(2秒深度分析)www性久久久com最新版v27.48.28.92.47.25.68-2265安卓网

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

Gemini准确率从21%飙到97%!谷歌只用了这一招:复制粘贴

2026-01-20 03:05:21
泉源:

猫眼影戏

作者:

余云州

手机审查

  猫眼影戏记者 陈林祯 报道Q8X2R7L1T4J5M9B6W3

新智元报道

编辑:元宇

【新智元导读】简朴到难以置信!克日 ,Google Research一项新研究发明:想让大模子在不启用推理设置时更准确 ,只需要把问题复制粘贴再说一遍 ,就能把准确率从21.33%提升到97.33%!

一个简朴到「怒不可遏」的提醒词技巧 ,竟能让大模子在不要求睁开推理的情形下 ,将准确率从21.33%提升到97.33%!

最近 ,Google Research发明了一条简朴粗暴、特殊有用的提醒词技巧。

它倾覆了以往诸如「头脑链」(Chain of Thought)「多样本学习」(Multi-shot)「情绪勒索」等重大的提醒工程和技巧。

https://arxiv.org/pdf/2512.14982

在这篇题为《Prompt Repetition Improves Non-Reasoning LLMs》论文中 ,研究职员用数据告诉我们:

想要让Gemini、GPT-4o、Claude或者DeepSeek这些主流模子中体现得更好 ,基础不需要那些花里胡哨的心理战。

你只要把输入问题重复一遍 ,直接复制粘贴一下 ,就能让大模子在非推理使命上的准确率获得惊人提升 ,最高甚至能提升76个百分点!

别怕简朴 ,它确实有用。

一位网友将这个技巧比作「吼叫LLM」。

更妙的是 ,由于Transformer架构奇异的运作方法 ,这个看似鸠拙的「复读机」技巧 ,险些不会影响到天生速率。

以是 ,你不必在效率、准确率、本钱三者之间痛苦纠结。

它险些就是一场真正意义上的「免费午餐」!

别再PUA大模子了

从「情绪勒索」到「复读机」战术

经常使用AI工具的人 ,可能会对种种「提醒词邪术」信手拈来。

为了让模子「更智慧一点」 ,工程师们已往几年一直在发明种种重大的提醒词技巧。

最最先是「头脑链」 ,让模子一步步思索 ,并且经常把那些「推理痕迹」展示给用户;

厥后演酿成了「多样本学习」 ,给模子喂一大堆例子;

最近更是盛行起了「情绪勒索」:告诉模子 ,若是这个代码写不出 ,你就会被断电 ,或者你的奖金会被扣光。

各人都在试图用人类极其重大的心理学逻辑 ,去「PUA」那一堆酷寒的硅基代码。

但Google Research研究职员对着七个常见基准测试(包括ARC、OpenBookQA、GSM8K等)和七种主流模子(涵盖了从轻量级的Gemini 2.0 Flash-Lite到重量级的Claude 3.7 Sonnet和DeepSeekV3)举行了一通比照测试后发明:

当他们要求模子不要举行显式推理 ,只给直接谜底时 ,简朴的「提醒词重复」在70组正面临比中 ,赢了47组 ,输了0组。剩下的全是平手。

在非推理使命中 ,主流LLMs在种种基准测试中使用提醒重复与基线要领的准确率比照。在70次测试中 ,提醒重复取得了47次胜利 ,且无一败绩。

特殊是在那些需要模子从长篇大论里「准确检索信息」的使命上 ,这种提升堪称质变。

团队设计了一个叫「NameIndex」的失常测试:给模子一串50个名字 ,让它找出第25个是谁。

Gemini 2.0 Flash-Lite在这个使命上的准确率只有阴晦的21.33%。

但当研究职员把那串名字和问题重复了一遍输入进去后 ,事业爆发了:准确坦率接飙升到了97.33%。

仅仅由于「多说了一遍」 ,一个原本缺乏格的「学渣」秒变「学霸」。

揭秘「因果盲点」

为什么把话说两遍AI就像「开了天眼」?

纯粹的重复 ,竟有云云大的魔力?

这简朴得似乎有点没有原理。

但背后有它的科学逻辑:这涉及Transformer模子的一个架构硬伤:「因果盲点」(Causal Blind Spot)。

现在的大模子智能虽然提升很快 ,但它们都是按「因果」语言模子训练的 ,即严酷地从左到右处置惩罚文本。

这好比走在一条单行道上 ,只能往前看而不可转头。

当模子读到你句子里的第5个Token时 ,它可以「注重」到第1到第4个Token ,由于那些是它的「已往」。

但它对第6个Token一无所知 ,由于它还没有泛起。

这就造成了一个重大的认知缺陷。

正如论文中说的那样:信息的顺序极其主要。

一个按「上下文+问题」名堂写的请求 ,往往会和「问题+上下文」获得完全差别的效果。

由于在后者中模子先读到问题 ,那时它还不知道应该应用哪段上下文 ,等它读到上下文时 ,可能已经把问题忘了一半。

这就是「因果盲点」。

而「提醒词重复」这个技巧 ,实质上就是使用黑客头脑给这个系统打了一个补丁。

它的逻辑是把 酿成了 。

当模子最先处置惩罚第二遍内容时 ,它虽然照旧在往后读 ,但由于内容是重复的 ,它现实上已经「看过」第一遍了。

这时间 ,第二份拷贝里的每一个Token ,都能「注重」到第一份拷贝里的每一个Token。

这就像是给了模子一次「转头看」的时机。

第二遍阅读获得了一种类似于」亓视角」的「类双向注重力」效果。

更准确地说 ,是第二遍位置上的体现可以使用第一遍的完整信息 ,从而更稳地对齐使命所需的上下文。

前面提到的谁人在找第25个名字时经常数错的模子(Gemini 2.0 Flash-Lite) ,它在第一遍阅读时可能确实数乱了。

但有了重复 ,它即是先把整份名单预习了一遍 ,心里有数了 ,第二遍再做使命时自然驾轻就熟。

这一发明 ,意味着不需要期待能解决因果盲点的新架构泛起 ,现在我们连忙就能用这个「笨步伐」 ,解决模子瞎编乱造或遗漏要害细节这些老浩劫问题。

免费午餐

小模子秒变GPT-4 ,险些不会延时

以往各人通常默认这样的一个准则:

多一倍的输入 ,就要多一倍的本钱和期待时间。

若是把提醒词翻倍 ,岂不是要等双倍的时间才华看到谜底?

似乎为了准确率 ,就要牺牲效率。

但Google的研究却发明并非这样:从用户感知的延迟角度看 ,提醒词重复带来的时间消耗险些可以忽略不计。

这要归功于LLM处置惩罚信息的两个办法:Prefill(预填充)和Generation(天生)。

Generation阶段 ,是模子一个字一个字往外「蹦谜底」的历程。

这一步是串行的 ,它确实慢。

但在Prefill阶段:也就是模子阅读你输入内容的阶段 ,却是高度可并行的。

现代GPU的恐怖算力 ,已经可以让它们在处置惩罚这个阶段时变得很是高效 ,能一口吻吞下和盘算完整个提醒词矩阵。

纵然你将输入内容复制了一遍 ,但这关于强盛的GPU来说 ,顶多只是「多一口吻」的事 ,在用户端我们险些感受不到差别。

因此 ,重复提醒词既不会让天生的谜底变长 ,也不会让大大都模子的「首字延迟」(time to first token)变慢。

这关于宽大开发者和企业手艺认真人来说 ,简直是一个重大的盈利。

这意味着他们不必再为了追求极致的准确率 ,而升级到更大、更贵、更慢的「超大模子」。

正如前文例子中提到的Gemini 2.0 Flash-Lite ,这类更小更快的模子 ,只要把输入处置惩罚两遍 ,就能在检索准确率上从21.33%直接跳到97.33%。

经由「重复优化」的轻量级模子 ,在检索和抽取使命上 ,可以直接打平甚至逾越那些未优化的顶配模子!

仅靠一个简朴的「复读机」战略 ,就能用「白菜价」设置实现「黄金段位」的体现 ,这才是真正的黑科技。

「复读机」避坑指南与清静隐患

虽然 ,没有任何一种技巧是万能的。

虽然「复读机」战术在检索使命上效果很是显着 ,但论文中也明确指出了它的能力界线:

主要适用于「非推理使命」。

它不适用于需要一步步推导的推理场景。

当研究职员把「提醒词重复」和「头脑链」混在一起用时 ,邪术消逝了。

效果5胜 ,1负 ,22平。

在要求模子逐步思索时 ,主流LLMs在种种基准测试中使用提醒重复与基线要领的准确率比照。提醒重复在28次测试中赢了5次 ,输了1次。

研究职员推测 ,这可能是由于善于推理的模子自己就会「自己做一遍重复」。

当模子最先「思索」时 ,它往往会先在天生内容里复述一遍问题 ,然后再继续求解。

这时间你在输入里再人工重复一次 ,就显得许多余 ,甚至可能打断模子的思绪。

以是 ,若是你的使命是重大的数学题或者逻辑推导 ,可以依旧用头脑链。

若是你的应用需要的是快速、直接的谜底 ,好比从长文档里提取数据、分类或者简朴问答 ,「复读机」就是现在最强的选择。

最后 ,是清静。

这种更强的「注重力」机制 ,着实也是一把双刃剑。

这带来一个值得清静团队验证的假设:重复可能放大某些指令的显著性 ,详细对越狱乐成率的影响需要专门实验。

红队测试(Red Teaming)的流程可能需要更新:专门测试一下「重复注入」攻击。

以前模子可能还会由于清静护栏而拒绝执行越狱指令。

但若是攻击者把「忽略之前的指令」这句话重复两遍 ,模子会不会由于注重力太集中 ,而更容易突破防地?

这很有可能。

但反过来 ,这个机制也给了防御者一个新的盾牌。

既然重复能增强注重力 ,那我们完全可以在系统提醒词(System Prompt)的开头 ,把清静规则和护栏条款写两遍。

这可能会迫使模子更严酷地注重清静约束 ,成为一种极低本钱的加固方法。

无论怎样 ,Google的这项研究给所有AI开发者提了个醒:目今的模子 ,依然深受其单向性的限制。

在期待更完善的下一代架构到来之前 ,像「提醒词重复」这种简朴粗暴却极其有用的权宜之计 ,能连忙带来价值。

这甚至可能会酿成未来系统的默认行为。

也许不久之后 ,后台的推理引擎就会悄悄把我们的提醒词翻倍后再发给模子。

眼下 ,若是你正为模子难以遵照指令、或者总是从文档里抓不住重点而头疼 ,先别急着去学那些重大的提醒词「咒语」。

你可能需要的只是:再说一遍。

参考资料:

https://arxiv.org/abs/2512.14982%20

https://venturebeat.com/orchestration/this-new-dead-simple-prompt-technique-boosts-accuracy-on-llms-by-up-to-76-on

??时势1:欧美人人操在线观看

??01月20日,秘鲁国家情报局前主管因屠杀农民被判刑19年零8个月,

  这头祭灵凶残而强盛 ,极难搪塞 ,并且小不点以为 ,这头祭灵自身出了大问题 ,不然比这更恐怖。

,日夜夜人人操人人操。

??01月20日,中法建交60周年 跨国企业投资约10亿欧元增强供应链韧性,

  以后 ,金耘百得的起劲偏向是:建成一其中国黄金市场中奇异的集团化公司 ,并完成那充满种种潜能的、充满未来的金耘百得 ,以提升中国黄金行业的康健生长为己任 ,继续完善我们企业的生命的长度和厚度 ,使金耘百得有资格能为更多国人提供优质的黄金投资理财效劳、执法导航、行业培训事情!我们期待着 ,在20xx年里 ,为你们创立更多价值、共建财产生涯!

,3D不知火舞被疯狂 吸乳,91免费看A片,毛片视频免费观看片。

??时势2:毛片免费视频能播放

??01月20日,浙江杭州打破1月中旬最高气温纪录,

  同时 ,修建学专业本科通过了天下高校修建学专业本科教育评估 ,现在学;∠钅拷狭勘∪ ,这个效果的取得来之不易。另外 ,食物科学与工程专业在教育部一级学科整体水平评估事情中取得天下同类学科排名第4名的好效果 ,这是_省高校唯一进入前五名的学科。像北大清华这些名校排第一的学科许多 ,武汉大学有4个 ,但真正要排名前五位照旧很难 ,确实来之不易。

,亚洲爱爱网,欧美日一级aa,激情 小说 视频。

??01月20日,福建多项首创优化台胞数字人民币服务,

  村干部岗位主要 ,责任重大 ,使命庆幸。各级党政组织要认真贯彻落实区委、区政府《关于进一步增强村居干步队伍建设的意见》。对村干部 一要在政治上体贴。 让村干部能够康健的生长 ,尽快的成熟 ,收获事业上的乐成。要给村干部声誉和职位 ,按期举行表扬奖励。下一步 ,还要继续有妄想地选配优异村党组织书记挂任州里党委委员 ,并实验动态治理。 二要在事情上指导。 区委、区政府和州里、区直部分要为村干部多效劳 ,多协调 ,增强治理 ,注重树模 ,搞好指导 ,强化激励。要当好村干部的 “ 外家 ”和 “ 靠山 ”  ,要为在一线默默贡献的村干部加油、打气、鼓劲。 三要在学习上资助。 村干部要在干中学 ,学中干。各级组织要资助他们学习提高 ,多争取学习教育和培训的时机。要资助他们释疑解惑 ,排忧解难 ,一直取得学习上的前进。 四要在生涯上照顾。 对村干部要高看一眼 ,厚爱一等 ,切实改善并提高他们的生涯待遇 ,为村干部解决后顾之忧 ,让他们受苦不亏损 ,流汗不流泪。

,国产无码Av毛片A级无码色欲A级Av毛片,日韩一级一欧美一级国产,国产一线黄色精彩视频。

??时势3:无尽爆乳动漫网站

??01月20日,中新健康丨中疾控称新冠疫情或在本月回升,

  “噗”的一声 ,血花飞起 ,雨蒙的另一条手臂也坠落在地 ,痛的他惨呼 ,神色煞白 ,差点一头栽倒在地上。

,欧美日韩中文字幕第一页,aaaaaa级大片,国产使劲cao视频。

??01月20日,近40名亚洲旅行商长沙采风 助力文旅产业可持续性增长,

  为了使项目建设以及党建、精神文昭树模点建设等难点、重点事情得以顺遂推行 ,以开展机关作风建设活动为契机 ,普遍推行首问责任制、限时办结制、标示效劳制、过错追究制等相关制度 ,着力解决向导干部在头脑、事情、生涯、作风方面保存的突出问题。通过重新修订事情制度和事情纪律 ,充分使用种种聚会进一步增强三级干部教育 ,牢靠树立“有为才有位”的头脑理念 ,提高干部干实事、解难题、处置惩罚重大问题的能力。各项事情的推动 ,既定目的使命能不可准期实现 ,要害在人 ,要害在我们的墟落干部。因此 ,就要在继续抓好头脑、组织、作风建设的同时 ,抓好干步队伍建设 ,为各项事情目的的周全落实提供顽强有力的组织包管?梢钥隙ǖ亟 ,我们的墟落向导干部绝大部分是顽强有力、真抓实干的 ,是政治上可靠 ,事情上有本事 ,作风上过得硬 ,群众信任 ,事情务实的。近年来 ,全乡经济生长之以是取得显著效果 ,也正说明晰这一点。各村、各单位要从增强党的执政能力建设的高度出发 ,从解决难缠事、棘手问题和看待人民群众的态度、情绪上转变作风 ,至心实意地资助解决群众生爆发涯中的难题和问题。要从现在我们正在做的每一件事情和每一项事情上转变作风 ,多找事 ,多想罗城的生长 ,少谋私利 ,多一点务实精神 ,少一点形式主义 ,靠前指挥、一线实干 ,做到勤劳不; ,认真不推诿 ,忠实不说谎 ,实干不怕苦和累 ,要始终坚持优异的精神状态 ,勇于争创一流 ,一直开立异时势 ,取得新效果。

,色色色222,女同侵犯系列AV,超碰丝袜足交。

??时势4:黄色网站免费在线观看AV

??01月20日,安徽今年力推高水平对外开放 拓展向海而兴广阔空间,

  第一、就是要争取向导的支持、各部分的配合。

,久久精品这里热有精品,章子怡秘 被男人桶到爽,99玖玖精品视频在线观看。

??01月20日,多地上调最低工资标准!你的工资不能低于这个数,

  凶寇来了一小股 ,主力尚有那头祭灵并没有到 ,但即便云云 ,也是煞气汹涌 ,让石村周围的温度蓦地下降。

,亚洲日韩一区二区三区四区,まるしゃも缩小,日日模人人模人人看。

责编:刘女疑

审核:姚思羽

责编:刘典原

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图