首页
作者 | 辰辰
出品 | 网易科技
专挑节沐日搞大新闻”的DeepSeek又脱手了。
就在大洋彼岸的工程师们准备切火鸡庆祝节日时,DeepSeek坚持了极客古板,悄然上线了DeepSeekMath-V2。
开源权重、IMO金牌水平、逾越GPT-5。?这套熟悉的“三连击”,再次牢靠了DeepSeek作为“开源灯塔”的职位。?在算力受限的配景下,DeepSeek 再次证实晰自己:不需要重大的 GPU 集群,也能用算法事业在最硬核的数学赛道上,教闭源巨头们“做人”。
它“不搞虚的”,直接拿数学竞赛界的“最终试金石”,包括2025国际数学奥林匹克(IMO 2025)?和?普特南数学竞赛(Putnam)?的真题开练。在严苛的基准测试中,它交出了一份与 GPT-5和 Gemini 2.5 Pro 平起平坐,甚至更胜一筹的完善答卷。
1. 战绩彪悍:AI “碾压”人类学霸
DeepSeekMath-V2究竟有多强?数据不会说谎。
——?IMO 2025金牌得主,比肩谷歌 OpenAI。?在 IMO 2025的基准测试中,DeepSeekMath-V2乐成解出6道题中的5道,抵达“金牌”水准。这一效果直接对标谷歌 DeepMind 和 OpenAI 此前引以为傲的闭源模子。?要知道,在此之前,这种级别的推理能力是硅谷巨头们严防死守的商业神秘。
——?普特南竞赛:118分 VS 人类最高分90分。?威廉·罗威尔·普特南数学竞赛(Putnam)可以说是北美本科生的“恶梦”,以难度极高著称,中位数得分甚至靠近于0。DeepSeek 团队透露,DeepSeekMath-V2在2024年的普特南考题测试中,12道题做对了11道,最后一道也仅有细小瑕疵,最终得分118分(满分120)。相比之下,人类选手的最高分只有90分左右。这说明 AI 不但仅是在“背题”,而是具备了逾越顶尖人类选手的逻辑解题能力。
别的,DeepSeekMath-V2在代数、几何等5大数学领域周全逾越 GPT-5和 Gemini 2.5 Pro。
2. 揭秘:为什么它能这么智慧?
数学推理一直是 AI 的软肋,由于大模子很容易“一本正经地乱说八道”(幻觉问题)。DeepSeek 是怎样解决这个问题的?
谜底是“元验证”(Meta-Verification)手艺。
古板的 AI 训练是“给糖吃”:谜底对了就奖励。但在高等数学证实中,谜底对不代表历程对。AI 很容易瞎编一个历程然后蒙对谜底。
但 DeepSeek 引入了一套“左右互搏”机制:
其中天生器就像一个学生,认真写解题办法。验证器则是先生,认真检查逻辑误差,不但仅看谜底,还要看推导历程是否严谨。
更绝的是,他们还训练了一个“二阶验证器”,用来监视“先生”修正得对差池,避免模子为了拿分而钻空子。?这种递归式的验证结构,逼着模子必需学会真正的逻辑推理,而不是投契取巧。
而在推理阶段,模子不是张口就来。它会针对一个问题天生64个候选证实路径,然后用验证器逐一打分,挑出逻辑最严密的那一个。?这种“三思此后行”的模式,正是通往通用人工智能(AGI)的要害一步。
别的,DeepSeekMath-V2还打造了数字闭环生态,用验证反响直接优化天生质量,用自主爆发的高难度训练样本推动系统迭代。
3. 最大的杀手锏:它是开源的!
这才是让手艺界欢喜的真正缘故原由。
以往,无论是 OpenAI 照旧谷歌都选择闭源。你想用顶级的数学推理能力?只能付费挪用 API,不但数据要传到云端,使用更受限于人。
但 DeepSeek 直接掀了桌子:模子权重果真下载,Apache 2.0协议。
Hugging Face 的 CEO 克莱门特·德朗格(Clément Delangue)为此激动地发推体现:
“据我所知,没有任何谈天机械人或 API 能给你提供 IMO 金牌级别的模子。但今天变了,你可以在 Hugging Face 上直接下载 DeepSeek Math-V2的权重。”
这意味着,高校研究职员、企业开发者都可以在外地安排这个“数学天才”。所有人都可以体验在外地运行“奥数金牌” AI 的快感,无需担心数据隐私,也不必看硅谷大厂的神色。?一夜之间,一经被视为焦点竞争力的“推理护城河”,酿成了人人可用的基础设施。
一经上线,全球各路手艺播客和达人纷纷上手试用。
手艺博主、英王程序大佬西蒙·威利森(Simon Willison)快速对 DeepSeek Math-V2的宣布做了手艺层面解读,强调这是一个开放权重模子。他还特意提到,OpenAI和谷歌的一律模子有快要700G,相比之下DeepSeek Math-V2要小得多。
BinaryVerse 宣布的播客也称 DeepSeekMath-V2在某些数学推理基准上逾越了已有闭源大模子,但同时也提到,模子“对知识问答或通用场景并非周全领先”。
Hacker News 等社区也纷纷对模子指标和能力揭晓小我私家看法。不少人惊讶模子的强盛能力,但也有人质疑大宗推理算力带来的优异指标是否可迁徙到通例使用场景。许多谈论强调“惊艳但令人担心”的速率,讨论模子在更广义推理与清静性方面的意义。
4. 逆风翻盘:算力受限下的极致优化
DeepSeek 的这次突围,配景着实略带悲壮。
由于芯片供应问题,DeepSeek 在算力硬件上并不占优,旗舰模子 R2甚至因硬件兼容性问题而被迫推迟。
但在这种极限施压下,DeepSeekMath-V2证实晰一件事:算法的立异可以填补算力的缺乏。
它没有纯粹依赖暴力堆砌英伟达的 GPU 集群,而是通过“冷启动”训练——让 AI 自己天生训练数据,自己训练自己,还用自动化标注系统挣脱了对昂朱紫工标注数据的依赖。
5. 结语
DeepSeekMath-V2的宣布证实:在通往 AGI 的蹊径上,开源模子并没有落伍,甚至正在反超。
当硅谷还在试图用“清静”为由将顶级模子锁在黑盒子里时,来自中国企业的 DeepSeek 选择漂亮把钥匙交给了全天下。
关于所有 AI 从业者来说,这是一个最好的时代。
《免费的黄色》,《Q8X2R7L1T4J5M9B6W3》91久婷
“免费精品国产自在在线观看”
可以免费观看的黄色网址
……
12月04日
“欧美又色又爽又黄刺激的视频”WTA年终总决赛预告片无郑钦文
↓↓↓
12月04日,外贸亮眼“成绩单”折射经济韧性与底气 新业态激活发展新动能,91re热超碰在线,锕锕锕锕锕锕~太深了软件,馃崒馃崒馃惢馃惢,免费一级操逼毛片
12月04日,中国饭店协会倡议:OTA平台持续优化入境人员支付体验,又爱又爱人人黄色,免费黄色网址查找,欧美一级淫片视频,369你懂得天天看片在线看片
12月04日,罗布央宗代表——因地制宜发展乡村旅游,馃崋馃憴馃惢,深夜国产欧美视频在线,桃子 安装,开户猎手(破解版)飞机
12月04日|财政部:一季度全国一般公共预算收入60877亿元 预算支出同比增长2.9%|china武警gay粗大呻吟|18岁禁网页|久草在在线观看|3D hentai 2D hentai touhou
12月04日|江西全省高等级航道通航总里程达960.6公里|欧美性爱顶级视频|老师掀起内衣喂我奶头的漫画|日本一区二三区水蜜桃下载|欧洲黄色网站在线观看免费
12月04日|第一观察丨总书记这样为奥运健儿点赞|欧美强奸A片|国产伦视频网所有|欧美成年人免费|欧美激情免费一区二区三区……
12月04日,中国教育部:2025届高校毕业生预计规模1222万人,下载黄色录像2级A级大学生,日本大片视频网站免费25分钟,亚洲一级爱爱视频,欧美大屁股vidos
12月04日,“捏捏乐”让5岁孩子“上头” 是解压治愈还是情绪消费?,人人人人干夜夜操,国产精品色拍拍免费视频,精品国产福利在线观看网址,美女裸体100%㊙️无遮挡视
12月04日|高温持续 警惕脑卒中“偷袭”|男女啪啪18禁免费网站|国产欧美在|欧美熟妇A片|最近2019中文字幕在线,最近更新中文字幕免费大全,最
12月04日,新闻观察丨加沙地带停火谈判为何难以取得成果?,www无码在线观看,欧美最淫色最黄的网站,中国美女全身裸体㊙️免费看视频,三级电影黄网
12月04日,教育部:2025届高校毕业生预计规模1222万人,天堂男人wang,免费网站看A片在线18禁无码,一级激情精品福利视频,手臂全部伸入肚子鼓包网站
12月04日,巴黎各界人士夹道欢迎习近平主席到访,被玩坏的严格高冷老师,2012av天堂网,188437神秘电视剧,人人干人人澡人人摸
12月04日|两会受权发布|中国人民政治协商会议全国委员会常务委员会工作报告|国产丝袜在线|久久中文字幕无码专区韩国一级婬|哑剧猫原版动画免费网站下载|女人添荫蒂全部过程
12月04日|市场监管总局2023年审结经营者集中案件近800件 平均审结时间25.7天|三级片手机在线视频|外网speaking实践真打视频|羞羞 在线|国产欧美日韩一区二区久久
12月04日|巴基斯坦媒体人走进新疆伊犁|欧美在线免费小视频|谁知道A片网址|国产ww男女|无尽 得到 向上 可爱 香椿
乌尔善新片异人之下定档,易普症|重庆兴隆场编组站供电扩能改造完成 提升中欧班列运能|欧美性爱区网站|王雨纯与周于希互怼互抚爱情剧|亚洲第一 网址|男女一起怼怼怼轮滑鞋
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
岸田文雄等向靖国神社献祭品 中方提出严正交涉
云南普洱“单腿夫妻”自强创业助残扶弱
新疆阿勒泰强降雪致游客滞留 部分道路已抢通
深耕“地瓜经济” 浙江稳外贸稳外资走出“上扬曲线”
第二届链博会有哪些新亮点?官方回应
南方多地遭遇酷热“持久战” 浙苏沪局地突破历史极值
油价年内第四次下调 加一箱油少花约7.5元
做磁浮的梁 架传承的桥(讲述·弘扬科学家精神)
联播观察丨关键之年两会 总书记关注这三“新”
高温下,“瓷都”景德镇建设一线的坚守与关爱
欧洲黄色在线
人人模人人操
伊人黄色网
美女破处三级片短视频
无遮挡呻吟娇喘高潮在线观看
国产手机在线观看视频想
国产剧情视频一区
欧美胖老妇 BBBWWW
黄片二级片
百度欧洲老奶奶与孙子乱伦视频

闽公网安备 35010302000113号