NHDTA一988偷偷拿掉套子

电脑版下载

90175
5

NHDTA一988偷偷拿掉套子截图Q8X2R7L1T4J5M9B6W3

内容详情

NHDTA一988偷偷拿掉套子

鱼羊 henry 发自麦蒿寺量子位 | 公众号 QbitAI

2025倒计时，新SOTA模子涌现没有放缓迹象。

一夜之间，编程SOTA模子易主，并且上线即开源，依然来自中国大模子公司——

智谱AI，GLM-4.7。

这波更新，手艺报告里满眼都是Coding，Coding，照旧Coding。

而能力的提升，带来的最直观效果是：

AIME 25和人类最后考试（HLE）等基准中，GLM-4.7分数超GPT-5.1；

SWE-Bench分数达（73.8%，+5.8%），创开源新高。

官方Demo显示，写个植物大战僵尸不辛苦：

总而言之，模子这么一发，双旦的节庆气氛一下到位了（doge）。

官网Chatbot和API均已就位，现在就能在线开玩。

Demo来吧，展示

在前端天生质量上，GLM-4.7展现出显着升级：页面结构更清洁、组件层级更清晰。

相比GLM-4.6，更像是现代的Web UI，网友元素中越发雅观。

在PPT与视觉物料天生方面，GLM-4.7问题层级明确、元素尺寸更合理。

在重大几何结构与空间关系的表达上，GLM-4.7模子能够坚持较好的结构一致性与细节稳固性。

3D资产的天生质量也有显著提升。

刷新开源SOTA

这次最新的模子主打编程，相较前代GLM-4.6，GLM-4.7在编码能力、交互体验与重大推理等多个维度实现了系统性升级。

重大推理能力（Reasoning）：周全提升，HLE（含工具）42.8（+12.4 vs GLM-4.6），MMUL-Pro 84.3，GPQA-Diamond 85.7，数学与推理能力更稳更强。焦点编码能力（Code Agent）：多语言与终端使命显著增强，SWE-bench Verified 73.8（+5.8）、SWE-bench Multilingual 66.7（+12.9）、Terminal Bench 2.0 41.0（+16.5），支持“先思索、再行动”模式。工具使用能力（General Agent）：工具挪用更高效，BrowseComp 52.0（+6.9）、BrowseComp w/ Context Management 67.5（+10.0）、τ?-Bench 87.4（+12.2），网页浏览与工具链治理体现更优。

别的，GLM-4.7在对话、创意写作、角色饰演等场景中同样有提升，系统性增强了编码、推理与工具使用能力。

交织式思索和保存式思索

手艺方面，GLM-4.7强化了自GLM-4.5起引入的交织式思索（Interleaved Thinking），并进一步引入了保存式思索（Preserved thinking）和轮级思索（Turn-level Thinking）。

交织式思索

GLM在工具挪用之间、收到工具效果之后继续思索。

这让模子能够举行更重大的漫衍推理，提升了指令遵从和天生质量：

在决议下一步行动前先解读每次的工具输出，把多次工具挪用和推理办法串联起来，并凭证中心效果做出更细粒度的决议。

保存式思索

在编码场景中，GLM-4.7引入了一种新的思索模式：

模子会自动在多回合对话中保存所有思索快，复用已有推理而不是重新重新推理。这镌汰了信息丧失和纷歧致性，使得模子更适用于长程、重大使命�；鼓茉谡媸凳姑薪谠几鄑okens。

轮级思索

轮级思索是一种按轮控制推理盘算的能力，即在统一个会话中，每一轮请求都可以自力选择开启/关闭思索。

这使得GLM-4.7具备以下优势：

更无邪的本钱/时延控制：对“问个事实/改个语言”等轻量轮次可关闭思索，追求快速响应；对“重大妄想/多约束推理/代码调试”等重使命轮次可开启思索，提升准确率与稳固性。更顺滑的多轮体验：思索开关在会话内可随时切换，模子能在差别轮次间坚持对话连贯与输出气概一致，让用户感受“智慧时更智慧、简朴时更快”。更适合Agent/工具挪用场景：在需要快速执行的工具轮次可降低推理开销，在需要综合工具效果做决议的轮次再开启深度思索，实现效率与质量的动态平衡。

更多手艺详情，智谱官方也附上了详细手艺报告。

BTW，智谱这个月还真上了“节日限制优惠”。

每月最低20元即可畅享GLM-4.7，用上Claude Pro套餐3倍用量。

又是一位好价钱屠夫呀。

并且GLM-4.7的深夜炸场，也算是已经冲刺IPO上市的智谱，带来的最新手艺证实。

现在智谱已经通过了港交所上市聆讯，IPO敲钟仅剩下最后100米。

而GLM-4.7可能也是智谱上市之前，最主要的模子更新了……吧？

[1]https://z.ai/blog/glm-4.7

[2]https://x.com/Zai_org/status/2003156119087382683

— 完 —