首页
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
《九九热国产》,《Q8X2R7L1T4J5M9B6W3》www在线免费看黄色视频
“明明说好的只蹭蹭”
免费白丝jk爆 乳
……
01月08日
“jy073911f22.apk”七夕之国
↓↓↓
01月08日,混团世界杯韩国队小组头名晋级 田志希:目标是享受成都比赛时间,国产91区精品福利在线社区,一级黄色片日本小小美女免费,强奷漂亮雪白丰满少妇AV,日本免费A片视频
01月08日,(巴黎残奥会)克服困难迎接挑战 “金牌大户”中国体育代表团游泳队力争佳绩,日本青草视频,苍井无套射了60分钟,刻晴刻晴 自慰18禁,欧美综合小说
01月08日,日本大学生探访成都武侯祠 谈三国文化海外影响,av先锋资源,又粗又大又爽,精品视频免费在线观看,天堂在线性感美女黄色视频
01月08日|柬埔寨首相:柬中传统友谊是两国和两国人民的宝贵财富|美女视频黄一区二区|久久99热狠狠色一区二区|男男自慰合集GayXXX|亚洲老熟女乱又伦
01月08日|南方电网原纪检监察组组长龙飞被逮捕|农村寡妇偷人高潮A片免费|国产性社区免费视频|大片一级免费大片|97在线国产视频
01月08日|安徽今年力推高水平对外开放 拓展向海而兴广阔空间|亚洲玖玖爱|国产99久久91精品社区|国产盗摄在线精品福利|午夜A片在线观看全免费……
01月08日,奔向梦想!2024希望工程·蒙牛少年足球公益行正式启动,刘诗诗换脸mv在线观看,特黄无码自拍视频,天天爽天天狠久久久综合′一,狼友av永久网站免费极品观看
01月08日,2024第八届“多彩贵州”自行车联赛收官,海姆斯利外网原版gif,欧美福利在线观看网站,免费看裸体 女神,魅魔娜娜在线观看免费高清电视剧
01月08日|今年北京城市副中心将保持千亿投资强度|超黄18岁禁播网站|灌肠➕憋尿➕调教灌肠打屁|人人澡人人人人天天夜|国产gay+粗大+掰开+射精
01月08日,“五一”假期宁夏累计接待国内游客561.58万人次,黄色毛片网站国产,欧美一级毛免费观看片,把女人弄特爽黄a大片,四川妇女操bb
01月08日,港珠澳大桥桥梁航道恢复通航,A片免费看A级,日本高清视频网站WWW,精品黄色国产一区二区三区,18禁羞羞漫画网站入口
01月08日,“立夏”逢雪 “中国最冷小镇”呼中一夜“返冬”,午夜小黄片,美女啪啪啪网站,日韩av免费av,美日本黄色网站视频
01月08日|香港国际影视展广东馆开馆 近50家机构带来近百部优秀作品|妇女游泳A片啪啪啪视频|大姑娘解小便|黄瓜视频♥成人app♥i|黄电影一级视频
01月08日|安徽歙县:千年古城内 “00”后焕新演绎徽文化|你懂的网站在线观看网址|狼友AV国内精品自在线拍|www.se在线视频|大肉大捧一进一出两腿
01月08日|广东丹霞山再添3个新物种|91热91精品啪|国产欧美日韩国产第一区|男生自慰呻吟抽搐|黄色免费啪啪啪视频
终于有人把五险一金说清楚了,JDG零封RNG|【中新画报】请查收这份中国人的“春节实践指南”|中文字幕无码专区精品人妻|女仆扒开腿秘 让泥鳅钻|十八禁国产精品五五网|欧美盗摄精品视频在线
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
数说湾区丨四图速览大湾区发展
【巴黎奥运会】中国体育代表团:应对个别出现失误运动员给予理解
秘鲁国家情报局前主管因屠杀农民被判刑19年零8个月
五一假期江西累计接待入赣游客596.22万人次
昆明蓝花楹迎盛花期 吸引游客打卡
美政客承认“盯上”乌克兰矿产资源 网友:原形毕露了
公安部:迅速查明珠海驾车冲撞行人案情 依法严惩凶手
热带气旋贝拉尔逼近留尼汪岛 中国驻法使馆提醒当地侨民提高警惕
高校体育场地如何开放才合理?
美媒称以色列提议停火两个月以换取人质获释
18岁禁止免费
三级全黄60分钟以上
狼友入口视频。
www.jjzzcom
最近中文MV在线看7
捷克街头挑战
毛片毛片电影电影,
78互吃
www.αV日本网站
国产网站免费看

闽公网安备 35010302000113号