猫眼影戏
猫眼影戏
弗洛里安
手机审查
猫眼影戏记者 李岩文 报道Q8X2R7L1T4J5M9B6W3
随着多模态大模子(MLLMs)的飞速生长,模子已经能够很好地明确视频中 “爆发了什么(What)”,却无法精准地定位到事务在视频中 “何时爆发(When)”。这种视频时序定位(Video Temporal Grounding, VTG)能力的严重缺陷,已成为制约 MLLM 迈向更细腻化的视频明确的主要瓶颈。
恒久以来,大宗研究致力于设计重大的模子结构,却忽视了两个要害问题:在数据层面,我们依赖的评测基准是否可靠?在算法层面,是否保存一套精练通用的最佳实践?
针对上述痛点,来自南京大学、腾讯 ARC Lab 和上海 AI Lab 的联合研究团队提出了TimeLens(时间透镜),系统性地展现了现有数据的“评测陷阱”,构建出更可靠的评测基准和高质量训练数据,并探索出一套精练有用的算法优化。得益于这些孝顺,仅8B 参数的 TimeLens 模子成为了开源模子中的新 SOTA,更击败了 GPT-5 和 Gemini-2.5-Flash 等闭源巨头。
论文问题:TimeLens: Rethinking Video Temporal Grounding with Multimodal LLMs论文链接: https://arxiv.org/abs/2512.14698项目主页: https://timelens-arc-lab.github.io/代码链接: https://github.com/TencentARC/TimeLens
焦点洞察:拨开数据质量的迷雾
在深度学习中,“Data is fuel”(数据即燃料)是公认的真理。然而,团队发明,在 VTG 领域,燃料的质量却令人担心。
1. 现有基准的 “隐形陷阱”
研究团队通过一套标注流水线,对 Charades-STA、ActivityNet Captions 和 QVHighlights 等主流基准举行了严酷的人工核验,发明这些基准数据集中充满着大宗的标注过失。许多样本中的文本形貌模糊不清,或是文本形貌的事务在视频中基础未泛起。标注方面,也保存大宗的时间界线标注过失,或是统一形貌对应了视频中的多个片断却只标注了其中之一(漏标)。统计数据显示,这些过失在现有基准中的比例极高。
2. TimeLens-Bench:对评估效果的“拨乱横竖”
为相识决现有数据集中保存的严重过失,团队构建了严酷的标注准则,对上述三个基准数据集举行了周全的修复和重新标注,推出了TimeLens-Bench。这是一个经由严酷交织验证的高质量评测基准,能够更真实地反应模子的时序定位能力。
将 TimeLens-Bench 和原始 Benchmark 上的评测效果举行比照,揭破了过往评估效果的不可靠—— 旧基准严重高估了开源模子的能力,而掩饰了前沿闭源模子(如 Gemini)的真实水平。TimeLens-Bench 对这一过失举行了拨乱横竖,事实上,现有开源模子仍显着落伍于闭源模子。
3. 高质量训练数据:TimeLens-100K
针对同样低质量的训练数据,团队设计了一套自动化流水线,对训练数据举行了大规模的洗濯和重标,宣布了高质量的大型训练数据集 TimeLens-100K。实验证实,数据质量的提升能带来显著的性能增添。
算法设计的“最佳实践”
在夯实数据基础后,TimeLens 进一步对 MLLM 在 VTG 使命上的算法设计举行了全方位的消融实验,从时间戳编码到训练范式,总结出一套精练有用的 “最佳实践”。
1. 精练有用的时间戳编码
时间戳编码(timestamp encoding)是 VTG 使命中的要害模子结构设计,决议了模子能否准确地感知到输入的每一视频帧的采样时间。
团队周全地比照了种种时间戳编码方法的优劣。实验效果批注,最优的时间戳编码方法是简朴的交织文本编码(Interleaved Textual Encoding) 战略,即在每一帧的视觉 Token 前插入文本形式的时间戳 token。这种要领无需修改 LLM 的底层架构,包管了实现上的精练,同时还能取得最优的效果。
2. 训练范式:Thinking-free RLVR 的胜利
随着 DeepSeek-R1 等一系列事情的提出,带有可验证奖励机制的强化学习(RLVR)范式在提升模子推理能力方面的作用备受关注。而在 VTG 领域,关于训练范式的几个要害问题尚无定论:
有监视微调(SFT)仍是 VTG 领域最为主流的训练范式,RLVR 范式在同样的训练开销下,是否显着优于 SFT?时序定位使命是一个以感知 (Perception) 而非推理 (Reasoning) 为主的使命。针对这样的使命举行 RLVR 训练时,显式的思索历程(thinking)是否是必需的?SFT+RLVR 的多阶段训练,是否比单阶段训练的效果更好?
TimeLens 比照了多种训练范式的优劣。结论出人意料且极具启发性:单阶段的 Thinking-free RLVR 训练范式在盘算效率和性能上均取得了最优。该范式直接让模子输出定位效果,并凭证定位准确率(IoU)给予奖励。这种方法不需要天生冗长的中心思索历程,训练和推理效率高于 Thinking-based RLVR 范式和多阶段训练范式,且性能优于 SFT 范式。
这一效果批注,关于时序定位这种偏向感知(Perception-heavy)的使命,显式的思索历程不是必需的。 模子可以直接学习从使命输入到输出的映射,不需要举行重大的逻辑推理。
3. 要害训练技巧:Early Stopping 与 Difficulty-based Sampling
针对Thinking-free RLVR范式,团队举行了越发深入的实验探讨,发明了两个要害的训练技巧。
首先,与 SFT 中 “训练越久越好” 的共识差别,在 RL 训练中,当奖励指标进入平台期后,就应该接纳早息兵略(Early Stopping) 连忙阻止训练,在该阶段之后继续训练反而会使得模子的性能下降。
其次,基于难度的数据采样(Difficulty-based Sampling) 至关主要。纵然数据的标注质量有包管,也并非所有的数据都适适用于 RLVR 训练。需要预先使用待训练的模子举行推理,评估每个训练样本的难度,采样足够具有挑战性的样本举行 RLVR 训练,才华最洪流平上提升模子的性能。
实验验证:8B 模子逆袭闭源巨头
研究团队将上述数据和算法层面的所有刷新聚合在了一起,每一项手艺都带来了显着的性能提升,最终获得了 TimeLens 系列模子。
评测效果批注,TimeLens-8B 展现出了惊人的性能,不但大幅逾越了 Qwen3-VL 等开源模子成为新的开源 SOTA,更以 8B 的参数目,在多项焦点指标上周全击败了 GPT-5 和 Gemini-2.5-Flash 等前沿的闭源模子。
这一效果有力地证实晰:在 VTG 使命中,通过系统性地提升数据质量并接纳有用的算法设计,开源小尺寸模子完全具备挑战甚至逾越闭源大模子的能力。
总结
TimeLens 的孝顺不止于一个 SOTA 开源模子。团队在数据和算法双维度的系统性探索,为后续研究提供了极具参考价值的要领论与设计蓝图。
现在,TimeLens 的代码、模子、训练数据和评测基准都已开源,希望能为未来的视频时序定位研究提供一个更好的起点。
??时势1:高质量新一代小豚导航
??01月06日,2023年度个税汇算将于3月1日开始,优先退税服务范围扩大 ,
“绝对可信!”
,亚洲爆乳性爱三级片。??01月06日,粤北始兴洪水退去 有序进行灾后恢复重建工作,
我校上次党代会是1999年1月召开的,至今已经已往8年。时代由于治理体制转变、中国矿业大学北京校区东校园并入、校向导班子调解等缘故原由,未能按期召开党代会。近几年来,在教育部党组、北京市委、市政府和市委教育工委的准确向导下,学校党委坚持社会主义办学偏向,周全贯彻党的教育目的,一直增强党的建设,充分验展党委的向导焦点作用和全校共产的先锋模范作用。全校宽大及师生员工同心协力,开拓进取,起劲推进学校的刷新和生长,取得了显著效果。20xx年学校由国家广电总局划归教育部,成为教育部直属高校;20xx年,学校乐成进入“211工程”重点建设高校行列;20xx年,中国矿业大学北京校区东校园并入;20xx年,学校更名为中国传媒大学,实现了全院师生员工的夙愿;20xx年,开展坚持共产党先进性教育活动,全校党的组织建设和的头脑、作风建设获得进一步增强。20xx年,顺遂完成了学校行政向导班子和部分学院党政向导班子的换届、机构调解和中层干部聘用事情。这一系列标记性效果,是学校近几年生长的里程碑,同时也为党代会召开涤讪了坚实的基础?梢运,学校召开党代会的条件已经具备。
,ytsex_7.0.4_30981083.apk,婷婷久久精品免视看国产盗摄,免费看所有乱伦黄色视频。??时势2:www.九九爱
??01月06日,我国国家公园建设取得积极成效 生物多样性稳定增加,
我真诚地希望:能够把我们的学生作育成为懂、会处世、爱学习的阳光学子。希望我们能够塑造出一支有、善学习、爱学生的优异西席步队,希望我们能够营造出一个重人本、厚文化、有活力的欢喜校园。建设“书香校园、活力校园、欢喜校园、协调校园”是我们的理想,我很是希望它能够成为我们全体师生配合的目的,这需要我们来配合起劲。
,黄 色情视 频小便,黄游18+**在线下载,沟沟人体。??01月06日,腾讯股东南非纳斯帕斯集团投资印度食品配送平台获利纽约联储:1.17万亿美元!美国人信用卡债务总额创纪录 ,
“应该是骨文的神秘实力,令那处神藏沉入了大地下,漂移向了远方,无人知晓在那里了。”族长一声叹息。
,师妹三级片,自拍偷拍欧美日韩,www日本免费。??时势3:国产原创无码视频在线观看
??01月06日,香港西九社区参与计划推出共融茶馆剧场体验及触感导赏团,
时间不长,这数十头猛兽与异禽所有倒在了血泊中,或是被斩掉了头颅,或是被截断了躯体,很是的霸烈!
,26uuu亚洲欧美,乱伦.www,黄站18禁免费。??01月06日,王楚钦、孙颖莎巴黎奥运会后再搭档混双感觉不错,
??时势4:国产免费AⅤ片在线观看不卡
??01月06日,越冬候鸟抵达新疆博乐市,
最后祝各人新年快乐,身体康健,家庭幸福,心想事成!谢谢!
,亚洲精品在线免费自拍视频,狂c舞蹈生,国产乱人视频在线播放。??01月06日,台积电暂停向大陆客户提供芯片 国台办回应,
依赖科学手艺和信息化治理是提高谋划和企业治理水平的主要手段,在企业体制刷新一直深化的今天显得更为主要?萍己托畔⑹虑樵诠镜闹饕饔靡阎鸩降靡匀啡虾吞嵘。公司向导一直重视科技信息事情,对科技信息事情有明确的指示:依赖手艺前进,一直提高清静稳固运行水平。要牢牢围绕解决清静、稳固、高效、经济运行,提高手艺水平和生产能力,提高企业现代化治理水平,开展科技立异,要注重新手艺的应用研究和推广。重视信息网络清静治理,扎实搞好信息资源整合,以信息化推动电网治理现代化。因此,我们要从提高清静、稳固、经济、优质运行,提高治理水平、提高经济效益、提高焦点竞争力的高度,抓好科技信息事情,为周全提高公司妄想、设计、建设、生产、运营、试验研究和谋划治理的水平,提供强有力的手艺支持和全方位的效劳。
,AA黄色网站视频,啊 学长 好硬 拔出来 罗莉岛,国产在线精品自拍。责编:陈美
审核:盛修利
责编:梁朝伟
Copyright (C) 2001- Dzwww 鲁ICP备09023866号-1