首页
这项由浙江大学ZIP实验室的李小龙、谷友平、林希、王伟杰和庄博涵配合完成的研究揭晓于2025年12月,论文编号为arXiv:2512.04025v1,为视频AI领域带来了一项主要突破。有兴趣深入相识的读者可以通过该编号盘问完整论文。
要明确这项研究的主要性,我们得先从一个一样平常体验提及。当你用手机看高清视频时,是否注重过有时间加载很慢,或者电池消耗特殊快?这背后的缘故原由,就是处置惩罚视频对盘算机来说确实是一件"重体力活"。现在的AI模子在明确和天生视频时面临着一个重大的挑战:盘算量太大了。就好比要一小我私家同时记着一本小说的每个字、每个标点符号,然后还要明确整个故事情节一样难题。
古板的AI处置惩罚视频时,接纳的是"全注重力"机制,这就像是一个极端专注的学生,对课本上的每一个字都投入同样的精神去明确。这种要领虽然准确,但效率极低。好比处置惩罚一段720p、81帧的视频时,使用Wan2.1-14B模子在单个NVIDIA H20 GPU上需要近两个小时,而其中80%以上的时间都花在了注重力盘算上。这种效率显然无法知足现实应用的需求。
为相识决这个问题,科研界提出了"希罕注重力"手艺,就像是让学生学会"重点阅读"——只关注主要的部分,忽略不主要的内容。现在主流的要领是"块希罕注重力",它把视频内容分成许多小块,然后用简朴的"要或不要"来决议是否处置惩罚每个块。这就像用一把粗糙的筛子来过滤信息,虽然速率快了,但在高希罕度(也就是扬弃大宗信息)的情形下,主要信息也会被误删,导致质量下降。
浙江大学的研究团队提出了一个巧妙的解决计划:金字塔希罕注重力(PSA)。这个要领的焦点头脑可以用视察景物来比喻。当你站在山顶俯瞰山下的都会时,你会自然地对差别距离的事物接纳差别的视察精度:近处的修建你能看清每扇窗户,中等距离的你能区分出修建轮廓,远处的可能只能看到一片朦胧的色彩。PSA就是模拟了这种人类视觉的自顺应机制。
这种要领的巧妙之处在于,它不再简朴地"要或不要"某个信息块,而是凭证主要性给每个信息块分派差别的"视察精度"。关于主要的部分,它会坚持高精度的处置惩罚(就像仔细视察近处的景物);关于次主要的部分,它会适度降低精度(就像简陋视察中距离的景物);关于最不主要的部分,它会大幅降低精度或者完全忽略。
详细来说,PSA构建了一个多条理的"金字塔"结构。在这个金字塔中,底层坚持原始的高区分率信息,而每向上一层,信息就会通过平均池化变得越发粗糙。研究团队发明,相邻的视频帧在内容上往往很相似,这为这种分层处置惩罚提供了理论基础。通过巧妙的主要性评估和多条理掩码天生,PSA能够为每个盘问动态分派最合适的处置惩罚层级。
为了确保这种要领在现实硬件上也能高效运行,研究团队还开发了一个硬件友好的内核设计。他们接纳了"解耦块-瓦片"设计,将逻辑块巨细与硬件瓦片巨细疏散,这样纵然处置惩罚的信息块巨细各不相同,也能坚持高效的GPU使用率。这种设计在NVIDIA H200上相比质朴实现能够抵达10倍的加速。
实验效果令人印象深刻。在视频明确使命中,使用Qwen2.5-VL模子在Video-MME数据集上的测试显示,PSA在坚持与全注重力相当准确度的同时,将盘算量降低到了原来的35%。在视频天生使命中,PSA在多个模子上都体现精彩。以Wan2.1-1.3B模子为例,在高达91%的希罕度下,PSA天生的视频在PSNR、SSIM等要害指标上都显着优于其他希罕注重力要领,同时在VBench评分的美学质量、配景一致性等方面也体现更佳。
特殊值得一提的是,PSA还能与其他优化手艺很好地连系。研究团队将PSA与TDM蒸馏框架连系,在CogVideoX-5B模子上实现了30倍的推理加速,同时VBench评分甚至凌驾了原始模子。这批注PSA不但是一个自力的优化计划,更是一个可以与其他手艺协同事情的通用?。
从手艺实现角度来看,PSA包括三个焦点组件。首先是金字塔KV块构建,通过渐进式池化建设多条理体现。其次是多条理掩码天生器,它能够凭证盘问-键块对的主要性动态分派处置惩罚层级。最后是自顺应金字塔注重力盘算,在包管概率漫衍一致性的同时高效盘算注重力权重。
研究团队还举行了详尽的消融实验来验证设计选择的合理性。他们发明,多条理掩码相比古板二进制掩码能够显著提升性能;基于阈值的掩码分派战略比基于分位数的战略越发无邪有用;余弦相似性约束能够进一步提升模子在特定使命上的体现。这些实验效果为PSA的设计提供了坚实的理论支持。
更令人兴奋的是,PSA展现出了极强的通用性。它既可以应用于因果注重力场景(如视频天生),也可以用于双向注重力场景(如视频明确)。这种无邪性使得PSA成为了一个真正的"即插即用"?,可以轻松集成到现有的种种视频AI系统中。
从更宏观的角度来看,PSA代表了希罕注重力手艺的一个主要生长偏向。它证实晰在盘算效率和质量之间并非只有简朴的取舍关系,通过更细腻的设计,我们可以在大幅提升效率的同时坚持甚至提高输出质量。这为未来的视频AI应用,特殊是实时视频处置惩罚、移动端视频天生等场景提供了新的可能性。
说究竟,这项研究的价值不但在于解决了目今视频AI面临的盘算瓶颈,更在于它为整个领域提供了一个新的思索框架。通过模拟人类视觉系统的自顺应处置惩罚机制,PSA展示了怎样在人工智能系统中实现越发智能化的资源分派。随着视频内容在我们一样平常生涯中的主要性一直提升,这种高效的处置惩罚手艺将为更多立异应用铺平蹊径,让通俗用户也能享受到更流通、更智能的视频AI体验。关于那些希望深入相识手艺细节的读者,可以通过论文编号arXiv:2512.04025v1查阅完整的研究报告。
Q&A
Q1:金字塔希罕注重力相比古板要领有什么优势?
A:金字塔希罕注重力的最大优势是能够凭证信息主要性分派差别的处置惩罚精度,而不是简朴的"要或不要"。这就像用差别倍率的望远镜视察差别距离的物体,既包管了主要信息的清晰度,又大幅降低了盘算量。实验显示它能在91%希罕度下仍坚持优异的视频天生质量。
Q2:金字塔希罕注重力能用在哪些现实应用中?
A:这项手艺可以普遍应用于视频明确和天生使命中,包括手机上的视频编辑、实时视频通话、短视频平台的内容天生、安防监控的智能剖析等。特殊是在移动装备上,它能显著降低电池消耗和发热,让用户获得更流通的视频AI体验。
Q3:通俗用户什么时间能体验到金字塔希罕注重力手艺?
A:虽然这项手艺现在主要在学术研究阶段,但其"即插即用"的设计特点使得它很容易集成到现有的AI视频系统中。预计在不久的未来,各大科技公司会将类似手艺应用到消耗级产品中,用户可能会在视频编辑App、智能手机相机功效等应用中体验到这种手艺带来的性能提升。
《aaa湿湿湿》,《Q8X2R7L1T4J5M9B6W3》在线无码视频
“有没有免费的黄色网址”
真实乱子乱人伦视频
……
12月10日
“人人干 人人色”A股三大指数高开
↓↓↓
12月10日,四川绵竹:红外相机多次拍到野生大熊猫活动视频,一级欧美片免费观看,一级黄色视频免费淫乱,成人黄色视频在线观看,亚洲熟女乱综合一区二区
12月10日,巡视组进驻1个月,省会市长任上被查,少年被爸爸c到爽到尿床漫画,人人澡人人模人人爽av,顶级黄色视频播放,麻花豆国产剧免费观看
12月10日,深圳楼市止跌回稳态势明显,天天日天天插天天干天天很天天色天天射,原耽嗯啊 摸 湿,麻豆国产91啪啪啪啪啪啪,亚洲精品人成无码毛片
12月10日|重庆2023年GDP迈上3万亿元新台阶 专家解读:“3万亿”如何炼成?|窒物者驺虞|打屁股调教网站|亚洲视频华人在线播放|曼珠沙华裸身被 羞羞漫画
12月10日|国台酒总工程师李长文讲述:一个茅台镇白酒现代化的故事|黄色视频在线观看网址大全|成年人视频在线免费|欧美猛男军人Gay巨大杂志|国产口爆吞精在线观看视频
12月10日|马来西亚鲜食榴莲首航落地河南|爆喷水洗澡wwww|牧场ZOZ0重口另类女人2|五月综合激情网|午夜东京热精品久久……
12月10日,国台办:只要承认“九二共识” 两会对话交往便不存在障碍,影音先锋男人av资源网站,日韩黄污视频免费看,欧美熟妇激情视频在线播放,欧美激情性A片在线观看⑧
12月10日,从大都市回归,这个小伙想与乡土一起成长,人人操人人一,扒开腿cao烂你小sao货作文,又黄又骚的视频国产,波波视频欧美
12月10日|新疆克孜勒苏州乌恰县发生3.0级地震 震源深度10千米|国模久久|日韩欧美视频图片综合二区|町村京子|人人揉人人操人人摸
12月10日,春运前5天广东累计发送旅客超1700万人次 同比增长逾45%,欧美午夜性交,女人被男人操出高潮,欧美的一级片,黄色色综合
12月10日,黄河流凌簇拥碰撞 奏响“大合唱”,国产精品国产高清国产AⅤ,www.久操.com,欧洲Aa片,亚洲美女操逼视频一区二区
12月10日,云中锦书丨阿联酋姑娘:从青年外交官到知名中国问题专家,美韩美屄,黄色性爱网页,穆桂英一级婬片,水蜜蜜-www.9.5com免费在线看中文版
12月10日|云南牟定彝绣产业崛起 赋能乡村振兴|污污污自慰黄色漫|久久综合九色综合久99|外国网站|国产免费又大又硬又爽视频
12月10日|中国传统剪纸在香港文化中心展出|草留色区|日日操天天操|视频一区二区三区入口|日本视频www.色
12月10日|习近平总书记关切事|古城近悦远来的故事|1024金沙人妻一区二区三区|免费看无码毛视频成片|日韩亚洲欧美综合|精品性爱视频在线
《大长今》续集制作决定,吧友陆续通关黑神话悟空|澜湄合作2023年度十大新闻发布|欧美风韵熟妇XXXX性|亚洲A片无码视频|李宗瑞和贝贝一夜二次|超碰人人操AV在线
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
2024世界青少年模拟联合国大会·重庆会议 中国少年双语讨论全球议题
2024年台湾地区两项选举结果揭晓
2024年上海GDP增长预期目标为5%左右
澳大利亚悉尼老年大学庆祝成立六周年
中外专家热议新质生产力:人工智能提供关键驱动力
广西柳州:融江江水交汇 现“泾渭分明”景观
《中国文化名片:北京中轴线非遗之旅》将出版 系统呈现中轴线上的人物生活
山西阳泉:以“数智新城”构筑转型发展新优势
加固堤坝、电力抢修 各地严阵以待应对持续暴雨
中国将牵头制定抗量子攻击的通信网络安全协议设计指南
国产真实迷J视频在线
国产精品毛片无码高清
一级色视频
99年黄色视频观看
啊啊啊太大了要坏了视频在线看
日本手机在线视频观看
亚洲综合网色
免费观看黃色A一级视频
一级毛片美女高潮喷水水
国产一区二区在线观看

闽公网安备 35010302000113号