首页
近一年以来,统一明确与天生模子生长十分迅速,该使命的主要挑战在于视觉明确和天生使命自己在网络层间会爆发冲突。早期的完全统一模子(如 Emu3)与单使命的要领差别重大,Janus-Pro、BAGEL 通过一步一步解耦模子架构,极大地减小了与单使命模子的性能差别,后续要领甚至通过直接拼接现有明确和天生模子以抵达极致的性能。
香港中文大学 MMLab 和美团的研究者相信,在不久的未来统一模子的性能一定能够抵达单使命的水平,但同时也引起了他们的思索,现在通过拆解架构换取性能提升的方法真的是准确的吗,它是否背离统一模子的初志,它能够提升性能的内在缘故原由又是什么,这种方法真的是统一模子必需的吗?
「统一模子的初志」以及「 架构解耦的弱点」
统一明确天生模子的初志是为了通过透明化、合理化的图文交织思索历程,提高单使命的性能,例如让模子走迷宫时统一模子可以天生每一步对应的图像,可以在模子做数学题的时间给图像画上辅助线,或者是在天生一张图像的时间边画边思索有没有天生不对理的地方并且自动修正,这些都是 Uni-MMMU 等目今统一模子基准所关注,也是它自己被自力成一个领域的初志。
再回到架构解耦的模子,例如 BAGEL 上,它自己若是要实现图文交织思索,需要履历隐空间解码到文字或者像素空间,然后再编码到隐空间的重大历程,两个使命也险些不在统一个模子空间中,具有盘算开销大、信息丧失两大问题。虽然在目今情形下相比于其可观的性能,这个问题似乎并不显著,可是研究者以为随着研究的举行,这会是一个很大的问题。
AIA: 模子架构解耦不是统一模子必需的
为了探讨清晰「架构解耦带来性能提升的内在缘故原由」以及「探索不使用架构解耦的条件下提升模子性能的方法」,香港中文大学 MMLab 和美团联合推出了 AIA。
论文问题:Architecture Decoupling Is Not All You Need For Unified Multimodal Model论文链接:https://arxiv.org/abs/2511.22663代码:https://github.com/zhengdian1/AIA网页:https://github.com/zhengdian1/AIA-project
研究者首先通过研究差别架构的统一模子在每一层网络中跨模态交互的强度,他们惊讶地发明不管怎样举行模子架构解耦,明确和天生使命在统一层网络中始终泛起负相关的关系,同时进一步验证了这个征象与输入的模态、长度和种别都没有关系,这说明是模子自觉在学习怎样合理地分派两个使命在每一层中的占比,从而 「缓解冲突」,这又说明架构解耦实质上并没有解决使命之间冲突的问题。
研究者进一步在最后一列可视化了现在单使命 SOTA 的模子的多模态交互模式(HunyuanImage-3.0 虽然是统一模子,但更着重于天生效果),效果发明随着模子解耦水平的增强,其对应的跨模态交互模式会趋向于单使命的体现,这也是能够实现性能提升的主要缘故原由。
基于这个发明,研究者设计了Attention Interaction Alignment (AIA) 损失,通过将单使命模子的跨模态交互模式作为学习目的,在训练的历程中显式地约束统一模子的交互模式。
AIA 效果怎样?
研究者在 Emu3 和 Janus-Pro 这两种完全统一架构、稍微模子解耦架构上举行了实验,如下表所示,效果批注本文的要领能够在没有任何其他 trick 的情形下提升这些模子的性能,减小了与更高解耦水平模子的差别。
同时,研究者给出了使用 AIA 损失之后 Emu3 和 Janus-Pro 跨模态交互模式曲线转变,可以发明加入了 AIA 损失之后,两个模子的交互曲线都向单使命模子的体现靠近了,既证实晰 AIA 损失的有用性,同时也说明晰模子架构解耦不是唯一能够提高统一模子性能的方法。
虽然,研究者也认可在现在情形下完全统一的要领和高解耦水平的模子之间保存很大的差别,但正如 Emu3.5 的泛起,他们以为这个差别会越来越小。因此,研究者呼吁更多的人抛开表层的框架和数据配比,深入研究统一模子的使命冲突问题,寻找更优的解法。
AIA 好训吗?
由于 Emu3 只有预训练 (PT) 阶段是统一训练的,因此研究者在其 PT 权重上举行微调,而 Janus-Pro 给的是最终 SFT 微调后的权重,研究者在此基础上举行后训练。
研究者通过调解 AIA 损失与 next-token-prediction (NTP) 损失的比重来测试其微调的敏感度,效果发明训练 Emu3 的时间由于其预训练知识较量薄弱,AIA 损失在一个很大的规模内都能抵达稳固收敛的效果。而在 Janus-Pro 中,由于其自己预训练知识很强,AIA 的加入很是容易影响模子训练,但在合适的比重情形下仍然能够抵达不错的效果。
AIA 有什么优势?
AIA 损失的加入可以一定水平上镌汰现在常见的数据配比工程问题,本文的要领在天生与明确数据配比在 1:1 的情形下能够抵达更好的效果,这说明在一定水平上两个使命的训练不再是冲突的,爆发了协同优化的效果。
统一模子训练的准确蹊径是什么?
通过连系现在所有统一模子训练的问题以及本文的实验剖析,可以发明不管怎样解耦模子,其始终会在统一训练的历程中动态分派差别使命在统一层的权重来缓解冲突,那这是否现实上代表了统一模子的准确行为?
另一条统一起径是移除所有可以用来区分使命的线索(即接纳统一分词器、消除使命相关特殊 token、使用交织数据数据输入),迫使模子只能从输入中学习真正的统一空间。虽然这种要领或允许以解决使命间的负相关问题,但也会显著增添训练难度。
未来展望
AIA 迈出了统一模子训练原理剖析的第一步,研究者希望能够有更多志同志合的研究者加入这个领域的探索。统一模子现在的理论、架构都远远没有到杀青熟,需要各人配合举行探索。同时研究者也希望各人能够越发关注统一模子真正的意义,不要一味地关注目今单使命基准上的性能。
《160mk2成色带图片》,《Q8X2R7L1T4J5M9B6W3》好硬好粗
“全国直接免费观看的黄色网站”
婷婷五色天综合网
……
12月03日
“欧美一区视频”山东蒙阴冰雹大面积砸烂蜜桃
↓↓↓
12月03日,道中华丨云冈石窟第6窟中文殊和维摩诘竟然在中国?杭侃院长揭秘云冈石窟中的佛教中国化,免费看黄色大片视频大全,长精久久精品,西施奖励自己核心提示,王者涩涩
12月03日,中国发布全球首款别墅专用光伏组件,我要看黄色视频一区二区,美国色情巜做爰狂欲,二级婬片日本高清视频一,91精品九色九色
12月03日,中国驻名古屋总领馆提醒领区中国公民注意防范台风灾害,免费黄涩AV网址,无码中文字幕日韩专区视频,中国x站下载安装,小樱裸体 开腿被c
12月03日|广州白云机场国际出港客运航班截载时间缩至60分钟内|BB痒想让你添添让你日|巨乳 拔萝卜 自慰电影免费|韩国肉体裸交|免费看A级毛片在线
12月03日|线上线下联动 国货潮牌成为消费热点|日本黄色免费网址|精品国产碰碰人人a久久|免费观看欧美黄色网站|老熟女搡小伙子HD另类
12月03日|好吃又好玩!2024“好Ye冰淇淋节”邀民众共赴甜蜜之约|美女带乳钉秘 视频|www.黄色网址|26uuu另类|羞羞视频网站久久……
12月03日,伊朗外长:遭袭前收到消息,将在“适当时候”回击以色列,狼友网站直接麻豆,銍弇yoxy,欧美的性久久视频,欧美日韩国产在线va
12月03日,村味儿+国际范 青海建设高原特色体育强省,天天在线干,黄色录像第三部BB,汤姆维的姐姐的电影,精品国产a片免费网址
12月03日|宁夏回族自治区石嘴山市气象台发布大雾黄色预警信号|免费在线看国产网站视频|美女大黄大色一级特级毛片|tom影院入口tom最新消息|扒开她粉嫩的小缝尿进去H视频
12月03日,中新教育丨贵州推出“冬季研学大礼包” 让“研学游”实现“研学优”,70岁老妇 精,国产黄站,97国产精品永久性人人视频,The po r n脱裤子打屁股
12月03日,数读中国 | “压舱石”作用凸显 四组数据看工业经济向上向好,麻豆精品,javdb成人番🈲,国产精品欧美激情在线,欧美精彩在线视频
12月03日,国风新业态“一夜兴起” 商家转型“带火”王羲之的家,9.1在线观看漫画官方版下载,(越南女子别动队)免费,https://18comic-ph.club/stray/?utm_source=ZA&utm_medium=APPDOW,大色欧美性爱
12月03日|唐睿宗李旦孙媳妇墓出土罕见的完整石椁|爱操AV|/羞辱/调教/捆绑/束缚sm|二次元人物桶二次元人物用英语怎么|韩国成年人视频网
12月03日|“中国美食地标城市”福建福鼎举办啤酒美食节|天天色人人操|人人操人人干人人摸人人操|久久93精品国产91久久综合|熟女多毛模特操逼巨乳
12月03日|中国载人航天工程的开创者、工程院首批院士王永志逝世|女人鳮巴视频免费网站性质|91夫妻自拍偷拍视频|免费观看黃色A一级视|V11AV
李现朱一龙都被湖北文旅摇来了,罪魁祸首|以军:已包围汗尤尼斯,将继续向哈马斯据点推进|欧美色吧综合另类色吧|lutube|女医生帮我打了飞机真实经历|http://黄色视频在线观看
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
耐盐碱耐涝、固氮高产 “中科菁1号”高效实现盐碱地生物改良
四川打造新时代更高水平“天府粮仓” 耕地面积净增加50万亩以上
“龟甲牛骨上的精灵——甲骨文艺术展”亮相南非
李盈莹:这场比赛完全有机会战胜对手,结果有些可惜
十年,为一个山冲“筑梦”
重庆警方侦破特大跨境网络赌博案 查证涉案资金流水10亿余元
央行开展373亿元7天期逆回购操作
江苏南京:年夜饭堂食预订火爆 外卖服务更便捷
菲律宾南部海域发生5.2级地震 震源深度10千米
达沃斯热议中国建议:开放合作为全球产业注入新动能
真琴动漫社
久久精品免费视频e
嗯 好深 啊 用力 哦 轻点
成年男人黄网站色大片免
干下面视频免费
黑土被扒开腿做 同人动漫
斩神红樱胸罩是白色还是黑色
毛片网在线视频
欧美高清官网
人人操日人人摸人人操

闽公网安备 35010302000113号