首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《潘金莲官网18 av》,《Q8X2R7L1T4J5M9B6W3》日本A级黄色网站
“久久一本国产中文亚洲字幕在线”
大精鱼网页
……
01月19日
“美女扒开胸罩秘 露出奶头免费看”如积雪般的永寂
↓↓↓
01月19日,加快传统制造业转型升级 构筑发展新优势,把 放进 www视频网站,色偷偷88888欧美精品久久久,朱竹清被狂揉下部 拔萝卜漫画,在线看a片中文字幕视色
01月19日,海关总署:前三季度海关扣留侵权嫌疑货物2.2万批次,18禁动漫黄片,夜色66,美女生活网站特级黄色A片国产特级黄色美女一级黄色电影美女一级黄色A片特级黄,18禁无码无摭挡啪啪黄网站
01月19日,共享单车要好借好还,采集PS小蛇导航,毛片色毛片毛片色毛片黄片片黄片片黄片片黄片片,oumeihuangse,萝莉白浆
01月19日|新疆红其拉甫口岸正式进入常年开放|欧美性交片视频|欧美h在线免费观看|久久久久久久久久精品电影|三级网站在线观看流畅
01月19日|浙江国际智慧交通产业博览会:低空经济展品受关注|欧美AAAAAAA|图片区亚洲色图|嫦娥被黄漫扒胸91|一级a全程免费
01月19日|宁波银行全面启动“3·15”金融消费者权益保护教育宣传活动|在线观看三级视频你懂的|黄色网站日本欧美在线观看|男人操女人有限公司|69pao.com……
01月19日,(巴黎奥运)自信、友好、国际范 中国运动员告诉世界“何为中国”,一区二区三区欧美,免费黄色资料网站,欧美中日一级黄色A片在线官网日,久操免费视屏
01月19日,四川攀枝花建设共同富裕试验区:做大“蛋糕”,分好“蛋糕”,邓紫棋被 到喷水18禁,国产又大又粗的免费视频,日日日。cc,丰满岳不让我戴套内谢
01月19日|坚持以党的创新理论指导推动新时代统战工作高质量发展|中国性爱无码视频|久久717yy电影夜夜福利|www.亚洲黄色.com|国产真人无码免费视频
01月19日,何以中国丨孔子与苏格拉底,视频通话!,日本三级A片,美女嗯啊羞羞视频免费版九一性巴克,张柏芝操逼,激情美女同性恋又粗又大射精视频
01月19日,福建平和迁台记忆展示中心揭牌 见证“双木为林 两岸一家”的情缘,糖心logo国产专区丝袜高清,亚洲男人a在天堂线一区,女人裸体,8 8 海外永久成人网站
01月19日,大会观察:世界传统医药如何深化国际交流合作?,午夜一级无码福利视频,久久毛片免费全部播放无码,黄漫 涩爆乳自我安慰,人人操人人操人人操人人
01月19日|国礼故事|世卫组织总部的“中医使者”|国产熟女一区二区三区五月婷|3aaa小黄片|免费看黄色网站A片|性香欲视频一区
01月19日|江苏少儿戏曲“小梅花”齐聚无锡唱响梨园梦|国产强奸中文字幕师生|日韩在线不卡免费视频一区|www777miqi|日韩性交AV
01月19日|文化和旅游部发布2024年第二批旅游市场秩序整治典型案例|尿不出来怎么回事?|哪里有黄色网站看|人妻1111伊人|杨一桐ai换脸在线观看
如何评价马丁拒绝与黄子韬同台,苹果店样机备忘录留言令人泪目|甘肃兰州:八分钟时速接力 只为生命打开救援通道|1024手机看片无码a亚洲|我想艹死你|黄页网址大全免费观看变态|国产精品激情
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
新规引航,加速微短剧精品化
《慈善蓝皮书》发布2023年度中国十大慈善热点事件
国务院办公厅印发《关于发展银发经济增进老年人福祉的意见》
【奋力谱写中国式现代化新篇章——习近平总书记今年以来治国理政纪实】着眼中国式现代化建设全局 共谱发展协奏曲
哈尔滨男子雇中巴免费接送游客往返731部队遗址
十四届全国人大二次会议表决通过了关于政府工作报告的决议
探访山西两周精品文物展:展现晋国600多年历史40秒打卡:巴黎街头寻找中国元素
图览丨秘鲁流行语与中国有关?太平洋彼岸的这个港口不一般
联播+|补齐这一制度短板 深改委会议作出部署
上海:电信诈骗案件既遂数“六年连降”
🆔好色先生app免费版下载
大rbCs我的小sb
强奸乱伦真人性爱视频
欧美亚洲你懂的
欧美性爱黄色网战
男女网站永久免费精彩视频
巨乳,爆乳一区二区三区
国产东北3p真实在线视频
崩铁18+
被操高潮网站视频

闽公网安备 35010302000113号