(5秒详细教程)狂x英语课代表软件安卓版v4.09.9.84.04.20.77-2265安卓网

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

美团龙猫手艺升级!新注重力机制速率快10倍,还能处置惩罚1M超长文本

2026-01-18 05:16:53
泉源:

猫眼影戏

作者:

刘丹丹

手机审查

  猫眼影戏记者 王明 报道Q8X2R7L1T4J5M9B6W3

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

256K文本预加载提速超50%,还解锁了1M上下文窗口。

美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)

新手艺集中火力,重点解决长文本使命的明确、算力难题。

相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。

但模子长文本能力从256K扩展到1M,解码速率还快了不少。

甚至比同类型的Qwen-3模子体现还要好。

接下来看详细计划。

怎样做到 “只算要害部分” ?

全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。

LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。

作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。

详细分两步。

首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。

在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。

α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。

在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。

随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA

这样就形成了一种交织结构,团队将这种结构称为ZigZag

SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。

以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。

为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口

每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。

这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。

从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”

速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;

256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。

这也让LongCat-Flash-Exp解锁了1M上下文窗口。

性能上,LoZA也没由于简化而缩水。

处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。

好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。

接下来,团队还妄想让LoZA支持动态希罕比例

随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。

好一个新年新气象!

论文地点:https://www.alphaxiv.org/abs/2512.23966

— 完 —

??时势1:成人色漫-免费播放3d第五人格

??01月18日,美国当选总统特朗普提名国务卿等多个重要职位人选,

  远处的云层中,小不点喃喃自语,道:“狻猊是在诈死,想要除掉仇敌,居心引恶魔猿尚有离火牛魔前来,果真是智慧种族,比许多人都智慧。”

,一级少妇A片无码专区A片。

??01月18日,台风“潭美”已致越南3人死亡 1人失踪,

  山石嶙峋,这是一片很大的石林,悄然无声,地上散落着一些巨兽的遗骨,雪白而惊人。

,成人版寶可夢18禁,91精品福利尤物,无码视频网址大全。

??时势2:影视先锋AV资源站

??01月18日,日本大选:自民党不能单独过半数已成定局,

  干部冬训学习,既是深入学习党的理论立异效果的主要平台,又是建设学习型党组织的一个主要载体。要捉住冬训这一有利时机,普遍开展种种形式的学习型党组织建设活动。在学习方法上注重“三学”:向书籍学习、向实践学习、向群众学习;在学习目的上做到“三宽”:眼界宽、思绪宽、胸襟宽;在学习效果转化上落实“三新”:破解难题上有新思绪、推动生长上有新行动、创先争优上有新效果。

,A片亚洲一区二区三区,久久免费无码视频,网爆自拍视频在线观看。

??01月18日,2024我们如何邂逅文学的繁花?,

  “孩子,让我们看一看你爆发了怎样的转变。”一位族老说道。

,最好的AV网站,→开元ky888棋app下载,chaopeng97在线。

??时势3:色操B

??01月18日,中央民族乐团航天音乐会在海南文昌奏响,

新高一的致辞 篇7

,91论坛交友,欧美浓毛大泬视频在线观看,一级免费黄色毛片视频。

??01月18日,香港红色暴雨警告信号生效 西贡区暴雨水浸,

  直到天亮,一群孩子尚有部分年轻人才瞪着熊猫眼从湖中爬上来,灰溜溜地逃回了自己的家门。

,久久艹动态视频,99爱免费视频最新版本,Gay腹肌精牛捆绑虐榨精。

??时势4:国产精品视频99

??01月18日,新疆阿勒泰地区下拨1000万元应急救灾资金,

  混沌气汹涌,那块莹白的神物被攻击的飞向远方,竟击穿了密布于山水间的符文,那十几块原始宝骨锁不住此地了。

,舞蹈生露奶头,亚洲日本一区二区三区18禁,欧美高潮喷水抽搐A片免费看。

??01月18日,重庆永川为三只大熊猫举办生日会 果蔬蛋糕、九大碗、火锅串串等亮相,

  不然,谁没事吃狻猊啊,这种生物,血液稍纯一些的就凶气滔天,就更不要说是远古遗种了,让一个富家都压力重大,忌惮不已。

,18禁的黄色网站,东北老处女人69xxxx,欧美精品在线第一页。

责编:牛力

审核:卫翰思

责编:欧伯箭

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图