99re6在线视频精品免费大秀,探索无限精彩,畅享不一样的世界,让生活更有趣

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

美团龙猫手艺升级!新注重力机制速率快10倍,还能处置惩罚1M超长文本

2026-01-21 16:25:20
泉源:

猫眼影戏

作者:

魏雨柔

手机审查

  猫眼影戏记者 杨彦龙 报道Q8X2R7L1T4J5M9B6W3

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

256K文本预加载提速超50%,还解锁了1M上下文窗口。

美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)

新手艺集中火力,重点解决长文本使命的明确、算力难题。

相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。

但模子长文本能力从256K扩展到1M,解码速率还快了不少。

甚至比同类型的Qwen-3模子体现还要好。

接下来看详细计划。

怎样做到 “只算要害部分” ?

全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。

LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。

作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。

详细分两步。

首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。

在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。

α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能 ;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。

在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。

随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA

这样就形成了一种交织结构,团队将这种结构称为ZigZag

SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。

以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。

为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口

每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。

这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。

从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”

速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍 ;

256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。

这也让LongCat-Flash-Exp解锁了1M上下文窗口。

性能上,LoZA也没由于简化而缩水。

处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平 ;处置惩罚长文本使命时,体现反而更好。

好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。

接下来,团队还妄想让LoZA支持动态希罕比例

随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。

好一个新年新气象!

论文地点:https://www.alphaxiv.org/abs/2512.23966

— 完 —

??时势1:欧美精品黄片

??01月21日,2024年巴黎奥运会开幕式观众规模减半,约为30万人,

  “松手,将宝扇还来!”那群人喝道,为首的几人眸子开阖劲间,符文流转,极端恐怖。

,日韩淫色av网站在线观看。

??01月21日,《群书治要续编》出版座谈会在北京举行,

  石洞中一群孩子一窝蜂的跑了出来,奔向大人,而这一边石林虎与石飞蛟等人也倚仗两件祖器前往接应,双方快速汇合在一起。

,婷婷5月天综合色色,欧美做受 高潮白,在线亚洲视频二。

??时势2:欧美精品视频一区11页

??01月21日,延安苹果进京推介,2023年全产业链综合产值破500亿元,

  六年级的最后一个学期应该是人生中要害的第一步。那么,在这要害时刻我们应当怎么做呢?下面我提几点要求。

,高清无码三级片尤物视频,黄工厂精品视频,AⅤ69色。

??01月21日,第75届黄金时段艾美奖颁奖 《继承之战》《熊家餐馆》《怒呛人生》胜出,

  好了!总之一句话:好的纪律、秩序是搞好事情、学习的包管。希望忘各人好勤学习,天天向上为中心小学争光。

,免费在线黄片免费,国产视频伊人网,丁香五月论坛。

??时势3:另类综合在线视频网站

??01月21日,20余件吴昌硕书法真迹在陆家嘴“百年雕花楼”展出,

  已往的一年,我们迎难而上, 规范实验土地征收衡宇搬家, 起劲争取用地指标。 基本 完成张洼村 160 户、 204 位宅基地和 17 位门面房、9.8万 M2 的搬家拆除事情,完成陈岗村1056户衡宇的视察摸底和宅基地甄别事情,完成343省道改线土地及地上附着物视察摸底事情,完成凤凰乐园项目101亩土地征收赔偿协议的签署、平安路242.6亩土地地上附着物的整理赔偿及土地租用事情 。通过多种方法 协调土地指标1323亩,通过 南水北调调蓄水库 争取土地指标2595 亩。同时完成 安顿区、化工技师学院、凤凰乐园等重点项目的6400亩土地测绘、勘界等事情 。

,美人猎母三部曲是哪三部,人干人操黄色视频,免费黄色刷视频网站。

??01月21日,2023年中国警方破获涉海犯罪案件2200余起,

  这太快了,如一道金色的闪电横过,祭灵行动迅猛,脱手快如火光,强烈而犷悍。

,国产A级毛片无码视频,三个黑人猛躁我一晚上什么歌,斗罗玉传不乐奇遇漫画画免费读漫画。

??时势4:欧洲老熟妇性做性视频

??01月21日,南宁有个“无人菜摊” 每把菜两元 交易全凭诚信,

  “孩子,既然你要实验,那就去吧。你还小,受一些波折,也许不是什么坏事,会激励你越提议劲前行。”有一些老人这样启发道。

,www 日韩,午夜欧美888,大骚逼人人操。

??01月21日,中新真探:加钙牙膏能为牙齿补钙?,

  “噗”

?第八十五章 收获,裸体少罗,人人操人人插人人爱人人色人人尻,竹内沙里纳夸最经典十句话。

责编:王力丁

审核:翁奇羽

责编:格萨尔

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图