首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《积积桶积积无掩盖教程》,《Q8X2R7L1T4J5M9B6W3》自拍偷拍激情小视频
“最新黄色网站下载”
五月婷婷丁香综合网
……
01月19日
“把14岁校花按在床上操”美国梦魇:迷离绑架案
↓↓↓
01月19日,加拿大“石油城”的国际中文日:“学中文,有用”,freexxx天美,看看一级操逼视频,男生的 伸进人 免费软件,美女黄色网站mmm
01月19日,在电影院里看奥运:氛围感满分 解锁体育消费新场景,中国美女洗澡,有没有嗯多个男人和一个女人做爱的高清视频黄色的aa片,两年青男野战Gay,久草网站在线
01月19日,数字中国建设的起点,国产午夜精品鲁丝片,igao爱搞视频网为爱搞点激情,动漫3D成人H无码国漫,玖玖玖啪色
01月19日|江西省政协服务大局谋良策出实招 履职为民做“四者”|亚洲综合网址|国产淫荡视频导航|911柚子猫盛世容颜小僵尸|国内乱能揄拍国内精品人妻
01月19日|从卷利率到卷额度 消费贷竞争白刃化|唐三爆桶比比东下面不亦乐乎|尤物性感美女自慰喷水网站|男男班杰明AV|少妇午夜福利
01月19日|售价78.9万元起 四座旗舰MPV极氪009光辉正式上市|图片区亚洲色图|亚洲色久桃花在线|免费鸥美A片在线视频|国产曰批试看免费视频播放免费……
01月19日,三百骑手角逐黄河畔 跟着赛事骑行游山西,超碰100,免费日本黄色网址,一级a性生活久久无码,欧美日韩精品久久免费
01月19日,《春天的旋律·2024》跨国春晚在广西南宁完成录制,午夜免费福利网站,丰满饥渴老女人HD,欧美精品AU在线,131美女爱做视频
01月19日|(文化中国行)“中国民族工业发展史活标本”何以跨越一个多世纪?|男生洗澡露j 秘 网站|jizz中国视频|国在线产视频91|撕开她的 吸奶头打扑克漫画
01月19日,2023年安徽制造业、高技术产业实际使用外资占比均超四成,真实国内自拍视频在线,成色18k1.8.35mb官网,美女免费无遮挡吸奶头网站,布兰迪爱视频
01月19日,建行多个项目荣获首届产融合作数据模型算法大赛奖项,99re这里只精品,www.αeαe.28.com欧美黄色片,黄片儿在线免费观看。,成人爽看一二三四
01月19日,和谐共生|长江、黄河流域是生态文明建设的主战场,99re6国内精品视频在线观看,小心 戳进初音未来 网站,野战乱轮,一级A片久久观看
01月19日|2023年12月规模以上工业主要能源产品生产保持稳定增长|日本乱子伦视频|影音先锋亚洲中文资源站点AV|A片免费看久久AV|观看免费黄色网站免费
01月19日|“机遇中国多彩世界”国际交流周在贵州遵义启动|欧美熟女乱伦自拍|免费一级精品黄色录像|自拍三级青草|偷拍一页
01月19日|探访山西两周精品文物展:展现晋国600多年历史|国产一级婬片A片AAA毛片A级漫画|国产免费观看黄AV片|16岁小萝自我安慰强插|在线视频国产免费观看
WBG遭WE零封,齐思钧发视频报平安|粗粮越吃血糖越高?当心“伪”粗粮|左边禁漫|免费看黄 片,在线观看|嘛豆传谋免费91最新版本|亚洲免费黄色视频
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
川青铁路构筑民族经济共荣新通道
江西鹰潭发生龙舟侧翻事故 造成1人死亡2人失联
(乡村行·看振兴)福建永定:沃柑俏枝头 乡村产业旺
“天府之国”美味多:打好“特”字牌 唱好“产”字歌
李家超:香港正与内地讨论增开24小时通关口岸等措施
从磨憨看政协力量如何助力国际口岸建设迸发活力
汇聚金融“同心力量” 重庆市委统战部引活水“滴灌”乡村发展
秋季暴雨袭海南 气象专家:台风“潭美”残涡和冷空气共同造成
四川地方国企规模再上台阶 将推动新一轮国企改革
美国华人病理医生王焕友:探寻临床诊断“金标准”
18 岁免费看
欧美老妇大乳大屁股操逼视频
未满十八禁止观看在线
一级特黄大片视频在线播放
女性性爱高潮免费视频
www.韩国avtv
多人换娶妻俱乐部疯狂操逼视频
欧美老妇黄色视频
国产高清
黑人狂躁女学生

闽公网安备 35010302000113号