首页
智工具作者 ZeR0编辑 漠影
智工具12月20日报道,今日,摩尔线程在首届MUSA开发者大会2025上宣布全功效GPU手艺蹊径图,并一连亮出“10张王牌”:新一代全功效GPU架构「花港」、即将宣布的AI训推一体芯片「西岳」与高性能图形渲染GPU「庐山」、万卡训练集群「夸娥」、刷新单卡推理的「S5000」、智能SoC芯片「长江」、AI算力本MTT AIBOOK、迷你型盘算装备AI Cube、具身智能、摩尔学院。
恰逢近期国产GPU声量沸沸扬扬,摩尔线程这场大会,说是万众期待绝不为过。
从交出的年终答卷来看,摩尔线程称得上是至心拉满。摩尔线程首创人、董事长兼CEO张建中长达2小时的主题演讲,麋集披露了笼罩云边端的最新软硬件产品及手艺结构。MUSA嘉年华展区琳琅满目的展品与演示,转达出国产GPU生态的勃勃生气。
按MUSA架构蹊径图,其架构每年一迭代,继苏堤、春晓、曲院、平湖后,新一代花港架构终于登场;ǜ壑С諪P4到FP64的全精度盘算,算力密度提升50%,效能提升10倍,可支持十万卡以上规模的智算集群。
基于花港架构,摩尔线程即将宣布2款芯片手艺蹊径:
西岳芯片专注AI训推一体与超大规模智能盘算,集成新一代异步编程与全精度张量盘算单位,支持从FP4至FP64的全精度盘算,为万卡级智算集群提供稳固高效的算力支持。其浮点算力、访存带宽、访存容量、高速互连带宽性能均凌驾业界标杆产品HXXX,部分设置看齐BXXX。
庐山芯片专攻高性能图形渲染,相比MTT S80,3A游戏性能提升至15倍,AI盘算性能提升64倍,几那里置性能提升16倍,光线追踪性能提升50倍,显存容量提升4倍,并显著增强纹理填充、原子访存能力;集成AI天生式渲染、UniTE统一渲染架构及全新硬件光追引擎。
面向云端盘算,夸娥万卡智算集群已建成,是真正的用来“训练”的万卡,可支持万亿参数模子训练;在推理方面,摩尔线程联合硅基流动,大幅提升满血版DeepSeek R1单卡推理吞吐量,S5000单卡Prefill破4000,Decode超千;MTT C256超节点架构专为超大规模智算中心设计,基于高密硬件架构,实现极致智算性能。
张建中说,接下来,摩尔线程将会做10万卡及更大规模的智算集群。
面向端边侧,张建中现场展示了搭载“长江”SoC芯片的第一台AI算力本MTT AIBOOK。
这款AI算力本集开发、办公、娱乐于一体,提供50TOPS异构AI算力,具备多系统兼容能力,预置了AI开发情形与工具链,可在外地运行最高30B的端侧大模子,内置智能体“小麦”及多种AI应用,支持8K超高清视频播放、外接4屏,今日起在京东商城开启预售。
AIBOOK实现了从芯片、驱动到开发情形的全栈整合,不但使得AI开发的“开箱即用”,更立异地突破Linux开发、Windows办公与Android应用之间场景壁垒,将强盛的AI能力转化为人人可及的生产力,赋能开发者在AI时代成为“超等个体”。
它不但是立异工具,更将成为开发者接入MUSA生态的主要入口。
大会同期宣布AI模组MTT E300,并预告了迷你型盘算装备MTT AI Cube。
这些盘算装备均搭载了自研智能SoC“长江”芯片。这款芯片集成磷七性能全大核CPU、全功效GPU、可编程双核NPU、VPU、DSP、ISP,支持32GB/64GBLPDDR5X ,内存带宽凌驾100GB/s,异构AI算力达50TOPS,支持INT8/FP16/FP32混淆精度盘算。
摩尔线程还披露了图形手艺蹊径图:率先拥抱“图形+AI”,实现硬件级光线追踪加速。
此次大会亦宣布了MUSA 5.0全栈软件、MUSA图形软件栈、大模子推理套件等一系列升级,进一步降低开发门槛。
面向具身智能领域,摩尔线程宣布MT Lambda具身智能仿真训练平台、夸娥智算集群“端云连系”的MT Robot具身智能解决计划,并宣布将于2026年第一季度开源要害仿真加速组件Mujoco-warp-MUSA,以开放协作助力机械人工业研发效率提升。
阻止今年6月30日,摩尔线程拥有凌驾500个已授权专利,其中发明专利抵达468个。
一、战略基石:MUSA 5.0全栈软件升级,即将推出盘算光刻库
在主题演讲中,张建中强调了MUSA架构作为全功效GPU基石的先进性与手艺引领性。
全功效GPU的立异折射出一部算力进化史。他展望2021年-2026年是天生式AI时代,2027年后是物理AI和量电融合的时代,基础设施接纳全功效GPU,就可以坚持科技一连领先。
摩尔线程的全功效GPU有四大焦点引擎:AI盘算加速引擎、图形渲染引擎、物理仿真和科学盘算引擎、超高清视频编解码引擎。
这背后,是摩尔线程自主研发的元盘算统一盘算架构MUSA(Meta-computing Unified System Architecture),完整界说了从芯片设计到软件生态的统一手艺标准。
张建中宣布,MUSA 5.0全栈软件全新升级,可完整笼罩种种GPU应用场景,支持海内外主流CPU、操作系统及开发情形。
MUSA 5.0在全栈统一性、极致效能与生态开放性上取得要害突破。
(1)编程生态周全升级:既兼容CUDA C,又有原生MUSA C,深度兼容TileLang、Triton等编程语言,还原生支持智源研究院开发的FlagOS & Triton,为开发者提供无邪高效的全栈开发体验。
(2)盘算效能极致优化:焦点盘算库muDNN实现GEMM、FlashAttention效率超98%,通讯效率达97%,编译器性能提升3倍,并集成高性能算子库和开发者工具,显著加速训练与推理全流程。
(3)开源生态一连扩大:妄想逐步开源盘算加速库、通讯库、系统治理框架等焦点组件,向开发者社区开放深度优化的底层能力。
(4)即将推出四大基础库:兼容跨代GPU指令架构的中心语言MTX、面向渲染+AI融合盘算的编程语言muLang、量子盘算GPU融合框架MUSA-Q、加速OPC光刻盘算的盘算光刻库muLitho。
二、硬件焦点:宣布手艺蹊径图,花港新架构首揭秘
花港架构基于全栈自主研发,接纳新一代指令集,支持FP4到FP64的全精度端到端盘算,算力密度提升50%,能效提升10倍,新增MTFP6/MTFP4及混淆低精度支持,兼容MXFP和NVFP,内置低精度赔偿手艺。
该架构集成新一代异步编程模子,优化使命调理与并行机制,高效施展算力;通过自研MTLink高速互联手艺,支持1314GB/s片间互联,支持超十万卡级智算集群扩展。
在花港ACE2.0架构中,摩尔线程在每个MP里设计了一个小ACE引擎,通过更多的通讯和盘算并行,使效果显著提升。
别的,花港做到了图形与AI深度融合:内置AI天生式渲染架构(AGR),增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate。
基于“花港”架构的硬件光线追踪加速引擎,可实现对DirectX Raytracing (DXR)的支持,使实时、逼真的光影效果在国产GPU上成为可能,性能比MTT S80快50倍。
除了具备自主可控的焦点能力外,花港还具有高清静性,通过4层硬件清静架构,提供从芯片到系统的可验证清静守护。
三、夸娥万卡智算集群算力达10EFLOPS,单卡刷新国产GPU推理性能纪录
会上,摩尔线程正式宣布夸娥万卡智算集群。该集群具备全精度、全功效通用盘算能力,在万卡规模下实现高效稳固的AI训练与推理。
其有8大亮点:
浮点运算能力抵达10EFLOPS在多项要害精度指标上,模子效果抵达国际主流水平;逊с力使用率(MFU)在Dense大模子上达60%,MOE大模子上达40%有用训练时间占比凌驾90%训练线性扩展效率达95%盘算通用;与国际主流生态高度兼容;在多项指标上具备显著能效和性价比优势。
面向大模子训练,随着大模子走向万亿参数、重大MoE架构,大模子训练集群规模迈向10万卡,训练精度从FP16走向FP8/FP4,后训练强化学习算力需求快速爆发,带来应对大规模训练、实现高性能训练、包管可靠性训练方面的挑战。
摩尔线程通过软硬协同,分层优化,系统性攻克这些挑战:GPU提供低精度FP8盘算能力、ACE异步通讯引擎;MUSA架构提供高性能算子与通讯原语;兼容主流的AI框架;通过MT-Megatron平漫衍式训练工具,实现高效并行与高吞吐RL;最终由夸娥智算集群平台提供零中止容错与统一可视察。
同时,通过软硬协同深度优化,摩尔线程完整复现DeepSeek V3的FP8训练,自研FP8 GEMM通详尽腻化优化,算力使用率高达90%;通过极致算子性能优化,Flash Attention的算力使用率超95%。在展示的案例中,MTT S5000集群实现了比国际主流盘算卡更好的DeepSeek训练效果。
面向大模子推理,挑战在于降低本钱和让效劳更快。为了充分验展硬件性能,摩尔线程宣布升级的大模子推理套件,周全支持开源社区引擎。
连系这些推理引擎,在DeepSeek R1 671B全量模子漫衍式推理场景中,MTT S5000能实现优于HXX的Prefill Only和Decode单卡吞吐,单用户每秒有凌驾100个token。
摩尔线程联合硅基流动,经由系统级工程优化与FP8精度加速,在DeepSeek R1 671B全量模子上实现性能突破:MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s。这一效果刷新了国产GPU的推理性能纪录。
在运行混元、万相视频天生模子时,MTT S5000单机推理速率比HXXX更快。
面向未来,摩尔线程宣布了MTT C256超节点的架构妄想。该产品为下一代超大规模智算中心构建,接纳盘算与交流一体化的高密设计,以1层scale up网络实现2柜256GPU全互联,规避2层以上网络带来的带宽损失和特殊延迟,旨在系统性提升万卡集群的训练效能与推理能力,兼顾超高密度与极致能效。
四、作育百万MUSA开发者,AI算力本提供“开箱即用”一站式开发
GPU盘算生态由上层算法库,中层接口、驱动、编译器和底层硬件架构三大部分基本组成,盘算生态的富厚性是GPU的焦点竞争力之一。
摩尔线程构建了从硬件工具、算力支持到人才作育的赋能系统。
1、深化人才作育,建设MUSA生态枢纽
以摩尔学院为平台,摩尔线程已构建起产教融合的开发者生长系统,该平台汇聚近20万名开发者与学习者,并通过“国产盘算生态与AI教育共建行动”将前沿手艺与工业实践带入天下200多所高校,吸引超10万名学子加入。
本次大会宣布建设MUSA生态中心,同时宣布MUSA开发者妄想,旨在为从AI学习探索到科研立异的各阶段立异者,提供算力支持与手艺赋能。
2、宣布AI算力本,提供“开箱即用”的开发体验
作为毗连开发者与MUSA生态的焦点入口,MTT AIBOOK搭载自研“长江”智能SoC,提供高达50TOPS的端侧AI算力、32GB/64GB高速内存、1TB SSD超大存储。
这是一款专为AI学习与开发者打造的小我私家智算平台,从芯片、驱动到开发情形全栈整合,实现了专业AI开发的“开箱即用”,可随心切换Linux开发、Windows办公、Android应用,亦支持国产操作系统,以便开发者快速搭建智能体。
在展区,智工具看到MTT AIBOOK里已经装置了百度网盘、飞书、腾讯聚会、腾讯文档、QQ等常见应用。
大会同时预告了基于长江芯片打造的迷你型盘算装备MTT AI Cube,进一步富厚端侧盘算产品形态。
张建中谈道,生态系统是GPU行业的焦点护城河与价值所在,依托MUSA架构的优势,摩尔线程一连加大研发投入,致力于攻克从硬件到软件的焦点手艺挑战,以开放立异一直深化与生态同伴的协同,配合构建自主自强的国产盘算工业生态。
结语:国产智能盘算生态一连演进
随着手艺及生态走向成熟,国产GPU落地渐呈燎原之势。
在这场聚焦全功效GPU的开发者盛会上,中国工程院院士、清华大学盘算机系教授郑纬民揭晓主题演讲,提到生长“主权AI”是提升未来国家竞争力的要害,其焦点在于实现“算力自主、算法自强、生态自主”的完整系统。
据郑纬民院士分享,国产盘算显卡与外洋主流产品的性能差别正在一连缩小,虽然构开国产万卡以致十万卡级别的超大规模智算系统保存难度,但这是必需完成的工业基础设施使命。开发者是生态建设的要害,国产芯片平台必需构建起友好、易用的开发情形,以有用效劳开发者社群。
MUSA开发者大会2025展示了摩尔线程以自主统一架构MUSA为基本、贯串“芯-边-端-云”的完整手艺栈,落地领域笼罩从超大规;∩枋┑娇⒄咧斩。
面向更辽阔的未来盘算场景,摩尔线程已睁开前瞻性结构。MUSA生态已与相助同伴在具身智能、科学智能(AI for Science)、量子科技、AI for 6G等前沿交织领域睁开探索事情,一连拓展全功效GPU作为通用算力底座的手艺界线与应用价值。
国产GPU还在闯关,但这条路,已经肉眼可看法越来越有希望。
《美女被草软件》,《Q8X2R7L1T4J5M9B6W3》火影忍者vk1400最新版本更新内容
“99riav免费毛片”
小萝莉被各种姿势c到合不拢腿
……
12月22日
“中文字幕精品三级视频”密室大逃脱大神版 第六季
↓↓↓
12月22日,2023年山西全社会用电量达2885亿千瓦时,人人操 插,教室里强摁做开腿呻吟h,国产欧美视频-区在线,母狗人妻调教
12月22日,香港金管局:美联储何时减息存变数,高清无码一本,久久久精品国产自在看,成年网站未满十八禁止看,mantahaya1777kino的功能
12月22日,安徽省气象局启动重大气象灾害(高温)Ⅳ级应急响应,黄色欧美久久a级美国一级片,啪啪官网,超碰在线网,国产午夜一级特黄A片在线观看
12月22日|巴黎奥运会开幕式观众规模降至30万人|3DFree XXX hinata 动漫 同人|丰满岳乱妇精品|天天一级片|亚洲欧美在线aaa
12月22日|独家V观丨你好 秘鲁|成年人免费观看网站|影音先锋在线观看资源无码|www .激情小说.com|在线观看叶山小百合主演的电影
12月22日|河南发布高温红色预警 农户抗旱保秋苗|浪货今天就把你 到服为止文轩|日本在线WWW免费|国产又爽又粗又硬又适应|www.人人操.co m……
12月22日,李昊冉:跃动的音符是我一生的追求,欧日韩在线看片免费人成视频,叶子楣露100%奶头无遮挡,2022年精品国产福利在线高清,99热这里只有精品2
12月22日,全国充电基础设施保有量达1188.4万台,一级黄色A片网站,亚洲IV秘 一区二区三区,日本成人香蕉网,朴正姬老款A8的电影免费观看
12月22日|日照边检站全流程高效保障“一带一路”航运重器|人人干人人操人人摸人人爽|国产黄色网站大全在线观看|群交双渗透HDⅴideos|无套内谢小罗莉在线播放
12月22日,标本兼治,电动自行车源头治理要跟上,国产在线观看H精品一区,亚洲色图欧美一区二区,嗯啊少妇骚动午夜视频,91免费精品国自产拍在线入口
12月22日,中方呼吁乌克兰危机有关方面恢复谈判,被c 到爽的视频,左手视频日本,少萝自慰 免费网站,污污污视频在线亚洲精品网站
12月22日,加拿大法语区最大城市蒙特利尔龙年新春节庆氛围升温,美女a黄,露脸颜射视频,黄色网站一级怕怕,欧美劲爆性爱A片
12月22日|山西黎城:“水+”产业赋能丹泉河谷 打造乡村振兴新引擎|国产黄色片av|一级肏屄免费视频|国产av导航网站|www.17.com一起草
12月22日|旅俄大熊猫“喀秋莎”迎来一周岁生日|樱桃视频 成人|怎样免费在线观看黄色视频|亚洲黄色12级视频|亚洲一区二区免费在线观看
12月22日|超74000名南非选民在海外参加全国大选投票|一级毛片视频免费入口|四川美女爆乳性交|色欲国产精品久久久久|国产A片
爱是常觉亏欠啊,李宇春演唱会成都收官站|海外华文媒体代表走进福建漳州零距离感悟语堂文化|色视频在线观看无码视频|网友自拍偷拍第一页|人妻系列AV无码专区按摩|AV午夜剧场
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
中国俄罗斯书法美术作品展在莫斯科举行
人民日报记者走进钱凯港 | 大国外交零时差
学习时节丨全国两会上,总书记这样强调文化自信
埃塔水瓶座流星雨出现在斯里兰卡夜空
上海医疗援青:先进技术“带土移植” 提高受援方“造血”功能
外国网红看海南|黑神话火了以后 老外跑来南湾猴岛寻猴王啦
专家:泡脚水温过高会影响睡眠,时间以15分钟到30分钟为宜
海外华裔青少年北京行:登长城 习武术 重温奥运记忆
交通部门多举措应对返程客流高峰
中方:将继续为推动巴勒斯坦问题早日得到全面公正持久解决不懈努力
欧美精品视频A欧美大胆
嗯∽啊~轻点禁🔞视频
蜜芽av人妻久久无码精品
国产午夜福利不卡片在线
九九国产调教视频网站
伊人影视在线观看
午夜少妇影院
r34奖励图片
XAMSTER中文版
2017人人操人人摸

闽公网安备 35010302000113号