摩尔线程发布新款AI训推一体GPU,性能如何?

南都N视频APP · AI前哨站
原创2025-12-20 13:14

12月20日的开发者大会上,国产GPU公司摩尔线程(688795.SH)发布第五代芯片架构“花港”,并基于该架构新推出AI训推一体和图形渲染两款GPU产品。

摩尔线程创始人、董事长兼首席执行官张建中介绍,“花港”架构芯片支持十万卡以上规模智算集群,其算力密度提升50%,能效(性能与功耗的比值)提升10倍。

2020年10月成立至2024年底,摩尔线程先后推出以“苏堤”“春晓”“曲院”“平湖”命名的四代芯片架构。其中,“苏堤”“春晓”这两代架构的芯片主要为图形加速产品,直至2023年的“曲院”架构芯片,摩尔线程将重心转向AI智算产品。

目前,摩尔线程的产品线划分为AI智算、图形渲染加速,以及面向消费电子、智能座舱、具身智能等边缘计算领域的智能SoC(系统级芯片)三类。开发者大会上,摩尔线程针对三大产品线推出新款产品。

基于“花港”架构,摩尔线程发布AI训推一体芯片“华山”。张建中未给出“华山”芯片的详细参数,仅和英伟达两种新近架构的芯片进行了模糊比较:在浮点算力、高速互联带宽两项关键指标上,“华山”芯片介于Hopper架构和Blackwell架构芯片之间;而访存带宽上,“华山”几乎与Blackwell架构芯片齐平;访存容量则大幅超出Hopper架构和Blackwell架构芯片。张建中未披露用来对比的Hopper架构和Blackwell架构芯片具体指代哪一款英伟达GPU。

图片

“华山”芯片与英伟达两种新近架构芯片的性能比较。

记者了解到,“华山”芯片支持FP8(8位浮点数)、FP6和FP4低精度计算数据格式。相比之下,沐曦、燧原等同行2025年发布的新款AI训推一体芯片产品尚未支持FP8以下的低精度格式。

AI智算芯片真正用于模型训练,离不开大规模智算集群。12月20日,摩尔线程发布万卡智算集群方案,基于2025年量产的“平湖”架构S5000芯片,其浮点运算能力为10 EFlops(1 EFlops代表每秒百亿亿次浮点运算)。摩尔线程方面称,该智算集群支撑万亿参数模型训练。

图片

摩尔线程万卡智算集群的性能。

在超节点建设浪潮兴起的当下,摩尔线程也发布超节点产品MTT C256,支持256块GPU互联。超节点意在借助更高规模AI加速卡的高速互联,来弥补单卡性能不足的缺陷。此前,华为、阿里、百度昆仑芯、中科曙光均已抢滩超节点赛道

在图形渲染显卡产品线上,摩尔线程基于“花港”架构发布“庐山”GPU。据张建中介绍,和2022年发布的上一代S80图形渲染芯片相比,“庐山”在运行3A游戏上的性能提升15倍。

而对于新布局的智能SoC业务,摩尔线程推出“长江”芯片,主要面向具身智能等端侧算力需求场景。


采写:南都N视频记者 杨柳 发自北京

编辑:黄莉玲

更多报道请看专题:“芯”情

南都N视频,未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626