摩尔线程发布新款AI训推一体GPU，性能如何？

南都N视频APP · AI前哨站

原创2025-12-20 13:14

12月20日的开发者大会上，国产GPU公司摩尔线程（688795.SH）发布第五代芯片架构“花港”，并基于该架构新推出AI训推一体和图形渲染两款GPU产品。

摩尔线程创始人、董事长兼首席执行官张建中介绍，“花港”架构芯片支持十万卡以上规模智算集群，其算力密度提升50%，能效（性能与功耗的比值）提升10倍。

2020年10月成立至2024年底，摩尔线程先后推出以“苏堤”“春晓”“曲院”“平湖”命名的四代芯片架构。其中，“苏堤”“春晓”这两代架构的芯片主要为图形加速产品，直至2023年的“曲院”架构芯片，摩尔线程将重心转向AI智算产品。

目前，摩尔线程的产品线划分为AI智算、图形渲染加速，以及面向消费电子、智能座舱、具身智能等边缘计算领域的智能SoC（系统级芯片）三类。开发者大会上，摩尔线程针对三大产品线推出新款产品。

基于“花港”架构，摩尔线程发布AI训推一体芯片“华山”。张建中未给出“华山”芯片的详细参数，仅和英伟达两种新近架构的芯片进行了模糊比较：在浮点算力、高速互联带宽两项关键指标上，“华山”芯片介于Hopper架构和Blackwell架构芯片之间；而访存带宽上，“华山”几乎与Blackwell架构芯片齐平；访存容量则大幅超出Hopper架构和Blackwell架构芯片。张建中未披露用来对比的Hopper架构和Blackwell架构芯片具体指代哪一款英伟达GPU。

“华山”芯片与英伟达两种新近架构芯片的性能比较。

记者了解到，“华山”芯片支持FP8（8位浮点数）、FP6和FP4低精度计算数据格式。相比之下，沐曦、燧原等同行2025年发布的新款AI训推一体芯片产品尚未支持FP8以下的低精度格式。

AI智算芯片真正用于模型训练，离不开大规模智算集群。12月20日，摩尔线程发布万卡智算集群方案，基于2025年量产的“平湖”架构S5000芯片，其浮点运算能力为10 EFlops（1 EFlops代表每秒百亿亿次浮点运算）。摩尔线程方面称，该智算集群支撑万亿参数模型训练。

摩尔线程万卡智算集群的性能。

在超节点建设浪潮兴起的当下，摩尔线程也发布超节点产品MTT C256，支持256块GPU互联。超节点意在借助更高规模AI加速卡的高速互联，来弥补单卡性能不足的缺陷。此前，华为、阿里、百度昆仑芯、中科曙光均已抢滩超节点赛道。

在图形渲染显卡产品线上，摩尔线程基于“花港”架构发布“庐山”GPU。据张建中介绍，和2022年发布的上一代S80图形渲染芯片相比，“庐山”在运行3A游戏上的性能提升15倍。

而对于新布局的智能SoC业务，摩尔线程推出“长江”芯片，主要面向具身智能等端侧算力需求场景。

采写：南都N视频记者杨柳发自北京

编辑：黄莉玲

更多报道请看专题：“芯”情

南都N视频，未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626

本文作者