华为于4月29日在2026数字中国建设峰会上披露的数据显示,昇腾384超节点已部署超500套,实现规模化商用。这款超节点搭载了384颗昇腾910C AI芯片。
一位华为人士介绍,目前公司的产能和供货,主要集中在昇腾910C芯片上。根据华为在3月底发布的2025年年报,昇腾384超节点自2025年4月发布以来,已规模化服务于互联网、金融、运营商、电力、制造等行业。
2026数字中国建设峰会上展出的华为昇腾384超节点
超节点是通过高速互连技术,将数十、数百乃至数千张芯片堆叠耦合,构成一个超级计算节点,弥补单颗国产芯片性能的短板,已被视为AI基础设施的基本单元。
按照计划,下一代昇腾950超节点将于2026年第四季度上市,搭载8192张昇腾950DT芯片。官方参数显示,昇腾950超节点在FP8(8位浮点数)精度下的算力为8 EFLOPS(每秒执行8百亿亿次浮点运算),在FP4精度下的算力达16 EFLOPS(每秒执行16百亿亿次浮点运算),互联带宽为16.3 PB/s(每秒传输16.3拍字节数据)。
昇腾950超节点将为DeepSeek-V4模型的运行提供关键算力支撑。DeepSeek在4月24日发布V4模型时提到,预计下半年昇腾950超节点批量上市后,V4-Pro模型的API调用价格会大幅下降。华为表示,昇腾950超节点能实现高吞吐、低时延的DeepSeek-V4模型推理部署。
DeepSeek-V4发布后,包括华为昇腾、寒武纪在内的国产AI芯片公司也宣布实现Day0适配DeepSeek-V4模型。所谓“Day0适配”,指的是模型发布当日,芯片即实现完全兼容和支持正常推理运行。
中国信息通信研究院副院长魏亮表示,DeepSeek-V4模型从研发阶段即与国产算力进行充分的协同联动,这反映出前沿模型的创新突破与基础软硬件间的强耦合依赖关系愈发明显,协同更加紧密。模型与硬件自诞生之初便“双向奔赴”,使国产软硬件和前沿模型的关系从此前的被动适配,逐渐走向主动协同、同步进化以及Day0原生适配。
魏亮认为,要推动国产AI芯片从“基本可用”迈向“好用易用”,仍需进一步从两个关键维度持续解决国产软硬件适配问题:其一,实现“芯片-框架-模型”之间的纵向适配,涉及算子的覆盖度、算子的编译运行效率、开发工具丰富度等问题,这是模型能否在算力系统上运行的基础。理想状态下,国产软硬件应具备对新模型、新架构的通用支持能力;其二,实现与模型深度结合的训推系统的协同扩展,涉及集群规模的稳定性、故障恢复、能耗优化、互联通信能力等一系列能力,这决定了模型的规模和性能的极限。
除了面向智能计算的昇腾超节点,华为也基于鲲鹏CPU推出业内首款通用计算超节点TaiShan 950。该产品已于2026年第一季度上市,最大支持16节点。华为计算Marketing与解决方案销售部总裁常成透露,华为在今年下半年还会推出更大节点的通算超节点设备。
采写:南都N视频记者 杨柳 李玲 发自福建福州
编辑:黄莉玲
更多报道请看专题:聚焦第九届数字中国建设峰会