DeepSeek点燃国产算力热情,寒武纪们谁是最大赢家?

南都N视频APP · 政商数据
原创2026-05-09 19:11
图片

近期,科创板国产芯片厂商陆续交出2026年第一季度成绩单,其中,寒武纪延续2025年的业绩增长势头,营收、净利润实现双增长,摩尔线程则在营收增长的同时,首次实现季度盈利,沐曦股份营收同样增长,不过,其暂时还未扭亏为盈。

总体来看,国产芯片厂商的业绩是在持续向好,这离不开近年国产算力需求的整体提升。就在各家业绩“出炉”同时,DeepSeek发布了其最新一代模型,多家国产芯片厂商实现Day0适配,再次点燃了业内对国产算力的热情。就目前而言,国产算力生态正从“可用”逐步走向“可规模商用”。

 

寒武纪一季度净利翻倍,摩尔线程靠政府补助扭亏

具体来看,寒武纪今年一季度实现营业收入28.85亿元,同比增长159.56%,归母净利润为10.13亿元,同比增长185.04%。

谈及业绩增长,寒武纪在财报中表示,营收增长主要系报告期内受益于人工智能行业算力需求的持续攀升,公司凭借产品竞争力持续拓展市场,积极推动人工智能应用场景落地。而营收的增长则进一步带动了利润总额、归属于上市公司股东的净利润及归属于上市公司股东的扣除非经常性损益的净利润较上年同期增长。

图片

寒武纪一季度财报

摩尔线程一季度实现营收7.38亿元,同比增长155.35%,归母净利润为0.29亿元,首次实现单季度盈利。摩尔线程在财报中表示,收入增长主要系报告期内公司专注于全功能GPU的研发与创新,产品实现规模化落地,进而促进了收入的快速增长。

不过,南都记者注意到,摩尔线程能够扭亏很大程度上依靠政府补助。一季度,其非经常性损益合计8364万元,其中计入当期损益的政府补助为7006万元,占比约84%,扣非净利润为亏损5428万元,虽然同比收窄60.1%,但亏损依然存在。

图片

摩尔线程一季度财报

沐曦股份一季度实现营业收入5.62亿元,同比增长75.37%,归母净利润亏损0.99亿元,较之上年同期亏损2.33亿元有所收窄。沐曦股份表示,其收入增长的核心驱动力来自GPU产品销量的持续放量。受益于人工智能产业的高速发展,依托自身产品性能与软件生态,公司产品与服务获得下游客户认可,业务规模较上年同期实现增长。

图片

沐曦股份一季度财报

另外,在毛利率方面,寒武纪和摩尔线程的毛利率出现些许下滑,据同花顺数据,今年一季度,寒武纪的毛利率为54.33%,较之去年一季度的55.99%,同比下降1.66个百分点,较之去年四季度的54.81%,环比下降0.48个百分点。

摩尔线程一季度毛利率为67.35%,处于同行中较高水平,不过,较去年一季度的77.64%,同比下降10.29个百分点。沐曦股份毛利率有所提升,今年一季度为60.05%,上年同期为55.26%。

华源证券认为,国产算力芯片企业迎来业绩兑现关键期。AI大模型迭代、智算中心规模化建设与边缘智能场景全面渗透,持续推高国内AI算力市场需求。整体来看,行业呈现头部企业盈利稳固、二线厂商减亏甚至扭亏提速、梯队化成长格局清晰的特征。

 

寒武纪现金流转正但存货高企,沐曦、摩尔线程还在“失血”

现金流方面,除了寒武纪已经实现由负转正外,沐曦股份与摩尔线程依旧处于“失血”阶段。财报显示,寒武纪经营活动产生的现金流量净额约为8.34亿元,上年同期这一数值为-13.99亿元;沐曦股份一季度经营活动产生的现金流量净额为-5.5亿元,较上年同期的-5.31亿元略有扩大;摩尔线程一季度经营活动产生的现金流量净额为-14.87亿元,较上年同期的-7.52亿元大幅扩大。

针对现金流情况,摩尔线程在财报业绩交流会上表示,经营性现金流扩大原因有两方面,一是根据市场情况积极进行战略备货,二是持续保持高强度研发投入,2026年一季度研发投入为3.69亿元,同比增长约50%。“上述两方面因素均与公司当前的发展阶段和经营策略相匹配,能够有效支撑业务扩张和持续研发投入,后续公司将在保持战略备货和研发强度的同时,持续优化营运资金管理,改善现金流状况”。

除摩尔线程外,寒武纪和沐曦股份也都维持着高强度的研发投入。财报显示,寒武纪一季度研发费用为3.24亿元,上年同期研发费用为2.73亿元。沐曦股份一季度研发投入为2.53亿元,同比增长16.27%。 

从存货及预付款来看,财报显示,截至一季度末,寒武纪应收账款余额为12.19亿元,较上年末的6.71亿元,增长81.64%,预付款项则由上年末7.45亿元飙升至18.97亿元,增幅超154.6%。另外,其存货账面价值较上年末的49.44亿元虽有所下降,但仍高达44.97亿元。

沐曦股份一季度应收账款余额为9.33亿元,较上年末的7.26亿元,增长28.51%,预付款项则由上年末8.34亿元增长至12.33亿元,另外,存货账面价值较上年末的14.96亿元略微下降至14.22亿元。

此前,沐曦股份方面在年报业绩交流会上回复过有关囤货的问题,其表示,“由于公司始终处于扩产过程中,公司为保障下游客户的需求和按时交付,需提前储备原材料、半成品及库存商品等存货,提前备货比例较高,因此公司存货金额较大、增长较快。公司高度重视存货管理,随着公司营业收入和营业成本的快速增长,公司存货周转率呈快速增长趋势”。

摩尔线程一季度应收账款余额为6.38亿元,较上年末的4.34亿元,增长47%,预付款项则由上年末17.82亿元增长至23.61亿元,另外,存货账面价值较上年末的13.32亿元上升至21.95亿元。针对一季度囤货和预付款上涨,摩尔线程在业绩交流会上回应称,“为应对下游市场需求的持续增长,结合市场情况,并保障供应链稳定,公司主动增加了原材料采购和战略备货力度。”

 

DeepSeek再次点燃国产算力热情,各家走向“可规模商用”

从当前产业进展来看,国产算力生态正从“可用”走向“可规模商用”,各家国产芯片厂商的业绩还有着较大增长空间。

就在一季度报出炉同期,DeepSeek正式发布了最新一代大模型DeepSeek-V4系列,包括DeepSeek-V4-Pro和DeepSeek-V4-Flash两款模型。在此之中,DeepSeek-V4首次将华为昇腾NPU与英伟达GPU同时写入硬件验证清单,并主动向英伟达和AMD提供早期访问权限。

在模型发布当天,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、百度昆仑芯、阿里平头哥、天数智芯等八家国产AI芯片厂商,纷纷宣布实现“发布即适配”(Day0适配),集体完成了全链路适配与性能优化。同时,由智源研究院牵头的众智FlagOS社区,也在Day0完成了DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署,并正在推进V4-Pro在多个芯片上的迁移。 

实现这样的Day0适配有什么难点?智源研究院副院长兼总工程师林咏华告诉南都记者,对于DeepSeek-V4这种量级的模型,整个架构有很多变化,所以在适配上比起其他模型难度要高很多,因此提前需要做大量的技术准备工作。

具体来讲,“第一,为了支持多芯片适配,我们需要将DeepSeek的原版算子用FlagOS的技术栈全部替换,从而保证之前已经适配过我们技术栈的芯片都能跑这些算子”。第二,要解决模型对硬件的精度依赖问题。DeepSeek这次采用的是FP4和FP8混合精度,而国内上市的芯片多数都是以BF16为主,必须转换成这些芯片所能支持的精度。

第三,要解决显存并行限制的问题。国内主流显卡基本是32G或64G显存,需要张量并行大于8份才能放得下,但DeepSeek-V4最多切8份,所以就需要重新做并行策略的切割。“这些都是在工程上、技术上怎么让它跑起来,后面更重要的要对齐精度。我们端到端测试了所有芯片,把精度误差控制在5%以内,然后才发布开源出来,让大家能下载代码,开箱即用。”林咏华说道。

值得一提的是,在介绍DeepSeek-V4两个版本的API调用价格时候,DeepSeek方面还在图片下方注释小字写道,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。业内分析认为,这显示出DeepSeek-V4或与国产算力芯片做针对性的深度联动适配,为中国顶尖大模型向国产算力迁移提供强有力的背书。

图片

华西证券认为,DeepSeek-V4并非只带动单一硬件厂商,而是在推动国产AI芯片、开源推理框架和模型服务之间形成更广泛的协同,国产算力建设正在从单点硬件替代,走向“模型发布—芯片适配—推理框架优化—云端服务—行业应用”的完整协同链条。

业内分析还指出,DeepSeek-V4让国产芯片优先适配,从根本上绕开了“先基于英伟达开发、再向国产芯片迁移”的被动局面,国内顶级AI模型正逐步摆脱对英伟达的单一依赖,DeepSeek正在为国产AI芯片打开结构性替代的想象空间。

事实上,DeepSeek牵手国产芯片的全国产生态布局早已开启。早在去年8月,DeepSeek V3.1就支持了UE8M0 FP8 Scale参数精度,并特别表示这一数据格式是针对即将发布的下一代国产芯片设计,为脱离英伟达生态埋下伏笔。

图片

Day0适配常态化,英伟达市场空间受国产替代挤压

南都记者也注意到,近期,一旦有国产新模型上新,国内芯片厂商总能迅速实现适配,国产芯片Day0适配国产模型已成为常态。

摩尔线程此前在业绩交流会上提到,在模型适配方面,其与各类合作伙伴持续开展技术合作,对DeepSeek、智谱、MiniMax、月之暗面、阿里巴巴等发布的SOTA大模型实现了Day0适配常态化支持。沐曦股份、壁仞科技和天数智芯也均曾公告称自身Day0适配多家国产大模型。

图片

谈及Day0适配的意义,林咏华告诉南都记者,今年很大的变化是,智能体拉动国内大模型的部署使用需求大幅上升,普遍需要更多的算力进入推理市场。如果模型厂商手上没有更多的算力资源,就很难支撑它去做更多的推理任务,吸引更多的用户。即便模型性能卓越,若算力支撑不足、难以满足用户需求,用户仍将转向替代方案。正因如此,今年模型厂商普遍呈现出更积极的姿态,主动推进甚至提前布局与芯片厂商的适配工作。

林咏华还表示,“行业内跨芯片适配时间已从原来的数周缩短至数天,当开发者发现用各种AI芯片跑模型都很简单时,生态才会真正发展起来”。

TrendForce集邦咨询分析师龚明德也对南都记者提到,Day0适配的意义主要包含兼容更多本土AI芯片硬件、LLM软件平台的开放性,以及更加重视上市时间,强调了AI未来能够更快速地在更多应用领域实现落地商转时机。

国模国芯生态正在逐步建立,而随着国产芯片替代从“备选项”升级为“必选项”,英伟达的重要性也已逐步减弱,这点在市占率下滑上亦有所体现。IDC数据显示,2025年中国市场AI加速卡总出货量约为400万张,其中英伟达出货约220万张,占据约55%的市场份额,在中国市场的领先优势正在收窄。AMD则出货约16万张,市场份额约为4%。另外,中国厂商合计出货约165万张,占总市场比例已攀升至约41%。

值得一提的是,在DeepSeek-V4发布之前,英伟达CEO黄仁勋还曾在访谈中直言,若DeepSeek的最新一代大模型,率先选择在华为平台上发布并全面适配,那么这对美国在全球人工智能领域的战略地位而言,无疑将是灾难性的打击。也就是说,当中国顶尖大模型与国产算力基座完成深度绑定,美国长期推行的芯片封锁将会失去关键“抓手”。

摩根士丹利在研报中提到,当前,国产芯片单颗与英伟达存在些许差距,但通过多芯片封装、先进封装、软硬件协同等系统工程思路,已经有效弥补短板。摩根士丹利维持对中国AI芯片市场的长期看好判断,其预计到2030年,中国AI芯片自给率将从当前33%飙升至86%,市场规模突破670亿美元,国产替代进入全面冲刺期。

谈及今年的国产芯片发展,龚明德对南都记者表示,“因应全球地缘风险影响,观察国内业者有两大成长驱动来源,其一为本土供货商,以今年需求量面向来看,有机会实现双倍以上成长;其二为大型互联网厂商投入AI芯片自研发展,也将成为未来重要的支撑动能。整体而言,预估今年本土高阶AI芯片(包含本土供货商及CSP自研部分)合计需求量同比增长率将达六成以上”。 


采写:南都N视频记者 朱可轩 发自上海

 

 

编辑:甄芹

更多报道请看专题:逐浪“AI资本局”

南都N视频,未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626