连续三季盈利、股价逼近茅台，寒武纪行情因何高亢？

南都N视频APP · AI前哨站

原创2025-08-27 12:00

8月26日晚，近期股价高歌猛进的“国产AI芯片第一股”寒武纪（688256.SH）发布半年报。2025年上半年，寒武纪营收28.81亿元，同比增加4347.82%，归属于母公司股东的净利润10.38亿元，扣非后归母净利润9.13亿元，均同比扭亏为盈。

股市8月27日开盘后，寒武纪股价一度涨超7%。截至午盘收盘，寒武纪大涨6.01%，报1408.9元/股，与“A股之王”茅台（600519.SH)的股价差距仅剩50多元，市值接近6000亿元。半年报业绩发布后，用来反映市场对公司成长性预期高低的指标——市盈率（TTM）（当前股价/最近12个月的每股净利润），从此前惊人的4000多倍回调到相对合理的500多倍，不过依然远超英伟达、AMD等海外芯片巨头。

寒武纪的火热行情肇始于2024年9月并延续至今。

扭亏为盈后，延续盈利攀升势头

结合2025年第一季度财报进行推算，寒武纪在2025年第二季度的营收为17.69亿元，环比增加59.19%；归母净利润6.83亿元，环比增长92.03%，扣非后归母净利润6.37亿元，环比增长130.68%。

这是自2024年第四季度单季度净利润扭亏为盈后，寒武纪连续三个季度实现盈利。扣非后归母净利润则是连续两个季度保持正值。

寒武纪表示，收入增长背后，公司在上半年持续拓展市场，积极助力人工智能应用落地。今年上半年，人工智能算力需求持续增长，寒武纪凭借人工智能芯片产品的核心优势，持续深化与大模型、互联网等前沿领域头部企业的技术合作。依托于公司在人工智能芯片产品、基础系统软件平台取得的进步，公司产品持续在运营商、金融、互联网等多个重点行业规模化部署并通过了客户严苛环境的验证。

寒武纪目前的主要产品线包括云端产品线、边缘产品线、IP授权及软件，其中，云端产品线营收结构中占比最高，包括云端智能芯片及板卡、智能整机，是云服务器、数据中心等进行人工智能处理的核心器件。2025年上半年，云端产品线营收28.70亿元，占比高达99.62%。

寒武纪并未透露最新代AI芯片的研发进展。公开信息显示，寒武纪的AI芯片已迭代至思元590，其在大模型训练任务中的表现接近英伟达A100的80%。

值得一提的是，截至第二季度期末（6月30日），寒武纪经营活动产生的现金流也从第一季度的净流出14亿元，转正为9.11亿元。公司方面称，这主要是销售回款增加带来的。

近期，寒武纪近40亿元的定向增发方案获上交所审核通过，正在等待中国证监会做出统一注册的决定。该资金将主要用于面向大模型的芯片平台项目和软件平台项目。按照寒武纪董事长、总经理陈天石在5月12日业绩会上的介绍，芯片平台项目包括覆盖不同类型大模型任务场景的系列化芯片产品、先进封装技术平台等；软件平台项目则用于提升公司智能芯片的易用性和适应性等。

陈天石表示，在大模型技术革新的背景下，公司将聚焦主业发展，以技术创新提升芯片产品竞争力，优化芯片能效表现，强化算法与硬件的协同研发能力，推动芯片产品向大模型及行业垂直领域延伸，持续拓展业务合作，通过解决方案赋能传统行业智能化升级，同时探索新兴场景的算力需求，挖掘增量市场潜力。

从过往年报来看，寒武纪存在客户集中度较高的风险。2022-2024年，公司前五大客户的销售金额合计占营业收入比例分别为84.94%、92.36%和94.63%，客户集中度较高。其中，2024年，第一大客户销售额占比为79.15%。寒武纪提醒，若公司主要客户经营发生变动或者需求放缓，可能给公司业绩带来不利影响。

外部环境对寒武纪未来营收的影响存在两面性。一方面，国产芯片替代在持续推进，部分省市均在过往提出了智算中心算力国产化率指标，如上海市早在2024年3月便要求，2025年新建智算中心国产算力芯片使用占比超过50%；另一方面，寒武纪仍面临来自英伟达等巨头和国内AI芯片厂商的竞争。英伟达的中国“特供”芯片H20近期陷入安装定位“后门”的网络安全质疑，引发国家网信办约谈。另据媒体报道，英伟达正在开发基于最新Blackwell架构的新款中国“特供”版AI芯片，功能比H20更强大。

一起传闻和一句留言催化的行情

8月中旬以来，寒武纪的股价如火箭般蹿升，成为茅台之后的A股市场第二只千元股。一起业务传闻和DeepSeek留言区的一句话，催化了这轮火热行情。

这起市场传闻称，寒武纪向台湾载板大厂景硕电子预定了大量订单，暗示其订单量激增，并且2026年规划产能50万颗。在股价涨停的8月12日，寒武纪就传闻回应说，网上传播的关于公司在某厂商预定大量载板订单、收入预测、新产品情况、送样及潜在客户、供应链等相关信息，均为误导市场的不实信息。

此前3月10日，市场上也曾流出另一条关于寒武纪订单的“小作文”：字节跳动向寒武纪下单4万颗芯片，单价2.5万元，总价值10亿元。字节跳动彼时予以辟谣。

另一起催化因素发生在8月21日，亦即寒武纪收盘价首度突破1000元的次日。DeepSeek当日正式发布模型新版本DeepSeek-V3.1，这款模型使用了UE8M0 FP8 Scale 的参数精度。DeepSeek在公众号留言区补充的一句话引起更大的市场关注：UE8M0 FP8是针对即将发布的下一代国产芯片设计。

DeepSeek在公众号底部的留言引起市场关注。

尽管DeepSeek并未点名哪一款国产芯片，但市场对寒武纪、海光信息、云天励飞等芯片股的情绪被点燃，这三家公司在8月22日均涨停，国产算力供应链上的其他公司也被“带飞”。

股市热潮背后，何为UE8M0 FP8亦引发广泛讨论。

FP8（8 位浮点数）是芯片支持的一种低精度格式。和FP32、FP16格式相比，FP8牺牲了精度，但胜在可以节省存储和带宽，加快计算速度，这对拥有上千亿参数的大模型训练来说至为关键。FP8精度格式的“出圈”，得益于DeepSeek在训练V3模型时，引入了FP8的混合精度训练框架，并首次在超大规模模型上验证了其有效性。

根据开放计算项目2023年9月提出的Microscaling（MX）微缩放格式，MX FP8精度分为E4M3、E5M2两种编码方式。按命名规范，在提及任何符合MX规范的数据精度类型时，会在名称前添加“MX”。

浮点数由符号位、指数、尾数三个部分组成，而E4M3、E5M2各自代表着“4位指数+3位尾数+1位符号位”和“5位指数+2位尾数+1位符号位”，前者精度较高但数值表示范围小，后者精度更低但数值范围大。但英伟达公司的研究论文显示，E4M3是 MX FP8两种数据类型中最能保持预训练精度的变体。

无论是FP8（E4M3）还是FP8（E5M2），相较而言精度低、数值范围有限。为避免过大或过小数值的溢出以及精度损失，模型训练时就需要通过数值乘以“缩放因子”（Scale），来把数值压缩在FP8格式的可表示范围内。UE8M0便是“缩放因子”，其只有指数，没有符号和尾数，适合表示倍数关系，用来进行数值压缩。

AI芯片初创公司行云集成电路联合创始人、CTO余洪敏告诉南都N视频记者，DeepSeek从算法层面另辟蹊径，选择MX FP8进行训练，使用无符号、8位指数的UE8M0作为“缩放因子”，进行“量化内核”设计，增大了FP8精度覆盖的数值动态范围。

余洪敏介绍，UE8M0本质上是对关键参数保留更高有效位，对非敏感参数进行激进压缩。当“缩放因子”动态补偿量化的误差，维持训练过程中模型收敛的稳定性，等于是忽略了“缩放因子”的影响，在运算过程中也就没有了“缩放因子”的频繁加载。如此一来，可通过固定的GPU指令进行解析，减小硬件指令不兼容的影响。这一定程度上会减轻国产芯片硬件支撑FP8精度时的难度，能让国产芯片的适配更顺利，提升模型和芯片的兼容性。

余洪敏预测，DeepSeek带头使用UE8M0 FP8后，后续几乎所有的AI芯片厂商都会去原生支持这种精度。

中信证券研报认为，一方面，国产模型为适应国产算力，在调整资源端的消耗；另一方面国产算力也不断支持国产模型的发展，“国产算力和国产模型在相向而行”。

据记者了解，目前包括沐曦、燧原科技、摩尔线程等芯片厂商均已宣称旗下芯片支持FP8精度。余洪敏介绍，国产芯片原生支持FP8的较少，有的实际上仍然是用FP16格式，再通过软件模拟或转换成FP8，这会影响到芯片的计算效率。

采写：南都N视频记者杨柳

编辑：李玲

更多报道请看专题：“芯”情

南都N视频，未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626

本文作者

芒果超媒三个月内三名高管辞职，股价连续两天累计下挫11%
政商数据
湛江台风后神速恢复通电供水！生动践行“发扬连续作战精神”
南都即时
岚图联交所递表：去年第四季度已开始盈利，毛利率行业领先
南都汽车 16万读
外籍男子元朗站拖箱惹疑，香港警方检获价值近千万港元可卡因
港澳台live