商汤分拆的AI芯片公司，为何全盘押注模型推理市场？

南都N视频APP · AI前哨站

原创2025-11-25 14:39

沐曦、燧原等国产AI芯片公司希望同时抓住模型训练和推理两块市场，但从商汤分拆而来的曦望Sunrise定位明确：全盘押注AI推理芯片市场。

11月24日中国国际半导体博览会的一场论坛上，曦望Sunrise商业产品负责人阎研解释称，国产AI芯片公司若想缩短与英伟达的距离，不能空喊口号，而要拆解可行路径。曦望Sunrise选择在推理芯片上做单点突破，背后的考虑的是，模型训练和推理在计算精度、内存架构、互联方式等方面存在较大区别，一颗芯片难以兼顾训练效能与推理的经济性。

曦望Sunrise脱胎于商汤的芯片业务部门，于2024年底独立并完成第一轮外部融资，今年7月宣布了一笔近10亿元的新融资。公司董事长由商汤科技联合创始人徐冰担任，联席CEO王勇和王湛均有百度从业背景。

截至目前，该公司已推出三代推理芯片。据记者了解，第一代S1芯片于2020年量产，定位于视觉推理芯片，主要服务于商汤的计算机视觉（CV）业务，累计销售超2万颗；第二代S2芯片从2024年9月起量产，采用GPGPU（通用GPU）架构，公司方面声称该芯片实测性能接近英伟达A100的80%；第三代S3芯片在2025年5月正式立项，预计2026年点亮——该步骤意味着芯片设计和制造过程已经成功。S3芯片针对大模型推理定制优化，支持FP8和FP4（8位和4位浮点数）低精度数据格式。

阎研介绍，S3芯片将配置200G以上的显存以及足够的带宽去满足推理需求。公司的目标是使其在大模型推理部署的成本，能接近英伟达的下一代Rubin架构芯片。

相较于训练芯片，推理芯片的设计难度和数据处理规模相对较低，成为众多国产AI芯片公司必争之地。同时，AI应用的加速普及，带动推理算力市场需求的高涨。这也是曦望Sunrise全面押注推理芯片的行业背景。阎研认为“大模型下半场”已然到来：如今，预训练模型趋于成熟，头部开源模型的性能表现亮眼，很少有AI公司仍继续开展模型预训练；而伴随智能体和下游应用持续爆发，行业预见推理算力将在未来数年占据上风。

在阎研看来，AI芯片范式也随之变迁：高性能训练芯片的市场发展空间小，但高性价比推理芯片则是市场蓝海。如何做到好用和高性价比，是推理芯片当前面临的挑战。

为了降低客户迁移成本，曦望Sunrise和大多数国产芯片公司一样，选择兼容英伟达的并行计算框架CUDA——它能让开发者轻松利用GPU的并行计算能力。阎研提到的公司另一策略是，通过资本投融资以及深度业务合作的方式，紧密绑定众多上下游企业。“也就是说，芯片从设计的第一天开始就已经有了客户。”有人使用，才能得到一手反馈，进而提高芯片的易用性。

记者了解到，曦望Sunrise背后的产业资本包括装备制造企业三一集团、第四范式、美的控股、游族网络等，同时公司还与商汤科技、数据中心服务商世纪互联、服务器厂商超云、AI Infra公司硅基流动等建立合作。

在推理芯片性比价的优化策略上，阎研认为，取得算力与显存带宽之间的平衡至为关键。在推理计算任务中，可能出现浪费算力或浪费带宽的情况，都相当于拉低了芯片的性价比。因此在芯片设计阶段，厂商就应该让目标计算任务的运行，尽量落在算力与显存带宽的平衡点上。

采写：南都N视频记者杨柳发自北京

编辑：黄莉玲

南都N视频，未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626

本文作者

华为百度接连“秀肌肉”，大厂自研AI芯片为何不再闷声？
AI前哨站 1万读
东莞国企出手，设立全资新公司！以市场化思维激活招商生态
南都东莞
数量暴涨10倍，广东三成备案AI大模型为何“抢滩”琶洲？
南都广州
汤俊任惠州市商务局局长
惠州大件事 1万读