商汤分拆的AI芯片公司,为何全盘押注模型推理市场?

南都N视频APP · AI前哨站
原创2025-11-25 14:39

沐曦、燧原等国产AI芯片公司希望同时抓住模型训练和推理两块市场,但从商汤分拆而来的曦望Sunrise定位明确:全盘押注AI推理芯片市场。

11月24日中国国际半导体博览会的一场论坛上,曦望Sunrise商业产品负责人阎研解释称,国产AI芯片公司若想缩短与英伟达的距离,不能空喊口号,而要拆解可行路径。曦望Sunrise选择在推理芯片上做单点突破,背后的考虑的是,模型训练和推理在计算精度、内存架构、互联方式等方面存在较大区别,一颗芯片难以兼顾训练效能与推理的经济性。

曦望Sunrise脱胎于商汤的芯片业务部门,于2024年底独立并完成第一轮外部融资,今年7月宣布了一笔近10亿元的新融资。公司董事长由商汤科技联合创始人徐冰担任,联席CEO王勇和王湛均有百度从业背景。

截至目前,该公司已推出三代推理芯片。据记者了解,第一代S1芯片于2020年量产,定位于视觉推理芯片,主要服务于商汤的计算机视觉(CV)业务,累计销售超2万颗;第二代S2芯片从2024年9月起量产,采用GPGPU(通用GPU)架构,公司方面声称该芯片实测性能接近英伟达A100的80%;第三代S3芯片在2025年5月正式立项,预计2026年点亮——该步骤意味着芯片设计和制造过程已经成功。S3芯片针对大模型推理定制优化,支持FP8和FP4(8位和4位浮点数)低精度数据格式。

阎研介绍,S3芯片将配置200G以上的显存以及足够的带宽去满足推理需求。公司的目标是使其在大模型推理部署的成本,能接近英伟达的下一代Rubin架构芯片。

相较于训练芯片,推理芯片的设计难度和数据处理规模相对较低,成为众多国产AI芯片公司必争之地。同时,AI应用的加速普及,带动推理算力市场需求的高涨。这也是曦望Sunrise全面押注推理芯片的行业背景。阎研认为“大模型下半场”已然到来:如今,预训练模型趋于成熟,头部开源模型的性能表现亮眼,很少有AI公司仍继续开展模型预训练;而伴随智能体和下游应用持续爆发,行业预见推理算力将在未来数年占据上风。

在阎研看来,AI芯片范式也随之变迁:高性能训练芯片的市场发展空间小,但高性价比推理芯片则是市场蓝海。如何做到好用和高性价比,是推理芯片当前面临的挑战。

为了降低客户迁移成本,曦望Sunrise和大多数国产芯片公司一样,选择兼容英伟达的并行计算框架CUDA——它能让开发者轻松利用GPU的并行计算能力。阎研提到的公司另一策略是,通过资本投融资以及深度业务合作的方式,紧密绑定众多上下游企业。“也就是说,芯片从设计的第一天开始就已经有了客户。”有人使用,才能得到一手反馈,进而提高芯片的易用性。

记者了解到,曦望Sunrise背后的产业资本包括装备制造企业三一集团、第四范式、美的控股、游族网络等,同时公司还与商汤科技、数据中心服务商世纪互联、服务器厂商超云、AI Infra公司硅基流动等建立合作。

在推理芯片性比价的优化策略上,阎研认为,取得算力与显存带宽之间的平衡至为关键。在推理计算任务中,可能出现浪费算力或浪费带宽的情况,都相当于拉低了芯片的性价比。因此在芯片设计阶段,厂商就应该让目标计算任务的运行,尽量落在算力与显存带宽的平衡点上。

 

采写:南都N视频记者 杨柳 发自北京

编辑:黄莉玲

南都N视频,未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626