云天励飞超4亿元中标！首个国产AI推理千卡集群落地湛江

南都N视频APP · 湾财社

原创2026-03-12 15:06

以上内容由AI大模型生成，仅供参考

3月12日，云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目，中标金额4.2亿元。项目将基于云天励飞自研的国产AI推理加速卡，建设国产AI推理千卡集群。据介绍，该集群将搭载DeepSeek等国产大模型，为政务、产业及各类应用场景提供更加便捷、低成本的AI能力，探索打造“国模国芯”的AI生态样板。

智算集群是人工智能时代的基础设施。如果说电力支撑了工业时代，互联网支撑了信息时代，那么智算正在成为支撑AI时代的重要底座。

在AI算力体系中，算力大体可以分为训练算力与推理算力。训练算力决定模型如何完成“从0到1”的能力构建，而推理算力则直接支撑AI应用落地。无论是春节期间大热的SeeDance、近期广泛讨论的“小龙虾”，还是各行业不断上线的AI Agent应用，背后都离不开推理算力的支撑。根据Gartner预测，到2026年，约55%的AI专用云基础设施支出将用于推理工作负载。

过去，国内许多智算中心普遍采用“训推一体”的建设模式。而此次在湛江建设的集群，则定位为专注推理任务的AI推理集群，主要面向各类行业应用场景，为传统产业的AI化提供直接支撑。

据悉，本次AI推理集群将分三期建设，并全部采用云天励飞自研的国产AI推理加速卡。该集群采用云天励飞自主研发的AI推理芯片，并在系统架构上确立了“优先优化Prefill、兼顾Decode”的技术路线。通过在芯片设计中对计算资源与存储带宽进行针对性配置，使系统在长上下文推理场景下依然能够保持较高的吞吐效率。

值得注意的是，过去几年，AI算力建设往往以“堆算力”为主要路径——通过不断扩大GPU规模来获得更高性能。但随着大模型逐渐进入应用阶段，产业关注点正从“算力峰值”转向“单位成本效率”。

换句话说，未来AI产业竞争的重要维度，不仅在于模型能力本身，还在于谁能够以更低成本提供稳定的大规模推理能力。湛江项目的落地，也为这一目标提供了重要的实践场景。千卡级推理集群不仅能够满足当前AI应用需求，同时也为更大规模算力系统提供技术部署平台。

随着大模型逐步进入产业应用阶段，AI基础设施的发展逻辑也正在发生变化——从单纯追求算力规模，转向更加注重效率与成本。

在业内看来，推理算力将成为决定AI应用规模化落地的关键基础设施。谁能够以更高效率、更低成本提供稳定的大规模推理能力，谁就有机会在新一轮人工智能产业竞争中占据先机。

采写：南都·湾财社记者程洋

南都N视频，未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626

本文作者

程洋

南方都市报记者