科大讯飞(002230.SZ)9月29日晚披露,修改40亿元定向增发募集资金的用途,将其中24亿元投入算力平台建设;其余16亿元则平均分配,分别用于星火教育大模型及典型产品研发,以及补充流动资金。
而此前8月22日的定增方案中,32亿元用来补充流动资金,剩余8亿元开发星火教育大模型及典型产品。
科大讯飞介绍,公司拟通过算力租赁模式实施算力平台项目,进一步扩充公司算力规模,以实现大模型研发攻关和算法的迭代升级。
据其透露,当前,正在预研更大参数、更高性能的讯飞星火大模型新版本,需要更大规模的国产算力集群作为支撑保障。
和国内其他大模型厂商相比,科大讯飞长期宣称算力的自主可控。2023年10月,科大讯飞基于华为昇腾910B芯片,上线国内首个全国产智算平台“飞星一号”。科大讯飞称,该万卡算力集群的大模型训练任务性能,达到同规模英伟达A800集群的90%以上。A800芯片是英伟达为应对出口管制,于2022年底面向中国大陆市场推出的减配版本。
在“飞星一号”的基础上,科大讯飞于2024年1月训练出中国首个基于国产算力的千亿参数大模型。2025年1月,科大讯飞推出首个基于全国产算力训练的深度推理模型——讯飞星火X1。
科大讯飞表示,当前,业界更大参数规模的大模型、MoE(混合专家模型)和长思维链深度推理大模型等算法创新,仍然高度依赖英伟达生态,基于全国产算力开展算法适配优化和算法创新还面临诸多挑战。由于国产算力硬件性能不足和软件算子缺失,导致在强化学习训练、长序列等当前热点研究领域,基于国产算力进行训练和推理的效率与使用英伟达算力存在较大差距。
为了实现适配优化,科大讯飞通过与华为、中科海光、寒武纪等国产算力厂商协作,来使用国产算力集群,发现并解决了多个国产算力底层软硬件隐藏问题。科大讯飞9月29日在投资者互动平台上还称,面对模型的新算法和新架构,讯飞会持续联合国内芯片厂商团队开展攻关优化。
但基于国产算力开展适配优化,需付出额外的算力成本与时间代价。今年3月,科大讯飞董事长刘庆峰接受南都等媒体采访时透露,2024年10月,科大讯飞便完成深度推理模型的技术路线验证。然而,为了在国产算力平台上进行训练,公司不得不花费额外两个月时间来进行适配工作。所以,使用全国产算力训练的代价,不仅体现在国产AI芯片的使用成本更高,也体现在训练所消耗的时间更长,拖慢了模型发布的进度。
但刘庆峰表示,大多数大模型创业公司选择使用英伟达芯片开展训练,这是出于快速推出产品的实际考量。不过,如果大家只想摘取现成的果实,等待他人建好生态系统后再加入,那么自主可控的平台生态将没法成长。“从国家和产业龙头型公司的角度看,一定要有一批企业在国产算力平台上进行大模型训练,做大模型工具链的各种设计”。
采写:南都N视频记者 杨柳
编辑:李玲
更多报道请看专题:“芯”情