周鸿祎谈大模型:做小做垂,企业成本可从千万美元降到百万元

南方都市报APP • 湾财社
原创2023-08-26 19:20

8月26日,2023年亚布力论坛夏季高峰会在深圳召开。360集团创始人、董事长周鸿祎发表演讲,他认为在产业数字化的战略背景下,人工智能大模型的未来机会在企业级增量市场。而把大模型拉下神坛,即将大模型做小的关键在于发展垂直化大模型。

图片

360集团创始人、董事长 周鸿祎。

周鸿祎表示,很多企业在讨论大模型发展时,都隐含着走OpenAI之路的前提,但这条路短期内面临着资源和资金等诸多困难。同时,OpenAI缺乏对行业的深刻理解,无法理解企业的通用数据集,且存在成本问题。

在周鸿祎看来,还有一条路就是把大模型拉下神坛,换句话说,就是能不能把大模型做小。其中的关键就是大模型发展的垂直化,可归纳为行业深度化、企业个性化、能力专业化、规模小型化、部署分布化和所有权私有化。

周鸿祎表示,当前全世界出现这一趋势,就是怎么把大模型做小,让它只解决垂直领域的问题。大模型的参数不一定要万亿、千亿,事实上,今天很多开源软件给的是百亿的模型。百亿跟ChatGPT不能比,但在企业内部够用时,就能把部署成本从原来的千万美元降到千万元人民币,甚至百万元人民币的级别。

周鸿祎认为,大模型的发展路径更像电脑,“以后每个企业根据自己的应用场景,可能都有若干套大模型”,甚至以后每个家庭、企业、每辆车上都有一个大模型,但大模型不会成为操作系统,这意味着全世界最多只会有两三套大模型,便垄断了。

“目前中国已经是‘百模大战’了,未来可能‘万模群舞’,如果企业都训练出来自己的小规模大模型,当大模型无处不在时,就会产生很多产业创新的机会。”周鸿祎说道。

这意味着,只需少数公司用大规模投入把基础模型训练出来,再提供给其他企业。后者用小规模的算力便能进行微调,然后用小规模的算力进行部署、推理和计算。“在现阶段这样一算,可能目前的A100、A800再加上国产华为的910B,可以在一定阶段满足我们国家的需求”。

针对GPT4是由8个专家模型组合而成的传言,周鸿祎认为,这进一步印证了大模型垂直化的发展方向,即并非用一个万能大脑解决所有问题,而是用8个甚至更多的垂直大脑来解决专业问题。

周鸿祎表示,当前,大模型仍存在安全及幻觉问题,这也是360布局大模型的初衷,“只有躬身入局,才能解决大模型的安全问题”。他建议,企业可先在各种垂直场景中,率先应用好大模型最通用的、最成熟的知识问答及写作生成能力,从办公场景刚需切入,遵循“小切口大纵深”原则。

周鸿祎认为,未来所有业务都会被大模型重塑,“大模型不会淘汰任何人,只有不会用大模型的人才会被会使用大模型的人淘汰”。

采写:南都湾财社记者 方诗琪 陈镜安

【欢迎爆料】南都湾财社关注商业、金融及资本市场,相关新闻线索欢迎发送至邮箱:Ndwcsbl@163.com,将有专业记者与您联系。

编辑:方诗琪

南都新闻,未经授权不得转载。授权联系方式
banquan@nandu.cc. 020-87006626
1