李彦宏：没有应用，基础模型将一文不值

南方都市报APP • AI前哨站

原创2024-07-04 16:52

7月4日，百度创始人李彦宏再度回应大模型开源闭源之争。他在2024世界人工智能大会上表示，激烈竞争环境中，商业化闭源模型最能打。但比开源闭源之争更重要的是，“卷”应用才是当前更具价值的话题，“没有应用，基础模型将一文不值”。

百度创始人李彦宏在2024世界人工智能大会演讲。

今年3月以来的开源闭源争议中，李彦宏称“有些外行甚至混淆了模型开源和代码开源这两个概念”。模型开源的情况下，使用者得到的是基础参数，还需进一步做监督微调（SFT）、安全对齐。但由于不清楚参数来源，就无法做到“众人拾柴火焰高”。即使拿到对应的源代码，也无法获知大模型开发者使用了哪些数据去训练模型。所以，使用开源模型并不意味着可以站在巨人的肩膀上去开发迭代。

李彦宏认为，同样参数规模之下，闭源模型的能力优于开源模型。如果开源模型想要追平闭源模型的能力，需要有更大的参数，那么推理成本会更高，反应速度会更慢。一个激烈竞争的市场环境中，比拼的是业务效率和更低的成本，对此，“商业化的闭源模型是最能打的”。

此前4月中旬，李彦宏的一份内部讲话内容流出，给开源路线泼冷水。他说，模型开源的意义不大，闭源才有真正的商业模式，能够赚到钱并聚集算力和人才。李彦宏随后在4月18日的百度AI开发者大会进一步断言：“开源模型会越来越落后。”其理由在于，通过文心4.0降维裁剪出来的更小尺寸模型，比直接拿开源模型调出来的模型，在同等尺寸下效果明显更好；同等效果下，成本明显更低。

但李彦宏也承认开源模型在某些场景下存在价值，比如学术研究、教学领域，可以借助开源模型研究大模型的运作机制。

与开源闭源之争相比，李彦宏认为关注大模型的应用层更为重要，“没有应用，光有一个基础模型，不管是开源还是闭源，一文不值。”他呼吁业界不要继续“卷”底层模型——此前的“百模大战”造成了巨大的算力资源浪费，而应当去“卷”应用。

李彦宏说，随着基础模型的日益强大，开发应用变得越来越简单，他最看好AI Agent（智能体）的应用方向。制作一个有价值的智能体，通常并不需要代码，只需用自然语言把智能体的工作流程表述清楚，再配上专有的知识库，比互联网时代制作一个网页还要简单。

他预测，未来在医疗、金融、教育、制造、交通、农业等等各个领域，都会依据特定场景下的经验、规则、数据等，打造出各种各样的智能体，“将来会有数以百亿的智能体出现，形成庞大的智能体生态”。搜索则是智能体分发最大的入口。

百度创始人李彦宏在2024世界人工智能大会演讲。

李彦宏还回应了AI对就业市场影响的外界担忧。他说，AI大模型更多扮演Copilot（副驾驶）的角色，只是辅助人，让人的工作效率更高、质量更好，而不是替代人。另一方面，大模型也催生了一些全新的工作机会。比如，过去几年，百度在全国二十多个城市落地了数据标注中心，提供了大量的数据标注师就业岗位。此外，随着智能体的大量涌现，提示词工程师的工作需求也会飙升——无需编程能力，但要有很强的逻辑性，用提示词对模型进行调教。

“从石器时代的石斧，到移动时代的手机，再到AI时代的大模型，人类不断创造各种工具来改善生活，来提高生产力。但是它们永远只是工具，只有在被人类所使用的时候才有价值。”李彦宏说，AI不是人类的竞争对手，构建和应用AI技术是为了满足人的需求，增强人的能力。

采写：南都见习记者杨柳记者王子黎发自上海

编辑：李玲

更多报道请看专题：直击2024世界人工智能大会