5月22日,2023数字经济(东湖)论坛在武汉举办。会上,复旦大学教授、上海市数据科学重点实验室主任肖仰华以大模型为主题进行演讲。
肖仰华表示,大模型可以为当前的数字经济发展中的重要环节——数据的价值变现提供助力,使其不用乙方、不用过多成本、过多精力就能达成目的。他同时也表示,当前国内大模型还存在着技术同质化严重、持续投入模型创新等问题。
“首先,我要传达一个基本观点,以大模型,以ChatGPT为代表的这样一个深层的人工智能技术,或者更广一点,通用人工智能技术将成为推动我国数字经济发展,实现我国高质量发展一个非常重要的引擎和先进的生产力。”肖仰华开门见山地说。
当然,要明白其原因,还要从数字经济本身说起。
当前的数字经济发展中,有一个非常重要的环节——数据的价值变现。简单来说,收集、存储大量数据的最终目的还是要创造价值。但现在很多数据都只是躺在服务器上“睡觉”,没有创造太多价值,甚至对于很多企业来说,还需要消耗巨大的人力成本去运维,算得上是一种负资产。
但要实现数据的价值变现,却并非易事:无论是数据开发时期的安全和隐私问题,还是数据整合阶段的数据隔离,无法实现有效关联问题,都长期无法得到解决。肖仰华认为,只有去深挖数据背后的隐性规律,才有可能真正做到数据的价值变现。
如何去挖掘?这个答案随着以ChatGPT为代表的深层次人工智能大模型的到来浮出水面。
肖仰华表示,大模型为数据的价值变现提供了一种“端到端”的实现方式。以前要想把数据价值变现要当甲方,要出钱,要告诉乙方自己的商业逻辑是什么,领域知识是什么,属于人工干预很重的方式。但现在只要向大模型提出任务,让大模型理解自己的意图,拆解每个具体任务,使其调用传统的内部信息系统实现整个逻辑,就能达到目的。
具体在toC市场,大模型有望成为一个互联网的新入口,就像是以前的搜索引擎、社交网络一样,比如现在的类ChatGPT大模型可以以问答交互的形式融合订票、出行、订餐等等平台。
而在toB市场,大模型可能会成为一种全新的“引擎”,就像是以前的马力、蒸气、油、电一样。大模型可以为企业内部原本独立进入的信息系统、数据库、企业资源管理系统、客户关系管理系统、OA系统等系统设立一个统一入口,把任务分解到各个子系统,所起到了一个核心的控制器作用。
大模型的重要程度不言而喻。但当前,国内的大模型产业仍在起步阶段。肖仰华表示,国内大模型各自为政,大模型能力缺乏也统一的规划和协调,主要存在着四个问题:
第一,同质化严重。国产大模型很多都是用ChatGPT喂养自己,技术同质化比较严重。
第二,数据生态不完善、中文数据生态尤其重要。
第三,国产算力问题、尤其发展国产算力联盟和生态。
第四,持续投入模型创新问题。而这也导致一旦开源社区模型被禁用,国内大模型的发展就会非常被动。
可以说,大模型要创造价值有两个基本要求,一个是底座模型能力强,一个是要能领域应用。国外大模型产业已经形成了一个生态,且发展非常迅速,而肖仰华认为,我国市场巨大,数据丰富,应用场景多元,更应该从应用带动底座模型研究,走一条所谓“农村包围城市”的战略,外围应用、生态做好,不断去看补齐数据,算力,模型工艺方面短板,最后在技术模型方面形成自己的核心竞争力。
他也提到,大模型不是万能的。比如toB场景绝大部分都是复杂决策,这需要丰富的背景知识、宏观态势研判能力、综合任务拆解能力、精细严密的规划能力、复杂约束取舍能力、不确定场景推断能力,以及物质事物的预见能力,这都是人类专家可以胜任,但大模型尚不具备的能力——但不具备也意味着研发机会,这就是国内可以去研究,甚至形成优势,实现弯道超车的能力。
“ChatGPT之前,人工智能处于一个不成熟的产业阶段,但之后之后,整个人工智能进入了一个重工业发展阶段,进入一个快速发展、快速变现的新阶段。一个明显的标志就是,以前重大历史事件是按年来算,而去年12月份到今天,人工智能领域很多重大历史事件是按月,按周,按天算,这些事件做过十年之后回头看,都有可能是里程碑意义事件。”肖仰华说。
他在演讲最后表示,大模型绝不是宣传文案的噱头,也绝不能成为一场华丽的烟花秀,要实实在在让它成为一个推动社会发展和进步的先进生产力。
采写:南都记者杨博雯
编辑:李玲