截至2024年6月,中国有3.5亿人表示自己听说过生成式AI产品,占整体人口的24.8%;有2.3亿人表示自己使用过生成式AI产品,占整体人口的16.4%。11月30日,由中国互联网络信息中心编写的《生成式人工智能应用发展报告(2024)》披露这组数据。
报告显示,年龄和学历明显影响了网民对生成式AI产品的使用意愿,中青年、高学历网民的使用情况更普遍。
截至2024年11月,我国共有309个生成式AI产品完成备案。报告提到,用户使用选择上,百度文心一言在所调研的典型产品中,网民使用率最高,达11.5%;而OpenAI、谷歌等海外公司研发的生成式AI产品在国内也拥有一定规模的用户——尽管其服务未正式进入中国大陆。
生成式人工智能典型产品在网民中的使用率。图:《生成式人工智能应用发展报告(2024)》
与用户规模相伴随的是不断扩大的产业规模。工信部信息技术发展司副司长杨亚俊9月中旬公开介绍,中国初步构建了较为全面的人工智能产业体系,相关企业超过4500家,核心产业规模已接近6000亿元人民币,产业链覆盖芯片、算法、数据、平台、应用等上下游关键环节。
但在这些生成式AI上下游关键环节,中国依然面临多重瓶颈。
上述报告指出,算力瓶颈主要体现在算力供给、算力分布和算力管理调度等方面——比如高性能芯片进口受限;算力基础设施分布不均衡,东部沿海算力资源较为集中,中西部则相对匮乏;随着算力规模扩大,硬件故障发生的概率也随之增加。
高质量数据集的匮乏是另一掣肘。报告发现,尽管我国已有部分中文开源数据集,但数据完整性不足、清洗和标注不精确等问题普遍存在,导致数据质量相比国际英文公开数据集存在较大差距。由于国内数据集质量参差不齐、部分内容陈旧,导致国产大模型的训练效果并不十分理想。
生成式AI应用向B端(企业端)推进也存在阻力。报告指出,很多企业对大模型应用存在“私有化部署才安全”的传统观念,对更易用、更高效的公有云部署持有疑虑。而一味强调私有化、定制化,一方面会大幅增加企业的运维和服务成本;另一方面,“手工作坊”“施工队”的应用模式,会折损大模型应用的效率和质量。
华泰证券科技与电子行业首席分析师黄乐平此前向南都提到,在中国,政府、金融、电信、能源等很多行业使用大模型的时候,都要求模型的私有化部署,这些企业不会因为大模型API调用价格下降就选择上公有云。
上述报告建议,央国企作为大模型应用的主力军,应先行先试,通过对场景业务分类分级,精细化区隔适合采取公有云模式的大模型应用场景,以此带动更多企业参与。
报告还特别提及专业人才短缺的现状:人才缺口加大的同时,高校在人工智能相关教育中又缺乏高水平的课程建设经验,导致学生学习的专业知识与实际就业存在一定差异。此外,未成年人的教育培养有所不足。尽管很多未成年人对人工智能技术存在兴趣,但其获取信息的主要渠道是“自己在网上浏览相关知识”,而非来自学校的教育课程。
南都此前报道,艾媒咨询6月发布的调研数据显示,91.3%的受访企业面临人工智能人才缺乏的问题。但一些高校的人才培养与现实需求脱钩,师资水平参差不齐、教学条件不足。
为破解人才缺口,中国互联网络信息中心的报告提议,完善海外人才引进、回流的支持保障机制,并且在高校开展实用性生成式AI教育,同时将人工智能的基础知识纳入中小学教育体系。
采写:南都记者 杨柳
编辑:李玲