为深入贯彻中央经济工作会议对“人工智能+”的战略部署,积极响应省委经济工作会议关于大力实施“人工智能+”行动的要求,南都大数据研究院推出“AI+无穷大”年度专题报道。从政策、市场、应用、科研、舆论等主题切入,通过多维度梳理关键数据,剖析人工智能如何在创新驱动下蓬勃发展,赋能千行百业;同时,专题还将聚焦广东,看数字经济第一大省如何在智慧医疗、智慧教育、智慧交通、智能制造等领域落地AI应用。
第3期,通过综合分析国内外学术研究数据库,观察中国AI的科研活跃度,看国内研究者在关注什么。
AI,正在全球掀起一场科学革命,而这场巨变的起源,是科学家们的“察觉”与“接力”。在这片共同绘就的图景中,中国科研既有“产量”也有“含金量”:国际知名研究机构数据显示,近十年,中国AI论文总量全球第一,总引用量全球第二;中国科学院、清华大学等8所中国高校及科研机构的论文发表量在全球位列前十。
国内研究者在关注什么?分析中国知网数据库相关论文,2024年,国内AI应用研究论文“井喷”,论文数量相比2023年增长47.4%,其中,近三成关注AI在教育领域的应用,其次是计算机软件及计算机应用。
中国AI论文发表量
近十年来全球第一
1943年,阿兰·图灵发明了“图灵机”,这被视作科学家思考“机器模拟人脑”的首次探索。1956年,美国达特茅斯会议上首次提出“人工智能”这一术语,4位学者提出,希望研究“让机器能像人那样认知、思考和学习,即用计算机模拟人的智能”的科学,人工智能学科由此而来。
数十年来,科学家们前赴后继,不断突破着AI的边界。据美国乔治城大学数据库ETO截至去年12月最新数据显示,2014年至今,全球约192个国家和地区共发表了近270万篇AI相关论文,其中亚太地区论文数量占比最高,为49.3%。中国是论文最“高产”的国家,近十年共发表AI相关论文近64万篇,位居全球第一,是美国(第二位)的1.6倍。
从研究子领域来看,中国的研究更多集中在机器人技术和计算机视觉上,总计38万篇左右;在自然语言处理为4.9万篇左右、AI安全方面约为7300篇。
如今,AI的进步已形成复利,并驱动着对AI本身的研究。2024年11月,谷歌DeepMind发布《发现的新黄金时代:抓住AI for Science的机遇》报告,报告结论显示,AI的出现,提高了科学家知识获取和利用的效率。全球各地的实验室里,科学家们对AI的使用正以指数级增长。
乔治城大学安全与新兴技术中心(CSET)最新发布的《人工智能研究年鉴》显示,2017至2022年期间,全球范围内的人工智能研究呈爆发式增长。这一增长主要得益于自然语言处理(NLP)和计算机视觉(CV)领域的快速发展,特别是计算机视觉领域的研究,约占人工智能研究总量的32%,在5年内增长了121%。
全球AI论文发表量Top10机构
8个在中国,中科院霸榜
不仅勤奋高产,在论文质量方面,中国亦有不俗表现。ETO数据显示,近十年,中国AI领域论文引用量超过一千万,仅次于美国。
而据《日本经济新闻》报道,在对全球三大顶尖AI学术会议——ICLR(国际学习表征会议)、NeurIPS(神经信息处理系统大会)和ICML(国际机器学习大会)采用的约3万篇论文进行分析后发现,从2024年采用论文的作者国籍排名来看,美国以14766人位居榜首,中国以8491人位居第二。
南都大数据研究院梳理发现,多组数据表明,无论从数量还是质量,中国研究机构在AI领域都贡献了高含金量的科研成果。
从ETO数据来看,过去十年,全球AI论文数量的Top10研究机构中有8个来自中国。其中,中国科学院稳坐第一,将分析范围缩小到高引用论文时,中国科学院仍然位居榜首。英国《自然》增刊“自然指数2024人工智能(AI)”显示,2019年至2023年,自然指数中AI研究产出增长最多的10家机构有6家来自中国,中国科学院排名居首。《日本经济新闻》报道指出,根据三大顶尖会议采用论文作者数量统计机构排名,中国有清华大学、北京大学、浙江大学、上海交通大学等4家机构跻身前十。浙江大学与阿里巴巴合作设立的AI研究机构2020年采纳论文作者人数为34人,而2024年达到了906人。
乔治城大学安全与新兴技术中心(CSET)发布的《人工智能研究年鉴》还强调了企业在人工智能研究中的重要角色。数据显示,6%的人工智能研究文章由来自企业的作者撰写,而一般学术文章来自企业的作者仅占3%。这表明,企业在推动人工智能技术应用与发展的过程中发挥了关键作用。而根据权威论文网站Arxiv数据统计,2024年引用次数最高的10篇AI论文中,其中一篇关于大模型应用和发展的研究,就来自阿里巴巴。
去年国内AI应用论文量同比增长近五成
近三成研究教育场景应用
通过权威中国学术文献数据库——中国知网来观察国内的研究趋势,可以发现,在近五年间,有关人工智能(AI)应用的研究论文数量一直保持着强劲的增长态势。2024年更是创了新高,与2023年相比,研究论文数量增长幅度将近五成。
以“人工智能应用”为关键词在中国知网检索,2024年共有2946篇相关论文,对其进行学科分类后发现,关注人工智能在教育领域应用的论文最多,占比近三成,研究方向包括教育理论与教育管理、高等教育、医学教育与医学边缘学科、中等教育、职业教育等。其次是计算机软件及计算机应用,占比约25%。
下载量最高的10篇论文,其中一半是关于教育教学的论文。比如,聚焦典型教育应用场景探讨生成式人工智能与未来教育形态重塑;归纳国内外实证研究,提炼人工智能应用于语言教学的前沿技术方法;针对性提出适合我国基础教育实际情况的生成式人工智能应用对策等。
除了以论文形式淬炼科研成果,“产学研融合”成为当前国内特色研究趋势。2024年7月,上海算法创新研究院、北京科学智能研究院与华为云计算技术有限公司签署合作协议,在算力底座供应、算法生态培育、产业赋能落地、算法人才培育和前沿技术创新研究等五个方面展开具体合作;今年1月,浙江大学与蚂蚁集团携手共建数据与智能联合研究中心,整合科研资源与应用场景,共同攻坚专项课题、开展人才合作、科技大赛、开源合作、行业交流等。
顶尖科研机构和新型研发机构也在AI领域重点开拓。如鹏城实验室布局“AI+遥感”“AI+天文”“AI+生命组学”三大重点方向。上海AI实验室开源了“万卷·丝路”多语言语料库,为多语言大模型训练提供高质量数据支撑等。
出品:南都大数据研究院
策划:王卫国 邹莹
统筹:张纯 张雨亭
采写:南都记者 张雨亭
设计:欧阳静 罗锐
更多报道请看专题:AI+无穷大