粤语语料库建设与大模型评测重点实验室成立

南方都市报APP • 南都教育
原创2024-11-15 19:52

南都讯 记者孙小鹏 通讯员广大宣 日前,大模型与语言资源学术研讨会暨粤语语料库建设与大模型评测重点实验室启动会在广州大学(黄埔校区)举行。此次大会由广州大学与广州市社会科学界联合会联合主办,旨在推动语言资源的数字化与大模型应用的多语言服务化,标志着广东省在粤语语料库建设方面迈出了重要一步。

图片

“人文科学+科技创新”传承保护粤语

粤语是岭南文化最重要的基因和最具特色的要素。为弘扬广州历史文化,传承广州千年文脉,广州大学与广州市社科联经过多次调研、多方论证,决定以人工智能时代粤语语言的传承发展为着力点,合作共建“粤语语料库建设与大模型评测重点实验室”,期望通过多学科交叉融合创新研究,探索具有中国特色、岭南风格的城市文化传承、保护与发展之路。

图片

“粤语作为中华文化的瑰宝,承载着粤港澳大湾区深厚的历史文化底蕴。我们有责任,也有义务,利用现代科技手段,保护和传承好这一宝贵的文化遗产。”广州大学张其学副校长指出,粤语语料库建设与大模型评测重点实验室(以下简称“实验室”)的成立,是广州大学服务国家战略、响应时代号召的具体行动,是广州大学在跨学科建设中迈出的重要一步。实验室不仅能推动粤语文化的数字化传承,更能在粤港澳大湾区乃至全球的文化交流与合作中发挥积极作用,还将成为广州大学跨学科发展中的重要学术平台。期待实验室在未来能够结出丰硕的成果,为中华文化的传承与发展,为粤港澳大湾区的繁荣与进步,为推动国家科技创新、提升文化自信,贡献智慧和力量。

广州市社科联主席崔颂东指出,此次与广州大学合作共建粤语语料库建设与大模型评测重点实验室,是打造跨学科协同创新科研平台进行“新协同”、紧抓哲学社会科学创新“新机遇”、锚定学科交叉融合破题大模型“新赛道”的重要举措。他强调,要扎扎实实把实验室各项建设落到实处,为广州加快实现老城市新活力、“四个出新出彩”,在进一步全面深化改革、推进中国式现代化建设中当好排头兵,继续在高质量发展方面发挥领头羊和火车头作用贡献社科力量。

“粤语语料+大模型” 创新融合

“当语言遇到大模型,每个国家,每个语种,要重新审视自己的文化语言战略。”会上,重点实验室主任、广州大学齐佳音教授介绍, 重点实验室将通过建立岭南文化核心语料及细分领域知识库、粤语数据资产库、粤语高质量数据集,以重点实验室为载体形成面向人工智能应用的粤语文化数据资源基础服务能力以及面向人工智能粤语服务的内容安全合规评测能力,为粤语的数据化、资源化、服务化和产业化助力。

重点实验室采取1+1+N的运行机制,由广州大学和广州市社会科学界联合会联合共建,采取政产学研用一体化的模式,形成围绕粤语语料库建设与智能化服务的合作生态。重点实验室第一期建设周期为五年,长远目标是成为立足粤港澳大湾区、面向国家语言服务战略、通用粤语语料库及大模型粤语服务评测的国内乃至全球首屈一指的科研与对外服务专业学术性机构。

3360x2240_67371f1b3fa32.jpg

3360x2240_67371f1b3eff5.jpg

重点实验室设立“双首席科学家”。由中国工程院院士、广州大学网络空间安全学院名誉院长、中国电子信息产业集团有限公司资深首席科学家方滨兴院士,香港科技大学(广州)党委书记、广州大学二级教授、国家语委科研机构国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授分别担任重点实验室技术首席专家与语言首席专家,承担学术指导和咨询工作,保障重点实验室学术发展方向。广州大学张其学副校长和广州市社科联崔颂东主席担任实验室指导委员会主任,协调整合各界资源,为重点实验室运行提供指导。

重点实验室以广州大学为主体,依托广州大学网络空间安全学院、人文学院、新闻与传播学院,打造跨学科协同创新科研平台。重点实验室以广州为基地,推动广东、香港、澳门的学术团体以及互联网企业,共建共享粤语语料数据库。接下来,重点实验室将围绕粤语文化精神标识体系研究、通用粤语语料库建设、大模型粤语言语交互质量评测、大模型粤语言语交互质量提升研究四个方向开展科学研究。


图片:通讯员提供

对这篇文章有想法?跟我聊聊吧
孙小鹏7171W
南方都市报记者
南都新闻,未经授权不得转载。授权联系方式:
banquan@nandu.cc,020-87006626。