南都讯 日前,由国家语言资源监测与研究中心指导、中国传媒大学和商务印书馆主办的“中国语言生活皮书”编纂二十周年暨第四届中国语言生活学术研讨会举行。本次会议上,香港科技大学(广州)作为牵头单位,正式对外发布了语言服务大语言模型(1.0)。
项目带头人屈哨兵教授、陈雷教授与项目团队。
语言服务大语言模型(1.0)是国家语言文字科研项目的阶段性成果,由香港科技大学(广州)牵头完成,简称“语服通大语言模型”,意指语言服务通。该大语言模型面向国家语言服务体系构建的实际需求,聚焦多源异构语言数据与复杂中文语境,打造了服务可集成、知识可溯源的一体化大模型,为国家语言服务体系的智能化建设提供了应用示范。
在服务层面,该大语言模型集成了国家语言资源服务平台的各类语言资源与知识源,支持跨平台资源访问与服务联动,实现了平台内资源的集成与智能调度。系统能够自动识别不同的服务请求类型,智能路由至相应的数据源和语言服务模块,完成请求解析、资源调用与结果生成全过程,不仅具备语言知识问答能力,更能在语言研究、教育教学、政务传播等垂直领域中提供专业支持。
在知识层面,该大语言模型依托国家语言生活知识库,实现了回答内容的可溯源与可验证。在回答问题时能够基于文献原文进行推理和引用,并在输出中标注具体来源,通过点对点溯源方式,确保生成结果可验证、可引用,以及模型的学术与公共可信度。其中,国家语言生活知识库汇聚了近二十年来的国家语言生活报告和政策研究成果,经过专家标注、原始文档数字结构化,形成了可检索的知识单元。
内测阶段,团队邀请了语言学专家、教师、科研人员等多角色参与评测,结果显示该大语言模型在问答准确率、调用准确率与溯源可靠性等方面均表现优异,满意度较高。未来,语言服务大模型将持续拓展语言资源接入与应用的边界,推动语言资源服务集成化、智能化、可信化发展,为国家数字中文建设提供有力支撑。
采写:南都N视频记者 孙小鹏