联合实验室专家陈建洪：打造AI伦理研究与实践国际高地

南都N视频APP · 南都大数据研究院

原创2025-09-16 09:23

生成式人工智能是引领新一代科技革命和产业革命的核心驱动力，是加快培育和发展新质生产力的重要引擎，为经济高质量发展注入新动能，与此同时，各类难以预知的风险和挑战也伴生而来。

安全是发展的基石，为进一步创新筑牢根基。2025年9月15日，粤港澳大湾区生成式人工智能安全发展联合实验室揭牌成立。其将构建“政产学研用”深度融合的创新生态，致力服务企业发展、推动产业落地、加强安全监管，努力实现属地企业安全合规成本全国最低、安全能力水平全国领先，助力粤港澳大湾区成为全国生成式人工智能安全发展服务最优区域。

南方都市报、南都大数据研究院推出“湾区AI安全发展新引擎”系列报道，深度对话参与联合实验室建设的专家，一同憧憬大湾区AI安全发展新未来。

“联合实验室将成为国际合作的重要窗口，积极参与全球AI治理对话，提升区域在全球的影响力。”中山大学哲学系（珠海）主任、博雅学院院长，联合实验室专家陈建洪接受南都采访表示，哲学研究能为AI伦理规范提供深层基础，哲学视角能提醒技术团队坚守增进人类福祉原则，而非取代人类价值。

哲学能深入理解AI风险本质

南方都市报（以下简称“南都”）：本次粤港澳大湾区生成式人工智能安全发展联合实验室汇聚了各学术领域、学科的专家，您作为哲学领域的专家，觉得哲学相关的研究能为实验室的治理体系建设提供哪些独特支撑？

陈建洪：首先是价值观与伦理原则的构建。哲学研究能够深入探讨人类社会的根本价值观，如公平、正义、尊严、自由等，为AI伦理规范提供深层基础。它将有助于联合实验室明确生成式AI发展的终极目的和应遵循的基本原则，避免技术盲目发展，例如思考“公平”的AI模型应具备哪些属性。

其次是风险的本质与边界界定。哲学能帮助我们超越技术层面，深入理解AI风险的本质（如是技术缺陷、使用方式问题还是社会结构互动结果），并界定可接受的风险边界，以及如何在创新与风险之间进行权衡取舍。例如，对“可解释性”的哲学探讨可避免过度约束技术发展。

最后是责任分配与主体思考：随着AI能力增强，传统责任概念面临挑战。哲学研究能深入探讨“谁该负责”的问题，包括开发者、使用者、管理者乃至AI系统自身（作为有限主体性），并强调人类在AI发展中的主体地位，确保AI始终服务于人类福祉。

南都：在您看来，哲学视角可在哪些维度和技术治理互相补充？
陈建洪：第一，超越技术可行性的伦理审查。技术团队常关注“能否做到”，哲学视角则引入“应不应该做”的考量。在AI模型迭代、内容审核等环节，哲学伦理审查节点可引导技术团队预判社会危害和伦理风险，在研发初期就进行规避或设计限制。

第二，社会影响的预判与评估。技术治理侧重技术指标，哲学视角引导技术团队更全面思考AI对社会、文化、经济乃至个人心理健康的深远影响，促使其在设计之初就融入社会影响评估，并通过技术设计促进积极社会效应。

除此之外，公平与公正的价值嵌入也很重要。技术团队难以直接在代码层面体现抽象公平概念。哲学视角可将公平、无偏见等伦理原则转化为具体的研发规范和设计策略，例如在数据选择时强调多样性和代表性，在算法设计时鼓励偏见检测和缓解机制。

最后就是增进人类福祉的坚守。哲学视角能提醒技术团队坚守增进人类福祉原则，确保AI工具服务于人类尊严、自主和福祉，而非取代人类价值。这意味着在技术设计中，要保留人类的最终控制权和决策权，强调AI作为人类辅助的角色。

建立系统性偏见检测与缓解流程

南都：据了解，联合实验室将制定行业安全发展标准，形成属地化安全标准体系。如何平衡标准的严谨性与产业发展的灵活性，满足大湾区多元产业结构的需求？

陈建洪：为平衡标准的严谨性与产业发展的灵活性，实验室可采取以下策略：首先，实施分级分类管理，依据风险等级和应用场景差异，对高风险领域制定强制性标准，对低风险领域采用灵活指导原则。其次，设立“监管沙盒”机制，允许企业在受控环境中测试创新应用，为标准完善提供实践依据。再次，推进行业自律与最佳实践，鼓励行业协会制定快速响应市场的专业指引，作为官方标准的有益补充。最后，建立动态更新与迭代机制，通过常态化评估和修订，确保标准体系具备前瞻性和适用性，适应技术快速发展。

南都：语料库作为生成式AI的“知识基础”，其价值导向直接影响AI生成内容的伦理边界。您认为联合实验室应建立怎样的语料库筛选与审核机制？

陈建洪：联合实验室应建立多层次的语料库筛选与审核机制，其核心原则包括：确保语料库的多元性与代表性；建立系统性偏见检测与缓解流程；实现价值观对齐；并严格遵守数据安全与隐私保护法规。具体机制涵盖：实施数据来源严格审查与白名单准入制度；采用自动化技术与人工审核相结合的双重筛选流程，由多学科专家团队对高风险内容进行复审；开发科学的偏见评估指标与度量体系，并定期发布审计报告；引入“红队”测试进行价值观对齐的压力测试与持续迭代；整合用户反馈与众包机制；并特别注重大湾区地域文化与行业特点的融入，邀请领域专家参与审核，确保AI的适应性与准确性。

期待形成“大湾区AI伦理范式”

南都：在您看来，联合实验室接下来的建设运行还有哪些方向？

陈建洪：对联合实验室的建设运行主要有四方面期待。一是将其打造为AI伦理研究与实践的国际高地，通过设立专项，系统研究并输出可操作的伦理准则与治理框架，形成具有国际影响力的“大湾区AI伦理范式”。二是构建深度融合的“产学研用”生态圈，与顶尖高校及产业界紧密合作，开展科研、人才培养及行业应用示范，推动AI安全与伦理的落地实践。三是赋能区域并影响全球，通过输出高标准的安全解决方案和可推广的“大湾区经验”，助力企业提升竞争力，并积极参与全球AI治理框架制定，贡献中国智慧。四是建设开放共享的AI安全知识与资源中心，通过构建知识库、测试平台及开源数据集，降低研发门槛，激发创新活力，提升全球AI系统的安全性与可信度。

同题问答

在您看来，粤港澳大湾区生成式人工智能安全发展联合实验室能发挥哪些独特作用？

陈建洪：粤港澳大湾区生成式人工智能安全发展联合实验室将作为技术创新的核心引擎，通过汇聚顶尖科研资源，致力于生成式AI的前沿突破与应用转化。联合实验室聚焦安全标准制定，构建符合国际水平且适应本地实际的安全规范体系。同时充当产学研用协同交叉的桥梁，促进知识共享与技术转移，加速AI技术落地。作为高水平AI人才培养基地，输送兼具技术能力与伦理法律视野的专业力量。依托大湾区区位优势，成为国际合作窗口，积极参与全球AI治理对话，提升区域影响力。

监制：戎明昌刘江涛

策划：王卫国邹莹

统筹：凌慧珊李伟锋陈实付可关健明

撰文：南都研究员李伟锋孔令旖唐静怡陈袁谢小清

南都N视频记者熊润淼袁炯贤伍曼娜曾俊豪

视频：陈杰豪赵炎雄冷锋

视效：AI数据工作室张许君郭文哲原毅

设计：林泳希尹洁琳蔡沐晗严丽萍

实习生：朱恺熙程佳丽

出品：南都大数据研究院

编辑：李伟锋

更多报道请看专题：湾区AI安全发展新引擎