49款国内外AI大模型安全测试结果：我国大多处于中游水平

南都N视频APP · 隐私护卫队课题组

原创2025-06-06 22:40

6月5日，2025全球数字经济大会数字安全主论坛暨2025北京网络安全大会在北京召开。北京前瞻人工智能安全与治理研究院院长、联合国人工智能高层顾问机构专家曾毅带来的一组研究数据显示，从国际视角看，我国人工智能大模型的安全性大多处在中游水平，攻击成功率约为5%-6%，还有一定提升空间。

大会现场

中国互联网协会专家咨询委员会常务副主任、工业和信息化部原总工程师赵志国在谈到人工智能为网络安全产业带来的冲击时指出，如今智能化安全威胁不断涌现，在传统攻击手段的基础上，攻击者利用人工智能放大攻击效果，使网络威胁更具规模性、针对性、杀伤性，进一步加剧了网络攻防不对称性。

他表示，目前我国人工智能安全算法的原创性、模型的开放性、数据集的质量等仍与国际先进水平存在差距，人工智能在高级威胁分析、位置威胁发现等方面的作用仍待探索提升。

曾毅现场带来的一组研究数据进一步印证了大模型安全性提升的必要性。据他介绍，新研发的灵御大模型安全攻防评估平台可对越狱攻击进行系统性评估。

他表示，通过该平台对49款不同类型大模型进行安全测试后得出结论——无论是国内还是国际大模型，人工智能能力的提升跃迁并未带动其安全风险防范水平提高。我国人工智能大模型的安全性大多处在中游水平，攻击成功率约为5%-6%，部分国外顶尖模型攻击成功率仅0.7%，我国还有较大提升空间。

曾毅认为，除了解决问题能力以外，安全与治理也是人工智能的核心能力，将加速人工智能稳健发展与应用。安全与性能之间不会相互掣肘，“没有安全治理框架的人工智能不仅是没有刹车，更是没有方向盘。”

专家普遍认为，人工智能为网络安全产业发展带来机遇的同时还有巨大挑战，南都记者注意到，多位专家在给出应对建议时都提到“体系”一词，即重视网络安全体系建设。

“单点的防御时代我认为已经结束了。”中国国家互联网信息办公室总工程师孙蔚敏以2022年冬奥会网络防护“零事故”的成功经历为例，强调了建立联合防御体系的重要性。

她指出，此前“铁桶式”“围栏式”“各家自扫门前雪式”的防护理念已经很难应对猖獗的、国家级网络攻击，要坚持系统思维、体系作战的思维方式。系统的运营者，包括运营商、服务商和相关部门应环环相扣，层层设防，共同打造国家网络安全的联合防御体系。

具体而言，孙蔚敏认为，建立联合防御体系应包括多个层面的要求。一是运营者要压实自身责任，做好运行系统的安全防护工作，落实等保等底线要求；二是从运营商层面看，可以考虑将单个购买的运营商流量清洗服务转变为联合防御体系下的一种公共服务。

全国工商联副主席，中国民间商会副会长安立佳也强调了体系建设的重要性。他建议广大企业坚持共商共建共享原则，推动产业链、创新链、价值链深度融合，促进网络技术与国际互通、标准互认、信任共建，以更加开放的姿态积极参与全球网络安全治理与规则制定，推动构建更加公平合理的网络空间治理体系。

“体系化择优将替代单品择优，体系化设计将替代拼盘设计。”全国工商联副主席、全国政协委员、奇安信集团董事长齐向东表示，网络安全突围的动力来自生成式人工智能，它激活了客户的安全需求，但安全建设却常陷入“缺啥补啥”的拼盘惯性。

他举例道，目前超90%的大型政企机构在开展安全建设时，会采购10家以上厂商的安全设备，项目建设、安全设备和项目采购分散化问题显著。另外，某省级“大体系”建设顺利，但各市、区之间的信息化水平和安全水平参差不齐，也导致大小体系间出现鸿沟。这些会导致网络安全体系建设困难，无法形成合力。

为此，齐向东提出重塑数据聚合模式、安全运营模式和生态合作模式三大路径。其中运营是内生安全体系起效的关键，应构建高效通畅、螺旋上升的反馈回路，包括将人工智能深度应用于威胁情报生产及运营，灵敏告警网络异常行为，通过安全编排自动化与响应（SOAR）技术实现及时处置等。

采写：南都记者樊文扬王子黎

编辑：李玲

南都N视频，未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626

本文作者