9月12日下午,以“规范AI内容 共筑清朗生态”为主题的2025外滩大会见解论坛上,蚂蚁数科AI科技产品总监鲁玮发表主题演讲,从身份伪造、凭证造假等AI滥用风险问题切入,系统介绍蚂蚁在应对生成式内容风险、黑灰产攻击以及大模型“幻觉”方面的技术实践与治理思考。
本次论坛由南方都市报社、南都大数据研究院、中国互联网协会人工智能工作委员会、复旦大学传播与国家治理研究中心联合主办。
鲁玮在外滩大会见解论坛上作主旨演讲。
鲁玮指出,当前AI对物理世界和数字世界带来三大真实性挑战:身份伪造、凭证伪造和大模型幻觉。黑产借助AI技术,通过深度伪造人脸、合成虚假票据和证件等方式,进行诈骗、虚假开户和贷款申请,给个人与社会带来巨大风险。现场,他展示了一个AI伪造图像的案例,9张数字人脸照片中有2张是AI生成的,但观众难以通过肉眼分辨。
“善战者无赫赫之功”,鲁玮强调,蚂蚁的安全理念重在防患于未然。面对身份伪造,蚂蚁数科依托国际前沿的生物识别安全实验室——蚂蚁天玑实验室,在开户、支付、信贷等关键场景中确保个人数字身份的可验证与可信赖。“数字世界里面有很多的办法伪造你自己,我们就是要保证你的身份真实和可信”,鲁玮表示。
目前,黑产借助AI的凭证造假愈发低成本、规模化。在凭证防伪方面,鲁玮介绍,蚂蚁数科推出“光鉴智能验真”,通过防伪、质检、识别,最后通过高阶的各种决策,大小模型结合,实现在语义、视觉、文本、图片多重信息的抽检,最后给出关键的决策,“核心逻辑是保证现在的物理世界里的票据、身份、凭证是防伪的。”
幻觉同样是大模型应用面临的重要挑战之一。鲁玮认为,AI生成内容幻觉的危害在于滥用人类的信任,若出现在问诊、商业决策或司法裁判等场景,将造成严重后果。蚂蚁数科面向这一问题推出“蚁天鉴”大模型内容安全防御服务,针对大模型业务场景中提问、回答的交互模式,构建了一套多层防御护栏方案,可以在提问环节对潜在风险做预防,对生成的回答内容进行风险过滤,并能面向用户和场景进行动态策略调优。
展望未来,鲁玮认为,随着具身智能、AI for Science与智能体(Agent)加速落地,AI能力跃升将伴随更复杂的安全议题,包括人机互动的责任边界、价值对齐与伦理问题等。他呼吁产业、学界与媒体加强协同,共建规范、透明、可信的AI治理体系。
采写:南都N视频记者 陈袁
更多报道请看专题:2025外滩大会论坛·规范AI内容 共筑清朗生态