WAIC上的“最强大脑”对话:机器人如何走向真实世界?

南都N视频APP · 南都汽车
原创2025-07-29 22:35
图片

在近日火热举行的2025世界人工智能大会(WAIC)上,人类对于机器人的想象似乎都照进了现实。数百家AI领域顶尖企业齐聚上海,机器人们从干活搬砖到跳舞打拳、从健康管理到安抚陪伴,让观众感觉人机共存的未来仿佛近在咫尺。

图片

而在大会的重要论坛之一“全球视角下的具身智能新机遇”中,来自PI、Intrinsic、清华大学、Sanctuary AI、英伟达、亚马逊等全球具身智能领域的 “最强大脑”汇聚一堂,开启了一场跨越学术与产业的 “华山论剑”。

构建算法飞轮,让机器人成为多面手

“世界模型让一部分机器人先想象起来,不是在梦中数电子羊,而是可以预见未来”。论坛上,智元机器人合伙人&具身业务部总裁姚卯青以《通向具身智能大规模突破之路——智元的本体,数据,算法飞轮》为主题分享,拉开了本届论坛的序幕。

图片

姚卯青介绍,智元打通了机器人本体、运动智能、交互智能、作业智能,实现“一体三智”全栈闭环发展,并构建了“数据-模型-本体-场景”四轮驱动的具身智能飞轮体系。

在此次大会上,智元机器人发布了面向真实世界双臂机器人的世界模型开源平台“Genie Envisioner”(以下简称 GE)。它融合了预测、控制、评测三大核心能力,为机器人从“看见”到“行动”提供了端到端、一体化的解决方案,让机器人在数字时空里先彩排、再上岗。

“面对具身智能数据的荒漠,我们选择栽下第一棵树,愿其能成为一片森林。”姚卯青表示,为了解决数据不足的问题,智元已经通过自建专业数采工厂,形成了全球最大数据集AgiBot World并进行了开源。

图片

与此同时,智元还发布行业首个通用具身基座模型——启元大模型,拥有“一脑多形”能力,可适配其他异构机器人本体。

而在场景端,智元机器人凭借“机器人+具身模型”技术重构了智能生产力范式,现已在工业制造、仓储物流、电力巡检、交互引导四大场景实现突破性落地。

在真实平台验证中,搭载GE-Act的机器人先后完成“做三明治”“倒茶”“擦桌面”“使用微波炉加热”“流水线装箱”等五项任务,各项成功率均远超行业平均值,展示了前所未有的精度与鲁棒性。

此外,姚卯青预告,精灵系列下一代机器人本体精灵 G2 即将发布,相较于上一代,G2 在运动精度、场景适配性上全面升级,具备原生数采能力,可胜任工业、商业、家庭等多元场景,进一步拓宽具身智能的应用边界。

如何让机器人走向真实世界

在学术前沿层面,全球学术专家首次同台解析具身智能技术突破。

谷歌科学家Stefan Schaal聚焦高性能AI驱动机器人操作痛点难点,分享最新进展;清华大学计算机系副研究员、IEEE TPAMI期刊编委苏航深入解析基座模型如何推动具身智能实现虚实泛化,助力机器人从虚拟训练走向真实世界应用。

产业实践层面,英伟达研究院高级研究员You Liang Tan从产业和研究两大视角,分享了机器人通用模型的构建路径。Sanctuary AI首席运营官Ron Keith分享了人形机器人Phoenix迭代进展,勾勒出具身智能落地前景。

Physical Intelligence联合创始人,UC Berkeley副教授的Sergey Levine则以机器人基础模型为核心进行阐述,揭秘“机器人基础模型”如何让机器自主掌握复杂操作。

在圆桌讨论环节,智元机器人首席科学家、具身研究中心主任、上海创智学院副教授罗剑岚博士,与众多嘉宾围绕自动化到智能化的时代趋势,就具身智能产业落地的机遇和挑战展开讨论,分享专业视角的行业洞察和探索方向。

作为全球AI顶级盛会,这届WAIC让观众感受到了具身智能的全面爆发,从AI应用融入千行百业,到世界模型的精细化搭建,再到国产算力的强势崛起,我们看到的不再是零散的技术点,而是一个个完整且高速运转的生态。它们不仅为具身智能发展划定了新坐标,也为硅碳融合文明指明了新方向。

 

采写:南都·湾财社记者 胡雯雯

编辑:黄露

南都N视频,未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626