一句话让AI点奶茶、订机票,在手机上就能实现。8月20日,AI独角兽公司智谱发布全球首个手机Agent(智能体)AutoGLM2.0,智谱AI CEO张鹏在沟通会上介绍称,相比于智谱去年发布的智能体,今年AutoGLM 2.0已经进化到了你不知道如何操作时,它能自动跳转帮你操作、完成任务。目前,智能体App AutoGLM已上线应用商店,人人免费可用。
智谱AutoGLM技术负责人刘潇在沟通会上表示,Deep Research Agent平均一个单个检索任务成本在3-5美元,但在AutoGLM2.0上检索的价格大概只有0.2美元,目前这个成本只是处于中间阶段,未来随着产品的规模化和商业化进一步深入,成本还会压缩一个量级,甚至更小。据此测算,AutoGLM2.0单次成本至少下降了93%。
一句话点奶茶,首个手机智能体来了
8月20日,大模型“六小虎”中的智谱发布了全球首个手机Agent(智能体)AutoGLM2.0。目前,AutoGLM已上线应用商店,人人免费可用。智谱AutoGLM技术负责人刘潇在媒体沟通会中发出“找附近奶茶店下单20杯并用优惠券”的指令,随后该智能体自动跳过广告、选择了最近门店中的热销品类,在确认数量、使用红包后,停在了支付环节。据介绍,出于安全考虑,支付环节仍需人为操作。
早在今年10月,智谱就推出了智能体AutoGLM。当时,AutoGLM能模拟用户的屏幕操作,如点击手机应用等。去年11月,智谱将AutoGLM做了升级,升级后的AutoGLM可以完成超长任务、跨App比价、短口令等操作。
智谱AI CEO张鹏在媒体沟通会中提到,7月底,智谱发布了GLM 4.5系列模型,它们更多偏向于基础模型技术层面,但首个C端手机Agent的发布能发挥模型的能力、融入到个人的生活和日常中去。
张鹏介绍,相比于去年的AutoGLM, AutoGLM 2.0更加智能。“去年AutoGLM是你知道怎么操作,但不想浪费时间所以让它来帮你操作。今年 AutoGLM 2.0已经进化到了你不知道如何操作时,它能自动跳转帮你操作、完成任务。”
南都N视频记者实测发现,输入“帮我查一下8月22日广州飞杭州最便宜的机票,并订购”指令,AutoGLM 2.0先进行了任务的分析,然后跳到携程App上输入起飞地、到达地和时间,多番比对后找到了价格为720元的航班。南都N视频记者后续手动核实对照,该航班确实为价格最低。最终订票环节,仍需人为接管输入订票人名字、身份证号码等信息。不过,目前需要花费较长时间等待任务完成。
【视频:实测智能体订机票】
能调用40+应用,单次任务成本至少下降93%
据了解,智谱AutoGLM2.0能调用的App包括小红书、抖音、美团、京东等40+高频应用,实现点外卖、订机票、查房源等服务。在办公场景中,可实现跨应用执行全流程工作:从信息检索到内容撰写,再到生成1分钟短视频、PPT 或播客,并直接完成小红书发布。
拾象科技创始人李广密此前公开提到,判定Agent好不好用的标准之一是Agent与当前模型能力的匹配程度,今天Agent 80%的能力依赖于模型这个引擎。
对此,智谱方面表示,AutoGLM 得以在国内全量上线,一是因为AutoGLM由智谱最新开源 SOTA 语言模型 GLM-4.5 与视觉推理模型 GLM-4.5V 驱动。AutoGLM 将基座模型原生能力发挥到极致,并结合在端到端异步强化学习方面的多项突破成果,得以完成 推理、编码、研究、Agentic与GUI操作等多类任务。二是因为它是纯国产Agent,并且成本相较于接入国外模型的Agent有了数量级的下降。
Agent在执行时产生的单次成本如何计算?智谱AutoGLM技术负责人刘潇在沟通会上表示,目前,AutoGLM 2.0单次运行成本已经被打下来1到2个数量级。“传统靠API形式的Deep Research Agent,平均单个检索任务成本在3-5美元,但在AutoGLM2.0上检索的价格大概只有0.2美元。同时,目前这个成本只是处于中间阶段,未来随着产品的规模化和商业化进一步深入,成本还会被继续压缩下一个量级,甚至更小。”据此测算,单次成本至少下降了93%。
可接入汽车、AI眼镜等更多硬件终端
2025年,Agent按下加速键。Manus等Agent产品的爆火将公众目光从创业公司竞相下注的大模型聚焦到更能触达普通人的智能体工具上,Agent也正成为科技企业密集落子的方向。
除了智谱,MiniMax、月之暗面、阶跃星辰、百度等科技公司也在集体进军智能体领域。南都N视频记者留意到,这些企业的入场方式大多是在通用大模型上用“模型即Agent”的方式推出智能体产品,这种方式将Agent的大模型语言、上下文、工具使用等组件缝合进了模型中,用户只需要在一个模型中就可以完成智能体的应用。
其中,百度近期发布的GenFlow 2.0一大特点是连接起百度文库、学术、地图等百度生态资源,用户能调用百度学术超6.8亿文献库、百度文库超14亿专业文档,在用户授权后还能随时检索、调用百度网盘中储存的指定资料,结合用户已有的知识库、资料库来精准找到想要的内容。GenFlow 2.0的主要落地场景还是手机和电脑。
今年另一大模型“小虎”阶跃星辰在世界人工智能大会(WAIC)前发布了其新一代基础大模型Step 3,目前阶跃星辰已覆盖国内超过一半头部国产手机厂商,深度合作打造手机 Agent体验。
智谱走的是另一条道路,即以一个通用App的方式,做了一个新的“siri”。刘潇表示,团队认为,从Agent智能体到AGI通用人工智能,还需要满足3A原则:Around-the-clock(全时),24小时运行,即使用户离线,Agent依然在执行任务;Autonomy without interference(自主零干扰),独立运行,不占用用户屏幕与算力;Affinity(全域连接),跳出浏览器对话框,跨越手机、电脑、手表、眼镜、家电等设备,操作物理世界。
基于这一理念,在AutoGLM 2.0中,智谱专门为AI配备了专属云手机和云电脑。Agent可以在云端自主干活、完成任务,无需占用用户的本地设备,其间用户可以使用其他APP(如刷抖音、打游戏)。这意味着它不仅能“自动驾驶手机”,还可异步“代理办公”。
刘潇向南都N视频记者表示,智谱已将AutoGLM的操作执行能力封装为API,开发者只需简单接入即可将这一能力融入各类硬件设备。除了常见的手机与电脑,AutoGLM2.0可以进入体重秤、汽车、AI眼镜等更多物理终端。
采写:南都N视频记者 林文琪
编辑:甄芹