5月18日,出行科技与服务公司如祺出行首次向外界完整披露其AI数据资产版图。随着AI技术加速迈向“世界模型”方向,物理世界的高质量交互数据已成为最稀缺的战略资源。如祺出行正加快将海量真实出行场景数据转化为驱动人工智能迭代的核心资产,向智能驾驶、具身智能、世界模型等前沿领域注入“数据动力”。
当前,广东正加速从“世界工厂”向“AI应用第一省”跨越。2025年,全省人工智能核心产业规模突破3000亿元,同比增长超40%,占全国约四分之一;人工智能相关企业达68.6万家,其中智驾企业超过1400家、具身智能企业已达9978家,对AI模型训练必需的优质数据需求极为庞大。在这一背景下,如祺出行也在加快向大湾区AI行业数据基础设施供应商发展。
据披露,如祺出行旗下数据业务板块(以下简称“如祺数据”)已覆盖标注数据、行为数据、合成数据及多模态训练数据集四大类,形成了从数据采集、规模化处理、精准标注到合成数据及多模态处理的全链路数据服务能力。
公开信息显示,如祺数据在大湾区已为腾讯、小马知行、广汽等多家科技及智驾头部企业提供服务。如祺出行自2023年开始布局、近年持续加码AI数据服务。财报显示,2025年以该业务为主要收入来源的技术服务板块实现营收1.60亿元,同比大增487.4%。截至2026年5月,公司已在广州、上海、重庆、沈阳等城市部署超过300辆智能驾驶数据采集车,每日可产出1600小时、约130TB的合规数据。
据介绍,这些数据主要根植于如祺出行的常态化运营场景。采集车搭载激光雷达、摄像头等多类传感器,在开展出行服务的同时合规采集真实场景中的驾驶行为、人车交互等信息,具备物理世界数据特征。行业数据显示,类似的高质量数据全球总量仅约50万小时,而头部厂商单年需求量即达百万小时级别,供需极度失衡。在业界普遍将具身智能和世界模型视为“下一个AI主战场”的背景下,这类数据已被视作稀缺性战略资产。
与传统AI数据服务商多聚焦于基础标注不同,如祺出行已向“数据集+全栈能力”升级。这一模式让公司不仅服务智能驾驶,还能向具身智能等高价值赛道延伸,实现数据服务价值链攀升。官方信息显示,如祺出行已在全国布局3大数据服务交付基地,拥有超1500人的服务团队、超1000家BPO合作伙伴及近百万众包资源,每月可提供千万级标注产能,满足高并发任务需求。同时,如祺的合成数据已涵盖不同时段、天气环境及座舱场景,有效弥补真实采集中的盲区;多模态训练数据集则覆盖图像、文本、音频与视频,可直接支持大模型的垂类微调。通过全栈数据服务能力,如祺出行可实现“数据即服务”模式,显著降低客户使用高质量真实数据的门槛。
目前,如祺数据服务已进入智能驾驶、具身智能、大模型、消费电子、医疗等多个领域,客户包括腾讯、小马智行、理想、广汽、火山引擎、百度智能云等头部企业,商业化路径已得到初步验证。
采写:南都·湾财社记者 梁罗喆
编辑:黄露