互联网巨头对待Token的态度变了:曾经将Token用量奉为考核“AI使用程度”的绩效指标,鼓励全员拥抱AI,现在纷纷重新审视AI账单。
此前曾有Uber高管透露,公司4个月烧光了全年的AI预算;其后,米哈游也传出一晚上跑出200万元的Token账单。随着AI成本飙升,不少公司开始反思:这笔投入花得值不值?
在此逻辑下,就连“家大业大”的科技巨头对烧Token也采取了一系列收紧措施。比如,微软取消了数千名开发者Claude Code访问授权;亚马逊叫停Token用量排名,告诫员工“不要为了用AI而用AI”;某国内大厂近期也被曝员工Token福利缩水,有自嘲忘了古法编程的码农担心要自费上班……
如何看待互联网巨头们的这一“转向”?在北京邮电大学人机交互与认知工程实验室主任刘伟看来,硅谷用天价账单换来了现实的一课:AI不是目的,而是手段;词元(Token)不是勋章,而是必须被精细管理、放回财务报表和业务闭环中审视的新生产资料。
Token用量与KPI挂钩,实际是“把手段当成目的”
巨额的算力成本支出,正让很多硅谷高管感到头疼。
去年12月,Uber在内部工程师团队中推广了Claude Code——这是知名AI公司Anthropic公司推出的终端AI编程助手。为鼓励员工尽可能多地使用AI工具,这家网约车公司还搞过内部排行榜,用以统计AI使用情况。
很快,这些AI工具在Uber的使用率变高。公司5000多名工程师中大概95%的人每个月都会用到AI。根据Uber披露的数据,约有11%的后端更新或代码提交由AI智能体生成,无需人工干预。
AI工具使用量的激增之下,成本也在急剧上升。今年4月,Uber首席技术官普拉文·纳加(Praveen Naga)表示,公司在4个月内就将2026年的AI预算花光了。他未透露年度AI预算的数额及在AI编码工具上的支出,但公开信息显示Uber 2025年的研发支出达到34亿美元,同比增长9%。
短短4个月全年AI预算已超支,听到这一消息时,Uber首席运营官安德鲁·麦克唐纳(Andrew Macdonald)感到无比震惊,称“脑袋像是炸开了一样”。5月22日,他在一档播客中直言,更高的Token支出与客户价值的提升,还未建立起清晰的逻辑关联——尤其是AI行业还在一种浪费现象"Tokenmaxxing"(Token极大化)。
作为处理文本的最小数据单元,Token的消耗量越多,一度被视为员工使用AI工具越频繁、拥抱AI程度越高的衡量标准。在这套逻辑下,硅谷掀起了一股Tokenmaxxing的竞赛,一些公司内部设立专门的Token使用量排行榜,有的甚至将它与绩效指标挂钩。由此产生的一个后果是,为争夺排名、保住工作,部分员工上演了一场“为用AI而用AI”的昂贵表演。
公开信息显示,Meta30天内“烧”了60万亿Token,其中包括大量无效的消耗。同样的现象也出现在亚马逊,一些员工为了刷量安排AI智能体执行大量无意义的任务,这让亚马逊紧急叫停了内部AI使用排行榜KiroRank,并改用“标准化部署量”为新考核指标,转而关注工程师用AI产出有效代码的频率。语言学习平台多邻国也宣布,正式撤回将“AI使用程度”纳入绩效考核的决定。
“Token消耗量基本上代表着模型为完成用户任务所耗费的工作量。”赛智产业研究院院长赵刚告诉南都记者,这个完成结果是否让人满意,有无解决用户问题、能否产出实际价值,无法用Token指标来衡量。因此,“单纯以Token消耗量作为激励员工使用AI的手段,可能较为偏颇,需要企业及时纠偏。”
刘伟也对南都记者表示,将Token当成KPI,本质上是“把手段当成目的”。他认为,Token只是计量单位,而非价值本身。企业必须完成认知跃迁,把Token真正当作有成本的生产资料来运营,让每一笔Token支出都指向可衡量的业务结果。
AI应从“资源消耗型工具”转向“价值共创型伙伴”
随着AI应用的普及,全球Token消耗量持续攀升。AI模型聚合与调用平台OpenRouter的统计数据显示,5月25日至31日,全球AI大模型总调用量为31.8万亿Token,较年初1月5日当周调用量6.42万亿,增长近5倍。另据中国国家数据局披露,2026年3月,我国日均Token调用量已突破140万亿,两年增长超过千倍。
2026年,OpenClaw、Hermes等智能体横空出世,更是推动Token需求呈现指数级走高。AI智能体自主执行一个任务,需要完成规划、推理、工具调用和结果验证等流程,Token消耗量能达到聊天问答场景的十倍以上,有分析形容Agent工作流天然是“Token黑洞”。
一个代表性案例是,5月底,国内游戏公司米哈游《崩坏》系列的技术团队负责人郑银河在一场峰会上透露,内部有工程师搭建了几个Agent(智能体)协作,结果一晚上跑出200万元的Token账单。
很显然,Token不是免费午餐。按照Open AI的GPT5.5模型收费标准,输入每百万Token要花费5美元,输出为每百万Token 30美元。Anthropic的Claude Opus 4.8模型收费标准类似,输入为每百万Token 5美元,输出为每百万 token 25美元。
当巨额的AI账单摆在面前时,Uber高管麦克唐纳直言,公司越来越难以为持续攀升的AI支出作出合理解释。为了控制成本,Uber规定每位员工月度使用AI编程工具的上限为1500美元。
微软也转向更可控的AI方案——5月14日,微软发文将取消大部分人Claude Code的内部许可,要求工程师们在6月30日前迁移到自家的GitHub Copilot CLI。
值得一提的是,国内也有大厂收紧了Token政策。近日多位网友发帖称,腾讯内部Token福利“缩水”,已将全员统一的Token额度改为按工作任务动态调配。此前,腾讯传出为每位员工发放价值约22万元的Token套餐。
在逐浪AI过程中,和硅谷的巨头一样,国内科技公司同样需要正视AI投入与产出能否划上等号的问题。Token“烧”得越多,算力成本压力越凸显,这将迫使企业作出相应的调整。
如何看待巨头们的这些变化?网经社电子商务研究中心数字生活分析师陈礼腾告诉南都记者,这说明整个行业逐步褪去狂热,朝着看重落地收益的理性阶段过渡。前两年,AI赛道融资火热,企业普遍把模型调用频次、Token消耗量当作数字化成果的评判标准,叠加用户教育需要,造成高端算力成本居高不下。
“一边为Token账单头痛,一边又怕削减投入在AI竞赛中掉队。”在刘伟看来,硅谷正陷入亲手制造的难题。他认为,企业要明确“Token烧得多不是本事,烧得准才是本事”的价值取向,培养更强的成本与目标意识,将词元成本与业务价值精准关联、建立精细化核算体系,才能在智能时代站稳脚跟。
“AI应从‘资源消耗型工具’转向‘价值共创型伙伴’。”刘伟告诉南都记者,未来人工智能的发展趋势是,把技术事实驱动与需求价值驱动融合在一起的人机环境系统智能。
陈礼腾进一步提到,各大企业陆续调整AI管理策略,资本端的态度也将同步转变,市场不再单纯为技术概念和研发“烧钱”买单,缺乏商业化落地路径、难以兑现实际产出的AI项目将会持续缩减预算。
“从堆算力、堆Token调用量的泡沫扩张,转向成本可控、价值落地优先的精细化运营,已成为当下AI产业发展的主流趋势。”陈礼腾说。
采写:南都N视频记者李玲 发自北京
编辑:黄莉玲