叫停Token排名、设定支出上限……巨头开始审视AI账单

南都N视频APP · AI前哨站

原创2026-06-07 18:04

互联网巨头对待Token的态度变了：曾经将Token用量奉为考核“AI使用程度”的绩效指标，鼓励全员拥抱AI，现在纷纷重新审视AI账单。

此前曾有Uber高管透露，公司4个月烧光了全年的AI预算；其后，米哈游也传出一晚上跑出200万元的Token账单。随着AI成本飙升，不少公司开始反思：这笔投入花得值不值？

在此逻辑下，就连“家大业大”的科技巨头对烧Token也采取了一系列收紧措施。比如，微软取消了数千名开发者Claude Code访问授权；亚马逊叫停Token用量排名，告诫员工“不要为了用AI而用AI”；某国内大厂近期也被曝员工Token福利缩水，有自嘲忘了古法编程的码农担心要自费上班……

如何看待互联网巨头们的这一“转向”？在北京邮电大学人机交互与认知工程实验室主任刘伟看来，硅谷用天价账单换来了现实的一课：AI不是目的，而是手段；词元（Token）不是勋章，而是必须被精细管理、放回财务报表和业务闭环中审视的新生产资料。

Token用量与KPI挂钩，实际是“把手段当成目的”

巨额的算力成本支出，正让很多硅谷高管感到头疼。

去年12月，Uber在内部工程师团队中推广了Claude Code——这是知名AI公司Anthropic公司推出的终端AI编程助手。为鼓励员工尽可能多地使用AI工具，这家网约车公司还搞过内部排行榜，用以统计AI使用情况。

很快，这些AI工具在Uber的使用率变高。公司5000多名工程师中大概95%的人每个月都会用到AI。根据Uber披露的数据，约有11%‌的后端更新或代码提交由AI智能体生成，无需人工干预。

AI工具使用量的激增之下，成本也在急剧上升。今年4月，Uber首席技术官普拉文·纳加（Praveen Naga）表示，公司在4个月内就将2026年的AI预算花光了。他未透露年度AI预算的数额及在AI编码工具上的支出，但公开信息显示Uber 2025年的研发支出达到34亿美元，同比增长9%。

短短4个月全年AI预算已超支，听到这一消息时，Uber首席运营官安德鲁·麦克唐纳（Andrew Macdonald）感到无比震惊，称“脑袋像是炸开了一样”。5月22日，他在一档播客中直言，更高的Token支出与客户价值的提升，还未建立起清晰的逻辑关联——尤其是AI行业还在一种浪费现象"Tokenmaxxing"（Token极大化）。

作为处理文本的最小数据单元，Token的消耗量越多，一度被视为员工使用AI工具越频繁、拥抱AI程度越高的衡量标准。在这套逻辑下，硅谷掀起了一股Tokenmaxxing的竞赛，一些公司内部设立专门的Token使用量排行榜，有的甚至将它与绩效指标挂钩。由此产生的一个后果是，为争夺排名、保住工作，部分员工上演了一场“为用AI而用AI”的昂贵表演。

公开信息显示，Meta30天内“烧”了60万亿Token，其中包括大量无效的消耗。同样的现象也出现在亚马逊，一些员工为了刷量安排AI智能体执行大量无意义的任务，这让亚马逊紧急叫停了内部AI使用排行榜KiroRank，并改用“标准化部署量”为新考核指标，转而关注工程师用AI产出有效代码的频率。语言学习平台多邻国也宣布，正式撤回将“AI使用程度”纳入绩效考核的决定。

“Token消耗量基本上代表着模型为完成用户任务所耗费的工作量。”赛智产业研究院院长赵刚告诉南都记者，这个完成结果是否让人满意，有无解决用户问题、能否产出实际价值，无法用Token指标来衡量。因此，“单纯以Token消耗量作为激励员工使用AI的手段，可能较为偏颇，需要企业及时纠偏。”

刘伟也对南都记者表示，将Token当成KPI，本质上是“把手段当成目的”。他认为，Token只是计量单位，而非价值本身。企业必须完成认知跃迁，把Token真正当作有成本的生产资料来运营，让每一笔Token支出都指向可衡量的业务结果。

AI应从“资源消耗型工具”转向“价值共创型伙伴”

随着AI应用的普及，全球Token消耗量持续攀升。AI模型聚合与调用平台OpenRouter的统计数据显示，5月25日至31日，全球AI大模型总调用量为31.8万亿Token，较年初1月5日当周调用量6.42万亿，增长近5倍。另据中国国家数据局披露，2026年3月，我国日均Token调用量已突破140万亿，两年增长超过千倍。

2026年，OpenClaw、Hermes等智能体横空出世，更是推动Token需求呈现指数级走高。AI智能体自主执行一个任务，需要完成规划、推理、工具调用和结果验证等流程，Token消耗量能达到聊天问答场景的十倍以上，有分析形容Agent工作流天然是“Token黑洞”。

一个代表性案例是，5月底，国内游戏公司米哈游《崩坏》系列的技术团队负责人郑银河在一场峰会上透露，内部有工程师搭建了几个Agent（智能体）协作，结果一晚上跑出200万元的Token账单。

很显然，Token不是免费午餐。按照Open AI的GPT5.5模型收费标准，输入每百万Token要花费5美元，输出为每百万Token 30美元。Anthropic的Claude Opus 4.8模型收费标准类似，输入为每百万Token 5美元，输出为每百万 token 25美元。

当巨额的AI账单摆在面前时，Uber高管麦克唐纳直言，公司越来越难以为持续攀升的AI支出作出合理解释。为了控制成本，Uber规定每位员工月度使用AI编程工具的上限为1500美元。

微软也转向更可控的AI方案——5月14日，微软发文将取消大部分人Claude Code的内部许可，要求工程师们在6月30日前迁移到自家的GitHub Copilot CLI。

值得一提的是，国内也有大厂收紧了Token政策。近日多位网友发帖称，腾讯内部Token福利“缩水”，已将全员统一的Token额度改为按工作任务动态调配。此前，腾讯传出为每位员工发放价值约22万元的Token套餐。

在逐浪AI过程中，和硅谷的巨头一样，国内科技公司同样需要正视AI投入与产出能否划上等号的问题。Token“烧”得越多，算力成本压力越凸显，这将迫使企业作出相应的调整。

如何看待巨头们的这些变化？网经社电子商务研究中心数字生活分析师陈礼腾告诉南都记者，这说明整个行业逐步褪去狂热，朝着看重落地收益的理性阶段过渡。前两年，AI赛道融资火热，企业普遍把模型调用频次、Token消耗量当作数字化成果的评判标准，叠加用户教育需要，造成高端算力成本居高不下。

“一边为Token账单头痛，一边又怕削减投入在AI竞赛中掉队。”在刘伟看来，硅谷正陷入亲手制造的难题。他认为，企业要明确“Token烧得多不是本事，烧得准才是本事”的价值取向，培养更强的成本与目标意识，将词元成本与业务价值精准关联、建立精细化核算体系，才能在智能时代站稳脚跟。

“AI应从‘资源消耗型工具’转向‘价值共创型伙伴’。”刘伟告诉南都记者，未来人工智能的发展趋势是，把技术事实驱动与需求价值驱动融合在一起的人机环境系统智能。

陈礼腾进一步提到，各大企业陆续调整AI管理策略，资本端的态度也将同步转变，市场不再单纯为技术概念和研发“烧钱”买单，缺乏商业化落地路径、难以兑现实际产出的AI项目将会持续缩减预算。

“从堆算力、堆Token调用量的泡沫扩张，转向成本可控、价值落地优先的精细化运营，已成为当下AI产业发展的主流趋势。”陈礼腾说。

采写：南都N视频记者李玲发自北京

编辑：黄莉玲

南都N视频，未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626

本文作者