6月11日,字节跳动旗下云业务平台火山引擎发布豆包大模型1.6,依据模型调用的上下文长度(即模型能处理的对话记忆范围),首度推行区间梯度定价策略。其中,最低价格区间的模型调用综合成本,相较4月中旬推出的豆包1.5深度思考模型下降63%,公司称这主要得益于技术层面的工程优化。
火山引擎总裁谭待解释说,一些模型厂商会根据是否启用深度思考或多模态功能来差异化定价。然而,对于同结构、同参数的模型而言,真正影响成本的关键因素并不是这些功能,而是上下文窗口的长度——成本随长度增加而递增。
谭待介绍,实践中,企业的大部分模型调用,其输入长度范围都在32K以内。基于这一判断,豆包大模型1.6设定了三个梯度的价位区间:对于绝大部分企业使用集中的0-32K的输入范围,每百万tokens的输入价格为0.8元,输出价格8元。按照3:1的输入输出占比计算,其综合成本为2.6元,而豆包1.5深度思考模型和DeepSeek R1的相应价格为7元。其余两个价格区间为32K-128K与128K-256K。256K即为豆包大模型1.6支持的最大上下文长度。
谭待认为,区间定价的新模式,能够让多模态深度思考模型得到更广泛的调用,从而加速AI Agent(AI智能体)的大规模应用。
火山引擎将降价视为解决Agent规模化难题的手段。当前企业级Agent的实际应用成本压力尤为突出:单个Agent每日token消耗成本可达20美元,高成本阻碍了企业对Agent的开发和应用。谭待接受记者采访时进一步指出,Agent执行任务的Token消耗量大,完成一项任务可能需要20万Tokens,因此降低Token成本尤为关键。
火山引擎总裁谭待。图:火山引擎
此次发布的豆包大模型1.6系列包含三个版本,分别是doubao-seed-1.6;doubao-seed-1.6-thinking和doubao-seed-1.6-flash。doubao-seed-1.6作为一款综合模型,支持深度思考、多模态理解、图形界面操作等多项能力,可为构建Agent提供基础;doubao-seed-1.6-thinking则是1.6系列在深度思考方面的强化版本,只支持深度思考模式,但提升了AI编程、数据和逻辑推理等方面的能力;doubao-seed-1.6-flash则是1.6系列的极速版本,适用于实时交互等低延迟要求高的场景。
为直观说明豆包大模型1.6的推理能力,谭待展示了模型的高考评测“成绩”:在高考全国新一卷数学单科中取得144分,在海淀区模拟全卷考试中,理科得分706分、文科得分712分。
多模态能力上,豆包大模型1.6可用于电商场景中的同款快速识别、商品图片合规审查,也适用于自动驾驶数据标注任务,包括识别视频中车辆的行驶方向、驾驶意图以及路标信息等内容。
凭借其视觉深度思考和视觉定位能力,豆包大模型1.6已具备让AI智能体与浏览器及其他软件进行交互和操作,完成各种任务。在谭待演示的一个场景应用中,模型不仅可以自动操作携程网页预订酒店,并能翻看酒店照片,识别是否带有浴缸等,满足用户个性化需求。
谭待告诉南都记者,此类大模型对GUI(图形用户界面)的操作,在技术上无需第三方软件授权,而是需要和用户协同。GUI操作之外,AI 辅助完成任务的另一途径是通过MCP (模型上下文协议)直接调用第三方服务,但并非每个场景中都有对应的MCP Server(AI与外部工具的中间层)。鉴于该局限性,GUI操作调用也会成为一种重要的方式。二者的融合能让模型去做好各类任务调用。
6月11日的Force原动力大会上,火山引擎同时发布了视频生成模型Seedance 1.0 pro。据介绍,该模型支持文字与图片输入,支持无缝多镜头叙事和运镜。
这款视频生成模型同样采取高性价比策略:每千tokens的价格为0.015元,每生成一条5秒的1080P视频价格为3.67元。如果以1万块钱的预算计算,使用Seedance 1.0 pro可制作超过2700条5秒的1080P视频。按照火山引擎给出的比较数据,相比之下,快手可灵V2.1大师版,相同预算下只能生成1000条同等规格的视频。
成本优势一定程度上推动豆包大模型在B端市场的快速渗透。根据市场调研机构IDC在3月下旬发布的数据,火山引擎占据中国公有云大模型服务调用量市场份额的46.4%,远高于排名其后的百度智能云、阿里云。
另据火山引擎提供的数据,豆包大模型日均Tokens调用量从2024年12月的4万亿,飙升至2025年5月的16.4万亿,自2024年5月发布以来增长137倍。从模型调用的应用场景来看,和去年12月相比,AI搜索的调用量增长10倍,AI编程增长了8.4倍。
行业层面,豆包大模型已广泛落地到消费电子、汽车、金融和教育领域。具体而言,火山引擎与全球前10手机厂商中的9家达成了合作,为其提供语音助手、创作工具等服务;和八成主流车企的合作,则覆盖智能座舱、自动驾驶标注、智能营销等场景;金融方向上,为招行、浦发等70%的系统重要性银行及数十家券商,提供智能展业、投顾等服务;另有超半数985高校用豆包大模型推动教学服务、科研辅助的智能化。
谭待向记者透露,大模型产品在火山引擎所有业务中收入增速最快,远超其他产品,且毛利位居前列。
采写:南都记者 杨柳
编辑:李玲