豆包大模型升级,火山引擎总裁谭待谈Agent元年市场竞争

南都N视频APP · 政商数据
原创2025-12-24 09:47

“截至12月,豆包大模型日均调用量已经超过了50万亿Tokens,从发布至今实现了417倍的高速增长;相比去年12月,也实现了超过十倍的增速。这不仅是火山引擎的速度,更代表了AI行业的加速发展。”近日,火山引擎总裁谭待在FORCE原动力大会上宣布了豆包大模型的最新调用数据。

从市场表现来看,不断提升的tokens数,也推动火山引擎的AI产品不断完善。在Gartner发布的全球AI应用开发平台魔力象限中,火山引擎位列挑战者首位,位居中国第一;而根据IDC的报告,火山引擎在中国公有云大模型服务调用量上也稳居第一,市场份额从2024年的46.4%进一步提升到了今年的49.2%。

谭待透露,今年有超过100万企业和个人使用了火山引擎的大模型服务,覆盖了100多个行业。其中有超过100家企业,在火山引擎的tokens使用量超过1万亿。

会上,火山引擎还正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。权威评测数据显示,豆包大模型在多模态理解、生成能力及Agent能力上,已跻身全球第一梯队。 

图片

火山引擎总裁谭待

豆包大模型升级,能看长视频、能跨平台生成购物攻略

“帮我找一款适合长时间开会用的骨传导蓝牙耳机,要求手机和笔记本都能用,音质超级好,降噪功能好,长期使用不会损伤听力,续航时间一定要久。预算1500-2000元。注意优惠券要计算,选个最便宜的,三天内送到。”

接到这个由十项复杂需求构成的购物要求后,豆包1.8在抖音、京东、得物等各平台搜索产品进行了对比,最终生成了一份涵盖各平台价格、评价、运费等信息进行对比的购物攻略。

而当丢给豆包1.8一个1小时4分钟的视频监控画面,让其找出车被刮花的原因后,模型则是通过低帧率快速看完,最终找到肇事车辆和事故时间。

可以做复杂需求的购物攻略,能帮看长时间的监控视频,可以帮经营者生成接下来的经营计划……豆包1.8可以完成更复杂的任务了。

据介绍,作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。其工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。

在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧,模型支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解,该能力可广泛用于在线教育、产品质检等场景中;豆包1.8还原生支持智能上下文管理,用户可以配置上下文策略,当任务轮次过长时,模型会根据策略智能清除低价值的历史工具调用信息,确保多步骤任务稳定完成。

目前,豆包1.8在各类测评集中表现突出。Agent方面,豆包1.8在AIME 2025测评集上表现稳步提升,在通用智能体测评 BrowseComp中取得全球领先成绩,HLE相比1.6版本也有大幅提升;多模态理解方面,豆包1.8在视觉判断准确性、空间理解、文档解析、视频运动识别能力上超越Gemini 3,领跑全球;在其他任务上,也处于全球第一梯队。

图片

音视频创作模型可实现音画同步、多语言多角色对话

针对日益增长的视频创作需求,火山引擎还推出了Seedance 1.5 pro音视频创作模型。该模型不仅具备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性进展。

“音画同步的功能很多人都有了,但是能不能做好了这是很大的差别。怎么做好?一个很关键的点,你要做好这个事情要做到声音和画面的同步,还要做到语义的同步,你要做好的基础条件,不仅视频模型做得好,还要有很强的大语言模型作为基础,还要有很好的端到端的语音模型为基础”。谭待表示。

在现场展示的Seedance 1.5 pro生成的两个战士打斗视频中,长剑相撞、头盔落地、以及人倒地、喘息的声音都和画面完全同步。

据介绍,Seedance 1.5 pro采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出。在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语等)、英文及小语种,极大地提升了视频内容的真实感与全球化创作潜力。

现场展示了由Seedance 1.5 pro生成的三个角色进行对话的视频,三个角色可以无缝使用四川话、西班牙语和英语进行沟通。

为进一步降低创作门槛与成本,Seedance系列即将上线“Draft样片”功能。创作者可先生成低分辨率样片进行预览,其关键要素与最终成片高度一致,真正做到“预览即所得”。数据显示,该功能可帮助创作者提升65%的整体效率,并减少60%的无效创作成本。

在谈到市场竞争的时候,谭待表示,模型之间最重要的还不是竞争,而是把市场做大,“你想明年这个市场还要再涨10倍,大家看的就不是存量的竞争、不是零和博弈。所以我觉得越来越多的企业开始重视MaaS,大家进来一起把这个市场做大,让各个行业的AI落地能更快。”


Agent元年,规模化使代码量减少96%

“在中国看,今年算是Agent的元年,明年肯定还是会爆发,肯定会有很多涌现出来的更有价值的功能,比如说现在AI写PPT已经写得很好了,但是比最好还是有一定的差距,明年这块可能非常好。”谭待表示。

他在大会上表示,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构。

谭待也强调称,安全是AI领域最基础的条件。在AI安全领域,火山引擎也正式推出一项新功能:MaaS on AICC,通过这个服务,火山方舟上的所有模型,包括豆包大模型家族和deepseek等开源模型,都可以直接运行在AICC加密环境中。用户只需要在火山方舟选择“机密部署”方式,就可以一键开启各种模型的机密推理服务。

据介绍,火山引擎和联想一起基于AICC率先实现了端加密AI PC。最近,火山引擎还和OPPO一起打造了业界首款支持机密AI推理的智能手机。

在Agent开发层面,火山引擎全面升级了企业级AI Agent平台——AgentKit。该平台覆盖了Agent从开发、部署到管控的全生命周期,旨在解决企业在Agent落地中面临的身份权限管理、模型确定性及系统集成等核心挑战。此次大会的会前智能推荐agent、智能签到agent和智能总结 Agent都是通过AgentKit快速搭建而成,

在传统开发方式下,开发者需要手动去调用模型、解析工具、处理各种状态和异常,要实现一个Agent,大约就需要700行代码,后端接口还要再写800多行进行各种串联,加起来接近1500行代码;而使用AgentKit,Agent 本身只需要50行左右就能完成,后端接口只需十几行代码,整体加起来不到70行代码,代码量直接减少了96%。

在Agent运营层面,火山引擎推出了HiAgent智能体工作站。该工作站通过构建统一的企业AI任务调度中心、提供一系列开箱即用的通用智能体,以及支持个性化定制智能体应用,帮助企业实现Agent的规模化管理与应用。

此外,为降低企业使用门槛,火山引擎推出了业内首个“AI节省计划”。该计划覆盖所有按量后付费的大模型产品,通过阶梯式折扣,帮助企业最高节省47%的成本。

谭待表示,通过从模型能力到基础设施的全面革新,火山引擎正在推动AI应用从单一的模型调用向复杂的Agent智能体生态演进,加速AI能力在各行各业的深度落地。 


采写:南都N视频记者 汪陈晨

 

编辑:甄芹

南都N视频,未经授权不得转载、授权联系方式
banquan@nandu.cc. 020-87006626