

以上内容由AI大模型生成,仅供参考
初代王者Sora推出的升级版Sora2,再次“掀翻”了AI圈。除了比上一版Sora对物理世界理解更准确、逼真、可控、能实现同步生成音频能力以外,Sora2对AI圈的撞击在于,它的社交模式将模型厂商对AGI的野心和盘托出:在AI时代构造超过“抖音”这样的超级应用。
AI视频模型刚兴起之时,威尔·斯密斯吃意大利面吃得错漏百出的鬼畜视频记忆仍未远去,不到一年的时间,AI视频已经能对物理世界理解得更好,比如今年全球爆火的“猫猫跳水”“粒子消散”“兔子蹦床”系列视频。但模型厂商的野心并没有就此停下。10月28日,Minimax旗下海螺AI全量更新Hailuo 2.3、2.3 fast系列模型,再次推高视频产品上限。
与此同时,Minimax还用其他组合牌的方法验证了国内厂商的先进性:最新开源、专攻Agent和coding的M2大模型在权威测评榜单上打下全球第五、开源第一的成绩,在LMArena Web Dev榜单上水平接近GPT-5(high)与Claude Sonnet 4.5等顶级模型;语音模型MiniMax Speech 2.6专为商用场景Voice Agent 打造;MiniMax Music 2.0对音乐的理解与表达进一步升级。
一个时代有一个时代的超级应用,结合MiniMax的整体布局,你或许可以窥探到AI时代的创业者们用全模态不断逼近AI战事的终局状态和真正的AGI。
从爆款到变现,新的社交范式被模型厂商造出来了
近半年,AI生成的爆款视频多了起来。
最先出现在公众视野的爆款视频是“猫猫跳水”。周鹏从未想到,自己随手做的一条“口水片”,竟能给自己带来意想不到的曝光度。今年6月,一条在“鲤鱼与鱼Ai”账号上发布的动物跳水视频在互联网上迅速走红,周鹏成为了国内第一个做出“猫咪跳水”爆火视频的人。随后,各种动物、宠物跳水视频频繁出现在视频平台上,抖音平台上,“动物运动会”词条已有1.4亿的播放量。
周鹏在“鲤鱼与鱼Ai”账号上发布的动物运动会视频。
“粒子消散”是另一个爆款AI视频品类,“粒子消散”视频中人物或物体会转化为细小粒子,随着其在空间中逐步消散,会创造出一种梦幻的视觉效果。在抖音发起的“粒子消散大赛”中,这一主题中的视频结合先烈、经典著作人物的追溯等故事,已有4.6亿的播放量。
除了国内互联网,粒子消散模板的视频特效也在同一时间风靡海外。美国AI视频平台Higgsfield AI自今年7月份接入国内AI六小虎中Minimax旗下Hailuo02视频模型API,Hailuo02的粒子消散模板迅速广受欢迎,据Higgsfield AI透露,用户量两个月激增了三倍。
AI生成的爆款视频疯狂进入公众视野、形成新的社交范式的背后,是AI生成技术、底模能力正在被进一步推高。与此同时,AI视频正在进入影视、游戏等商业创作领域。
前述首个在国内做出“猫猫跳水”视频的周鹏,很早就感受到了AI视频带来的改变。相较于基于好玩心态和兴趣做的“口水片”,从今年2月起,周鹏已把更多的精力从原来的装修公司业务转移到AI视频上来,并在4月就开始接商单。他透露,目前自己已在全职用做AI广告服务,1分钟的视频价格在3万到5万之间。
谈及AI视频带来的变化,周鹏直言,以前一条1分钟的传统特效动画片,四个人的团队大概需要做20天,现在两个人用AI三天就能做出来。
新锐创作者“猫大人爱睡大觉”(下文称“猫大人”)也感知到了今年的AI视频热。“猫大人”是AIGC动画团队光影几何视觉方向负责人,此前从事的工作为3D方向。目前,“猫大人”所在的团队创作以中国经典传统文化故事IP、国风水墨为主,输出内容多会配上古典民乐,目前正在和头部视频大厂谈相关商业合作。
“猫大人爱睡大觉”团队作品
“猫大人”表示,目前在他的作品中,应用海螺的频率最高,海螺在大动态运镜、打斗、基础动画上都能解决得很好。
同时“猫大人”也表示,从电影到游戏行业,AI的降本效应已无处不在。“以前一部电影也许需要花上千万来做3D建模、绑定、灯光、渲染、合成等各种流程。尽管AI目前也有一些无法达到的效果,但确实将成本大大降低,甚至不到100万就可以做一部电影。”
“猫大人”兴奋地表示,自己做视频时常常会感到很“燃”。“我做的大多是国风的内容,在对传统内容的表现上,中国的厂商无疑是最好的,AI能赋能我们推动传统文化出海,把我们的优质内容推出海外甚至变现,这是AI时代最强的文化输出,可以让全球看到,其实动画不再只有迪士尼、皮克斯。”
“毛骨悚然”,Minimax拉高天花板
AI生成爆款视频更广泛走入公众视野的现象中,潜藏着中国视频生成模型厂商你追我赶的故事。周鹏就曾总结过,行业有几次“拉高天花板”式的模型上新:去年12月可灵AI 1.6上线,今年5月即梦AI 3.0发布,以及今年6月海螺02的上线。在周鹏看来,中国的视频生成模型正处于百花齐放的阶段:即梦对中国元素有独特的理解、Vidu在角色一致性上做得很好、海螺的运镜和动态实录最强。
在上述爆款视频的背后,Minimax的身影尤为不能忽略。
周鹏透露,以“猫猫跳水”视频为例,海螺02在当时已开启了一个“新的时代”。“其实猫猫跳水在海螺2.0出现前是不可能完成的,因为跳水这个动作很复杂,涉及空中转体、入水水花反馈等,这些你要逐字逐句用提示词教大模型生成,但海螺02对物理世界有感知,它可以自己完成这些动作的反馈。”
“粒子消散”背后最早的推手也是海螺。截至目前,在海螺国内App端,两款带有“粒子消散”特效的花瓣消失模板使用次数已超过40万人。
但Minimax明显没有就此停下。10月28日,Minimax旗下海螺AI全量更新Hailuo 2.3、2.3 fast系列模型。MiniMax全球业务总经理盛静远表示,MiniMax这一次推出的Hailuo 2.3、2.3 fast系列模型相较于Hailuo 02在多方面都进行了优化和升级。
其中,Hailuo 2.3在Hailuo 02模型的基础上进一步升级动态表现力,画面更加真实、稳定,且在肢体动作呈现、风格化以及人物微表情方面实现提升。
特别是在几乎所有模型都会遇到困难的舞蹈动作上,Hailuo 2.3的表现颇为惊人。这一次,海螺还在官网上准备了关于舞蹈的提示词模板,可以应用在各种舞种上。
周鹏在Hailuo 2.3、2.3 fast系列模型一发布就立马使用,他透露,“跳舞以前对模型来说是一个比较难的题目,因为这里面包含大量转身、头部的动作,还有就是手部细节会崩、转身后一个人的脸接上另一个人的身子,海螺2.3在这方面做得很好,复杂手部动作、手臂手指动作都解决得不错。”
他还提到,Hailuo 2.3在微表情的处理上也堪称强项。“大家不喜欢看死板的数字人,更希望数字人是有情感的,以前我们靠分镜、蒙太奇手法来侧面表达,比如主角很悲伤我们用平静的脸加一朵枯萎的花,现在可以直接用微表情了。”
另外,在此前被各大视频工具追求实现的粒子消散能力上,Hailuo 2.3这一次也做了新的突破。还记得上一个接入Hailuo2后拿到三倍用户增长的平台吗?这一次Hailuo2.3一上线,Higgsfield AI和多个视频平台都自发组织了内测活动,所有人都在期待借Hailuo2.3押中下一个“粒子消散”。
在物理表现与指令遵循方面,Hailuo 2.3再度推高上限,被无数海外专业人士推荐。
亚马逊Prime Video创意总监希瑟·库珀在Hailuo 2.3上线后快速试用,并为它的指令遵循能力感到惊奇;3D数字艺术家特拉维斯·戴维斯用Hailuo2.3做了一直想做的狼人变身视频,他认为就电影输出感而言,Hailuo2.3达到了让人毛骨悚然的效果,并再一次cue到了新模型的指令遵循能力。
3D数字艺术家特拉维斯·戴维斯推荐海螺。
美剧《大卫王朝》AI视觉特效艺术家Pierrick Chevallier认为,Hailuo 2.3将带来巨大冲击,他放出了自己用Hailuo 2.3做高空楼宇爆炸场景的测试demo,特效、爆炸效果、运镜都让人为之一振,Pierrick 直言“这个带有破坏场景的测试已经非常震撼了”。
模型厂商的野心:打造下一个时代的超级应用
今年10月1日,OpenAI发布了Sora 2模型,相比初代Sora模型,Sora 2在物理世界的准确性、真实感和可控性方面都实现了巨大提升,并首次加入了同步对话和音效生成功能。特别是新增的客串Cameo功能,为Sora 2带来了更具标志性的社交意义,首次混合了真实物理世界与AI世界。作为一个单独App推出(Sora App),被业内视为下一个接近甚至超过“抖音”“TikTok”的超级应用。
在这个AI版的“抖音”中,用户能创作AI内容、对他人生成的AI内容进行二次创作、在可自定义的信息流里发现新视频,还能通过“客串”功能,让自己或朋友进入Sora生成的环境,并进行各类社交。
尽管手机设备、互联网的进化,已经将大众变成可以“随时随地随手拍”的内容拍摄者。但客观来看,专业内容拍摄仍然是有门槛的行业。新AI视频产品的出现,一方面降低了专业创作视频的门槛,一方面又创造了新的场域,让用户可以把创意变成视频,甚至变现。与此同时,新的社交形态也潜藏在这些产品中,新的超级应用也许会从中诞生。
过去一段时间,行业在以下方面形成了布局趋势:一是多模态进一步融合,除了视频以外,音频等各种元素正在被模型厂商融入模型;二是传统专业视频市场在快速拥抱AI、在多重工作流中融入AI;三是模型厂商对视频模型的布局,正在从“单一对话工具”向“生态化社交平台”进发。
在布局这些趋势的同时,MiniMax已经用“猫咪跳水”“粒子消散”打造爆款来颠覆社交范式,并在全球范围内做到了小范围领先。
MiniMax不单独出牌,你可以看到,这家厂商是朝着整体生态去的,它按照自己的路线,全面布局,并系统地突破每一个模态的模型上限。
在近期的批量上新中,除了上新Hailuo 2.3、2.3 fast系列视频模型,也同步上新了语音模型MiniMax Speech 2.6、MiniMax Music 2.0,以及专门为coding和agent打造的MiniMax-M2。
M2一经上线,便在全球权威测评榜单Artificial Analysis (AA)中取得全球第五、开源第一的成绩;在LMArena Web Dev位居全球第四,超过了Claude 4.5;智能水平接近GPT-5(high)与Claude Sonnet 4.5等顶级模型。另外在价格上,MiniMax也再次以惠普的态度将M2价格颠覆至Claude 4.5的8%。
M2在全球权威测评榜单Artificial Analysis (AA)中取得全球第五。
目前,M2每天的调用量token还在迅速增长,已成为token wallet share最大的国产模型,未来有望切走Anthropic的份额。这应该是第一个国产模型真正在复杂的coding、agent场景中进入硅谷主流视野,现在每天的调用量token还在迅速增长。
在多模态融合上,这一次发布Hailuo Video Agent也正式迭代升级为支持全模态全能创作的 Media Agent。目前,Media Agent已自动匹配了多模态模型,agent集成语音、视频、图片、剪辑相关工具,会根据用户的要求分步骤实现视频需求。另外这一次还新增了“一键成片”功能。
在社交生态的打造上,MiniMax在国内布局有沉浸AI社交应用星野AI,在海外布局有情感陪伴类AI应用Talkie。据公开信息,上线一年后,Talkie在全球的月活跃用户突破1100万,主要用户来自美国市场,同时去年全年Talkie的营收已达到7000万美元。
据透露,在商业化端,MiniMax的ARR早已迈过上亿美金门槛,目前是年化可持续收入和国际化收入最高的中国公司之一。同时MiniMax很快会对标Veo3和Sora2推出下一代的技术,融合各个不同模态的领先技术。未来,MiniMax会带来哪些社交范式的颠覆、走出怎样的AGI之路,值得期待。
采写:南都N视频记者 林文琪
编辑:甄芹