生成游戏3D资产时间从天缩短至分钟级,腾讯混元3D再升级

南方都市报APP • 政商数据
原创2025-01-23 22:41

1月21日,腾讯混元宣布开源3D生成大模型2.0版本,并上线业界首个一站式3D内容AI创作平台—混元3D AI创作引擎。就在两个多月前,腾讯混元港宣布其混元3D生成大模型“ Hunyuan3D-1.0”正式开源,同时支持文字、图像生成3D资产。

据悉,对比1.0版本,2.0版本依然同时支持文、图生3D的能力,并在生成效果上得到显著提升,其中特别是在几何结构上更加精细,纹理色彩更加丰富。目前3D生成大模型已应用在腾讯游戏业务中。据统计,通过混元3D创作平台的助力,游戏业务3D资产制作时间成本可从5-10天级别下降到分钟级。

图片

具身智能、游戏、自动驾驶等领域成应用场景 

目前,3D AIGC技术正在快速迭代,3D技术应用落地进程也在不断加快,游戏制作、社交、电商广告、工业制造、具身智能、自动驾驶、AR/VR、三维打印等多个领域都积极应用AI能力辅助3D内容生产,如在游戏制作环节,快速生成高质量的游戏角色、道具、建筑等3D资产,提升游戏开发效率。

据悉,腾讯混元上线的3D AI创作引擎,是业界首个低门槛、一站式的3D内容AI创作平台,包含了基础模型生成、3D功能矩阵、3D编辑、3D生成工作流、创作素材库等多种功能。

在基础模型生成方面,创作引擎同时支持文生及图生3D。其中,输入中/英文提示词,描述主体内容、特征、风格等,就能快速生成4个高质量3D模型,同时,也支持上传单图即生成3D模型。效果上,可以选择不同纹理风格进行生成,同时支持PBR贴图,通过模拟物理特性可生成更逼真的材质贴图效果。 

图片

谈及产品的应用场景,腾讯混元3D负责人在接受媒体群访时郭春超表示,游戏产业商业价值明确、国内有百万相关从业者,构成了一个刚需场景。其次具身智能、自动驾驶等领域也是3D生成的应用场景。“比如很多具身智能企业找我们团队要接口生成,以前他们做机器人仿真,需要在屋里让机器人训练,不可能造真实的场景训练,所以有很多模拟需求,这种情况下都需要3D的资产;另外在自动驾驶领域也能提高效率,比如好几个自动驾驶公司开车采集实时的路况,他们用这个3D生成大模型造数据,模拟一场车祸非常容易,但如果在实际采集的时候,需要半年才会碰到车撞上电线杆的情景。”

 

游戏业务已应用,3D资产制作时间从天降低到分钟

去年11月,混元3D生成大模型1.0全面开源。据悉,此次发布的2.0版本也依然同时支持文、图生3D的能力,此外,通过将几何、纹理解耦生成,2.0版本还在生成效果上得到显著提升,在几何结构上更加精细,纹理色彩更加丰富。 

图片

3D生成模型主要包括几何和纹理生成两部分,其中,几何大模型专注于捕捉物体的形状、结构和空间关系,而纹理大模型则专注于颜色、细节和表面特征。据了解,在实际应用上,混元3D生成大模型此前也已经开始应用于UGC 3D创作、商品素材合成、游戏3D资产生成等公司内业务及场景。

腾讯游戏在研项目研发制作人王智刚在现场分享时提到,混元3D生成能力也开始应用于腾讯内部游戏业务,其生成3D质量已能满足部分游戏3D资产标准,包括几何布线合理性、贴图准确性与骨骼蒙皮合理性等,据统计,通过混元3D创作平台的助力,游戏业务3D资产制作时间成本可从5-10天级别下降到分钟级。

另外,此前在发布混元3D生成大模型1.0时,腾讯地图也已基于腾讯混元3D大模型,发布了自定义3D导航车标功能,支持用户创作个性化的 3D 导航车标,相比传统的3D车标重建方案速度提升了91%,有效提升了用户使用体验。

郭春超表示,随着3D AIGC技术快速迭代,3D技术应用落地进程也在不断加快。混元3D生成大模型从1.0版本的率先开源,到快速升级2.0版本并开放业界首个一站式3D AI创作平台,希望切实帮助大众爱好者、开发者、创作者们降低使用门槛,提升创作效率,让3D大模型技术在各行各业发挥价值。

郭春超还提到,AI目前只是理解文本、图、视频等1D或2D,它怎么在真实的物理世界中理解空间是更关键的,而空间的智能也需要大量3D的生成和创造,如果不能创造它,必然无法理解它。AI要往更高阶的方向发展,

目前,开发者可在GitHub、Hugging Face等技术社区下载混元3D 2.0模型,用户也可以直接在混元3D AI创作引擎上体验。 


采写:南都记者 林文琪

 

编辑:甄芹

对这篇文章有想法?跟我聊聊吧
南都新闻,未经授权不得转载。授权联系方式:
banquan@nandu.cc,020-87006626。