一句话创造可漫游的3D世界，业界首个开源3D世界生成模型发布丨2025WAIC

7月27日，2025世界人工智能大会腾讯论坛上，腾讯正式发布混元3D世界模型1.0，并宣布全面开源。这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型，为游戏开发、VR、数字内容创作等领域带来了全新的可能性。

除3D模型外，腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。

据介绍，腾讯混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术，同时支持文字和图片输入，实现了高质量、风格多样的可漫游3D场景生成。过去需要专业建模团队数周才能搭建的3D虚拟世界，现在只需一句文字或一张图片，几分钟内即可生成。

对游戏开发者而言，混元3D世界模型极大简化了3D场景构建流程，只需输入“一座中世纪城堡，城堡塔楼宏伟壮阔，城堡周围是一座石头雕像，石头铺成的路以及美丽的花朵，卡通风格”等简单指令，模型即可快速生成包含建筑、地形、植被的完整3D场景。输出的Mesh文件可用于游戏原型搭建或关卡设计，还能灵活调整前景物体、更换天空背景，满足个性化创作需求。

对于无建模经验的普通用户，混元3D世界模型同样友好易用，通过混元3D创作引擎，仅需一句话或者一张图即可快速生成360°沉浸式视觉空间，生成的场景可无缝导入Vision Pro等虚拟头显，带来沉浸式体验。

混元3D世界模型1.0的核心还在于其创新的“语意层次化3D场景表征及生成算法”。该算法将复杂3D世界解构为不同语意层级，实现前景与背景、地面与天空的智能分离，不仅生成视觉效果逼真的整体场景，还能输出标准化的3D Mesh资产，兼容Unity、Unreal Engine、Blender等主流工具。用户可对场景内元素进行独立编辑或物理仿真，无缝衔接AIGC技术与传统CG工作流。

与全球领先的开源模型相比，混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键维度均全面超越当前SOTA的开源模型。

目前，混元3D世界模型1.0已全面开源。从秒级生成单个3D资产，到一键打造可漫游的3D世界，腾讯混元正在逐步构建完善的3D内容生成生态。

文丨记者何晶图丨主办方供图

编辑：陈睿智

来源：羊城晚报•羊城派

栏目导航

一句话创造可漫游的3D世界，业界首个开源3D世界生成模型发布丨2025WAIC