昆仑万维开源交互式世界模型Matrix-Game 2.0:3D创作进入实时生成时代

AI快讯4天前发布 ai-tab
9 0

🌟 产品介绍

昆仑万维(中国领先AI科技公司)在2025年8月12日“SkyWork AI技术发布周”上,开源两款突破性世界模型:Matrix-Game 2.0(交互式实时生成模型)和Matrix-3D(3D场景生成模型)。这是业内首个在通用场景实现实时长序列交互生成的开源方案,对标Google DeepMind的Genie 3与李飞飞WorldLabs,但以开源形式推动技术民主化。

昆仑万维开源交互式世界模型Matrix-Game 2.0:3D创作进入实时生成时代

🎯 适用人群

  1. 游戏开发者:低成本构建动态游戏场景
  2. VR/AR创作者:分钟级生成可交互沉浸空间
  3. 具身智能研究者:训练AI智能体的虚拟环境
  4. 数字艺术家:一键生成风格化3D世界(油画/真实/卡通)
  5. 元宇宙开发者:快速搭建物理一致的虚拟空间

⚡ 核心功能与技术实现

以下为两款模型的核心能力对比:

功能模块Matrix-Game 2.0Matrix-3D
实时交互生成25 FPS连续视频,分钟级长序列(W/A/SD操控)单图生成360°全景视频
场景构建城市/野外多环境,支持跳跃/转向/复杂地形交互文本/图像输入生成可漫游3D空间
物理一致性✅ 角色运动符合重力/碰撞规则✅ 几何结构与遮挡关系自然
跨场景泛化真实/油画等多风格适配中世纪城堡/自然景观等多样主题
技术实现3D Causal VAE+扩散Transformer+KV缓存全景表示+条件视频生成+3D重建模块

关键技术原理详解:

  1. 25FPS实时生成

    • 3D Causal VAE:压缩时空维度数据,高效建模动态序列。
    • 多模态扩散Transformer:融合视觉编码与动作指令(键盘/鼠标输入),逐帧生成物理合理画面。
    • KV缓存机制:减少重复计算,实现无限时长视频生成。
  2. 单图生成3D世界

    • 全景表示技术:将2D图像解译为360°空间视角。
    • 分层3D重建:分离前景/背景语义层,输出标准化Mesh资产(兼容Unity/Blender)。

🛠️ 工具使用技巧

  1. 快速构建游戏原型
    • 输入指令如“生成GTA式追车场景”,通过键盘控制车辆转向,实时生成25帧连贯画面。
  2. 3D场景分层编辑
    • 在Matrix-3D中上传一张城堡图片 → 生成可漫游空间 → 在Blender中独立调整植被/建筑纹理。
  3. 物理规则测试
    • 在Matrix-Game 2.0的沙盒场景中,设置台阶/障碍物,观察角色跳跃轨迹是否符合重力模拟。

🔗 访问地址

  1. Matrix-Game 2.0 GitHub
    https://github.com/SkyworkAI/Matrix-Game
  2. Matrix-3D GitHub
    https://github.com/imandrewlux/matrix3d

💡 行业影响:这两款模型将传统游戏场景建模从数周缩短至分钟级,且开源属性允许开发者二次训练定制化环境。昆仑万维的布局不仅推动AI基础设施国产化,更为虚拟人、自动驾驶仿真等场景提供高性价比解决方案。


© 版权声明
trae-字节旗下AI代码助手

相关文章

暂无评论

用户头像
none
暂无评论...