🌟 产品介绍
昆仑万维(中国领先AI科技公司)在2025年8月12日“SkyWork AI技术发布周”上,开源两款突破性世界模型:Matrix-Game 2.0(交互式实时生成模型)和Matrix-3D(3D场景生成模型)。这是业内首个在通用场景实现实时长序列交互生成的开源方案,对标Google DeepMind的Genie 3与李飞飞WorldLabs,但以开源形式推动技术民主化。

🎯 适用人群
- 游戏开发者:低成本构建动态游戏场景
- VR/AR创作者:分钟级生成可交互沉浸空间
- 具身智能研究者:训练AI智能体的虚拟环境
- 数字艺术家:一键生成风格化3D世界(油画/真实/卡通)
- 元宇宙开发者:快速搭建物理一致的虚拟空间
⚡ 核心功能与技术实现
以下为两款模型的核心能力对比:
功能模块 | Matrix-Game 2.0 | Matrix-3D |
---|---|---|
实时交互生成 | 25 FPS连续视频,分钟级长序列(W/A/SD操控) | 单图生成360°全景视频 |
场景构建 | 城市/野外多环境,支持跳跃/转向/复杂地形交互 | 文本/图像输入生成可漫游3D空间 |
物理一致性 | ✅ 角色运动符合重力/碰撞规则 | ✅ 几何结构与遮挡关系自然 |
跨场景泛化 | 真实/油画等多风格适配 | 中世纪城堡/自然景观等多样主题 |
技术实现 | 3D Causal VAE+扩散Transformer+KV缓存 | 全景表示+条件视频生成+3D重建模块 |
关键技术原理详解:
25FPS实时生成:
- 3D Causal VAE:压缩时空维度数据,高效建模动态序列。
- 多模态扩散Transformer:融合视觉编码与动作指令(键盘/鼠标输入),逐帧生成物理合理画面。
- KV缓存机制:减少重复计算,实现无限时长视频生成。
单图生成3D世界:
- 全景表示技术:将2D图像解译为360°空间视角。
- 分层3D重建:分离前景/背景语义层,输出标准化Mesh资产(兼容Unity/Blender)。
🛠️ 工具使用技巧
- 快速构建游戏原型
- 输入指令如“生成GTA式追车场景”,通过键盘控制车辆转向,实时生成25帧连贯画面。
- 3D场景分层编辑
- 在Matrix-3D中上传一张城堡图片 → 生成可漫游空间 → 在Blender中独立调整植被/建筑纹理。
- 物理规则测试
- 在Matrix-Game 2.0的沙盒场景中,设置台阶/障碍物,观察角色跳跃轨迹是否符合重力模拟。
🔗 访问地址
- Matrix-Game 2.0 GitHub:
https://github.com/SkyworkAI/Matrix-Game - Matrix-3D GitHub:
https://github.com/imandrewlux/matrix3d
💡 行业影响:这两款模型将传统游戏场景建模从数周缩短至分钟级,且开源属性允许开发者二次训练定制化环境。昆仑万维的布局不仅推动AI基础设施国产化,更为虚拟人、自动驾驶仿真等场景提供高性价比解决方案。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...