百度自研视频生成模型“蒸汽机”推出手机网页版,支持一键生成电影级视频

AI快讯1天前发布 ai-tab
12 0

🎬 产品介绍

百度商业研发团队于2025年7月推出的蒸汽机(MuseSteamer) ,是首个登顶全球VBench I2V榜单(89.38分)的中文视频生成模型。此次上线的手机网页版彻底打通移动端创作闭环,用户访问即用、无需下载,将专业影视制作能力装进口袋💡

颠覆性亮点
✅ 中文语音还原度98%,方言也能精准拟合
✅ 告别“先画面后配音”,音画同步达毫秒级
✅ 8月上线双人对话生成,角色互动如真人实拍

百度自研视频生成模型“蒸汽机”推出手机网页版,支持一键生成电影级视频

👥 适用人群

用户类型典型场景举例
自媒体创作者短视频口播、剧情片段快速生成
电商运营商品动态广告一键制作
教育工作者知识点动画视频创作
企业营销团队品牌宣传片高效产出
影视工作室分镜预演与特效素材生成

🚀 核心功能与技术解析(按优先级排序)

  1. 音视频一体化生成
    ▶︎ 技术原理:基于Latent Multi Modal Planner(LMMP) 框架,自主规划角色身份、台词情感及互动逻辑,实现画面与音频的全局协同生成。
    ▶︎ 效果:环境音效、人物唇形、表情动作自然联动,中文语音细节还原度超98%。

  2. 电影级运镜控制
    ▶︎ 技术原理:采用3D VAE+FullAttention时空对齐算法,结合多目标强化学习反馈调优,预训练引入专业审美分级模型。
    ▶︎ 效果:支持推移/跟随/特写等专业镜头语言,Pro版可实现大师级运镜。

  3. 多角色对话生成(8月上线)
    ▶︎ 技术原理:通过安全沙盒与MCP协议连接多模态数据流,实现角色行为逻辑与语音节奏的跨模态协同。
    ▶︎ 效果:双人对话场景中,角色微表情、肢体互动真实如电影实拍。

  4. 物理规律模拟
    ▶︎ 技术原理:10亿级多源异构数据库训练,融入物理引擎约束条件。
    ▶︎ 效果:光影变化、物体运动符合现实规律(如自行车轨迹、汉堡挤压形变)。

  5. 多风格适配
    ▶︎ 技术原理:三级视频标签体系覆盖数百种场景类别,模型以标签为条件输入控制生成风格。
    ▶︎ 效果:写实电影/赛博朋克/复古胶片/动画风格精准切换。


💡 工具使用技巧

🔥 让视频更自然的3个秘籍

  1. 精准描述镜头语言
    范例
    镜头从咖啡拉花特写缓慢上移,露出微笑的咖啡师,背景虚化伴随研磨声渐强
    ✨ 效果:模型自动匹配运镜节奏与音效过渡

  2. 方言提示词增强真实感
    操作:在描述后标注 [四川话版],系统自动调用方言语音库生成方言配音

  3. 控制动作幅度关键词

    强度词适用场景
    轻微抖动手持物体特写
    大幅摆动舞蹈/运动场景
    渐变位移场景切换转场

🌐 访问地址

⏩ 立即体验百度绘想平台蒸汽机Turbo版
✨ 当前福利

  • Turbo版 限时免费公测(720P视频生成)
  • 8月上线 Lite/Pro/有声版,支持1080P电影画质及对话生成

随手试了张宠物图生成奔跑视频——小狗影子随步伐晃动,毛发飘动方向都超真实!果然吃透中文数据的AI就是懂细节~🐾


© 版权声明

相关文章

暂无评论

none
暂无评论...