Vidu

1年前发布 1,460 07

生数科技与清华大学联合发布的AI视频大模型

收录时间：

2025-03-13

打开网站

AI视频工具 # AI视频工具

Vidu

打开网站

产品介绍

Vidu是清华大学与生数科技于2024年4月联合发布的中国首个长时长、高一致性的视频生成大模型。基于自主研发的U-ViT架构（融合Diffusion与Transformer），Vidu支持一键生成16秒1080P高清视频，并具备多镜头切换、物理规律模拟、中国元素生成等独特能力。2024年7月全球上线后，Vidu用户数在20天内突破百万，累计生成视频超亿条。

适用人群

用户类型	应用场景示例
短视频创作者	快速生成创意剧情片段、特效转场
广告/影视公司	低成本制作分镜脚本、概念预览
教育机构	动态课件、历史场景复原
企业营销	产品演示视频、社交媒体热点内容

核心功能与技术实现

长视频生成（16秒）
• 技术原理：采用U-ViT架构，通过时空联合建模处理视频序列，解决传统模型帧间连贯性问题。
• 效果：生成视频首尾帧自然过渡，支持航拍视角转换、日夜变化等复杂场景。
多模态参考生视频
• 技术原理：基于检索增强生成（RAG），将用户上传的1-3张参考图与文本提示结合，通过跨模态对齐技术控制生成内容一致性。
• 案例：上传“故宫雪景图+苹果头人物”，生成动态环绕镜头视频。
中国元素理解
• 技术原理：训练数据融入熊猫、龙等文化符号，通过注意力机制强化特定对象生成。
• 示例：生成“弹吉他的熊猫”“水墨风格毒液”等创意内容。
物理世界模拟
• 技术原理：引入物理引擎约束，在扩散过程中加入光影、运动轨迹等先验知识。
• 效果：生成车辆颠簸、水流动态等符合真实物理规律的内容。
极速生成与低成本
• 技术升级：Vidu 2.0版本将4秒视频生成时间压缩至10秒，单次成本低至0.04元。

工具使用技巧

• 提示词公式：主体+场景+镜头语言+风格
• 示例：玻璃桌上的咖啡杯（主体），周围盛放鲜花（场景），俯拍镜头（镜头语言），莫奈印象派风格（风格）。
• 多图参考：上传人物+场景图，生成“特定角色在指定地点互动”的视频（如“李白在竹林饮酒”）。
• 运动控制：调整“运动幅度”参数（低/中/高），避免快速动作下的肢体扭曲。

访问地址

官网直达：https://www.vidu.studio
• 免费版：注册赠送80积分（可生成20条4秒视频）
• 高级功能：错峰模式无限生成、1080P高清输出、商业授权去水印

提示：Vidu的“参考生视频”功能可复刻历史人物（如李清照），结合剪辑工具制作爆款内容。尝试上传古风画像，输入人物微笑+镜头环绕等提示词，生成穿越千年的动态故事！

暂无评论

暂无评论...

Vidu

产品介绍

适用人群

核心功能与技术实现

工具使用技巧

访问地址

相关导航

秒创

万兴天幕

Vizard

Boba

可灵大模型

Sora

Pollo AI

Higgsfield

暂无评论