Vidu

3周前发布 3 07

生数科技与清华大学联合发布的AI视频大模型

收录时间:
2025-03-13
ViduVidu
Vidu

产品介绍

Vidu是清华大学与生数科技于2024年4月联合发布的中国首个长时长、高一致性的视频生成大模型。基于自主研发的U-ViT架构(融合Diffusion与Transformer),Vidu支持一键生成16秒1080P高清视频,并具备多镜头切换、物理规律模拟、中国元素生成等独特能力。2024年7月全球上线后,Vidu用户数在20天内突破百万,累计生成视频超亿条。


适用人群

用户类型应用场景示例
短视频创作者快速生成创意剧情片段、特效转场
广告/影视公司低成本制作分镜脚本、概念预览
教育机构动态课件、历史场景复原
企业营销产品演示视频、社交媒体热点内容

核心功能与技术实现

  1. 长视频生成(16秒)
    技术原理:采用U-ViT架构,通过时空联合建模处理视频序列,解决传统模型帧间连贯性问题。
    效果:生成视频首尾帧自然过渡,支持航拍视角转换、日夜变化等复杂场景。

  2. 多模态参考生视频
    技术原理:基于检索增强生成(RAG),将用户上传的1-3张参考图与文本提示结合,通过跨模态对齐技术控制生成内容一致性。
    案例:上传“故宫雪景图+苹果头人物”,生成动态环绕镜头视频。

  3. 中国元素理解
    技术原理:训练数据融入熊猫、龙等文化符号,通过注意力机制强化特定对象生成。
    示例:生成“弹吉他的熊猫”“水墨风格毒液”等创意内容。

  4. 物理世界模拟
    技术原理:引入物理引擎约束,在扩散过程中加入光影、运动轨迹等先验知识。
    效果:生成车辆颠簸、水流动态等符合真实物理规律的内容。

  5. 极速生成与低成本
    技术升级:Vidu 2.0版本将4秒视频生成时间压缩至10秒,单次成本低至0.04元。


工具使用技巧

提示词公式主体+场景+镜头语言+风格
• 示例:玻璃桌上的咖啡杯(主体),周围盛放鲜花(场景),俯拍镜头(镜头语言),莫奈印象派风格(风格)
多图参考:上传人物+场景图,生成“特定角色在指定地点互动”的视频(如“李白在竹林饮酒”)。
运动控制:调整“运动幅度”参数(低/中/高),避免快速动作下的肢体扭曲。


访问地址

官网直达:https://www.vidu.studio
免费版:注册赠送80积分(可生成20条4秒视频)
高级功能:错峰模式无限生成、1080P高清输出、商业授权去水印


提示:Vidu的“参考生视频”功能可复刻历史人物(如李清照),结合剪辑工具制作爆款内容。尝试上传古风画像,输入人物微笑+镜头环绕等提示词,生成穿越千年的动态故事!

相关导航

暂无评论

none
暂无评论...