商汤推出AI剧组工具Seko，支持全流程视频生成，仅需中文描述

1,159 0

一、产品介绍

商汤科技2025年8月正式推出的Seko短片创作Agent，定位为“个人创作者的AI剧组”。不同于传统剪辑软件或单点AI工具，Seko通过自然语言理解技术，将中文描述自动转化为包含剧本、分镜、画面、配音的完整视频，真正实现“描述即成片”。其最大突破在于解决了多镜头间角色、场景的一致性难题，让非专业用户也能产出连贯的剧情短片。

开发者背景：
背靠商汤科技的多模态大模型技术矩阵，集成文生图、图生视频、口型对齐（Seko Talk）等十余项生成能力，形成端到端的创作闭环。

二、适用人群：谁需要这个工具？

人群类型	典型场景举例	核心价值
个人创作者	短视频博主、二创爱好者	单人完成剧本到成片，降低人力成本
企业营销团队	产品广告、品牌故事短片	快速生成多版方案，降本增效
动画工作室	分镜预览、角色设定测试	缩短前期策划周期
教育/知识分享者	教学动画、科普视频	零技术门槛实现可视化表达

三、核心功能与技术原理拆解

按使用流程优先级排序的六大核心能力：

自然语言→全剧本生成（无需Prompt）
- 功能：输入中文描述（如“Labubu在西班牙餐厅跳舞”），自动生成包含分镜、对白、音乐风格的完整剧本。
- 原理：Agent系统解析语义→拆解为故事类型/角色/场景元素→调用多模块协同输出结构化脚本。
多镜头角色一致性控制
- 功能：确保角色在连续镜头中服饰、表情、光影统一，避免“变脸”问题。
- 原理：基于参考生图+跨帧驱动技术，通过首尾帧对齐和材质复用锁定特征。
Seko Talk口型同步引擎
- 功能：支持中/英/日语等12种语言的口型精准匹配，卡通/真人/动物皆适用。
- 原理：音素级对齐模型 + 面部肌肉模拟算法，实现“说话即演戏”效果。
一体化镜头编辑器
- 功能：直接修改成片中的分镜元素（如动作、台词、背景色），实时渲染效果。
- 操作：所见即所得编辑，支持单镜头替换/复制/参数联动。
AI配乐与音效生成
- 功能：根据剧情自动匹配BGM风格（如“弗拉明戈融合乐”），支持自定义情绪标签。
- 原理：音乐情绪图谱分析 + 乐器元素库组合生成。
多主体协同生成
- 功能：上传自定义角色（如IP形象Labubu），系统自动识别特征并贯穿全片。
- 操作：上传图片→AI生成主体描述→绑定到分镜。

四、底层技术原理：Agent驱动的创作流水线

Seko的革命性突破在于工作流重构：

graph LR
A[中文描述] --> B(Agent任务拆解)
B --> C1[剧本分镜生成]
B --> C2[角色一致性调度]
B --> C3[场景光影建模]
C1 --> D[多模态模型协同]
C2 --> D
C3 --> D
D --> E[成片编辑器]

Agent中枢系统：将用户描述解析为创作任务，调度文生图/图生视频/口型对齐等模块协作；
一致性建模技术：通过跨镜头特征绑定（Cross-frame Binding）确保角色、场景的连贯性；
多模型热切换：根据需求自动切换模型（如卡通转真人风格），无需手动调整参数。

五、工具使用技巧：专业级创作指南

5.1 高效生成秘诀

描述公式：“角色+场景+冲突+情绪”
例：“复古朋克少女驾驶飞机穿越蒸汽波云层，追逐落日，悲壮感” → 生成《蒸汽纪元：迷幻少女飞行物语》

快速修正指令：

“镜头2：Labubu增加红色蝴蝶结”  
“背景音乐切换为电子摇滚”

5.2 进阶功能活用

多语言混合生成：中文剧本 + 英语对白 + 日语配音同步输出；
风格移植：上传参考图→指定“应用此画风到全部镜头”；
分镜预演模式：生成低精度草稿→确认逻辑→一键转高清成片。

六、访问地址与资源

? 官网直达：https://seko.sensetime.com/invite/8V5PBA0H

新用户福利：注册即赠100创作积分（可生成3-5部短片）
教程库：官网提供Labubu/柯南二创等案例的完整分镜脚本下载

与其说Seko是工具，不如说它重新定义了“创作自由”。当技术壁垒消失，唯一限制你的只有想象力本身。

AI快讯

文章版权归作者所有，未经允许请勿转载。

马斯克xAI的Grok超37万条聊天记录及文件可被搜索引擎获取，引发隐私担忧。

AI快讯

11个月前

阿里云Tablestore推出AI Agent记忆存储：三大升级破解智能体开发效率瓶颈

AI快讯

11个月前

七牛智能股价强势上扬，七牛云率先集成OpenAI开源模型GPT-OSS

AI快讯

11个月前

OpenAI AI浏览器：无跳转交互+智能代理如何重塑网页体验

AI快讯

12个月前

暂无评论

暂无评论...

商汤推出AI剧组工具Seko，支持全流程视频生成，仅需中文描述

一、产品介绍

二、适用人群：谁需要这个工具？

三、核心功能与技术原理拆解

四、底层技术原理：Agent驱动的创作流水线