
一、产品介绍
「寻光」是阿里达摩院视觉技术实验室研发的一站式AI视频创作平台,2024年7月于世界人工智能大会(WAIC)首发,旨在通过AI技术简化视频制作全流程,覆盖剧本生成、分镜设计到后期编辑。平台定位“更懂你的AI视频工作流”,目前已开放内测体验版。
开发团队 | 核心功能定位 | 上线时间 |
---|---|---|
阿里达摩院视觉实验室 | 视频编辑、角色控制、画质增强 | 2024年7月(内测中) |
二、适用人群
• 短视频创作者:快速生成对口型视频、变换风格吸引流量。
• 企业营销团队:制作广告片、产品演示视频,降低外包成本。
• 教育培训从业者:一键生成教学动画、课件素材。
• 影视/游戏开发者:精细化角色表情、姿态控制,提升制作效率。
三、核心功能与技术解析
AI口型控制
• 功能:输入文字或音频,自动生成与语音匹配的口型动画,支持本地配音上传优化效果。
• 技术原理:基于语音识别(ASR)和实时面部关键点生成算法,结合达摩院自研的多模态生成模型,实现毫秒级口型同步。目标消除与图层拆解
• 功能:框选视频中多余元素(如路人、车辆),AI自动修复背景。
• 技术原理:采用目标检测(YOLO系列算法)与图像修复(GAN对抗生成网络),实现无痕消除。视频风格化
• 功能:一键转换梵高、水墨、新海诚等9种艺术风格。
• 技术原理:基于风格迁移模型(如Neural Style Transfer),结合达摩院优化的轻量化渲染引擎,降低GPU算力需求。角色表情/姿态控制
• 功能:预设10种表情(点头、惊讶等),调整人物动作。
• 技术原理:通过3D人脸形变模型(3DMM)与骨骼绑定技术,实现高精度表情驱动。视频超分与插帧
• 功能(待上线):提升视频分辨率至4K、优化帧率流畅度。
• 技术原理:超分辨率重建(SRGAN)与光流法插帧技术,解决低画质视频卡顿问题。
四、实测使用技巧
- 口型优化:上传本地配音文件(非平台合成语音),可减少AI生成的机械感。
- 分片段处理:针对长视频,按10秒分段消除元素或调整风格,避免系统超时。
- 多风格混搭:先用“水墨风”生成背景,再叠加“浮世绘”角色,创造独特视觉效果。
- 表情叠加:对同一视频多次应用不同表情(如“点头”+“大笑”),增加表现力。
五、访问地址
• 官网入口:https://xunguang.com/solution
• 内测申请:每日赠送100光点(1次视频生成消耗10光点),支持功能优先体验。
结语:
「寻光」通过视频编辑垂类切入AI赛道,避开“文生视频”红海竞争,其精准的行业定位与阿里达摩院的视觉技术积累,或将成为国内AI视频工具的黑马。无论是个人创作者还是企业团队,都可借助其“低门槛+高精度”特性,释放创意生产力!
相关导航

生数科技与清华大学联合发布的AI视频大模型

Vozo
集一键重写脚本、配音、对口型、翻译于一体的AI视频编辑工具

Dream Machine
Luma推出的AI视频生成工具,120秒内可生成120帧视频

阿里云AI学习路线
阿里云AI学习平台是阿里云面向开发者与企业推出的技术赋能体系,依托自研通义大模型家族(如Qwen-7B/14B)及灵骏智能算力集群,提供从理论学习到行业落地的全链路支持。

CodeFuse
蚂蚁集团推出的AI编程助手

通义星尘
用AI定制属于你自己的IP角色

白日梦
白日梦AI是一款领先的文生视频类AIGC创作平台

阿里巴巴M6
阿里达摩院研发,是国内首个商业化落地的超大规模多模态AI模型,参数规模高达10万亿
暂无评论...