
一、产品介绍
「寻光」是阿里达摩院视觉技术实验室研发的一站式AI视频创作平台,2024年7月于世界人工智能大会(WAIC)首发,旨在通过AI技术简化视频制作全流程,覆盖剧本生成、分镜设计到后期编辑。平台定位“更懂你的AI视频工作流”,目前已开放内测体验版。
开发团队 | 核心功能定位 | 上线时间 |
---|---|---|
阿里达摩院视觉实验室 | 视频编辑、角色控制、画质增强 | 2024年7月(内测中) |
二、适用人群
• 短视频创作者:快速生成对口型视频、变换风格吸引流量。
• 企业营销团队:制作广告片、产品演示视频,降低外包成本。
• 教育培训从业者:一键生成教学动画、课件素材。
• 影视/游戏开发者:精细化角色表情、姿态控制,提升制作效率。
三、核心功能与技术解析
AI口型控制
• 功能:输入文字或音频,自动生成与语音匹配的口型动画,支持本地配音上传优化效果。
• 技术原理:基于语音识别(ASR)和实时面部关键点生成算法,结合达摩院自研的多模态生成模型,实现毫秒级口型同步。目标消除与图层拆解
• 功能:框选视频中多余元素(如路人、车辆),AI自动修复背景。
• 技术原理:采用目标检测(YOLO系列算法)与图像修复(GAN对抗生成网络),实现无痕消除。视频风格化
• 功能:一键转换梵高、水墨、新海诚等9种艺术风格。
• 技术原理:基于风格迁移模型(如Neural Style Transfer),结合达摩院优化的轻量化渲染引擎,降低GPU算力需求。角色表情/姿态控制
• 功能:预设10种表情(点头、惊讶等),调整人物动作。
• 技术原理:通过3D人脸形变模型(3DMM)与骨骼绑定技术,实现高精度表情驱动。视频超分与插帧
• 功能(待上线):提升视频分辨率至4K、优化帧率流畅度。
• 技术原理:超分辨率重建(SRGAN)与光流法插帧技术,解决低画质视频卡顿问题。
四、实测使用技巧
- 口型优化:上传本地配音文件(非平台合成语音),可减少AI生成的机械感。
- 分片段处理:针对长视频,按10秒分段消除元素或调整风格,避免系统超时。
- 多风格混搭:先用“水墨风”生成背景,再叠加“浮世绘”角色,创造独特视觉效果。
- 表情叠加:对同一视频多次应用不同表情(如“点头”+“大笑”),增加表现力。
五、访问地址
• 官网入口:https://xunguang.com/solution
• 内测申请:每日赠送100光点(1次视频生成消耗10光点),支持功能优先体验。
结语:
「寻光」通过视频编辑垂类切入AI赛道,避开“文生视频”红海竞争,其精准的行业定位与阿里达摩院的视觉技术积累,或将成为国内AI视频工具的黑马。无论是个人创作者还是企业团队,都可借助其“低门槛+高精度”特性,释放创意生产力!
相关导航

阿里妈妈旗下智能文案工具「悉语」,基于AI技术实现电商文案智能生成与优化,支持多模态内容创作,助力品牌高效输出高转化营销内容,点击了解核心功能与使用技巧!

通义万相
阿里云通义万相2.1版本上线,免费开放AI视频生成与图像创作能力!揭秘核心技术、适用人群与实战技巧,助你轻松玩转多模态内容生成。

顽兔抠图
阿里巴巴推出的顽兔抠图工具,支持批量智能抠图、背景替换、多平台尺寸适配,免费高效解决电商设计难题,新手也能快速上手!

混元文生视频
腾讯混元大模型是由腾讯研发的大语言模型

抖音
抖音-记录美好生活

Hedra
AI对口型视频生成工具,单次可免费生成30秒的视频

魔搭GPT(ModelScopeGPT)
阿里达摩院推出的大小模型协同的智能助手,具备作诗、绘画、视频生成、语音播放等多模态能力

Imgcook
阿里巴巴推出的智能化设计稿转代码工具
暂无评论...