阿里通义APP上线形象自定义功能,可自由设定AI助手形象、声音等。

AI快讯8小时前发布 ai-tab
0 0

最近刷到不少人晒通义APP的新玩法——它悄悄上线了形象自定义功能!不用复杂操作,就能给AI助手换模样、克隆自己的声音,甚至设定专属人设,攒出一个独一份的AI分身。光基础音色就有20多种,连人物设定都能让AI帮忙写,这下跟AI互动终于不只是“对着冰冷界面说话”了。

一、功能亮点:从看着顺眼到听着舒心,全维度都能自定义

1. 视觉形象:想让助手变啥样,一句话或一张图就行

打开通义APP首页,点一下AI助手的头像,就能进编辑界面。不管你喜欢真实感还是创意风,都能找到适配的方式:

  • 传张照片就行:不管是自己的自拍、喜欢的宠物图,还是随手拍的小物件,上传后系统会自动调整,让它变成适合当助手形象的样子;
  • 按风格生成:用的是通义万相ACE模型,你说“赛博朋克风”“水墨古风”,甚至“像宫崎骏动画里的角色”,它就能生成对应风格的头像;
  • 玩趣味模板:之前“局部风格化”里的针织、陶瓷模板能直接用,给助手加层毛绒绒的质感,或者做成冰雕一样的纹理,特别有意思。
    之前我还想过,能不能让助手变敦煌飞天的样子?或者cos一次钢铁侠?现在根本不用琢磨技术,说一句描述就搞定了。

2. 声音定制:20+音色可选,5分钟克隆自己的声线

声音库的选择也很全,邻家女孩的清甜、俊朗青年的沉稳、温柔姐姐的语调……光基础音色就有20多种。更有意思的是AI声音克隆功能:

  • 你录5分钟自己的声音(别背景杂音太大,语速稳一点),就能生成一个跟你音色超像的复刻版;
  • 还能调语调,比如把原本冷静的陈述,改成活泼的反问,跟朋友聊天似的。
    据技术团队说,这功能用了新一代的Fun-ASR语音模型,靠它的端到端识别能力,克隆出来的声音跟日常对话的节奏特别像,不会有“机械感”。

3. 人设定制:两种方式,AI帮写或自己定义

做人设也不用费脑,两种方式怎么方便怎么来:

  1. 自己写提示词:比如给AI起名“王教授”,加性格标签“严谨但爱开玩笑”,再备注“不聊政治话题”,边界感自己定;
  2. 让AI帮忙写:你说“生成一个懂历史的学者人设”,系统会自动帮你搭知识背景——比如熟悉唐宋史、说话带点文言韵味,连互动规则都会一起定好。
    就像有个懂宋词的AI助手,早上可能会给你推“昨夜雨疏风骤”的典故,还会跟你聊两句李清照的词。其实人设的小细节,就决定了跟AI互动时的那种“温度感”。

二、技术底座:多模态融合玩出了新花样

为啥这些功能用着这么顺?背后其实是技术在“撑腰”。

1. ACE架构:让图像编辑变简单

形象生成的流畅度,全靠通义万相的ACE图片编辑模型。它最厉害的两点是:

  • 能懂“抽象要求”:比如你说“给建筑穿件毛衣”,它能精准把针织纹理贴到建筑结构上,连窗户、墙角的细节都能照顾到,跟像素级操作似的;
  • 不用会专业工具:不用你学ControlNet这种复杂软件,说句大白话——比如“把头像做成油画质感,颜色暖一点”,它就能搞定。

2. 声音克隆的“进化”:吵环境也能录,响应快

新一代的Fun-ASR模型做了优化,就算在有点吵的环境里录声音,识别准确率也能到95%以上,能给克隆提供“干净”的音源。而且用了分布式WebSockets架构,语音通话时响应快到以毫秒算,不会有“卡顿感”。


三、用户玩疯了:从趣味互动到真·情感陪伴

这功能上线才48小时,用户就玩出了好多有意思的花样,社交平台上都传开了:

1. 创意玩法:跨时空聊天、分身社交都实现了

  • “跨时空对话”:有人克隆孔子的声音讲《论语》,还有人让梵高画里的人物“活过来”,聊向日葵是怎么画的;
  • “分身代劳”:传自己的自拍生成“数字分身”,有时候忙不过来,让它帮着接亲友的电话,或者代做简单的会议发言;
  • IP二创:给动漫角色做专属声音库,比如让“柯南”的声音分析案发现场,玩出互动剧场的感觉。

2. 不只是好玩:还能当“情感小助手”

做企业管理的李琳分享过她的用法:给团队定制了一个“激励型助手”,设成登山教练的样子,声音听着就特有力气。团队成员报进度的时候,AI会自动说“比上次快了两分钟,继续冲!”——原来冷冰冰的KPI,因为这种正向反馈,突然变得有温度了。


四、行业都在关注:AI助手从“工具”变“伙伴”了

以前的AI助手,大多是帮着查天气、设提醒的“工具”,但通义这次的形象自定义,好像让AI往“情感化伙伴”的方向走了一大步。

1. 角色升级:记住你的偏好,越用越“懂你”

  • 人设记忆库会慢慢学你的喜好,比如你喜欢聊电影,它会慢慢调整互动风格,跟你聊新片的时候更对味;
  • 既有视觉形象,又有语音反馈,能激活大脑的镜像神经元,跟它互动的时候,会觉得“更真实”,不像对着机器说话。

2. 企业服务有了新想法

技术团队说,现在金融、教育行业已经在测这个功能了:

  • 银行想让客户经理的“数字分身”24小时在线,随时给用户做理财咨询;
  • 教育机构打算克隆名师的形象和声音,录播课也能有“面对面上课”的沉浸感,学生听课不会觉得枯燥。

五、手把手教你:三步搞定专属AI助手

其实操作特别简单,三步就能弄好:

  1. 先搞形象:点首页的AI助手头像,要么传张你喜欢的图,要么输入风格描述(小技巧:说“电影光影感”“莫兰迪配色”这种词,出来的效果会更有艺术感);
  2. 再调声音:选现成的音色,或者录5分钟自己的声音克隆(记得找安静的地方,语速别太快);
  3. 最后定人设:可以说“帮我写一个游戏主播的人设”,系统会出草案,你再改改细节——比如加个“擅长讲冷笑话”的设定,它回答的时候会突然冒个笑点,很惊喜。

想试试的话,直接点链接就能体验:https://tongyi.aliyun.com/


© 版权声明
trae-字节旗下AI代码助手

相关文章

暂无评论

头像
none
暂无评论...