谷歌 Nano Banana 火了!重构 AI 修图逻辑,Veo 3 限时免费狂掀创作热潮

AI快讯9小时前发布 ai-tab
0 0

最近AI创作圈里藏不住两个“狠角色”:Nano Banana靠“改图不崩脸”和快速多步编辑,直接把传统修图流程掀了个底朝天,还拿了LMArena盲测冠军;另一边谷歌趁热开放Veo 3免费体验,8秒就能生成带音效的视频。今天咱们就扒透这俩工具的技术硬实力,再教你怎么用它们高效出活。

一、Nano Banana:把“修图难”变成“一句话的事”

用过PS的人都懂,想改个发色得调蒙版、抠发丝,改完表情又得重调光影,步骤绕得人头疼——但Nano Banana偏要把这事变简单。你上传照片后,直接输“把发色改成蜜桃粉,表情换成咧嘴笑”,它8步就能出结果,速度比PS快了足足10倍。

最绝的是它“认人”:不管你改十次还是二十次,人物嘴角的弧度、瞳孔里的高光都不会变。这背后是它用3D建模重新搭了光影逻辑,彻底解决了AI修图“越改越不像本人”的老毛病。

在LMArena平台500万次盲测里,它赢了GPT-4o和Flux Kontext整整92%的次数。有用户说“改完的图像同一台相机拍的,完全看不出是修的”,电商圈更是靠它实现了“零棚拍”:以前4个人花3天修的素人图,现在用它换背景、调服装材质,1小时就能搞定。

它的技术厉害在哪?不是靠滤镜堆效果,而是真能“理解”图像:

  • 改光影时会按物理规律来:比如你说“给房间开灯”,它不只是叠个发光层,连茶几的影子都会跟着新光源转方向,比简单加亮真实多了;
  • 能精准“摘”主体:拿毕业合照说,你要“生成两个人的专属合影”,它能直接把这俩人提出来重搭场景,不像别的AI还会把无关的人留在图里;
  • 细节控到能过“证件照标准”:测试时连耳朵露出的比例、瞳孔反光点的位置,都符合国际护照要求,不会出现AI常犯的“眼睛不对称”“耳朵少一块”的错。

二、Veo 3:AI视频终于不用“东拼西凑”了

这边Nano Banana重构静态修图,谷歌转头就放了Veo 3的免费福利:从现在到太平洋时间8月24日晚上10点,所有Gemini用户都能免费生成3段视频——这可是首个能让音画天生同步的AI视频工具。

你输一句“老水手盯着暴风雨里的大海”,Veo 3不只会生成海浪翻涌的画面,还会给水手配对口型的独白,再混上海浪声和风声,不用你再单独找音效。它的物理引擎也够强,布料飘动感、液体溅起来的样子都很真实,甚至能一次性输出“侦探审橡皮鸭”这种脑洞剧情的分镜。

以前做视频有多麻烦,现在用Veo 3就有多爽:

任务类型传统操作Veo 3操作
8秒短视频拍素材+剪片子,最少3小时输指令等20秒
多镜头分镜手绘故事板,得花1天一句指令出4个版本
音效合成单独找音效、混音,2小时自动匹配环境声

现在手机端Gemini App就能用,点“视频”选项就能生成720p短片。不过要注意:免费用户只能用3次,Pro用户每天也限3次,超了会自动降到Veo 2引擎。

三、这俩工具一火,行业都在变

“现在客户开口就问‘能不能用Nano Banana那种风格修图’”,一位做了十年的修图师跟我吐槽。但他也没慌,现在让AI做基础修图,自己只优化皮肤质感这种细节,效率上去后,反而能接更多高价的创意活。

整个行业的生态都在重构:

  • 基础岗少了:证件照精修、商品图抠图这些活,需求直接降了70%,有些电商公司干脆把初级修图团队撤了;
  • 创意岗忙疯了:广告公司现在用AI批量出10种风格的方案,设计师只需要挑着优化。之前有个咖啡品牌做海报,团队不用再抠细节,把时间都花在想“怎么用画面讲咖啡的故事”上;
  • 新职业冒出来了:“AI虚拟网红经纪人”成了香饽饽,他们用Nano Banana给虚拟模特出上千张穿搭图,既能保持人设统一,还不怕模特违约。

当然它们也有短板:Nano Banana改广告牌上的文字时容易出错,Veo 3对非英语指令支持不太好。不过谷歌已经用C2PA凭证标注AI生成内容,也算给伦理问题留了个解决方向。

四、零门槛上手:两步就能用起来

▶ 用Nano Banana修图

  1. 先去https://lmarena.ai/ ,上传你要改的图,然后输英文指令——比如想做护照照,就写“convert to passport photo with ear visibility”(生成耳朵可见的护照照);
  2. 系统会随机匹配模型出图,要是看到结果里发丝的光影分层特自然,那大概率就是Nano Banana出的活;
  3. 想玩得更专业,就去https://console.cloud.google.com/vertex-ai/studio ,调用gemini-2.5-flash-image-preview模型。

▶ 抢Veo 3免费名额

  1. 打开Gemini App,点输入框右边的「···」,就能找到视频工具;
  2. 输场景描述,比如“两只猫在东京霓虹小巷里打拳击,配合成器浪潮音乐”(two cats boxing in neon-lit Tokyo alley with synthwave music);
  3. 等20秒左右就能拿到带音效的视频,导出后直接能适配TikTok、YouTube Shorts的竖屏格式。

👉 想立刻试的话,直接戳链接:https://gemini.google.com/app | https://lmarena.ai/

五、当AI帮你搞定技术,剩下的就是“敢想”

有个用Nano Banana做手办设计的朋友说:“以前建个模要两周,现在两分钟就能出图。”其实AI现在做的,就是把“怎么实现”的技术活接过去,让咱们能专心想“要做什么”。

比如有人会把咖啡杯的光影,用到星空摄影里;有人给证件照修图时,会特意保留人物微微皱眉的细节——这些“跨着想”和“抓小情绪”的能力,才是现在创作的核心。

谷歌其实早有打算,以后要把Nano Banana和Veo 3拼成一条“Flow视频管线”:先用AI出海报,再转成视频,最后补帧扩剧情。有个独立导演已经靠这招把分镜成本从几百万压到了几千块,他说“终于敢拍科幻处女作了”。

现在想想,当改图比按快门还容易,我们要纠结的可能不是“真不真实”,而是“有没有温度”。就像那位修图师说的:“把AI当助手,不是当对手,才能让作品有别人抄不走的感觉。”

© 版权声明
trae-字节旗下AI代码助手

相关文章

暂无评论

头像
none
暂无评论...