谷歌为Pixel 10系列手机相册推对话式AI图片编辑功能,还将引入标注功能。

AI快讯1天前发布 ai-tab
4 0

一、当修图变成对话

“去掉背景汽车,天空加云,再调亮整体”——过去需要Photoshop分图层操作的任务,现在只需对手机说一句话。谷歌在Pixel 10系列上推出的对话式AI编辑功能,将传统滑块操作彻底颠覆。通过Gemini模型的多模态理解能力,系统能解析模糊指令(如“修复老照片”)和复杂组合命令(如“消除反光+校正过曝+添加派对帽”)。

技术内核

  • 文生图重构:用户指令触发Gemini对原图进行生成式修补(generative inpainting),而非简单参数调整。例如“消除眩光”需识别光源物理特性,重建自然光影。
  • 端云协同计算:基础优化由Tensor G5芯片本地处理(4-5秒响应),复杂生成任务(如换背景)调用云端算力。
  • 连续指令流:支持追加指令微调效果,类似与大模型的迭代对话(“云再多些,调冷色调”)。

实测显示,对逆光人像说“修复死亡顶光”,AI不仅提亮面部,还同步修正了背景过曝区域的色彩断层——这种多目标协同优化,传统手动编辑需20分钟以上。

Pixel 10系列手机相册对话式AI图片编辑功能

二、给AI编辑装上“说明书”

当AI能随意增减画面元素,如何区分真实与创作?谷歌同步推出的C2PA(内容来源和真实性联盟)凭证,在照片元数据中植入不可篡改的编辑记录。

运作机制

  1. 全链路追踪:从快门按下开始记录设备型号、拍摄参数;若经AI编辑,追加操作类型(如“生成式填充”“对象移除”)。
  2. 分级标注
    • 基础计算摄影(多帧合成、HDR)标记为“算法优化”
    • 生成式修改(添加云朵/移除物体)标记为“AI编辑”。
  3. 跨平台可视:在Google Photos详情页点击凭证图标,即可查看完整编辑树。

争议点在于:手机摄影是否还存在“原片”?Pixel 10的100倍变焦依赖AI补全细节,此类常规优化被归为“算法优化”,而添加趣味元素则属“AI编辑”。标准模糊可能引发用户认知混淆。


三、影像真实性

C2PA试图建立数字影像的“诚信协议”,但用户体验与真实性之间存在天然张力:

  • 社交平台困境:当小红书自动显示“此图经AI编辑”,用户分享欲会否受挫?
  • 新闻纪实红线:徕卡M11-P相机早前应用C2PA保障新闻真实性,但大众摄影更倾向“表达优先”。
    谷歌产品经理Isaac Reynolds坦言:“标记不是为限制创作,而是防止恶意伪造(如往食物中P入蟑螂)。”

行业反思:苹果曾因坚持“照片即现实”拒绝AI编辑,最终向用户需求妥协;华为的“AI辅助构图”直接接管取景框,技术介入更彻底。这场博弈本质是工具理性与人文价值的对抗


四、生态野心

谷歌正构建影像AI的闭环生态:

  • 硬件层:Tensor G5芯片的TPU性能提升60%,支持本地运行Gemini Nano模型。
  • 交互层:对话编辑(Photos)→实时指导(Camera Coach)→设备协同(Pixel Watch语音触发修图)。
  • 服务层:未来或向第三方开放API,如Snapchat调用Gemini编辑引擎。

值得玩味的是,该功能初期独占Pixel 10系列,后续通过Feature Drop推旧款机型——用软件优势弥补硬件短板,正是谷歌对抗苹果的核心策略


工具解放还是能力退化?

对话式编辑将专业后期民主化,但同时也削弱了手动调整的创作深度。当AI能一键实现“安塞尔·亚当斯式黑白效果”,摄影是更自由还是更趋同?技术终需回归本质:降低表达门槛,而非替代思考。随着C2PA标准普及,我们或许将重新定义何为“真实的影像记忆”。

体验谷歌AI影像生态 👉 https://photos.google.com/

数据来源:谷歌官方公告、The Verge、CNET实测报告(2025年8月)

© 版权声明
trae-字节旗下AI代码助手

相关文章

暂无评论

none
暂无评论...