一、当修图变成对话
“去掉背景汽车,天空加云,再调亮整体”——过去需要Photoshop分图层操作的任务,现在只需对手机说一句话。谷歌在Pixel 10系列上推出的对话式AI编辑功能,将传统滑块操作彻底颠覆。通过Gemini模型的多模态理解能力,系统能解析模糊指令(如“修复老照片”)和复杂组合命令(如“消除反光+校正过曝+添加派对帽”)。
技术内核:
- 文生图重构:用户指令触发Gemini对原图进行生成式修补(generative inpainting),而非简单参数调整。例如“消除眩光”需识别光源物理特性,重建自然光影。
- 端云协同计算:基础优化由Tensor G5芯片本地处理(4-5秒响应),复杂生成任务(如换背景)调用云端算力。
- 连续指令流:支持追加指令微调效果,类似与大模型的迭代对话(“云再多些,调冷色调”)。
实测显示,对逆光人像说“修复死亡顶光”,AI不仅提亮面部,还同步修正了背景过曝区域的色彩断层——这种多目标协同优化,传统手动编辑需20分钟以上。

二、给AI编辑装上“说明书”
当AI能随意增减画面元素,如何区分真实与创作?谷歌同步推出的C2PA(内容来源和真实性联盟)凭证,在照片元数据中植入不可篡改的编辑记录。
运作机制:
- 全链路追踪:从快门按下开始记录设备型号、拍摄参数;若经AI编辑,追加操作类型(如“生成式填充”“对象移除”)。
- 分级标注:
- 基础计算摄影(多帧合成、HDR)标记为“算法优化”
- 生成式修改(添加云朵/移除物体)标记为“AI编辑”。
- 跨平台可视:在Google Photos详情页点击凭证图标,即可查看完整编辑树。
争议点在于:手机摄影是否还存在“原片”?Pixel 10的100倍变焦依赖AI补全细节,此类常规优化被归为“算法优化”,而添加趣味元素则属“AI编辑”。标准模糊可能引发用户认知混淆。
三、影像真实性
C2PA试图建立数字影像的“诚信协议”,但用户体验与真实性之间存在天然张力:
- 社交平台困境:当小红书自动显示“此图经AI编辑”,用户分享欲会否受挫?
- 新闻纪实红线:徕卡M11-P相机早前应用C2PA保障新闻真实性,但大众摄影更倾向“表达优先”。
谷歌产品经理Isaac Reynolds坦言:“标记不是为限制创作,而是防止恶意伪造(如往食物中P入蟑螂)。”
行业反思:苹果曾因坚持“照片即现实”拒绝AI编辑,最终向用户需求妥协;华为的“AI辅助构图”直接接管取景框,技术介入更彻底。这场博弈本质是工具理性与人文价值的对抗。
四、生态野心
谷歌正构建影像AI的闭环生态:
- 硬件层:Tensor G5芯片的TPU性能提升60%,支持本地运行Gemini Nano模型。
- 交互层:对话编辑(Photos)→实时指导(Camera Coach)→设备协同(Pixel Watch语音触发修图)。
- 服务层:未来或向第三方开放API,如Snapchat调用Gemini编辑引擎。
值得玩味的是,该功能初期独占Pixel 10系列,后续通过Feature Drop推旧款机型——用软件优势弥补硬件短板,正是谷歌对抗苹果的核心策略。
工具解放还是能力退化?
对话式编辑将专业后期民主化,但同时也削弱了手动调整的创作深度。当AI能一键实现“安塞尔·亚当斯式黑白效果”,摄影是更自由还是更趋同?技术终需回归本质:降低表达门槛,而非替代思考。随着C2PA标准普及,我们或许将重新定义何为“真实的影像记忆”。
体验谷歌AI影像生态 👉 https://photos.google.com/
数据来源:谷歌官方公告、The Verge、CNET实测报告(2025年8月)
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...