谷歌为Pixel 10系列手机相册推对话式AI图片编辑功能，还将引入标注功能。

124 0

一、当修图变成对话

“去掉背景汽车，天空加云，再调亮整体”——过去需要Photoshop分图层操作的任务，现在只需对手机说一句话。谷歌在Pixel 10系列上推出的对话式AI编辑功能，将传统滑块操作彻底颠覆。通过Gemini模型的多模态理解能力，系统能解析模糊指令（如“修复老照片”）和复杂组合命令（如“消除反光+校正过曝+添加派对帽”）。

技术内核：

文生图重构：用户指令触发Gemini对原图进行生成式修补（generative inpainting），而非简单参数调整。例如“消除眩光”需识别光源物理特性，重建自然光影。
端云协同计算：基础优化由Tensor G5芯片本地处理（4-5秒响应），复杂生成任务（如换背景）调用云端算力。
连续指令流：支持追加指令微调效果，类似与大模型的迭代对话（“云再多些，调冷色调”）。

实测显示，对逆光人像说“修复死亡顶光”，AI不仅提亮面部，还同步修正了背景过曝区域的色彩断层——这种多目标协同优化，传统手动编辑需20分钟以上。

二、给AI编辑装上“说明书”

当AI能随意增减画面元素，如何区分真实与创作？谷歌同步推出的C2PA（内容来源和真实性联盟）凭证，在照片元数据中植入不可篡改的编辑记录。

运作机制：

全链路追踪：从快门按下开始记录设备型号、拍摄参数；若经AI编辑，追加操作类型（如“生成式填充”“对象移除”）。
分级标注：
- 基础计算摄影（多帧合成、HDR）标记为“算法优化”
- 生成式修改（添加云朵/移除物体）标记为“AI编辑”。
跨平台可视：在Google Photos详情页点击凭证图标，即可查看完整编辑树。

争议点在于：手机摄影是否还存在“原片”？Pixel 10的100倍变焦依赖AI补全细节，此类常规优化被归为“算法优化”，而添加趣味元素则属“AI编辑”。标准模糊可能引发用户认知混淆。

三、影像真实性

C2PA试图建立数字影像的“诚信协议”，但用户体验与真实性之间存在天然张力：

社交平台困境：当小红书自动显示“此图经AI编辑”，用户分享欲会否受挫？
新闻纪实红线：徕卡M11-P相机早前应用C2PA保障新闻真实性，但大众摄影更倾向“表达优先”。
谷歌产品经理Isaac Reynolds坦言：“标记不是为限制创作，而是防止恶意伪造（如往食物中P入蟑螂）。”

行业反思：苹果曾因坚持“照片即现实”拒绝AI编辑，最终向用户需求妥协；华为的“AI辅助构图”直接接管取景框，技术介入更彻底。这场博弈本质是工具理性与人文价值的对抗。

四、生态野心

谷歌正构建影像AI的闭环生态：

硬件层：Tensor G5芯片的TPU性能提升60%，支持本地运行Gemini Nano模型。
交互层：对话编辑（Photos）→实时指导（Camera Coach）→设备协同（Pixel Watch语音触发修图）。
服务层：未来或向第三方开放API，如Snapchat调用Gemini编辑引擎。

值得玩味的是，该功能初期独占Pixel 10系列，后续通过Feature Drop推旧款机型——用软件优势弥补硬件短板，正是谷歌对抗苹果的核心策略。

工具解放还是能力退化？

对话式编辑将专业后期民主化，但同时也削弱了手动调整的创作深度。当AI能一键实现“安塞尔·亚当斯式黑白效果”，摄影是更自由还是更趋同？技术终需回归本质：降低表达门槛，而非替代思考。随着C2PA标准普及，我们或许将重新定义何为“真实的影像记忆”。

体验谷歌AI影像生态 ? https://photos.google.com/

数据来源：谷歌官方公告、The Verge、CNET实测报告（2025年8月）

AI快讯

文章版权归作者所有，未经允许请勿转载。

谷歌为Pixel 10系列手机相册推对话式AI图片编辑功能，还将引入标注功能。

一、当修图变成对话

二、给AI编辑装上“说明书”

三、影像真实性

四、生态野心

工具解放还是能力退化？

马斯克宣布xAI开源Grok 2.5模型，并计划半年后开源Grok 3模型。

DeepSeek-V3.1登陆火山方舟，企业用户免注册免费体验，支持低延迟高效处理。

相关文章

苹果宣布投资6000亿美元在美扩产，招聘2万人，首批合作包括康宁等

紫光发10款龙芯芯片打印机，两款首发2P0300并推AI平台

马斯克称谷歌在AI领域领先，但未来几年领先优势或改变

上交大与深势科技联合发布全球首个通用科研智能体 SciMaster

暂无评论

热门文章