苹果洽谈采用谷歌 Gemini AI 以升级 Siri，同时开发自研AI模型。

33 0

一、为何双轨并行成必选项？

2025年8月，苹果主动向谷歌抛出合作邀约，探讨定制Gemini模型作为新版Siri核心引擎的可能性。知情人士透露，谷歌已启动适配苹果私有云服务器的模型训练，确保数据流严格遵循苹果的隐私计算框架。但谈判仍处早期阶段——苹果同时保留着“Plan B”：内部同步开发代号Linwood的自研模型与代号Glenwood的第三方技术方案。

这种矛盾策略背后是残酷的现实压力。原定2025年春季发布的Siri升级因工程难题被迫推迟一年，核心障碍在于上下文理解与全语音操控两大功能迟迟无法突破。项目受挫直接导致AI负责人John Giannandrea调离，改由软件工程副总裁Craig Federighi与Vision Pro负责人Mike Rockwell接管。

更棘手的是人才流失。7月，基础模型团队首席架构师Ruoming Pang携多名核心成员跳槽Meta，后者开出2亿美元薪酬筹码。内部动荡迫使苹果重新评估技术路线："全自研虽能深度整合硬件，但追赶速度可能错过窗口期"，一位接近决策层的匿名人士如是说。

二、自研模型能否逆袭？

苹果的自研技术并非停滞不前。2025年技术报告披露了两大突破：

端云协同架构：30亿参数端侧模型通过键值缓存共享（KV Cache Sharing） 降低37.5%内存占用，响应延迟缩短40%；云端采用并行轨道混合专家（PT-MoE） 架构，将大型模型拆解为并行计算单元，突破通信瓶颈。
多模态进化：新发布的MM1.5模型支持300亿参数规模，专攻UI界面理解与视频分析。其寄存器-窗口机制可同时捕捉图像全局语境与局部细节，未来或用于Siri的屏幕操作指令解析。

但在关键指标上仍存差距。苹果服务器模型（1500亿参数）在MMLU测试中落后GPT-4o约15个百分点，而谷歌Gemini已实现多模态实时摘要——例如解析视频内容生成会议纪要，这正是Siri升级的目标场景。

三、Gemini的诱惑与代价

谷歌的吸引力显而易见。Gemini在安卓设备上已展示跨模态推理能力：用户拍摄超市货架照片，助手自动比价并推荐健康替代品。这种场景化服务正是苹果对“主动式Siri”的构想。

但合作暗藏三重风险：

商业依赖：若采用Gemini，苹果需向谷歌支付技术授权费，重演“默认搜索引擎”支付模式——后者正遭美国司法部反垄断调查，年费高达百亿美元。
数据主权：谈判焦点在于模型部署形式。苹果要求Gemini必须运行于私有云计算（Private Cloud Compute） 服务器，使用苹果自研芯片处理数据，严防用户行为泄露。
生态冲突：谷歌将Gemini设为安卓默认助手，若同时驱动Siri，可能导致跨平台体验同质化，削弱苹果差异化优势。

此前苹果与Anthropic的谈判就因财务条款破裂。消息人士称，Anthropic要求预付20亿美元研发资金加分成条款，远超苹果心理预期。

四、2026年的三种可能

混合方案：基础指令由Linwood模型处理，复杂查询路由至Gemini。类似iOS 26中ChatGPT的后备调用机制，但需解决上下文无缝切换问题。
分阶段替换：2026年春季先推出Gemini版Siri过渡，同步加速自研模型迭代。苹果万亿参数模型已开始内部测试，但消费级部署尚无时间表。
完全自研：高管团队仍倾向此路径。端云架构通过2比特量化感知训练（QAT） 压缩模型体积，配合低秩适配器（LoRA） 恢复精度损失，技术可行性正在验证。