一、为何双轨并行成必选项?
2025年8月,苹果主动向谷歌抛出合作邀约,探讨定制Gemini模型作为新版Siri核心引擎的可能性。知情人士透露,谷歌已启动适配苹果私有云服务器的模型训练,确保数据流严格遵循苹果的隐私计算框架。但谈判仍处早期阶段——苹果同时保留着“Plan B”:内部同步开发代号Linwood的自研模型与代号Glenwood的第三方技术方案。
这种矛盾策略背后是残酷的现实压力。原定2025年春季发布的Siri升级因工程难题被迫推迟一年,核心障碍在于上下文理解与全语音操控两大功能迟迟无法突破。项目受挫直接导致AI负责人John Giannandrea调离,改由软件工程副总裁Craig Federighi与Vision Pro负责人Mike Rockwell接管。
更棘手的是人才流失。7月,基础模型团队首席架构师Ruoming Pang携多名核心成员跳槽Meta,后者开出2亿美元薪酬筹码。内部动荡迫使苹果重新评估技术路线:"全自研虽能深度整合硬件,但追赶速度可能错过窗口期",一位接近决策层的匿名人士如是说。

二、自研模型能否逆袭?
苹果的自研技术并非停滞不前。2025年技术报告披露了两大突破:
- 端云协同架构:30亿参数端侧模型通过键值缓存共享(KV Cache Sharing) 降低37.5%内存占用,响应延迟缩短40%;云端采用并行轨道混合专家(PT-MoE) 架构,将大型模型拆解为并行计算单元,突破通信瓶颈。
- 多模态进化:新发布的MM1.5模型支持300亿参数规模,专攻UI界面理解与视频分析。其寄存器-窗口机制可同时捕捉图像全局语境与局部细节,未来或用于Siri的屏幕操作指令解析。
但在关键指标上仍存差距。苹果服务器模型(1500亿参数)在MMLU测试中落后GPT-4o约15个百分点,而谷歌Gemini已实现多模态实时摘要——例如解析视频内容生成会议纪要,这正是Siri升级的目标场景。
三、Gemini的诱惑与代价
谷歌的吸引力显而易见。Gemini在安卓设备上已展示跨模态推理能力:用户拍摄超市货架照片,助手自动比价并推荐健康替代品。这种场景化服务正是苹果对“主动式Siri”的构想。
但合作暗藏三重风险:
- 商业依赖:若采用Gemini,苹果需向谷歌支付技术授权费,重演“默认搜索引擎”支付模式——后者正遭美国司法部反垄断调查,年费高达百亿美元。
- 数据主权:谈判焦点在于模型部署形式。苹果要求Gemini必须运行于私有云计算(Private Cloud Compute) 服务器,使用苹果自研芯片处理数据,严防用户行为泄露。
- 生态冲突:谷歌将Gemini设为安卓默认助手,若同时驱动Siri,可能导致跨平台体验同质化,削弱苹果差异化优势。
此前苹果与Anthropic的谈判就因财务条款破裂。消息人士称,Anthropic要求预付20亿美元研发资金加分成条款,远超苹果心理预期。
四、2026年的三种可能
- 混合方案:基础指令由Linwood模型处理,复杂查询路由至Gemini。类似iOS 26中ChatGPT的后备调用机制,但需解决上下文无缝切换问题。
- 分阶段替换:2026年春季先推出Gemini版Siri过渡,同步加速自研模型迭代。苹果万亿参数模型已开始内部测试,但消费级部署尚无时间表。
- 完全自研:高管团队仍倾向此路径。端云架构通过2比特量化感知训练(QAT) 压缩模型体积,配合低秩适配器(LoRA) 恢复精度损失,技术可行性正在验证。
五、AI竞赛重构硬件生态
这场升级牵动更广的硬件布局。知情人士透露,苹果正在开发集成新Siri的桌面机器人与智能家居屏,计划2026年面世。若采用第三方模型,这些设备的云端API调用成本将倍增。
更深层的博弈在于标准制定。苹果坚持设备端处理敏感数据(如健康记录、位置信息),仅将通用查询移交云端。这与谷歌“全云端优先”策略形成根本冲突——若Gemini无法适应此框架,合作可能搁浅。
库克的胜负手
“我们必须在AI领域获胜”,蒂姆·库克在内部会议上强调。尽管苹果惯于后发制人,但生成式AI的窗口期正在收窄。双轨战略本质是风险对冲:Gemini提供即时战斗力,自研模型守护长期掌控力。2026年春季的发布不仅是技术升级,更是苹果能否守住“体验护城河”的试金石。
👉 探索Apple Intelligence技术细节:https://machinelearning.apple.com/research/apple-foundation-models-tech-report-202501/
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...