苹果把20B参数AI塞进iPhone：不用联网，数据永不离开手机

6月8日WWDC上，苹果发布了第三代 Apple Foundation Models（AFM 3）。最大的一个亮点：一颗200亿参数的AI模型，能在你的iPhone上完全离线运行。

这不是云端处理，是真真切切跑在本地。

苹果怎么做到的？答案是"稀疏架构"——每次请求只激活10到40亿参数，而不是全量运行200亿。这就像一台油电混合车，平时用小电机省电，需要的时候才启动大电机。苹果把这种设计称为"按需分配"，既保证了性能，又不至于把电池榨干。

几个关键数据：

(1) 语音听写满意度从17.6%飙升到44.7%，几乎翻了近三倍
(2) 文字处理偏好度从8.7%跳到64.7%，提升近8倍
(3) 语音质量评分（MOS）达到4.15-4.24分，比上一代高出0.28-0.42分

这意味着什么？你的iPhone现在能理解更复杂的指令，生成更准确的文字，甚至离线状态下也能完成大多数AI任务。

但有个问题：不是所有iPhone都能用。200亿参数模型需要苹果最新最强的芯片——大概率是下一代A系列处理器，老机型用户只能用到3B参数的轻量版。

更有意思的是隐私这part。苹果反复强调：你的数据永远不会离开手机。即使需要调用云端处理，也是通过苹果的"私有云计算"框架，苹果自己都看不到你的数据。

当然，这里有个小细节：苹果云端最强的那颗"AFM 3 Cloud Pro"模型，其实是跑在Google Cloud的NVIDIA GPU上。Gemini也在训练过程中出了一份力——只是不参与实际推理。

说白了，苹果在借Google和NVIDIA的力气，但最后落在你手机上的，还是那个"数据不外传"的承诺。

今年晚些时候，iOS 26正式推送后，用户会用脚投票：本地跑的AI，真的能和ChatGPT或者双子座掰掰手腕吗？

近期文章