苹果把20B参数AI塞进iPhone:不用联网,数据永不离开手机

4次阅读

6月8日WWDC上,苹果发布了第三代 Apple Foundation Models(AFM 3)。最大的一个亮点:一颗200亿参数的AI模型,能在你的iPhone上完全离线运行。

这不是云端处理,是真真切切跑在本地。

苹果怎么做到的?答案是"稀疏架构"——每次请求只激活10到40亿参数,而不是全量运行200亿。这就像一台油电混合车,平时用小电机省电,需要的时候才启动大电机。苹果把这种设计称为"按需分配",既保证了性能,又不至于把电池榨干。

几个关键数据:

(1) 语音听写满意度从17.6%飙升到44.7%,几乎翻了近三倍
(2) 文字处理偏好度从8.7%跳到64.7%,提升近8倍
(3) 语音质量评分(MOS)达到4.15-4.24分,比上一代高出0.28-0.42分

这意味着什么?你的iPhone现在能理解更复杂的指令,生成更准确的文字,甚至离线状态下也能完成大多数AI任务。

但有个问题:不是所有iPhone都能用。200亿参数模型需要苹果最新最强的芯片——大概率是下一代A系列处理器,老机型用户只能用到3B参数的轻量版。

更有意思的是隐私这part。苹果反复强调:你的数据永远不会离开手机。即使需要调用云端处理,也是通过苹果的"私有云计算"框架,苹果自己都看不到你的数据。

当然,这里有个小细节:苹果云端最强的那颗"AFM 3 Cloud Pro"模型,其实是跑在Google Cloud的NVIDIA GPU上。Gemini也在训练过程中出了一份力——只是不参与实际推理。

说白了,苹果在借Google和NVIDIA的力气,但最后落在你手机上的,还是那个"数据不外传"的承诺。

今年晚些时候,iOS 26正式推送后,用户会用脚投票:本地跑的AI,真的能和ChatGPT或者双子座掰掰手腕吗?

正文完
 0