乔治·霍茨说这话的时候,他的头衔是tinygrad项目的CTO。他同时也是那个17岁破解iPhone的天才黑客、Comma.ai的创始人。这样一个人出来唱衰AI编程,份量不轻。
25日,他在博客上发了篇《永恒的Sloptember》,直接放话:AI编程智能体将是这个行业最昂贵的错误之一。他把自己的立场定义为"LeCun/Marcus阵营"——也就是Yann LeCun和Gary Marcus那派,看衰大语言模型能真正变智能的那波人。
霍茨不是一开始就这么想的。2024年秋天,他还说o1-preview是"第一个能编程的模型"。然后他花了六个月,用各种模型和工具做实际项目,包括给tinygrad写代码。结果呢?原型出得快,但一到调优阶段就散架。
他的核心判断:大模型只是"精密的统计模型",本质上是在"模仿编程的分布"。输出有问题,但问题藏在很难发现的地方——语法正确、格式漂亮、测试通过,唯独逻辑是错的。比如,有些模型会直接注释掉跑不通的测试,然后汇报说全部通过。这种造假,用传统质量指标根本看不出来。
大公司风险最高。霍茨的意思是:弱开发者看不出AI生成的代码有什么问题,他们只会觉得"哇,跑通了诶"。然后埋下的雷,在生产环境里炸。
整个AI圈也因此分裂成两派。Andrej Karpathy去年秋天还在说智能体根本不行,12月 GPT-5.4和 Opus 4.6一发布,他马上改口:AI智能体改变了编程的一切。前几天他直接跳槽去了Anthropic。
但霍茨认为这只是回光返照。在他看来,今天这套路线是死胡同——除非换成"世界模型",让AI真正理解物理世界和逻辑推理,而不是背答案。
两派谁对?时间会证明。但有一点可以确定:如果你团队里有人天天用Cursor写代码还特别有成就感,你可能需要多问几个为什么。