阿里腾讯同日出牌:两款AI「世界模型」意味着什么?

8次阅读

2026年4月16日,腾讯和阿里在同一天各自发布了一款「世界模型」产品。腾讯推出开源混元3D世界模型2.0(HY-World 2.0),阿里发布主打实时交互的HappyOyster。

这背后,是中国科技巨头在AI新赛道上的正面交锋。Meta前首席AI科学家杨立昆说过:「三到五年内,世界模型将取代大语言模型成为主流AI架构。」这话在硅谷得罪了不少人,但也让「世界模型」这个词真正进入了大众讨论。

为什么大语言模型有盲区

你可能已经习惯用ChatGPT写文案、做数据分析。但有没有发现,它在涉及真实物理世界的问题上经常「一本正经地胡说八道」?

原因在于:大语言模型本质是在语言空间里找规律。它知道「玻璃杯掉到地上会碎」,是因为这个句子在训练数据里出现过无数次,而不是因为它真的理解了弹性、应力和冲击能量。对它来说,「重力」只是一个高频词汇,不是可推广的物理规律。

这种缺陷在聊天、写作任务里问题不大。但让AI控制机器人取东西、让自动驾驶预判路况、让游戏NPC做出真实行为——语言建模的框架从根本上就不适合处理这些。

世界模型在做什么

世界模型的核心区别:预测的不是「下一个词」,而是「下一个状态」。

它构建的是对物理现实的内部表征。物体会怎么移动、动作会引发什么连锁反应、光线在不同材质表面视角移动后如何变化——这些问题,语言模型给不了真实答案,但世界模型可以。

腾讯HY-World 2.0是开源3D世界模型,阿里HappyOyster主打实时交互。两家路线不同,目标一致:让AI真正理解世界运作规律,而不只是堆砌语言符号。

普通人什么时候能用上

目前这些产品主要面向开发者和企业。但技术成熟后下沉到消费端的速度,往往超预期。

想想大语言模型从发布到嵌入日常应用的过程。世界模型的普及路径很可能类似:先是开发者工具,然后是企业解决方案,最后是你手机上的AI助手变得更「懂」你。

腾讯开源HY-World 2.0这个动作值得关注。开源意味着全球开发者都能参与改进,技术迭代速度会大幅加快。你现在用的某款AI产品,可能过不了多久就会悄悄升级「世界理解」能力。

这不是遥远的未来。这是正在发生的现在。

正文完
 0