ChatGPT 图像生成大升级：文字渲染能力惊艳亮相

ChatGPT 的图像生成能力迎来重大更新。4月21日，OpenAI 推出了 Images 2.0 模型，最大的亮点是：终于能正确生成文字了。

这个升级听起来简单，实际意义却不小。之前版本的 DALL-E 在图片里写字时，经常出现乱码、错字或者干脆胡写一通。你让它生成一张「OPENAI」的招牌，它可能给你拼成「OPSENAI」。现在 Images 2.0 彻底解决了这个问题。

技术圈的反应很快。实测视频在 X 上获得大量转发，有人用它生成带完整句子的海报，有人做出包含多语言标识的商业图。评论区不少设计师开始讨论：这会不会抢走 Canva 和 Figma 的部分生意？

对普通用户来说，这意味着门槛进一步降低。以前你要做一张带文字的宣传图，需要先 AI 生成底图，再手动用 Photoshop 加上文字。现在一句话就能搞定。

当然，争议也有。外媒指出，Images 2.0 仍然无法完美处理手写字体、长段落以及某些特殊字符。在测试中，中文渲染效果比英文稍差，笔画复杂的情况下偶尔会糊成一团。但相比之前，已经是好几个量级的提升。

这是 OpenAI 在多模态领域的又一次落子。ChatGPT 持续占据 AI 对话的头把交椅，Images 2.0 则补全了「图+文」的内容生产闭环。免费用户目前可以体验基础功能，付费用户有更高的生成额度。

图像生成这条赛道，正在变得越来越卷。Google 的 Imagen、Midjourney、Adobe Firefly 都在狂奔。OpenAI 这一步，至少在文字渲染这个具体场景上，暂时领先了半个身位。

近期文章