ChatGPT 的图像生成能力迎来重大更新。4月21日,OpenAI 推出了 Images 2.0 模型,最大的亮点是:终于能正确生成文字了。
这个升级听起来简单,实际意义却不小。之前版本的 DALL-E 在图片里写字时,经常出现乱码、错字或者干脆胡写一通。你让它生成一张「OPENAI」的招牌,它可能给你拼成「OPSENAI」。现在 Images 2.0 彻底解决了这个问题。
技术圈的反应很快。实测视频在 X 上获得大量转发,有人用它生成带完整句子的海报,有人做出包含多语言标识的商业图。评论区不少设计师开始讨论:这会不会抢走 Canva 和 Figma 的部分生意?
对普通用户来说,这意味着门槛进一步降低。以前你要做一张带文字的宣传图,需要先 AI 生成底图,再手动用 Photoshop 加上文字。现在一句话就能搞定。
当然,争议也有。外媒指出,Images 2.0 仍然无法完美处理手写字体、长段落以及某些特殊字符。在测试中,中文渲染效果比英文稍差,笔画复杂的情况下偶尔会糊成一团。但相比之前,已经是好几个量级的提升。
这是 OpenAI 在多模态领域的又一次落子。ChatGPT 持续占据 AI 对话的头把交椅,Images 2.0 则补全了「图+文」的内容生产闭环。免费用户目前可以体验基础功能,付费用户有更高的生成额度。
图像生成这条赛道,正在变得越来越卷。Google 的 Imagen、Midjourney、Adobe Firefly 都在狂奔。OpenAI 这一步,至少在文字渲染这个具体场景上,暂时领先了半个身位。
正文完