PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌

作者：小编　日期：Apr.28.2026　点击数：　　

　　【新智元导读】被Google按了半年头，OpenAI终于祭出一记反杀。GPT Image 2上线小时，就登顶Arena文生图榜，领先Nano Banana 2达241分。Arena官方称，这是Image Arena文生图排行榜迄今最大的分差。

　　「没有任何模型曾以这种差距统治过Image Arena」，Arena官方表示。

　　「如果把DALL-E看作洞穴壁画，把Images 1.0视为古代艺术，那么Images 2.0就是文艺复兴」。

　　OpenAI在发布会开场中这样介绍Images 2.0，奥特曼更是将它称作跨代升级：

　　Google放出了Nano Banana。这个在Gemini里嵌入的图像生成模型，在C端瞬间引爆。

　　这一月底，奥特曼对全公司发了一份「红色警戒」（code red）的内部备忘录。

　　一直到4月21日，GPT Image 2上线，OpenAI这才实现反超，重新扳回一局。

　　但Chen在press briefing时拒绝公开承认它具体是扩散还是自回归架构。

　　外界普遍把它理解为「带推理规划的图像生成系统」：画之前先规划，再下笔。这正是GPT Image 2和上一代图像模型最大的不同。

　　画之前先想、画完自己检查、需要时联网搜索资料、一次能产出8张前后连贯的图。

　　OpenAI发布会现场演示：让GPT Image 2画一碗米饭，其中只有一粒米上写有模型名字。

　　具体到能力展示，OpenAI总裁Greg Brockman在自己的X账号上做了示范。

　　OpenAI官方API文档里那句「high-fidelity image inputs」（高保真图像输入），说的就是模型对原图细节的保留能力：输入端能精确读取褪色的、破损的、模糊的老照片细节，输出端才能重新渲染出清晰版。

　　第二个案例中，Brockman转发了用户@doodlestein的一组测试图：用同一个复杂提示词让GPT Image 2画一张数学解释图。

　　他评价说，即便是复杂提示词，GPT Image 2也能生成风格各异的图。

　　@doodlestein 测试GPT Image 2用同一个提示词画一张线性代数解释图。模型一口气画出4个完全不同的版本：同样是Mona Lisa+特征向量教学，每个版本的构图、配色、信息密度完全不同。

　　这个案例真正价值不在「能画数学图」，而是解决了过去两年中AI生图的一个重要的痛点：输出单一、变体可控性差。

　　GPT Image 2第一次让「一个prompt给我4个完全不同的方向」变成了产品级能力。

　　GPT Image 2 Thinking模式生成的manga风格漫画页：从一个简单提示词出发，模型保持角色一致性、铺出多格剧情。

　　高质量出图$0.21一张；ChatGPT Plus $20一个月，图像生成已经包含在PG电子套餐里。

　　GPT Image 2生成的photorealistic candid（写实抓拍）。海岸、阴天、复古车、胶片质感——这种过去要专业摄影师外拍+后期才能达到的视觉效果，现在API $0.21一张。OpenAI研究员Gabriel Goh说，photorealism是他对这个模型最兴奋的能力。

　　它们是2022年开启了整个AIGC视觉革命的开山祖师。三年后，被OpenAI自家的继承者，亲手送入历史。

　　图像不是装饰，是语言。一张好图做的事和一个好句子一样：选择、排列、揭示。

　　当然，也不是没有反方声音。ZDNet在实测中发现，GPT Image 2无法准确复刻品牌logo，连ZDNet自己的logo都被画歪了。

　　Google把推理塞进图像模型里。OpenAI把图像工具塞进推理模型里。242分Elo差距测的就是二者架构上的差异。

　　模型先思考再下笔，能搜索、能自检、能完成任务。它不是画笔，是会画画的助手。

　　GPT Image 2发布真正值得重视的，是图像生成走向「会思考」这件事本身。

　　当AI开始用「思考」来产出图像、视频、音频、代码，整个生成式AI的范式都会跟着发生变化。

　　去年12月，奥特曼在备忘录里敲下「code red」的时候，应该没想到五个月后会以这种方式回到Arena榜首。

　　但这次反杀的真正意义，可能不是OpenAI赢了Google，而是OpenAI改写了图像生成赛道的规则。

　　Google下一拳什么时候出？这个问题决定了2026下半年AI格局的走向。

　　而在那一拳挥出来之前，GPT Image 2会在Arena榜首坐多久，没人知道。

PG电子科技发展有限公司 | 专业数字记忆策展服务