PG电子科技发展有限公司 | 专业数字记忆策展服务

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌

作者:小编 日期:Apr.28.2026 点击数:  

  【新智元导读】被Google按了半年头,OpenAI终于祭出一记反杀。GPT Image 2上线小时,就登顶Arena文生图榜,领先Nano Banana 2达241分。Arena官方称,这是Image Arena文生图排行榜迄今最大的分差。

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图1)

  「没有任何模型曾以这种差距统治过Image Arena」,Arena官方表示。

  「如果把DALL-E看作洞穴壁画,把Images 1.0视为古代艺术,那么Images 2.0就是文艺复兴」。

  OpenAI在发布会开场中这样介绍Images 2.0,奥特曼更是将它称作跨代升级:

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图2)

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图3)

  Google放出了Nano Banana。这个在Gemini里嵌入的图像生成模型,在C端瞬间引爆。

  这一月底,奥特曼对全公司发了一份「红色警戒」(code red)的内部备忘录。

  一直到4月21日,GPT Image 2上线,OpenAI这才实现反超,重新扳回一局。

  但Chen在press briefing时拒绝公开承认它具体是扩散还是自回归架构。

  外界普遍把它理解为「带推理规划的图像生成系统」:画之前先规划,再下笔。这正是GPT Image 2和上一代图像模型最大的不同。

  画之前先想、画完自己检查、需要时联网搜索资料、一次能产出8张前后连贯的图。

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图4)

  OpenAI发布会现场演示:让GPT Image 2画一碗米饭,其中只有一粒米上写有模型名字。

  具体到能力展示,OpenAI总裁Greg Brockman在自己的X账号上做了示范。

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图5)

  OpenAI官方API文档里那句「high-fidelity image inputs」(高保真图像输入),说的就是模型对原图细节的保留能力:输入端能精确读取褪色的、破损的、模糊的老照片细节,输出端才能重新渲染出清晰版。

  第二个案例中,Brockman转发了用户@doodlestein的一组测试图:用同一个复杂提示词让GPT Image 2画一张数学解释图。

  他评价说,即便是复杂提示词,GPT Image 2也能生成风格各异的图。

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图6)

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图7)

  @doodlestein 测试GPT Image 2用同一个提示词画一张线性代数解释图。模型一口气画出4个完全不同的版本:同样是Mona Lisa+特征向量教学,每个版本的构图、配色、信息密度完全不同。

  这个案例真正价值不在「能画数学图」,而是解决了过去两年中AI生图的一个重要的痛点:输出单一、变体可控性差。

  GPT Image 2第一次让「一个prompt给我4个完全不同的方向」变成了产品级能力。

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图8)

  GPT Image 2 Thinking模式生成的manga风格漫画页:从一个简单提示词出发,模型保持角色一致性、铺出多格剧情。

  高质量出图$0.21一张;ChatGPT Plus $20一个月,图像生成已经包含在PG电子套餐里。

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图9)

  GPT Image 2生成的photorealistic candid(写实抓拍)。海岸、阴天、复古车、胶片质感——这种过去要专业摄影师外拍+后期才能达到的视觉效果,现在API $0.21一张。OpenAI研究员Gabriel Goh说,photorealism是他对这个模型最兴奋的能力。

  它们是2022年开启了整个AIGC视觉革命的开山祖师。三年后,被OpenAI自家的继承者,亲手送入历史。

  图像不是装饰,是语言。一张好图做的事和一个好句子一样:选择、排列、揭示。

  当然,也不是没有反方声音。ZDNet在实测中发现,GPT Image 2无法准确复刻品牌logo,连ZDNet自己的logo都被画歪了。

  Google把推理塞进图像模型里。OpenAI把图像工具塞进推理模型里。242分Elo差距测的就是二者架构上的差异。

  模型先思考再下笔,能搜索、能自检、能完成任务。它不是画笔,是会画画的助手。

  GPT Image 2发布真正值得重视的,是图像生成走向「会思考」这件事本身。

  当AI开始用「思考」来产出图像、视频、音频、代码,整个生成式AI的范式都会跟着发生变化。

  去年12月,奥特曼在备忘录里敲下「code red」的时候,应该没想到五个月后会以这种方式回到Arena榜首。

  但这次反杀的真正意义,可能不是OpenAI赢了Google,而是OpenAI改写了图像生成赛道的规则。

PG电子奥特曼「红色警戒」5个月后GPTImage2屠榜断层领先反杀谷歌(图10)

  Google下一拳什么时候出?这个问题决定了2026下半年AI格局的走向。

  而在那一拳挥出来之前,GPT Image 2会在Arena榜首坐多久,没人知道。