GPT Image 1.5 全面實測:被 Nano Banana Pro 吊打!

就在今天,OpenAI 終於把它的 GPT Image 1.5 抬上來了!

說實話,在 Nano Banana Pro(以下簡稱 NBP)已經強到“殺瘋了”的今天,我甚至是帶著一種“挑刺”的心態點開更新的:

OpenAI,你這次到底能不能行?

是能一舉奪回王座,還是像上次一樣“發佈會猛如虎,實測二百五”?

話不多說,我肝了一個通宵,直接上號,殘酷實測走起。

精準修圖,誰更聽話?

大家玩 AI 繪圖最頭疼的是什麼?肯定是“一改就廢”。明明只想給小姐姐換個髮型,結果圖一出來,臉都給換了,這誰受得了?

OpenAI 的宣傳片倒是吹得很神:指那打那,完美保留角色形象。但這畢竟是“買家秀”,實際上手效果如何?

為了不冤枉它,我特地隨機選了一個路人人物做測試。


圖:測試用素材圖

先來個最簡單的:換髮型

提示詞:基於這張圖片,將人物的髮型改為齊肩的紅棕色波波頭(Bob頭)。請務必保留頭髮被風吹起的動態效果和陽光照射在頭髮上的強烈高光。人物的面部表情、衣服、姿勢和背景需完全保持不變。

GPT 跑出來的第一張圖,乍一看還真不錯:人物沒變,衣服沒變,髮型也確實換成了波波頭,看著挺自然。

但俗話說得好,不怕不識貨,就怕貨比貨。

我們拉出隔壁的 NBP 來跑同樣的詞:

圖:對比圖

坦率講,把兩張圖放在我的 4K 大屏上一對比,差距瞬間就出來了:

  • GPT 這邊: 臉部光影明顯偏暗,甚至出現了肉眼可見的色斑(這是什麼鬼?),皮膚質感有點髒。
  • NBP 這邊: 皮膚通透,頭髮上的高光處理得非常細膩,明顯贏麻了。

第一局結論: 雖然 GPT 聽懂了指令,但在畫質和光影細節上,NBP 依然略勝一籌。

多圖一致性,二哈能拆家嗎?

再來試個更有難度的:換裝 + 多圖融合。

提示詞:將人物身上的藍色條紋襯衫取代為一件米白色的亞麻質地休閒西裝外套,內搭一件白色圓領T恤。保持她倚靠欄杆的姿勢不變。新的衣物上需要有符合當前強烈側光照明的自然褶皺和陰影。人物頭部和背景保持不變。

我試著給人物換了套衣服,GPT 的表現依然穩定,形象保持得很好。

但在光影邏輯上,還是老毛病——有點“平”。

不過這裡 NBP把原圖的道具給搞丟了……

接著,我開始給它上點難度了:多圖融合。

我找了兩張女生圖和一張動物圖,要求它們融合在一起。

圖:多圖融合示例


圖:多圖融合對比

不得不承認,這個環節我更喜歡 GPT。

它的融合能力簡直驚豔,整張圖片的質感非常像一張真實的電影劇照,那種“無聊和疲憊”的氛圍感拿捏得死死的。

而 NBP 這邊……怎麼說呢?它的背景單一了點,但實際上它更好的遵循了提示詞,沙發凌亂,連狗都是疲憊的。

現在,加入調皮的二哈試試。

提示詞:保持這兩位女士和動物的姿勢、表情完全不變。在背景中加入幾隻正在瘋狂拆家的哈士奇,它們正在撕咬沙發靠墊和跑來跑去,讓場面看起來極其混亂。

這個部分我更喜歡 NBP了,GPT 加入的二哈過於瘋狂,感覺有點失真。

但他們在多輪編輯中,都很好的延續了之前的形象和風格。

既然融合能力不錯,那拿來做電影海報怎麼樣?

我讓它設計一張 1950 年代好萊塢風格的電影海報,標題叫《THE ALGORITHM》(演算法)。

效果直接驚豔到我了:

圖:英文海報

利用這三張圖片(兩張女生和一張動物),製作一張 1950 年代好萊塢黃金時期的電影海報。

電影標題: 海報上方用復古的大寫襯線體展示電影名為 "THE ALGORITHM" (演算法)。

角色設定: 將兩位女生設計為經典的黑色電影(Film Noir)女主角,穿著優雅的絲綢晚禮服,波浪捲發。將那隻動物設計為她們神秘的同伴,脖子上戴著鑽石項圈。

演職員表: 在底部加入演職員文字:

Starring: The Neural Sisters (左) & The Beast (右)

Directed by: Sam Altman

Produced by: OpenAI Studios

風格: 手繪海報質感,強烈的明暗對比(Chiaroscuro),略帶褪色的特藝彩色(Technicolor)色調。

不得不說,這海報挺有感覺的,但似乎人物形像已經對不上了。而且,這個尺度怎麼突然提升了。

用中文發現,不僅尺度小了,字幾乎是災難。。(這個後面具體講)

圖:GPT 的中文海報

變態指令遵循,誰腦子更好使?

GPT Image 1.5 有很強的指令遵循能力。

來給它一點難度:6x6 網格挑戰。

這非常考驗 AI 的邏輯理解能力。我要求它嚴格按照 6 行 6 列的格式,每一個格子裡畫出指定的東西(比如菠蘿、宇航員、Wi-Fi圖示等)。

提示詞:畫一個 6x6 的網格 建立一個 6 列 x 6 行的網格,網格內容如下:第一排:希臘字母Ω、一個熱氣球、菠蘿、宇航員、水晶球、變色龍 第二排:一隻蜘蛛、老式懷錶、淋浴噴頭、望遠鏡、一隻孔雀、一張藏寶圖 第三行:一枚紀念幣、一面圓鏡子、一杯冒熱氣的咖啡、“希望”一詞、滑板、字母K 第四排:洗衣機、遊樂園代幣、Wi-Fi圖示、一支口紅、螳螂、棒球帽 第五行:電源圖示、數字8、紅色鑽石、樂高積木人、火烈鳥、維京頭盔 第6行:一隻橘貓、滅火器、一個錨、遊戲手把、捲紙、數字88

除了中文,它做得的確完美。

看看 NBP,雖然中文對了。但這那裡是 6x6 宮格?

數學是體育老師教的嗎?格局完全亂了。

圖:NBP 生成的 6 宮格

這一局:GPT 險勝,贏在邏輯,輸在中文。

真正的硬傷是文字

大家都知道,NBP 幾乎徹底的解決了文字難題,不論中英文。

OpenAI 也不甘示弱,給了一個非常複雜的多字的案例,但其實 NBP 設定完整得更好。

圖:文書處理對比

而換成中文,GPT 就是個災難,不過這點官方自己是承認的。

圖:GPT Image 1.5 的中文處理

換成 NBP,那幾乎是吊打。

圖:NBP 的中文處理

即便是簡單點的中文,GPT 也無法勝任。

圖:GPT Image 1.5 的中文處理

NBP 幾乎完美。

圖:NBP 的中文處理

NBP 讓資訊圖流行了起來,OpenAI 也提供了類似案例。

但不論從效果還是從文書處理,GPT 都是被按在地上摩擦的。

圖:資訊圖對比

除了升級了圖片功能之外,OpenAI 還新增了一個類似於“範本”的功能,選擇某個範本,然後再選一張自己的圖片,就可以生成這個範本對應的風格。

圖:GPT 提供範本選擇

通過固定一些常用的風格,很方便那些不想到處找提示詞或者不會寫提示詞的朋友。

最終結論:這就是一場單方面的“碾壓”

測到這,我不裝了,直接攤牌:GPT Image 1.5 目前全面落後於 Nano Banana Pro。

雖然在剛才的某些特定 Case 裡(比如那個瘋狂的二哈),GPT 偶爾能靈光一閃,但這阻擋不了它整體被 NBP 甩在身後的事實。

為什麼這麼說?除了前面看到的這些,NBP 還有很多讓創作者無法拒絕的“殺手鐧”,比如:

  • 畫質硬傷: NBP 早就支援 2K、4K 直出了,而 GPT Image 1.5 居然還在 1K 解析度裡玩泥巴。這對於要幹活的人來說,簡直是致命傷。
  • 資訊差優勢: NBP 可以結合聯網搜尋,直接生成帶即時資料的資訊圖,這點 GPT 目前完全做不到。

至於大家關心的速度……官方發佈會吹噓說“速度快了 4 倍”。

我實測跑了一個通宵,說實話,完全沒感覺到。體感上甚至比 NBP 還要慢一點。

OpenAI 這波“畫餅”,我給負分。

當然,它也不是一無是處。

它唯一讓我覺得“真香”的功能,是多工並行——前一張圖還在轉圈圈,我可以立馬發下一條指令,不用乾等著。

這一點,NBP 確實該學學(NBP 目前只能單線程排隊)。

現在的 GPT Image 1.5 給我的感覺,更像是一個氣喘吁吁跟在 NBP 屁股後面追趕的“優等生”,早已不是那個曾經引領時代的“神”了。

(其實 GPT 5.2 追趕 Gemini 3 Pro 也類似)

所以,我的建議很直接:

如果你是普通玩家: 想嘗鮮,可以玩玩。

如果你要幹活、出圖、接商單: 請老老實實續費 Nano Banana Pro,它依然是目前的最佳選擇。

OpenAI 這一波?還得回爐再練練。 (AI范兒)