GPT Image 1.5 全面實測：被 Nano Banana Pro 吊打！

2025/12/17

•

就在今天，OpenAI 終於把它的 GPT Image 1.5 抬上來了！

說實話，在 Nano Banana Pro（以下簡稱 NBP）已經強到“殺瘋了”的今天，我甚至是帶著一種“挑刺”的心態點開更新的：

OpenAI，你這次到底能不能行？

是能一舉奪回王座，還是像上次一樣“發佈會猛如虎，實測二百五”？

話不多說，我肝了一個通宵，直接上號，殘酷實測走起。

精準修圖，誰更聽話？

大家玩 AI 繪圖最頭疼的是什麼？肯定是“一改就廢”。明明只想給小姐姐換個髮型，結果圖一出來，臉都給換了，這誰受得了？

OpenAI 的宣傳片倒是吹得很神：指那打那，完美保留角色形象。但這畢竟是“買家秀”，實際上手效果如何？

為了不冤枉它，我特地隨機選了一個路人人物做測試。

先來個最簡單的：換髮型

提示詞：基於這張圖片，將人物的髮型改為齊肩的紅棕色波波頭（Bob頭）。請務必保留頭髮被風吹起的動態效果和陽光照射在頭髮上的強烈高光。人物的面部表情、衣服、姿勢和背景需完全保持不變。

GPT 跑出來的第一張圖，乍一看還真不錯：人物沒變，衣服沒變，髮型也確實換成了波波頭，看著挺自然。

但俗話說得好，不怕不識貨，就怕貨比貨。

我們拉出隔壁的 NBP 來跑同樣的詞：

坦率講，把兩張圖放在我的 4K 大屏上一對比，差距瞬間就出來了：

GPT 這邊：臉部光影明顯偏暗，甚至出現了肉眼可見的色斑（這是什麼鬼？），皮膚質感有點髒。
NBP 這邊：皮膚通透，頭髮上的高光處理得非常細膩，明顯贏麻了。

第一局結論：雖然 GPT 聽懂了指令，但在畫質和光影細節上，NBP 依然略勝一籌。

多圖一致性，二哈能拆家嗎？

再來試個更有難度的：換裝 + 多圖融合。

提示詞：將人物身上的藍色條紋襯衫取代為一件米白色的亞麻質地休閒西裝外套，內搭一件白色圓領T恤。保持她倚靠欄杆的姿勢不變。新的衣物上需要有符合當前強烈側光照明的自然褶皺和陰影。人物頭部和背景保持不變。

我試著給人物換了套衣服，GPT 的表現依然穩定，形象保持得很好。

但在光影邏輯上，還是老毛病——有點“平”。

不過這裡 NBP把原圖的道具給搞丟了……

接著，我開始給它上點難度了：多圖融合。

我找了兩張女生圖和一張動物圖，要求它們融合在一起。

不得不承認，這個環節我更喜歡 GPT。

它的融合能力簡直驚豔，整張圖片的質感非常像一張真實的電影劇照，那種“無聊和疲憊”的氛圍感拿捏得死死的。

而 NBP 這邊……怎麼說呢？它的背景單一了點，但實際上它更好的遵循了提示詞，沙發凌亂，連狗都是疲憊的。

現在，加入調皮的二哈試試。

提示詞：保持這兩位女士和動物的姿勢、表情完全不變。在背景中加入幾隻正在瘋狂拆家的哈士奇，它們正在撕咬沙發靠墊和跑來跑去，讓場面看起來極其混亂。

這個部分我更喜歡 NBP了，GPT 加入的二哈過於瘋狂，感覺有點失真。

但他們在多輪編輯中，都很好的延續了之前的形象和風格。

既然融合能力不錯，那拿來做電影海報怎麼樣？

我讓它設計一張 1950 年代好萊塢風格的電影海報，標題叫《THE ALGORITHM》（演算法）。

效果直接驚豔到我了：

利用這三張圖片（兩張女生和一張動物），製作一張 1950 年代好萊塢黃金時期的電影海報。

電影標題：海報上方用復古的大寫襯線體展示電影名為 "THE ALGORITHM" (演算法)。

角色設定：將兩位女生設計為經典的黑色電影（Film Noir）女主角，穿著優雅的絲綢晚禮服，波浪捲發。將那隻動物設計為她們神秘的同伴，脖子上戴著鑽石項圈。

演職員表：在底部加入演職員文字：

Starring: The Neural Sisters (左) & The Beast (右)

Directed by: Sam Altman

Produced by: OpenAI Studios

風格：手繪海報質感，強烈的明暗對比（Chiaroscuro），略帶褪色的特藝彩色（Technicolor）色調。

不得不說，這海報挺有感覺的，但似乎人物形像已經對不上了。而且，這個尺度怎麼突然提升了。

用中文發現，不僅尺度小了，字幾乎是災難。。（這個後面具體講）

變態指令遵循，誰腦子更好使？

GPT Image 1.5 有很強的指令遵循能力。

來給它一點難度：6x6 網格挑戰。

這非常考驗 AI 的邏輯理解能力。我要求它嚴格按照 6 行 6 列的格式，每一個格子裡畫出指定的東西（比如菠蘿、宇航員、Wi-Fi圖示等）。

提示詞：畫一個 6x6 的網格建立一個 6 列 x 6 行的網格，網格內容如下：第一排：希臘字母Ω、一個熱氣球、菠蘿、宇航員、水晶球、變色龍第二排：一隻蜘蛛、老式懷錶、淋浴噴頭、望遠鏡、一隻孔雀、一張藏寶圖第三行：一枚紀念幣、一面圓鏡子、一杯冒熱氣的咖啡、“希望”一詞、滑板、字母K 第四排：洗衣機、遊樂園代幣、Wi-Fi圖示、一支口紅、螳螂、棒球帽第五行：電源圖示、數字8、紅色鑽石、樂高積木人、火烈鳥、維京頭盔第6行：一隻橘貓、滅火器、一個錨、遊戲手把、捲紙、數字88

除了中文，它做得的確完美。

看看 NBP，雖然中文對了。但這那裡是 6x6 宮格？

數學是體育老師教的嗎？格局完全亂了。