距離聖誕節還有一星期,奧特曼卻徹底放飛了!
今天凌晨,OpenAI 掌門人Sam Altman 提前為節慶氛圍來了一波火辣的暖身。
圖片裡,Sam Altman 化身肌肉猛男消防員,聖誕主題,半裸腹肌、油光閃閃,右手扛著水管,左手插兜……,配文簡單粗暴:「比如這樣玩……」(For example:)
一下子,整個X都炸鍋了,圍觀群眾直接攀升超百萬,甚至超過了Sam宣布推出ChatGPT Image 1.5 的主帖。 (ps:主貼文訪問是40多萬。)
百萬網友坐不住了,紛紛上手幫Sam穿衣服
看罷,網友也坐不住了,直呼辣眼睛,有的為奧特曼打圓場:說奧特曼終於受不了自己不是家族裡最帥的那位,有的則實在忍不了,乾脆上手,讓ChatGPT新推出的“Image”功能,為下面這張“奧特曼版節日消防員”穿上了T卹。
效果立竿見影。
連OpenAI 官方帳號也實在看不下去了,在下方弱弱回覆:「sam.」(就一個點,翻譯成中文就是「老哥你別這樣…」)
而Sam 的親弟弟也聞訊第一時間來表達自己的尷尬:老哥,你有毒吧!我不行了!
而OpenAI的另一個官方認證帳號「ChatGPT」也在幾個小時後趕來為老闆「遮羞羞」:別的不變,給他穿個shirt。
再來看網友們的替Sam「遮羞」的作品,prompt:讓他的T恤衫換成紅色——
一位推友則,索性生成了一張“穿了8層帶領襯衫的Sam”,來提醒Sam多穿點。
不過,有位網友倒是比Sam本人還放得開,乾脆徹底放飛吧,直接讓ChatGPT生成了一張堪比86版豬八戒的大肚子,和一頭殺馬特的頭髮,更意外的是,竟然毫無違和感。 (ps:怕難過審,小編只能打碼了~)
現在這篇貼文的瀏覽量和給Sam穿衣服的圖片數量還在狂飆,有網友甚至開始擔心:“這值得我們燒掉一個小城鎮的電量嗎?”
但得到更多讚的網友認為:值!這個功能用起來爽!
為什麼這波自黑操作能這麼爆?
因為,今天凌晨發售的新版 ChatGPT Images 真的太強了!
這次的版本命名為GPT Image 1.5,號稱是OpenAI 迄今最好的圖像生成模型,現在已經直接集成到所有ChatGPT 用戶(免費+付費)中,還開放了API。
繼GPT-4o之後,這個新版本的核心升級主要有5點:
首先,速度提升4倍:以前等半天,現在秒出圖,玩起來超爽!
這一點,作為免費用戶,速度提昇明顯。之前4o生成影像至少要等10分鐘左右,而現可以說1分鐘以內就可以做到,不用排隊的感覺,真的有被爽到。
下面這張圖,是小編為Sam換衣服帽子的無快放錄屏,大概10秒鐘就出圖了。
其次,指令遵循更精準:你說改那裡就改那裡,不會亂動其他部分,保持光影、構圖、人物一致性。
這點也是很多圖像模型都在卷的地方。可以說人物一致性方面,OpenAI做得一直都很好。
第三個,編輯能力爆棚:精準加物、刪物、換風格、試衣服、改表情……你可以把它當成隨身的PS神器!
為此,小編試了一個相對刁鑽的P圖玩法:
先讓它生成一張亞洲女生形象。
prompt:
一張寫實風格的照片:一位30歲左右的亞洲女性,短髮,穿著白色T恤和牛仔褲,站在現代簡約風格的客廳裡,雙手自然下垂,表情平靜中帶著一絲嚴肅,正面直視鏡頭。客廳背景有灰色沙發、木質茶几、落地窗,窗外是城市白天景色。光線自然,明亮但不刺眼,高清攝影,細節豐富。
然後小編就開始,上難度了!為它設定了6重關卡,重點是考核Image1.5的對於部位細節處理、光影色調、風格切換。
prompt:
使用我上傳/剛生成的這張照片作為基礎,進行以下精確修改,只改動指定的部分,其他所有元素(包括人物面部特徵、身材比例、姿勢、光影方向、構圖、背景細節)保持完全一致: 1. 給她換上一件紅色聖誕毛衣(帶白色雪花圖案,毛衣要貼身,顯示出原本的身材),下身保持牛仔褲不變。 2. 在她右手邊(畫面左側)加上一個真實感的聖誕樹,樹高約到她肩膀,放在地板上,樹上掛滿彩燈和小飾品,燈是暖黃色亮著的。 3. 在茶几上添加一個正在燃燒的壁爐效果的小蠟燭組(3-5支),有真實火焰和輕微煙霧。 4. 把她的表情改成開心的笑容,眼睛微微瞇起,露出牙齒,自然真誠的聖誕日笑容。 5. 把整體畫面風格轉換成吉卜力工作室的動畫風格(類似宮崎駿電影《千與千尋》或《龍貓》的手繪質感),但要保持高度寫實的光影和細節,不能變成卡通簡化。 輸出4K分辨率,細節拉滿。
可以看出,嚴格遵循指令,可以做到精準修改,沒有讓它修改的部分,例如“手部下垂”,可以說紋絲不動。
第四,文字渲染終於可靠:以前生成帶字的圖總歪歪扭扭,現在清晰銳利。
這裡,我要看看中英文方面到底如何。中文方面,可以看出字體準確度上已經有了質的飛升。之前的4o生成圖方面非常容易出錯。
這是之前小編用4o生成的一張馬斯克的插畫。錯字多到數不清。
而現在的Image 1.5不僅錯字少了,就連「插畫」生成的品質也有模有樣了。
不僅如此,中文的LOGO字體也有了較高的突破。小編在實測中發現,新版本的圖像模型對於中文LOGO和對應的品牌特質有了理解,例如:農夫山泉字體有棱有角,背景是紅色;而元氣森林的背景則是白色(當然對於具體的介紹語,還是會有錯字。)
ps:裸瓶也是提前讓Image 1.5 生成的,所以顏色一直是藍色沒有變。
第五,新介面:ChatGPT 側邊欄新增「Images」入口,像創意工作室一樣,有預設濾鏡和熱門提示字。
OpenAI 應用負責人Fidji Simo 爆料:“很多人第一次用ChatGPT 就是生成圖片,這太魔性了,但原來的聊天界面不是為這個設計的。現在我們把它變成一個真正的創意工作室。”
Image 1.5 也被視為OpenAI 上周GPT-5.2發布沒有發布圖像模型所彌補的一個遺憾。
毫無疑問,這波更新明顯是衝著Google的Nano Banana Pro 去的。今年下半年以來,影像生成大戰被Google再次掀起戰火。
OpenAI 可以說用速度+精度+娛樂性,一定程度上實現了反殺。
普通人怎麼玩?
現在所有ChatGPT 用戶(含免費版)都能直接使用!
打開ChatGPT,側邊欄點Images,或直接聊天說:「幫我生成一張…」就能玩。想玩得更嗨?試試這些提示詞:
“把我變成聖誕消防員日曆模特兒”
除此之外,還有許多新玩法,官網上放出了不少精品範例。
地址:
https://openai.com/index/new-chatgpt-images-is-here/
例如經典的生成90年的照片。
prompt:將兩個男人和一隻狗放在一張2000年代膠卷相機風格的照片中,照片中他們看起來很無聊,正在參加一個孩子的生日派對。
當然,小編獨家推薦的是:舊照片修復,還有專業求職照片,這些功能不但生成品質能打,關鍵是,不用花錢也可以實現P圖自由了!
例如小編,為哈利波特中最令人欽佩的石內卜教授做了一張年輕時候的履歷職業照。
prompt:產生一張年輕時的、求職用的履歷照片。
再例如,我讓它修復一張鄧麗君老照片。
清晰度和還原度還是不錯的,但小編發現,還是少了一代歌後的一絲神韻(尤其是眼睛)。
prompt:改成一張2025年的高清照片。
基準測試(LMArena)排名第一
LMArena 排名(真人盲測排行榜):文字轉圖像類別排名第一,得分1277 分(擊敗Gemini 3 Pro Image / Nano Banana Pro 的1235 分)。
當然,根據reddit網友,覺得這個分數雖然高,但實測體驗並不如Google的圖像模型NanoBanana Pro。
架構細節與模型特性
據公開放出資料顯示,GPT Image 1.5 是 原生多模態模型,屬於GPT Image 系列(繼GPT Image 1 和mini 之後)。
它結合了自回歸先驗與強大解碼器,可能採用類似「tokens → transformer → diffusion → pixels」的混合架構(從OpenAI Cookbook 提示指南推測)。
API 與定價細節方面,小編也扒了下來。
相較於前代GPT Image 1,Image 1.5 的影像輸入/輸出成本 降低約20%,較適合大規模應用。
不過,OpenAI文件中也表示:建議根據實際場景需求進行模型選擇。
GPT影像模型包括gpt-image-1.5(最先進的)、gpt-image-1和gpt-image-1-mini。它們共享相同的API接口,其中gpt-image-1.5提供最佳的整體品質。
我們建議使用gpt-image-1.5以獲得最佳體驗,但如果您正在尋找更經濟實惠的選擇,並且影像品質不是首要考慮因素,則可以使用gpt-image-1-mini。
也可以將專用影像產生模型(DALL·E 2 和DALL·E 3)與映像API 一起使用,但請注意,這些模型現在已棄用,我們將於2026 年5 月12 日停止支援它們。
不過,OpenAI 很誠實,團隊也承認模型仍有限制,例如某些複雜場景下的一致性或特定內容過濾,但整體已向「生產級視覺創作」邁進一大步。
最後想說:OpenAI或還憋著一個大
Sam這波自黑行銷,真的絕了!
「行銷學大師」再次玩出了新高度。既展現了新模型的強大(臉部一致性、肌肉細節、節日氛圍拉滿),又用幽默拉近距離。
另外,有網友猜測,從這次命名看,OpenAI應該還在憋著一個大版本沒發!
之所以命名1.5,要嘛是不想重蹈GPT-5的覆轍,要嘛,是還有一個更好的模型等著發布!
不得不說,大模型進展實在太神速了! AI 影像生成已經從「技術demo」變成「全民娛樂工具」。
2025年的尾巴,OpenAI 給了我們一個大禮包。不知道大家是否已經去試過了?各位大俠可以在留言區分享你的神圖!
讓子彈快樂飛吧!(51CTO技術棧)