昨夜,GPT-4o原生出圖在全網掀起風暴。從一鍵風格遷移、秒出高保真線框,到精準呈現複雜資訊圖和完整漫畫,GPT-4o將AI生圖從「超現實」帶回「現實主義」。這場視覺革命,或許正推動AI正式進入專業創作領域。
昨晚,AI圈樂瘋了:先是DeepSeek高調官宣V3模型升級;緊接著Google深夜上線旗下最強模型Gemini 2.5 Pro。
雙方夾擊之下,OpenAI還能坐得住?這種時候,怎麼能少得了OpenAI整活?
果不其然,奧特曼親自出馬,現場直播演示GPT-4o全新的原生圖像生成功能。
經過各路大神上手實測,效果相當驚豔。
更讓人意外的是,OpenAI這次也終於Open了一把,連免費使用者也可以使用。
200萬粉絲的網紅Allie K.Miller,提前嘗試過GPT-4o新功能表示:「新模型確實值得一試,特別在文字生成上取得了巨大飛越。」
在人物創作上,GPT-4o生成的照片毫無破綻,逼真到令人恐怖。
與DALL-E 3不同,此次OpenAI的全新圖像生成器基於其原生多模態GPT-4o模型,能夠同時理解圖像和文字,可以非常好地遵循提示詞指令,輕鬆創作出虛實結合的場景,就像在現實中一樣。
比如下面圖片,文字可以很好地融入到圖片中去,還不怎麼出現錯字。
從事創意的Lucas Crespo,已經研究了好幾周OpenAI的新圖像生成模型了。
簡單總結,OpenAI的新模型幾乎可以可視化全部東西,甚至包括待辦事項列表(To-Do List),更不要提替換背景了。
Lucas Crespo認為新模型的確令人印象深刻,並分享了10個令人驚嘆的用例。
1、給ChatGPT-4o輸入情緒板或視覺指導,就可以建立遵循相同風格的圖像。
2、製作資訊圖表(infographics),表現非常出色。
3、室內設計和改造,輕鬆10倍。
4、生成不同的角度的側檢視。
5、 將手繪變成高保真線框,UI設計輕鬆上手。
6、一次性顯示完整漫畫
7、也非常適合製作圖畫說明書
8、將元素組合成全新的圖像
9、建立高品質的模特展示圖
關注ChatGPT的AI開發者Tibor Blaho,對此次更新非常滿意:
在提示遵循、結果質量、排版、編輯能力、角色一致性等方面,都無與倫比。
在各種風格上,都令人印象深刻,而且可以簡單地「與模型聊天」,就可以迭代編輯圖像。
1、不同風格的漫畫
2、機器人打字日記
3、logo在不同材質上的效果
4、 卡通郵遞員
5、友善的機器人
6、詩歌
7、網友自己的不同形象
GPT-4o在生成人物細節方面,到了人眼已經無法辨別真假的程度。
下面這張女人的臉,睫毛根根分明,臉上斑點也是清晰可見,關鍵非常符合女性外貌特徵。
還有更近一步,再近一步的瞳孔放大圖。
如下生成的是2006年左右,農貿集市場真實照片。
職業女性工作照。
AI生圖的風格從一開始似乎就帶有「科幻」色彩。
以OpenAI Sora的風格為例,對於提示詞中天馬行空的想像力,AI表現的總是遊刃有餘。
但是在昨夜直播中展現的GPT 4o,以及上述十個案例的風格預示著AI生圖似乎開始「回歸現實」。
GPT 4o最新生圖功能的目的不再專注於創造典型的「超現實主義」AI藝術。
而更多地是主打一個「實用」——高度可控的創作。
提示詞從神秘幻想的「黃昏時分,神秘森林,發光的生物優雅地漫步在高聳的苔蘚覆蓋的樹木中」開始演進為「冰箱中上的磁貼和手裡拿著單詞卡的男人」。
而GPT 4o的生圖功能很好的完成這幅了「現實主義」畫作。
而真正的提升,來自於GPT-4o對於提示詞「細節」的嚴格遵循。
來自OpenAI的示例圖像展示最新AI對這些細節的把控能力。
模型能夠在單個圖像中生成12個離散圖形——如貓的表情符號或閃電圖示——並將它們按正確的順序排列。
下面的示例展示了模型創作的四杯雞尾酒,配有包含精準文字的食物卡片。
甚至,可以完美的渲染出複雜的數學公式,這明顯區別於以往的AI生圖能力。
這似乎是一個明確的訊號,AI的創造力不再侷限於「隨意發揮想像而不需要關注對錯」的領域。
相比Midjourney和Sora早期還是被用來肆意揮灑想像力。
OpenAI正在將該工具定位於給專業人士使用:比如平面設計師、廣告公司或插畫師。
無論如何,OpenAI的新圖像生成器不論是不是為了「狙擊」Google和Grok等競爭對手。
從GPT-4o的生成結果來看,OpenAI的技術顯然已經突破了某些技術障礙。
OpenAI給AI公司們「內卷」設定了更高的標準。
創新的速度也許會進一步加快。
參考資料:
https://x.com/lucas__crespo/status/1904599683085029377
https://x.com/alliekmiller/status/1904604335272870114
https://x.com/giffmana/status/1904645482024202365
https://x.com/btibor91/status/1904594906112549156 (新智元)