Nano Banana Pro殺死比賽!中文可用,細節多得離譜,網友瘋狂曬圖

基於Gemini 3 Pro,具備增強推理能力與知識庫。

Nano Banana升級了!

智東西11月21日報導,昨晚23點,Google發佈了其最新一代圖像生成和編輯模型Nano Banana Pro,這是先前爆火的Nano Banana的重磅更新。Google直接將Gemini 3 Pro的推理能力與世界知識庫,塞進了Nano Banana Pro。

Nano Banana Pro的正式名稱為Gemini 3 Pro Image。基於增強的推理能力、世界知識和即時資訊,這個模型可以產生更準確、更具上下文資訊的視覺效果。用Google的話來說,它不再只是產生「像模像樣」的圖像,而是能夠真正打造出實用的內容。

GoogleCEO Sundar Pichai分享道,Nano Banana Pro是一款SOTA級的圖像生成與編輯模型,非常擅長製作複雜的圖表,看待世界的方式就像工程師一樣。 Pichai分享的案例裡,Nano Banana Pro用實拍和手繪草圖結合的方式,講解了金門大橋的基本結構資訊,一目瞭然。

Nano Banana Pro的實用性也體現在較強的文字渲染能力上。結合其自帶的聯網搜尋能力,智東西試圖讓Nano Banana Pro打造了一個剪紙風的中文即時天氣卡。模型不僅找到了正確的天氣資訊,文字渲染、風格化也是毫無破綻,徹底和上一代Nano Banana的“鬼畫符”告別了。

目前,Nano Banana Pro已在Gemini應用和Web端免費可用,但有一定限額,用完後將恢復到原有的Nano Banana模型,Google AI Plus、Pro和Ultra訂閱使用者可獲得更高的配額。

Google廣告服務、GoogleSlides和GoogleVids中的影像產生功能將升級為Nano Banana Pro。使用者也可透過API通話、企業訂閱方案等使用此模型。

體驗連結:https://gemini.google.com/

01. 外掛Google搜尋字型、元素融合玩出花

借助更豐富的知識,Nano Banana Pro可以製作複雜的教育性講解圖,例如直接產生一份「小荳蔻茶」菜譜。

可以看到,模型產生的結果不僅文字清晰、毫無亂碼,說明步驟也直觀易懂;插圖與內容配合自然,整體設計風格統一協調。以這樣的完成度來說,幾乎不需要再做二次編輯。

Nano Banana Pro能連接Google搜尋,幫助使用者建立可視化的即時資訊,例如天氣或體育賽事等等。

下圖就是Nano Banana Pro自行搜尋並打造的波普風格天氣海報,上面的資訊我們已經核驗過了,是完全正確的。

此外,Nano Banana Pro在文字渲染和多語言方面有了進展。模型現在可以更為深刻的理解圖像,感知細節,從而為圖像編輯和生成提供了更多空間。

在下面這一案例中,Nano Banana Pro能根據一張劇照,直接還原出一份手寫體的黑板故事板草圖,還是帶有運鏡和故事情節的。

Nano Banana Pro現在支援更豐富的紋理、字型和書法,能創造出更精細的文字。例如,它就在下圖中把「BERLIN(柏林)」一詞融入了建築設計,毫無違和感。

或者是把文字和紋理巧妙地融合在一起,下面的文字上就完美融合了木頭橫截面的紋理。

書法、字型方面,Nano Banana Pro的風格是由語義啟發的,例如CRASH一詞的藝術字就有很多裂痕,DRIP一詞就使用了滴落的效果。

透過Gemini增強的多語言推理功能,Nano Banana Pro可以產生多種語言的文字,或對內容進行在地化和翻譯。

下方就是一個英語譯韓國語的案例,商品圖中不同角度的文字在翻譯時都得到了準確的對應。

針對專業創作者的需求,Nano Banana Pro現在允許使用者融合更多的元素,最多可使用14張圖像,並保持最多5位人物的一致性和相似度。下圖就是14張輸入圖像+文字提示詞打造的,角色一致性得到不錯的保持。

這項功能不僅適用於角色,也適用於物體。例如,可以將沙發、綠植和洋裝和場景等元素一同輸入,然後輸出全新的場景。

Nano Banana Pro提供了高級創意控制功能。改進的局部編輯功能現在支援選擇、最佳化和調整圖像裡的任何部分,例如調整相機角度、改變焦點、應用精細的色彩分級,甚至改變場景光照(例如,將白天變為夜晚或建立散景效果)。

模型現在支援豐富的寬高比調整和2K、4K解析度,讓生成結果適用於更專業的場景。

隨著Nano Banana Pro將虛擬和現實的邊界進一步模糊,Google打造了一款專用的驗證工具,以應對這一挑戰。

現在使用者可以將照片上傳到Gemini,並要求Gemini識別圖片是否為AI產生。 Google已經為自家所有的AI生成媒體內容配備了SynthID數字水印,Gemini將會據此進行判斷。目前,該功能率先支援圖片驗證,但很快將擴展到音訊和視訊。

02. 多元素一鍵換裝可「拍攝」復古老照片

Nano Banana Pro上線後,已經有海量網友分享了自己的使用體驗。

這位網友利用Nano Banana Pro打造了四張抓拍照。可以看到Nano Banana Pro在運動場景產生的肢體動作不僅沒有扭曲,還很有影響力,而這類場景對大多數圖像生成模型來說其實是不小的挑戰。這位網友感嘆,Google真的在改變世界。

Nano Banana Pro可以用來「拍攝」懷舊風格的老照片,如果不是網友特別說明,恐怕我們已經很難分辨下面四張圖片究竟是真正的老照片,還是AI生成的。

同樣的風格化能力也能用來復刻遊戲的畫風,一位日本網友就分享了他打造的像素風遊戲角色卡。

元素組合功能對於電商場景來說十分實用。這位設計師分享,自己上傳了模特兒圖和衣物圖,Nano Banana Pro能讓模特兒「穿上」新衣服,融合得很自然。

Nano Banana Pro的圖像編輯能力也可用於最佳化照片。這位網友將自己實拍的Cyber​​Truck交給Nano Banana Pro處理,他認為該模型在調整光線、去除瑕疵方面表現出色。 Nano Banana Pro幫他把豎屏照片擴展為了橫屏照片,能直接當壁紙用。

03. 結語:Nano Banana實用程度獲得針對性提升

憑藉底層模型的升級,Nano Banana Pro現在讓更多一般使用者能輕鬆上手使用圖像創作模型,僅依賴簡單的提示詞就能還原自己內心的想法。

不過,值得注意的是,Google在本次升級中的不少方向是在提升模型的實用性。無論更多樣的字型,更多的元素,還是高級控制選項,都能給專業創作者更多選擇,打造真正符合其創意的畫面。

Google已在積極將Nano Banana Pro融入其To-B的創意產品,未來該模型能否在商用場景中展示真實價值,值得持續關注。 (智東西)