繼前日Gemini 3推出後,GOOGLE股價創歷史新高後,今日Google股價再次大漲超4%,再創歷史新高!三個月前,來自Google AI Studio 負責人 Logan Kilpatrick 的一個香蕉表情暗示了現象級圖像生成模型 Nano-banana 出自Google,引發了軒然大波。Nano-banana,也就是 Gemini 2.5 Flash Image 模型,有多猛大家也不陌生了。無論是修復老照片,還是生成迷你手辦,Nano Banana 在圖像編輯方面邁出了重要一步,讓普通創作者也能輕鬆表達創意。我們也曾經翻遍全網,整理了 7 種體現奈米香蕉超強圖像理解生成能力的趣味玩法,感興趣的讀者可以回顧一下。就在前兩天,Gemini 3 發佈前,Logan Kilpatrick 故技重施,點燃了大家對新模型的期待。結果今天下午梅開三度。網友說:「停停」。在 Gemini 3 重磅登場後,Google的王炸模型只剩下了那支傳說級的香蕉。不出所料,就在剛剛,Google最新,最強大,最全面的圖像生成模型 Nano Banana Pro(Gemini 3 Pro Image)正式登場,掛上了「專業級」後綴的奈米香蕉,結合了 Gemini 3 Pro 的強大推理能力和世界知識,實力再次實現了飛躍。簡而言之,Nano Banana Pro 主要 Pro 在 :前所未有的控制力、完美的文字渲染效果和更強的世界知識,具備打造工作室等級的設計作品的生成能力。前所未有的控制力高解析度作為一款圖像生成模型,Nano Banana Pro 這次最直觀、最能有感的基礎能力升級,是能夠生成 2K 和 4K 的高解析度圖像。圖像像素量有顯著的提升,意味著模型必須同時在細節刻畫、畫面精度、生成穩定性、一致性以及可控性上全面升級。除此以外,Nano Banana Pro 支援了廣泛的圖像長寬比,解決了基礎款 Nano Banana 使用時很難控製圖像比例的痛點問題,尤其是在 Gemini 對話中明確要求圖像比例時,Nano Banana 仍不能生成對應長寬比的圖像。Nano Banana Pro 生成不同比例的超高畫質圖像得益於多種可用的長寬比和 2K / 4K 高解析度,Google聲稱:「作品可以直接用於任意平台,從社交媒體到印刷物料。」更強大的一致性Nano Banana 火遍全網,其中最重要的原因就在於它令人驚嘆的視覺一致性控制。舉個大家最熟悉的例子:只需上傳一張簡單的服裝圖和人物照片,再配上一兩句限制性文字指令,它就能快速精準地將元素融合,輕鬆生成風格統一、構圖自然,並且保持人物和服裝一致的 OOTD 合成照。感興趣的讀者可以看看我們這一篇報導,輕輕鬆鬆做一名時尚博主。而使用 Nano Banana Pro,你可以融合比以往更多的元素:最多使用 14 張參考圖像,保持多達 5 個人物 的一致性與相似度。讓我們簡單來看兩個實例:Prompt: Combine these images into one appropriately arranged cinematic image in 16:9 formatPrompt: A medium shot of the 14 fluffy characters sitting squeezed together side-by-side on a worn beige fabric sofa and on the floor. They are all facing forwards, watching a vintage, wooden-boxed television set placed on a low wooden table in front of the sofa. The room is dimly lit, with warm light from a window on the left and the glow from the TV illuminating the creatures’ faces and fluffy textures. The background is a cozy, slightly cluttered living room with a braided rug, a bookshelf with old books, and rustic kitchen elements in the background. The overall atmosphere is warm, cozy, and amused.效果非常令人驚訝,Nano Banana Pro 不僅可以保留參考圖片中的物體和人物特徵,更能夠理解參考圖片中的背景圖像資訊,理解光影、材質和圖像結構,深刻洞察使用者的設計意圖。那怕高達 14 張參考圖像,Nano Banana Pro 都能夠在新圖像中保留全部的細節。不管是將一張隨手勾勒的手繪草圖變成可落地的實體產品,還是把技術藍圖轉化為質感逼真的 3D 結構,Nano Banana Pro 都能幫你輕鬆跨越那道長期存在的從想像到落地的鴻溝。此外,在設計領域中,Nano Banana Pro 也可以為設計稿一鍵套入理想的視覺風格,包括品牌主視覺、潮流配色,不同材質和質感的測試效果,它都能快速生成。最終呈現的結果在所有關鍵特徵上都能保持高度統一,從電商圖到宣傳海報,從社交內容到實體包裝,毫無割裂感。相比 Nano Banana 更強的一致性控制,遠遠拓展了參考圖生成的上限,創造了更多玩法可能。更靈活的創意控制借助 Nano Banana Pro 的全新能力,高級圖像編輯不再是專業團隊的專屬 —— 真正的創意控制權被交回到使用者手中。使用者可以對畫面進行近乎「分子級」的操控:自由選取並重塑圖像任意局部區域,實現精準微調切換攝影機角度,快速生成不同視角與構圖調整焦點位置,打造更具敘事感的畫面重心應用電影工業級調色,一鍵改變視覺氣質重塑場景光照,從白天到夜晚、從硬光到散景過渡皆可瞬時完成這些能力讓 Nano Banana Pro 從簡單的圖像生成工具,躍升為一個能夠支援創作者進行分鏡級、視覺導演級創作的圖像引擎。視訊中也簡單演示了從一張圖像,到天氣的重塑,最後使用 Veo 3 模型生成極具電影風格的視訊的全過程。下面兩個示例不僅能夠展示 Nano Banana Pro 強大的創意控制能力,也展開了結合首尾幀視訊生成的全新可能。Prompt: change lighting of this portrait to from the left, diffused and softPrompt: Focus on the flowers文字與知識大師輕鬆拿捏文字生成我們知道,在圖像生成模型中,生成文字一直是一個難點。Nano Banana Pro 正是在這一痛點上實現了再一次迭代:它具備非常強大的文字生成能力,能夠生成包含更準確、清晰可讀、多語言文字的視覺內容。Nano Banana Pro 是生成圖像內可讀文字的最佳模型,無論你需要的是一句簡短標語還是一整段較長文字,都能夠清晰,完整,合理的生成,並且與圖像內容完美融合。Prompt: make 8 minimalistic logos, each is an expressive word, and make letters convey a message or sound visually to express the meaning of this word in a dramatic way. composition: flat vector rendering of all logos in black on a single white backgroundPrompt: Create an image showing the phrase "How much wood would a woodchuck chuck if a woodchuck could chuck wood" made out of wood chucked by a woodchuck.現在我們可以在視覺設計或海報中建立帶有更多細節的文字,具備更廣泛的紋理、字型與創意樣式。另外,憑藉 Gemini 的增強多語言推理能力,我們可以通過 Nano Banana Pro 生成多語言文字,或對內容進行本地化與翻譯,從而實現全球化擴展,或更輕鬆地與朋友和家人分享內容。就比如將飲料瓶上的英文翻譯成韓語,並且無縫的合成在原文字的位置,還能保證超高品質的細節和字型風格。Prompt: translate all the English text on the three yellow and blue cans into Korean, while keeping everything else the sameGemini 3 賦能知識庫由於和 Gemini 3 大模型的深度融合,可以借助 Gemini 3 的高級推理,Nano Banana Pro 不只是生成漂亮的圖像,它還能幫助你建立更有用的內容。Nano Banana Pro 將龐大的知識庫融入生成過程,能夠比以往的圖像生成模型產出更具事實精準性的視覺內容。此外,在啟用相關能力時,通過與 Google 搜尋的檢索基座相結合,模型可以連接到即時的網頁內容,生成基於最新資料的輸出。於是我們可以獲得準確的解釋內容,進一步理解一個事實主題,並且生成語境豐富的資訊圖和示意圖。這對於需要精確呈現現實資訊的應用場景尤為重要,如生物學示意圖或歷史地圖。Nano Banana Pro 生成的製作荳蔻茶的教學圖片更進一步,Nano Banana Pro 還具備根據內容自動生成 PPT 頁面的能力無論使用者提供的是一段文字、幾條要點,還是一篇長文,模型都能自動理解內容和結構,生成對應演示文件圖像。實現了「從文字到展示」的流程自動化與智能化的實用進步。隱形水印,快速驗證Nano Banana Pro 的圖像生成能力再次進化後,生成圖像和真實圖像愈發難以區分。但Google在這次更新發佈後,對 AI 圖像鑑別採取了新的方法,提高內容來源的透明度。Gemini 應用中現在加入了一項新功能:使用者可以直接驗證某張圖像是否由 Google AI 生成或編輯。從今天開始,使用者可以直接在 Gemini 應用中驗證某張圖像是否由 Google AI 生成或編輯。如果你看到一張圖像並希望確認它是否由 Google AI 生成,只需將其上傳至 Gemini 應用,並提出類似於:「這是由 Google AI 生成的嗎?」的問題,就可以獲取準確的答案。這一能力由 SynthID 實現,這是Google的數字水印技術,它將不可察覺的訊號嵌入到 AI 生成內容中。Google在 2023 年推出 SynthID。自那以來,已有超過 200 億份 AI 生成內容通過 SynthID 加上水印。Gemini 會檢測圖像中的 SynthID 水印,並結合自身的推理能力,為使用者提供結果,使使用者更瞭解你在網上看到的內容的背景。不久後,Google將擴展 SynthID 驗證能力,支援包括音視訊在內的更多格式,並讓這些能力覆蓋更多產品,如搜尋等。作為此次發佈的一部分,從今天起,通過 Gemini、Vertex AI,Google ADs、Flow 生成的 Nano Banana Pro(Gemini 3 Pro Image)圖像都將嵌入 C2PA 中繼資料,進一步提升圖像生成方式的透明度。面向各類使用者上線Google表示,會在多個原本支援舊版本模型的 Google 產品中上線 Nano Banana Pro:面向消費者與學生在 Gemini App 中,當你選擇 「Create images」並使用 「Thinking」模型時,將在全球範圍內陸續上線。免費使用者會獲得有限的免費額度,用完後將回退至原版 Nano Banana 模型。Google AI Plus、Pro 和 Ultra 的訂閱使用者將獲得更高額度。在搜尋的 AI Mode 中,Nano Banana Pro 將向美國的訂閱使用者提供。NotebookLM 中,Nano Banana Pro 也將向全球訂閱使用者提供。面向專業人士Google Ads 將升級圖像生成功能至 Nano Banana Pro,讓廣告主可在 Asset Studio 中使用最前沿的生成與編輯能力。同時,它也將從今天開始陸續向 Workspace 使用者推出,包括 Google Slides 和 Google Vids。面向開發者與企業可通過 Gemini API 與 Google AI Studio 訪問,並可在 Google Antigravity 中用於建立豐富的 UX 佈局與原型。企業可立即在 Vertex AI 中開始大規模內容創作支援,並且即將登陸 Gemini Enterprise。面向創意人士Nano Banana Pro 將提供給使用 Flow 的 Google AI Ultra 訂閱使用者,為創作者、導演與行銷團隊提供更精準、更可控的鏡頭與場景生成能力。Gemini 2.5 Flash Image 和 Gemini 3 Pro Image 模型可通過 Gemini API、Google AI Studio 和 Vertex AI 以付費預覽形式使用。使用 Nano banana (Gemini 2.5 Flash Image)獲取更快、更低成本的圖像生成/編輯;使用 Nano banana Pro(Gemini 3 Pro Image)處理更加複雜、要求更高的任務,但成本與延遲也更高。 (invest wallstreet)