台北時間周四深夜,AI巨頭Google麾下的Nano Banana圖像生成模型迎來重磅更新——Nano Banana Pro閃亮登場!作為背景,Google於今年8月底發佈基於Gemini 2.5 Flash模型的Nano Banana。由於該模型能夠將人物或者動漫照片變成栩栩如生的“3D列印手辦”,短時間內形成全球範圍內的破圈效應。GoogleCEO皮查伊披露,在Nano Banana的推動下,Gemini應用的月活使用者數在短短1個季度內,就從4.5億暴增至6.5億。隨著本周Google發佈新一代旗艦大模型,Google的圖像生成模型也迎來了意料之中的飛躍式升級。用Google的話來講,Nano Banana Pro能“以空前的控制力、無瑕的文字呈現和增強的世界知識,將使用者的構想變成工作室級的設計”。據Google介紹,Nano Banana Pro基於本周早些時候發佈的Gemini 3 Pro,不僅在細節表現力、圖像解析度和文字渲染精準性方面強於前一代Nano Banana,還能以不同風格、字型和語言生成本文。新一代圖像生成模型還新增了編輯功能,並加入網際網路搜尋能力。Google強調,Nano Banana Pro是在圖像中生成正確且清晰可讀文字的最佳AI模型,不論是簡短的標語還是長段落均可,支援更加豐富的紋理、字型和書法。同時借助Gemini增強的多語言推理能力,使用者可以生成多種語言的文字,或者對內容進行翻譯和本地化。(將一張照片轉化為電影分鏡,以及翻譯飲料包裝上的文字,來源:Google)同時基於網際網路知識庫,Nano Banana Pro還能將現實世界的資訊轉化為生動形象的可視化資訊,例如如何製作一杯荳蔻茶。Google透露,Nano Banana Pro也非常適合用來做PPT或者資訊圖表,同時會加入Google的辦公套件Workspace。Google Labs和Gemini副總裁Josh Woodward介紹稱:“Nano Banana Pro在資訊圖表方面非常出色,可以用來製作幻燈片。它最多可以處理14張不同的圖像,或5個不同的角色,並在某種程度上保持角色一致性。”對於創意產業的工作者而言,Nano Banana Pro也大幅升級了編輯功能,直接將創意的決策權交到使用者手中。Google介紹稱,新的編輯功能支援改變相機角度、場景光線、景深、對焦等,同時可以調整多種縱橫比,解析度也從Nano Banana的1024X1024上升到最高4K。(調整角度或圖片焦點)Google正在各項AI工具中推出Nano Banana Pro,包括免費使用者在內,都能在Gemini等應用中試用這一新功能(但會有配額限制)。Google AI Plus、Pro和Ultra訂閱使用者會獲得更高的配額。Google也表示,該功能隨後也將率先在Flow(Google的AI電影製作工具)向Ultra訂閱使用者推出。 (財聯社AI daily)