Google“Nano Banana Pro”提示詞全解:把 AI 玩成 4K 級專業產線
凌晨,Google生成式AI團隊毫無預警地甩出一份提示詞手冊——《The Complete Guide to Nano Banana Pro: 10 Tips for Professional Asset Production》。核心資訊只有一個:如何用Nano Banana Pro製作專業級內容~~~
技術範式轉移:當AI開始“思考”創作
Nano Banana Pro的進化核心在於意圖理解引擎的突破。與傳統模型的“關鍵詞匹配”機制不同,該系統具備:
以下是Google團隊的官方指南:
Nano-Banana Pro 是相對於前代模型的重大飛躍,從“趣味性”圖像生成轉向“功能性”專業資產生產。它在文字渲染、角色一致性、視覺合成、世界知識(搜尋)和高解析度(4K)輸出方面表現出色。
本文內容概覽:
🛑 章節 0:提示詞黃金法則
Nano-Banana Pro 是一個“會思考”的模型。它不僅僅是匹配關鍵詞;它能理解意圖、物理原理和構圖。要獲得最佳效果,請停止使用“標籤堆砌”(例如:狗、公園、4k、寫實),開始像創意總監一樣思考。
1、編輯,而非重新生成 (Edit, Don't Re-roll)
該模型在理解對話式編輯方面表現出色。如果一張圖像有 80% 是正確的,不要從頭開始生成新圖像。相反,只需要求進行你需要的具體更改。
示例: “這很棒,但請將光線改為日落效果,並將文字改為霓虹藍色。”
2、使用自然語言和完整句子 (Use Natural Language & Full Sentences)
像向人類藝術家做簡報一樣與模型對話。使用正確的語法和描述性形容詞。
❌ 差: “酷車,霓虹,城市,夜晚,8k。”
✅ 好: “一張電影感的廣角鏡頭,展示一輛未來主義跑車在雨夜中飛馳穿過東京街道。霓虹燈招牌的燈光反射在濕漉漉的路面和跑車的金屬底盤上。”
3、具體且具有描述性 (Be Specific and Descriptive)
模糊的提示詞會產生通用的結果。定義主體、場景、光線和氛圍。
主體:不要說“一個女人”,而要說“一位穿著復古香奈兒風格套裝的優雅老婦人”。
材質:描述紋理。“啞光飾面”、“拉絲鋼”、“柔軟天鵝絨”、“皺紙”。
4、提供上下文(“為什麼”或“為誰”)(Provide Context (The "Why" or "For whom"))
因為模型會“思考”,給它提供上下文有助於它做出合乎邏輯的藝術決策。
示例: “為巴西高端美食食譜創作一張三明治的圖像。”(模型將推斷出專業的擺盤、淺景深和完美的光線)。
🛑 章節 1:文字渲染、資訊圖與視覺合成
Nano-Banana Pro 擁有最先進(SOTA)的能力,可渲染清晰易讀、風格化的文字,並將複雜資訊合成為視覺格式。
最佳實踐:
示例提示詞:
財報資訊圖(資料輸入)
[輸入 Google 最新財報的 PDF]
“生成一張簡潔、現代的資訊圖,總結這份財報中的關鍵財務亮點。包括‘收入增長’和‘淨利潤’的圖表,並將 CEO 的關鍵引述高亮顯示在一個風格化的引文框中。”
復古資訊圖 :
“製作一張關於美國小餐館歷史的復古 1950 年代風格資訊圖。包含‘食物’、‘點唱機’和‘裝飾’等獨立版塊。確保所有文字清晰易讀,並採用符合該時期的風格化設計。”
技術圖表:
“建立一張正交藍圖,從平面圖、立面圖和剖面圖描述這座建築。用技術性建築字型清晰標註‘北立面’和‘主入口’。格式為 16:9。”
白板總結(教育類):
“將‘Transformer 神經網路架構’的概念總結為一張手繪白板圖,適用於大學講座。使用不同顏色的記號筆區分編碼器(Encoder)和解碼器(Decoder)模組,並為‘自注意力(Self-Attention)’和‘前饋網路(Feed Forward)’加入清晰標籤。”
🛑 章節2:角色一致性與病毒式縮圖
Nano-Banana Pro 最多支援 14 張參考圖像(其中 6 張具有高保真度)。這允許進行“身份鎖定 (Identity Locking)”——將特定人物或角色放入新場景中而不會出現面部扭曲。
最佳實踐:
示例提示詞:
“病毒式縮圖”(身份 + 文字 + 圖形)(The "Viral Thumbnail" (Identity + Text + Graphics)):
“使用圖像 1 中的人物設計一個病毒式視訊縮圖。
面部一致性:保持人物的面部特徵與圖像 1 完全一致,但將其表情改為興奮和驚訝。
動作:將人物擺放在畫面左側,手指指向畫面右側。
主體:在右側放置一張高品質的酪梨吐司美食圖片。
圖形:加入一個醒目的黃色箭頭,連接人物的手指和吐司。
文字:在中間疊加巨大的流行風格文字:‘3分鐘搞定!’。使用粗體白色描邊和投影效果。
背景:模糊、明亮的廚房背景。高飽和度和對比度。”
“毛絨夥伴”場景(群體一致性)
[輸入 3 張不同毛絨玩偶的圖像]
“創作一個由 10 個部分組成的搞笑故事,講述這 3 個毛絨朋友去熱帶度假的經歷。故事全程充滿刺激,有情感起伏,並以一個幸福的時刻結束。確保所有 3 個角色的服裝和身份保持一致,但他們的表情和角度應在所有 10 張圖像中有所變化。確保每張圖像中每個角色只出現一次。”
品牌資產生成:
[輸入 1 張產品圖像]
“建立 9 張驚豔的時尚照片,彷彿出自獲獎時尚雜誌大片。使用此參考圖像作為品牌風格,但在系列中加入細微差別和變化,以傳達專業的設計感。請一次生成一張圖像,共生成九張。”
🛑 章節3:基於 Google 搜尋的資訊錨定
Nano-Banana Pro 利用 Google 搜尋,基於即時資料、時事或事實核查生成圖像,減少在時效性話題上的幻覺(hallucinations)。
最佳實踐:
示例提示詞:
事件可視化 (Event Visualization):
“根據當前的旅行趨勢,生成一張關於 2025 年美國國家公園最佳遊覽時間的資訊圖。”
🛑 章節3:高級編輯、修復與著色
該模型擅長通過對話式提示進行複雜編輯。這包括“圖像修補 (In-painting)”(移除/加入對象)、“修復 (Restoration)”(修復老照片)、“著色 (Colorization)”(漫畫/黑白照片)和“風格轉換 (Style Swapping)”。
最佳實踐:
示例提示詞:
對象移除與圖像修補 (Object Removal & In-painting):
“移除這張照片背景中的遊客,並用符合周圍環境的合理紋理(鵝卵石和店面)填充該空間。”
漫畫/連環畫著色 (Manga/Comic Colorization):
[輸入黑白漫畫分鏡]
“為這張漫畫分鏡上色。使用充滿活力的動漫風格調色盤。確保能量光束上的光照效果呈現發光的霓虹藍色,角色的服裝與其官方配色保持一致。”
本地化(文字翻譯 + 文化適配)
[輸入倫敦公車站廣告圖像]
“採用這個概念並將其本地化到東京場景,包括將標語翻譯成日語。將背景改為夜晚繁忙的澀谷街道。”
光線/季節控制 (Lighting/Seasonal Control):
[輸入夏季房屋圖像]
“將此場景轉換為冬季。保持房屋結構完全相同,但在屋頂和院子裡加入積雪,並將光線改為寒冷、陰沉的下午光線。”
🛑 章節4:維度轉換 (2D ↔ 3D:
一項強大的新功能是將 2D 示意圖轉換為 3D 可視化效果,反之亦然。這非常適合室內設計師、建築師和表情包創作者。
示例提示詞:
2D 平面圖轉 3D 室內設計板 (2D Floor Plan to 3D Interior Design Board):
“基於上傳的 2D 平面圖,在一張圖像中生成專業的室內設計演示板。
佈局:拼貼形式,頂部一張大型主圖(客廳區域的廣角透檢視),下方三張小圖(主臥室、家庭辦公室和一個 3D 俯視平面圖)。
風格:應用現代極簡主義風格,所有圖像均採用溫暖的橡木地板和灰白色牆壁。
質量:照片級真實感渲染,柔和的自然光線。”
2D 轉 3D 表情包轉換:
“將‘This is Fine’狗表情包轉換為照片級真實感的 3D 渲染。保持構圖完全相同,但讓狗看起來像一個毛絨玩具,讓火看起來像真實的火焰。”
🛑 章節5:高解析度與紋理
Nano-Banana Pro 支援原生 1K 至 4K 圖像生成。這對於細節紋理或大幅面列印特別有用。
最佳實踐:
示例提示詞:
4K 紋理生成:
“利用原生高保真輸出,打造一個令人驚嘆的青苔森林地面的氛圍環境。掌控複雜的光照效果和細膩的紋理,確保每一縷苔蘚和每一束光線都以適合 4K 壁紙的像素級完美解析度呈現。”
複雜邏輯(思考模式):
“建立一張超寫實的資訊圖,展示一個解構的精緻芝士漢堡,展示烤布裡歐面包的紋理、肉餅的焦化外殼以及芝士閃亮的融化狀態。為每一層標註其風味特徵。”
🛑 章節6:思考與推理
Nano-Banana Pro 默認採用“思考”過程,在渲染最終輸出前會生成臨時的思考圖像(不收費),以最佳化構圖。這允許進行資料分析和解決視覺問題。
示例提示詞:
解方程 (Solve Equations):
“在白板上解方程 log_{x^2+1}(x^4-1)=2 in C。清晰地展示步驟。”
視覺推理:
“分析這張房間的圖像,並生成一張‘之前’的圖像,展示該房間在施工期間可能的樣子,顯示框架和未完成的石膏板。”
🛑 章節7:一次性故事板與概念藝術:
你可以無需網格即可生成連續藝術或故事板,確保在單次會話中獲得連貫的敘事流。這也常用於“電影概念藝術”(例如,即將上映電影的虛假洩露圖)。
示例提示詞:
“創作一個引人入勝的 9 部分故事,包含 9 張圖像,講述一個獲獎奢華行李箱廣告中的一男一女。故事應有情感起伏,以一個展示女性和品牌標誌的優雅鏡頭結束。女性和男性的身份及其著裝必須貫穿始終保持一致,但可以且應該從不同的角度和距離展現他們。請一次生成一張圖像。確保每張圖像均為 16:9 的橫向格式。”
🛑 章節9:結構控制與佈局引導
輸入圖像不僅限於角色參考或待編輯的主體。你可以使用它們來嚴格控制最終輸出的構圖和佈局。這對於需要將草圖、線框圖或特定網格佈局轉化為精美資產的設計師來說是革命性的。
最佳實踐:
示例提示詞:
草圖轉最終廣告 (Sketch to Final Ad):
“根據這張草圖,為 [產品] 建立一個廣告。”
線框圖轉 UI 模型 (UI Mockup from Wireframe):
“根據這些指南,為 [產品] 建立一個模型。”
像素藝術與 LED 螢幕 (Pixel Art & LED Displays):
“生成一個獨角獸的像素藝術精靈,完美適配這張 64x64 網格圖像。使用高對比度顏色。”
(提示:開發人員隨後可以程式設計提取每個儲存格的中心顏色,以驅動連接的 64x64 LED 矩陣螢幕)。
精靈圖 (Sprites):
“精靈圖:一個女人在無人機上做後空翻,3x3 網格,序列,逐幀動畫,正方形寬高比。嚴格按照所附參考圖像的結構。”
(提示:你可以提取每個儲存格並製作 GIF 動畫)。
(三次方AIRX)