Google深夜甩出一份【Nano Banana Pro提示詞指南】，手把手教你生產專業級內容，實戰案例+提示詞範本

2025/11/30

•

Google“Nano Banana Pro”提示詞全解：把 AI 玩成 4K 級專業產線

凌晨，Google生成式AI團隊毫無預警地甩出一份提示詞手冊——《The Complete Guide to Nano Banana Pro: 10 Tips for Professional Asset Production》。核心資訊只有一個：如何用Nano Banana Pro製作專業級內容~~~

技術範式轉移：當AI開始“思考”創作

Nano Banana Pro的進化核心在於意圖理解引擎的突破。與傳統模型的“關鍵詞匹配”機制不同，該系統具備：

物理規則推演能力（如光影反射邏輯）
構圖美學理解（黃金分割/視覺層次）
語義上下文推理（品牌調性/受眾定位）

以下是Google團隊的官方指南：

Nano-Banana Pro 是相對於前代模型的重大飛躍，從“趣味性”圖像生成轉向“功能性”專業資產生產。它在文字渲染、角色一致性、視覺合成、世界知識（搜尋）和高解析度（4K）輸出方面表現出色。

本文內容概覽：

提示詞黃金法則
文字渲染、資訊圖與視覺合成
角色一致性與病毒式縮圖
基於 Google 搜尋的資訊錨定
高級編輯、修復與著色
維度轉換 (2D ↔ 3D)
高解析度與紋理
思考與推理
一次性故事板與概念藝術
結構控制與佈局引導
下一步是什麼？

🛑 章節 0：提示詞黃金法則

Nano-Banana Pro 是一個“會思考”的模型。它不僅僅是匹配關鍵詞；它能理解意圖、物理原理和構圖。要獲得最佳效果，請停止使用“標籤堆砌”（例如：狗、公園、4k、寫實），開始像創意總監一樣思考。

1、編輯，而非重新生成 (Edit, Don't Re-roll)

該模型在理解對話式編輯方面表現出色。如果一張圖像有 80% 是正確的，不要從頭開始生成新圖像。相反，只需要求進行你需要的具體更改。

示例： “這很棒，但請將光線改為日落效果，並將文字改為霓虹藍色。”

2、使用自然語言和完整句子 (Use Natural Language & Full Sentences)

像向人類藝術家做簡報一樣與模型對話。使用正確的語法和描述性形容詞。

❌ 差： “酷車，霓虹，城市，夜晚，8k。”

✅ 好： “一張電影感的廣角鏡頭，展示一輛未來主義跑車在雨夜中飛馳穿過東京街道。霓虹燈招牌的燈光反射在濕漉漉的路面和跑車的金屬底盤上。”

3、具體且具有描述性 (Be Specific and Descriptive)

模糊的提示詞會產生通用的結果。定義主體、場景、光線和氛圍。

主體：不要說“一個女人”，而要說“一位穿著復古香奈兒風格套裝的優雅老婦人”。

材質：描述紋理。“啞光飾面”、“拉絲鋼”、“柔軟天鵝絨”、“皺紙”。

4、提供上下文（“為什麼”或“為誰”）(Provide Context (The "Why" or "For whom"))

因為模型會“思考”，給它提供上下文有助於它做出合乎邏輯的藝術決策。

示例： “為巴西高端美食食譜創作一張三明治的圖像。”（模型將推斷出專業的擺盤、淺景深和完美的光線）。

🛑 章節 1：文字渲染、資訊圖與視覺合成

Nano-Banana Pro 擁有最先進（SOTA）的能力，可渲染清晰易讀、風格化的文字，並將複雜資訊合成為視覺格式。

最佳實踐：

壓縮 (Compression)：要求模型將密集文字或 PDF “壓縮”成視覺輔助工具。
風格 (Style)：明確指定你想要的風格，如“精緻的編輯風”、“技術圖表”或“手繪白板”效果。
引文 (Quotes)：明確指定你想要的文字，並用引號括起來。

示例提示詞：

財報資訊圖（資料輸入）

[輸入 Google 最新財報的 PDF]

“生成一張簡潔、現代的資訊圖，總結這份財報中的關鍵財務亮點。包括‘收入增長’和‘淨利潤’的圖表，並將 CEO 的關鍵引述高亮顯示在一個風格化的引文框中。”

復古資訊圖：

“製作一張關於美國小餐館歷史的復古 1950 年代風格資訊圖。包含‘食物’、‘點唱機’和‘裝飾’等獨立版塊。確保所有文字清晰易讀，並採用符合該時期的風格化設計。”

技術圖表：

“建立一張正交藍圖，從平面圖、立面圖和剖面圖描述這座建築。用技術性建築字型清晰標註‘北立面’和‘主入口’。格式為 16:9。”

白板總結（教育類）：

“將‘Transformer 神經網路架構’的概念總結為一張手繪白板圖，適用於大學講座。使用不同顏色的記號筆區分編碼器（Encoder）和解碼器（Decoder）模組，並為‘自注意力（Self-Attention）’和‘前饋網路（Feed Forward）’加入清晰標籤。”

🛑 章節2：角色一致性與病毒式縮圖

Nano-Banana Pro 最多支援 14 張參考圖像（其中 6 張具有高保真度）。這允許進行“身份鎖定 (Identity Locking)”——將特定人物或角色放入新場景中而不會出現面部扭曲。

最佳實踐：

身份鎖定：明確說明：“保持人物的面部特徵與圖像 1 完全一致。”
表情/動作：描述情緒或姿勢的變化，同時保持身份不變。
病毒式構圖：一次性將主體與醒目的圖形和文字結合起來。

示例提示詞：

“病毒式縮圖”（身份 + 文字 + 圖形）(The "Viral Thumbnail" (Identity + Text + Graphics))：

“使用圖像 1 中的人物設計一個病毒式視訊縮圖。

面部一致性：保持人物的面部特徵與圖像 1 完全一致，但將其表情改為興奮和驚訝。

動作：將人物擺放在畫面左側，手指指向畫面右側。

主體：在右側放置一張高品質的酪梨吐司美食圖片。

圖形：加入一個醒目的黃色箭頭，連接人物的手指和吐司。

文字：在中間疊加巨大的流行風格文字：‘3分鐘搞定！’。使用粗體白色描邊和投影效果。

背景：模糊、明亮的廚房背景。高飽和度和對比度。”

“毛絨夥伴”場景（群體一致性）

[輸入 3 張不同毛絨玩偶的圖像]

“創作一個由 10 個部分組成的搞笑故事，講述這 3 個毛絨朋友去熱帶度假的經歷。故事全程充滿刺激，有情感起伏，並以一個幸福的時刻結束。確保所有 3 個角色的服裝和身份保持一致，但他們的表情和角度應在所有 10 張圖像中有所變化。確保每張圖像中每個角色只出現一次。”

品牌資產生成：

[輸入 1 張產品圖像]

“建立 9 張驚豔的時尚照片，彷彿出自獲獎時尚雜誌大片。使用此參考圖像作為品牌風格，但在系列中加入細微差別和變化，以傳達專業的設計感。請一次生成一張圖像，共生成九張。”

🛑 章節3：基於 Google 搜尋的資訊錨定

Nano-Banana Pro 利用 Google 搜尋，基於即時資料、時事或事實核查生成圖像，減少在時效性話題上的幻覺（hallucinations）。

最佳實踐：

要求可視化動態資料（天氣、股票、新聞）。
模型在生成圖像前會“思考”（推理）搜尋結果。

示例提示詞：

事件可視化 (Event Visualization)：

“根據當前的旅行趨勢，生成一張關於 2025 年美國國家公園最佳遊覽時間的資訊圖。”

🛑 章節3：高級編輯、修復與著色

該模型擅長通過對話式提示進行複雜編輯。這包括“圖像修補 (In-painting)”（移除/加入對象）、“修復 (Restoration)”（修復老照片）、“著色 (Colorization)”（漫畫/黑白照片）和“風格轉換 (Style Swapping)”。

最佳實踐：

語義指令：你不需要手動繪製遮罩；只需自然地告訴模型要更改什麼。
物理理解：你可以要求進行複雜更改，例如“給這個杯子裝滿液體”來測試物理生成能力。

示例提示詞：

對象移除與圖像修補 (Object Removal & In-painting)：

“移除這張照片背景中的遊客，並用符合周圍環境的合理紋理（鵝卵石和店面）填充該空間。”

漫畫/連環畫著色 (Manga/Comic Colorization)：

[輸入黑白漫畫分鏡]

“為這張漫畫分鏡上色。使用充滿活力的動漫風格調色盤。確保能量光束上的光照效果呈現發光的霓虹藍色，角色的服裝與其官方配色保持一致。”

本地化（文字翻譯 + 文化適配）

[輸入倫敦公車站廣告圖像]

“採用這個概念並將其本地化到東京場景，包括將標語翻譯成日語。將背景改為夜晚繁忙的澀谷街道。”

光線/季節控制 (Lighting/Seasonal Control)：

[輸入夏季房屋圖像]

“將此場景轉換為冬季。保持房屋結構完全相同，但在屋頂和院子裡加入積雪，並將光線改為寒冷、陰沉的下午光線。”

🛑 章節4：維度轉換 (2D ↔ 3D:

一項強大的新功能是將 2D 示意圖轉換為 3D 可視化效果，反之亦然。這非常適合室內設計師、建築師和表情包創作者。

示例提示詞：

2D 平面圖轉 3D 室內設計板 (2D Floor Plan to 3D Interior Design Board)：

“基於上傳的 2D 平面圖，在一張圖像中生成專業的室內設計演示板。

佈局：拼貼形式，頂部一張大型主圖（客廳區域的廣角透檢視），下方三張小圖（主臥室、家庭辦公室和一個 3D 俯視平面圖）。

風格：應用現代極簡主義風格，所有圖像均採用溫暖的橡木地板和灰白色牆壁。

質量：照片級真實感渲染，柔和的自然光線。”

2D 轉 3D 表情包轉換：

“將‘This is Fine’狗表情包轉換為照片級真實感的 3D 渲染。保持構圖完全相同，但讓狗看起來像一個毛絨玩具，讓火看起來像真實的火焰。”

🛑 章節5：高解析度與紋理

Nano-Banana Pro 支援原生 1K 至 4K 圖像生成。這對於細節紋理或大幅面列印特別有用。

最佳實踐：

如果你的 API/介面允許，請明確要求高解析度（2K 或 4K）。
描述高保真細節（瑕疵、表面紋理）。

示例提示詞：

4K 紋理生成：

“利用原生高保真輸出，打造一個令人驚嘆的青苔森林地面的氛圍環境。掌控複雜的光照效果和細膩的紋理，確保每一縷苔蘚和每一束光線都以適合 4K 壁紙的像素級完美解析度呈現。”

複雜邏輯（思考模式）：

“建立一張超寫實的資訊圖，展示一個解構的精緻芝士漢堡，展示烤布裡歐面包的紋理、肉餅的焦化外殼以及芝士閃亮的融化狀態。為每一層標註其風味特徵。”

🛑 章節6：思考與推理

Nano-Banana Pro 默認採用“思考”過程，在渲染最終輸出前會生成臨時的思考圖像（不收費），以最佳化構圖。這允許進行資料分析和解決視覺問題。

示例提示詞：

解方程 (Solve Equations)：

“在白板上解方程 log_{x^2+1}(x^4-1)=2 in C。清晰地展示步驟。”

視覺推理：

“分析這張房間的圖像，並生成一張‘之前’的圖像，展示該房間在施工期間可能的樣子，顯示框架和未完成的石膏板。”

🛑 章節7：一次性故事板與概念藝術:

你可以無需網格即可生成連續藝術或故事板，確保在單次會話中獲得連貫的敘事流。這也常用於“電影概念藝術”（例如，即將上映電影的虛假洩露圖）。

示例提示詞：

“創作一個引人入勝的 9 部分故事，包含 9 張圖像，講述一個獲獎奢華行李箱廣告中的一男一女。故事應有情感起伏，以一個展示女性和品牌標誌的優雅鏡頭結束。女性和男性的身份及其著裝必須貫穿始終保持一致，但可以且應該從不同的角度和距離展現他們。請一次生成一張圖像。確保每張圖像均為 16:9 的橫向格式。”