GoogleCEO Sundar Pichai談Gemini 3、Nano Banana與AI全端策略
Google和Alphabet的CEO。
他在2016年確立了Google的"AI First"(AI優先)的戰略,推動了從TPU研發到AlphaGo,再到如今Gemini全端生態的建設。
在此次訪談中,他深入闡述了Google從晶片到應用的全端優勢、對“Vibe Coding”(氛圍編碼)的看法,以及對2027年太空計算設施的展望。
Google DeepMind的產品負責人(前OpenAI開發者關係負責人),也是 "Release Notes" 系列訪談的主持人。
他代表開發者社區與Sundar對話,探討了模型在實際產品中的落地挑戰、Gemini 3的技術突破以及AI如何降低創造力的門檻。
如果說兩年前我們還在為 Prompt Engineering(提示詞工程)爭論不休,那麼2025年的今天,Google用“Nano Banana”(奈米香蕉)和“Vibe Coding”(氛圍編碼)狠狠地幽了科技圈一默。
Sundar Pichai在這次訪談中展現了一種久違的鬆弛感——也許是因為 Gemini 3 終於不僅在跑分上贏了,更在“好玩”上贏了。當程式碼不再是冰冷的邏輯堆砌,而是變成了一種“氛圍”,當普通人可以用 AI 像發朋友圈一樣“手搓”應用,我們不得不承認:技術平權的高牆正在被一塊塊名為“Banana”的磚頭砸碎。
最讓我在意的,不是那個聽起來很好吃的模型名字,而是Sundar拋出的那顆“太空衛星”:2027年,TPU上天。這聽起來像是在致敬馬斯克的跑車,但對於一家早在2016年就默默押注全端 AI 的公司來說,這或許不是玩笑。畢竟,五年前誰能想到,我們今天會對著螢幕上的香蕉圖示,一本正經地討論量子計算呢?
Logan Kilpatrick:
大家好,歡迎回到Release Notes。我是Logan Kilpatrick,來自Google DeepMind團隊。今天我們邀請到了Google和 Alphabet的CEO Sundar Pichai。我們身在山景城。Gemini 3 已經發佈,Nano Banana Pro也已經推出,反響非常積極。所以我想,你是否想概括一下我們取得這一進展的時刻?如今我們不僅擁有了 Gemini和Nano Banana Pro這樣的頂尖模型,還有Vo以及其他一些音樂模型等等,全面開花。感覺時間越久,湧現的東西就越多。所以,是的,我不知道。你是否想為我們描繪一下這個時刻?
Sundar Pichai:
首先,很高興來到這裡。我想說,這是非凡的一周。你知道,當你在內部進行研發時,你會設想真正將所有成果公之於眾的那一刻。當你致力於產品時,沒有什麼比那一刻更令人興奮的了。這就是這一周的寫照。
但我想這是基於多年來的基礎,以及我們所有的深度投資。對我來說一直很清楚,你可以看到我們取得進展的速度。但所有的種子都匯聚到一起,這確實非常特別。就在過去幾周我還在回想,我覺得我們幾乎每天都在發佈新東西。所以這是一種很棒的感覺。
Logan Kilpatrick:
確實。我記得大約一年半前我和你聊天,我當時在抱怨某些事情。我肯定是在抱怨什麼,然後你說了些話。看到了推動我以長遠視角看問題的影響。我很好奇,對我來說,達到我們現在這個時刻的故事——擁有頂尖模型以及在整個 Google範圍內擴展Gemini的所有基礎設施——顯然就是這種長遠視角。尤其是在當前這個高度競爭的時刻,你是如何保持這種長遠視角的?因為現在感覺就像一場無休止的競爭,為了在排行榜上保持 1% 的領先優勢而疲於奔命,但顯然,長遠眼光至關重要。
Sundar Pichai:
我一直強迫自己,顯然你身處當下。我們所在的行業節奏很快,你希望快速迭代,我真的很享受這一點。但能夠退後一步,進行長遠佈局,並在那段時期內非常專注於一個長期目標,我認為這始終是至關重要的。
在2016年,我希望整個公司以AI為先。促成那一刻的很大一部分原因是:2012年的Google Brain,那篇著名的"貓咪論文"在圖像分類上取得了突破;2014年,我們引入了Google DeepMind;2016年1月是AlphaGo的時刻。然後人們會注意到——許多人在2016年5月確實注意到了——我們宣佈了我們的第一款TPU。
是的,所以在2016年,看到這一切,我很清楚我們將要經歷另一次平台轉變。那就是對全端模式的押注,將 Google 定位為一家 AI 優先的公司。
從那以後,我們取得了許多進展。有太多來自Google的突破,包括Transformer。我們將其應用到我們的產品中,如Bert和MUM,讓搜尋變得更好,發佈Google Photos等等。
但顯然,隨著生成式 AI 時刻的到來,我意識到這個機會窗口甚至更大了。人們已經準備好大規模使用這項技術了,無論是消費者、開發者等等。那麼如何應對這樣的時刻呢?對我們來說,AI意味著我們啟動了 Gemini項目,橫跨Google Brain 和Google DeepMind。作為其中的一部分,我們決定將團隊合併為Google DeepMind,我們真正加大了在基礎設施、資料中心、TPU、GPU等方面的投入。
接下來,你知道需要讓公司進入更快的節奏,對吧?你現在擁有了技術,一旦GDM團隊開始發佈Gemini,你可以談論我們經歷的一系列 Gemini里程碑,很高興你在推動這一旅程的很多環節中都發揮了作用。現在,如何確保它在我們的所有產品中體現出來?有許多產品觸及數十億使用者,對吧?如何讓搜尋迭代這些模型所能實現的能力?這就是我們的歷程。但你知道,你可以退一步理解這個框架。
這非常令人興奮,因為這是第一次,當你採用全端方法時,每一層的創新,都會貫穿整個系統,直至頂層。
Logan Kilpatrick:
這就是我向人們解釋預訓練的方式。DeepMind的預訓練在Gemma上效果顯著。我的模型,就像後訓練一樣,強化學習就像是底層能力的加速器。我覺得我們的基礎設施也是如此。
Sundar Pichai:
完全正確。你改善了基礎設施,最佳化了模型在訓練前、訓練後、測試階段和計算方面的表現,我們在那裡等方面讓模型變得更好?或者你如何獲取這些能力並將其體現在產品中,對吧?Nano Banana如何出現在你的產品中?搜尋中帶有AI模式的生成式UI,對吧?所以你在各個層面都進行了改進,更不用說還能將這些改進提供給開發者,讓他們在此基礎上進行創新,對吧?
這就是倍增效應的來源。而這一切總是令人無比興奮。這就創造了這種乘數效應。看著這一切總是令人無比激動。
但是,你知道,我們一直都有著長遠的規劃,思考如何實現目標。有些環節需要時間,因為我們採用的是全端式方法。當我們需要應對人工智慧時代帶來的挑戰時,我不知道,我們當時的能力確實不足。所以,我們需要投資來擴大規模,讓所有環節都達到一定規模,這樣才能保證一定的固定成本。因此,如果你站在外部視角,可能會覺得我們進展緩慢或者落後於時代。但實際上,我們一直在搭建所有必要的框架,然後在此基礎上推進執行。現在我們已經成功了,你可以看到各個團隊都在快速推進。
Logan Kilpatrick:
是的,看到這一切真是不可思議。你提到Gemini出現在我們所有的產品中。我想我當時在和Josh與Tulsi談論這個錨點,關於這個挑戰——我感覺現在其中一些發佈面臨的挑戰是同步發佈,甚至可能不是從產品角度,而是從產能角度,以及如何確保模型在所有不同的產品體驗中都能良好呈現,我感覺這引入了一個新的……我們幾乎……我評論過類似的話,我們已經搞定了模型本身,顯然還有更多工作要做,但將它們部署到 Google的所有產品介面上是極其困難的,這讓我想到了這一點。
我今年在 I/O 大會上有了一個認識,我想和你確認一下,因為也許你有不同的看法,但歷史上,除了你的Gmail或你的Google帳戶之外,似乎沒有這樣一條貫穿線,能夠連接Google 擁有的整個產品套件,從Cloud到Waymo,到Search,再到所有其他產品,如 Gmail。而現在,感覺 Gemini 就是這條貫穿線,實實在在地連接著我們的每一款產品,這感覺就像是正在發生某種神奇的事情。我不知道你對此有何反應。
Sundar Pichai:
我覺得是Gemini。我知道你的看法很好。但對我來說,Gemini的意義遠不止於此。它清晰地體現了“人工智慧優先”戰略的精髓。沒錯,因為現在有了像Gemini這樣切實可見、易於理解的產品。而且,你說得對,Gemini確實能提升從搜尋、YouTube、雲服務到Vemo等方方面面的服務。
關於Gemini 3的發佈,我喜愛的一點是,你談到了同步發佈。我們在許多產品中都同步進行了切換。但對我來說,看到在X上,可能是 Copilot或Replied或Figma,你知道,所有人都聚集在一起,他們也在同步發佈。是的,沒錯。對我來說,這就是規模化的創新,對吧?不僅僅是我們,還有世界上的其他公司。看到這一切非常了不起。
Logan Kilpatrick:
是啊,太棒了。看看其他帖子,還有Nano Banana Pro那次,我肯定你花了不少時間研究這個模型。人們都為之瘋狂,這太棒了。我必須繼續……
Sundar Pichai:
我不禁要問,我們是提高了世界的生產力,還是僅僅滿足了娛樂需求?這到底是淨進步還是不是?那些資訊圖看起來非常驚人。
我認為當我們超越娛樂階段,我剛剛在X上看到Ajrim發佈了他核心織法分析的資訊圖。
所以,你知道,這促使我仔細研究它,試圖理解它。多年前PowerPoint帶來的一個問題是,人們不斷地製作越來越多的幻燈片,而我過去總是收集大量的資訊,資訊量也隨之不斷增長。也許有了Nano Banana Pro,我們又回到了一個可以壓縮資訊並以更易於理解的方式呈現給世界的工具。
Logan Kilpatrick:
是的,這正是我接下來要說的。歷史上我個人一直持懷疑態度的一點是,很多生成式媒體模型對世界到底有多大用處。顯然從娛樂角度來看它是有用的,但感覺:
Nano Banana Pro越過了鴻溝,特別是在資訊圖和與Google搜尋結合進行事實核驗方面,實際上,就像我相信我能清楚地看到這如何成為 Google使命的一部分——組織世界資訊,使其人人可用——通過那些資訊圖。
它讓我震驚,太有趣了。我覺得這是一個很好的提醒,我們將看到那些用例。我記得我們製作某段內容時,Nano Banana團隊說過,他們甚至沒有刻意去讓資訊圖效果很好,只是隨著模型變得非常強大,文字渲染能力大大提高,它就自然而然地發生了。
Sundar Pichai:
這很有趣。另一件向我展示的事情是,世界上蘊藏著多少潛在的創造力。我們正在目睹的另一件美妙的事情是,我認為人們將要表達自己,而我們正在提供工具,讓他們能夠按照自己腦海中的想法去實現,對吧?所以我認為,否則,我們一直受限於人們面前的工具。你可能沒有意識到,但我們正在創造越來越多富有表現力的工具,而且它們對越來越多的人來說越來越容易使用。所以看到這一切,你知道,也同樣令人難以置信。
Logan Kilpatrick:
我稍後還有一個關於這方面的問題,但其中一個……我要歸功於Tulsi。Tulsi昨天建議我在和你談話時問你這個問題,因為她很好奇,當你看到這些發佈和這些Google的重大時刻發生時,你衡量這些時刻成功的參數是什麼?是線上上的反響嗎?是第一天採用情況看起來如何?還是你如何衡量這東西是否真的為Google帶來了改變?
Sundar Pichai:
你看,在發佈日我相當活躍,試圖瞭解什麼在起作用。我在尋找反饋,例如,我在 X 上試圖瞭解,看看普通使用者是如何體驗產品的。我可能會回覆人們說,看,這是一個合理的觀點,我們應該解決它。所以在某種意義上,我通過觀察這些來評估。我很清楚,內部團隊也在使用Gemini本身來收集整理資訊。我們有很棒的儀表板。所以我試圖綜合各種來源的資訊。其中之一是我需要親身感受,對吧?所以我收到報告,但我也在外面試圖瞭解人們如何使用它,他們發佈了什麼,對吧?而且,我認為這很重要。我會走到一些人那裡,或者看著那些顯示多個儀表板的大螢幕,查看QPS,瞭解使用情況,擔心產能問題。但所有這些都讓你真實地感受到人們在做什麼、說什麼。這就是我的方式。結合了線上監控、與人交談、四處走動、與人坐下來交流。我想瞭解,尤其是第一天,這真的有助於我瞭解什麼在起作用,什麼效果不佳。
Logan Kilpatrick:
我感覺現在也能感受到辦公室裡的興奮氣氛。
Sundar Pichai:
我走到那裡都能看到某種banana的版本,某個……
Logan Kilpatrick:
我不知道是誰做的,但Kudos給活動或設施團隊,他們不知怎麼弄來了十萬根香蕉放在這棟樓裡,並讓它成真。令人興奮的是,這還只是 Gemini 3篇章的第一章或第一頁。我們還沒有推出Flash。我們還沒有任何其他3.0類別的模型。我們發佈了Gemini 2.5 Pro。實際上,當我查看一大堆基準測試時,即使是 .5 Pro也並非在所有方面都領先。顯然,競爭對手已經趕上來了。但即使是2.5 Pro 現在仍然是同類最佳,擁有大量能力,並且通過R 在2.5的基礎上又前進了一步。
Sundar Pichai:
2.5 Pro在Google I/O大會上。你可以感覺到這是一個巨大的進步。我認為讓我感覺很好的一點是,Demis的團隊和GDM團隊保持著良好的節奏,對吧?所以我們大約每六個月就會在這方面推進一次。而且這變得越來越難,對吧?因為你是……沒錯,2.5 Pro是一個非常優秀的模型。所以要從中取得明顯的、有意義的飛躍,我認為很難。
但正是這讓人興奮的進步。我知道你總是對Flash感到興奮,它正在開發中並且即將到來。開發者們對Flash感到興奮,因為它能讓你服務更多的人。在追求前沿的過程中,這確實很重要。
所以我對3.0 Flash感到興奮。我認為它將是一個非常優秀的模型。可能會是我們迄今為止最好的一個,對吧?
我們將看到我們內部的預訓練團隊對於下一個版本的想法。所以,這種不斷創新和發佈的文化,我認為讓這個時刻變得特別,而且絕對感覺在進入 2026年之際,隨著我們在技術堆疊所有層面的全面進展,將會有許多令人興奮的進步。
Logan Kilpatrick:
你有什麼奇怪或有趣的發佈日儀式嗎?還是只是努力熬過這一天?
Sundar Pichai:
好吧,通常是這樣的,我早上的習慣總是有點悲傷的是,我會拿起手機瞭解世界上正在發生的事。事實上,我甚至不查看Google的郵件,因為我的想法是,如果有什麼關於Google的有趣事情發生,新聞裡總會有的。所以我試著退一步,吸收新聞。這就是我的做法。所以很大程度上,儀式就變成了使用我們的產品。當我們在新聞中出現時,就試圖理解你之前提到的關於它如何工作的問題。所以這是我的主要習慣。在發佈日,我儘量讓日程不那麼結構化,這樣我可以花時間去那些致力於產品的團隊走走,看看他們,看看他們對自己發佈的東西感覺如何。這種互動對我來說非常重要。所以,是的。
Logan Kilpatrick:
我還有一個這方面的問題,是關於……我有一個有趣的觀察。我想Dennis和其他人可能在公司內部談到過這個,但在grading canopy 辦公室裡面有一個微型廚房,那裡是很多DeepMind方面的行動發生地。每次我在那裡,它都讓我覺得……顯然Google規模龐大,遍佈全球,發生著所有這些事情。但那個藍色的MK讓Google感覺很小,很親切。我很好奇這裡面是否有什麼有趣之處,比如你是如何……它感覺小而親切,我很好奇你是如何……
Sundar Pichai:
哦,這讓我想起了早期的Google。顯然,你知道,我經常去那裡。可能是,你知道,Sergey在那裡,還有像Min、Jeff和Sanjay這樣的人,Parr program still,他們都在製作自己的濃縮咖啡。你怎麼能比在那裡看人們製作濃縮咖啡的精準度更能體會到文化呢?我絕不敢在那裡做濃縮咖啡。我知道很多關於如何製作好咖啡的知識,但我覺得在那群人中間有點膽怯。但是,你知道,不,就在上周,Demis和Oriol還在那裡走動,你知道,那裡人才密集,人們不斷地交流。有人來訪。思想的交流非常活躍。所以我喜歡那樣,你知道,這讓我想起了公司早期的樣子。我們的一些服務團隊,Emma等人也在那裡。你知道,那就是當我提到我要去看QPS時,我可能會去的地方,你知道,我在這些人的螢幕前徘徊,試圖瞭解發生了什麼。所以這絕對是我喜歡公司運作方式的一部分。
Logan Kilpatrick:
是的,我的Google功能請求是,我們需要以某種方式在所有PA重新打造這樣的MK之類的。我不知道這如何實現,但……
Sundar Pichai:
你知道,有其他團隊也有類似這樣的版本。我認為,這確實有助於把人們拉回辦公室,因為當你身處那裡時,你意識到了思想交流的價值。你仍然可以回到你工作的地方,擁有專注的時間,但你知道,那一刻真的很有幫助。我認為,是的。
Logan Kilpatrick:
到目前為止,你談到的很多關於AI的故事,都像是我們在進行這些非常長期的投資,並為公司的成功奠定基礎,比如早在10年前。我很好奇你現在如何看待,或者顯然……這些賭注是正確的,比如Cloud發展得很好,Waymo發展得很好,量子計算希望也會很好。剛剛宣佈了一堆其他的……量子計算的東西超出了我的理解範圍,但我一直在用"氛圍編碼"體驗來試圖理解……
Sundar Pichai:
這是測試 Gemini 3是否能幫助在這些主題上理解得更深入一層的方法之一,這很吸引人。
Logan Kilpatrick:
是的,它能賦予萬物生命,我很滿意我們想要用這個標語表達的意思。但是,您是如何看待未來十年的基礎設施建設的呢?或者,我們是否已經意識到人工智慧才是關鍵,所以現在所有的希望都寄託在它上面了?我很好奇您是如何看待未來十年的發展前景,以及我們現在應該在那些方面進行投資,為下一個成功階段做好準備。
Sundar Pichai:
哦,你看,我認為這始終都很重要,對吧?你知道,十年前,我們押注人工智慧,而且是深入、全端式地投入。我們押注要打造其他大型新業務,實現公司多元化,投資YouTube,投資雲端運算。Google被譽為一家你難以想像的雲原生公司,但我們當時並沒有完全向外部提供這項服務。所以,那是一筆對雲端運算的深度大規模投資。你知道,Waymo,這些都需要時間。Waymo是一項長期投資。我認為我們現在看到的轉折點遠不止於此。
總會有人對未來進行預測,對吧?
量子計算就是一個絕佳的預測。我認為大約五年後,我們會像今天對人工智慧那樣,對量子計算感到無比興奮。但我一直在思考這個時間框架。
舉個例子,兩周前我們宣佈了“太陽捕手計畫”(Project Sun Catcher),我們將在太空建造資料中心。顯然,這就像登月計畫一樣。現在看來,有些想法確實很瘋狂。但你知道,當你真正冷靜下來,設想一下我們將來需要多少計算資源時,一切就變得合理了,這只是時間問題。那麼,如何才能取得進展呢?你需要倒推時間,制定 27 個里程碑,然後逐步推進。
所以,到 2027 年,我們或許就能在太空中部署一些 TPU(時間處理單元)。哦,說不定我們還能遇到一輛特斯拉跑車,它也在太空中飛行。
想想就覺得很有意思。但這就是你想要承擔並實施的長期項目的例子,還有像AlphaFold這樣的同構項目,以及無人機送貨的Wing。我們正在機器人領域進行激動人心的工作。所以,你知道,要著眼長遠,不斷取得進展。
Logan Kilpatrick:
當我看到TPU要上太空時,我聯絡了Thomas,我說我們應該在月球車上搭載Gemini,然後讓它探索月球。這將是一個很棒的行銷活動,即使科學上不是超級有用。所以……
Sundar Pichai:
誰知道呢,也許產品已經在某個地方進行了。
Logan Kilpatrick:
我相信是的。這個……你之前提到過這個線索,即能力持續提升,相當於為每個人提高了創造力的基礎門檻。我個人確實有這種感覺。我感覺自己天生並不是超級有藝術創造力的人。然而我現在可以處理那些歷史上我必須具備創造力才能完成的任務,這賦予了我能力。我感覺自己實際上變得更有創造力了,連看待世界的方式都因為這些工具而改變了,而且不再擔心自己無法做某事。
我認為"氛圍編碼" (Vibe Coding) 就是一個巨大的例子。這是一個關鍵時刻,這股力量——歷史上最具變革性的力量之一,即建立軟體和編碼的能力——現在觸手可及地惠及了更多人。我很好奇你,顯然你有時也進行"氛圍編碼"。我很好奇你如何看待那個時刻,即 AI 建構者(而不僅僅是傳統軟體工程師)能夠……
Sundar Pichai:
去創造東西。現在讓我興奮的是,你知道:
Vibe Coding幾乎就像網際網路的興起,部落格突然出現,更多的人成了寫作者,對吧?還有YouTube,更多的人成了創作者。是的,你可以在程式設計領域感受到這種變化,甚至在Google內部也是如此。
提交第一個認證的人數急劇增加,對吧?而這正是因為這些工具,它們讓這一切變得更加容易,對吧?你知道,也許你是一名產品行銷人員,你有一個想法。過去你會如何描述它呢?
現在也許你有點像是在用"氛圍編碼"把它弄出來,展示給別人看。所以你可以切實地看到這一點在工作中體現。我剛才和團隊裡一位不會程式設計但一直在嘗試的人聊過。他教兒子西班牙語動詞變位,還用Gemini 3 的HML動畫頁面來描述這顆太陽。你看,當你聽到這樣的故事,而且這個人還是我們溝通團隊的成員,對吧?所以你就能看出大家是如何開始著手做的。所以這很有前景。在我有限的時間裡,我也嘗試過。
這幾乎就像,你知道,不僅僅是"氛圍編碼",還有這些IDE,現在它讓編碼變得如此愉快,對吧?當然,我不是在處理大型程式碼庫,那裡你必須確保一切正確,安全性必須到位。所以你知道,那些人應該提出意見。但我確實認為,我感覺事情正變得更容易接近。它再次變得令人興奮。而令人驚奇的是,它只會變得更好。
現在,每當人們和我談論Waymo 時,我總喜歡說:記住,這是 Waymo駕駛技術最差的時候,對吧?它只會變得更好。同樣地,對於我們正在做的所有這些工具,你知道,在AI Studio中使用Gemini 3 進行"氛圍編碼",你知道,看到它既令人驚嘆,同時它也是它最差的狀態。是的,沒錯。兩者同時成立。所以,從某種意義上說,你將看到未來有很多進步。所以我認為這絕對是一個激動人心的時刻,迫不及待地想看看世界上的人們用它創造出什麼。
Logan Kilpatrick:
是的,太棒了。我想我的最後一個問題是,接下來是什麼?我們可以期待什麼?有很多很酷的東西在籌備中,但有什麼是最先想到的嗎?
Sundar Pichai:
我想有些人需要休息一下。我希望團隊,我們所有人,能稍微休息一下。但是,你看,我對Gemini的路線圖感到興奮。我對它如何融入我們所有產品感到興奮。我們也在發佈新東西,對吧?我喜歡Flow。我一直在體驗 Flow notebook alum。你知道,它有一個熱情增長的社區,看到記者在上面工作,人們用它們進行博士研究,真的把所有研究都放在裡面,這太神奇了。所以未來還有更多。
Logan Kilpatrick:
我很期待。謝謝你,Sundar,接受採訪。也謝謝大家觀看。我們下期再見。 (軲轆凱)