【新智元導讀】2025年8月,一個叫Nano Banana的圖像生成器沖上LMArena榜首,後來Gemini App成為蘋果商店下載量第一,OpenAI內部發出Code Red。但很少有人知道,這場逆襲的起點是2012年太浩湖賭場酒店的一場秘密競拍。此後十三年,Google收購DeepMind、發明Transformer、自研TPU晶片、經歷ChatGPT衝擊和Bard翻車,直到創始人Sergey Brin回歸、核心人才Noam Shazeer歸來,才在2025年完成反超。這是一個關於人才、時間與長期主義的故事。
2025年8月的一個凌晨兩點半。
Google的AI項目經理Naina Raisinghani正坐在電腦前,準備把DeepMind實驗室的最新成果——一個超快的圖像生成器——上傳到LMArena排名平台。
系統需要一個名字才能提交。
這個點沒人線上。
於是她隨手用朋友給她起的兩個外號拼了一個:Nano Banana🍌。
幾天後,Nano Banana沖上排名榜首,在X上成為熱門話題,全球使用者生成了數十億張圖片。
Google一度找不到足夠的算力,只能緊急借用伺服器。
負責人Josh Woodward後來把這次發佈稱為「成功的災難」。
到9月,Gemini App成了蘋果應用程式商店下載量第一。11月,Google發佈了迄今最強的Gemini 3模型,在多項指標上超越ChatGPT,股價大漲。
消息傳回矽谷的另一端,OpenAI內部發出了Code Red。
如果說人工智慧是一場馬拉松,那麼Google剛剛完成了一次史詩級的衝刺。
但很少有人知道,這場逆襲的起點,要追溯到十三年前一家賭場酒店的703號房間。
2012年12月初的一天,一場秘密競拍正在美國滑雪勝地太浩湖(Lake Tahoe)的一家賭場酒店裡進行。
太浩湖位於加州和內華達州交界處,是北美最大的高山湖泊,擁有藍寶石般的湖面和頂級雪道。
《教父2》曾在這裡取景,馬克吐溫曾在此地流連忘返。
由於離舊金山灣區只有200多英里,這裡被稱為矽谷的後花園——祖克柏和埃裡森都在此圈地佔山,興建豪宅。
但這一天,矽谷的大佬們沒有來滑雪。他們在競拍一個人。
秘密競拍的對象,是一家剛剛成立1個月、僅有3名員工的公司——DNNresearch。
它沒有任何有形的產品或資產,但追求者的身份暗示出了它的份量:Google、微軟、DeepMind和百度。
65歲的Geoffrey Hinton坐在酒店703房間的地板上。他蒼老、瘦削,飽受腰椎間盤的疼痛折磨——不能開車,也不能坐飛機。這位多倫多大學教授是深度學習領域的宗師級人物,從1972年進入愛丁堡大學算起,他已經在這條路上鏖戰了40年。
他為競拍設定了規則:起價1200萬美元,每次抬價至少100萬美元。
幾個小時後,價格被推到了4400萬美元。辛頓有些頭暈,感覺「我們像是在拍電影」。他果斷喊停,把公司賣給了最後的喊價者——Google。
有意思的是,這場4400萬美元競拍的源頭之一,正是來自6個月前的Google。
2012年6月,Google研究部門Google Brain公開了一個叫「Google貓」的項目成果。
簡單來說,這個項目就是用演算法在YouTube的視訊裡識別貓。
它由從史丹佛跳槽來Google的吳恩達發起,拉上了Google傳奇人物Jeff Dean入夥,還從創始人Larry Page那裡要到了大筆預算。
Google貓搭建了一個神經網路,動用了遍佈Google各個資料中心的16000個CPU進行訓練,最終實現74.8%的識別精準率。
這一數字震驚業界。
但吳恩達在項目臨近結束前激流勇退,投身自己的網際網路教育項目。臨走前他向公司推薦了辛頓來接替他的工作。
面對邀請,辛頓表示自己不會離開大學,只願意去Google待一個夏天。
由於Google招聘規則的特殊性,時年64歲的辛頓成為了Google歷史上最年長的暑期實習生。
這位實習生瞭解了Google貓項目的技術細節後,馬上看到了項目成功背後的隱藏缺陷。他後來說:他們運行了錯誤的神經網路,並使用了錯誤的計算能力。
同樣的任務,辛頓認為自己可以做得更好。
於是在短暫的實習期結束後,他馬上投入行動。
辛頓找來了自己的兩個學生——Ilya Sutskever和Alex Krizhevsky,兩人都是出生於蘇聯的猶太人,前者極具數學天賦,後者擅長工程實現。三人密切配合,建立了一個新神經網路,參加了ImageNet圖像識別大賽。
2012年10月,辛頓團隊的冠軍演算法AlexNet以驚人的84%識別精準率奪冠。
相比Google貓用了16000顆CPU,AlexNet只用了4顆輝達GPU。
學術界和產業界徹底轟動。
AlexNet的論文成為電腦科學史上最有影響力的論文之一,目前被引次數已經超過12萬。而Google貓則被迅速遺忘。
太浩湖的4400萬美元,給全球的深度學習大神做了一次重新定價。在那個價格面前,圖靈獎的100萬美元獎金看起來都像是零花錢。
Google在拿下辛頓團隊後再接再厲。
2014年1月,Google以約6億美元收購了當年在太浩湖競拍中與之競爭的DeepMind。
這家倫敦公司的創始人Demis Hassabis是一個國際象棋神童,4歲開始接觸國際象棋,14歲成為國際象棋大師。
馬斯克曾向Google創始人Larry Page推薦了自己投資的這家公司。
為了能帶上辛頓一起去倫敦驗證DeepMind的成色,Google團隊專門包了一架私人飛機,並且改造了座椅——因為辛頓的腰椎問題讓他無法乘坐普通飛機。
收購完成後,Google的AI版圖上已經聚集了當時最頂尖的深度學習人才。
與此同時,一個不太引人注目的項目正在悄悄進行:Google開始自研AI晶片。
他們認為語音識別這類應用會需要大量算力,於是設計了TPU(張量處理單元),比傳統CPU和GPU更省電。
這一步棋當時看起來並不顯眼。
但十多年後,它將成為Google反超的關鍵武器。
2016年3月,DeepMind的AlphaGo以4:1擊敗圍棋世界冠軍李世石,震驚全球。
這是AI第一次在這種極其複雜的策略遊戲中戰勝人類頂尖選手。
那一年,Sundar Pichai剛接任Google CEO不久。他在部落格裡寫道:過去十年是智慧型手機的時代,未來十年將是AI優先的時代。
2017年6月,Google的一個團隊發表了一篇名為《Attention Is All You Need》的論文。8位Google科學家提出了Transformer模型——一種徹底拋棄循環神經網路、完全基於注意力機制的新架構。
這篇論文開啟了如今的大模型時代。ChatGPT、Claude、Gemini……所有當今最強大的AI模型,都建立在Transformer的基礎之上。
截至2025年,這篇論文被引用超過17.3萬次,位列21世紀被引用最多的論文前十。
但諷刺的是,8位作者後來全部離開了Google,創辦或加入了其他公司。
其中一位叫Noam Shazeer。
記住這個名字。
儘管Google擁有最強的技術積累和最頂尖的人才,但在聊天機器人這條賽道上,它一直表現得異常謹慎。
2021年5月,Google發佈了LaMDA——一個基於Transformer的對話大模型。
但它只對少數人開放測試,限制極多。2022年8月,Google推出了測試應用AI Test Kitchen,有三個功能:想像它、列出它、聊狗。
沒錯,第三個功能只能聊狗。
Google的高管和研究員們擔心安全問題。早期模型很容易被誘匯出種族歧視或性別歧視的回答。前Google Brain員工Julia Winn說,Google對這類風險看得比她待過的任何公司都重。
這種謹慎讓一些研究員很沮喪,有的選擇了離開。
然後,2022年11月30日,OpenAI發佈了ChatGPT。
五天內,一百萬人註冊。使用者沒有太多限制,想聊什麼聊什麼。
Google內部一些在AI上耕耘多年的員工氣壞了。
分析師和投資者開始質疑:Google是不是要錯過科技史上的下一波大浪?
2023年1月,Jeff Dean、Demis Hassabis和新加入的機器人專家James Manyika向董事會匯報了打造最強模型的計畫。
但Google等不及了,需要先推一個產品出來。
2023年2月6日,他們匆忙發佈了基於LaMDA的聊天機器人Bard。
發佈會翻車了。
宣傳視訊裡,Bard被問到韋伯望遠鏡的問題,回答說它拍了第一張系外行星照片。
這是錯的。第一張系外行星照片是2004年歐洲南方天文台的甚大望遠鏡拍攝的。
Alphabet股價當天下跌8%,市值蒸發約1000億美元。
這是GoogleAI歷史上最黑暗的時刻之一。
差不多同一時間,已經退休的Google聯合創始人Sergey Brin在一個派對上碰到了OpenAI的研究員Daniel Selsam。
Selsam問他:ChatGPT這麼厲害,作為電腦科學家你不心動嗎?怎麼不回來全職搞AI?
Brin覺得他說得有道理。
這位2019年從執行層退休的聯合創始人,開始幾乎每天參與AI工作。
他深入瞭解技術細節,研究損失曲線,每周參與前沿AI研究的討論。他還幫Gemini挑毛病,並且參與了關鍵人才的招聘。
Brin後來說:任何電腦科學家現在都不應該退休。
他還促成了一筆關鍵的交易。
Noam Shazeer是2017年Transformer論文的8位作者之一。
他後來離開Google,與Daniel De Freitas共同創辦了Character.AI——一家專注於AI角色對話的創業公司。
這兩個人還有另一個共同點:他們都是LaMDA的關鍵開發者。
2024年8月,一個價值27億美元的交易讓這兩位叛將回歸了Google DeepMind。
嚴格來說,這不是一次收購——Character.AI繼續獨立營運,但Shazeer、De Freitas和約30名研究人員回到了Google。
Google要回的不是公司,是人。
這兩人後來參與領導了Gemini的開發。
整合
2023年4月20日,Sundar Pichai宣佈了一個重大決定:Google Brain與DeepMind合併,成立新的GoogleDeepMind。
這兩個團隊此前一直分頭運作,文化也不相同。Google Brain偏研究,總部在美國;DeepMind偏產品,根基在英國。兩邊合併後產生了不少摩擦。
但在ChatGPT的壓力下,Google別無選擇。
Demis Hassabis被任命為Google DeepMind的CEO。Jeff Dean轉任首席科學家。
與此同時,Google有一個OpenAI沒有的優勢:OpenAI需要融資,而Google可以從自己每年幾百億美元的利潤裡拿錢做研發。
2023年底,Google發佈了第一版Gemini。
與ChatGPT主要用文字訓練不同,Gemini從一開始就用文字、程式碼、音訊、圖像和視訊一起訓練。
這是技術野心更大的方案,雖然開發時間更長,但後來被證明是值得的。
2024年10月,Demis Hassabis和John Jumper因AlphaFold獲得諾貝爾化學獎。
AlphaFold解決了困擾科學界50年的蛋白質折疊問題——僅憑氨基酸序列就能精準預測蛋白質的三維結構。
這是AI對基礎科學的歷史性貢獻。
對Google來說,這是一個轉折訊號:他們的科學家正在拿諾貝爾獎,而不只是追著競爭對手的尾燈跑。
關於這個故事,歡迎收看我認為目前最精彩的紀錄片。
《The Thinking Game | Full documentary | Tribeca Film Festival official selection》
2025年4月,Google發佈了第七代AI晶片Ironwood。
每顆晶片可達4,614TFLOPs的FP8性能。
最多9,216顆晶片可以互聯成一個超級算力叢集,總性能達到42.5Exaflops——這是當時世界最強超級電腦El Capitan的24倍。
比第一代Cloud TPU能效提升了30倍。
當Google在2013年開始秘密研發TPU時,沒有多少人意識到這步棋的意義。
那時候,Nvidia的GPU還是AI訓練的絕對霸主;那時候,ChatGPT還不存在;那時候,大多數人連大語言模型這個詞都沒聽說過。
但十二年後,這步落子終於開花結果。
消息傳出:Google正在和Meta談判,要賣給他們價值數十億美元的TPU晶片。
Nvidia股價當天下跌7%。
2025年8月,Nano Banana橫空出世。
這個隨手起的名字沖上了LM Arena排名榜首。全球使用者瘋狂使用,生成了數十億張圖片。Google的伺服器一度不堪重負。
負責人Josh Woodward把這次發佈稱為成功的災難。
到9月,Gemini App成為蘋果應用程式商店下載量第一。月活使用者從7月的4.5億漲到了10月的6.5億。
11月,Gemini 3發佈。在多項基準測試中超越ChatGPT。自研的Ironwood晶片大幅降低了AI模型的運行成本。
Pichai在12月的內部備忘錄裡寫道:我們以很棒的姿態結束了2025年。想想一年前我們在什麼位置,這個進步令人難以置信。
Google用了十三年完成這場逆襲。
從2012年太浩湖的4400萬美元競拍,到2014年收購DeepMind,到2017年發表Transformer論文,到2023年經歷Bard的翻車和團隊的整合,再到2025年Gemini 3的登頂和晶片業務的突破。
期間有無數次可能走岔的路口:
如果2012年百度而不是Google贏下了辛頓,歷史會怎樣?
如果8位Transformer作者沒有全部離開Google,會怎樣?
如果Sergey Brin沒有在那個派對上被一句話刺激到,會怎樣?
如果Noam Shazeer沒有回歸,會怎樣?
但歷史沒有如果。
回看這十三年,有一個貫穿始終的主題:人才。
太浩湖的秘密競拍搶的是人。收購DeepMind買的是人。Sergey Brin回歸是人的回歸。Noam Shazeer的27億美元交易,本質上還是請人回來。
在前沿技術領域,一個頂級學者的作用,往往大過一萬個普通工程師。這就是為什麼Google願意花4400萬美元買下一家沒有產品、沒有收入、只有三個人的公司。這就是為什麼Brin願意從退休生活中走出來。
而另一個主題是:時間。
TPU晶片從2013年開始研發,到2025年成為競爭優勢,中間隔了12年。Transformer論文發表於2017年,但它的全部威力要到2022年ChatGPT發佈後才被世界看見。深度學習的先驅們從1970年代就開始了探索,卻要等到2012年才迎來產業化的曙光。
偉大之所以為偉大,不是因為其橫空出世時的驚豔,而是因為它要在無邊黑暗中,忍受漫長的籍籍無名與不被理解。直到多年之後,人們才能順著這些標尺,感嘆那時群星璀璨,天才輩出。
2025年末,AI競賽遠沒有結束。OpenAI後來也發佈了更強的ChatGPT,使用者量仍然遠超Gemini。這場馬拉松還在繼續。
但至少,Google已經證明了一件事:
即使是科技巨頭,也可以從落後中爬起來。即使是ChatGPT的衝擊,也沒有把Google打倒。
只要有人才,只要有耐心,只要有足夠長的時間線,逆襲永遠可能發生。
畢竟,Nano Banana這個名字,不過是一個項目經理在凌晨兩點半隨手起的。
而它背後,是十三年的佈局——和無數個不眠之夜。 (新智元)