#哈薩比斯
讀《哈薩比斯》以及AI時代的啟示錄
花了兩周時間,斷斷續續讀完了《哈薩比斯:GoogleAI之腦》,它雖無《馬斯克傳》的跌宕起伏,卻以更冷靜的筆觸剖析了天才與時代的真相,讓人清晰窺見AI文明崛起的底層邏輯,瞭解一位異類先行者如何親手改寫人類智能的未來。在科學史的浩瀚長河中,時常會出現一種偉大的理論以摧枯拉朽之勢取代另一種理論的壯闊景象。哥白尼的日心說將人類從宇宙中心的幻覺中喚醒,愛因斯坦的廣義相對論則重塑了牛頓力學統治下的絕對時空觀。今天,我們或許正處在思想進步的又一個歷史性分水嶺——一個有望將各個孤立領域的知識融合成統一理論的奇點時刻。《哈薩比斯》這本書,正是一部記錄這個奇點時刻如何孕育、爆發與演進的啟示錄。它以DeepMind創始人德米斯·哈薩比斯的傳奇經歷為主線,不僅全景式地復盤了Google與OpenAI之間驚心動魄的矽谷暗戰,更深刻探討了通用人工智慧(AGI)的本質及其對人類未來的終極意義。不走尋常路的成長與成名哈薩比斯的成長軌跡,生動地詮釋了何為「天命之子」。彼得·蒂爾曾一針見血地評價:天才的卓越往往體現在特定的使命上,他們彷彿是為完成某項特定任務而量身定製的。對哈薩比斯而言,他的絕對使命就是創辦一家追求AGI的公司並實現它。回溯他的早年經歷,你會發現他本能地抗拒著循規蹈矩。他的一生都在走自己的路:年少時便嶄露頭角贏得國際象棋冠軍,未成年就破格為知名遊戲製作人彼得·莫林紐克斯打工,主導開發經典遊戲。在劍橋大學求學期間,面對當時學術界普遍的「AI懷疑論」,他表現出了一種過於早熟的不耐煩。他身上有著與傳統英國人內斂作風截然不同的狂熱創業激情。為了真正破解「智能」的奧秘,他完成了一次驚人的跨界——從遊戲設計領域毅然轉身,一頭紮進認知神經科學的深海,去研究人類大腦的記憶與想像機制。這種跨界並非一時興起,而是他深刻認識到:要創造機器智能,首先必須逆向工程自然界最完美的智能實體——人腦。這種將電腦科學與神經科學深度融合的底層DNA,為後來DeepMind的誕生埋下了最核心的伏筆。DeepMind的創立與理想大多數矽谷的創業項目,其核心目標是將已知的技術轉化為商業產品,這本質上是一個工程挑戰。然而,像DeepMind這樣的高科技初創公司,成立的初衷是發明技術本身,去觸碰人類認知的邊界,這是一場純粹的科學挑戰。這種根本性的差異,決定了DeepMind必須擁有特殊的組織結構和人員配置。在工程類公司中,需要的是務實的問題解決者,他們注重KPI,會不惜一切代價按時交付特定產品。但在DeepMind這樣的科學類初創公司,哈薩比斯聚集了一群能在未知領域自由探索的、天馬行空的思考者。正如書中刻畫的天才群像:大衛·西爾弗作為DeepMind核心研究員、強化學習領域領軍者,畢生使命是不斷拓寬強化學習的邊界;弗拉德·莫尼赫則是深度學習與強化學習融合的關鍵研究者,致力於實現兩大領域的歷史性交匯。彼時AI競賽白熱化,Google為搶佔通用人工智慧戰略高地、阻擊競爭對手、鎖定頂尖科研團隊與前沿技術,以重金將DeepMind收入麾下,更承諾保留其科研獨立性與算力資金全力支援。哈薩比斯借此撬動Google龐大的算力與資本,將這群天才的理想鑄成現實——2016年AlphaGo橫空出世,4:1擊敗圍棋傳奇李世石,以驚世之戰宣告AI正式突破人類智慧壁壘。在哈薩比斯看來,實現AGI的科學願景高於一切,被科技巨頭收購絕非妥協,而是借時代之力,成就終極目標的必然抉擇。跌入谷底與絕地反擊然而,歷史的劇本往往充滿戲劇性。在很長一段時間裡,科技界早已習慣了DeepMind在圍棋和蛋白質折疊(AlphaFold)領域的降維打擊,卻未曾料到,另一場風暴正在悄然醞釀。2017年6月,Transformer架構橫空出世,徹底改寫AI發展軌跡。這一架構完美契合伊利亞·蘇茨克維(OpenAI聯合創始人、首席科學家,師從深度學習泰斗辛頓,是GPT技術路線的奠基人)的核心專長,Transformer也由此成為OpenAI崛起的絕對基石,為後續大模型時代拉開序幕。與深耕基礎科學的哈薩比斯不同,OpenAI的創始團隊呈現出截然不同的特質。其創始人之一馬斯克,是一位在航天和汽車領域叱咤風雲、性格中帶著滑稽、嫉妒心強且極度自負的商業巨頭;而年輕的聯合創始人山姆·奧特曼,則是一位能言善辯的社交達人、敏銳的投資者和極具野心的機會主義者(他甚至曾在2017年考慮競選加州州長)。「在矽谷創造的財富越多,權力就越大」的叢林法則下,奧特曼憑藉極強的工程產品化能力和激進的商業策略,推出了ChatGPT。這一擊,直接命中Google的軟肋。Google一度輸掉了大語言模型和推理模型的競爭,這家曾經的AI霸主在輿論和資本市場上被OpenAI「按在地上摩擦」,陷入了前所未有的被動與恐慌。面對危機,哈薩比斯本能地抗拒效仿OpenAI那種略顯浮躁的「暴力美學」和激進行銷,但他別無選擇地承接了歷史重任——率領GoogleDeepMind進行絕地翻盤。他的應對策略並非簡單的跟隨,而是在更高維度上展開反擊:不僅要追平語言模型的差距,更要在多模態模型、世界模型、持續學習等方面實現從0到1的突破。Gemini的誕生,正是哈薩比斯在商業壓力與科學理想之間艱難平衡後交出的答卷,標誌著GoogleAI開始從陣痛中甦醒,重新奪回技術高地的控制權。萬物理論,AI的終極哲學《哈薩比斯:GoogleAI之腦》不僅是一部商業戰史,更是一部科技哲學著作。自愛因斯坦之後,無數頂尖物理學家窮盡畢生精力,都未能如願找到一套能解釋所有現實的「萬物理論」。哈薩比斯給出了一個極具顛覆性的視角。資訊理論之父香農曾用一個簡單卻深刻的觀點定義資訊:資訊是不確定性的對立面。任何不確定性的減少,都依賴於經過智能處理的資訊。哈薩比斯堅信,資訊才是構成現實的最基本單位。「萬物理論」這種能將不確定性無限趨近於零的終極真理,極有可能會以電腦程序的形式呈現。自然界中任何可生成或存在的模式,本質上都能被經典的學習演算法高效地發現並建模。一台能夠自主學習並歸納自然規律的機器,將是人類理解現實最強大的工具。在哈薩比斯眼中,真正的通用智能(AGI)將讓幾乎一切成為可能。它的重要性將遠遠超過網際網路、印刷術甚至工業革命。它將徹底打破人類社會的資源詛咒,引領人類進入一個智能和物質極大豐富的「後稀缺時代」——這正是他青少年時期在科幻小說中無數次憧憬過的未來。群雄逐鹿與人類文明的新躍遷審視當下的AI戰局:ChatGPT、Claude、Gemini、xAI、豆包、千問等群雄逐鹿,本質是不同價值觀與技術路線的激烈碰撞。以奧特曼為首的OpenAI陣營,代表了極具野心、快速迭代、產品導向的矽谷實用主義。他們以「大力出奇蹟」的方式驗證了Scaling Law(縮放定律),是極具破壞力的時代顛覆者;Anthropic旗下的Claude,則秉持安全優先、可控可靠、倫理先行的研發理念,走穩健克制、追求AI對齊的技術路線,是AI安全陣營的堅定代表;字節跳動的豆包,則依託龐大生態與場景化能力,輕量化落地、讓AI真正融入日常;阿里的千問,則深耕產業賦能與政企服務,是產業智能化的堅實力量;馬斯克的xAI則帶著強烈的個人英雄主義與反叛精神,試圖打破現有格局的壟斷與桎梏。而哈薩比斯與他麾下的Gemini,更像一群純粹的科學信徒。他們雖在商業化步伐上一度滯後,甚至顯得沉穩笨拙,卻對通用智能的底層邏輯有著更深邃的探索——從強化學習與世界模型的融合,到AI for Science的長遠佈局,始終錨定智能本質。這一波AI浪潮的從業者,無論身為野心家、工程師還是科學家,都在共同推動人類歷史上最偉大的技術躍遷。他們早已不只是程式碼的編寫者,更是未來文明的架構師。Google與OpenAI的戰火仍在蔓延,但對整個人類而言,這場競爭無論勝負,都在加速「後稀缺時代」的到來。這個時代充滿未知與變數,唯一確定的是:智能的進化已然不可逆,每個人都是這場偉大遠征的親歷者與見證者。與其淪為抗拒變革、固步自封的盧德分子,不如主動擁抱技術浪潮,拓展邊界,共同奔赴智能文明的新彼岸。 (禇偉)
LeCun哈薩比斯神仙吵架,馬斯克也站隊了
吵起來了。圖靈獎得主和諾貝爾獎得主,為了“智能的本質”——直接激情友好地交流上了。AI三巨頭之一、圖靈獎得主Yann LeCun明確表示:純粹就是胡扯(complete BS)。而諾貝爾獎得主、GoogleDeepMind CEO哈薩比斯也不留情面了,指名道姓回擊:LeCun的說法簡直是大錯特錯。論戰之激烈,關注度之高,已經讓𝕏專門開闢了一個話題類股:馬斯克也跑來吃瓜了——沒有任何多餘的解釋,但這波他站哈薩比斯——“Demis is right”。當然,馬斯克的站隊可能也有別的原因。畢竟他和LeCun素來不是很對付,跟哈薩比斯則亦師亦友——馬斯克還是哈薩比斯DeepMind早期投資人。要科學吃瓜,可能還是要知道他們究竟在激辯什麼?爭論焦點:智能的本質是什麼?事情還要從LeCun幾天前接受的一場採訪說起。他在節目中言辭犀利地指出:根本不存在所謂的“通用智能”,純粹就是胡扯(complete BS)。這個概念毫無意義,因為它實際上是用來指代人類水平的智能,但人類智能其實是高度專業化的。我們在現實世界裡確實幹得不錯,比如認個路、導航blabla;也特別擅長跟人打交道,因為咱們進化了這麼多年就是幹這個的。但在國際象棋方面,我們表現很差。而且還有一堆事兒都搞不定,反倒是有些動物比我們強得多。所以說,我們其實就是“專才”。我們認為自己是“通用”的,但這僅僅是一種錯覺,因為我們能理解的所有問題都侷限於我們能想到的那些。簡單概括就是,LeCun認為人類智能並不“通用”,而是為了適應現實物理世界而專門進化出來的某種專業能力。人類之所以擅長識別物體、躲避危險、與他人合作等,也只是因為這些能力在進化中被環境塑造。然而,這一觀點很快遭到了哈薩比斯的直接回懟。哈薩比斯表示:LeCun的說法簡直是大錯特錯。他這是把“general intelligence”和“universal intelligence”兩個概念搞混了。然後他一一駁斥了LeCun的觀點,其原話如下:大腦是目前宇宙中已知最精妙、最複雜的事物,實際上具有極強的通用性。但是在實際的系統當中,“天下沒有免費的午餐”這個道理是無法迴避的——任何實際且有限的系統,在其所學目標分佈周圍,都必然存在一定程度的專門化。但從圖靈機的理論意義上講,通用性的核心在於,只要給予足夠的時間、記憶體(及資料),就能夠學習任何可計算的內容。而人腦(以及AI基礎模型)正是近似的圖靈機。並且,針對LeCun關於國際象棋棋手的評論,哈薩比斯認為人類能發明國際象棋本身就令人驚嘆,更不用說從科學到波音747等現代文明的一切了。關於LeCun對棋手的評論——人類最初竟能發明國際象棋(乃至從科學到波音747的整個現代文明!)本就令人驚嘆,更不用說還能出現像馬格努斯·卡爾森那樣棋藝卓絕的人物。他或許並非嚴格意義上的最優解(畢竟記憶有限、決策時間也受限),但考慮到我們的大腦本是為狩獵採集而進化,他和我們如今所能成就的一切,已足以展現人腦的驚人潛力。顯而易見,哈薩比斯對“智能”的理解從不侷限於電腦科學,而是深度融合了神經科學。一直以來,他認為真正衡量智能的兩個關鍵標準分別是通用性(Generality)和學習能力(Learning),為此他經常拿1997年“深藍”戰勝卡斯帕羅夫舉例——雖然“深藍”在國際象棋上很強,但還是連簡單的井字遊戲都不會玩,所以足以見得這種程序的死板之處。而關於這場對決,哈薩比斯還透露,最吸引他的不是“深藍”這個系統,而是卡斯帕羅夫的大腦(畢竟他能作為人類代表與AI進行比賽)。沒錯,又是“大腦”這個關鍵詞。哈薩比斯一直堅信,人類大腦是宇宙中已知的唯一關於“通用智能可行性”的存在性證明。當大腦和AI結合之後,所謂的“通用人工智慧”其實就是能夠展現出人類所擁有的所有認知能力的系統。至於具體如何實現AGI,哈薩比斯多年來也形成了一套自己的方法論,總結起來就是——預測建構理解,規劃擴展可能,強化學習實現自主進化。第一步:以預測為基石。在他看來,智能的本質在於預測——無論是預測下一個單詞還是預測蛋白質的折疊形狀。這是所有認知活動的基礎形式,也是AI理解世界的內在驅動力。第二步:引入搜尋與規劃AI系統首先要建立一個世界模型,然後在此基礎上進行搜尋或規劃,以在巨大的組合搜尋空間中找到最優解。第三步:最終通向深度強化學習這是哈薩比斯最推崇的終局路徑,也是對大腦運作方式的模擬——深度學習負責模式匹配和尋找結構,強化學習負責通過試錯進行規劃和達成目標。這在生物學上對應著大腦的神經通路和多巴胺獎勵系統。至此,我們看到兩位大佬關於智能本質的爭論,表面上看起來似乎確實截然不同。一個認為“通用性智能”是胡扯,本質上智能是自然世界高度專業化的產物;另一個認為通用性智能不僅存在,而且仍有巨大潛力有待挖掘。但事實,真的如此嗎?上述爭論過後,LeCun又再次出來回應了,而且這次直接點名了分歧核心——用詞。我認為分歧主要在於用詞。我反對用“通用(general)”來指代“人類水平”,因為人類是高度專門化的。不過,雖然承認用詞有分歧,但他還是繼續重申了“人類智能並不通用”的觀點。其論證如下:第一,理論完備≠實際通用。你也許不同意人類思維是專門化的,但事實確實如此。這不僅是理論能力的問題,更是實踐效率的問題。顯然,一個經過良好訓練的人腦,如果配合無限量的紙和筆,是圖靈完備的。但對於絕大多數計算問題來說,這種方式效率極低,因此在資源受限的情況下(比如下棋),它遠非最優方案。就是說,哈薩比斯所構想的“理想的圖靈機”對解決現實問題幾乎沒有意義,因為真正的智能必須在有限資源下高效運作——而人腦的進化恰恰是資源約束下高度最佳化的結果。第二,兩個典型例子可以反映大腦的“非通用性”。在理論上,一個兩層神經網路可以以任意精度逼近任何函數;但在實踐中,幾乎所有有意義的函數都需要隱藏層中包含數量巨大、難以實現的神經元。正因如此,我們才使用多層網路——這正是深度學習存在的根本原因。再換一個角度來看:視神經大約有100萬根神經纖維。為了簡化討論,我們假設訊號是二進制的,那麼一次視覺任務就可以被視為一個從100萬位元對應到1位元的布林函數。在所有可能的此類函數中,有多少是人腦可以實現的?答案是:一個無窮小的比例。通過這兩個例子,LeCun再次重申了自己的觀點:所以我們不僅談不上“通用”,而且是極其高度專業化的。可能的函數空間極其廣闊。我們之所以沒有意識到這一點,是因為其中絕大多數函數對我們來說複雜到難以想像,看起來幾乎完全是隨機的。而且他還提到了愛因斯坦曾經說過的一句話——世界上最不可思議的事情,是世界竟然是可以被理解的。在所有可能的、隨機的世界組織方式中,我們竟然能夠理解其中極小的一部分,這本身就令人驚嘆。而我們無法理解的那一部分,我們稱之為“熵”。從這個意義上說,宇宙中絕大多數的資訊都是熵——是我們孱弱的認知能力無法理解、因而只能選擇忽略的內容。總之,事情battle到最後,網友們也是紛紛回過神來了——這場爭論最大的bug可能就在用詞上了。而拋開用詞不談,本質上來看,兩個人其實更像是在談論不同的問題:一個核心在強調“我們是什麼”,另一個則在強調“我們能成為什麼” 。而這,也恰恰指向了同一個更深層、也更現實的議題——接下來,我們究竟該以怎樣的方式實現AGI?答案:世界模型不管是在LeCun還是哈薩比斯這裡,答案其實都已經很清晰了——世界模型。眾所周知,即將從Meta正式離職的LeCun,下一站就是創業世界模型。據《金融時報》爆料,其新公司名為Advanced Machine Intelligence Labs(AMI Labs),計畫於明年一月正式亮相,目標估值30億歐元(約247億人民幣)。在LeCun的理解中,世界模型所要追求的不是渲染精美的像素,而是掌握控制理論和認知科學。他認為對AI而言,只有中間那個抽象表徵才重要(和JEPA研究一脈相承),模型沒必要浪費算力去生成像素,只需專注於捕捉那些能用於AI決策的世界狀態。換言之,瞭解“世界的結構是什麼”才是最關鍵的。而哈薩比斯這邊也在採訪中多次表示,世界模型絕對是自己和Google接下來的重點。今年8月,GoogleDeepMind推出了新版世界模型Genie 3。哈薩比斯表示:我們談論的世界模型,指的是那種能夠理解世界運行機制中因果關係與協同效應的模型,也就是一種“直觀物理學”——事物如何運動、如何相互作用、如何表現。你已經可以在當前的視訊模型中看到這種能力的雛形。而檢驗是否真正具備這種理解的一種方式是否能夠建構一個逼真的世界。因為如果你能夠生成它,那麼在某種意義上,你就已經理解並內化了這個系統的運作規律。這也解釋了為什麼Genie、Veo這些模型首先會以視訊模型的形式出現。在他看來,這種可互動的世界模型正是通往AGI的關鍵一步。通過對比,我們能發現雖然二者都是在描繪“世界模型”,但他們的理解和實踐方向也明視訊記憶體在差別——LeCun代表著“世界模型即認知框架”,而Google哈薩比斯代表著“世界模型即模擬器”。嗯,同一個概念,不同的理解和實踐——怎麼不算一種call back呢?(手動狗頭)Anyway,回顧歷史,實際上AI的每一次躍遷都伴隨著這樣的“爭吵”:符號主義和連接主義的爭論,定義了智能的根基究竟是“邏輯”還是“資料”;端到端學習和模組化系統的爭論,定義了“系統該如何建構”;再加上我們今天的“開源VS閉源之爭”、“智能本質之爭”……還是那些老話,“真理不辯不明”、“真理越辯越明”。不過玩笑說說,等到真理辯明了,那個老頭可要來了……One More Thing幾乎同一時間,LSTM之父Jürgen Schmidhuber又出來隨機掉落了一個“小彩蛋”,他預判了預判——LeCun即將創業的世界模型,他們在2014年就有涉獵了(原話是二者高度相似)。怎麼說呢,Jürgen Schmidhuber老爺子這幾年,基本都在“維權”了。作為LSTM的發明者,LSTM一度在ChatGPT誕生前被稱為“最具商業價值的人工智慧成就”,而作為LSTM之父,Jürgen Schmidhuber早在三巨頭獲得圖靈獎之前就被《紐約時報》稱為“成熟人工智慧之父”。但當AI時代真正到來,各種技術發明者桂冠沒有他、圖靈獎沒有他、諾貝爾獎也沒有他……Schmidhuber只能一次次維權、隔空懟人,最後成為祥林嫂·Schmidhuber。幸好,還有推特,可以讓他首頁上清晰完整展示——以及推特當前的擁有者馬斯克,他評價Jürgen Schmidhuber時言簡意賅:一切的發明者。這,確定不是在陰陽八卦? (量子位)