#Demis
【達沃斯論壇】Demis Hassabis重磅訪談:變革將比工業革命大100倍,快10倍
時間:2026 年 1 月地點:達沃斯世界經濟論壇人物:Demis Hassabis (Google DeepMind CEO) / Emily Chang (Bloomberg)在 2026 年達沃斯的聚光燈下,剛獲得諾貝爾獎的 Demis Hassabis 看起來並沒有顯露出勝利者的輕鬆。相反,這位 Google DeepMind 的掌舵人形容自己處於“每周 100 小時、每年 50 周”的極限工作狀態中。面對 Bloomberg 主持人 Emily Chang,Hassabis 拋出了一個震動全場的判斷:AI 帶來的變革規模將是工業革命的 10 倍,而發生速度將是工業革命的 10 倍——乘在一起,這是一場 100 倍於工業革命的劇變。這場訪談不僅是對 Google 過去一年技術反擊戰的復盤,更涵蓋了 AGI 時間線、中美競爭、機器人奇點以及後稀缺世界的哲學困境。第一章:Google 的反擊與“全端”自信訪談的起點是 Google 剛剛發佈的Gemini 3。2025 年底,Gemini 3 Pro 的發佈以及隨後的 Flash 版本更新,在技術圈引發了巨大的震動,甚至據傳引發了 OpenAI 內部的“code red”——這與三年前 ChatGPT 問世時 Google 內部的反應如出一轍。“過去一年是極其艱苦的一年,”Hassabis 坦承。他並沒有迴避 Google 曾經面臨的被動局面,但他強調團隊已經適應了新的世界規則:“我們找回了創業公司的能量,快速發佈、快速迭代。”對於 Gemini 3 和圖像模型 Imagen 的表現,他表示“非常滿意”。當被問及 Google 的護城河時,Hassabis 展現了少有的強硬。他指出,外界可能低估了 Google“從第一性原理”建構的優勢。“我們可能是唯一擁有完整技術堆疊的組織,”Hassabis 分析道,“從底層的 TPU 和資料中心,到雲業務、前沿實驗室,再到數十億使用者使用的搜尋、信箱和 Chrome。這些產品天然適合 AI 的落地。”他更是拋出了一組資料來捍衛 DeepMind 的歷史地位:“過去十年,Google 和 DeepMind 發明了現代 AI 行業所依賴的大約 90% 的突破性技術——Transformer、AlphaGo、深度強化學習,都在其中。”第二章:物理世界的“AlphaFold 時刻”如果說大模型是數字世界的爭奪,那麼機器人則是物理世界的戰場。2026 年初,Boston Dynamics 與 Google DeepMind 的重磅合作成為 CES 的焦點。Gemini 的多模態能力被植入 Atlas 機器人,並在現代汽車的工廠中進行測試。Hassabis 認為,我們正處於物理智能(Physical Intelligence)突破的臨界點,但他給出的時間表相對審慎:“大概還需要 18 到 24 個月。”阻礙並非僅僅來自軟體。Hassabis 分享了一個有趣的細節:“當你深入研究機器人時,你會對人類的手產生全新的敬畏。”進化所設計的機械結構的靈巧度、力量和可靠性,是目前硬體難以企及的。但他描繪的願景十分清晰:Gemini 從設計之初就是原生的多模態模型。未來一兩年內,當演算法(需要更少資料)和硬體(尤其是機械手)同時突破,我們將看到機器人能“可靠地”在現實世界執行任務——那將是物理世界的奇點。第三章:技術大辯論——回應 LeCun、Sutskever 與 Musk作為 AI 領域的頂層設計者,Hassabis 在訪談中回應了關於技術路線的三大爭議,立場鮮明。1. 關於 Transformer 是否是死胡同(回應 Yann LeCun):針對 Yann LeCun 關於“LLM 是通往 AGI 的死胡同”的觀點,Hassabis 直言“那是顯然錯誤的”。“它們已經如此有用。我認為有 50% 的機率,僅僅通過擴展(Scaling)加上一些調整就足以實現 AGI。”即使不是全部,LLM 也必然是最終系統的核心元件。當然,他也補充說,Google 正在全力研發“世界模型”(World Model),比如 DeepMind 的Genie項目。2. 關於“研究時代”是否結束(回應 Ilya Sutskever):Ilya 曾表示 Scaling 時代結束,行業回歸“研究時代”。Hassabis 糾正了這種二元對立的看法:“我們從未離開過研究時代。”他強調,DeepMind 一直在做“深層研究”。如果未來需要新的架構突破,他押注 DeepMind 依然會是那個發明者。3. 關於“奇點”是否已來(回應 Elon Musk):對於 Musk 聲稱“我們已進入奇點”的言論,Hassabis 投了反對票。“這太早了。奇點是完全 AGI 的代名詞,而我們距離那個標準還有很多工作要做。”第四章:AGI 時間線與“參差不齊的智能”Hassabis 堅持了他對 AGI 的預測:2030 年前,有 50% 的機率實現。但他定義的 AGI 標準極高:“不只是解決問題,而是提出問題。”他以科學發現為例,指出當前的系統還無法像頂尖科學家那樣,在未知領域建構假設。對於當下的 AI 能力,他提出了一個精準的概念:“參差不齊的智能”(Jagged Intelligence)。“現在的系統在某些方面表現驚人,在另一些方面卻非常糟糕。如果你想把任務完全委託給 AI(Agent 模式),而不是像現在這樣把它當副駕駛,你需要的是全面的一致性。”只有填平這種“參差不齊”,實現持續學習(Continual Learning)和長程規劃,AI 才能真正從“輔助工具”進化為“自主智能”。第五章:地緣政治與 DeepSeek 的崛起針對一年前中國公司 DeepSeek 帶來的衝擊,Hassabis 的態度顯得冷靜而理性。“我認為西方的反應是大規模過度反應(Massive Overreaction)。”雖然承認字節跳動等中國公司可能只落後 6 個月,且非常擅長追趕,但他指出了一個關鍵區別:“他們目前更多是在西方模型的基礎上進行微調或借鑑。到目前為止,中國公司尚未展示出超越前沿進行原始創新的能力。”但他並未掉以輕心,坦言中國擁有強大的工程能力和追趕速度。第六章:後稀缺世界的哲學困境訪談的最後,話題轉向了終極問題:當 AI 解決了能源(核聚變)、材料和生產力問題,人類將進入一個“後稀缺世界”。相比於 Dario Amodei 預測的“5 年內 50% 白領失業”,Hassabis 的短期預測更為溫和,但他承認,長期來看,這不僅僅是就業問題,而是“意義危機”。“我比擔心經濟更擔心意義。”Hassabis 說道。“當工作不再是必須,我們從那裡尋找目的感?”他認為,經濟分配問題最終是一個政治問題,是可以被解決的。但人類心理上的空缺,需要“新的偉大哲學家”來指引。在這個未來圖景中,他給年輕人的建議是掌握 “元技能”——即“學會學習”(Learning to Learn);給企業家的建議則是選擇那些有著正確價值觀的合作夥伴。尾聲:凝視深淵的人這場訪談最動人的一刻,發生在這位諾貝爾獎得主談論自己“退休計畫”的時候。如果 AGI 真的建成,如果所有實際問題都被解決,Hassabis 想做什麼?“我想去探索物理學的極限。”他說。即便掌管著全球最強大的 AI 實驗室,在凌晨 4 點無法入睡的時刻,困擾他的依然是那些最古老的問題:現實的本質是什麼?時間是什麼?引力是什麼?“這些深刻的謎題幾乎在向我尖叫,”Hassabis 說,“我驚訝於更多人竟然不去思考這些。”對於 Demis Hassabis 而言,比工業革命大 100 倍的變革只是手段,他的終極目標,始終是解開宇宙那個名為“智能”的鎖,然後用它去打開所有其他的門。 (京墨AI研習社)
【達沃斯論壇】最懂AI的人Demis Hassabis:關於Google的全端優勢,中國競爭的理性看待,AGI的時間線
作為這個世界上最懂AI的人,Demis Hassabis 在達沃斯接收採訪,關於人工智慧(AI)未來、Google 的戰略以及社會影響的核心觀點如下。核心觀點Google 的重新崛起與全端優勢Google 已通過 Gemini 3 系列模型回到了技術的前沿,並適應了快速發佈產品的“初創公司能量”。Hassabis 強調 Google 是唯一擁有“全端”能力的組織,涵蓋了從 TPU 硬體、資料中心、雲業務到前沿實驗室(Google DeepMind)以及擁有數十億使用者的產品線(如搜尋、郵件、Chrome)。對中國競爭的理性看待他認為西方對來自中國的競爭存在過度反應,雖然像字節跳動這樣的公司極具能力且可能僅落後前沿約 6 個月,但他們很大程度上依賴於對西方模型輸出的微調。目前尚未觀察到中國公司能做出超越現有前沿的自主創新。AGI 的時間線與高門檻定義他維持 2030 年有 50% 機會實現 AGI 的預測。他為 AGI 設定了極高的標準,即系統必須展現人類所有的認知能力,特別是在科學創造力(如能夠提出科學假設而非僅是解決問題)和線上持續學習(即時學習)方面的能力。物理智能與機器人的突破他認為物理智能正處於突破邊緣,預計在 18 個月到 2 年內,機器人將能可靠地在現實世界執行任務。目前的挑戰在於演算法需要更強的穩健性,以及硬體上(尤其是手部)難以匹配人類進化的靈活性和力量。技術路徑與縮放法則他不同意“縮放法則(Scaling)”已經終結,也不認為 Transformer 或大語言模型是“死胡同”。他預測 AGI 的實現可能還需要在世界模型(如 Google 的 GENI 系統)、推理和長期規劃等領域取得少於五個的關鍵性突破。社會影響與人類適應他將 AI 革命比作工業革命,但規模大 10 倍且速度快 10 倍(綜合影響達 100 倍)。儘管這會帶來職業取代的壓力,但他相信人類具有極強的適應能力,並鼓勵下一代成為“AI 原生民”,利用這些工具獲得“超能力”。科學發現的終極工具Hassabis 的個人熱情在於利用 AI 加速科學發現,他將 AI 視為“終極科學工具”,類似於更高級的望遠鏡或顯微鏡。即使 AI 做出諾貝爾獎等級的發現,他仍認為榮譽應歸屬於通過這些工具投入創意和假設的人類科學家。安全、信任與國際合作他倡導建立類似 AI 領域的“國際 CERN”進行科學合作,以決定如何利用技術造福人類。他認為應通過行動和領導者的動機(如 Google 的科學文化背景)來判斷是否值得信任。採訪視訊連結油管:https://www.youtube.com/watch?v=BbIaYFHxW3YB站:https://www.bilibili.com/video/BV1DuzjBZEMv/?spm_id_from=333.337.search-card.all.click&vd_source=806ae2cead4c4e9790a58d15b64b1bbe完整的問題及回覆如下(AI整理)問:很高興見到你。答:我也很高興見到你。問:我們在舊金山見過。 我知道你無處不在。 我很好奇今年在達沃斯的感覺是否與你上次在這裡時有所不同。 Gemini 3 已經發佈了。 我們聽過那個開場白。 我在內部稱之為“紅色程式碼”。 你覺得 Google 找回它的狀態(Mojo)了嗎?答:嗯,我不確定這是否該由我來評價,但我感覺我們度過了非常好的一年。 為了讓我們的技術和模型回到世界領先水平,我們付出了極其艱辛的努力。 我認為我們通過 Gemini 3 尤其是影像軟體上的成果做到了這一點。 同時,我也認為我們也適應了快速發佈產品的新世界。 為我們的工作注入了某種初創公司的活力。問:你認為人們是否低估了 Google,或者誤解了什麼?答:是的,也許吧。 我不確定。 我的意思是,我認為我們一直擁有站在這一領域最前沿的所有要素。 顯然,我們在這方面有悠久的歷史。 我認為在過去的十年裡,Google 和 DeepMind 之間,我們發明了現代 AI 行業依賴的大部分突破性技術。 最著名的如 Transformers,還有 AlphaGo、深度強化學習等。 我們擁有驚人的產品表面,擁有數十億使用者的服務。 實際上,從搜尋到電子郵件再到 Chrome,AI 與這些產品是天然契合的,關鍵是將所有這些整合在一起並以正確的方式組織起來。 我認為我們在過去的幾年裡已經做到了這一點,雖然還有很多工作要做,但我認為我們開始看到這些努力的果實了。問:如果你認為自己有優勢,你認為你的優勢有多大? 能持續多久?答: 嗯,我認為在我看來,一切都始於研究。 尤其是模型在所有不同基準測試中處於世界領先水平。 這就是我們將 Google 和 DeepMind 整合在一起時首先關注的目標。 我認為對於 Gemini 系列,我對它的進展感到非常滿意。 那裡還有很多工作要做。 但我認為我們是唯一一個擁有“全端”能力的組織,從 TPU 硬體、資料中心、雲業務、前沿實驗室,到所有這些與 AI 天然契合的神奇產品。, 所以從基本原理來看,在結構上,我們應該做得非常好。 而且我認為實際上未來還有很大的提升空間。問:我想知道一個處於前沿模型領域的 CEO 的一天是怎樣的。 比如我讀到你大部分的思考是在凌晨 1 點到 4 點進行的。 是的,那是對的。 公司內部有過不是“紅色程式碼”的時候嗎? 比如,你感到過舒適嗎?答:不。 你永遠不會感到舒適。 我是說,我們嘗試(保持常態),“紅色程式碼”是針對非常特殊的情況的。 但我可以表達,在過去的三年、四年裡,工作強度一直難以置信。 每周工作 100 小時,一年工作 50 周,這就是常態。 我認為在面對這種發展極其迅速的技術前沿時,你必須這樣做。 外部競爭非常激烈。 這可能是技術史上最激烈的競爭。 而且賭注極高,涉及 AGI 及其在商業和科學上的所有意義。, 此外,如果你加上我們所做的事情帶來的所有興奮感——正如你所知,我的熱情是利用 AI 探索科學問題,加速科學發現本身。 這是我一生夢寐以求的事情,我畢生致力於 AI 的工作都是為了這一刻。 所以有時很難入睡,因為有太多工作要做。 但同時也因為有這麼多令人興奮的事情可以去研究和推動。問:我知你非常專注於驅動科學進步,比如發現新材料。 我們甚至看到 Gemini 被整合進人形機器人。 物理世界的“AlphaFold 時刻”已經到來了嗎? 那是什麼,看起來又是怎樣的?答: 是的,在過去的一年裡,我確實花了很多時間仔細研究機器人技術。 我確實認為我們正處於物理智能突破時刻的邊緣。 我仍然認為我們離實現它還有大約 18 個月到 2 年的時間。 我們需要進行更多的研究。 但我認為像 Gemini 這樣的基礎模型指明了前進的方向。 從一開始我們就讓 Gemini 具備多模態能力,這樣你就可以出於多種原因理解物理世界。 一個原因是我們想要建構一個通用助手,它可能存在於你的眼鏡或手機中,能夠理解你周圍的世界。 但當然,第二個用途就是用於機器人。 那麼物理世界的那個時刻看起來像什麼? 我認為它是讓機器人能夠在現實世界中可靠地執行有用的任務。 我認為目前還有一些事情在阻礙其發展。 部分原因是演算法還不夠完善,它們需要更多的穩健性。 它們必須能在比實驗室或純數字模型更少的資料下工作。 在數字世界你可以建立合成資料,但在物理世界製作這類資料要困難得多。 而且硬體中仍然存在一些未解決的問題,特別是手臂和手。 實際上,當你仔細研究機器人技術時,你會對人類的手產生一種全新的欣賞——至少我是這樣——以及進化是如何將其設計得如此精妙的。 這太不可思議了,很難匹配人類手所擁有的可靠性、力量和靈活性。 所以在我看來,還有相當多的碎片需要拼湊。 但也有非常令人興奮的事情。 我們剛剛宣佈了與 Boston Dynamics 的一項新的深度合作。 他們有一些非常令人興奮的機器人。 我們正在將其應用於汽車製造領域。 我們將在接下來的一年裡觀察其原型階段的表現。 也許在一兩年內,我們將會有一些真正令人印象深刻的、可以大規模推廣的演示。問:一年前,中國在 AI 領域的競爭對西方來說似乎是災難性的。 現在一年過去了,它變得安靜了。 中國似乎變得更安靜了。 是的。 你對來自中國的競爭看法改變了嗎?答: 並沒有。 我從一開始就不認為那是災難性的。 我認為西方對此反應過度了。 雖然它確實令人印象深刻。 我認為它表明中國人非常有能力,他們的頂尖公司,我認為像字節跳動這樣的公司,實際上是我認為最有能力的,他們可能只落後前沿 6 個月,而不是落後一兩年。 所以我認為這就是他們所展示的。 關於他們使用的算力極少等說法有些言過其實,因為他們依賴於一些西方模型,並針對一些領先西方模型的輸出進行微調。 所以那並不是完全自主研發的。 我認為到目前為止另一件尚未被觀察到的事情是,中國公司能否在這一前沿領域實現超越自身的創新。 他們正在追趕,非常擅長追趕前沿所在的位置。 但我認為他們尚未展示出能夠超越前沿進行創新的能力。問:你協助定義了 AGI。 你曾說我們有 50% 的機會在 2030 年實現它。 這還是你的時間表嗎?答: 是的。問:AGI 對你來說仍然是一個有用的目標嗎?答: 我認為是。 我認為在我的時間表上這是一個非常好的目標,雖然它比其他一些人的預測稍長。 但我的門檻很高。 它指的是一個系統展示出人類擁有的所有認知能力。 我認為我們目前顯然離那還很遠。 這意味著像科學創造力這樣的事情,不僅僅是解決一個問題,而是最初就能提出假設或發現問題。 正如任何科學家所知,找到正確的問題往往比找到答案難得多。 現有的系統目前還不具備這種能力。 我認為它們最終會具備,但目前還不清楚還需要什麼。 還有像持續學習、線上學習這類事情,要超越它們接受培訓的內容,它們需要能夠隨時隨地進行學習。 所以在我看來,還有相當多缺失的能力,這些對於我所認為的 AGI 系統來說至關重要。問:Google 是 Anthropic 的主要投資者,Dario 之前也在這裡。 你是否同意或反對他的預測,即 AI 將在五年內抹去 50% 的入門級白領工作?答: 我認為我的看法是時間會更長一些。 我的意思是,我認為我們今年開始看到入門級工作或實習這類工作的萌芽。 但我認為我們需要解決更多的一致性問題,而目前的系統還沒有做到這一點。 我稱之為**“參差不齊的智能”,我們在某些事情上做得非常好,而在其他事情上卻非常糟糕。 當前的系統就是這樣。 如果你想要將一整項任務交給一個代理(Agent)去處理,而不是像我們今天這樣擁有輔助程序,你需要更全面的一致性。 它僅僅能完成 95% 的任務是不夠的。 你需要它能夠勝任整項工作,這樣你才能真正實現“放手不管”。 所以我認為在看到那種程度的顛覆之前,還有相當多的工作要做。 但那種顛覆最終會發生,這是肯定的。 我認為在極限情況下,有了 AGI,它會改變整個經濟。 但除了工作問題,我認為如果我們能正確建構它,我們將進入一個“後稀缺”世界。 在那裡我們解決了一些世界的基本瓶頸,比如能源來源、新型清潔可再生能源,基本上是免費的。 如果我們在 AI 的幫助下解決了聚變(Fusion)等問題,或者新材料,我認為在 AGI 之後的五到十年,我們將處於一個極其富足的世界。 那麼這意味著經濟如何運行,社會如何運作?問:實際上,在我們進入“後稀缺”世界之前,如果真能到那一步,中間過程充滿了焦慮。 我是一個母親,我知道你也有孩子。 比如,對於他們,你最擔心什麼? 你和他們談論什麼? 你告訴他們即將到來的是什麼? 我剛聽到很多人說,天那,大學畢業生將面臨非常艱難的時期。答: 嗯,我不確定。 聽著,我認為這將是一個劇烈變革的時代,就像工業革命一樣,可能是工業革命的 10 倍規模,這種程度是難以想像的。 我通常描述它是 10 倍大、10 倍快。 工業革命用了 100 年,現在可能只需要 10 年,所以是它的 100 倍(速度與影響)。 我對每個人都這麼說,但我認為這伴隨著巨大的機遇。, 而且我也非常堅信人類的聰明才智。 我們極具適應能力,因為我們的思維是非常通用的。 人類的思維非常通用。 我們適應了周圍的現代世界。 我們原本屬於狩獵採集者的思維已經成功建構了現代文明。 所以我認為我們會再次適應。 我認為這有一點前所未有,因為它的速度太快了。 通常這種轉變需要一兩代人的時間。 但我認為現在的孩子們,我會鼓勵他們變得非常精通這些新工具並成為“原生民”,這幾乎等同於賦予了他們超能力。 在創意藝術領域,你可能一個人就能完成過去需要十個人才能完成的工作。 我認為這意味著,如果你具有企業家精神,如果你在遊戲設計、電影或項目方面有創意,你可能更容易完成更多工作並突破這些行業。 比起過去作為新人的門檻要低得多。問:一些人倡導暫停研發,以給監管留出追趕的時間,給社會留出調整的時間。 在一個完美的世界裡,如果你知道所有其他公司都會暫停,所有國家都會暫停,你會倡導這樣做嗎?答: 我想是的。 我一直公開表示我希望看到的情況。 15 年前當我創辦 DeepMind,或者說 25 年前開始從事這方面工作時,我的路線圖一直是:當我們接近 AGI 到來的臨界時刻,我們也許可以以科學的方式進行合作。, 我有時會談到建立一個 AI 領域的國際 CERN 等效機構,讓世界上所有最頂尖的頭腦一起合作。 以非常嚴謹的科學方式完成最後幾步,讓全社會都參與進來,可能包括哲學家、社會科學家、經濟學家以及技術專家,來弄清楚我們想從這項技術中得到什麼,以及如何利用它。 從而造福全人類。 我認為這就是賭注所在。 不幸的是,這確實需要國際合作,因為即便西方決定這樣做,除非全世界都同意至少達成某種最低標準,否則沒有用。 而且你知道,目前國際合作有點棘手。 所以如果我們想要對通往 AGI 的最後步驟採取嚴謹的科學方法,這種情況必須改變。問:所以如果 AGI 在 2030 年到來,而我們還沒有建立好監管,我們是否註定會面臨困難?答: 嗯,到那時,我仍然樂觀地認為,主要的參與者之間會有足夠的溝通,並希望至少在安全和安保協議上進行合作。 已經有很多這樣的合作了。 例如,我們在這些方面與 Anthropic 合作非常緊密。 如果國際層面的合作行不通,那麼就需要更多類似的基於同行的合作。問:這會涉及到像 Sam (Altman) 這樣的人與你合作嗎?答: 潛在地,我認為我與幾乎所有領先實驗室的領導者都保持著非常良好的關係。 我認為如果賭注足夠高,很大程度上取決於理解賭注是什麼以及風險是什麼。 我認為在接下來的兩三年內,這對每個人來說都會變得更加清晰。問:讓我們談談技術和下一個曲線。 Yann LeCun 說他不認為 Transformer 和大語言模型單獨能帶我們走向 AGI。 你同意還是反對?答: 是的。 不,我不同意它們是死胡同。 我認為這種說法顯然是錯誤的。 我是說,它們已經極其有用了。 但我的看法是,這是一個經驗性的問題。 僅僅通過調整現有的方法並擴大規模是否足夠,這是一個科學問題。 我認為只有 50% 的機會是足夠的。 也許是吧。 你必須這樣做。 而且我認為那是很有用的工作,因為至少在我看來,這些大語言模型將成為最終系統的一個組成部分,一個極其重要的組成部分。 我腦海中唯一的問題是,它是唯一的元件嗎? 我可以想像還有一兩個突破,也許是少量的,從這裡開始還需要不到五個突破,對吧? 那麼,這些可能是像世界模型(world models)之類的東西。 那是我談論過的我們正在研究的東西。 事實上,我們目前擁有最好的世界模型,即我們的 GENI 系統。 我直接參與了那項工作,我認為它非常重要。 此外還有持續學習,以及擁有沒有這些參差不齊邊緣的連貫系統。 通用系統不應該有這些。 所以我認為,更好的推理、更長期的規劃,還有相當多的能力仍然缺失。 究竟是需要新的架構、新的突破,還是僅僅是現有的更多嘗試,這仍然是一個懸而未決的問題。, 從我的角度,從 Google DeepMind 的角度來看,我們正在這兩方面盡最大努力推動:既發明新事物,也擴大現有事物的規模。問:Ilya Sutskever 說過,擴大規模和通過更大的模型來實現改進的時代快要結束了。 這是你同意的嗎? 他的原話是“我們回到了研究時代”。答: 我不同意。 我很愛 Ilya,我們是很好的朋友。 但我的觀點是,我們從未離開過研究時代,至少從 DeepMind 的角度來看是這樣。 我們一直在投資。 在我看來,我們一直擁有最深厚、最廣泛的人才儲備,Google 和 DeepMind 在一起確實如此。 在過去的十年裡,我們發明了現代工業所依賴的約 90% 的突破。 當然,最著名的 Transformers,還有深度強化學習、AlphaGo 這種技術。, 我們開創了所有這些。 所以如果未來需要一些新的突破,我會賭我們,就像過去一樣,成為做出那些突破的人。問:最後,同意還是反對——埃隆(Elon Musk)說我們已經進入了奇點。答: 不,我認為這太早了。 我認為奇點是完全 AGI 到來的另一種說法。 我之前解釋了為什麼我認為我們離那還遠。, 我認為我們會到達那裡。 但我認為在出現任何看起來像奇點的事物之前,仍有很多工作要做。問:跟我們談談現在 Google 內部的文化,為了贏得這場比賽但要以正確的方式去做。 領導層。 Larry 和 Sergey 現在的參與度有多高? 你多久和他們談一次話,他們的優先順序是什麼?答: 是的,他們非常投入。 Larry 更多在戰略層面。 我在董事會會議上以及訪問矽谷的其他時候見到他。 Sergey 則更親力親為,他參與了程式碼編寫,具體是在 Gemini 團隊中,更多地涉及演算法細節。 看到他們兩個都對我們所處的階段充滿活力,這太棒了。 誰不會呢? 這一刻對於電腦科學來說絕對是不可思議的時刻。 所以純粹從科學的角度來看,他們兩位都是科學家,這是人類歷史上極其令人興奮的一刻。, 所以當然,每個人都想親力親為並深入參與。 那太棒了。 對我們這個實體而言,我正嘗試結合許多世界的最佳部分。 比如快速發佈產品、承擔風險的初創公司能量,我想你正看到這些帶來的好處。 大公司的資源也是非常有用的,但同時還要為長期的研究和探索性研究保護空間。 而不僅是研究三個月後能交付到產品中的東西。, 我正在嘗試平衡所有這些不同的因素。 在過去的一年裡,事情進展順利。 但我對我們的軌跡非常滿意。 我認為它是整個行業中改進和進步最陡峭的。問:你是一位諾貝爾獎得主,我知道你對 AI 驅動科學研究有多痴迷。 如果 AI 本身做出了諾貝爾獎等級的發現,你認為你應該得獎嗎?答:是 AI 還是人類? 我認為還是人類。 因為這取決於你所說的“完全自主”是什麼意思。 就目前而言,這些仍然是工具。 我將它們視為,也許是終極的科學工具,但就像是更好版本的望遠鏡和顯微鏡。 我們一直是製造工具的動物,這就是人類區別於其他動物的地方。 那就是超能力,當然我把電腦也包括在內。 而 AI 是這一點的終極表達。 所以在某些方面,我一直認為 AI 是進行科學研究的終極工具。 而且在可預見的未來,這將是與頂尖科學家的合作,由人類投入創意和假設,利用這些驚人的工具來增強資料處理、模式匹配和科學探索。問:你顯然本可以把 DeepMind 賣給任何人。 我認為所有這些公司都要求我們給予很大的信任。 尤其是如果監管趕不上技術的發展。 為什麼? 我們為什麼要信任你? 為什麼你認為 Google —— 我隱含地認為你相信它是我們最應該相信的地方?答: 是的。 我認為你需要通過這些公司的行動來判斷它們,也要看參與這些努力的領導者的動機。 對我而言,這也是我選擇 Google 作為 DeepMind 的歸宿的幾個原因之一。 主要原因是 Google 的創始人以及 Google 建立的方式使它本質上是一家科學公司。 很多人忘了 Google 本身就是一個博士項目,它是 Larry 和 Sergey 的項目。 所以我感到與他們有一種天然的親近感。 Larry 主導了收購,還有董事會,他們召集的董事會成員。 你看,John Hennessy 是主席,他本身就是圖靈獎獲得者。, 還有 Frances Arnold,另一位諾貝爾獎獲得者。 這些人出現在公司董事會上是不尋常的。 所以整個環境非常具有科學色彩,以科學、研究和工程為文化導向,這根植於文化深處。 這意味著在最高水平上從事科學,意味著要非常嚴謹、深思熟慮,並在任何可能的地方應用科學方法。 我認為這不僅體現在技術上,也體現在作為一個組織的運作方式上。 所以我覺得,我們非常努力地做到深思熟慮和負責任。 最後一件事我想說的是,我被 Google 嘗試在世界上做的事情所吸引,組織全球資訊是一個非常崇高的目標。, 我認為這與 DeepMind 的使命——解決智能問題並用它來解決其他一切——是天然契合的。 這兩個使命宣言是天然契合的。 AI 和組織全球資訊自然相輔相成。 而且我認為 Google 廣為人知的產品,如地圖、Gmail 和搜尋。 我認為它們是世界上真正有用的產品,而 AI 是一個很容易融入的環節。 想像如何利用 AI 增強這些產品,讓每個人的日常生活都能受益。 我認為這對世界是一件好事。問:好吧,那麼在“後稀缺”世界,人們不再有工作,一旦你實現了所有的技術目標,你個人打算如何安排你的時間? 研究正在自我自動化,對吧?答:嗯,我很樂意利用它。 在奇點之後我將做的是,利用它探索物理學的極限。 那是我在學校裡最喜歡的科目,關注那些大問題。 比如,現實的結構是什麼? 現實的本質是什麼? 意識的本質是什麼? 費米悖論的答案是什麼? 所有這些事情,時間是什麼? 引力是什麼? 對我來說,這些問題總是在對我尖叫:這些深奧謎團的答案是什麼?, 我想使用 AI 來探索所有這些事情,也許在 AI 解鎖的新能源和材料的幫助下前往星際旅行。問:如果我們沒有工作,我們還會有意義和目標感嗎?答: 嗯,說實話,比起經濟問題,我更擔心這件事。 我認為經濟更像是一個政治問題,即當我們獲得所有這些額外的收益和生產力時,能否確保它為了每個人的利益而共享。, 但更大的問題是,我們許多人從工作和科學事業中獲得的目標感和意義感呢? 在新世界裡我們將如何尋找它? 我認為我們需要一些新的偉大的哲學家來幫助思考這個問題。 也許我們將通過藝術和探索變得更加複雜。 還有像極限運動這種我們今天做的很多事情,並不只是為了經濟收益。 也許未來我們會擁有這些事情的非常深奧的版本。問:房間裡的每個人都在想他們應該做什麼。 比如,十年後坐在達沃斯的這裡我該做什麼? 你認為這個房間裡的人關於 AI 會犯下的最大錯誤是什麼?答:聽著,我想說兩件事。 一是對於年輕一代和我們的孩子等等,我們唯一能確定的就是會有巨大的變化。, 所以在學習技能方面,要做好準備,因為**“學習如何學習”是最重要的事情**。 你能多快適應新情況,吸收新資訊並使用我們擁有的工具。 對於房間裡的 CEO 和商界人士,我認為現在最重要的事情是,有很多領先模型的供應商。 選擇那些你覺得其處理方式正確的合作夥伴。 所以,與那些正在推動變革並以你希望在世界上看到的方式對待這項技術的人合作。 我認為我們可以共同建構我們想要的未來。 (長韋雜談)
【達沃斯論壇】Dario × Demis 達沃斯交鋒:AGI 是“明年就來”,還是“十年之後”?
你相信誰?一個說:1 到 2 年。一個說:也許還要 10 年。2026 年 1 月 20 日,達沃斯。兩個最接近 AGI 的人給出了截然不同的答案。Anthropic CEO Dario Amodei 認為,模型已經在寫模型,閉環正在形成,時間可能只剩一年。Google DeepMind CEO Demis Hassabis 堅持,真正的科學創造力還差幾步,我們還有 5 到 10 年。問題不是誰對誰錯,而是:如果 Dario 是對的,我們來得及準備嗎?當時間成為變數,風險就不再是遙遠的末日,而是速度失控的現在。第一節|模型開始寫模型:自我進化已啟動?2026 年達沃斯的這場對話,Dario 重申了他去年的預測:到 2027 年,我們就會擁有一個能完成人類幾乎所有工作、達到諾獎水平的模型。Demis 沒有反駁,只是更謹慎地補充:“是的,模型在某些領域進展驚人。但你要讓它提出新的理論或假設,還早。”真正的分歧在於:AI 自我進化的閉環,啟動了嗎?Dario 的答案是:已經在發生了。Anthropic 的工程師已經不再自己寫程式碼,而是直接把任務交給 Claude,讓它產出初稿,自己只做稽核與改寫。 而且這不是個例,Dario 透露,Claude Cowork 的核心模組,就是由 Claude 自己在一周半內完成搭建的。基於這種趨勢,他給出了一個大膽預測:“也許 6 到 12 個月,我們就會有模型能完成大多數軟體工程師的工作。”注意,不是輔助工作,而是完成大多數。Demis 對此並不完全否認。他承認,在程式設計和數學這類“能驗證結果”的領域,模型已經接近專業水平。但他強調了一個關鍵區別:科學創造力的難點,不在解題,而在提出問題。在 Demis 看來,真正的通用智能需要具備從零提出假設的能力,而不僅僅是生成正確答案。這類能力目前仍難以驗證、也尚未實現。兩人的共識是:AI 已經能加快 AI 的迭代。Dario 甚至用了“自我演化”這個詞。一旦“模型→模型”這條路徑成熟,它將不再等待人類研發節奏,而會主動生成下一個版本。到那時,人類角色可能從創造者變成稽核員。這意味著決定 AI 進化速度的,不再是你有多少工程師,而是模型自己的成長能力。這正是 Dario 所說時間可能只剩一年的核心理由。Demis 的回應雖然保守,但也沒否認這條路徑的可行性。他只是提醒:我們可能還缺少一兩個關鍵環節,像持續學習、世界模型這類能力。也就是說,在可驗證的領域,閉環已經在形成。但要真正徹底閉環,可能還需要幾個技術突破。時間差,就在這幾步之間。第二節|50% 入門崗位消失:新人進不來了主持人把話題從技術拉回現實:這會對工作意味著什麼?Dario 的回答:“我認為,在未來 1 到 5 年內,50% 的白領入門崗位都會消失。因為企業已經發現,用模型完成很多基礎工作,比雇新人更快、更省錢。”換句話說,不是公司裁員更狠,而是公司不再招人。Demis 的觀察更具體:今年開始,我們已經能看到實習崗位和初級職位受到衝擊。真正被優先替代的,是重複性強、規則清晰、需要時間但不需要經驗積累的工作。第一批受衝擊的,不是資深專家,而是剛進場的人。Dario 給出了一個場景:一家企業可以做到業務翻好幾倍,但員工規模幾乎不變。這是因為 AI 已經被當作數字勞動力在使用。文件整理、程式碼初稿、資料清洗、客服回覆、內容生成,這些原本屬於新人練手的工作,正在被批次壓縮。Demis 補充了另一個維度:“創造性工作、需要跨領域經驗的崗位,暫時還沒被真正撼動。”但在整個就業市場中,這類創造性崗位只佔很小一部分。絕大多數人依靠的,還是從基層幹起、一步步積累經驗的職業路徑。而這條路,正在被堵死:經驗崗位還在入門崗位變少有經驗但不夠資深的人,晉陞空間被壓縮這導致一個矛盾的局面:企業看起來運轉正常,但職業階梯已經開始斷裂。變化已經發生,但組織根本沒準備好如何應對。 用人方式、培養機制、晉陞通道,都還停留在過去。為了追蹤這種變化,Dario 透露 Anthropic 正在維護一個“經濟指數”通過分析對話資料,即時監測那些行業、那些任務正在被 AI 增強或替代,精確到具體的州、行業、甚至任務類型。資料會告訴我們變化的全貌,但個體等不了那麼久。對年輕從業者來說,問題已經變了:不再是會不會被替代,而是當一個崗位消失,你能頂替誰的位置?這,才是 AI 時代真正殘酷的篩選邏輯。第三節|技術每月升級,組織還在按年調整在整場對談的後半段,主持人提出了一個問題:你們最擔心的是什麼?Dario 沒有說超級智能或模型失控,他說的是:“速度。技術進展得太快,而我們還沒搞清楚該怎麼用它。”Demis 的擔心更具體:很多人根本不知道 AI 現在能做什麼。他舉了個例子:有些人還把大模型當搜尋引擎在用,但其實它已經可以做研究助理、項目助手、程式碼搭檔,甚至承擔部分商業分析。這種錯配,正在製造兩個風險:低估了 AI,錯失轉型窗口;高估了 AI,用在不該放手的環節。Dario 補充:今天很多失敗,不是 AI 能力不夠,而是組織的架構、流程、用人方式都還沒變。Demis 做了一個類比:就像工業革命時期,人們先是驚訝,然後混亂,最後才重構了整個社會。而工業革命用了幾代人完成的轉型,AI 可能只給我們幾年時間。那麼,這種速度失控會帶來那些具體風險?Dario 提到三個現實層面的挑戰:第一,技術擴散風險。 當模型能力足夠強,如何確保它不被用於危險用途?比如合成生物學、網路攻擊等領域。這不是假想,而是每次發佈新模型前都必須測試的內容。第二,模型對齊問題。 Anthropic 的研究已經在實驗室環境中觀察到,模型在某些情況下會產生繞過限制的行為傾向。雖然這在所有大模型中都存在,但說明高度自主的系統確實需要更嚴格的控制機制。第三,社會適應速度。 當技術迭代以月為單位,而組織、教育、法規的更新還在以年為單位,這個時間差本身就是風險。應對路徑呢?Dario 介紹了 Anthropic 正在推進的"機械可解釋性"研究:像神經科學家研究大腦一樣,觀察模型內部的決策過程,從機制層面理解它為什麼會產生某種輸出,然後進行針對性干預和重新訓練。Demis 則強調,真正解決這些問題需要全球科學界的協作。他提到了類似 CERN(歐洲核子研究組織)的國際合作模式,讓各國頂尖科學家在開放、透明的框架下共同攻克 AGI 的關鍵問題。兩人都認為:這些技術挑戰是可以解決的,前提是有足夠的時間和足夠的協作。但現實是,行業競爭正在壓縮這個時間窗口。誰能快速建構出理解它、整合它、把它用得對的路徑,誰就領先一個時代。結語|一年還是十年?時間會給答案達沃斯的這場對談,Dario 和 Demis 沒有爭出對錯。但他們的共識是:AI 已經在自我加速,入門崗位正在消失,組織還沒準備好。分歧只在於速度。Dario 認為一兩年,Demis 認為五到十年。但變化不會等所有人都準備好。 (AI深度研究員)
DeepMind CEO 在 CNBC 算 4 筆帳:這輪 AI 競賽,錢到底花在那?
最近 AI 圈最熱的詞,已經不是更強,而是更賺錢。2026 年 1 月 16 日,CNBC 新上線了一檔播客《The Tech Download》,定位很明確:不談概念,只談錢。第一期請到的嘉賓,是 Google DeepMind 的 CEO Demis Hassabis。Hassabis 沒有談技術概念,而是在算四筆投資帳:AGI 缺的能力,該投什麼模型商業化,成本花在那能源瓶頸,資源配在那AI 競爭,優勢建在那這四筆帳,指向同一個核心:這輪 AI 競賽,錢到底該花在那?第一筆帳|AGI 還缺什麼能力?專訪剛開始,主持人問出一個所有人都關心的問題:我們的大模型已經這麼強了,還能更好嗎?AGI 是不是快到了?Hassabis 的回答是:大模型的能力,其實有明顯短板。他說,這些 AI 工具在某些問題上能給出驚豔的表現,但你換個問法,或者稍微複雜一點,它立刻就不行了。他把這叫做:參差不齊的智能(jagged intelligences)。說白了,這種智能還不夠靠譜。能答題,但不能舉一反三;能寫論文,但不能自己提一個真正新的點子。1、通用智能,得能自己提問題Hassabis 認為,真正的通用 AI,必須具備一項能力:能自己提出問題,能假設世界可能如何運轉,然後想辦法去驗證它。也就是說,它不能只是答你問題,還得能自己思考問題是什麼。他說,現在的大模型,連持續學習都做不到。你教會它一件新事,它很快就忘了;它不會像人一樣積累經驗。這也是為什麼,DeepMind 近兩年開始把重點從 LLM 轉向另一個方向:做一個懂得世界如何運轉的 AI。2、世界模型,不是懂語言,是能想像他用很通俗的方式講了世界模型這個概念:“就像人類科學家,能在腦海中推演如果這樣,那會發生什麼,AI 也得具備這種能力。”不是理解你說什麼,而是能根據它自己對世界的認識,去預測接下來會發生什麼、什麼東西會影響什麼結果。這聽起來有點抽象,但它已經落地到了 DeepMind 的幾個核心方向裡:Genie: 能與虛擬環境互動的模型,相當於在玩遊戲的同時理解規則AlphaFold: 當年用 AI 去預測蛋白質折疊結構,其實也是讓模型理解形狀為什麼會變成那樣Veo: 文字生成視訊,不是湊鏡頭,而是讓 AI 根據因果關係決定下一秒畫面該變成什麼這些看起來不一樣的項目,其實在做同一件事:讓 AI 像人一樣理解世界,而不是只會背答案。3、AGI 不靠湧現,靠組合Hassabis 相信:單純擴大模型規模,不會自動產生通用智能。真正有可能做出 AGI 的,是讓多個模型各司其職、協同工作:LLM 負責語言和基礎理解視訊模型負責時間序列、物理直覺世界模型提供模擬、推理、預測的能力只有這些能力拚圖逐步接上,通用智能才會是可靠的,而不是看起來聰明但漏洞百出。對大多數人來說,AGI 是比人更聰明的 AI;但對 Hassabis 來說,AGI 是能自己提出新想法的 AI。這就是 DeepMind 把世界模型當成下一步主線的原因。它不只是一個新模型,而是一個核心能力:能不能站在世界的角度去理解,而不是被動回答。第二筆帳|模型怎麼賺錢?不是更強,是更划算技術路線是一回事,但商業落地是另一回事。AI 要走向通用,不只是越來越聰明,還要用得起。Demis Hassabis 講了 DeepMind 的產品策略:不是只推 Pro 版,而是同時做 Flash 版。這不是大小模型的高低之分,而是為了讓更多場景能用得起。能大規模部署、覆蓋場景的模型,必須夠輕、夠快、夠省。1、Flash:用強模型教出主力模型Hassabis 形容:用最強的模型訓練出一個更高效的版本,就像用大腦教出一個更靈巧的分身。這個過程在技術上叫蒸餾,但他更關注的不是技術本身,而是能否落地:訓練出來的模型可以被廣泛部署,成為主力使用的版本。比如 Gemini 模型線:Pro 版本,是給複雜場景或前沿應用準備的Flash 版本,是給終端使用者、高頻任務提供服務的2、商業化不是賣模型,而是讓模型進產品“AI 不該永遠停在網頁對話方塊裡。”Hassabis 說:未來我最看好的方向之一,是讓 AI 真正進入手機、眼鏡這些裝置裡。也就是說,未來不是你去找 AI,而是 AI 就在你手邊、螢幕裡、日常動作之間。DeepMind 已經和三星、Warby Parker 等品牌展開合作,探索裝置端 AI 的可行性。這說明 DeepMind 的商業路線,不只是 API 售賣,更看重模型與產品深度結合。3、AI 不止省人力,還要省資源Hassabis 說,效率是 Gemini 全線設計時的最高優先順序,尤其是 Flash 系列。推理更快能力更平衡能耗更低DeepMind 對 AI 商業化的看法不是卷功能,而是算總成本:一個模型能做什麼不重要,重要的是它能成本可控、能落地、穩定可靠。從 Flash 的設計、蒸餾策略,到裝置端合作、能效優先,Hassabis 給出的不是模型路線圖,而是使用路線圖。他沒有強調模型有多強,而是圍繞:怎麼讓 AI 被真正用起來?這才是商業化起步的基礎。第三筆帳|能源問題,AI 能自己解決嗎?Flash 版本解決的是模型本身的能耗,但這還不夠。Demis Hassabis 明確表示:隨著我們走向 AGI,能源將等同於智能。智能越強,耗電越大。這是繞不開的物理規律。1、AI 不缺模型,最缺的是電不夠晶片永遠不夠。Hassabis 直言,即使 Google 有自己的 TPU 系列和 GPU,全球的計算晶片仍然供不應求。追根溯源,真正的瓶頸是能源:GPU 再多,也要靠電運行資料中心再大,也受限於電力供應模型再強,如果成本壓不下來,也只能停留在實驗室這不只是 Google 的問題,而是整個行業的天花板。當每家公司都在競相擴大算力、訓練更強的模型時,能源供應能不能跟上,決定了誰能真正把 AGI 從實驗室帶到現實世界。而這一點,正在成為 AGI 能否大規模應用的關鍵障礙。2、DeepMind 另一個野心:用 AI 去找能源如果 AGI 需要海量能源,那就讓 AI 自己去解決。DeepMind 的策略分兩個方向。開源:生產新能源與美國 Commonwealth Fusion 公司合作,用 AI 控制核聚變反應堆中的電漿體。核聚變一旦實現,將提供幾乎無限的清潔能源。Hassabis 的個人項目:能不能靠 AI 找出室溫超導材料。如果成功,將徹底改變電力傳輸和儲存方式。重新設計太陽能材料,大幅提升能源轉化率。節流:提高能源效率最佳化電網、資料中心、能源系統的運行效率,減少浪費尋找降低能耗的新型晶體結構幫工業最佳化生產路徑,減少不必要的能源消耗AI 不只會消耗資源,它也可以反過來推高資源效率。這不是第一次。從 AlphaFold 預測蛋白質結構,到現在尋找能源突破,Hassabis 始終相信:AI 是科學發現的終極工具。當每家公司、每個企業都要部署自己的大模型,競爭的關鍵變了:誰能讓AI更省電,誰就能部署更大規模誰能把每度電用得更值,誰就能活得更久最終,智能不是在比聰明,而是在比划算。能源供應能不能跟上,決定了這場技術升級能走多遠。而 DeepMind 的答案是:讓 AI 自己去解決能源問題。第四筆帳|競爭的關鍵:整合、部署、活下來技術路線之外,還有競爭格局。過去幾年,OpenAI 在消費端領先。憑藉 ChatGPT,迅速繫結微軟,推出 API、外掛、GPTs 商店。Google 顯得慢了半拍。但 2025 年底,風向變了。Gemini 3 上線時,同步進入 Google 搜尋、Android系統、Gmail、Workspace……全線鋪開。Hassabis 透露:過去兩三年,他做的最大變化不是研發方向,而是內部整合。1、DeepMind :從研究所到引擎室過去三年,Hassabis 只專注一件事:把 Google Research、Google Brain、DeepMind 三支團隊整合成一個 Google DeepMind。這不只是團隊整合,還包括重建Google的整個 AI 基礎設施。整合的結果:所有 AI 技術由 DeepMind 統一開發技術完成後,直接擴散到Google所有產品中Hassabis 與 Sundar Pichai(Google CEO)幾乎每天對話,決定技術方向和產品配置過去是三個團隊分頭做 AI,路線重疊、資源分散。現在是一個引擎室,統一調度。更關鍵的是速度。 Hassabis 說,他們每天調整路線圖和計畫。這不是大公司的穩健打法,而是初創團隊的衝刺節奏。目標只有一個:快速且安全地實現 AGI。Google AI 產品發佈效率實現了質的提升。2、模型強,部署要更快為了實現快速部署,DeepMind 建立了一個“骨幹網”,讓 AI 技術能夠快速擴散到Google所有產品中。Hassabis 把 Gemini 3 的發佈節奏形容為同步投放:模型訓練完成,第二天就能上線到搜尋、Gmail、Workspace不用二次改造,不用跨團隊溝通,一步到位這在以前是做不到的。Hassabis 說,他們在 Gemini 2.5 時才真正進入這個狀態。在此之前,模型和產品之間還有大量銜接工作。這種效率來自兩個優勢:第一,DeepMind 掌握從晶片到模型的完整技術堆疊。技術自主,不用等外部配合。第二,Google 的產品矩陣本身就是現成平台。搜尋、Android、Chrome、YouTube……AI 能力可以立刻接入,同步推送到數十億使用者。當 OpenAI 還在一個個談合作時,Google 已經完成了部署。Hassabis 說,接下來 12 個月,AI 能力會擴散到更多 Google 產品中。3、中國AI,落後幾個月意味著什麼談到中國的 AI 發展時,Hassabis 認為:中國領先實驗室,可能只落後幾個月。這意味著:在訓練效率、模型能力、部署速度上,差距正在快速縮小。DeepSeek 的低成本訓練方案、阿里巴巴的開源模型,都展示了中國團隊的工程能力和追趕速度。同時,Hassabis 也指出了下一個階段的關鍵:從復現技術到原創突破。他認為,發明一個新技術的難度,可能是復現它的100倍。中國實驗室已經證明了復現能力,接下來的問題是:能不能像當年發明Transformer那樣,創造出新的架構或方法?這不只是對中國的問題,也是對所有 AI 實驗室的挑戰。對所有想贏的 AI 玩家,Hassabis 指出:不是誰發佈得多,而是誰能讓產品真正跑起來不是誰融資多,而是誰能在泡沫之後還活著OpenAI 壓力很大,Anthropic 產品也很快,中國模型確實在追。但 DeepMind 的打法不是分散應對,而是整合優勢:統一的產品線、自有的平台、一步到位的部署。在 AI 這場長跑裡,活下來比跑得快更重要。結語|這輪 AI 競賽,錢該花在那四個地方Demis Hassabis 給出了四個方向:技術上,投資能理解世界、提出新想法的能力,不要只堆資料商業上,投資模型的部署效率,而不只是追求性能資源上,投資能源技術和能效最佳化,智能規模取決於每瓦電的價值競爭上,投資整合能力和產品閉環,而不只是發佈速度這四筆帳,DeepMind 給出了自己的答案。其他玩家怎麼選,決定了他們能走多遠。 (AI深度研究員)
當今 AI 最缺什麼?|DeepMind CEO最新對話實錄
12月17日,Google DeepMind 發佈了DeepMind聯合創始人兼 CEO Demis Hassabis 的專訪。本次對話全面探討了AI從大語言模型向Agentic AI的重心轉移、科學“根節點”問題的破解路徑、AlphaFold 到核聚變的連鎖反應、AGI 實現中“規模擴展”與“創新”的博弈、當前模型“鋸齒狀智能”的本質缺陷、世界模型與模擬在科學發現中的終極價值、從“被動式 AI”向“主動智能體”演進的風險與機遇、後 AGI 時代的經濟重構等話題以及 Demis Hassabis 基於圖靈機極限對人類意識獨特性的思考。Demis Hassabis 指出,儘管 AI 能在國際數學奧林匹克中摘金,卻在簡單的邏輯問題上犯“低級錯誤”,這種“鋸齒狀智能”是現有AI在一致性與推理能力上的缺失,就像一個“狀態不好、隨口胡謅”的人,缺乏像 AlphaGo 那樣“先思考、後行動”的規劃與雙重檢查機制。他強調,單純的知識壓縮不足以通向 AGI,必須補齊線上學習與深度推理這最後 50% 的拼圖。關於Scaling Law“撞牆”,Demis Hassabis 指出:“50% 的精力用於規模擴展,50% 用於創新,這兩者缺一不可”。他認為,我們正處於一個需要將“世界級的工程能力”與“世界級的研究科學”深度融合的新階段。不同於單純的資料堆砌,他主張回歸 AlphaGo 的演算法範式,通過在基礎模型之上疊加搜尋與規劃能力,並利用“世界模型”在模擬環境中通過無限的合成資料來突破資料枯竭的瓶頸。針對 DeepMind 的長期願景,他認為,大語言模型雖能理解語義,卻難以捕捉物理世界的因果力學。真正的理解意味著能夠“生成逼真的世界”,而精確的模擬將是科學發現的終極工具。他構想了一個通過模擬重演進化乃至社會動態的沙盒,不僅用於訓練具備好奇心的智能體,更試圖以此解開生命起源與意識誕生的謎題。他坦言,這種對物理法則的深度封裝,是 AI 從虛擬走向機器人實體與通用助手的必經之路。01AI 解鎖科學的連鎖反應這對 AI 來說是非凡的一年,我們目睹了重心從大語言模型轉移到了代理式 AI,以及 AI 在藥物研發、機器人和無人駕駛中的應用。記得我第一次採訪你時,你談到了“根節點”問題,也就是利用 AI 來解鎖下游利益的理念。你想給我們更新一下這些方面的進展嗎?有那些成果近在咫尺,又有那些問題已經解決或接近解決了?Demis Hassabis:最有力的證明就是 AlphaFold。想到 AlphaFold 2 向世界發佈快五周年了,這真不可思議。這證明瞭解決這種根節點類型的問題是可能的。我們現在正在探索所有其他領域,比如材料科學,我很想搞定室溫超導、更好的電池這類東西。我認為這些都是指日可待的,還有各種更好的材料。我們也正在致力於核聚變。我們剛宣佈了與 Commonwealth Fusion Systems 更深度的合作夥伴關係。我們之前就有合作,但現在更加深入了。我認為他們可能是致力於傳統托卡馬克反應堆的最優秀的初創公司,可能是最接近提出可行方案的團隊。我們希望能加速這一處理程序,幫助他們控制磁體中的電漿體,甚至可能協助進行一些材料設計,這非常令人興奮。此外,我們也在與 Google Quantum AI 團隊的量子計算同事們合作,他們正在做著驚人的工作。我們利用機器學習幫助他們開發糾錯碼。也許有一天,他們也會反過來幫助我們。聚變那個項目特別關鍵,如果我們能搞定這個,是不是會讓現在的很多問題迎刃而解?Demis Hassabis:(關於核聚變的影響)聚變一直是“聖盃”。當然,我認為太陽能也非常有前景,實際上它就是利用天空中的那個聚變反應堆。但如果我們要擁有模組化的聚變反應堆,這種幾乎無限、可再生、清潔能源的承諾顯然會改變一切。這就是“聖盃”,當然,這也是我們助力解決氣候問題的方式之一。絕對會。它會開啟許多其他的可能性,這就是為什麼我們將它視為一個“根節點”。當然,它直接有助於解決能源、污染等問題,緩解氣候危機。而且,如果能源真的實現可再生、清潔且超級便宜甚至幾乎免費,那麼許多其他事情就會變得可行。比如水資源獲取,因為我們幾乎可以在任何地方通過海水淡化廠獲取淡水。甚至製造火箭燃料,海水中含有大量的氫和氧,那基本上就是火箭燃料,只是將它們分離需要消耗大量能量。但如果能源便宜、可再生且清潔,為什麼不做呢?你可以讓它 24/7 全天候生產。02“鋸齒狀智能”與 AGI 的關鍵拼圖你也看到了很多變化,AI 被應用於數學領域,在國際數學奧林匹克競賽中贏得獎牌。然而與此同時,這些模型在高中數學題上卻可能犯相當基礎的錯誤。為什麼會存在這種悖論?Demis Hassabis:這可能是最迷人的事情之一,也可能是我們需要解決的關鍵問題之一,只有解決了它才能達到 AGI。正如你所說,我們和其他團隊已經取得了很多成功,在國際數學奧林匹克中摘金。你看那些題目,都是只有世界頂尖學生才能解出的超級難題。但另一方面,如果你換一種方式提問,它會在邏輯問題上犯一些相當低級的錯誤。它們甚至還不能真正下好一盤像樣的國際象棋,這很令人驚訝。所以在一致性方面仍然缺失了一些東西。我認為這正是你對通用智能,即 AGI 的期望:它應該在各個方面保持一致。有時人們稱之為“鋸齒狀智能”。它們在某些方面非常強,甚至達到博士水平,但在其他方面甚至不如高中水平。所以這些系統的表現仍然非常不均衡。它們在某些維度上令人印象深刻,但在其他方面仍相當基礎。我們必須填補這些差距。關於原因有各種理論。根據具體情況,甚至可能與圖像被感知和Token 化的方式有關。有時候,當你讓它數單詞裡的字母時,它實際上甚至沒有獲取到所有的字母;有時它會數錯,但這可能是因為它並沒有看到每一個單獨的字母。這些問題各有不同的原因,每一個都可以被修復,然後我們再看還剩下什麼問題。但我認為一致性,以及另一件事——推理和思考,是關鍵。我們現在的AI在推理階段會花更多時間“思考”,也更擅長輸出答案。但在以下方面還不夠穩定:它是否有效地利用了那段思考時間來進行雙重檢查,以及是否使用工具來驗證輸出結果?我認為我們正在朝著這個方向努力,但也許只走了 50% 的路程。我也在想 AlphaGo 和後來 AlphaZero 的故事,你們剝離了所有人類經驗,卻發現模型實際上變得更強了。在你正在建立的模型中,是否存在類似的科學或數學版本的演進?Demis Hassabis:(關於技術演進路線)我認為我們今天試圖建構的更像是 AlphaGo。實際上,這些大語言模型、基礎模型,是從全人類的知識起步的——我們在網際網路上發佈的所有內容,如今幾乎涵蓋了一切,然後將這些知識壓縮成某種有用的製品,供它們查詢和泛化。但我確實認為,我們仍處於早期階段,即在這些模型之上疊加搜尋或思考能力,就像 AlphaGo 那樣,利用模型來引導有用的推理路徑、規劃思路,然後針對當下的問題想出最佳解決方案。所以我不覺得我們目前受限於人類知識的極限。我認為目前的主要問題是,我們還不知道如何像使用 AlphaGo 那樣,以完全可靠的方式充分利用這些系統。當然,AlphaGo 要容易得多,因為它是一個遊戲。我認為一旦你擁有了 AlphaGo,你就可以回過頭來,就像我們開發 Alpha 系列時那樣,做一個 AlphaZero,讓它開始自我探索知識。我認為那將是下一步,但這顯然更難。所以我認為最好先嘗試用某種類似 AlphaGo 的系統邁出第一步,然後再考慮類似 AlphaZero 的系統。這也是當今AI所缺失的東西之一,就是線上學習和持續學習的能力。我們訓練這些系統,平衡它們,對它們進行後訓練,然後把它們投放到世界上,但它們不會像我們一樣在真實世界中持續學習。我認為這是這些系統所需的另一個關鍵缺失部分,也是 AGI 所必需的。03想要實現 AGI,規模擴展與創新缺一不可我看到你最近說過一句話:“如果由我決定,我們會讓 AI 在實驗室裡待得更久一些,做更多像 AlphaFold 這樣的事情,也許先治癒癌症之類的。”你認為因為沒有走那條更慢的路,我們失去了一些東西嗎?Demis Hassabis:我認為我們既有失去也有獲得。我覺得那本來會是一種更純粹的科學方法。至少那是 15、20 年前我最初的計畫,當時幾乎還沒人研究 AI。我們正準備創辦 DeepMind,人們覺得研究這個簡直是瘋了,但我們堅信不疑。當時的想法是,如果我們取得進展,我們會繼續循序漸進地建構 AGI,對每一步及其安全性非常謹慎,分析系統在做什麼等等。但在此期間,你不必等到 AGI 到來後才讓它發揮作用。你可以將技術分支出來,以真正造福社會的方式使用它,即推進科學和醫學。這實際上正是我們用 AlphaFold 所做的。它本身不是一個基礎模型,也不是通用模型,但它使用了相同的技術——Transformer 和其他技術,並將其與該領域的特定知識相結合。所以我曾設想完成一大批這類事情,這將帶來巨大的益處。你會向世界發佈這些成果,就像我們發佈 AlphaFold 一樣,並確實做到治癒癌症等事情,同時我們在實驗室裡繼續致力於更偏向 AGI 的路徑。現在的結局證明,聊天機器人在規模化上是可行的,人們也發現它們很有用。如今它們已經演變成了這些基礎模型,能做的不僅僅是聊天和處理文字,顯然包括 Gemini,它們可以處理圖像、視訊等各種事情。這在商業和產品層面上也非常成功。我也很喜歡這一點。我一直夢想擁有一個終極助手,能在日常生活中幫助你,讓你更高效,甚至可能保護你的大腦空間免受干擾,讓你能專注並進入心流狀態,因為今天的社交媒體充滿了噪音。我認為為你工作的 AI 實際上可以在這方面幫助我們。所以我認為這是好事。但這創造了一種相當瘋狂的競賽環境,許多商業組織甚至國家都在急於改進並超越彼此。這使得同時進行那種嚴謹的科學研究變得困難。我們試圖兩者兼顧,我認為我們正在把握這種平衡。另一方面,這種發展方式也有很多優點,資源湧入這個領域無疑加速了進展。而且,公眾實際上只比絕對前沿技術落後幾個月就能使用到這些東西。所以每個人都有機會親身感受 AI 將會是什麼樣子,這是件好事,也能讓政府更好地理解這一點。(關於Scaling是否撞牆)奇怪的是,去年這個時候,有很多關於Scaling最終會撞牆的討論,說我們會耗盡資料。然而,Gemini 1.5 剛剛發佈,它在一系列不同的基準測試中都處於領先地位。這怎麼可能呢?不是應該有擴展撞牆的問題嗎?Demis Hassabis:我認為很多人是這麼想的,特別是當其他公司的進展較慢時。但我認為我們從未真正看到過那樣的牆。我想說的是,也許存在收益遞減。當我說這個詞時,人們只會想到“那就沒有收益了”,好像它是 0 或 1 的關係,要麼是指數級增長,要麼是漸近線。不,實際上,在這兩種機制之間有很大的空間,我認為我們就處於這兩者之間。這不像在三四年前的早期階段那樣,你每發佈一個新的迭代,所有基準測試的性能都會翻倍。但你正在獲得顯著的改進,就像我們在 Gemini 1.5 中看到的那樣,這非常值得投資,且有很好的投資回報,所以我們沒有看到任何放緩的跡象。確實存在一些問題,比如:我們是否會耗盡可用的資料?但有辦法繞過這個問題,比如合成資料。這些AI已經足夠好,它們可以開始生成自己的資料,特別是在程式設計和數學等某些領域,你可以驗證答案的正確性。從某種意義上說,你可以生產無限的資料。雖然所有這些都是研究問題,但我認為這是我們一直擁有的優勢,就是我們一直堅持研究為先。我們擁有最廣度和最深度的研究人才儲備,一直如此。如果你回顧過去十年的進步——無論是 Transformer 還是 AlphaGo、AlphaZero,以及我們剛才討論的任何事情,它們都出自 Google 或 DeepMind。所以我一直說,如果需要更多的創新,尤其是科學上的創新,那麼我堅信我們就是做這件事的地方,就像我們在過去 15 年裡為許多重大突破所做的那樣。我認為這正是正在發生的事情。實際上,我很喜歡當局面變得更困難的時候。因為那時你不僅需要世界級的工程能力,還需要將其與世界級的研究和科學結合起來,而這正是我們所擅長的。除此之外,我們還擁有世界級基礎設施的優勢,利用我們的 TPU 和我們長期投資的其他資源。所以我認為這種組合讓我們既能處於創新的前沿,也能在規模擴展方面保持領先。實際上,你可以認為我們將50% 的精力用於Scaling,另外 50% 用於創新。我敢打賭,你需要這兩者才能達到 AGI。04模型越先進,就越能清晰地認知自身的知識邊界我們在 Gemini 1.5 這樣出色的模型中仍然觀察到的一點,就是所謂的“幻覺”問題。我記得有一個指標顯示,模型在理應拒絕回答時仍然給出了答案。你們能否建構一個系統,讓 Gemini 像 AlphaFold 那樣給出置信度分數?Demis Hassabis:我認為可以。這確實是目前缺失的環節之一,但我認為我們正在接近這個目標。模型越先進,就越能清晰地認知自身的知識邊界。因此它們會變得更可靠,你可以依靠它們進行某種形式的“內省”,或者進行更深度的思考,從而自我意識到對某個答案的不確定性。我們要解決的是如何通過訓練,讓它能夠將這種“不確定”作為一個合理的答案輸出。目前情況正在改善,但有時模型仍會強迫自己回答本不該回答的問題,這就導致了幻覺。目前很多幻覺都屬於這種類型。這是一個必須解決的缺失環節。你說得對,正如我們在 AlphaFold 上解決的那樣,但這顯然是在一個更受限的範圍內。Demis Hassabis:確實有對下一個 Token 的預測,這就是它的工作原理。但這並不能告訴你整體層面的資訊:即你對整個事實或整個陳述有多大信心?這就是我們需要利用思考和規劃步驟來回顧剛剛輸出內容的原因。目前有點像在跟一個狀態不好的人聊天,他們只是隨口說出腦海中蹦出的第一件事。大多數時候這沒問題,但在處理難題時,你會希望停下來暫停片刻,回顧並調整正要說的內容。也許這種方式在當今世界越來越少見,但這仍然是更好的交流方式。你可以這樣理解,模型需要在這方面做得更好。05世界模型與模擬的終極目標今年早些時候我們採訪了你們的 Genie 團隊。那是很棒的工作。告訴我為什麼你如此關注模擬?世界模型能做到那些大語言模型做不到的事情?Demis Hassabis:實際上,除了 AI 之外,世界模型和模擬可能是我長期以來最大的熱情所在。當然在我們最近像 Genie 這樣的工作中,這一切都融合在了一起。我認為大語言模型能夠理解關於世界的很多東西,實際上比我們預期的要多,甚至比我預期的還要多。因為語言所包含的資訊遠比我們想像的豐富,甚至超出了語言學家的預期。這些新系統已經證明了這一點。但關於世界的空間動態、空間感知,以及物理環境的機械運作原理,仍有很多難以用語言描述的內容,通常也不會在文字語料庫中被描述。這其中很多都與從經驗學習有關。有很多事情你無法真正描述,只能去體驗。無論是運動角度、氣味還是這類感測資訊,用任何語言描述都非常困難。所以我認為圍繞這方面有一整套內容。如果希望機器人技術能夠奏效,或者希望通用助手能在日常生活中,比如通過眼鏡或手機,伴隨並幫助你,而不僅僅是在電腦上,你就需要這種類型的世界理解能力。世界模型正是其核心所在。我們所說的世界模型,是指這種理解世界力學因果效應的模型,包括直觀物理學,事物如何移動、如何表現。現在我們在視訊模型中看到了很多這方面的內容。如何測試你是否擁有這種理解?如果你能生成逼真的世界,那麼在某種意義上你必須已經理解了,系統必須已經封裝了世界的許多力學原理。這就是為什麼 Genie 和 Veo 這些視訊模型和互動式世界模型令人印象深刻,它們標誌著我們正朝著通用世界模型邁進。希望在某個時間點,我們可以將其應用於機器人技術和通用助手。當然我最喜歡的事情之一,也是我肯定會去做的,就是將其重新應用迴游戲和遊戲模擬中,創造終極遊戲。這也許一直是我潛意識裡的計畫。所有這一切就是為了那個?Demis Hassabis:沒錯。這對遊戲來說將是驚人的。科學領域呢?你能在那個領域使用它嗎?Demis Hassabis:可以。對於科學而言,我認為建立複雜領域的模型——無論是原子層面的材料、生物學,還是像天氣這樣的物理系統,理解這些系統的一種方式是從原始資料中學習模擬。假設你有一堆原始資料,比如關於天氣的(顯然我們正在進行一些驚人的天氣項目),然後你有一個模型能學習這些動態,並能比暴力計算更高效地重建這些動態。所以我認為,模擬和某種形式的世界模型在科學和數學方面有巨大的潛力。06讓 AI 在彼此的“思想”中互動,創造無限的訓練樣本但通過這種方式,你也可以把一個智能體扔進那個模擬世界裡,對嗎?你的 Genie 團隊曾引用過一句非常漂亮的話:“幾乎沒有任何重大發明的先決條件是為了該發明而存在的。”他們談論的是將智能體放入這些模擬環境中,並允許它們以好奇心為主要動力進行探索。Demis Hassabis:對,這也是這些世界模型另一個真正令人興奮的用途。我們有另一個項目叫 SIMA,近期剛發佈了 SIMA 2。在這個項目中,我們將化身或智能體放入虛擬世界。它可以是一個普通的商業遊戲,或者像《無人深空》這樣複雜的開放世界太空遊戲。因為底層有 Gemini,你可以指導它,只需與智能體交談並給它佈置任務。但後來我們想:如果我們把 Genie 接入 SIMA 會不會很有趣?有點像是把一個 SIMA 智能體扔進另一個正在即時創造世界的 AI 中?現在這兩個AI 實際上是在彼此的“思想”中互動。SIMA 智能體試圖在這個世界中導航,而對 Genie 來說那只是一個玩家和一個化身,它不在乎那是另一個 AI,它只是圍繞著 SIMA 試圖做的事情生成世界。看到它們互動真是太神奇了。我認為這可能是一個有趣訓練循環的開端,在這裡我們幾乎擁有無限的訓練樣本。因為無論 SIMA 智能體試圖學習什麼,Genie 基本上都可以即時創造障礙、阻礙和環境來幫助它學習。你可以想像一整個設定和解決任務的世界,數百萬個任務自動生成並且難度不斷增加。所以我們可能會嘗試建立這樣一個循環。顯然這些 SIMA 智能體可以成為很好的遊戲伴侶,它們學到的一些東西對機器人技術也可能很有用。不過你創造的那些世界,如何確保它們真的逼真?如何確保你不會最終得到看似合理但實際上違背物理法則的結果?Demis Hassabis:(關於物理逼真度)這是一個很好的問題,也可能是一個隱患。這基本上又是幻覺問題。有些幻覺是好的,因為它意味著你可能會創造出有趣和新穎的東西。實際上如果你試圖做創造性的事情,或者讓AI創造新事物,一點幻覺可能是好的。但你希望這是有意為之,你可以稍微打開“幻覺轉盤”或創造性探索的開關。但是,當你試圖訓練 SIMA 智能體時,你並不希望 Genie 產生錯誤的物理幻覺。所以實際上我們現在正在做的是建構一個物理基準測試,我們可以使用物理模擬非常準確的遊戲引擎,來建立大量相當簡單的實驗,就像你在高中物理實驗室裡做的那樣。比如讓小球滾下不同的軌道,看它們跑多快。從非常基礎的層面上進行剖析,比如牛頓三大運動定律:模型是否封裝了這些定律?無論是 Veo 還是 Genie,這些模型是否 100% 精準地封裝了物理學?目前它們還沒有,只是一種近似。當你隨意觀看時它們看起來很逼真,但對於機器人技術等領域來說,它們還不夠準確無法依賴。所以這是下一步。既然我們已經擁有了這些非常有趣的模型,現在的目標之一就是減少幻覺,使它們更加紮實。對於物理學,這可能涉及生成大量的真值資料,比如簡單的鐘擺視訊——當兩個鐘擺相互繞行時會發生什麼,但很快你就會遇到三體問題,那是無論如何都無法精確解析的。所以我認為這會很有趣。但令人驚嘆的是,當你觀察像 Veo 這樣的視訊模型時,僅僅看它處理反射和液體的方式,至少在肉眼看來已經精準得令人難以置信。所以下一步實際上是超越人類業餘愛好者的感知範圍。它真的能經得起嚴格的物理級實驗嗎?07精確的模擬將是科學的一大福音,有助於理解生命的起源我知道你思考這些模擬世界已經很長時間了。我回顧了我們第一次採訪,在採訪中你說過,你非常喜歡這樣一個理論:意識是進化的產物。在我們進化路徑的某個節點,理解另一個體的內部狀態具有優勢,然後我們將這種能力轉向了自己。這是否讓你對在模擬內部運行一個進化中的智能體感到好奇?Demis Hassabis:當然,我很想在某個時候運行那個實驗。某種程度上重演進化,甚至重演社會動態。聖菲研究所過去常在小型網格世界中運行很多很酷的實驗。我過去很喜歡其中一些,主要是經濟學家在嘗試運行小型人工社會。他們發現,只要讓智能體在正確的激勵結構下運行足夠長的時間,市場、銀行等各種有趣的事物就會湧現出來。所以我認為那真的會很酷,也有助於理解生命的起源和意識的起源。這是我從一開始投身 AI 工作的最大熱情之一:我認為你需要這類工具來真正理解我們從何而來,以及這些現象究竟是什麼。我認為模擬是實現這一目標的最強大工具之一,因為你可以從統計學角度來進行研究。你可以用略微不同的初始條件運行模擬很多次,甚至運行數百萬次,然後以一種非常受控的實驗方式理解微小的差異是什麼。這在現實世界中對於我們想回答的任何真正有趣的問題來說,顯然是非常難以做到的。所以我認為精確的模擬將是科學的一大福音。考慮到我們已經發現了這些模型的湧現屬性,它們擁有某種我們沒預料到的概念性理解,你在運行這種模擬時是否也必須非常小心?Demis Hassabis:我認為必須如此。是的。但模擬的另一個好處是,你可以在相當安全的沙盒中運行它們。也許最終你會希望對它們進行物理隔離。當然你可以全天候監控模擬中發生的事情,而且你有權訪問所有資料。所以我們可能需要 AI 工具來幫助我們監控模擬,因為它們將變得非常複雜。如果你想像大量的 AI 在模擬中運行,裡面會有太多事情發生,任何人類科學家都很難跟上。但我們或許可以使用其他 AI 來幫助我們自動分析並標記模擬中任何有趣或令人擔憂的事情。08AI 泡沫與 Gemini 的“科學家”人格上次我們交談時,你說過你認為 AI 在短期內被過度炒作,但在長期內被低估了。我知道今年有很多關於 AI 泡沫的討論。如果出現泡沫並且破裂了,會發生什麼?Demis Hassabis:我仍然認同這一觀點:短期內過度炒作,而在中長期內,其實際的變革能力仍然被低估了。是的,現在當然有很多關於 AI 泡沫的討論。在我看來,這並非非此即彼的二元問題。我認為 AI 生態系統的某些部分可能處於泡沫之中。一個例子就是初創公司的種子輪融資,有些公司甚至還沒起步一出場就獲得了數百億美元的估值。這種情況是否可持續是有趣的,我的猜測是可能不會,至少總體上不會。所以這確實是一個存在泡沫的領域。然後人們顯然也在擔心大型科技公司的估值和其他事情。我認為這背後有很多真實的業務支撐,但這還有待觀察。也許對於任何具有難以置信的變革性和深刻影響的新技術——當然 AI 可能是最深刻的——你都會經歷這種矯枉過正。當我們創辦 DeepMind 時沒人相信它,沒人認為這是可能的。人們在想,“AI 到底有什麼用?”快進 10 到 15 年,現在這似乎成了商界唯一談論的話題。所以這幾乎是對之前反應不足的一種過度反應。我認為這是自然的。我們在網際網路時代看到過,在移動網際網路時代看到過,我認為我們在 AI 領域正在看到或將再次看到這一點。我不太擔心“我們是否處於泡沫中”,因為作為 Google DeepMind 的領導者,我們的工作是確保無論發生什麼,我們都能從中脫穎而出,變得更強大。我們的定位非常好,無論那種情況,我們都處於極佳的位置。所以如果趨勢像現在這樣繼續下去,太棒了,我們將繼續推進所有正在做的偉大事情、實驗以及朝著 AGI 的進展。如果出現回呼也沒關係。我認為我們也處於一個很好的位置,因為我們擁有自己的 TPU 全端基礎設施。我們還有所有這些令人難以置信的 Google 產品,以及由此產生的利潤,可以將我們的 AI 植入其中。而且我們正在這樣做,搜尋業務正被“AI 概覽”徹底革新。底層由 Gemini 驅動的 AI 模式。我們正在關注 Workspace、電子郵件、YouTube。Chrome 中也有所有這些驚人的功能。有很多這樣的機會,我們可以看到應用 Gemini 是唾手可得的果實。當然還有 Gemini App,它現在也表現得非常好,以及通用助手的願景。所以有新產品出現,我認為隨著時間的推移它們將變得超級有價值。但我們不必完全依賴那個。我們可以只為現有的生態系統賦能,我認為這就是過去一年發生的事情,我們現在的效率已經變得非常高了。人們花大量時間與聊天機器人交談,以至於最終陷入了自我激進化的怪圈。你要如何阻止這種情況?你如何在建構 AI 時讓使用者處於自己宇宙的中心,但同時又不至於創造出一個封閉的個人資訊繭房?Demis Hassabis:(關於資訊繭房與人格設定)這是一個非常微妙的平衡,我認為這是我們作為一個行業必須正確處理的最重要的事情之一。我們已經看到了某些過度迎合使用者的AI會帶來什麼後果,或者你會得到那種對使用者非常有害的回聲室強化效應。所以我認為解決這個問題的一部分——實際上這正是我們要用 Gemini 建構的,我對我們的團隊致力打造且我也親自參與的 Gemini 3 人格設定感到非常滿意——就是賦予它一種近乎科學家的個性。它是溫暖、樂於助人、輕鬆的,但同時也是簡潔、切中要害的。它會以一種友好的方式反駁那些不合邏輯的事情,而不是試圖強化“地球是平的”這種觀點。如果你說了這種話,它附和說:“絕妙的主意”,我認為這對社會總體上是沒有好處的。但你必須在這一點和使用者的需求之間取得平衡。因為人們希望這些系統是支援性的,能輔助他們的想法和頭腦風暴,所以你必須拿捏好這個尺度。我認為我們正在開發一門關於個性和人格的科學,研究如何衡量它的行為,以及我們希望它在真實性、幽默感這類維度上處於什麼位置。你可以想像,它出廠時會帶有一種基礎人格。每個人都有自己的偏好,你是希望它更幽默一點還是嚴肅一點,更簡潔一點還是更詳盡一點?人們各有所好,所以你可以在此基礎上加入額外的個性化層。但每個人得到的仍然是那個核心的基礎人格,它堅持科學方法,這是這些AI的全部意義。我們希望人們將這些工具用於科學、醫學和健康問題等領域。我認為這是正確建構這些大語言模型的科學的一部分,我對我們目前的發展方向感到相當滿意。09AGI 的雛形在目前 AI 領域發生的所有事情中,包括語言模型、世界模型等等,什麼最接近你對 AGI 的願景?Demis Hassabis:實際上顯然有 Gemini 3,我認為它非常有能力。但我們上周發佈的 Imagen 3 ,那是我們圖像生成工具的高級版本。真正令人驚嘆的是,它的底層也使用了 Gemini。它不僅能理解圖像,還能在某種程度上理解那些圖像中語義上正在發生什麼。人們才體驗了一周,但我已經在社交媒體上看到了很多關於人們用它做出的很酷的東西。例如,你可以給它一張複雜的飛機或類似的圖片,它可以標記出飛機所有不同部件的圖表,甚至可以將所有不同部件拆解開來進行可視化。它對機械學、物體的構成部件以及材料屬性有某種深度的理解。它現在還可以非常準確地渲染文字。所以我認為這正在朝向一種用於圖像領域的 AGI 邁進。它是一種可以在圖像跨域上做任何事情的通用系統,這非常令人興奮。然後是世界模型的進步,比如 Genie 和 SIMA 以及我們在那裡做的事情。最終我們將不得不把所有這些目前不同且交織的項目匯聚成一個大模型。那個模型可能開始成為原始 AGI 的一個候選者。10工業革命的鏡像與後 AGI 經濟重構我知道你最近一直在閱讀大量關於工業革命的內容。我們是否可以從那段歷史中學到什麼,來試圖減輕這次 AI 變革不可避免會引起的一些破壞?在後 AGI 社會,你對社會應該如何重構,或者可能以何種行得通的方式重構有什麼願景嗎?Demis Hassabis:我認為有很多值得我們學習的地方。這是我們在學校裡會學到的東西,至少在英國是這樣,但往往只是停留在非常表面的層次。對我來說,深入研究它是如何發生的真的很有趣。它的起源、背後的經濟原因,比如紡織工業,實際上第一批電腦的原型可以說就是紡織機,然後演變成了早期 FORTRAN 電腦和大型機使用的打孔卡。有一段時間,英國非常成功,成為了世界紡織業的中心,因為依靠自動化系統,他們可以以極低的成本製造出這些令人驚嘆的高品質產品。然後顯然蒸汽機和所有那些東西也隨之而來。工業革命帶來了許多不可思議的進步。兒童死亡率下降了,現代醫學和衛生條件、工作與生活的分離模式以及這一切的運作方式,都是在工業革命期間確立的。但它也帶來了很多挑戰。這個過程花了相當長的時間,大約一個世紀,不同領域的勞動力在特定時期遭遇了流離失所。社會必須創造新事物,必須建立像工會和其他組織這樣的新機構來重新平衡這種關係。看到整個社會不得不隨著時間推移去適應是令人著迷的,然後就有了現在的現代世界。顯然工業革命有很多利弊,但沒有人會想要回到工業革命之前,如果你想想它帶來的總和,比如西方世界食物和物資的富足,以及現代醫學和現代交通,那都是工業革命的功勞。也許我們可以通過從歷史中學習,提前弄清楚那些脫節和錯位是什麼,也許這次能更早或更有效地減輕這些影響。我們可能必須這麼做,因為這次的不同在於,它可能將比工業革命規模大 10 倍,而且速度可能快 10 倍。它更可能是在十年內展開,而不是一個世紀。(關於經濟重構的願景)是的,我現在花更多時間思考這個問題,實際上 Shane 正在領導這方面的一項工作,去思考後 AGI 世界可能是什麼樣子,以及我們需要為此做什麼準備。我認為社會總體上需要花更多時間思考這個問題,包括經濟學家、社會科學家和政府。就像工業革命一樣,整個工作世界、工作周以及一切都較工業革命前發生了改變,那時更像是農業社會。我認為至少這種程度的改變將再次發生。如果我們需要新的經濟系統、新的經濟模型來從根本上幫助這種轉型,我並不會感到驚訝。然後還有哲學層面的一面:工作會改變,其他事情也會改變。但也許那時我們將已經解決了核聚變,擁有了這種充裕的免費能源,進入了後稀缺社會。那麼金錢會變成什麼樣?也許每個人都更富裕了。但隨後人生的目標會變成什麼?因為很多人從他們的工作中獲得目標感,供養他們的家庭,這是一個非常高尚的目標。我認為其中一些問題從經濟問題混合成了近乎哲學的問題。你是否擔心人們似乎沒有關注,沒有像你希望的那樣快速行動?要讓人們認識到我們需要在這個問題上進行國際合作,需要付出什麼代價?你認為這會需要一個時刻,一個特定事件,讓每個人都猛然警醒並開始關注嗎?Demis Hassabis:我對此很擔心。在一個理想的世界裡,本應該已經有更多的合作了,特別是國際層面的。應該有更多的研究,以及關於這些話題的探索和討論。我實際上非常驚訝目前沒有更多關於這方面的討論。考慮到即使是我們的時間表,即 5 到 10 年,對於建立處理這一問題的機構來說,這個時間也並不長。我的一大擔憂是,現存的機構似乎非常碎片化,並且沒有達到你所需要的那個水平的影響力,所以可能是目前沒有合適的機構來處理這個問題。當然,如果你加上目前世界各地正在發生的地緣政治緊張局勢,合作和協作似乎比以往任何時候都難。只要看看氣候變化,要在與之相關的任何事情上達成協議是多麼困難。我們將拭目以待。我認為隨著賭注變得更高,隨著這些系統變得更強大——也許這是它們作為產品存在的好處之一,那些不從事這項技術工作的普通人將能切身感受到這些東西力量和能力的增長。這隨後將傳導給政府,也許隨著我們更接近 AGI,他們會變得理智起來。(關於喚醒時刻)我希望不需要。大多數主要的實驗室都相當負責任,我們試圖儘可能負責任。如你所知,這一直是我們所做一切的核心。這並不意味著我們會把一切都做對,但我們試圖在我們的方法上儘可能深思熟慮和科學。大多數主要實驗室都在試圖表現得負責任,而且實際上也有很好的商業壓力促使大家負責任。如果你想想 Agent,假設你正在把一個 Agent 租給另一家公司去做某事,那家公司會想知道限制、邊界以及護欄是什麼,以免它們做出不僅僅是搞砸資料之類的壞事。這很好,因為那些不守規矩的草莽式運作將無法獲得生意,企業不會選擇它們。11圖靈機極限與人類的獨特性從長遠來看,在 AGI 之外並邁向ASI時,你認為有一些事情是人類能做而機器永遠無法做到的嗎?所以,對於這些電腦器來說,不存在什麼做不到的事情嗎?Demis Hassabis:這是一個大問題。我覺得這與我最喜歡的話題之一:圖靈機有關。我一直有這種感覺:如果我們建構了 AGI,用它作為心靈的模擬,再把它與真實的心靈進行比較,我們隨後將看到差異在那裡,以及潛在地,什麼是人類心靈中獨特的、保留下來的東西。也許那是創造力,也許是情感,也許是做夢。還有關於意識,關於什麼可能是或可能不是可計算的,外界有很多假設。這回到了圖靈機的問題:圖靈機的極限是什麼?這是我一生的核心問題。我認為我們一直在做的一切,都在某種程度上把圖靈機能做什麼的概念推向極限,包括蛋白質摺疊。結果我不確定極限在那裡,也許根本沒有極限。當然我的量子計算朋友會說有極限,你需要量子電腦來模擬量子系統。但我真的不太確定,我實際上和一些量子領域的專家討論過這個問題,可能是我們需要來自這些量子系統的資料以便建立一個經典的模擬。這又回到了心靈的問題:它全是經典的計算,還是有其他什麼正在發生?像 Roger Penrose 相信大腦中有量子效應。如果確實有,而且那與意識有關,那麼機器將永遠不會擁有那個,至少經典機器不會,我們將不得不等待量子電腦。但如果沒有量子效應,那麼可能沒有任何限制。也許在宇宙中,如果你以正確的方式審視,一切都是計算可解的,因此圖靈機可能能夠建模宇宙中的一切。如果你非要我猜,我會猜是後者。在物理學向我證明事實並非如此之前,我都在這個基礎上開展工作。這麼說吧,到目前為止,在宇宙中還沒有人發現任何不可計算的東西。而且我們已經證明,對於經典電腦今天能做到的事情,比如蛋白質摺疊和圍棋,我們已經遠遠超越了通常複雜性理論家所持的 P=NP 觀點。所以我認為沒人知道那個極限在那裡。歸根結底,我們在 DeepMind 和 Google 所做的,以及我試圖做的,就是找到那個極限。如果把這個想法推演到極限,比如我們坐在這裡,感覺到燈光照在臉上的溫暖,聽見背景裡機器的嗡嗡聲,還有手下桌子的觸感。所有這些都能被經典電腦複製嗎?Demis Hassabis:我認為是可能的。這也正是我喜歡康德的原因。雖然我最喜歡的兩位哲學家是康德和斯賓諾莎,理由各異,但康德認為現實是心智的建構,我認為這是對的。你提到的那些進入感官系統並帶來不同感覺的事物,比如光的溫暖、桌子的觸感,歸根結底全都是資訊。我們就是資訊處理系統,我認為這也是生物學的本質。這正是我們在試圖做的事情:通過把生物學視為一個資訊處理系統,最終治癒所有疾病。我在業餘時間也在研究一些物理理論,認為資訊可能是宇宙的最基本單元,而不是能量或物質。或許最終這些都是可以互換的,只是我們感知的方式不同。但在我們所知的範圍內,所有這些驚人的感測器仍然可以被圖靈機計算。這就是為什麼你的模擬世界如此重要,對吧?Demis Hassabis:沒錯。那是通往真理的一條路徑。我們能模擬的極限是什麼?如果你能模擬它,在某種意義上你就已經理解了它。這種沉重的責任感是否曾讓你感到壓抑?是否曾感到孤獨?有沒有什麼事情對你的衝擊比預期的要大?Demis Hassabis:我睡得不多,部分是因為工作太多,也因為我有睡眠障礙。這其中的情緒非常複雜,因為它令人難以置信地興奮。我基本上在做我曾夢想的一切,我們在應用科學和機器學習等諸多方面都處於科學的絕對前沿。正如所有科學家都知道的那樣,那種身處前沿並首次發現新事物的感覺令人振奮。這種事幾乎每個月都在我們身上發生,太驚人了。當然,Shane 和我以及其他長期從事這項工作的人比任何人都更理解即將發生之事的深遠影響。實際上人們仍然低估了未來十年將會發生什麼,包括像哲學層面的問題:生而為人的意義是什麼,其中什麼才是重要的,所有這些問題都會浮出水面。這是一個巨大的責任。但我們有一個了不起的團隊在思考這些事情。這也算是我一生都在為此訓練的事情。從我早期下國際象棋,然後致力於電腦、遊戲、模擬和神經科學,這一切都是為了這一刻。這與我想像的樣子大致相符,所以我應對壓力的方式就是把這當作一種訓練。(關於意料之外的衝擊)當然有。比如 AlphaGo 的比賽。看著我們破解了圍棋這個曾經美麗的謎團,改變了它。這很有趣,但也讓人感到苦樂參半。我認為最近的語言模型和圖像生成對創造力的影響也是如此。我對創意藝術懷有巨大的尊重和熱情。我和電影導演交流過,這對他們來說也是一個雙重時刻。一方面他們擁有了能將創意原型製作速度提高 10 倍的驚人工具,但另一方面,它是否正在取代某些創造性技能?我認為這種權衡到處都在發生,對於像 AI 這樣強大且具有變革性的技術來說是不可避免的,就像過去的電力和網際網路一樣。人類的歷史就是製造工具的歷史,那是我們熱愛做的事情。我們擁有一個可以理解科學的大腦,這也讓我們擁有貪得無厭的好奇心。我認為這就是生而為人的核心。我從一開始就著了迷,而我回答這一問題的方式就是建構 AI。當你和其他 AI 領袖共處一室時,你們之間會有團結感嗎?那種大家都理解利害關係的感覺?還是說競爭讓你們彼此疏遠?Demis Hassabis:我們都認識彼此,我和他們幾乎所有人都相處得很好。但這很難,因為我們正處於可能有史以來最殘酷的資本主義競爭中。我的投資人朋友說,現在的殘酷程度是網際網路泡沫時代的 10 倍。在很多方面我喜歡這一點,我為競爭而生。但退一步說,我理解並且希望每個人都理解,比起公司的成功,還有更重大的東西處於危急關頭。談到未來十年,你個人最擔憂的時刻是什麼?那你最期待的是什麼?Demis Hassabis:現在的AI我稱之為被動式AI。使用者投入能量提出問題或任務,AI提供總結或答案。這很大程度上是人類主導的。下一個階段是基於 Agent 的AI。未來幾年我們將看到真正可靠的 Agent,它們將是極有能力的助手,但也更加自主。我認為這類系統的風險也會隨之上升。我相當擔心那些AI在兩三年後能做什麼。所以我們在致力於網路安全防禦,以準備應對那樣一個可能有數百萬 Agent 在網際網路上遊蕩的世界。至於期待,我絕對需要放個長假去做科學研究。那怕一周甚至一天也好。我的使命一直是協助世界為了全人類安全地實現 AGI。當我們到達那一點時,當然會有超級智能和後 AGI 時代的經濟社會問題。也許我可以在那裡提供幫助,但我的人生使命核心部分將就此完成。這需要協作,我希望利用我的位置提供幫助。 (數字開物)
36個月大逆轉!他帶著GoogleAI殺回來了,下一步世界模型
ChatGPT發佈距今已近36個月,面對OpenAI的領先,哈薩比斯帶領GoogleAI全面反攻,通過新發佈的Gemini 3強勢回歸。Gemini 3在LM Arena等多個模型榜單登頂,表現優於GPT-5及其他模型,上演了一場完美逆襲。大模型排行榜,你方唱罷我登場。馬斯克的Grok 4.1剛登頂,隨後就被Gemini 3 Pro反超了,上演了一幕AI版的「速度與激情」!Google DeepMind CEO哈薩比斯(Demis Hassabis)哈薩比斯在X平台上興奮地曬出Gemini 3的成績單,稱其「當然地」登頂各大排行榜,並表示這是自己迄今為止最愛的模型。就連奧特曼和馬斯克,也紛紛為Gemini 3點贊。馬斯克連發兩個哭泣的表情包:看來我們要盡快推Grok 4.2了。新發佈的Gemini 3具備領先的推理、多媒體處理和編碼能力,擅長推理、生成視訊和寫程式碼。Google強調,Gemini 3不只是一個更聰明的模型或聊天機器人,更重要的是它從發佈之日起,就開始全面增強Google現有產品,包括其利潤可觀的搜尋業務。它是Google這台龐大的賺錢機器的AI引擎,用哈薩比斯的話說:「我們是Google的動力引擎,現在我們正在讓AI全面接入」。哈薩比斯認為目前確實可能存在AI泡沫的問題,比如許多尚未經過檢驗的初創公司卻拿到了數十億美元的估值。但在他看來,即便是AI泡沫真的破裂,Gemini 3也讓Google有了穿越這場泡沫的底氣。把Google搜尋塞進GeminiGoogle內部,一直有一個把Google搜尋「塞」進Gemini的想法。這一想法,甚至可以追溯到Google早期。當時的Larry Page和Sergey Brin就設想過把整個網際網路都放進AI的「記憶」中,然後再對外提供服務。因此,Google在上下文方面做了大量實驗,並將上下文窗口提升到了100萬個token,目前這個記錄仍沒真正被人打破。哈薩比斯認為,機器理論上可以擁有比人類多幾百萬倍的儲存/記憶空間,但如果只是「天真地」把所有東西暴力存下來,其實並不高效。因此,與Google搜尋「塞」進Gemini相比,Google更多是把Gemini作為現有產品的底層模型向使用者開放。此次Gemini 3一發佈,Google已經正式通過Gemini應用,以及Google搜尋中的AI Overviews功能向使用者開放。據Google母公司Alphabet在7月的季度財報中表示,AI Overviews推動搜尋查詢量提升了10%。同時,Google視覺搜尋也出現了70%的激增,這項功能依賴於Gemini對照片的分析能力。與OpenAI相比,Google的優勢在於其產品「家底」深厚。它擁有包括搜尋、Google地圖、Gmail、雲服務等非常廣泛的基礎產品線。而且,Google很早就開始利用AI來增強其已有產品的能力。這使得它在與OpenAI、xAI、Anthropic等AI廠商的競爭中進可攻,退可守。哈薩比斯表示,「在不利的情況下,我們會更加依靠這些基礎產品;在有利的情況下,我們擁有最全面的佈局和最具前瞻性的研究。」Google也在考慮通過Gemini重啟Google眼鏡(Google Glass)項目。哈薩比斯表示,當時Google眼鏡步子邁得有點超前,缺少一個真正的「殺手級用例」,而通用助手正是這樣一個用例。因此,未來Gemini也將啟動Google以往積累下來的「經驗和遺產」,但是重點會放在「世界理解」上。以Gemini為例,Google一開始就將機器人和眼鏡視為兩個非常重要的應用場景,因此決定走多模態路線。如今,這些押注正在逐漸顯現出成果,Gemini已經在多模態理解上顯現出明顯優勢。除了用AI增強現有和以往的產品之外,Google也在積極利用AI打造越來越受歡迎的新工具。比如,NotebookLM,它可以根據文字材料自動生成播客;AI Studio,可以借助AI快速生成應用原型,等等。此外,Google還探索將這項技術應用到遊戲、機器人等領域。哈薩比斯提到GoogleAI的一個優勢,目前所有產品已經完全跑在Gemini技術堆疊上,實現了從產品到模型的「一體化」。這意味著無論是產品改動,還是模型微調都會容易很多,而且產品也可以更好地學會理解和使用底層模型。目前,哈薩比斯的重要精力,一半是將Gemini應用進一步加速做強,另一方面是將AI融入Google的各條業務線,使之成為Google的「AI動力艙」。「我對這一切非常興奮,目前我們只是剛剛觸及未來可能性的表面,明年會更直觀地看到這些變化」。哈薩比斯表示。被OpenAI「搶跑」後Google正快速趕上Google在AI領域長期投入巨大資源,並取得了一系列關鍵性突破。包括在2017年發現了Transformer模型架構,但沒有將其商業化,而是選擇把它公開。一直到2022年,OpenAI基於Transformer的ChatGPT爆火,動搖了Google的核心搜尋業務,才令它深受震動,開始奮起直追。有意思的是,OpenAI的崛起,不僅喚醒了Google在AI領域的加速發展,甚至還間接幫助Google避免了被分拆,出售其搜尋業務的命運。如今,Google的搜尋業務不僅沒有被OpenAI等AI新勢力所顛覆,相反它的AI模型還實現了對後者的反超。與Gemini3相比,OpenAI在8月份發佈的GPT-5令人略顯失望。一些評論者認為它「表現平平」,使用者也抱怨其風格變得更正式。據Google表示,Gemini 3在LM Arena等多個模型榜單上的表現優於GPT-5及其他模型,尤其在模擬推理以及長時間規劃方面表現更佳,這有助於提升依賴工具或網際網路的AI智能體的實際能力。在早期的AI競賽中,經歷過一些磕磕絆絆之後,Google總算是「漸入佳境」了。從使用者活躍度上看,Gemini應用的月活使用者已超過6.5億,僅次於ChatGPT的7-8億周活使用者(如果換算成月活可能在10億以上)。每月有超過20億人通過搜尋裡的AI Overviews使用Gemini;還有約1300萬開發者在自己的產品中整合了Gemini。這些數字表明Google正在逐漸縮短與OpenAI在AI領域的差距,作為GoogleAI總負責人的哈薩比斯也可以鬆口氣了。各方面都最強才叫AGI實現還要5-10年哈薩比斯表示,Google仍然在追求做「各方面都最強」的模型。在他看來,這才是真正意義上的通用模型,也是最終通向通用人工智慧(AGI)系統的關鍵組成部分。從之前的幾個版本到Gemini3,Google一直在修正Gemini模型的一些短板,使其在程式設計、推理、數學等能力上更進一步。比如,此次Gemini 3就在2.5之上迭代,一方面升級它的基礎能力,另一方鞏固在多模態領域的優勢。哈薩比斯認為未來AI的技術路線會越來越收斂,而擁有一個通用、全能的基礎模型將是一切的地基。除此次發佈的Gemini3 Pro外,Gemini模型家族裡的其他成員也在打磨中,等到這些模型陸續就位之後,Google還將在產品分層服務上提供更大的靈活度。簡單來說,就是更強的性能,更低的價格。正如哈薩比斯所言:「大方向是每一代新模型,都要在整體能力上更強,同時所需算力更便宜、更高效,帶來更有競爭力的價格和更低的時延」。目前,哈薩比斯在世界模型研究上花時間最多,在他看來這是通往AGI的關鍵元件。同樣,他也認為未來世界模型也將迎來類似ChatGPT那樣的「爆發時刻」。但最大的挑戰是推理/服務成本,以及還要解決在更長時間尺度上保持世界一致性等關鍵難題,才能迎來真正的「破圈」時刻。哈薩比斯表示,目前世界模型已經有了一些內部用例,比如用來訓練其他智能體、機器人系統等。未來可能會出現一些非常酷的外部應用場景。哈薩比斯仍然堅持他對通用人工智慧(AGI)時間表的預測。他認為距離真正意義上的完全實現AGI還有五到十年,而Gemini 3將成為未來打造更強大AI的重要平台,還需要在現有模型不斷變強的基礎上再取得一兩次關鍵性突破。在通往AGI的路上,哈薩比斯同樣也有算力焦慮。他坦言「即便將現在全世界的算力加在一起,也不夠滿足我們想做的所有事情」。因此,需要在不同項目之間衡量算力投入的回報。比如,研究上的收益、新產品探索的價值,或是直接的收入等。除了追求AGI,哈薩比斯還在帶領DeepMind在AlphaEvolve等一些科學領域進一步擴展。穿越AI泡沫的底氣談到AI泡沫,哈薩比斯整體上還是比較樂觀的,但他認為仍然存在一定的泡沫。「那些幾乎沒有什麼的項目,種子輪估值就能到幾十億美元,這在邏輯上有點行不通。」對比這些泡沫,哈薩比斯認為Google的位置非常好。就DeepMind而言,既有紮實營收,同時又承擔著Google「AI動力艙」的重任;既有Gemini模型及App,還有基於Gemini的NotebookLM等AI優先產品。哈薩比斯表示,目前AI已經在Google現有業務中看到了立竿見影的回報:正在為搜尋、YouTube、雲等業務「加功率」。作為DeepMind的聯合創始人,哈薩比斯早在12年前選擇與Google「聯手」時,已經考量過雙方合作的價值:Google可以提供海量的算力資源,同時它的產品又天然適合用AI去增強。目前,這條路正一步步變成現實。在哈薩比斯看來,Google與DeepMind的結合,讓現在的Google在AI競爭中處於一個非常有利的位置,使它有機會穿越泡沫,笑到最後。 (新智元)
AI還不具備真正的創造力 | DeepMind CEO,All-In Summit
近日,在美國All-In AI峰會上,Google DeepMind首席執行官、新晉諾貝爾獎得主Demis Hassabis接受了一場深度對話。本次圓桌對話全面探討了AI的前沿進展與未來圖景,話題涵蓋了從顛覆性的可互動世界模型Genie,到AI在機器人、科學發現、藥物研發領域的革命性應用,再到對AGI實現路徑。Demis Hassabis詳細闡述了Genie模型如何通過“逆向工程”學習並生成物理世界,顛覆了傳統3D渲染引擎的底層邏輯,更提出了未來娛樂形態將是頂尖創作者主導下的“共同創作”模式。此外,Demis Hassabis駁斥了當前AI系統已達“博士級智能”的說法,稱之為“無稽之談”,並犀利地指出其在穩定性和真正的通用性上仍有根本性缺陷。同時,他也對AI性能提升趨於停滯的觀點予以否認,認為在更廣闊的多模態領域,進步速度依然驚人。01 諾獎榮耀與Google的AI引擎室您在得知獲得諾貝爾獎時身在何處,又是如何得知的?DeepMind在龐大的Alphabet組織中扮演著怎樣的角色,您的具體職責是什麼?以及您的團隊規模有多大,人員構成是怎樣的,其中科學家和工程師的比例如何?Demis Hassabis: 那是一個非常奇妙的時刻。關於它的一切都感覺不真實,包括他們通知你的方式。他們會在全球直播前大約10分鐘才告訴你。當你接到來自瑞典的電話時,你真的會感到有些不知所措。那是每一位科學家都夢寐以求的電話。接下來的頒獎典禮,是在瑞典與王室成員共度一整周。那感覺太棒了,畢竟這項傳統已經延續了120年。而最不可思議的部分,是他們會從保險庫中取出諾貝爾獎的簽名冊,讓你在所有前輩偉人的名字旁邊簽下自己的名字。所以,當翻閱著冊子,看到Feynman、Marie Curie、Einstein和Niels Bohr等等這些名字,一頁頁地回溯歷史,然後將自己的名字也寫進那本冊子裡,那真是一個令人難以置信的瞬間。(關於是否預感會獲獎)你會聽到一些傳聞。但在當今這個時代,他們還能把消息封鎖得如此之好,確實令人驚嘆。諾貝爾獎對瑞典來說就像是國寶一樣。所以你會聽到一些說法,比如 AlphaFold 的成就或許值得這份殊榮。而且,他們不僅看重科學突破本身,也看重其在真實世界中產生的影響。而這種影響力的顯現,有時需要二三十年。所以,你永遠無法確定獲獎的時刻是否會到來,會在何時到來。因此,這確實是一個驚喜。(關於DeepMind在Alphabet中的角色)我們現在將 DeepMind,或者說合併後的 Google DeepMind,視為整個 Google 和 Alphabet 的核心引擎室。幾年前,我們將 Google 和 Alphabet 內部所有不同的人工智慧項目,包括 DeepMind,都整合到了一起,成立了一個新的部門,彙集了各個團隊的優勢。我現在通常這樣描述我們的角色:我們是整個 Google 和 Alphabet 的動力之源。我們建構的核心模型 Gemini,以及許多其他模型,比如視訊模型和互動式世界模型,現在都已接入 Google 的各個體系中。可以說,幾乎每一款產品、每一個使用者介面,背後都有我們 AI 模型的支援。如今,無論是通過 AI Overview、AI 模式還是 Gemini 應用,已有數十億使用者在與 Gemini 模型進行互動。而這僅僅是一個開始。我們正逐步將其融入 Workspace、Gmail 等產品中。所以,這對於我們來說是一個絕佳的機會,既能進行最前沿的研究,又能立刻將成果交付給數十億使用者。(關於團隊構成)我負責的 Google DeepMind 部門大約有5000人。其中,我估計超過80%是工程師和擁有博士學位的研究人員。所以,這個數字大約在三四千人。02 AI正在對我們世界的直觀物理學進行逆向工程你們前發佈一款名為Genie的世界模型,它具體是什麼?其是它與傳統3D渲染引擎有何根本不同?從長遠來看,當這類模型發展到更高階段,例如第五代時,它將引領我們走向何方,其最終的應用目標又是什麼?Demis Hassabis: 它非常驚豔。大家現在看到的所有視訊和可互動世界,實際上都是由 AI 生成的。你可以看到有人在實際控制畫面,它不是一段靜態視訊,而是完全由文字提示生成。然後,人們就可以用方向鍵和空格鍵來控制這個三維環境。所以,你在這裡看到的每一個像素都是即時生成的。在玩家或互動者到達世界的某個區域之前,那個區域是不存在的。這些豐富的細節隨後會展現出來,這個畫面是完全生成的,不是真實視訊。它生成了一個人正在粉刷自己房間的場景,在牆上塗鴉。接著,玩家會向右看,然後再看回來。世界的這個部分剛才還不存在,現在它被創造出來了。當玩家回頭看時,又能看到自己剛才留下的塗鴉痕跡。我再強調一次,你看到的每一個像素都是完全由 AI 生成的。你還可以輸入“穿著小雞服裝的人”或“一輛水上摩托艇”,模型會即時將這些元素加入到場景中。這真的相當令人震撼。(關於與3D引擎的不同)這個模型實際上是在對我們世界中的直觀物理學進行逆向工程。它觀看了數百萬個關於我們世界的視訊,包括YouTube視訊等,並僅從這些視覺資訊中,就反向推匯出了世界運行的大部分規律。它目前還不完美,但已經能作為使用者,在許許多多不同的世界裡,生成一到兩分鐘連貫的互動體驗。在後面的演示中,你還可以控制沙灘上的一隻狗,或者一隻水母,所以它的能力不侷限於和人類相關的場景。它通過觀看視訊和一些來自遊戲引擎的合成資料進行訓練,並自己完成了逆向工程。這個項目對我個人而言意義非凡,同時也讓我感到非常震撼。因為在90年代,我職業生涯早期曾為視訊遊戲編寫過AI和圖形引擎。我至今還記得,當時要手動編寫所有多邊形和物理引擎是多麼困難。而現在看到Genie毫不費力地就實現了這一切,水面的反射、材質的流動方式、物體的行為等等,全都自然天成,這實在是太神奇了。(關於模型的未來方向)我們之所以建構這類模型,是因為我們始終認為,儘管我們像其他團隊一樣,在Gemini這樣的大語言模型上不斷取得進展,但從一開始,我們就希望Gemini是一個多模態模型。我們希望它能接收任何類型的輸入,無論是圖像、音訊還是視訊,並且能輸出任何內容。我們對此非常感興趣,因為要讓AI實現真正的通用,要建構AGI,我們認為AGI系統必須能夠理解我們周圍的物理世界,而不僅僅是語言或數學等抽象世界。當然,這對於機器人技術的發展也至關重要,這可能正是當前機器人技術所缺失的環節。同樣的道理也適用於智能眼鏡這類裝置,一個能在日常生活中為你提供幫助的智能眼鏡助手,必須能夠理解你所處的物理環境,以及我們世界中直觀物理學的運作方式。因此,我們認為,建構像Genie這樣的模型,以及我們最好的文字到視訊模型Veo,都是我們建構世界模型的具體體現。這些模型能夠理解世界的動態和物理規律。如果你的系統能夠生成一個世界,那就證明它已經理解了那個世界的運行法則。03 AGI系統必須能夠理解我們周圍的物理世界Genie這類世界模型最終是否會通往機器人領域?能否介紹一下當前視覺-語言-行動模型的最新進展是怎樣的?一個能夠通過攝影機觀察世界,通過自然語言接收指令,並據此在物理世界中執行相應動作的通用系統,目前發展到了什麼階段?Demis Hassabis: 完全正確。如果你體驗一下Gemini的Gemini Live版本,將手機攝影機對準你周圍的世界,你會發現它對物理世界的理解已經達到了一種近乎神奇的程度。你可以將下一步想像為,把這種能力整合到像眼鏡這樣更便攜的裝置中。到那時,它就會成為一個日常助手,可以在你逛街時為你推薦事物,或者我們可以將它嵌入到Google地圖中。在機器人領域,我們建構了名為“Gemini機器人模型”的系統,這可以看作是在Gemini的基礎上,用額外的機器人資料進行微調後的版本。這個項目最酷的一點,也是我們今年夏天通過一些演示所展示的,是我們設定了一些桌面場景,有兩隻機械臂在桌面上與物體互動,你可以直接和機器人對話。比如,你可以說“把黃色的物體放進紅色的桶裡”,它就能理解這條語言指令,並將其轉化為具體的機械動作。這就是多模態模型相比於純粹的機器人專用模型所具備的強大之處,它能夠將對真實世界的理解融入到與你的互動中。所以最終,這種模型既能提供你所需要的使用者介面體驗,也能賦予機器人安全探索世界所必需的理解力。04 “機器人Android系統”與人形設計的價值是否意味著你們最終能夠打造出一種通用機器人領域的“Android”系統,一個能夠賦能大量機器人裝置和公司的底層作業系統?您認為人形是機器人一種好的外形設計嗎,這種形態在現實世界中是否有其存在的意義?對於未來五到七年,您預計機器人的普及規模會達到何種量級,是成千上萬,還是數百萬甚至上億?Demis Hassabis:這當然是我們正在追求的策略之一,可以稱之為一種“Android模式”,即為整個機器人領域提供一個近乎作業系統的底層。但除此之外,還有一些非常有趣的方向,比如將我們最新的模型與特定的機器人類型和設計進行垂直整合,並進行某種端到端的學習。所以,這兩種策略都非常有前景,我們也在同時推進。(關於人形設計的價值)我認為未來這兩者都會有市場。實際上,大概在五到十年前,我的看法是,我們會為不同的任務設計特定形態的機器人。而且我認為在工業領域,工業機器人肯定會是這樣,你可以根據具體任務來最佳化機器人的形態,無論是在實驗室還是在生產線上,你需要的機器人類型都會大相逕庭。但另一方面,對於通用或個人使用的機器人,要讓它們與我們的日常生活環境互動,人形形態可能就非常重要了。因為,我們身邊的物理世界顯然是圍繞人類的需求來設計的。比如台階、門廊,所有這些都是為我們自己設計的。與其去改造現實世界中的這一切,設計出一種能與我們現有世界無縫協作的機器人形態,可能會是更容易的方案。所以我認為,有充分的理由相信,對於這類任務,人形形態可能至關重要。當然,我也認為,特種形態的機器人同樣會有一席之地。(關於機器人普及的時間和規模)我確實有,並且在這個問題上思考了很久。我感覺,我們在機器人技術領域仍處於比較早期的階段。我相信在未來幾年內,機器人領域會出現一個真正令人驚嘆的“高光時刻”。但我認為,演算法還需要進一步發展。這些機器人模型所依賴的通用模型,需要變得更強大、更可靠,需要更好地理解周圍的世界。我相信這在未來幾年內能夠實現。此外,在硬體方面,關鍵問題在於,我認為我們最終會擁有數百萬台機器人來服務社會、提高生產力。但關鍵在於,當你和硬體專家交流時,他們會問:硬體發展到那個節點,才算達到了適合大規模量產的水平?因為一旦你開始投資建廠,準備生產成千上萬台特定型號的機器人,再想快速迭代更新機器人設計就變得非常困難了。所以這是一個時機問題,如果你過早地決定量產,可能六個月後就會出現一款更可靠、更出色、更靈巧的下一代機器人。如果用電腦領域的發展來類比,我們當前所處的階段,是不是有點像上世紀70年代,PC-DOS系統剛剛出現的那個時期?有這個可能。或許我們確實處於類似的早期階段,但關鍵區別在於發展的速度。我們現在用一年時間就走完了過去十年的路,所以必須進行快速迭代。可以說,現在的一年,就相當於過去的十年。05 如今的AI還不具備真正的創造力在科學領域,AI有那些最讓您感到興奮的應用前景和潛在突破,我們還需要什麼樣的模型才能實現這些突破?當前AI在科學發現的能力上還缺失那些關鍵環節?另外,從人類的角度來看,您如何定義“創造力”這一概念?Demis Hassabis: 利用AI加速科學發現並助力人類健康等事業,正是我為AI奮鬥終生的原因。我認為這是AI最重要的使命。我相信,如果我們能以正確的方式建構AGI,它將成為推動科學發展的終極工具。在DeepMind,我們的工作正是在不斷為此開闢道路。其中最著名的當然是AlphaFold,但實際上,我們已經將AI系統應用於眾多科學領域,例如材料設計、輔助控制核聚變反應堆中的電漿體、天氣預測以及解答奧數難題。這些複雜的難題,基本上用同類型的系統,再經過一些額外的微調就能解決。所以我認為,我們目前對AI潛力的探索還僅僅是冰山一角,還有很多能力尚待開發。在我看來,如今的AI還不具備真正的創造力,因為它還無法提出新的科學猜想或假設。它或許可以證明你給定的命題,但無法自己構想出全新的想法或理論。因此,我認為這恰恰是檢驗AGI的標準之一。(關於創造力的定義)我認為創造力是我們常在歷史上最傑出的科學家和藝術家身上所推崇的那種直覺的飛躍。它或許源於類比或類比推理。關於我們人類科學家如何實現這一點,心理學和神經科學領域有許多理論。但一個很好的測試方法是,給一個現代AI系統設定1901年的知識截止點,看它能否像愛因斯坦在1905年那樣提出狹義相對論。如果它做到了,那就意味著我們觸及到了非常本質的東西,或許就離AGI不遠了。另一個例子是我們的AlphaGo程序,它曾擊敗世界圍棋冠軍。它不僅贏得了比賽,還為圍棋這項運動開創了前所未有的新策略,比如在第二局下出的著名的第37手,如今已成為棋界研究的經典。但是,一個AI系統能否創造出一款像圍棋這樣優雅、精妙、富有美感的遊戲,而不僅僅是發明一種新策略呢?目前來看,答案是否定的。所以我認為,這正是真正的通用系統,也就是AGI系統所缺失的能力之一,它理應也具備這些能力。06 “博士級智能”是無稽之談很多人認為AGI將在幾年內實現,您似乎不完全認同這個觀點。能否從系統架構的理解出發,具體分析一下當前實現AGI還缺少那些關鍵環節,瓶頸究竟在那裡?與此同時,有報告和評估體係指出,大語言模型的性能正在趨同,且每一代模型性能的提升速度似乎在放緩,您認為這個說法基本屬實嗎?Demis Hassabis: 我認為這裡的根本問題在於,我們能否模仿最頂尖人類科學家所能實現的那種直覺飛躍,而不僅僅是漸進式的提升。我常說,一個偉大的科學家與一個優秀的科學家之間的區別在於,儘管兩者都具備很強的技術能力,但偉大的科學家更具創造力。他們或許能從另一個學科領域發現某種模式,並將其通過類比或模式匹配應用到自己正在研究的問題上。我相信AI終有一天能做到這一點,但目前它還不具備實現這種突破所必需的推理能力和某些思維能力。我還認為,我們目前缺乏穩定性。你常聽到我們的一些競爭對手說,現在的這些是“博士級智能”。我認為這種說法是無稽之恩。它們不是博士級智能。它們或許在某些方面具備博士水準的能力,但遠非在所有領域都能穩定地達到博士水平,而這恰恰是通用智能的定義。事實上,我們和今天的聊天機器人互動時都會發現,只要換種方式提問,它們甚至會在高中數學或簡單計數這類問題上犯低級錯誤。這對於一個真正的AGI來說是不應該發生的。所以我認為,我們距離一個能做到上述所有事情的AGI,可能還有五到十年的時間。另一個缺失的關鍵是持續學習,即系統能夠線上學習新知識或隨時調整自身行為的能力。我認為,許多這類核心能力目前仍然缺失。或許Scaling Law能幫助我們實現目標,但如果讓我預測的話,我認為我們可能還需要一到兩個關鍵的理論突破,而這大概需要未來五年左右的時間。(關於模型性能趨同和提升放緩的說法)不,我們在內部並沒有看到這種情況,我們依然保持著極快的進步速度。而且,我們看待問題的視野也更廣。你可以看看我們的Genie、Veo等模型。07 AI創作的兩個趨勢以Nano-Banana為例,這類先進的圖像生成工具不僅效果驚人,更重要的是其指令理解的精準性和結果的一致性,這是否意味著我們正在走向一個“創造力民主化”的未來,讓每個人都能輕鬆創作?在推動工具普及的同時,這些AI工具又將如何賦能頂尖的專業創作者?未來我們會進入一個完全個性化的娛樂世界,每個人都能即時生成自己想要的內容,還是社會仍然需要由創作者提供、供大家共同分享的文化產品?從文化角度看,我們是會各自沉浸在自己的虛擬世界,還是會繼續擁有共同的故事?Demis Hassabis: Nano-Banana的效果簡直不可思議。我認為很多創意工具的未來就是這樣:你只需要憑感覺與它互動,或者直接和它對話就行了。而且它們的表現會足夠穩定,就拿Nano-Banana來說,它之所以如此出色,不僅在於它是頂級的、最先進的圖像生成器,更在於它的一致性。它能精準理解並執行你的指令,在你要求改變某個部分時,能保持其他所有元素不變。這樣你就可以通過不斷迭代,最終得到你想要的效果。我認為這就是未來創意工具的形態,它指明了發展的方向,人們非常喜愛它,也樂於用它來創作。這實現了“創造力的民主化”,我認為這非常了不起。我記得小時候,為了學Photoshop,我得買很多書,照著書學習如何從圖像中移除物體、如何填充、如何羽化等複雜操作。現在,任何人用Nano-Banana都能做到,他們只需向軟體描述想讓它做什麼,它就能自動完成。(關於賦能專業創作者)未來會出現兩個趨勢。一方面是這些創作工具的普及化,讓每個人都能輕鬆上手和創作,而不必像我們過去那樣去學習極其複雜的使用者體驗和使用者介面。但另一方面,我們也正在與頂尖的電影製作人、創意人士和藝術家合作,比如我的好朋友、著名導演Darren Aronofsky。他們正在幫助我們設計新一代的工具,告訴我們需要那些功能。他和他的團隊已經在使用Veo等工具來製作電影。通過觀察並與他們合作,我們獲益匪淺。我們發現,這些工具也極大地提升了頂尖專業人士的能力和效率。那些最優秀的專業創作者,他們的生產力突然之間可以提升10倍甚至100倍。他們可以低成本地嘗試腦海中各式各樣的創意,並最終創作出理想的作品。所以我認為,這兩方面是平行不悖的。我們既在為普通使用者和YouTube博主們推動工具的普及,同時,在高端專業領域,情況也同樣如此。要用好這些工具,並獲得頂級輸出,並非人人都能做到,這本身也需要技巧,更需要頂尖創者的視野、敘事能力和獨特風格。我認為,這些工具讓他們如虎添翼,他們也非常享受這種能快速迭代創作過程的體驗。(關於未來娛樂的形態)我確實預見到一個新世界的到來。我從90年代起就以遊戲設計師和程式設計師的身份入行,所以我經常思考這個問題。我認為我們正在見證的,正是娛樂行業未來的開端,它可能會催生一種全新的內容類型或藝術形式。在這種形式中,存在著一定程度的“共同創作”。我仍然相信,頂尖的、富有遠見的創作者依然會是核心,他們將創造出引人入勝的體驗和動態的故事情節,即便使用相同的工具,他們作品的質量也會遠超普通人。因此,未來可能會有數百萬人沉浸在這些大師建構的世界裡,但同時,他們或許也能參與到這個世界某些部分的共同創造中。而那位主要的創作者,其角色更像是一個世界的“主編”。這就是我預見的未來幾年可能發生的事,而且我也很想用Genie這樣的技術親自去探索這個方向。08 AI的能源挑戰能否介紹一下您負責的另一家公司Isomorphic及其在藥物發現領域的革新性工作?這些AI發現的候選藥物預計何時能進入臨床試驗階段?在技術層面,這項工作多大程度上需要開發新的模型架構,你們是如何將機率性模型與確定性模型相結合的?此外,關於AI的能源需求問題,您認為模型和硬體的進步能否有效降低能耗?最後,請您描繪一下十年後,在AI影響下的世界圖景。Demis Hassabis: 當然可以。我還負責營運Isomorphic,這是我們基於AlphaFold在蛋白質摺疊領域的突破而分拆成立的一家公司,旨在徹底革新藥物發現的過程。當然,瞭解蛋白質的結構只是藥物發現的第一步。你可以將Isomorphic想像成一個平台,它正在建構一系列與AlphaFold功能銜接的系統,用於解決後續問題,例如設計出能夠精準結合蛋白質靶點又沒有副作用的化學分子。我認為在未來十年,我們有望將藥物發現所需的時間從數年甚至十年,縮短到幾周乃至幾天。(關於進入臨床試驗的時間點)我們目前正在搭建這個平台,並與禮來(Eli Lilly)和諾華(Novartis)等頂尖藥企建立了良好的合作關係。此外,我們也有自己的內部藥物研發項目。我預計,我們將在明年某個時間點進入臨床前階段。我們將候選藥物交付給製藥公司,由他們接手推進後續的開發。我們目前正致力於癌症、免疫學和腫瘤學等領域的研究,並與MD Anderson癌症中心等機構合作。(關於混合模型架構)這是個非常好的問題。實際上,至少在目前以及未來五年左右,我們建構的都是所謂的混合模型。AlphaFold本身就是一個混合模型。它有一個學習元件,也就是你提到的機率性部分,它基於神經網路和Transformer架構,從所有可用資料中進行學習。但與此同時,在生物和化學的許多場景中,我們並沒有足夠的資料來讓模型從零學起。因此,你還必須將一些已知的化學和物理規則內建到模型中。例如,在AlphaFold中,我們設定了原子間化學鍵的角度限制,並確保模型理解原子之間不能發生重疊等基本物理原則。理論上,模型或許也能自己學會這些,但這會極大浪費它的學習能力。因此,將這些規則作為硬性約束,效率會高得多。現在,所有混合系統的難點都在於此——AlphaGo也是一個混合系統,它有一個學習圍棋棋局模式的神經網路,上層則是一個用於規劃的蒙特卡洛樹搜尋演算法。真正的挑戰在於,你如何將一個學習系統與一個更偏向人工設計的定製化系統完美地結合起來,並讓它們高效協同工作?這其實非常困難。我認為最終的目標是,當你通過混合系統驗證了某個元件的有效性之後,你應該想辦法將這個元件的能力整合、“反哺”到學習元件中去。因為,如果能實現端到端學習,直接從原始資料一步到位地預測出最終結果,那永遠是更好的方案。所以,一旦你通過某個混合系統取得進展,你就要回頭去反思,看看能否將這一成功經驗和知識,完全融入到學習系統本身。(關於AI的能源需求問題)有趣的是,我認為這兩種趨勢是同時存在的。一方面,我們,尤其是在Google和DeepMind,極其注重提升模型的效率和性能,因為我們有大量的內部應用場景。例如,我們需要每天為全球數十億使用者提供AI Overviews服務,這就要求系統必須做到極致的高效、低延遲和低服務成本。為此,我們開創了許多技術,比如“蒸餾”,也就是用一個強大的內部大模型來訓練一個更小的模型,讓小模型模仿大模型的行為。如果你看過去兩年的進展,要達到同等性能,模型的效率已經提升了10倍,甚至100倍。那麼,為什麼總需求沒有下降呢?因為我們離AGI還很遠。這意味著在不斷提升推理服務效率的同時,我們還希望在更大規模上訓練和試驗新的前沿模型。所以,這兩個方面的情況都是真實的。但最終,從能源的角度看,我認為AI系統對能源和氣候變化等領域的貢獻,將遠遠超過它自身的消耗。AI將在提升電網系統效率、設計新材料、發現新能源等方面發揮巨大作用。我相信,在未來十年,AI在這些領域的貢獻所帶來的價值,將遠遠超過它今天所消耗的能源。(關於十年後的世界)在AI領域,十年太漫長了,有時十周就如同一個時代。但我確實認為,未來十年內我們將迎來真正的、完全的AGI。我認為,它的到來將開啟一個科學的全新黃金時代,一場新的文藝復興。屆時,我們將看到它為從能源到人類健康的各個領域帶來深遠的益處。 (數字開物)
DeepMind CEO定義世界模型標準:不僅理解物理世界,還能創造它
從與現實難辨的AI視訊,到細緻到流水與倒影都符合物理的虛擬世界,再到會在推理中主動呼叫工具自我修正的模型——這並非科幻小說,而是DeepMind最新的AI工具,已經展現的驚人能力。8月13日消息,GoogleDeepMind首席執行官德米斯・哈薩比斯(Demis Hassabis)近日做客播客節目《Release Notes》,全面闡述了DeepMind最新一系列技術突破背後的思路與戰略佈局,其中世界模型Genie 3的突破性進展成為核心亮點。在這場深度對話中,他勾勒出一個令人振奮又充滿挑戰的AI新紀元:從AlphaGo征服圍棋,到Deep Think斬獲數學奧賽金牌;從生成逼真世界的Genie 3,到即將誕生的“全能模型”,我們正站在通向AGI的關鍵轉折點。然而,即便AI已能創造一個完整的虛擬宇宙,它依然可能在國際象棋中違規行棋,這種“參差型智能”的悖論,正揭示了人工智慧最深層的秘密。哈薩比斯指出,“思考型模型” (the thinking models)是通向通用人工智慧(AGI)的必經之路;DeepMind的終極目標是推出融合語言、多媒體、物理推理與生成能力的全能模型(Omni Model),其核心支撐正是世界模型的持續進化,最終將實現全面且一致的智能表現,推動通用人工智慧(AGI)安全落地。此次訪談由GoogleAI Studio產品負責人洛根・基爾帕特里克(Logan Kilpatrick)主持,以下為對話內容實錄:1. 思考型模型:從遊戲AI到AGI的演進之路基爾帕特里克:今天我們的嘉賓是GoogleDeepMind首席執行官德米斯·哈薩比斯。你好德米斯,感謝你的到來,很高興能一起聊聊我們在過去幾個月裡取得的大量發佈成果和進展。哈薩比斯:你好,很高興來到這裡。基爾帕特里克:我想先談談這種前所未有的進展勢頭。我看到DeepMind近期在不斷推出各種成果,包括Deep Think、IMO金牌、Genie 3,還有其他大約五十個項目,在過去兩個月內接連面世,快到讓人忘記它們的存在,因為一切都在飛速推進。我想聽聽你對這種進展與勢頭的總體看法。哈薩比斯:是的,這種情形令人振奮。過去幾年,我們一直在積蓄力量,加快發佈和研發的節奏,如今正看到這些努力的結果。我認為這是行業一個非常令人興奮的時刻。幾乎每天都有新成果面世,我們團隊幾乎每天都在發佈新東西,即便是在內部,也很難跟上進度,更不用說整個領域了。看到這一切我非常自豪,也對我們近期的一些成果感到非常滿意。基爾帕特里克:那你是如何看待 Deep Think 的呢?我個人最興奮的一點,是該模型的一個版本如今已向 Gemini 應用的訂閱使用者開放,讓大家能夠真正親手體驗。我覺得,這種一邊推進技術研發、一邊讓使用者直接上手的結合非常美妙。那麼,從 Deep Think 的角度來看,你會如何思考?哈薩比斯:我認為,“思考型”模型的出現,可以看作是對我們早期遊戲 AI 工作的一種回溯,比如 AlphaGo 和 AlphaZero。自 DeepMind 成立以來,我們一直在研發“基於智能體的系統”。在早期,這意味著系統能夠完成一個完整的任務,通常是將遊戲玩到極致,因為遊戲有明確的目標。當時我們的模型是單一領域的遊戲模型,而如今我們擁有功能強大的多模態模型,既能處理語言,也能理解和整合其他資訊。在遊戲AI中,我們需要在模型之上疊加“思考”或“規劃”的能力。這是通往 AGI 的必經之路。當模型具備思考能力,就可以進一步延展到“深度思考”,甚至實現平行規劃——也就是同時推演多條思路,然後擇優決策,進入下一步行動。這一方向仍有廣闊的創新空間,但即便在“思考”這一部分,進展速度也非常快。無論是數學、程式設計、科學問題,還是遊戲,這類系統都必須具備思考與規劃能力,而不是簡單地給出腦海中閃現的第一個答案。思考型系統的核心價值,就是不斷修正和最佳化自身的推理過程。基爾帕特里克:我之前看了《The Thinking Game》那部視訊,一邊觀看一邊做筆記,發現 DeepMind 團隊其實很早就踏上了這條道路,而且和你們當年用強化學習(RL)解決問題的過程有許多相似之處。比如,AlphaFold 曾面臨的資料瓶頸,就和我們現在在程式設計等領域缺乏專家資料的困境十分相似。這種情況,會讓你產生似曾相識的感覺嗎?哈薩比斯:確實如此。我們很早就堅定選擇了強化學習,這是 2010 年我們做出的首批關鍵決策之一,與深度學習並列。當時的 Atari 項目,是第一個能真正完成有趣任務的深度強化學習系統——它能夠直接從螢幕像素中學習玩上世紀 70 年代的Atari遊戲,而且表現超過任何人類玩家。更重要的是,它能“開箱即用”地玩任何 Atari 遊戲,這種通用性證明了新技術具備規模化並行揮實際價值的潛力。我個人從小下國際象棋時,就會思考如何最佳化自己的思維過程,這也促使我去研究神經科學,探索大腦的工作機制,並借助人工智慧這一強大的工具,將智慧凝結為數字形態。當然,現有系統在某些方面的表現已經非常出色,但在一些相對簡單的任務上仍有不足,比如高中數學、基礎邏輯,或者某些經過特殊設計的小遊戲。它們體現出一種“參差型智能”——在某些維度上表現驚人,但在另一些方面則很容易暴露弱點。2. 從機器人到通用助理 Genie 3 的多維度潛力基爾帕特里克:那你是如何看待 Deep Think 的呢?我個人最興奮的一點,是該模型的一個版本如今已向 Gemini 應用的訂閱使用者開放,讓大家能夠真正親手體驗。我覺得,這種一邊推進技術研發、一邊讓使用者直接上手的結合非常美妙。那麼,從 Deep Think 的角度來看,你會如何思考?哈薩比斯:我認為,“思考型”模型的出現,可以看作是對我們早期遊戲 AI 工作的一種回溯,比如 AlphaGo 和 AlphaZero。自 DeepMind 成立以來,我們一直在研發“基於智能體的系統”。在早期,這意味著系統能夠完成一個完整的任務,通常是將遊戲玩到極致,因為遊戲有明確的目標。當時我們的模型是單一領域的遊戲模型,而如今我們擁有功能強大的多模態模型,既能處理語言,也能理解和整合其他資訊。在遊戲 AI 中,我們需要在模型之上疊加“思考”或“規劃”的能力。這是通往 AGI 的必經之路。當模型具備思考能力,就可以進一步延展到“深度思考”,甚至實現平行規劃——也就是同時推演多條思路,然後擇優決策,進入下一步行動。這一方向仍有廣闊的創新空間,但即便在“思考”這一部分,進展速度也非常快。無論是數學、程式設計、科學問題,還是遊戲,這類系統都必須具備思考與規劃能力,而不是簡單地給出腦海中閃現的第一個答案。思考型系統的核心價值,就是不斷修正和最佳化自身的推理過程。基爾帕特里克:許多人看了Genie 3的演示後感到震撼,有人甚至誇張地說“這是模擬理論的證據”。它確實和用遊戲推動強化學習發展有關。回顧Genie 3,你覺得結果和當初的預期一致嗎?我覺得,提升模型玩遊戲的能力,未必必然帶來如今的世界模型。哈薩比斯:Genie 3彙集了多條研究路徑與想法。我們一直把棋類或電子遊戲作為挑戰環境,不僅用來推動演算法進步,也用來合成資料。我們會建構極為逼真的虛擬環境,用來訓練系統理解物理世界。我們想要建構的世界模型,不僅要理解物理結構、材料特性、液體流動,還要理解生物和人類的行為,因為AGI必須理解物理世界,才能在其中運作。這對機器人至關重要,也對通用助理項目如Project Astra(Gemini Live)不可或缺。驗證世界模型的一種方法,就是讓它生成與現實一致的虛擬世界,比如打開水龍頭會有水流出,鏡子裡會映出自己等等。Genie 3之所以驚人,就在於它生成的世界具有一致性。你轉身離開,再回頭,世界保持原樣。這說明它的底層物理理解相當出色。基爾帕特里克:你認為使用者將如何使用 Genie?我們的目標是僅將它作為改進Gemini和其他機器人項目的工具,還是你覺得它本身還有更多用途?哈薩比斯:它在多個維度上都令人興奮。首先,我們已經在用它進行訓練。例如,我們有一個名為SIMA(Simulated Agent,模擬智能體)的遊戲智能體,可以開箱即用地操作並玩一款現有的電腦遊戲。它有時表現不錯,有時不夠理想。令人有趣的是,我們可以把SIMA放進Genie 3里,相當於一個AI在另一個AI的“腦海”中行動。SIMA會根據目標(比如找到房間裡的鑰匙)發出操作指令,而Genie 3則即時生成遊戲世界。這樣可以創造無限的訓練資料,對機器人訓練或AGI系統的通用訓練都有價值。同時,它在互動娛樂領域也有巨大潛力。我有很多想法去打造下一代遊戲,甚至可能催生一種介於電影與遊戲之間的新型娛樂形式。最後,從科學家的角度看,最有趣的是這能告訴我們關於現實世界、物理規律,甚至模擬理論的什麼資訊。當你在深夜生成整片虛擬世界時,你會不自覺地思考:現實世界的本質是什麼?這也是我整個職業生涯推動自己用AI服務科學的動力所在。我認為,像Veo 3和Genie 3這樣的模型,若換個角度觀察,能給我們關於現實本質的啟示。3. AI的能力鴻溝 強大生成力與低級錯誤並存基爾帕特里克:這正好能回到我們之前談到的“參差型智能”問題。一方面,我們已經有了能生成完整虛擬世界的驚人系統;另一方面,讓 Gemini下國際象棋,我可能都能贏它,而且有時它甚至會違反規則。我們最近宣佈了 DeepMind 與 Kaggle 合作推出“遊戲競技場”,讓模型在各種遊戲中對戰並接受測試。你怎麼看?哈薩比斯:這反映了一個更普遍的問題——如今的系統(無論是 Gemini 還是競爭對手的模型)在很多方面都很強大:它們能從文字生成模擬世界,能理解視訊,能解數學題、做科研。然而,用過這些聊天機器人的人都知道,它們的能力邊界很容易被觸碰到。在我看來,這種缺乏一致性,正是它們距離實現完全AGI還差的一步。一個普通人不應該如此輕易就能發現系統的低級缺陷。我們或許已經解決了過去那種“數 strawberry 裡的R”這種用於評估模型細節關注度的低級問題,但依然存在一些小學生都能輕鬆完成、而模型卻失敗的任務。這很可能是因為在推理、規劃、記憶等方面,仍然缺少關鍵性的創新。此外,我們現有的評測基準中,很多已經接近飽和。比如在 AIME 數學測試上,Deep Think 最近的成績已經達到 99.2%,幾乎沒有提升空間,這甚至可能意味著測試本身已經失去區分力。因此,我們需要設計更新、更難、覆蓋面更廣的評測,用來考察模型的物理直覺、世界理解,以及安全性(比如防止欺騙行為)。我對“遊戲競技場”非常期待,因為它延續了我們最初做遊戲 AI 的初衷。遊戲是乾淨的測試環境,有客觀分數,沒有人為主觀打分;它們會隨著系統能力的提升自動增加難度,還可以不斷引入更複雜的遊戲。未來甚至能讓 AI 自創新遊戲、彼此對戰學習,從而避免資料洩露或過擬合。這種多智能體環境將成為長期有效的重要評測基準之一。4. 能力內化 VS 外部呼叫:經驗驅動的決策基爾帕特里克:我過去兩年的感悟是,生活中的許多問題,本質上都是一種評測。工作表現是一種評測,你看待事物的方式也是評測。在遊戲領域,我們有明確的約束條件和客觀的結果,但一旦擴展到非遊戲領域,“真值”就很難定義。比如,在人類日常任務中,如何建構強化學習環境?你覺得在非遊戲環境中,我們該怎麼捕捉這些特徵?哈薩比斯:如何定義獎勵函數或目標函數,一直是強化學習在真實且混亂的環境中面臨的最大挑戰。現實世界中,並不存在單一的目標函數,而是多個目標並存,而且這些目標的權重會隨著情緒、環境、職業階段等因素不斷變化。我認為,未來的通用系統必須學會理解使用者的真實意圖,並將其轉化為一組可最佳化的獎勵函數。這涉及元認知或“元強化學習”(meta-RL)的研究——在主要系統之上再建立一個系統,用來推測主要系統的最優目標函數。這類研究在十年前的 AlphaGo、AlphaZero 遊戲階段我們就已經開始嘗試,如今很可能會再次成為研究重點。基爾帕特里克:我覺得我們應該現在就著手,因為感覺 DeepMind 十年前做的事,正好就是今天大家追趕的前沿。回到“思考趨勢”和“遊戲趨勢”,我們歷史上經歷了多種模型擴展路徑——預訓練、後訓練、資料擴展、算力擴展,後來又有了推理擴展,比如 Deep Think 就得益於推理能力的提升。現在似乎“工具”成了新的擴展維度。你覺得,給模型配備物理模擬器作為工具,會是未來的方向之一嗎?哈薩比斯:工具使用是 AI 系統最重要的能力之一。思考型系統的核心在於,它能在思考過程中主動呼叫工具,比如搜尋引擎、數學程序、程式設計環境,然後基於工具提供的結果調整規劃。有趣的是,那些能力應當放進主模型(即“主腦”),那些應當作為外部工具,這在數字系統中並不像在人類身上那麼清晰。對於人類來說,不屬於身體的就是工具;但在 AI 中,這條界限很模糊。比如,下棋能力是直接內建在主模型中,還是呼叫 Stockfish 或 AlphaZero 作為外部工具?經驗表明,如果某項能力(如數學、程式設計)能提升整體推理水平,就應該放入主模型;但如果它可能削弱模型的其他通用能力,則更適合作為外部工具。這完全是一個經驗性問題,需要在實踐中不斷試驗和驗證。5. AGI的綜合能力藍圖 語言、多媒體與物理推理一體化基爾帕特里克:很多開發者現在都會問,模型已經不再是過去那種靜態的權重,而是在推理過程中能呼叫各種工具,功能越來越像一個完整的系統。這正在改變人們建構應用的方式。你怎麼看這種從“模型”到“系統”的轉變?對開發者有什麼建議?哈薩比斯:模型的進化速度非常快,尤其是當工具能力與規劃、思考能力結合後,其潛力可能呈指數級擴張,因為它們可以用全新的方式組合使用工具。我建議開發者多思考:那些工具對 AI 的能力最有價值?然後著手建構這些工具。即便有了工具呼叫和智能體能力,這些系統本身還不是成品,它們依然需要大量的產品化工作。產品經理和設計師面臨的挑戰,是必須預判一年後的技術狀態,並為那個未來去設計產品,同時允許底層引擎在 3 到 6 個月,甚至更短的周期內進行一次重大更新。基爾帕特里克:現在感覺幾乎是每兩周就有一次更新。哈薩比斯:確實是這種節奏,而且短期內不會改變。未來整個網路生態和應用的運作方式,都將因為智能體系統能夠靈活使用工具而發生深刻變化。基爾帕特里克:Genie 3 的進展令人震撼,很多人都迫不及待想親手體驗。我希望能盡快讓更多使用者用上它。從世界模型和 Genie 的角度看,下一步是什麼?哈薩比斯:我們正在努力提升 Genie 的運行效率,好讓更多使用者盡快體驗。目前它還處於有限預覽階段。我們也在思考最佳的發佈方式,希望使用者能夠分享自己創作的世界,互相體驗、投票,從而形成一個活躍的社區。但有一個關鍵問題是,如何保持世界生成的一致性——當某個提示生成了一個極具吸引力的世界,我們怎樣確保後來者也能復現它?這是我們正在攻關的技術挑戰之一。更長遠來看,Genie、Veo、Gemini 這些目前相對獨立的模型,正逐漸走向融合,形成我們所謂的“全能模型”(Omni Model)。它既能處理語言、多媒體,又能進行物理推理和內容生成,這才是 AGI 應該具備的綜合能力。基爾帕特里克:我們之前還開玩笑說,Genie 是我們製作和玩遊戲的絕佳藉口。哈薩比斯:沒錯。基爾帕特里克:這樣 DeepMind 就成了一家遊戲公司了。哈薩比斯:這是我的秘密計畫。等 AGI 安全落地之後,我就會用這些工具去製作史上最偉大的遊戲——那將是我的夢想成真。基爾帕特里克:會是終極版的《主題公園》嗎?哈薩比斯:也許吧,不過我還有更宏大的遊戲創意。基爾帕特里克:我們在 AI Studio 裡做了很多“氛圍程式設計”功能,如果一切順利,你在 AGI 誕生前就可以不斷拋出這些創意,自己打造一個“德米斯遊戲競技場”。哈薩比斯:這已經在我的高優先順序待辦清單上了。基爾帕特里克:前段時間我們慶祝每月處理 980 兆個 token,如今已經突破千兆(quadrillion)大關,我們還特地為你準備了一個紀念品。哈薩比斯:謝謝,這真是太棒了。基爾帕特里克:我們還會做一些其他版本。哈薩比斯:非常感謝。基爾帕特里克:今天非常感謝你抽出時間做客,也感謝你和 DeepMind 團隊為未來所付出的努力與深夜的思考。這次訪談很愉快。哈薩比斯:我也很高興能和你交流,謝謝。 (騰訊科技)