當今 AI 最缺什麼?|DeepMind CEO最新對話實錄

12月17日,Google DeepMind 發佈了DeepMind聯合創始人兼 CEO Demis Hassabis 的專訪。本次對話全面探討了AI從大語言模型向Agentic AI的重心轉移、科學“根節點”問題的破解路徑、AlphaFold 到核聚變的連鎖反應、AGI 實現中“規模擴展”與“創新”的博弈、當前模型“鋸齒狀智能”的本質缺陷、世界模型與模擬在科學發現中的終極價值、從“被動式 AI”向“主動智能體”演進的風險與機遇、後 AGI 時代的經濟重構等話題以及 Demis Hassabis 基於圖靈機極限對人類意識獨特性的思考。

Demis Hassabis 指出,儘管 AI 能在國際數學奧林匹克中摘金,卻在簡單的邏輯問題上犯“低級錯誤”,這種“鋸齒狀智能”是現有AI在一致性與推理能力上的缺失,就像一個“狀態不好、隨口胡謅”的人,缺乏像 AlphaGo 那樣“先思考、後行動”的規劃與雙重檢查機制。他強調,單純的知識壓縮不足以通向 AGI,必須補齊線上學習與深度推理這最後 50% 的拼圖。

關於Scaling Law“撞牆”,Demis Hassabis 指出:“50% 的精力用於規模擴展,50% 用於創新,這兩者缺一不可”。他認為,我們正處於一個需要將“世界級的工程能力”與“世界級的研究科學”深度融合的新階段。不同於單純的資料堆砌,他主張回歸 AlphaGo 的演算法範式,通過在基礎模型之上疊加搜尋與規劃能力,並利用“世界模型”在模擬環境中通過無限的合成資料來突破資料枯竭的瓶頸。

針對 DeepMind 的長期願景,他認為,大語言模型雖能理解語義,卻難以捕捉物理世界的因果力學。真正的理解意味著能夠“生成逼真的世界”,而精確的模擬將是科學發現的終極工具。他構想了一個通過模擬重演進化乃至社會動態的沙盒,不僅用於訓練具備好奇心的智能體,更試圖以此解開生命起源與意識誕生的謎題。他坦言,這種對物理法則的深度封裝,是 AI 從虛擬走向機器人實體與通用助手的必經之路。

01

AI 解鎖科學的連鎖反應

這對 AI 來說是非凡的一年,我們目睹了重心從大語言模型轉移到了代理式 AI,以及 AI 在藥物研發、機器人和無人駕駛中的應用。記得我第一次採訪你時,你談到了“根節點”問題,也就是利用 AI 來解鎖下游利益的理念。你想給我們更新一下這些方面的進展嗎?有那些成果近在咫尺,又有那些問題已經解決或接近解決了?

Demis Hassabis:最有力的證明就是 AlphaFold。想到 AlphaFold 2 向世界發佈快五周年了,這真不可思議。這證明瞭解決這種根節點類型的問題是可能的。我們現在正在探索所有其他領域,比如材料科學,我很想搞定室溫超導、更好的電池這類東西。我認為這些都是指日可待的,還有各種更好的材料。

我們也正在致力於核聚變。我們剛宣佈了與 Commonwealth Fusion Systems 更深度的合作夥伴關係。我們之前就有合作,但現在更加深入了。我認為他們可能是致力於傳統托卡馬克反應堆的最優秀的初創公司,可能是最接近提出可行方案的團隊。我們希望能加速這一處理程序,幫助他們控制磁體中的電漿體,甚至可能協助進行一些材料設計,這非常令人興奮。

此外,我們也在與 Google Quantum AI 團隊的量子計算同事們合作,他們正在做著驚人的工作。我們利用機器學習幫助他們開發糾錯碼。也許有一天,他們也會反過來幫助我們。

聚變那個項目特別關鍵,如果我們能搞定這個,是不是會讓現在的很多問題迎刃而解?

Demis Hassabis:(關於核聚變的影響)聚變一直是“聖盃”。當然,我認為太陽能也非常有前景,實際上它就是利用天空中的那個聚變反應堆。但如果我們要擁有模組化的聚變反應堆,這種幾乎無限、可再生、清潔能源的承諾顯然會改變一切。這就是“聖盃”,當然,這也是我們助力解決氣候問題的方式之一。

絕對會。它會開啟許多其他的可能性,這就是為什麼我們將它視為一個“根節點”。當然,它直接有助於解決能源、污染等問題,緩解氣候危機。而且,如果能源真的實現可再生、清潔且超級便宜甚至幾乎免費,那麼許多其他事情就會變得可行。比如水資源獲取,因為我們幾乎可以在任何地方通過海水淡化廠獲取淡水。甚至製造火箭燃料,海水中含有大量的氫和氧,那基本上就是火箭燃料,只是將它們分離需要消耗大量能量。但如果能源便宜、可再生且清潔,為什麼不做呢?你可以讓它 24/7 全天候生產。

02

“鋸齒狀智能”與 AGI 的關鍵拼圖

你也看到了很多變化,AI 被應用於數學領域,在國際數學奧林匹克競賽中贏得獎牌。然而與此同時,這些模型在高中數學題上卻可能犯相當基礎的錯誤。為什麼會存在這種悖論?

Demis Hassabis:這可能是最迷人的事情之一,也可能是我們需要解決的關鍵問題之一,只有解決了它才能達到 AGI。正如你所說,我們和其他團隊已經取得了很多成功,在國際數學奧林匹克中摘金。你看那些題目,都是只有世界頂尖學生才能解出的超級難題。但另一方面,如果你換一種方式提問,它會在邏輯問題上犯一些相當低級的錯誤。它們甚至還不能真正下好一盤像樣的國際象棋,這很令人驚訝。

所以在一致性方面仍然缺失了一些東西。我認為這正是你對通用智能,即 AGI 的期望:它應該在各個方面保持一致。有時人們稱之為“鋸齒狀智能”。它們在某些方面非常強,甚至達到博士水平,但在其他方面甚至不如高中水平。所以這些系統的表現仍然非常不均衡。它們在某些維度上令人印象深刻,但在其他方面仍相當基礎。我們必須填補這些差距。

關於原因有各種理論。根據具體情況,甚至可能與圖像被感知和Token 化的方式有關。有時候,當你讓它數單詞裡的字母時,它實際上甚至沒有獲取到所有的字母;有時它會數錯,但這可能是因為它並沒有看到每一個單獨的字母。這些問題各有不同的原因,每一個都可以被修復,然後我們再看還剩下什麼問題。

但我認為一致性,以及另一件事——推理和思考,是關鍵。我們現在的AI在推理階段會花更多時間“思考”,也更擅長輸出答案。但在以下方面還不夠穩定:它是否有效地利用了那段思考時間來進行雙重檢查,以及是否使用工具來驗證輸出結果?我認為我們正在朝著這個方向努力,但也許只走了 50% 的路程。

我也在想 AlphaGo 和後來 AlphaZero 的故事,你們剝離了所有人類經驗,卻發現模型實際上變得更強了。在你正在建立的模型中,是否存在類似的科學或數學版本的演進?

Demis Hassabis:(關於技術演進路線)我認為我們今天試圖建構的更像是 AlphaGo。實際上,這些大語言模型、基礎模型,是從全人類的知識起步的——我們在網際網路上發佈的所有內容,如今幾乎涵蓋了一切,然後將這些知識壓縮成某種有用的製品,供它們查詢和泛化。但我確實認為,我們仍處於早期階段,即在這些模型之上疊加搜尋或思考能力,就像 AlphaGo 那樣,利用模型來引導有用的推理路徑、規劃思路,然後針對當下的問題想出最佳解決方案。

所以我不覺得我們目前受限於人類知識的極限。我認為目前的主要問題是,我們還不知道如何像使用 AlphaGo 那樣,以完全可靠的方式充分利用這些系統。當然,AlphaGo 要容易得多,因為它是一個遊戲。我認為一旦你擁有了 AlphaGo,你就可以回過頭來,就像我們開發 Alpha 系列時那樣,做一個 AlphaZero,讓它開始自我探索知識。我認為那將是下一步,但這顯然更難。所以我認為最好先嘗試用某種類似 AlphaGo 的系統邁出第一步,然後再考慮類似 AlphaZero 的系統。

這也是當今AI所缺失的東西之一,就是線上學習和持續學習的能力。我們訓練這些系統,平衡它們,對它們進行後訓練,然後把它們投放到世界上,但它們不會像我們一樣在真實世界中持續學習。我認為這是這些系統所需的另一個關鍵缺失部分,也是 AGI 所必需的。

03

想要實現 AGI,規模擴展與創新缺一不可

我看到你最近說過一句話:“如果由我決定,我們會讓 AI 在實驗室裡待得更久一些,做更多像 AlphaFold 這樣的事情,也許先治癒癌症之類的。”你認為因為沒有走那條更慢的路,我們失去了一些東西嗎?

Demis Hassabis:我認為我們既有失去也有獲得。我覺得那本來會是一種更純粹的科學方法。至少那是 15、20 年前我最初的計畫,當時幾乎還沒人研究 AI。我們正準備創辦 DeepMind,人們覺得研究這個簡直是瘋了,但我們堅信不疑。當時的想法是,如果我們取得進展,我們會繼續循序漸進地建構 AGI,對每一步及其安全性非常謹慎,分析系統在做什麼等等。但在此期間,你不必等到 AGI 到來後才讓它發揮作用。你可以將技術分支出來,以真正造福社會的方式使用它,即推進科學和醫學。這實際上正是我們用 AlphaFold 所做的。它本身不是一個基礎模型,也不是通用模型,但它使用了相同的技術——Transformer 和其他技術,並將其與該領域的特定知識相結合。

所以我曾設想完成一大批這類事情,這將帶來巨大的益處。你會向世界發佈這些成果,就像我們發佈 AlphaFold 一樣,並確實做到治癒癌症等事情,同時我們在實驗室裡繼續致力於更偏向 AGI 的路徑。現在的結局證明,聊天機器人在規模化上是可行的,人們也發現它們很有用。如今它們已經演變成了這些基礎模型,能做的不僅僅是聊天和處理文字,顯然包括 Gemini,它們可以處理圖像、視訊等各種事情。這在商業和產品層面上也非常成功。

我也很喜歡這一點。我一直夢想擁有一個終極助手,能在日常生活中幫助你,讓你更高效,甚至可能保護你的大腦空間免受干擾,讓你能專注並進入心流狀態,因為今天的社交媒體充滿了噪音。我認為為你工作的 AI 實際上可以在這方面幫助我們。所以我認為這是好事。但這創造了一種相當瘋狂的競賽環境,許多商業組織甚至國家都在急於改進並超越彼此。這使得同時進行那種嚴謹的科學研究變得困難。我們試圖兩者兼顧,我認為我們正在把握這種平衡。

另一方面,這種發展方式也有很多優點,資源湧入這個領域無疑加速了進展。而且,公眾實際上只比絕對前沿技術落後幾個月就能使用到這些東西。所以每個人都有機會親身感受 AI 將會是什麼樣子,這是件好事,也能讓政府更好地理解這一點。

(關於Scaling是否撞牆)奇怪的是,去年這個時候,有很多關於Scaling最終會撞牆的討論,說我們會耗盡資料。然而,Gemini 1.5 剛剛發佈,它在一系列不同的基準測試中都處於領先地位。這怎麼可能呢?不是應該有擴展撞牆的問題嗎?

Demis Hassabis:我認為很多人是這麼想的,特別是當其他公司的進展較慢時。但我認為我們從未真正看到過那樣的牆。我想說的是,也許存在收益遞減。當我說這個詞時,人們只會想到“那就沒有收益了”,好像它是 0 或 1 的關係,要麼是指數級增長,要麼是漸近線。不,實際上,在這兩種機制之間有很大的空間,我認為我們就處於這兩者之間。這不像在三四年前的早期階段那樣,你每發佈一個新的迭代,所有基準測試的性能都會翻倍。但你正在獲得顯著的改進,就像我們在 Gemini 1.5 中看到的那樣,這非常值得投資,且有很好的投資回報,所以我們沒有看到任何放緩的跡象。

確實存在一些問題,比如:我們是否會耗盡可用的資料?但有辦法繞過這個問題,比如合成資料。這些AI已經足夠好,它們可以開始生成自己的資料,特別是在程式設計和數學等某些領域,你可以驗證答案的正確性。從某種意義上說,你可以生產無限的資料。

雖然所有這些都是研究問題,但我認為這是我們一直擁有的優勢,就是我們一直堅持研究為先。我們擁有最廣度和最深度的研究人才儲備,一直如此。如果你回顧過去十年的進步——無論是 Transformer 還是 AlphaGo、AlphaZero,以及我們剛才討論的任何事情,它們都出自 Google 或 DeepMind。所以我一直說,如果需要更多的創新,尤其是科學上的創新,那麼我堅信我們就是做這件事的地方,就像我們在過去 15 年裡為許多重大突破所做的那樣。

我認為這正是正在發生的事情。實際上,我很喜歡當局面變得更困難的時候。因為那時你不僅需要世界級的工程能力,還需要將其與世界級的研究和科學結合起來,而這正是我們所擅長的。除此之外,我們還擁有世界級基礎設施的優勢,利用我們的 TPU 和我們長期投資的其他資源。所以我認為這種組合讓我們既能處於創新的前沿,也能在規模擴展方面保持領先。實際上,你可以認為我們將50% 的精力用於Scaling,另外 50% 用於創新。我敢打賭,你需要這兩者才能達到 AGI。

04

模型越先進,就越能清晰地認知自身的知識邊界

我們在 Gemini 1.5 這樣出色的模型中仍然觀察到的一點,就是所謂的“幻覺”問題。我記得有一個指標顯示,模型在理應拒絕回答時仍然給出了答案。你們能否建構一個系統,讓 Gemini 像 AlphaFold 那樣給出置信度分數?

Demis Hassabis:我認為可以。這確實是目前缺失的環節之一,但我認為我們正在接近這個目標。模型越先進,就越能清晰地認知自身的知識邊界。因此它們會變得更可靠,你可以依靠它們進行某種形式的“內省”,或者進行更深度的思考,從而自我意識到對某個答案的不確定性。我們要解決的是如何通過訓練,讓它能夠將這種“不確定”作為一個合理的答案輸出。

目前情況正在改善,但有時模型仍會強迫自己回答本不該回答的問題,這就導致了幻覺。目前很多幻覺都屬於這種類型。這是一個必須解決的缺失環節。你說得對,正如我們在 AlphaFold 上解決的那樣,但這顯然是在一個更受限的範圍內。

Demis Hassabis:確實有對下一個 Token 的預測,這就是它的工作原理。但這並不能告訴你整體層面的資訊:即你對整個事實或整個陳述有多大信心?這就是我們需要利用思考和規劃步驟來回顧剛剛輸出內容的原因。

目前有點像在跟一個狀態不好的人聊天,他們只是隨口說出腦海中蹦出的第一件事。大多數時候這沒問題,但在處理難題時,你會希望停下來暫停片刻,回顧並調整正要說的內容。也許這種方式在當今世界越來越少見,但這仍然是更好的交流方式。你可以這樣理解,模型需要在這方面做得更好。

05

世界模型與模擬的終極目標

今年早些時候我們採訪了你們的 Genie 團隊。那是很棒的工作。告訴我為什麼你如此關注模擬?世界模型能做到那些大語言模型做不到的事情?

Demis Hassabis:實際上,除了 AI 之外,世界模型和模擬可能是我長期以來最大的熱情所在。當然在我們最近像 Genie 這樣的工作中,這一切都融合在了一起。我認為大語言模型能夠理解關於世界的很多東西,實際上比我們預期的要多,甚至比我預期的還要多。因為語言所包含的資訊遠比我們想像的豐富,甚至超出了語言學家的預期。這些新系統已經證明了這一點。

但關於世界的空間動態、空間感知,以及物理環境的機械運作原理,仍有很多難以用語言描述的內容,通常也不會在文字語料庫中被描述。這其中很多都與從經驗學習有關。有很多事情你無法真正描述,只能去體驗。無論是運動角度、氣味還是這類感測資訊,用任何語言描述都非常困難。

所以我認為圍繞這方面有一整套內容。如果希望機器人技術能夠奏效,或者希望通用助手能在日常生活中,比如通過眼鏡或手機,伴隨並幫助你,而不僅僅是在電腦上,你就需要這種類型的世界理解能力。

世界模型正是其核心所在。我們所說的世界模型,是指這種理解世界力學因果效應的模型,包括直觀物理學,事物如何移動、如何表現。現在我們在視訊模型中看到了很多這方面的內容。如何測試你是否擁有這種理解?如果你能生成逼真的世界,那麼在某種意義上你必須已經理解了,系統必須已經封裝了世界的許多力學原理。這就是為什麼 Genie 和 Veo 這些視訊模型和互動式世界模型令人印象深刻,它們標誌著我們正朝著通用世界模型邁進。

希望在某個時間點,我們可以將其應用於機器人技術和通用助手。當然我最喜歡的事情之一,也是我肯定會去做的,就是將其重新應用迴游戲和遊戲模擬中,創造終極遊戲。這也許一直是我潛意識裡的計畫。

所有這一切就是為了那個?

Demis Hassabis:沒錯。這對遊戲來說將是驚人的。

科學領域呢?你能在那個領域使用它嗎?

Demis Hassabis:可以。對於科學而言,我認為建立複雜領域的模型——無論是原子層面的材料、生物學,還是像天氣這樣的物理系統,理解這些系統的一種方式是從原始資料中學習模擬。假設你有一堆原始資料,比如關於天氣的(顯然我們正在進行一些驚人的天氣項目),然後你有一個模型能學習這些動態,並能比暴力計算更高效地重建這些動態。所以我認為,模擬和某種形式的世界模型在科學和數學方面有巨大的潛力。

06

讓 AI 在彼此的“思想”中互動,創造無限的訓練樣本

但通過這種方式,你也可以把一個智能體扔進那個模擬世界裡,對嗎?你的 Genie 團隊曾引用過一句非常漂亮的話:“幾乎沒有任何重大發明的先決條件是為了該發明而存在的。”他們談論的是將智能體放入這些模擬環境中,並允許它們以好奇心為主要動力進行探索

Demis Hassabis:對,這也是這些世界模型另一個真正令人興奮的用途。我們有另一個項目叫 SIMA,近期剛發佈了 SIMA 2。在這個項目中,我們將化身或智能體放入虛擬世界。它可以是一個普通的商業遊戲,或者像《無人深空》這樣複雜的開放世界太空遊戲。因為底層有 Gemini,你可以指導它,只需與智能體交談並給它佈置任務。

但後來我們想:如果我們把 Genie 接入 SIMA 會不會很有趣?有點像是把一個 SIMA 智能體扔進另一個正在即時創造世界的 AI 中?現在這兩個AI 實際上是在彼此的“思想”中互動。SIMA 智能體試圖在這個世界中導航,而對 Genie 來說那只是一個玩家和一個化身,它不在乎那是另一個 AI,它只是圍繞著 SIMA 試圖做的事情生成世界。

看到它們互動真是太神奇了。我認為這可能是一個有趣訓練循環的開端,在這裡我們幾乎擁有無限的訓練樣本。因為無論 SIMA 智能體試圖學習什麼,Genie 基本上都可以即時創造障礙、阻礙和環境來幫助它學習。你可以想像一整個設定和解決任務的世界,數百萬個任務自動生成並且難度不斷增加。所以我們可能會嘗試建立這樣一個循環。顯然這些 SIMA 智能體可以成為很好的遊戲伴侶,它們學到的一些東西對機器人技術也可能很有用。

不過你創造的那些世界,如何確保它們真的逼真?如何確保你不會最終得到看似合理但實際上違背物理法則的結果?

Demis Hassabis:(關於物理逼真度)這是一個很好的問題,也可能是一個隱患。這基本上又是幻覺問題。有些幻覺是好的,因為它意味著你可能會創造出有趣和新穎的東西。實際上如果你試圖做創造性的事情,或者讓AI創造新事物,一點幻覺可能是好的。但你希望這是有意為之,你可以稍微打開“幻覺轉盤”或創造性探索的開關。

但是,當你試圖訓練 SIMA 智能體時,你並不希望 Genie 產生錯誤的物理幻覺。所以實際上我們現在正在做的是建構一個物理基準測試,我們可以使用物理模擬非常準確的遊戲引擎,來建立大量相當簡單的實驗,就像你在高中物理實驗室裡做的那樣。比如讓小球滾下不同的軌道,看它們跑多快。從非常基礎的層面上進行剖析,比如牛頓三大運動定律:模型是否封裝了這些定律?無論是 Veo 還是 Genie,這些模型是否 100% 精準地封裝了物理學?

目前它們還沒有,只是一種近似。當你隨意觀看時它們看起來很逼真,但對於機器人技術等領域來說,它們還不夠準確無法依賴。所以這是下一步。既然我們已經擁有了這些非常有趣的模型,現在的目標之一就是減少幻覺,使它們更加紮實。對於物理學,這可能涉及生成大量的真值資料,比如簡單的鐘擺視訊——當兩個鐘擺相互繞行時會發生什麼,但很快你就會遇到三體問題,那是無論如何都無法精確解析的。所以我認為這會很有趣。

但令人驚嘆的是,當你觀察像 Veo 這樣的視訊模型時,僅僅看它處理反射和液體的方式,至少在肉眼看來已經精準得令人難以置信。所以下一步實際上是超越人類業餘愛好者的感知範圍。它真的能經得起嚴格的物理級實驗嗎?

07

精確的模擬將是科學的一大福音,有助於理解生命的起源

我知道你思考這些模擬世界已經很長時間了。我回顧了我們第一次採訪,在採訪中你說過,你非常喜歡這樣一個理論:意識是進化的產物。在我們進化路徑的某個節點,理解另一個體的內部狀態具有優勢,然後我們將這種能力轉向了自己。這是否讓你對在模擬內部運行一個進化中的智能體感到好奇?

Demis Hassabis:當然,我很想在某個時候運行那個實驗。某種程度上重演進化,甚至重演社會動態。聖菲研究所過去常在小型網格世界中運行很多很酷的實驗。我過去很喜歡其中一些,主要是經濟學家在嘗試運行小型人工社會。他們發現,只要讓智能體在正確的激勵結構下運行足夠長的時間,市場、銀行等各種有趣的事物就會湧現出來。

所以我認為那真的會很酷,也有助於理解生命的起源和意識的起源。這是我從一開始投身 AI 工作的最大熱情之一:我認為你需要這類工具來真正理解我們從何而來,以及這些現象究竟是什麼。我認為模擬是實現這一目標的最強大工具之一,因為你可以從統計學角度來進行研究。你可以用略微不同的初始條件運行模擬很多次,甚至運行數百萬次,然後以一種非常受控的實驗方式理解微小的差異是什麼。這在現實世界中對於我們想回答的任何真正有趣的問題來說,顯然是非常難以做到的。所以我認為精確的模擬將是科學的一大福音。

考慮到我們已經發現了這些模型的湧現屬性,它們擁有某種我們沒預料到的概念性理解,你在運行這種模擬時是否也必須非常小心?

Demis Hassabis:我認為必須如此。是的。但模擬的另一個好處是,你可以在相當安全的沙盒中運行它們。也許最終你會希望對它們進行物理隔離。當然你可以全天候監控模擬中發生的事情,而且你有權訪問所有資料。所以我們可能需要 AI 工具來幫助我們監控模擬,因為它們將變得非常複雜。如果你想像大量的 AI 在模擬中運行,裡面會有太多事情發生,任何人類科學家都很難跟上。但我們或許可以使用其他 AI 來幫助我們自動分析並標記模擬中任何有趣或令人擔憂的事情。

08

AI 泡沫與 Gemini 的“科學家”人格

上次我們交談時,你說過你認為 AI 在短期內被過度炒作,但在長期內被低估了。我知道今年有很多關於 AI 泡沫的討論。如果出現泡沫並且破裂了,會發生什麼?

Demis Hassabis:我仍然認同這一觀點:短期內過度炒作,而在中長期內,其實際的變革能力仍然被低估了。是的,現在當然有很多關於 AI 泡沫的討論。在我看來,這並非非此即彼的二元問題。我認為 AI 生態系統的某些部分可能處於泡沫之中。一個例子就是初創公司的種子輪融資,有些公司甚至還沒起步一出場就獲得了數百億美元的估值。這種情況是否可持續是有趣的,我的猜測是可能不會,至少總體上不會。所以這確實是一個存在泡沫的領域。

然後人們顯然也在擔心大型科技公司的估值和其他事情。我認為這背後有很多真實的業務支撐,但這還有待觀察。也許對於任何具有難以置信的變革性和深刻影響的新技術——當然 AI 可能是最深刻的——你都會經歷這種矯枉過正。當我們創辦 DeepMind 時沒人相信它,沒人認為這是可能的。人們在想,“AI 到底有什麼用?”快進 10 到 15 年,現在這似乎成了商界唯一談論的話題。所以這幾乎是對之前反應不足的一種過度反應。

我認為這是自然的。我們在網際網路時代看到過,在移動網際網路時代看到過,我認為我們在 AI 領域正在看到或將再次看到這一點。我不太擔心“我們是否處於泡沫中”,因為作為 Google DeepMind 的領導者,我們的工作是確保無論發生什麼,我們都能從中脫穎而出,變得更強大。我們的定位非常好,無論那種情況,我們都處於極佳的位置。

所以如果趨勢像現在這樣繼續下去,太棒了,我們將繼續推進所有正在做的偉大事情、實驗以及朝著 AGI 的進展。如果出現回呼也沒關係。我認為我們也處於一個很好的位置,因為我們擁有自己的 TPU 全端基礎設施。我們還有所有這些令人難以置信的 Google 產品,以及由此產生的利潤,可以將我們的 AI 植入其中。而且我們正在這樣做,搜尋業務正被“AI 概覽”徹底革新。底層由 Gemini 驅動的 AI 模式。我們正在關注 Workspace、電子郵件、YouTube。Chrome 中也有所有這些驚人的功能。有很多這樣的機會,我們可以看到應用 Gemini 是唾手可得的果實。當然還有 Gemini App,它現在也表現得非常好,以及通用助手的願景。

所以有新產品出現,我認為隨著時間的推移它們將變得超級有價值。但我們不必完全依賴那個。我們可以只為現有的生態系統賦能,我認為這就是過去一年發生的事情,我們現在的效率已經變得非常高了。

人們花大量時間與聊天機器人交談,以至於最終陷入了自我激進化的怪圈。你要如何阻止這種情況?你如何在建構 AI 時讓使用者處於自己宇宙的中心,但同時又不至於創造出一個封閉的個人資訊繭房?

Demis Hassabis:(關於資訊繭房與人格設定)這是一個非常微妙的平衡,我認為這是我們作為一個行業必須正確處理的最重要的事情之一。我們已經看到了某些過度迎合使用者的AI會帶來什麼後果,或者你會得到那種對使用者非常有害的回聲室強化效應。

所以我認為解決這個問題的一部分——實際上這正是我們要用 Gemini 建構的,我對我們的團隊致力打造且我也親自參與的 Gemini 3 人格設定感到非常滿意——就是賦予它一種近乎科學家的個性。它是溫暖、樂於助人、輕鬆的,但同時也是簡潔、切中要害的。它會以一種友好的方式反駁那些不合邏輯的事情,而不是試圖強化“地球是平的”這種觀點。如果你說了這種話,它附和說:“絕妙的主意”,我認為這對社會總體上是沒有好處的。

但你必須在這一點和使用者的需求之間取得平衡。因為人們希望這些系統是支援性的,能輔助他們的想法和頭腦風暴,所以你必須拿捏好這個尺度。我認為我們正在開發一門關於個性和人格的科學,研究如何衡量它的行為,以及我們希望它在真實性、幽默感這類維度上處於什麼位置。

你可以想像,它出廠時會帶有一種基礎人格。每個人都有自己的偏好,你是希望它更幽默一點還是嚴肅一點,更簡潔一點還是更詳盡一點?人們各有所好,所以你可以在此基礎上加入額外的個性化層。但每個人得到的仍然是那個核心的基礎人格,它堅持科學方法,這是這些AI的全部意義。我們希望人們將這些工具用於科學、醫學和健康問題等領域。

我認為這是正確建構這些大語言模型的科學的一部分,我對我們目前的發展方向感到相當滿意。

09

AGI 的雛形

在目前 AI 領域發生的所有事情中,包括語言模型、世界模型等等,什麼最接近你對 AGI 的願景?

Demis Hassabis:實際上顯然有 Gemini 3,我認為它非常有能力。但我們上周發佈的 Imagen 3 ,那是我們圖像生成工具的高級版本。真正令人驚嘆的是,它的底層也使用了 Gemini。它不僅能理解圖像,還能在某種程度上理解那些圖像中語義上正在發生什麼。

人們才體驗了一周,但我已經在社交媒體上看到了很多關於人們用它做出的很酷的東西。例如,你可以給它一張複雜的飛機或類似的圖片,它可以標記出飛機所有不同部件的圖表,甚至可以將所有不同部件拆解開來進行可視化。

它對機械學、物體的構成部件以及材料屬性有某種深度的理解。它現在還可以非常準確地渲染文字。所以我認為這正在朝向一種用於圖像領域的 AGI 邁進。它是一種可以在圖像跨域上做任何事情的通用系統,這非常令人興奮。

然後是世界模型的進步,比如 Genie 和 SIMA 以及我們在那裡做的事情。最終我們將不得不把所有這些目前不同且交織的項目匯聚成一個大模型。那個模型可能開始成為原始 AGI 的一個候選者。

10

工業革命的鏡像與後 AGI 經濟重構

我知道你最近一直在閱讀大量關於工業革命的內容。我們是否可以從那段歷史中學到什麼,來試圖減輕這次 AI 變革不可避免會引起的一些破壞?在後 AGI 社會,你對社會應該如何重構,或者可能以何種行得通的方式重構有什麼願景嗎?

Demis Hassabis:我認為有很多值得我們學習的地方。這是我們在學校裡會學到的東西,至少在英國是這樣,但往往只是停留在非常表面的層次。對我來說,深入研究它是如何發生的真的很有趣。它的起源、背後的經濟原因,比如紡織工業,實際上第一批電腦的原型可以說就是紡織機,然後演變成了早期 FORTRAN 電腦和大型機使用的打孔卡。有一段時間,英國非常成功,成為了世界紡織業的中心,因為依靠自動化系統,他們可以以極低的成本製造出這些令人驚嘆的高品質產品。然後顯然蒸汽機和所有那些東西也隨之而來。

工業革命帶來了許多不可思議的進步。兒童死亡率下降了,現代醫學和衛生條件、工作與生活的分離模式以及這一切的運作方式,都是在工業革命期間確立的。但它也帶來了很多挑戰。這個過程花了相當長的時間,大約一個世紀,不同領域的勞動力在特定時期遭遇了流離失所。社會必須創造新事物,必須建立像工會和其他組織這樣的新機構來重新平衡這種關係。看到整個社會不得不隨著時間推移去適應是令人著迷的,然後就有了現在的現代世界。顯然工業革命有很多利弊,但沒有人會想要回到工業革命之前,如果你想想它帶來的總和,比如西方世界食物和物資的富足,以及現代醫學和現代交通,那都是工業革命的功勞。

也許我們可以通過從歷史中學習,提前弄清楚那些脫節和錯位是什麼,也許這次能更早或更有效地減輕這些影響。我們可能必須這麼做,因為這次的不同在於,它可能將比工業革命規模大 10 倍,而且速度可能快 10 倍。它更可能是在十年內展開,而不是一個世紀。

(關於經濟重構的願景)是的,我現在花更多時間思考這個問題,實際上 Shane 正在領導這方面的一項工作,去思考後 AGI 世界可能是什麼樣子,以及我們需要為此做什麼準備。我認為社會總體上需要花更多時間思考這個問題,包括經濟學家、社會科學家和政府。就像工業革命一樣,整個工作世界、工作周以及一切都較工業革命前發生了改變,那時更像是農業社會。我認為至少這種程度的改變將再次發生。如果我們需要新的經濟系統、新的經濟模型來從根本上幫助這種轉型,我並不會感到驚訝。

然後還有哲學層面的一面:工作會改變,其他事情也會改變。但也許那時我們將已經解決了核聚變,擁有了這種充裕的免費能源,進入了後稀缺社會。那麼金錢會變成什麼樣?也許每個人都更富裕了。但隨後人生的目標會變成什麼?因為很多人從他們的工作中獲得目標感,供養他們的家庭,這是一個非常高尚的目標。我認為其中一些問題從經濟問題混合成了近乎哲學的問題。

你是否擔心人們似乎沒有關注,沒有像你希望的那樣快速行動?要讓人們認識到我們需要在這個問題上進行國際合作,需要付出什麼代價?你認為這會需要一個時刻,一個特定事件,讓每個人都猛然警醒並開始關注嗎?

Demis Hassabis:我對此很擔心。在一個理想的世界裡,本應該已經有更多的合作了,特別是國際層面的。應該有更多的研究,以及關於這些話題的探索和討論。我實際上非常驚訝目前沒有更多關於這方面的討論。考慮到即使是我們的時間表,即 5 到 10 年,對於建立處理這一問題的機構來說,這個時間也並不長。

我的一大擔憂是,現存的機構似乎非常碎片化,並且沒有達到你所需要的那個水平的影響力,所以可能是目前沒有合適的機構來處理這個問題。當然,如果你加上目前世界各地正在發生的地緣政治緊張局勢,合作和協作似乎比以往任何時候都難。只要看看氣候變化,要在與之相關的任何事情上達成協議是多麼困難。

我們將拭目以待。我認為隨著賭注變得更高,隨著這些系統變得更強大——也許這是它們作為產品存在的好處之一,那些不從事這項技術工作的普通人將能切身感受到這些東西力量和能力的增長。這隨後將傳導給政府,也許隨著我們更接近 AGI,他們會變得理智起來。

(關於喚醒時刻)我希望不需要。大多數主要的實驗室都相當負責任,我們試圖儘可能負責任。如你所知,這一直是我們所做一切的核心。這並不意味著我們會把一切都做對,但我們試圖在我們的方法上儘可能深思熟慮和科學。大多數主要實驗室都在試圖表現得負責任,而且實際上也有很好的商業壓力促使大家負責任。如果你想想 Agent,假設你正在把一個 Agent 租給另一家公司去做某事,那家公司會想知道限制、邊界以及護欄是什麼,以免它們做出不僅僅是搞砸資料之類的壞事。這很好,因為那些不守規矩的草莽式運作將無法獲得生意,企業不會選擇它們。

11

圖靈機極限與人類的獨特性

從長遠來看,在 AGI 之外並邁向ASI時,你認為有一些事情是人類能做而機器永遠無法做到的嗎?所以,對於這些電腦器來說,不存在什麼做不到的事情嗎?

Demis Hassabis:這是一個大問題。我覺得這與我最喜歡的話題之一:圖靈機有關。我一直有這種感覺:如果我們建構了 AGI,用它作為心靈的模擬,再把它與真實的心靈進行比較,我們隨後將看到差異在那裡,以及潛在地,什麼是人類心靈中獨特的、保留下來的東西。也許那是創造力,也許是情感,也許是做夢。還有關於意識,關於什麼可能是或可能不是可計算的,外界有很多假設。

這回到了圖靈機的問題:圖靈機的極限是什麼?這是我一生的核心問題。我認為我們一直在做的一切,都在某種程度上把圖靈機能做什麼的概念推向極限,包括蛋白質摺疊。結果我不確定極限在那裡,也許根本沒有極限。當然我的量子計算朋友會說有極限,你需要量子電腦來模擬量子系統。但我真的不太確定,我實際上和一些量子領域的專家討論過這個問題,可能是我們需要來自這些量子系統的資料以便建立一個經典的模擬。

這又回到了心靈的問題:它全是經典的計算,還是有其他什麼正在發生?像 Roger Penrose 相信大腦中有量子效應。如果確實有,而且那與意識有關,那麼機器將永遠不會擁有那個,至少經典機器不會,我們將不得不等待量子電腦。但如果沒有量子效應,那麼可能沒有任何限制。也許在宇宙中,如果你以正確的方式審視,一切都是計算可解的,因此圖靈機可能能夠建模宇宙中的一切。

如果你非要我猜,我會猜是後者。在物理學向我證明事實並非如此之前,我都在這個基礎上開展工作。

這麼說吧,到目前為止,在宇宙中還沒有人發現任何不可計算的東西。而且我們已經證明,對於經典電腦今天能做到的事情,比如蛋白質摺疊和圍棋,我們已經遠遠超越了通常複雜性理論家所持的 P=NP 觀點。所以我認為沒人知道那個極限在那裡。歸根結底,我們在 DeepMind 和 Google 所做的,以及我試圖做的,就是找到那個極限。

如果把這個想法推演到極限,比如我們坐在這裡,感覺到燈光照在臉上的溫暖,聽見背景裡機器的嗡嗡聲,還有手下桌子的觸感。所有這些都能被經典電腦複製嗎?

Demis Hassabis:我認為是可能的。這也正是我喜歡康德的原因。雖然我最喜歡的兩位哲學家是康德和斯賓諾莎,理由各異,但康德認為現實是心智的建構,我認為這是對的。你提到的那些進入感官系統並帶來不同感覺的事物,比如光的溫暖、桌子的觸感,歸根結底全都是資訊。我們就是資訊處理系統,我認為這也是生物學的本質。這正是我們在試圖做的事情:通過把生物學視為一個資訊處理系統,最終治癒所有疾病。我在業餘時間也在研究一些物理理論,認為資訊可能是宇宙的最基本單元,而不是能量或物質。或許最終這些都是可以互換的,只是我們感知的方式不同。

但在我們所知的範圍內,所有這些驚人的感測器仍然可以被圖靈機計算。

這就是為什麼你的模擬世界如此重要,對吧?

Demis Hassabis:沒錯。那是通往真理的一條路徑。我們能模擬的極限是什麼?如果你能模擬它,在某種意義上你就已經理解了它。

這種沉重的責任感是否曾讓你感到壓抑?是否曾感到孤獨?有沒有什麼事情對你的衝擊比預期的要大?

Demis Hassabis:我睡得不多,部分是因為工作太多,也因為我有睡眠障礙。這其中的情緒非常複雜,因為它令人難以置信地興奮。我基本上在做我曾夢想的一切,我們在應用科學和機器學習等諸多方面都處於科學的絕對前沿。正如所有科學家都知道的那樣,那種身處前沿並首次發現新事物的感覺令人振奮。這種事幾乎每個月都在我們身上發生,太驚人了。

當然,Shane 和我以及其他長期從事這項工作的人比任何人都更理解即將發生之事的深遠影響。實際上人們仍然低估了未來十年將會發生什麼,包括像哲學層面的問題:生而為人的意義是什麼,其中什麼才是重要的,所有這些問題都會浮出水面。

這是一個巨大的責任。但我們有一個了不起的團隊在思考這些事情。這也算是我一生都在為此訓練的事情。從我早期下國際象棋,然後致力於電腦、遊戲、模擬和神經科學,這一切都是為了這一刻。這與我想像的樣子大致相符,所以我應對壓力的方式就是把這當作一種訓練。

(關於意料之外的衝擊)當然有。比如 AlphaGo 的比賽。看著我們破解了圍棋這個曾經美麗的謎團,改變了它。這很有趣,但也讓人感到苦樂參半。

我認為最近的語言模型和圖像生成對創造力的影響也是如此。我對創意藝術懷有巨大的尊重和熱情。我和電影導演交流過,這對他們來說也是一個雙重時刻。一方面他們擁有了能將創意原型製作速度提高 10 倍的驚人工具,但另一方面,它是否正在取代某些創造性技能?

我認為這種權衡到處都在發生,對於像 AI 這樣強大且具有變革性的技術來說是不可避免的,就像過去的電力和網際網路一樣。人類的歷史就是製造工具的歷史,那是我們熱愛做的事情。我們擁有一個可以理解科學的大腦,這也讓我們擁有貪得無厭的好奇心。我認為這就是生而為人的核心。我從一開始就著了迷,而我回答這一問題的方式就是建構 AI。

當你和其他 AI 領袖共處一室時,你們之間會有團結感嗎?那種大家都理解利害關係的感覺?還是說競爭讓你們彼此疏遠?

Demis Hassabis:我們都認識彼此,我和他們幾乎所有人都相處得很好。但這很難,因為我們正處於可能有史以來最殘酷的資本主義競爭中。我的投資人朋友說,現在的殘酷程度是網際網路泡沫時代的 10 倍。

在很多方面我喜歡這一點,我為競爭而生。但退一步說,我理解並且希望每個人都理解,比起公司的成功,還有更重大的東西處於危急關頭。

談到未來十年,你個人最擔憂的時刻是什麼?那你最期待的是什麼?

Demis Hassabis:現在的AI我稱之為被動式AI。使用者投入能量提出問題或任務,AI提供總結或答案。這很大程度上是人類主導的。下一個階段是基於 Agent 的AI。未來幾年我們將看到真正可靠的 Agent,它們將是極有能力的助手,但也更加自主。我認為這類系統的風險也會隨之上升。

我相當擔心那些AI在兩三年後能做什麼。所以我們在致力於網路安全防禦,以準備應對那樣一個可能有數百萬 Agent 在網際網路上遊蕩的世界。

至於期待,我絕對需要放個長假去做科學研究。那怕一周甚至一天也好。我的使命一直是協助世界為了全人類安全地實現 AGI。當我們到達那一點時,當然會有超級智能和後 AGI 時代的經濟社會問題。也許我可以在那裡提供幫助,但我的人生使命核心部分將就此完成。這需要協作,我希望利用我的位置提供幫助。 (數字開物)