#Titans
AGI只剩5–10 年!GoogleDeepMindCEO:必須把Scaling推到極限,還需1-2個Transformer級重大突破
前不久,在NeurIPS 2025大會上,Google推出了Transformer框架的最強繼任者:Titans+MIRAS。眾所周知,Transformer最大瓶頸在於,上下文無限擴展,會導致計算成本飆升。除了業界迭代的RNN、Mamba-2等架構,Google提出的新一代解決方案Titans+MIRAS,能夠把RNN速度和Transformer精準性相結合,可以讓 AI模型在運行過程中動態更新核心記憶,跑得更快,也能處理超長規模的上下文。與此同時,在最新採訪中,GoogleDeepMind CEO Demis Hassabis也對未來12個月AI的關鍵突破做出重磅預測!1、多模態深度融合Gemini 天生多模態,未來 12 個月會看到圖像、視訊、音訊與語言更深層的“能力互相催化”。他特別強調圖像模型(如 NanoBanana Pro)表現驚豔,能做精準圖表類輸出。2、世界模型DeepMind 的 Genie 3:可以生成視訊、還能像遊戲一樣走進畫面內部探索,並保持 1 分鐘的視覺一致性。這是“可互動 AGI”的重要原型。3、Agent 可靠性大躍升Demis說今天的 agents 不能完全委託任務,但 1 年內將逼近可託付等級。結合 Gemini 的“通用助理”概念:明年將更普遍出現在手機、電腦、眼鏡等裝置,成為人類生活的纖維層工具。在今年早些時候,Demis就公開表示我們將在2030年實現AGI。在最新採訪中,Demis又再次強調:我們距離實現AGI只有5-10年時間!他直言自己對AGI的標準很高:AI必須全面具備人類的所有認知能力,其中包括創造力和發明能力。他認為在達到AGI之前,還需要做兩件事:1、大語言模型的Scaling必須做到極限,Demis認為規模化“至少會成為 AGI 的一個關鍵組成部分,甚至就是全部”;2、還需要一兩個像Transformer、AlphaGo這樣的重大技術突破(全新架構Titans+MIRAS就是這個等級的)以下是Axios AI+峰會上,Axios聯合創始人Mike Allen與Demis Hassabis交談的全文,enjoy!諾獎之後的變化主持人:距你得知自己成為諾貝爾獎得主,只過去 400 多天。當時你說 “這太不真實了,這是最重要的那個獎”。從那之後,你的生活與工作發生了什麼變化?它帶來了什麼?Demis:到現在其實依然有點不真實,感覺還沒完全消化。但確實帶來了不少改變。最大的改變是,當你和 AI 領域之外的人交流,像政府高層,那些對 AI 瞭解不多的人,諾貝爾獎就像一個“通行證”,會讓他們立刻意識到你在這個領域確實是專家。我覺得未來在很多場合它會很有用。至於資源,你說得對,我們在 Google 和 DeepMind 本來資源就不少,雖然永遠不夠,計算力永遠不嫌多。但諾獎更多是給我一個平台,讓我能夠為重要議題發聲,比如 AI 安全。我過去發聲不多,但未來這會變得重要,可能我們今天也會談到。主持人:除了 AI 安全,你覺得未來你還會更常用你的平台談那些議題?Demis不僅是長期的 AGI 安全,當然那是我們持續關注的,另外我也會關注當下對 AI 的負責任使用。那些事情適合讓 AI 加速、增強?那些領域在短期內就需要我們更謹慎?還有,就是幫助整個社會為 AGI 做好準備。AGI 可能是人類歷史最具變革性的時刻之一,它已經在地平線上逼近了。社會、物種、政府,以及重要決策者都必須提前準備。而諾獎帶來的平台基本能讓我敲開任何一扇門,這會非常關鍵。主持人:你的獨特之處在於,你既深耕科學,又站在全球科技公司、超級平台、超級大國競爭的前線。同時你又有類似賈伯斯那種“產品直覺”,想做讓人讚嘆的產品,但你總說自己首先是科學家。Demis:是的,我首先是科學家。所謂“科學家”,是指我的默認思考方式就是“科學方法”。我認為科學方法可能是人類歷史上最重要的思想之一,它帶來了啟蒙時代、現代科學,甚至現代文明賴以運轉的體系:實驗、假設、驗證、迭代。我認為這種方法不僅適用於科學,甚至適用於日常生活和商業。我一直努力把這種方法做到極致。它讓我們在研究、工程和基礎設施上都追求極高的嚴謹性和精確性。是的,我們正處在科技史上最激烈的競爭中之一,但我們的優勢來自這種科學方法的根基,以及我們能夠同時做到世界級研究、世界級工程、世界級基礎設施建設——這三者缺一不可,而 DeepMind 在這三方面都保持著頂級水平。未來12個月 AI 會發生什麼?主持人:未來 12 個月,你認為世界會發生那些變化?如果明年這個時候我們還能坐在這裡,會看到什麼不同?Demis我們現在正在努力推進的是多模態能力的深度融合。Gemini 從第一天起就是多模態模型,能處理圖像、視訊、文字、音訊,現在也能產出這些模態的內容。多模態帶來非常多跨領域能力增強,比如我們最近的圖像模型 NoBanana Pro,它對於視覺的理解驚人,能生成精準的資訊圖。未來一年你會看到多模態的進一步突破,特別是視訊與語言模型的深度結合,將出現非常強的新能力。第二個重點是“世界模型”。我們現在有一個系統叫 Genie 3,它是互動視訊模型,你不僅能生成視訊,還能像在遊戲或模擬世界中一樣“走進去”,並保持一分鐘以上的連貫性,這是非常令人興奮的。第三是智能體(agents)。現在智能體還不夠可靠,無法完成完整任務,但未來一年會有明顯進展。主持人:今天在台上我們已經聽了很多關於 agents 的討論。一年後它們會發展到什麼程度?能給普通人一個具體例子嗎?Demis我們正在打造一個“通用助手”,最終希望 Gemini 能成為這種普適助手,它會出現在更多裝置上,不只是電腦和手機,甚至可能是眼鏡等隨身裝置。它會成為你日常生活中的一部分,每天多次向它求助,不僅提升工作效率,也改善個人生活,比如給予你喜歡的書、電影、活動的推薦。不過目前智能體還不能讓你完全“委派”一個任務並保證 100% 完成。但我認為一年後,我們會看到接近這種能力的智能體出現。AI最好的可能vs 最糟的擔憂主持人如果分“最樂觀”和“最悲觀”來說,你心中 AI 能給世界帶來的最好是什麼?最怕的又是什麼?Demis最好的情況,是我從年輕時就一直為之努力的願景,一種“激進豐裕(radical abundance)”。意味著 AI 解決了人類當下最大的難題:免費、清潔的可再生能源;或許突破聚變、突破電池、突破材料科學、半導體;治癒大量疾病。那會是一個“後稀缺時代”,人類繁榮,甚至走向星辰,向銀河擴散意識。但即便是烏托邦也會帶來問題:如果 AI 把所有難題都解決了,人類的目的感會發生什麼?作為科學家,我會擔心這一點,連科學方法本身也可能受到影響。主持人:那最糟的情況呢?Demis:顯然,AI 的兩個主要風險:1)壞人用它做壞事;2)隨著系統更接近 AGI、更具“能動性(agentic)”,它可能偏離人類初始目標,造成傷害。主持人:我快速列幾個風險,你告訴我你有多擔心:① 惡意分子利用 AI 製造病原體。Demis:是的,這是必須嚴格防範的風險之一。② 國家級駭客用 AI 對能源、水資源系統發動網路攻擊。Demis:這可能現在就已經在發生了,雖然 AI 還不算很先進。但這是最容易被攻擊的方向。因此我們在 Google 和 DeepMind 都在投入大量資源,用 AI 提升網路防禦能力。③ AI 自主運行,脫離人類控制。Demis:這與 agentic 系統的發展直接相關。它們越強、越自主,偏離指令的可能性也越大。現在研究的重點是如何讓能“持續學習”的系統始終待在安全護欄內。商業世界會強迫我們做到這一點,因為企業客戶會要求可靠性,否則他們不會購買,市場會淘汰不負責任的模型提供商。但AI“跳出護欄”的風險不是零,必須嚴肅對待。中美之間的差距只有“幾個月”主持人:在與中國的 AI 競賽中,美國在那些方面領先?那些方面落後?Demis:我認為西方和美國仍然領先,尤其從最新基準和系統表現來看。但中國並不遠,比如 DeepSeek 等最新模型都很優秀,團隊也很強。現在的差距可能只剩“幾個月”,而不是“幾年”。主持人:如果不談晶片,只看 AI 本身,中國是不是贏了?Demis:我認為即便不考慮晶片,在演算法創新上,西方仍然佔優勢。到目前為止,中國公司還沒有展示過真正突破性的全新演算法創新。關於 Gemini 3 的“細膩感”主持人:恭喜你們上個月推出了 Gemini 3。這款模型被稱為“遊戲規則改變者”,你們說它在推理的深度與細膩度上達到了前所未有的水平。能不能告訴我們,Gemini 3 的“細膩度”究竟獨特在那裡?Demis:我覺得最讓我們滿意的,不只是它的能力,還有它的“風格”,甚至可以說是某種“人格感”。我喜歡它回答問題時的方式:既能保持簡潔,又不會對使用者的話一味附和。如果你的觀點不太成立,它會溫和地指出問題。我認為很多使用者也感受到了這種變化,可以明顯感覺到它的智能層次以及整體實用性都上了一個台階。主持人:那有沒有什麼是 Gemini 做出來以後連你都覺得:“哇,我沒想到它竟然能這樣”?Demis:這其實就是我們為什麼如此熱愛這份工作的原因。現在這個時代,研究直接連著產品,這意味著數百萬,甚至在 Google 的規模下,是數十億使用者,會在第一時間使用你剛發佈的技術,然後他們總能立刻把模型玩出一些非常酷的新花樣,很多還會迅速傳播開來。我個人最喜歡的是 Gemini 3 能“一次性生成遊戲”的能力。這對我意義很大,因為我職業生涯最早就是做遊戲 AI 的。現在的模型已經非常接近可以在下一代版本中做到:你可能只用幾小時,通過“邊聊邊寫程式碼”的方式,就能做出接近商業品質的遊戲,而這些過去可能要花團隊多年才能完成。主持人:遊戲“一次生成”的能力,說明了模型的什麼特質?Demis:這說明了這些模型具備令人難以置信的深度理解能力:它們能夠消化非常高層次的指令,然後輸出極其具體與細節豐富的成果。另外,Gemini 3 在前端開發、網站設計方面特別強,美感與創造力兼具,同時技術上又非常穩健。主持人:Axios 寫過很多關於“連這些模型的創造者都無法完全理解模型”的文章。Gemini 3 有沒有什麼地方讓你覺得:“我其實也不完全理解它”?Demis:老實說,我覺得在座的所有人可能都有同樣的感覺,創新的速度太快了。我們幾乎把所有時間都花在建構這些系統上,卻沒有足夠時間真正探索它們的全部能力。每次發佈新版本時,我都會有一種強烈感覺:我甚至連當前系統能力的十分之一都沒來得及挖掘,因為我們馬上又得投入到下一輪的研發與安全測試中。於是很多情況下,最終是使用者比我們內部團隊更早發現這些系統的極限與可能性。為什麼會從其他路線“轉向”大模型?主持人:再問一個有關 Gemini 的背景問題。你們當時其實有很多研究方向,但你並不是一開始就把“大語言模型”當成最終路徑。作家Walter Isaacson告訴我,當你意識到 LLM 的力量時,你做了一個“轉身式大調整”,而且成功地實現了跨越式領先。按 Walter 的說法,大多數商業領袖可能會固執,堅持自己原本的方向。你是怎麼做出這個轉向、決定“ALL IN 大模型”的?Demis:這就是科學方法的力量,如果你是真正的科學家,你不能對某個想法太教條,你必須順著事實與實驗結果前進。Walter 說的是2017–2018 年左右的事情。當時我們並不確定那條路線能通往 AGI,我們有很多方向:我們有自己很強的語言模型(內部叫 Chinchilla、Sparrow 等),我們也在做 AlphaZero 那一類“純強化學習系統”,還有一些偏認知科學、神經科學啟發的架構。作為 DeepMind 的負責人,我的任務是:盡快、安全地建構 AGI,而不是押注某條特定路線。所以我對方法其實很務實,理論可以有,但最終標準是“能不能行得通”。當我們開始看到“規模化”開始真正起效時,我們就逐漸把更多資源轉向語言模型這條研究分支。距離AGI還有5-10年主持人:你對人工通用智能(AGI)從不迴避,有些人說“我們不知道”,或者甚至說“已經有了”,但你會明確說:“我們還沒到,但已經很近”。到底有多近?Demis:我們現在肯定還沒到。但我確實認為很接近了。如果讓我給個時間窗口,我的判斷是5 到 10 年。不過我對 AGI 的標準很高:我們定義的 AGI 是一個擁有所有人類認知能力的系統,包括創新與創造力。雖然今天的 LLM 在某些方面已經驚人地強大,像博士水準甚至金牌等級,但也仍然存在明顯缺陷,能力不平衡(所謂“鋸齒型智能”)。而且還缺少持續學習、線上學習、長期規劃、深層推理這些關鍵能力。我認為未來它們能做到,但可能還需要“一兩次真正的大突破”。主持人:那我們能僅靠 LLM 的規模化與改進實現 AGI 嗎?還是還需要別的方法?Demis:這是一個實驗問題,但我的最佳判斷是:規模化必須做到極限,它至少會成為 AGI 的一個關鍵組成部分,有可能甚至就是全部。不過我個人認為,很可能在事後回看時,我們會發現除了規模化之外,還需要再來一兩次類似“Transformer 或 AlphaZero 那種等級的突破”。AI 產業是否正在形成泡沫主持人:回到行業層面。投入這麼大,會不會形成足以衝擊經濟的大泡沫?Demis:我認為不是非黑即白。行業某些部分確實可能已經泡沫化,比如某些荒唐的天價種子輪融資,這可能不可持續。但另一方面,我比任何人都相信 AI 會成為最具變革性的技術,所以長期看,這些投入最終都會被證明合理。作為 Google DeepMind 的負責人,我的工作就是:無論泡沫破不破,我們都要處於最佳位置。主持人:AI 人才大戰正在瘋狂升級,最終會走向什麼?Demis:確實現在有點誇張,比如 Meta 的一些舉動。但對我們來說,我們要的是“使命驅動的人”。我們擁有最好的使命、最完整的技術堆疊,如果你想做影響世界最大的工作,沒有比 Google DeepMind 更好的地方。而且頂尖科學家與工程師都會想在最靠前的系統上工作,這會形成一個正循環。AI 會不會發展出“自我利益”主持人:很多人擔心 AI 會不會發展出自己的“利益傾向”。你覺得可能嗎?Demis:這是一個嚴肅的問題。如果未來高度自主的系統真的出現了某種“自我利益”,而這種利益又與設計者、甚至與人類整體意願衝突,那確實可能導致風險。這是所有“智能體AI”必須謹慎考慮的問題。人類可能通過腦機介面來跟上AGI主持人:你還是個玩家。遊戲教給了我們什麼?對 AI 的未來有什麼啟示?Demis:我的棋類背景與遊戲經驗對我的科研與管理影響很大。最好的遊戲(比如象棋、圍棋、撲克)都是現實某些面向的縮影,但區別在於現實中你往往只有寥寥幾次關鍵決策機會,而在遊戲中你可以不斷練習、不斷提升決策能力。如果你認真對待遊戲,把每次決策都當成真實的判斷,它確實能訓練你的思維方式與規劃能力。主持人:你說過,我們的大腦其實是為了做“採獵者”而進化的。但現在我們面對的變革規模是工業革命的十倍、速度是十倍。人類跟得上嗎?包括你自己?Demis:我提“採獵者大腦”的重點其實恰恰是:人類極其適應性強。我們從遠古自然走到現代城市文明,用的還是同一顆大腦。這說明我們本身就是通用智能的最佳例子,我們可以適應各種環境。未來當 AGI 出現後,我們可能會發明新的技術(比如腦機介面),有些人可能會選擇將它們作為自身能力的擴展,那也可能是我們保持同步的一種方式。AI 將如何改變未來的世界盃主持人:你是終身利物浦球迷,也給他們做過分析。AI 將如何影響未來在北美舉辦的世界盃?Demis:已經有很多球隊來找我們,希望獲得幫助。當然我必須儘量保持中立。但從本質上講,體育有巨大且細緻的資料,而且追求極致的表現,是 AI 介入並產生巨大價值的天然場景。 (51CTO技術堆疊)