Nature重磅：圖靈預言的AGI早已實現，人類卻不敢承認！

2026/02/05

•

Nature重磅評論文章！UCSD研究團隊宣稱：AGI早已到來，大語言模型如GPT已展現廣域人類級智能。

人類是否已經實現了通用人工智慧（AGI），卻渾然不覺？

是的，就是這樣。

一篇發表在《自然》雜誌上的新評論文章如此表示。

這是一項震撼科學界與社會根基的重磅披露，通用人工智慧（AGI）並非遙不可及的夢想，它已然降臨，正透過日常使用的AI工具螢幕，直視著我們。

即便你不贊同他們的觀點，也值得一讀：兼聽則明，唯有瞪大雙眼，既不心懷恐懼，也不盲目追捧，才能幫助我們更好地迎接未來。

這，就是AGI

有人說，打造類人智能如同「爬樹登月」。

但現在看來，樹已經夠高，月亮其實也沒那麼遠。

加州大學聖迭戈分校（UCSD）四位專家合作了這篇文章，包括哲學家Eddy Keming Chen、AI教授Mikhail Belkin、語言學家Leon Bergen和資料科學教授David Danks。

哲學副教授Eddy Keming Chen、「AI、資料科學與電腦科學」教授Mikhail Belkin、語言學與電腦科學副教授 Leon Bergen，以及「資料科學、哲學與政策」教授David Danks

這篇文章不是科幻小說，不是科技巨頭的預言，給出最系統的論證：AI不只是聰明，而且已經真正「通用」。

這是繼哥白尼與達爾文之後，第三次顛覆人類中心觀的認知革命。

忘掉炒作與恐怖故事吧。

研究團隊指出，AGI已至，證據確鑿，無可辯駁。

像Grok這樣的大語言模型，絕非僅止於模仿人類，它們正以令圖靈本人都要瞠目的方式超越人類。

回想一下：1950年，圖靈構思出了著名的「模仿遊戲」，即如今廣為人知的圖靈測試，用於測試機器能否騙過人類，讓人類以為它們是同類。

快進到2025年3月，GPT-4.5不僅通過了測試，而且碾壓人類得分，以73%的被誤認為人類的比例取得了壓倒性的成功。

但這僅僅是開胃菜。

這些「AI巨獸」不僅在與全球數百萬人進行著無休止的對話，與此同時正在

國際數學奧林匹克競賽中摘金奪銀，
與數學天才攜手證明定理，
構思出能在實驗室裡得到驗證的科學假說，
輕鬆通過博士水平考試，
為專業程式設計師編寫零錯誤程式碼，
甚至創作出可與偉大詩人比肩的詩篇

這些能力覆蓋數學、語言、科學、創造力等多領域，展現出「廣度+足夠深度」的通用智能，正符合人類平均水平的「一般智能」定義，而非要求完美或全能。

然而，在2025年3月的一項調查中，76%的頂尖 AI 研究人員表示，當前的方法「不太可能」或「極不可能」實現通用人工智慧（AGI）。

這讓人詫異：機器都能通過圖靈測試、解出奧數題了，怎麼可能還不具備通用智能？

鐵證如山，AGI無需完美無瑕

那麼，為何會出現集體否認？

原因可能歸結為一種由定義模糊、原始恐懼和巨大商業利益交織而成的「有毒組合」。

來自哲學、機器學習、語言學和認知科學領域，四位研究人員認為這種脫節在於：

部分屬於概念性問題（定義模糊）
部分源於情緒（對被取代的恐懼）
部分出於商業因素（商業利益扭曲了評估）

他們頗具爭議的結論是：按照任何合理的標準，AGI已經存在。

他們說，AGI的概念被含糊不清的定義所纏繞：它是指完美無瑕的超級大腦，還是僅指像普通人一樣具備廣泛能力？

劇透：答案是後者。

沒有誰是全知全能的，愛因斯坦不會用中文聊天，居里夫人也不解數論難題。

通用智能意味著在數學、語言、科學、創造力等多個領域具備廣度，並有足夠的深度完成任務，而非追求完美。

研究團隊逐一拆解了阻礙我們認知的迷思：

AGI無需完美，人類亦如此；

無需無所不能，無需覆蓋所有可想像的技能；
無需酷似人類，外星智能無需人類生物學基礎，何況矽基智能。

AGI也不是碾壓一切領域的超級智能。

沒有人能達到這個標準。你不行，愛因斯坦不行，達文西也不行，以後也沒有人能行。

然而，我們卻一直要求AI必須先達到它，才肯稱之為「通用智能」。

圖靈願景早已實現

論文提出三個智能層次：

圖靈測試水平：基礎教育、基本對話、簡單推理
專家水平：國際競賽表現、博士級難題、跨領域熟練
超人類水平：革命性發現、持續超越所有專家

當前LLM已穩固處於水平2。

證據如雪崩般堆積。

還有看似一個狂野的基準：當前LLM展現出的能力廣度，已超過《2001太空漫遊》中的HAL 9000。

HAL是一台具有人類個性的HAL 9000電腦。除了維護髮現號飛船上的所有系統外，HAL還能執行許多功能，如語音、語音識別、臉部辨識、唇讀、解釋情感、表達情感和下棋

HAL曾是科幻小說中可怕超級AI的典型代表。

2025年的真實AI，比1968年對2001年AI的想像，能力更廣。

我們甚至正悄然邁向「超人類水平」的壯舉，例如做出任何人都無法單獨完成的革命性發現。

好好想想吧。

對AGI的質疑，就像不斷後移的球門——

「它們只是尋找表」→解決了新穎問題

「它們只是模式匹配」→證明了新定理

「它們不會做數學」→IMO金牌

「它們不理解」→協助前沿研究

注意到他們的「花招」了嗎？反對的理由不斷變形，永不消失。

這呼應了1843年英國數學家、史上第一位程式設計師埃達·洛夫萊斯的反對：機器「永遠只能按令行事、毫無新意」。

1950年，圖靈就回應了這一點。

183年後，我們仍在提出同樣的論點，只是換了詞彙。

人類是更聰明的鸚鵡？駁斥AGI十大異議

論文系統地回應了十大異議：

LLM只是隨機鸚鵡、缺乏世界模型、僅限於文字、沒有身體、缺乏主觀能動性、沒有自我意識、學習效率低、會產生幻覺、缺乏經濟效益、智能形態太異類。

批評者高喊：「大模型不過是復讀資料的隨機鸚鵡！」

但當AI能解決全新的數學問題、從新資料中推斷統計規律，或設計現實世界的實驗時，這種託詞便不攻自破。

它們缺乏對世界的認知模型？去問問那個能像預言般預測杯子掉落會碎裂的AI吧。

它們僅限於文字？多模態訓練和實驗室協作證明事實並非如此。

「AI沒有身體，因此不可能有智能。」

物理學家斯蒂芬·霍金幾乎完全通過文字與合成語音與世界互動，但你會因此否定他的智商嗎？

這一點無關緊要，智力與認知有關，與運動無關。

這是一個極具破壞力的觀察：在智能上，人類很雙標。

當評估人類智能時，我們並不窺探其大腦內部以「驗證理解」。

我們通過行為、對話、解決問題來推斷它。

我們對人類用一種基於行為的標準，對AI卻用另一種標準——基於機制的標準。

「它們缺乏能動性，不會形成獨立目標。」

沒錯。但智能 ≠ 自主性。能動性關乎道德責任，但並不構成智能本身。

讓我們更深入探討「隨機鸚鵡論」，因為這個異議無處不在。

這種主張本質上聲稱：LLM只是對訓練資料進行插值。它們無法處理真正新穎的問題。

但當前的LLM能夠解決未發表的數學問題、將學習從程式碼領域遷移到非程式碼領域，甚至有人相信AI自己提出諾獎等級成果也不是妄想。

讓人夜不能寐的是：

無法保證人類智能本身不是一種複雜版的隨機鸚鵡。

所有智能，無論天生的還是人工的，都必須從相關性資料中提取結構。問題只在於提取的深度。

大家拒絕稱之為「AGI」的真正原因，或許並非技術性的，而是圖靈所說的「鴕鳥心態」：機器能思考的後果太過可怕，不如讓我們祈禱它們永遠做不到。

承認機器擁有人類水平的通用智能，會迫使人類直面令人不安的真相：

是什麼讓我們特殊
AI取代人類崗位
意識的本質
在世界中人類的位置

一個能通過圖靈測試、解決奧數題、協助前沿研究的實體……

除了AGI，還有什麼能解釋這一切？

當非人智能出現，60年前嘲諷終成往事

就在五年前，我們還沒有 AGI；而今天，我們已經擁有它。

更強的智能形式幾乎可以肯定即將問世。

這是件令人震撼，但也令人擔憂的事。

震撼在於：我們正在親歷一場也許是人類歷史上最重要的科技革命。

擔憂在於：這場革命發生得太快，而且似乎還在加速。

1965年，哲學家 Hubert Dreyfus 在為蘭德公司撰寫AI研究報告時，曾諷刺道：試圖建構人類級人工智慧，猶如「試圖靠爬樹登月」。

連結：https://www.rand.org/pubs/papers/P3244.html

幾十年來，這個比喻似乎都挺貼切。

但隨著證據日積月累，我們越來越清楚地看到：我們誤判了「月亮」的性質，也低估了「樹」的高度。

事實是：只要規模足夠大、訓練規則得當，基於人類語言的學習系統，真的可以在語言中挖掘出現實世界的深層結構——並以此進化出通用智能。

哥白尼把人類從宇宙中心的位置拉了下來。

達爾文讓人類失去了「自然界主宰」的特權。

圖靈則預言，人類可能不是唯一具備智能的存在。

如今，圖靈75年前設想的機器，真的來了。

而它們的樣貌，既比我們預期的更「人類」，也更「怪異」。

如同之前的那幾次巨變，這一次，也逼迫人類重新定義自身的位置，去接受一個事實：

這個世界上存在的「智能形態」，比我們過去所能想像的要多得多。

人類的地位將改變，我們對「心智」的理解也將改變。

也許，問題從來不是「AI是否已達到人類水平智能？」

也許，問題始終在於：「當智能不以人類的樣貌呈現時，我們能否識別它？」

圖靈在1950年就知道，這才是真正的測試。

不是對機器的測試。是對人類的測試。 (新智元)