Nature重磅:圖靈預言的AGI早已實現,人類卻不敢承認!

Nature重磅評論文章!UCSD研究團隊宣稱:AGI早已到來,大語言模型如GPT已展現廣域人類級智能。

人類是否已經實現了通用人工智慧(AGI),卻渾然不覺?

是的,就是這樣。

一篇發表在《自然》雜誌上的新評論文章如此表示。

這是一項震撼科學界與社會根基的重磅披露,通用人工智慧(AGI)並非遙不可及的夢想,它已然降臨,正透過日常使用的AI工具螢幕,直視著我們

即便你不贊同他們的觀點,也值得一讀:兼聽則明,唯有瞪大雙眼,既不心懷恐懼,也不盲目追捧,才能幫助我們更好地迎接未來。

這,就是AGI

有人說,打造類人智能如同「爬樹登月」。

但現在看來,樹已經夠高,月亮其實也沒那麼遠。

加州大學聖迭戈分校(UCSD)四位專家合作了這篇文章,包括哲學家Eddy Keming Chen、AI教授Mikhail Belkin、語言學家Leon Bergen和資料科學教授David Danks。

哲學副教授Eddy Keming Chen、「AI、資料科學與電腦科學」教授Mikhail Belkin、語言學與電腦科學副教授 Leon Bergen,以及「資料科學、哲學與政策」教授David Danks

這篇文章不是科幻小說,不是科技巨頭的預言,給出最系統的論證:AI不只是聰明,而且已經真正「通用」。

這是繼哥白尼與達爾文之後,第三次顛覆人類中心觀的認知革命。

忘掉炒作與恐怖故事吧。

研究團隊指出,AGI已至,證據確鑿,無可辯駁。

像Grok這樣的大語言模型,絕非僅止於模仿人類,它們正以令圖靈本人都要瞠目的方式超越人類。

回想一下:1950年,圖靈構思出了著名的「模仿遊戲」,即如今廣為人知的圖靈測試,用於測試機器能否騙過人類,讓人類以為它們是同類。


快進到2025年3月,GPT-4.5不僅通過了測試,而且碾壓人類得分,以73%的被誤認為人類的比例取得了壓倒性的成功。

但這僅僅是開胃菜。

這些「AI巨獸」不僅在與全球數百萬人進行著無休止的對話,與此同時正在

  • 國際數學奧林匹克競賽中摘金奪銀,
  • 與數學天才攜手證明定理,
  • 構思出能在實驗室裡得到驗證的科學假說,
  • 輕鬆通過博士水平考試,
  • 為專業程式設計師編寫零錯誤程式碼,
  • 甚至創作出可與偉大詩人比肩的詩篇

這些能力覆蓋數學、語言、科學、創造力等多領域,展現出「廣度+足夠深度」的通用智能,正符合人類平均水平的「一般智能」定義,而非要求完美或全能

然而,在2025年3月的一項調查中,76%的頂尖 AI 研究人員表示,當前的方法「不太可能」或「極不可能」實現通用人工智慧(AGI)。

這讓人詫異:機器都能通過圖靈測試、解出奧數題了,怎麼可能還不具備通用智能?

鐵證如山,AGI無需完美無瑕

那麼,為何會出現集體否認?

原因可能歸結為一種由定義模糊、原始恐懼和巨大商業利益交織而成的「有毒組合」。

來自哲學、機器學習、語言學和認知科學領域,四位研究人員認為這種脫節在於:

  • 部分屬於概念性問題(定義模糊)
  • 部分源於情緒(對被取代的恐懼)
  • 部分出於商業因素(商業利益扭曲了評估)

他們頗具爭議的結論是:按照任何合理的標準,AGI已經存在。

他們說,AGI的概念被含糊不清的定義所纏繞:它是指完美無瑕的超級大腦,還是僅指像普通人一樣具備廣泛能力?

劇透:答案是後者。

沒有誰是全知全能的,愛因斯坦不會用中文聊天,居里夫人也不解數論難題。

通用智能意味著在數學、語言、科學、創造力等多個領域具備廣度,並有足夠的深度完成任務,而非追求完美。

研究團隊逐一拆解了阻礙我們認知的迷思:

AGI無需完美,人類亦如此;

  • 無需無所不能,無需覆蓋所有可想像的技能;
  • 無需酷似人類,外星智能無需人類生物學基礎,何況矽基智能。

AGI也不是碾壓一切領域的超級智能。

沒有人能達到這個標準。你不行,愛因斯坦不行,達文西也不行,以後也沒有人能行。

然而,我們卻一直要求AI必須先達到它,才肯稱之為「通用智能」。

圖靈願景早已實現

論文提出三個智能層次:

  • 圖靈測試水平:基礎教育、基本對話、簡單推理
  • 專家水平:國際競賽表現、博士級難題、跨領域熟練
  • 超人類水平:革命性發現、持續超越所有專家

當前LLM已穩固處於水平2。

證據如雪崩般堆積。

還有看似一個狂野的基準:當前LLM展現出的能力廣度,已超過《2001太空漫遊》中的HAL 9000。

HAL是一台具有人類個性的HAL 9000電腦。除了維護髮現號飛船上的所有系統外,HAL還能執行許多功能,如語音、語音識別、臉部辨識、唇讀、解釋情感、表達情感和下棋

HAL曾是科幻小說中可怕超級AI的典型代表。

2025年的真實AI,比1968年對2001年AI的想像,能力更廣。

我們甚至正悄然邁向「超人類水平」的壯舉,例如做出任何人都無法單獨完成的革命性發現。

好好想想吧。

對AGI的質疑,就像不斷後移的球門——

「它們只是尋找表」→解決了新穎問題

「它們只是模式匹配」→證明了新定理

「它們不會做數學」→IMO金牌

「它們不理解」→協助前沿研究

注意到他們的「花招」了嗎?反對的理由不斷變形,永不消失。

這呼應了1843年英國數學家、史上第一位程式設計師埃達·洛夫萊斯的反對:機器「永遠只能按令行事、毫無新意」。

1950年,圖靈就回應了這一點。

183年後,我們仍在提出同樣的論點,只是換了詞彙。

人類是更聰明的鸚鵡?駁斥AGI十大異議

論文系統地回應了十大異議:

LLM只是隨機鸚鵡、缺乏世界模型、僅限於文字、沒有身體、缺乏主觀能動性、沒有自我意識、學習效率低、會產生幻覺、缺乏經濟效益 、智能形態太異類。

批評者高喊:「大模型不過是復讀資料的隨機鸚鵡!」

但當AI能解決全新的數學問題、從新資料中推斷統計規律,或設計現實世界的實驗時,這種託詞便不攻自破。

它們缺乏對世界的認知模型? 去問問那個能像預言般預測杯子掉落會碎裂的AI吧。

它們僅限於文字?多模態訓練和實驗室協作證明事實並非如此。

「AI沒有身體,因此不可能有智能。」

物理學家斯蒂芬·霍金幾乎完全通過文字與合成語音與世界互動,但你會因此否定他的智商嗎?

這一點無關緊要,智力與認知有關,與運動無關。

這是一個極具破壞力的觀察:在智能上,人類很雙標。

當評估人類智能時,我們並不窺探其大腦內部以「驗證理解」。

我們通過行為、對話、解決問題來推斷它。

我們對人類用一種基於行為的標準,對AI卻用另一種標準——基於機制的標準。

「它們缺乏能動性,不會形成獨立目標。」

沒錯。但智能 ≠ 自主性。能動性關乎道德責任,但並不構成智能本身。

讓我們更深入探討「隨機鸚鵡論」,因為這個異議無處不在。

這種主張本質上聲稱:LLM只是對訓練資料進行插值。它們無法處理真正新穎的問題。

但當前的LLM能夠解決未發表的數學問題、將學習從程式碼領域遷移到非程式碼領域,甚至有人相信AI自己提出諾獎等級成果也不是妄想。

讓人夜不能寐的是:

無法保證人類智能本身不是一種複雜版的隨機鸚鵡。

所有智能,無論天生的還是人工的,都必須從相關性資料中提取結構。問題只在於提取的深度。

大家拒絕稱之為「AGI」的真正原因,或許並非技術性的,而是圖靈所說的「鴕鳥心態」:機器能思考的後果太過可怕,不如讓我們祈禱它們永遠做不到。

承認機器擁有人類水平的通用智能,會迫使人類直面令人不安的真相:

  • 是什麼讓我們特殊
  • AI取代人類崗位
  • 意識的本質
  • 在世界中人類的位置

一個能通過圖靈測試、解決奧數題、協助前沿研究的實體……

除了AGI,還有什麼能解釋這一切?

當非人智能出現,60年前嘲諷終成往事

就在五年前,我們還沒有 AGI;而今天,我們已經擁有它。

更強的智能形式幾乎可以肯定即將問世。

這是件令人震撼,但也令人擔憂的事。

震撼在於:我們正在親歷一場也許是人類歷史上最重要的科技革命。

擔憂在於:這場革命發生得太快,而且似乎還在加速。

1965年,哲學家 Hubert Dreyfus 在為蘭德公司撰寫AI研究報告時,曾諷刺道:試圖建構人類級人工智慧,猶如「試圖靠爬樹登月」。

連結:https://www.rand.org/pubs/papers/P3244.html

幾十年來,這個比喻似乎都挺貼切。

但隨著證據日積月累,我們越來越清楚地看到:我們誤判了「月亮」的性質,也低估了「樹」的高度。

事實是:只要規模足夠大、訓練規則得當,基於人類語言的學習系統,真的可以在語言中挖掘出現實世界的深層結構——並以此進化出通用智能。

哥白尼把人類從宇宙中心的位置拉了下來。

達爾文讓人類失去了「自然界主宰」的特權。

圖靈則預言,人類可能不是唯一具備智能的存在。

如今,圖靈75年前設想的機器,真的來了。

而它們的樣貌,既比我們預期的更「人類」,也更「怪異」。

如同之前的那幾次巨變,這一次,也逼迫人類重新定義自身的位置,去接受一個事實:

這個世界上存在的「智能形態」,比我們過去所能想像的要多得多。

人類的地位將改變,我們對「心智」的理解也將改變。

也許,問題從來不是「AI是否已達到人類水平智能?」

也許,問題始終在於:「當智能不以人類的樣貌呈現時,我們能否識別它?」

圖靈在1950年就知道,這才是真正的測試。

不是對機器的測試。是對人類的測試。 (新智元)