Nature重磅評論文章!UCSD研究團隊宣稱:AGI早已到來,大語言模型如GPT已展現廣域人類級智能。
人類是否已經實現了通用人工智慧(AGI),卻渾然不覺?
是的,就是這樣。
一篇發表在《自然》雜誌上的新評論文章如此表示。
這是一項震撼科學界與社會根基的重磅披露,通用人工智慧(AGI)並非遙不可及的夢想,它已然降臨,正透過日常使用的AI工具螢幕,直視著我們。
即便你不贊同他們的觀點,也值得一讀:兼聽則明,唯有瞪大雙眼,既不心懷恐懼,也不盲目追捧,才能幫助我們更好地迎接未來。
有人說,打造類人智能如同「爬樹登月」。
但現在看來,樹已經夠高,月亮其實也沒那麼遠。
加州大學聖迭戈分校(UCSD)四位專家合作了這篇文章,包括哲學家Eddy Keming Chen、AI教授Mikhail Belkin、語言學家Leon Bergen和資料科學教授David Danks。
哲學副教授Eddy Keming Chen、「AI、資料科學與電腦科學」教授Mikhail Belkin、語言學與電腦科學副教授 Leon Bergen,以及「資料科學、哲學與政策」教授David Danks
這篇文章不是科幻小說,不是科技巨頭的預言,給出最系統的論證:AI不只是聰明,而且已經真正「通用」。
這是繼哥白尼與達爾文之後,第三次顛覆人類中心觀的認知革命。
忘掉炒作與恐怖故事吧。
研究團隊指出,AGI已至,證據確鑿,無可辯駁。
像Grok這樣的大語言模型,絕非僅止於模仿人類,它們正以令圖靈本人都要瞠目的方式超越人類。
回想一下:1950年,圖靈構思出了著名的「模仿遊戲」,即如今廣為人知的圖靈測試,用於測試機器能否騙過人類,讓人類以為它們是同類。
快進到2025年3月,GPT-4.5不僅通過了測試,而且碾壓人類得分,以73%的被誤認為人類的比例取得了壓倒性的成功。
但這僅僅是開胃菜。
這些「AI巨獸」不僅在與全球數百萬人進行著無休止的對話,與此同時正在
這些能力覆蓋數學、語言、科學、創造力等多領域,展現出「廣度+足夠深度」的通用智能,正符合人類平均水平的「一般智能」定義,而非要求完美或全能。
然而,在2025年3月的一項調查中,76%的頂尖 AI 研究人員表示,當前的方法「不太可能」或「極不可能」實現通用人工智慧(AGI)。
這讓人詫異:機器都能通過圖靈測試、解出奧數題了,怎麼可能還不具備通用智能?
那麼,為何會出現集體否認?
原因可能歸結為一種由定義模糊、原始恐懼和巨大商業利益交織而成的「有毒組合」。
來自哲學、機器學習、語言學和認知科學領域,四位研究人員認為這種脫節在於:
他們頗具爭議的結論是:按照任何合理的標準,AGI已經存在。
他們說,AGI的概念被含糊不清的定義所纏繞:它是指完美無瑕的超級大腦,還是僅指像普通人一樣具備廣泛能力?
劇透:答案是後者。
沒有誰是全知全能的,愛因斯坦不會用中文聊天,居里夫人也不解數論難題。
通用智能意味著在數學、語言、科學、創造力等多個領域具備廣度,並有足夠的深度完成任務,而非追求完美。
研究團隊逐一拆解了阻礙我們認知的迷思:
AGI無需完美,人類亦如此;
AGI也不是碾壓一切領域的超級智能。
沒有人能達到這個標準。你不行,愛因斯坦不行,達文西也不行,以後也沒有人能行。
然而,我們卻一直要求AI必須先達到它,才肯稱之為「通用智能」。
論文提出三個智能層次:
當前LLM已穩固處於水平2。
證據如雪崩般堆積。
還有看似一個狂野的基準:當前LLM展現出的能力廣度,已超過《2001太空漫遊》中的HAL 9000。
HAL是一台具有人類個性的HAL 9000電腦。除了維護髮現號飛船上的所有系統外,HAL還能執行許多功能,如語音、語音識別、臉部辨識、唇讀、解釋情感、表達情感和下棋
HAL曾是科幻小說中可怕超級AI的典型代表。
2025年的真實AI,比1968年對2001年AI的想像,能力更廣。
我們甚至正悄然邁向「超人類水平」的壯舉,例如做出任何人都無法單獨完成的革命性發現。
好好想想吧。
對AGI的質疑,就像不斷後移的球門——
「它們只是尋找表」→解決了新穎問題
「它們只是模式匹配」→證明了新定理
「它們不會做數學」→IMO金牌
「它們不理解」→協助前沿研究
注意到他們的「花招」了嗎?反對的理由不斷變形,永不消失。
這呼應了1843年英國數學家、史上第一位程式設計師埃達·洛夫萊斯的反對:機器「永遠只能按令行事、毫無新意」。
1950年,圖靈就回應了這一點。
183年後,我們仍在提出同樣的論點,只是換了詞彙。
論文系統地回應了十大異議:
LLM只是隨機鸚鵡、缺乏世界模型、僅限於文字、沒有身體、缺乏主觀能動性、沒有自我意識、學習效率低、會產生幻覺、缺乏經濟效益 、智能形態太異類。
批評者高喊:「大模型不過是復讀資料的隨機鸚鵡!」
但當AI能解決全新的數學問題、從新資料中推斷統計規律,或設計現實世界的實驗時,這種託詞便不攻自破。
它們缺乏對世界的認知模型? 去問問那個能像預言般預測杯子掉落會碎裂的AI吧。
它們僅限於文字?多模態訓練和實驗室協作證明事實並非如此。
「AI沒有身體,因此不可能有智能。」
物理學家斯蒂芬·霍金幾乎完全通過文字與合成語音與世界互動,但你會因此否定他的智商嗎?
這一點無關緊要,智力與認知有關,與運動無關。
這是一個極具破壞力的觀察:在智能上,人類很雙標。
當評估人類智能時,我們並不窺探其大腦內部以「驗證理解」。
我們通過行為、對話、解決問題來推斷它。
我們對人類用一種基於行為的標準,對AI卻用另一種標準——基於機制的標準。
「它們缺乏能動性,不會形成獨立目標。」
沒錯。但智能 ≠ 自主性。能動性關乎道德責任,但並不構成智能本身。
讓我們更深入探討「隨機鸚鵡論」,因為這個異議無處不在。
這種主張本質上聲稱:LLM只是對訓練資料進行插值。它們無法處理真正新穎的問題。
但當前的LLM能夠解決未發表的數學問題、將學習從程式碼領域遷移到非程式碼領域,甚至有人相信AI自己提出諾獎等級成果也不是妄想。
讓人夜不能寐的是:
無法保證人類智能本身不是一種複雜版的隨機鸚鵡。
所有智能,無論天生的還是人工的,都必須從相關性資料中提取結構。問題只在於提取的深度。
大家拒絕稱之為「AGI」的真正原因,或許並非技術性的,而是圖靈所說的「鴕鳥心態」:機器能思考的後果太過可怕,不如讓我們祈禱它們永遠做不到。
承認機器擁有人類水平的通用智能,會迫使人類直面令人不安的真相:
一個能通過圖靈測試、解決奧數題、協助前沿研究的實體……
除了AGI,還有什麼能解釋這一切?
就在五年前,我們還沒有 AGI;而今天,我們已經擁有它。
更強的智能形式幾乎可以肯定即將問世。
這是件令人震撼,但也令人擔憂的事。
震撼在於:我們正在親歷一場也許是人類歷史上最重要的科技革命。
擔憂在於:這場革命發生得太快,而且似乎還在加速。
1965年,哲學家 Hubert Dreyfus 在為蘭德公司撰寫AI研究報告時,曾諷刺道:試圖建構人類級人工智慧,猶如「試圖靠爬樹登月」。
幾十年來,這個比喻似乎都挺貼切。
但隨著證據日積月累,我們越來越清楚地看到:我們誤判了「月亮」的性質,也低估了「樹」的高度。
事實是:只要規模足夠大、訓練規則得當,基於人類語言的學習系統,真的可以在語言中挖掘出現實世界的深層結構——並以此進化出通用智能。
哥白尼把人類從宇宙中心的位置拉了下來。
達爾文讓人類失去了「自然界主宰」的特權。
圖靈則預言,人類可能不是唯一具備智能的存在。
如今,圖靈75年前設想的機器,真的來了。
而它們的樣貌,既比我們預期的更「人類」,也更「怪異」。
如同之前的那幾次巨變,這一次,也逼迫人類重新定義自身的位置,去接受一個事實:
這個世界上存在的「智能形態」,比我們過去所能想像的要多得多。
人類的地位將改變,我們對「心智」的理解也將改變。
也許,問題從來不是「AI是否已達到人類水平智能?」
也許,問題始終在於:「當智能不以人類的樣貌呈現時,我們能否識別它?」
圖靈在1950年就知道,這才是真正的測試。
不是對機器的測試。是對人類的測試。 (新智元)