Nature重磅評論文章!UCSD研究團隊宣稱:AGI早已到來,大語言模型如GPT已展現廣域人類級智能。人類是否已經實現了通用人工智慧(AGI),卻渾然不覺?是的,就是這樣。一篇發表在《自然》雜誌上的新評論文章如此表示。這是一項震撼科學界與社會根基的重磅披露,通用人工智慧(AGI)並非遙不可及的夢想,它已然降臨,正透過日常使用的AI工具螢幕,直視著我們。即便你不贊同他們的觀點,也值得一讀:兼聽則明,唯有瞪大雙眼,既不心懷恐懼,也不盲目追捧,才能幫助我們更好地迎接未來。這,就是AGI有人說,打造類人智能如同「爬樹登月」。但現在看來,樹已經夠高,月亮其實也沒那麼遠。加州大學聖迭戈分校(UCSD)四位專家合作了這篇文章,包括哲學家Eddy Keming Chen、AI教授Mikhail Belkin、語言學家Leon Bergen和資料科學教授David Danks。哲學副教授Eddy Keming Chen、「AI、資料科學與電腦科學」教授Mikhail Belkin、語言學與電腦科學副教授 Leon Bergen,以及「資料科學、哲學與政策」教授David Danks這篇文章不是科幻小說,不是科技巨頭的預言,給出最系統的論證:AI不只是聰明,而且已經真正「通用」。這是繼哥白尼與達爾文之後,第三次顛覆人類中心觀的認知革命。忘掉炒作與恐怖故事吧。研究團隊指出,AGI已至,證據確鑿,無可辯駁。像Grok這樣的大語言模型,絕非僅止於模仿人類,它們正以令圖靈本人都要瞠目的方式超越人類。回想一下:1950年,圖靈構思出了著名的「模仿遊戲」,即如今廣為人知的圖靈測試,用於測試機器能否騙過人類,讓人類以為它們是同類。快進到2025年3月,GPT-4.5不僅通過了測試,而且碾壓人類得分,以73%的被誤認為人類的比例取得了壓倒性的成功。但這僅僅是開胃菜。這些「AI巨獸」不僅在與全球數百萬人進行著無休止的對話,與此同時正在國際數學奧林匹克競賽中摘金奪銀,與數學天才攜手證明定理,構思出能在實驗室裡得到驗證的科學假說,輕鬆通過博士水平考試,為專業程式設計師編寫零錯誤程式碼,甚至創作出可與偉大詩人比肩的詩篇這些能力覆蓋數學、語言、科學、創造力等多領域,展現出「廣度+足夠深度」的通用智能,正符合人類平均水平的「一般智能」定義,而非要求完美或全能。然而,在2025年3月的一項調查中,76%的頂尖 AI 研究人員表示,當前的方法「不太可能」或「極不可能」實現通用人工智慧(AGI)。這讓人詫異:機器都能通過圖靈測試、解出奧數題了,怎麼可能還不具備通用智能?鐵證如山,AGI無需完美無瑕那麼,為何會出現集體否認?原因可能歸結為一種由定義模糊、原始恐懼和巨大商業利益交織而成的「有毒組合」。來自哲學、機器學習、語言學和認知科學領域,四位研究人員認為這種脫節在於:部分屬於概念性問題(定義模糊)部分源於情緒(對被取代的恐懼)部分出於商業因素(商業利益扭曲了評估)他們頗具爭議的結論是:按照任何合理的標準,AGI已經存在。他們說,AGI的概念被含糊不清的定義所纏繞:它是指完美無瑕的超級大腦,還是僅指像普通人一樣具備廣泛能力?劇透:答案是後者。沒有誰是全知全能的,愛因斯坦不會用中文聊天,居里夫人也不解數論難題。通用智能意味著在數學、語言、科學、創造力等多個領域具備廣度,並有足夠的深度完成任務,而非追求完美。研究團隊逐一拆解了阻礙我們認知的迷思:AGI無需完美,人類亦如此;無需無所不能,無需覆蓋所有可想像的技能;無需酷似人類,外星智能無需人類生物學基礎,何況矽基智能。AGI也不是碾壓一切領域的超級智能。沒有人能達到這個標準。你不行,愛因斯坦不行,達文西也不行,以後也沒有人能行。然而,我們卻一直要求AI必須先達到它,才肯稱之為「通用智能」。圖靈願景早已實現論文提出三個智能層次:圖靈測試水平:基礎教育、基本對話、簡單推理專家水平:國際競賽表現、博士級難題、跨領域熟練超人類水平:革命性發現、持續超越所有專家當前LLM已穩固處於水平2。證據如雪崩般堆積。還有看似一個狂野的基準:當前LLM展現出的能力廣度,已超過《2001太空漫遊》中的HAL 9000。HAL是一台具有人類個性的HAL 9000電腦。除了維護髮現號飛船上的所有系統外,HAL還能執行許多功能,如語音、語音識別、臉部辨識、唇讀、解釋情感、表達情感和下棋HAL曾是科幻小說中可怕超級AI的典型代表。2025年的真實AI,比1968年對2001年AI的想像,能力更廣。我們甚至正悄然邁向「超人類水平」的壯舉,例如做出任何人都無法單獨完成的革命性發現。好好想想吧。對AGI的質疑,就像不斷後移的球門——「它們只是尋找表」→解決了新穎問題「它們只是模式匹配」→證明了新定理「它們不會做數學」→IMO金牌「它們不理解」→協助前沿研究注意到他們的「花招」了嗎?反對的理由不斷變形,永不消失。這呼應了1843年英國數學家、史上第一位程式設計師埃達·洛夫萊斯的反對:機器「永遠只能按令行事、毫無新意」。1950年,圖靈就回應了這一點。183年後,我們仍在提出同樣的論點,只是換了詞彙。人類是更聰明的鸚鵡?駁斥AGI十大異議論文系統地回應了十大異議:LLM只是隨機鸚鵡、缺乏世界模型、僅限於文字、沒有身體、缺乏主觀能動性、沒有自我意識、學習效率低、會產生幻覺、缺乏經濟效益 、智能形態太異類。批評者高喊:「大模型不過是復讀資料的隨機鸚鵡!」但當AI能解決全新的數學問題、從新資料中推斷統計規律,或設計現實世界的實驗時,這種託詞便不攻自破。它們缺乏對世界的認知模型? 去問問那個能像預言般預測杯子掉落會碎裂的AI吧。它們僅限於文字?多模態訓練和實驗室協作證明事實並非如此。「AI沒有身體,因此不可能有智能。」物理學家斯蒂芬·霍金幾乎完全通過文字與合成語音與世界互動,但你會因此否定他的智商嗎?這一點無關緊要,智力與認知有關,與運動無關。這是一個極具破壞力的觀察:在智能上,人類很雙標。當評估人類智能時,我們並不窺探其大腦內部以「驗證理解」。我們通過行為、對話、解決問題來推斷它。我們對人類用一種基於行為的標準,對AI卻用另一種標準——基於機制的標準。「它們缺乏能動性,不會形成獨立目標。」沒錯。但智能 ≠ 自主性。能動性關乎道德責任,但並不構成智能本身。讓我們更深入探討「隨機鸚鵡論」,因為這個異議無處不在。這種主張本質上聲稱:LLM只是對訓練資料進行插值。它們無法處理真正新穎的問題。但當前的LLM能夠解決未發表的數學問題、將學習從程式碼領域遷移到非程式碼領域,甚至有人相信AI自己提出諾獎等級成果也不是妄想。讓人夜不能寐的是:無法保證人類智能本身不是一種複雜版的隨機鸚鵡。所有智能,無論天生的還是人工的,都必須從相關性資料中提取結構。問題只在於提取的深度。大家拒絕稱之為「AGI」的真正原因,或許並非技術性的,而是圖靈所說的「鴕鳥心態」:機器能思考的後果太過可怕,不如讓我們祈禱它們永遠做不到。承認機器擁有人類水平的通用智能,會迫使人類直面令人不安的真相:是什麼讓我們特殊AI取代人類崗位意識的本質在世界中人類的位置一個能通過圖靈測試、解決奧數題、協助前沿研究的實體……除了AGI,還有什麼能解釋這一切?當非人智能出現,60年前嘲諷終成往事就在五年前,我們還沒有 AGI;而今天,我們已經擁有它。更強的智能形式幾乎可以肯定即將問世。這是件令人震撼,但也令人擔憂的事。震撼在於:我們正在親歷一場也許是人類歷史上最重要的科技革命。擔憂在於:這場革命發生得太快,而且似乎還在加速。1965年,哲學家 Hubert Dreyfus 在為蘭德公司撰寫AI研究報告時,曾諷刺道:試圖建構人類級人工智慧,猶如「試圖靠爬樹登月」。連結:https://www.rand.org/pubs/papers/P3244.html幾十年來,這個比喻似乎都挺貼切。但隨著證據日積月累,我們越來越清楚地看到:我們誤判了「月亮」的性質,也低估了「樹」的高度。事實是:只要規模足夠大、訓練規則得當,基於人類語言的學習系統,真的可以在語言中挖掘出現實世界的深層結構——並以此進化出通用智能。哥白尼把人類從宇宙中心的位置拉了下來。達爾文讓人類失去了「自然界主宰」的特權。圖靈則預言,人類可能不是唯一具備智能的存在。如今,圖靈75年前設想的機器,真的來了。而它們的樣貌,既比我們預期的更「人類」,也更「怪異」。如同之前的那幾次巨變,這一次,也逼迫人類重新定義自身的位置,去接受一個事實:這個世界上存在的「智能形態」,比我們過去所能想像的要多得多。人類的地位將改變,我們對「心智」的理解也將改變。也許,問題從來不是「AI是否已達到人類水平智能?」也許,問題始終在於:「當智能不以人類的樣貌呈現時,我們能否識別它?」圖靈在1950年就知道,這才是真正的測試。不是對機器的測試。是對人類的測試。 (新智元)