#可靈
Nature重磅:圖靈預言的AGI早已實現,人類卻不敢承認!
Nature重磅評論文章!UCSD研究團隊宣稱:AGI早已到來,大語言模型如GPT已展現廣域人類級智能。人類是否已經實現了通用人工智慧(AGI),卻渾然不覺?是的,就是這樣。一篇發表在《自然》雜誌上的新評論文章如此表示。這是一項震撼科學界與社會根基的重磅披露,通用人工智慧(AGI)並非遙不可及的夢想,它已然降臨,正透過日常使用的AI工具螢幕,直視著我們。即便你不贊同他們的觀點,也值得一讀:兼聽則明,唯有瞪大雙眼,既不心懷恐懼,也不盲目追捧,才能幫助我們更好地迎接未來。這,就是AGI有人說,打造類人智能如同「爬樹登月」。但現在看來,樹已經夠高,月亮其實也沒那麼遠。加州大學聖迭戈分校(UCSD)四位專家合作了這篇文章,包括哲學家Eddy Keming Chen、AI教授Mikhail Belkin、語言學家Leon Bergen和資料科學教授David Danks。哲學副教授Eddy Keming Chen、「AI、資料科學與電腦科學」教授Mikhail Belkin、語言學與電腦科學副教授 Leon Bergen,以及「資料科學、哲學與政策」教授David Danks這篇文章不是科幻小說,不是科技巨頭的預言,給出最系統的論證:AI不只是聰明,而且已經真正「通用」。這是繼哥白尼與達爾文之後,第三次顛覆人類中心觀的認知革命。忘掉炒作與恐怖故事吧。研究團隊指出,AGI已至,證據確鑿,無可辯駁。像Grok這樣的大語言模型,絕非僅止於模仿人類,它們正以令圖靈本人都要瞠目的方式超越人類。回想一下:1950年,圖靈構思出了著名的「模仿遊戲」,即如今廣為人知的圖靈測試,用於測試機器能否騙過人類,讓人類以為它們是同類。快進到2025年3月,GPT-4.5不僅通過了測試,而且碾壓人類得分,以73%的被誤認為人類的比例取得了壓倒性的成功。但這僅僅是開胃菜。這些「AI巨獸」不僅在與全球數百萬人進行著無休止的對話,與此同時正在國際數學奧林匹克競賽中摘金奪銀,與數學天才攜手證明定理,構思出能在實驗室裡得到驗證的科學假說,輕鬆通過博士水平考試,為專業程式設計師編寫零錯誤程式碼,甚至創作出可與偉大詩人比肩的詩篇這些能力覆蓋數學、語言、科學、創造力等多領域,展現出「廣度+足夠深度」的通用智能,正符合人類平均水平的「一般智能」定義,而非要求完美或全能。然而,在2025年3月的一項調查中,76%的頂尖 AI 研究人員表示,當前的方法「不太可能」或「極不可能」實現通用人工智慧(AGI)。這讓人詫異:機器都能通過圖靈測試、解出奧數題了,怎麼可能還不具備通用智能?鐵證如山,AGI無需完美無瑕那麼,為何會出現集體否認?原因可能歸結為一種由定義模糊、原始恐懼和巨大商業利益交織而成的「有毒組合」。來自哲學、機器學習、語言學和認知科學領域,四位研究人員認為這種脫節在於:部分屬於概念性問題(定義模糊)部分源於情緒(對被取代的恐懼)部分出於商業因素(商業利益扭曲了評估)他們頗具爭議的結論是:按照任何合理的標準,AGI已經存在。他們說,AGI的概念被含糊不清的定義所纏繞:它是指完美無瑕的超級大腦,還是僅指像普通人一樣具備廣泛能力?劇透:答案是後者。沒有誰是全知全能的,愛因斯坦不會用中文聊天,居里夫人也不解數論難題。通用智能意味著在數學、語言、科學、創造力等多個領域具備廣度,並有足夠的深度完成任務,而非追求完美。研究團隊逐一拆解了阻礙我們認知的迷思:AGI無需完美,人類亦如此;無需無所不能,無需覆蓋所有可想像的技能;無需酷似人類,外星智能無需人類生物學基礎,何況矽基智能。AGI也不是碾壓一切領域的超級智能。沒有人能達到這個標準。你不行,愛因斯坦不行,達文西也不行,以後也沒有人能行。然而,我們卻一直要求AI必須先達到它,才肯稱之為「通用智能」。圖靈願景早已實現論文提出三個智能層次:圖靈測試水平:基礎教育、基本對話、簡單推理專家水平:國際競賽表現、博士級難題、跨領域熟練超人類水平:革命性發現、持續超越所有專家當前LLM已穩固處於水平2。證據如雪崩般堆積。還有看似一個狂野的基準:當前LLM展現出的能力廣度,已超過《2001太空漫遊》中的HAL 9000。HAL是一台具有人類個性的HAL 9000電腦。除了維護髮現號飛船上的所有系統外,HAL還能執行許多功能,如語音、語音識別、臉部辨識、唇讀、解釋情感、表達情感和下棋HAL曾是科幻小說中可怕超級AI的典型代表。2025年的真實AI,比1968年對2001年AI的想像,能力更廣。我們甚至正悄然邁向「超人類水平」的壯舉,例如做出任何人都無法單獨完成的革命性發現。好好想想吧。對AGI的質疑,就像不斷後移的球門——「它們只是尋找表」→解決了新穎問題「它們只是模式匹配」→證明了新定理「它們不會做數學」→IMO金牌「它們不理解」→協助前沿研究注意到他們的「花招」了嗎?反對的理由不斷變形,永不消失。這呼應了1843年英國數學家、史上第一位程式設計師埃達·洛夫萊斯的反對:機器「永遠只能按令行事、毫無新意」。1950年,圖靈就回應了這一點。183年後,我們仍在提出同樣的論點,只是換了詞彙。人類是更聰明的鸚鵡?駁斥AGI十大異議論文系統地回應了十大異議:LLM只是隨機鸚鵡、缺乏世界模型、僅限於文字、沒有身體、缺乏主觀能動性、沒有自我意識、學習效率低、會產生幻覺、缺乏經濟效益 、智能形態太異類。批評者高喊:「大模型不過是復讀資料的隨機鸚鵡!」但當AI能解決全新的數學問題、從新資料中推斷統計規律,或設計現實世界的實驗時,這種託詞便不攻自破。它們缺乏對世界的認知模型? 去問問那個能像預言般預測杯子掉落會碎裂的AI吧。它們僅限於文字?多模態訓練和實驗室協作證明事實並非如此。「AI沒有身體,因此不可能有智能。」物理學家斯蒂芬·霍金幾乎完全通過文字與合成語音與世界互動,但你會因此否定他的智商嗎?這一點無關緊要,智力與認知有關,與運動無關。這是一個極具破壞力的觀察:在智能上,人類很雙標。當評估人類智能時,我們並不窺探其大腦內部以「驗證理解」。我們通過行為、對話、解決問題來推斷它。我們對人類用一種基於行為的標準,對AI卻用另一種標準——基於機制的標準。「它們缺乏能動性,不會形成獨立目標。」沒錯。但智能 ≠ 自主性。能動性關乎道德責任,但並不構成智能本身。讓我們更深入探討「隨機鸚鵡論」,因為這個異議無處不在。這種主張本質上聲稱:LLM只是對訓練資料進行插值。它們無法處理真正新穎的問題。但當前的LLM能夠解決未發表的數學問題、將學習從程式碼領域遷移到非程式碼領域,甚至有人相信AI自己提出諾獎等級成果也不是妄想。讓人夜不能寐的是:無法保證人類智能本身不是一種複雜版的隨機鸚鵡。所有智能,無論天生的還是人工的,都必須從相關性資料中提取結構。問題只在於提取的深度。大家拒絕稱之為「AGI」的真正原因,或許並非技術性的,而是圖靈所說的「鴕鳥心態」:機器能思考的後果太過可怕,不如讓我們祈禱它們永遠做不到。承認機器擁有人類水平的通用智能,會迫使人類直面令人不安的真相:是什麼讓我們特殊AI取代人類崗位意識的本質在世界中人類的位置一個能通過圖靈測試、解決奧數題、協助前沿研究的實體……除了AGI,還有什麼能解釋這一切?當非人智能出現,60年前嘲諷終成往事就在五年前,我們還沒有 AGI;而今天,我們已經擁有它。更強的智能形式幾乎可以肯定即將問世。這是件令人震撼,但也令人擔憂的事。震撼在於:我們正在親歷一場也許是人類歷史上最重要的科技革命。擔憂在於:這場革命發生得太快,而且似乎還在加速。1965年,哲學家 Hubert Dreyfus 在為蘭德公司撰寫AI研究報告時,曾諷刺道:試圖建構人類級人工智慧,猶如「試圖靠爬樹登月」。連結:https://www.rand.org/pubs/papers/P3244.html幾十年來,這個比喻似乎都挺貼切。但隨著證據日積月累,我們越來越清楚地看到:我們誤判了「月亮」的性質,也低估了「樹」的高度。事實是:只要規模足夠大、訓練規則得當,基於人類語言的學習系統,真的可以在語言中挖掘出現實世界的深層結構——並以此進化出通用智能。哥白尼把人類從宇宙中心的位置拉了下來。達爾文讓人類失去了「自然界主宰」的特權。圖靈則預言,人類可能不是唯一具備智能的存在。如今,圖靈75年前設想的機器,真的來了。而它們的樣貌,既比我們預期的更「人類」,也更「怪異」。如同之前的那幾次巨變,這一次,也逼迫人類重新定義自身的位置,去接受一個事實:這個世界上存在的「智能形態」,比我們過去所能想像的要多得多。人類的地位將改變,我們對「心智」的理解也將改變。也許,問題從來不是「AI是否已達到人類水平智能?」也許,問題始終在於:「當智能不以人類的樣貌呈現時,我們能否識別它?」圖靈在1950年就知道,這才是真正的測試。不是對機器的測試。是對人類的測試。 (新智元)
Nature重磅:圖靈測試已死,AI已具備人類水平智能,這一天終於來了
別再爭論AI 什麼時候能趕上人類了。頂刊《Nature》剛剛發文宣佈:不用等了,就是現在。如果說 1950 年阿蘭·圖靈(Alan Turing)提出的“模仿遊戲”只是一個天才的腦洞,那麼 75 年後的今天,這個腦洞已經被矽基生物徹底填平。今天,一篇發表在《Nature》上的重磅文章引爆了科技圈。這就好比《皇帝的新衣》裡那個誠實的小孩,來自加州大學聖地亞哥分校等機構的頂級哲學家、認知科學家和電腦專家們聯名站出來,指著那個名為“通用人工智慧(AGI)”的房間大聲宣佈:“別找了,AGI 就在這兒。它已經誕生了。”01 別再自欺欺人:圖靈測試已成“過去式”還記得一年前,2025 年的3月, OpenAI 發佈 GPT-4.5的那個春天嗎?當時業界還在為參數和算力爭吵不休,但在一個最古老的測試場上,勝負已分。在嚴格的圖靈測試中,GPT-4.5 被人類受試者判定為“真人”的比例高達 73%。諷刺的是,在同一場測試中,真正的人類被判定為“人”的比例,竟然比 AI 還要低。這意味著什麼?意味著在“像人”這件事上,AI 已經比人更像人了。更別提現在的讀者們,比起人類專家寫的晦澀文章,他們甚至更愛讀大語言模型生成的文學作品。然而,奇怪的事情發生了。儘管事實擺在眼前,根據 2025 年的一項調查,仍有 76%的頂級 AI 研究人員認為 AGI 遙遙無期。《Nature》這篇文章的作者們毫不留情地指出:這種認知錯位,不是因為 AI 不夠強,而是因為人類“不敢承認”。因為恐懼被取代,因為商業利益的糾葛,我們不斷地移動球門,給 AGI 設下各種不可能完成的定義。但現在,是時候撥開迷霧,承認現實了。02 別再叫它“學舌鸚鵡”:鐵證如山的進化階梯曾幾何時,嘲笑 AI 是我們的一大樂事:“它連小學數學都算不對”、“它就是個只會機率預測的隨機鸚鵡(Stochastic Parrots)”、“它經常一本正經地胡說八道(幻覺)”。但在這個2026 年的開端,如果你還抱著這些老黃曆看 AI,那你可能已經成了那個“活在舊時代的人”。文章作者並沒有空談哲學,而是根據一系列硬核證據,建構了一個評估 AGI 的“三級階梯”。對照一下,你會發現我們正處於什麼位置:Level 1:圖靈測試級(已通關)這是幾年前的標準。能通過學校的基礎考試,能進行像樣的對話,能做簡單的推理。那時的 AI,或許還只是個“聰明的復讀機”。Level 2:專家級(Current Level,當前已達成)這就是我們現在面對的怪物。數學:它們不僅拿下了國際數學奧林匹克競賽(IMO)的金牌,還能與頂級數學家合作證明未知的定理。科研:它們生成的科學假設,已經在現實世界的實驗室裡被驗證為真。全能:它們能通過多學科的博士資格考試,能幫專業程式設計師寫出無 Bug 的複雜程式碼,能精通幾十種語言創作詩歌,還能同時和全球數億人聊天。對比:科幻電影《2001太空漫遊》裡的超級電腦 HAL 9000 曾是我們的噩夢,但現在的 LLM 在知識廣度上,實際上已經超越了 HAL 9000。Level 3:超人類級(正在逼近)這要求 AI 做出人類完全做不出的革命性科學發現。雖然 AI 還沒完全做到這一點,但作者強調:這不是 AGI 的必要條件。畢竟,能不能拿諾貝爾獎並不是衡量一個人是否“有智能”的標準。面對這些成就,那些質疑聲顯得越來越蒼白。每當 AI 攻克一個新堡壘(比如做出了從未見過的數學題),懷疑論者就會立刻把標準提高:“哦,那不算,它得能理解情感才行……”對此,文章中有一句精彩的“打臉”:“面對每一次成功都在不斷後退的假設,預測下一次一定會失敗……這根本不是有說服力的科學理論,這只是對‘永遠懷疑’的一種教條式堅持。”不管是做數學題、寫程式碼,還是理解物理世界的因果律(比如它知道枕頭掉地上不會碎,而玻璃杯會),現在的 AI 都表現出了圖靈當年所定義的“通用認知能力”。AGI 的大門已經被踢開了。無論你是否準備好,我們都已經和一種“異類智能”生活在了同一個屋簷下。03 為什麼專家還在裝睡?因為我們把 AGI 神話了既然證據確鑿,為什麼還有 76% 的專家搖頭說“不”?為什麼我們在社交媒體上還在爭論 AI 是不是“人工智障”?文章指出,問題出在我們對“智能”的定義上,我們太自戀了,也太苛刻了。誤區一:AGI = 全知全能的神很多人潛意識裡覺得,AGI 必須是一個完美的“六邊形戰士”。它得有愛因斯坦的物理頭腦,莎士比亞的文采,還得像甚至不像任何一個人類那樣犯錯。但作者反問:“居里夫人不懂數論,愛因斯坦不會說中文,難道他們就沒有通用智能嗎?”人類都不是全能的,我們憑什麼要求 AI 必須是神?真相:真正的通用智能,看的是廣度(Breadth)和深度(Depth)。只要它能像普通人類一樣在不同領域間切換,並且在這些領域達到專家水平,它就是 AGI。誤區二:AGI 必須像人一樣思考我們總覺得,只有像人類那樣有肉體、有情感、會生老病死,才叫智能。真相:這是一種“碳基生物的傲慢”。就像章魚的神經系統分佈在觸手裡,外星人可能通過無線電波交流——智能是功能,不是形態。只要它能像人一樣解決問題,它是不是矽做的、有沒有身體,根本不重要。04 精彩辯論:十大質疑,逐個擊破這篇《Nature》文章最精彩的部分,莫過於作者化身“終極辯手”,對目前市面上最流行的反 AI 觀點進行了逐一反駁。試舉幾例。質疑 A:“它只是個隨機鸚鵡(Stochastic Parrots),只會拼湊訓練資料裡的詞,根本不懂邏輯。”《Nature》反駁:這個說法在幾年前可能成立,但現在已經過時了。如果它只是拼湊舊資料,怎麼可能解出從未發表過的全新數學題?怎麼可能幫助科學家發現新的物理定律?這不叫拼湊,這叫推理。如果這也叫鸚鵡,那人類可能也不過是一隻比較複雜的鸚鵡。質疑 B:“它沒有身體,無法感知物理世界,所以沒有真正的理解。”《Nature》反駁:這是一個巨大的誤解。史蒂芬·霍金(Stephen Hawking)在晚年幾乎完全失去了身體的行動能力,通過語音合成器交流,難道他的智能就消失了嗎?再者,問問 AI:“把玻璃杯和枕頭扔到瓷磚地上,會有什麼不同?”它能精準地告訴你結果。能進行反事實推理(Counterfactual Reasoning),就證明它腦子裡已經有了物理世界的模型。質疑 C:“它沒有自主性(Agency),你不給指令它就不動。”《Nature》反駁:智能不等於意願。古希臘神話中的德爾斐神諭(Oracle),只有在你提問時才回答,但誰敢說神諭沒有智慧?自主性關乎“道德責任”,而不關乎“智力水平”。一個隨叫隨到的超級智囊,依然是超級智囊。質疑 D:“它學得太慢了,小孩看幾次就懂,AI 要喂幾兆的資料。”《Nature》反駁:別忘了,人類小孩的大腦裡預裝了祖先們進化了幾十億年的“出廠設定”(本能和大腦結構)。AI 是從零開始的。而且,一個練了 10 年才成為大師的棋手,和一個練了 1 年就成為大師的棋手,他們的棋力是一樣的。效率不代表能力。05 越早承認越好,這是一種“異類”的降臨看到這裡,你可能還是覺得那裡不對勁。“可是,它連‘Strawberry’裡有幾個‘r’有時候都會數錯啊!”沒錯,這正是文章最後強調的關鍵點:我們面對的,是一種“異類智能”(Alien Intelligence)。這就像是一個外星人降臨地球。它在某些我們覺得很難的事情上(比如讀完 1000 篇論文並寫出綜述)易如反掌,卻在某些我們覺得很簡單的事情上(比如數數、常識判斷)顯得笨手笨腳。但這不代表它不是智能,只能說明通往智能的道路不止一條。人類的智能是為了生存、為了繁衍、為了在叢林裡不被吃掉而進化出來的;而 AI 的智能是從語言的海洋中湧現出來的。2026 年的今天,正如 Reddit 網友所熱議的那樣:“我們原本以為 AGI 會像《終結者》裡的天網,結果它更像是一個有些偏科、但智商爆表的‘外星圖書管理員’。”06 結語:別再試圖爬樹登月了在文章的結尾,作者引用了一個著名的舊日比喻。1965 年,哲學家休伯特·德雷福斯曾嘲諷早期的 AI 研究,說他們試圖通過“爬樹”來“登月”。意思是方向徹底錯了,爬得再高也離月球很遠。幾十年來,我們都以為他是對的。但今天,當我們抬頭仰望,卻發現我們真的爬上了月球。原來,只要樹足夠高,資料足夠多,結構足夠精妙,簡單的學習規則真的能湧現出理解世界的智慧。這是一個哥白尼式、達爾文式的時刻。哥白尼告訴我們,地球不是宇宙的中心;達爾文告訴我們,人類不是生靈的主宰;圖靈和今天的 AI 告訴我們,人類的大腦,也不是智慧存在的唯一形式。文章末尾寫道:“承認 LLM 為 AGI 是一個警鐘。這些系統不是“將要到來”,而是“已經存在”。用評估“窄工具”的框架來衡量 AGI 是遠遠不夠的。當涉及的不再是工具而是通用智能時,共存、責任、歸屬和治理等問題將進入全新的維度。”全文的最後一句振聾發聵:“機器不是正在趕來,它們已經到了。”(The machines aren't coming; they've arrived.)與其像鴕鳥一樣把頭埋在沙子裡,假裝這一切沒發生,不如抬起頭來,正視這個新夥伴(或者對手)。畢竟,在這個星球上,我們第一次不再是孤獨的智慧生物了。 (不懂經)
大事不好!機器人學會預測未來了
不得了,機器人現在開始學會腦補未來了。這就是螞蟻靈波又又又又(連續第4天)開放原始碼的狠活兒——全球首個用於通用機器人控制的因果視訊-動作世界模型,LingBot-VA。怎麼個腦補法?簡單來說啊,以前的機器人(尤其是基於VLA的)幹活兒,主打一個條件反射:眼睛看到什麼,手立刻就動一下。這叫“觀察-反應”模式。但LingBot-VA就不一樣了,它通過自回歸視訊預測打破了這種思考方式,在動手之前,腦子裡先把未來幾秒的畫面推演出來。說實話,用想像力做決策,在機器人控制這塊還是相當新鮮的。但這不是LingBot-VA唯一的亮點,還包括:記憶不丟失:做長序列任務(比如做早餐)時,它會記得自己剛才幹了什麼,狀態感知極強。高效泛化:只要給幾十個演示樣本,它就能適應新任務;換個機器人本體,也能hold住。因此在LingBot-VA的加持下,像清洗細小的透明試管這種高精度任務,機器人已經是可以輕鬆拿捏:正如我們剛才提到的,今天是螞蟻靈波連續第四天開源。如果說前幾天的開源是給機器人加強了眼睛(LingBot-Depth)、大腦(LingBot-VLA)和世界模擬器(LingBot-World),那麼今天的LingBot-VA,就是讓這具軀殼真正擁有了靈魂——一個行動中的世界模型,讓想像真正落到執行層面。如此一來,通用機器人的天花板,算是被螞蟻靈波往上頂了一截。正如網友所述:從預測到執行;說實話這是巨大的飛躍。讓想像力先行一步LingBot-VA在架構設計上選擇了一條更進一步的路徑。在傳統的VLA(視覺-語言-動作)範式中,模型通常會將視覺理解、物理變化推理、低層動作控制這三項複雜任務放在同一個神經網路中處理,這在學術界被稱為表徵纏繞(Representation Entanglement)。為了追求更高的樣本效率和更強的泛化能力,LingBot-VA選擇把這團亂麻解開,提出了一套全新的解題思路:先想像世界,再反推動作。為了實現這個想法,螞蟻靈波團隊採用了一個兩步走的策略:視訊世界模型:先預測未來的視覺狀態(接下來會發生什麼)。逆向動力學(Inverse Dynamics):基於視覺的變化,反推出應該執行什麼動作(為了達到這個畫面,手該怎麼動)。這與傳統VLA有著本質區別:它不直接從“現在”跳到“動作”,而是要經過一下“未來”這個步驟。如何實現?螞蟻靈波團隊主要將三個架構層面作為突破口。首先就是視訊與動作的自回歸交錯序列。在LingBot-VA的模型裡,視訊Token和動作Token被放進了同一條時間序列裡。為了保證邏輯嚴密,團隊引入了因果注意力(Causal Attention)。這就像給模型定了一條死規矩:只能用過去的資訊,絕對不能偷看未來。同時,借助KV-cache技術,模型擁有了超強的長期記憶。它清楚地知道自己三步之前做了什麼,任務絕對不會失憶。其次是Mixture-of-Transformers (MoT) 的分工協作。這一步主要是為瞭解決我們前面提到的表徵纏繞的問題。我們可以把過程理解為“左右互搏”,但又很默契的一種配合:視訊流:寬而深,負責繁重的視覺推演。動作流:輕而快,負責精準的運動控制。這兩個流共享注意力機制,資訊互通,但在各自的表徵空間裡保持獨立。這樣一來,視覺的複雜性不會干擾動作的精準度,動作的簡單性也不會拉低視覺的豐富度。最後就是工程設計相關的工作。畢竟光有理論是不好使的,“實踐才是檢驗真理的唯一標準”:部分去噪(Partial Denoising):做動作預測時,其實不需要每一次都把未來畫面渲染得高畫質無碼。模型學會了從帶有噪點的中間狀態裡提取關鍵資訊,計算效率大大提升。非同步推理(Asynchronous Inference):機器人在執行當前動作的時候,模型已經在後台瘋狂計算下一步了。推理和執行平行,延遲感幾乎消失。FDM 接地(Grounding):為了防止模型想像力脫離現實,系統會用真實的觀測資料不斷校正想像,避免出現開放式的幻覺漂移。實驗結果與能力驗證在瞭解完理論之後,我們再來看實驗效果。螞蟻靈波團隊在真機實驗和模擬基準上,對LingBot-VA進行了全方位的實測。在真機測試中,LingBot-VA覆蓋了三類最具挑戰性的任務。首先是長時序任務,比如準備早餐(烤面包、倒水、擺盤)、拆快遞(拿刀、劃箱、開蓋)。這些任務步驟繁多,但凡中間有一步有誤,那可以說是滿盤皆輸。從LingBot-VA的表現來看,一個字,穩。即便是不小心失敗了,機器人也會記得進度,嘗試重來。第二類是高精度任務,比如擦試管、擰螺絲。這要求動作精度達到毫米級,得益於MoT架構,動作流不再受視覺噪聲的干擾,手極穩。剛才我們已經看了擦拭管的案例,再來看個擰螺絲的:第三類任務是針對可變形物體,例如折衣服、折褲子。這些任務的難點在於物體處於一個隨時變化的狀態,但LingBot-VA通過視訊推演,預判了布料的形變,操作行雲流水。除此之外,LingBot-VA在RoboTwin 2.0和LIBERO這兩個硬核模擬基準上,也是很能打的。尤其是在RoboTwin 2.0的雙臂協作任務中,無論是簡單的固定場景(Easy),還是複雜的隨機場景(Hard),LingBot-VA都展現出了不錯的實力:RoboTwin 2.0 (Easy):成功率92.93%,比第二名高出4.2%。RoboTwin 2.0 (Hard):成功率91.55%,比第二名高出4.6%。而且有一個趨勢非常明顯:任務越難、序列越長(Horizon變大),LingBot-VA的領先優勢就越大。在 Horizon=3 的長任務中,它的優勢甚至擴大到了9%以上。而在LIBERO基準測試中,LingBot-VA更是拿下了98.5%的平均成功率,刷新了SOTA記錄。總結一下,通過這些實驗,我們可以清晰地看到LingBot-VA的三個核心特質:長期記憶:在一個來回擦盤子的計數任務中,普通VLA模型擦著擦著就忘了擦了幾下,開始亂擦;LingBot-VA 則精準計數,擦完即停。這就是KV-cache的起到的作用。少樣本適應:面對全新的任務,只需提供50條左右的演示資料,稍微微調一下,它就能學會。這比那些動輒需要成千上萬條資料的模型,效率高了幾個數量級。泛化能力:訓練時用的是某種杯子,測試時換個形狀、換個顏色,或者把杯子隨便擺個位置,它依然能精準識別並操作。連續四天開源,已經產生影響把時間軸拉長,回看這四天的連續開源,我們會發現螞蟻靈波下了一盤大棋。因為這四個開放原始碼專案拼湊在一起,就會形成一條非常清晰的技術主線:Day 1: LingBot-Depth——解決“看清”的問題。讓感知能夠更加清晰。Day 2: LingBot-VLA——解決“連接”的問題。打通語言、視覺到動作的通用介面。Day 3: LingBot-World——解決“理解”的問題。建構可預測、可想像的世界模型。Day 4: LingBot-VA——解決“行動”的問題。把世界模型真正嵌入控制閉環,讓想像指導行動。這四塊拼圖湊在一起,釋放了一個強烈的訊號:通用機器人正在全面走向視訊時代。視訊,不再僅僅是訓練用的資料素材,它正在成為推理的媒介,成為連接感知、記憶、物理和行動的統一表徵。這對於整個行業來說,價值是巨大的。對通用機器人來說,長任務、複雜場景、非結構化環境,這些曾經的硬傷,現在有了系統性的解法。從具身智能路線來看,世界模型不再是一個可選項,它正式成為了機器人的中樞能力,從“能動”進化到“會想再動”。並且螞蟻靈波的持續不斷地開源動作,不僅僅是提供了程式碼、模型這麼簡單,更是一條可復現、可擴展的技術範式。而蝴蝶效應也在行業中開始顯現。就在這兩天,Google宣佈通過Project Genie項目讓更多人體驗Genie 3;宇樹科技宣佈開源UnifoLM-VLA-0……海外媒體也對螞蟻靈波的開源動作有了不小關注,點評道:螞蟻集團發佈了名為LingBot-World的高品質機器人AI模擬環境。這家中國金融科技公司完善了一套完整的開源工具包,用於物理AI系統的開發。這也是在全球機器人領域主導權爭奪戰中的一項戰略性舉措。嗯,螞蟻靈波的壓力是給到位了。總而言之,LingBot-VA的出現,標誌著世界模型第一次真正站上了機器人控制的主舞台。項目地址:https://technology.robbyant.com/lingbot-vaGitHub地址:https://github.com/robbyant/lingbot-va項目權重:https://huggingface.co/robbyant/lingbot-vahttps://www.modelscope.cn/collections/Robbyant/LingBot-va (量子位)
全體起立,00後大老闆來了!
2079.1億人民幣估值,年化收入破10億美元,成立僅三年的AI程式設計公司Anysphere,以驚人的成長速度被矽谷譽為“史上最快崛起的企業之一”。而這家新銳公司的CEO Michael Truell竟是一位00後,三年前他還輾轉於各大公司實習,如今已躋身億萬富翁之列,成為投資人追捧的新星。AI時代,“資本偏愛35歲以下的年輕人”,這是創投界最近流行的共識。紅杉、高瓴、藍馳等頭部機構紛紛注資00後創業者,張一鳴、劉強東、王興等大佬也密集入股00後初創公司,徐小平的真格基金更是推出“00後狠人計畫”,鎖定新生代群體。01. 潮汕天才,轟動矽谷2025年10月初,矽谷傳來一條爆炸性消息:初創公司Axiom Math完成6400萬美元(約合人民幣4.56億)首輪融資,投後估值破3億美元。但這家公司沒有產品、沒有客戶,創始人還是一位來自中國潮汕的00後女性——年僅24歲的洪樂潼。矽谷資本為何對洪樂潼慷慨押注?答案藏在她近乎“開掛”般的成長軌跡中。洪樂潼早年便顯露出超凡的數學天賦。她高中就讀於廣東名校華南師大附中,成為廣東省奧數隊四名女生之一,在“華羅庚金盃”、全國高中數學聯賽等多項頂級競賽中屢創佳績。2019年,她進入麻省理工學院,攻讀數學與物理雙學位,僅用三年就完成了所有課程,還額外修讀了20門碩博等級的高階課程。本科階段,她就已經在數論、組合數學等專業領域發表多篇高品質論文。卓越的學術能力讓洪樂潼拿獎拿到手軟:被譽為北美數學本科生最高榮譽的“摩根獎”、專門表彰全美頂尖本科女數學家的“Schafer數學卓越獎”、有“本科諾貝爾獎”之稱的牛津大學羅德獎學金(當年全球僅四名中國學生獲此殊榮)等,都被她收入囊中。憑藉羅德獎學金,洪樂潼赴牛津大學攻讀神經科學碩士,之後又進入史丹佛大學,同步攻讀數學博士與法學博士。2024年,洪樂潼做了一個決定:退學創業。這源於她在史丹佛附近的咖啡廳與Meta工程師Shubho Sengupta的一次深度交流,主題聚焦於“運用AI攻克數學難題”。此次會面後不久,她正式創立Axiom Math。彼時,ChatGPT o3被曝光在數學測試中存在“作弊”嫌疑,全球輿論嘩然。洪樂潼在社交媒體上犀利評價道:“OpenAI大模型在數學測試中表現優秀,大機率是因為訓練資料中提前洩題了。在一些測試中,大模型回答的精準率雖然高達96%,但一旦展示推理過程,得分率就降至5%。”這正是洪樂潼立志攻克的核心難題,她認為現有的訓練方法有侷限性,她想要打造一個“AI數學家”:不僅能夠將現有的數學知識全部吸收,還能夠自主推理,甚至自主提出數學猜想。數學為何如此重要,以至於要用AI去攻克數學難題?任正非曾講過一段經歷,華為有位年輕的俄羅斯員工,平日裡不善言辭,只會埋頭做數學題,一做就是十幾年。有一天,這位員工突然宣佈他突破了2G到3G的核心演算法,這一突破幫助華為在無線電領域從此領先全球,並為後續5G技術奠定基礎。攀登科技之樹的頂端,往往是憑藉基礎研究的創新,任正非曾感慨:“光靠砸錢沒用,還要‘砸’數學家、物理學家。”因此,解決複雜數學問題往往是人類創新的金鑰。洪樂潼所要建構的AI數學模型,目標就是為科學研究、晶片設計、金融建模等領域實現底層突破。這個想法吸引了多位數學與AI領域的頂尖人才加盟:曾領導Meta FAIR團隊的Shubho Sengupta、最早將Transformer應用於解決複雜數學問題的法國數學家François Charton、最早將深度學習應用於程式碼生成的AI開發者Hugh Leather......如此豪華的陣容,也是矽谷投資人敢於掏出真金白銀支援Axiom的核心原因。不僅是AI大模型,同樣處於風口的具身智能與機器人行業,也正在成為00後創業者扎堆佈局的賽道。02. 不務正業的創業者2025年7月26日,世界人工智慧大會現場,一場特殊的麻將局拉開帷幕。牌桌四方中坐著三位科技精英:被譽為“華為天才少年”的智元機器人創始人稚暉君、哥倫比亞大學博士胡宇航、靈初科技聯合創始人陳源培。他們正與第四位牌手——機器人“小靈”切磋牌技。在這場“矽基與碳基”的對決中,機器人小靈憑藉其搭載的“靈巧手”順暢自如地抓牌、碼牌、碰牌。有人開玩笑說:“以後再也不怕三缺一了”。“小靈”的締造者正是陳源培團隊,24歲的陳源培今年成功入選《福布斯》2025亞洲30歲以下青年領袖榜單,是其中最年輕的AI創業者。鮮為人知的是,這位技術天才在華南理工大學就讀期間,曾是一名頻繁翹課的“問題學生”。2022年,在參加RoboMaster機器人大賽後,原本土木專業的陳源培徹底迷上了靈巧手研究。“讓機器擁有像人一樣靈活的手,是件特別酷的事。不上課我也要自學機器人。”為此,他不惜逃課投身實驗室,醉心於研發。這段看似“不務正業”的自學經歷,讓他得以敲開北京大學人工智慧研究院的大門,師從強化學習權威楊耀東教授。在北大期間,陳源培實現了一項重大突破:全球首次在真實環境中,運用強化學習同時控制雙臂與雙手完成多技能操作。但陳源培對此並不滿足,他還要去探索最尖端的具身智能技術。2023年,他以訪問學者身份赴美,加入了著名的“AI教母”李飛飛團隊。一年後,當同齡人還在撰寫畢業論文時,陳源培收到了華為“天才少年”offer以及一份史丹佛繼續深造的邀請。然而,他卻出人意料地選擇了第三條路——創業。“發論文固然重要,但我更希望親手將技術轉化為產品。”在楊耀東教授的引薦下,陳源培結識了擁有20多年硬體經驗的王啟斌,以及機器人與無人駕駛專家柴曉傑博士,他們聯手創辦了靈初智能,被譽為“科學家密度最高的創業公司”。馬斯克曾斷言:“機器人研發真正的挑戰在於硬體設計,尤其是手和前臂的複雜工程難題。人手大約有27、28個自由度,而要讓機器人成為真正的通用機器人,必須解決‘手’的問題。”這也是靈初智能瞄準的破局點。成立後不久,公司推出了首款21自由度靈巧手,能夠穩定抓取盛滿水的紙杯,並且滴水不漏。這吸引了輝達的關注,雙方宣佈將在模擬訓練層面開展深度合作。美團也緊隨其後,邀請他們共同研發末端配送機器人“小黃蜂”。2025年年初,靈初智能完成由高瓴資本、藍馳創投領投的天使輪融資,估值破億。當前,具身智慧型手機器人賽道持續升溫。據國務院發展研究中心《中國發展報告2025》預測,中國具身智能產業規模將在2030年達到4000億元,2035年突破兆。在這條新興賽道上,除了陳源培團隊外,一批00後創業者都正嶄露頭角。25歲的清華AI碩士閔宇恆創辦零次元機器人,成立僅半年即獲‌得1億元融資‌及‌數千萬元訂單‌,團隊研發人員80%來自中國TOP2高校。還有同齡的優理奇‌創始人楊豐瑜博士,從耶魯休學回國後專注於保姆機器人研發,現已完成數億元天使輪融資‌,簽約數千萬元訂單‌‌。公司首席科學家為全球機器人專家、上海交大王賀升教授。03. 淘金熱的“賣水人”當這些00後創業者選擇深耕AI與機器人時,另一位同齡人決定另闢蹊徑——做AI淘金熱中的“賣水人”。他就是付智,共績科技的創始人。付智出生於貴州銅仁鄉村,父母都是沒有受過高等教育的普通人。童年時,他曾在貴陽花果園目睹農民工群體的艱辛,萌生了“通過創業讓世界更美好”的信念。2018年,他考入清華大學,成為村裡第一代大學生。初入清華園,付智一度變得自卑起來。“感覺身邊的每一個同學都比我優秀。”但僅僅幾年後,他便一躍成為“2024清華年度人物”以及“2025北京青年榜樣”。一切要從2022年的冬天說起。那年冬天,一個緊急的研究項目要求付智在7天時間完成40天的計算量,面對“算力不足”的困境,他東拼西湊借來8台電腦,才趕在截止日前完成任務。以此為靈感,付智乾脆開發了一個簡易的共享算力平台,發佈在B站上,幫助大家解決臨時算力不足的問題。結果沒想到網站的日註冊量達到7000-8000人,還有5名付費客戶。這次小試牛刀,讓付智關於算力共享平台的構想愈發成型。在他看來,廣大中小企業與個人開發者對AI算力存在大量彈性需求,就像遍佈大街的乘客。另一方面,中國擁有5.7億台個人電腦,其中67%的算力處於日常閒置狀態,就像空載的車輛。算力市場的現狀,恰如網約車出現之前的打車市場。付智要搭建一個穩定、低價、彈性的算力共享平台,做“算力界的滴滴”。創業伊始,他說服了兩位清華天才的加入:許鐘子珩,清華機械與電腦雙料博士,機械系十年以來年級最高分,曾用兩個晚上破解國家軍工領域某“卡脖子”技術難題;還有清華叉院博士黃力昂,亞洲超算第一名的獲得者。團隊雖然如此專業,但在項目路演時,付智收到的更多是質疑。有投資人甚至直言:“你們這個事做不成,80年代就有人嘗試了,賺不到錢。”相比網約車共享,算力共享確實存在諸多的技術難點和變現挑戰,但投資人顯然低估了這個00後團隊的執著與實力。為節約成本,付智團隊在海淀民房開始“車庫式創業”。兩年時間埋頭研發,他們完成80多個版本的產品迭代,最終實現了99.9%穩定率,且90%裝置可一鍵接入。技術問題雖然有解,但資金壓力也是這個年輕團隊不得不面對的現實。2023年夏天,付智迎來最艱難的時刻,團隊瀕臨解散。直到8月底的一天,付智在海南散步時偶然瞥見“七彩祥雲”,次日他便接到百度前總裁陸奇的電話,獲得30萬美元種子投資,一解燃眉之急。如今,AI算力需求呈現出爆發式增長的態勢,共績科技的發展也隨之打開局面,青海、河北等地方政府更是主動上門謀求合作,公司也完成了數千萬元天使融資。截止目前,共績科技接入裝置達數十萬台,這些裝置一起運行的算力相當於兩個長三角智算中心的算力之和,2025年上半年公司實現營收2000萬元。一位投資人曾對付智講:“要多看毛選裡的《論持久戰》,這裡有最頂級的戰略。”據工信部預測,2030年中國算力市場規模將超兆元,其中彈性算力佔比超千億元。對於付智來說,這場關於算力重構的戰役,才剛剛拉開序幕。而屬於00後創業者的黃金時代也才剛剛開啟。被譽為“最牛天使投資人”的龔虹嘉曾指出:“什麼時候有人敢在天使輪或種子輪投10個億,中國的創新就真正起來了。DeepSeek的梁文鋒就是一個例子。”龔虹嘉本人曾以245萬元投資海康威視,最終收穫超300億回報。在他看來,押注年輕人就是押注未來。縱觀當下00後精英創業者,他們熱衷於源頭創新,聚焦於AI、具身智能、生物科技等代表未來的前沿產業。胡潤U25榜單顯示,2024年中國25歲以下創業先鋒中,前沿科技領域佔比高達80%,且多數擁有頂尖高校或實驗室研發經歷。他們出生於國家崛起之際,擁有豐富的知識積累與廣闊的全球視野,不再是亦步亦趨的追趕者,而是從起點就瞄準全球趨勢的領跑者;他們不再像父輩甚至爺輩那樣創業更多是為了吃飯賺錢,他們一出手就站在世界級水準之上,為理想為熱愛而星辰大海。站在改革開放40多年後,民族偉大復興新時代節點上的他們,是新中國成立至今最自信、最平視世界、最有資本與底氣敢為天下先的一代。從他們開始中國創業者將真正走向:一出手就引領世界。 (EDA365電子論壇)
LeCun哈薩比斯神仙吵架,馬斯克也站隊了
吵起來了。圖靈獎得主和諾貝爾獎得主,為了“智能的本質”——直接激情友好地交流上了。AI三巨頭之一、圖靈獎得主Yann LeCun明確表示:純粹就是胡扯(complete BS)。而諾貝爾獎得主、GoogleDeepMind CEO哈薩比斯也不留情面了,指名道姓回擊:LeCun的說法簡直是大錯特錯。論戰之激烈,關注度之高,已經讓𝕏專門開闢了一個話題類股:馬斯克也跑來吃瓜了——沒有任何多餘的解釋,但這波他站哈薩比斯——“Demis is right”。當然,馬斯克的站隊可能也有別的原因。畢竟他和LeCun素來不是很對付,跟哈薩比斯則亦師亦友——馬斯克還是哈薩比斯DeepMind早期投資人。要科學吃瓜,可能還是要知道他們究竟在激辯什麼?爭論焦點:智能的本質是什麼?事情還要從LeCun幾天前接受的一場採訪說起。他在節目中言辭犀利地指出:根本不存在所謂的“通用智能”,純粹就是胡扯(complete BS)。這個概念毫無意義,因為它實際上是用來指代人類水平的智能,但人類智能其實是高度專業化的。我們在現實世界裡確實幹得不錯,比如認個路、導航blabla;也特別擅長跟人打交道,因為咱們進化了這麼多年就是幹這個的。但在國際象棋方面,我們表現很差。而且還有一堆事兒都搞不定,反倒是有些動物比我們強得多。所以說,我們其實就是“專才”。我們認為自己是“通用”的,但這僅僅是一種錯覺,因為我們能理解的所有問題都侷限於我們能想到的那些。簡單概括就是,LeCun認為人類智能並不“通用”,而是為了適應現實物理世界而專門進化出來的某種專業能力。人類之所以擅長識別物體、躲避危險、與他人合作等,也只是因為這些能力在進化中被環境塑造。然而,這一觀點很快遭到了哈薩比斯的直接回懟。哈薩比斯表示:LeCun的說法簡直是大錯特錯。他這是把“general intelligence”和“universal intelligence”兩個概念搞混了。然後他一一駁斥了LeCun的觀點,其原話如下:大腦是目前宇宙中已知最精妙、最複雜的事物,實際上具有極強的通用性。但是在實際的系統當中,“天下沒有免費的午餐”這個道理是無法迴避的——任何實際且有限的系統,在其所學目標分佈周圍,都必然存在一定程度的專門化。但從圖靈機的理論意義上講,通用性的核心在於,只要給予足夠的時間、記憶體(及資料),就能夠學習任何可計算的內容。而人腦(以及AI基礎模型)正是近似的圖靈機。並且,針對LeCun關於國際象棋棋手的評論,哈薩比斯認為人類能發明國際象棋本身就令人驚嘆,更不用說從科學到波音747等現代文明的一切了。關於LeCun對棋手的評論——人類最初竟能發明國際象棋(乃至從科學到波音747的整個現代文明!)本就令人驚嘆,更不用說還能出現像馬格努斯·卡爾森那樣棋藝卓絕的人物。他或許並非嚴格意義上的最優解(畢竟記憶有限、決策時間也受限),但考慮到我們的大腦本是為狩獵採集而進化,他和我們如今所能成就的一切,已足以展現人腦的驚人潛力。顯而易見,哈薩比斯對“智能”的理解從不侷限於電腦科學,而是深度融合了神經科學。一直以來,他認為真正衡量智能的兩個關鍵標準分別是通用性(Generality)和學習能力(Learning),為此他經常拿1997年“深藍”戰勝卡斯帕羅夫舉例——雖然“深藍”在國際象棋上很強,但還是連簡單的井字遊戲都不會玩,所以足以見得這種程序的死板之處。而關於這場對決,哈薩比斯還透露,最吸引他的不是“深藍”這個系統,而是卡斯帕羅夫的大腦(畢竟他能作為人類代表與AI進行比賽)。沒錯,又是“大腦”這個關鍵詞。哈薩比斯一直堅信,人類大腦是宇宙中已知的唯一關於“通用智能可行性”的存在性證明。當大腦和AI結合之後,所謂的“通用人工智慧”其實就是能夠展現出人類所擁有的所有認知能力的系統。至於具體如何實現AGI,哈薩比斯多年來也形成了一套自己的方法論,總結起來就是——預測建構理解,規劃擴展可能,強化學習實現自主進化。第一步:以預測為基石。在他看來,智能的本質在於預測——無論是預測下一個單詞還是預測蛋白質的折疊形狀。這是所有認知活動的基礎形式,也是AI理解世界的內在驅動力。第二步:引入搜尋與規劃AI系統首先要建立一個世界模型,然後在此基礎上進行搜尋或規劃,以在巨大的組合搜尋空間中找到最優解。第三步:最終通向深度強化學習這是哈薩比斯最推崇的終局路徑,也是對大腦運作方式的模擬——深度學習負責模式匹配和尋找結構,強化學習負責通過試錯進行規劃和達成目標。這在生物學上對應著大腦的神經通路和多巴胺獎勵系統。至此,我們看到兩位大佬關於智能本質的爭論,表面上看起來似乎確實截然不同。一個認為“通用性智能”是胡扯,本質上智能是自然世界高度專業化的產物;另一個認為通用性智能不僅存在,而且仍有巨大潛力有待挖掘。但事實,真的如此嗎?上述爭論過後,LeCun又再次出來回應了,而且這次直接點名了分歧核心——用詞。我認為分歧主要在於用詞。我反對用“通用(general)”來指代“人類水平”,因為人類是高度專門化的。不過,雖然承認用詞有分歧,但他還是繼續重申了“人類智能並不通用”的觀點。其論證如下:第一,理論完備≠實際通用。你也許不同意人類思維是專門化的,但事實確實如此。這不僅是理論能力的問題,更是實踐效率的問題。顯然,一個經過良好訓練的人腦,如果配合無限量的紙和筆,是圖靈完備的。但對於絕大多數計算問題來說,這種方式效率極低,因此在資源受限的情況下(比如下棋),它遠非最優方案。就是說,哈薩比斯所構想的“理想的圖靈機”對解決現實問題幾乎沒有意義,因為真正的智能必須在有限資源下高效運作——而人腦的進化恰恰是資源約束下高度最佳化的結果。第二,兩個典型例子可以反映大腦的“非通用性”。在理論上,一個兩層神經網路可以以任意精度逼近任何函數;但在實踐中,幾乎所有有意義的函數都需要隱藏層中包含數量巨大、難以實現的神經元。正因如此,我們才使用多層網路——這正是深度學習存在的根本原因。再換一個角度來看:視神經大約有100萬根神經纖維。為了簡化討論,我們假設訊號是二進制的,那麼一次視覺任務就可以被視為一個從100萬位元對應到1位元的布林函數。在所有可能的此類函數中,有多少是人腦可以實現的?答案是:一個無窮小的比例。通過這兩個例子,LeCun再次重申了自己的觀點:所以我們不僅談不上“通用”,而且是極其高度專業化的。可能的函數空間極其廣闊。我們之所以沒有意識到這一點,是因為其中絕大多數函數對我們來說複雜到難以想像,看起來幾乎完全是隨機的。而且他還提到了愛因斯坦曾經說過的一句話——世界上最不可思議的事情,是世界竟然是可以被理解的。在所有可能的、隨機的世界組織方式中,我們竟然能夠理解其中極小的一部分,這本身就令人驚嘆。而我們無法理解的那一部分,我們稱之為“熵”。從這個意義上說,宇宙中絕大多數的資訊都是熵——是我們孱弱的認知能力無法理解、因而只能選擇忽略的內容。總之,事情battle到最後,網友們也是紛紛回過神來了——這場爭論最大的bug可能就在用詞上了。而拋開用詞不談,本質上來看,兩個人其實更像是在談論不同的問題:一個核心在強調“我們是什麼”,另一個則在強調“我們能成為什麼” 。而這,也恰恰指向了同一個更深層、也更現實的議題——接下來,我們究竟該以怎樣的方式實現AGI?答案:世界模型不管是在LeCun還是哈薩比斯這裡,答案其實都已經很清晰了——世界模型。眾所周知,即將從Meta正式離職的LeCun,下一站就是創業世界模型。據《金融時報》爆料,其新公司名為Advanced Machine Intelligence Labs(AMI Labs),計畫於明年一月正式亮相,目標估值30億歐元(約247億人民幣)。在LeCun的理解中,世界模型所要追求的不是渲染精美的像素,而是掌握控制理論和認知科學。他認為對AI而言,只有中間那個抽象表徵才重要(和JEPA研究一脈相承),模型沒必要浪費算力去生成像素,只需專注於捕捉那些能用於AI決策的世界狀態。換言之,瞭解“世界的結構是什麼”才是最關鍵的。而哈薩比斯這邊也在採訪中多次表示,世界模型絕對是自己和Google接下來的重點。今年8月,GoogleDeepMind推出了新版世界模型Genie 3。哈薩比斯表示:我們談論的世界模型,指的是那種能夠理解世界運行機制中因果關係與協同效應的模型,也就是一種“直觀物理學”——事物如何運動、如何相互作用、如何表現。你已經可以在當前的視訊模型中看到這種能力的雛形。而檢驗是否真正具備這種理解的一種方式是否能夠建構一個逼真的世界。因為如果你能夠生成它,那麼在某種意義上,你就已經理解並內化了這個系統的運作規律。這也解釋了為什麼Genie、Veo這些模型首先會以視訊模型的形式出現。在他看來,這種可互動的世界模型正是通往AGI的關鍵一步。通過對比,我們能發現雖然二者都是在描繪“世界模型”,但他們的理解和實踐方向也明視訊記憶體在差別——LeCun代表著“世界模型即認知框架”,而Google哈薩比斯代表著“世界模型即模擬器”。嗯,同一個概念,不同的理解和實踐——怎麼不算一種call back呢?(手動狗頭)Anyway,回顧歷史,實際上AI的每一次躍遷都伴隨著這樣的“爭吵”:符號主義和連接主義的爭論,定義了智能的根基究竟是“邏輯”還是“資料”;端到端學習和模組化系統的爭論,定義了“系統該如何建構”;再加上我們今天的“開源VS閉源之爭”、“智能本質之爭”……還是那些老話,“真理不辯不明”、“真理越辯越明”。不過玩笑說說,等到真理辯明了,那個老頭可要來了……One More Thing幾乎同一時間,LSTM之父Jürgen Schmidhuber又出來隨機掉落了一個“小彩蛋”,他預判了預判——LeCun即將創業的世界模型,他們在2014年就有涉獵了(原話是二者高度相似)。怎麼說呢,Jürgen Schmidhuber老爺子這幾年,基本都在“維權”了。作為LSTM的發明者,LSTM一度在ChatGPT誕生前被稱為“最具商業價值的人工智慧成就”,而作為LSTM之父,Jürgen Schmidhuber早在三巨頭獲得圖靈獎之前就被《紐約時報》稱為“成熟人工智慧之父”。但當AI時代真正到來,各種技術發明者桂冠沒有他、圖靈獎沒有他、諾貝爾獎也沒有他……Schmidhuber只能一次次維權、隔空懟人,最後成為祥林嫂·Schmidhuber。幸好,還有推特,可以讓他首頁上清晰完整展示——以及推特當前的擁有者馬斯克,他評價Jürgen Schmidhuber時言簡意賅:一切的發明者。這,確定不是在陰陽八卦? (量子位)
這位德國華裔被《經濟周刊》評為能影響德國21世紀經濟走向的人物之一
導語: 華裔工程師陳兆芃創立的思靈機器人(Agile Robots)公司,正試圖通過研發出能夠進行精細非單調性操作的人形機器人,來幫助德國重塑其作為機械製造強國的聲譽,以應對來自中國和美國的激烈競爭。其技術聚焦於機器人“手”的靈巧性,挑戰傳統自動化極限。源自《經濟周刊》作者: Thomas Stölzel陳兆芃熱愛機器人。像許多現代人一樣,他在家裡有幾台機器人:一台用於割草,另一台清潔游泳池,還有一台負責吸塵。這位在中國出生、現居慕尼黑的工程師目前正為他的小女兒開發一隻機器狗。他對在不遠的將來首次在家中使用一台基礎的通用機器人感到樂觀。陳兆芃強調,這還不是一個真正像人的模型。但是,至少:“它將能夠承擔很多家務勞動。”不過,他目前不願透露太多細節。機器人技術已經主導了陳兆芃的職業生涯二十年。他在中國北方的哈爾濱工業大學完成學業後,曾在德國航空航天中心(DLR)進行研究,該中心是全球領先的機器人開發機構之一。隨後,他在2018年創立了思靈機器人。如今,他的公司是全球最有前途的競爭者之一,致力於將類人機器人帶入日常生活,尤其是為了取代非單調的手工勞動。這是該行業長期以來的夢想。因此,陳兆芃代表著德國為捍衛其作為機械製造強國聲譽所做的最重要嘗試之一——以應對中國和美國。就在11月,他在一群記者面前推出了“思靈一號”(Agile One),這款人形機器人將在思靈機器人自己的工廠中,與人類工人並肩協作,協助組裝機械臂和其他機器。顯而易見,人形機器人將在未來幾年徹底改變工業製造。將出現所謂的“黑燈工廠”,在那裡幾乎沒有人類工作。不少人可能會對這種設想感到毛骨悚然。然而,對於高工資國家來說,這同時也是一個機會,它們或許可以再次與印度或孟加拉國等國競爭生產基地的地位。陳兆芃表示,在勞動力短缺的地方,工廠的產能可以翻倍甚至三倍。“對於像我這樣的機器人研究人員來說,這是一個令人難以置信的激動人心的時代,”這位企業家說道。潛力是巨大的。到目前為止,工業界雖然已經成功地利用銲接機器人(例如來自 Kuka)等自動化單調性任務。但智慧型手機仍然需要手工組裝,僅僅是因為機器人太昂貴或根本沒有人類那麼靈巧。例如,到目前為止,機器人仍然無法從一箱螺絲中取出一顆螺絲,將其在指尖轉動,然後擰入螺紋中。美國投資銀行摩根士丹利(Morgan Stanley)估計,在25年內,將有一億台人形機器人在使用中,其中90%用於商業領域。這將是一個年交易額達五兆美元的市場。關鍵在於模仿人手的靈巧性。誰能做到這一點,誰就能獲勝。而這正是陳兆芃的專業領域。十年前,他在德國航空航天中心位於奧伯普法芬霍芬(Oberpfaffenhofen)的研究院,完成了關於“手”的博士學位。當時,科學家的機器手在物理上已經可以做到人類抓取器官所能做的一切。但直到今天仍然缺乏的是其背後的智能。陳兆芃說:“我們已經非常接近了。”硬體和軟體都已具備。現在它需要學習,就像一個真正的人類一樣。這需要時間。陳兆芃舉起一個瓶子,擰開螺旋蓋。“我們的機器人今天已經可以很好地做到這一點,”他表示。但他不能保證機器人每次都能成功地完成這項任務,不論何時。靈巧性是一種反射,手會察覺到瓶子是否因為太重而滑落。然後它會抓得更緊,但又不會緊到把瓶子捏碎。這是一個高度複雜的相互作用,涉及觸覺、肌肉、關節和100多根肌腱。有些肌腱會被拉緊,有些則會放鬆。中國和矽谷可能通過大量的機器人初創公司、宏大的聲明和引人注目的展示而閃耀光芒。例如,展示那些動作與人類幾乎無法區分的舞蹈人形機器人,或者掌握格鬥技巧的機器人。但就機器人技術知識而言,德國仍然在全球處於領先地位,尤其是在“手”的技術方面。這也歸功於德國幾十年來在硬體和軟體方面的持續努力。陳兆芃講述:“我在加利福尼亞州見過一些機器人公司成立後不久就倒閉了,因為它們過於專注於軟體。”在機器人開發中,軟體和硬體必須共同考慮。而正是在這個連接點上,歐洲和德國的機械製造知識具有真正的份量。機器人更像汽車而非智慧型手機,還有一個原因。智慧型手機不會啟動並傷害到人。“機器人本身必須始終絕對安全,為了我的女兒和家裡的兩隻貓的安全,”陳兆芃說。任何危及這種安全的操作都不能被允許。目前,美國人工智慧行業的一個重要承諾是,可以利用網際網路視訊來訓練機器人獲得某些能力。陳兆芃對此表示懷疑,並將這種方法比作培訓醫生。他認為,這種練習只會讓機器人像一個勤奮的醫學生一樣,頭腦裡有很多知識。但它無法達到經驗豐富的外科醫生在手術台上的水平。這需要實踐中的訓練。而這正是思靈機器人的方法。機器人的人工智慧必須由多個層面組成,才能實現真正的靈巧。網際網路上的視訊可以幫助開發各種動作,使機器人儘可能通用。但它需要模擬和真實的訓練資料才能真正學會。陳兆芃的公司正在慕尼黑的一個培訓中心進行所有這些工作。儘管擁有創新能力,但在德國科技界中,有不少人對思靈機器人仍持懷疑態度。近年來,該公司收購了幾家德國自動化專業公司。例如,收購了此前陷入困境的協作機器人製造商Franka Emika,其產品被世界各地大學和研究機構用於科研。又比如,收購了擁有50多年歷史的機器人和自動化系統整合商 Bär Automation。甚至寶馬的內部物流分拆公司Idealworks也被這家慕尼黑初創公司收入囊中。最近,思靈機器人收購了蒂森克虜伯(ThyssenKrupp)的工廠建設部門,連同650名員工。人們普遍擔憂:最終可能會重蹈庫卡或晶片製造商安世半導體的覆轍——技術訣竅流向中國,留下的只是眾多生產基地中的一個,在公司內部競爭中越來越艱難,從而逐漸失去重要性。思靈機器人營運副總裁羅裡·塞克斯頓(Rory Saxton)指出,國際投資者有興趣避免這種情況發生。除了來自日本的軟銀(Softbank)、富士康和阿布扎比皇室集團(Abu Dhabi Royal Group)之外,還包括許多中國投資公司,如高瓴資本(Hillhouse)、紅杉中國(Sequoia China)、高領創投(GL Ventures)、線性資本(Linear Capital)以及科技公司小米。陳兆芃竭盡全力消除這種疑慮。他紮根於慕尼黑,他的公司是一家巴伐利亞公司。他說:“來自東方和西方的人都想來這裡。”對於許多人才來說,現在去美國很困難。慕尼黑是一種中立場所,人們可以在這裡工作,而不必思考自己屬於世界的那一個極點。陳兆芃將思靈機器人比作富士康:他們無處不在,在中國、印度和美國都有業務。“為什麼這不能也適用於我們?”陳兆芃問道。《經濟周刊》(WirtschaftsWoche)今年再次評選出30位將影響、改變並推動德國在本世紀末向前發展的人物。因為有許多人和項目讓人充滿勇氣。所有獲獎者名單可以在這裡找到。 (德國派)
90後華人科學家:超一億美金年薪背後的權力遊戲
一紙離職信,震動矽谷AI版圖。2025年11月20日,圖靈獎得主、被譽為“AI教父”之一的楊立昆(Yann LeCun)在領英上發表告別辭,宣佈將於年底離開效力12年的Meta。這位曾一手締造FAIR(基礎人工智慧研究實驗室)輝煌的宗師級人物,在65歲之際選擇重新出發,追尋關於“世界模型”的未竟理想。楊立昆的離去,標誌著Meta AI戰略路線徹底轉向:從FAIR所代表的學院派長期理想主義,全面倒向以產品化與商業落地為導向的實用主義。這一歷史性轉身的背後,是Meta內部早已展開的權力重組。就在數月前,年僅30出頭的華人科學家趙晟佳(Shengjia Zhao)——前OpenAI核心開發者——空降Meta,引發組織震動。趙晟佳的加盟充滿戲劇性:入職不到30天便萌生去意,祖克柏親自以“首席科學家”頭銜與天價薪酬極力挽留。他的“上位史”,成為矽谷AI人才爭奪白熱化的真實縮影。當圖靈獎得主楊立昆選擇離開堅守12年的Meta,當30歲的趙晟佳以超一億美金年薪空降矽谷,這場看似簡單的新老交替背後,是一場關乎AI技術路線、企業戰略與文化認同的深層博弈。從OpenAI到Meta,從清華園到矽谷,這位年輕科學家的選擇不僅改變著個人命運,更在重塑科技巨頭間的權力天平。圖源:Shengjia Zhao 的 X清華少年到史丹佛博士的進階翻開趙晟佳的履歷,一條近乎完美的頂尖學者成長路徑徐徐展開。2012年,他考入清華大學機械工程系,後因對電腦的濃厚興趣轉至電腦系,於2016年取得學士學位。在清華的四年裡,他的視野遠不限於課堂。2014年,趙晟佳赴美國萊斯大學交換學習,這段經歷徹底打開了他的學術視野:課堂講座常延續至深夜討論,各類想法在交流中不斷被檢驗、挑戰與完善。更重要的是,他在跨文化、跨學科的協作中,學會了以多元視角理解和推進科研。本科畢業後,他將目光投向了矽谷。2016年,趙晟佳進入史丹佛大學攻讀電腦科學博士,師從Stefano Ermon教授。在六年的博士生涯中,他全心投入深度生成模型、變分推斷等前沿方向。其代表作《InfoVAE: Balancing Learning and Inference in Variational Autoencoders》於2019年發表在AAAI,至今引用量已超23000次,成為該領域的里程碑論文。博士期間,他幾乎囊括了各類頂尖獎項:ICLR 2022傑出論文獎、Google卓越獎學金、高通創新獎(QinF)、摩根大通博士獎學金等。(趙晟佳的教育經歷)然而,真正讓他在全球AI領域聲名鵲起的,是在OpenAI的三年。2022年6月博士畢業後,趙晟佳作為技術團隊成員加入OpenAI。當時ChatGPT尚未面世。他不僅是ChatGPT、GPT-4、GPT-4.1的早期核心開發者,更是OpenAI推理模型體系的關鍵奠基者——主導了“o1”與後續“o3”系列的研究。“o1”在AI業界的影響堪稱技術核爆。它將思維鏈從理論概念轉化為可規模化部署的產品,使AI從機率性的語言續寫工具,躍升為具備類人邏輯推理能力的系統。這一突破迅速引發Google、DeepSeek、xAI等全球頂尖實驗室的跟進。與此同時,他還領導OpenAI的合成資料團隊,在行業深陷高品質資料匱乏的困境中,建構了一套可複製、可擴展的資料生成範式。可以說,在Meta向他伸出橄欖枝之前,趙晟佳已是當代生成式AI技術範式的重要建構者之一。他掌握了業內競相追逐的“新型擴展範式”——對於急於在AGI賽道實現反超的祖克柏而言,他無疑是必須爭取的關鍵人才。三十天離職危機今年夏天,Meta陷入了前所未有的焦慮與混亂。公司寄予厚望的Llama 4模型發佈後表現平平,更因"性能評測造假"爭議而聲譽受損。面對OpenAI和Google的持續領跑,以及中國AI實驗室在開源領域的快速追趕,祖克柏決定放手一搏。他斥資143億美元收購資料標註巨頭Scale AI,並任命其28歲的創始人Alexandr Wang為Meta首席人工智慧官。隨後,旨在整合公司所有AI資源的"Meta超級智能實驗室"(MSL)正式成立,標誌著Meta向AGI發起了全面衝刺。為了給MSL配備頂尖人才,Meta開啟了一場瘋狂的挖角行動。祖克柏不僅親自向目標研究人員傳送邀請郵件,還安排他們在其太浩湖莊園進行面談。Meta開出了高達九位美元的薪酬方案,其中部分offer的有效期僅有幾天。正是在這樣的背景下,趙晟佳被Meta從OpenAI成功挖來。更引人注目的是,圍繞著他迅速集結了一支實力雄厚的華人科學家團隊:團隊成員包括前OpenAI多模態後訓練研究負責人畢樹超、前OpenAI感知技術研究負責人及Gemini多模態部門聯合創始人余家輝、OpenAI o3-mini和o1-mini的核心開發者任泓宇、前OpenAI電腦視覺專家常慧雯,以及前Google DeepMind高級研究科學家翟曉華。祖克柏為這支夢之隊承諾了頂級資源支援。據悉,趙晟佳和MSL團隊將能夠使用計畫於2026年建成的"普羅米修斯"計算叢集,該叢集擁有高達1000兆瓦的電力供應,足以支撐前所未有的超大規模AI訓練。然而,這段"聯姻"在開始後不久就面臨危機。據多家媒體報導,趙晟佳加入Meta僅數日,就遭遇了嚴重的管理混亂和文化衝突。MSL內部資源分配不公、官僚作風盛行,承諾的算力資源遲遲未能兌現,這讓習慣OpenAI高效科研環境的趙晟佳深感不適。知情人士透露,趙晟佳當時已決定離開,甚至與老東家OpenAI達成了回歸協議,並簽署了入職檔案。這一消息對祖克柏而言無異於當頭一棒。若這位重金聘請的頂尖人才在入職不到一個月就重返競爭對手,不僅將使Meta顏面盡失,更將對其重振AI雄心的計畫造成致命打擊。為留住趙晟佳,祖克柏展現了驚人的決斷力。他直接介入,打破常規,授予趙晟佳"Meta超級智能實驗室首席科學家"頭銜,並正式確立其領導地位,要求其直接向自己和Alexandr Wang匯報。祖克柏更在Threads上高調宣佈這一任命,特別強調趙晟佳是實驗室的聯合創始人,"從第一天起就是我們的首席科學家"。這不僅是一次薪酬留人,更是一次地位與權力的鄭重承諾。最終,趙晟佳選擇留下,成為Meta AI版圖中僅次於祖克柏和Alexandr Wang的第三號關鍵人物。權力更迭暗戰趙晟佳最終選擇留下,但Meta的內部動盪遠未平息。事實上,MSL的成立與趙晟佳的迅速上位,恰恰催化了Meta新舊勢力更替下的深層矛盾。儘管趙晟佳被成功挽留,同期加入的其他頂尖人才卻未能適應。據外媒報導,與趙晟佳同期加盟的兩位前OpenAI研究員——Ethan Knight與Avi Verma,在入職不到一個月內相繼離職,重返OpenAI。來自GoogleDeepMind的研究科學家Rishabh Agarwal也在短短數月後選擇離開。對這些頂尖研究者而言,Meta雖能提供豐厚的薪酬,卻難以復現他們理想的科研環境。一位離職員工坦言:“人才終將流向能產生共鳴的地方。缺乏內在凝聚力的體系,終會從內部瓦解。”與此同時,管理層的“低齡化”與信任危機逐漸浮現。統管Meta AI全域的Alexandr Wang年僅28歲,此前並無人工智慧領域的研究經驗,其背景主要來自營運資料標註公司Scale AI。這種“外行領導內行”的局面,在內部引發了諸多資深科學家的困惑與不滿。有內部人士透露,Alexandr Wang所帶來的Scale AI高管團隊與Meta原有體系格格不入,管理方式簡單直接,甚至導致Meta與Scale AI在資料合作層面出現裂痕。更深遠的影響體現在FAIR實驗室的邊緣化。在MSL成立前,由楊立昆一手打造的FAIR實驗室一直是Meta AI的金字招牌。然而在新架構下,FAIR被整體併入MSL體系。儘管楊立昆名義上仍保留FAIR首席科學家頭銜,但在匯報關係上,這點陣圖靈獎得主需要向28歲的Alexandr Wang匯報。儘管祖克柏與楊立昆本人均公開否認角色變化,但在外界看來,隨著公司資源全面向以產品化為導向的MSL傾斜,堅持“世界模型”長線研究的FAIR團隊,實際上已失去對Meta核心AI戰略的主導權。Llama 4的失利成為壓垮駱駝的最後一根稻草,也成為楊立昆選擇體面離開的導火索。儘管雙方在分手聲明中保持了極大的克制,甚至達成了投資合作的“第三條道路”,但楊立昆的離去,無疑標誌著Meta AI那個充滿理想主義的學術時代正式落幕。面對重重挑戰,Meta正嘗試踩下剎車。據《金融時報》獲得的內部備忘錄顯示,Meta已暫停MSL除關鍵崗位外的所有招聘,以期在制定新戰略的同時更審慎地規劃未來。而這一切的挑戰,恰恰發生在個人能力與時代機遇碰撞的關鍵節點。對趙晟佳而言,出任首席科學家僅僅是開端。他不僅需要帶領團隊在技術上追趕GPT-4、打造更強大的Llama 5,更要在Meta複雜的官僚體系與文化衝突的夾縫中,為祖克柏找到通往AGI的可行路徑。而這場權力更迭的意義,早已超越了趙晟佳個體職業生涯的起落。它對應出整個AI產業在理想與現實間的艱難平衡,也預示著科技巨頭在AGI征程上更加激進的投資邏輯。這位90後華人科學家必須證明:超一億美金的薪酬背後,是與之匹配的遠見與實力。在趙晟佳按下"普羅米修斯"叢集啟動鍵的那一刻,一場新的AI競賽已經悄然開始。 (首席商業評論)