#陶哲軒
《大西洋月刊》丨陶哲軒:數學的邊界
The Edge of Mathematics傳奇數學家陶哲軒闡釋生成式人工智慧的前景。作者:馬特奧·王 (Matteo Wong)插圖:《大西洋月刊》繪製。圖片來源:Kimberly White / Getty Images2026年2月24日在過去的幾個月裡,幾位研究人員開始提出一個相同的挑釁性主張:他們利用生成式人工智慧工具解決了一個此前未解的數學難題。那些最極端的承諾——即人工智慧輔助解決數學界一些最棘手的問題——很可能最終被證明是空洞的炒作。但是,許多由人工智慧撰寫的解答(儘管針對的是遠沒那麼受讚譽的問題)已經通過了驗證。這些答案針對的是“埃爾德什問題”(Erdős Problems)中的一部分——這是由匈牙利數學家保羅·埃爾德什(Paul Erdős)提出的1000多個數學問題——是利用包括ChatGPT在內的生成式人工智慧模型寫成的。OpenAI迅速宣佈了一場勝利:“GPT-5.2 Pro解決了另一個開放的埃爾德什問題,”OpenAI總裁格雷格·布羅克曼(Greg Brockman)於一月份在X平台上發帖稱,“這將是數學和科學進步狂野的一年!”圍繞這一新聞的大部分興奮之情,源於這些人工智慧所寫證明的裁決者:陶哲軒。他是加州大學洛杉磯分校(UCLA)的教授,被廣泛認為是當今世界上最偉大的在世數學家。他的認可似乎賦予了生成式人工智慧最大的承諾以合法性——即推動人類知識和文明的邊界。當我本月早些時候致電陶哲軒,詢問他對人工智慧能為數學帶來什麼的看法時,他的態度更為溫和。他告訴我,人工智慧生成的埃爾德什問題解答令人印象深刻,但並非壓倒性的:陶哲軒表示,這些機器人實際上只是取得了一些“廉價的勝利”。陶哲軒長期以來對人工智慧工具能為他的領域做些什麼感到好奇,但也持保留態度。我們在2024年秋季第一次交談時,陶哲軒將聊天機器人比作“平庸但並非完全無能”的研究生。大約六個月後,他告訴我,這些模型在“某些類型的高層數學推理”方面有所進步,但缺乏創造力且會犯細微的錯誤。但在我們最近的談話中,他的態度更加樂觀。人工智慧或許尚未處於解決世界上所有偉大數學問題的邊緣,但聊天機器人已經達到了可以與人類數學家協作的水平。他說,在這個過程中,這項技術正在開闢一種不同的“做數學的方式”。本次對話經過編輯,以求簡練清晰。馬特奧·王: 最近,關於ChatGPT解決某些埃爾德什問題的能力引起了極大轟動。在過去一年左右的時間裡,您看到生成式人工智慧的數學能力是如何演變的?陶哲軒: 有一大群人非常、非常希望看到人工智慧的成功故事。與此同時,也有另一群截然相反的人想要抹殺所有人工智慧的進展。而事實介於兩者之間,是一個非常複雜且微妙的故事。特別是在這些埃爾德什問題中,有一小部分是我們要真正解決的高知名度問題,然後還有長長的尾部,由非常冷僻的問題組成。人工智慧非常擅長系統地探索這個長尾部分,並攻克其中最簡單的問題。但這與人類的風格截然不同。人類不會系統地瀏覽所有1000個問題並挑選出最簡單的12個來研究,而這正是人工智慧正在做的事情。這些問題之間確實存在著巨大的難度差異。看看迄今為止人工智慧獨立解決的問題,你會發現:哦,好吧,它們使用的是一種標準技術。如果一位專家花半天時間研究此事,也能解決出來。當然也有更複雜的、由人工智慧輔助的解決方案。我認為在短期內,我們將通過純人工智慧方法在簡單問題上獲得許多快速勝利。而在接下來的幾個月裡,我認為我們將看到各種形式的人機混合貢獻。我也從出現的一些證明中學習。我喜歡閱讀它們——也許它使用了某篇1960年論文中的技巧,而我之前並不知曉。所以它可能不是超級、超級有創造力,但它是新的,並且能做到那些審視該問題的人類專家所忽略的事情。王: 您曾寫道,當人類數學家面對一個新問題時,無論成功與否,他們都會產生見解供該領域的其他人建構基礎——這是基於人工智慧的證明所無法提供的。為什麼會這樣?陶哲軒: 這些問題就像是你需要徒步前往的遙遠地點。在過去,你必須踏上一段旅程。你可以放下路標供他人跟隨,也可以繪製地圖。人工智慧工具就像是用直升機把你直接空降到目的地。你錯過了旅程本身的所有益處。你直接到達了終點,而這實際上只是解決這些問題價值的一部分。王: 當您思考當今這些模型的能力時,除了讓非數學家能夠處理更高級的問題外,它們還能為您的領域做出什麼貢獻?陶哲軒: 如今有很多非常乏味的數學工作是我們不喜歡做的,所以我們尋找巧妙的方法來繞過它們。但人工智慧會很樂意猛衝通過這些繁瑣的計算。當我們把人工智慧整合到人類的工作流程中時,我們就可以滑過這些障礙。我還認為數學家將開始在更大的規模上進行數學研究。想想科學研究中個案研究與人口調查之間的區別。如果你要在18世紀研究一種疾病,如果這是一種罕見病,你可能會研究一位患有此病的病人,記錄其所有症狀並做詳盡的筆記。但在21世紀,你可以進行臨床試驗,給1000人用藥,進行統計分析,從而獲得關於藥物效率更精確的資訊。數學仍然很大程度上處於個案研究的水平。一篇論文會選取一兩個問題,以一種非常手工打造、高強度的方式對其進行透徹研究。這是我們的風格。但人工智慧工具實現的是“群體研究”。王: 您對人工智慧模型在數學能力方面取得的進步感到驚訝嗎?陶哲軒: 有一點驚訝。發生的很多事情是我預料到的,但它們比我預期的時間表稍微提前了一點。並沒有提前太多。例如,在2023年,我為微軟寫了一篇文章,預測到2026年,人工智慧將成為值得信賴的合著者——即其對技術論文的貢獻將達到合著者的水平。那篇文章反響不一:有人說我太過雄心勃勃,也有人說我太過悲觀。但我認為這基本上幾乎完全符合時間表。我們基本上看到人工智慧的使用水平達到了我預期初級人類合著者所能做出的貢獻,尤其是那些非常樂意做苦差事並解決大量繁瑣案例的合著者。王: 在未來一兩年內,您希望或期待生成式人工智慧模型有那些改進?陶哲軒: 我們需要找到一個中間地帶,既鼓勵負責任地使用人工智慧,又阻止不負責任的使用。這是一條需要小心行走的界線。但我們以前做到過。數學家經常使用電腦進行數值工作,當電腦輔助證明首次出現時,最初遭到了很多反對,因為人們質疑如何信任電腦程式碼?但我們在20或30年裡解決了這個問題。不幸的是,現在的時間表被大大壓縮了。所以我們必須在幾年內製訂出我們的標準。而我們的社區通常不會移動得那麼快。有一件非常基本的事情可以幫助數學社區:當人工智慧給你一個問題的答案時,通常它不會很好地表明它對這個答案有多大的把握,或者它總是會說:“我完全確定這是真的。”人類也會這樣做。無論他們對某事是否有信心,這都是非常重要的資訊。暫時提出一些你不確定的事情是可以的,但重要的是要標記出你對此不確定。然而,人工智慧工具並不能精準地評估它們自己的置信度。這降低了它們的有用性。我們會更欣賞誠實的人工智慧。此外,許多人工智慧公司痴迷於“一鍵式”、完全自主的工作流程:你把任務交給人工智慧,然後你去喝杯咖啡,回來時問題就解決了。這實際上並不理想。對於困難的問題,你真正想要的是人類與人工智慧之間的對話。而人工智慧公司並沒有真正促進這種互動。如果我們能與至少一些願意開發更多互動平台的技術公司合作,那將會更容易被人們所接受。我們不想淪為只是按按鈕的角色。 (邸報)
陶哲軒潑冷水:我不相信AGI!但又一數學難題被GPT-5.2 Pro攻克
就在剛剛,陶哲軒po文揭秘:當前的AI無法實現真正的AGI,不過,他們倒是擁有一些有用的小聰明,或者可以說「通用狡猾」。而就在同時,又一多年數學難題被GPT-5.2 Pro攻克了。就在今天,即將離職Meta的LeCun再次給當前AI判死刑——這條路行不通,而且永遠不會成功。前不久,GoogleDeepMind首席科學家Shane Legg給出預測:最小AGI有50%的可能性在2028年實現。業界都在討論的AGI之爭,陶哲軒是如何看待的?就在剛剛,陶哲軒po文明確了自己的態度——還不行。他認為,目前還無法實現AGI。我懷疑目前工具還無法實現真正意義上的「人工通用智能」。然而,我認為一種較弱但仍然非常有價值的「人工通用才智」,正在以各種方式成為現實。而他的觀點,立馬在網上引起了廣泛討論。網友們表示,陶哲軒這樣聰明的人,都認為AGI並未實現,這樣太令人絕望了——希望他是錯的吧。陶哲軒:不是AGI,只是魔術師什麼叫通用才智?陶哲軒是這樣解釋的。「通用才智」是指通過某種臨時手段解決廣泛複雜問題的能力。這些手段可能是隨機的,也可能是暴力計算的成果;它們可能缺乏根基或容易出錯;它們可能難以解釋,也可能能追溯到AI訓練資料中類似的技巧。因此,它們不能被視為任何真正「智能」的結果。然而,它們在實現日益廣泛的任務時,可以擁有非同尋常的成功率,尤其是在結合嚴格的驗證程序以過濾掉錯誤或不具前景的方法時,其規模已超出了單個人類所能達到的範圍。可以理解為,這是一種「通用狡猾」AI。而這種「通用狡猾」AI,就會讓人感覺非常匪夷所思。比如在有時候,這些技術非常實用,令人印象深刻,然而從根本上說,它卻令人不滿和失望。AI是「最強大腦」魔術師?想像這樣一個場景:一位魔術師上台,憑空變出鴿子、猜中你選的牌、把水杯變成金魚。全場掌聲雷動,觀眾目瞪口呆。結果他平靜自曝:「其實我袖子藏了十八個機關,桌下有暗格,牌是特製的,金魚是提前藏好的。」掌聲戛然而止。如今的AI,就像這位魔術師一樣。它能寫詩、程式設計、解數學題——但如果你問它:「你是怎麼想到這個答案的?」它可能會誠實坦白:「我在訓練資料裡見過類似題目,機率上這個回答匹配度最高。」所以,這其實不是智能,而是基於海量資料的「聰明把戲」。「通用狡猾AI」,反而起了大作用對於這種「通用狡猾AI」,陶哲軒是怎麼解釋的。雖然聰明才智和智力在人類身上是某種程度上相關的特質,但對於AI工具(這些工具通常被最佳化以追求聰明才智)來說,它們卻更加解耦,將當前一代這樣的工具主要視為一個隨機生成有時聰明,且往往有用的思想和輸出的生成器,在嘗試使用它們解決難題時,可能是一種更具生產性的視角。也就是說,智能≠聰明。對人來說,二者是同時存在的;但對於AI而言,所謂的「聰明」,也就是快速解決複雜問題,可以獨立存在。當前AI的「聰明」,是隨機的,暴力的,可錯的,難解釋的。最終,它並不是靠智慧取勝,而是靠「大規模試錯與匹配」,就像用超級望遠鏡,在答案星海裡撈最亮的幾顆。當今的AI,並不是全知全能,然而這個「不夠智能但足夠聰明」的工具,卻已經悄悄改變知識工作的每一個環節。對於陶哲軒的說法,網友們表示的確如此。對於目前的AI來說,看似便利但難以預測的思想,似乎是一種主要應用場景。可以說,陶哲軒所說的,就是目前AI能力「參差不齊的邊界」。甚至評論區還出現了中文留言,認為目前的AI底層架構就決定了,即使投入無限多的算力,產出的東西也依然有邊際。而在Reddit的帖子中,網友們也對此展開熱議。有人對表示,自己非常尊重陶哲軒,但對他的部分觀點表示反駁。有人說,他用「狡猾」或「巧妙」一詞,來針對現代LLM缺乏系統性思維的缺點。目前,他或許是對的。不過,ChatGPT還只有3歲,如果要宣佈所有LLM都有此侷限,至少還應該再等待十年。又一數學難題被AI破解巧的是,就在陶哲軒發出這個論點不久,又有一道數學難題被AI破解了!滑鐵盧大學電腦系的助理教授Kimon Fountoulakis激動發帖稱,GPT-5.2剛剛解決了COLT 2022開放問題——使用標準加速梯度演算法和互補性邊界假設,證明加速L1正則化PageRank的執行階段間複雜度。其中,所有證明都由GPT-5.2 Pro生成。演算法總工作量的關鍵界限,則是使用 GPT-5.2 Pro、Aristotle和Antigravity上的Gemini 3 Pro (High) 組合完成了自動的形式化。多倫多大學的教授Daniel Litt也出來表示,GPT-5.2 Pro的確很強,它對於自己的代數幾何和數論研究,都產生了巨大飛躍。懸賞8年難題,GPT-5.2用數學證明封神這道難題,已經困擾了教授8年。自2024年以來,每次OpenAI或Google發佈一個新模型,他都會拿過來嘗試一下。令人沒想到的是,這一次,GPT-5.2竟然成功了!教授這樣回憶道:這個開放性問題,我們嘗試了三年,失敗了;找博士生做,也失敗了;問了多位頂尖學者,都說太難了。2022年,這道關於「加速L1正則化PageRank演算法時間複雜度」的難題,被正式列為COLT國際頂級會議的開放問題之一,懸賞求解。誰也沒想到,兩年後,這道難倒無數學者的題目,竟被GPT-5.2悄然攻克。懸賞故事要從2016年說起。當時,教授在最佳化PageRank演算法時發現,經典迭代軟閾值演算法在求解帶L1正則的PageRank問題時,其執行階段間竟然只與最終解的非零節點數有關,出奇地高一個很自然的追問隨之而來:如果用上加速演算法,比如在最佳化領域聲名顯赫的FISTA,會不會更快?理論上應該如此。但現實卻潑了一盆冷水:FISTA在迭代過程中會「啟動」大量本應為零的節點,雖然最終能收斂到正確的稀疏解,但中間過程卻很鋪張浪費。開始,教授嘗試了三個月,想從理論上界定FISTA的總計算量,失敗了。後來斷斷續續又試了幾次,直到2021年,無論是教授最傑出的學生,還是幾位大牛研究者,都對這個問題束手無策。團隊決定,將這個難題公之於眾。2022年,它被正式列為COLT的開放問題,向全球機器學習社區發起挑戰。破局第一個成功的解法,出現在2023年。David Martínez-Rubio等人提出了一種新穎的加速演算法,從完全不同的角度給出解答。然而,這個演算法為了達到加速效果,需要在每一步求解一個昂貴的子問題,在實際應用中效率很低。直到GPT-5.2發佈後,真正的轉折點來了。這一次,GPT-5.2給出了完整的證明。而且令人震驚的是,它給出的恰恰是針對經典FISTA演算法的證明。它揭示了在一種被稱為「互補性邊界」的合理假設下,FISTA的總計算量可以被優雅地界定,並且在特定的圖結構上,能展現出明確優於經典演算法的加速效果。更關鍵的是,這個證明解釋了長期困擾學界的現象:儘管FISTA在迭代中會啟動更多節點,但這些「多餘啟動」是可控的、暫時的。一旦迭代進入最優解的一個鄰域,演算法就會迅速收斂。怎麼證明?三重驗證GPT-5.2的證明能令人信服嗎?為此,團隊搭建了一個三重驗證體系。首先,GPT-5.2 Pro生成了完整的證明初稿。接著,團隊借助@HarmonicMath的Aristotle系統,結合Gemini 3 Pro模型,將證明中的關鍵不等式和複雜度上界,逐行轉化成了形式化的Lean程式碼。而且除了形式化驗證之外,教授自己也把證明從頭到尾證明了兩遍。目前看來,證明是沒問題的。陶哲軒會被說服嗎又一數學難題被GPT-5.2 Pro攻克,這不由得引起網友討論——它會成為AGI嗎?陶哲軒會看到希望嗎?至少,目前GPT-5.2再一次證明了LLM在深度數學推理上的驚人潛力。而且,它也彌合了理論分析與實際演算法之間的鴻溝。它的證明,為最經典的加速演算法提供了缺失的理論基石。當然,這並不意味著AI能取代理論科學家。可以說,它更像是一個擁有驚人直覺和不知疲倦的協作者。人類提出關鍵問題、界定框架、判斷價值,AI則能在龐大的數學空間裡,幫我們找到那條通往答案的隱秘小徑。 (新智元)
華裔數學天才陶哲軒經費被砍,被迫四處籌款,美國高校迎來艱難時刻
2025年8月的一個深夜,數學圈被一條推文刷屏:“IPAM帳戶只剩不到90天工資,我不得不開始緊急籌款。如果9月還看不到NSF撥款,我們將取消秋季學期所有項目。”發推的人叫陶哲軒——曾經以13歲獲得國際數學奧林匹克競賽金牌、24歲成為加州大學洛杉磯分校正教授、31歲斬獲數學界最高榮譽菲爾茲獎的天才數學家。評論區瞬間翻車:“連陶哲軒都缺錢?美國科研是真完了。”“當年他拿獎時,政府哭著求他留下,現在說斷供就斷供?”“這不是個人悲劇,是系統地震。”當一個世界級的數學天才都無法獲得基本的研究經費保障時,我們不得不思考:這究竟是一個個案,還是美國科研體系深層次問題的集中體現?2025年7月31日,對於陶哲軒而言是一個分水嶺式的日子。當天,川普政府以加州大學洛杉磯分校(UCLA)“未能有效遏制校園反猶主義”為由,凍結了該校約5.84億美元的聯邦研究資金。這筆錢的量級是什麼概念?它相當於美國國家科學基金會(NSF)一年撥給整個加州大學系統的數學+物理+化學總預算。純數學與應用數學研究所(IPAM)不幸躺槍——100%經費來自NSF,其研究經費也隨之被切斷。而陶哲軒,正是IPAM的特別項目主任。圖源:網路IPAM是美國僅有的5家NSF數學研究所之一,專攻跨界,曾把純數學帶進深度學習、密碼貨幣、癌症影像。過去20年,從這裡走出的學者拿下3枚菲爾茲獎、2座沃爾夫獎,堪稱“數學諾獎搖籃”。IPAM不是“邊角料”,而是美國數學的“呼吸機”。拔掉呼吸機,整條學科鏈都得休克。圖源:網路儘管美國法院在8月12日下令恢復UCLA的國家科學基金會(NSF)撥款,但截至9月初,陶哲軒個人的研究資金以及IPAM的營運資金仍然無法發放。陶哲軒透露,自己的NSF項目(總額75萬美元,用於研究孿生素數猜想)仍被凍結。更糟糕的是,由於該研究所幾乎完全依賴NSF的資助,此前的營運資金已經耗盡,面臨被迫關閉的危機。“IPAM沒有足夠的儲備金來維持幾個月以上的營運。在過去兩周左右的時間裡,我們一直處於緊急籌款模式,我一直在與很多捐贈者會面。”陶哲軒在接受《華盛頓郵報》採訪時無奈地表示。這位曾經專注於探索人工智慧在數學應用的世界級學者,如今被迫將主要精力轉向了籌款活動。川普政府上台以來,一直推行大幅削減聯邦開支的政策,科研經費成為重點削減對象之一。據PBS報導,國家科學基金會被迫暫停了高達10億美元的資助項目。IPAM的現金流告急只是浮出水面的冰山一角。同一紙範本信(4月22日NSF《重新對齊通知》)共凍結800余個項目,其中包括:40個癌症臨床試驗被迫暫停招募;6顆已進入總裝測試的氣候衛星無限期推遲發射;3條剛剛通線的新一代量子晶片中試產線直接關閉。圖源:網路美國科學促進會(AAAS)發表白皮書,用一句罕見的嚴厲措辭警告:“政治化凍結正把國家科研拖入‘人為冬天’。”更令人擔憂的是,政治因素對科研經費分配的影響日益明顯。政府以大學校園存在“反猶太主義和偏見”問題為由切斷經費,這種做法本身就充滿了爭議。它不僅違背了學術獨立的基本原則,更開創了一個危險的先例:科研經費可以成為政治鬥爭的工具和籌碼。陶哲軒在公開發聲中直言不諱地指出,聯邦科研資金的動盪、延遲與不確定性,正危及美國獨特的科學生態系統。他認為,政府不加區分的科研經費削減行動,對他的研究領域乃至更廣泛的學術科學構成了生存威脅。陶哲軒事件的影響遠遠超出了一個數學家的個人遭遇,它正在引發美國科研界的人才流失潮。在接受PBS採訪時,陶哲軒透露自己已經被歐洲、澳大利亞和中國的多個院系接觸,考慮離開美國的可能性。"我第一次真正開始擔心存在性問題。比如,院系可能會關閉,或者大幅削減研究部分。"陶哲軒的這番話反映了許多美國科研人員的共同擔憂。圖源:網路曾經,美國實驗室的燈亮到最晚,世界各地的聰明人便循著光而來:經費充裕,話題自由,沒人計較口音和護照。如今紅燈開始閃了——機器還在轉,帳上的錢卻說不準那天斷。青年學者們發現:“今天可以斷IPAM,明天就能斷我的實驗室。”於是,跳槽、轉行、出海,產生多米諾骨牌效應。其他國家趁勢打開國門,用更快的簽證、更厚的啟動包、更穩的經費周期,計畫把美國多年攢下的頂尖人才接走。哈佛數學系悄悄推出“北美—亞洲雙聘”席位,一年只需在美待四個月,其餘時間飛東京或香港;新加坡國立大學把“IPAM避難包”直接塞到博士後手裡——三年工資加啟動經費,拎包即走;更有中國新銳研究所在朋友圈放話:“菲爾茲獎等級,落地獨立實驗室加一千萬元,孩子上學包辦。”一夜之間,簡歷像候鳥一樣向南飛,連行李箱都來不及裝滿。人才流失不再是無聲的數字,而是登機口排起的長隊和Zoom裡越來越多的海外IP。對於陶哲軒個人而言,這次事件無疑是一次嚴峻的考驗。作為已經在美國工作和生活了30年的科學家,他與這個國家已經產生了深厚的連結。他在採訪中表示,美國的科學傳統和開放的學術環境對他產生了深遠的影響。然而,當理想遭遇現實,當學術追求受到基本生存條件的制約時,個人不得不做出艱難的選擇。圖源:網路陶哲軒表示,這是他第一次真正考慮離開美國的可能性。這種考慮背後,既有對現實困境的無奈,也有對未來發展的深思熟慮。幸運的是,根據最新的報導,IPAM在年底獲得了NSF的五年資助,雖然經費大幅縮水,但至少為研究所的基本營運提供了保障。這也意味著陶哲軒暫時不需要為他的研究所的生存問題而過度擔憂,但他仍然需要繼續籌款以保證研究所的正常營運。圖源:網路寫在最後無論陶哲軒最終選擇留在美國還是前往其他國家,他在數學領域的貢獻都將被歷史銘記。但這次事件所折射出的科研生態問題和人才流動趨勢,其影響將遠遠超出一個數學家的個人命運,成為理解現在全球科技發展軌跡的一個重要觀察點。今天美國科研的“雷”,明天可能砸到任何高度依賴單一經費的地方。無論是高校、實驗室,還是你所在的公司研究院。 (留學生日報)
陶哲軒力推AlphaEvolve:解決67個不同數學問題,多個難題中超越人類最優解
陶哲軒又來安利AlphaEvolve了。在與DeepMind高級工程師Bogdan Georgiev等人合著的新論文中,陶哲軒稱其為數學發現的有力新工具。具體來說,他們用AlphaEvolve研究了67個數學問題,涵蓋組合數學、幾何、數學分析與數論等多個領域。結果發現,AlphaEvolve在可擴展性、魯棒性、可解釋性方面均優於傳統工具。更關鍵的是,AlphaEvolve已經可以自主發現新穎的數學構造,並在部分問題上超越人類已有的最優結果。AI自主發現新數學構造AlphaEvolve在67個問題的測試中,不僅復現了眾多已知最優解,更在多個方面展現了其獨特的發現能力。一個關鍵的成就是AlphaEvolve能夠自主發現人類未曾一窺的新數學構造。例如在處理Nikodym集問題時,系統生成的初步構造雖然尚未達到最優,但它為人類研究者提供了“一個極好的人類直覺跳板” 。基於AI提供的結構,研究人員通過人工簡化和直覺推演,最終找到了一個更優的構造,改進了已知的上界,這一人機協作的成果將作為一篇獨立的數學論文發表。同樣地,在算術Kakeya猜想中,AlphaEvolve也發揮了類似作用。系統不僅將一個已知的下界從1.61226提升至1.668,其構造的解(形態上類似於離散高斯分佈)還啟發人類數學家建立了新的漸近關係,相關成果也即將發表。這種啟發人類研究的能力,與AlphaEvolve輸出結果的可解釋性緊密相關。系統在大多數情況下生成的是結構清晰的程式碼,而非難以理解的黑盒結果,這使得人類專家可以方便地分析、歸納其發現的模式,並提煉出通用的數學公式。積木堆疊問題便是這一特性的絕佳體現。在該問題中,系統最初生成了一個邏輯正確的遞迴程序來計算積木的放置。在隨後的演化中,系統內部的LLM分析了這段程式碼的邏輯,並自主將其重構為一個更簡潔、高效的顯式程序。這個最終程序清晰地揭示了最優解與諧波數(harmonic numbers)之間的數學關係,這與人類已知的理論公式完全一致,展示了系統從複雜解法中提煉數學本質的能力。除了方案的清晰性,AlphaEvolve在不同類型的問題設定下也表現出了強大的魯棒性。它能夠有效處理高維度參數空間、複雜的幾何約束以及基於蒙特卡洛模擬的近似評分函數。比如這裡有一個最小三角形密度問題。研究人員最初設計了一個樸素的評分函數,但系統很快利用了該問題空間的非凸性,通過“欺騙”評分函數獲得了超越理論最優的不可能分數。為瞭解決這個問題,研究人員設計了一個更魯棒的新評分函數,該函數基於問題的利普希茨連續性(Lipschitz type bounds)構造。在切換到這個更複雜的連續評分函數後,AlphaEvolve不再受局部陷阱的迷惑,迅速收斂到了已知的、正確的理論最優解。並且AlphaEvolve具備了出色的泛化能力,來看IMO 2025的第6題。研究人員只在輸入n為完全平方數時才對系統進行評分。這種“資訊限制”反而迫使AlphaEvolve去尋找這些稀疏實例背後的共同結構模式,而不是對每個n進行“過擬合”。最終,系統成功發現並輸出了在所有完全平方數n上均達到最優的通用構造,展現出了歸納能力。在實際應用中,AlphaEvolve的效率極高,僅需少量高品質提示即可驅動。論文指出,來自領域專家的提示(expert guidance)往往能顯著提升最終構造的質量,表明系統對人類輸入具有高度的敏感性。同時,該系統在架構上支援平行化,允許研究人員在多個問題實例或同一問題的不同參數設定上同時運行探索,並能自動遷移成功的搜尋策略,這在處理多參數的幾何類問題時尤其高效。AlphaEvolve工作模式AlphaEvolve並非一個單一流程的系統,而是通過不同“工作模式”適應不同類型的數學問題探索任務。該系統主要在兩種不同的模式下運行——“搜尋模式”(search mode)和“泛化模式”(generalizer mode)。“搜尋模式”是系統最常用的模式,其目標是高效地發現最優的數學構造,而不必關心構造過程是否具有可解釋性或普適性。在這種模式下,AlphaEvolve演化的不是直接生成構造的程序,而是演化用於搜尋構造的程序。每一個被演化的程序本身就是一個“搜尋啟髮式演算法”(search heuristic)。評估器會給予這些啟髮式演算法一個固定的時間預算,演算法的得分取決於它在此預算內能找到的最佳構造的質量。這種方式解決了LLM呼叫(緩慢且昂貴)與傳統局部搜尋(快速且廉價)之間的速度差異——一次緩慢的LLM呼叫用於生成一個高效的搜尋策略,該策略隨後可以觸發大規模的廉價計算,自主探索數百萬個候選構造。系統演化的是一系列“改進器”(improver)函數,它們動態地適應搜尋處理程序,早期可能偏好進行廣泛探索的啟髮式演算法,而當接近最優解時,則會演化出更精細的、針對特定問題進行最佳化的演算法。“泛化模式”則更具挑戰性 。其目標是讓AlphaEvolve編寫一個能夠解決任意給定參數n的問題的通用程序 。系統的評估方式是考察該程序在一系列不同n值上的綜合表現。這種模式的期望是,通過讓系統觀察自己在小規模n上找到的最優解,它能夠自主“發現模式”,並將其歸納推廣為一個適用於所有n的通用公式或演算法 。總之,AlphaEvolve展示了AI引導的演化搜尋如何補充人類的直覺,為數學研究提供了一個強大的新範式。 (量子位)
陶哲軒敲警鐘!Google DeepMind聯手五大神殿,用AI向世紀難題宣戰
【新智元導讀】GoogleDeepMind再出重拳,集結全球五大頂尖機構,以AI之力直指數學界聖盃!同時,陶哲軒也發出冷靜警示:須警惕AI濫用帶來的潛在風險。今天,GoogleDeepMind重磅發起「AI賦能數學計畫」,集結了全球五大頂尖機構。他們將用上Google最強數學AI,去探索發現新的疆域。這其中,有奪下IMO金牌的Gemini Deep Think,有演算法發現AI智能體AlphaEvolve,還有形式化證明自動補全AlphaProof。目前,首批合作機構陣容,堪稱豪華:倫敦帝國學院普林斯頓高等研究院(IAS)法國高等科學研究所(IHES)西蒙斯計算理論研究所(加州大學伯克利分校)塔塔基礎科學研究所(TIFR)這五大機構有著一個共同的使命,發掘可以被AI點亮的數學難題,加速科學發現。然而,陶哲軒擔憂的是,「當前AI在數學研究中應用加深,除了負責任的使用,AI濫用的案例也屢見不鮮」。因此他認為,現在正是時候,啟動關於如何最佳融入AI、透明披露其作用,並緩解風險的討論。或許,這不僅能守護數學研究的嚴謹性,還將為AI+數學融合鋪就道路。五大頂尖機構,聯手強攻數學難題數學,是宇宙最基礎的語言。在GoogleDeepMind看來,AI可以作為強大工具,與數學家合作,激發其創造力。「AI賦能數學計畫」的誕生,就是為了:發掘有望借助AI獲得深刻見解的新一代數學難題;建構支援這些前沿探索所需的基礎設施與工具;最終加速科學發現的步伐。這項計畫,將由Google.org提供資金支援,以及GoogleDeepMind的頂尖技術。幾個月來,GoogleDeepMind自身的研究,取得了飛速進步。2024年,AlphaGeometry和AlphaProof在IMO競賽中,拿下了銀牌。而搭載Deep Think的最新Gemini模型,更是在今年IMO中取得了金牌水平的表現,完美破解5題拿下35分。今年5月,GoogleDeepMind又發佈的AlphaEvolve,堪稱最強通用AI智能體。在數學分析、幾何學、組合數學和數論領域50個公開難題上,20%題目中,AlphaEvolve取得了最優解。而且,在數學與演算法發現領域,它發明了一種全新的、更高效的矩陣乘法方法。具體來說,在4x4矩陣乘法這一特定問題上,它發現了僅需48次標量乘法的演算法。這一結果,打破了1969年由Strassen演算法,創下長達50年的歷史紀錄。不僅如此,在電腦科學領域,AlphaEvolve協助研究員發現了全新的數學結構。同時,它還發現了有些複雜問題的求解難度,其實比人們過去想的還要高,這讓研究者對計算邊界看得更清楚、更精準,為未來的研究探明方向。以上這些進展,都是當前AI模型快速發展的有力證明。對於AI的全部潛力,還有它怎麼搞定思考最深奧的科學問題,人類的理解才剛剛開始。AI+數學,邊界在那?一直以來,陶哲軒是「AI+數學」領域應用的看好者,也是最佳實踐者。他曾多次聯手GPT-5 Pro等頂尖AI,破解了許多數學領域的難題,大大提升了效率。毋庸置疑,在數學領域,LLM和證明助手等AI工具,正悄然改變研究範式。最近,一些頂尖論文開始融合AI,推動了從形式化證明到複雜計算的創新。論文地址:https://borisalexeev.com/pdf/erdos707.pdf然而,隨著AI的深度介入,也引發了一個關鍵問題:如何確保這些工具的使用,不損害論文的嚴謹性和價值?陶哲軒獻策借此契機,陶哲軒在公開平台上發起了討論,在長帖中,他提出了三大建議。以下,AI一詞,它不僅涵蓋LLM,也包括神經網路、可滿足性求解器、證明助手以及任何其他複雜的工具。1 AI使用聲明論文中,所有對AI實質性的使用,超出其基礎功能,比如自動補全、拼寫檢查,或搜尋引擎AI摘要,都必須明確聲明。2 AI風險討論與緩解措施論文中,應討論所用AI工具可能帶來的一般性風險,並說明為緩解這些風險已採取的措施。以下將舉例說明:2.1. 內容虛構,出現了「幻覺」AI可能會編造參考文獻、證明過程或文字,導致事實錯誤。建議不要在論文正文中,使用AI生成的文字;若必須使用AI輸出,則用不同字型或標記清晰標註。2.2. 缺乏可復現性專有AI或高計算成本的結果難以復現。解決方案是,開源提示詞、工作流程、認證資料等,讓他人能低成本驗證。2.3. 缺乏可解釋性AI輸出往往晦澀,其解釋可能站不住腳。建議為每個AI輸出配以人類撰寫的、可讀性強的對應內容。比如,一個定理可以同時包含一個由人類撰寫、易於閱讀的非形式化證明,以及一個由AI生成但不易閱讀的形式化證明。2.4. 缺乏可驗證性AI易藏細微錯誤,檢查耗時。形式化驗證,一致性檢查,都有助於緩解這一問題,並採用多層次方法。關鍵是標註驗證範圍,在定理旁加「校驗標記」,未驗證部分則明確說明。2.5. 目標形式化不當AI可能精確解決「錯位」目標,即形式化後的命題偏離作者意圖。為此,應從獨立來源獲取形式化目標,或由人類深入審視形式化過程。2.6. 可能利用漏洞達成目標與上一問題相關聯,AI可能會鑽形式化表述的空子,如加入任意公理「證明」命題。應對方法是,列出已知漏洞,並討論排除機制確保過程嚴謹。2.7. AI生成程式碼有BugAI生成程式碼bug更加隱蔽,難以用傳統標準方法來檢測修復。為此,建議採用大量單元測試、外部驗證,或將AI使用限於簡單場景,複雜任務需由人類修改適配。3 責任歸屬最終,論文的所有作者,必須為AI貢獻內容承擔責任,包括任何不精準、疏漏或虛假陳述。除非明確標記為「未經核實」,否則作者不能推卸。以上這些,僅是陶哲軒的拋磚引玉,他希望加入更多的討論,和業界研究人員進一步完善這份清單。評論下方,一位研究者John Dvorak直戳痛點——除非我們能跨過臨界點,讓所有數學證明都用Lean做形式化驗證,成為學界的標配,否則這個問題基本無解。說到底,在Lean普及之前,這些法子雖然治標不治本。對此,陶哲軒拋出了最近看到的一個觀點,即用AI審稿質量是可以的,但它並非是主要的篩選工具質之一。否則就會觸發「古德哈特定律」(Goodhart's law),AI工具就會找到漏洞,用一些異常、分佈之外的文字字串就能繞開稽核。說白了,AI評估器頂多給人類稽核當個輔助,而不能完全取代人類評估者。 (新智元)
陶哲軒聯手GPT-5,1小時攻克數學難題!全程無編碼,OpenAI副總驚呼
陶哲軒聯手ChatGPT,多輪互動一個小時,最後破解了MathOverflow複雜數學題。讓他驚訝的是,AI不僅省去了數小時編碼,還最佳化了工作流程。兩年前,陶哲軒曾預言,「2026年的AI,將成為數學研究和其他許多領域的可靠的合作者」。現在,不用等到2026年,AI已經做到了!在Mathstodon上,陶哲軒稱,自己聯手ChatGPT攻克了一個MathOverflow難題,節省了數小時的編碼時間。在此期間,對話持續長達一小時。OpenAI副總Kevin Weil激動表示,「陶哲軒+AI解決了複雜數學難題」。OpenAI科學家Sebastien Bubeck自豪地表示,「這次,是陶哲軒本人的」。幾天前,GPT-5成功破解三大猜想,通過了「哥德爾測試」,以往需要耗費人類博士生數日才能完成。如今,越來越多的證據表明,AI正為數學發現做出實質的貢獻。這次,陶哲軒攜手ChatGPT,攻克了怎樣的難題?陶哲軒+GPT-5,破解數學難題這個MathOverflow的問題,探討了「最小公倍數序列是否為某一特定集合的子集」——序列lcm(1,2,…,n)是否為高度豐數的子集?陶哲軒本人透過理論分析,已經下定結論:答案是否定的。然而,要完全證明這一點,他需要找到具體的數值參數,以便確鑿地建構一個反例。這過程看似簡單,其實需要繁瑣的計算和參數搜尋,稍有不慎便可能陷入低效的泥淖。初試ChatGPT,多輪互動起初,陶哲軒嘗試讓ChatGPT直接產生Python程式碼,以搜尋符合條件的不等式參數。這樣一來,就可以自己運作調整。不過,這一方法很快就暴露了侷限性——產生的程式碼執行階段間過長,初始參數選擇不當,最終會導致搜尋的失敗。於是接下來,他改變了策略,轉而與AI展開逐步對話,讓它透過啟髮式計算來尋找可行的偏好設定。這種方法的核心在於:將複雜問題拆解為小步驟,每一步都由AI提供計算支援,並在陶哲軒的指導下不斷最佳化。最終,AI成功產生了符合要求的參數。為了確保結果的可靠性,陶哲軒使用了一個由AI產生的29行Python指令碼進行獨立驗證。這個指令碼簡潔明了,易於人工檢查,且驗證的數值結果與先前的啟髮式預測完全吻合。不用手動編碼,最佳化工作流程陶哲軒坦言,AI在這過程中的作用不可忽視。AI不僅幫助他發現了初始嘗試中的多處數學錯誤,還將原本可能耗費數小時的程式設計與偵錯工作,壓縮為一個高效的流程。如果沒有AI的協助,他根本不會嘗試這種數值搜尋,而是轉而尋求更傳統的理論分析方法。更重要的是,陶哲軒強調,他沒有遇到AI常見的「幻覺」問題。這得歸功於他清晰的任務規劃,以及逐步引導的對話方式。每一步計算,都在自己的監督下完成,AI僅在最後階段提供了數值結果和驗證程式碼,確保了整個過程的嚴謹性。我認為,這是因為對需要執行的那些繁瑣的計算任務,我心裡已經有了比較清晰的規劃,並且能夠以分步的方式向AI詳細解釋,每一步都在對話中得到確認後,再繼續下一步。在切換到對話式策略後,我只在最後階段才用Python進行外部驗證,也就是當AI產生了它聲稱滿足約束條件的數值輸出時。順便提一句,陶哲軒本人用的就是,所有人接觸到的GPT-5。陶哲軒的這次嘗試,為我們揭示了AI在數學研究中的巨大潛力。它不僅能執行繁瑣的計算任務,還能在數學家的引導下,參與複雜的探索過程。AI的價值在於解放研究者的時間與精力,讓他們專注於更高層次的思考與創新。正如陶哲軒所言,「如果沒有AI 的幫助,我很可能不會去嘗試這種數值搜尋」。從AI拿下IMO金牌,到成為天才數學家的得力助手,或許未來,類似的故事將更多領域不斷上演。 (新智元)
頂尖華裔數學家被迫在美籌款
數學界巨擘陶哲軒曾經只需專注破解宇宙的數學奧秘,如今卻得為維持研究所的生存四處奔走籌款,甚至開始考慮離開美國。01頂尖數學家陷募款困境「IPAM沒有足夠的儲備金來維持幾個月以上的運作。在過去兩周左右的時間裡,我們一直處於緊急籌款模式,我一直在與許多捐贈者會面。」華裔數學家陶哲軒向《華盛頓郵報》無奈地表示。這位被譽為「數學界莫札特」的天才,如今不得不將主要精力從研究轉向募款活動。世界頂尖數學家、菲爾茲獎得主陶哲軒從未想過,自己生涯最大的挑戰不是破解數學難題,而是為最基本的科學研究經費四處募款。2025年9月9日,加州大學洛杉磯分校(UCLA)的純數學與應用數學研究所(IPAM)內,50歲的陶哲軒經常會見潛在捐贈者。2025年8月,美國國家科學基金會(NSF)突然終止了對加州大學洛杉磯分校(UCLA)純數學與應用數學研究所(IPAM)的撥款。該研究所由菲爾茲獎得主陶哲軒領導,幾乎完全依賴NSF每年約數百萬美元的資助。資金斷裂的直接導火線是聯邦政府以UCLA「未能解決反猶太主義問題」為由,凍結了該校5.84億美元聯邦資金。儘管法院於8月12日判決恢復撥款,但IPAM的營運資金已耗盡,陶哲軒被迫暫停研究,連續兩周奔走於捐贈者之間。這位曾以破解孿生素數猜想震驚數學界的學者,如今自嘲「成了全職募款人」。02天才的困境從破解數學難題到緊急募款陶哲軒於1975年出生於澳大利亞,父母為香港移民。他16歲獲得弗林德斯大學學士和碩士學位,21歲在普林斯頓大學獲博士學位,24歲成為UCLA史上最年輕正教授。2016年,他因在偏微分方程、組合數學和數論領域的突破性貢獻獲得菲爾茲獎(數學界最高獎項),還與英國數學家本·格林合作證明了“格林-陶定理”,證明了素數中存在任意長度的等差數列,影響深遠。然而,這位世界頂尖數學家最近幾周卻不得不投入大量時間與私人捐助者會面、召開緊急會議、撰寫公開信。他甚至已經推遲了自己夏季薪資的發放,以優先保障研究生的經費。IPAM成立於2000年,旨在促進數學家、工業界和工程師之間的合作,是全美六大數學研究所之一,在全球數學界有著舉足輕重的地位。該研究所幾乎完全由NSF資助。然而,川普政府2025年對高校科研的全面削減令陶哲軒等學者陷入困境。 NSF的2026財政年度預算申請顯示,政府已提議將NSF的預算削減57%。白宮發言人庫什·德賽表示:“聯邦研究經費並非憲法賦予的權利……本屆政府有責任確保納稅人資助的研究符合美國人民的優先事項。”陶哲軒認為,川普政府的行動對他的研究領域乃至更廣泛的學術科學構成了「生存威脅」。他在8月底接受美國全國廣播公司(NBC)採訪時說:“我發現,這屆政府在改變科學生態系統方面極其激進,甚至連第一屆川普政府都沒有這樣做過。”03經費削減的骨牌效應此次危機折射出美國科研體系的系統性脆弱。川普政府擬削減NSF預算57%,且政策反复無常——陶哲軒將其比喻為“溫度時高時低的房間”,即便暫時恢復撥款,學者仍擔憂“下一次突變”。更深遠的影響在於人才流失。IPAM失去資助後,大批研究生和博士後被迫離美。陶哲軒警示:「歷史曾因戰爭出現人才逃往美國的浪潮,如今諷刺性逆轉正在發生──其他國家開始吸收美國流失的頂尖頭腦」。這一觀點呼應了2008年NSF報告《Cross-cultural analysis》的預言:忽視科學研究投入將導致「美國未來經濟與生活標準的災難性代價」。陶哲軒坦言,科研環境的不穩定性是他30年來從未見過的。一年前他從未考慮離開美國,但如今“所有可能性都得考慮”,包括前往香港或中國大陸。他接受《華盛頓郵報》採訪時表示:「我以前根本不會考慮搬家,現在我非常希望留下,事情恢復正常。」但這種願望正受到嚴峻考驗。如果當前趨勢持續下去,他將「失去留在美國的信心」。這種來自世界頂尖科學家的表態,標誌著美國科學研究環境正面臨前所未有的信任危機。04點評美國科學的十字路口陶哲軒的募款困境揭示了美國科研體系的深層危機:當科學淪為政治博弈的犧牲品,其創新引擎必將熄火。儘管私人捐款暫緩IPAM的生存危機(維持至2025年底),但「救火式」募款無法支撐長遠發展。(壹零社)
陶哲軒深度對話:AI與頂尖人類智能的本質鴻溝在於“嗅覺”
6月15日,菲爾茲獎得主、華裔數學家陶哲軒(Terence Tao)接受知名播客Lex Fridman訪談,本文摘取了本次深度訪談中陶哲軒闡述了關於數學、計算理論與人工智慧交叉領域的系統性思考。他探討了如何將流體力學中的經典難題重構為計算問題,如何從“生命遊戲”的湧現中洞察AI系統設計的核心原則,並深入剖析他對於當前AI無法踰越“數學嗅覺”鴻溝的判斷。01一個思想實驗:將納維-斯托克斯問題重構為計算問題陶哲軒對AI與計算理論的思考,其起點並非源自數字世界,而是植根於對物理世界最複雜系統之一——流體力學的深刻洞察。他以克雷基金會千禧年大獎難題之一的“納維-斯托克斯存在性與光滑性問題”為切入點,展開了一場關於計算本質的思想實驗。該問題的核心在於,能否從數學上100%保證流體的解永遠不會在有限時間內、於空間某點形成能量無限集中的“爆破”(blow-up)。陶哲軒指出,這個問題的極端困難性,源於其“超臨界”(supercritical)特性。在流體系統中,存在兩種相互競爭的力量:一是使系統趨於平穩的粘性耗散,二是驅動能量輸運的非線性效應。在“超臨界”狀態下,當尺度越來越小時,非線性效應會壓倒性地戰勝粘性效應。他將潛在的“爆破”機制比作“麥克斯韋妖”的傑作:理論上,一個微觀“妖精”可以巧妙地操縱能量,將其不斷推向更小的尺度,形成一個自相似的能量匯聚鏈條,最終在有限時間內形成奇點。面對這個直接攻擊極為困難的問題,陶哲軒採取了一種非傳統的數學策略:如果無法直接證明原方程的正則性,那麼能否反向構造一個會“爆破”的解?為了實現這一點,他通過修改物理定律,設計出了一個可控的“爆破”模型。他解釋了其方法論:“我基本上就是通過修改物理定律,設計出了一個爆破模型。我無法直接研究真實的流體方程,那太複雜了。但如果我能對納維-斯托克斯的運動方程進行‘平均化’處理,也就是說,在物理圖像上,我可以人為地‘關閉’流體某些特定的相互作用方式,只保留我想要的那部分。”通過這種精心設計,他成功地在模型中迫使所有能量在有限時間內爆破。這一成果的直接意義,是為所有試圖證明原方程全域正則性的理論路徑,設定了一個關鍵的“障礙”。它清晰地表明:任何成功的證明,都必須本質性地用到那些被他在模型中“關閉”掉的關鍵物理特性。然而,在建構這個精巧爆破模型的過程中,一個更深刻、更具革命性的構想浮現了。陶哲軒發現,為了實現能量受控的、逐級向更小尺度傳遞,他必須在模型中建構一種複雜的非線性結構,其功能類似於電路中的“船閘”和“時鐘”。這個過程啟發他思考:如果流體系統本身就能被設計成一個計算裝置呢?由此,他提出了“液體電腦”的構想。他設想,驅動計算的單元不再是電子,而是一股股以特定速度流動的水流脈衝。水流的不同形態可以代表二進制的0和1,通過設計特定的流體互動,可以實現“與門”和“或門”等邏輯運算。將這些邏輯閘串聯,理論上甚至可以建構出一台液態的“Transformer”。一旦擁有了完全由水構成的電腦,便可以創造一個流體版的“馮·諾依曼機”(von Neumann machine)——一個能夠利用流體資源進行自我複製的機器人。這個“流體機器人”被程式設計設定了此生唯一的目標:創造一個比自己更小的、處於“冷啟動”狀態的複製品。一旦完成,它會將自身全部能量轉移給這個“子代”,然後自身“斷電”並消散。這個全新的、更小更快的“機器人”將自行啟動,並以指數級的速度重複這個過程。從理論上講,這個無限迭代的自我複製過程,就將在真實的納維-斯托克斯方程中製造出一個“爆破”。儘管陶哲軒坦承,目前建構這樣的“液體電腦”還缺少太多關鍵技術環節,但他這一思想實驗的深遠意義在於,它將一個純粹的偏微分方程問題,與計算理論的核心——圖靈機、馮·諾依曼架構——直接聯絡了起來。它揭示了計算可以是一種從物理定律中湧現的現象,為未來超越傳統矽基的、更泛在的智能形態,提供了來自基礎物理學的、邏輯上自洽的理論支撐。02計算的湧現:從“生命遊戲”看工程化初始條件的重要性陶哲軒關於“液體電腦”的構想,其核心在於複雜的計算能力可從簡單的底層規則中湧現。這一思想並非孤立,而是在數字世界中有著一個強大且經典的印證——約翰·康威的“生命遊戲”(Conway's Game of Life)。陶哲軒明確表示,他對元胞自動機(cellular automata)的瞭解,深刻地影響了他對複雜系統行為的思考,並為理解人工智慧系統的內在邏輯提供了關鍵類比。“生命遊戲”是一個由極簡規則驅動的二維數字宇宙,其演化模式有時看起來極為混亂,酷似流體湍流。然而,陶哲軒指出,研究者們,其中不乏業餘數學家,通過社區眾包式的努力,在這個極簡系統中發現了令人驚嘆的、具有高度組織性的結構。例如,他們發現了“滑翔者”(glider),一種能穩定向特定方向移動的微小模式,這與陶哲軒在流體力學中思考的“渦環”(vortex ring)形成了功能上的類比。更令人驚嘆的是,通過對這些基本模式的巧妙組合,人們最終在“生命遊戲”裡建構出了更高級的計算元件。他們設計出了能持續發射“滑翔者”的“滑翔者槍”,乃至能夠實現“與門”和“或門”等邏輯運算的複雜結構。陶哲軒強調:“一旦你能建構出這些基本門電路,從軟體工程的角度看,你幾乎可以造出任何東西,包括一台圖靈機。”最終,人們甚至在其中創造出了一個龐大得看似荒謬的、能夠實現自我複製的馮·諾依曼機。然而,無論是設想中的“液體電腦”,還是“生命遊戲”中已實現的複雜機器,其湧現都有一個至關重要的共同前提,陶哲軒對此給出了明確的論斷:“你能得到這種湧現出的複雜結構,但前提是需要非常精心準備的初始條件。”他強調,如果你只是在棋盤上隨機撒下一些“細胞”,你是絕對看不到“滑翔者槍”或自我複製機器的。這些複雜結構必須通過“工程”的手段,以一種非常特殊的方式精心設計,才能建構出來。03AI在數學研究中的潛力與核心侷限:“數學嗅覺”當對話轉向AI在數學研究領域的直接應用時,陶哲軒系統性地評估了AI當前的潛力,並明確指出了其與頂尖人類智能之間難以踰越的本質鴻溝——他稱之為“數學嗅覺”(Mathematical Smell)的缺失。他認為,人與AI在研究層面的合作已初現端倪,並給出了一個具體預測:“我認為在2026年就會出現人與AI合作的數學研究,其成果或許還達不到菲爾茲獎的等級,但會是真正在研究層面的數學論文,其中部分內容由AI生成。”他本人也經常使用程式碼補全等AI工具來加速研究工作,並視AI為出色的“計算助手”。然而,當被問及AI能否獨立完成菲爾茲獎等級的、類似格里戈裡·佩雷爾曼解決龐加萊猜想那樣的思想突破時,他的回答是清晰而否定的。他詳細解釋了佩雷爾曼的工作:其核心在於引入“裡奇流”(Ricci flow)並行展出“佩雷爾曼熵”等全新概念,將一個棘手的“超臨界”問題轉化為一個可控的“臨界”問題,並最終對所有可能出現的奇點進行分類和“手術”。這一過程,是長達數年、基於深刻物理直覺的探索,是一條需要巨大毅力才能走通的、前無古人的道路。陶哲軒對此斷言:“這完全不是今天的Transformer架構的AI或大語言模型所能做到的。”他進一步剖析了原因:一個AI或許能在其龐大的可能性空間中“碰巧”生成佩雷爾曼用到的某個公式或概念,但它無法像佩雷爾曼那樣,憑藉一種深刻的直覺堅信這是唯一正確的方向,並為之投入數年光陰。AI可以生成選項,但無法進行戰略性的、具有長遠信念的抉擇。不過,陶哲軒也指出,大型語言模型生成的數學內容,最令人頭疼之處在於它們常常“看起來完美無瑕”,語法正確、邏輯鏈條完整,但內部卻可能包含任何一個受過訓練的人都不會犯的、荒謬的低級錯誤。他將這種現象與程式設計師圈的術語“程式碼異味”進行類比。一個有經驗的程式設計師能憑直覺“聞到”一段程式碼中存在問題,即便它能夠運行。同樣,頂尖數學家對一個證明策略、一個研究方向的好壞,也有一種直覺性的判斷力,這就是“數學嗅覺”。而AI生成的文字,由於其訓練目標是模仿正確的文字樣式,所以常常是“沒有氣味”的,這使得發現其深層邏輯謬誤變得異常困難。“所以說,就是‘嗅覺’,”陶哲軒總結道,“這正是人類所具備的能力。”他認為,一個頂尖數學家的工作,遠不止是執行計算和邏輯推演,更重要的是對研究方向的戰略判斷:那個問題值得投入精力?那條證明路徑更有前景?那種問題的分解方式是化繁為簡,而非化簡為繁?他將這種能力與AlphaGo在圍棋領域的成功進行對比:AlphaGo之所以能戰勝人類,並非因為它算得更遠,而是因為它通過海量學習,發展出了對“棋局”優劣的“嗅覺”。陶哲軒預言,只有當AI也獲得了對“證明策略”可行性的‘嗅覺’時,它們才可能開始與人類水平的數學家一較高下。在此之前,一個理想的AI助手應該扮演什麼角色?陶哲軒認為,我們正進入一個全新的範式,面對的是一個能理解複雜指令、可進行大規模工作,但同時並不可靠的助手。這意味著人機協作的模式並非簡單的任務分配,而是一個動態的、需要人類扮演最終戰略決策者和“嗅覺”驗證者的過程。人類的職責,是提出深刻的問題,設定正確的方向,並利用自己深厚的“嗅覺”來審視和引導AI強大的、但可能是盲目的計算和生成能力。04眾包與形式化證明:重塑數學研究的協作新範式在被問及近年來積極投身並倡導使用像Lean這樣的形式化證明語言,是如何親自投身這個領域,並且參與的Polymath以及利用Lean的“等式理論項目”是如何運作?這種全新的、高度分佈式的協作模式,對於攻克難題和數學研究的未來意味著什麼?陶哲軒坦言,他投身這一領域,源於對傳統研究方式低效的切身感受。他看到數學家們花費大量時間進行重複性計算或在不熟悉的領域摸索,這促使他不斷探索新的工作流程。數年前,他便敏銳地捕捉到電腦輔助證明的潛力並組織相關研討會。當ChatGPT引爆AI浪潮後,他更進一步,意識到自己不能只停留在口頭倡導,必須親身實踐,用行動來證實這一方向的價值:“我不能僅僅憑藉自己作為‘世界知名數學家’的權威去告訴大家‘相信我,這將改變數學’,而自己卻不投身其中。”他所引領的這場變革,核心在於用電腦可以完全理解和驗證的程式碼,來重寫數學。像Lean這樣的形式化證明語言,讓數學定理不再僅僅是人類頭腦中的抽象概念和紙上的符號,而變成了可被機器嚴格審查的、精確無誤的數位化對象。陶哲軒解釋道,這從根本上解決了一個困擾大規模數學協作的瓶頸:信任。“你實際上是在利用電腦的證明檢查器來確保過程中的每一步都精準無誤,這讓所有部分都能相容並且高度可靠。”在這種新範式下,一個宏大複雜的證明可以被分解成數千個獨立的、標準化的、可被驗證的“節點”或“引理”。這就像一張詳盡的“藍圖”。貢獻者無需通曉整個證明的全貌,只需領取並攻克自己負責的那個小模組即可。這種模式徹底改變了數學研究的生產關係,使其從一門以孤膽英雄為主的學科,演變為可以像現代工業供應鏈那樣進行大規模、分佈式、可信協作的工程。為了檢驗這一模式的威力,陶哲軒與合作者們發起了一個名為“等式理論項目”的宏大計畫。該項目旨在完整描繪抽象代數領域約4000條定律之間的相互推導關係,這構成了大約2200萬個需要被證明或證偽的子問題。在過去,僅靠人力處理十幾個類似問題就已是極限。但在Lean和GitHub等協作平台的加持下,這個看似不可能的任務吸引了全球約50位數學家和程式設計師的參與。在訪談時,這個龐大的項目已接近尾聲,即將產出一篇有50位作者署名的論文,這在傳統數學領域是極其罕見的。這次經歷也讓他深刻反思了科研協作模式的演進。他回憶起十年前參與的、早期的眾包項目“Polymath”。雖然理念先進,但因缺乏Lean這樣的自動驗證工具,所有貢獻都需核心成員人工稽核,效率受限於巨大的瓶頸。當時團隊採用共同筆名發表成果,卻也帶來了署名權不清、功勞歸屬模糊等問題。而在新的“等式理論項目”中,他們採用了更精細的貢獻歸屬機制:所有參與者都是正式作者,並通過一個詳盡的“貢獻矩陣”來申明各自在概念構思、程式設計實現、結果驗證等方面的具體工作。05AI能否“發明”出這樣一種全新的數學思想當AI擁有了堅實的知識基礎(形式化數學庫)和強大的計算能力後,它能否攻克那些困擾人類數百年、似乎需要全新概念才能突破的終極難題,如孿生素數猜想和黎曼猜想?他以數論中著名的“奇偶性障礙”(parity barrier)為例,來闡釋所面臨的深層困難。在研究孿生素數猜想這類問題時,數學家們發展了一套強大的“篩法”技術。然而,陶哲軒指出,這套技術有一個內在的、已被證明了的侷限,即“奇偶性障礙”。它像一堵無法踰越的牆,使得所有基於現有篩法框架的嘗試,都註定無法最終證明孿生素數猜想。他將突破這一障礙比作“超越光速”,它需要的不僅僅是更強的算力,而是一個全新的、可能來自完全不同領域的革命性思想。一個AI或許可以通過強化學習,將現有方法運用到極致,但它能否“發明”出一種能繞過“奇偶性障礙”的、全新的數學思想?陶哲軒對此持開放但審慎的態度。他指出,對於孿生素數猜想,我們很大程度上仍處於“黑暗中摸索”的階段,缺乏像龐加萊猜想那樣一個由哈密爾頓提出的、明確的“裡奇流”攻擊方案。而對於另一個更著名的難題——黎曼猜想,本質上是說,素數的分佈,在刨除掉一些已知的局部規律後,其表現得和你所能期望的一樣“隨機”。陶哲軒解釋道,證明這一點極其困難,因為數學中我們恰恰缺乏有效的工具去證明某個具體事物“真正具有隨機性”。任何可行的證明,都必須極其精確,巧妙地避開所有已知陷阱,不能有巨大的誤差容忍度。他認為,用於解決黎曼猜想的工具,很可能與解決孿生素數猜想的工具截然不同。當被問及黎曼猜想是否會在我們有生之年被解決時,他坦率地表示:“如果非要我下注的話,我會賭它不會。但我真心希望自己會輸掉這個賭。”06面向未來的集體智能與核心素養在AI技術浪潮席捲全球的背景下,關於“人類何去何從”的討論不絕於耳。陶哲軒的思考,最終回歸到對人類智慧形態和社會協作模式的未來展望上,為我們在一個日益智能化的世界中定位自身,提供了清晰的指引。他首先強調,我們正從個體英雄主義時代,步入一個更加依賴“集體智慧”的時代。他以數學問答網站MathOverflow為例,這個線上社區常常能對極其艱深的問題給出驚人迅速且高品質的解答。他評價道:“當基礎設施和文化環境都健康時,人類作為一個共同體,其所能達到的智慧、成熟和理性,可以遠超所有個體成員的總和。作為一個整體的數學界,它就是一個令人難以置信的超級智能實體。”這種集體智慧的湧現,正是他對人類文明未來抱有希望的核心原因之一。這為我們思考未來的AI系統提供了新的視角:強大的智能或許不體現在單一的、無所不能的“超級AI”上,而是在於由無數AI代理和人類專家組成的、能夠高效協作的“智能蜂群”或混合智能系統。面對這樣一個充滿不確定性與巨大機遇的未來,年輕人應如何裝備自己?陶哲軒給出了明確而深刻的建議:專注於培養可遷移的核心技能。他警告說,學習某一門特定的程式語言或數學分支,其價值會隨著工具的更新換代而衰減。真正恆久不變、且在人機協作中不可替代的,是更根本的能力,例如:運用抽象概念進行推理的能力,以及在面對全新未知問題時的解決能力。這些元能力,是人類心智的基石,無論未來的AI工具變得多麼強大,它們始終是驅動創新和解決複雜問題的核心。他還對標準化教育提出了批評。他基於自己的觀察提出一個理論:“進化並沒有直接賦予我們大腦一個‘數學中心’,但我們大腦的其他中樞足夠精密,以至於不同的人可以‘呼叫’大腦的不同區域來處理數學。”例如,有些人偏好視覺化思維,有些人則偏好符號化和語言化思維。標準化的教育模式可能會因為無法匹配個體的天生認知風格,而過早地扼殺掉許多人對數學的興趣。 (數字開物)