The Edge of Mathematics傳奇數學家陶哲軒闡釋生成式人工智慧的前景。作者:馬特奧·王 (Matteo Wong)插圖:《大西洋月刊》繪製。圖片來源:Kimberly White / Getty Images2026年2月24日在過去的幾個月裡,幾位研究人員開始提出一個相同的挑釁性主張:他們利用生成式人工智慧工具解決了一個此前未解的數學難題。那些最極端的承諾——即人工智慧輔助解決數學界一些最棘手的問題——很可能最終被證明是空洞的炒作。但是,許多由人工智慧撰寫的解答(儘管針對的是遠沒那麼受讚譽的問題)已經通過了驗證。這些答案針對的是“埃爾德什問題”(Erdős Problems)中的一部分——這是由匈牙利數學家保羅·埃爾德什(Paul Erdős)提出的1000多個數學問題——是利用包括ChatGPT在內的生成式人工智慧模型寫成的。OpenAI迅速宣佈了一場勝利:“GPT-5.2 Pro解決了另一個開放的埃爾德什問題,”OpenAI總裁格雷格·布羅克曼(Greg Brockman)於一月份在X平台上發帖稱,“這將是數學和科學進步狂野的一年!”圍繞這一新聞的大部分興奮之情,源於這些人工智慧所寫證明的裁決者:陶哲軒。他是加州大學洛杉磯分校(UCLA)的教授,被廣泛認為是當今世界上最偉大的在世數學家。他的認可似乎賦予了生成式人工智慧最大的承諾以合法性——即推動人類知識和文明的邊界。當我本月早些時候致電陶哲軒,詢問他對人工智慧能為數學帶來什麼的看法時,他的態度更為溫和。他告訴我,人工智慧生成的埃爾德什問題解答令人印象深刻,但並非壓倒性的:陶哲軒表示,這些機器人實際上只是取得了一些“廉價的勝利”。陶哲軒長期以來對人工智慧工具能為他的領域做些什麼感到好奇,但也持保留態度。我們在2024年秋季第一次交談時,陶哲軒將聊天機器人比作“平庸但並非完全無能”的研究生。大約六個月後,他告訴我,這些模型在“某些類型的高層數學推理”方面有所進步,但缺乏創造力且會犯細微的錯誤。但在我們最近的談話中,他的態度更加樂觀。人工智慧或許尚未處於解決世界上所有偉大數學問題的邊緣,但聊天機器人已經達到了可以與人類數學家協作的水平。他說,在這個過程中,這項技術正在開闢一種不同的“做數學的方式”。本次對話經過編輯,以求簡練清晰。馬特奧·王: 最近,關於ChatGPT解決某些埃爾德什問題的能力引起了極大轟動。在過去一年左右的時間裡,您看到生成式人工智慧的數學能力是如何演變的?陶哲軒: 有一大群人非常、非常希望看到人工智慧的成功故事。與此同時,也有另一群截然相反的人想要抹殺所有人工智慧的進展。而事實介於兩者之間,是一個非常複雜且微妙的故事。特別是在這些埃爾德什問題中,有一小部分是我們要真正解決的高知名度問題,然後還有長長的尾部,由非常冷僻的問題組成。人工智慧非常擅長系統地探索這個長尾部分,並攻克其中最簡單的問題。但這與人類的風格截然不同。人類不會系統地瀏覽所有1000個問題並挑選出最簡單的12個來研究,而這正是人工智慧正在做的事情。這些問題之間確實存在著巨大的難度差異。看看迄今為止人工智慧獨立解決的問題,你會發現:哦,好吧,它們使用的是一種標準技術。如果一位專家花半天時間研究此事,也能解決出來。當然也有更複雜的、由人工智慧輔助的解決方案。我認為在短期內,我們將通過純人工智慧方法在簡單問題上獲得許多快速勝利。而在接下來的幾個月裡,我認為我們將看到各種形式的人機混合貢獻。我也從出現的一些證明中學習。我喜歡閱讀它們——也許它使用了某篇1960年論文中的技巧,而我之前並不知曉。所以它可能不是超級、超級有創造力,但它是新的,並且能做到那些審視該問題的人類專家所忽略的事情。王: 您曾寫道,當人類數學家面對一個新問題時,無論成功與否,他們都會產生見解供該領域的其他人建構基礎——這是基於人工智慧的證明所無法提供的。為什麼會這樣?陶哲軒: 這些問題就像是你需要徒步前往的遙遠地點。在過去,你必須踏上一段旅程。你可以放下路標供他人跟隨,也可以繪製地圖。人工智慧工具就像是用直升機把你直接空降到目的地。你錯過了旅程本身的所有益處。你直接到達了終點,而這實際上只是解決這些問題價值的一部分。王: 當您思考當今這些模型的能力時,除了讓非數學家能夠處理更高級的問題外,它們還能為您的領域做出什麼貢獻?陶哲軒: 如今有很多非常乏味的數學工作是我們不喜歡做的,所以我們尋找巧妙的方法來繞過它們。但人工智慧會很樂意猛衝通過這些繁瑣的計算。當我們把人工智慧整合到人類的工作流程中時,我們就可以滑過這些障礙。我還認為數學家將開始在更大的規模上進行數學研究。想想科學研究中個案研究與人口調查之間的區別。如果你要在18世紀研究一種疾病,如果這是一種罕見病,你可能會研究一位患有此病的病人,記錄其所有症狀並做詳盡的筆記。但在21世紀,你可以進行臨床試驗,給1000人用藥,進行統計分析,從而獲得關於藥物效率更精確的資訊。數學仍然很大程度上處於個案研究的水平。一篇論文會選取一兩個問題,以一種非常手工打造、高強度的方式對其進行透徹研究。這是我們的風格。但人工智慧工具實現的是“群體研究”。王: 您對人工智慧模型在數學能力方面取得的進步感到驚訝嗎?陶哲軒: 有一點驚訝。發生的很多事情是我預料到的,但它們比我預期的時間表稍微提前了一點。並沒有提前太多。例如,在2023年,我為微軟寫了一篇文章,預測到2026年,人工智慧將成為值得信賴的合著者——即其對技術論文的貢獻將達到合著者的水平。那篇文章反響不一:有人說我太過雄心勃勃,也有人說我太過悲觀。但我認為這基本上幾乎完全符合時間表。我們基本上看到人工智慧的使用水平達到了我預期初級人類合著者所能做出的貢獻,尤其是那些非常樂意做苦差事並解決大量繁瑣案例的合著者。王: 在未來一兩年內,您希望或期待生成式人工智慧模型有那些改進?陶哲軒: 我們需要找到一個中間地帶,既鼓勵負責任地使用人工智慧,又阻止不負責任的使用。這是一條需要小心行走的界線。但我們以前做到過。數學家經常使用電腦進行數值工作,當電腦輔助證明首次出現時,最初遭到了很多反對,因為人們質疑如何信任電腦程式碼?但我們在20或30年裡解決了這個問題。不幸的是,現在的時間表被大大壓縮了。所以我們必須在幾年內製訂出我們的標準。而我們的社區通常不會移動得那麼快。有一件非常基本的事情可以幫助數學社區:當人工智慧給你一個問題的答案時,通常它不會很好地表明它對這個答案有多大的把握,或者它總是會說:“我完全確定這是真的。”人類也會這樣做。無論他們對某事是否有信心,這都是非常重要的資訊。暫時提出一些你不確定的事情是可以的,但重要的是要標記出你對此不確定。然而,人工智慧工具並不能精準地評估它們自己的置信度。這降低了它們的有用性。我們會更欣賞誠實的人工智慧。此外,許多人工智慧公司痴迷於“一鍵式”、完全自主的工作流程:你把任務交給人工智慧,然後你去喝杯咖啡,回來時問題就解決了。這實際上並不理想。對於困難的問題,你真正想要的是人類與人工智慧之間的對話。而人工智慧公司並沒有真正促進這種互動。如果我們能與至少一些願意開發更多互動平台的技術公司合作,那將會更容易被人們所接受。我們不想淪為只是按按鈕的角色。 (邸報)