陶哲軒聯手GPT-5,1小時攻克數學難題!全程無編碼,OpenAI副總驚呼

陶哲軒聯手ChatGPT,多輪互動一個小時,最後破解了MathOverflow複雜數學題。讓他驚訝的是,AI不僅省去了數小時編碼,還最佳化了工作流程。

兩年前,陶哲軒曾預言,「2026年的AI,將成為數學研究和其他許多領域的可靠的合作者」。

現在,不用等到2026年,AI已經做到了!

在Mathstodon上,陶哲軒稱,自己聯手ChatGPT攻克了一個MathOverflow難題,節省了數小時的編碼時間。

在此期間,對話持續長達一小時。

OpenAI副總Kevin Weil激動表示,「陶哲軒+AI解決了複雜數學難題」。

OpenAI科學家Sebastien Bubeck自豪地表示,「這次,是陶哲軒本人的」。

幾天前,GPT-5成功破解三大猜想,通過了「哥德爾測試」,以往需要耗費人類博士生數日才能完成。

如今,越來越多的證據表明,AI正為數學發現做出實質的貢獻。

這次,陶哲軒攜手ChatGPT,攻克了怎樣的難題?

陶哲軒+GPT-5,破解數學難題

這個MathOverflow的問題,探討了「最小公倍數序列是否為某一特定集合的子集」——

序列lcm(1,2,…,n)是否為高度豐數的子集?

陶哲軒本人透過理論分析,已經下定結論:答案是否定的。

然而,要完全證明這一點,他需要找到具體的數值參數,以便確鑿地建構一個反例。

這過程看似簡單,其實需要繁瑣的計算和參數搜尋,稍有不慎便可能陷入低效的泥淖。

初試ChatGPT,多輪互動

起初,陶哲軒嘗試讓ChatGPT直接產生Python程式碼,以搜尋符合條件的不等式參數。

這樣一來,就可以自己運作調整。

不過,這一方法很快就暴露了侷限性——

產生的程式碼執行階段間過長,初始參數選擇不當,最終會導致搜尋的失敗。

於是接下來,他改變了策略,轉而與AI展開逐步對話,讓它透過啟髮式計算來尋找可行的偏好設定。

這種方法的核心在於:將複雜問題拆解為小步驟,每一步都由AI提供計算支援,並在陶哲軒的指導下不斷最佳化。

最終,AI成功產生了符合要求的參數。

為了確保結果的可靠性,陶哲軒使用了一個由AI產生的29行Python指令碼進行獨立驗證。

這個指令碼簡潔明了,易於人工檢查,且驗證的數值結果與先前的啟髮式預測完全吻合。


不用手動編碼,最佳化工作流程

陶哲軒坦言,AI在這過程中的作用不可忽視。

AI不僅幫助他發現了初始嘗試中的多處數學錯誤,還將原本可能耗費數小時的程式設計與偵錯工作,壓縮為一個高效的流程。

如果沒有AI的協助,他根本不會嘗試這種數值搜尋,而是轉而尋求更傳統的理論分析方法。

更重要的是,陶哲軒強調,他沒有遇到AI常見的「幻覺」問題。

這得歸功於他清晰的任務規劃,以及逐步引導的對話方式。

每一步計算,都在自己的監督下完成,AI僅在最後階段提供了數值結果和驗證程式碼,確保了整個過程的嚴謹性。

我認為,這是因為對需要執行的那些繁瑣的計算任務,我心裡已經有了比較清晰的規劃,並且能夠以分步的方式向AI詳細解釋,每一步都在對話中得到確認後,再繼續下一步。

在切換到對話式策略後,我只在最後階段才用Python進行外部驗證,也就是當AI產生了它聲稱滿足約束條件的數值輸出時。

順便提一句,陶哲軒本人用的就是,所有人接觸到的GPT-5。

陶哲軒的這次嘗試,為我們揭示了AI在數學研究中的巨大潛力。

它不僅能執行繁瑣的計算任務,還能在數學家的引導下,參與複雜的探索過程。

AI的價值在於解放研究者的時間與精力,讓他們專注於更高層次的思考與創新。

正如陶哲軒所言,「如果沒有AI 的幫助,我很可能不會去嘗試這種數值搜尋」。

從AI拿下IMO金牌,到成為天才數學家的得力助手,或許未來,類似的故事將更多領域不斷上演。 (新智元)