一周兩破18年數學紀錄!陶哲軒驚嘆:AlphaEvolve帶來久違「加速度」

【新智元導讀】人類數學家與AlphaEvolve攜手,一周內兩次刷新18年未破的數學紀錄!展現AI與人類協作的驚人潛力。AI如偵察兵廣度掃描,人類專家深度最佳化,雙引擎驅動下,科學前沿正在加速推進!

AI正在與人類協作加速推進科學前沿。

一周之內,一項18年的數學紀錄連續兩次被刷新!

先是在5月14日,DeepMind的AlphaEvolve(陶哲軒有參與)發佈白皮書,宣佈在50多個公開難題上刷新紀錄,其中就包括將和差集的θ從1.14465提升到1.1584。

接著,在5月22號,人類數學家Robert Gerbicz又在AlphaEvolve的研究基礎上,把θ推進到了1.173050!

在數學上,這是相當大的進步。

論文地址:https://arxiv.org/abs/2505.16105

陶哲軒發帖由衷的感嘆道:「人類與AI不同方法的互補,正是數學快速前進的原因。」

這一次,AI的「廣度掃描」與人類的「深度打磨」像雙引擎一樣同時驅動,給數學研究帶來了久違的加速度。

和差集問題究竟是什麼?

讓我們先來瞭解一下這個讓數學家們痴迷的問題。

簡單來說,它關乎整數集合的「和集」(A+B,集合中所有元素兩兩相加得到的集合)與「差集」(A-B,集合中所有元素兩兩相減得到的集合)之間的大小關係。

想像你有兩個裝滿了數字的袋子,我們叫它們袋子A和袋子B。

和集(A+B),就是你從袋子A裡拿一個數,再從袋子B裡拿一個數,把這兩個數加起來,所有可能的加和結果,就組成了這個「和集」。

類似的,差集(A-B),就是從袋子A裡拿一個數,從袋子B裡拿一個數,用第一個數減去第二個數,所有可能的相減結果,就組成了「差集」。

比如A={1, 2},B={3, 4},那麼A+B={1+3, 1+4, 2+3, 2+4}={4, 5, 5, 6}={4, 5, 6}(集合裡元素不重複),A-B={1-3, 1-4, 2-3, 2-4}={-2, -3, -1, -2}={-1, -2, -3}。

那麼,數學家們在琢磨什麼呢?

他們想找到一種特別的袋子A和袋子B(裡面的數字要選得很巧),使得和集裡不同結果的數量相對較少,但同時,差集裡不同結果的數量卻非常非常多。

這個「非常非常多」到底能有多大,就用上面提到的那個神秘的指數θ來衡量。

2007年,Gyarmati、Hennecart和Ruzsa通過構造一個包含約30,000個元素的集合U,確立了θ=1.14465的下界。

這一結果在當時是加法組合學領域的重大進展,但數學家們知道,θ的上界為4/3,意味著仍有很大的改進空間。

AlphaEvolve通過無約束搜尋,找到一個包含54,265個元素的集合U,將θ的下界提升至1.1584。

這一進步展示了AI在數學研究中的潛力:通過快速掃描大量可能性,AI能夠發現人類可能忽略的構造。

這一次Gerbicz的新進展並非打敗了AlphaEvolve,而是站在它提供的新基準上,用經典思路配超大參數(超過10^43546個元素)再進一步。

AlphaEvolve的「廣角鏡」

AlphaEvolve之所以能在和差集問題上取得突破,得益於其強大的通用演算法設計能力。

它的核心機制,是將GoogleGemini解決創造性問題的能力和能驗證答案的自動評估器相結合,然後用進化框架來最佳化最有潛力的想法。

論文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf

它用48次標量乘法,搞定4x4複數矩陣乘法,改進了1969年Strassen最優演算法。

AlphaEvolve不僅僅是矩陣乘法屠龍刀,還是個跨界狂魔。

為了測試AlphaEvolve的極限,DeepMind將其投入了數學分析、幾何、組合學和數論中的50多個開放問題。

陶哲軒親自出題參與到項目中。

在短短幾小時內,AlphaEvolve完成了大多數問題的設定,展現出驚豔的靈活性。

更令人震撼的是,它在大約75%情況下,重新發現了最先進的解決方案;在20%情況下,改進了已知的最佳解決方案,並在相應的開放問題上取得了進展。

以困擾數學家300多年「親吻數」難題為例,AlphaEvolve在11維空間中,發現了593個外球的配置,刷新了該問題的下限。

幾何學中,數學空間的親吻數被定義為一種空間排布下非重疊單位球體的最大數量。其中,所有的單位球體都與一個中心單位球體相切

AlphaEvolve並非DeepMind首次用AI做數學:AlphaGeometry 2解決了84%的IMO幾何難題,勝過人類金牌選手。FunSearch則在組合數論難題上找到新構造,被Science評論為「新工具箱」。

這不是零和博弈

Gerbicz的突破正是陶哲軒所說的「互補」範例——Gerbicz與AlphaEvolve之間並不是一種零和遊戲。

「將此簡化為贏家和輸家的零和遊戲是很誘人的,但我認為,不同的方法在這裡能夠相互補充,共同推動數學進步,這非常棒。」陶哲軒寫道。

像AlphaEvolve這樣的AI工具,其優勢更在於廣度而非深度。

AI能憑藉其強大的計算和模式識別能力,快速給出直覺性的判斷和有潛力的方向。

它可以像一個孜孜不倦的「偵察兵」,快速掃描廣闊的戰場(問題的可能性空間),找出那些可能存在寶藏(可以改進的地方)的區域。

當AI標出「可疑區域」後,人類專家(或許也需要電腦的輔助進行精細計算)便可以集中火力,進行深度挖掘。

這實際上揭示了一種「AI+人類」雙引擎驅動數學乃至科學進步的新範式。

在探索未知的前沿,單打獨鬥的時代或許正在過去,AI與人類智慧的協同,將是未來的主旋律。

正如一句老話所說:「如果你想走得快,就一個人走;如果你想走得遠,就一起走。」

在AI的加持下,科學研究將會走得更遠。 (新智元)