【新智元導讀】猜想界的皇冠——黎曼猜想,離被證明的那一天不遠了。Grok 3便是關鍵所在:暴力計算+驗證器能讓AI窮舉所有解法,再加上AI輔助科學家打出的組合拳,下一個諾獎級突破近在咫尺。
困擾人類一個多世紀的「黎曼猜想」,如今可能正站在被破解的邊緣。
這周發佈的Grok 3異軍突起,不僅橫掃各大排行榜,更將目光投向了這個「猜想界的皇冠」。
風投機構IBC Group創始人Mario Nawfal發文稱,破解黎曼猜想的競賽正在升溫,而Grok 3可能正是關鍵所在!
究竟是什麼原因,讓他敢於做出這樣一個判斷?
有了這雙重buff的加持,Grok估計什麼時候可以解決這一世紀難題?根據馬斯克的預測,「基於AI的進展,可能將在兩年內實現」。
在Mario看來,雖然目前還沒有解決方案——但Grok 3正在逐步接近破解這個數學界最大的未解之謎之一!
網友對此激動地表示,「暴力計算和人類洞察力的結合,簡直是終極組合拳」。
甚至,還有人大膽預言,下一個諾獎得主就是AI。
Grok 3對決黎曼猜想:突破即將到來?
去年11月,工程師Hieu Pham「爆料」稱,Grok 3證明了黎曼猜想。
為此,xAI不得不終止模型訓練,以驗證它的證明。他表示,如果結果是正確的,將會完全終止模型的訓練。
之後,Hieu Pham發帖稱這只是自己的惡搞
要知道,黎曼猜想可是千禧年七大數學難題之一。
這一次,基於20萬塊GPU訓出的Grok 3,在數學基準測試中AIME 2024上刷新SOTA,創下了52高分。mini版本性能幾乎與Claude 3.5 持平。
與此同時,xAI團隊專門針對最新AIME 2025基準,對Grok 3模型推理版本進行了測試,更是創下了93分紀錄。
AI大神Karpathhy在Grok 3還未發佈之前,曾拿到了灰度測試資格,讓其去證明黎曼猜想猜想。
他表示,相較於其他模型(如o1-pro、Claude、Gemini 2.0 Flash Thinking),只會簡單表示——這是一個偉大的未解之謎,Grok 3非常有勇氣,會嘗試去解決問題。
雖然沒有攻克,但是邁出了「嘗試」的重要一步。
正如Karpathhy所言,誰知呢,總會有那麼一天...
甚至,就連菲爾茲獎得主陶哲軒大膽預測,2026年,AI將與搜尋和符號數學工具相結合,成為數學研究中值得信賴的合著者。
對此,有網友對於人工智慧輔助破解數學謎題的前景感到興奮。
更有網友期待Grok 3將量子力學與相對論一起聯絡起來。
「可能性是無限的」該網友評論道。
Grok 3全面領先!
這些排名是基於人類的盲測評估得出的。
對此,馬斯克表示,Grok位居第一,並持續改進。
「這個結果是基於兩周前的Grok版本。自那時以來Grok有顯著改進。」他表示。
網友Gavin Baker評論說,從2022年夏季到2024年春季,OpenAI曾大幅領先,隨後Google和Anthropic趕上了GPT-4的水平。
OpenAI能夠主導大約7個季度,這歸功於他們率先積極押注於預訓練的傳統「Scaling Law」。然而,率先實現o1等級的推理僅僅使得OpenAI領先幾個月。
目前,Deepseek、Google和xAI與OpenAI大致處於同等水平。xAI甚至可以說處於領先地位。
Google和xAI的基礎模型更優秀,因此它們很可能很快就會徹底超越o3。因此,OpenAI迫切需要GPT-5,作為假定的o5推理模型的基礎。
奧特曼指出,OpenAI未來的領先優勢將會縮小。微軟CEO納德拉也基本表示認同,OpenAI在模型能力方面擁有巨大領先優勢的時期即將結束。
網友Gavin表示,在他看來,這就是為什麼Nadell根據Theinformation的消息,選擇不為OpenAI 1600億美元的預訓練提供資金的原因。相反,他希望通過為OpenAI提供推理服務來賺錢。
Google和xAI都擁有獨特且有價值的資料來源,這將使它們與Deepseek、OpenAI和Anthropic之間的差異越來越大。如果Meta在模型能力方面趕上來,情況也是如此。
Gavin同時指出,無法獲得獨特、有價值資料的前沿模型是歷史上貶值最快的資產。模型蒸餾只會加劇這種情況。
Nadella在最近一次播客中說,資料中心建設過剩即將到來,租用比購買更好。甚至在某個時候,微軟可能會使用開源模型來驅動CoPilot。
未來的前沿模型,如果無法獲得像YouTube、X、TeslaVision、Instagram和Facebook這樣獨特、有價值的資料,可能無法獲得任何投資回報 (ROI)。從這個角度來看,祖克柏的策略似乎也更加合理。獨特的資料最終可能成為區分多兆或千兆參數模型預訓練的唯一基礎,也是獲得投資回報的唯一基礎。
如果這是正確的,那麼只有2-3家公司會進行前沿模型的預訓練,我們只需要少數幾個巨型資料中心來建構預訓練所需的相干叢集。
其餘的人工智慧計算將由較小的資料中心完成,這些資料中心在地理位置上進行了最佳化,以實現低延遲和/或具有成本效益的推理。具有成本效益的推理等於更便宜、質量較低的電力(對核電的需求減少),在短期內對液冷的需求減少等。
這與目前6-10家公司都在進行前沿模型預訓練的世界截然不同。
推理模型需要極高的計算量。測試時計算意味著計算能力本身就是智能。因此,在這種情況下,所需的計算量甚至可能比2023-2024年整個市場所預期的以「預訓練」為中心的計算場景還要多。
但這將是一種截然不同的計算類型,如上所述。預訓練和推理之間的比例將不再是50/50,而是5/95。基礎設施的卓越性將至關重要。
對於網友Gavin Baker的這番分析,馬斯克也表示認同。
「良好的分析」他評論道。
使用者離開ChatGPT轉向Grok
有網友調侃說,他妻子嫉妒Grok 3,因為他跟Grok 3說的話比跟他妻子還多。
對於大家紛紛轉向Grok這事兒,網友紛紛表示贊同。
什麼是黎曼猜想?
質數是那些大於1、只能被1和自己整除的數字,比如2、3、5、7、11、13等等。它們像是自然數的「積木」,因為任何一個自然數都可以拆成質數的乘積,比如15 = 3 × 5。
質數的出現看起來很隨機,沒有簡單的規律可循。
比如在1到10里有4個質數(2、3、5、7),11到20里也有4個(11、13、17、19),但21到30里只有2個(23、29),數量分佈不太好預測。
這讓研究質數分佈成了數學中一個大難題。
質數的研究不只是數學家的興趣,它在現實生活中也很重要。比如,網際網路上的安全通訊(像網上銀行、購物)靠一種叫RSA的密碼系統保護,而RSA的基礎就是利用大質數的不可預測性。
1859年,德國數學家伯恩哈德·黎曼(Bernhard Riemann)想出了一個研究質數的新辦法,引入了一個叫黎曼zeta函數的東西,記作ζ(s)。
簡單來說,zeta函數是一個無限加法公式:
這裡的「s」是一個複數,複數是一種特別的數字,比如s = a + bi(a是實部,b是虛部,i是虛數單位)。
這個函數的神奇之處在於,它跟質數的分佈有很深的聯絡。
零點就是讓ζ(s)等於0的s值。研究發現,這些零點分成兩類:
黎曼猜想的核心是:所有的非平凡零點的實部都等於1/2。
想像一下,把複數s = a + bi畫在平面上,橫軸是實部a,縱軸是虛部b。
黎曼猜想說,所有非平凡零點都會整整齊齊地排在實部a = 1/2這條豎線上。
如果這個猜想是真的,它能讓我們更清楚地知道質數是怎麼分佈的。
比如,它能更精確地預測某個範圍內有多少個質數。這跟一個叫素數定理的東西有關,素數定理告訴我們質數的「大趨勢」,而黎曼猜想則能解釋趨勢裡的「小起伏」。
打個比方,把質數分佈想像成一條河的流量,素數定理像是告訴你河水平均每天流多少水;黎曼猜想則是幫你搞清楚為什麼有些天水流多些,有些天少些。
這種對質數的深入瞭解不只對數學家重要,還會影響像密碼學這樣的領域,因為密碼系統需要質數儘量「隨機」。
黎曼猜想從1859年提出到現在,已經160多年了,但還是沒人能證明它是對是錯。
它被認為是數學裡最重要的問題之一,出現在1900年希爾伯特提出的23個數學難題裡(第8個問題),也被2000年Clay數學研究所列為「千禧年七大難題」之一。
Clay研究所還懸賞100萬美元,鼓勵全世界數學家來挑戰這個問題。現在,電腦已經檢查了無數個非平凡零點,發現它們的實部都是1/2,但這只是證據,不是嚴格的數學證明。
一些數學家,比如Larry Guth和James Maynard,最近在這個問題上有了一些新進展,但離徹底解決還很遠。
黎曼猜想不只是數學裡的「腦洞」,它的研究還推動了很多數學分支的發展,比如復分析和數論的結合。 (新智元)