史詩時刻! AlphaGo神之一手突現,GoogleAI顛覆科學研究極限?

太瘋狂了,AlphaGo的「第37步」時刻,已經來臨。 Google的AlphaEvolve,讓我們從此進入AI創造科學的時代,人類科學研究將徹底顛覆!背後的研究者也首次接受採訪,揭露研究過程中的一些驚人細節。

這周,GoogleDeepMind丟出了重磅炸彈-AlphaEvolve。

但許多人,彷彿還未意識到這個AI的意義。

可以這麼說,AlphaEvolve,就是數學界AlphaGo的「第37步」時刻,堪稱瘋狂。

Google的這個AI,取得了人類未曾發現的數學成果。

例如,它改進了改進了4x4矩陣乘法,將運算次數從49次減少到48次,這是自1969年Strassen演算法提出以來,56年內的突破!

另外,它還推進了六邊形填充問題的研究,找到了在更大六邊形內排列11個和12個六邊形的更優解法,超越了人類的解決方案(在停滯16年之後)!

甚至,它一舉改進了困擾數學家300多年的「接吻數問題」。


而這一切,都是靠AI自我進化、訓練自己所使用的LLM而得到的。

透過自我對弈,它擁有了超人的編碼能力,甚至讓人預言—

十年內,程式設計將迎來自己的AlphaGo時刻。

而且,跟AlphaGo的「第37步」不同,AlphaEvolve展現出AI自主優化演算法的能力,或將徹底改變晶片設計與資料中心效率。

GoogleCEO Pichai,對「AI訓練AI」進行了生動的解釋:由Gemini驅動的編碼agent,優化了Gemini的訓練,形成了一個資料飛輪

跟以往成果不同的是,GoogleDeepMind這次直接弄出一個通用武器。

從此,AI不僅能解決問題,還能發現新的前沿領域。這代表著,人類集體智慧發生了一次真正的飛躍!

接下來的劇本,或許就是AI橫掃各大科學難題,直接顛覆人類科學研究。


GoogleDeepMind引領全人類未來

GoogleDeepMind,一直在AI改造世界這個方向引領著前線。可以說,在將近30年裡,他們都在指引人類文明的方向。

AlphaGo透過學習人類對弈,甚至自我對弈,擊敗了人類冠軍李世石。

AlphaZero通過自我對弈,學會圍棋、國際象棋和日本將棋,被稱為一種人類從未見過的智慧。

AlphaFold預測了數百萬種從未經過實驗測量的蛋白質三維結構。

AlphaDev則發現了更快的排序演算法。

AlphaTensor用於進行科學發現,將尋找更快矩陣乘法演算法的問題建構成一個遊戲,並實現了重大突破。

FunSearch則將我們帶到更遠,透過程式碼演化,利用LLM尋找新的數學解決方案。

GoogleDeepMind的下一個Alpha,更是令人無比期待。

OpenAI研究員Jason Wei就表示,AlphaEvolve對於像我這樣的強化學習鐵桿粉絲來說,確實令人不安

所以,這次打造出AlphaEvolve的團隊,究竟有那些人物,經歷了那些探索?

就在最近,Youtube上的人氣大V「Machine Learning Street Talk”,就提前獲取了GoogleDeepMind的這篇論文,並採訪了這項工作的研究者。

半個世紀矩陣乘法突破,研究者當場驚呆

在電腦科學領域,幾乎沒有問題能像矩陣乘法一樣基礎。

半個多世紀以來,此領域的一個特定基準,一直被認為難以突破。

因為最優演算法的搜尋空間極為龐大,使得窮舉在實務上幾乎不可能,即使對相對較小的矩陣也是如此。

1969年,Strassen透過發現一種演算法,徹底改變了這個領域。此演算法僅需七次標量乘法,即可乘以兩個二乘二矩陣。

而就在今天,這紀錄被Alpha Evolve打破了!

而它能做到一點,連GoogleDeepMind的研究者都沒想到。

對於通常情況下的矩陣,仍然沒有比使用四十九次乘法進行兩次Strassen更好的辦法。

開始,研究者也壓根沒有期待,它能找到比四十九次更好的結果,因為他們已經用AlphaTensor嘗試了很長時間了。

所以,他們只是出於完整性試了一下,因為想在論文中展示這個表格而已。

結果,出乎所有人意料,一個更快的演算法,居然被它發現了!

這次,演算法使用了48次,而不是49次乘法,徹底打破紀錄。

當看到一位同事發消息通知這一結果時,研究者表示自己簡直不敢相信。

反複檢查三次後,他們終於確認——

AI不斷增強的能力,可以產生全新的、可證明精準的演算法,從而推動科學的邊界!

跟第一個版本有何差別?

根據論文,AlphaEvolve是一種進化編程智能體,顯著提升了預訓練LLM在復雜任務上的能力。

要知道,先前團隊曾有第一篇論文,講的是FunSearch,原理與之非常相似。

所以,二者的區別在那裡呢?

研究者介紹說,FunSearch只是在搜尋一個單一的函數,但AlphaEvolve,本質上可以作用於整個程式碼庫。

它會在程式碼庫中你標記的區域中進行搜尋,甚至優化這些函數之間的互動。


Google昂貴的服務器,不用閒置了

所以,AlphaEvolve有沒有可能進化出一個方法,來優化Google的計算基礎設施呢?

出於嘗試,Google工程師將一個候選方案放進這個AI,令人驚喜的是,它果然進化出了一個更聰明的啟髮式方法!

現在,這個方法已經被運用於優化Google內部的計算基礎設施了。

要知道,在Google龐大的資料中心,高效率安排計算任務是一項非常複雜的操作。如果操作不當,昂貴的伺服器就會閒置。

而現在結果正式,這個全新方法利用了Google服務器群計算資源的0.7%,對於Google來說,這是一項巨大的節省。

盜夢空間成真?

甚至,在另一個自我改進的實例中,它甚至找到了加速Gemini模型訓練的方法,這,就為AlphaEvolve本身提供了動力。

這個實例之所以如此有趣,是因為它不僅產生瞭解決方案,還產生了產生這些方案的程式。

也就是說,Alpha Evolve就像《盜夢空間》一樣。

甚至研究者表示,在檢查程式碼時,他不僅想到,這看起來完全就是一種數學洞察,或者一種數學假設!

事實也證明了,它們確實對改進結果的非常關鍵。

而Alpha Evolve另外一個有趣的點,就是它仍然非常依賴「人類參與其中」。

過程中,人類負責識別那些內容是有趣的,找到那些有明確評估標準的問題,將候選解決方案納入循環中。

然後,Alpha Evolve就會遍歷這個可能性的錐體,在過程中不斷跳躍,將這個循環繼續下去。

所以,Alpha Evolve也預示了一種AI的未來──人類和AI之間,有著強大的協作循環。

曾經有一個「死掉的互聯網」的理論,指的是在未來,網上大部分內容都將由AI生成,而且非常表面化、非常膚淺。

而此時,就需要人類來指導AI、改進結果,進行迭代。

而讓Alpha Evolve如此酷炫且強大的,也正是人與機器之間的這種互動。

AlphaEvolve,為何如此適合科學發現

在訪談中,主持人向研究者提問:究竟是什麼促使你們走上了進化演算法的道路呢?

研究者回答說,這就跟科學發現的過程一樣,是非常自然的選擇。

進化演算法能為探索過程帶來多樣性,確保你不會在早期就鎖定在某種特定方法上,因為這種方法有可能是次優解。

最終,我們仍然需要不斷探索所有的可能性,尤其是在想要做出新的科學發現時。

言簡意賅地說,AlphaEvolve就是一個進化演算法,對於系統給出程式碼片段,我們都可以自動測試它好不好,有多好。

一方面,它可以把你限制在你可以解決的問題集上,另一方面,它涵蓋的問題範圍又非常廣泛。

LLM會為你提出各種想法,透過這個評估器,我們就可以篩選出真正重要的、能做出改變的想法。

最有潛力的代碼,將被識別出來,然後專注於改進這些部分。


接下來,採訪者就提出了一個重要的問題:我們什麼時候才知道,這個過程要結束?

例如,可能我們覺得該終止了,但如果再多等五分鐘,就會得到一個近乎完美的演算法。

研究者解答了他的疑惑。

從理論上講,的確永遠無法確定如何讓演算法運作更久,以及會得到什麼結果。

但在實踐中,這並未造成任何問題。

例如可以這樣設定問題:我正在嘗試解決這個數學中的開放性問題,尋找能取得進展的搜尋演算法,但我希望10分鐘內就能取得進展。

也就是說,其實我們只探索了能在10分鐘內做出進展的演算法空間。

當然的確存在這種可能性:如果運行更長時間,說不定還會有表現更好的演算法。這個可能性永遠無法消除。

那一刻,AI發生了想像力驚人的跳躍

主持人問道:你可以舉出一些系統做出真正有想像力的跳躍的例子嗎?

研究者表示,一個具體的例子,A​​lphaEvolve如何發現矩陣乘法演算法的。

實際上,他們只是讓它設計了一個基於梯度的搜尋演算法,也也就是一個能找出來的演算法的演算法,或是元演算法。

第一個搜尋演算法,是從一個非常簡單的程式碼框架開始的。

研究者並未給它任何東西,只告訴它「用梯度」,然後,它就寫出了這些複雜的損失函數和更新函數,而且以完全出人意料的方式引入了隨機性。

就在那一刻,研究者驚呼:太厲害了!

當然,這種程式碼也有可能是人類寫的,但他們真的會想到要寫出這段特定程式碼嗎?

那一刻,他彷彿頓悟了──AlphaEvolve所做的,是一些類似人類的事情,但又顯然不是人類會嘗試的東西。

人類具體是怎樣指導AI的呢?

研究者提及了一個實驗,在這個實驗中,他們請幾個人花了30分鍾思考這個問題,記下筆記,然後指導系統完成整個過程。

可以理解為,AI榨出了這個想法的全部精華,瞭解它的本質,於是引導LLM得出了這樣的目標,同時做了很多優化。

聽起來,這就是智慧的本質──嘗試很多事情,總有一件會成功。


最震撼之處:改變世界,就在當下

研究者表示,在以往,通常我們很難開發出某種科學研究工具,直接、立刻應用到現實世界的挑戰,並產生巨大影響。

而AlphaEvolve的意義就在於,在開箱時就能同時在數學和科學問題上做出新發現,甚至還能發現可以直接部署到Google核心計算架構中的演算法。

這,是他們以前從未經歷過的事。

AI奇點,或許已經到來了。 (新智元)