新·摩爾定律誕生:AI智能體能力每4個月翻一番!智能爆炸在即


【新智元導讀】AI編程智能體的能力正在飛速增長,最新研究揭示了這一「新摩爾定律」,如果AI智能體的任務時長繼續以每4個月翻倍的速度增長,到2027年它們可能完成長達167小時的月級任務!

程式設計智能體能完成的任務量,正以爆炸式的速度增長!

而且,這一趨勢還在加速。

2024到2025年,它們的任務處理能力每4個月翻一倍;而在2019到2025年,這個翻倍周期則是7個月。

22號,AI研究網站AI Digest發表了上述觀點,揭示了一個AI智能體的新摩爾定律。


部落格地址:https://theaidigest.org/time-horizons

從圖表中可以清晰地看到這一趨勢,任務時長的增長軌跡幾乎是一條陡峭的指數曲線。

2019年,GPT-2隻能處理不到1秒的簡單任務;2022年ChatGPT發佈時,AI已經可以完成30秒的程式設計任務。

現在,智能體可以自主完成人類需要一小時才能完成的程式設計任務。

頂尖的AI系統可以完成的任務長度正在呈指數級增長——每7個月翻一番。


這個趨勢是METR的研究人員發現的。

他們選取了2019到2025年間最強的AI模型,測試了它們在大約200個任務上的表現。主要是程式設計任務,也有一些邏輯推理任務。

然後,他們把AI的成功率和每個任務的長度做了對比——任務長度指的是專業人士完成這些任務需要的時間,從不到30秒到超過8小時不等。

測試過所有模型後,出現了兩個明顯的規律:

  1. 任務長度和AI成功率高度相關(相關係數R²=0.83)。
  2. AI成功率達到50%的任務長度——即「時間跨度」——正在呈指數增長。


接下來是什麼?

這個指數增長的趨勢看起來很穩健,沒有停下來的意思。

如果按照這個趨勢推算下去,AI智能體將能夠完成:

  • 2026年:2小時的任務;
  • 2027年:1個工作日(8小時)的任務;
  • 2028年:1個工作周(40小時)的任務;
  • 2029年:1個工作月(167小時)的任務。


最近,這一趨勢還在加速。

2024-2025年間,時間跨度是每4個月任務長度翻一番,而2019-2025年間則是每7個月翻一番。


如果按照2024-2025年加速的趨勢(每4個月翻倍)推算,AI智能體可能在2027年就能完成月級任務(167小時)。

然而,僅觀察一年的資料給出預測可能會不太穩定,實際的進步速度也可能會放緩。


不過,考慮到這個趨勢已經開始加速,它很可能處於一個比指數增長還要快的增長軌道上。

這也很符合直覺:隨著增長軌道直線上升,1周和2周任務之間所需技能的差距,可能比1年和2年任務之間的差距更大。

此外,隨著AI能力的提升,它們在開發更強大AI方面的作用會越來越大,可能導致超指數級增長。


智能爆炸

AI智能體的能力提升會反過來加速更強大AI的研發,形成飛輪效應:更強大的AI智能體能夠更快地開發出更先進的AI系統,從而進一步提升能力。

這種正反饋循環可能導致超指數增長,甚至觸發「軟體智能爆炸」(software intelligence explosion),即AI能力在短時間內急劇提升,遠遠超過人類的水平。

此外,演算法進步也在推動這一趨勢。

METR的研究表明,近年來AI在演算法效率上的提升,顯著降低了計算資源需求。

通過更高效的預訓練和後訓練方法,即使硬體資源不增加,AI智能體的能力也能快速提升。

AI智能體任務時長的指數增長,可能成為人類歷史上最具變革性的趨勢之一。

它能在短時間內完成複雜任務,將徹底改變軟體開發、科學研究、醫療診斷等多個領域。

例如,一個能夠自主完成月級任務的AI智能體,可以完全自動化軟體工程項目,甚至獨立進行科學研究,從而大幅提高生產效率。

這一趨勢也帶來了潛在的社會挑戰。隨著AI智能體能力的快速提升,人類社會可能難以適應這種變化。

許多傳統職業可能面臨自動化,人類可能需要轉向更具創造性和策略性的角色。 (新智元)