【新智元導讀】AI編程智能體的能力正在飛速增長,最新研究揭示了這一「新摩爾定律」,如果AI智能體的任務時長繼續以每4個月翻倍的速度增長,到2027年它們可能完成長達167小時的月級任務!
程式設計智能體能完成的任務量,正以爆炸式的速度增長!
而且,這一趨勢還在加速。
2024到2025年,它們的任務處理能力每4個月翻一倍;而在2019到2025年,這個翻倍周期則是7個月。
22號,AI研究網站AI Digest發表了上述觀點,揭示了一個AI智能體的新摩爾定律。
部落格地址:https://theaidigest.org/time-horizons
從圖表中可以清晰地看到這一趨勢,任務時長的增長軌跡幾乎是一條陡峭的指數曲線。
2019年,GPT-2隻能處理不到1秒的簡單任務;2022年ChatGPT發佈時,AI已經可以完成30秒的程式設計任務。
現在,智能體可以自主完成人類需要一小時才能完成的程式設計任務。
頂尖的AI系統可以完成的任務長度正在呈指數級增長——每7個月翻一番。
這個趨勢是METR的研究人員發現的。
他們選取了2019到2025年間最強的AI模型,測試了它們在大約200個任務上的表現。主要是程式設計任務,也有一些邏輯推理任務。
然後,他們把AI的成功率和每個任務的長度做了對比——任務長度指的是專業人士完成這些任務需要的時間,從不到30秒到超過8小時不等。
測試過所有模型後,出現了兩個明顯的規律:
如果按照這個趨勢推算下去,AI智能體將能夠完成:
最近,這一趨勢還在加速。
2024-2025年間,時間跨度是每4個月任務長度翻一番,而2019-2025年間則是每7個月翻一番。
如果按照2024-2025年加速的趨勢(每4個月翻倍)推算,AI智能體可能在2027年就能完成月級任務(167小時)。
然而,僅觀察一年的資料給出預測可能會不太穩定,實際的進步速度也可能會放緩。
不過,考慮到這個趨勢已經開始加速,它很可能處於一個比指數增長還要快的增長軌道上。
這也很符合直覺:隨著增長軌道直線上升,1周和2周任務之間所需技能的差距,可能比1年和2年任務之間的差距更大。
此外,隨著AI能力的提升,它們在開發更強大AI方面的作用會越來越大,可能導致超指數級增長。
這種正反饋循環可能導致超指數增長,甚至觸發「軟體智能爆炸」(software intelligence explosion),即AI能力在短時間內急劇提升,遠遠超過人類的水平。
此外,演算法進步也在推動這一趨勢。
METR的研究表明,近年來AI在演算法效率上的提升,顯著降低了計算資源需求。
通過更高效的預訓練和後訓練方法,即使硬體資源不增加,AI智能體的能力也能快速提升。
AI智能體任務時長的指數增長,可能成為人類歷史上最具變革性的趨勢之一。
它能在短時間內完成複雜任務,將徹底改變軟體開發、科學研究、醫療診斷等多個領域。
例如,一個能夠自主完成月級任務的AI智能體,可以完全自動化軟體工程項目,甚至獨立進行科學研究,從而大幅提高生產效率。
這一趨勢也帶來了潛在的社會挑戰。隨著AI智能體能力的快速提升,人類社會可能難以適應這種變化。
許多傳統職業可能面臨自動化,人類可能需要轉向更具創造性和策略性的角色。 (新智元)