史丹佛發佈《2025年AI指數報告》:AI正以前所未有的速度重塑世界

史丹佛大學以人為本人工智慧研究院(Stanford HAI)在今年4月發佈了備受矚目的《2025年AI指數報告》(AI Index Report 2025)。

這是 Stanford HAI 發佈的第 8 份年度 AI Index 研究報告長達 456 多頁。作為全球最權威的AI發展年度評估報告之一,它全面追蹤了 2024 年全球人工智慧(AI)行業的發展趨勢,並深入分析了AI在研究、技術、經濟、政策、教育和公眾認知等多個維度的最新進展和趨勢,為政策制定者、行業領袖、研究人員和公眾提供了基於嚴謹資料的洞察。

2024年是AI發展史上意義非凡的一年。AI在科學領域的貢獻獲得了諾貝爾物理學獎和化學獎的認可,圖靈獎也頒給了強化學習的奠基性工作。曾被視為遙遠目標的圖靈測試已被當前先進系統超越。

AI的採用以前所未有的速度加速,數百萬人在工作和生活中常規使用AI。隨著高性能、低成本、開放模型的湧現,AI的可及性和影響力將進一步擴大。

考慮到報告篇幅近500頁,報告的開篇部分已對各章節的核心觀點和亮點進行了提煉。讀者可以通過這部分內容快速概覽報告全貌,或直接定位到自己感興趣的領域進行深入閱讀。

本文主要揭示報告部分核心洞察:

一、 技術性能持續突破,AI能力邊界不斷拓展

報告顯示,AI在各項基準測試上的表現持續快速提升。針對先進AI系統極限的新基準測試(如MMMU、GPQA、SWE-bench)在2023年推出後,僅一年時間,AI在這些測試上的得分就大幅提高,例如SWE-bench上的程式設計問題解決率從2023年的4.4%躍升至2024年的71.7%。

值得關注的是,開源模型正在迅速追趕閉源模型。2024年初,領先的閉源模型在Chatbot Arena排行榜上領先開源模型8.0%,到2025年2月,這一差距已縮小至1.7%。

同時,中美兩國在AI模型性能上的差距也在縮小。2023年底,美國領先模型在多個主要基準測試上顯著優於中國同行,而到2024年底,這些差距已大幅縮小至接近持平。

同樣趨勢參考公眾號另一篇文章(摩根士丹利:中國AI,馬上甦醒的巨人!

二、 研發格局演變:產業領跑模型,中美競爭加劇

在AI研發領域,產業界繼續扮演著主導角色,尤其是在“知名AI模型”的開發上。2024年,近90%的知名AI模型來自產業界,遠高於2023年的60%。相比之下,學術界仍然是高被引研究(前100名)的主要來源。

在AI研究出版物總量上,中國繼續領先,2023年佔全球總量的23.2%,其次是歐洲(15.2%)和印度(9.2%)。然而,在最具影響力的研究(高被引論文)方面,美國機構在過去三年中貢獻最多。

圖:中國在AI出版內容在數量上全球領先

AI專利申請量持續增長,2023年全球AI專利授權量達到122,511件,同比增長29.6%。中國在AI專利總量上遙遙領先,佔全球授權量的69.7%,而韓國和盧森堡則在人均AI專利數量上表現突出。

圖:中國AI方面專利數量佔最高(這裡插播下:需要依舊保持理性,數量只是其中一個維度,更重要的是要看到創新力度,能否帶來行業級的變革)

在知名AI模型的產出方面,美國在2024年以40個模型繼續領先,中國以15個模型位居第二,歐洲共計3個。儘管美國在數量上保持優勢,但中國模型在性能上正快速追趕。

圖:知名模型產出上,美國領先,中國第二,其次是歐洲

三、 技術成本與效率:推理成本驟降,訓練消耗激增

AI模型的使用成本(推理成本)正在變得越來越低廉。報告指出,達到GPT-3.5同等性能水平的AI模型,其推理成本在2022年11月至2024年10月期間下降了280多倍,從每百萬tokens 20美元降至0.07美元。

圖:主流模型的每百萬Token成本(看看這個成本墊底的小鯨魚Deepseek,難怪會引發全球資本驚愕)

硬體層面,AI硬體性能持續提升(年增長43%),價格性能改善(成本年降30%),能源效率提高(年增40%)。

然而,訓練前沿AI模型的計算需求和能源消耗仍在快速增長。知名AI模型的訓練計算量大約每五個月翻一番,訓練大型語言模型的資料集規模每八個月翻一番,訓練所需的電力每年翻一番。這導致訓練成本居高不下。隨之而來的是碳排放的增加。

圖:訓練前沿模型所需要的總功耗

值得關注的是,AI Agent(人工智慧代理)在今年報告中也開始嶄露頭角,展現出早期潛力。

2024年推出的 RE-Bench 基準測試為評估AI Agent執行複雜任務的能力提供了嚴苛的標準。測試結果顯示,在短時任務(例如兩小時預算內)中,頂級的AI系統得分比人類專家高出四倍。然而,隨著時間預算的增加,人類的表現會超越AI,在32小時的預算下,人類得分是AI的兩倍。

儘管如此,AI Agent在特定任務上已經能夠媲美人類專家。AI Agent正逐步從理論走向實際應用,尤其在需要快速迭代和執行特定複雜操作的場景中。

四、 負責任AI與治理:風險事件增加,政府行動加速

與AI相關的事件報告數量持續增加,2024年達到233起。企業雖然認識到RAI風險,但在採取實際緩解措施方面存在滯後。相比之下,各國政府表現出更高的緊迫性。

各國政府正在加速AI立法和投資。全球範圍內,立法程序中提及AI的次數持續攀升,自2016年以來增長了九倍,僅2024年就比2023年增加了21.3%。

2024年,美國聯邦機構出台的AI相關法規數量翻了一番多。加拿大、中國、法國、印度、沙烏地阿拉伯等國都宣佈了數十億甚至千億美元等級的國家AI基礎設施投資計畫。這表明AI已成為各國議程上的重要議題。

五、 經濟影響與投資:商業採用激增,投資創紀錄

全球私人AI投資在2024年創下新高,達到2523億美元,同比增長26%。其中,生成式AI領域勢頭強勁,吸引了339億美元的私人投資,較2023年增長18.7%。

AI的商業使用率大幅攀升。2024年,78%的組織報告使用了AI,高於2023年的55%。超過一半的受訪者表示在至少一個業務職能中使用了生成式AI。儘管如此,大多數公司仍處於AI應用的早期階段,報告的財務影響(成本節約或收入增長)處於較低水平。

區域層面,北美在組織AI使用方面保持領先,但大中華區和歐洲的增長速度最快,顯示出全球AI實施競爭的加劇。中國在工業機器人安裝量上繼續保持主導地位,協作機器人和互動機器人的安裝也變得更加普遍。

圖:報告列舉了2024年期間的重大投資線(有興趣的投資者可以直接定位到221頁查閱)

六、勞動力市場:AI發展改變崗位需求

AI對勞動力市場的影響是公眾普遍關注的焦點。在美國市場,人工智慧技能彙總,需求最高的是人工智慧,佔0.9%,其次是機器學習,佔0.9%,然後是自然語言處理。

圖:人工智慧在所有職位招聘廣告中的佔比
圖:2023年與2024年美國AI職位招聘廣告所需AI技能(可以看到一年中人工智慧崗位需求激增)

報告深入分析和引用的研究證實,AI能夠顯著提升生產力,並且在大多數情況下有助於縮小勞動力隊伍中的技能差距。

更詳細的崗位趨勢還可以參考公眾號另一篇文章(麥肯錫AI報告:組織重塑觸發崗位大洗牌(3年趨勢)

七、 AI在具體領域(如醫學、教育領域)的突破

AI在科學發現中的作用持續擴大,尤其是在生物學和醫學領域。新的研究表明,AI在診斷複雜臨床病例、癌症檢測等方面已能超越醫生,但AI與醫生的協作可能產生最佳結果。

美國FDA批准的AI醫療裝置數量激增,從2015年的6個增加到2023年的223個。合成資料在醫學領域顯示出巨大潛力,可用於識別健康社會決定因素、保護隱私的臨床風險預測以及藥物發現。

全球三分之二的國家現在提供或計畫提供K-12電腦科學(CS)教育,是2019年的兩倍,非洲和拉丁美洲進步最大。

在美國,雖然大多數K-12 CS教師認為AI應納入基礎CS教育,但只有不到一半的教師感到有能力教授AI。

美國電腦科學學士學位畢業生數量在過去十年中增長了22%,AI碩士學位畢業生數量在2022年至2023年間幾乎翻了一番。

(科學與醫學突破這一章內容相對專業,感興趣的朋友可以直接定位到285頁瞭解詳情。)

八、 公眾認知:樂觀情緒上升,但區域差異與擔憂並存

全球公眾對AI產品和服務的樂觀情緒正在上升。在26個受調查國家中,18個國家認為AI產品和服務利大於弊的人數比例有所增加。全球範圍內,這一比例從2022年的52%上升到2024年的55%。

區域差異依然顯著,中國(83%)、印度尼西亞(80%)、泰國(77%)等國絕大多數人認為AI利大於弊,而加拿大(40%)、美國(39%)、荷蘭(36%)等國的樂觀情緒較低,儘管這些國家的樂觀情緒自2022年以來有所增長。

與此同時,全球60%的受訪者認為AI將在未來五年內改變他們的工作方式。然而,對於AI將完全取代他們工作的擔憂程度相對較低,只有36%的受訪者持此觀點。

史丹佛大學以人為本人工智慧研究院在官方網站上寫道:

AI 將是 21 世紀最具變革性的技術。然而,除非我們精心引導 AI 行業的發展,否則這項技術將難以惠及普羅大眾。

(旁觀者手記)