麻省理工:2025 年人工智慧將如何發展?

2024 年MIT列出了需要關注的四大熱門趨勢,包括所謂的定製聊天機器人——由多模態大型語言模型驅動的互動式助手應用程式(當時還不知道,但其實就是現在每個人都稱之為AI代理的東西,這是目前人工智慧領域最熱門的東西);生成視訊(過去 12 個月中,很少有技術進步如此之快,OpenAI 和 Google DeepMind 在今年 12 月的一周內相繼發佈了他們的旗艦視訊生成模型Sora和 Veo);以及可以執行更廣泛任務的更多通用機器人(大型語言模型的收益繼續滲透到科技行業的其他領域,機器人技術位居榜首)。

那麼 2025 年會發生什麼?顯而易見的事實:您可以肯定,AI代理和更小、更高效的語言模型將繼續塑造這個行業。您已經知道,AI代理和小型語言模型是下一個大趨勢。那麼以下是今年您應該關注的另外五個熱門趨勢。

1. 生成虛擬遊樂場:遊戲、科研 “雙開花”

在虛擬世界的建構方面,科技巨頭Google DeepMind 一馬當先。今年 2 月,其推出的 Genie 模型驚豔眾人,它能夠將靜態圖像巧妙轉化為充滿趣味的橫向滾動 2D 平台遊戲,玩家得以沉浸其中,與虛擬世界深度互動。而到了 12 月,Genie 2 的問世更是將虛擬世界的建構推向了新高度,它可以依據初始圖像,全方位旋轉、拓展,進而生成宏大、逼真的 3D 虛擬世界,讓玩家彷彿置身於另一個次元。

其他公司同樣不甘示弱,人工智慧初創公司 Decart 和 Etched 另闢蹊徑,在 10 月份公佈了一款非官方的 Minecraft 破解版。在這個版本中,遊戲的每一幀都不再是預設好的,而是在玩家即時操作過程中,由 AI 即時生成,真正實現了遊戲場景的無限可能。由李飛飛參與創辦的 World Labs 公司,則將目光聚焦於大型世界模型(LWM)的建構,致力於打造超大規模、超高擬真度的虛擬世界。

這些技術突破帶來的影響是深遠且廣泛的。在遊戲領域,它為遊戲開發者們提供了全新的創作思路,以往受限於人力、物力,難以實現的宏大場景、複雜劇情,如今借助 AI 都能輕鬆達成。玩家們也將迎來遊戲體驗的大革命,更加豐富多元、個性化的遊戲世界將不斷湧現,滿足不同玩家群體的獨特需求。不僅如此,在科研戰線,這些虛擬世界同樣發揮著關鍵作用。機器人研究長期面臨著現實世界資料獲取困難、場景搭建成本高昂的困境,而虛擬世界的出現則完美破解了這一難題。研究人員可以在虛擬環境中建立無數個不同場景,將虛擬機器人置於其中,通過反覆試驗、糾錯,讓機器人快速學習應對各種複雜情況的能力,進而大幅提升機器人的空間智能水平,加速機器人技術的發展與落地。

2. 推理型大語言模型:精準決策 “智多星”

OpenAI 於 9 月推出的 o1 模型,宛如一顆投入湖面的巨石,激起千層浪。它開創性地引入了大型語言模型工作方式的全新範式,一改以往模型簡單直接給出首個答案的做法,轉而通過 “推理”,將複雜棘手的問題逐步拆解為一系列簡單易解的子問題,有條不紊地逐個攻克。兩個月後,o3 模型重磅登場,更是將這一範式推向了新的巔峰,幾乎在各個維度都實現了重大突破,讓問題解決的精準度和效率都得到了質的飛躍。

同樣,Google DeepMind 也在這條賽道上奮勇疾馳。其發佈的實驗性新型網路瀏覽代理 Mariner 便是有力例證。在一次測試中,當被要求尋找一份與給定照片中餅乾一模一樣的聖誕餅乾食譜,並完成線上購物籃配料加入任務時,Mariner 遇到了 “麵粉選型” 的難題。令人驚嘆的是,它並未就此停滯,而是迅速啟動推理機制,將任務拆解為多個操作步驟,精準判斷需要點選 “返回” 按鈕,重新確認麵粉類型,隨後順利完成後續配料加入,整個過程一氣呵成,充分展現了推理型大語言模型的強大決策能力。

目前,Google DeepMind 正在緊鑼密鼓地建構 Gemini 2.0 的實驗版本,該版本融入了先進的循序漸進解決問題方法,即 Gemini 2.0 Flash Thinking,有望進一步提升模型的推理性能。放眼整個行業,眾多公司都敏銳捕捉到了這一發展趨勢,紛紛投身於推理型大語言模型的研發浪潮之中,一場圍繞模型推理能力提升的科技競賽已然拉開帷幕。

這一技術革新的意義非凡,尤其是在數學、物理、邏輯等對思維嚴謹性要求極高的領域,模型能夠像人類一樣,層層剖析問題,避開思維陷阱,給出精準答案,為科研探索、學術研究提供了強有力的工具支撐。在智能代理領域,無論是日常的購物助手、行程規劃師,還是複雜的企業決策輔助、智能客服,推理型大語言模型都能憑藉其出色的決策能力,更好地理解使用者需求,精準提供服務,極大提升使用者體驗,成為推動各行業智能化轉型的核心驅動力。

3.科學研究:AI 點燃探索 “新引擎”

人工智慧最令人興奮的用途之一是加速自然科學的發現。也許人工智慧在這方面潛力的最大證明發生在去年 10 月,當時瑞典皇家科學院將諾貝爾化學獎授予了Google DeepMind 的 Demis Hassabis 和 John M. Jumper,以表彰他們開發了可以解決蛋白質摺疊問題的 AlphaFold 工具,以及開發了有助於設計新蛋白質的工具的 David Baker。

預計這一趨勢明年將繼續,並會出現更多專門用於科學發現的資料集和模型。蛋白質是人工智慧的完美目標,因為該領域擁有可用於訓練人工智慧模型的 優秀現有資料集。

人們開始尋找下一個大熱點。材料科學就是一個潛在的領域。Meta 發佈了海量資料集和模型,可以幫助科學家利用人工智慧更快地發現新材料。12 月,Hugging Face 與初創公司 Entalpic 合作推出了LeMaterial,這是一個旨在簡化和加速材料研究的開放原始碼專案。他們的第一個項目是一個資料集,用於統一、清理和標準化最突出的材料資料集。

AI 模型製作者也熱衷於將他們的生成產品作為科學家的研究工具。OpenAI 讓科學家測試其最新的 o1 模型,看看它如何支援他們的研究。結果令人鼓舞。

擁有一個可以像科學家一樣運作的人工智慧工具是科技界的夢想之一。在去年 10 月發表的一份宣言中,Anthropic 創始人 Dario Amodei 強調科學,尤其是生物學,是強大人工智慧可以提供幫助的關鍵領域之一。Amodei 推測,未來人工智慧可能不僅是一種資料分析方法,而且還是一個“執行生物學家所有任務的虛擬生物學家”。我們距離這一場景還很遠。但明年,我們可能會看到朝著這一目標邁出的重要一步。

4.企業抉擇:軍企合作 “邀請函”

近年來,美軍在 AI 領域佈局緊密,“複製器計畫” 投 10 億美元打造小型無人機叢集作戰優勢,還組建 AI 快速能力小組推動其在戰場決策、後勤保障等環節深度融合,欲借 AI 重塑戰爭規則、掌控戰場主動權。

在此浪潮下,AI 企業抉擇艱難。曾堅守 “不與軍方合作” 的 OpenAI 於 2024 年 12 月宣佈與 Anduril 投身擊落無人機項目研發,開啟軍方合作。背後是利益權衡:研發成本飆升,五角大樓巨額合同可提供資金助力技術迭代;地緣政治緊張、國際競爭加劇,合作有助於提升本國 AI 軍事應用實力,維護國家安全。

但這一抉擇爭議頗多,有人擔憂 AI 軍事化失控,自主武器系統易誤判、失控致無辜傷亡,還可能引發軍備競賽、加劇國際緊張局勢;也有人認為合理軍事應用能發揮 AI 優勢,如提升情報分析與作戰指揮效率、降低士兵傷亡風險,只要有嚴格監管、倫理審查機制,就能趨利避害。

如今,AI 公司站在十字路口,擁抱軍方合作還是堅守民用底線,不同選擇影響未來,時間將給出答案。

5. 晶片競爭:諸侯逐鹿 “新戰場”

在 AI 晶片領域,輝達憑藉 GPU 技術在資料中心、深度學習等場景佔主導。但隨著 AI 發展,晶片爭霸賽開啟,對手紛紛崛起。

晶片巨頭亞馬遜依託雲端運算與技術積累切入賽道,旗下 AWS Inferentia 晶片專為推理最佳化,在雲端推理高效且具成本優勢,可處理海量資料。博通定製化晶片方案在網路通訊、安防監控等領域佈局廣泛,契合複雜應用場景。AMD 持續發力,創新架構設計,GPU 和 CPU 產品性能逐步縮小與輝達差距,受遊戲等領域青睞。

初創陣營的 “晶片黑馬” 也在衝刺,Groq 公司 “資料流架構” 晶片打破傳統設計思維,在 AI 訓練潛力巨大。這些初創公司憑靈活創新、敏銳嗅覺在細分領域深耕,推動技術多元化。

晶片大戰背後有地緣政治因素,美國對中國實施晶片出口管制,阻礙中國 AI 產業崛起。不過這激發了中國本土晶片產業自主創新熱情,寒武紀、華為海思等在政府扶持下取得成果,建構自主可控生態,邁向國際舞台。

結語:

展望 2025 年,人工智慧的發展既充滿無限機遇,又伴隨著諸多挑戰。從技術的深度革新到應用的廣泛拓展,從產業的格局重塑到倫理的思辨權衡,AI 正在以前所未有的速度和廣度改寫著人類社會的運行規則。

然而,我們也需清醒地認識到,AI 前行之路並非坦途。技術瓶頸猶存,如模型的穩定性、資料的隱私安全、演算法的可解釋性等難題,亟待全球智慧合力攻克;倫理爭議紛擾,從潛在的就業結構衝擊,到自主武器的道德困境,無一不考驗著人類的良知與智慧。如何建構公平、透明、有益的 AI 生態,確保技術發展與人類價值觀同頻共振,是我們必須直面的時代問卷。

身為這場科技變革的見證者與參與者,我們每個人都肩負重任。讓我們以開放的胸懷擁抱 AI,用敏銳的洞察捕捉機遇,以審慎的態度管控風險,攜手共創一個人機協同、智慧閃耀的美好未來。相信在人類智慧與 AI 力量的交織輝映下,未來的畫卷必將更加絢麗多彩,超乎想像。 (SDI數字創新)