AI未來的下一個「風口」是什麼?


在談到AI未來的下一個「風口」時,人們往往會從科技與應用的角度予以關注,但不能忽視更深層的因素,即社會與政治等對AI未來的影響。

以ChatGPT為代表的大語言模型技術及其產品掀起的新一輪AI研發與應用狂潮,充分彰顯了人類社會對未來智慧時代前所未有的熱情與期待。誰掌握了AI,誰就掌握了未來的論點被越來越多的人所津津樂道。經過一年多的發展,最初的驚喜與狂熱已更多轉向理性與務實,人們開始將更多精力放在如何確保此輪AI能夠穩定「續航」而非曇花一現。

為此,各方一方面探索下一個“技術風口”,即從技術端探討未來更有價值的技術路線;另一方面尋找下一個“應用風口”,即從應用端尋找未來最有潛力的應用場景。而這事關能否真正在AI發展中獲得真正的優勢,因為在新興科技領域,只有前瞻性的佈局和引領式的發展,才能成為真正的贏家。

技術路線並不單一

通用人工智慧(AGI)如何實現和應用都是其中繞不開的話題甚至是最終目標。目前關注度最高的以ChatGPT為代表的大語言模型路線只是AGI的一個分支,雖然現在其“獨領風騷”,但業界對此有不同看法。

大語言模式批判聲音不斷。作為生成式大語言模型的“領路人”,OpenAI堅持以“大數據、大算力、大模型”的路線發展AGI,這一路線近年來招致多位業界“大佬”批評。早在2023年ChatGPT推出時,圖靈獎得主、Meta公司AI首席科學家楊立昆(Yann Lecun)就表示,就基礎技術而言,此類產品並不具備太多創新性和革命性;今年5月,楊立昆又在接受媒體採訪時提出現有大模型存在「邏輯理解能力極差、無持久記憶、無層次規劃推理能力」等重大缺陷,稱大語言模型「永遠無法達到人類智能水準」。 AI研究領域大拿、深度學習框架Keras創建者弗朗索瓦·肖萊今年6月批評OpenAI竭力炒作大語言模型的行為導致其他AGI研究領域資源和人才匱乏,稱AGI研究進展因此推遲了五到十年。

AGI未來或有多種技術路徑。雖然近兩年AI界的「頭版頭條」幾乎都被大模型所佔據,但業界並未停止對AGI其他實現路徑的研發。 Meta公司AI實驗室自2022年起在楊立昆領導下研究“可以模擬世界運作方式的AI系統”,該理論認為生命在遺傳進化過程中構建起了一套獨特的與物理世界交互的世界模型,真正的智能就蘊含其中。相關研究人員計劃設計一套AI學習範式和架構,使機器能夠以自我監督而非人類幹預的方式學習並掌握世界模型。楊立昆在今年5月受訪時表示計畫10年內完成世界模型系統的研發。人腦科學驅動的AI技術也是話題度較高的一種發展路線。 2022年10月,AI、神經科學、計算神經科學等領域的27位西方頂尖學者共同發布《邁向下一代人工智慧:催化神經人工智慧革命》白皮書,力推神經科學與AI交叉結合,利用對人腦運作機制的研究推動AGI發展,文中甚至將此上升到維持美國AI研究領先優勢的高度。

不同研發路線其實為AI發展注入了更多活力,AI已進入快速發展變革期,究竟是大模型繼續給世界帶來更多驚喜,還是新領域新方法“橫空出世”“大放異彩”,我們拭目以待。


「具身智能」或成未來風潮

不管科技路線如何,從應用端來看,人類對於未來AGI應用的期待無疑地更集中在「具身智慧」上。動漫《哆啦A夢》中機器貓陪伴大雄成長的故事給幾代人留下了深刻印象,當下哆啦A夢的神奇口袋還遙不可及,但具身智能(Embodied AI,EAI)研究或將陪伴人類的機器人變成現實。簡單來說,EAI就是將AI融入機器人等物理實體,賦予它們感知、學習和與物理世界動態互動的能力。 EAI提出時間可追溯至20世紀,但其研究進展緩慢,近年來機器人相關技術逐漸成熟,加之GPT等大語言模型技術為EAI發展注入新動能,EAI的熱度正逐步攀升。

「大佬」紛紛下場力推。早在2023年5月,英偉達執行長黃仁勳就公開表明AI的「前路」在EAI;2024年6月,黃仁勳又在公開演講中稱“AI的新一波浪潮是物理AI”,所謂物理AI是指AI能夠理解現實世界物理定律,實現可以自主運作的AI機器人。 2024年5月,多家媒體報道AI界著名科學家李飛飛正聚焦“空間智能”進行創業,引發業界關注,李飛飛此前曾在TED演講中介紹“空間智能”,該研究涉及AI如何“觀察”、“理解」現實三維空間,從中獲取常識推理能力,進而引導機器人等物理實體進行行動,同樣與EAI密切關聯。

相關產品已加速湧現。近年來EAI領域相關論文、模型、系統甚至機器人成品井噴式湧現,各類探索式研究「百花齊放」。國外方面,Google在ChatGPT發布後不久就推出PaLM-E具身多模態語言模型,隨後持續發布相關模型和機器人訓練資料集等;英偉達自去年起相繼發布多模態EAI系統Nvidia VIMA、人形機器人通用基礎模型Project GR00T等產品;此外,特斯拉、Meta、OpenAI等公司同樣跟進相關技術及產品佈局,積極投資「押注」並壯大自體研發團隊。國內方面,華為於近期發布盤古具身大模型,實現更高水平機器人複雜任務規劃、場景學習和人物執行;小米公司自去年起發布並逐步完善全尺寸人形仿生機器人Cyber​​One;此外,各頂尖院校和科學研究院所,以及銀河通用、星動紀元等新創公司投身EAI研究熱潮,形成了EAI研發的良好生態。

未來發展面臨一些「桎梏」。一是「智能核心」能否進化。例如目前的大模型技術已廣泛應用於EAI研發,顯著增強了EAI系統處理視覺和文字等資訊的能力,成為了多數EAI系統的核心「大腦」。但正如一些技術專家指出,大模型技術本身存在邏輯理解和推理能力匱乏等缺陷,無法解決EAI系統自適應、自學習物理環境的難題,真正能夠支撐未來應用的「智慧核心」還需要更加「聰明」一些;二是資料難題亟待解決。例如EAI要面臨的是物理世界的各個場景,不同場景所需數據量、數據形式各異,數據獲取和高品質融合應用難度高。目前EAI系統訓練資料量較為匱乏,大量訓練依賴模擬數據,系統泛化能力弱、演化速度慢。此外,軟硬體水平不相容、政策跟進有限等問題同樣限制著AI的進一步發展。

誠然,在談到AI未來的下一個「風口」時,人們往往會從科技與應用的角度予以關注,但筆者仍想提醒的是,不能忽視更深層的因素,即社會與政治等對AI未來的影響。

技術從來不是「純粹」的技術,它是在與社會的不斷互動中,尤其是社會的規制與選擇中找到自身演進的軌跡與方向。例如目前對於AI的諸多討論,無論是安全風險或社會變革性影響,都是在從社會維度進行發展與安全的平衡性選擇,「奧本海默糾結」或多或少都會有所體現;再例如眾所周知的百年未有之大變局與新一輪科技革命的迭加共振,AI無疑是大國博弈的重中之重,不可迴避的是,這種基於競爭的邏輯有促進技術進步的一面,但亦有限制技術進步的一面,而這些無疑都會為AI未來帶來深遠影響。

因此,AI未來的下一個「風口」何時會來,又會以一種什麼形式來,來了之後又會給世界帶來怎樣的變化,不單單取決於技術本身的演進,還取決於凌駕於科技之上的社會因素。我們在期待AI發展下一個「風口」的同時,需要深刻體會到,我們也正在塑造AI的下一個「風口」。(中國現代國際關係研究院)