AI的下一個十年,是建構空間智能的機器。李飛飛最新硬核長文,揭秘了空間智能「世界模型」核心框架和三大核心支柱。AI的下一個前沿,是「空間智能」。它是一項能讓「看見」昇華為「推理」,讓「感知」蛻變為「行動」,讓「想像」落地為「創造」的技術。但「空間智能」究竟是什麼?為何如此重要?該如何建構它?又該如何應用它?今天,李飛飛撰萬字長文分享了自己關於建構和使用「世界模型」以解鎖空間智能的思考。新文章中,她為真正具備空間智能的「世界模型」所需達成的目標勾勒了一個框架。具體來說,建構這樣的AI必須具備三大核心能力:讓AI擁有故事講述家的想像力去創造,擁有急救人員般的敏捷性去導航,並擁有科學家的嚴謹去推理空間。李飛飛與LeCun共識的一點是,「世界模型」是解鎖空間智能的核心。它必須能生成遵循物理定律、在空間上保持一致的世界,能處理從圖像到動作的多模態輸入,並能預測這些世界將如何演變或與之互動。空間智能的應用疆域,正沿著一條清晰路徑演進。當下,它正賦能創意,World Labs Marble項目已經將這些能力交到了創作者和故事講述者的手中。下一步,它將駕馭物理世界,機器人實現感知與行動之間的閉環。而最具變革性的科學應用,雖然需要更長時間,但有望對人類福祉產生深遠影響。哲學家維特根斯坦曾寫道:「我語言的極限,意味著我世界的極限。」李飛飛表示,「我不是哲學家,但我深知,至少對AI而言,世界遠不止於文字」。空間智能代表了超越語言的前沿——它是一種將想像、感知與行動融會貫通的能力,為機器真正提升人類生活開啟了無限可能,從醫療健康到創意揮灑,從科學探索到日常輔助。眾多網友點評,這是李飛飛一篇非常重要的文章,空間智能必讀之作!從語言到世界:空間智能是AI的下一個前沿1950年,當計算還只是自動化算術和簡單邏輯的代名詞時,阿蘭·圖靈提出了一個至今仍振聾發聵的問題:機器能否思考?能洞見他所預見的一切,需要非凡的想像力:智能有朝一日或可後天建構,而非與生俱來。這一洞見,後來開啟了一場名為「人工智慧」(AI)的不懈科學探索。在我投身AI領域的第二十五個年頭,圖靈的遠見卓識依然激勵著我。但我們離這個目標還有多近?答案並非一言以蔽之。如今,以大語言模型(LLM)為代表的頂尖AI技術已開始改變我們獲取和運用抽象知識的方式。然而,它們仍是黑暗中的文字大師;能言善辯卻缺乏經驗,知識淵博卻脫離現實的根基。空間智能將改變我們創造以及與真實和虛擬世界互動的方式——為故事敘述、創意、機器人技術、科學發現等領域帶來革命性的變革。這,就是AI的下一個前沿。對視覺與空間智能的追求,是我踏入該領域以來始終指引我前行的「北極星」。正因如此,我花費數年時間建構了ImageNet——首個大規模視覺學習與基準測試資料集,它與神經網路演算法、圖形處理器(GPU)等現代計算裝置一道,成為催生現代AI的三大關鍵基石之一。正因如此,我在史丹佛大學的學術實驗室在過去十年裡,始終致力於將電腦視覺與機器人學習相結合。也正因如此,一年多前,我與聯合創始人Justin Johnson、Christoph Lassner、Ben Mildenhall共同創立了World Labs:旨在首次將這一可能性淋漓盡致地變為現實。World Labs創始人團隊,左起依次為Ben Mildenhall、Justin Johnson、Christoph Lassner和李飛飛在本文中,我將闡釋何為空間智能、其重要性何在,以及我們如何建構能夠解鎖它的「世界模型」——其深遠影響將重塑創意、具身智能與人類的進步。空間智能:人類認知的基石人工智慧的發展從未如此激動人心。像大語言模型這樣的生成式AI已經從實驗室走向日常生活,成為數十億人創意、生產力和溝通的工具。它們展現了曾被認為遙不可及的能力,能輕鬆生成連貫的文字、浩如煙海的程式碼、逼真的圖像,乃至短影片片段。AI是否會改變世界已不再是疑問。無論以何種合理的標準衡量,它都已然做到了。然而,仍有太多領域是我們力所不及的。自主機器人的願景雖引人入勝,卻仍停留在理論層面,遠未成為未來學家們長期許諾的日常必需品。在疾病治療、新材料發現和粒子物理學等領域實現研究處理程序大飛躍的夢想,在很大程度上仍未實現。而AI真正理解並賦能人類創作者的承諾——無論是幫助學生理解分子化學的複雜概念,協助建築師構想空間,支援電影製作人建構世界,還是為任何尋求完全沉浸式虛擬體驗的人提供支援——也依然遙不可及。要理解為何這些能力仍難以實現,我們需要審視空間智能的演化歷程,以及它如何塑造我們對世界的認知。視覺長久以來都是人類智能的基石,但其力量源於某種更為根本的能力。遠在動物學會築巢、哺育後代、用語言交流或建立文明之前,感知這一簡單的行為就已悄然點燃了通往智能的進化火花。這種從外部世界(無論是一縷微光還是一絲觸感)收集資訊的看似孤立的能力,在感知與生存之間架起了一座橋樑,並隨著代代繁衍而愈發堅固和精巧。層層疊疊的神經元從這座橋樑上生長出來,形成了能夠解讀世界並協調生物體與環境互動的神經系統。因此,許多科學家推斷,感知與行動的循環成為驅動智能進化的核心動力,也是自然界創造出我們人類——這一集感知、學習、思考與行動於一體的終極造物——的根基。空間智能在定義我們如何與物理世界互動方面扮演著至關重要的角色。每一天,我們都依賴它來完成最平凡的舉動:通過想像保險槓與路緣之間不斷縮小的間隙來停放汽車,接住拋過房間的一串鑰匙,在擁擠的人行道上穿行而避免碰撞,或是在睡眼惺忪中不看一眼便將咖啡倒入杯中。在更極端的情況下,消防員在濃煙瀰漫、搖搖欲墜的建築中穿行,對結構的穩定性和自身的生存在瞬間做出判斷,並通過手勢、肢體語言和一種無可替代的職業直覺進行交流。而嬰幼兒則在學會說話前的整段歲月裡,通過與環境的嬉戲互動來認知世界。所有這一切都發生得如此直觀、自然——這是機器尚未能企及的自如與嫻熟。空間智能同樣是我們想像力與創造力的基石。故事講述者在腦海中創造出異常豐富的世界,並利用從古老的洞穴壁畫到現代電影,再到沉浸式視訊遊戲等多種視覺媒介,將這些世界呈現給他人。無論是孩童在沙灘上堆砌沙堡,還是在電腦上玩《我的世界》,基於空間的想像力構成了真實或虛擬世界中互動體驗的基礎。在眾多行業應用中,對物體、場景和動態互動環境的模擬,為從工業設計到數字孿生,再到機器人訓練等無數關鍵商業用例提供了動力。歷史上充滿了由空間智能扮演核心角色的、定義文明處理程序的時刻。在古希臘,埃拉托色尼將光影轉化為幾何學——在太陽直射賽伊尼城的同一時刻,於亞歷山大港測得7度的夾角——從而計算出地球的周長。哈格里夫斯的「珍妮紡紗機」憑藉一個空間洞見徹底改變了紡織業:將多個紡錘並排置於同一框架內,使得一名工人能同時紡織多根紗線,生產效率提升了八倍。沃森和克里克通過親手搭建3D分子模型發現了DNA的結構,他們不斷擺弄金屬板和金屬絲,直至鹼基對的空間排列「咔噠」一聲完美契合。在每一個案例中,當科學家和發明家需要操控物體、構想結構、推理物理空間時,空間智能都推動了文明的進步——而這些,都非文字所能單獨承載。空間智能是我們認知賴以建構的基石。無論我們是被動觀察還是主動創造,它都在發揮作用。它驅動著我們的推理與規劃,即便是面對最抽象的議題。它對於我們互動的方式——無論是口頭還是肢體,與同伴還是與環境本身——都至關重要。雖然我們大多數人並非每天都能像埃拉托色尼那樣揭示新的宇宙真理,但我們日常的思考方式與他並無二致——通過感官感知複雜的世界,再利用一種對物理、空間運作方式的直觀理解來賦予其意義。不幸的是,今天的AI還不能這樣思考。過去幾年確實取得了巨大進步。多模態大語言模型(MLLM)除了文字資料外,還用大量的多媒體資料進行訓練,引入了一些基本的空間意識,今天的AI可以分析圖片、回答關於圖片的問題,並生成超逼真的圖像和短影片。通過感測器和觸覺技術的突破,我們最先進的機器人可以在高度受限的環境中開始操縱物體和工具。然而,坦率的真相是,AI的空間能力仍遠未達到人類水平,其侷限性很快便會暴露無遺。在估算距離、方向和尺寸,或通過從新角度生成圖像來進行物體的「心理旋轉」等任務上,最先進的MLLM模型的表現鮮有超過隨機猜測的。它們無法走出迷宮、識別捷徑或預測基本的物理現象。AI生成的視訊——儘管初露鋒芒,且的確酷炫——通常在幾秒鐘後便會失去連貫性。雖然當前最先進的AI在閱讀、寫作、研究和資料模式識別方面表現出色,但這些模型在表徵或與物理世界互動時,卻存在根本性的侷限。我們對世界的看法是整體性的——不僅僅是眼前所見,還包括萬物在空間上的相互關聯、其意義以及其重要性。通過想像、推理、創造和互動——而不僅是描述——來理解這一切,正是空間智能的力量所在。若無此能力,AI便與它試圖理解的物理現實脫節。它將無法有效地駕駛我們的汽車,引導家中的機器人或醫院的護理機器人,也無法為學習和娛樂開啟全新的沉浸式互動體驗,更無法加速材料科學和醫學領域的探索發現。哲學家維特根斯坦曾寫道:「我語言的極限,意味著我世界的極限。」我不是哲學家,但我深知,至少對AI而言,世界遠不止於文字。空間智能代表了超越語言的前沿——它是一種將想像、感知與行動融會貫通的能力,為機器真正提升人類生活開啟了無限可能,從醫療健康到創意揮灑,從科學探索到日常輔助。AI的下一個十年:建構真正具備空間智能的機器那麼,我們該如何建構具備空間智能的AI?如何才能打造出能夠像埃拉托色尼一樣洞察深遠、像工業設計師一樣精雕細琢、像故事講述家一樣天馬行空,並像急救人員一樣敏捷自如地與環境互動的模型?建構具備空間智能的AI需要比大語言模型更為宏大的構想:世界模型。這是一種新型的生成模型,其理解、推理、生成以及與語義、物理、幾何和動態上都極為複雜的虛擬或真實世界進行互動的能力,遠非今日的LLM所能企及。不過,這一領域尚處萌芽階段,當前方法涵蓋了從抽象推理模型到視訊生成系統的各種探索。World Labs正是基於這一信念於2024年初創立的:基礎方法尚在建立之中,而這將成為未來十年的決定性挑戰。在這個新興領域,最重要的是確立指導發展的基本原則。對於空間智能,我通過三大核心能力來定義世界模型:1. 生成式:世界模型能生成在感知、幾何和物理層面保持一致的世界能解鎖空間理解與推理能力的世界模型,也必須能生成屬於自己的模擬世界。它們必須能夠生成無窮無盡、千變萬化的模擬世界,這些世界遵循語義或感知指令,同時在幾何、物理和動態層面保持一致性——無論其表徵的是真實空間還是虛擬空間。研究界正在積極探索,這些世界固有的幾何結構應該被隱式表徵還是顯式表徵。此外,我相信,除了強大的潛在表徵,一個通用的世界模型的輸出還必須能為眾多不同的用例生成一個顯式的、可觀察的世界狀態。尤其重要的是,它對當前狀態的理解必須與其過去——即導致當前狀態的先前世界狀態——連貫地聯絡在一起。2. 多模態:世界模型在設計上是多模態的正如動物與人類一樣,世界模型應該能夠處理多種形式的輸入——在生成式AI領域,這被稱為「提示詞」。在給定部分資訊——無論是圖像、視訊、深度圖、文字指令、手勢還是動作——的情況下,世界模型應能預測或生成儘可能完整的世界狀態。這要求它既能以真實視覺的保真度處理視覺輸入,又能同樣自如地解讀語義指令。這使得智能體和人類都能通過多樣化的輸入與模型與世界進行交流,並反過來接收多樣化的輸出。3. 互動性:世界模型能根據輸入的動作輸出下一個狀態最後,如果動作和/或目標是給予世界模型的提示詞的一部分,那麼其輸出必須包含世界的下一個狀態,無論是隱式還是顯式表徵。當僅給定一個動作(無論是否包含目標狀態)作為輸入時,世界模型產生的輸出必須與世界先前的狀態、任何預設的目標狀態、其語義含義、物理定律以及動態行為保持一致。隨著具備空間智能的世界模型在推理和生成能力上變得日益強大和穩健,可以想見,在給定目標的情況下,世界模型本身將不僅能預測世界的下一個狀態,甚至還能基於新狀態預測出下一步的動作。這項挑戰的廣度與深度,超越了AI以往所面對的任何課題。語言是人類認知中純粹的生成現象,而世界則遵循著遠為複雜的規則。例如,在地球上,引力支配運動,原子結構決定光如何產生色彩與亮度,無數物理定律約束著每一次互動。即便是最天馬行空的創意世界,也由遵循其自身物理定律和動態行為的空間物體與智能體構成。要將這一切——語義、幾何、動態與物理——持續一致地調和起來,需要全新的方法論。表徵一個世界的維度,遠比像語言這樣的一維、順序訊號複雜得多。要實現能提供如人類般通用能力的世界模型,需要克服若干嚴峻的技術壁壘。在World Labs,我們的研究團隊正致力於朝此目標取得根本性的進展。以下是我們當前研究課題的一些示例。· 一種新的、通用的訓練任務函數:定義一個像LLM中「預測下一個token」一樣簡潔而優雅的通用任務函數,長久以來都是世界模型研究的核心目標。由於其輸入和輸出空間的複雜性,這種函數的建構本質上更加困難。儘管仍有待探索,但這個目標函數及相應的表徵必須能反映幾何與物理定律,尊重世界模型作為想像與現實之根基表徵的本質。· 大規模訓練資料:訓練世界模型需要比文字整理複雜得多的資料。好消息是:海量的資料來源業已存在。網際網路規模的圖像和視訊集是豐富且易於獲取的訓練材料——挑戰在於開發能夠從這些二維圖像或視訊幀訊號(即RGB)中提取更深層次空間資訊的演算法。過去十年的研究已證明了語言模型中資料量與模型大小之間的「規模定律」的力量;世界模型的關鍵突破在於建構能夠以相當規模利用現有視覺資料的架構。此外,我絕不會低估高品質合成資料以及深度、觸覺資訊等額外模態的力量。它們在訓練過程的關鍵階段對網際網路規模的資料形成了重要補充。但前路漫漫,這有賴於更好的感測器系統、更穩健的訊號提取演算法以及遠為強大的神經模擬方法。· 新的模型架構與表徵學習:世界模型的研究將不可避免地推動模型架構與學習演算法的進步,尤其是在當前MLLM和視訊擴散範式之外。這兩種範式通常將資料「token化」為一維或二維序列,這使得一些簡單的空間任務變得異常困難——例如,計算一個短影片中不重複的椅子數量,或者記住一個小時前房間的樣貌。替代性架構或可助一臂之力,例如具備三維或四維感知能力的token化、上下文和記憶方法。例如,在World Labs,我們近期關於一個名為RTFM的即時生成性幀基模型的工作就展示了這種轉變,它使用基於空間的幀作為一種空間記憶形式,以實現高效的即時生成,同時在生成的世界中保持持久性。顯然,在我們能夠通過世界建模完全解鎖空間智能之前,仍面臨著艱巨的挑戰。這項研究不僅是一次理論演練,它是一類新型創意與生產力工具的核心引擎。而World Labs內部的進展令人鼓舞。我們最近向少數使用者展示了Marble的一瞥——這是首個能夠通過多模態輸入提示,來生成並維持一致三維環境的世界模型,供使用者和故事講述者在其創意工作流中進行探索、互動和進一步建構。我們正努力使其盡快向公眾開放!Marble只是我們創造真正具備空間智能的世界模型的第一步。隨著進展加速,研究人員、工程師、使用者和商界領袖都開始認識到其非凡的潛力。下一代世界模型將使機器能夠在全新層面上實現空間智能——這一成就將解鎖當今AI系統中仍然普遍缺失的核心能力。用世界模型為人類建構一個更美好的世界是什麼在激勵AI的發展?這一點至關重要。作為協助開啟現代AI時代的科學家之一,我的動機始終明確:AI必須增強人類的能力,而非取而代之。多年來,我一直致力於使AI的開發、部署和治理與人類的需求相契合。如今,關於技術烏托邦和末日論的極端敘事甚囂塵上,但我始終持有一種更務實的觀點:AI由人開發,為人所用,由人治理。它必須始終尊重人的能動性與尊嚴。它的魔力在於擴展我們的能力,讓我們更有創造力、聯絡更緊密、效率更高、生活更充實。空間智能正是這一願景的體現——AI賦能人類的創作者、照護者、科學家和夢想家,去實現曾經的不可能。這一信念,是我將空間智能作為AI下一個偉大前沿並為之奮鬥的動力。空間智能的應用橫跨不同的時間尺度。創意工具正不斷湧現——World Labs的Marble項目已經將這些能力交到了創作者和故事講述者的手中。隨著我們不斷完善感知與行動之間的閉環,機器人技術將是雄心勃勃的中期目標。而最具變革性的科學應用雖然需要更長時間,但有望對人類的福祉產生深遠影響。在所有這些時間尺度上,有幾個領域因其重塑人類能力的潛力而格外突出。這需要巨大的集體努力,遠非一個團隊或一家公司所能實現。具體來說,它需要整個AI生態系統的參與——研究人員、創新者、企業家、公司,乃至政策制定者——共同為實現一個共享的願景而努力。但這個願景值得我們去追求。以下是這個未來所蘊含的圖景:創造力:為故事敘述和沉浸式體驗注入超凡動力「創造力是智力在享受樂趣。」這是我最喜歡的 愛因斯坦名言之一。早在書面語言出現之前,人類就已開始講述故事——將其描繪於洞穴岩壁,代代相傳,在共同的敘事之上建立起整個文化。故事是我們理解世界、跨越時空建立聯絡、探索人性意義的方式,最重要的是,在生活中找到意義,在內心發現愛。今天,空間智能有潛力改變我們創造和體驗敘事的方式,既尊重其根本的重要性,又將其影響力從娛樂延伸至教育,從設計延伸至建築。World Labs的Marble平台將把前所未有的空間能力和編輯可控性交到電影製作人、遊戲設計師、建築師和各類故事講述者的手中,讓他們能夠快速創造和迭代完全可探索的三維世界,而無需傳統三維設計軟體的沉重負擔。創造行為本身依然如故,充滿人性的活力;AI工具只是放大和加速了創作者所能達成的成就。這包括:新維度的敘事體驗:電影製作人和遊戲設計師正使用Marble憑空創造出整個世界,不受預算或地理位置的限制,探索在傳統製作流程中難以企及的各種場景和視角。隨著不同形式的媒體與娛樂之間的界限日益模糊,我們正在接近一種全新的互動體驗,它融合了藝術、模擬與遊戲——個性化的世界,其中任何人,而不僅是工作室,都可以創造並沉浸在自己的故事中。隨著將概念和故事板轉化為完整體驗的更新、更快捷的方式的出現,敘事將不再侷限於單一媒介,創作者可以自由地在無數的介面和平台上建構具有共同主線的大千世界。通過設計的空間敘事:幾乎每一個製造的物體或建造的空間,在其實體化之前都必須在虛擬三維環境中進行設計。這個過程在時間和金錢上都高度迭代且成本高昂。有了具備空間智能的模型,建築師可以快速構想結構,而無需投入數月時間進行設計,他們可以在尚未存在的空間中漫步——這本質上是在講述我們未來可能如何生活、工作和聚集的故事。工業設計師和時裝設計師可以瞬間將想像轉化為形態,探索物體如何與人體和空間互動。新的沉浸式和互動體驗:體驗本身是我們作為一個物種創造意義的最深層方式之一。在整個人類歷史中,只有一個單一的三維世界:我們共同生活的物理世界。僅在近幾十年,通過遊戲和早期的虛擬現實(VR),我們才開始一窺我們自己創造的替代世界是何種滋味。現在,空間智能與新的裝置形態(如VR和擴展現實(XR)頭顯及沉浸式顯示器)相結合,以前所未有的方式提升了這些體驗。我們正在接近一個未來,屆時,步入一個完全實現的多維世界將像翻開一本書一樣自然。空間智能讓世界建構不再是擁有專業製作團隊的工作室的專利,而是個人創作者、教育工作者以及任何有願景希望分享的人都能觸及的能力。機器人技術:具身智能在行動從昆蟲到人類,動物都依賴空間智能來理解、導航並與它們的世界互動。機器人也不例外。自誕生之日起,具備空間意識的機器就一直是該領域的夢想,這其中也包括我與我在史丹佛研究實驗室的學生及合作者們的工作。這也是為何我如此興奮,期待能用World Labs正在建構的這類模型將這一夢想變為現實。通過世界模型規模化機器人學習:機器人學習的進展取決於一個可擴展的、可行的訓練資料解決方案。考慮到機器人必須學習去理解、推理、規劃和互動的狀態空間極其龐大,許多人推測,需要結合網際網路資料、合成模擬以及對真實世界人類演示的捕捉,才能真正創造出具備泛化能力的機器人。但與語言模型不同,當今的機器人研究缺乏訓練資料。世界模型將在此扮演決定性角色。隨著它們在感知保真度和計算效率上的提升,世界模型的輸出可以迅速彌合模擬與現實之間的鴻溝。這反過來將有助於在無數的狀態、互動和環境模擬中訓練機器人。伴侶與協作者:機器人作為人類的協作者——無論是在實驗室工作台上協助科學家,還是在家中幫助獨居老人——都可以在急需更多勞動力和生產力的領域擴展我們的勞動力。但這需要具備感知、推理、規劃和行動的空間智能,同時——這是最重要的——與人類的目標和行為保持共情式的對齊。例如,一個實驗室機器人可以處理儀器,讓科學家能專注於需要精細操作或推理的任務;而一個家庭助理則可以幫助一位老年人做飯,而不會削弱他們的樂趣或自主性。能夠預測下一個狀態,甚至可能預測出符合這種期望的下一步動作的、真正具備空間智能的世界模型,對於實現這一目標至關重要。擴展具身形式:人形機器人在我們為自己建構的世界中扮演著一定角色。但創新的全部益處將來自更多樣化的設計:輸送藥物的奈米機器人、在狹小空間中穿行的軟體機器人,以及為深海或外太空打造的機器。無論其形態如何,未來的空間智能模型都必須整合這些機器人所處的環境以及它們自身的具身感知與運動。但開發這些機器人的一個關鍵挑戰是,在這些五花八門的具身形態上缺乏訓練資料。世界模型將在模擬資料、訓練環境和基準測試任務等方面為這些努力發揮關鍵作用。更長遠的圖景:科學、醫療與教育除了創意和機器人應用,空間智能的深遠影響還將延伸至那些能以拯救生命、加速發現的方式增強人類能力的領域。我下面重點介紹三個可能帶來深刻變革的應用領域,當然,空間智能的用例在更多行業中同樣是廣闊無垠的。在科學研究中,具備空間智能的系統可以模擬實驗、平行測試假設,並探索人類無法觸及的環境——從深邃的海洋到遙遠的行星。這項技術可以改變氣候科學和材料研究等領域的計算建模。通過將多維模擬與真實世界的資料收集相結合,這些工具可以降低計算門檻,擴展每個實驗室所能觀察和理解的範圍。在醫療健康領域,空間智能將重塑從實驗室到病床邊的每一個環節。在史丹佛,我的學生和合作者多年來一直與醫院、養老院以及居家患者合作。這段經歷讓我堅信空間智能在此處的變革潛力。AI可以通過在多維空間中建模分子相互作用來加速藥物發現,通過幫助放射科醫生在醫學影像中識別模式來提升診斷水平,並能實現環境監測系統,在不取代治癒所必需的人類情感聯結的前提下,為患者和照護者提供支援。更不用說機器人在眾多不同場景下幫助我們的醫護人員和患者的巨大潛力。在教育領域,空間智能可以實現沉浸式學習,使抽象或複雜的概念變得觸手可及,並創造出對我們大腦和身體學習方式至關重要的迭代式體驗。在AI時代,更快、更有效的學習和技能再培訓對於學齡兒童和成年人都尤為重要。學生可以在多維空間中探索細胞的運作機制或親歷歷史事件。教師可以利用互動環境獲得個性化教學的工具。從外科醫生到工程師的專業人士,都可以在逼真的模擬中安全地練習複雜技能。在所有這些領域,可能性是無限的,但目標始終如一:AI增強人類的專業知識,加速人類的發現,並放大人類的關懷——而不是取代作為人類核心的判斷力、創造力和同理心。結 論過去十年見證了AI成為一種全球現象,以及技術、經濟乃至地緣政治的轉折點。但作為一名研究者、教育者,如今又是一名創業者,最能激勵我的,仍然是圖靈75年前提出的那個問題背後的精神。我依然懷有他那份好奇與驚嘆。正是這種感覺,每天都激勵著我迎接空間智能的挑戰。歷史上第一次,我們有望建構出與物理世界如此協調的機器,以至於在我們面臨的最嚴峻挑戰中,可以將它們視為真正的夥伴。無論是加速我們對實驗室中疾病的理解,徹底改變我們講述故事的方式,還是在我們因疾病、受傷或年老而最脆弱的時刻給予支援,我們都正處在一項新技術的風口浪尖,這項技術將提升我們最珍視的生活的方方面面。這是一個更深刻、更豐富、更強大的生活願景。在大自然於遠古動物身上釋放出第一縷空間智能的近五億年後,我們有幸成為可能很快就能賦予機器同樣能力的這一代技術專家中的一員——並有幸利用這些能力為世界各地的人們謀福祉。我們關於真正智慧型手機器的夢想,沒有空間智能是不完整的。這項探索,就是指引我的北極星。我邀請你與我同行。 (新智元)