#李飛飛
“AI教母”李飛飛,尋求新一輪融資
據知情人士透露,“AI教母”李飛飛目前正與投資者展開新一輪洽談,計畫為其人工智慧初創公司World Labs籌集數億美元資金。據知情人士透露,“AI教母”李飛飛目前正與投資者展開新一輪洽談,計畫為其人工智慧初創公司World Labs籌集數億美元資金。據悉,該公司最新估值有望達到約50億美元。這一新估值對World Labs來說將是一個巨大的飛躍——該公司於2024年首度亮相時曾獲得了2.3億美元融資,當時估值僅為10億美元。其現有投資者包括了風投公司Andreessen Horowitz、NEA和Radical Ventures(李飛飛在該公司擔任科學合夥人),輝達的風險投資部門也對該公司進行了投資。業內人士透露,本輪融資預計將為World Labs帶來約5億美元資金注入。但他們同時指出,交易尚未最終敲定,細節仍可能調整。目前,World Labs正致力於開發能夠在三維世界中導航並作出決策的AI工具,建構其所謂的“大世界模型”。去年11月,World Labs推出了其首款世界模型產品Marble,並將其描述為一款可以根據圖像或文字提示建立3D世界的模型。在商業模式上,該產品採用免費增值與付費訂閱結合的模式,旨在快速推向市場並建立使用者基礎。許多正在尋找下一個重大技術突破的AI投資者,當前也正積極探索能夠超越驅動ChatGPT等文字聊天機器人的大語言模型(LLM)的技術,這導致了投資人對世界模型等尚不成熟領域的興趣激增。本周早些時候的消息顯示,“AI教父”楊立昆的世界模型初創公司AMI Labs在一輪融資中也吸引了包括Cathay Innovation在內的潛在支持者,該輪融資可能使這位前Meta首席人工智慧科學家的公司估值達到35億美元。被譽為“AI教母”的李飛飛,因其在2006年領導具有歷史意義的ImageNet項目而聞名。這個包含超過1500萬張圖像的可視化資料庫,能幫助電腦像人類一樣“觀察”世界,並為一波AI發展浪潮打開了大門。除創業工作外,李飛飛目前還是史丹佛大學教授,也是史丹佛“以人為本”人工智慧研究院的創始聯席院長。World Labs的其他機構投資者目前還包括沙烏地阿拉伯投資公司Sanabil和新加坡國有投資機構淡馬錫控股。World Labs在2024年融資輪的個人投資者,則涵蓋了GoogleDeepMind首席科學家Jeff Dean、演員兼投資人Ashton Kutcher,以及因推進機器學習領域工作而聞名的前GoogleAI研究員Geoffrey Hinton。李飛飛去年12月曾表示,她在為自己的科技初創公司招聘軟體工程師時,更看重候選人的AI技能,而非大學學位。她不會錄用那些不願擁抱AI工具的軟體工程師。 (科創板日報)
和馬斯克、黃仁勳一起入選2025年度人物,李飛飛憑什麼?
“如果有一天我去領取諾貝爾獎,我一定要以中國人的身份”你敢相信嗎,說出這句話的這個女人,16歲才開始系統學英語,17歲還在美國中餐館後廚刷盤子。卻在不久前,登上《時代》雜誌2025年度人物封面,和馬斯克、黃仁勳、奧特曼等科技大佬一起被評為“人工智慧的締造者”。她叫李飛飛,一位華裔女性科學家。在人人都不看好人工智慧的年代,她僅靠兩人團隊,不到三年就搞定了業內公認“20年不吃不喝才能完成”的壯舉:建立ImageNet,一個包含1500萬張標註圖像、覆蓋2.2萬個類別的視覺資料庫,沒有它,就沒有今天的AI浪潮。黃仁勳解決了算力,辛頓解決了演算法,而李飛飛提供了資料集,給了AI一雙“看見世界的眼睛”。李飛飛的故事,是一場硬生生砸開AI世界大門的突圍。她闖入的,不僅是一個由男性主導的科技領域,更是一個長期被西方話語壟斷的學術世界。2006年,她拒絕了麥肯錫開出的天價offer,一頭紮進當時“冷門中的冷門”領域:電腦視覺。那時沒人相信,機器人能“看懂”世界。光是識別一條狗,全球就有1400多種,體型、毛色、姿態千差萬別,真要較真起來,簡直是“子子孫孫無窮無盡”。同行勸她換賽道,這樣拉不到經費,更評不上教授。她在自傳中寫道:“我聽到的勸阻之聲,已經夠用一輩子了,可能下輩子也夠了。”但她有一種前所未有的自信——她們正在做一件歷史性的大事。沒人投資?她自掏腰包。沒人看好?她拉來一位學生助理,組成兩人小團隊。然而現實遠比理想殘酷。研究停滯不前,連她導師的導師吉滕德拉也勸她:別太超前。身為亞裔女性,在白人男性主導的學術圈裡,她承受著雙重偏見。那是她的至暗時刻:財務岌岌可危,團隊隨時散夥。但她沒有退縮。為了建構高品質資料集,她從網上下載近10億張圖片,通過亞馬遜眾包平台,動員近5萬名志願者,篩選、整理、打標籤……短短三年,ImageNet誕生了!機器能像人一樣“看世界”的科幻,第一次變成現實。靠著ImageNet,默默無名的辛頓驗證了神經網路演算法的有效性,一躍成為“AI教父”,徹底引爆AI浪潮。黃仁勳解決算力,辛頓突破演算法,李飛飛提供資料——三要素齊備,人工智慧時代起飛!那個曾受盡白眼的女人,也成了今天的“AI教母”。33歲,她成為史丹佛最年輕的終身教授;2021年,45歲的她當選美國“三院院士”,成為極少數獲此殊榮的華裔女性;2025年11月,她與黃仁勳、辛頓共獲“工程界諾貝爾獎”——伊麗莎白女王工程獎,她是唯一女性。而今年《時代》封面的設計耐人尋味:李飛飛只露出半個身子,祖克柏身旁卻空出半席。是邊緣化?被忽視?都不是。這是一種無聲的宣告——在AI的下半場,她的探索,或許正定義著未來的方向。當全世界都在狂捲大語言模型時,她反問:AI真的理解世界嗎?一個只會處理文字的AI,那怕能寫詩、程式設計、辯論,也只是“黑暗中的文豪”——它看不見杯子為何會摔碎,不懂人如何行走、抓取、互動。這樣的AI,無法真正落地。於是2024年,她創立新公司World Labs(估值已破10億美元),全力投入“空間智能”研究。目標是建構“世界模型”——讓機器人從執行者變成思考者,在行動前就能推演:“如果我往前跑,這個花瓶會碎嗎?我要繞行。”“地上有水,我會滑倒嗎?我要擦乾。”一旦成功,機器人走進家庭,就不再是幻想。這比堆參數難得多,卻是通向通用人工智慧的關鍵一步。有人翻遍她的履歷,找不出一絲瑕疵,便拿國籍說事。但很多人不知道——早在2001年,李飛飛就堅定地說:“如果有一天我去領取諾貝爾獎,我一定要以中國人的身份。”在普林斯頓,她牽頭舉辦“南京大屠殺”國際會議,邀請全球300多名學者參與,耗時數年將資料編纂成書。她只有一個信念:“我不能讓世界忘記這段歷史。”在Google擔任副總裁時,她力排眾議,推動GoogleAI中國中心在北京成立——這是Google在亞洲設立的第一個AI研究中心。從刷盤子的少女,到AI時代的奠基人,李飛飛的故事,不是天賦異稟的神話,而是一個普通人,用不信命的倔強,在偏見、質疑、孤獨中,一步步鑿穿天花板的史詩。她證明了:女性可以站在科技之巔,華人可以定義未來方向。 (星海情報局)
【CES 2026】黃仁勳與李飛飛,讓AI不止於“動嘴”
在最新的CES 2026上,輝達(NVIDIA)首席執行長黃仁勳發表了主題演講。這次發佈會被業界視為從“生成式AI”轉向“物理AI”與“推理型AI”的歷史性節點。在本地發佈會上,黃仁勳宣佈Vera Rubin平台全面量產:作為Blackwell 的繼任者,Rubin架構正式亮相併宣佈已進入全面投產階段,預計2026年下半年交付。其推理性能是前一代Blackwell的5倍,訓練性能是Blackwell的3.5倍,生成AI Token的成本直接降低至原來的1/10。最關鍵的是,黃仁勳在演講中強調,AI的下個階段是物理AI,不僅要懂語言,也要懂物理世界,並行布了三款平台或應用模型:1. Cosmos物理AI平台:輝達發佈了Cosmos系列基礎模型(包括 Reason2、Predict2.5等)。它能通過視訊和遙測資料學習物理規律,在虛擬的 Omniverse 空間中生成大規模合成資料。這意味著 AI 不再只是“猜下一個詞”,而是能理解重力、碰撞和物體的物理屬性。2. Alpamayo推理型智駕模型:這是首個具備“思考”能力的自動駕駛模型。它不再僅僅依賴預設規則,而是能像人類一樣對複雜長尾場景進行邏輯推理。黃仁勳宣佈,首款搭載該全端系統的梅賽德斯-奔馳CLA將於 2026 年第一季度在美上路。3. Project GR00T 進階:黃仁勳現場展示了十余台人形機器人。輝達的目標是成為通用機器人的“Android”,通過提供 Isaac 平台和開源模型,降低機器人研發門檻。這些都意味著,物理AI迎來了“ChatGPT”時刻,當AI能夠理解物理世界並具備推理能力時,具身智能(Embodied AI)將迎來爆發,機器人可能將像智慧型手機一樣普及。而Alpamayo則意味著智駕有了一條新路。過去自動駕駛依賴於海量資料“喂養”,而現在通過推理模型,車輛可以處理從未見過的極端情況。這標誌著全自動駕駛真正具備了商用落地的可能性。此外,黃仁勳在會上多次點名表揚了包括中國DeepSeek R1在內的開源模型。他認為開源模型與閉源模型的差距正在縮短,輝達通過開源 Alpamayo和Cosmos平台,試圖建構一個由其晶片驅動的全球開放生態。2026年的輝達已經不再只是一家晶片公司,它正試圖通過整合Rubin硬體、Cosmos物理大腦和Alpamayo推理系統,定義未來十年“物理智能”的底座。輝達的物理AI,和李飛飛的“世界模型”有什麼聯絡?一些朋友可能會問,輝達的物理AI和李飛飛提出的世界模型有什麼關係?是一樣的原理嗎?是否是競爭對手?我個人認為,他們在底層邏輯上是同源的,但在實現路徑和商業生態位上有不同。他們都認為,AI必須從“文字的符號世界”進化到“三維的物理世界”。李飛飛的World Lab目的應該是建立一套理解現實世界的模型架構,兼具學術與實用目的,而輝達的目的是實現物理AI世界的作業系統。World Lab應該更聚焦在演算法突破,而輝達則聚焦在建立開源標準和打造工具鏈。它們會競爭“物理AI”的定義權,但在硬體上也有合作與互補的一面,畢竟輝達有晶片和開源系統。相比李飛飛更偏學術和通用性的“世界模型”,輝達在2026CES發佈的Cosmos和Alpamayo更偏工程落地。總之,一個偏抽象化,讓AI看懂世界,另外一個偏具象化,教AI開始玩轉世界。但他們的目標,都想要AI落地現實世界,而不僅是動嘴,只是從產學研不同角度切入。比起競爭,更重要的是,物理AI正在把世界模型從“AI的一種研究方向”,升級為“下一代AI的核心基礎設施”。未來人類除了靠自己,還會有更厲害的幫手,而決定一切的方向,也是在人類手中。 (首席商業評論)
【CES 2026】美國CES展開幕,14句重要論斷
“在這些演講中,物理AI、混合AI、空間智能等幾大焦點,並非割裂,而是一個協同進化的生態系統。”拉斯維加斯,飛機已落地,開年第一周,許多人奔赴CES,一年一度的科技春晚拉開序幕。這幾日的焦點,在人和他們說的話。1月4日、5日,展會正式開始前兩天,是CES的媒體日,許多公司會選擇在此時發佈新品。與往年一樣,這兩天幾乎變成了一場全球AI頭部公司的“掌門人峰會”:輝達創始人黃仁勳、AMD董事長蘇姿丰、英特爾CEO陳立武、聯想集團CEO楊元慶、高通CEO克里斯蒂亞諾·阿蒙……紛紛亮相併發表演講。但這些演講並不止於新品發佈,更像是一次對企業技術路徑和產業佈局的表態,每一句判斷,都會被世界反覆拆解、思考。對此,資深科技自媒體人莊明浩表示,CES本來是消費電子展,但看輝達和AMD,尤其是黃仁勳的演講,其實基本上已經完全沒有針對“消費市場”的內容描述,全部都是當前AI敘事下,資料中心所需要的GPU,以及所謂“物理”世界極限這樣的宏大命題,我們人類的消費品似乎真的已經不那麼重要了。而隨後四天,當主舞台的燈光逐漸暗下,展館的大門一扇扇打開,CES的正式展期才剛剛開始。據報導,超250萬平方英呎的展區,吸引了全球超過4000家參展企業和十幾萬參會者。機器人、AI PC、智能眼鏡等最熱門的科技產品,都將在此亮相。CES 2026開幕中國企業的身影同樣密集。既有聯想、海信、TCL等老牌廠商,也有宇樹科技、智元、雲深處等機器人公司,在洗地機、割草機、爬樓機、泳池清潔機等細分領域,中國廠商的身影也不會缺席。正如黃仁勳在演講中反覆強調的那樣:“AI競賽已經開始,所有人都在努力達到下一個水平。”那麼,在第一天的多場主題演講中,各大AI企業的掌門人都是如何解讀行業趨勢,又是如何描繪各自企業的未來藍圖?據未可知人工智慧研究院院長杜雨所總結:黃仁勳的核心邏輯是AI必須理解物理世界的常識,才能真正與現實世界互動。從商業邏輯來講,現實世界的天花板比線上世界更大。黃仁勳這次穿上了鱷魚皮英特爾強調混合AI和端側,本質上是現實世界有很多場景是需要端側AI的,比如醫療、金融、工業,強調資料隱私、低延遲、零斷網。AMD的蘇姿丰說未來幾年計算能力需要再提升100倍,本質上是在解決“算力荒”的問題。AMD的戰略是用更高性價比的算力,搶奪輝達的資料中心市場。應蘇姿丰邀請而來的“AI教母”李飛飛,則再次強調了“大語言模型終究受制於語言本身”這個天然的侷限性,她認為,語言是用來描述世界的工具,但不是世界本身。從物理AI、混合AI、端側AI,到算力、空間智能、AI代理……在這些主題演講中,或新或舊的概念,共同勾勒出了未來AI發展的全景圖。我們整理了十四句與未來AI發展有關的金句,它們為這個飛速發展的AI時代留下了一個小小的時間標記,留待未來驗證。同時,我們也邀請了相關領域的專家,對這些洞見發表了各自的看法。十四句金句整理1.“物理AI的ChatGPT時刻即將到來。”——黃仁勳2.“物理AI的突破,讓AI從螢幕走向了我們的物理世界——這恰逢其時,因為世界正在建設各種各樣的工廠,用於晶片、電腦、救命藥物和AI。隨著全球勞動力短缺的加劇,我們比以往任何時候,都更需要由物理AI和機器人技術驅動的自動化。”——黃仁勳3.“今天我想要談一點AIpamayo,這是我們在自動駕駛汽車方面所做的工作——我們不僅開源了模型,還開源了我們用來訓練這些模型的資料。因為只有這樣,你才能真正信任模型的來源。我們開源所有模型,我們幫助你們從中製作衍生品。”——黃仁勳4.“如果你看世界的模型,OpenAI生成的Token比其他任何模型都多,而第二大群體,可能是開源模型。我的猜測是,隨著時間的推移,開源模型可能會成為第一名。”——黃仁勳5.“我們相信,隨著人工智慧能力的不斷提升,本地化計算只會變得越來越重要,第一,本地化程度越高,延遲就越低,因此性能也越好;第二,AI越本地化,就越安全,也越真正“屬於你”;第三,AI推理每一次都要花錢,雲端集中計算存在成本與頻寬瓶頸,而本地化計算通過減少傳輸和基礎設施依賴,能顯著降低整體成本;第四,對企業而言,本地計算的核心價值不在性能,而在於讓資料、智能與控制權重新回到自己手中。”——Perplexity CEO斯里尼瓦斯6.“混合人工智慧時代開啟……本地AI安全地執行任務,將資料保留在機器上,而云端AI則負責全域推理、規劃和多智能體編排。”——英特爾戶端計算事業部高級副總裁吉姆7.“你將在智慧城市、工廠、醫療保健和各種自動化系統等關鍵領域中,看到數百種不同外形尺寸的邊緣裝置,它們需求巨大且不斷增長。”——英特爾戶端計算事業部高級副總裁吉姆8.“AI的使用者數量,已經從最初的100萬人,躍升至如今超過10億活躍使用者……我們預計,AI的活躍使用者數量將增長到超過50億人,AI將真正融入我們生活的方方面面,就像今天的手機和網際網路一樣。”——蘇姿丰9.“我們現在擁有的算力,遠遠不足以支撐AI能做到的一切……為了讓AI無處不在,我們需要在未來幾年內將全球算力提升一百倍,或者在未來五年內提升超過十倍。”——蘇姿丰10.“未來,一個國家的GDP增長,很大程度上將由其可用算力決定。”——OpenAI總裁格雷格11.“讓我興奮的是,現在出現了新一代人工智慧技術,包括具身人工智慧和生成式人工智慧,我們終於可以賦予機器更接近人類水平的能力——空間智能。”——李飛飛12.“我們正在從‘被動理解世界的系統’,走向‘幫助我們與世界互動的系統’。”——李飛飛13.“如今大多數AI助手都是反應式智能體,你打開一個應用程式,然後提問以獲得回應,但是當AI在裝置上快速運行且始終處於開啟狀態時,它就可以主動為你執行任務。”——Luma AI CEO阿米特14.“2026年將是AI代理元年,AI將能夠幫助你完成更多工,甚至有望完成整個任務的端到端,而不是僅僅做一些零碎的工作。”——Luma AI CEO阿米特大頭有話說胡延平上海財經大學特聘教授智能科技產業與智能經濟研究學者黃仁勳所言“物理AI的ChatGPT時刻到來”,如果更具體地定位,2026年可能是物理AI的GPT3—GPT3.5時刻,也就是進步顯著,但還不能給予過高的預期,尤其機器人的“大腦發育”。不過,自動駕駛的L3量產時刻今年到來,這一點是比較確定和樂觀的。此外,AMD和輝達都在強調從晶片到主機和叢集的全端AI能力,產品從晶片算力、開發環境到垂直應用,面向多個垂直場景全線佈局而非單點突破。尤其AMD後起直追,在已經實現從資料中心到個人裝置的完整AI佈局的基礎上,產品性能又有顯著提升。李飛飛展示了World Labs旗下首款商用世界模型Marble,目標是生成持久存在、可導航且一致的三維世界,助力人類的創造力而不是替代人,也和她過去提出的“以人類為中心”的AI發展理念相契合。李飛飛發表演講接下來,這屆CES 2026我會關注五個重點:一是機器人等具身智能,二是智能眼鏡等智能裝置,三是智能駕駛L3產業鏈,四是訓練與推理計算架構以及終端與邊緣AI算力變化,五是在感測演算法基礎上模型能力的注入給智慧健康領域帶來的變化。AI產業鏈意義上的“AI中國鏈”已經成型,AI技術與應用意義上的“AI中國環”也已經閉環,中國企業在推出琳瑯滿目的創新產品的同時,有希望為世界提供更多解決方案。杜雨未可知人工智慧研究院院長中國社會科學院技術經濟學博士幾場演講聽下來,我的感受是,“算力軍備競賽”已經白熱化。三家巨頭都在強調算力,但路徑完全不同:輝達追求絕對性能,AMD追求性價比,英特爾追求邊緣普及。這讓我想到近期扎堆上市的國產GPU四小龍,也是各有千秋。這也意味著未來2—3年,晶片價格戰、性能戰會非常激烈,對創業公司和企業客戶是重大利多——算力成本將大幅下降。中國在晶片製造上短期追不上,但在AI應用硬體上很猛。CES展會現場的機器人企業中,中國企業佔到一半以上,宇樹人形機器人、智元機器人、追覓掃地機器人,全是中國的。機器人還只是典型代表之一。這是因為中國市場大、場景多、迭代快。因此,我對中國創業企業的建議是:錯位競爭、長期主義。張孝榮深度科技研究院院長演講中,黃仁勳的觀點不僅是技術升級,更是範式轉移。以前的AI是“鍵鼠互動”,現在的AI是“視覺和語言互動”,而黃仁勳定義的“物理AI”是“行動互動”。他通過Cosmos模型(看視訊學物理規律)和Newton引擎(即時物理計算),試圖解決AI的“幻覺”問題——讓機器明白“水是流體、玻璃是脆的”。這是為了讓AI能在工廠和家庭中安全地幹活,而不僅僅是寫詩畫畫。AMD和英特爾兩家都迴避了與輝達GPU的直接競爭,各自另闢蹊徑:蘇姿丰展示了AMD在AI產業鏈中的位置。她強調的Helios系統和針對PC的Ryzen AI 400系列,傳遞出一個明確訊號:算力競爭是持久戰,AMD已經準備好接招,且更注重端側和成本效益。AMD的策略更像是“務實的理想主義者”,強調的“突破算力瓶頸”,本質上是降低AI的使用門檻。如果算力成本降不下來,中小企業玩不起,AI生態就會枯萎。蘇姿丰介紹AMD Instinct MI455X GPU英特爾強調的“本地計算”,其實是在輝達強大的雲端壟斷下,尋找一條讓AI落地到普通使用者手中的差異化生存之路。英特爾確實是在打一場“防禦戰”,但也是一場“必贏之戰”——它們看到了一個痛點:並非所有AI任務都需要去雲端。隱私問題(如家庭監控)、延遲問題(如遊戲響應)、成本問題,都要求算力下沉。英特爾通過在PC和邊緣裝置部署NPU(神經網路處理單元),是在建構AI時代的“毛細血管”。如果AI只存在於雲端巨頭手裡,那是不健康的;英特爾在試圖讓AI真正“無處不在”。幾場演講的核心概念,物理AI、本地計算、突破瓶頸、空間……勾勒出了AI從“雲端大腦”走向“實體世界”的完整路徑。結合CES 2026的風向,我對未來的感受可以用三個詞概括:“智能體、具身智能、技術方案”。1.AI將從“對話方塊”裡走出來:未來不再只是Copilot(副駕駛),而是Co-worker(同事)。我們期待看到AI智能體(Agent)能幫我們訂票、操作軟體,甚至通過機器人幫我們打掃房間。2.硬體形態的爆發:2026年將是人形機器人和AI定義汽車大爆發的一年。我們將在工廠和道路上看到更多形態的AI物理實體。3.成本的下降:隨著輝達Rubin架構和AMD/Intel方案的推出,AI推理成本將大幅下降。這意味著我們將看到更多便宜好用的AI應用,而不僅僅是昂貴的奢侈品。劉興亮知名數字經濟學者工信部資訊通訊經濟專家委員會委員在這些演講中,物理AI、混合AI、空間智能等幾大焦點,並非割裂,而是一個協同進化的生態系統。AMD和輝達在雲端提供近乎無限的算力,驅動模型變得無比強大,然後,這些能力通過英特爾的混合架構和李飛飛所展望的多模態模型,分發到我們身邊的裝置上,最終通過輝達倡導的物理AI和機器人技術,在現實世界中產生價值。在這個宏大的圖景中,中國企業絕非旁觀者,而是至關重要的參與者,並有望在以下幾個領域扮演關鍵角色:應用創新的主戰場:中國擁有世界上最龐大、最多元的應用場景和市場需求。在電商、社交、移動支付、智慧城市、製造業等領域,中國企業可以將全球領先的AI基礎模型和硬體,與本土化的深刻洞察相結合,催生出世界級的AI應用創新。例如,在AI賦能供應鏈、個性化推薦、工業自動化等方面,中國有巨大優勢。硬體產業鏈的關鍵一環: 中國在全球電子製造和供應鏈中佔據核心地位。從伺服器製造、AI終端裝置(PC、手機、機器人)到資料中心建設,中國企業是將先進AI技術轉化為實體產品並實現大規模交付不可或缺的力量。特定領域的技術突破者: 在AI晶片設計(如華為昇騰、寒武紀等)、自動駕駛(如百度Apollo、小鵬、華為Inside模式)、機器人等領域,中國企業已經積累了深厚的技術實力。面對國際競爭,他們有望通過聚焦特定垂直領域,實現差異化的技術突破,並依託國內市場形成規模效應。開源生態的積極貢獻者: 越來越多的中國科技公司擁抱開源,向全球貢獻程式碼、模型(如DeepSeek)和資料集。這有助於提升中國在全球技術社區的影響力,並從協作中獲益。CES 2026描繪的未來是清晰而激動人心的。中國企業需要發揮自身在市場、供應鏈和應用創新上的優勢,一方面積極融入全球技術生態,另一方面勇於在核心技術上攻堅克難。未來的AI世界,必將是一個多極、協作、充滿競爭的精彩舞台,中國企業註定是台上的主角之一。 (吳曉波頻道)
【CES 2026】OpenAI、李飛飛同台,Lisa Su:AMD AI 晶片走到關鍵一步
2026 年 1 月 5 日,CES 開場。AMD 董事長兼首席執行長 Lisa Su 站上主舞台,沒有任何鋪墊,直指本質:AI 是過去 50 年最重要的技術。但她這次不是來講遠景的,而是帶著完整方案來的。不只是晶片,而是一整套工業級平台:面向資料中心的 MI455X,3200 億電晶體;面向企業部署的 MI440X,主打推理與節能;還有她這次主推的 Helios,為 Yotta 級 AI 時代打造的機架級平台。這不是在升級顯示卡,而是在重新劃出一個產業分界線。為了證明這不僅是 AMD 自說自話,Lisa Su 請來了一批頂級 AI 使用者同台背書:OpenAI、World Labs、Luma、Liquid、Absci 等行業領軍者,現場展示他們如何將核心業務部署在 AMD 平台上。更關鍵的是,Lisa Su 還預告了下一代 MI500 系列將在 2027 年登場,四年內性能增長 1000 倍。第一節:Yotta 級算力缺口,逼出新的產業邏輯過去一年,AI 模型變得更聰明了,但對算力的需求也更大了。2022 年全球 AI 運算需求是 1 Zettaflop,2025 年預計要超過 100 Zettaflops,Lisa Su 給出的預測更為大膽:未來五年,全球算力要再提 100 倍,邁向 10 Yottaflops。Yottaflop 是什麼概念?一個 Yottaflop 是 1 後面帶 24 個零,是現在全球算力的上萬倍。 這就像過去幾十年所有計算升級的總和,需要在五年內完成。這預示著未來 AI 應用將全面爆發:生成視訊:一個 10 秒視訊動輒十萬個 token,遠超文字模型;多模態智能體:不僅看圖、寫文、識音,還要自動調度工作流;企業部署:每個公司不再只要模型,還得有配套的開發工具和本地 AI 支援。這一趨勢在 OpenAI 總裁 Greg Brockman 那裡得到了資料印證:推理量兩年激增 100 倍的現實,讓“人手一個後台 GPU”的願景受困於基建短板。模當大模型從“嘗鮮”變成“常駐”,算力系統面臨的考驗也隨之升級:它不再需要為了跑分而生的短跑冠軍,而是需要能長期線上、安全維穩的馬拉松選手。這迫使晶片廠商重新思考產品形態:不是做出最強一顆晶片,而是建構起能支撐 AI 工業化的全套基礎設施:每個托盤能承載多顆 GPU、CPU、NPU 協同工作;每個機架能無縫擴展為成千上萬個單元的 AI 工廠;網路、記憶體、冷卻、供電都得為高密度、低延遲重構。這就是 AMD 推出 Helios 架構的核心思路:不靠一顆 GPU 單打獨鬥,而是打造一套可規模部署、長期線上、靈活適配的 AI 基礎設施。每個 Helios 機架擁有:超過 18,000 個 CDNA 5 GPU 計算核心;4,600 多個 CPU 核心;31TB HBM4 高速視訊記憶體;每秒 2.9 Exaflops 的運算能力。它不再是晶片堆疊,而是 AI 工業化的生產線。這一節,AMD 沒在講性能天花板,而是定了一個新基礎:如何讓 AI 成為真正能用、高性價比、工業級穩定的算力系統。第二節:Helios 不是最強機器,是能量產的標準件這次 CES 上,Lisa Su 發佈的不是一塊晶片,而是一整個計算工廠。舞台上,AMD 首次展示了 Helios,一個重達 3 噸的機架級計算平台,專為 AI 工業化設計。Helios 的三個關鍵詞:1、整合每個計算托盤,包含:4 塊 MI455X GPU,搭載 3200 億電晶體、432GB HBM4 高頻寬記憶體;1 顆 Venice CPU,擁有多達 256 個 Zen6 核心;1 顆 Pensando 網路晶片,負責資料流通。托盤之間通過 Ultra Accelerator Link 相連,72 塊 GPU 在一個機架內協同工作,形成統一的計算單元。而托盤 + 冷卻 + 電力 + 網路 + 算力調度,全都打包到一個整機裡。 不是一堆零件,而是一個能直接投產的 AI 工段。2、模組化Helios 沒選封閉架構,而是用的 OCP(開放計算項目)標準。每個元件都能替換、升級、擴展。更像一個搭積木的系統,而非一次性封裝的黑盒。這對大型 AI 公司很關鍵,模型還在快速進化,不能每次都從頭再建一套資料中心。Lisa Su 給出了 Helios 的定義:不是做一台最強機器,而是做一個能量產的算力範本。3、效率Helios 全液冷,能在高密度負載下保持穩定。每個機架配有 31TB 視訊記憶體,機架內部頻寬達 260TB/s,對外連接頻寬 43TB/s。AMD 還專門強化了 ROCm 軟體棧,能相容主流開源 AI 框架,如 PyTorch、vLLM、SGLang。開發者無需改程式碼就能上手。相比之下,NVIDIA 的 DGX 系列更強調整體性能,而 Helios 更注重模組化和開放性,是為整個行業打造的通用標準件。Lisa Su 不想讓客戶適配 AMD,而是要讓 AMD 適配客戶。這不是單機性能的發佈,而是一次架構觀的轉變。OpenAI 用 MI455 加速推理;Meta 和 AMD 聯合設計 Helios 架構;主要雲服務商正在將 Helios 納入新一代 AI 基礎設施。Helios 不再是一個產品,是下一輪 AI 工業化的最小構件。AMD 在發佈一個能複製的生產線,一個可以為 AGI 世界裝配的底層模組。第三節:OpenAI、Luma、李飛飛,為什麼選 AMD這次 CES 舞台上,AMD 不是在跟隨競爭,而是在定義新標準。過去兩年,大模型發佈節奏越來越快,但 AI 真正運行的地方,已經不是發佈會,而是後台:Greg Brockman:我們正從單純的被動問答,進化為自主執行複雜工作流。未來每個人都將擁有背景執行的 10 個智能體。那不再是臨時呼叫 AI,而是 AI 全天線上,背後對推理晶片提出了全新壓力。1、智能體不是概念,已經在現場運行了AI視訊公司 Luma CEO 的回答更有說服力:一段視訊模型推理 10 秒,Token 數量能達到 10 萬個。他們已經把模型部署到生產線上:一年時間內,Luma 有 60% 的推理負載遷移到了 AMD 平台;大模型只是起點,接下來的任務都是智能體結構;這些智能體不僅是回答問題,而是能修改世界、編輯視訊、自動創作一整部電影。而當這些任務真正落地時,GPU 的經濟性變得比絕對性能更重要。2、 Liquid AI:AI 的下一個入口,是主動助手MIT 孵化公司 Liquid AI 聯合創始人 Ramin Hasani 在正式推出兩款核心產品:一個是 LFM 2.5:12 億參數的小模型,在本地裝置上完成指令跟隨,在指令遵循能力上超過 DeepSeek 和 Gemini 2.5 Pro;另一個是 LFM 3:能聽、能看、能說、能即時翻譯的多模態助手,延遲低於 100 毫秒。這不是在雲上訓練模型,而是直接在筆記本本地運轉,持續監聽、協助使用者。Ramin 說:“現在,不是人類在召喚 AI,而是 AI 在默默為你做事。”這對晶片的要求,已經從模型規模大小,轉向部署速度、離線能力和功耗控制。3、 李飛飛帶來第三種維度:空間智能 + 世界建模World Labs CEO 李飛飛展示了另一種“AI 互動的新範式”的可能性。只需一張普通照片,模型就能還原完整 3D 空間,不只是識別房間,而是“建立世界”:將圖片輸入模型後,可以生成多個 3D 結構版本;即時拖動、編輯、重建世界細節甚至能把拉斯維加斯威尼斯人酒店的一張圖,生成可遊覽的完整空間世界。李飛飛強調:“人類的理解從不是文字開始,而是空間與動作。真正通用的 AI,必須能理解物理世界。”而空間智能的落地,需要高頻寬、低延遲、大記憶體、高並行,這些需求不是傳統圖形處理可以滿足的。三個案例,指向同一個趨勢: Luma 看重成本,Liquid 看重即時性,World Labs 看重大記憶體。這意味著算力競爭的邏輯變了:從比拚參數,變成了比拚體系。AMD 正在將硬體重塑為 AI 的“作業系統”,成為支撐萬物智能的算力底座。第四節:從雲到端,AI 落地的最後一公里如果說 Helios 是主電站,那麼接下來的問題就是:電怎麼輸送下去,怎麼在每個終端點亮。AI 要無處不在,需要把算力帶到雲端之下的每一層。個性化、現場化、連續性,是這個過程的三個關鍵詞。從醫院、工廠、學校,到你桌上的那台電腦,AI 要進入真正複雜的人類環境。1、從 AI PC 到 Halo:把 AI 帶到桌面過去兩年,大語言模型幾乎都在雲上運轉,但這帶來兩大問題:成本高,每次呼叫都要顯示卡費用;延遲長,每次問答都要聯網。AMD 推出 Ryzen AI Max 和 Halo,就是要把 AI 搬到本地。Ryzen AI Max 配備 128GB 統一記憶體,能在本地運行 200B 參數模型,讓創作者和開發者可以在工作站上直接部署 AI 工具。性能上,它在高端筆記本場景超過 MacBook Pro,在小型工作站場景以更低價格達到 NVIDIA DGX Spark 的性能,運行 GPT 開源模型時每美元每秒生成的 Token 數是後者的 1.7 倍。Halo 則是世界最小的 AI 開發機,手掌大小卻能運行 200B 參數模型,預裝 ROCm 軟體棧,專為開發者和研究團隊設計。關鍵技術是 AMD 把 CPU、GPU 和 NPU 做成統一記憶體架構,三者直接共享資料。這意味著你在筆記本上呼叫 Copilot、摘要會議、編輯視訊,都可以完全離線完成。2、醫療:AI 已經在救人OpenAI 總裁 Greg Brockman 講了個假期真實案例:有人腿疼,醫生初診說沒事,回家用 ChatGPT 輸入症狀,建議立即回醫院。結果是嚴重血栓,如果沒有 AI 提醒可能致命。醫療行業已成為 AI 落地最快的領域之一。現場三家公司展示了實際應用:Absci 用 AI 從零設計新藥,使用 AMD MI355 單日篩選超過 100 萬種候選藥物,攻克脫髮和女性健康疾病。Illumina 每天產生超過 YouTube 的測序資料量,用於癌症早篩和精準醫療,系統使用 AMD EPYC CPU 和 FPGA 即時處理。AstraZeneca 大規模使用生成式 AI 設計分子、篩選藥物,候選藥物交付速度提升 50%,臨床成功率也在提高。這些公司把 AI 當作主力工具,而不是在試水。3、工業機器人:邊緣 AI 的觸覺協作Generative Bionics 創始人 Daniele Pucci 帶來了人形機器人 Gene One。它能感受人手的力度、方向和協作意圖,這背後是觸覺反饋和即時決策能力。AMD 提供了完整算力路徑:機器人本體用 Ryzen AI Embedded 和 Versal Edge 晶片,模型訓練用 MI 系列顯示卡,多機協作靠 Pensando 網路晶片。邊緣裝置的 AI 不能等待聯網,必須本地決策、立刻響應。這就是 AMD 從雲到端的連續計算結構。4、新興場景:不能等、不能斷、不能慢除了雲端和邊緣,AI 正向更多新興場景滲透。空間智能、機器人導航、虛擬世界建構,都需要高頻寬、低延遲、大記憶體和即時響應。這些場景的共同特點是:不能等,不能斷,不能慢。5、AI 落地的未來:從標準晶片變成場景原生平台這一整輪發佈,其實是 Lisa Su 帶領 AMD 轉型的路線圖。在雲端,Helios 機架、MI455 顯示卡和 Venice CPU 構成了大規模訓練與推理的基礎設施,服務 OpenAI、Meta 等頭部 AI 公司。在企業級,MI440X 和 MI430X 提供更高精度的計算能力,專門面向主權 AI 和超級計算場景,滿足科研機構和政府部門的需求。在開發層,Ryzen AI Max 和 Halo 讓開發者能在本地進行模型開發和智能體原型驗證,不必每次都依賴雲端資源。在消費端,Ryzen AI 400 系列處理器讓普通 PC 也能運行 Copilot、主動助手和內容創作工具,把 AI 真正帶進日常生活。從雲到端,AMD 不是在賣晶片,而是在鋪設 AI 時代的基礎設施。結語:把晶片做成地基MI455 是晶片,Helios 是平台,但真正讓 AMD 搶佔位置的,是 Lisa Su 給出的產業邏輯:不是建一台最強機器,而是搭一套能量產的工業系統;不是問能跑多大模型,而是問能不能支撐百萬級智能體同時工作。OpenAI 訓練模型,Luma 生成視訊,Absci 設計新藥,Generative Bionics 驅動機器人。而 AMD,正在成為這一切背後的算力基礎設施。2026 年這場 CES,Lisa Su 押注的是最底層的命題:讓 AI 真正落地,既要性能夠強,也要成本可控,還要長期穩定。 (AI 深度研究員)
李飛飛踢館遊戲圈:Unity們,該退場了!
【新智元導讀】1900億美金的遊戲帝國正迎來寒冬!《原神》式的重金堆砌已近極限,李飛飛攜「世界模型」暴力拆解行業規則。從4倍速開發到Genie 3瞬間造夢,AI正在終結搬磚時代。這場關於造物權的豪賭,你準備好成為上帝了嗎?在遊戲界,我們似乎已經習慣了用「生命」去等待。米哈游的《原神》研發了4年,每年的營運成本超過2億美元;全球玩家翹首以盼的《GTA6》,距離前作發佈已經過去了整整十二年。然而,在那個高聳的技術圍牆內,頂級遊戲卻也在成為開發者的重擔。據Newzoo資料顯示,這個產值1900億美元的版圖,正陷入一種僵局:3A大作的研發成本動輒幾十億美金,開發者在無盡的加班中靈感枯竭。就在這個節點,AI領軍人物李飛飛撕開了舊時代的裂縫。她直言不諱地指出:這一切都將被顛覆,模擬引擎早該改進了。李飛飛的World Labs展示的世界模型,正試圖賦予AI理解並重構3D物理空間的能力。Game Gears首席執行長在實測中證實:AI已經讓開發速度實打實地翻了4倍。我們正站在奇點之上。原本屬於巨頭們的戰場,正向每個人敞開。效率的「核裂變」從千人團隊到4倍速革命當大多數人還在討論「AI能不能畫出一張好看的海報」時,遊戲行業已經拿到了讓傳統工作室汗顏的成績單。Game Gears首席執行長Alexander Vaschenko透露了:在開發《Aliens vs Zombies: Invasion》等作品時,AI將開發速度提升了整整4倍。這意味著,需要幾個月才能完成的建模和關卡設計,被壓縮到了以「周」甚至「天」為單位的生命周期。AI自動生成的複雜3D場景。這種即時的生產力釋放,是過去任何引擎都無法比擬的。那麼,它究竟是怎麼做到的?以Google DeepMind發佈的Genie 3為例。在傳統的遊戲邏輯中,如果你想讓角色在森林裡奔跑,你得先建出樹木的模型,寫好碰撞體積的程式碼,再設定複雜的光影渲染。但在世界模型面前,這一切都消失了。你只需給它一張森林的照片,它就能「明白」什麼是樹,什麼是路。正如Shlomi Fruchter所說:這種模型正在賦予開發者一種從未有過的超能力。它不再是幫你修剪枝葉的剪刀,而是直接生成整片森林的土壤。更讓人驚豔的是出自李飛飛之手World Labs,及其推出的Marble模型。它生成的3D環境不僅具有視覺上的深度,更擁有內在的邏輯——知道重力如何作用,也懂光線如何折射。這種基於「物理直覺」的生成方式,讓原本需要算力維持的模擬,變得像呼吸一樣自然。當一個團隊能夠通過AI達到千人工作室的產出水平時,遊戲行業的「重工業時代」也將落下帷幕。引擎已老邏輯的「降維打擊」傳統的遊戲引擎(如 Unreal/Unity),本質上是一套依賴「預設規則」的執行器。它並不真正理解物理,它只是在執行人類寫的程式碼。如果你想在遊戲裡推倒一堵牆,需要程式設計師寫下複雜的碰撞檢測程式碼,需要美術師精修碎裂的紋理。傳統引擎依賴極其複雜的邏輯節點來模擬現實,每一個動作背後都是海量的參數堆砌。而李飛飛所倡導的「世界模型」,推行的是一套「自上而下」的視覺智能。它不需要人類去定義什麼是重力,什麼是摩擦力。通過學習數以億計的視訊資料,AI自己通過觀察就能學會「物理直覺」。它「知道」玻璃碎裂的軌跡,也「懂得」水流如何繞過岩石。原本需要成千上萬行程式碼才能模擬的物理世界,現在已經成了AI的基礎設定。正如李飛飛所言,現有的模擬引擎早已到了改進的關口。當世界模型成熟後,遊戲引擎不再是一個需要開發者去苦苦鑽研、考取證書的複雜軟體,而是一個能夠聽懂人類意圖的「數字容器」。這正是DeepMind的專家們所期待的「解脫」。當繁瑣的、重複性的模擬工作被AI取代,開發者們終於能從中抽身,重新把精力投入到那份久違的、關於「尋找樂趣」的冒險中去。人人都是造物主從「看電影」到「造夢境」當技術的圍牆被世界模型被推倒,最興奮的是每一個普通人。如果說去年的Genie 2還是一個「視訊生成器」,那麼今年的 Genie 3則徹底打破了螢幕的第四面牆,是真正的「建構者」。Genie 3,它生成的不再是平面的畫面,而是一個擁有即時物理互動能力的3D環境。Genie 3相比Genie 2提升了一致性和真實性。長期以來,遊戲是開發商寫給我們玩的作品;但在未來,遊戲將成為我們靈魂的延伸。通過 AI 驅動的世界模型,個性化遊戲的生產正變得異常簡單。你甚至不需要學習枯燥的C++或複雜的3D建模,你唯一的「開發工具」就是你的想像力。在《堡壘之夜》中,開發團隊利用AI讓Darth Vader跨越螢幕。這種「造物權」的下放,不僅是效率的提升,更是情感的彌補。未來,我們或許能利用世界模型,在3D空間裡復刻童年的模糊記憶,或者與記憶中的故人,在AI編織的世界中重逢。技術的盡頭是繭房,還是靈感?正如任何一場偉大的革命都會伴隨懷疑,「造物權」移交也不例外。在本月,六個歐洲視訊遊戲工會發出了集體譴責。他們擔心這些工具正在「強加於人」,不僅威脅到藝術家的生計,更可能讓遊戲世界被平庸的、低品質的「AI廢料」淹沒。這種擔憂並非空穴來風。當生成一個世界的成本趨近於零,我們是否會像被困在資訊繭房裡一樣,被困在由演算法編織的、失去靈魂的數位化垃圾場裡?這正是李飛飛所預言的顛覆中,最隱秘也最沉重的代價。然而,Alexandre Moufarek提供了一個視角。這位曾任職於Ubisoft的資深製片人深知,傳統遊戲開發的末期往往是一場靈感的屠殺——為了追趕聖誕節的發行窗口,開發者們不得不放棄打磨、放棄冒險,陷入無盡的偵錯與查錯中。AI的意義,是給開發者空間去「尋找樂趣」。我們正站在舊時代的黃昏與新紀元的黎明之間。未來的遊戲,可能不再是標準化的商品,而是一個隨心生長、具備物理靈魂的生命體。當$1900億美金的重工業圍牆轟然倒塌,我們最終會發現,技術的盡頭不是機器取代了人,而是讓每個人都能像兒時一樣,在想像力的曠野裡,重新找回那份最純粹、最毫無顧忌的快樂。 (新智元)
李飛飛最新訪談:這,才是下一個10年
筆記君說:在AI浪潮席捲各行各業的今天,每一位企業家和創業者都面臨同一個問題:未來的機會究竟在那裡?被譽為“AI教母”的李飛飛,在前兩天的一次深度對話中,給出了她的答案。以下是李飛飛這次訪談中的自述部分,希望她的這些話,對你有所啟發。一、“空間智能”是AGI的一把關鍵鑰匙1.世界遠不止語言那麼簡單我先說一下我的信念:在技術上,確實有一些相通的概念,所以我也能理解有些人說“語言即世界”。宏觀地來說,我堅信這個世界遠不止語言那麼簡單。如果我們說的語言概念,指的是那種離散的、本質上更偏向“一維”的資訊——即便它能表達多維的內容,語言本身的呈現形式還是比較一維的。但這個世界其實要豐滿得多。我一直強調,空間智能包含諸多特性,比如物理屬性這些,都是超越語言範疇的。而且不管是人類的行為,還是大自然的運轉,很多東西既沒法用語言完全表述清楚,也不可能單靠語言就實現所有想做的事。我們每天睜開眼,從生存、工作、創造,到感受、感知,再到人與人之間豐滿的情感,這些日常裡的種種,從來都不是只靠語言就能完成的。當然“語言即世界”這樣的話確實挺好聽,聽起來也沒錯,因為它是非常籠統的一句話。當你一句話很籠統的時候,它可能錯不了。但從技術層面看,現在數位化是必然趨勢:視覺模型、空間智能、機器人模型,本質上都會走向數位化。可要是把數字和語言完全畫等號、當成一回事,那這個概念就變味了。如果連數字都能被叫做“語言”,那相當於啥都能往“語言”裡套,這就沒什麼好爭論的了。在我看來,資訊遠不止語言這一種,還有空間資訊,它和語言一樣美妙、一樣重要。2.“空間智能”到了爆發前夜現在AI大環境裡,大家對AI的期待確實有點太激進了。但我可以告訴你,我選擇創業的核心原因,就是覺得時間點到了。畢竟創業和搞科研不一樣,創業得緊密結合市場、尊重市場規律。但就像很多比我優秀的企業家說的,創業最關鍵的是踩準時間點——不能太早,市場和技術都沒成熟;也不能太晚,否則就沒了機會。空間智能技術在World Labs(中文名:空間智能)剛成立時,確實還早了點,但也沒早到需要等五六年、十年的程度。我判斷未來一兩年,它會迎來爆發式增長。你看現在視訊生成技術的飛速發展,再到我們做的World Models,我堅信這類技術在一兩年內還會有質的飛躍,市場應用的可能性也越來越清晰。我沒法簡單定義現在發展的速度是快還是慢,但能肯定的是,現在正是做空間智能的好時機。我們現在做的“世界生成”(world generation)模型,真的特別令人激動。它的應用場景太廣泛了——從數字創意、遊戲開發、影視製作、設計領域、建築行業,到VR、XR、AR技術,再到機器人模擬,每一個大領域裡又能細分出無數小場景。而這些場景,其實都藏著對三維空間的強烈訴求。生成式AI有個很特別的價值:它能降低原本高難度事情的門檻,進而打開很多你意想不到的新市場。生成三維空間就是件超難的事——這個世界上沒多少人能做到,而且用到的Blender、Unity這類工具,操作起來特別繁瑣。我自己試過,頭都大了。其實很多創作者腦子裡裝滿了好想法,只是被工具卡住了,而非缺乏創意。而AI既能給現有創作者賦能,還能讓很多原本覺得“這事跟自己沒關係”的人,發現新可能。就像我,以前根本不會碰Blender、Unity這類軟體,覺得又麻煩又費時間,但現在AI能賦予我這種能力,我肯定願意用——它能帶來太多新靈感、新機會了。所以我覺得三維世界模型特別讓人興奮:它原本是件對普通人來說難度極高的事,而AI能降低這項能力的使用門檻,這本身就是打開市場的絕佳機會。在我看來,沒有空間智能,沒有三維世界的生成式模型,就談不上AGI(通用人工智慧)。AGI就像一扇門,上面掛著好多把鎖,需要不同的鑰匙去開啟。我始終認為空間智能是其中一把關鍵鑰匙——不過這扇門並非非開即關,而是被一點點推開的。其實我一直不太糾結AI和AGI的區別。因為兩者的夢想是相近的,都是源於一種“科學”的好奇心:機器能不能思考?能不能自主完成事情?這是AI最初的夢想,AGI的目標似乎也沒偏離太多。不管叫什麼,這個夢想都得一步步實現,我們每往前走一步,就離它更近一點。而空間智能,必然是通往這個夢想的重要一環。不管是賦能人類的創造力(從遊戲、設計到工業應用),還是給機器人賦能,亦或是元宇宙、AR/VR的內容生成與落地,都離不開空間智能。3.演算法與資料,都是AI的核心工程、數學的發展路徑和進化的路徑是不一樣的,這就像蘋果和橘子的比較,它們的進化都是很慢的。進化的迭代速度遠慢於演算法迭代,而且碳基與矽基的運算邏輯也大不相同,所以從時間維度來看,兩者沒法放在一起比。但即便如此,進化依然給了我們很多啟發和靈感。這就說到資料的重要性了。當初我們實驗室提出“資料”相關概念,其實也借鑑了不少進化的思路:漫長的進化歲月,本質上就是一段巨量資料訓練的過程;但到了數字時代,我們不用再等幾十億年去收集資料,而是可以大規模、快速地積累資料。和大自然通過進化完成的“資料積累”比起來,我們現在一次能處理、看到的資料,可能相當於進化幾千萬年才沉澱下來的量。相信自己深思熟慮後的假設,也不是什麼怪事吧?走在科學路上,對於那些經過深度思考的假設,你總得有所堅信。但作為科研人,也得清楚有些假設註定是錯的——我當然也有過很多失敗的假設。而我現在堅信的這個假設,是琢磨了很久才得出的:它在數學上是歸納推理的邏輯。我整個博士階段都在做模型、搞演算法,積累了不少領悟,才慢慢意識到這一點。說白了,AI到今天在數學層面的核心,就是“泛化”(generalization)——本質上就這一件事。而泛化怎麼實現?核心就兩點:演算法和資料,而且兩者息息相關。演算法太複雜但資料不足,會過擬合(模型在訓練資料上表現優異,但在面對新資料時性能顯著下降,無法有效泛化的情況);資料太多但演算法不夠好,同樣會過擬合——這裡面藏著明確的數學邏輯。我算是電腦視覺領域早期做機器學習的那批博士生,很幸運的是,我的博士研究剛好趕上電腦視覺的轉折點——我們大量運用機器學習的理念,這讓我對“泛化”的理解更深刻(當然,不一定只有我理解得深)。但我那時候就明確看到了資料的重要性,所以一直堅持了下來。這又回到了好奇心的話題——那個求證假設的過程其實挺有意思的,全程充滿激情,就像一路打怪升級。只要沒被“妖怪”打敗,就接著往下打唄。模型和資料的關係,本質是螺旋式上升的。當年,ImageNet搭建起電腦視覺領域最大的資料庫,直接推動了電腦視覺的蓬勃發展;後來網際網路催生了海量自然語言資料,大語言模型也跟著迎來爆發;再看現在的視訊模型發展得這麼快,核心也是有足量視訊資料支撐;自動駕駛能飛速進步,也離不開頭部公司積累的海量路況、行駛資料。現在看似“又回到了資料和演算法”,其實根本算不上“回歸”——它們從來就沒離開過AI的核心。我有時候覺得挺有意思:就算AI發展到今天,大家還是更看重演算法。但真正做AI的人,不管是創業者還是大公司從業者,心裡都清楚:資料不是說比演算法更重要,至少是同等重要。演算法聽著更“酷炫”,資料的價值反而容易被忽視。但實際上,資料本身就是一門科學。4.空間智能,賦能於“機器人”的發展① 自動駕駛,是簡化版的世界模型自動駕駛汽車其實就是機器人——它是人類最早量產的機器人,但其實挺侷限的。你想啊,它就是個方盒子,基本只在二維路面上活動,只要別碰到別的東西,不管是車、行人還是路邊設施。但我們未來要做的三維機器人不一樣:它得在三維世界裡主動“碰”各種東西,幫我們洗碗、做飯、疊衣服。這麼一對比,就知道自動駕駛汽車其實還是挺簡單的機器人。所以對應的,它的世界模型也更簡單——畢竟要做的事兒就那麼點。當然我不是說自動駕駛不厲害,特斯拉、Waymo(全球自動駕駛標竿,前身為 2009 年Google自動駕駛項目)這些公司都很了不起。但從科學和宏觀的角度看世界模型與機器人技術,這頂多隻是個開始,接下來要做的事情複雜多了。我無法斷言特斯拉有沒有(世界模型)相關佈局。但至少不會是一個強生成性的模型,畢竟業務場景本身不需要這件事。但機器人不一樣,機器人訓練離不開生成式模型——你不可能收集到足夠多的真實場景資料。而且我們做的事情都和創意、設計相關,這些本身就需要生成能力,“生成”本身就是核心應用場景之一。② 機器人的三維能力,還在早期階段現在矽谷的機器人領域大火,我也特別喜歡這個領域,也一直很看好機器人的前景。但同時,我也覺得要保持冷靜:機器人研究其實還處在早期階段。首先,最核心的問題是缺資料。汽車行業發展了幾十年,還有無數人在開車過程中持續蒐集資料;可機器人目前基本沒有商業化應用場景,尤其是日常消費級場景,資料自然難收集。而生成式AI的出現,給機器人領域帶來了一條有意思又有前景的出路。像視訊生成這類技術,不僅提供了豐富的訓練想像空間,還能用於擬態——比如我們正在做的機器人模擬,就特別有前景;甚至在推理階段,還能用視訊模型輔助線上做規劃。可以說,正是機器人周邊領域(比如生成式AI)的快速發展,在反過來帶動機器人技術進步,這一點確實讓人激動。但機器人要真正實現商業化,還有一段路要走,尤其是日常消費級機器人。不過工業機器人早就落地了,畢竟它的應用場景相對單一,容易約束環境,而且也積累了不少資料。自動化駕駛和機器人兩者之間,既有可比性,也有不可比之處。自動駕駛從概唸到商業化,走了近20年:Google2006年就成立了小型自動駕駛研發團隊,直到2024年Waymo才正式上路。汽車行業的供應鏈、OEM體系、客戶場景都非常成熟,這一點讓自動駕駛的商業化比機器人快得多;但當年AI技術不成熟,自動駕駛在AI這條路上走了很久,而現在AI的發展速度肯定會更快。可除了工業機器人(或者說場景單一、易約束的工業機器人),目前並沒有像汽車那樣成熟的機器人應用場景。所以機器人商業化之路會比20年快,還是更慢,真的很難說。但我相信,AI層面的進展會比當年自動駕駛時期快一些;可反過來,機器人面臨的問題也更複雜——它要應對的是完整的三維世界。AI已經能做到非常出色,可要說今天的空間智能,能達到人類睜開眼就有的那種對三維世界的深層理解,還差得遠。比如物體間的物理關係、材料屬性、物理特性,這些我們人類能直觀感知的豐富資訊,AI還沒法完全掌握;更別說對社交資訊、人與人之間情感的理解,這些都屬於視覺理解的範疇,而我還沒提語言層面的複雜認知。人類本身就是極其複雜的存在。所以從進化和能力來看,AI在某些方面已經追上甚至超越人類,但在很多核心維度上,還遠遠不及。而且我作為深耕AI和科技領域多年的人,對空間智能的信仰,絕不是盲目崇拜。它源於對技術的深刻理解,源於這麼多年在這個領域的深耕,也源於我和同事們看到的技術機會與發展方向。創業確實需要情懷,但對科技趨勢的判斷,更需要紮實的邏輯和科學的判斷。二、AI的未來:人類有責任讓其“向善”1.機會,並非贏家通吃綜合來看,資料、算力、人才的整合能力很關鍵——現在能做好這些資源整合的公司,存活機率和勝率會更高。但我覺得,不能只盯著這些顯性因素。畢竟顯性因素一眼就能看到,也容易被大家熱議追捧,但光靠這些遠遠不夠。舉個簡單的例子,在AI coding領域,微軟應該是第一個下場的,推出了Copilot(微軟推出的跨平台生成式 AI 助手)。它可謂佔盡了天時地利人和:手握所有資源、坐擁現成場景,連GitHub(微軟旗下的開發者平台)都是自己的。可微軟最終沒能成為行業標竿,反倒是矽谷現在火起來的Cursor、Claude Code這些小公司,在巨頭圍剿下實現了突圍。這就說明,光有顯性因素根本不夠。如果大家都只盯著這些表面資源下判斷,很容易出現偏差。人類歷史上,從來沒有那個時代是大公司獨霸天下的——即便每個時代的大公司都手握超強的資源整合能力。所以這裡邊還藏著更關鍵的東西:創造力、機遇、執行力,還有對時間點的把握,這些都是決定成敗的核心變數。再加上,AI本身就是一門橫向技術,能催生出無數應用級機會,大公司根本做不完。這些機會,恰恰給了小公司足夠的空間:把某個應用做到極致,慢慢撕開市場缺口,完全有可能實現彎道超車。2.AI只是工具“AI是工具”,這其實是常識。工具本就是雙刃劍:人類史上所有工具,小到最初的火、石斧,大到核彈、生物技術,再到如今的AI,無一例外。我當然也認為,工具的使用必須向善,但同時也要防範它被誤用,不管是有意還是無意。所以我覺得,兩種極端都不理性:只追求發展而無視安全與向善,必然是災難;但天天空談倫理向善而停滯發展,也會錯失技術帶來的諸多福祉。就像做父母,你會教孩子用火做飯吧?既要告訴他們火能做飯的好處,也得讓他們知道用火的危險,這是再簡單不過的道理。AI既是權力的工具,也是向善的工具,但它永遠只是工具。在我看來,這工具會越來越強大,但在它真正不可控之前,它始終屬於人類——人類有責任讓它保持可控。但就像所有工具一樣,我們從來不會指望工具自己明白該做什麼:向善與否,本質是人類的責任。所以對AI的控制與引導,是法律、制度、教育和整個社會的共同責任。不同社會、不同個體或許有差異,但這份責任終究在人類身上。3.教育體系,到了徹底變革的時刻AI時代迫切需要我們更新教育理念和方式——既要讓孩子們學會用這個工具,借助它賦能創造力、助力學習;也要讓他們清楚工具可能存在的問題與風險。而且這絕不僅僅是教育孩子的事。我們總覺得該教育孩子,殊不知最需要被教育的其實是成年人自己。所以,自我教育、面向公眾的科普、給政策與法律制定者提供充足資訊和學習機會,這些都至關重要。說到底,對AI的發展與治理,本質上就是我們人類自身的學習、發展與治理——核心還是人的問題。在這個AI成為具備智力能力的工具的時代,它帶給我們的最大啟發,或許是讓我們更好地瞭解自己、治理自己——這裡的“自己”,既包括每個個體,也包括人類群體。現在關於AI的討論沸沸揚揚,大家都熱衷於談論這項技術。但說到底,不管是個體人性還是群體人性,欠缺的或許還是那份自省吧。對個體來說,時代正在劇變,再做“鴕鳥”逃避現實絕非明智之舉。這種變化必然帶來工作形態的重塑。任何重大科技革命都會引發職業變遷,有時是短暫陣痛、軟著陸,有時可能伴隨社會動盪。作為個體,還是要保持好奇心——對生命、對世界的好奇。那怕這份好奇心,在成年人的世界裡源於對未知的恐慌也沒關係,至少它能成為驅動你主動學習的動力。這一點,值得每個個體自省。而從群體層面來看,AI時代最急需革新的,是我們的教育體系。不管是國內的K-12教育,還是美國這邊雖不唯應試但仍包含應試、仍側重“知識填充”的教學模式,都亟待更新。AI正在不斷證明,很多事情機器能做得更好。如果還讓人類花十幾年、幾十年時間,去重複大半機器可替代的工作,無疑是對人類潛能的浪費。所以我特別想呼籲:所有關注教育、能影響教育政策以及踐行教育的人,都要牢牢抓住這個時代機遇。我們的教育方法論,已經100多年沒有本質變化了。我最大的期待是,100年後歷史學家回望21世紀上半葉時,會看到人類完成了一次真正的教育革命。借助AI賦能教育者與學生,把節約下來的大量時間和精力,讓學生們在老師的引導以及自我探索中,去積累那些AI永遠做不到的認知與核心能力。人類的潛力其實無比巨大,每個個體都是如此。我們的大腦遠未被充分開發,不管是作為個體還是群體,都還沒發揮出全部潛能。你只要看看人與人之間的能力差異,就能感受到這份潛力有多驚人:有些人展現出的能力,簡直像“超人”一樣。這說明,這種極致的潛能本就藏在人性之中,只是大多數人都沒能把它激發出來。而AI這個工具的出現,甚至它對人類工作帶來的衝擊,恰恰給了我們一個契機——重新審視並重構整個教育體系。我覺得真正的教育變革,應該打破工科與文科的固有界限:畢竟AI能讓所有人都學會程式設計,那這些人還能簡單歸為工科生嗎?AI也能幫更多人更好地感知美、讀書、作詩,文科的邊界也被打破了。所以,以前的分科邏輯完全可以改變——AI給了我們打破這種侷限的機會。但說到底,關鍵還是人怎麼使用這個工具。我最擔心的,是人類會放棄自我:覺得“AI這麼聰明,有沒有我都一樣”,這種想法太可怕了。“躺平”這個詞很形象,但背後的心態真的危險。人類有太多未被發掘的潛力,有太多創造世界的可能,有太多讓這個世界變得更美好的機會。而AI,終究只是一個工具而已。如果我們放棄了自身的能動性(agency),就等於放棄了改變自己、改變世界的好奇心與動力。說實話,我真的不懂什麼叫“AI就是世界”。就像有人說“一花一世界”,我能理解那份意境,但“AI就是世界”的說法,我實在摸不透它的核心含義。其實“AI只是工具”這句話的背後,本質是我們如何看待AI與人的關係——把AI當工具,意味著人類始終把自身放在更重要的位置,意味著我們更該關注自我的成長與價值。說到底,“AI是工具”這句話裡,藏著我對人的信仰——我信仰人性的潛力,信仰人類社會的韌性,我信仰的是人,而不是AI。尾聲李飛飛,是對技術趨勢的清醒判斷者。AI,是我們這一代人此生最大的機會。她說,AI時代,人類迎來一次教育的革命,從知識性教育到技能型教育,到認知結構,到人本身的教育,都可以改變。正是在這個時代背景下,筆記俠推出了中國首個面向企業家的AI時代PPE(政治、經濟、哲學)底層認知課程。以AI時代為背景,通過人工智慧科學、AI文明、經濟學、政治學、哲學、智能商業等視角,從底層把握AI時代,激發創業者們在AI時代的潛力,培養能駕馭AI範式轉移的決策者。如何擁抱AI時代,需要理解那些?要理解技術。人工智慧必然重構人類社會的底層邏輯。成為新人類,是決策者的宿命。要理解商業。當AI成為核心生產要素,企業的價值創作邏輯和增長範式會發生根本性變化。要理解世界。在波譎雲詭的世界中生存發展,決策者需要深刻理解AI時代下國際政治經濟體系運行的規律和趨勢。要理解中國。中國走向現代化的道路,必然建築在中國的文化基因上,理解中國才能穿越宏觀周期,活在中國,贏在中國。要理解自己。活出內心的自由和篤定,不被AI時代外界的震盪所撼動,決策者才有心力成為企業的定海神針。這,就需要回到決策的源頭:AI技術與文明、哲學、政治、經濟,重構我們的底層認知邏輯。我們一起做AI時代保持清醒和篤定的決策者。 (筆記俠)
兆豪賭:年底AI大戰背後的三個趨勢
今天我們要關注的重點是AI。不知道你發現一件事沒有,每到年底,各路AI大廠的動作都特別密集。11月12日,李飛飛發佈了新的世界模型Marble。11月13日,OpenAI宣佈推出GPT-5.1。11月18日,Google發佈了Gemini 3,號稱是目前為止測試評分最高的大模型之一。從10月初到11月中旬,中國多家AI企業也在密集發佈模型更新。螞蟻、阿里、科大訊飛、字節、百度,幾乎是排著隊發佈。在年底的這一輪“AI熱點大爆發”裡,有那些消息特別值得留意呢?接下來,咱們就展開說說。01 AI的技術在分化回顧去年這個時候,山姆·奧特曼宣佈,OpenAI要連續12天發佈新品。12月也成了OpenAI一年中火力最猛的時期。而且幾乎是同時,Google發佈Gemini2,號稱是“專為智能體而生”。還有,李飛飛的第一個AI系統,World Labs也是在這個時間發佈的。而今年呢,情況與去年驚人地押韻。只不過,整體提早了大概一個月。我們大致給這些AI界的消息分了分類,可以用三個關鍵詞概括。分別是,技術的分化、資源的分化,以及“賭注”的極端化。第一,AI的技術分化。今天的AI公司看起來很多,怎麼快速瞭解它們的技術走向呢?關於這個問題,喻穎正老師做過一個分類。世界上的AI流派,大概可以分成三種:湧現派、訓鳥派、飛機派。湧現派,代表人物是奧特曼。他們相信“規模化就是一切”。只要喂足夠多的資料,AI就會自發“湧現”出智能。就像天才兒童看了足夠多關於鳥和飛機的視訊,就能自己發明空氣動力學一樣。目前的多數AI公司,包括Google在內,也都屬於這一派。訓鳥派,代表人物就是李飛飛。她認為AI需要“身體”,需要在物理世界中學習。所有抽象概念都源於身體與物理世界的互動經驗,沒有身體,就沒有真正的理解。所以AI需要的不是被動的視訊資料,而是通過機器人主動互動收集到的“動作資料”。飛機派,代表人物是楊立昆。他認為大模型只是“鸚鵡學舌”,AI需要先天架構才能組織經驗。人類不是通過模仿鳥學會飛行的,而是通過理解空氣動力學原理造出了飛機。AI必須通過一個全新設計的、非生成式的“世界模型”來學習抽象規則和因果。我們今天看到的多數AI技術的進展,在底層模型這個層面,都可以歸類到前面三者中的某一個。比如,李飛飛發佈Marble,是“訓鳥派”的實踐。她在為AI建構一個可以“練習飛行”的高保真模擬器。而Google發佈了Gemini 3。這個模型在評測平台LMArena上以1501分的歷史最高分登頂,成為首個突破1500分的模型。這是“湧現派”的延續,繼續在規模化的道路上狂奔。前面三個流派,都只是在基礎模型這個維度上的分類。而在基礎模型之上,目前AI領域還有另一個關鍵維度,應用層。現在有大量的公司,都把精力聚焦在了應用層。比如,從10月初到11月中旬,中國多家AI企業陸續發佈了大模型更新。10月9日,螞蟻集團推出兆參數通用模型,主打金融場景。10月15日,阿里巴巴開源支援256K超長上下文的視覺語言模型,主打視覺理解。11月初,科大訊飛發佈星火大模型X1.5版本,強調醫療領域優勢。這些模型的差異化,不再是參數規模,而是垂直領域的能力。大家都在強調自己在特定場景的優勢,而不是單純地比拚模型大小。當然,不只是AI的技術在分化,它背後的資本也在分化。02 AI背後資本的分化第二個關鍵詞,資本的分化。一邊是持續押注,另一邊是看衰做空。最近,關於AI泡沫的討論一直很激烈。11月19日,在美國—沙烏地阿拉伯投資論壇上,主持人直接向黃仁勳和馬斯克提問:“我們正在面臨一場AI泡沫嗎?”這個問題不是空穴來風。看幾個數字你就明白了。輝達從1兆美元市值漲到5兆美元,用時不到兩年半,漲幅400%。《經濟學人》統計顯示,自2022年11月ChatGPT發佈以來,AI概念股累計貢獻了美股標普500指數3/4的漲幅。整個2024年,美國家庭新增財富接近一半由AI概念股創造。更驚人的資料是,2025年上半年,美國有92%的GDP增長是AI產業支出貢獻的。但問題在於,這些投入能換來多少回報?OpenAI單周活躍使用者超8億人,但付費使用者比例僅5%。2024年營收不到40億美元,虧損卻超50億美元,但未來五年投資承諾高達1.4兆美元。摩根大通研報估計:到2030年,美國AI企業承諾的軟硬體投資額度,可能逼近每年7兆美元,即使只要求10%的資本回報率,每年也得尋求至少6500億美元營收。但整個2024年,美國AI產業實際營收僅500億美元,只有目標的一個零頭。麥肯錫調研顯示,近80%部署AI的企業沒能實現淨利潤提升,95%的生成式AI試點項目沒有帶來直接財務回報。比爾·蓋茲、IMF總裁格奧爾基耶娃都警告,美國當前正處於類似上世紀90年代末“網際網路泡沫”的AI投資熱潮,許多當下投資最終可能成為壞帳。前段時間,著名的“大空頭”麥可·貝瑞,還把13.5%的投資組合用於做空輝達。但是,與此同時,也有大量資本對AI依然充滿熱情。比如,巴菲特在今年11月建倉Google,這算是個直接訊號。當然,巴菲特對Google的投資並不完全是出於AI的考量,我們在這裡就不細說了。再比如,還有個值得留意的消息,只不過這個消息有點迂迴,需要多解釋兩句。前段時間,亞馬遜宣佈裁員1.4萬人。裁員消息公佈當天,亞馬遜股價不跌反漲1%。財報發佈後,股價更是暴漲13%,市值單日增加3000億美元。你看,華爾街不但不擔心亞馬遜裁員,反而覺得這是好事。因為外界對這件事的普遍解讀是,亞馬遜在通過裁員留出更多的預算,並且把這些預算用來投資伺服器與資料中心。說白了,這更像是在為AI投資騰出預算。外界看好亞馬遜,本質是在某種程度上看好AI。有人在瘋狂押注AI,有人在質疑泡沫,有人在調整結構為AI騰空間。這就是我們所說的,資本的分化。03 賭注的極端化第三個關鍵詞,賭注的極端化。技術在分化,資本在分化,但有一件事情是一致的:這個行業裡的賭注,正在變得越來越極端。11月6日,特斯拉股東大會上,超過76%的股東批准了馬斯克的新薪酬方案。假如目標達成,馬斯克將獲得最高1兆美元市值的特斯拉股票。但注意,馬斯克要拿到這筆錢,需要完成幾個極具挑戰性的目標:特斯拉的市值從1.5兆增長到8.5兆美元,同時實現累計交付2000萬輛汽車、100萬台人形機器人商用、100萬輛自動駕駛計程車上路。這幾個目標與AI的關聯度很高。換句話說,這筆錢不是在獎勵馬斯克過去的貢獻,而是在為特斯拉的未來下注,而且是個極端的賭注。賭對了,馬斯克拿走1兆美元,股東的財富也會暴漲。賭錯了,這個薪酬方案就是一張廢紙。再看人才市場。11月12日,被稱為“AI天才少女”的羅福莉在朋友圈官宣加入小米。根據相關報導,羅福莉的年薪在千萬等級。字節跳動最近也啟動了針對AI核心人才的激勵實驗。據說他們還為旗下Seed部門發放了每月10萬元左右的津貼,面向大模型方向的技術員工。根據中國獵頭機構的資料,AI相關崗位的薪資今年明顯上漲。很多演算法工程師在跳槽的過程中,年薪漲了一倍不止。而像清華、北大、浙大、上交這些頂尖高校出來的AI博士,頂尖人才的年薪可以達到200萬到400萬元之間。根據中國國務院發展研究中心預測,中國具身智能產業的市場規模,2030年將達到4000億元,2035年預計突破兆元。從馬斯克的兆薪酬,到AI人才的千萬年薪,再到兆級的產業預測,這些數字背後也許是一個共同的邏輯:AI不再是一個可以慢慢試錯的領域,而是一場必須全力以赴的豪賭。前面這些新聞乍一看好像很分散,但是,假如放在一起看,我們或許會產生一個總體的感受。這就是,AI正在從一個技術話題,變成一個關於選擇和押注的話題。技術路線在分化,沒人知道湧現派、訓鳥派、飛機派誰會贏。資本在分化,有人瘋狂進場,有人質疑泡沫。賭注在極端化,從兆薪酬到千萬年薪,每個數字背後都是一個關於未來的押注。李飛飛在《世界模型宣言》中說過一句話,講的是關於AI未來的可能性,我們放在最後,作為今天的結尾吧。這句話是這麼說的,“我語言的極限,意味著我世界的極限。我不是哲學家,但我深知,至少對AI而言,世界遠不止於文字。” (羅輯思維)