#3D
中國國產半導體裝置新突破,便宜大碗的自主儲存晶片真要來了?
坐等根據瑞銀(UBS)近期發佈的一份報告,中國半導體裝置領軍企業北方華創(NAURA)在關鍵的深孔刻蝕技術上取得了重大進展。北方華創成功攻克了 90:1 高縱橫比(HAR)深孔刻蝕技術,這為國記憶體儲晶片廠商實現300層以上3D NAND快閃記憶體的製造奠定了裝置基礎。3D NAND技術是當前儲存晶片提高密度的核心路徑,廠商通過不斷堆疊儲存單元層數來提升容量。隨著層數從128層邁向200層乃至300層,對製造工藝的要求也達到了極致。晶片製造商需要在數微米厚的多層材料中,垂直打出直徑僅幾十奈米的“通孔”,以連接各層儲存單元。當層數達到300層以上時,所需的深寬比(即深度與直徑之比)將達到90:1或更高。深孔刻蝕正是實現這一目標的最苛刻工藝之一,長期以來由美國泛林(Lam Research)和日本東京電子(TEL)等國際巨頭主導。在美國對華實施半導體裝置出口管制、先進儲存裝置禁運的背景下,國記憶體儲廠商對核心裝置的中國國產化需求已上升為“必選項”。北方華創此次的技術突破,正是在這一戰略關鍵期的重要進展。值得一提的是,中國另一家刻蝕裝置龍頭中微公司此前也已宣佈具備90:1深孔刻蝕能力,並正在加速攻克100:1技術,顯示出中國裝置廠商在這一領域整體的奮起直追態勢。瑞銀分析指出,如果北方華創的90:1刻蝕裝置能順利獲得中國NAND晶圓廠的訂單,預計將為公司打開數億乃至數十億美元的新增市場空間。同時,由於中國邏輯晶片廠商對先進製程裝置的需求持續旺盛,北方華創來自邏輯客戶的收入也有進一步增長潛力。基於對市場需求的樂觀判斷,瑞銀已將北方華創2026年和2027年的晶圓廠裝置(WFE)收入預測分別上調1%和8%。事實上,北方華創的業務佈局已覆蓋多個高增長領域。公司近期在投資者互動平台上透露,隨著 HBM(高頻寬記憶體)市場需求的爆發,公司在HBM晶片製造領域已形成完整的解決方案。這包括深矽刻蝕、薄膜沉積、熱處理、濕法清洗、電鍍等多款核心裝置。面對投資者關於“美系裝置斷供下訂單情況”的提問,北方華創回應稱,目前公司在儲存裝置和成熟製程裝置方面的訂單保持良好態勢,產品已廣泛應用於中國主流晶片廠商的生產線。當前,AI、雲端運算等新興應用正在推動儲存晶片進入新一輪擴產周期,行業供需缺口明顯。據業內預測,2025 年至2027年全球HBM產能將增長超過300%。中國作為全球最大的儲存晶片消費市場,本土製造的迫切需求為北方華創等中國國產裝置商帶來了歷史性的發展機遇。此次突破,使得國記憶體儲晶片廠商在關鍵裝置採購上擁有了可靠的本土選項,極大地降低了外部管制帶來的風險。配合中微公司的同步進展,中國國產刻蝕裝置正在形成強大的叢集效應,這對於儲存器產業實現自主可控具有里程碑意義。目前中國市場對儲存晶片的依賴度,仍以韓國的三星和 SK 海力士為主,美光也佔據重要地位,有大量的市場等待開拓。當下中國國產DRAM佔據全球市場份額僅3~5%,而NAND快閃記憶體領域也不過是5~8%。而中國是全球雲端運算和 AI 基礎設施增長最快的市場之一,對高性能伺服器記憶體的需求巨大,同時也是全球最大的智慧型手機和 PC 製造及消費市場,對DRAM的需求佔比預估為30~40%。隨著資料中心和 PC 市場對固態硬碟的需求增加,NAND快閃記憶體的需求量持續攀升,在手機儲存上也需要大量的UFS儲存晶片,因此對NAND快閃記憶體的產能需求同樣巨大,佔全球產能1/3左右。而若要實現中國國產裝置儲存全面自主化,這些待開拓的市場價值超過三千億元,這對於我們的企業既是機會也是挑戰。希望我們的儲存晶片企業能夠抓住這次機會,趁上行期好好擴充產能,為全面自主添磚加瓦。 (AMP實驗室)
屏下3D+微透玻璃?iPhone18系列新爆料 | 小米17Pro背屏玩法再上新
蘋果每次新機爆料都非常早,儘管最近兩個月電商大促iPhone 17系列一直熱銷,但也不影響iPhone 18系列的爆料越來越多。現據數位博主@智慧皮卡丘 爆料,iPhone 18系列物料端正在測試屏下3D人臉解鎖,同時還在測試微透玻璃,有望推動一波供應鏈加速。不過需要注意的是,此前也有爆料稱iPhone 18 Pro系列在測試屏下3D,但螢幕形態並不是像努比亞紅魔那樣的無打孔·屏下前置,而是可能變成左側單挖孔螢幕或者基於之前的靈動島顯示面積縮窄。除了螢幕形態變化外,爆料iPhone 18 Pro系列升級還有搭載全新A20 Pro晶片 、蘋果第二代自研C2基帶,升級相機感測器同時有望引入可變光圈、簡化拍照鍵等等,iPhone 18 Pro Max還可能是Pro Max型號首次採用鋼殼電池。細節上,還需要注意的是,爆料iPhone 18系列幾款機型這次可能不會一起發佈,而是Pro系列先發,標準版後發,爆料預計蘋果會在2026年秋季(9月左右)先發iPhone 18 Pro、18 Pro Max和蘋果的首款摺疊屏,2027年再發iPhone 18和iPhone 18e,其中iPhone 18標準版可能依舊是居中挖孔靈動島造型。綜合各種爆料來看,如果iPhone 18 Pro系列採用左側單挖孔多少有些像過渡方案,不如期待2027年·蘋果20周年要迭代的新iPhone。大家覺得蘋果會採用左側單挖孔嗎?另外就是小米17 Pro系列這邊了,今年小米17 Pro和小米17 Pro Max兩款新機採用了背屏設計,官方陸續上新了不少玩法,現據最新消息,又雙叒有新功能了。據網友反饋,小米17 Pro系列手機已開啟HyperOS3.0.34.0正式版內測升級,除了最佳化遊戲性能、最佳化相機畫質效果/提升拍攝的流暢度和穩定性外,最主要就是針對背屏玩法進行了上新:新增背屏個性化趣味壁紙-方糖,新增自訂壁紙支援動態照片/視訊格式,新增在背屏用三指下拉手勢進行截圖、支援多種帶殼螢幕擷圖樣式,新增支援生成的背屏AI壁紙一鍵保存至相簿等等。其中背屏新增的方糖趣味壁紙還有互動屬性,類似養成系電子寵物。 (小白測評)
大疆旁邊咖啡館擠滿了投資人
“以大疆總部天空之城為圓心,半徑10公里內,就能找到不錯的硬體項目。”一家頭部基金投資人聊起今年在深圳掃貨的隱秘地圖。沿著這份投資地圖,你會發現:90後前大疆工程師唐文軒創辦的無弦吉他LiberLive已完成兩輪融資,與大疆相隔300米;大疆昔日電池研發部負責人王雷創辦的正浩創新,距離大疆400米;大疆前高管魏基棟的松靈機器人坐落在南山智園,距離大疆20分鐘車程;還有海外爆紅的深圳智能硬體“三劍客”——影石創新、韶音科技、拓竹科技,都距離大疆不到半小時車程。想起今年以來,見到多位從外地過來的投資人,對方出奇一致地都約在了大疆附近的咖啡館,“我們最近在看AI硬體。”當工程師人才們選擇從大疆出走創業時,往往不會走遠,於是便有了中國硬體創新的新聖地。“每個真正關注AI硬體落地的人,都要去深圳。”年底創投圈,有多家頭部VC正在招聘AI硬體投資人,且無一例外都要求base深圳。如此一幕,正是深圳硬體生態繁榮最具象的縮影。01 “FOMO大疆系”坊間流傳:當年陶冶還在大疆時,曾建議公司入局3D列印,但並未被採納,這才有了後來估值百億美金的拓竹。關於這個故事,投資界得到了另一個版本:一位任職於頭部美元基金的投資人通過校友圈結識了陶冶,交談中瞭解到陶冶對3D列印的構想後,極力鼓勵他出來創業,此後拓竹誕生。告別大疆,陶冶帶走了老同事高秀峰、劉懷宇、陳子涵、吳偉四人,這便是外界熟知的拓竹“創始5人組”。如今再看當年那張五人合影,似乎預示著一個起點——VC追蹤“大疆系”的開始。一家深圳本土VC機構合夥人回憶,內部第一次討論拓竹是在2022年,那時的硬體投資圈,大家都在看戶外電源,普遍認為3D列印賽道太窄,沒有太大的想像空間。然而沒想到,僅過去兩年,這條賽道就被拓竹點燃。此時的拓竹,估值早已水漲船高,大多數投資機構已經錯過了入場機會。今年,陶冶和拓竹成為不少科技投資人研究的對象。脫胎於大疆,拓竹的成長路徑與前東家極其相似,甚至連內部組織、社區搭建、海外市場擴張等都有早期大疆的影子。正因如此,一個群體在VC圈爆紅——“大疆系創業者”。比陶冶早幾年,王雷在2017年離開一手建立的大疆電池研發部,成立移動儲能公司正浩創新;早王雷一年,大疆高管魏基棟決定去做機器人,松靈機器人成立,今年拿下紅杉中國、五源資本、祥峰投資和HKX的億元融資。更有今年剛成立就拿下紅杉中國、經緯創投、美團龍珠融資的妙動科技……這是一串長到讓人驚訝的名單——散是滿天星,現在這群大疆前員工遍佈各個細分賽道創業,梳理下來卻有一個共同點——幾乎聚焦於硬體領域,大多是技術派,崇尚工程師文化。某種程度上,大疆成為中國硬體創業的“黃埔軍校”。“今年投資人fomo大疆系。”Fear of Missing Out,fomo情緒歷來是創投圈風向標。一位VC朋友聊起,從大疆出來的創始人,那怕只有個創業理念,估值都能比別人翻幾倍。02 投資人來找項目大疆系只是一抹縮影。記得一年前,一位長三角投資人朋友把家搬到了深圳,原因很直接:“硬體創業看深圳”已是基本共識,這裡離供應鏈更近,離出海也更近。如今搭上AI浪潮,硬體又一次成為風口。“從去年開始,我們就關注到有一批硬體創業者冒頭,今年‘AI+硬體’成為趨勢後,同行明顯在向深圳乃至大灣區聚集。”一家深圳本土機構的投資人聊起這一幕。此時此刻,深圳硬體融資火爆。最新一幕是戴盟機器人宣佈完成新一輪戰略融資;剛剛過去的11月,兒童智能硬體公司奇朵智能成立僅三個月已完成兩輪種子輪融資;護理機器人公司作為科技拿下近億元融資。更早一些,陪伴機器人躍然創新(Haivivi)完成2億元A輪融資,此外還有聯合飛機、睿魔創新、靈啟萬物、攬月動力、妙動科技……他們的背後,紅杉中國、中金資本、經緯創投、順為資本一眾頭部機構雲集。這當中,另一個新面孔尤為搶眼——小紅書戰投。梳理下來,今年小紅書在深圳密集出手了創立不到半年的陪伴機器人宇靈無限(Skyris)、全自動泡沫軸的雲望創新、做智能肩部護理儀的夢馬創新等項目。不久前,小紅書還開了深圳總部,落地南山區金地威新中心,與騰訊為鄰‌,距離大疆只有不到半小時車程。還有一個不易察覺的現象:原始碼資本、明勢創投、線性資本等多家知名VC最近都在深圳開了年會。人的流動,錢的流動,影響深遠。03 深圳,硬體矽谷爆發縱觀深圳硬體進化史,大疆堪稱一個關鍵轉折點,它徹底重塑了世界對“中國製造”的想像力,撕去了中國硬體“山寨”“低廉”等標籤,潛移默化間也影響了一代創業者,使得一眾年輕人對“搞硬體就去深圳”心嚮往之。正如90後創始人劉靖康,在影石創新創立之初,思來想去還是把公司從南京搬到了供應鏈更完善的深圳。在深圳創業十年,影石創新於今年6月登陸A股,劉靖康成為科創板最年輕的IPO敲鐘人。事實上,深圳一直以來奉行的是“競爭不是單個企業的競爭,更多是生態的競爭”。這是一種更深邃、也更持久的城市競爭策略,使得其硬體生態百花齊放。正如在大疆背後,深圳編織了一張龐大的無人機生態網路,產業鏈涵蓋了從研發、生產到銷售、服務等各個環節。一個世界無人機之都悄然浮現,單是南山區,就有”不出南山就能造一台無人機“的說法。今年火爆的人形機器人賽道,深圳同樣火力全開。據統計,在深圳,頭部人形機器人企業國產化率超90%,產業鏈供應鏈本地化率突破60%。據說在南山“機器人谷”,10公里內基本可以完成機器人從設計到量產閉環。拓竹成為最火獨角獸背後,深圳築造了整個3D印表機全產業鏈,從建模系統到材料裝置再到應用服務,快到上午設計圖紙,下午樣品就能送達產線,“在深圳,每2分鐘就能組裝一台3D印表機”。凡此種種,都是深圳硬體繁榮的一抹縮影。行至當下,新一代年輕創始人正登上歷史舞台。與上一代“外貿製造”出身的創業者不同,他們成長於網際網路時代,對全球市場沒有距離感,之於創業有著全然不同的視野與抱負,全球化可以說是他們做產品構思的起點。如此一來,地處珠江三角洲,背靠全球最完整、最活躍的製造叢集,又面向香港這一國際自由貿易港,這些得天獨厚的地理與產業條件,讓深圳依然是一代代年輕人將硬體夢想付諸實踐的首選之地。不久前,美國《時代》周刊公佈2025年最佳發明榜單,入選的中國產品中有超七成來自深圳,從3D列印裝置、電池、相機,到手機、耳機、AR眼鏡、網球訓練機器人等等,它們都有個共同特徵:“深圳智造”。創新永不落幕,今天的深圳依然是那個“中國最像矽谷的地方”。 (華爾街見聞)
智捷醫學科技帶領3D標準化Anatomy Cloud GPT搶進百億美元市場
▲圖為智捷醫學科技孫繼信董事長於台上發表AI 醫療影像 3D 標準化成果。衛福部次長莊人祥12/4於智捷醫學科技(IntelliGen Technology)主辦的全球創新 AI 醫療影像 3D 標準化成果與 MR 應用大會上指出:「全球醫療仍停留在黑白 2D,台灣已準備跨入下一個時代。」▲圖為衛福部次長莊人祥蒞臨台上致詞搶進百億美元市場在全球醫療 3D 影像市場規模突破 13.6 億美元、AI 醫療影像市場 CAGR 高達 34% 的背景下,台灣此舉不僅是與趨勢接軌,更是明確展現 主動引領智慧醫療升級的產業戰略,並在全球醫療影像升級浪潮中扮演關鍵推動者。AI 將 CT/MRI 黑白影像即時3D 化,被視為未來十年醫療科技的主戰場,也是各國積極投入的醫療影像升級項目。台灣下一座護國神山台灣的智捷醫學科技(Intelligen Technology)憑藉自主研發的 Anatomy Cloud GPT 技術,可於 5 分鐘內完成黑白影像轉為高解析彩色 3D,成為目前台灣推動 3D 標準化最關鍵的技術提供者。其 AI 醫療雲端系統 「Anatomy Cloud GPT」 也以突破性成果獲得 第 21 屆國家新創獎「初創企業獎」 殊榮,引發產業高度關注。智捷醫學科技執行董事 鍾富瑋 於會中指出,「3D AI 醫療影像將從醫院內部工具,轉變為全球標準化平台。台灣有機會在這個市場中,提前卡位成為技術輸出國。」執行董事 鍾富瑋強調,3D 影像標準化將帶動 設備汰換、雲端服務、教育訓練、醫材整合、跨國醫療合作 等龐大需求,形塑出「超過百億美元」的新市場,而 Anatomy Cloud GPT 已成為此產業鏈中的核心引擎。▲智捷執行董事鍾富瑋表示3D AI影像技術不僅是臨床醫療技術的進步,更是台灣AI醫療走入全球的第一步。他進一步指出:「智捷正在與亞洲、歐洲多國洽談合作,2026也將啟動海外布局。Anatomy Cloud GPT不僅是醫療影像的革新服務,更可以整合AI、通信、雲端、教育、S I等的產業鏈我們相信台灣具備打造下一座『醫療 AI 護國神山』的條件。」
蘋果這波更新,有億點瘋狂
不知不覺間,蘋果又做了一件大事。前段時間,蘋果主動「揭秘」,指其在 Apple Watch Ultra 3 等鈦金屬框架的產品上,採用了全新的「鈦金屬列印」工藝,甚至久違地為這一工藝推出了專門的宣傳視訊。圖片來源:雷科技單從這項宣傳的「直接影響」來看,這次工藝升級看似有些「失敗」,畢竟絕大多數 Apple Watch Ultra 使用者根本就沒有意識到蘋果更換了新的製造工藝,更不用說體驗到工藝升級背後的「技術提升了」。但在小雷看來,這種「使用者看不出差別」的工藝改進,恰恰證明了蘋果鈦金屬列印工藝的成功——能用更低的製造成本、維持相同的產品性能,同時良品率翻倍,原料浪費也直線減少,相信有過機械加工經驗的朋友,都能理解這是多麼巨大的成就。那麼,這項被稱之為「3D 列印」的鈦金屬製造工藝,又是怎麼一回事呢?和市面上的3D列印截然不同如果把蘋果這次宣傳的「鈦金屬列印」放到整個 3D 列印體系裡去看,它確實屬於增材製造的一類,但這和大眾理解的 3D 列印與蘋果採用的技術完全不是同一種工具。一般來說,常見的 3D 列印技術有兩種:熱材料擠出列印(FDM)和光固化列印(SLA)。這兩種列印技術非常好區分:前者的耗材是一卷卷的「塑料」條(比如 PLA),通過「加熱耗材-冷卻耗材」來固化;後者的耗材是特殊的光敏樹脂液,光頭在特定位置用特定波長的光(通常為 UV)照射固化,從而一層層堆疊出模型來。圖片來源:Formlabs和 FDM 方案相比,光固化的優勢很明顯——SLA 方案「拉」出來的模型細節保留遠超 FDM 工藝。但無論它的成型質量看起來多麼「像金屬」,光固化模型終究是一種聚合物結構,在強度、抗高溫、抗腐蝕方面都有天然的短板。它可以測試造型、驗證裝配,無法用於製造手機、手錶外殼。說回蘋果,蘋果這次使用的雷射金屬熔融工藝(SLM),雖然看起來和光固化有點像,但核心技術大有不同:圖片來源:Apple雷射金屬熔融工藝的核心在於讓金屬粉末在雷射能量下熔融、堆疊成型。和 SLA 相比,SLM 的原料不是樹脂液,而是數十微米級的鈦金屬粉末;能量也不是紫外線,而是多台高能雷射器;最終產物更不是塑料模型,而是可以進行加工的金屬結構體。根據蘋果的介紹,他們限制了鈦粉原料的直徑,確保列印時將每一層厚度控制在 60 微米;多雷射陣列同時列印的方式,也讓鈦粉原料更能形成連續緻密的金屬組織。儘管如此,金屬增材製造的「列印」只是開端。列印出來的鈦結構件內部仍然存在少量孔隙和應力,需要通過熱等靜壓進行緻密化處理,使內部組織接近鍛件;表面也難以一次成型,離不開後續的 CNC 精加工和拋光。雷射金屬熔融工藝開啟「鈦金」時代?從蘋果的流程來看,雷射金屬熔融工藝並不是一個「列印完就能用」的技術,成型後的鈦結構件依然要經歷熱等靜壓、CNC 精加工、拋光等流程。那既然雷射金屬熔融工藝如此複雜,為什麼蘋果還要直接用於生產呢?(據蘋果介紹,今年所有 Apple Watch Ultra 3 和鈦殼 S11 錶殼均採用 3D 列印工藝製造)原因其實很簡單,雷射金屬熔融工藝可以顯著降低生產過程的材料浪費,同時提高良品率。傳統的鈦加工依賴鍛件成形,必須從遠大於成品的坯料開始削減。而鈦金屬本身難切削、導熱差,一旦結構複雜,加工的良品率就會「跳水」。事實上,採用鈦金屬的數位產品之所以昂貴,其不可控的加工成本就佔據了大頭。圖片來源:Apple而雷射金屬熔融工藝就沒有這樣的問題:不像傳統的金屬加工工藝那樣需要一個中間階段,雷射金屬熔融在列印階段便完成了大部分體積的成型,材料利用率大幅提高。按蘋果給出的數字,雷射金屬熔融技術能節約 50% 的原材料——「這意味著你現在可以用此前一塊表所需的材料製造出兩塊表了」。據 Apple 估算,得益於這一新工藝,僅在今年就節約了超過 400 噸的鈦原料。除了節省原料,雷射金屬熔融技術也能顯著提升鈦件的加工良品率。由於主要結構已在列印階段完成,後續 CNC 只需要負責精度與表面質量,而不再承擔大規模去料,因此加工風險也隨之下降。此外,雷射金屬熔融技術還帶來了傳統工藝無法想像的設計自由度。圖片來源:Apple以蘋果此次著重介紹的 Apple Watch Ultra 3 為例,複雜曲面在 CNC 體系中加工難度極大,必要時還需要多次換刀;智能手錶的超小體積也限制了內部加工的刀路,必要時還需要定製刀頭。但雷射金屬熔融的加入,從工程角度上取消了設計的條條框框,讓那些因加工精度、成本而無法實現的特殊結構走向現實。也正因如此,在雷科技看來,如果中國智慧型手機行業還希望在材質上跟進由蘋果掀起的「鈦金時代」,而不僅僅是停留在「鈦色」配色,必須跟進雷射金屬熔融工藝或雷射燒結工藝,用全新的方式處理全新的材料。中國國產手機用得上雷射金屬熔融工藝嗎?不過問題也隨之而來,既然這是「鈦時代」的關鍵工藝,那為什麼中國國產手機品牌不早點跟進呢?要說中國國產品牌有沒有能力做雷射金屬熔融工藝,答案當然是肯定的。說到底,雷射金屬熔融工藝也是金屬增材製造的一種,而國內增材製造產業鏈極為完整:從鈦粉霧化裝置到雷射金屬熔融成型機,再到後續的五軸 CNC、自動檢測,整個加工環節都具備規模化生產的能力。換句話說,中國國產廠商完全具備做雷射金屬熔融鈦中框的「工業基礎」,不存在技術門檻。對中國國產品牌來說,雷射金屬熔融工藝真正的難點在量產體系,而不是技術本身。對蘋果來說,一款智能手錶賣幾千萬台根本不在話下;但和蘋果一年不超過 5 款手機的產品節奏相比,Android旗艦機更新快、SKU 多、代工分散,能用雷射金屬熔融工藝的產品也相當有限。如果排產不足,製造成本必然失控,製造性價比還不如鍛造甚至是 CNC 加工來得划算。圖片來源:小米其次,Android旗艦手機內部的「資源競爭」極為激烈,影像、轉軸、電池快充……每項功能都在搶預算,相比能直接改變體驗的升級,鈦中框的價值相當有限。不可否認的是,雷射金屬熔融工藝除了可以用來列印鈦中框,也可以用來製造摺疊屏手機的轉軸關鍵部件。但轉軸部件的產量,對分攤雷射金屬熔融工藝的成本依舊杯水車薪。不過話又說回來,雷射金屬熔融工藝,對立志要衝擊高端市場的中國國產手機品牌來說,同樣也是一條值得發展的技術路線。畢竟雷射金屬熔融工藝沒有鍛造、CNC 加工的侷限性,通用性更強,既能做手錶外殼、鏡頭飾圈,也能做螢幕轉軸甚至更大體積的部件。在雷科技看來,對中國國產品牌來說,雷射金屬熔融工藝並非不切實際的幻想。蘋果要將機身材質革命引向何方?我們說回蘋果,儘管蘋果最新一季的 iPhone 中,只有 iPhone Air 這個「非常設型號」還保留著鈦金屬中框。甚至 iPhone Air 沿用鈦金屬中框,全因這款手機是 iPhone 16 同期立項的產品。但可以肯定的是,蘋果對鈦金屬中框、或者說對鈦金屬的追求,絕對不會止步於 iPhone Air。大家都清楚,Apple Watch、iPad 這類「周邊產品」,一直都是蘋果的「試驗田」,是 iPhone 未來新技術的「真機測試」。即使從工程的角度看,未來的「摺疊屏 iPhone」,也必然會用鈦金屬來保證機身與轉軸的強度。圖片來源:雷科技基於這一角度,再結合雷射金屬熔融工藝的特點,雷科技認為,鈦金屬在蘋果內部還有更多的應用;但和鈦金屬中框這種更利於宣傳的用法相比,未來的鈦金屬可能更強調實用意義。比如搭配回收鋁外殼,在轉軸、邊框中部、USB-C 等特定位置打造鈦結構件,為整體結構補強、或者用於製造傳統工藝難以加工的特殊部件。至於到那時候,鈦中框還會不會再次流行?小雷沒法這麼早下結論。就個人來說,我對不鏽鋼、鈦金屬等高強度材料邊框一直都喜愛有加;在 iPhone 17 Pro 改用鋁合金後,我也直接指出過「鋁框不如鈦框高端和耐用」。但如果在鈦件的結構補強下,鋁合金中框也能像鈦框那樣耐用,那至少對大多數理性消費者來說,「鋁鈦之爭」將不再重要。 (雷科技)
一撮鈦粉末,如何變成 Apple Watch 最複雜的金屬結構?|獨家專訪
Apple Watch 最新一代的鈦金屬外殼,始於一撮細密的金屬粉末。沒有車床的轟鳴、火星,也沒有刀具切割金屬時那令人牙酸的摩擦聲,鈦金屬版的 Apple Watch 不是被切削出來的,而是被「列印」出來的。3D 列印這個詞,在很多人的腦海裡仍停留在實驗室和原型階段:列印一隻概念零件、一段驗證思路的模型。而蘋果,第一次把它推入了消費電子的大規模量產線。這還真不是炫技。為什麼是 3D 列印?傳統的金屬加工是一道「做減法」的技藝:一整塊金屬,通過 CNC 加工(數控銑床)從四面八方切、銑、磨,把多餘的部分一點點削切成目標的形狀,再進行打磨和拋光。這種方式加工精度極高,卻免不了一個硬傷——浪費。「金屬好不好加工,一用刀就知道。」鈦的優秀已經被無數行業肯定:輕、強、耐腐蝕,是天生的「工程好料」。但它同時也倔強固執:熔點高、延展性低,加工具有挑戰性。刀具磨損比加工鋁時快得多,時間被成倍拉長,還要不斷處理因「太硬」而帶來的種種麻煩。對 Apple Watch 這樣的複雜造型來說,過去工程師常常得先做一個尺寸更大的鍛件,再慢慢從裡面「雕刻」出想要的形狀。就如同從一塊巨石中鑿出一小尊雕像,壯觀,卻不夠高效。增材製造徹底改寫了這套邏輯。它的思路,則是一次「加」的工藝——將材料一層層堆疊成形,如同用裱花袋擠出蛋糕的紋理,精準而克制。60 微米、900 層:一枚錶殼的成長軌跡列印從一撮回收的鈦粉開始。「鈦金屬粉末之前是不存在的,」Kate Bergeron 是蘋果產品設計副總裁,還負責所有 Apple 產品的材料創新。她告訴愛范兒,獲得並使用可回收的鈦粉,本身就是一個巨大的突破。鈦是一種堅硬而活躍的金屬,在高溫下甚至可能爆燃。為了保障安全,蘋果對原始鈦進行霧化處理,降低氧含量,並針對雷射參數進行了極為精細的調整。每台印表機配備了一個振鏡系統,包含 6 束雷射,每束光如同一支細筆,通過振鏡系統引導,在粉末表面融化出一層零件的橫截面。完成一層,列印平台下移 60 微米——大約一根頭髮絲的寬度,再鋪上新的粉末層,繼續熔化。經過 900 層的堆疊,錶殼的雛形浮現。列印結束後,零件仍埋在粉末堆裡,工程師通過真空吸取的方式清除多餘的粉末。接著,使用超聲振動裝置,對列印件進行更精細的清粉操作,確保將錶殼內部縫隙和細小結構中的殘餘粉末完全清除。所有粉末都會被回收再利用。隨後,成型的零件被金剛石線鋸從底板上小心翼翼地切割下來。從粗糙到精緻:後處理的藝術增材製造出的金屬零件,其表面粗糙度遠無法滿足消費級產品的外觀要求,尤其像 Apple Watch Series 11 這樣要求拋光鏡面、結構複雜、內外皆可見的產品。於是,一門叫做「後處理」的工藝開始了。CNC 精修校正尺寸、噴砂或拋光塑造質感、注塑整合其他部件、最後進行表面處理。Ultra 3 採用細膩噴砂,強化戶外的堅固觸感;Series 11 則追求幾乎照見人影的光滑度。「我們對精度與結構完整性要求沒有任何降低。」Kate 強調,蘋果沒有因為 3D 列印而犧牲質量。左圖顯示外殼表面紋理,右圖顯示拋光表面拆解網站 iFixit 也從側面印證了這一點,在顯微鏡下,Ultra 3 錶殼的確隱約可見一些列印層紋。但在硬度測試中,Ultra 3 錶殼與前代鍛造版本一樣,僅在莫氏硬度 6 級才會出現劃痕————比早期 Ultra 一代(硬度 5 級即劃傷)更為優秀。環保是一場主動爭勝的技術戰如果製造一枚錶殼可以用傳統工藝解決,為什麼蘋果要冒著巨大的研發成本繞這麼大一個圈?畢竟,普通使用者並不關心 Apple Watch 是不是 3D 列印的。答案藏在另一個更宏大的承諾裡——蘋果以 2015 年為基準,計畫實現 75% 的碳減排。主要路徑包括:推動供應鏈使用可再生能源、採用更低碳的運輸方式,以及通過材料創新提升回收比例。3D 列印正好處在這三個方向的交匯點上。它不僅將鈦金屬的回收利用比例提升至 100%,與鍛造相比,列印可減少約 50% 材料使用量,從源頭減少碳排放。過去我們如果能提高 10%、15% 的材料效率,我們就已經非常興奮了。而現在,我們將材料使用量直接砍半——從碳排放角度來看,這是一次極其重大的勝利。在蘋果環境和供應鏈創新副總裁 Sarah 眼中,環保從來不是被動的責任,而是一場需要主動出擊的技術戰役。而 3D 列印,正是這場戰役中的一件關鍵武器。她所帶領的團隊,負責在蘋果全球供應鏈中貫徹兩個核心目標:一個是到 2030 年實現碳中和,另一個是終有一日,讓每一件產品都由回收和可再生材料製成。據她透露,蘋果目前已完成 60% 的減碳任務,但剩下的減碳部分將越發艱難。我們尋找的是那種既對地球有益,也對產品本身、對使用者體驗同樣有益的方案。從 CNC 到 3D 列印:製造的下一次進化十五年前,蘋果用 CNC 工藝打造出 MacBook Unibody 一體成型機身,開啟精密製造的革命性時刻,推動了整整一代製造業升級。蘋果能夠大規模整合 3D 列印鈦金屬,其他 OEM 廠商也能有信心跟進。在過去的一個季度中,我們看到各大品牌將增材製造引入日常產品和營運中——從消費玩具和自行車元件到鞋類平台和工廠備件。這一模式是一致的:試點生產線成熟為可重複的生產,中等產量下經濟效益更好,並與數字質量系統更緊密整合。簡單來說,增材製造正從新奇走向常規。專注金屬增材製造的專業機構 3DS Pro 認為,金屬 3D 列印這件事的意義不僅在於「用上了新工藝」,而是它證明了一件以前幾乎沒人敢想的事——鈦金屬的 3D 列印,真的可以規模化做到消費電子所需的光潔度與公差控制。不是幾十件的試水,而是數百萬件的量產等級。更重要的是,它所能帶來的創造力空間,也被正式打開。傳統的減材加工,總要被刀具、彎折半徑、材料延展性這些邊界框住思路。但 3D 列印的邏輯完全不同——它可以在元件內部做晶格結構,可以一次成型複雜的中空通道,也可以實現傳統方法根本沒法加工的過渡幾何。iPhone Air 是一個極好的例子:它的 USB-C 外殼,用的就是和 Apple Watch 一樣的回收鈦粉,用 3D 列印造出來。在這種工藝下,設計師不僅能保持結構強度與耐用性,還能實現極致的輕薄比例。「這件事一開始是既令人興奮又讓人有點害怕的。」Kate 說,「因為理論上,它可以列印任何形狀。我們已經充分理解了鈦金屬的列印方式,接下來我們會探索如何將這項工藝應用到更多產品上。」「現在談革命還為時尚早。」Kate 謹慎地說,「但它絕對是我們製造工具箱中新增的重要一環。」接著,她說了一句特別「蘋果」的話:「天空才是極限。」又像是給未來留了個伏筆:「我們很期待設計師們會用這項技術提出什麼新的挑戰。這絕對不是一個終點,而是一個新的起點。」 (愛范兒)
大疆佈局3D列印,招惹了誰?
“大疆數億投資,炸出輿論深水彈。”近日,科技創投圈很熱鬧。拓竹創始人陶冶發佈的一則朋友圈動態,矛頭直指大疆。導火索似乎是傳聞大疆投資了3D列印領域的同行智能派。以務實、低調著稱的“大疆系”人才,向來極少將內部爭議訴諸公共輿論。為什麼突然打破“常態”?3D列印賽道很火熱,但基本圍繞“下一個拓竹”展開,但大疆的布局,以及此次隔空喊話一石激起千層浪,讓這個原本只是產業內的熱門賽道,迅速被推向更廣闊領域。01 大疆為什麼佈局3D列印?昨晚,大疆正式做出回應:對3D列印公司的投資資訊屬實。要理解這場風波的底層邏輯,首先要看清它所發生的戰場——消費級3D列印,正迎來前所未有的發展窗口。從生態維度看,現在依舊是布局3D列印的黃金時期。各廠商在多色列印、多材料列印等方面不斷創新,同時也在積極建構內容生態,利多消費者。隨著AI大模型的普及,建模門檻降低,3D列印市場需求也將進一步釋放。普通消費者原本沒有太多建模能力,如今可以借用AI工具輕鬆生成3D模型。“在沒有3D生成技術出現之前,消費級3D列印公司目標使用者可能僅100萬人;但3D生成技術問世之後,目標使用者規模一下躍升至幾十億人,同時3D生成的門檻幾乎降至零。”3D生成廠商肖四表示,AI與3D列印結合是未來趨勢,能顛覆C端使用場景,為消費級3D列印帶來新的增量使用者。從市場維度看,大疆布局3D列印完全只是時間的問題。這一領域被普遍認為是未來增長最快、最大的單品之一。吳明向雷峰網透露,大疆一直十分關注各行業的前沿科技和新領域機會,比如早期投資大疆車載,是因為看好智能駕駛的發展前景。此次投資智能派也是這個邏輯,大疆看到了整個3D列印賽道的發展潛力和前景。根據二級市場分析師的推算,目前全球消費級3D列印的年出貨量為450萬台,與20年前的掃地機器人年出貨量相近。未來5年,消費級3D印表機的出貨量將增長至2000萬台,再過5年將有望增長至5000萬台。可以預見的是,未來幾年3D列印走入家庭的趨勢會越來越明顯。一位3D列印從業者分析,中國市場僅學生群體就有七八千萬,家庭滲透率達到10%左右就可能有近千萬台的量,全球加起來超過2000萬台問題不大。值得一提的是,拓竹作為行業黑馬,在2024年利潤率就已高達30%,其成功也拉動了整個賽道的增長與關注度。這樣一個擁有廣闊市場且由中國企業主導未來的賽道,自然成為頂級資本的“兵家必爭之地”。大疆對產業鏈前沿進行戰略卡位,是嗅到趨勢後的必然之舉。前有騰訊、美團、追覓等企業布局,後有大疆,消費級3D列印行業迎來更多新鮮的身影,這些企業的布局都會為3D列印市場擴展貢獻一份力量。02 為什麼是智能派?無論是投資圈視角,還是業內視角,智能派在3D列印領域並非熱門標的,之前也鮮少處於行業話題中心。投資人李華認為,大疆此次投資,更多是產業佈局的考慮。放眼消費級3D列印賽道,拓竹穩居第一梯隊,但幾乎不對外開放融資,已成不爭的事實。第二梯隊玩家創想三維赴港IPO臨門一腳,更適合二級市場的投資打法。3D列印作為大單品,既然未來市場需求已經如此明晰,這時候投資頭部企業反而不划算。成立於2015年的智能派,位列第三梯隊,去年營收16億元,估值低於創想三維。但其光固化3D印表機出貨量已是行業第一,同時重點投入FDM產品線,整機累積出貨量超百萬台。如此看來,智能派在一級市場依然是一個非常有性價比的投資標的。從智能派近年來的增長態勢也印證了這一點。接近智能派的陳銘透露,在過去三年間,智能派增速維持在40%,收入規模已位居行業第三。預計2025年,智能派將實現約25億元的營收。隨著FDM產品線的豐富,未來增速將繼續有望提升。近年來,智能派持續擴充團隊,尤其是在研發端。據稱研發團隊要全部搬到人才聚集的深圳科技園。不久前,智能派創始人洪英盛曾對外透露,目標是未來三年實現年營收超50億元,啟動IPO計畫。雷峰網獲悉,智能派也有在調整打法,從去年開始組建了專門的團隊來自己設計產品,有更清晰的產品目標,行銷打法上也更激進了。智能派表現出的決心和野心,或許也正是大疆所看中的。而且智能派供應鏈管理能力並不低,中低價格區間的產品能夠維持較高的毛利率,同時通過自建生產線確保產品質量與可靠性。此前,一級市場在投資拓竹無望後,試圖找到下一個“3D列印界的小米”。但隨著深入研究,大部分基金更希望找到“下一個拓竹”,而不是追隨者,當時市面上其他頭部玩家基本被視為追隨者。快造並聯多頭的新品眾籌霸榜,一級市場在這家公司身上看到了新的希望,美團、高瓴等頭部機構紛紛布局。恰恰在這時候,大疆投資了智能派,這個看起來相對反常的投資動作,引起了市場的高度關注。因此,可以看到,大疆並非盲目追逐熱點的企業。這一選擇本身,就透露出大疆的投資邏輯。當市場以FDM 3D列印為主流時,市場需要不同的技術路線和創新產品來滿足多元化的使用者需求。大疆投資智能派,可能正是看中其在全產業鏈佈局和技術多元化上的潛力,這更像是一次互補性的價值發現。在大疆的押注下,一級市場開始分析其投資邏輯,並試圖重新理解智能派。部分美元基金甚至向智能派示好,表露其投資意願。(更多DIY工具行業細節,歡迎加入微信 ydinitialheart 瞭解。)因此,某種程度,大疆其實是給賽道加持,讓賽道發展更加均衡。頭部玩家或許會感到焦慮和承壓,也是可以理解的。03 大疆的定力在這場輿論風波中,大疆的行業地位與投資動作被推至台前。一個不爭的事實是:在創投圈,“硬體看大疆”已成為一句共識。大疆不僅是一家公司,更被業界稱為“硬體創業的黃埔軍校”,其培養的人才和輸出的方法論,持續滋養著整個硬體創投生態。這是大疆選拔人才的方法之一,持續吸收和培養了一批又一批的核心優秀骨幹,也使大疆各系列產品的產品力和影響力得以延續或突破。這些人才成就了大疆,大疆也成就了他們。如今大疆系的創業者們,已成為中國科創領域一股不可忽視的力量。拓竹、正浩、松靈等大疆系企業,均在短時間內發展成為相應細分領域的龍頭,完美驗證了大疆人才培養體系和方法論的有效性。大疆的成功,其最根本、也最難以複製的核心資產,並非單一的技術爆款或明星人物,而是一套成熟、系統化的人才培養與產品方法論體系。大疆將一種獨特的精神核心深植於團隊之中:那就是對技術近乎偏執的敬畏、對產品細節死磕到底的務實,以及堅信最終能打動使用者的,永遠是超越預期的技術體驗與產品力。正是這種深入骨髓的“工程師文化”與“產品至上”的理念,構成了“大疆系”創業者們共同的風格底色。無論他們進入那個細分賽道,都延續著低調務實、專注研發、用硬核產品說話的行為準則。這種一脈相承的精神核心,使得“大疆系”企業往往不熱衷於追逐市場熱點或行銷炒作,而是選擇在喧囂中沉心打磨,通過紮實的技術積累和可靠的產品性能來建構壁壘。也許這是此次“小作文”風波會讓業界感覺如此突兀的原因。這場風波,最終會如何收場?或許,答案不在企業的行銷狂歡中,而最終要回到硬科技行業的根本——產品力。我們真正需要關注的是:企業是否在關鍵技術上建構了足夠的護城河?其產品能否在成本、效率或性能上實現關鍵突破?商業的終局裁判是市場,而市場只相信產品與技術的硬實力。這場意外的交鋒,揭開了中國硬科技領域成熟而殘酷的一面,但這並非壞事。一個健康的創新生態,正是在這種動態的而激烈的碰撞中,不斷向前演進。 (雷峰網)
世界上第一個能夠生成真正3D世界的生成式AI模型 | 李飛飛最新萬字實錄
11月16日,被譽為“AI教母”的史丹佛大學以人為本AI研究所聯席主任的李飛飛接受了海外播客Lenny's Podcast的訪談。李飛飛詳細回顧了她如何從2006年開始,在AI的“寒冬”期,洞察到“巨量資料”是智能爆發的關鍵,並因此建立了ImageNet。本次對話還深入探討了為何AGI目前更像一個“行銷術語”,Scaling Law的侷限性;AI的下一個前沿“空間智能”;機器人領域“苦澀的教訓”為何可能失效等話題。此外,李飛飛還詳細介紹了Marble及其應用場景。Marble是World-Labs已研發出首個能生成真正“3D可導航世界”的生成式AI模型。它實現了提示詞生成世界,旨在為機器人模擬、電影虛擬製片、遊戲和科學發現提供空間智能的基礎。李飛飛回顧,AI寒冬期的核心痛點是“模型沒有資料可供訓練”,早在2016年,“AI”一詞在矽谷仍被視為“貶義詞”,公司會刻意避免自稱“AI公司”。李飛飛認為AGI在定義上模糊不清,而當前的AI(即使是LLM)在真正的認知、推理和情商上與人類相去甚遠,我們仍需大量的基礎創新。她指出,繼語言模型之後,AI的下一個前沿是“空間智能”。她認為人類智能很大程度上建立在視覺和空間理解之上,而“空間智能”是連接視覺、具身AI(機器人)和語言的“關鍵缺失環節”。機器人是“物理系統”,其難度遠超LLM。她認為巨量資料+簡單模型在機器人領域可能受阻,因為存在“完美錯位”:LLM的訓練(文字)和輸出(文字)完美對齊,而機器人的訓練資料(2D網路影片)與其期望的輸出(3D世界中的動作)完全不同。01 AI的最終走向取決於人類自己的選擇很多人稱你為“AI教母”,但與許多AI領袖不同,你是一位AI樂觀主義者,不認為AI會取代我們或毀滅我們。你如何看待AI將對人類產生的長期影響?你曾說“AI 沒有任何‘人工’的成分。它由人啟發,由人創造,最重要的是,它影響著人。” 既然AI的走向取決於我們,你認為我們需要做對那些事情?我們該如何確保AI走上正軌?李飛飛:首先我要明確一點,我不是一個烏托邦主義者。我並不是認為 AI 對就業或人類毫無影響。事實上,我是一個人本主義者。我相信,無論 AI 現在或未來做什麼,最終都取決於我們,取決於人類自己。我的確相信,如果你縱觀人類文明的漫長歷史,技術總體上對人類是積極的。我認為,我們本質上是一個善於創新的物種。從幾千年前有文字記錄開始,人類就在不斷自我革新、創新工具;借此,我們改善了生活,最佳化了工作,建立了文明。我相信 AI 也是這一處理程序的一部分。我的樂觀正是源於此。但我認為每一項技術都是雙刃劍。如果我們作為一個物種、一個社會、一個社區,或作為個體,沒有做出正確的選擇,我們同樣可能把事情搞砸。(關於AI“非人工”的本質)我對此感受很深。我二十五年前開始從事 AI 研究,在過去的二十年裡,我一直在指導學生。幾乎我實驗室的每位學生畢業時,我都會提醒他們:你們的領域叫作人工智慧,但它的本質沒有絲毫“人工”可言。(關於如何確保AI走上正軌)我認為,無論我們做什麼,都應該首先成為一個負責任的個體。這是我們教育孩子的方式,也是我們成年人應盡的責任。無論你參與的是 AI 的開發、部署還是應用,在那個環節——很可能我們中的許多人,特別是技術專家,同時參與了多個環節,我們都應該像一個負責任的個體那樣行事,並且真正關心這件事。我認為今天的每一個人都應該關心 AI,因為它將影響你的個人生活、你的社區,乃至整個社會和我們的子孫後代。而作為一個負責任的人去關心它,是第一步,也是最重要的一步。02 巨量資料、神經網路和 GPU成為現代 AI 的“黃金組合”大多數人開始聽說和關注AI,大概是幾年前ChatGPT問世的時候。但很少有人知道,在這之前有很長很長的歷史,人們在研究(當時它被稱為機器學習)AI。在很長一段時間裡,有很多人在研究它。然後,出現了人們所說的“AI 寒冬”,那個時期人們幾乎都放棄了。而你所做的工作(ImageNet),本質上是帶領我們走出AI寒冬的火花,並且直接促成了我們今天所處的世界。所以,我非常想聽你分享一下:在 ImageNet 誕生之前,世界是怎樣的?你建立 ImageNet 的歷程是怎樣的?它為什麼如此重要?以及這之後又發生了什麼?李飛飛:我的整個職業生涯都投身於 AI,所以有時我很難意識到 AI 對大多數人來說是多麼新奇。這... 看到一個我剛剛告別青少年時期就開始的個人好奇心,如今正轉變為一股推動我們文明變革的力量,我的一部分內心感到無比滿足。它確實是一種文明等級的技術。所以,這段旅程大約... 大約 30 年,或者說 20 多年,這真的非常令人滿足。那麼,一切是如何開始的呢?其實,我甚至不算是第一代 AI 研究者。第一代 AI 研究者真正要追溯到 50 年代和 60 年代。Alan Turing 在 40 年代就領先於他的時代,他向人類提出了一個大膽的問題:“機器能否思考?” 當然,他設計了一種特定的方法來測試“會思考的機器”這一概念,那就是一個對話聊天機器人。如果按照他的標準,我們現在已經擁有了會思考的機器。但這更多隻是一種軼事般的靈感。這個領域真正始於 50 年代,那時的電腦科學家們齊聚一堂,探討如何使用電腦程序和演算法,來建構那些能完成過去只有人類認知才能勝任的任務的程序。這就是 AI 的開端和奠基者們,在 1956 年的達特茅斯研討會上。後來任教於史丹佛的 John McCarthy 教授,創造了“人工智慧”這個術語。在 50 年代、60 年代、70 年代和 80 年代,是 AI 探索的早期階段。我們有了邏輯系統、專家系統,也對神經網路進行了早期探索。然後到了 80 年代末、90 年代,直到 21 世紀初。這大約 20 年的時間,實際上是機器學習的開端。它是電腦程式設計和統計學習的一次聯姻。這次聯姻為 AI 帶來了一個至關重要的概念:純粹基於規則的程序,是無法涵蓋我們想像中電腦所能擁有的龐大認知能力的。因此,我們必須用機器來學習模式。一旦機器能夠學習模式,它就有望做更多的事情。例如,你給它三隻貓的照片,你希望的不僅僅是機器能認出這三隻貓,而是希望它能認出第四隻、第五隻、第六隻,以及所有其他的貓。這是一種學習能力,是人類和許多動物的基礎能力。我們作為一個領域,認識到我們需要機器學習。這就是 21 世紀初之前的狀況。我進入 AI 領域,精準說是在 2000 年。那是我在 Caltech 開始攻讀博士學位的時候。所以,我是第一代機器學習研究者之一,我們當時已經在研究機器學習的概念,特別是神經網路。我記得我在 Caltech 的第一門課,就叫神經網路。但那段時期非常痛苦。我們仍深陷於所謂的“AI 寒冬”之中,這意味著公眾對此關注甚少,研究經費也不充裕,但學術思想卻在激盪。我認為,有兩件事讓我個人的職業生涯與現代 AI 的誕生如此緊密地聯絡在一起:一是我選擇通過視覺智能的視角來研究人工智慧,因為人類是高度依賴視覺的動物。我們稍後可以深入探討,但我們很大一部分智能是建立在視覺、感知和空間理解之上的,而不僅僅是語言本身。我認為兩者是互補的。所以我選擇了視覺智能。在我的博士和早期任教階段,我和我的學生們都堅定地朝著一個“北極星問題”努力,那就是解決物體識別的問題。因為它是我們感知世界的基石,對吧?我們在世界上詮釋、推理,並與世界互動,或多或少都是在物體層面上進行的。我們不會在分子層面與世界互動。我們... 即使有時會,也非常罕見。例如,當你想拿起一個茶壺,你不會想:“這個茶壺由 100 塊瓷片組成,我要先處理這 100 塊瓷片。” 你會把它當作一個整體來互動。所以,物體這個概念至關重要。因此,我是最早將物體識別確定為北極星問題的研究人員之一。但我認為,當時的情況是,作為 AI 的學生和研究者,我研究了各種數學模型,包括神經網路、貝葉斯網路等等。但存在一個核心痛點:這些模型沒有資料可供訓練。我們整個領域都過度專注於模型本身,但我突然意識到,人類的學習,乃至生物的進化,實際上都是一個巨量資料學習過程。人類通過海量的經驗持續學習;而進化,從時間尺度來看,動物也是在不斷體驗世界中進化的。所以,我和我的學生猜想,要讓 AI 真正實現,一個被嚴重忽視的關鍵要素就是巨量資料。於是在 2006 到 2007 年,我們啟動了 ImageNet 項目。我們當時雄心勃勃,想要獲取網際網路上所有關於物體的圖像資料。當然,那時的網際網路比現在小得多。所以我覺得那個雄心至少不算太瘋狂。如果放到現在,幾個研究生和教授想做這個,那簡直是痴人說夢。但我們確實那麼做了。我們精心收集並整理了網際網路上的 1500 萬張圖片,建立了一個包含 22000 個概念的分類法。我們借鑑了其他研究者的成果,比如語言學家在 WordNet 上的工作,那是一種特殊的詞典編纂方式。我們將這些整合建立了 ImageNet,並將其開源給了研究社區。我們還舉辦了一年一度的 ImageNet 挑戰賽,鼓勵所有人參與。我們自己也繼續著研究。但 2012 年,成為了許多人認為的深度學習的開端,或是現代 AI 的誕生日。因為由 Jeff Hinton 教授帶領的一組多倫多研究人員,參加了 ImageNet 挑戰賽,他們使用了 ImageNet 的巨量資料,以及 NVIDIA 的兩塊 GPU,成功建立了第一個神經網路演算法。它並沒有從根本上完全解決問題,但在解決物體識別問題上取得了巨大進展。這三者的結合——巨量資料、神經網路和 GPU成為了現代 AI 的“黃金組合”。然後快進到 AI 的高光時刻,也就是 ChatGPT 時刻。如果你分析一下推動 ChatGPT 誕生的要素,你會發現它在技術上仍然依賴這三個要素:現在是網際網路規模的資料,並且以文字為主;神經網路架構比 2012 年複雜得多,但它仍然是神經網路;GPU 的數量也多得多,但它仍然是 GPU。所以這三個要素至今仍是現代 AI 的核心。03 9年前,自稱為人工智慧公司基本上就是判了死刑ImageNet誕生前後“AI”和“機器學習”這兩個詞可以互換使用嗎?那是當時的主流叫法嗎?關於那段早期歷史,是否還有什麼是你認為很重要、但人們卻不瞭解的?李飛飛:我覺得這兩個詞當時是互換使用的, 但確實,我記得那些科技公司... 我就不點名了。但我在一次早期的對話中,大概是 2015 年中或 2016 年中,一些科技公司刻意避免使用 AI 這個詞,因為他們不確定 AI 是不是一個“貶義詞”。我記得我當時實際上在鼓勵大家使用 AI 這個詞,因為對我而言,這是人類在探索科學技術過程中提出的最大膽的問題之一,我為這個詞感到非常自豪。但是,在早期,有些人確實心存疑慮。Lenny:“AI 是個貶義詞”大概是在那一年?李飛飛:2016 年。我認為那是一個轉折點。開始有人稱它為 AI。但我認為,如果你回顧矽谷科技公司的行銷術語,大概在 2017 年左右,才開始有公司稱自己為“AI 公司”。(關於早期AI歷史的補充)我想,和所有歷史一樣,我深知自己被視為歷史的一部分,但這段歷史中有太多的英雄和研究者。我們談論的是幾代研究者。在我的經歷中,有很多人激勵了我,我在書中也提到了他們。但我確實感到我們的文化,尤其是矽谷,傾向於將成就歸功於某一個人。雖然我認為這有一定價值,但我們必須記住,AI 是一個至今已有 70 年歷史的領域,我們已經歷了數代人的努力。沒有任何人能獨自走到今天。04 AGI是行銷術語我們似乎總感覺自己處在 AGI 的邊緣,AGI 是人們常掛在嘴邊的一個模糊術語。你如何看待我們與 AGI 之間的距離?你認為我們能沿著當前的軌跡實現它嗎?還是說我們需要更多的突破?李飛飛:Lenny,這是一個非常有趣的術語。我不知道是否有人真正定義過 AGI。目前有很多不同的定義,包括機器擁有某種超能力,甚至到機器能否成為社會中經濟上可行的“代理人”,換句話說,能靠掙工資“養活”自己。這算是 AGI 的定義嗎?作為一名科學家,我對待科學非常嚴肅。我進入這個領域,是受一個大膽問題的激勵:“機器能否像人類一樣思考和行動?” 對我而言,這一直是 AI 的“北極星”。從這個角度來看,我不知道 AI 和 AGI 之間有何區別。我認為我們在實現 AI 的部分目標上做得很好,比如對話式 AI,但我認為我們尚未完全實現 AI 的所有目標。我想,我們的開創者們,比如 Alan Turing,如果 Alan Turing 今天還在世,你讓他比較 AI 和 AGI,他可能只會聳聳肩說:“我在 1940 年代問過同樣的問題。” 所以,我不想在定義 AI 還是 AGI 這個問題上鑽牛角尖。我覺得 AGI 與其說是一個科學術語,不如說更像一個行銷術語。作為一名科學家和技術專家,AI 是我的北極星,是我所在領域的北極星,至於人們想叫它什麼名字,我都很樂意。正如你所描述的,是某些要素(如 ImageNet、AlexNet、GPU、資料、Transformer)將我們帶到了今天。你是否覺得,要實現一個聰明 10 倍的模型,依靠的還是這些相同的要素?還是你認為我們需要更多突破?你是否覺得“現有路徑會達到瓶頸”,或者“不,我們只需要更多資料、更多算力、更多 GPU 就行了”?李飛飛:不,我堅信我們需要更多創新。我認為,依賴更多資料、更多 GPU 和更大規模的現行模型架構的 Scaling Law 確實還有很多潛力可挖,但我絕對認為我們需要更多創新。在人類歷史上,沒有任何一個深度科學學科發展到某個階段後敢說:“我們完工了,我們不需要再創新了。” 而 AI,即使不是最年輕的,也是人類文明科學技術史上最年輕的學科之一。我們仍然只是觸及了皮毛。舉個例子,就像我說的,我們等下會聊到世界模型。今天,你拿一個模型,讓它觀看一段包含幾個辦公室房間的視訊,然後要求模型數出椅子的數量。這件事一個剛會走路的孩子,或者頂多一個小學生就能做到。但 AI 卻做不到。所以,當今的 AI 還有太多事情做不到。更不用說去思考,像 Isaac Newton 這樣的人是如何觀察天體運行,並推匯出一個或一組支配所有物體運動的方程式?那種水平的創造力、外推能力和抽象能力,我們今天完全沒有辦法讓 AI 具備。再來看看情商。想像一個學生來到老師的辦公室,他們討論關於動力、熱情、該學什麼,以及到底是什麼問題在真正困擾著你。這樣的對話,即使今天的對話機器人已經非常強大,你也無法從當今的 AI 身上獲得那種水平的情感和認知智能。所以,我們還有太多可以改進的地方,我絕不相信我們的創新之路已經走到了盡頭。Lenny:Google 的 Demis 說如果我們把直到 20 世紀末的所有資訊都喂給最前沿的模型,看看它能否重現愛因斯坦當年的所有突破。而到目前為止,我們離那一步還差得很遠。李飛飛:沒錯,我們還做不到。事實上,情況可能更糟。讓我們給 AI 所有的資料,包括 Isaac Newton 當年沒有的、由現代儀器觀測的天體資料,然後只要求 AI 建立出 17 世紀那套關於物體運動定律的方程式。今天的 AI 依然做不到。05 空間智能是連接視覺、具身AI和語言的關鍵您很早就預見到世界模型,您投身於此已久,能否談談:什麼是世界模型?它為什麼如此重要?李飛飛:我很高興看到越來越多的人開始討論世界模型,比如 Elon 和 Jensen。我一生都在思考如何真正推動 AI 向前發展。過去幾年裡,從研究界湧現出的大語言模型,以及 OpenAI 等公司的工作,對我這樣的研究者來說也是極具啟發性的。我記得 GPT-2 問世時,大概是在 2020 年底。我當時 (現在仍然是) 史丹佛大學HAI的聯席主任,但我那時是全職的聯席主任。我記得當時公眾還沒有意識到大語言模型的力量,但作為研究者,我們已經預見到了。我們看到了未來。我與我的自然語言處理同事,如 Percy Liang 和 Chris Manning,進行了深入的交流。我們討論了這項技術將變得多麼關鍵。史丹佛 AI 研究所,即 HAI,是全球第一個圍繞基礎模型成立完整研究中心的機構。Percy Liang 和許多研究者領導撰寫了第一篇關於基礎模型的學術論文。所以,這一切都讓我備受鼓舞。當然,我來自視覺智能領域,我一直在思考,除了語言之外,我們還有太多可以推進的領域。因為人類會運用我們的空間智能和對世界的理解來完成許許多多超越語言範疇的事情。想像一個極其混亂的急救人員現場,無論是火災、交通事故還是自然災害。如果你置身其中,想想人們是如何組織起來救人、阻止災難擴大、滅火……這其中很大一部分涉及移動,涉及對物體、世界、人類以及態勢感知的即時理解。語言是其中的一部分,但在很多情況下,語言本身並不能幫你撲滅大火。那麼,這是什麼呢?我思考了很久。與此同時,我正在做大量的機器人學研究。我逐漸意識到,要想連接語言之外的額外智能,要想連接具身 AI (即機器人學),要想連接視覺智能,其關鍵就在於那種理解世界的空間智能。就在那時,我想大概是 2024 年,我做了一場關於空間智能和世界模型的 TED 演講。我早在 2022 年,就基於我在機器人學和電腦視覺領域的研究,開始構思這個想法。然後,有一點對我來說非常清晰:我非常渴望與最頂尖的技術專家合作,並盡快將這項技術變為現實。就在那時,我們創立了這家名為 World-Labs 的公司。你可以看到,“世界” (world) 這個詞就在我們公司的名字裡,因為我們對世界建模和空間智能懷有無比的信念。如果拿大語言模型(聊天機器人)作對比,是否可以簡單理解為:世界模型就是你描述一個場景,它就能生成一個可以無限探索的世界?李飛飛:Lenny,這只是其中一部分。我認為,理解世界模型的一個簡單方式是:這個模型允許任何人在腦海中通過提示 (無論是圖像還是句子) 來創造任何世界;並且能夠在這個世界中互動,無論你是在瀏覽、行走、拾取物體還是改變事物;同時還能利用這個世界進行推理。舉個例子,如果使用這個世界模型輸出的 AI Agent 是一個機器人,它就應該能夠規劃自己的路徑,並幫助整理廚房。所以,世界模型是一個基礎,你可以用它來推理、互動和創造世界。機器人似乎是 AI 研究者的下一個重大關注點。您是否認為,世界模型(或空間智能)是讓機器人在現實世界中真正發揮作用所缺失的關鍵一環?那麼,世界模型的重大突破點是否主要集中在機器人、遊戲和創意領域?李飛飛:嗯,不過首先,我確實認為還有比機器人更令人興奮的東西。但我完全同意你剛才說的。我認為世界建模和空間智能是具身 AI 的關鍵缺失環節。同時,我也認為我們不應低估人類自己就是具身代理人這一事實,AI 的智能同樣可以增強人類。就像今天,人類是“語言動物”,但 AI 在很大程度上增強了我們執行語言任務的能力,包括軟體工程。我認為我們不應該低估,或者說我們傾向於忽視,人類作為具身代理人,其實也能像機器人一樣,從世界模型和空間智能模型中獲益良多。還有設計。人類從事各種設計,從機器到建築再到家居。此外還有科學發現。有太多,我喜歡用 DNA 結構的發現作為例子。如果你回顧 DNA 發現史上最重要的證據之一,那就是 Rosalind Franklin 拍攝的 X 射線衍射照片。那是一張平面的 2D 照片,展示了一個看起來像一個帶有衍射紋路的十字架的結構。你可以去 Google 搜尋那些照片。但憑藉那張 2D 平面照片,人類,特別是兩位重要人物——James Watson 和 Francis Crick,結合他們掌握的其他資訊,成功地在 3D 空間中進行了推理,推匯出了 DNA 高度三維的雙螺旋結構。那個結構不可能是 2D 的。你無法在 2D 層面思考並推匯出那種結構。你必須在 3D 空間中思考,運用人類的空間智能。所以我認為,即使在科學發現領域,空間智能或 AI 輔助的空間智能也至關重要。06 機器人是物理系統,訓練資料與目標輸出“完美錯位”Ben Horowitz 建議我問您:為什麼“苦澀的教訓”(The Bitter Lesson)單獨拿出來看,可能不足以解決機器人學的問題?能否請您首先解釋一下 AI 歷史上的“苦澀的教訓”是什麼?然後,再談談為什麼僅憑它無法讓我們在機器人領域實現目標?李飛飛:AI 領域有很多“慘痛的教訓”,但大家常提的“慘痛的教訓”是一篇由 Richard Sutton 撰寫的論文,他最近獲得了圖靈獎。他從事大量關於強化學習的研究,Richard 曾經說過,如果你回顧歷史,尤其是 AI 的演算法發展史,你會發現,簡單的模型輔以海量資料最終總是會勝出,而不是那些依賴更少資料、更複雜的模型。這篇論文實際上是在 ImageNet 誕生數年後才發表的。對我而言,這並非“慘痛”,反而是一個“甜蜜的教訓”。這也正是我建立 ImageNet 的原因,因為我堅信巨量資料能扮演這樣的角色。那麼,“慘痛的教訓”在機器人學領域是否還適用呢?首先,我認為我們要客觀看待目前取得的進展。機器人學尚處於非常早期的實驗階段。這項研究的成熟度遠不及語言模型等領域。因此,許多人仍在使用不同的演算法進行實驗,其中一些演算法確實是由巨量資料驅動的。所以我認為巨量資料將繼續在機器人學中發揮作用。但是,機器人學領域的難點在於什麼?有幾個方面。其一,獲取資料更難,難得多。你可能會說,“有網路資料。”沒錯,這也是當下機器人學研究正在使用網路影片的原因。而且我認為網路影片確實在發揮作用。但如果你思考一下語言模型成功的原因,作為一名從事電腦視覺、空間智能和機器人學研究的人,我非常羨慕我那些研究語言的同事,因為他們擁有近乎完美的配置:他們的訓練資料是詞語,最終成為 tokens,然後他們生成的模型輸出的也是詞語。因此,在你期望得到的結果,我們稱之為目標函數,和你的訓練資料形態之間,存在著完美的對齊。但機器人學不同,空間智能也不同。你希望機器人能輸出動作,但你的訓練資料卻缺乏 3D 世界中的動作資料,而這恰恰是機器人必須執行的:在 3D 世界中產生動作。因此,你必須尋找不同的方法,這就好比要把一個方形的東西塞進圓形的孔裡。我們擁有的是海量的網路影片。所以我們必須開始討論補充資料,例如遙運算元據或合成資料,以便讓機器人基於“慘痛的教訓”這一假設,即海量資料,進行訓練。我認為希望仍在,因為即便是我們正在做的世界建模工作,也將真正為機器人解鎖大量此類資訊。但我認為我們必須保持謹慎,因為我們尚處於這一領域的早期,而“慘痛的教訓”是否適用仍有待檢驗,因為我們還未完全弄清適合的資料形態。關於機器人學的“慘痛的教訓”,我認為我們還必須非常現實地認識到另一點:與語言模型甚至空間模型相比,機器人是物理系統。因此,機器人更接近於自動駕駛汽車,而不是大語言模型。認識到這一點至關重要。這意味著要讓機器人工作,我們不僅需要“大腦”,還需要“實體”,更需要應用場景。如果你回顧一下自動駕駛汽車的歷史:我的同事 Sebastian Thrun 帶領 Stanford 的團隊在 2006 年或 2005 年贏得了第一屆 DARPA 挑戰賽。從那輛能在內華達沙漠行駛 130 英里的自動駕駛原型車,到今天行駛在舊金山街頭的 Waymo,已經過去了 20 年。即便如此,我們仍未大功告成,還有很長的路要走。這是一段 20 年的歷程。而自動駕駛汽車還是相對簡單很多的機器人,它們只是在 2D 表面上行駛的金屬盒子,目標是“不觸碰”任何東西。機器人則是在 3D 世界中運行的 3D 物體,其目標是“去觸碰”東西。所以,這段旅程將會涉及很多方面和元素。當然,有人可能會說:“自動駕駛早期的演算法屬於前深度學習時代。深度學習正在加速‘大腦’的進化。”我同意這一點。這正是我投身於機器人學和空間智能領域的原因,我對此感到興奮。但與此同時,汽車工業已經是一個非常成熟的產業。產品化同樣涉及成熟的用例、供應鏈和硬體。因此,我認為現在是研究這些問題的絕佳時機,但 Ben 說的沒錯,我們可能仍會遭遇許多“慘痛的教訓”。在從事這項工作時,您是否曾對大腦的運作方式感到敬畏?僅僅是讓一台機器四處走動、不撞到東西,就要克服如此高的複雜性。李飛飛:確實如此。我們的運行功率大約只有 20 瓦,比我現在房間裡任何一盞燈泡都暗。然而,我們卻能完成如此多的事情。所以我認為,實際上,我越是深入 AI 領域的工作,就越是敬佩人類。07 我們建構了世界上第一個能夠生成真正3D世界的生成式AI模型讓我們聊聊您剛發佈的這款產品 Marble。它是什麼,以及它為何重要?李飛飛:我非常興奮。首先,Marble 是 World-Labs 推出的首批產品之一。World-Labs 是一家基礎前沿模型公司。我們由四位擁有深厚技術背景的聯合創始人共同創立。我的聯合創始人 Dustin, John, Christoph Lassner, 和 Ben Mildenhall,都來自 AI、電腦圖形學、電腦視覺的研究領域。我們相信,空間智能和世界建模即便不比語言模型更重要,也至少同等重要,並且與語言模型相輔相成。因此,我們希望抓住這個機遇,建立一個能夠連接前沿模型與產品的深度科技研究實驗室。所以,Marble 是一款基於我們的前沿模型建構的應用程式。我們花了一年多的時間,建構了世界上第一個能夠生成真正 3D 世界的生成式 AI 模型。這是一個非常、非常困難的問題。這個過程也異常艱難,我們擁有一支令人難以置信的創始團隊,彙集了來自頂尖實驗室的傑出技術專家。大概一兩個月前,我們第一次實現了僅通過一個句子、一張或多張圖片作為提示,就能建立出可在其中導航的世界。如果你把它載入到 VR 頭顯中,你甚至可以在裡面四處走動。所以,儘管我們已經為此努力了相當長一段時間,但看到成果時仍然感到無比振奮。我們希望將它交到需要它的人手中。我們知道,有那麼多的創作者、設計師、考慮機器人模擬的人、思考可導航、可互動、沉浸式世界不同用例的人,以及遊戲開發者,都會發現它非常有用。因此,我們開發了 Marble 作為第一步。當然,它仍處於非常早期的階段,但它是世界上第一個實現此功能的模型,也是世界上第一個允許人們僅通過提示詞就能生成世界的產品。我們稱之為“提示詞生成世界”。我試用時,最喜歡的部分是在渲染紋理前,能看到構成世界的“點”。我不知道這是功能還是 bug?你們加入這個“點”的功能是為了幫助人類理解它在做什麼嗎?這讓我想起了《駭客帝國》,這是否是你們的靈感來源?李飛飛:聽到你的反饋真是太好了,因為這也讓我作為研究者學到了東西。那些引導你進入世界的“點”,是一個我們有意設計的可視化功能。它並不是模型的一部分。模型本身只是負責生成世界。但我們當時在嘗試找到一種引導使用者進入世界的方式,工程師們嘗試了不同的版本,最終我們選定了“點”這個方案。有很多人,你不是唯一一個,告訴我們那種體驗是多麼令人愉悅。我們有意設計的這個可視化功能,而不只是那個龐大、硬核的模型本身,能給使用者帶來快樂,這真的讓我們感到非常滿足。就像我說的,有很多工程師參與了這項工作。這可能是他們的靈感。08 Marble的應用:從虛擬製片到心理治療對於那些想要嘗試或使用 Marble 的人來說,目前有那些應用是大家今天就可以開始使用的?這次發佈的目標是什麼?Marble 與 Sora 和其他視訊生成模型有什麼區別?創造出這樣的產品需要投入多少?比如團隊規模有多大?你們用了多少 GPU?李飛飛:我們堅信世界建模是一項具有高度通用性的技術,但我們已經看到了一些非常令人興奮的用例。比如用於電影的虛擬製片,因為他們需要 3D 世界來與攝影機對齊,這樣當演員在綠幕前表演時,他們就可以定位攝影機並完美地拍攝片段。我們已經看到了非常棒的應用。事實上,不知道你是否看了我們展示 Marble 的發佈視訊,它就是由一家虛擬製片公司製作的。我們與 Sony 合作,他們使用 Marble 生成的場景來拍攝那些視訊。我們與那些技術美術師和導演合作時,他們說:“這為我們縮短了 40 倍的製作時間。”事實上,也只能這樣才能完成,因為我們只有一個月的時間來製作這個項目,而他們需要拍攝的場景非常多。因此,使用 Marble 極大、極大地加速了視覺特效和電影的虛擬製片流程。這是一個用例。我們已經看到使用者將我們的 Marble 場景進行網格匯出,然後放入遊戲中,無論是在 VR 平台上的遊戲,還只是他們開發的有趣遊戲。我們還展示了一個機器人模擬的例子。因為我現在仍然是一名從事機器人訓練的研究者,過去最大的痛點之一就是為訓練機器人建立合成資料。這些合成資料需要非常多樣化,需要來自具有不同可操縱物體的不同環境。實現這一目標的一條途徑就是讓電腦去模擬。否則,人類就必須為機器人建構每一個單獨的資產,那將花費太長太長的時間。所以,已經有研究人員聯絡我們,希望使用 Marble 來建立那些合成環境。在如何使用 Marble 方面,我們也收到了一些意想不到的使用者垂詢。例如,一個心理學家團隊聯絡我們,希望使用 Marble 來進行心理學研究。原來,他們研究的某些精神疾病患者,需要瞭解他們的大腦對不同特徵,例如凌亂的場景、乾淨的場景,或任何你能想到的,的沉浸式場景會作何反應。對於研究人員來說,要獲取這類沉浸式場景非常困難,建立它們需要耗費太多的時間和預算。而 Marble 提供了一種幾乎是即時的方式,讓他們能夠獲得大量此類實驗環境。因此,我們看到了多種用例,其中視覺特效、遊戲開發者、模擬開發者以及設計師都對此非常興奮。(關於與視訊模型的區別)World-Labs 的核心理念是,空間智能是至關重要的。空間智能並不僅僅是關於視訊。事實上,我們感知世界的方式並不是被動地觀看視訊流逝。我非常喜歡柏拉圖用“洞穴寓言”來描述視覺。他說:“想像一個囚犯被綁在椅子上,在一個洞穴裡,觀看他面前牆上的一場戲劇表演。但真正的戲劇,演員們表演的地方,是在他的背後。那裡有光照,使得戲劇動作的投影投射在洞穴的牆壁上。”這位囚犯的任務就是要弄清楚到底發生了什麼。這是一個很極端的例子,但它深刻地描述了視覺的本質:即從 2D 圖像中去理解 3D 乃至 4D 的世界。所以,對我而言,空間智能比僅僅建立平面的 2D 影像要深刻得多。空間智能是一種建立、推理、互動並理解具有深度空間屬性的世界的能力,無論是 2D、3D 還是 4D,這其中也包括了動力學等。因此,World-Labs 專注於此。當然,生成視訊本身的能力也可以是其中的一部分。事實上,就在幾周前,我們推出了世界上第一個可以在單個 H100 GPU 上進行即時演示的視訊生成技術。所以我們的技術也包含了那部分。但我認為 Marble 非常不同,因為我們真心希望創作者、設計師和開發者手中能有一個模型,為他們提供具有 3D 結構的世界,以便他們將其用於自己的工作。這正是 Marble 如此與眾不同的原因。順便一提,在 Marble 內部,我們可以允許使用者以視訊形式匯出。所以你完全可以,就像你說的,你進入一個世界,比如一個哈比人的洞穴,特別是作為一名創作者,你在腦海中已經有了一個非常具體的攝影機運動軌跡,對吧?然後你就可以將這段運鏡從 Marble 中匯出為視訊。(關於團隊和資源投入)這需要極大的智慧。我們剛提到過,人類大腦的功耗大約是 20 瓦。從這個角度看,20 瓦是個很小的數字,但它背後是令人難以置信的,是長達五億年的進化才賦予我們的力量。我們現在有一個 30 人左右的團隊,主要由研究人員和研究工程師組成。但我們也有設計師和產品人員。我們堅信,我們要建立一家植根於空間智能深度技術的公司,同時,我們也在打造真正有價值的產品。所以,我們實現了研發與產品落地的整合。當然,我們用了海量的 GPU。這大概是 Jensen 最樂意聽到的。09 AI領域的競爭太激烈了,無論是模型、技術還是人才您是 World-Labs 的創始人,公司成立大約 18 個月了。您現在回想,最希望 18 個月前的 Fei-Fei 當時就知道的事情是什麼?縱觀你的職業生涯,你似乎總是在那些推動了當今科技突破的核心人才高地(ImageNet、Stanford SAIL、Google Cloud)。是什麼指引你加入了這些地方?對於那些希望渴望站在未來中心的人們,這背後是否有一條主線?你提到了現在的年輕人才在選擇工作時會精打細算。你是否想對他們說幾句話?李飛飛:我一直都希望能預知技術的未來。實際上,我認為這是我們能獲得融資的優勢之一,那就是我們通常比大多數人更早地看到未來。但是,這個領域依然如此令人興奮,如此令人驚奇,充滿了未知與即將到來的變革。但我知道你問的不是關於技術未來。你可能更關心別的。我並不是 20 歲就創辦了這種規模的公司。我 19 歲時開過一家乾洗店,但那規模小多了。後來,我參與創立了 Google Cloud AI,然後在 Stanford 創立了一個研究所,但那些都和現在完全是兩碼事。我確實覺得,相比那些 20 歲的創始人,我對於創業這段艱辛的歷程準備得更充分一些。但我仍然時常感到驚訝,甚至有些焦慮不安,AI 領域的競爭實在是太激烈了,無論是模型、技術本身,還是人才方面。我剛成立公司那會兒,還沒有聽說過某些人才的身價會高到如此離譜。這些事情持續讓我感到驚訝,我必須對此保持高度警惕。(關於職業選擇的主線)我也時常思考。顯然,我們談到過,是好奇心和熱情指引我進入 AI 領域。這更像是我科研上的“北極星”。我當時並不在乎 AI 是否炙手可熱。這是一方面。但我是如何最終選擇在我工作過的這些地方,包括創辦 World-Labs 的呢?我想我非常感謝自己,或者感謝我父母的基因,我是一個在求知上無所畏懼的人。我必須說,我在招聘年輕人時,也會尋找這種特質。因為我認為,如果你想有所作為,這是一種非常重要的品質。當你想要有所作為時,你必須接受一個事實:你正在創造前人未曾做過的新事物,或者正在投身於一個全新的領域。一旦你有了這種自我認知,你就必須讓自己保持無畏和勇敢。舉個例子,我來 Stanford 的時候,在學術界,我當時在 Princeton 已經非常接近拿到“終身教職”了,那意味著一份終身的工作。但我選擇來到 Stanford。我愛 Princeton,那是我的母校。但只是在那個時刻,Stanford 有太傑出的人才,矽谷的生態系統太棒了,我願意冒險,那怕讓我的終身教職“時鐘”歸零重啟。再比如,我去擔任 SAIL 的第一位女性主任。坦白說,我當時是相對非常年輕的教員。我之所以想這麼做,是因為我關心那個學術社區。我沒有花太多時間去想各種失敗的可能性。當然,我很幸運,那些資深教授都很支援我,但我當時就是想做點不一樣的事情。去 Google 也是類似的。我想和 Jeff Dean, Jeff Hinton 那些了不起的人一起工作。創辦 World-Labs 也是一樣。我懷有這份熱情,並且我堅信,一群懷有相同使命的人能做出不可思議的成就。這就是指引我人生的信條。我不會過度思考所有可能出錯的細枝末節,因為那樣想是想不完的。(對年輕AI人才的建議)我確實想對所有 AI 領域的年輕人才,對那些工程師和研究員們說幾句話,因為你們中有些人申請了 World-Labs。你們能考慮 World-Labs,我感到非常榮幸。我發現,現在許多年輕人在決定工作時,會精打細算,權衡每一個因素。某種程度上,也許,這只是他們做事的方式。但有時我真的很想鼓勵年輕人專注於真正重要的事情。我發現自己,在和候選人交談時,常常不自覺地扮演起導師的角色,無關招聘與否,只是當我看到一個極具天賦的年輕人,卻過度糾結於工作的每一個細枝末節時,我總想提醒他們,也許最重要的事情是:你的熱情在那裡?你是否認同這家公司的使命?你是否相信並對這個團隊抱有信心?你應該專注於你能產生的影響,以及你將與之共事的工作和團隊。10 史丹佛HAI的使命:建立“以人為本”的AI框架我一定要問問你今天在 Stanford 的工作,在 HAI。你在那裡做什麼?李飛飛:HAI,以人為本的 AI 研究所,是我和 John Etchemendy 教授、James Landay 教授、Chris Manning 教授等一群學者在 2018 年共同創立的。當時我其實快結束在 Google 的學術休假了。那對我來說是一個非常重要的決定。我本可以留在工業界,但我在 Google 的經歷讓我明白了一件事:AI 將成為一種足以影響文明處理程序的技術。我突然意識到它對人類有多麼重要,以至於我2018 年在 《紐約時報》上發表了一篇文章,呼籲我們需要一個指導框架來開發和應用 AI。這個框架必須植根於人類的福祉,也就是‘以人為本’。我覺得 Stanford,作為世界頂尖大學之一,地處誕生了 NVIDIA、Google 等重要公司的矽谷心臟,理應成為思想領袖,去建立這個以人為本的 AI 框架,並將這一理念真正體現在我們的研究、教育、政策和生態建設中。所以我創立了 HAI。一晃六七年過去了,它現在已經成為全球最大的人工智慧研究所,致力於以人為本的研究、教育、生態外展和政策影響。HAI 匯聚了 Stanford 所有八個學院的數百名教員,涵蓋了醫學、教育、可持續發展、商學、工程、人文、法律等領域。我們支援研究人員,特別是那些跨學科領域的研究,從數字經濟、法律研究、政治科學,到新藥發現,再到超越 Transformer 的新演算法。我們還特別關注政策。因為在創立 HAI 時,我意識到科技界與全球的政策制定者之間缺乏溝通。鑑於這項技術如此重要,我們需要讓各方都參與進來。因此,我們設立了多個項目,從‘AI 指數報告’到‘政策簡報’。我們還積極參與政策制定,包括倡導‘國家 AI 研究雲’法案,並參與了州一級的 AI 監管討論。我們做了很多工作。我至今仍是領導者之一,儘管在具體營運上參與得少了,因為我關心的不僅是創造這項技術,更是確保我們以正確的方式使用技術。11 任何技術都不應剝奪人的尊嚴和自主權你還有什麼想分享的嗎?或者想對聽眾說的?李飛飛:我對 AI 感到非常興奮。我想回答一個問題,一個我環遊世界時每個人都會問我的問題:如果我是一個音樂家、一個中學老師、一個護士、一個會計或一個農民,在 AI 時代還有我的位置嗎?還是 AI 終將取代我的生活或工作?我認為這是關於 AI 最重要的問題。我發現,在矽谷,我們不常與普羅大眾,無論是像我們的人,還是和我們不一樣的人,進行坦誠的交流。我們傾向於隨意拋出‘無限生產力’、‘無限休閒時間’或‘無限權力’之類的詞彙。但歸根結底,AI 是關於人的。當人們問我那個問題時,我的答案是毋庸置疑的‘是’,每個人在 AI 時代都有自己的角色。這取決於你的工作和你的追求,但任何技術都不應剝奪人的尊嚴。人類的尊嚴和自主權必須是每一項技術開發、部署和治理的核心。所以,如果你是一個年輕的藝術家,你的熱情是講故事,那麼請擁抱 AI 作為工具。事實上,我希望你擁抱 Marble,希望它能成為你的工具。因為你講故事的方式是獨一無二的,世界仍然需要你的故事。但你如何講述故事,如何使用這些最不可思議的工具,用你最獨特的方式去講述,這很重要,你的聲音需要被聽到。如果你是一個即將退休的農民,AI 對你依然重要,因為你是一名公民。你可以參與社區事務,你應該在 AI 如何被使用和應用上擁有發言權。你和你身邊的人,可以鼓勵大家利用 AI 讓生活變得更輕鬆。如果你是一名護士,我希望你知道,至少在我的職業生涯中,我在醫療保健研究上投入了大量精力,因為我堅信我們的醫護人員應該被 AI 技術極大地賦能和幫助。無論是通過智能攝影機提供更多資訊,還是通過機器人輔助,因為我們的護士工作強度太大、太疲勞了。隨著社會老齡化,我們需要更多幫助來照顧人們。AI 可以在這方面發揮作用。我只想說,這一點非常重要:即使是像我這樣的技術專家,也真誠地相信,每個人在 AI 時代都扮演著重要的角色。 (數字開物)