Nebius聯創聊AI基礎設施泡沫論與算力需求

20VC with Harry Stebbings × Roman Chernin(Nebius聯合創始人)最新訪談

核心要點:

AI基礎設施是泡沫嗎?還是剛剛起步?

不是泡沫,是最開端:唯一跑通的用例(程式設計)才幾個月前開始奏效;任何一家公司的 AI 採納都只在"頭百分之幾"的業務量、"頭百分之幾"的用例;即使技術先進的大公司也剛起步

DeepSeek 時刻的悖論:2025年2/3月 Nebius 股票一周內跌40%,但同周卻是公司史上最好的商業周——市場恐懼"AI便宜這麼多是泡沫",而實際是更多人用 DeepSeek 在生產負載跑推理,Cursor 也在那時增長

Jevons 悖論成立讓智能變便宜 → 不減少消耗,反而擴大消耗(同一預算解決更複雜任務,或經濟上終於可行地去規模化那些早就知道可解的任務)

閉源 vs 開源不是替代而是分蛋糕:Anthropic/OpenAI 不會被困住,而是"跳到下一個前沿"——每次解決一個任務,就開始解決更複雜的任務,永遠有更複雜的事要搞定

大多數人真正該擔心的是另一邊:有沒有足夠強的開源/專才模型環境來托住地板

四層產品棧:越往上客戶越多,價值越大?

產能 / 產品 / 客戶 / 資本四維度思考公司:產能是物理世界擴張(供應鏈、監管、防火、用水),團隊永遠不夠

裸金屬(兆瓦,~十幾個客戶):Meta/微軟等級,只需要物理基礎設施,你能給的額外價值很小 → 託管 IaaS(GPU 小時,幾百客戶):多租戶虛擬化,帶 API/可觀測性/安全 → Token Factory(token,幾千客戶):垂直 AI 公司/企業,不碰叢集只管建構 → 智能體層(端到端任務,數萬客戶,規劃中):開發者甚至不再想"特定類型 token",而是"任務被高效完成"

產能瓶頸的時間窗口:6個月內卡死(有什麼就用什麼)→ 12個月仍是產能約束 → 24個月才能真正解鎖

向下全端(建資料中心 + 造機架)壓成本,向上全端(產品層)服務企業——與 CoreWeave 的核心差異

從訓練到推理,客戶真正要的是什麼?不只是算力轉移

訓練→推理只是"十萬英呎視角";真正的新需求 = 資料飛輪(跑推理 → 收資料 → 觀察分析 → 改進模型 → 持續提升產品質量)

「建構門檻在下降」:越來越多建構者不是 AI 研究員、不是推理工程師——能降低複雜性的公司才創造價值

與 CoreWeave 的區分:全端整合(向下:建資料中心 + 造機架 + 建平台 → 動得更快、擠出更多成本;向上:服務企業和產品公司 → 更低集中度、更廣泛客戶組合)

真正的"大遊戲"不是 AI 原生公司,而是現存企業市場:他們不買裸算力,需要平台/工具/尊重遺留系統/能在更複雜環境裡工作——不靈活,有資料要遷移、系統要整合

Token Factory 為什麼是必需的?自己跑 vLLM 為什麼不夠?

vLLM/SGLang 自己跑開源模型不奏效:缺最佳化、缺快取、缺可觀測性——不是"單塊 GPU 榨 token",是成百上千塊 GPU 需要編排/快取/可觀測性

蒸餾 / 投機解碼 / 快取等最佳化能把 token 成本壓一個數量級(TCO 真實成本而非標價)

模型每周/每月在變:平台替你抽象掉"從一個模型切到另一個、做基準"的切換成本——每次新模型出來,平台裡就有,能測試,更好就切換,平滑透明

不止 LLM:生命科學 / 機器人 / 世界模型 / 視訊 / 圖像 / 網路防禦等專才模型大量湧現

Revolut 案例 = 冷啟動問題:99% 預算在 OpenAI → 先花時間建評測 / CI-CD 根基(理解怎麼演進模型、怎麼安全整合進生產)→ 根基建好後指數級增長(Revolut / Shopify / Booking.com 同理)

最先進公司的 AI 預算增速(不是刷量競賽,是實打實生產負載)= AI 原生公司報告的 ARR 增速

「雲是售後生意,每次簽約都是給你去交付的機會」

主權 AI 與輝達:關鍵不是兆瓦,是建構者

主權 AI 對話太集中在"兆瓦 / 電力",不是"建構者層";兆瓦會來,前提是有需求,需求來自建構者

這個行業最了不起的人 = 冒險建構終端使用者產品的人(冒真正風險建構"人們需要或不需要的東西")

輝達關係 = "工程師對工程師"的尊重:輝達是工程師驅動公司,最好的事就是讓輝達工程師尊重你的工程師 → "把你的本職工作做好"

今年 capex 約 20 億美元,對手(超大規模雲廠商)是 8-10 倍

Leo Ashenbrenner 持倉 5.3% = "印證",然後回去做工作;"售後生意" = 每次投資/簽約都是信任 + 交付機會

公眾焦慮、資料中心建設與快問快答:最大威脅是什麼?

70-75% 新產能在美國(歐洲經驗多但現在重心在美國),與社區溝通是職責一部分——像 Uber 早期,去做、去解釋

太空資料中心:3 年前沒人信多吉瓦叢集,"可我們現在就在這兒"

5 年後的工作 = "讓每個人都成為開發者"的二階效應(把想法轉化成數位資產的民主化 → 大量新生意/新想法被點亮)

給女兒的建議:"能與人溝通 + 共情" 和 "創造力/所有藝術" 會被需要——十年前以為該學數學和工程,現在遠離了這個信念

最大威脅 = 整合/集中:如果走向 3-5 個超級公司掌控 → Nebius 只能做物理層供應商 → 世界越民主化越多元,這門生意越被需要 (米飯思考)