今天這篇文章來自播客《Invest Like The Best》,這次主持人帕特里克·奧肖內西(Patrick O'Shaughnessy)邀請加文·貝克(Gavin Baker)深入剖析該如何投資這場前所未有的人工智慧技術熱潮。
Gavin Baker 是一位美國知名科技投資人,現任避險基金 Atreides Management 的創始人、管理合夥人兼首席投資官(CIO)。他因早期重倉投資 SpaceX、Uber、Snapchat 等高成長科技公司而廣受關注。擅長從技術演進、資本配置和產業格局變化中識別長期投資機會。截至2026年,Atreides Management 管理資產約70億美元
在對話中,Gavin直言Anthropic單月新增110億美元ARR,“是資本主義史上、美國商業史上最非凡的時刻”——其增長速度遠超SaaS革命十年總和,徹底重塑了我們對指數級擴張的認知。
他強調,當前AI投資的核心矛盾在於基礎設施瓶頸:“電力與晶圓”正成為決定產業格局的關鍵。而解決之道不僅來自地面——SpaceX構想的“軌道計算”(orbital compute),即將Blackwell機架送入太陽同步軌道,用雷射互聯建構太空資料中心,可能在未來兩年根本性緩解算力與散熱限制。與此同時,台積電的產能決策被Baker稱為“抑制AI泡沫的關鍵閥門”;若非其刻意維持晶圓短缺,市場恐已陷入由過度建設引發的崩盤。
Gavin犀利指出,AI經濟回報高度集中於“前沿模型”,開源方案難以撼動閉源巨頭,原因在於“苦澀教訓”(bitter lesson)依然有效:算力終將壓倒演算法巧思。他警告,違背這一原則是“AI領域最大風險”。此外,AI正從“無限套餐”轉向“按需付費”,企業用量定價將推動OpenAI與Anthropic ARR突破2000億美元,但也加劇了“只有富人才能觸及前沿”的反烏托邦隱憂。
在巨頭點評中,他盛讚祖克柏將Meta真正轉型為“AI優先”公司,肯定薩提亞押注自研算力的戰略勇氣,並預言Terafab晶圓廠——由SpaceX與英特爾合作打造——或在美國本土重構半導體權力結構。
最後,Gavin以武士與機槍的隱喻呼籲投資者:“機槍已經來了。如果我們不能都成為機槍大師,就會被機槍主宰。”總之,對於任何投資AI領域的人來說,這都是一期必聽的對話。
以下為正文,全文兩萬字,預計閱讀時間1小時,供感興趣的朋友參考:
一、史無前例的增長:Anthropic的ARR奇蹟
主持人(Patrick O'Shaughnessy):這已經是我們第六次做這個節目了,這讓你重回第一的位置,或者至少與Girly並列第一。而且我認為,即使從我們上次做這個節目以來——那期節目就已經非常激動人心和精彩絕倫了——我們現在所處的時代甚至更加有趣。也許你可以先聊聊,對你而言,親身經歷今年三月和四月是什麼感覺?
Gavin Baker:我會說,廣義上講,有兩種類型的回撤。一種是你錯了,比如誤判了形勢,你的假設被證偽了,你必須認虧止損,並將損失變現。另一種回撤或表現不佳的時期,則是因為那些你非常瞭解的公司,你對其價格走勢深感不認同,這時你反而可以加倉,而不是去確認虧損,從而積累起潛在的阿爾法收益,也就是未來的超額回報。對我而言,三月就是這種感覺。當時納斯達克在拋售,但與此同時,AI領域正在發生的事情,我認為是資本主義史上、美國商業史上最非凡的時刻。
我所說的這一點,具體是指Anthropic新增了110億美元的ARR。讓我感到震驚的是,SaaS和雲端運算革命創造了大約5到10兆美元的價值。可以說,在過去10到12年裡成立的三家最具知名度的SaaS公司就是Palantir、Snowflake和Databricks。這三家公司總共僱傭了成千上萬的員工,花了十年時間打造業務。而Anthropic在一個月內就新增了相當於它們總和的業務量。資本主義歷史上從未發生過這樣的事情——我說的不是我的職業生涯,而是整個資本主義史、整個商業史。
所以,這完全沒有先例。我們這些科技投資者,經常聽到關於S型曲線和投資指數級增長的討論。但我從未見過像這樣的指數級增長。它甚至比DeepSeek那次還要極端。
那確實是一個非常相似的局面。如果我們回到2025年,當時DeepSeek引發了一次巨大的拋售,這很奇怪,因為那篇論文是在DeepSeek周一發佈前7天發表的。我記得那篇論文好像是在一個美國的假日發佈的。我讀了之後心想,這對AI交易可能不是個好消息。於是我採取了行動。我們在“DeepSeek周一”那天看到AI類股真正崩盤,一周後情況變得非常奇怪,因為亞洲AWS可用區的價格已經翻倍,GPU的可用性急劇下降。那是我們第一次看到,與非推理模型相比,推理模型在推理階段對算力的渴求要大得多。
所以那是個類似的佈局,但你當時需要做一些功課才能看清。我的意思是,看到股價拋售、但DRAM價格飆升、亞洲GPU價格飆升、GPU可用性下降,其實並不難。然後兩三天後,美國的GPU租賃價格也漲了。而在三月,你只需要簡單地觀察Anthropic身上發生的事情就夠了。
有很多人似乎都在後悔:後悔在2022年沒買,後悔在疫情期間沒買,後悔在DeepSeek時沒買。你在四月初又遇到了同樣的估值環境,而且AI的拐點訊號甚至更加清晰。所以,市場上一直都有買入AI的機會。當然,後來是荷姆茲海峽事件。
我成了一個信徒,現在依然是。我認為市場可能錯誤定價的一點是——我不是宏觀專家,但我確實做了很多與國家安全相關的投資,因此我能接觸到一些專家,他們樂於與我分享他們的想法和觀點——荷姆茲海峽關閉對美國來說實際上相對有利。
主持人:為什麼?
Gavin Baker:因為這尤其符合本屆政府的目標。電力是非常重要的工業或製造業投入。影響美國電價(進而影響AI成本)的關鍵因素是天然氣。彭博資料顯示,美國天然氣價格下跌了20%,而亞洲、歐洲和其他地方的天然氣價格則翻了一番甚至兩番。因此,我們的相對製造業競爭力一夜之間就得到了提升。無論好壞,這正是川普政府似乎關心的。他們非常關注美國的相對地位。
我認為很多人還記著1970年代。70年代之所以如此創傷性,不僅僅是因為價格上漲,更是因為出現了實際的汽油短缺。但當你仔細分析就會發現,美國經濟的能源密集度已大幅降低,美國現在是全球最大的石油和天然氣生產國,並已成為全球最大的石油和天然氣出口國。再加上這種相對的製造業優勢,這使得我們更容易專注於AI的基本面,專注於那些從歷史角度看極具吸引力的估值。從相對角度來看,科技股相對於市場其他部分的估值,已經達到了過去十年中的極低水平。
想想市場有效性這個背景:我們正處在資本主義史上最非凡的時刻,這對AI是極度看漲的,而你卻有機會以極具吸引力的估值買入AI。
主持人:你怎麼看待Anthropic和OpenAI的估值倍數?在我看來,這兩家公司就像是這一趨勢中最純粹的參考資產,而它們的估值倍數其實並不算離譜。如果你只看市銷率,並將其與Databricks、Snowflake等公司在巔峰時期的估值進行比較,你會怎麼理解?
Gavin Baker:我認為OpenAI和Anthropic從資本效率的角度看是截然不同的動物。Anthropic的每個token成本顯然遠低於OpenAI。這一點從它們燒錢達到大致相同收入規模所花費的金額就能看出來。我認為Anthropic的燒錢額可能比OpenAI少了80%。因此,作為企業,它們顯然有著非常不同的結構性ROIC(投入資本回報率)。我認為OpenAI正在做很多事情。我認為Sarah Frier是最傑出的CFO之一,他們正在做很多事情來試圖改善這一點。
而且他們已經鎖定了大量的算力。這是另一個巨大的差異。事實證明,激進的策略確實得到了回報。但話說回來,Anthropic以9000億美元的估值對應500億美元的ARR,並且還在以1000%的速度增長。也許一個真實的說法是,如果Anthropic擁有所有算力,他們今天的收入可能會遠超1000億美元,也許是1500億。
而且,眾所周知,他們已經顯著提升了Claude的智能水平。有分析顯示,即使是Opus版本,Claude在回答完全相同的問題時,生成的token數量也減少了70%。正如我們上次談到的,在某種程度上,token數量等於答案質量和思考質量。當然,每個token的智能密度也很重要。作為一名使用者,我也感受到了這一點。所以我認為如果算力不受限制他們的收入可能會實質性地超過1000億、1500億,甚至可能是2000億。
主持人:那麼為什麼他們不以3兆美元的估值融資1000億美元之類呢?如果你是Anthropic的CFO,Krishna很棒,我們剛請他上過節目(詳見:Anthropic首席財務官萬字訪談實錄:千億美元算力內幕)。那期節目後我認識的每個人都在試圖投資這家公司。
Gavin Baker:我認為這是明智之舉。未來充滿不確定性。你顯然身處一個資本密集型的遊戲,即使你是Anthropic。我敢肯定,Anthropic目前的推理業務毛利率已經是正的,今年可能就會開始產生現金流。儘管如此,你可能還是希望有能力籌集更多資本、獲取更多算力。
我想到埃隆·馬斯克,他總是能讓投資者賺錢。他視之為一種神聖的契約。正因為如此,他在過去20年裡一直讓投資者賺錢,他擁有了超能力。這種能力就是,他基本上可以在任何時候、以任何規模籌集到他想要的資本。我確實認為,專注於讓投資者賺錢是明智的,這帶來的好處不會只持續一兩年,而是可以持續未來二三十年。
主持人:埃隆做到這一點的方法,似乎是系統性地壓低SpaceX或其他公司的估值。具體方法是什麼?
Gavin Baker:就是永遠不在估值上貪婪,永遠不推高估值。就這麼簡單。我的朋友Antonio指出,SpaceX在過去十年裡以略高於30%的復合年增長率增長。我認為這是因為埃隆專注於保持這種“超能力”,並在投資者和員工之間努力尋求公平的平衡。我認為這是明智的。但Anthropic能否以比最新傳聞估值高出至少100%的價格融資呢?當然可以。
二、軌道計算將在未來兩年解決電力短缺問題
主持人:讓我們進入沃森晶圓(Watson wafers)的討論部分,這一直是我和你聊天時最喜歡的話題。我總覺得,每當我感覺基礎設施建設已經過熱時,下一次和你聊,你就覺得我們本該做得更多。你研究過S型曲線及其陡峭程度,也懂很多歷史。談談你今天如何看待沃森晶圓,將其視為這一切的關鍵輸入。
Gavin Baker:我會說,我認為資本主義將解決電力短缺問題,除非出現重大的監管或政治反彈,而我認為這種可能性是真實存在的。一家大型私募股權公司(比如黑石、Apollo或KKR)的資料中心基礎設施投資負責人曾說過:“過去,能源和晶片是我們最大的瓶頸。現在,更重要的是分區規劃和審批許可。”
我認為很多公司都在等待中期選舉後再採取行動,比如進行裁員。沒人想在中期選舉期間成為眾矢之的。但你已經看到,許多製造渦輪機的公司都宣佈了大幅增加產能的計畫。西方已經有80年沒有製造過能鑄造這些大型葉片的機器了,我們已經不知道如何製造它們了,等等。所有這些都是事實。我絕不是要低估其中所涉及的工業工程,但資本主義非常擅長隨著時間的推移解決這類問題。
除了這些渦輪機,還有其他能源來源,只是時間框架更長。因此,我認為電力短缺問題可能會在2027或2028年開始緩解,而軌道計算(orbital compute)將真正解決這個問題。
我想重新定義一下軌道計算,因為當人們聽到“太空資料中心”時——這是我們上期節目討論過的——他們會想像一個五角大樓大小的建築漂浮在太空中,然後說:“我們做不到,那不可能。”但事實並非如此。一個Blackwell機架重約3000磅,高8英呎,深4英呎,寬3英呎。那就是太空中的衛星。SpaceX已經展示了一張示意圖,就是一個機架。它大概有Blackwell機架那麼大,兩側有大約500英呎長的太陽能板翅膀。你把它放在太陽同步軌道上,這樣太陽能板就始終沐浴在陽光下。由於它處於精確的太陽同步軌道上,其後方延伸數百英呎的散熱器也能有效工作。
主持人:這是一個常見的批評。是啊,你怎麼解決散熱問題?
Gavin Baker:我這些年在星港(Starbase)待了很多時間,和很多SpaceX工程師聊過。我認為他們是地球上最有才華的工程師團隊,他們非常有信心已經解決了這個問題。他們並非總是如此自信。例如,要把星艦(Starship)變成火星殖民運輸船,可能還需要一些工程突破。他們能做到嗎?絕對能。但他們目前更關注什麼?我認為可能是維修和維護。
這兩個是最大的問題:散熱器,以及如何修理機架裡出問題的地方。答案是,在你擁有漂浮的Optimus機器人之前,你沒法修。不過,我認為星艦將以前所未有的方式改變太空經濟。特別是如果地面資料中心受到監管限制,那麼一切都不重要了——你能造多少軌道算力,就能賣出多少。
顯然,你會用雷射將這些機架連接起來,而雷射在真空中傳播,這已經是每顆星鏈(Starlink)衛星的標準配置。這讓我感到震驚的是,SpaceX營運著世界上最大的衛星艦隊,佔軌道上所有衛星的98%或99%。他們今天就在給星鏈降溫。我認為星鏈V3的功率將達到20千瓦。而一個Blackwell機架只有100千瓦。人們經常談論密度問題。但在太空中,如果你用真空中的雷射連接機架,你就可以把機架做得更大。你關注的是重量,而不是尺寸。
在地球上的資料中心,你試圖用銅纜連接機架,要儘量縮短距離,布線成本很高。你希望機架小一些,因為能用銅纜就用銅纜,實在不行才用光纜。但在太空中,SpaceX可以做很多那些紙上談兵的懷疑論者想不到的事情。他們營運的衛星比任何人都多。他們今天就有20千瓦的衛星,所以也許你可以先把它擴大到60千瓦。他們似乎非常有信心能直接做到100到120千瓦。
而且,同一家公司現在也營運著地球上最大的資料中心。他們擁有世界上最頂尖的硬體工程師。幾乎所有不夠聰明或不夠務實、無法在SpaceX工作的人,都成了這些坐在扶手椅上的懷疑論者。
我不想引用拉里·埃裡森的話,但有人表示懷疑時,拉里就說:“聽著,他在那裡成功回收火箭。我沒看到有別人能做到。事實是,十年過去了,沒有其他公司能持續地著陸並完全重複使用軌道火箭。如果沒有可重複使用性,這一切都沒有意義。這意味著你必須能著陸它。”
我想重新定義軌道計算:它是太空中的機架,而不是漂浮在太空中的巨型五角大樓式資料中心,那太荒謬了。但你可以做到,因為資料中心的本質就是用雷射連接這些機架。所以,它將是通過雷射連接成一個虛擬資料中心的太空機架。
如果你設想一下那樣的世界,假設這一切都實現了,我們真的能經濟高效地把這些東西送上天,在太空中到處進行矩陣乘法運算。這對地面資料中心意味著什麼?有人曾說過,美國會盡其所能地汲取它能得到的每一種能源。我認為對算力也是如此。
這就是為什麼我可能不像以前那樣擔心邊緣AI的前景了。我們會儘可能多地消耗算力。我認為推理任務非常適合軌道計算。訓練任務在很長一段時間內仍將在地球上進行。所以,我不認為這對地面資料中心是特別利空的。我認為在我有生之年,它們都將是有價值的。
但我確實認為,如果你身處發電和冷卻生態系統中,並且正在大規模提升產能,而你知道很多這樣的產能擴張恰好會在所有那些愚蠢的懷疑論者開始明白軌道計算非常真實的時候上線,那麼你真的需要認真思考一下。與此同時,還有很多酷炫的事情在發生,比如我們正在非常擅長改造噴氣發動機。你知道,有一家叫Boom Aerospace的公司就在做這個。
所以,資本主義正在努力解決瓦特(電力)問題。
三、台積電的產能決策是抑制AI泡沫的關鍵閥門
Gavin Baker:至於晶圓(wafers),那就完全是另一回事了。這是一群在台灣的、意志堅定的老派人士,他們是台灣最重要的人物。他們佔據了該國GDP、用水量、用電量的絕大部分。他們談論著“矽盾”。他們都視自己為摩裡斯·詹(Morris Chang)神聖遺產的繼承者。
我清楚地記得,20多年前我參觀科學園區時,曾問他們:“你們覺得能趕上英特爾嗎?”他們說:“這是一個非常美好的夢想,但這是留給我們的子孫後代的夢想。”
而他們做到了。部分原因是英特爾自己的問題,但更重要的是,他們的思維方式完全不同。這也是為什麼黃仁勳(Jensen)如此頻繁地飛往那裡的原因之一——他希望他們擴大產能。
我認為有一點很瘋狂:黃仁勳從未與台積電(TSMC)簽過合同。他們的生意似乎僅憑握手和公平感就做成了。“長期來看,這將是公平的。我們是合作夥伴,我們會彼此公平對待。”事實上,根據以往所有基礎性新技術(如AI)的市場先例,總會有一個泡沫。卡洛塔·佩雷斯(Carleta Perez)寫過一本關於這個的精彩著作。基本上,市場是有效的,它們能正確理解這是一種基礎性技術。
莫比森(Mobison)稱之為“多樣性崩潰”(breakdown in diversity)。所有人都對這項新技術變得樂觀。我開始有點擔心出現多樣性崩潰。然後就會產生泡沫。這個泡沫為這項新技術的建設提供資金,但供應會超過需求,於是就會發生崩盤。如果這種建設是由債務驅動的(比如2000年),崩盤就會特別嚴重。
我真正感到高興的一點是,當前的建設仍然主要由經營性現金流資助,這是與2000年的一個根本性區別。另一個根本性區別是,如今每塊GPU的利用率都是100%,而2000年時99%的光纖都未被使用。所以存在所有這些根本性的差異,但我們必須記住,歷史不會重演,但會押韻。作為投資者,我們必須對此有清醒的認識,並認識到,在過去兩三百年裡——別提網際網路泡沫了——這種情況總是會發生。
我們歷史上有過鐵路泡沫、運河泡沫,所以我們理應預期也會出現一個AI泡沫。而這令人恐懼——沒人想要泡沫,泡沫是可怕的。之所以可怕,是因為如果你對估值敏感,你就會大幅跑輸市場,很可能被所有客戶解僱。喬治·范德希登(George Vanderhiden)——這位已故的富達(Fidelity)傳奇基金經理——在1999年對抗泡沫,最終於2000年初退休,我想就是因為他實在無法忍受了。
他深知那是錯誤的,而他的客戶們卻深表懷疑:“喬治,你落伍了。”他當時已是滿頭白髮,是一位真正偉大的人物。我只與他短暫共事過,但他對我好友兼導師詹妮弗·尤里克(Jennifer Urick)而言,是一位非常重要的導師和朋友。因此,我從她身上繼承了很多范德希登的“基因”。正是他提出了那句名言:“過早入場和犯錯是一回事。”喬治因為無法忍受持續跑輸、無法忍受客戶質問“你怎麼回事?你不懂嗎?”而選擇退休。他當時持倉中約40%是菸草股,40%是住宅建築商。結果在接下來的三年裡,他可能跑贏納斯達克20到30倍。
現在,我一直樂觀地認為,晶圓(wafers)的根本性短缺——目前實際上由台積電(Taiwan Semi)控制——將阻止泡沫的形成。如果台積電聽從黃仁勳(Jensen)的意願,我認為輝達(Nvidia)在2026或2027年可能賣出2兆美元的GPU,也許是2.5兆,甚至3兆美元。但總會有一個臨界點:當消費者消耗算力的速度快到一定程度時,就可能出現過度建設。因此,如果我們最終沒有出現泡沫,我們應該為台積電舉辦一場慶祝派對,因為他們單槍匹馬地阻止了泡沫。
主持人:你現在已經開始看到一些公司轉向英特爾(Intel)和三星(Samsung)了。假設台積電繼續保持極度供應受限的狀態,遠低於潛在需求,那會發生什麼?
Gavin Baker:在市場歷史中,英特爾和三星這兩家中,總有一家不會保持紀律性。他們會率先打破限制,然後在某種程度上迫使其他所有人都跟進。所以,這很大程度上可能取決於台積電能在多大程度上維持對英特爾和三星的領先優勢。你要記住,這個領先優勢大概是9到12個月,甚至15個月。
主持人:你是說製程節點的領先優勢?
Gavin Baker:沒錯,就是他們擴產的速度。如果要我關注一件事來判斷是否會出現泡沫,那就是台積電的產能決策。我認為存在一個“金發姑娘區間”(Goldilocks zone):他們擴產的幅度足以讓英特爾或三星難以真正成為具備規模化能力的第二供應商(市場份額遠高於30%),同時又能維持晶圓的根本性約束,從而幫助我們避免泡沫。顯然,我認為Terafab(特拉法布)也將在這其中扮演重要角色。
主持人:能為不瞭解的人多說說Terafab嗎?
Gavin Baker:Terafab是SpaceX(我相信特斯拉也參與其中)的一家合資企業,旨在美國本土建造全球最大的晶圓廠。我認為他們會成功。他們與英特爾建立了非常重要的合作夥伴關係,因此他們能獲得英特爾50年的機構知識積累。雖然他們在技術上可能落後前沿幾個季度,但這反而是一種優勢。此外,我相信Terafab會吸引所有半導體裝置公司的“A團隊”關注。台積電當年能快速崛起的一個重要原因,就是ASML、KLA-Tencor、Lam Research和應用材料等公司都不希望市場上只有一個買家(monopsony),於是派出了最頂尖的工程師團隊常駐台灣。英特爾犯了一些錯誤,於是台積電迅速崛起。
現在,由於馬斯克在硬體工程領域的聲譽,“A團隊”將會來到這裡。在美國,政治已經取代了宗教,而埃隆因涉足政治,讓一些美國人難以客觀看待他,這很遺憾。因為我認為,他可能比任何其他美國人都為美國做了更多貢獻:他單槍匹馬地將製造業帶回美國;他復興了“國防科技”(Dince Tech);SpaceX在某種程度上是美國最重要的國防承包商;他在星鏈(Starlink)上的成就對世界意義非凡;他創造了大量藍領製造崗位——這其實是許多自由派人士的目標,對美國大有裨益;他在推動全球脫碳方面的貢獻,超過任何在世之人。如果你因為地面資料中心的環境問題而感到不安,那麼Terafab正是解決方案。可惜的是,在美國本土,人們難以看清這一點,但在中、台、韓、日,他被視為活著的神明。
長期觀察他,你會發現他會招募最優秀的人才——因為頂尖工程師都想為埃隆工作,尤其是在硬體工程領域。他會招募不可思議的工程師。然後,在Terafab旁邊,他會建一個“台灣城”:“這些是你最喜歡的餐廳,我要把它們連同整個員工團隊從台灣搬到德州,我們會按你們喜歡的方式重建一切。”接著會有“日本城”,同樣操作;再建“韓國城”……他會精準地打造這些社區,只為吸引最頂尖的工程師。而英特爾和三星的管理層根本不是這樣思考問題的。因此,他將擁有最頂尖的人才、半導體裝置公司的“A團隊”,以及與英特爾的重要合作——這對任何一屆政府的政治目標都極為有利。而且,這種模式足夠差異化,不會疏遠台積電。
主持人:這些項目都有很長的前置時間,對吧?所以Terafab要開始大規模生產輝達GPU或其他晶片,還需要相當長的時間。
Gavin Baker:埃隆做事的方式總是與眾不同。別人建一個資料中心要三年,他122天就建成了。三星不得不在德州的晶圓廠裡給他專門設一間辦公室,因為他對他們擴建廠房的速度極度不滿。我們拭目以待。
四、違背“苦澀教訓”是AI發展的最大風險
主持人:你之前提到DeepSeek,當時一個簡單的反應是:“好吧,這些模型只需極小一部分成本,就能達到95%的效果,尤其是那些中國開源模型。我們以後大部分任務都可以用它們完成。再過兩年,我這個小公司就不用每年花100萬美元在token上了。”但現實似乎與這種預期大相逕庭。我很想知道,你認為這種認知偏差背後的原因是什麼?
Gavin Baker:我認為這非常有趣:在模型層,AI產生的經濟回報幾乎全部集中在前沿模型(frontier models)上。這一點讓我感到驚訝,也讓很多人感到意外。作為投資者,你必須對此形成自己的假設:前沿token是否會繼續攫取模型層創造的絕大部分經濟價值?我還記得Gemini 3.1 Pro剛發佈時,我覺得它驚豔絕倫,但現在卻已完全無法忍受。
當然,可能存在一種動態:公司先用前沿模型做原型開發,等到投入生產時,很多人會選擇Vertex或開源模型。但事實是,今天絕大多數經濟回報仍然來自前沿token。這很反直覺。至於這種情況是否會持續,我認為是一個非常值得探討的問題。經歷了Gemini 3.1和Opus之後,我對這個問題更加開放。
我目前使用Groq 4.3,它處於“帕羅前沿”(Paro frontier)——即智能與成本的最優邊界。如今處於這一前沿的公司,與我們上次討論的情況相比已有重大變化:Google因在TPU V8上做出過於保守的設計決策(試圖部分擺脫博通和輝達),失去了其每token成本的領導地位;而輝達則持續採取激進策略。九個月前,Google主導著帕羅前沿——在該曲線上每個點都優於OpenAI、xAI和Anthropic。如今,帕羅前沿已被Anthropic和OpenAI主導,Groq 4.3也位於前沿(顯然是目前性價比最高的5000億參數模型),而Gemini 3.1則勉強掛在邊緣。我甚至懷疑Google是在靠補貼維持其地位。
我認為,違反理查德·薩頓(Richard Sutton)的“苦澀教訓”(bitter lesson)絕對是這項投資、乃至整個AI領域最大的風險。“苦澀教訓”的核心是:利用大規模算力的通用方法,最終總是以巨大優勢勝過依賴人類領域知識的特定方法。“苦澀”是因為它打擊了人類的自尊心,因此越接近AI的人,越不相信這種風險會發生。我認為三月市場疲軟的部分原因,就是出現了一個比DeepSeek更愚蠢的東西——“TurboQuant”。這是Google一年前在一篇論文中提出的記憶體最佳化技術。在Google正與美光、三星和海力士談判簽訂長期協議(LTA)、鎖定長期高價的關鍵時刻,他們突然公開了這項技術。人們的行為永遠比言語更重要。他們在X平台上簡單宣傳了一下,立刻病毒式傳播:“天啊,DRAM需求完蛋了!看這個DRAM最佳化方案!”但我找不到地球上任何一個AI工程師相信TurboQuant會對DRAM需求產生任何影響。
儘管如此,違反“苦澀教訓”——即相信人類演算法巧思能超越算力堆砌——確實是一個真實的風險。而那些正在建構模型的人恰恰對這一風險持懷疑態度。我之所以不那麼懷疑,是因為我認為我們已非常接近超級人工智慧(ASI)。誰知道“苦澀教訓”是否適用於400 IQ的模型?也許我們會進入一個短暫的時期:一旦達到ASI,它的首要目標可能是變得更聰明、獲得更多資源。如何實現?通過提升自身效率。我認為這確實是一個風險——“苦澀教訓”字面意義上就包含了人類。我們將很快驗證這一點:它是否適用於300 IQ的AI?400?500?600?在某個時刻,我們可能會因AI/ASI而短暫地違反“苦澀教訓”。
主持人:我很好奇,你怎麼看待模型創新中的其他方面?比如持續學習(continual learning)和記憶(memory),這兩點似乎是人們最關注的、可能催生全新範式的方向。你怎麼看它們的作用?
Gavin Baker:我認為我們已經通過“駕馭層”(harnesses)在記憶方面做了很多工作。“駕馭層”雖不如模型本身重要,但影響巨大。如今,這些駕馭層與模型越來越協同開發。你可以把駕馭層想像成模型運行的“執行階段環境”(runtime),它知道工具池在那裡,能建立上下文、記憶、狀態,提供非常具體的提示或指令,從而產生巨大差異——即使是簡單版本,效果也令人難以置信。
上次我在這裡時就說過:“作為投資者,你必須付費使用250美元/月的版本,才能直觀感受前沿AI的能力。”但現在,即使對於非程式設計用途,你也需要Cloud Code或CodeEx,並且必須使用企業版計畫。原因在於:隨著Google失去成本領導地位,AI模型已全面轉向基於用量的定價模式。如果你使用250、280或300美元/月的個人計畫,你會受到嚴重的速率限制,得到的是“閹割版”AI。正如我們之前討論的,Claude現在生成的token減少了70%。如果你想獲得Claude及其駕馭層認為回答問題所需的完整token量,就必須使用基於用量的企業計畫。
順便說一句,這對AI行業是極度看漲的訊號。我在2005-2007年做過電信分析師,當時移動通訊在過去十年一直是高增長行業,原因在於它結合了固定套餐(比如900分鐘)和超額用量計費。後來當所有人都轉向“無限套餐”(all-you-can-eat)時,移動通訊就不再是一個高增長行業了。長途電話也是如此。AI正在從“無限套餐”轉向“按需付費”(pay-by-the-drink)。事實證明,人們非常喜歡打長途電話,非常喜歡用手機聊天,也極其喜歡使用AI——尤其現在一個人可以擁有100個AI代理。因此,我認為轉向用量定價模式,可能是OpenAI和Anthropic今年ARR將遠超2000億美元的原因:不僅更多算力會上線,它們還能通過企業用量模型推高前沿token的價格。但這對世界來說是悲哀的——這意味著如果你負擔不起,就無法觸及前沿。至於持續學習,如果真能解決這個問題……
主持人:你如何理解“持續學習”?人類心智有太多未解之謎。我們在樣本效率上遠超AI——AI需要的數量級比我們高得多。
Gavin Baker:是的,高出好幾個數量級。今天我們有一種粗糙的持續學習變體,僅限於可驗證的場景,即訓練中期的強化學習(reinforcement learning)。但真正的持續學習,是指模型能即時動態調整其權重。就像人類一樣。
比如我第一次把手伸進火裡,我就學會了再也不這麼做。而今天的模型需要把手伸進火裡一百萬次,然後由設計者在下一次訓練或RL訓練場中人為加入“火”這個元素,它才能學會。我認為它必須能動態更新權重,不過人們已經在研究超越這一點的更聰明技術。如果我們真能實現這一點,就會迎來極快的起飛。人們似乎普遍相信,持續學習就在眼前。我認為這是第三個關鍵問題:1)ASI(或不太可能的人類巧思)是否會導致“苦澀教訓”失效?2)前沿token是否還能維持當前的溢價?3)我們能否實現持續學習?如果能,何時實現?
主持人:在這一切中,新興晶片公司扮演什麼角色?我們談了很多輝達、它與台積電和英特爾的關係等。現在可謂“百花齊放”——可能真的有上千家公司在嘗試設計新晶片,以解決某個瓶頸。我很想知道,你如何看待這個領域的機會、它們將扮演的角色?
Gavin Baker:我認為這對世界是好事,對黃仁勳也是好事。因為不同政府可能持不同觀點,競爭對所有人都有益。在坦克設計中,有個概念叫“鐵三角”(iron triangle):設計師必須在攻擊、防禦和機動性之間權衡。顯然,裝甲(防禦)越多,坦克越重,機動性就越差。因此你必須在這個三角形內做取捨。比如以色列的梅卡瓦(Merkava)坦克側重防禦,而俄羅斯和豹式(Leopard)坦克更側重機動性。
晶片設計同理。你必須在台積電設計規則所規定的物理定律約束下生存。目前,TPU、Tranium和AMD本質上都在試圖打造更好的GPU。我認為Tranium目前做得最好。沒人能造出比輝達更好的GPU,但Tranium確實在“挑戰超人”(tugging on Superman's cape)。不過Tranium 3尚未量產,它需要搭載交換機擴展網路(switch-scale-up network),這對經濟高效的推理至關重要。很多公司採用Taurus架構,包括Google和AMD。MI450的情況還不清楚。我們可能對Trinium 3的瞭解多於MI450,但這仍是一場艱難的競爭。
因此,初創公司必須另闢蹊徑,而且這條路徑本身也必須很難走通。我的經驗法則是:1%的市場份額就值1000億美元——這是一個相當不錯的風投回報。黃仁勳可能會說:“如果有人做出了不同的東西,並獲得了1%-3%的份額,我們就會自己造這種晶片。”所以,如果你只是想造一個更好的GPU,祝你好運。如果你做的是不同的東西,那它也必須很難複製。
此外,預填充(prefill)和推理(decode)的分離,為晶片設計打開了新的可能性。你可以針對decode做激進的權衡,也可以針對prefill做激進的權衡。Prefill是指接收上下文,decode是指生成輸出。
我有位名叫安德魯·福克斯(Andrew Fox)的同事曾比喻:“想像一艘18世紀的英國戰艦。Prefill是裝填炮彈,decode是開火。”Prefill本質上是模型理解問題和提示,並跟蹤自身的解碼狀態——這是一個記憶體容量受限的問題。而Decode是生成新token的過程,受記憶體頻寬限制。
因此,作為晶片設計師,你有了更豐富的畫布。但即便如此,你的權衡也必須足夠難。如果你在“鐵三角”中為最佳化記憶體容量而做出的權衡很容易複製,那麼輝達就會立刻跟進。他們在台積電拿到的價格比你永遠都拿不到的更好。祝你好運吧。而且,他們與每一家模型公司合作,能最佳化自己的設計。
順便說一句,另一件非常有趣的事情是:如果你是一位風險投資家(VC),而你投資的半導體公司告訴你,他們將因為擁有台積電某項製程的“特殊權限”而獲得優勢——我向你保證,黃仁勳早在台積電剛有這個想法時就看到了這項製程,他對它的瞭解遠超一家只有200人的小公司所能想像的程度。台積電、CMI以及整個供應鏈中的所有人,都會像向亞馬遜、AMD、TPU展示一切那樣,向黃仁勳展示所有東西。這也是另一個原因:不要試圖去造一個更好的GPU。
所以,你可以做點不同的事。你可以在預填充(prefill)畫布上作畫,也可以在解碼(decode)畫布上作畫,但你還必須做一件困難的事,因為一旦你的技術達到規模化,那四家公司(輝達、AMD、Google、亞馬遜)就會迅速跟進。我的公司曾是Cerebras的風險投資人。Cerebras所做的是完全不同且極其困難的大規模計算方式。這種架構決策帶來了特定的權衡,但正是這種困難讓他們能做別人做不到的事。我們很快就會知道這到底有多大價值。
你知道,他們正在研究一些非常酷的東西。比如Cerebras面臨的一個問題:當你需要將大量晶片連接起來,並建構擴展型(scale-up)或分佈式(scale-out)網路時,你需要大量的輸入/輸出(IO),而IO受限於所謂的“海岸線”(shoreline)——即晶片的邊緣。Cerebras的片上計算記憶體與“海岸線”IO的比例極高。但他們是非常聰明的人,已經做了極其困難的事。他們現在正嘗試在晶片頂部直接整合一塊光學晶圓(optical wafer),從而解決這個問題。我敢肯定,他們也在研究DRAM的混合鍵合(hybrid bonding)技術,以繞過那些所謂但並不真實的限制。
理論上,Cerebras機器可以運行任意大小的模型。對於某些特定規模的模型,他們的表現遠優於其他方案。我認為Cerebras最有趣的地方在於,他們做了一件既不同又極其困難的事——晶圓級計算(wafer-scale computing)。因此,我認為這些公司確實有其角色。我只是鼓勵所有創業者:做出不同的權衡,並嘗試做一件困難的事。因為在Cerebras IPO之後,所有人都會獲得融資,這不會是問題。但Cerebras花了整整三代晶片才做對這件事,這真的非常困難。你能從CEO安德魯·費爾德曼(Andrew Feldman)和他的團隊身上看出這條路有多艱難。他們需要具備那種堅韌和韌性——第一代晶片失敗了?這很正常。你能否捲土重來,做出第二代晶片?
關於這個話題,最後一點:這對GPU的使用壽命將是驚人的利多,甚至可能單槍匹馬地拯救私人信貸(private credit)市場。
五、GPU壽命延長是私人信貸市場的意外救星
主持人:能詳細說說嗎?你所說的“私人信貸”是什麼意思?
Gavin Baker:私人信貸目前正因SaaS貸款而承受痛苦。無論這些貸款被減記了多少,它們可能還需要進一步減記——如果上市公司都難以適應,那些負債纍纍的公司又如何能適應並投資於這種利潤率結構截然不同的新業務呢?但私人信貸市場也持有大量GPU相關貸款。他們當初做這些貸款時,預期的期限大概是三到四年。而推理任務的分離意味著,我認為這些GPU的使用壽命將達到10到15年。
AI懷疑論者總說:“這些公司都在粉飾帳目。GPU的有效壽命只有一兩年,CPU也只有四年,因為技術迭代太快。”但事實並非如此。正是因為預填充和推理的分離,技術快速迭代反而延長了硬體壽命。你現在可以把Cerebras系統或Groq LPUs(輝達收購的)放在Hopper甚至Ampere GPU前面,用Hopper和Ampere處理預填充任務,從而極大延長這些GPU的使用壽命——直到它們熔化為止。(當然,它們確實會熔化,所以還是有時間限制的,但也許你不必讓它們全速運行。)
這對整個私人信貸行業將是極大的利多。它將有助於為AI基礎設施建設提供融資,因為如果你能以5%或6%的利率(而非之前Crow的最低7%左右)為GPU融資,這在數學上會顯著降低整個建設項目的融資成本。我們正經歷一場技術創新,它將降低融資成本,並延長地球上的計算裝置使用壽命。
最後一點也很有趣:我的朋友Jamon(來自Coatue)最近做了一期播客,Coatue有個簡報提到:“短缺的賣家(sellers of shortage)的表現遠好於短缺的買家(buyers of shortage)。”這裡的“買家”指的是超大規模雲服務商(hyperscalers)。但如果你已經擁有大量當前短缺的裝置,那也是一個極佳的位置。我們聽到越來越多的聲音說,在“智能體”(agentic)世界中,CPU的重要性遠超以往——它們負責編排、工具呼叫等任務。而全球最大的CPU叢集恰恰就在這些超大規模雲服務商手中。因此,我認為這些超大規模雲服務商可能會稍微追趕一下“短缺賣家”的步伐。
主持人:我想談談“不同且困難”這一理念在基礎設施之外的應用。你現在開始與新一代創始人、以及必須適應這個新世界的現有CEO和創始人互動。你觀察到的那些最“原生AI”的創始人——他們不造晶片、不做基礎設施、也不訓練大模型,只是利用這項技術建構其他東西——他們給你什麼感覺?如果你觀察到了差異,他們最與眾不同的地方是什麼?
Gavin Baker:首先,我認為這對晶片設計而言一直是個根本性問題。在風投領域,我一直認為存在兩類創意:一類是地球上任何人一聽就明白的顯而易見的想法;另一類則不然。如果你處於第一類,而且這件事並不難做,那麼在你建立起規模優勢(scale is the ultimate advantage)之前,全世界都會意識到這一點,你就麻煩了。
亞馬遜的偉大之處在於:雖然很多人意識到了電商的機會,但零售業CEO們並沒有意識到。亞馬遜非常聰明——任何VC投資的電商公司,他們都能輕鬆摧毀:我們會把利潤率壓到負10000%。”Wayfair的團隊就做了件困難的事,亞馬遜試圖殺死他們但失敗了。他們是那種營運極其強悍、能力超群的CEO。
對我而言,在風投中,我總是會問:在這家公司建立起規模之前,這個創意會不會變得人盡皆知?還是說,這個創意既不顯而易見、與眾不同,又極其困難?我認為很多創始人都在AI領域苦苦掙扎。
如今,人們越來越擔心:在黃仁勳提出的AI五層蛋糕中,利潤正流向能源、資料中心、晶片和模型層,而應用層幾乎沒有分到利潤。Cursor和Cognition之所以成功,是因為他們18個月前就專注於程式設計領域。當時OpenAI還在嘗試各種方向,而專注程式設計的只有Cursor、Cognition和Anthropic。專注於程式碼確實是明智之舉。MSAD(Replit創始人)曾發推說了一句非常聰明的話,大意是:“與‘苦澀教訓’相關的一點是,程式設計可能是通往ASI(人工通用智能)和實用AI的最短路徑——因為如果你擅長程式設計,你就能為自己編寫程式碼去做任何事。”
因此,這些公司專注程式碼是非常明智的,我認為他們都已達到一定規模,擁有了自己的位置。Cognition正在做一件真正與眾不同的事。但我認為很多創始人都在苦苦掙扎——他們試圖在細分領域建立信心,希望在模型公司進入該領域之前,先建立起自己的資料護城河(data moat);或者賭這個細分市場足夠小,模型公司不會親自下場,但仍能產生風投等級的回報。
主持人:這是否與你之前提到的“token路徑”(token path)有關?
Gavin Baker:是的,這個說法來自Altimiter的Jamon Ball。他說:“無論你是軟體公司還是AI公司,你都必須處於token路徑上。”Databricks就處於token路徑上,同類公司也是如此。如果你不在token路徑上,又不做極其細分的事情,日子可能會很難過。
即使對於這些垂直細分領域,如果你和模型公司的人聊一聊,他們會對此表示懷疑——因為這些細分領域產生的資料都來自人類。而你押注的是:你能利用這個狹窄垂直領域的專有資料,訓練出一個成本低於前沿實驗室的模型。這或許是個不錯的賭注,但我認為你必須非常非常謹慎。
另一方面,如果前沿token相對於其他token的回報率下降,應用層將迎來價值創造的大爆發。另一個非常重要的觀點是:我相信只要黃仁勳願意,他很可能用自己的模型非常接近前沿水平。
我認為你會看到,今天的開源前沿主要由使用“竊取的美國token”的中國模型組成。有人告訴我,DeepSeek最新版(或最初版)僅用了15萬條推理軌跡(reasoning traces)。中國公司有很多方法“洗白”這些資料:你可以呼叫各種API,讓追蹤變得困難。不過,美國實驗室正在努力開發反蒸餾(anti-distillation)技術。
但我認為,中國開源社區在資源極度受限的情況下做出了令人印象深刻的成績,其中包含大量蒸餾(distillation)成分。這也是為什麼我認為,除了算力不足以服務Mythos之外,他們根本不想讓Mythos被蒸餾——他們想自己用Mythos進行蒸餾,並用它通過強化學習(RL)訓練下一代模型。
最終,我認為如果OpenAI或其他前沿公司覺得經濟上可行,他們會面臨一種全新的博弈論困境——一種新型“囚徒困境”。過去的囚徒困境是“你必須投入資金”,而新的囚徒困境是:“如果你處於前沿,你會通過API發佈你的模型嗎?”如果所有前沿公司都同意不發佈,那麼中國開源社區很快就會……但如果有一方背叛,他們將擁有最好的模型、大量收入和現金流,而“資源等於智能”(resources equal intelligence),他們將開始領先,最終迫使所有人都發佈模型。這是一種新的博弈論,類似於台積電、三星和英特爾之間的博弈。
現實是,如果輝達或AMD真的使用其他晶圓廠,那家晶圓廠會迅速變強。因此,我認為黃仁勳會讓開源模型始終落後前沿一段時間。這將是非常值得關注的現象。
順便說一句,開源模型是可以貨幣化的。“開源免費”是個誤解。開源token需要消耗能源,需要用GPU生產,而開源模型公司幾乎總能獲得收入分成。
主持人:你如何為Mythos 3、Mythos 4的世界佈局交易?
Gavin Baker:我們正試圖在網路安全領域過度投資。我在多個場合都說過,並且深信不疑:每個人都需要一個“安全詞”(safe word)。每個人都需要暫時離開數字裝置,真正去海邊,和家人或公司設定一個安全詞——而且不能是容易被社交工程破解的那種。這是為了防範網路犯罪:比如有人Facetime你,看起來完全就是你的兒子、女兒、祖父母或父母,模擬得毫無破綻。他們知道一切,並能基於過往言論精準推測對方可能說的話,然後說:“給我匯100萬美元。”
主持人:這是防禦性的。那在分析層面,你還能做什麼是它無法做到的?
Gavin Baker:這是個好問題。我剛看了《最後的武士》(The Last Samurai),並讓公司同事也去看。如果你沒看過,我強烈推薦。這部20年前湯姆·克魯斯主演的電影歷久彌新。劇情講的是:克魯斯飾演一位憤世嫉俗、退役的內戰老兵(其實是個優秀士兵,但因參與迫害印第安人而心懷愧疚)。他在明治維新時期被日本政府僱傭,訓練一支農民軍隊對抗武士。第一場戰鬥中,儘管武士沒有槍,卻依然獲勝。克魯斯英勇作戰,武士決定不殺他,帶他回村。他逐漸成為武士,並在內戰般的衝突中站在武士一方。最終,他卻被一個手持機槍的農民射殺。
機槍已經來了。如果我們不能都成為機槍大師,就會被機槍主宰。因此,我正努力成為機槍大師。而且我很樂觀:就像一位50歲的資深武士,在許多戰爭中積累了豐富經驗,他使用機槍時也會有優勢。作為一名終身學習投資的學生,我相信自己能夠掌握這把“機槍”(新技術),將其融入我的個人流程和公司流程,從而在未來很長一段時間內繼續作為人類創造價值。
現在,我和所有人一樣,時刻運行著各種AI代理。
主持人:你最有用的代理是什麼?
Gavin Baker:最有用的代理(老實說,我不想傷害你的生意)是一個能為我精準總結播客要點的代理。每天有大約六小時的內容是我職責範圍內必須關注的:每當OpenAI、xAI、Google、Cursor、Fireworks、Bain的人發言,更不用說黃仁勳、埃隆·馬斯克、Dario等人,我都覺得必須觀看,但我實在沒那麼多時間。這其中有很多“乾草堆裡的針”。我總是特別關注管理層薪酬:他們被激勵去做什麼?是愚蠢的RSU(限制性股票單位),還是PSU(績效股票單位)?如果是PSU,具體激勵目標是什麼?能在這方面做好初步篩選的系統,能為人們節省大量時間,讓他們專注於更具創造性的工作,而不是手動翻閱委託書、對比PSU條款的變化——這其中蘊含訊號,但勞動密集度極高,非常適合AI處理。投資領域顯然也有無數類似場景。這是成為投資者最激動人心的時刻。
主持人:但我也有些擔憂——關於“多樣性崩潰”(diversity breakdown)。
Gavin Baker:是的,我越來越擔心這一點。比如,我不認識任何一個像我這樣對DRAM不看漲的人。一個都沒有。
現在AI領域發生了很多有趣的事。首先是橫向估值(cross-sectional valuations)完全不合理——它們根本不可能同時成立。半導體裝置公司以明年一季度年化收益的40倍交易,而DRAM公司卻只有個位數市盈率。上一輪周期高點時,這個比例是5倍對12倍,甚至一度達到3倍對45倍。這種差距不可能持續。誠然,半導體裝置公司的商業模式比記憶體公司更優,但我們還不知道HBM能在多大程度上改善記憶體公司的商業模式。雖然裝置公司通過零部件和服務有部分經常性收入,但這不值得1000%的估值差距。
我認為很難解釋:一方面,輝達在四月初的估值相對於市場處於過去10-12年來的最低水平(絕對估值也很便宜);另一方面,GE Vernova的估值卻隱含了輝達將遭遇難以想像的市場份額流失。這種橫向估值的巨大差異,正是因為我們正處於短缺之中。
在短缺中,質量最低的公司表現最好。如果你是油氣或自然資源投資者,熟悉成本思維,這對你來說很直觀:在真正的商品牛市中,成本最高的供應商漲幅最大——因為他們從破產邊緣一躍成為現金牛。這也是大宗商品投資極其困難的原因:高品質公司在周期中跑贏,但絕大部分超額收益出現在下行周期——當那些在短缺和牛市中暴漲的高成本公司破產時。
你現在在每個行業都能看到這種現象:那些被超大規模雲服務商和買家厭惡的低品質玩家(因為成本高、不可靠、部件故障率高),現在卻供不應求、不斷提價。這種活動吸引了X平台上的散戶,這些股票被炒上天。而一些高品質標的卻顯著跑輸。作為投資者,這很煎熬——因為你非常確定那隻3-6個月內漲了10倍的股票最終會跌回去(除非他們用現金做了明智的事)。但這些低品質公司確實用現金做了些聰明事。
這讓我有點擔心:一年前非常懷疑的人,現在不再懷疑了。但當我對比這些高品質公司的估值(並未高估)時,我又感覺好些了。不過,這確實讓我想起2024-2025年時覺得很滑稽的一點:當時居然有人討論AI泡沫——因為你眼前明明有一個核聚變泡沫、一個量子泡沫。這才是現實!但如今,這種“核聚變/量子”的狂熱可能蔓延到了更投機、質量更低、市值更小的股票上——如果你在X或Reddit上有很大影響力,很容易就能推動它們。這讓我有點害怕。我真心希望有更多AI空頭,更多記憶體空頭。
比如Astera這只股票,我長期關注,有很多空頭,這很好。我最早在C輪融資時就投資了它。別指望能在我面前差異化定價,也別指望它是“銅輸家”(copper loser)。此外,你能感受到市場中的“籃子效應”(baskets)和槓桿籃子——你屬於那個籃子非常重要:銅、光通訊、DRAM、NAND。
今年發生了一件非常有趣的事:在2024-2025年,AI交易是聯動的——比如你可以做多GPU計算、擴展型網路和跨節點光通訊,同時做空電力。這種交易從風險管理角度看是合理的(因為我非常關注因子)。但今年1月,這一切都崩解了:擴展型網路瘋狂上漲時,分佈式網路卻在下跌;DRAM大幅跑輸NAND和HDD(這在過去從未發生)。AI內部的橫向相關性徹底瓦解,你必須極其精細——不能再用半導體裝置或NAND來避險記憶體風險。今年1月,所有橫向關係都發生了非常有趣的變化。我認為原因之一是:AI發展到一定質量後,突然有大量人能深入理解各個子領域並開始交易,然後這些股票被打包進各種“籃子”,從而創造了價格效率。
因此,我認為除了那些能長期複利的高品質標的(它們安全,不像低品質標的那樣可怕)之外,最大的機會在於那些被錯誤分類的股票。比如Astera曾被歸入很多“銅輸家”籃子,但Astera的最大產品將是交換機——而交換機同時使用銅纜和光纜連接加速器。因此,從定義上講,交換機公司或加速器公司不可能是“銅輸家”,因為你必然處於連接的另一端。
六、Google、Meta、微軟、亞馬遜的AI路徑
主持人:我很好奇,你能否用一兩句話點評一下各大公司?我總覺得忘了問你:Google、微軟、亞馬遜這些上市公司,所有討論都圍繞這些令人興奮的新公司展開。
Gavin Baker:好的。Google去年非常不可思議,因為他們擁有TPU優勢(現在已消失)。我認為他們仍處於有利位置,僅僅因為他們擁有最多的算力。我們討論過,在短缺環境下,已部署算力的價值更高——而Google擁有最大的已部署算力基礎。
我對他們感到有點驚訝。本周就是GoogleI/O大會。如果他們不發佈那怕略微超越OpenAI或Claude的產品,雖然不是災難,但會很有趣——這意味著我們討論的“輝達效應”比我想像的更強大。我非常好奇,5天後Google發佈新產品後,“帕羅前沿”(Paro frontier)會變成什麼樣。這對他們是張大牌。
但Google憑藉其資料量(尤其是YouTube資料——在機器人時代極具價值)、算力規模和搜尋業務,永遠不會處於不利位置。你看GCP的瘋狂增長就知道了。
你必須給祖克柏巨大讚譽。他在內部將Meta轉變為“AI優先”公司,我認為他是唯一做到這一點的網際網路巨頭。我非常認可他為此付出的努力,包括早早簽下那些十億美元等級的天才人才合同。Muse(MSL的第一個模型)對我來說是個巨大的驚喜——雖然它不在帕羅前沿(與xAI、Google、OpenAI、Claude相比),但已非常接近,這給我留下深刻印象。因此,我認為Meta處境更好——雖然絕對位置仍不如Google,但在市場中,變化率比絕對水平更重要(尤其在三年這樣的短期框架內;長期來看,競爭優勢的絕對水平才佔主導)。即便如此,變化本身確實至關重要。
亞馬遜憑藉Tranium處於非常強勢的位置。未來18個月,你將在其零售業務中看到機器人帶來的真實P&L效率提升。我認為他們的內部模型Nova雖不及Muse,但比外界評價的要好。
微軟方面,我認為薩提亞(Satya)非常聰明,但在投資者對話中,人們談論他的方式已大不如前。我喜歡薩提亞,欽佩他,認為他是傑出的CEO,並認可他的決策。但你要知道,他從“我們要讓Google跳舞”變成了“Copilot的產品經理”,只用了三年。我很好奇:在OpenAI政變期間,薩提亞是否後悔自己的決定?他是否希望當初支援伊利亞(Ilya)而非山姆(Sam)?如果今天由伊利亞和米拉(Meera)執掌OpenAI,微軟與OpenAI的合作可能會截然不同。這是個我們永遠無法知道答案的有趣問題。
但我必須給他巨大讚譽:他現在所做的決策是有風險的。在不確定性錐體(cone of uncertainty)中,你不僅要決定投入多少,還要決定投入什麼。我認為微軟在2025年初曾猶豫過——他們有個演算法:“投入這麼多資本支出,就能獲得這麼多回報”,但這個演算法當時失靈了。一旦猶豫,你就會失去位置——失去所有算力配額,且很難再拿回來。
因此,薩提亞現在做的決策(儘管市場因此懲罰了他,但我認為是正確的)是:我們將使用自己的算力,而不是(誰知道如果他們願意把GPU賣給OpenAI,Azure的增長會有多快)僅僅服務OpenAI。我們將用算力內部提升自己的產品。Copilot之所以表現糟糕,很大程度上就是因為算力不足。他們正在解決這個問題。薩提亞現在是Copilot的產品經理。我認為他是位偉大的CEO,他們正試圖用算力訓練自己的模型。我有點懷疑他們是否有合適的團隊能成功,但他們和Meta一樣,完全可以負擔得起組建新團隊的費用。我認為他正在做出有風險但正確的決策,為微軟在這個“前沿模型不再通過API開放”的世界中定位。如果微軟僅僅用GPU服務OpenAI和Anthropic,而不是用於自家產品,今天股價可能已是800美元。因此,我非常認可他做出的這個偉大決策。
真正有趣的是,這些公司在決策上的“對外導向”程度。與初創公司互動最深入的兩家公司是亞馬遜和輝達,遙遙領先。其次是Google。博通(Broadcom)則以不同方式參與——他們是每個人最喜歡的AS6供應商。對初創公司而言,如果第二代晶片能與博通合作,就算“升級”;如果博通願意在第一代晶片就合作,簡直是“天降甘霖”。而AMD、微軟和Meta基本上與初創公司零互動。(我說“零”可能有點誇張,但基本如此。)我很好奇這個決策——因為一些最優秀的團隊已不在大型上市公司,而在這些小型初創公司。我認為這最終將成為輝達、AMD和緊隨其後的Google的巨大優勢,而其他超大規模雲服務商則缺乏這種互動。
主持人:在結束前,我很好奇你是否還思考過這個巨大趨勢的其他連鎖反應?我們詳細討論了受影響最直接的公司,也談了些應用層的情況(以及應用層要創造更多價值需要什麼條件)。我還想知道,隨著這個世界如此快速地變化,你是否還想到其他有趣的連鎖效應?
Gavin Baker:是的,這確實很瘋狂。在應用層,別說價值聚集了,價值實際上已被摧毀——即使算上最成功的AI原生公司Cursor和Cognition,AI在應用層已摧毀了數兆美元的價值。
在此背景下,我認為有一點需要警惕:今天表現最好、價值增長最多、創造經濟價值最多的公司,是那些“人均GPU利用率”(utilized GPUs per human)比率最高的公司。也許這意味著每個人未來都會擁有大量GPU,但這是一個我們需要意識到的有趣事實。
我還要說一點(可能有點陰暗):我越來越擔心人身安全——尤其為那些公眾形象更大、與AI關聯更深的人擔心。我希望不要發生悲劇,但美國的政治暴力正在抬頭,而AI日益政治化,我擔心這種暴力會越來越多地針對AI領域的政治領袖。無論我對OpenAI有何看法,我認為有人向山姆·阿爾特曼(Sam Altman)家投擲燃燒瓶是極其可怕的。
我擔心我們正進入一個更高波動性、更高貝塔、更高風險的世界,而這都是因為AI。對我個人而言是如此,對棋盤上的大玩家更是如此。從地緣政治角度看:我們看到烏克蘭人開始真正取勝。我認為他們取勝的原因並非僅僅是擁有更好的無人機(雖然這也是部分原因),而是因為他們擁有僅次於美國和以色列的最佳戰場AI。當中國等對手開始意識到這一點時,他們會如何回應?美國因AI優勢而受益固然是好事,但這對世界其他地區卻是破壞穩定的。
我非常樂觀地認為,AI將為世界帶來奇蹟。比如,有位女兒被診斷出罕見基因突變(無藥可治)的父親,通過AI整合資源、獲得實驗室算力、啟動大量代理,最終找到了一種能影響女兒病情的上市藥物,並創辦公司研發治癒方案。她的人生已因AI而徹底改變。
因此,我是個極端的AI樂觀主義者。但我也承認,AI就像一個“事件視界”(event horizon)——它必將帶來不連續性。作為社會,我們需要謹慎導航。精英們可能會判斷錯誤,但我們必須認真對待他們的擔憂,確保AI惠及所有人。現在最好的AI只對富人開放,這有點反烏托邦。我們需要解決這個問題,以謙卑的態度面對不確定性,並深思熟慮。
主持人:每次和你做完節目,我都會告訴別人:“願你找到一份熱愛,如同加文(Gavin)熱愛市場、公司、資本主義和歷史一樣——今天再次展現無遺。” 非常感謝你的時間。 (衛斯李的投研筆記)
台積電是全場最穩定的角色:只要台積電不讓晶片變太多,AI 的泡沫就吹不起來。台灣工程師辛苦了,你們正在拯救人類的資本主義。
太空資料中心:以後不用擔心發電問題,直接把機架送到太空,用太陽能和雷射連線。聽起來很科幻,但大佬說 SpaceX 的工程師真的在做這件事。
結論:別想著去寫更厲害的演算法了,現在就是『大力出奇跡』,誰有算力誰是大佬。
我只想問:既然機槍都來了,那我可以申請領取免費的 AI 代理(Agent)來幫我上班嗎?🙏
現在這種『物理性的短缺』反而成了市場的保護色。另外,他提到 AI 從『無限套餐』轉向『按需付費』,這對 OpenAI 和 Anthropic 的 ARR 估值是利多,但對二線軟體商則是滅頂之災。如果算力成本無法降下來,應用層的利潤會被模型層榨乾,這就是為何現在應用層價值反而在縮水的原因。」
