AMD、AMAT、KLAC、INTC、LRCX、MU、NVDA、STX、SWKS和WDC等以及一級市場的Cerebras、Groq、Tenstorrent、Sambanova等公司,甚至包括了美國商務部工業和安全副部長Alan Estevez主持的小組討論。總結如下:
輝達表示B100相比H100性能提升超過2-3倍(註:輝達CFO原話是「2-3倍聽起來低了」。因為H200相比H100就是80%提升,B100相比H200 2倍提升,也有3.6了,估計真的要4倍以上了)。 推理需求的成長開始迅速加速,上個財年40%,現在已經到了70%(註:這個和我們之前星球裡的分析對上了,但要注意這裡麵包含了大量傳統推理需求,真正的GenAI佔推理需求小於50%,但反過來,隨著GenAI部署的泛華,意味著推理的需求成長會加速)
關於每個GPU 4500美元軟體收入,這與企業安裝基礎有關,20%的收入來自企業,以及一部分銷售到雲端。對於已經出貨的H100有400萬GPU的累計基數,這些GPU都存在升級的可能。如果我們假設一半已經銷售到雲端中,最終將以某種方式被企業在雲端實例中使用,因此需要打補丁/優化,這表明收入潛力>100億美元。對於在CPU上運行的推理,可以繼續在CPU上運行,不一定需要GPU。對於其他類型的更高階的推理工作負載,如genAI,不可能在CPU上運作。資料中心容量瓶頸,對於CSP,他們已經在展望2-3年後,所以這是他們規劃過程的一部分,因此NVDA沒有那麼擔心資料中心容量瓶頸。HBM供應商會增加到三個。需求仍然遠遠超過供應,尤其是全球範圍內,特別是在中東地區(阿聯酋、沙烏地阿拉伯)開始出現國家層級的需求。
AMD表示2027年其4000億美元AI加速器TAM中約65-70%將用於推理。但強調從未說過今年可以實現80億美元的MI300收入(?),認為按產能儲備(HBM和cowos)算的話,的確超過35億美元的指引,並在未來幾代產品表現出非常自信的語氣。我們預計AMD今年結束將在資料中心GPU的市佔率達到約10%。我們也感覺到伺服器CPU的語氣稍微好一些,在傳統伺服器市場看到了一些反彈(也得到了MU評論的支援)。長期毛利率目標57%,但在設定該目標時並未考慮AI業務(MI300X前期對毛利率還是有拖累)。而公司也提到了未來可能會和HBM廠商進行客製化合作(之前文章我們提過HBM4會更加客製化)
儲存板塊持樂觀態度在DRAM方面,HBM供應一直緊張到2025年,MU採用了與TSMC對其客戶所做的類似的預付款和晶圓供應協議,以及年度而非季度/半年的定價談判方式。為了最大化HBM量,在一定程度上犧牲了DDR5的量,並造成了緊缺——所有這些都有助於ASP。WDC對NAND的定價和上漲的持續性持非常樂觀的態度,因為新的資本支出仍然沒有用於NAND,而是被轉移到了HBM。這也傳遞到了SPE,AMAT和LRCX都對DRAM持樂觀態度。
MU透露更多HBM訊息,8層已經量產,12層3月送樣,12層毛利率比8層更高。且鎂光的2024年的HBM已經售罄,再次強調在2025年下半年某個時候達到與鎂光全球DRAM份額相同的HBM份額。而由於MU在HBM2E和HBM3上起步較晚,所以跳到了HBM3E,並決定在1beta上做(功耗有優勢),同時優化了TSV的數量和間距。HBM的晶片尺寸是DDR5的兩倍,且由於堆疊產能額外晶圓損耗,因此非常吃DDR產能(與先前季報說的一致)。適當時間一定會轉向Hybrid Bonding。對於中國XXXX做HBM,原話是「packaging is not controlled」。
可能有更多的CN晶片製造商會被加入實體清單,儘管很難說是誰、何時(彭博已經報導了幾個潛在實體)。在我們的小組討論中,產業與美國商務部之間的一個爭議點仍然是讓其他地區的供應商加入並停止在禁止美國供應商的情況下補發設備發貨(堵日韓的缺口嗔) 。KLA表示china某廠希望其承諾服務資源,給了更多預付款。XXXX的第二家工廠是新的先進工廠,雖然KLA被禁,但其試圖用國產供應商來實現小於1X奈米的產能。XXXX的第一家工廠是20奈米,會升級微縮一次可以用KLA。如果其他公司被加入實體清單,KLAC擔心的是,這些份額只會流向日本競爭對手,如Lasertech或日立,性能不會那麼好,但能用。
I OpenAI 2027 AGI?
今天廣泛流傳的50多頁的《OpenAI 2027 AGI plan》(也傳星球了),作者幾乎是蒐集了之前推特出現的關於OpenAI的所有傳聞,然後把點連成了線,一位大佬評價非常精準——「twitter大旗黨」。文章核心就為了論證以下猜想:
OAI從22年8月開始訓練一個125兆參數的模型,第一階段是Arrakis,也稱為Q*,模型於2023 年12 月完成訓練,Q*原本作為GPT-5在2年後也就是2025年發布,但由於推理成本過高而暫時擱置(記得當時出現了Arrakis的rumor)。而另一個稱為Gobi的模型原本是作為GPT-4.5,現在更名為GPT-5。Q* 的下一階段原為GPT-6,也繼續順延為GPT-7(原定於2026 年發布),但由於伊隆馬斯克最近提起的訴訟而被擱置。OAI目標是2027年推出GPT-8實現AGI。
真假自辨吧,說實話,你也不能否認所有twitter上的rumor,只不過按照過去1年結果看「大旗黨」屢次被打臉。27年實現AGI的確是一個非常非常bullish的觀點,完全不可能嗎?也不是。例如你說3年後GPU效能per Dollar 或per power會降低多少?拍腦袋例如30-50倍(就算現在每年3倍,2年10倍,3年也30倍了),那125兆參數的算力也就等於目前2-4兆參數,和GPT-4 8*2200的1.8兆規模也差不多了。這段時間看了很多人的觀點,傾向於認為純scaling就已經可以實現模型能力的巨大提升...還是那句話,NV+OAI,全村的希望。
I 今天熱議TSMC的第二大客戶到底是誰
台積發了2023年審計報告,其中第二大客戶佔收入11%引起大家熱議。我們之前文章發過UBS計算的台積電歷史客戶收入,24/25預測就看看,23年之前歷史數據確定性強一點,AMD按照這個計算就是11%,NVDA會在24年對TSMC的收入貢獻猛增到10%以上。
I 繼續說AI catch up plays(今天海力士+6%,台積電+5%)
TMTB部落客今天的comment,哥們最近是格局打開了:AI新結構下,想像力打開點對我們有好處。2-3年後的世界會是什麼樣子?從那個點出發,我們應該思考5-6年後的世界會是什麼樣子?這對當前的本益比意味著什麼?市盈率是我們嘗試根據成長和風險來評估資產價格的一種方式(註:如果指數成長傳統的PE估值如何優化)。如果AI讓利率反而是lower for longer,越來越多的AI驅動的投資報酬率(ROI)的證據對我們對獲利成長預測有什麼影響?在某個時候,我們將從第一波(半導體受益於晶片需求的快速擴張+IT雲端支出)和第二波(基礎設施需求增加)轉向第三波(非科技公司透過利用AI提高效率+收入成長獲得更高的投資回報)。這個過程不會是線性的,任何時候都會有階段之間的重疊:Klarna和META的收益是第三波的早期例子。
這裡不得不再引述下F姐的評論:「既然beat rate差異這麼大(IGV 51% vs SOX 67%),這是不是說明大而分散的IGV就比小而集中的SOX基本面更差?並不是。如果我們把這個月度的業績擴展到整個1Q,兩者beat/miss的機率幾乎差不多,都是50:50;但是兩者的賠率卻有顯著差異,IGV是3%:-4%, SOX是11%:-1%」 說穿了,風在硬體這邊,beat一點就給你拉上天,miss一點反倒一堆人去抄,更何況beat率還挺高,傳統業務復甦和AI拉動共振了,基本面強勁。
因此TMTB老哥也提到了賭財報的問題,“這種股價反應範式是否會在本週CRWD、MDB、GTLB、MRVL、AVGO、CIEN的季報中繼續? ”
另外對於老哥提到的「第三波」非科技公司用AI提升效率,MS還真就剛剛做了個圖,說實話,過去一年由於模型的不給力,這個交易邏輯一直不work,到今天繼續擴散的話,不知道會不會又被拿回來炒
MS策略分析師Andrew Pauker的結論:類比1990s年代,生產力提升傳導至利潤率滯後了1年,認為AI會給2025整個標普500的淨利率提升30-50個bp...
I Tegus今天的一篇NV紀要,專家據稱是戴爾CTO...
總結:企業級HPC和AI伺服器,戴爾和惠普相比SMCI有明顯優勢;輝達AI Enterprise (軟體業務)所帶來的GPU資產“可管理性”,又是前瞻的一步,將進一步拉開與AMD Rocm 差距;NV對超威的優先支持,讓其他伺服器廠商不得不增加對AMD Intel的適配(這不得取決於客戶選擇嗎?)
I關於某芯某線又5了,什麼n+three了之類的新聞,以及星球裡面大家熱議的HBM到底XX有沒有出貨YY有沒有量產之類的,我們Leslie總今天給了一個清晰的總結:
說到底晶片好壞的評價標準是PPACt(power,performance,Area,Cost,time to market),線寬只是指標之一,但過去幾十年因為消費者最易於理解被營銷反復加強,過度強調了其重要性,且在非業內人士中建立一個過於單一的評價標準。就比如說幾nm成功了,「成功」是什麼意思?對應晶圓良率爬坡的哪個階段叫成功?台積電可能至少初期良率要4成一年後要拉上7成才會叫量產。如果按照且聽龍吟式段子,那台積電完全可以說a14已經成功!(三星不就每次玩這招)良率界定清楚了,還有成本問題(一袋麵粉做一個饅頭還是10個饅頭),還有產能問題,只能擴1k片還是1w片還是10w片有本質區別。以極低良率、極高成本、實現了超小規模產能,技術突破的象徵意義的確很大。不過話說回來,卡點也是一個個解決的,現狀不代表未來,良率&成本、擴產設備瓶頸,留給時間吧。(資訊平權)