▎取消中間商。
上個月中際旭創一季報公佈,營收、淨利潤雙雙翻倍,市值突破1兆元,成為寧德時代之後,創業板第二個獲得此成就的個股。
中際旭創是A股光模組龍頭,也是“老登買白酒”事件第一當事人:
去年9月,荒原資產凌鵬懷疑中際旭創2027年250億的利潤預測只存在於EXCEL表裡,引來國盛通訊分析師年度金句級轉發語:“買你的白酒去吧,老登”。
此後,但凡沾上點白酒、地產,言必談股息分紅、安全邊際,都被統一貼上“老登”標籤。
出圈後的中際旭創也非常爭氣,市值開啟逆天暴漲趨勢。此次季報發佈後,加上分別突破6000億和2700億的新易盛與天孚通訊,A股光模組三劍客“易中天”合計市值超過貴州茅台。
一波接一波的AI資料中心建設浪潮,是光模組一漲再漲的幕後推手,加上AI大廠大超預期的資本開支,把光模組的超強行情又往後續了幾年,也讓A股光模組徹底瘋狂。
一片烈火烹油中,輝達卻在暗地裡磨刀霍霍。
連接算力的“光”
在弄清黃仁勳想幹什麼之前,要先講講光模組的作用和功能。
每個大模型背後,都有一個7×24小時不停計算的資料中心。把資料中心視作“計算工廠”,GPU就是廠裡的基層工人,負責一線計算工作。
但廠長不能直接指揮每個工人,要讓成千上萬人有序工作,最大限度提升效能,就得將工人分成各個小組和車間。光模組的作用就是連線據中心的算力資源,讓彼此互相通訊,有效協調組織。
簡單來說,一個資料中心內部,有三個關鍵環節需要“通訊”:
第一層是伺服器,一個伺服器就是幾張GPU組合在一起,相當於“工作小組”,GPU之間的協作就需要通訊互連,輝達大名鼎鼎的NVLink就是幹這個活的。
第二層是機櫃,一般由多台伺服器組成,相當於一個“車間”。每個伺服器之間也得配合協作。
這些機櫃放在一起,就組成了第三層:有序生產的“計算工廠”。機櫃與機櫃之間也得通過交換機互相通訊。
一個資料中心裡,層級內部(GPU和GPU、伺服器和伺服器)、層級之間都要互連,讓資料自由流動。一旦流動時間太長,外面的計算任務傳不進來,算好的結果傳不出去,就會拖垮整體計算效率。
光模組的出現,就是為瞭解決傳得太慢的問題。
過去幾十年,資料中心的互連任務主要由銅完成。銅纜線的優點是零功耗、零延遲、高可靠性,不產生額外熱量。最重要的是便宜:所有金屬中,銅的導電性僅次於銀排名第二,但成本卻遠低於銀。
黃仁勳就認為,只要物理距離允許,銅就是最好的連接方式。
輝達GB200 NVL72機櫃內部,72顆GPU由5000多根銅纜線連接起來,纜線長度加起來長達2英里。
然而如黃仁勳所說,銅纜的最大限制在於物理距離:超過3-5米,訊號就會快速衰減。尤其機櫃和機櫃間傳輸距離變長,纜線變得像手臂一樣粗,布線非常困難。
大概二十年前,Google就嘗試用光纖替代銅纜,負責機櫃之間的通訊。
光纖/光纜最大的優勢是傳得遠,標準的單模光纖在400G的速率下,能把訊號最遠傳輸至10公里的地方,並且幾乎沒有損耗,長距離傳輸的功耗也低得多。
比較麻煩的是訊號轉換問題。
銅能導電,因此銅纜能直接傳輸晶片送出的電訊號,但光纜的材料是玻璃、塑料等絕緣體需要額外安裝一個“翻譯官”——也就是光模組。
資料以電訊號進入光纜,光模組把電訊號轉換成光訊號;光訊號從光纜輸入另一個裝置,光模組再把光訊號轉回電訊號。
可以說,需要用光纜的地方,就有光模組的需求;對算力的需求越大,對資料傳輸延遲容忍度越低,對光模組的需求就越發高漲。
一個輝達H100算力叢集,平均一顆GPU就要配備6-8個光模組,H200叢集更是需要18-24個,光模組也從800G迭代到了1.6T規格。
但即便如此,輝達還是覺得不夠用。
CPO革命
輝達的替代方案是CPO(Co-Packaged Optics/光電共封裝),顧名思義,就是把負責翻譯的光器件直接裝進負責計算的電晶片上,別過一道中間商了。
光模組本身是一個集合多種零部件的模組,Google最初探索光纖替代銅纜時,負責翻譯功能的各個零件是“散裝”的。後來行業逐漸成熟,各類器件的規格逐步標準化,才被“打包”起來,成為模組。
光模組廠商崛起後,光模組變得即插即用。典型的光模組是可插拔形式,通過標準介面插在交換機上,再連接光纜,資料通過光模組的瞬間就完成了光電訊號的轉換。
然而,資料規模中心規模越大,對光模組的需求量就越大,也帶來了一個問題:功耗。
資料傳輸得越快,功耗越高,最新的1.6T光模組,功耗已經從10G時代的1W飆升到了30W。輝達年初就在GTC上抱怨,光互連的功耗已經佔據計算系統總功耗的10%。
光模組的功耗,很大一部分花在了“路上”:
訊號從交換機“走到”光模組內部的光引擎,這個過程會導致訊號損耗。為了彌補損耗,又需要光模組裡的DSP補償,補償得越多,功耗就越高。
輝達的想法很簡單,既然路太長,那就把路縮短:
電晶片說的是英語,每次資料傳輸都得讓光模組查字典,翻譯成漢語。那乾脆把字典直接塞給電晶片,自己翻譯完直接漢語輸出。這就是CPO的設想——把光模組重新“打散”。
按照輝達的構想,可以把光引擎等核心部件從光模組裡拿出來,放在交換機的晶片旁邊,就省的花錢找翻譯了。
當然,如果只是為了那點功耗,那就把黃總想簡單了。黃仁勳早年提出過一個觀點,光賣晶片,輝達肯定不值這麼多錢,所以輝達“一定不是個晶片公司”,而是要賣整個“計算系統”。
要實現這個偉大構想,輝達還需要一位盟友:台積電。
CPO的技術構思是把光器件“粘”在電晶片上,這就需要先進封裝技術。而台積電恰好是那個在先進封裝領域技術佈局最早、投資力度最大、研發成果最多的公司。
2021年的Hot Chips會議,台積電首次在PPT上展示了COUPE(即CPO)技術,隨後業內傳出,輝達正在謀劃一個矽光子整合研發項目,台積電是重要成員。
好盟友合作的最新成果,是今年初剛剛發佈的AI超級計算平台Vera Rubin NVL576。
負責機架間通訊的Spcectrim-SPX交換機群,就利用了CPO技術,把光引擎放在了交換機晶片旁邊。去掉第三方光模組後,輝達對整個系統的掌控力前所未有。
黃仁勳表示,從光模組改用CPO,“節省出的6兆瓦電力相當於10個Rubin Ultra機架的功耗”。
根據輝達的規劃,把光引擎與交換機晶片整合只是開始,最終目標是把光引擎整合進GPU,量產節點初步定在2028年。
另一邊,台積電也在最近召開的SEMI論壇上宣佈,其COUPE平台預計將在2026年晚些時候正式進入量產階段,意思是:COUPE要開始大範圍接單了。
兩個技術狂魔磨刀霍霍,眼看著就要將光模組穩定已久的格局,重新清洗一遍。
取消中間商
輝達把光模組打散了重做,會直接打擊系統整合商。
這一部分,恰恰就是中國廠商在整個光模組產業鏈中最具統治力的一環。中際旭創、新易盛分列光模組出貨量全球第一、第三,全球前十中國佔了七席(2024年)。
光模組整合屬於精密製造,最大的技術難點是對準精度,要讓光訊號在各個零部件之間以最低的損耗完成對接,對準精度通常需要控制在μm等級,而且速率越高,通道數越多。
最新的1.6T光模組,光晶片貼片精度要達到±3μm,電晶片是±10μm。
中際旭創在1.6T光模組的市佔率達到70%,是輝達的核心供應商之一,一季度毛利率42.61%,相較於行業平均的20%以下,已經做到了天花板等級。
但從上下游結構看,系統整合依然屬於下游組裝環節。
換句話說,輝達用CPO拆裝光模組,拆掉的都是中國企業擅長的部分,留下的光器件和電晶片,中國廠商存在感稀薄。
光器件中,雷射器、探測器是“翻譯”功能的關鍵。光器件在光模組成本中佔比超過70%,而雷射器、探測器合計又佔了光器件成本的50%以上。
電晶片佔光模組成本接近20%,核心器件是DSP晶片和AFE模擬前端,用來確保“翻譯”的精準性。
這兩大類目的四大零部件,目前被美日廠商聯手包圓,尤其在高端產品上,中國廠商幾乎佔不到什麼身位。
高端雷射器由Lumentum、Coherent、博通(美國),和三菱、住友電工(日本)牢牢把持;探測器則有GCS、SiFotonics、Coherent、博通四座大山。
中國本土雖有源傑科技有高端雷射器出貨,但其他廠商多數盤踞在低端市場。
DSP和AFE是典型的模擬晶片,更是博通、Marvell、MACOM等美國模擬晶片老藝術家的傳統藝能,中國廠商更加式微。
中國的光模組企業大多從美日廠商採購核心器件,再將其封裝打包成光模組,雖然毛利不錯,但並未改變光模組“中間商”的定位。
從輝達的動作來看,已經在為光模組的下桌做準備。
就在今年一季度,輝達前後腳向Lumentum和Coherent戰略投資了20億美元,兩者都是當前高端雷射器的全球領頭羊,兩筆投資,直接鎖定了未來幾年雷射器的產能。
上游廠商也在挾天子令諸侯,藉著自家技術優勢,替代光模組廠商去做tier1。
例如在高端DSP佔據主導地位的博通,是輝達之外、台積電COUPE技術的另一個盟友,也是全球最早實現CPO商業化的廠商,2024年就發佈過相關的CPO產品。
這種大客戶和上游一塊擠壓整合商的趨勢一旦形成,整合商的日子就很難過了。
好消息是,鑑於高昂的成本和複雜的技術,短時間內CPO大機率只會應用在少數的高端交換機側,而大部分中低端和高端場景,足夠讓光模組廠商接下來的幾年不愁訂單。
但考慮到矽谷這幫人已經嚷嚷著往太空發射資料中心,用CPO幹掉光模組聽上去也沒那麼難了。 (鈦媒體)
