輝達想革光模組的命

2026/05/11

•

▎取消中間商。

上個月中際旭創一季報公佈，營收、淨利潤雙雙翻倍，市值突破1兆元，成為寧德時代之後，創業板第二個獲得此成就的個股。

中際旭創是A股光模組龍頭，也是“老登買白酒”事件第一當事人：

去年9月，荒原資產凌鵬懷疑中際旭創2027年250億的利潤預測只存在於EXCEL表裡，引來國盛通訊分析師年度金句級轉發語：“買你的白酒去吧，老登”。

此後，但凡沾上點白酒、地產，言必談股息分紅、安全邊際，都被統一貼上“老登”標籤。

出圈後的中際旭創也非常爭氣，市值開啟逆天暴漲趨勢。此次季報發佈後，加上分別突破6000億和2700億的新易盛與天孚通訊，A股光模組三劍客“易中天”合計市值超過貴州茅台。

一波接一波的AI資料中心建設浪潮，是光模組一漲再漲的幕後推手，加上AI大廠大超預期的資本開支，把光模組的超強行情又往後續了幾年，也讓A股光模組徹底瘋狂。

一片烈火烹油中，輝達卻在暗地裡磨刀霍霍。

連接算力的“光”

在弄清黃仁勳想幹什麼之前，要先講講光模組的作用和功能。

每個大模型背後，都有一個7×24小時不停計算的資料中心。把資料中心視作“計算工廠”，GPU就是廠裡的基層工人，負責一線計算工作。

但廠長不能直接指揮每個工人，要讓成千上萬人有序工作，最大限度提升效能，就得將工人分成各個小組和車間。光模組的作用就是連線據中心的算力資源，讓彼此互相通訊，有效協調組織。

簡單來說，一個資料中心內部，有三個關鍵環節需要“通訊”：

第一層是伺服器，一個伺服器就是幾張GPU組合在一起，相當於“工作小組”，GPU之間的協作就需要通訊互連，輝達大名鼎鼎的NVLink就是幹這個活的。

第二層是機櫃，一般由多台伺服器組成，相當於一個“車間”。每個伺服器之間也得配合協作。

這些機櫃放在一起，就組成了第三層：有序生產的“計算工廠”。機櫃與機櫃之間也得通過交換機互相通訊。

一個資料中心裡，層級內部（GPU和GPU、伺服器和伺服器）、層級之間都要互連，讓資料自由流動。一旦流動時間太長，外面的計算任務傳不進來，算好的結果傳不出去，就會拖垮整體計算效率。

光模組的出現，就是為瞭解決傳得太慢的問題。

過去幾十年，資料中心的互連任務主要由銅完成。銅纜線的優點是零功耗、零延遲、高可靠性，不產生額外熱量。最重要的是便宜：所有金屬中，銅的導電性僅次於銀排名第二，但成本卻遠低於銀。

黃仁勳就認為，只要物理距離允許，銅就是最好的連接方式。

輝達GB200 NVL72機櫃內部，72顆GPU由5000多根銅纜線連接起來，纜線長度加起來長達2英里。

然而如黃仁勳所說，銅纜的最大限制在於物理距離：超過3-5米，訊號就會快速衰減。尤其機櫃和機櫃間傳輸距離變長，纜線變得像手臂一樣粗，布線非常困難。

大概二十年前，Google就嘗試用光纖替代銅纜，負責機櫃之間的通訊。

光纖/光纜最大的優勢是傳得遠，標準的單模光纖在400G的速率下，能把訊號最遠傳輸至10公里的地方，並且幾乎沒有損耗，長距離傳輸的功耗也低得多。

比較麻煩的是訊號轉換問題。

銅能導電，因此銅纜能直接傳輸晶片送出的電訊號，但光纜的材料是玻璃、塑料等絕緣體需要額外安裝一個“翻譯官”——也就是光模組。

資料以電訊號進入光纜，光模組把電訊號轉換成光訊號；光訊號從光纜輸入另一個裝置，光模組再把光訊號轉回電訊號。

可以說，需要用光纜的地方，就有光模組的需求；對算力的需求越大，對資料傳輸延遲容忍度越低，對光模組的需求就越發高漲。

一個輝達H100算力叢集，平均一顆GPU就要配備6-8個光模組，H200叢集更是需要18-24個，光模組也從800G迭代到了1.6T規格。

但即便如此，輝達還是覺得不夠用。

CPO革命

輝達的替代方案是CPO（Co-Packaged Optics/光電共封裝），顧名思義，就是把負責翻譯的光器件直接裝進負責計算的電晶片上，別過一道中間商了。

光模組本身是一個集合多種零部件的模組，Google最初探索光纖替代銅纜時，負責翻譯功能的各個零件是“散裝”的。後來行業逐漸成熟，各類器件的規格逐步標準化，才被“打包”起來，成為模組。

光模組廠商崛起後，光模組變得即插即用。典型的光模組是可插拔形式，通過標準介面插在交換機上，再連接光纜，資料通過光模組的瞬間就完成了光電訊號的轉換。

然而，資料規模中心規模越大，對光模組的需求量就越大，也帶來了一個問題：功耗。

資料傳輸得越快，功耗越高，最新的1.6T光模組，功耗已經從10G時代的1W飆升到了30W。輝達年初就在GTC上抱怨，光互連的功耗已經佔據計算系統總功耗的10%。

光模組的功耗，很大一部分花在了“路上”：

訊號從交換機“走到”光模組內部的光引擎，這個過程會導致訊號損耗。為了彌補損耗，又需要光模組裡的DSP補償，補償得越多，功耗就越高。

輝達的想法很簡單，既然路太長，那就把路縮短：

電晶片說的是英語，每次資料傳輸都得讓光模組查字典，翻譯成漢語。那乾脆把字典直接塞給電晶片，自己翻譯完直接漢語輸出。這就是CPO的設想——把光模組重新“打散”。

按照輝達的構想，可以把光引擎等核心部件從光模組裡拿出來，放在交換機的晶片旁邊，就省的花錢找翻譯了。

當然，如果只是為了那點功耗，那就把黃總想簡單了。黃仁勳早年提出過一個觀點，光賣晶片，輝達肯定不值這麼多錢，所以輝達“一定不是個晶片公司”，而是要賣整個“計算系統”。

要實現這個偉大構想，輝達還需要一位盟友：台積電。

CPO的技術構思是把光器件“粘”在電晶片上，這就需要先進封裝技術。而台積電恰好是那個在先進封裝領域技術佈局最早、投資力度最大、研發成果最多的公司。

2021年的Hot Chips會議，台積電首次在PPT上展示了COUPE（即CPO）技術，隨後業內傳出，輝達正在謀劃一個矽光子整合研發項目，台積電是重要成員。

好盟友合作的最新成果，是今年初剛剛發佈的AI超級計算平台Vera Rubin NVL576。

負責機架間通訊的Spcectrim-SPX交換機群，就利用了CPO技術，把光引擎放在了交換機晶片旁邊。去掉第三方光模組後，輝達對整個系統的掌控力前所未有。

黃仁勳表示，從光模組改用CPO，“節省出的6兆瓦電力相當於10個Rubin Ultra機架的功耗”。

根據輝達的規劃，把光引擎與交換機晶片整合只是開始，最終目標是把光引擎整合進GPU，量產節點初步定在2028年。

另一邊，台積電也在最近召開的SEMI論壇上宣佈，其COUPE平台預計將在2026年晚些時候正式進入量產階段，意思是：COUPE要開始大範圍接單了。

兩個技術狂魔磨刀霍霍，眼看著就要將光模組穩定已久的格局，重新清洗一遍。

取消中間商

輝達把光模組打散了重做，會直接打擊系統整合商。

這一部分，恰恰就是中國廠商在整個光模組產業鏈中最具統治力的一環。中際旭創、新易盛分列光模組出貨量全球第一、第三，全球前十中國佔了七席（2024年）。

光模組整合屬於精密製造，最大的技術難點是對準精度，要讓光訊號在各個零部件之間以最低的損耗完成對接，對準精度通常需要控制在μm等級，而且速率越高，通道數越多。

最新的1.6T光模組，光晶片貼片精度要達到±3μm，電晶片是±10μm。

中際旭創在1.6T光模組的市佔率達到70%，是輝達的核心供應商之一，一季度毛利率42.61%，相較於行業平均的20%以下，已經做到了天花板等級。

但從上下游結構看，系統整合依然屬於下游組裝環節。

換句話說，輝達用CPO拆裝光模組，拆掉的都是中國企業擅長的部分，留下的光器件和電晶片，中國廠商存在感稀薄。

光器件中，雷射器、探測器是“翻譯”功能的關鍵。光器件在光模組成本中佔比超過70%，而雷射器、探測器合計又佔了光器件成本的50%以上。

電晶片佔光模組成本接近20%，核心器件是DSP晶片和AFE模擬前端，用來確保“翻譯”的精準性。

這兩大類目的四大零部件，目前被美日廠商聯手包圓，尤其在高端產品上，中國廠商幾乎佔不到什麼身位。

高端雷射器由Lumentum、Coherent、博通（美國），和三菱、住友電工（日本）牢牢把持；探測器則有GCS、SiFotonics、Coherent、博通四座大山。

中國本土雖有源傑科技有高端雷射器出貨，但其他廠商多數盤踞在低端市場。

DSP和AFE是典型的模擬晶片，更是博通、Marvell、MACOM等美國模擬晶片老藝術家的傳統藝能，中國廠商更加式微。

中國的光模組企業大多從美日廠商採購核心器件，再將其封裝打包成光模組，雖然毛利不錯，但並未改變光模組“中間商”的定位。

從輝達的動作來看，已經在為光模組的下桌做準備。

就在今年一季度，輝達前後腳向Lumentum和Coherent戰略投資了20億美元，兩者都是當前高端雷射器的全球領頭羊，兩筆投資，直接鎖定了未來幾年雷射器的產能。

上游廠商也在挾天子令諸侯，藉著自家技術優勢，替代光模組廠商去做tier1。

例如在高端DSP佔據主導地位的博通，是輝達之外、台積電COUPE技術的另一個盟友，也是全球最早實現CPO商業化的廠商，2024年就發佈過相關的CPO產品。

這種大客戶和上游一塊擠壓整合商的趨勢一旦形成，整合商的日子就很難過了。

好消息是，鑑於高昂的成本和複雜的技術，短時間內CPO大機率只會應用在少數的高端交換機側，而大部分中低端和高端場景，足夠讓光模組廠商接下來的幾年不愁訂單。

但考慮到矽谷這幫人已經嚷嚷著往太空發射資料中心，用CPO幹掉光模組聽上去也沒那麼難了。 (鈦媒體)