#光纖
銅纜退潮,無線電成AI新引擎
無線電接棒銅纜與光纖。訓練超大型新AI 模型的速度,歸根結底取決於兩個詞:向上擴展與向外擴展。在資料中心術語中,向外擴展(scaling out)指的是增加您可以連接在一起的 AI 電腦數量,以分塊處理一個大問題。另一方面,向上擴展(scaling up) 指的是在每台電腦中塞入儘可能多的 GPU,將它們連接起來使其像一個單一的巨型 GPU 一樣工作,並允許它們更快地處理更大塊的問題。這兩個領域依賴於兩種不同的物理連接。向外擴展主要依賴於光子晶片和光纖,它們可以將資料傳輸數百或數千米。而向上擴展形成的網路密度大約是前者的10 倍,它屬於一種更簡單、成本更低的技術領域 —— 通常跨度不超過一兩米的銅纜。但隨著製造更強大電腦所需的GPU 間資料傳輸速率越來越高,銅纜正面臨其物理極限。資料中心互聯初創公司 Point2 Technology 的產品行銷和業務開發副總裁 David Kuo 表示,當銅纜的頻寬需求接近每秒太位元(Tb/s)的領域時,物理定律要求它們必須做得更短、更粗。考慮到當今電腦機架內部的擁擠狀況,以及領先的 AI 硬體公司輝達(Nvidia)計畫到 2027 年將每個系統的最大 GPU 數量從 72 個增加到 576 個(增長八倍),這成為了一個大問題。“我們稱之為‘銅纜懸崖’(copper cliff)。”Kuo 說。業界正在研究各種方法來疏通資料中心,包括延長銅纜的傳輸距離,並將纖細、長距離的光纖更靠近GPU 本身。但 Point2 和另一家初創公司 AttoTude 則倡導一種介於這兩種技術之間、又完全不同的解決方案。他們聲稱,這項技術將兼具銅纜的低成本和可靠性,以及光纖的部分細徑和長距離優勢 —— 這種組合將輕鬆滿足未來 AI 系統的需求。他們的答案是什麼?無線電(Radio)今年晚些時候,Point2 將開始製造支援 1.6 太位元 / 秒(Tb/s)的電纜背後的晶片。該電纜由 8 根細長的聚合物波導組成,每根波導使用 90 吉赫茲(GHz)和 225 吉赫茲(GHz)兩種頻率,能夠承載 448 吉位元 / 秒(Gb/s)的資料。在波導的兩端是外掛模組,用於將電子位元轉換為調製無線電波,再轉換回來。AttoTude 也在計畫本質上相同的事情,但工作在太赫茲(THz)頻率,並使用一種不同類型的纖細、靈活的電纜。兩家公司都表示,他們的技術在傳輸距離上可以輕鬆超越銅纜—— 在沒有顯著損耗的情況下跨越 10 到 20 米,這對於處理輝達宣佈的向上擴展計畫來說肯定足夠長。就 Point2 的情況而言,該系統的功耗僅為光纖的三分之一,成本也為三分之一,延遲可低至光纖的千分之一。據其支持者稱,與光子學相比,無線電的可靠性和易於製造性意味著它可能在將低能耗的處理器間連接一路延伸到GPU 的競賽中擊敗光子學,甚至在印刷電路板上也能取代部分銅纜。銅纜出了什麼問題?一條傳輸速率高達1.6 太位元/秒的 e-Tube 電纜,其橫截面積僅為 32 號銅纜的一半,傳輸距離卻可達其 20 倍。那麼,銅纜出了什麼問題?只要資料速率不太高,傳輸距離不太遠,銅纜本身沒什麼問題。然而,在高速率下,像銅這樣的導體會受到所謂趨膚效應(skin effect)的影響。趨膚效應的產生是因為訊號快速變化的電流會產生一個試圖抵消該電流的變化磁場。這種抵消力集中在導線的中心,因此大部分電流被限制在導線的外邊緣 —— 即 “表皮”—— 流動,這增加了電阻。在 60 赫茲(許多國家的市電頻率)下,大部分電流位於銅纜外 8 毫米處。但在 10 吉赫茲下,“表皮” 深度僅為 0.65 微米。因此,要通過銅纜傳輸高頻資料,導線需要更粗,並且需要更多的功率。這兩個要求都不利於在更小的空間內封裝越來越多的連接以向上擴展計算能力。為了抵消趨膚效應和其他訊號衰減問題,各公司開發了在兩端帶有專用電子裝置的銅纜。其中最有前景的一種稱為有源電纜(Active Electrical Cables, AECs),其終端晶片被稱為重定時器(retimer)。這種積體電路在資料訊號和時鐘訊號從處理器到達時對其進行清理。然後,該電路將它們重新傳輸到銅纜通常包含的八對導線(或通道)上。(另一組用於反向傳輸。)在另一端,該晶片的配對晶片處理在傳輸過程中累積的任何噪聲或時鐘問題,並將資料傳送到接收處理器。因此,以電子複雜性和功耗為代價,AEC 可以延長銅纜的傳輸距離。為資料中心提供網路硬體的Credo 公司高級副總裁兼產品主管 Don Barnetson 表示,他的公司已經開發出一種 AEC,可以在 7 米的距離內傳輸 800 吉位元 / 秒(Gb/s)的資料 —— 隨著電腦達到 500 至 600 個 GPU 並跨越多個機架,這個距離很可能是必需的。AEC 的首次使用可能是將單個 GPU 連接到構成向外擴展網路的網路交換機。Barnetson 說,向外擴展網路的這第一階段很重要,因為 “它是網路中唯一的非冗餘躍點(hop)”。失去該鏈路,即使是瞬間的,也可能導致 AI 訓練運行崩潰。但即使重定時器能將“銅纜懸崖” 的到來稍微推遲一些,物理定律最終還是會佔上風。Point2 和 AttoTude 都押注這一點很快就會到來。太赫茲無線電的傳輸距離AttoTude 脫胎於創始人兼首席執行長 Dave Welch 對光子學的深入研究。作為 2025 年被諾基亞收購的光通訊裝置製造商 Infinera 的聯合創始人,Welch 數十年來一直在開發光子系統。他非常清楚該技術的弱點:功耗太大(據輝達稱,約佔資料中心計算預算的 10%);對溫度極其敏感;將光匯入和匯出光子晶片需要微米級精度的製造;而且該技術缺乏長期可靠性是出了名的。(甚至有一個專門的術語來形容它:“鏈路抖動”(link flap)。)“客戶喜歡光纖。但他們討厭的是光子學。”Welch 說,“事實證明,電子學本質上比光學更可靠。”在諾基亞以23 億美元收購 Infinera 後不久,Welch 在考慮他的下一個創業項目時,問了自己一些根本性的問題,首先是 “如果我不必侷限於 [某個光波長],我應該選擇那裡?” 答案是可以純粹用電子學實現的最高頻率 —— 太赫茲頻段,即 300 至 3000 吉赫茲(GHz)。因此,Welch 和他的團隊著手建構一個系統,該系統包括一個與 GPU 介面的數字元件、一個太赫茲頻率發生器,以及一個將資料編碼到太赫茲訊號上的混頻器。然後,一個天線將訊號送入一根狹窄、靈活的波導中。至於波導,它由中心的電介質(用於傳輸太赫茲訊號)和周圍的包層組成。早期的一個版本只是一根狹窄的空心銅管。Welch 說,第二代電纜 —— 由直徑僅約 200 微米的光纖組成 —— 指向一個損耗低至每米 0.3 分貝的系統 —— 這只是承載 224 吉位元 / 秒(Gb/s)資料的典型銅纜損耗的一小部分。Welch 預測,這種波導將能夠傳輸資料長達 20 米。他說,這 “恰好是資料中心向上擴展的理想距離”。到目前為止,AttoTude 已經製造出了各個元件 —— 數字資料晶片、太赫茲訊號發生器、將兩者混合的電路 —— 以及幾代波導。但該公司尚未將它們整合到一個單一的可插拔形式中。儘管如此,Welch 表示,這種組合至少可以提供 224 吉位元 / 秒(Gb/s)的傳輸頻寬,並且該初創公司去年 4 月在舊金山舉行的光纖通訊會議(Optical Fiber Communications Conference)上展示了在 970 吉赫茲(GHz)下 4 米的傳輸。無線電在資料中心的應用前景Point2 致力於將無線電引入資料中心的時間比 AttoTude 更長。這家由 Marvell、Nvidia 和三星的資深人士於九年前成立的初創公司已經獲得了 5500 萬美元的風險投資,其中最引人注目的來自電腦電纜和連接器製造商 Molex。Kuo 表示,後者的支援 “至關重要,因為他們是電纜和連接器生態系統的重要組成部分”。Molex 已經證明,它可以在不修改現有生產線的情況下製造 Point2 的電纜,現在,生產電纜和連接器的富士康互聯科技(Foxconn Interconnect Technology)也在與該初創公司合作。這種支援對於作為 Point2 客戶的超大規模資料中心營運商來說可能是一個很大的賣點。輝達的GB200 NVL72機架式電腦依靠大量銅纜將72個處理器連接在一起。Point2 的電纜名為 e-Tube,其兩端各包含一個單一的矽晶片,用於將傳入的數字資料轉換為調製毫米波頻率,以及一個向波導輻射的天線。波導本身是一個帶有金屬包層的塑料芯,全部包裹在金屬遮蔽層中。一根名為有源無線電電纜(Active Radio Cable, ARC)的 1.6 太位元 / 秒(Tb/s)電纜由 8 個 e-Tube 芯組成。其直徑為 8.1 毫米,體積僅為同類 AEC 電纜的一半。Kuo 說,工作在射頻(RF)頻率的好處之一是,處理這些頻率的晶片可以在標準矽晶圓廠製造。今年發表在《IEEE 固態電路雜誌》(IEEE Journal of Solid-State Circuits)上的一篇由 Point2 和韓國科學技術高級研究院(Korea Advanced Institute of Science and Technology)的工程師合作的論文,使用了 28 奈米 CMOS 技術,該技術自 2010 年以來就不再是尖端技術了。向上擴展網路市場儘管他們的技術聽起來很有前景,但Point2 和 AttoTude 將不得不克服資料中心行業長期使用銅纜的歷史。“你從無源銅纜開始,”Credo 的 Barnetson 說,“並且只要有可能,你就會想盡一切辦法使用無源銅纜。”他說,資料中心計算中液體冷卻的興起就是證據。“人們轉向液體冷卻的全部原因就是為了繼續使用無源銅纜進行 [向上擴展]。” 為了使用無源銅纜在向上擴展網路中連接更多 GPU,它們必須以空氣冷卻無法單獨處理的密度進行封裝。Kuo 認為,通過毫米波 ARC 連接分佈更分散的 GPU 組來實現相同的向上擴展規模,將減輕對冷卻的需求。與此同時,兩家初創公司也在追逐一種將直接連接到GPU 的技術版本。輝達和博通最近部署了與處理器封裝在同一封裝內的光學收發器,將電子裝置和光學裝置之間的距離從釐米或米縮短到微米。目前,該技術僅限於連接到向外擴展網路的網路交換機晶片。但大公司和初創公司都在努力將其應用範圍一直延伸到GPU。Welch 和 Kuo 都表示,他們公司的技術在這種收發器 - 處理器封裝中可能比光學技術具有很大優勢。輝達和博通 —— 各自 —— 都做了大量的工程工作,才使其系統能夠製造出來,並足夠可靠地與非常昂貴的處理器共存於同一封裝中。眾多挑戰之一是如何以微米級精度將光纖連接到光子晶片上的波導。由於波長較短,紅外雷射必須與光纖纖芯(直徑僅約 10 微米)非常精確地對準。相比之下,毫米波和太赫茲訊號的波長要長得多,因此連接波導時不需要那麼高的精度。Kuo 說,在一個演示系統中,這是手工完成的。可插拔連接將是該技術的第一個用途,但與處理器共封裝的無線電收發器才是“真正的獎品”,Welch 說。 (半導體產業縱橫)