#光子技術
光晶片,一些看法
近年來,生成式人工智慧的迅猛發展導致全球範圍內超大規模人工智慧叢集的部署速度空前加快。隨著摩爾定律的放緩,只有通過平行計算才能實現更高的性能,因此,資料處理和/或傳輸性能的提升必然導致能耗的增加。也就是說,人工智慧基礎設施的快速增長帶來了嚴重的能源危機。如圖 1 所示,隨著資料量的指數級增長,所需的能源供應量也將呈指數級增長。從這個意義上講,解決這一能源問題的唯一有效途徑是開發一種能夠將能源增長與資料增長分離的技術。光子學具有巨大的潛力,因為光波的傳播和干涉無需消耗能量,因此可以通過工程設計來實現可擴展的功能,而無需增加能耗。矽光子學在過去二十年中得到了廣泛的發展,如今已完全具備提供近乎理想的平台的能力,從而釋放其巨大的潛力。事實上,矽光子學能夠提供高效的高密度互連,實現高頻寬和長距離鏈路;能夠實現低能耗的光路切換,且不受訊號頻寬的限制;以及能夠進行光速計算的光子神經網路,從而加速人工智慧計算。在本文中,我們將回顧這些光子技術的發展趨勢和進展,我們將論證,為了使這些光子技術成為人工智慧時代可持續基礎設施的重要組成部分,硬體和軟體以及電子和光子學需要以互補的方式進行開發。光收發器和交換機A. 能耗擴展圖 2 繪製了光收發器和超大規模資料中心常用的電交換機專用積體電路 (ASIC) 的能效(單位為 pJ/bit)隨時間的變化曲線。通過與光收發器的趨勢進行比較,發現交換機 ASIC 的可擴展性不如光收發器,這表明瓶頸在於交換機而非收發器。令人驚訝的是,光收發器的能效已經趕上了摩爾定律的步伐,基於矽光子學的近封裝/共封裝光學器件的能效已經超過了 5 pJ/bit,而交換機 ASIC 的能效提升卻明顯緩慢。事實上,ASIC交換機的功耗會隨著吞吐量的增加而增加,在100Tbps吞吐量下,每個晶片的功耗會超過1000W;而光交換機的功耗則極低且在吞吐量增加的情況下保持穩定(圖3)。因此,使用光交換機替代電交換機越多,系統效率就越高。以下將討論一些實際問題。B. 光交換機的系統應用案例光交換機的一個關鍵缺點是無法進行封包處理,而封包處理正是ASIC交換機的核心功能。光交換機僅作為“光路交換機(OCS:optical circuit switches)”運行,因此不能簡單地替代ASIC交換機。為了控制OCS,需要一個控制平面,而編排器或作業系統需要瞭解OCS的狀態,並根據系統需求,通過控制平面傳送相應的命令來控制光交換機。這種系統與依賴專用積體電路交換機 (ASIC) 的傳統分組系統截然不同,因此,使用光通訊系統 (OCS) 需要從零開始重建整個系統,並對架構進行全面最佳化。顯然,目前世界上除了Google之外,沒有其他公司能夠做到這一點。在Google宣佈已在其資料中心和人工智慧基礎設施中大規模使用 OCS 之後,光交換機開始得到廣泛發展。早在Google推出 OCS 系統之前,日本產業技術綜合研究所 (AIST) 就已經開始研發大規模矽光子交換機。圖 4 展示了 AIST 開發的矽光子交換機刀片。該交換機提供 32 x 32 個嚴格無阻塞連接,並帶有數字控制介面,通過配置 9 級 Clos 網路,可擴展至 131,072 x 131,072 個連接。實驗證明,在可組合的解耦基礎設施中,這些交換機可以將網路功耗降低 75%。用於製造這些大規模矽光子開關的製造裝置是日本產業技術綜合研究所(AIST)基於標準CMOS技術的內部試驗生產線,該技術採用45奈米工藝規則,實現了足夠高的均勻性和良率,可以大規模生產包含數千個器件(例如馬赫-曾德爾干涉儀(MZI: Mach-Zehnder interferometers))的大規模光子積體電路。光子神經網路基於標準CMOS製造技術的矽光子器件具有高均勻性和高良率,這對於實現光子神經網路(PNN:photonic neural networks )至關重要。在PNN中,整合了大量的馬赫-曾德爾干涉儀(MZI),形成網狀拓撲結構,並在光域中執行矩陣-向量乘法(MVM:matrix-vector multiplications)。PNN上的MVM過程本身速度極快,且不消耗能量,可以顯著提升人工智慧(AI)的計算能力。因此,人們期望PNN能夠分擔GPU等高能耗數字處理器的計算任務。然而,PNN缺乏良好的非線性啟動函數,而非線性啟動函數是AI計算中另一個重要的功能。為瞭解決這個問題,我們提出利用電光(EO:electro-optic)非線性效應,僅通過傳播即可完成AI計算過程,而無需中間階段的數字處理。利用馬赫-曾德爾干涉儀(MZI)器件可以輕鬆實現這一點,該器件以電訊號作為輸入,以調製後的光訊號作為輸出。電光非線性具有正弦傳遞函數,這與傳統的啟動函數(例如 ReLU、Sigmoid 和雙曲正切函數)截然不同。因此,需要尋找適用於機率神經網路(PNN)的全新人工智慧模型。A. 基於光電非線性的機率神經網路目前,我們已提出並演示了幾個基於光電非線性的AI模型,如下所示:第一個模型包含一個從輸入參數空間到更高維空間的非線性投影對應。通過調整馬赫-曾德爾干涉儀(MZI)的工作點來訓練其光電傳遞函數。轉換後的光學復空間中的非線性對應資料可以通過尋找超平面進行分離,類似於支援向量機。圖5(a)和5(b)分別展示了我們開發的矽光子晶片和實驗裝置。我們使用BFO(bacteria foraging optimization)和前向差分兩種演算法在晶片上進行了訓練,並在圖5(c)中展示了它們對多個布林邏輯進行分類的有效性,並在圖5(d)中展示了它們對鳶尾花資料集的高精度分類。該PNN僅通過無源光子電路中訊號的物理傳播即可完成計算,從而保證了低功耗和低延遲計算。我們在此討論的第二個模型是上述模型的級聯版本,即“垂直分層光電機率神經網路”(,如圖 6 所示)。在該模型中,所有光路的長度不會隨著層數的增加而增加,從而能夠實現更深度學習模型。圖 7 顯示了 MNIST、Fashion 和 KMNIST 資料集的測試精準率。三層模型的精準率優於兩層模型。我們在此介紹的最後一個(但同樣重要)模型是光電霍普菲爾德網路。圖 8(a) 顯示了我們提出的架構,其中馬赫-曾德爾干涉儀 (MZI) 作為非線性神經元,將輸入資料和反饋訊號編碼到輸入的單頻連續波 (CW) 光(記為 λ)上。圖 8(b) 顯示,經過訓練後,即使對於半損壞的輸入模式,也能回憶起儲存的模式,這表明了霍普菲爾德網路特有的聯想記憶效應。B. 流式 PNN 的通用方案由於運行 PNN 需要不可忽略的開銷,因此必須對整個系統進行徹底評估和整體最佳化。另一方面,PNN 的固有優勢是低延遲、高速度、低能耗等。為了充分發揮這些優勢,PNN 作為流式處理器,同時具備電域和光域 I/O 時,運行效果最佳。流式 PNN 的概念如圖 9 所示。通過該方案,PNN 可以同時在電域和光域中流式處理資料,從而無縫整合到數字基礎設施中。結論矽光子技術取得了顯著進步,如今在諸多方面展現出巨大的潛力,能夠從高密度I/O、頻寬無關的電路開關以及光速AI加速器等多個方面提升人工智慧基礎設施的可持續性。然而,將光子功能器件(例如OCS和PNN)引入傳統數字基礎設施並非易事,因此,未來需要對整體系統設計和實現進行更深入的研究。 (半導體行業觀察)
三星大舉殺入矽光賽道
據韓媒報導,三星全力投入矽光子技術,旨在顛覆“AI晶片代工”格局,利用光來提高資料傳輸速度,全力投入人才和技術,挑戰台積電。報導指出,三星電子已向台灣台積電發起挑戰,力圖在矽光子學市場佔據主導地位。矽光子學被認為是未來人工智慧(AI)半導體市場的顛覆性技術。它利用光的強度和波長來傳輸資訊,因其速度快、發熱量低、能耗低等優點,被認為將改變未來的半導體市場。據業內人士30日透露,三星電子器件解決方案(DS)事業部已將矽光子學選為未來的核心技術,並開始為其位於新加坡的專屬研發中心招募經驗豐富的專家。該新加坡研發中心由副總裁兼前台積電員工崔景建領導,正與總部技術開發辦公室(由晶圓代工事業部總裁兼首席技術官南錫佑領導)緊密合作,共同推進這項技術的發展。半導體公司正轉向矽光子技術,以提高人工智慧半導體的傳輸速度,同時降低發熱量和功耗。與將資料資訊儲存在銅線上的傳統半導體不同,矽光子技術將資訊封裝在光中,然後通過光纖(波導)傳輸。由於幾乎沒有電阻,矽光子技術不僅能夠實現更快的傳輸速度,還能顯著降低發熱量和功耗。鑑於這些優勢,輝達、AMD 和英特爾等公司均已開始研發,並與台積電簽署了代工協議。三星也計畫迅速提升其技術實力並吸引客戶。一位業內人士表示:“2030 年後,當矽光子技術應用於人工智慧伺服器之後的單個晶片時,它將決定代工市場的競爭力。”市場研究公司 Modo Intelligence 預測,到 2030 年,矽光子市場規模將增長至 103 億美元(約合 15 兆韓元)。十多年前,矽光子學還只是一種理論。它需要將電訊號注入雷射產生的光中,通過光的狀態變化將電訊號表示為0和1,並用矽波導而非導線傳輸光訊號,然後在接收器處將其轉換回電訊號。這一切都不容易實現。然而,隨著人工智慧(AI)半導體市場的興起,對海量資料進行快速處理的需求日益增長,輝達和AMD等全球半導體設計公司都對這項技術趨之若鶩。僅僅掌握這項技術就能同時解決銅線傳輸速度慢、發熱大、功耗高等諸多侷限。矽光子技術最早將於明年應用於AI伺服器晶片。這也為代工行業開闢了新的市場,代工企業負責實現這些公司委託的設計方案。矽光子學將半導體的主要材料矽與光子學(即光學)相結合。矽具有高折射率,這意味著它可以捕獲光。通過建立超細光通道,矽光子學可以防止光逸出,從而實現精確的資料傳輸。與銅線不同,矽光子學利用光進行無電阻資料傳輸,因此速度更快、效率更高。資料傳輸單元的容量將從現有的千兆字節 (GB) 提升到太字節 (TB),速度提升超過 1000 倍。這需要大量的新技術。為了有效地將攜帶資料的光載入到波導上,必須在晶片和光之間的邊界處放置高性能透鏡。此外,還需要一種稱為“諧振器”的器件,它將進入晶片的光轉換為 0 或 1 的數字訊號。一旦通過諧振器區分了光訊號,就必須將其轉換回電訊號並傳輸到外部。這代表了利用光的“尖端微技術集合”。英特爾是首家將矽光子技術商業化的公司。2016年,它成功地將矽光子技術應用於“收發器”中,這種裝置允許遠端伺服器通過光進行通訊。然而,由於市場需求低,這項技術並未引起太多關注。人工智慧的蓬勃發展使矽光子技術重獲新生。這是因為它是唯一能夠解決人工智慧半導體三大難題——速度慢、發熱量大和功耗高——的技術。實現最新的人工智慧模型需要數千億個數值(參數),但傳統的銅線布線會造成嚴重的瓶頸,就像道路上的交通堵塞一樣。雖然高頻寬記憶體(HBM)顯著增加了傳輸通道的數量以緩解這一瓶頸,但矽光子技術就像在這條路上鋪設了一列高鐵。隨著近年來尖端封裝技術(一種允許多個晶片像單個晶片一樣運行的技術)的飛速發展,矽光子器件的設計也發生了改變。收發器,這種原本安裝在伺服器外部的光傳輸處理器件,現在被放置在半導體基板上。這項技術被稱為“共封裝光學器件(CPO)”。CPO技術的引入,省去了連接進入伺服器的光和計算晶片的銅線,並縮短了光與晶片之間的距離。台積電宣佈,“這項技術明年實現商業化後,資料傳輸速度將比傳統方法提高十倍,功耗將降低一半。”這項技術尚未成熟。CPO比收發器更難製造。首要難題在於光對溫度的敏感性。一旦出現問題,價值數千萬韓元的整個AI半導體晶片就必須更換。這凸顯了合理設計的重要性。台積電是CPO市場的領導者。這得益於其最大的客戶之一NVIDIA積極開發矽光子技術。在3月份的開發者大會“GTC 2025”上,NVIDIA首席執行官黃仁勳介紹了一款採用矽光子技術的交換晶片,並表示:“它將顯著降低資料中心公司的成本,因為它省去了收發器的成本並降低了電力消耗。”為了進一步提升其技術實力,台積電正與矽谷的獨角獸企業(估值超過10億美元的初創公司)合作,例如Ayar Labs、Celestial AI和Lightmatter。三星電子也在全力以赴。該公司正調動其遍佈韓國、新加坡、印度、美國和日本的全球研發網路,致力於矽光子技術的研發。三星近期將負責矽光子技術研發的高級主管李康浩晉陞為副總裁,並聘請了英特爾前首席產品官研究員朴賢大。半導體行業正密切關注三星位於新加坡的研發子公司。新加坡擁有新加坡科技研究局(A*STAR)等政府資助的研究機構以及晶圓代工企業Compoundtech,被譽為矽光子技術強國。為韓國提供HBM封裝裝置的裝置公司ASMPT的總部也設在新加坡。三星正在擴大其在新加坡的研發規模,並從台積電(TSMC)挖角工程師。與此同時,三星還與人工智慧半導體設計公司博通(Broadcom)合作,共同推進矽光子技術的商業化。三星認為,矽光子技術是贏得更多大型晶圓代工客戶的關鍵。這是因為這可能是一張反擊王牌,能夠扭轉三星目前在2.5D和3D等尖端封裝市場落後於台積電的局面。業內人士預計,鑑於矽光子技術的市場潛力,三星已將其定位為“代工市場的HBM”。一位半導體行業內部人士解釋說:“由於三星電子宣佈CPO的商業化日期為2027年,與台積電的真正競爭將從那時開始。”他還表示,“代工市場的核心戰場很可能從2030年開始,屆時矽光子技術將應用於單個晶片。” (半導體行業觀察)