近年來,生成式人工智慧的迅猛發展導致全球範圍內超大規模人工智慧叢集的部署速度空前加快。隨著摩爾定律的放緩,只有通過平行計算才能實現更高的性能,因此,資料處理和/或傳輸性能的提升必然導致能耗的增加。也就是說,人工智慧基礎設施的快速增長帶來了嚴重的能源危機。如圖 1 所示,隨著資料量的指數級增長,所需的能源供應量也將呈指數級增長。從這個意義上講,解決這一能源問題的唯一有效途徑是開發一種能夠將能源增長與資料增長分離的技術。光子學具有巨大的潛力,因為光波的傳播和干涉無需消耗能量,因此可以通過工程設計來實現可擴展的功能,而無需增加能耗。矽光子學在過去二十年中得到了廣泛的發展,如今已完全具備提供近乎理想的平台的能力,從而釋放其巨大的潛力。事實上,矽光子學能夠提供高效的高密度互連,實現高頻寬和長距離鏈路;能夠實現低能耗的光路切換,且不受訊號頻寬的限制;以及能夠進行光速計算的光子神經網路,從而加速人工智慧計算。在本文中,我們將回顧這些光子技術的發展趨勢和進展,我們將論證,為了使這些光子技術成為人工智慧時代可持續基礎設施的重要組成部分,硬體和軟體以及電子和光子學需要以互補的方式進行開發。光收發器和交換機A. 能耗擴展圖 2 繪製了光收發器和超大規模資料中心常用的電交換機專用積體電路 (ASIC) 的能效(單位為 pJ/bit)隨時間的變化曲線。通過與光收發器的趨勢進行比較,發現交換機 ASIC 的可擴展性不如光收發器,這表明瓶頸在於交換機而非收發器。令人驚訝的是,光收發器的能效已經趕上了摩爾定律的步伐,基於矽光子學的近封裝/共封裝光學器件的能效已經超過了 5 pJ/bit,而交換機 ASIC 的能效提升卻明顯緩慢。事實上,ASIC交換機的功耗會隨著吞吐量的增加而增加,在100Tbps吞吐量下,每個晶片的功耗會超過1000W;而光交換機的功耗則極低且在吞吐量增加的情況下保持穩定(圖3)。因此,使用光交換機替代電交換機越多,系統效率就越高。以下將討論一些實際問題。B. 光交換機的系統應用案例光交換機的一個關鍵缺點是無法進行封包處理,而封包處理正是ASIC交換機的核心功能。光交換機僅作為“光路交換機(OCS:optical circuit switches)”運行,因此不能簡單地替代ASIC交換機。為了控制OCS,需要一個控制平面,而編排器或作業系統需要瞭解OCS的狀態,並根據系統需求,通過控制平面傳送相應的命令來控制光交換機。這種系統與依賴專用積體電路交換機 (ASIC) 的傳統分組系統截然不同,因此,使用光通訊系統 (OCS) 需要從零開始重建整個系統,並對架構進行全面最佳化。顯然,目前世界上除了Google之外,沒有其他公司能夠做到這一點。在Google宣佈已在其資料中心和人工智慧基礎設施中大規模使用 OCS 之後,光交換機開始得到廣泛發展。早在Google推出 OCS 系統之前,日本產業技術綜合研究所 (AIST) 就已經開始研發大規模矽光子交換機。圖 4 展示了 AIST 開發的矽光子交換機刀片。該交換機提供 32 x 32 個嚴格無阻塞連接,並帶有數字控制介面,通過配置 9 級 Clos 網路,可擴展至 131,072 x 131,072 個連接。實驗證明,在可組合的解耦基礎設施中,這些交換機可以將網路功耗降低 75%。用於製造這些大規模矽光子開關的製造裝置是日本產業技術綜合研究所(AIST)基於標準CMOS技術的內部試驗生產線,該技術採用45奈米工藝規則,實現了足夠高的均勻性和良率,可以大規模生產包含數千個器件(例如馬赫-曾德爾干涉儀(MZI: Mach-Zehnder interferometers))的大規模光子積體電路。光子神經網路基於標準CMOS製造技術的矽光子器件具有高均勻性和高良率,這對於實現光子神經網路(PNN:photonic neural networks )至關重要。在PNN中,整合了大量的馬赫-曾德爾干涉儀(MZI),形成網狀拓撲結構,並在光域中執行矩陣-向量乘法(MVM:matrix-vector multiplications)。PNN上的MVM過程本身速度極快,且不消耗能量,可以顯著提升人工智慧(AI)的計算能力。因此,人們期望PNN能夠分擔GPU等高能耗數字處理器的計算任務。然而,PNN缺乏良好的非線性啟動函數,而非線性啟動函數是AI計算中另一個重要的功能。為瞭解決這個問題,我們提出利用電光(EO:electro-optic)非線性效應,僅通過傳播即可完成AI計算過程,而無需中間階段的數字處理。利用馬赫-曾德爾干涉儀(MZI)器件可以輕鬆實現這一點,該器件以電訊號作為輸入,以調製後的光訊號作為輸出。電光非線性具有正弦傳遞函數,這與傳統的啟動函數(例如 ReLU、Sigmoid 和雙曲正切函數)截然不同。因此,需要尋找適用於機率神經網路(PNN)的全新人工智慧模型。A. 基於光電非線性的機率神經網路目前,我們已提出並演示了幾個基於光電非線性的AI模型,如下所示:第一個模型包含一個從輸入參數空間到更高維空間的非線性投影對應。通過調整馬赫-曾德爾干涉儀(MZI)的工作點來訓練其光電傳遞函數。轉換後的光學復空間中的非線性對應資料可以通過尋找超平面進行分離,類似於支援向量機。圖5(a)和5(b)分別展示了我們開發的矽光子晶片和實驗裝置。我們使用BFO(bacteria foraging optimization)和前向差分兩種演算法在晶片上進行了訓練,並在圖5(c)中展示了它們對多個布林邏輯進行分類的有效性,並在圖5(d)中展示了它們對鳶尾花資料集的高精度分類。該PNN僅通過無源光子電路中訊號的物理傳播即可完成計算,從而保證了低功耗和低延遲計算。我們在此討論的第二個模型是上述模型的級聯版本,即“垂直分層光電機率神經網路”(,如圖 6 所示)。在該模型中,所有光路的長度不會隨著層數的增加而增加,從而能夠實現更深度學習模型。圖 7 顯示了 MNIST、Fashion 和 KMNIST 資料集的測試精準率。三層模型的精準率優於兩層模型。我們在此介紹的最後一個(但同樣重要)模型是光電霍普菲爾德網路。圖 8(a) 顯示了我們提出的架構,其中馬赫-曾德爾干涉儀 (MZI) 作為非線性神經元,將輸入資料和反饋訊號編碼到輸入的單頻連續波 (CW) 光(記為 λ)上。圖 8(b) 顯示,經過訓練後,即使對於半損壞的輸入模式,也能回憶起儲存的模式,這表明了霍普菲爾德網路特有的聯想記憶效應。B. 流式 PNN 的通用方案由於運行 PNN 需要不可忽略的開銷,因此必須對整個系統進行徹底評估和整體最佳化。另一方面,PNN 的固有優勢是低延遲、高速度、低能耗等。為了充分發揮這些優勢,PNN 作為流式處理器,同時具備電域和光域 I/O 時,運行效果最佳。流式 PNN 的概念如圖 9 所示。通過該方案,PNN 可以同時在電域和光域中流式處理資料,從而無縫整合到數字基礎設施中。結論矽光子技術取得了顯著進步,如今在諸多方面展現出巨大的潛力,能夠從高密度I/O、頻寬無關的電路開關以及光速AI加速器等多個方面提升人工智慧基礎設施的可持續性。然而,將光子功能器件(例如OCS和PNN)引入傳統數字基礎設施並非易事,因此,未來需要對整體系統設計和實現進行更深入的研究。 (半導體行業觀察)