#積體電路
2025先進封裝與測試行業發展現狀與未來
引言當晶片製程的微縮逼近物理與經濟的雙重極限,積體電路產業的發展動能,正前所未有地從電晶體尺度的縮小,轉向系統級整合與架構的創新。在這一被稱為“後摩爾時代”的產業變局中,先進封裝與測試(簡稱“先進封測”) 已從配套輔助環節,躍升為提升晶片性能、最佳化系統功耗、控制整體成本的關鍵支點。本文旨在深入剖析全球及中國先進封測行業的發展現狀、技術脈絡、市場格局與驅動因素,並前瞻性地展望在人工智慧、高性能計算等需求的強勁牽引下,該領域所孕育的未來機遇與發展趨勢。一、積體電路先進封測概況1、積體電路製造概況積體電路製造產業鏈主要包括晶片設計、晶圓製造、封裝測試三個環節,具體如下:封裝測試包含封裝和測試兩個環節,其中,封裝是指將積體電路與引腳相連接以達到連接電訊號的目的,並使用塑料、金屬、陶瓷、玻璃等材料製作外殼保護積體電路免受外部環境的損傷;測試包括進入封裝前的晶圓測試(CP)和封裝完成後的成品測試(FT),晶圓測試主要檢驗每個晶粒的電性能,成品測試主要檢驗產品的電性能和功能,目的是將有結構缺陷以及功能、性能不符合要求的晶片篩選出來。2、積體電路製造產業的發展歷程3、先進封裝概況先進封裝是現代積體電路製造技術的關鍵環節,即採用先進的設計思路和先進的整合工藝對晶片進行封裝級重構,並能夠有效提高功能密度的封裝方式。在業內,先進封裝和傳統封裝主要以是否採用引線銲接來區分,傳統封裝通常採用引線鍵合的方式實現電氣連接,先進封裝通常採用凸塊(Bump)等鍵合方式實現電氣連接。從封裝效果來看,傳統封裝更加關注物理連接層面的最佳化,本身對晶片的功能不會產生實質變化,主要起到保護、巢狀、連接的作用;先進封裝更加關注電路系統層面的最佳化,除常規的保護、巢狀、連接外,還可起到縮短互聯長度、提高互聯性能、提升功能密度、實現系統重構等作用。二、積體電路封測行業發展情況1、全球積體電路封測行業發展情況積體電路產業早期從歐美地區發展,隨著產業的技術進步和資源要素的全球配置,封裝測試環節的產能已逐步由歐美地區轉至台灣、中國大陸、新加坡、馬來西亞等亞洲新興市場地區,目前全球積體電路封測行業已形成了台灣、中國大陸、美國三足鼎立的局面。根據Gartner的統計,2024年全球前十大封測企業中,前三大企業的市場份額合計佔比約為50%。中國大陸和台灣的企業在積體電路封測行業佔據優勢地位,2024年全球前十大封測企業中,中國大陸和台灣分別有4家和3家企業。從市場規模看,全球積體電路封測行業的市場規模從2019年的554.6億美元增長至2024年的1,014.7億美元,複合增長率為12.8%。2023年,受智慧型手機、消費電子需求疲軟、客戶庫存調整、經濟不確定性等因素的影響,全球積體電路封測市場總體處於下行周期,市場規模較2022年同比出現下降。2024年,隨著智慧型手機、消費電子需求的逐步回暖以及庫存水平的逐步調整,且高性能運算需求持續旺盛,全球積體電路封測行業市場規模同比恢復增長。未來,從供給端看,全球晶圓製造產能持續擴充,為封測行業的發展提供了重要基礎;從需求端看,數字經濟帶來人工智慧、資料中心、雲端運算、物聯網、虛擬/增強現實等新興應用場景,也為封測行業的發展提供了多元化動力。預計全球積體電路封測行業市場規模將在2029年達到1,349.0億美元,2024年至2029年複合增長率為5.9%。同時,先進封裝作為後摩爾時代的重要選擇,是全球積體電路封測行業未來持續發展的驅動因素,預計2024年至2029年,全球先進封裝市場將保持10.6%的複合增長率,高於傳統封裝市場2.1%的複合增長率,2029年全球先進封裝佔封測市場的比重將達到50.0%。2、中國大陸積體電路封測行業發展情況中國大陸積體電路封測行業主要有長電科技、通富微電、華天科技三家大型封測企業,其封裝形式佈局完善,業務規模較高。除上述大型封測企業外,憑藉在某些細分領域積累的技術,中國大陸湧現出較多專注於特定領域或特定工序的新興封測企業,但其業務規模與大型封測企業相比仍較小。2024年,除上述三家大型封測企業的營收規模超過100億元外,中國大陸其他封測企業的營收規模均在50億元以內。從市場規模看,受益於產業政策的大力支援以及下游應用領域的需求帶動,中國大陸封測市場跟隨積體電路產業實現了總體發展,市場規模由2019年的2,349.8億元增長至2024年的3,319.0億元,複合增長率為7.2%。但是,從業務結構看,中國大陸封測市場仍主要以傳統封裝為主,2024年中國大陸先進封裝佔封測市場的比重只有約15.5%。未來,隨著全球積體電路產業重心逐步轉移至中國大陸,中國大陸封測行業將保持增長態勢。預計中國大陸積體電路封測行業市場規模將在2029年達到4,389.8億元,2024年至2029年複合增長率為5.8%。同時,隨著領先企業在先進封裝領域的持續投入,以及下游應用對先進封裝需求的增長,預計2024年至2029年,中國大陸先進封裝市場將保持14.4%的複合增長率,高於傳統封裝市場3.8%的複合增長率,2029年中國大陸先進封裝佔封測市場的比重將達到22.9%。三、先進封裝行業發展情況1、全球先進封裝行業發展情況全球先進封裝行業的主要參與者包括具有晶圓製造背景的企業和封測背景的企業,其在先進封裝領域的佈局和主要特點具體如下:近年來,智慧型手機等移動終端向小型化、整合化、高性能方向更新迭代,帶動單機晶片數量和晶片性能要求的提升,是全球先進封裝行業發展的最重要驅動因素之一。未來,全球先進封裝行業的主要增長點將由智慧型手機等移動終端向人工智慧、資料中心、雲端運算、自動駕駛等高性能運算轉變。FC可以允許晶片有更高的I/O密度、更優良的熱傳導性,符合移動終端的應用需求,在移動終端的發展及迭代過程中充分受益。全球FC的市場規模由2019年的187.5億美元增長至2024年的269.7億美元,複合增長率為7.5%,是市場規模最大的先進封裝技術。未來,隨著先進封裝行業主要增長點的轉變,全球FC市場規模的整體增長率將有所下降,但人工智慧、資料中心、雲端運算、自動駕駛等高性能運算將使用到FCBGA等封裝形式支援更大尺寸、更高性能的晶片,保證了FC市場的持續增長。預計全球FC的市場規模將在2029年達到340.7億美元,2024年至2029年複合增長率為4.8%。WLCSP可以實現與裸晶片尺寸相同的最小封裝體積,並具備一定的成本優勢,FO可以實現高I/O密度晶片的低成本封裝,均能夠較好地契合移動終端對小型化、高性能、低成本的需求。因此,WLP的市場需求持續增長,全球市場規模由2019年的40.5億美元增長至2024年的56.1億美元,複合增長率為6.7%。未來,WLCSP的成本優勢會隨著晶圓尺寸的增大和晶片尺寸的減小而更加明顯,FO也會由於晶片性能要求的提升而被更多採用,保證了WLP市場的持續穩定增長。預計全球WLP的市場規模將在2029年達到75.5億美元,2024年至2029年複合增長率為6.1%。芯粒多晶片整合封裝是先進封裝行業主要增長點轉變的最充分受益者。全球芯粒多晶片整合封裝的市場規模由2019年的24.9億美元增長至2024年的81.8億美元,複合增長率為26.9%,是增長最快的先進封裝技術。未來,受益於人工智慧、資料中心、雲端運算、自動駕駛等高性能運算的快速發展,以及高端消費電子的持續進步,芯粒多晶片整合封裝的市場規模仍將保持高速增長的態勢,預計將在2029年達到258.2億美元,2024年至2029年複合增長率為25.8%,高於FC、WLP等相對成熟的先進封裝技術。2、中國大陸先進封裝行業發展情況與全球市場相比,中國大陸先進封裝市場起步較晚,但是近年來呈現快速追趕的態勢。從市場格局看,與全球市場相同,FC是中國大陸市場規模最大的先進封裝技術,芯粒多晶片整合封裝是增長最快的先進封裝技術;從變動趨勢看,中國大陸先進封裝市場規模的增長態勢與全球市場相似,但是,一方面,中國大陸擁有全球最大且增速最快的積體電路消費市場,另一方面,在境外供應受限的情況下,中國大陸需要通過芯粒多晶片整合封裝技術方案持續發展高算力晶片,因此,中國大陸先進封裝市場規模的複合增長率高於全球先進封裝市場的總體水平,尤其是芯粒多晶片整合封裝等前沿封裝技術的市場規模將呈現高速增長的態勢。四、先進封裝主要下遊行業發展情況積體電路是資訊產業的基礎,涉及家用電器、消費電子、移動通訊、網路通訊、高性能運算、工業、汽車、醫療、航空航天等各類電子裝置領域,先進封裝技術在上述領域也得到廣泛的應用。其中,智慧型手機等移動終端和人工智慧、資料中心、雲端運算、自動駕駛等高性能運算是先進封裝最具代表性的下遊行業,也是先進封裝市場近年來增長及未來可持續發展的重要驅動因素,具體如下:1、高性能運算近年來,人工智慧、資料中心、自動駕駛等高性能運算產業在全球範圍內迎來歷史性的爆發式增長機遇,並正逐步成為先進封裝行業的關鍵增長點和盈利點。從算力規模看,全球算力規模從2019年的309.0EFlops增長至2024年的2,207.0EFlops,複合增長率為48.2%,預計全球算力規模將在2029年達到14,130.0EFlops,2024年至2029年複合增長率為45.0%。以輝達為例,其來自資料中心的營業收入由2020財年的30億美元快速增長至2025財年的1,152億美元,複合增長率高達108%。中國高度重視算力資源的投資和算力基礎設施的建設。根據浪潮資訊、清華大學全球產業研究院等發佈的全球計算力指數評估報告,中國算力指數長期位居全球第二,僅次於美國,尤其在計算能力和基礎設施方面具備顯著優勢。從算力規模看,中國大陸算力規模從2019年的90.0EFlops增長至2024年的725.3EFlops,複合增長率為51.8%。預計中國大陸算力產業將步入到高品質發展的新階段,算力規模將在2029年達到5,457.4EFlops,2024年至2029年複合增長率為49.7%。算力通常分為通用算力(基礎算力)、智能算力和超算算力。過去,CPU、GPU、AI晶片、FPGA等高算力晶片的性能提升主要依靠晶圓製造技術的進步,但是,隨著摩爾定律逼近極限,通過製程推進持續提升晶片性能的難度快速增加。從價值量上看,芯粒多晶片整合封裝及配套的測試環節也已進入高算力晶片製造產業的價值鏈高端,一定程度上重構了積體電路製造產業鏈的價值分佈。根據Morgan Stanley發佈的報告3,目前最主流的高算力晶片的成本結構中,CoWoS及配套測試環節的合計價值量已經接近先進製程晶片製造環節,具體如下:對於中國大陸,近年來境外出口管制日益聚焦於人工智慧等高性能運算產業,且管制的深度和廣度均逐步提升,現階段已經形成對中國人工智慧等高性能運算產業“斷供”“斷鏈”的嚴峻局面,具體如下:目前,業界已經認識到中國實現人工智慧等高性能運算產業鏈的自主可控具有緊迫性,國內多家高算力晶片設計企業快速成長。由於摩爾定律逼近極限,中國晶圓製造環節的技術進步也面臨上游產業的限制,因此,國內高算力晶片設計企業正在逐步探索使用芯粒多晶片整合封裝技術方案提升自身產品的性能,並均已推出相關的高算力晶片產品。此外,為保障供應鏈的安全和穩定,中國高算力晶片設計企業也會更多地傾向於使用本土供應商的製造產能。2、智慧型手機近年來,隨著智慧型手機功能的豐富、性能的提升,以及通訊制式的迭代,單台智慧型手機需要搭載更多數量和更多種類的晶片,各類晶片使用的主要封裝技術也出現更新和發展,是先進封裝行業的重要增長點。以智慧型手機必需的應用處理器、電源管理晶片、射頻晶片和儲存晶片為例,具體如下:從出貨量看,雖然受公共衛生事件、政治經濟不確定性和消費者需求下降等因素影響,2019年至2023年全球智慧型手機出貨量總體呈現下降趨勢,但是,對於單價大於600美元的高端智慧型手機,其出貨量總體呈現穩定增長的態勢。高端智慧型手機的功能更豐富、性能更優異、通訊制式更全面,需要搭載更多使用到先進封裝技術的晶片。此後,隨著廠商庫存的正常化,以及摺疊屏手機、AI手機的加速滲透,全球智慧型手機出貨量自2024年開始復甦並預計將保持增長態勢。對於高端智慧型手機,預計其出貨量將保持穩定增長。與全球市場相同,2019年至2023年中國大陸智慧型手機出貨量總體呈現下降趨勢,此後,中國大陸智慧型手機出貨量自2024年開始復甦並預計將保持增長態勢。中國大陸高端智慧型手機出貨量除2022年出現下降外,其餘年度均總體呈現穩定增長的趨勢。特別地,支援各種人工智慧大模型的AI手機和AIPC實現了高性能運算與移動終端兩大先進封裝重要下遊行業的融合,滲透率有望實現快速提升,根據台積電的預計,全球AI手機和AIPC的滲透率將於2027年均超過50%,具體如下:五、積體電路先進封測行業發展趨勢1、國產替代加速推進國內積體電路產業自給率低,進口額連續十年居首,國產替代空間巨大。受外部限制影響,產業自主可控需求迫切,推動包括先進封測在內的全產業鏈國產化處理程序加快。2、芯粒多晶片整合封裝成為關鍵增長點數字經濟發展推動高算力晶片需求增長,芯粒多晶片整合封裝(如2.5D/3D IC)成為突破摩爾定律限制的主流方案。國內企業積極採用該技術,以應對製造環節限制並把握市場機遇。3、先進封裝成為後摩爾時代主流隨著製程推進面臨瓶頸,先進封裝成為提升晶片性能與整合度的關鍵。預計全球及中國大陸先進封裝市場佔比將持續提升,分別於2029年達到50%和22.9%。4、先進封裝價值量持續提升先進封裝價值顯著高於傳統封裝,隨著應用市場向AI、資料中心、自動駕駛等高算力領域轉移,高端封裝技術需求增長,推動產業鏈價值分佈重構。5、產業鏈協同與一站式服務能力日益重要芯粒整合封裝要求晶片設計、製造與封測緊密協作,跨環節溝通與一站式服務能力成為保障產品性能與良率的關鍵,具備晶圓製造背景的封測企業更具競爭優勢。六、結尾綜上所述,先進封測行業正處在一個技術與市場雙輪驅動的黃金發展期。從現狀看,芯粒(Chiplet)整合、2.5D/3D封裝等高階技術已成為突破算力瓶頸的主流方案,推動全球市場格局加速演變,並重構著產業鏈的價值分配。展望未來,兩條主線將愈發清晰:一是技術本身的持續深化,從互連密度、散熱能力到異質整合效率,創新競賽遠未結束;二是產業鏈協同的深度整合,設計、製造與封測的界限趨於模糊,打造一站式解決方案的能力將成為企業的核心壁壘。機遇與挑戰並存。對於中國產業而言,這既是緊跟全球技術浪潮、切入高價值環節的戰略機遇,也是建構自主可控算力體系的嚴峻考驗。可以肯定的是,先進封測的技術革新之路將繼續延伸,成為支撐數字經濟邁向下一階段的堅實基石。 (材料匯)
上海vs香港:中國最發達的城市在那?
上海GDP突破5兆的那天,朋友圈被刷屏了,各種標題看得人熱血沸騰。作為一個在上海生活了二十多年的人,當然為這座城市驕傲。打開香港那邊的新聞,看到的是另一組數字:2024年香港GDP約2.9兆人民幣,增速2.5%。如果只看GDP,上海完勝。但事情真有這麼簡單嗎?01、 深港vs上海前幾天看到一個討論:如果深圳和香港合併,能不能比得上上海“中國第一城”的位置?我們來看一組資料。2024年,深圳GDP是3.68兆,香港是2.9兆,加起來是6.58兆——比上海的5.39兆多了1.2兆。但深港兩地的面積加起來只有3100平方公里,不到上海6340平方公里的一半。換句話說,同樣超過上海的經濟體量,深港只用了上海一半的土地。這3100平方公里,可能是中國單位面積產出最高的地方。當然,深港合併只是假設。但這個假設背後,有個值得思考的問題——上海和香港,到底各自強在那?02、 上海強在“大而全”上海的厲害,在於它的體系和規模。2024年,上海三大先導產業——積體電路、生物醫藥、人工智慧——規模達到1.8兆元,佔GDP的三分之一。上海港集裝箱吞吐量5150萬標箱,連續15年全球第一。金融機構1771家,資管規模超過35兆。這些數字背後是什麼?是完整的產業鏈,是成熟的金融體系,是對整個長三角的輻射能力。上海是中國經濟的壓艙石,是真正意義上的“經濟首都”。但上海也有短板。在最新的全球金融中心指數(GFCI 36)中,上海排名第8,而香港是第3。在營商環境、資本自由流動、國際化程度這些"軟指標"上,上海和香港之間還有明顯差距。03、 香港強在“小而精”香港只有1113平方公里,比上海小了五倍多,但它在全球金融中心的排名,常年穩居前三。這不是靠規模堆出來的,而是靠規則。香港稅率香港個人所得稅最高17%,內地最高是45%。這不是一個小數字——同樣年薪百萬,在香港和在內地到手的差距可能有幾十萬。更重要的是,香港沒有外匯管制,資金進出完全自由。對於需要做跨境資產配置的人來說,這一點幾乎是決定性的。還有法律體系。香港實行普通法,稅收是屬地原則——簡單說,在香港以外賺的錢,不在香港交稅。在全球稅務資訊交換越來越嚴的今天,這套規則對高淨值人群有獨特的吸引力。這也是為什麼,即使香港GDP只有上海的一半多,每年仍有大量內地資金流向香港。2024年,內地訪客赴港投保628億港元,儲蓄型保險佔比超過60%。04、 你的人生需要那種模式?聊了這麼多資料,其實最核心的問題只有一個:你的生活和事業,更需要那種城市模式?如果你追求穩定、體系、規模效應,上海是更好的選擇。這裡有完整的產業鏈、成熟的市場、龐大的消費人群。對大多數人來說,上海足夠了。但如果你的資產規模到了一定程度,開始考慮多地配置、稅務規劃、財富傳承——香港的價值就體現出來了。這兩座城市不是“誰更好”的關係,而是“各有所長”。在成本低的地方消費,在回報高的地方投資。上海和香港,某種程度上就是這兩種選擇的代表。我自己這些年在滬港兩邊跑,見過太多在兩座城市之間糾結的朋友。有人把所有資產都放在上海,也有人把家安在香港——沒有標準答案,只有適不適合自己。 (滬港紀老闆)
北大團隊首創技術“看清”光刻膠真面目
光刻技術是支撐積體電路晶片工藝不斷微縮的關鍵技術基礎,近日,北京大學化學與分子工程學院彭海琳教授團隊及其合作者在《自然-通訊》上披露了他們的新發現。該團隊通過創新應用冷凍電子斷層掃描(cryo-ET)技術,團隊首次解析光刻膠在液態環境中的微觀三維結構及動態行為,為晶片製程微縮化與良率提升提供全新解決方案。相關成果發表於《自然-通訊》(Nature Communications)。論文連結: https://www.nature.com/articles/s41467-025-63689-4彭海琳表示,光刻是晶片製造中關鍵的步驟之一,通俗理解,光刻就是給半導體晶圓(比如矽片)“印電路”,核心是用超精密“投影儀”把設計好的電路圖案,縮小後印在矽片的特殊薄膜上,再通過沖洗定型。光刻是晶片製造的核心技術之一,更是微納加工領域“皇冠上的明珠”。顯影液則在電路圖案形成過程中發揮著重要作用。在光刻膠顯影過程中,光刻膠的曝光區域會選擇性地溶解在顯影液的液膜中。液膜中光刻膠分子的吸附與纏結行為,是影響晶圓表面圖案缺陷形成的關鍵因素,進而可直接影響晶片性能和良率。《自然-通訊》報導的簡介中提到,儘管經過數十年的研究,光刻膠在液膜和介面處的微觀行為仍然難以捉摸,導致工業界對圖案缺陷的控制很大程度上是一個反覆試驗的過程。在這裡,我們利用冷凍電子斷層掃描(cryo-ET)方法揭示了液膜和氣液介面處光刻膠聚合物的奈米結構和動力學。與傳統方法相比,cryo-ET 以顯著提高的解析度重建了光刻膠聚合物的天然態三維結構。Cryo-ET 重建解決了光刻膠聚合物在本體溶液中氣液介面上的空間分佈,揭示了聚合物鏈之間的內聚纏結。通過抑制聚合物纏結並利用光刻膠在氣液介面的吸附,在工業條件下消除了 12 英吋晶圓上的污染,使與晶圓廠相容的光刻圖案缺陷減少率提高了 99% 以上。註:a光刻膠顯影后 12 英吋晶圓的光學圖像。b顯影奈米圖案的 SEM 圖像。c光刻膠(化學放大光刻膠)的水接觸角測量。插圖:光學圖像顯示光刻膠的水接觸角約為 85°。d示意圖顯示光刻膠潤濕性差導致纏結聚合物吸附在圖案表面。e、f光刻膠顯影后12 英吋晶圓的缺陷對應(e),其中每個紅點表示圖案缺陷的發生(f)。g cryo -ET 切片顯示,當將曝光後烘烤溫度(T)從 95°C(左)增加到 105°C(右)時,聚合物纏結受到抑制。h通過抑制氣液介面處的聚合物纏結來去除缺陷的示意圖,防止大尺寸聚合物殘留物的形成和沉積。i消除缺陷的 12 英吋晶圓。j通過抑制氣液介面處的聚合物纏結,顯影圖案的聚合物殘留量降低了 99% 以上。插圖:無缺陷顯影圖案的典型 SEM 圖像。比例尺,80 奈米。冷凍電鏡斷層掃描的三維重構帶來了一系列新發現。論文通訊作者之一、北京大學化學與分子工程學院高毅勤教授表示,以往業界認為溶解後的光刻膠聚合物主要分散在液體內部,可三維圖像顯示它們大多吸附在氣液介面。團隊還首次直接觀察到光刻膠聚合物的“凝聚纏結”,其依靠較弱的力或者疏水相互作用結合。而且,吸附在氣液介面的聚合物更易發生纏結,形成平均尺寸約30奈米的團聚顆粒,這些“團聚顆粒”正是光刻潛在的缺陷根源。“我們由此提出了兩項簡單、高效且與現有半導體產線相容的解決方案。一是抑制纏結,二是介面捕獲。”彭海琳說,實驗表明,兩種策略結合,12英吋晶圓表面的光刻膠殘留物引起的圖案缺陷被成功消除,缺陷數量降幅超過99%,且該方案具備極高的可靠性和重複性。彭海琳表示,研究說明冷凍電子斷層掃描技術為在原子/分子尺度上解析各類液相介面反應提供了強大工具,也有助於闡釋高分子、增材製造和生命科學中廣泛存在的“纏結”現象。“我們的方案能為提升光刻精度與良率開闢新路徑。”彭海琳說。這項由中國科學家主導的重大突破,是基礎科學研究與產業應用需求緊密結合的典範。正如論文作者所言,這項工作為解讀水介面化學反應的結構和動力學鋪平了道路,而該領域的理論制定仍處於早期階段。低溫電子斷層掃描 (cryo-ET) 在解決聚合物科學、增材製造和生命科學中普遍存在的糾纏方面也顯示出巨大的潛力。在半導體工業的應用方面,液膜中的聚合物奈米結構和動力學有望有利於光刻、蝕刻和濕法工藝領域的缺陷控制,而這些領域對於製造下一代電子產品至關重要。 (半導體材料與工藝裝置)
8個月出口9千億!中國晶片逆襲成出口冠軍,超越手機成第一商品
“這是中國首次涉足晶片出口。”在中國海關部門的專門輔導下,他們順利完成了通關流程,實現了寧夏晶片出口的零的突破。這樣從小到大的故事,正是當前中國晶片出口迅猛發展的一個縮影。今年1-8月,中國出口晶片總額達9051.8億元,同比增長23.3%,出口數量達2330億個,增長20.8%。而在上半年,中國晶片出口金額已達6502.6億元,同比增長20.3%。這些數字背後,是中國晶片產業歷經多年積累後,開始在全球市場悄然崛起。八年時間,一個產業可以實現怎樣的跨越?上海臨港的變遷或許是最好的答案。2018年,臨港的積體電路產值僅有1億元,而到2025年,這一數字預計將達到500億元。從2019年之前僅有3家積體電路企業,到如今超過300家,臨港的發展軌跡恰似中國晶片產業的縮影。晶片,這個被稱為“現代工業糧食”的微小元件,早已不僅關乎技術進步,更關乎國家經濟安全。過去多年,中國一直是全球最大的晶片進口國,每年進口的晶片金額高達近4000億美元,佔全球晶片市場的60%以上。但情況正在悄然改變。2024年,晶片首次超過手機,成為中國出口額最高的單一商品。這一變化標誌著中國晶片產業在全球市場上的地位顯著提升。中國晶片出口的蓬勃發展,離不開區域佈局的最佳化和產業鏈的完善。長三角地區已經成為中國半導體產業的重要集聚地。2025年上半年,江蘇以20.7%的佔比領跑全國,上海市以18.8%佔比緊隨其後,浙江省則以14.4%的佔比位居第三。江浙滬三地佔據了全國一半以上的半導體投資金額。以上海為龍頭的長三角半導體產業生態圈已顯現規模效應,以上海、北京為代表的城市通過專項基金和人才政策形成了制度優勢。而像寧夏這樣的西部地區,也正在迎來突破。九天智能科技有限公司的晶片首次出口香港,為當地產業升級和外貿結構最佳化注入新動力。石嘴山海關負責人表示,未來將建立高新技術企業培育庫,推行“智慧海關”建設,將平均通關時間再壓縮30%,同時建構國際合作認證體系,幫助更多寧夏智造產品突破國際技術壁壘。中國晶片走向了何方?資料揭示了一個清晰的圖景:東南亞和南亞已成為中國晶片的主要市場。在東南亞,中國晶片主要用於智能電視、機頂盒、家電控制系統和智能穿戴裝置等場景。這些裝置普及速度快,對中低端晶片的需求穩定。越南市場在2024年為中國晶片貢獻了164.8億美元的訂單,同比增長56%,刷新歷史紀錄。越南沒有本地晶片產業,原材料只能靠外部採購,而中國供貨最快且交期穩定,成為首選。南亞的印度也不例外。2024年,印度對中國晶片的進口額達到74.7億美元,同比增長30.3%,五年內出口額擴大三倍。印度推動“手機製造本地化”政策,但晶片仍需依賴進口。華潤微電子在越南設有封測基地,2024年實現10%的海外收入增長。這樣的本地化營運,進一步推動了中國晶片的出口。中國晶片出口的快速增長,很大程度上得益於在成熟製程方面的競爭優勢。全球大約有七成晶片是28奈米以上的成熟晶片,而這些技術中國已形成自己的完整產業鏈,能夠實現低成本生產。中國晶片的成本比美國晶片低四成,這樣的價格優勢使得中國晶片逐漸滲入美國各個行業當中。甚至美國的福特號航母採用了6500顆中國晶片,F35、V22、伯克級驅逐艦等也採用了中國晶片或中國零件,用於電子裝置和通訊裝置當中。中芯國際28nm產能利用率超90%,帶動汽車電子、工業控制晶片出口增長19%。成熟製程已成為中國半導體出口的“壓艙石”。中國晶片出口的增長,離不開產業鏈各環節的全面突破。在半導體裝置領域,中微公司是典型的成功案例。作為半導體裝置的頭部企業,中微公司目前市值超過1800億人民幣,過去十四年收入年化增速大於35%,部分刻蝕、薄膜裝置進入全球先進水平行列。“我們給早期的投資者帶來了60倍的回報,給中期的投資商帶來了30倍的回報。”中微公司董事長尹志堯在近期的一次會議上透露。在人工智慧晶片領域,中國企業也取得了顯著進展。寒武紀在2025年上半年收入28.81億元,同比增長了43倍,摩爾執行緒在2022年營收只有4608萬元,2024年已經達到4.38億元。碳化矽產業的發展則證明技術變革才是中國企業的機會。特斯拉在Model3批次使用碳化矽替代晶矽IGBT,為碳化矽進入功率半導體打開了大門。全球半導體行業的競爭是一場沒有終點的長跑。據德勤預測,2030年全球半導體產業銷售規模將突破1兆美元。這個數字對於仍在發展中的中國晶片產業來說,是壓力也是動力。十年磨一劍,中國晶片的出海之路才剛剛開始。從進口大國到出口大國,這條轉型之路註定不平坦,但每一步都踏實而堅定。沒有任何一場技術競爭能一蹴而就,中國晶片正在用自己的方式,書寫屬於這個時代的故事。 (小柴侃侃)
不懼美國,這就是底氣!中國實現全球晶片首創!
一、全球首創!中國成功研發!【央視網】10月9日,復旦大學整合晶片與系統全國重點實驗室、積體電路與微納電子創新學院周鵬—劉春森團隊研發出全球首顆二維—矽基混合架構快閃記憶體晶片,解決了儲存速率的技術難題。相關研究成果8日發表於國際學術期刊《自然》。【榮茂觀察】我們現在每個人用的手機、電腦,為什麼有時候會卡?你打開一個大軟體,或者載入一個高畫質遊戲,總要等一下。很多人以為是CPU不夠快,其實大多數時候,是你的硬碟或者記憶體,也就是儲存器,跟不上趟。復旦大學周鵬-劉春森團隊這次搞出來的這顆晶片,就是來解決這個問題的。它到底有多快?根據公佈的資料,它的核心儲存單元擦寫速度達到了驚人的400皮秒。這項技術如果能順利商業化,未來我們的手機、電腦可能會迎來一次體驗上的革命。開機、打開APP、載入遊戲,都可能是瞬間完成。更重要的是,它有望打破記憶體和硬碟之間的界限。我們現在電腦裡,有運行速度快但斷電就丟資料的記憶體,也有速度慢但能長久保存資料的硬碟(SSD)。未來,可能只需要一種儲存器就夠了,它既像記憶體一樣快,又像硬碟一樣能永久儲存,這就是所謂的“通用型儲存器”。這將徹底改變電腦的架構,帶來巨大的效率提升。在過去幾年,全球“晶片戰”打得火熱,中國在半導體領域面臨著巨大的外部壓力。我們一直想在某些領域實現“彎道超車”。但真正的超車,不是在別人已經跑了很久的賽道上跟在後面猛追,而是在旁邊開闢一條全新的、更短的賽道,然後第一個衝過終點。這個二維-矽基混合架構,就是這樣一條新賽道。它巧妙地繞開了我們在某些傳統工藝(比如頂級光刻機)上的短板,利用我們在新材料研究和創新整合工藝上的優勢,形成了一種“非對稱”的競爭力。這項技術也為晶片產業的未來發展指明了一個非常重要的方向:三維堆疊(3D Stacking)。復旦的這個技術,天然就適合搞三維堆疊。因為二維材料本身就極薄,可以很方便地疊在成熟的矽基晶片上,通過微米級的垂直通道連接起來。產業界也普遍認為,這項技術未來在3D應用層面會帶來巨大的市場機會。這尤其對當下最火熱的人工智慧(AI)領域意義非凡。AI大模型訓練和推理,需要吞吐海量的資料。現在的AI晶片,大部分性能都耗費在等待資料從儲存器裡調取過來的路上了。如果能用上這種新型儲存晶片,AI的訓練效率和運行能效都會有質的飛躍。這顆小小的晶片,承載的不僅僅是更快的資料讀寫速度,更是一個龐大產業轉型升級的希望和一種在激烈科技競爭中突出重圍的智慧。二、俄羅斯總統最新發聲,作出重要宣佈!【新浪財經】當地時間10月10日,俄羅斯總統普丁召開新聞發佈會,總結近日他對塔吉克的訪問成果。普丁說,如果美國向烏克蘭提供“戰斧”巡航導彈,俄羅斯將會加強防空系統予以回應。普丁說,俄羅斯已經掌握了一種新型武器,將會在近期向外界展示,目前這種武器的測試效果良好。【榮茂觀察】這場發佈會,就是對美國這個動作的一次正面硬剛。他的回應分為兩手,一手是“盾”,一手是“劍”,每一手都打得極有章法。我們先來看第一手,也就是“加強防空系統”。這可不是一句空話,背後是俄羅斯幾十年積累的防空家底。目前,俄羅斯已經部署了大量的S-400和更先進的S-500“普羅米修斯”防空系統。特別是S-500,被認為是俄羅斯防空系統的巔峰之作。一套系統據說能同時跟蹤並打擊多達10個目標,性能上被不少分析認為已經超過了美國的“薩德”系統。但“戰斧”巡航導彈最陰險的地方在於它的飛行方式。它會利用地形,進行超低空“貼地飛行”,以此來躲避地面雷達的探測,讓你防不勝防。傳統的防空系統確實很容易在這種情況下出現“漏網之魚”。所以,普丁這次說的“加強”,絕對不是簡單地多部署幾套S-500那麼簡單。軍事圈普遍猜測,這很可能意味著俄羅斯要對S-500系統進行針對性地升級。如果說升級防空系統這張“盾牌”是陽謀,是穩紮穩打的防守,那麼普丁打出的第二張牌——“神秘新武器”,就是典型的“模糊威懾”策略。在10月10日的發佈會上,普丁只說了這款新武器“測試效果良好,近期將會展示”但對它的具體型號、性能、用途一概不提。這種“猶抱琵琶半遮面”的玩法,比直接亮出武器型號要高明得多,因為它把巨大的不確定性和壓力全拋給了美國。普丁這兩張牌一打出來,實際上是把難題又重新拋給了幾天前剛剛作出“模糊決定”的美國總統川普。川普當時之所以話說得那麼含糊,聲稱要“問清楚導彈的用途”就是想在鷹派支持者和避免戰爭失控的選民之間走鋼絲。他想用“戰斧”這張牌來展示對俄強硬,為自己的選情加分,但又害怕真的把普丁惹毛了,導致局勢徹底失控,反而丟掉更多選票。更絕的是,普丁在發佈會上還巧妙地提到了《新削減戰略武器條約》。這句話的潛台詞非常豐富,他等於是在告訴美國:“我們之間本來是有規則的,但如果你要打破規則,那我這個‘近期展示’的新武器,可就不受任何條約的約束了。”這是一種典型的“左手秀肌肉,右手留台階”的外交藝術。他既展示了俄羅斯不惜一戰的決心和實力,又暗示了通過談判解決問題的可能性,把博弈的主動權牢牢地攥在了自己手裡。三、首次亮相!解放軍隱形無人機中隊現身中印邊境【綜合新聞】這幾天,美媒《軍事觀察》:中國人民解放軍空軍已完成其已知首款GJ-11“利劍”無人隱形戰鬥機的部署,該機型現已進駐西藏日喀則空軍基地。這標誌著全球首個無人戰鬥機中隊正式投入實戰部署,是中國國防工業在新型無人機領域快速發展的重大里程碑事件。【榮茂觀察】這次部署到底改變了什麼?首當其衝的,就是對南亞方向的鄰國印度。美國媒體在報導中毫不客氣地用“印軍麻煩大了”、“足以讓其徹夜難眠”這樣的詞句來形容。這並不是危言聳聽。近些年來,印度空軍的日子本就不好過。其引以為傲的、從法國購買的“陣風”戰鬥機,在面對巴基斯坦裝備的中國產殲-10C時吃了大虧,這讓印度空軍在南亞次大陸的傳統空中優勢受到了嚴重挑戰。而在喜馬拉雅的另一邊,面對已經全面在西部戰區部署的殲-20隱形戰鬥機,印度空軍現有的所有戰鬥機在體繫上已經處於代差等級的劣勢。現在,攻擊-11的到來,更是“雪上加霜”。這些攻擊-11就像幽靈一樣,可以悄無聲息地穿透印度現有的防空體系,直接撲向其後方的指揮中心、機場、導彈陣地和後勤樞紐。而一旦它們掛載了空對空導彈,它們甚至可以在殲-20的指揮下,對印度的預警機,比如A-50EI,發起致命的超視距打擊。從全球範圍來看,攻擊-11的實戰化部署,標誌著中國在一個關鍵的未來軍事技術領域,已經走到了世界的最前沿,甚至實現了對美國的“彎道超車”。在飛翼佈局的無人作戰飛機這個賽道上,美國雖然起步很早,先後投入巨資研發X-45和X-47B等項目,但這些項目最終都因為各種原因未能真正走向實戰部署。目前,美國海軍雖然裝備了MQ-25“黃貂魚”無人機,但它本質上是一款不具備作戰能力的空中加油機,屬於輔助裝備。相比之下,中國不僅成功研發出了攻擊-11,而且完成了測試,並最終以中隊的規模進行了實戰部署。從圖紙到現實,從原型機到作戰部隊,中國走完了這完整的最後一步。這說明中國不僅在無人機技術上取得了突破,更在相關的作戰理論、指揮體系和後勤保障上做好了準備。這不再是閱兵式上的一閃而過,而是部署在世界屋脊之上,一支實實在在的、能夠影響地區戰略平衡的空中力量。這起發生在2025年秋天的事件,其深遠之影響,未來幾年我們將會看得越來越清楚。它宣告了一個由人工智慧和無人系統主導的新戰爭時代的來臨,而中國,正以一個領跑者的姿態,站在這場變革的潮頭。 (榮茂觀察)
光子積體電路(PIC)技術介紹,以及相關裝置要求
分享一份報告,源自ficonTEC Service GmbH,這是一家專注於光電子組裝和測試解決方案的公司,報告主要探討了光子學生產規模化所需的技術發展與裝置要求。文件內容涵蓋了光子積體電路(PIC)在多個前沿領域的應用、關鍵組裝步驟的技術挑戰以及對應的先進裝置和自動化解決方案。報告主要結構光子學應用場景光子積體電路(PIC)內部結構及具體應用PIC產品組裝的核心流程與關鍵技術需求量產所需的自動化產線系統和機器學習最佳化方法關鍵資訊摘錄1光子積體電路應用報告展示了光子積體電路在多個高科技領域的具體應用實例和所代表的前沿方向。例如,Intel/Mobileye的固態雷射雷達系統、用於生物感測的MZI結構(LioniX)、以及PsiQuantum提出的基於PIC的大規模量子電腦架構,體現了光子技術的高度整合性和革命性潛力。2高精度晶片貼裝技術PIC規模製造中雷射整合及其精度是核心難題,技術含量高,報告介紹了高精度晶片貼裝的技術細節和 achieved 的精度(例如貼裝精度達到3σ=±0.22μm),並提及了透過矽基板進行紅外對準與局部雷射銲接等先進工藝。3機器學習用於光電產品組裝機器學習在光電產品組裝過程中的應用,包括關鍵性能指標(KPI)跟蹤和人工智慧輔助的工藝最佳化,是行業通過資料驅動和智能演算法進一步提升良率與效率的發展方向,貼合工業4.0趨勢。其他主要頁面展示(銳芯聞)
光晶片,即將起飛!
大型語言模型(LLMs)正在迅速逼近當代計算硬體的極限。例如,據估算,訓練GPT-3大約消耗了1300兆瓦時(MWh)的電力,預測顯示未來模型可能需要城市級(吉瓦級)的電力預算。這種需求促使人們探索超越傳統馮·諾依曼架構的計算範式。本綜述調查了為下一代生成式AI計算最佳化的新興光子硬體。我們討論了整合光子神經網路架構(如馬赫-曾德干涉儀陣列、雷射器、波長復用微環諧振器),這些架構能夠實現超高速矩陣運算。同時,我們也研究了有前景的替代類神經裝置,包括脈衝神經網路電路和混合自旋-光子突觸,它們將儲存與計算融合在一起。本文還綜述了將二維材料(如石墨烯、過渡金屬二硫族化合物,TMDCs)整合進矽基光子平台,用於可調製器和片上突觸元件的研究進展。我們在這種硬體背景下分析了基於Transformer的大型語言模型架構(包括自注意力機制和前饋層),指出了將動態矩陣乘法對應到這些新型硬體上的策略與挑戰。隨後,我們剖析了主流大型語言模型的內部機制,例如chatGPT、DeepSeek和Llama,突出了它們架構上的異同。我們綜合了當前最先進的元件、演算法和整合方法,強調了在將此類系統擴展到百萬級模型時的關鍵進展與未解問題。我們發現,光子計算系統在吞吐量和能效方面有可能超越電子處理器幾個數量級,但在長上下文窗口、長序列處理所需的儲存與大規模資料集的保存方面仍需技術突破。本綜述為AI硬體的發展提供了一條清晰的路線圖,強調了先進光子元件和技術在支援未來LLM中的關鍵作用。引言近年來基於Transformer的大型語言模型(LLMs)的快速發展極大地提高了對計算基礎設施的需求。訓練最先進的AI模型現在需要巨大的計算與能耗資源。例如,GPT-3模型在訓練期間估計消耗了約1300兆瓦時的電力,而行業預測表明,下一代LLM可能需要吉瓦級的電力預算。這一趨勢與大規模GPU叢集的使用同時出現(例如,Meta訓練Llama 4時使用了超過10萬個NVIDIA H100 GPU的叢集)。與此同時,傳統矽基晶片正接近其物理極限(電晶體特徵尺寸已達約3奈米),馮·諾依曼架構也受限於“儲存器–處理器”瓶頸,從而限制了速度與能效。這些因素共同凸顯出LLMs日益增長的計算需求與傳統CMOS電子硬體能力之間的鴻溝。這一挑戰促使人們探索替代計算範式。光子計算利用光來處理資訊,天然具有高頻寬、超強平行性與極低熱耗散等優勢。近期在光子積體電路(PICs)上的進展,使得建構神經網路基本模組成為可能,例如相乾乾涉儀陣列、微環諧振器(MRR)權重陣列,以及用於執行密集矩陣乘法與乘-加操作的波分復用(WDM)方案。這些光子處理器利用WDM實現了極致的平行性與吞吐能力。與此同時,將二維材料(如石墨烯與TMDCs)整合入PIC中,催生了超高速的電吸收調製器與可飽和吸收體,成為片上的“神經元”與“突觸”。作為光學的補充,自旋電子類神經裝置(如磁隧道結和斯格明子通道)提供非易失性突觸儲存和類神經脈衝行為。這些光子與自旋電子類神經元件從物理機制上實現了儲存與處理的合一,為能效最佳化的AI計算開闢新途徑。將基於Transformer的LLM架構對應到這些新型硬體平台上,面臨諸多挑戰。Transformer中的自注意力層涉及動態計算的權重矩陣(query、key和value),這些權重依賴於輸入資料。設計可重構的光子或自旋電路以實現這種資料依賴型操作,正成為活躍研究領域。此外,在光子/自旋子媒介中實現模擬非線性(如GeLU啟動函數)與歸一化仍是重大技術難題。為應對上述問題,研究者提出了許多“硬體感知”的演算法設計策略,如適用於光子計算的訓練方法以及能容忍模擬噪聲和量化誤差的神經網路模型。本綜述餘下部分結構如下:第2節:介紹光子加速器架構,包括相乾乾涉儀網路、微環權重陣列與基於波分復用的矩陣處理器;第3節:探討二維材料在光子晶片上的整合(如石墨烯/TMDC調製器、光子憶阻器);第4節:分析替代類神經裝置,特別是自旋電子在類神經計算中的應用;第5節:總結主流LLM與Transformer架構原理,並探討如何將其對應到光子晶片上,強調在光子與類神經硬體上實現注意力機制與前饋層的策略;第6節:介紹脈衝神經網路的機制與實現演算法;第7節:指出系統層面的關鍵挑戰並展望未來方向。本綜述力圖為下一代AI硬體發展繪製出基於光子與自旋電子技術的完整路線圖。光子神經網路與光子計算的前沿器件光子神經網路(PNN:Photonic neural networks)依託多種光學器件之間的協同作用實現高效計算:微環諧振器利用共振效應進行波長復用與光頻梳生成,為多波長訊號處理奠定基礎 ;馬赫-曾德干涉儀(MZI:Mach-Zehnder interferometer)陣列通過相位調製實現光學矩陣運算,是神經網路中核心線性變換的關鍵元件 ;超構表面通過亞波長結構調控光波的相位與幅度,能在衍射域內執行高度平行的光學計算 ;4f系統通過傅里葉變換在衍射域中實現線性濾波功能;而新型雷射器則通過電光轉換機制實現非線性啟動功能。這些器件整合了光場調控、線性變換與非線性響應能力,建構出高速、低功耗、強平行的全光計算架構。本節將介紹當前光學神經網路實現中常用的器件。微環諧振器微環諧振器(MRRs)(見圖1)的重要性不僅體現在它們在波分復用(WDM)中的作用,還體現在其獨特的濾波特性,例如光頻梳生成。WDM允許不同波長的訊號在同一波導中同時傳播而不會產生干擾:通過設計微環的半徑與折射率以支援特定的共振波長,滿足共振條件的光將耦合進環形腔體中持續振盪,在透射譜上表現為明顯的吸收凹槽。而光頻梳則源於高Q值(低損耗)微腔中的參量振盪:當注入連續波(CW)泵浦雷射後,光子會經歷非線性效應(如Kerr非線性),從而自發地產生等間距的光譜線,形成梳狀頻譜。WDM與頻梳生成的結合,使多波長訊號可通過共享波導進行合成與傳輸,實現波長復用與空間復用的統一。微環的其他特性也得到了利用。例如,利用微環的熱光效應,在微環上加入了具有激射閾值的相變材料,實現了類似神經網路中ReLU函數的非線性效果。圖1:微環諧振器a)通過微環諧振器權重陣列可實現類神經光學神經網路(ONN); b)展示了全光脈衝神經網路的原理與實驗設定;c)開發了一種基於時間-波長復用的光子摺積加速器;d)提出了一種基於微梳與相變材料的片上光計算架構;e)展示了用於情緒識別的微梳摺積ONN晶片設計圖2:馬赫-曾德干涉儀(MZI)a)提出了支援即時線上學習的ONN訓練方法;b)展示了結合MZI與衍射光學元件的整合光子神經網路架構;c)演示了基於MZI陣列的光子神經網路的線上反向傳播訓練方法馬赫-曾德爾干涉儀(Mach-Zehnder Interferometer)MZI 陣列(見圖2)可有效執行光學矩陣-向量乘法(MVM)運算:它由兩個光學耦合器/分束器和兩個調製器(可通過外部電路控制)組成。輸入光通過分束器被分成兩路,調製器調節兩路之間的相位差,最後通過光學耦合器重新組合成干涉光。每個 MZI 對光訊號執行二維酉變換(複數域的正交變換),在數學上等價於一個 2×2 的酉矩陣。當多個 MZI 按特定拓撲結構(如網格)級聯時,它們的整體行為可對應於高維酉矩陣的分解,因為任意 N 維酉矩陣都可以分解為一系列二維酉變換。因此,MZI 陣列可以實現類似於神經網路中權重矩陣的可程式設計酉變換。輸出的光訊號可進一步通過光電手段進行轉換,並與電子器件整合,實現非線性啟動函數,從而完成神經網路的前向傳播。超表面(Metasurface)超表面在神經網路應用中的運行主要依賴於“面”之間的光的衍射與干涉。超表面是一種由亞波長尺度結構單元組成的材料,能夠調製光波的性質,包括相位、幅度、偏振和頻率。這些結構通常具有超薄、輕質和高整合密度(支援大規模平行)的特點,其實現方式多樣,如基於絕緣體上矽(SOI)的設計、復合惠更斯超表面、單層全息感知器等。由於衍射和干涉本質上是線性過程,因此要實現非線性計算需要額外機制,如利用超表面材料的光電效應 。多層衍射架構(見圖3)通過堆疊的二維表面作為高密度排列的神經元層實現。通過控制每個衍射層中空間位置處的相對厚度或材料特性,可調節光的相位和幅度。或者, 在一塊平面表面上製造一維高對比透射陣列超表面(見圖4),例如,在標準 SOI 基底上蝕刻空氣槽(後續可填充二氧化矽),槽的間距(晶格常數)和寬度固定,通過改變槽的長度來控制相位。圖3:二維超表面a) 二維衍射深度神經網路(D2NN)中推理機制的概念圖示。b) 通過衍射光學神經網路(DONN)實現邏輯運算的實驗配置。c) 奈米列印的光學感知器實現晶片級計算。d) 利用數字型超原子陣列的可重構DONN架構。圖4:一維超表面a) 一維DONN在光子機器學習中的實驗驗證。b) 基於模擬的晶片級DONN驗證,支援光速計算。c) 介電超表面實現用於傅里葉變換與空間微分的晶片級波前控制。圖5:4f系統a) 使用4f光學系統的混合光電摺積神經網路(CNN)。b) 完全光學神經網路(ONN)架構,將深度衍射神經網路整合於4f成像系統的傅里葉平面上。4f 系統(見圖5)利用光場訊號(如圖像)通過第一枚透鏡進行傅里葉變換。在透鏡後的傅里葉面上,調製裝置(如相位掩膜、空間光調製器 SLM)對頻譜進行濾波或加權調整。經調製後的頻譜再通過第二枚透鏡進行反傅里葉變換,生成輸出光場。超表面材料可替代傳統透鏡間的調製裝置 。其他類型雷射器雷射器作為一種具有高相乾性、單色性和方向性的獨特光源,也被應用於光神經網路(ONN)(見圖6)。圖6:其他類型的雷射器a) 使用垂直腔面發射雷射器(VCSELs)的全光尖峰神經網路(SNN)理論分析。b) 基於VCSEL的全光SNN進行有監督學習。c) 用於SNN中軟硬協同計算的FP-SA神經元晶片。d) 基於分佈反饋-飽和吸收(DFB-SA)雷射器的光子整合尖峰神經元的實驗演示例如,垂直腔面發射雷射器(VCSEL)在研究中已被理論提出並在實驗中驗證。在 VCSEL 中,電流通過電極注入有源區,電子與空穴在量子阱層中復合,產生光子。這些光子在兩個分佈式布拉格反射鏡(DBR)之間來回反射,多次穿過有源區並被放大。當增益(光放大能力)超過腔體損耗(吸收、散射等)時,達到閾值條件,雷射輸出就會產生。一項研究利用了 VCSEL 陣列的特性:在被主雷射器鎖模時可以保持相同的初始相位。在該研究中,特徵資料被編碼為電訊號來調節一個 VCSEL 的泵浦電壓,從而調節其輸出光的相位;同樣,權重矩陣的每一列也被編碼為電訊號,調節其他 VCSEL 的輸出光相位。利用光束分離器和耦合器,使代表 MNIST 資料的 VCSEL 的輸出光與其他 VCSEL 的輸出光干涉,光電探測器收集光訊號,並將其求和成電訊號,作為下一層 VCSEL 陣列的輸入,實現前向傳播。在最終輸出層,輸出電訊號最強的光電探測器對應於輸出標籤。另一個例子是帶有腔內可飽和吸收體(SA)的分佈反饋雷射器(DFB-SA)。DFB 雷射器的腔體內含有周期性光柵結構,可提供光反饋以實現單波長輸出。可飽和吸收體(SA)區域位於雷射腔高反射端附近。在低泵浦電平下,SA 吸收光子,抑制雷射輸出;在高泵浦電平下,SA 釋放光脈衝(Q開關效應)。因此,當增益電流超過 DFB-SA 的自脈衝閾值時,SA 的周期性吸收調製會產生脈衝輸出,其輸出頻率與泵浦強度呈非線性正相關,可作為脈衝神經網路(SNN)的基本單元。在此結構中,DFB 雷射器也可以被傳統法布裡-珀羅(FP)雷射器取代 。利用二維材料製造整合光子晶片整合光子晶片作為下一代 AI 硬體的關鍵技術之一,正逐步崛起。這類晶片利用光進行計算和通訊,具有高速與高能效的優勢。為了實現這一應用,將二維(2D)材料,主要是石墨烯和過渡金屬二硫族化物(TMDCs),整合到晶片中,能夠顯著提升功能與性能。本節將探討這些材料的特性、整合技術、應用場景以及其在 AI 光子晶片應用中面臨的挑戰。石墨烯和 TMDCs 的關鍵特性石墨烯因其優異的光學與電子性能,在光子學領域引發革命。儘管其厚度僅為一個原子層,卻能在寬光譜範圍內吸收約 2.3% 的入射光,這使其在光學調製與探測方面非常有效。此外,石墨烯超快的載流子遷移率支援高速調製與低功耗運行,這對於能效至上的 AI 硬體至關重要 。同時,石墨烯表現出強烈的非線性光學特性,可用於頻率變換、全光開關及其它高級功能,使其在該領域的重要性進一步提升。另一方面,TMDCs(如 MoS₂ 和 WS₂)以可調帶隙和強激子效應補充了石墨烯的不足。這些材料在單層狀態下具有直接帶隙,增強了光與物質的相互作用,因而特別適用於光電探測器和波導。TMDCs 也展現出強非線性光學響應,能在晶片上實現倍頻和參量放大等高級功能。基於上述材料特性與優勢,石墨烯與 TMDCs 顯然是推動 AI 光子晶片發展的關鍵材料。整合技術將二維材料整合到光子晶片中涉及多種先進封裝工藝,主要包括:轉印法(Transfer Printing):將二維材料的薄層剝離後轉印至矽基底,無需粘合劑,能保持其本征光學性能,並實現對光子結構(如波導、諧振器)的精確定位。混合整合(Hybrid Integration):將石墨烯或 TMDCs 與現有矽光平台結合,增強光-物質相互作用。例如,石墨烯已用於在微環諧振器中實現高速調製器,該混合器件可實現太赫茲等級調製速度,同時保持低功耗 。范德華異質結構(Van der Waals Heterostructures):通過堆疊不同的二維材料,形成具有可調帶隙和各向異性折射率的異質結構。這些結構被視為最佳化波導約束因子的理想方案。近期的研究還表明,採用與 CMOS 工藝相容的技術,可以實現基於石墨烯器件的晶圓級整合。這一突破為大規模生產含二維材料的光子晶片奠定了基礎。圖7:晶體結構a) 石墨烯,b) 過渡金屬二硫化物(TMDC),c) 黑磷,d) 六方氮化硼(h-BN)晶體結構圖。圖8:圖示(左)與光學顯微鏡圖像(右)展示了目前主要的機械方法之一——柔性剝離與轉印法的步驟。步驟如下:a) 將材料沉積在玻璃基底上,b) 小心地將圖案化的聚二甲基矽氧烷(PDMS)印章“上墨”,c) 將“上墨”後的印章接觸加熱的矽/二氧化矽(Si/SiO₂)基底,d) 撕開印章,留下沉積材料。圖9:不使用腐蝕劑建構范德華異質結構的水浸法流程示意圖。光子晶片中的應用整合石墨烯和過渡金屬二硫化物(TMDCs)的光子晶片在人工智慧工作負載中展現出變革性的應用:一、光調製器基於石墨烯的調製器已展示出卓越的速度和頻寬性能——通過將石墨烯與矽波導整合,研究人員實現了能夠在超過100 GHz頻率下運行的調製器。這些調製器特別適用於人工智慧系統中所需的高速資料傳輸應用場景。二、光電探測器石墨烯在光電探測器中的應用頗為令人驚訝,由於其頻率無關的吸收特性以及在與強吸光材料結合使用時所展現的極高載流子遷移率,使得其性能優於傳統材料 [graphenea]。研究在使用混合石墨烯-量子點光電探測器方向取得進展,這類探測器被作為寬頻圖像感測器整合到CMOS相機中,以實現高響應率 [graphenea]。總體而言,二維材料在波導整合光電探測器方面具有多項優勢,包括尺寸最小化、訊號雜訊比提升以及在寬頻寬和高量子應用中的效率提高。TMDCs被用於製造在可見光和紅外波段均具有高響應率的光電探測器,利用其物理特性提升探測性能。這類探測器使AI驅動的邊緣裝置能夠高效獲取資料 [26]。混合石墨烯-量子點光電探測器也在研究中,旨在在保持CMOS相容性的前提下進一步增強寬頻探測能力 [26]。三、波導范德瓦爾斯材料的使用使得超薄波導得以實現,並具有低傳播損耗的特性。通過將矽光子學與波導整合的石墨烯相結合,實現了全可調性、寬頻和高速運行等特性。總體而言,這種波導應用使光子電路得以小型化,同時保持AI硬體所需的性能指標,在該領域推動顯著進步 。圖10:依賴二維材料的波導整合光電探測器技術路線圖。圖11:整合在CMOS電路中的石墨烯-量子點光電探測器。非線性光學TMDCs表現出強烈的非線性響應,從而開啟了諸如頻率轉換和全光訊號處理等高級功能的大門。這些能力對於在晶片上直接實現非線性光學功能及實現晶片級量子計算至關重要 。基於石墨烯的器件也展現出在類腦架構如光子神經網路方面的潛力——近期一項研究提出了一種嵌入微環諧振器中的基於石墨烯的突觸模型,能夠使用多波長技術建構大規模神經網路,這一方法有望顯著加速大語言模型的訓練過程。表1:在技術上具有重要意義的電信波長下,常見二維材料與用於矽及矽混合整合方案中的CMOS相容平台主材的二階和三階非線性光學參數。該表表徵了多種混合波導的非線性響應,展示了二維材料在當前AI背景下的性能潛力。案例研究:基於光子晶片的AI硬體整合二維材料的光子晶片因其能夠以接近光速的速度執行計算任務,而比現有技術更快,因此在AI硬體方面展現出極大前景。例如:麻省理工學院的研究人員展示了一種能夠以光學方式執行深度神經網路計算的全整合光子處理器。該晶片通過整合非線性光學功能單元(NOFUs)實現了超低延遲和極低功耗,在不到半納秒內完成了機器學習分類任務的關鍵計算,同時精準率超過92%(與現有技術表現一致)。此晶片還採用商用工藝製造,為這一新技術的規模化鋪平了道路。哥倫比亞大學開發了一種節能的資料傳輸方法,通過在光子晶片上利用Kerr頻率梳,使研究人員能夠通過不同且精確的光波長傳輸清晰訊號。這一創新提高了頻寬密度並降低了能耗,這兩者都是提升大型語言模型訓練系統可擴展性的關鍵因素。Black Semiconductor公司新設立了名為FabONE的總部,專注於開發基於石墨烯的光子連接解決方案,以實現更快速的晶片間互連。這項技術將推動高性能計算、人工智慧、機器人技術、自動駕駛等領域的發展,特別是在AI模型的超高速訓練過程方面。這些突破性進展凸顯了整合二維材料的光子晶片在加速AI基礎設施革命方面的潛力,特別是在速度、可擴展性和能效方面的瓶頸突破。圖12:基於克爾頻率梳驅動的矽光子鏈路的分層結構藝術示意圖。挑戰與未來方向儘管潛力巨大,與所有新技術一樣,要充分實現二維材料在整合光子學中的價值,還面臨諸多挑戰:一、可擴展性超薄二維材料的脆弱性在大規模製造過程中帶來挑戰,需要在轉印技術和晶圓級合成方面取得進展,才能使這項技術真正具備可擴展性 。二、材料穩定性包括石墨烯和TMDCs在內的一些二維材料在環境條件下會降解。為了讓這項技術得到廣泛採用,必須開發保護塗層、封裝技術或一般性的保存方法,以保障其長期可靠性 [38]。三、整合複雜性要實現與現有CMOS工藝的無縫整合,需要在各種技術手段和介面工程上進一步最佳化,才能使這項新技術順利進入主流應用。未來的研究應聚焦於解決上述挑戰,同時繼續探索與石墨烯和TMDCs互補的新型材料系統。二者結合,將推動由電子、光子和基於二維材料的元件構成的混合平台發展,為AI硬體和技術帶來顛覆性進步鋪平道路。用於光子類腦計算晶片的自旋電子學奈米光子學作為一門新興的交叉學科,融合了奈米技術和光子學原理,旨在探索和利用奈米尺度結構對光波的調控能力。在光子學領域,主動器件與被動器件均扮演著重要角色,並具有廣闊的應用前景。類腦系統通過借鑑神經網路的原理,試圖模擬人腦的計算與認知能力。本節將系統探討自旋電子器件與奈米光子結構在類腦計算中的協同整合。類腦計算的背景與挑戰類腦計算的提出源於傳統馮·諾依曼架構的根本性限制。傳統計算系統受到“馮·諾依曼瓶頸”的困擾,即處理單元與儲存單元的物理分離導致在資料傳輸中產生過高的能耗與延遲。隨著處理器與儲存之間性能差距的擴大,這一瓶頸進一步加劇,被稱為“儲存牆”。現代電腦在模擬基礎腦功能時需消耗兆瓦級功率,而生物大腦僅使用20瓦功率卻能實現驚人的認知能力。與此同時,半導體產業面臨電晶體微縮趨於極限、摩爾定律停滯等生存性挑戰。這場架構危機與電晶體縮放危機共同促使人們對類腦計算範式產生濃厚興趣。類腦計算通過三項關鍵創新應對上述挑戰:1)計算與儲存的共址;2)資訊的模擬編碼;3)大規模平行連接 。儘管神經網路的理論框架可追溯至McCulloch與Pitts的二值神經元模型(1943年)以及之後的深度學習發展,但實際實現面臨嚴重的硬體限制。基於CMOS的電晶體陣列實現缺乏非線性動力學、長期可塑性和隨機性等基本神經生物特性。新興的非易失性儲存器技術(尤其是憶阻器 )使更具生物逼真度的實現成為可能,但材料限制依然存在。阻變RAM(RRAM)、相變材料和鐵電器件在耐久性、速度和可控性之間存在權衡,限制其大規模部署能力。三代神經網路凸顯了硬體需求的不斷演進:1)以閾值操作為核心的第一代感知機;2)要求連續非線性啟動函數的第二代深度神經網路(DNN);3)依賴精確時間編碼和事件驅動處理的第三代脈衝神經網路(SNN)。雖然DNN主導當前AI應用,SNN因稀疏、基於脈衝的通訊方式而在生物逼真度與能效方面表現更優 。然而,SNN的硬體實現尤為困難,需要器件能本徵地模擬生物神經元的“洩漏積分-發放”(LIF)動態,以及突觸的“基於脈衝時序的可塑性”(STDP)。當前採用CMOS電路或新型憶阻器的解決方案,或缺乏基本類腦特性,或在耐久性與隨機控制方面存在侷限性。這種硬體-演算法之間的落差從根本上限制了類腦計算實現類腦效率與適應性的潛力。神經形態計算中的核心優勢與關鍵自旋電子技術自旋電子器件具備獨特優勢,使其成為神經形態計算硬體的領先候選。其內在的非易失性、超快動態響應(>1 GHz)以及幾乎無限的耐久性(10^15 次循環)能夠實現高能效、符合生物邏輯的神經網路實現方式。關鍵在於,自旋電子技術利用磁性和自旋相關現象,天然模擬神經-突觸功能,同時保持與傳統 CMOS 製造工藝的相容性。其三大核心優勢包括:(1)磁化翻轉和自旋進動中的隨機性可對應為神經元的機率性發放機制,從而實現事件驅動的脈衝神經網路(SNNs),具備稀疏編碼效率 ;(2)多型磁化動態(如磁疇壁運動、磁渦旋核化)展現模擬憶阻特性,是調控突觸權重的關鍵 ;(3)非易失狀態保持特性可消除空閒期間的靜態功耗。這些特性有效緩解馮·諾依曼架構瓶頸,並在速度與可靠性方面優於其他憶阻技術 。磁隧道結(MTJ)是基礎的自旋電子構件,能夠在兩種運行模式下展現多樣神經形態功能。在超順磁模式下,MTJ 在平行與反平行狀態間的隨機翻轉可生成泊松分佈脈衝,應用於機率計算 ,在 CoFeB/MgO 結構中實現高達 604% 的隧道磁阻比(TMR)。當作為自旋轉矩奈米振盪器(STNO)使用時,MTJ 可產生 GHz 級的電壓振盪,並與外部刺激同步,用於建構耦合振盪器網路以實現模式識別 。自旋軌道轉矩(SOT)器件通過重金屬/鐵磁體雙層結構實現無場磁化翻轉,擴展了這些能力。SOT 驅動的自旋霍爾奈米振盪器(SHNOs)在二維陣列中可實現互同步,三端結構的 MTJ 則通過讀寫路徑分離增強突觸精度 [Fukami2016]。磁奈米線中的磁疇壁運動提供連續的電阻調製,適用於模擬突觸,實現每次突觸更新能耗為 32 meV。新興的拓撲自旋結構如磁渦旋(skyrmion)具備類粒子動態,可用於生物啟發計算模型。在手性磁體中,直徑小於 100 nm 的渦旋的生成與湮滅模擬神經遞質釋放的機率機制,閾值電流為 10 μA 。反鐵磁(AFM)自旋電子學提供 THz 級動態響應和無雜散磁場特性,通過補償磁矩實現高密度交叉陣列。基於 AFM 的突觸展現 100 ps 的翻轉速度和高達 200°C 的熱穩定性]。這些技術的融合使得建構“全自旋神經網路”成為可能:結合基於 STNO 的神經元 [Romera2018]、磁疇壁憶阻突觸與渦旋機率互連,該硬體生態系統在物理層面協調設計,解決了儲存-計算分離難題。自旋電子技術在系統層級的應用探索自旋電子神經形態系統通過基於物理機制的架構創新,在認知計算模式中展現變革潛力。一項前沿實現中,四個同步運行的自旋轉矩奈米振盪器(STNOs)處於耦合的微波發射狀態,用於即時元音識別任務,精準率達到 96%,比等效的深度學習網路高出 17%,且每次分類僅消耗 3 mW 功耗 。該事件驅動架構利用 2.4 GHz STNO 陣列的固有頻率復用特性,將時間語音訊號直接對應到振盪器的同步狀態,從而省去了模數轉換的開銷。對於大規模實現,32×32 元素的自旋霍爾奈米振盪器(SHNO)交叉陣列通過傳播的自旋波在 100 µm 距離上實現互相鎖相,從而通過集體動態而非離散突觸權重完成模式補全任務。磁渦旋網路通過拓撲保護的粒子相互作用引入機率計算能力。在手性磁體中,50–100 nm 尺寸的渦旋網路通過核化密度編碼機率分佈,建構貝葉斯推理引擎,實現氣象預測模型中的 92% 精準率,在 10^5 個隨機狀態下進行存內採樣。該方案相較於 GPU 實現的蒙特卡洛模擬,能耗減少了 10 倍,通過模擬電流控制的狀態重組方式實現。反鐵磁(AFM)自旋電子器件具備抗雜散場和 1 THz 動態性能,可實現超高密度結構。在 IrMn 基交叉陣列中,每次突觸更新的實驗能耗為 4 fJ,權重漂移在 10^12 次循環內保持在 0.1% 以下。在儲備計算(Reservoir Computing)實現中,系統利用非線性磁化動態進行時間訊號處理。單個漩渦型 STNO 通過時間復用進動狀態等效於 400 個神經元,解決 Mackey-Glass 混沌時間序列預測任務時,歸一化均方誤差僅為 0.012 。基於渦旋的儲備結構利用無序磁結構中的新興相互作用處理 10 MHz EEG 訊號,功耗為 20 μW,成功實現即時癲癇發作檢測,依賴自旋結構動態中的分叉檢測機制。展望大規模部署,結合 STNO 神經元、磁疇突觸與 AFM 互連的“全自旋神經網路”有望實現 >100 TOPS 的認知計算性能,系統功耗低於 10 mW,通過在物理層面聯合設計神經-突觸功能結構達成。圖13:用於儲存應用的磁隧道結。a、一種磁隧道結由兩個鐵磁層(灰色)夾著一層絕緣層(藍色)組成,其中一層的磁化方向固定,另一層的磁化方向可與其平行(低電阻)或反平行(高電阻)。標籤“1”和“0”分別表示這兩種狀態。b、高密度儲存用的磁隧道結交叉陣列(磁性隨機儲存器)。通過啟動相應的字線(紅色),允許底部位線與頂部感應線(均為藍色)導通,從而測量某個特定隧道結的電阻。通過施加足夠的電流可以切換磁化方向。c、聯想記憶:(i) 來自MNIST資料集的手寫數字用於訓練聯想記憶;(ii) 訓練後輸入的測試樣本;(iii) 測試輸入產生的訓練網路輸出,顯示成功的聯想。[<引用缺失>]圖14:基於自旋電子學的憶阻器。a、疇壁憶阻器:磁隧道結的電阻取決於疇壁位置,從而改變高電阻反平行態與低電阻平行態的相對面積。b、基於Skyrmion的憶阻器:裝置的電阻取決於固定層下方的Skyrmion數量。c、細磁疇隧道憶阻器:在與多晶反鐵磁體耦合的隧道結中,由於各個磁疇的切換特性不同,使得磁疇可以在不同條件下獨立翻轉。裝置的電阻由與固定層磁化方向一致的磁疇所佔比例決定。d、自旋電子聯想記憶:每個非對角矩陣元素的值通過憶阻器的配置儲存,用不同的電平表示。這些電平經過訓練,使得在矩陣與輸入相乘後,結果最接近訓練集中的某一元素。乘法運算通過施加對應輸入的電壓並測量相關憶阻器的輸出電流完成。d圖下方的前三個圖像為網路訓練識別的圖像,第四個為其中一個圖像的“噪聲”版本,第五個為重構後的正確圖像。當前挑戰與未來方向長上下文窗口與長序列下的記憶體問題記憶體與上下文窗口: 光子加速器通常缺乏足夠的片上記憶體來快取長序列的tokens。現代LLM推理可能涉及上萬個tokens,需要儲存啟動值、鍵/值對以及整個上下文中的中間狀態。由於片上通常缺少大容量SRAM或NVM,光子系統只能將資料流進流出,這重新引入了馮·諾依曼瓶頸。正如Ning等人所指出,“資料移動經常成為整個系統的瓶頸”,這一問題不僅存在於傳統電子處理器,也同樣適用於光處理器。實踐中,有限的片上記憶體迫使光子LLM實現從外部DRAM或硬碟中獲取上下文,從而帶來延遲並破壞全光計算流水線。諸如“檢索增強生成”(retrieval-augmented generation)等新興用例進一步加劇了這一問題:對多TB文字語料庫進行近即時搜尋與分詞,又引入一輪高開銷的記憶體訪問。簡而言之,光子晶片的有限儲存能力限制了LLM的上下文長度與吞吐量,使得長序列推理成為一個主要挑戰。光子計算系統中大規模資料集的儲存問題儲存與I/O瓶頸: 大語言模型及其訓練資料或知識庫涉及PB級甚至更大的資料集。光子加速器仍依賴於高速外部儲存與記憶體來提供這些資料。所需的I/O頻寬常常超出現有介面的處理能力:即使光核本身運行極快,但如果無法快速供數,也會造成資源浪費。分析人士警告LLM面臨越來越嚴重的“記憶體牆”,資料移動成為主導限制因素。現實工作負載使情況更為嚴峻:例如檢索增強型LLM需反覆提取和處理大量文字塊,對I/O系統造成極大壓力。有些提議(如將權重儲存與計算單元共置的非易失性儲存)可減少I/O開銷(一項研究報告使用片上Flash儲存權重可減少1000倍I/O),但考慮到資料集體量,多TB語料庫的快取、調度與匯流排頻寬仍將是光子LLM系統中的關鍵瓶頸。精度與轉換開銷問題光子計算本質上是模擬的,因此很難表示LLM推理所需的高精度張量。當前最先進的光子Transformer設計依賴高解析度ADC/DAC來保持精度,而這些轉換器消耗了大部分晶片面積與功耗。例如,在某個光子Transformer加速器中,ADC/DAC電路佔據了超過50%的晶片面積,並成為性能瓶頸。如何在不大幅增加轉換開銷的前提下減少量化誤差是持續的挑戰:低位元轉換器或共享ADC架構可最佳化面積與能耗,但可能影響模型精度。因此,找到最優的模擬量化方案或混合訊號架構(例如使用數字校正少量值)對下一代光子LLM晶片至關重要。缺乏原生非線性函數光子硬體擅長執行線性運算(如通過干涉儀實現的矩陣-向量乘法),但在實現啟動函數和非線性層方面歷來缺乏高效手段。早期整合光子神經網路雖可進行快速矩陣乘法,但啟動函數仍依賴電子電路。實踐中,許多光子LLM加速器仍需轉換至CMOS以實現softmax、GELU等點操作函數。整合高效的片上非線性元件(如光學可飽和吸收器、電光調製器或奈米光子非線性元件),或開發最小化轉換差距的混合光電計算流水線,是實現全光LLM推理的重要工程挑戰。光子注意力架構目前的主要研究方向之一是將Transformer中的自注意力機制直接實現於光域中。這要求設計可調光學權重元件與可重構干涉儀網路,以光學方式計算Q×K及V加權和。例如,光子張量核(photonic tensor cores)正在開發中,利用馬赫-曾德爾干涉儀(MZI)網格或其他交叉陣列實現大規模矩陣平行運算。可調權重可以通過相位調製器、微環調製器,甚至磁光儲存單元來實現:有研究提出使用Ce:YIG諧振器儲存多位元權重,從而實現片上非易失性光學權重儲存。此外,來自儲備計算(Reservoir Computing)的基於延遲方案可提供時間上下文:長光延遲線或串聯微環已展示出極高的序列記憶能力。未來構想是:實現一個全光Transformer模組,其中動態權重矩陣被程式設計進光學網格,過往token狀態保存在延遲路徑中,使自注意力機制得以光速運行。最新設計如Lightening-Transformer(動態運行的光子張量核)與HyAtten驗證了這一思路:它們實現了高度平行、全範圍矩陣運算,同時最大限度減少了片外轉換。持續推進整合光學快取、高頻寬調製器以及光學softmax逼近將推動該方向的發展。類腦與脈衝光子LLM另一條前沿路徑是將LLM推理重構為類腦、事件驅動範式。SNN以稀疏的非同步事件形式處理資料,天然契合光子的優勢。事實上,已有基於相變神經元和雷射脈衝的全光脈衝神經網路在晶片上實現。人們設想可以將token流編碼為光學脈衝,通過具有突觸權重的光子SNN實現序列處理。混合光子-自旋電子設計在此可發揮作用:自旋電子器件(如磁隧道結、相變突觸)可提供緊湊的非易失性權重儲存,並可與光神經元介面。近期關於磁光儲存的光子片上權重研究、利用極端稀疏性的光子類腦加速器研究表明,在光子晶片中嵌入非線性、事件驅動元件是可行的。這類架構可利用資料稀疏性(大多數token僅弱啟動網路),僅在事件發生時更新權重,從而顯著降低能耗。在光子類腦硬體上探索脈衝注意力模型或稀疏Transformer變種,是未來低功耗LLM推理的令人興奮的發展方向。系統整合與協同設計最後,在光子平台上擴展LLM需跨層次的協同設計。這包括將光子處理器與先進的光學I/O和儲存層次結構整合,以及從演算法層面匹配硬體特性。例如,近期在商用代工廠製造的全整合光子DNN晶片展示了在晶片內全光完成神經網路計算的可能性。將此類整合擴展到Transformer等級模型將需要密集的波分復用(WDM)、片上傳輸的光學網路架構(NoC)、以及新型封裝(如共同封裝光學)來提升吞吐量。同時,軟體工具鏈(如量化、平行性、佈局)也需適配光子硬體。關於光電協同封裝與存內計算架構的努力提供了路線圖:通過將光子張量核與共置的記憶體和控制邏輯緊密耦合,可緩解馮·諾依曼架構帶來的資料瓶頸。從長遠來看,成功可能來自“全球協同設計”——即將Transformer演算法的稀疏性、低精度、模型分區等特性與非馮·諾依曼的光子晶片能力精確匹配。這些軟硬體的協同創新將釋放光計算在下一代LLM負載中的巨大平行潛能。結論光子學的進步正在推動計算技術的變革,其中光電器件與光子平台的整合處於前沿。這一整合催生了光子積體電路(PICs),它們作為超高速人工神經網路的建構模組,是新一代計算裝置建立的關鍵。這些裝置旨在應對機器學習和人工智慧應用在醫療診斷、複雜語言處理、電信、高性能計算和沉浸式虛擬環境等多個領域中所帶來的高強度計算需求。儘管已有諸多進展,傳統電子系統在速度、訊號干擾和能效方面仍存在侷限。神經形態光子技術以其超低延遲的特性,作為一種突破性解決方案出現,為人工智慧和光神經網路(ONNs)的發展開闢了新的路徑。本綜述從光子工程和材料科學的角度出發,聚焦神經形態光子系統的最新發展,批判性地分析當前和預期面臨的挑戰,並描繪出克服這些障礙所需的科學與技術創新圖譜。文章重點介紹多種神經形態光子人工智慧加速器,涵蓋從經典光學到複雜的PIC設計的廣泛技術領域。通過詳細的對比分析,特別強調其在每瓦操作次數(operations per watt)方面的運行效率。討論轉向諸如垂直腔面發射雷射器(VCSEL)/光子晶體面發射雷射器(PCSEL)和基於頻率微梳的加速器等專用技術,突出了在光子調製和波分復用方面的最新創新,以實現神經網路的高效訓練與推理。鑑於當前在實現每瓦千兆次操作(PetaOPs/Watt)計算效率方面存在的技術瓶頸,本文探討了提升這些關鍵性能指標的潛在策略,包括拓撲絕緣體與PCSELs等新興技術,以及提升製造工藝、系統可擴展性與可靠性的手段。本文不僅描繪了當前的技術圖景,也預測了神經形態光子技術在推動人工智慧能力邊界方面的未來發展路徑。總的來說,隨著摩爾定律的終結以及光子版“摩爾定律”的起飛,我們預計將在PIC的成本、可擴展性、可整合性以及總體計算能力方面看到顯著提升。PIC最終將取代IC,成為未來計算系統的核心支柱。 (半導體行業觀察)