引言「強化人工智慧晶片、演算法等關鍵領域的中國國產替代,探索可重構、存算一體、超規格高算力智慧晶片等新型架構晶片」——人民日報《搶抓人工智慧發展的歷史性機會》近日,人民日報刊文《搶抓人工智慧發展的歷史性機遇》,其中特別提到一項關鍵技術——“可重構晶片”,這種被寄予厚望的晶片,有望成為AI時代的“加速引擎”。今天,讓我們沿著科技發展脈絡,全方位瞭解其技術原理,探究它如何革新計算模式。全系列文章共分為五個篇章,今天為系列文章的第一篇。可重構晶片:資料驅動動態重構可重構晶片(Reconfigurable Processing Unit, RPU)是一種能夠動態組態運算資源的新型晶片。此類晶片的核心在於內含可程式設計的處理單元及互連網路,能夠基於具體應用的運算需求和資料流特性,在運行過程中利用動態重構技術實現計算單元、互連結構和資料通路的動態按需組態,從而以接近「專用電路」(ASIC)的方式進行資料驅動下的計算。硬體層面的動態重構不僅具有完整的可程式設計能力,支援各類演算法和應用;而且提供了更精確靈活的硬體調度能力,大幅提高了晶片的面積效率和能量效率。因此,高能效比、高擴展性和高度的靈活性是該類晶片的最大特點。技術原理:高效能運算晶片中的“變形金剛”正是因為這種高度的靈活性,曾有媒體將可重構晶片稱為晶片界的“變形金剛”,其革命性體現在兩大核心技術特徵:(1)資料流驅動架構透過資料流直接驅動晶片運算和資料傳遞。與傳統CPU的指令驅動模式不同,其硬體資源(處理單元和互連網路)由資料流特性即時動態對應,消除了指令解碼、分支預測等傳統開銷,能效比提升可達十倍量級。(2)多層次重構能力支援從微架構到電路層的多粒度重構:計算單元重構:透過組態參數定義運算器功能(如算符和精度切換)互連網路重構:動態調整計算單元間的連接拓撲儲存系統重構:根據資料存取模式最佳化快取分配策略可重構晶片的內部結構主要有以下幾個部分組成:運算陣列:由處理單元(PE)陣列構成,每個PE具有多種算術邏輯運算能力,透過可程式互連網路形成複雜的資料路徑。可重構控製器:發射“組態資訊”,動態調整計算陣列的連接方式和運算模式。這種分離設計(資料流與控制流獨立)使得晶片能夠像CPU一樣靈活可程式設計,同時保持接近ASIC的能源效率。記憶體:分為組態記憶體和資料記憶體。設定記憶體儲存運算陣列「設定資訊」;資料記憶體儲存運算陣列所需的原始資料、中間資料和結果資料。圖1.可重構晶片基本架構[1]動態重構是可重構晶片(RPU)的「核心殺器」。它以無指令驅動的資料流運算方式和動態重構能力,顯著區別於傳統CPU和GPU。與CPU的馮諾依曼指令驅動架構不同,其硬體資源(處理單元和互連網路)可直接由資料流對應任務需求,消除了指令解碼和分支預測等指令開銷,能效比更高;相較於GPU的固定並行化架構(依賴SIMD/Warp調度),可重構模式透過重構支援多粒化模式可重構晶片的動態重構能力使其在能源效率、靈活性和開發成本之間取得最優效能,尤其適合在演算法快速迭代或需求多變的領域應用。因此,可重構晶片也被學術界和產業界視為CPU、FPGA和GPU之外的第四類通用運算晶片。可重構計算進化史:從理論到實踐的跨越可重構晶片的發展歷程呈現出全球技術演進與國家戰略驅動的雙重特徵。自1991年「新機器範式」提出可重構運算架構以來,該領域逐步從理論研究走向產業實踐:1997年加州大學柏克萊分校啟動GARP項目,針對可重構運算架構進行概念驗證;2003年麻省理工學院啟動MORPHEUS項目,探索可重構計算在專用領域的應用。2006年清華大學成立可重構運算實驗室,研究可重構運算理論與架構實作。2015年清華大學在可重構晶片方面的研究成果榮獲國家技術發明二等獎。同年,國際半導體技術路線圖(ITRS)將可重構晶片列為「未來最具前景晶片架構技術」。2016年,美國電子復興計畫(ERI)明確將可重構運算(軟體定義硬體)列為未來運算晶片的核心架構技術。2017年,國務院在《新一代人工智慧發展規劃》中將可重構計算列入“新一代人工智慧關鍵共性技術體系”,重點支援其發展。2017年清華大學團隊突破動態重構、多粒度融合等關鍵技術,研發出「Thinker」系列可重構AI 晶片,實測表明,該晶片運行典型人工智慧任務時,能效比顯著高於同類GPU。 Thinker晶片被《麻省理工科技評論》專題報導。2019年初,清微智慧公司的首款可重構晶片,也是全球第一顆可重構商用晶片大規模量產。同年,賽靈思推出包含粗粒度可重構陣列(CGRA)架構的Versal系列產品,面向資料中心與高階智慧駕駛,算力達到128TOPS。2020年美國SambaNova公司發表基於可重構晶片的DataScale平台,並在多個美國多個算力中心、國家實驗室和研究機構規模部署。2021年Mobileye公司在L4自動駕駛晶片中嵌入粗粒度可重構陣列。2022年GoogleTPU v4借助可重構互連技術實現算力躍升(同等晶片數時,處理速度達A100的1.67倍)2023年日本採用可重構晶片建造了「富岳(Fugaku)」超級電腦,名列全球超算排行榜(TOP500)第二名,處理AI任務的性能達到A100叢集的6倍。從這項發展脈絡不難洞察,可重構晶片的價值正逐步獲得廣泛認知,並開始在實踐中得以深度應用。可重構晶片未來發展演進可重構晶片作為下一代運算範式的核心載體,將沿著智慧化融合與彈性化演進兩大主軸深度發展,透過架構創新與跨層技術協同,建構適應多元場景的算力基座。其演進路徑主要體現在以下三個維度:架構革新:動態異質與資源重複使用多層次重構能力:透過動態層次化重構技術(資料級/張量級/任務級)與混合粒度架構設計(如粗粒度可程式單元與細粒度加速器協同),實現運算資源在時空維度的彈性調度與高效復用,突破非規則計算負載的資源適配瓶頸。並行化擴展:支援從SIMD到資料流驅動的多樣化並行模式,結合非馮架構的存算一體化設計,顯著提升演算法對應效率,尤其適用於稀疏計算、圖計算等複雜場景。軟硬協同:敏捷開發與智慧編譯SDH(軟體定義硬體)範式深化:基於組態輕量化管理、執行時間自適應最佳化及AI驅動的智慧編譯框架,建構從演算法到硬體的敏捷開發鏈路,降低開發門檻並提升硬體資源利用率。多模態運算融合:整合存內運算、近似運算、模擬運算等新運算單元,結合3D整合與光互連技術,實現能效數量級提升,滿足AI大模型訓練推理、邊緣即時決策等場景的差異化需求。場景驅動:垂直最佳化與生態建構領域專用化演進:針對自動駕駛、工業物聯網、生物運算等垂直領域,形成可組態範本庫與敏捷開髮套件,加速演算法-晶片協同最佳化。開放生態延伸:透過多層次程式設計模型拓展(如RISC-V擴展、Triton框架)建立軟硬體解耦生態,推動跨平台工具鏈與開源社群建設,釋放長尾應用創新潛力。結語《人民日報》提及的可重構晶片,是實現高算力、高能效智慧運算的有效途徑之一。從技術原理而言,它透過「軟硬體雙程式設計」達成了靈活性與高能效的統一;從發展歷程來看,其突破既依託國際學術屆長期積累的成果,更離不開國內產學研多年的持續探索。當下,伴隨後摩爾時代的來臨,可重構晶片將成為解決「效能牆」「儲存牆」「功耗牆」難題的關鍵所在。正如電腦圖靈獎得主Patterson教授所說:“我們正進入運算架構的另一個黃金時代”,而中國實踐的一系列成果正在證實,可重構晶片必將在未來的科技發展浪潮中扮演愈發重要的角色。可重構晶片究竟藏有什麼「神秘魔法」?為何它是最有前景的AI運算架構?下一篇文章,我們將從多維度深度剖析其中奧秘。參考資料[1]DE SUTTER B, RAGHAVAN P, LAMBRECHTS A. Coarse-Grained Reconfigurable Array Architectures[M/OL]//BHATTACHARYYA SS, DEPRETTERE EF, LEUPERS R, 等. Handbook of Signal Processing Systems. Boston, MA: Springer, LEUPERS R, 等。[2]PODOBAS A, SANO K, MATSUOKA S. A Survey on Coarse-Grained Reconfigurable Architectures From a Performance Perspective[J/OL]. IEEE Access, 2020, 8: 146719-146743.[3]清微智能官網http://www.tsingmicro.com/ (半導體產業觀察)