「強化人工智慧晶片、演算法等關鍵領域的中國國產替代,探索可重構、存算一體、超規格高算力智慧晶片等新型架構晶片」——人民日報《搶抓人工智慧發展的歷史性機會》
近日,人民日報刊文《搶抓人工智慧發展的歷史性機遇》,其中特別提到一項關鍵技術——“可重構晶片”,這種被寄予厚望的晶片,有望成為AI時代的“加速引擎”。今天,讓我們沿著科技發展脈絡,全方位瞭解其技術原理,探究它如何革新計算模式。
全系列文章共分為五個篇章,今天為系列文章的第一篇。
可重構晶片(Reconfigurable Processing Unit, RPU)是一種能夠動態組態運算資源的新型晶片。此類晶片的核心在於內含可程式設計的處理單元及互連網路,能夠基於具體應用的運算需求和資料流特性,在運行過程中利用動態重構技術實現計算單元、互連結構和資料通路的動態按需組態,從而以接近「專用電路」(ASIC)的方式進行資料驅動下的計算。硬體層面的動態重構不僅具有完整的可程式設計能力,支援各類演算法和應用;而且提供了更精確靈活的硬體調度能力,大幅提高了晶片的面積效率和能量效率。因此,高能效比、高擴展性和高度的靈活性是該類晶片的最大特點。
正是因為這種高度的靈活性,曾有媒體將可重構晶片稱為晶片界的“變形金剛”,其革命性體現在兩大核心技術特徵:
(1)資料流驅動架構
透過資料流直接驅動晶片運算和資料傳遞。與傳統CPU的指令驅動模式不同,其硬體資源(處理單元和互連網路)由資料流特性即時動態對應,消除了指令解碼、分支預測等傳統開銷,能效比提升可達十倍量級。
(2)多層次重構能力
支援從微架構到電路層的多粒度重構:
可重構晶片的內部結構主要有以下幾個部分組成:
動態重構是可重構晶片(RPU)的「核心殺器」。它以無指令驅動的資料流運算方式和動態重構能力,顯著區別於傳統CPU和GPU。與CPU的馮諾依曼指令驅動架構不同,其硬體資源(處理單元和互連網路)可直接由資料流對應任務需求,消除了指令解碼和分支預測等指令開銷,能效比更高;相較於GPU的固定並行化架構(依賴SIMD/Warp調度),可重構模式透過重構支援多粒化模式可重構晶片的動態重構能力使其在能源效率、靈活性和開發成本之間取得最優效能,尤其適合在演算法快速迭代或需求多變的領域應用。因此,可重構晶片也被學術界和產業界視為CPU、FPGA和GPU之外的第四類通用運算晶片。
可重構晶片的發展歷程呈現出全球技術演進與國家戰略驅動的雙重特徵。
自1991年「新機器範式」提出可重構運算架構以來,該領域逐步從理論研究走向產業實踐:
1997年加州大學柏克萊分校啟動GARP項目,針對可重構運算架構進行概念驗證;
2003年麻省理工學院啟動MORPHEUS項目,探索可重構計算在專用領域的應用。
2006年清華大學成立可重構運算實驗室,研究可重構運算理論與架構實作。
2015年清華大學在可重構晶片方面的研究成果榮獲國家技術發明二等獎。
同年,國際半導體技術路線圖(ITRS)將可重構晶片列為「未來最具前景晶片架構技術」。
2016年,美國電子復興計畫(ERI)明確將可重構運算(軟體定義硬體)列為未來運算晶片的核心架構技術。
2017年,國務院在《新一代人工智慧發展規劃》中將可重構計算列入“新一代人工智慧關鍵共性技術體系”,重點支援其發展。
2017年清華大學團隊突破動態重構、多粒度融合等關鍵技術,研發出「Thinker」系列可重構AI 晶片,實測表明,該晶片運行典型人工智慧任務時,能效比顯著高於同類GPU。 Thinker晶片被《麻省理工科技評論》專題報導。
2019年初,清微智慧公司的首款可重構晶片,也是全球第一顆可重構商用晶片大規模量產。
同年,賽靈思推出包含粗粒度可重構陣列(CGRA)架構的Versal系列產品,面向資料中心與高階智慧駕駛,算力達到128TOPS。
2020年美國SambaNova公司發表基於可重構晶片的DataScale平台,並在多個美國多個算力中心、國家實驗室和研究機構規模部署。
2021年Mobileye公司在L4自動駕駛晶片中嵌入粗粒度可重構陣列。
2022年GoogleTPU v4借助可重構互連技術實現算力躍升(同等晶片數時,處理速度達A100的1.67倍)
2023年日本採用可重構晶片建造了「富岳(Fugaku)」超級電腦,名列全球超算排行榜(TOP500)第二名,處理AI任務的性能達到A100叢集的6倍。
從這項發展脈絡不難洞察,可重構晶片的價值正逐步獲得廣泛認知,並開始在實踐中得以深度應用。
可重構晶片作為下一代運算範式的核心載體,將沿著智慧化融合與彈性化演進兩大主軸深度發展,透過架構創新與跨層技術協同,建構適應多元場景的算力基座。其演進路徑主要體現在以下三個維度:
《人民日報》提及的可重構晶片,是實現高算力、高能效智慧運算的有效途徑之一。從技術原理而言,它透過「軟硬體雙程式設計」達成了靈活性與高能效的統一;從發展歷程來看,其突破既依託國際學術屆長期積累的成果,更離不開國內產學研多年的持續探索。當下,伴隨後摩爾時代的來臨,可重構晶片將成為解決「效能牆」「儲存牆」「功耗牆」難題的關鍵所在。正如電腦圖靈獎得主Patterson教授所說:“我們正進入運算架構的另一個黃金時代”,而中國實踐的一系列成果正在證實,可重構晶片必將在未來的科技發展浪潮中扮演愈發重要的角色。
可重構晶片究竟藏有什麼「神秘魔法」?為何它是最有前景的AI運算架構?下一篇文章,我們將從多維度深度剖析其中奧秘。
參考資料
[1]DE SUTTER B, RAGHAVAN P, LAMBRECHTS A. Coarse-Grained Reconfigurable Array Architectures[M/OL]//BHATTACHARYYA SS, DEPRETTERE EF, LEUPERS R, 等. Handbook of Signal Processing Systems. Boston, MA: Springer, LEUPERS R, 等。
[2]PODOBAS A, SANO K, MATSUOKA S. A Survey on Coarse-Grained Reconfigurable Architectures From a Performance Perspective[J/OL]. IEEE Access, 2020, 8: 146719-146743.
[3]清微智能官網http://www.tsingmicro.com/ (半導體產業觀察)