【新智元導讀】近日,中國科學院計算技術研究所聯合軟體研究所推出「啟蒙」系統,基於AI技術,實現處理器晶片軟硬體各個步驟的全自動設計,達到或部分超越人類專家手工設計水平。
晶片設計向來是科技界的「皇冠明珠」,傳統設計流程需要頂尖專家團隊耗時數月甚至數年攻堅,極具挑戰性。
晶片設計包含多個關鍵步驟,硬體設計方面包括邏輯設計、電路設計、物理設計等,基礎軟體方面包括作業系統核心設計、編譯工具鏈設計、高性能庫設計等。
中國科學院計算技術研究所處理器晶片全國重點實驗室,聯合中國科學院軟體研究所,基於大模型等AI技術,推出處理器晶片和相關基礎軟體全自動設計系統——「啟蒙」。
「啟蒙」系統可以全自動的實現晶片軟硬體設計各個步驟,達到或部分超越人類專家手工設計水平。
具體而言,「啟蒙」系統已實現自動設計RISC-V CPU,達到ARM Cortex A53性能,並能為晶片自動配置作業系統、轉譯程序、高性能算子庫,性能優於人類專家設計水平。
這項研究有望改變處理器晶片軟硬體的設計範式,不僅有望大幅提升設計效率、縮短設計周期,同時有望針對特定應用場景需求實現快速定製化設計,靈活滿足晶片設計日益多樣化的需求。
眾所周知,晶片設計是一項非常具有挑戰性、需要耗費大量人力和資源的工作。
晶片硬體設計依賴工程師團隊編寫等硬體描述程式碼(如Verilog、Chisel等),通過電子設計自動化(EDA)工具生成電路邏輯,並反覆進行功能驗證和性能最佳化。
這一過程高度專業化且複雜,通常需上百人團隊耗時數月甚至數年,成本極高[1]。
同時,當前晶片基礎軟體適配需求激增。AI、雲端運算和邊緣計算等技術推動專用處理器設計多樣化,指令集組合呈指數級增長,每種組合均需適配龐大的基礎軟體棧。
傳統設計範式下,軟體生態適配周期長、成本高,嚴重制約硬體算力釋放。以openEuler為例,其包含1萬餘軟體倉庫、400余萬檔案,需針對不同RISC-V指令組合逐一驗證相容性。
為了減少晶片軟硬體設計的人力和資源投入,滿足晶片設計日益多樣化的需求,研究人員基於AI技術,建構國際首個全自動的處理器晶片軟硬設計系統「啟蒙」。
基於「啟蒙」系統,晶片軟硬體設計的各個環節都能實現全自動完成,設計成果可比肩甚至超過人工專家設計水平。
在晶片前端設計方面,實現國際首個全自動化設計的處理器核「啟蒙1號」[2], 5小時內完成32位RISC-V CPU的全部前端設計,達到Intel 486性能,規模超過4,000,000個邏輯閘,已完成流片。
其升級版「啟蒙2號」[3]為國際首個全自動設計的超標量處理器核,達到ARM Cortex A53性能,規模擴大至17,000,000個邏輯閘。
在硬體程式碼自動生成方面,實現硬體程式碼自動生成大模型CodeV系列 [4,5],能同時完成Chisel、Verilog語言的程式碼自動生成與程式碼片段補全。其中,CodeV-R1在Verilog硬體程式碼生成領域達到7B量級國際最優水平,在RTLLM Benchmark上超越671B滿血版DeepSeek-R1。
在自動作業系統配置最佳化方面,實現國際首個基於大模型的作業系統核心配置自動最佳化方法AutoOS [6],可自動生成定製最佳化後的作業系統核心配置,性能相比行業專家手工最佳化最高可提升25.6%。
在自動編譯工具鏈設計方面,實現國際首個自動跨平台張量程序轉譯工具QiMeng-Xpiler [7],可在不同的處理器晶片如輝達GPU、寒武紀MLU、AMD MI加速器、Intel DL Boost,和不同程式設計模型如SIMT、SIMD之間自動程序轉譯,性能最高達到廠商手工最佳化算子庫的2倍。
同時實現國際首個基於大模型的端到端編譯器 [8],成功實現真實編譯資料集ExeBench中91%的編譯任務。
在自動高性能庫設計方面,提出國際首個基於大模型的高性能矩陣乘程式碼自動生成框架QiMeng-GEMM [9]和國際首個基於大模型的高性能張量算子指令級自動生成框架QiMeng-TensorOp [10],在RISC-V CPU上的最高性能分別達到OpenBLAS的211%和251%,在NVIDIA GPU上的最高性能分別達到cuBLAS的115%和124%。
自動的電路邏輯設計長期以來都是電腦科學的核心問題之一[11]。現有自動設計方法通常將AI技術作為工具用於最佳化晶片設計的某個具體步驟。
不同於傳統自動設計方法,「啟蒙」系統旨在端對端的實現從功能需求到處理器晶片軟硬體的全自動設計和適配最佳化。
然而,由於處理器晶片設計領域的特殊性,實現處理器晶片軟硬體全自動設計主要面臨資料稀缺、正確性和求解規模等方面的關鍵挑戰。
為了應對上述挑戰,建立處理器晶片軟硬體全自動設計的新範式,「啟蒙」共包含三個層級。底層為處理器晶片領域大模型,中間層建構晶片和軟體智能體,實現處理器晶片和基礎軟體的自動設計,在最上層應用於晶片軟硬體設計的各個步驟。
處理器晶片大模型需要充分結合領域特點,掌握處理器晶片設計的領域知識,具備軟硬體設計的基礎能力。
此外,利用處理器晶片大模型建構反饋式推理流程,包括正確性反饋和性能反饋。通過自動功能驗證和基於功能正確性反饋的自動修復,確保生成結果的正確性。同時通過自動性能評估和基於性能反饋的自動搜尋,對解空間有效裁剪,實現對高性能設計結果的高效搜尋。
在處理器晶片大模型的基礎上,為自動設計處理器晶片的軟硬體,「啟蒙」系統分別建構了晶片生成智能體和基礎軟體智能體。
結合反饋式推理能力,晶片生成智能體自動完成從功能需求到邏輯電路的設計,基礎軟體智能體自主完成給定基礎軟體對目標晶片的自動功能適配和性能最佳化。
基於晶片生成智能體和基礎軟體智能體,針對多樣化的實際應用場景,在最上層全自動完成處理器晶片軟硬體設計各個步驟。
雖然「啟蒙」系統的設計是自底而上的,但由於晶片軟硬體設計領域的專業資料極為缺乏,
因此在具體實現時,採用自頂而下的建構方式更加容易切入。
以最頂層的多種應用實現為驅動,實現晶片軟硬體各個步驟的自動設計方法後,不僅可以為處理器晶片大模型提供豐富的軟硬體設計領域資料,同時也可以為處理器晶片智能體提供與專業工具協同互動的流程設計經驗。
因此,「啟蒙」系統採用「三步走」的技術路線:
(1)自頂而下:以通用大語言模型作為處理器晶片大模型的起點,實現處理器晶片智能體並完成處理器晶片軟硬體各個步驟的自動設計。將各個步驟串聯後自動產生豐富的跨層協同設計領域資料,用於訓練處理器晶片大模型。
(2)自底而上:基於訓練後的處理器晶片大模型重新建構智能體,並應用於軟硬體設計的各個步驟,提升自動設計效果,
(3)自演進:將自頂而下和自底而上的設計流程組成迭代的循環,通過循環實現「啟蒙」系統的自演進,不斷提升「啟蒙」系統的處理器晶片軟硬體全自動設計能力。
目前,研究人員已基本完成第一步中軟硬體各個步驟的自動設計。並且以3D高斯潑濺為驅動範例,將各個步驟串聯,組成完整的軟硬體協同設計流程[12]。後續將繼續推進跨層協同設計資料集的建立和處理器晶片大模型的訓練。
研究人員將繼續實現從自頂而下到自底而上的設計路線,並組成迭代的循環,最終朝著實現整個「啟蒙」系統自演進的目標邁進。
未來,還將通過符號主義、行為主義及連接主義等不同人工智慧路徑的交叉探索,不斷提升「啟蒙」系統的處理器晶片軟硬體全自動設計能力,同時持續拓展「啟蒙」的應用邊界,為更廣泛的處理器晶片設計應用場景提供智能化支援。
自2008年起,中國科學院計算技術研究所便開始長期從事晶片設計和人工智慧的交叉研究。其中一項為人熟知的產出就是人工智慧晶片寒武紀。
而在面向晶片設計的人工智慧方法上,計算所也已有十多年的積累,並且從未停止探索如何用人工智慧方法使得晶片設計完全自動化。
依託中國科學院計算技術研究所建立的處理器晶片全國重點實驗室,是中國科學院批准正式啟動建設的首批重點實驗室之一,並被科技部遴選為首批 20個標竿全國重點實驗室,2022年5月開始建設。
其中,實驗室學術委員會主任為孫凝暉院士,實驗室主任為陳雲霽研究員。
實驗室近年來獲得了處理器晶片領域首個國家自然科學獎等6項國家級科技獎勵;在處理器晶片領域國際頂級會議發表論文的數量長期列居中國第一;在國際上成功開創了深度學習處理器等熱門研究方向;孵化了總市值數千億元的國產處理器產業頭部企業。 (新智元)