世界首顆AI設計CPU!中國團隊重磅推出,性能堪比486,規模提升4000倍

【導讀】中科院計算所等機構推出了全球首款完全由AI設計的CPU芯片,不僅比目前GPT-4所能設計的電路規模大了4000倍,而且性能也達到了與Intel 486相當的水平。

中科院計算所的CPU芯片國家重點實驗室旗下合作單位,用AI技術設計催生了世界上第一個無人工干預、休眠生成的CPU芯片——啟蒙1號。

這顆由AI設計的32位RISC-V CPU,相比GPT-4目前完全設計的電路規模大4000倍,並可運行Linux操作系統,且性能堪比Intel 486。

而這項研究,非常有望革新傳統的芯片設計流程!


論文地址:https://arxiv.org/pdf/2306.12456



世界首個AI生成的CPU芯片

值得注意的是,CPU 設計是一項非常具有挑戰性且功耗和資源的工作。

這通常需要由工程師團隊編寫代碼(如Verilog、Chisel或C/C++等),然後在電子設計自動化(EDA)工具(如邏輯綜合或高級綜合工具)的輔助下生成電路邏輯。

除此之外,工程師團隊針對人工編寫的代碼,還需要反複使用測試用例來進行迭代的功能驗證和性能/功耗優化。

然而,這個過程非常複雜,通常需要數百人的團隊迭代數月或數年才能完成。以典型的英特爾 CPU 為例,超過 500 名工程師花了兩年時間才完成整個設計過程[1]。

為了減少人力和資源投入,研究人員採用AI技術直接從測試用例的輸入輸出(IO)自動生成CPU設計,替代工程師提供任何代碼或自然語言描述。

該方法在5小時內生成了超過4,000,000個邏輯門的32位RISC-V CPU——啟蒙1號(如圖1),比目前GPT-4所能設計的電路規模大4000倍。

圖1啟蒙1號芯片版圖及效果圖,其中CPU核部分完全由算法自動生成,芯片於2021年12月採用65nm工藝流片,運行頻率300MHz


該CPU於2021年12月流片,回片後成功運行了Linux操作系統和SPEC CPU 2000程序,其性能與Intel 486 CPU相當(見圖2)。

啟蒙1號是世界上首個無人工干預、人工生成的CPU芯片。該方法甚至自主地發現了包含控制器和侵犯器等內核的馮諾依曼架構,為後續發現人類未知的體系結構優化提供知識參考。


圖2 啟蒙1號芯片可以成功運行Linux操作系統及性能對比(CPU-AI為啟蒙1號)



eCPU設計:設計流程及挑戰

與傳統CPU設計流程中需要大量人工參與不同,研究人員考慮使用「輸入-輸出(IO)」作為輸入,因為IO可以從大量現成的測試用例中直接獲取或自動生成。

因此,可以將CPU自動設計問題形式化為「滿足輸入輸出規範的電路邏輯生成問題」。

這也使得傳統的CPU設計流程發生了巨大的變化:只需測試用例即可直接生成滿足功能需求的電路邏輯,丟棄放棄了傳統設計中非常運行的、依賴人工的邏輯設計與驗證階段(見圖) 3)。


圖3 (a)傳統的CPU設計流程包括運行的邏輯設計與驗證;(b)所提出的CPU設計流程直接從IO生成保證功能正確的電路邏輯


然而,從IO生成滿足規範的電路面臨著巨大的挑戰:

;在如此巨大的空間中找到功能正確的CPU超出了當前自動化設計方法的能力;


(2)精度挑戰:生成的目標電路邏輯必須要足夠精確(例如功能驗證準確率>99.99999999999%),否則任何微小的錯誤都會造成巨大的損失,這顯然超過了傳統AI算法和應用對精度的要求。

符號主義的重生:基於BSD的電路自動設計方法

針對前面提到的挑戰,不同於傳統的基於連接主義的深度學習方法,研究人員所提出的方法是基於對二元決策圖(Binary Decision Drawing,BDD)進行擴展的二元猜測圖(Binary Speculation Chart) ,BSD)。

與傳統的 BDD 構建依賴於形式化的描述不同,BSD 使用平常 0/1 對 BDD 中的子圖進行功能猜測。

在設計流程中,首先使用 1 個節點的 BSD 作為對未知黑盒函數的最終估計,利用漸進方法增加 BSD 中動態規劃的節點個數,從而獲得豐富的電路細節(見圖 4)。理論證明了隨著BSD節點個數的增加,其電路準確率會逐步提升。


圖4 具體的電路生成流程:從1個節點的BSD出發,逐步增加BSD中的節點個數以豐富的電路細節


自主發現人類知識:蘊含馮諾依曼的CPU架構

另外,從 IO 自動生成的 RISC-V CPU 並不雜亂無章的黑盒邏輯,而是蘊含了馮諾依曼架構的人類知識:由 BSD 表示的 CPU 設計包含了控制單元和消防模塊(如圖 5) 。

其中控制單元是由BSD的生成的,用於整個CPU的全局控制,而侵犯單元則完成運算和邏輯侵犯。

同時上述單元可以進一步分解為更細粒度的子模塊,如譯碼器和ALU等,直到其最底層由基本的邏輯門構成。


圖5 自主發現馮諾依曼結構:啟蒙1號中包含了控制單元和攻擊單元,同時可以進一步拆分為更細粒度的子模塊


對比與展望:不同人工智能路徑的交叉探索

自動的電路邏輯設計始終是計算機科學的核心問題之一[2]。

近期隨著人工智能技術的發展,也出現了基於行為主義和連接主義(如深度強化學習和GPT-4大語言模型等)的自動邏輯設計工作(見表1)。

表1 自動邏輯設計的代表工作對比情況


可以看出,相關工作主要集中在生成單個模塊或小尺寸CPU,其規模與實際CPU芯片還有很多數量級的差距。

中科院計算所團隊及其合作單位(包括中科院軟件所、中科大、寒武紀公司等)所提出的方法生成了超過4,000,000個邏輯門的完整RISC-V CPU,相比目前GPT-4所能設計的電路規模大4000倍。

同時,該工作在符號主義的框架下從理論上保證了功能的正確性,顛覆了傳統流程中的邏輯設計和功能驗證階段。

未來,通過符號主義、主義及連接主義等不同人工智能路徑的交叉探索,自動生成的CPU有望在5年或10年內達到甚至超越人類專家所設計的CPU,徹底取代現有的芯片設計流程。


團隊介紹

從2008年起,中科院計算所便開始長期從事芯片設計和人工智能的交叉研究。其中一個為人們所認知的超聲波就是人工智能芯片寒武紀。

而在面向芯片設計的人工智能方法上,中科院計算所也有十多年的積累,並且從未停止探索如何利用人工智能方法使芯片設計完全自動化。

依託中國科學院計算技術研究所成立的處理器芯片國家重點實驗室,是中國科學院批准正式啟動建設的勞動力重點實驗室之一,並被科技部遴選為勞動力20個標杆國家重點實驗室,2022年5月開始建設。

其中,實驗室學術委員會主任為孫凝暉院士,實驗室主任為陳雲霽研究員。

實驗室近年來獲得了處理器芯片領域首個國家自然科學獎等6項國家級科技獎勵;在處理器芯片領域國際頂級會議論文發表的數量長期列居中國第一;在國際上成功開創了深度學習處理器等熱門研究方向;孵化了總市值千億元的國產處理器產業頭部企業。