最近,科學家們首次製造出一種非硅製成的柔性可程式設計晶片。
據IEEE報導,英國Pragmatic Semiconductor 公司及其同事研發的新型超低功耗 32 位微處理器可以在彎曲時運行,並可運行機器學習工作負載。該微晶片的開源 RISC-V 架構表明其成本可能不到一美元,使其能夠為可穿戴醫療電子產品、智能包裝標籤和其他廉價物品供電,其發明者補充道。
例如,“我們可以開發一種心電圖貼片,該貼片在胸部安裝有柔性電極,並在柔性電極上連接有柔性微處理器,通過處理患者的心電圖資料來對心律失常進行分類,”英國劍橋柔性晶片製造商 Pragmatic 的處理器開發高級總監 Emre Ozer 說道。他表示,檢測正常心律與心律失常“是一項機器學習任務,可以在柔性微處理器的軟體中運行”。
柔性電子產品具有與軟材料相互作用的任何應用的潛力,例如佩戴在身上或植入體內的裝置。這些應用可能包括皮膚上的電腦、軟機器人和腦機介面。但是,傳統電子產品是由硅等剛性材料製成的。
Pragmatic 公司致力於開發一種柔性微晶片,其製造成本遠低於硅處理器。這款新裝置名為 Flex-RV,是一款基於金屬氧化物半導體氧化銦鎵鋅 (IGZO ) 的 32 位微處理器。
嘗試用硅製造柔性裝置需要對易碎的微晶片進行特殊封裝,以保護它們免受彎曲和拉伸的機械應力。相比之下,用 IGZO 製成的柔性薄膜電晶體可以直接在低溫下在柔性塑料上製造,從而降低成本。
新的微晶片基於RISC-V指令集。(RISC 代表精簡指令集電腦。)RISC-V 於 2010 年首次推出,旨在通過精簡處理器可執行的核心指令集來實現更小、更低功耗、性能更好的處理器。
“我們的最終目標是通過開發免許可的微處理器來實現計算的普及,”Ozer說。
RISC-V 既免費又開源,讓晶片設計人員可以避免與 x86 和 Arm 等專有架構相關的昂貴許可費用。此外,專有架構提供的定製機會有限,因為新增新指令通常受到限制。相比之下,RISC-V 鼓勵這種改變。
“我們在設計 Flex-RV 時選擇了Olof Kindgren 設計的Serv ... 作為開源 32 位 RISC-V CPU,”Ozer 說道。“Serv 是開源社區中最小的 RISC-V 處理器。”
其他處理器也採用柔性半導體製造,例如 Pragmatic 的 32 位PlasticARM以及由伊利諾伊州工程師設計的超廉價微控製器。與這些早期裝置不同,Flex-RV 是可程式設計的,可以運行用 C 等高級語言編寫的編譯程序。此外,RISC-V 的開源性質還讓研究人員為 Flex-RV 配備了可程式設計的機器學習硬體加速器,從而實現人工智慧應用。
每個 Flex-RV 微處理器都有一個 17.5 平方毫米的核心和大約 12,600 個邏輯閘。研究小組發現 Flex-RV 的運行速度可以達到 60 千赫茲,而功耗卻不到 6 毫瓦。
所有之前的柔性非硅微處理器都是在製造它們的晶圓上進行測試的。相比之下,Flex-RV 是在柔性印刷電路板上進行測試的,這讓研究人員能夠看到它在彎曲時的表現如何。Pragmatic 團隊發現,當彎曲到半徑為 3 毫米的曲線時,Flex-RV 仍然可以正確執行程序。根據彎曲方式的不同,性能在 4.3% 的減速到 2.3% 的加速之間變化。“需要進一步研究,以瞭解方向、方位和角度等彎曲條件如何影響宏觀和微觀尺度上的性能,”Ozer 說。
硅微晶片可以以千兆赫的速度運行,比 Flex-RV 快得多,但 Ozer 表示這應該不是問題。“柔性電子領域的許多感測器(例如溫度、壓力、氣味、濕度、pH 值等)通常以赫茲或千赫茲的頻率運行,運行速度非常慢,”他說。“這些感測器用於智能包裝、標籤和可穿戴醫療電子產品,這些是柔性微處理器將大有裨益的新興應用。以 60 kHz 的頻率運行微處理器足以滿足這些應用的要求。”
Ozer 和他的團隊認為,每台 Flex-RV 的成本可能不到一美元。儘管 Ozer 不願透露成本可能低於一美元多少,但他表示,他們相信如此低的成本是可能的,“這要歸功於 Pragmatic 的低成本柔性晶片製造技術和免許可的 RISC-V 技術。”
以下為關於這項技術的論文全文翻譯:
半導體已經對社會產生了非常深遠的影響,加速了科學研究並推動了更大的連通性。未來的半導體硬體將在量子計算、人工智慧和邊緣計算方面開闢新的可能性,用於網路安全和個性化醫療等應用。就其精神而言,開放硬體為教育、學術研究和行業之間的更大合作和創新提供了機會。
這裡我們介紹了 Flex-RV,這是一款基於開放 RISC-V指令集的 32 位微處理器,採用銦鎵氧化鋅薄膜電晶體在柔性聚酰亞胺基板上製造,可實現超低成本可彎曲微處理器。Flex-RV 還在微處理器內部整合了可程式設計機器學習 (ML) 硬體加速器,並演示了擴展 RISC-V 指令集以運行 ML 工作負載的新指令。它經過實現、製造和演示,運行頻率為 60 kHz,功耗不到 6 mW。其組裝到柔性印刷電路板上時的功能在平坦和緊密彎曲條件下執行程序時得到驗證,平均性能變化不低於 4.3%。
Flex-RV 開創了低於 1 美元的開放標準非硅 32 位微處理器時代,並將使計算訪問變得普及化,並解鎖可穿戴裝置、醫療保健裝置和智能包裝中的新興應用。
文章重點
我們推出了 Flex-RV,這是一款基於開源 32 位 RISC-V 中央處理單元 (CPU) 的 32 位 RISC-V 微處理器,並擴展了機器學習 (ML) 功能,採用銦鎵氧化鋅 (IGZO) 薄膜電晶體 (TFT) 製造,可為新興應用提供超低成本且適應性強的微處理器。
新興應用尚未嵌入微處理器,例如快速消費品(例如智能標籤和包裝)、醫療保健可穿戴裝置(例如智能貼片和敷料)、一次性醫療保健植入物(例如神經介面)和一次性醫療保健測試條(例如橫向流動測試、微流體)主要是因為成本和外形尺寸。成本是實現這些應用的決定性因素,特別是在智能標籤和商品包裝中。
此外,就物理靈活性和可彎曲性而言,外形尺寸對於醫療保健可穿戴裝置和植入物非常重要。這些新興應用對速度和通訊頻寬的計算要求並不高。這些應用中的感測器所需的資料採樣率不高於 200 Hz;在某些情況下,採樣率可以高達 1 kHz,因此以低時脈頻率(例如 <100 kHz)工作的微處理器可以滿足應用的計算要求。
50 多年來,硅 (Si) 一直是開發微處理器的基礎半導體技術,在其發展道路上不斷改進性能、面積、功耗和成本,這主要受到摩爾定律的推動。在此期間,微處理器的速度從 kHz 提高到 GHz,因為電晶體的幾何尺寸從幾微米縮小到今天的 2-3 納米,低端微控製器的單位成本高達幾美元。然而,對於許多新興應用來說,微處理器幾美元的單位成本是行不通的。單位成本無法降至不到 1 美元的水平有三個主要原因:(1) Si 晶圓廠的資本成本;(2) CPU 指令集、智慧財產權 (IP) 許可和非經常性工程 (NRE) 成本;以及 (3) 微處理器晶片封裝成本。
最先進的硅製造廠需要數百萬的資本投資,主要專注於先進節點的高端微處理器(例如 2-3 納米)。低端微處理器(如嵌入式系統的微控製器)可以在較舊的傳統晶圓廠(>65 納米)中生產,以最大限度地降低投資成本。然而,工廠在傳統晶圓廠的投資相對較少,這會導致營運和合規成本隨著時間的推移而增加,同時還會帶來環境問題。
每個微處理器都有一個 CPU,它根據其特定的指令集架構 (ISA) 執行程序,該架構可以是專有的(例如,Intel 和 AMD 的 x86、Arm 的 ARMvX)或開放原始碼的(即 RISC-V)。專有 ISA 提供了成熟的生態系統,但許可成本高昂,並且由於新增新指令通常受到限制,因此提供的定製有限。替代方案包括許可現有 CPU(會產生前期 IP 成本),或開發新的專有 ISA,這需要 CPU 設計 NRE 成本和軟體工具集開發費用,這兩者都會增加單位成本。
硅晶片對環境條件(包括機械應力)敏感。它們易碎,需要組裝到單獨的封裝(例如塑料、陶瓷)上以保護它們免受環境影響。晶片連接、組裝、封裝材料和封裝晶片測試的成本增加了微處理器的名義單位成本。此外,將剛性硅微處理器嵌入這些可穿戴或可植入裝置之一具有挑戰性,因為微處理器的晶片封裝將限制裝置在剛性和厚度方面的能力。必須消除剛性晶片封裝材料,以降低微處理器的成本並使其在新興應用中具有適應性。
我們需要一種超低成本、可適應並提供可接受性能的微處理器,以滿足新興應用的要求。為了實現價格低於 1 美元且物理上靈活的微處理器,兩種支援技術可以幫助我們克服以前的限制:
必須將低於 1 美元的微處理器中 CPU 的 NRE 成本降至最低(例如,ISA/IP 許可)。RISC-V是一種開放且免費的 ISA 標準,允許任何人開發實現 ISA 的 CPU,從而消除了 ISA 許可費,從而消除了微處理器開發的 NRE 成本。此外,RISC-V 生態系統鼓勵創新,不限制修改或擴展(例如,新指令),使設計人員能夠定製微處理器以滿足定製或應用需求,而無需承擔額外成本或限制性許可的負擔。
低於 1 美元的微處理器必須採用替代 Si 的半導體技術在比 Si 晶圓廠(包括傳統晶圓廠)便宜幾個數量級且碳足跡更少的晶圓廠中製造,其中的碳足跡是指晶片設計和製造過程中的二氧化碳排放量。
IGZO 是一種金屬氧化物半導體材料,可用於使用低溫光刻工藝在柔性聚酰亞胺基板上開發 TFT 。TFT 是通過在絕緣體基板上沉積半導體、電介質和電極來製造的,而不是在剛性硅晶片上使用摻雜 Si 來開發 MOSFET(金屬氧化物半導體場效應電晶體)。
Pragmatic的FlexLogic晶圓廠可以製造由 IGZO TFT 製成的柔性晶片或 FlexIC ,與同等 Si 晶圓廠相比,每個 FlexIC 的碳足跡要低幾個數量級。此外,FlexIC 不需要像 Si 晶片那樣使用額外的晶片封裝(例如塑料、陶瓷)來保護它們免受機械應力,因為它們不易碎,可以抵抗彎曲等機械應力。這可以將微處理器的單位成本進一步降低到低於 1 美元的水平,同時還具有彎曲功能。
之前曾有過基於柔性基板的非硅微處理器原型。早期的研究基於使用低溫多晶硅 TFT 和有機、混合氧化物和金屬氧化物 TFT 的 8 位 CPU 。在下文中,作者 介紹了 PlasticARM -第一款基於專有ARM ISA 的 32 位微處理器,該 ISA 使用基於 IGZO 的TFT。
PlasticARM不是可程式設計微處理器,其片上唯讀儲存器中只運行三個硬連執行緒序。雖然不是基於柔性基板,但展示了一種源自 RISC-V ISA 的 16 位 CPU,該 CPU 使用互補碳納米管電晶體在傳統硅晶片上建構。除了非硅微處理器外,先前的研究已經展示了使用在柔性基板上製造的 IGZO TFT 設計和實現的幾種ML ASIC(專用積體電路)。
Flex-RV 在三個方面不同於之前的非硅微處理器:(1)32 位微處理器是可程式設計的,可以運行用高級語言(例如 C)編寫的任意編譯程序。(2)RISC-V 的開源性質允許使用新指令擴展 ISA,因此 Flex-RV 還具有可程式設計 ML 加速器,該加速器與 CPU 緊密耦合,並新增了自訂 RISC-V 指令。(3)我們通過使用為此工作開發的創新技術(稱為邊緣印刷或 OEP)將微處理器裸片組裝到柔性印刷電路板 (FlexPCB) 上,展示了微處理器在晶圓級測試之外的功能,而所有其他以前的工作都是在晶圓級上演示的,無需從玻璃載體上釋放並切割。
這樣,我們就可以在運行程序的同時對 Flex-RV 進行物理彎曲測試,以驗證其在機械應力下的功能。我們演示了組裝到 FlexPCB 上的 Flex-RV 的功能,並在多個測試程序中量化了其性能。我們的結果表明,組裝在 FlexPCB 上的 Flex-RV 可以以高達 60 kHz 的速度運行,同時功耗不到 6 mW,並且可以彎曲到曲率半徑小於 5 mm 時仍能正確執行程序。
這項工作開啟了下一代智能、普適計算的大門,其中靈活、可程式設計的處理器與 ML 功能的整合將智能感知嵌入到日常物品中。
我們使用開源 Serv RISC-V CPU 來實現微處理器,這是迄今為止開發的最小的開源 RISC-V CPU 之一。Serv 是一種位序列 CPU,其中 32 位計算是逐位執行的,而不是像更典型的 CPU 那樣平行執行。這以犧牲性能為代價降低了 32 位 RISC-V 處理器的設計複雜性,其低設計複雜性是選擇 Serv 作為 Flex-RV 的 CPU 的主要原因。我們圍繞 Serv CPU 設計了一個簡單的片上系統 (SOC),以開發可以與外界通訊的微處理器。
Flex-RV 被設計為一個簡單的 SOC,由一個 Serv RISC-V CPU 和附加外設組成。作為 Serv 參考平台開發的 Servant SOC 被用作 Flex-RV 的起點。如圖1a所示,Servant 包含 Serv CPU、暫存器檔案 (RF)、偵錯開關、多路復用器開關、仲裁器、隨機存取儲存器 (RAM) 介面、片上 RAM 塊和通用輸入/輸出 (GPIO) 介面。Serv 支援 RISC-V RV32I ISA,它具有 32 個通用暫存器和 4 個額外的控制和狀態暫存器。程式碼和資料通過偵錯開關從外部儲存器載入到片上 RAM 中。GPIO 介面可用於與外部世界通訊(例如顯示器)。
我們修改了 Servant 中的某些功能來開發 Flex-RV,如圖1b所示。例如,Serv 經過修改以支援 RV32E ISA,它支援與 RV32I 相同的指令集,但僅使用前 16 個暫存器。我們刪除了偵錯開關和片上 RAM。由於當前的 FlexIC 技術出於面積/功率原因不允許我們放置相當大的片上儲存器(例如,>1kB SRAM),我們選擇使用片外儲存器來訪問程式碼和資料,因此新增了自訂序列外設介面 (SPI) 或 C-SPI 塊來與外部儲存器通訊。C-SPI 塊從外部儲存器獲取 32 位 RISC-V 指令,並對儲存器執行 32 位資料載入/儲存操作。使用 C-SPI 與外部儲存器通訊而不是使用平行資料、地址和控制匯流排訪問它的主要原因是為了減少片外焊盤的數量,從而簡化將 Flex-RV 組裝到 FlexPCB 上的過程。C-SPI 塊的詳細資訊(包括記憶體事務)可在方法中找到。
我們還設計了一個可程式設計的 ML 加速器,它是一個 SIMD(單指令多資料)引擎,用於加速當代 ML 演算法中常用的矩陣乘法和後處理操作。ML 加速器作為自訂功能單元 (CFU) 與 Serv 緊密耦合,並在 RV32E ISA 中新增了四條新指令,以便可以對加速器進行程式設計。方法中描述了 ML 模型、加速器架構、四條新指令和程式設計介面的詳細資訊。
Flex-RV 已使用 RISC-V 架構合規套件針對 RV32E ISA 進行了驗證。還開發了幾個測試基準來驗證其功能,這些基準是用 C 語言編寫的(帶有一些內聯彙編程式碼),並使用 RISC-V GNU 編譯器工具進行編譯。測試基準和編譯環境的詳細資訊可以在方法中找到。
我們使用 Pragmatic 的 0.6 µm FlexIC 技術實現 Flex-RV,該技術採用由 n 型 IGZO TFT 和電阻上拉組成的單極邏輯。晶片實現(即綜合、佈局布線、靜態時序分析、佈局布線後模擬和簽核)是使用商用電子設計自動化 (EDA) 工具執行的。RF 是一個雙連接埠陣列,具有一個讀連接埠和一個寫連接埠,陣列大小為 20 × 32 位(或 80 字節)。它使用佈局鄰接方法通過鎖存器實現,以增加陣列的密度(詳情請參閱方法 )。晶片的佈局和晶片照片如圖2所示。測試晶片的晶片尺寸為 9 mm × 6 mm,有 20 個引腳,晶片中裝有兩個 Flex-RV 微處理器。每個 Flex-RV 微處理器的核心面積為 17.5 mm² , NAND等效門數為 12,596,3 V 時的功耗為 5.8 mW。由於電阻上拉邏輯,5.8 mW 功耗主要是靜態的 (99%)。
測試晶片是在 Pragmatic 的 FlexLogic 晶圓廠中製造的,採用薄膜沉積工藝,在厚度為 30 µm 的 200 毫米聚酰亞胺晶圓上製造的,該工藝可建立金屬氧化物 TFT 和電阻器的圖案層,具有四個可布線的金屬層和一個額外的 RDL(重新分佈層),用於將晶片的核心焊盤重新布線到將成為與外部世界介面的外圍焊盤。
測試基礎設施由兩個完整階段組成:(1)玻璃晶圓測試和(2)FlexPCB 測試。
MicroZed Zynq-7000 現場可程式設計門陣列 (FPGA) 板用於測試 Flex-RV。FPGA 晶片經過程式設計以模擬外部儲存器,並通過同樣在 FPGA 上實現的 SPI 塊與晶圓上的 Flex-RV 通訊。編譯後的測試基準的二進制檔案被載入到 FPGA 上的記憶體中,FPGA 板重設測試晶片中的每個 Flex-RV,然後它們開始執行每個核心。測試基準的結果通過每個 Flex-RV 的 GPIO 引腳傳輸,該引腳通過 FPGA 連接到個人電腦 (PC) 的通用非同步接收器-傳送器 (UART) 介面,以在螢幕上顯示結果。FPGA 板還為每個測試晶片提供電源、時鐘和復位訊號。
在第一階段,使用半自動晶圓探針台(圖3a)對晶圓上的測試晶片進行功能測試,以識別功能正常的 Flex-RV。在第二階段,使用 OEP(一種為這項工作開發的新組裝方法)將第一階段識別的功能正常的 Flex-RV 組裝到 FlexPCB 上(圖3b)。然後,組裝好的 FlexPCB 通過 FPC 連接器連接到 FPGA 板(圖3c)。基於 FPGA 的測試基礎設施和 OEP 組裝過程的詳細資訊可以在方法中找到。
圖3d顯示了測試晶片中的 Flex-RV 微處理器在 13 個組裝的 FlexPCB 上運行所有測試基準時可達到的最高時脈頻率(以千赫茲 (kHz) 為單位)的分佈。13 個 FlexPCB 上的平均和最大時脈頻率分別為 52 kHz 和 60 kHz。
最後,我們在機械應力下驗證了 Flex-RV 組裝的 FlexPCB 的功能,並測量了最高可實現時脈頻率的變化。機械應力是通過將每個 FlexPCB 沿著與 FlexPCB 連接器平行的軸(也沿著 Flex-RV 的長度)滾動在非導電圓柱體上來實現的,直到測試晶片彎曲到圓柱體的曲率半徑。已知 IGZO TFT 可以彎曲到 3 毫米的曲率半徑而不會損壞,並且器件參數(例如遷移率和閾值電壓)在不同的應變情況下會發生變化。但是,這些測試針對的是單個 IGZO TFT 器件,而我們主要研究 FlexIC 等級的可彎曲性公差。
目前尚未有研究證明像 Flex-RV 這樣的複雜 FlexIC 單獨或在 FlexPCB 上組裝時通電執行階段的可彎曲性。我們使用三個不同的圓柱體(半徑分別為 3 毫米、4 毫米和 5 毫米)證明了組裝在 FlexPCB 上的 Flex-RV 的可彎曲性,並在拉伸(即晶片的曲率向外)和壓縮(即晶片的曲率向內)模式下對其進行測試,如圖4a、b分別所示。總共對包含九個 Flex-RV 微處理器的七個組裝 FlexPCB 進行了可彎曲性分析測試。這是一個動態可彎曲性測試,因為在晶片中的兩個 Flex-RV 微處理器都在運行測試基準時,會滾動 FlexPCB 並彎曲 Flex-RV 晶片——圖4c中顯示了一個示例。
當 FlexPCB 平放時,測試基準開始在微處理器上運行。在程式執行時,FlexPCB/Flex-RV 會繞圓柱體彎曲至拉伸模式,然後恢復至平坦狀態。接下來,它們會彎曲至壓縮模式,然後再恢復至平坦狀態。每個 FlexPCB 上的 Flex-RV 微處理器都會重複此操作兩次。
圖4d顯示了在三個不同彎曲半徑下彎曲實驗的加速結果。在動態彎曲測試期間,當晶片處於拉伸或壓縮模式時,在每個 Flex-RV 微處理器上運行測試基準直至完成。我們在拉伸或壓縮模式下測量 Flex-RV 微處理器在所有測試基準中可實現的最高時脈頻率,並將其與平坦時可實現的最高時脈頻率進行比較,即時脈頻率的加速。我們的結果表明,當每個微處理器回到其最高可實現時脈頻率時,即在兩個平坦位置、兩個拉伸和壓縮模式之間,Flex-RV 微處理器表現出靈活性。
我們還觀察到兩種趨勢:(1) Flex-RV 在拉伸模式下運行速度更快,但在壓縮模式下運行速度更慢,這歸因於裝置(即 TFT 和電阻器)和導線參數(例如電阻和電容)的變化。(2) 隨著曲率半徑的減小,其在拉伸模式下的性能會提高。這是因為隨著晶片的拉伸力增加,器件和導線參數會按比例變化,從而提高 Flex-RV 的性能,而在壓縮模式下則相反。彎曲實驗表明,Flex-RV 在 3 毫米的彎曲半徑下可以正常工作,並且平均而言,與平坦位置相比,Flex-RV 在拉伸模式下的運行速度可以提高 2.3%,在壓縮模式下的運行速度可以降低 4.3%。
我們開發了一款低於 1 美元、可彎曲且靈活的微處理器 Flex-RV,它採用基於 0.6 µm IGZO TFT 技術的非硅技術,並支援開放的 RISC-V 指令集。此外,我們在 Flex-RV 中加入了可程式設計硬體加速器,以支援 ML 應用。Flex-RV 在低成本、低環境足跡的 FlexLogic 晶圓廠中在厚度為 30 µm 的聚酰亞胺基板上製造,然後組裝到厚度為 45 µm 的 FlexPCB 上,建構超薄計算系統。我們的實驗結果表明,Flex-RV 的運行速度可以高達 60 kHz,總功耗不到 6 mW,並且可以在低至 3 mm 的彎曲曲率半徑內正常運行,運行程序時的性能變化範圍平均為加速 2.3% 到減速 4.3%。因此,它可以滿足快速消費品、可穿戴裝置和醫療保健裝置中許多新興應用的需求。
Flex-RV是建構不依賴任何傳統電子元件的超低成本可彎曲電腦的重要里程碑。 (半導體行業觀察)