#快閃記憶體
NAND價格兩個月內飆升80%
隨著NAND快閃記憶體價格短期內飆升,供應短缺的跡象開始顯現。據市場研究公司DRAMeXchange 4月14日發佈的資料顯示,自2月底以來的大約六周內,NAND快閃記憶體現貨價格已上漲近80%。SLC 2Gb固態硬碟的價格從2月底的2.10美元上漲了約62%,至4月初的3.41美元;而SLC 1Gb固態硬碟的價格則從1.75美元上漲了約64%,至2.87美元。同期,MLC 64Gb產品價格從8.37美元飆升約79%至15.00美元,32Gb產品價格也從5.25美元上漲約65%至8.67美元。現貨價格是分銷市場形成的指標;雖然波動性很大,但它們被認為是反映供需變化的先行指標。由於此次價格上漲涵蓋了從低容量到中容量的整個產品範圍,一些人將其解讀為供需結構轉變的初始階段,而不僅僅是簡單的庫存調整。首先,供應方面仍然存在限制。由於主要儲存器製造商將裝置和投資集中於高頻寬記憶體(HBM)的生產,NAND的擴張仍然有限。分析表明,三星電子和SK海力士也在調整其生產比例,以專注於高利潤的HBM快閃記憶體和企業級固態硬碟,這一過程正在減少通用NAND快閃記憶體的供應,加劇了供應緊張的局面。與此同時,需求正在結構性地增長。這是因為隨著人工智慧(AI)行業從以學習為中心的方法轉向以推理為中心的方法,資料儲存需求正在激增。隨著企業級固態硬碟(SSD)在資料中心和伺服器中的應用不斷擴大,NAND快閃記憶體的需求基礎正在迅速重塑。全球投資銀行摩根大通在近期的一份報告中分析指出,“未來三年,受企業級固態硬碟(SSD)需求增長的推動,NAND市場將以年均30%的速度增長”,並補充道,“NAND正在從以消費者為中心的儲存領域轉型為人工智慧基礎設施的核心領域。”美國金融投資公司Evercore ISI也評估認為,“NAND正在從周期性儲存領域轉型為受益於人工智慧的結構性產業”,並指出“至少到2028年,NAND的供應仍將保持有限,而需求卻在加速增長。”這種環境促使雲公司與儲存裝置製造商之間的戰略合同不斷增多。隨著包含價格底線和預付款等條款的合同結構日益普及,市場波動性也呈現出緩解的跡象。三星電子的“QLC第九代V-NAND”產品。全球NAND廠商正在研發的下一代技術——高頻寬快閃記憶體(HBF)技術也備受關注。去年,SanDisk 在一次投資者簡報會上公佈了其 HBF 開發路線圖。HBF 是一種將 TSV 堆疊技術應用於 NAND 快閃記憶體的結構,旨在提高頻寬和擴展容量;目前該技術正在開發中,目標是在年內交付樣品,並在 2027 年實現全面應用。在韓國,被譽為“HBM 之父”的韓國科學技術院 (KAIST) 金正浩教授於去年二月發表了題為“HBF 技術開發成果、路線圖及商業化戰略”的演講,介紹了該技術路線圖。金教授解釋說:“如果說 CPU 是 PC 時代的關鍵,低功耗是智慧型手機時代的關鍵,那麼記憶體就是人工智慧時代的關鍵。”他補充道:“HBM 決定速度,而 HBF 決定容量。” (大話晶片)
傳:蘋果擬牽手長江儲存!中國iPhone:或搭載國產快閃記憶體晶片!
蘋果擬牽手長江儲存,國產快閃記憶體或將打入中國版 iPhone據行業爆料,蘋果計畫在中國市場銷售的 iPhone 搭載長江儲存 NAND 快閃記憶體晶片。此舉旨在應對儲存晶片漲價,緩解利潤壓力。去年下半年以來,全球儲存晶片進入漲價周期。手機行業整體利潤被嚴重擠壓。此前受美國禁令限制。蘋果儲存晶片供應高度依賴三星、SK 海力士。蘋果在供應鏈中幾乎沒有議價主動權。為保障供應穩定,蘋果接受了三星 100% 的漲價合約。而三星最初漲價預期僅為 80%。目前蘋果單顆 LPDDR5X 記憶體晶片採購成本已達 70 美元。高額成本持續壓縮 iPhone 利潤。國產晶片技術已實現重大突破。長江儲存自研 Xtacking4.0 技術,已量產 300 層以上 3D NAND 快閃記憶體。產品性能對標三星 286 層、SK 海力士 321 層旗艦產品。可滿足蘋果嚴苛的品控要求。《日經亞洲》報導:中國設定半導體行業自給率提升至 80% 的戰略目標。國產儲存廠商的技術突破是國產化處理程序的核心體現。行業分析認為:蘋果僅在中國市場機型採用長江儲存晶片。這是兼顧成本與風險的最優選擇。既能通過本土供應鏈降低成本、保住利潤。也能規避美國國內輿論與政策壓力。新供應商的加入將打破韓系廠商供應壟斷。蘋果在供應鏈談判中將重獲主動權。此次合作屬於雙贏:蘋果可在行業波動中鞏固市場優勢;國內半導體供應鏈國產化處理程序也將進一步加速。 (深科技)
凡人看戲:機構再次警告,全球儲存大缺貨將持續至2027年底
電腦手機都買好了嗎?韓國媒體《先驅報》報導,根據市場調研機構 Counterpoint Research 在11日舉行的線上研討會上的最新報告,全球記憶體(DRAM)與快閃記憶體(NAND)價格正迎來史詩級暴漲,部分通用產品的價格甚至在短短一個季度內翻了三倍。Counterpoint 的資料顯示,受 AI 基礎設施建設對算力的極度飢渴影響,儲存市場的供需天平已徹底失衡。以春節為節點,伺服器常用的 64GB DDR5 模組價格較前一季度飆升了 150%,手機端的 12GB LPDDR5X 漲幅達 130%。更令人錯愕的是,即便是不再是主流的筆記本用 8GB DDR4 記憶體,其價格也由於產能向高端轉移而暴漲了 180%。不僅是 DRAM,NAND 快閃記憶體系列產品的漲幅也維持在 130% 至 150% 之間,這種全線飄紅的態勢在行業史上極其罕見。針對這一困局,Counterpoint 認為即便三星電子和 SK 海力士今年砸下近 90 兆韓元(約合 4900 億人民幣)進行產能擴張,依然無法在短期內填平缺口。分析師黃敏成指出,雖然各大巨頭今年的生產規模將增長約 25%,但真正的有效供應量釋放要等到 2027 年下半年。這意味著,這場“晶片荒”可能還要持續兩年之久,價格在今年下半年幾乎沒有回呼的可能。在備受關注的 HBM 領域,競爭格局也在發生微妙變化。SK 海力士在 HBM3e 時代曾佔據約 60% 的市場份額,但在下一代 HBM4 的爭奪中,三星電子似乎正憑藉更早的量產進度和認證優勢實現反超。海力士由於在部分高性能產品的適配上遭遇技術調整,目前正處於追趕狀態。此外,報告還特別警告了我們國記憶體儲勢力的崛起,CXMT 長鑫的市佔率有望在 2028 年突破 10%,而NAND製造商 YMTC 長江儲存已經佔據了全球13% 的市場份額,成為老牌巨頭們不可忽視的競爭對手。《先驅報》還指出,由於雲服務商(Hyperscalers)的採購需求依然維持在高位,儲存廠商已開始將主要精力轉向高利潤的 AI 定製化產品,甚至不惜壓縮部分通用記憶體的生產計畫。對於普通消費者而言,在“晶片漲價潮”與“電費普漲”的雙重壓力下,未來一兩年的電子產品購買成本恐怕將持續維持在高位。 (AMP實驗室)
NOR FLASH火了
快閃記憶體包括NOR Flash(或非快閃記憶體)和NAND Flash(與非快閃記憶體),其中NAND Flash佔據快閃記憶體市場95%以上份額。NOR Flash(或非快閃記憶體)憑藉獨特的技術特性,在工業、汽車等專業領域佔據一席之地。作為非易失快閃記憶體的兩大核心技術路徑之一,NOR Flash歷經數十年發展,在物聯網、汽車電子、AI伺服器等新興場景的驅動下,正從“小眾利基市場”邁向“高成長賽道”。而在這一浪潮中,本土MCU企業的佈局尤為關鍵。以中微半導為代表的本土企業,正憑藉MCU賽道的技術與客戶優勢,加速切入這一高成長領域,推動NOR Flash從“小眾剛需”向“規模化應用”邁進。01什麼是NOR Flash?NOR Flash的發展始於上世紀80年代,1988年相關技術率先由東芝的富士雄研發,後經Intel推動產業化,徹底打破了此前EPROM(Erasable Programmable Read-Only-Memory,電可程式設計序唯讀儲存器)和EEPROM(Electrically Erasable Programmable Read - Only Memory,電可擦唯讀儲存器)一統唯讀儲存器市場的格局。緊隨其後的1989年,東芝推出NAND Flash,二者形成鮮明互補:NOR側重程式碼儲存,而NAND Flash以高儲存密度、低成本為優勢,主導大容量資料儲存。NOR Flash的特點是採用平行定址結構,晶片內執行(XIP,eXecute In Place),這樣應用程式可以直接在快閃記憶體內運行,無需載入至系統RAM,且具備長資料保留時間、耐熱、低功耗、擦寫壽命長(約10萬次)等特性。儘管其儲存密度低、單位容量成本高,寫入與擦除速度較慢,但在小容量、高可靠性、快速響應的場景中具有不可替代性,早期主要應用於功能機等裝置的韌體儲存,如今已逐步拓展至更廣泛的專業領域。而NAND 由於具備極高的儲存單元密度,可實現高儲存密度,且寫入、擦除速度表現優異;其落地應用的的困難在於需要配套專用的系統介面完成快閃記憶體的高效管理。讀寫性能上,NOR 的讀取速度略優於 NAND,而 NAND 的寫入速度則遠勝 NOR。02多領域需求驅動NOR Flash量價齊升隨著物聯網、汽車電子、人工智慧等產業的快速發展,NOR Flash的應用場景持續拓寬,市場需求迎來爆發式增長,推動其從細分領域走向規模化應用。在物聯網與AIoT領域,MCU(微控製器)的應用也越來越廣。早期MCU通過內建EEPROM或外接小容量NOR Flash即可滿足需求,但隨著智能裝置功能不斷豐富,系統升級、音訊儲存、GUI圖片顯示、視訊快取、協議棧等需求催生了更大容量的儲存需求,MCU配套的NOR Flash也逐步向更高容量升級。人工智慧趨勢下,端側AI需求爆發進一步放大了這一趨勢,AI耳機、智能手環、AR/VR裝置、智能音箱、具身智慧型手機器人、AI玩具等終端產品,對儲存的快速響應能力和可靠性要求極高,且多數場景無需大容量儲存,恰好契合NOR Flash的技術優勢。比如,TWS耳機(內建1顆NOR以儲存系統程式碼)、智能手錶/手環(內建/外接1顆NOR)、AR/VR(通常配置1顆NOR)等可穿戴裝置市場快速發展,帶來巨大的NORFlash潛在需求量。汽車電子領域的增長同樣迅猛。數字座艙、自動駕駛(ADAS)的快速發展,推動車載儲存需求持續攀升。NOR Flash的即時啟動(instant-on)特性,使其成為汽車儀表板的理想選擇。相較於NAND Flash,其長資料保留、耐熱、快速啟動程式碼的優勢,完美匹配車載場景的嚴苛要求。而整個ADAS系統對NOR Flash的需求則更大。由於ADAS功能的複雜化正在推動智能感測器的普及,如前置攝影機、成像雷達,甚至雷射雷達,因此需要大量高密度NOR Flash。特別是進入自動駕駛時代之後,每顆攝影機、雷達均需要一顆儲存晶片與其配套使用,攝影機和雷達會將所感知到的路面資訊寫入儲存晶片中,並通過專有演算法對寫入的資料進行運算、分析,快速做出緊急避讓、制動等操作,這一需求只有NOR Flash能夠勝任。AI伺服器的爆發式增長,成為NOR Flash需求的“超級引擎”。HBM4(高頻寬記憶體)技術架構的革新,使得DRAM堆疊層數從HBM3的12層躍升至16-20層,其物理結構與電源管理邏輯更為複雜。NOR Flash承擔著AI伺服器系統初始化、安全啟動和韌體儲存的核心功能,能夠滿足HBM4每層DRAM獨立電源管理與初始化的需求。隨著AI伺服器從HBM3E向HBM4升級,單台裝置的NOR Flash用量從1-2顆增至3-5顆,行業資料顯示用量增幅達50%。在AI訓練叢集中,系統需頻繁、可靠地呼叫底層指令,NOR Flash的低延遲、高可靠性使其成為不可替代的部件。需求的持續火爆也引發了漲價潮。中微半導1月27日發佈漲價通知函稱,受當前全行業晶片供應緊張、成本上升等因素的影響,封裝成品交付周期變長,成本較此前大幅度增加,框架、封測費用等成本也持續上漲。鑑於當前嚴峻的供需形勢以及巨大的成本壓力,經過慎重研究,決定於即日起對MCU、Nor flash等產品進行價格調整,漲價幅度15%~50%。03本土MCU企業佈局NOR Flash的戰略邏輯日前,國內MCU龍頭中微半導正式官宣首款非易失性儲存器晶片CMS25Q40A,以4M bit低功耗SPI NOR Flash產品敲開儲存領域大門,開啟“MCU+儲存”佈局。MCU與NOR Flash是天然“黃金搭檔”。絕大多數搭載MCU的嵌入式裝置,都需要外掛NOR Flash儲存程序。這一天然協同性,也推動了本土MCU企業紛紛切入NOR Flash領域,成為產業發展的重要趨勢。NOR Flash與MCU在半導體設計及製造工藝層面具備天然共通性,二者同屬嵌入式系統核心晶片,均需攻克低功耗設計、高可靠性保障、嵌入式儲存最佳化等關鍵技術。企業依託在NOR Flash領域沉澱的工藝經驗、IP資源儲備及客戶管道優勢,可高效推進MCU產品研發,落地“儲存+控制”平台化戰略,顯著降低研發成本與市場風險。這一戰略已得到多家企業實踐驗證:兆易創新、恆爍股份均明確將自身定位為“儲存+控制”領域服務商,借助NOR Flash的管道協同效應拓展MCU業務;普冉則推行“儲存”與“儲存+”雙輪驅動戰略,一方面持續完善原有儲存產品線的全系列佈局,強化工藝性能領先優勢,聚焦中高端工控、車載客戶拓展及新增領域增量機會,為市佔率提升築牢產品根基;另一方面,“儲存+”類股下的MCU與VCM Driver產品快速打響品牌知名度,實現業務持續高速增長。本土MCU企業佈局NOR Flash有三大原因:一是完善產品生態,強化客戶粘性。MCU作為智能裝置的核心控制晶片,通常需外掛儲存晶片儲存程式碼、配置參數等關鍵資料。若MCU企業實現NOR Flash自主供給,可建構“MCU+Flash”一站式解決方案,不僅能有效降低客戶採購成本及供應鏈管理難度,更能通過產品協同繫結客戶需求,顯著增強客戶粘性。二是拓展業務邊界,挖掘新增量。儘管NOR Flash市場規模不及DRAM、NAND Flash,但在汽車電子、工業控制、物聯網裝置等領域具備不可替代性,尤其適配小容量、低功耗應用場景。MCU企業可憑藉既有的客戶資源與技術積累切入該領域,突破原有業務邊界,挖掘細分市場新增長點。三是把握國產化機遇,搶佔細分市場。全球NOR Flash市場長期由華邦、旺宏等國際廠商主導,近年來國產企業市場份額逐步提升,國產替代趨勢顯著。MCU企業可順勢而為,以中小容量產品為切入點,避開與頭部廠商在高密度、車規級產品上的直接競爭,精準搶佔細分市場份額。當然,新進入者也面臨不小挑戰:NOR Flash市場已形成兆易創新、普冉股份等頭部企業,新玩家需在性能、成本、可靠性上實現突破;產品系列化需持續投入大量研發資源,可能影響MCU傳統業務的迭代速度;同時,市場受產能、需求波動影響較大,價格起伏可能衝擊企業盈利能力。不難看出,MCU企業佈局NOR Flash,是依託技術協同、把握國產化機遇的戰略選擇,已成為近年來半導體行業的重要發展趨勢,同時也需應對市場競爭與資源分配等多重挑戰。043D NOR快閃記憶體:非易失性儲存革命為了適應人工智慧、智能汽車等產業發展,HBM、HBF、HBS等各類堆疊方案層出不窮。而在NOR Flash領域,這些應用也對更高密度、更快訪問速度和更高可靠性的快閃記憶體提出更高要求。傳統2D NORFlash已近接物理和性能極限,其平面架構限制了其可擴展性。3D NOR Flash通過垂直堆疊儲存單元,徹底解決了2D架構的可擴展性難題。以旺宏電子(Macronix)的產品線為例,2D NOR Flash單裸片最大容量僅為512Mb,若需更高密度需採用多裸片系統級封裝(SiP);而3D NOR Flash單裸片容量可達到4Gb,儲存密度實現跨越式提升。這一特性使其成為有限物理空間內需要大量非易失性儲存場景的理想選擇,能夠減少終端裝置對eMMC和NAND等多儲存器件的依賴。除了儲存密度的提升,3D NOR Flash還具備更短的訪問延遲,顯著最佳化了裝置啟動性能,這對於汽車儀表板、AI伺服器等需要近乎即時訪問儲存資料的應用至關重要。隨著3D NOR技術的成熟與量產,其將進一步滿足汽車電子、AI伺服器等高端場景的高性能需求。從技術迭代到需求爆發,從本土突圍到產業升級,NOR Flash在多領域剛需的推動下,成為半導體產業中極具增長潛力的黃金賽道。未來,隨著3D NOR等技術的持續突破,以及國產化處理程序的加速,NOR Flash市場將迎來更為廣闊的發展空間。 (半導體產業縱橫)
NAND快閃記憶體告急,企業儲存策略的生死時刻
NAND快閃記憶體告急:企業儲存策略的生死時刻📊 供應鏈危機正在重塑遊戲規則2025年7月,1TB TLC NAND的價格還停留在4.80美元,到11月已經飆升至10.70美元。不到半年時間,價格翻了一倍多。更要命的是,主要NAND供應商已經把2026年的產能全部售罄。這不是什麼"暫時性波動",這是AI超級周期對傳統供應鏈的一次降維打擊。🚨 現實壓力測試當前採購周期已經延長到數月,價格波動劇烈且不可預測。那些還在依賴傳統硬體定義儲存系統和超融合架構(HCI)的組織,正在為等待特定SKU而付出真金白銀的代價。問題的核心在於:你的儲存架構是為"供應鏈永遠穩定"這個幻覺設計的。現在幻覺破滅了。💣 傳統架構的四重困局困局一:硬體鎖定就是自我閹割專有裝置的邏輯很簡單,供應商賣給你一個黑盒子,你只能用他們的零件、他們的升級路徑、他們的時間表。NAND短缺來了,供應商說"抱歉,缺貨",你的整個創新路線圖就這樣凍結了。這不是技術問題,這是戰略失敗。💡 破局思路軟體定義儲存(SDS)的核心價值在於解耦:儲存軟體不再繫結特定硬體。你可以在行業標準伺服器上部署,可以用資料中心現有的硬體資產。採購不再是"等廠商發貨",而是"我需要什麼就買什麼"。困局二:SSD異構性變成了營運噩夢看看你資料中心裡的SSD,不同廠商、不同容量、不同世代、不同NAND類型。傳統儲存系統面對這堆"雜牌軍"基本抓瞎,要麼閒置、要麼性能拉胯。但這恰恰是現實。沒有那個組織能保證每次採購都買到完全一樣的硬碟。🎯 現代方案先進的SDS平台設計上就是為了"規範多樣性"。它把所有可用的SSD抽象成單一高性能儲存層,不管製造商是誰、容量多大。採購的變異性不再是問題,反而變成了靈活性。困局三:效率是軟體的事,別指望硬體當快閃記憶體價格翻倍,你還想靠堆硬體解決問題?那是用錢砸出來的低效。真正的效率來自軟體層:智能資源池化、精細化管理、資料壓縮最佳化。更高的利用率意味著同樣的物理硬體能支撐更多工作負載,新採購可以推遲甚至取消。📈 實際收益這意味著昂貴的計算資源能高效使用,而新儲存採購卻被推遲或取消。供應短缺的影響被直接削弱。困局四:短視的壽命觀會讓你持續受困挺過這輪供應鏈中斷不算本事,長期韌性才是真功夫。這取決於你能把現有基礎設施的生命周期延長到什麼程度。現代SDS平台已經把快閃記憶體管理的責任攬到軟體層了——監控介質健康、最佳化磨損分佈。結果是硬碟故障率下降,刷新周期延長,資本支出降低。壽命,而不僅僅是性能,已經成為2026年資料儲存策略的決定性指標。🎯 四項生存原則✅ 原則一:打破硬體依賴將儲存軟體與硬體解耦。不要圍繞供應商的發貨能力設計系統,而是圍繞你的業務需求。部署速度更快,採購靈活性更大,關注點從"硬體問題"轉向"軟體能力"。✅ 原則二:讓每台SSD都能用設計能抽象異構性的系統。不管什麼牌子、什麼容量、什麼世代的SSD,都要能集中到統一的高性能儲存層。沒有硬碟應該閒置。✅ 原則三:效率是軟體問題停止用硬體堆砌來彌補低效。通過軟體層的智能管理、資源池化和資料最佳化,用更少的物理硬體支撐更多工作負載。這才是對抗供應短缺的正確姿勢。✅ 原則四:壽命決定韌性讓軟體層承擔快閃記憶體管理責任,監控健康、最佳化磨損。延長刷新周期,降低資本支出,避免未來的供應風險。🔮 更大的圖景供應鏈短缺不是"危機",它是"篩選機制"。它暴露了那些僵化、專有、基於裝置的儲存系統的本質缺陷。這些系統讓你的組織變得脆弱、被動、容易受傷。而拆分式的軟體定義儲存架構給了你真正的靈活性——你能適應供應條件的變化,而不是被它限制。你能更快部署和配置,更有效利用硬體,無論NAND供應連結下來發生什麼,都能保持營運動力。💬 金句"組織的韌性不是靠等供應鏈恢復正常得來的。它由軟體架構定義,讓稀缺性和價格波動變得可控,讓敏捷性成為默認狀態。"🤔 跳出框架的思考這場NAND危機暴露的其實是更深層的問題:我們為什麼要把資料基礎設施的命運交給矽片供應商?過去二十年,整個行業都在追求"垂直整合"——硬體、軟體、服務打包銷售。這在供應鏈穩定時看起來很美好,但本質上是把風險外包給了你無法控制的環節。真正的反脆弱不是"更強的供應鏈",而是"不依賴單一供應鏈"。當你的儲存架構能相容任何硬體、能最佳化任何資源、能延長任何裝置的生命周期時,供應商的產能問題就變成了他們自己的問題,不再是你的問題。這不是技術路線的選擇,這是商業生存的選擇。2026年,那些還在等"合適的SKU"到貨的組織,會發現他們不只是等硬體,他們在等一個永遠不會回來的時代。 (芯在說)
儲存還要繼續瘋!輝達ICMSP讓快閃記憶體漲停,黃仁勳要一統儲存處理器
輝達推出全新推理上下文(Inference Context)記憶體儲存平台(ICMSP),通過將推理上下文解除安裝(Offload)至NVMe SSD的流程標準化,解決KV快取容量日益緊張的問題。該平台於 2026 年國際消費電子展(CES 2026)正式發佈,致力於將GPU的KV快取(Key-Value Cache)擴展至基於 NVMe 的儲存裝置,並獲得輝達 NVMe 儲存合作夥伴的支援。此消息一出,引爆的是本就漲到高不可攀的儲存廠商股價,多家儲存廠商和快閃記憶體控製器廠商股價直接漲停,快閃記憶體極有可能步DRAM後塵成為AI基建帶動下第二波緊俏儲存器,儲存價格特別是快閃記憶體價格在2026年可能成為儲存產品整體價格繼續飆漲的第二輪推動力。從某個角度考慮,ICMSP的推出,讓GPU晶片可以降低對大容量HBM產品的嚴重依賴,同時也讓AMD同步發佈的Helios機架平台變得有些“過時”,因為輝達已經邁向了存算結合的新階段。不過相比這些,黃仁勳在解答分析師問題時更是直言“我們現在是全球最大的網路公司。我預計我們還將成為全球最大的儲存處理器公司”,通過不斷收購儲存技術,輝達致力於在AI算力體系架構中,擁有更多的話語權。從這點來看,ICMSP將成為輝達在AI走向千行百業的工程化過程中主導的技術之一。認識一下ICMSP在大型語言模型推理過程中,KV快取用於儲存上下文資料 —— 即模型處理輸入時,表徵令牌間關係的鍵(keys)和值(values)。隨著推理推進,新令牌參數不斷生成,上下文資料量持續增長,往往會超出 GPU 的可用記憶體。當早期快取條目被淘汰後又需重新呼叫時,必須重新計算,這會增加延遲。智能體 AI(Agentic AI)和長上下文工作負載進一步加劇了這一問題,因為它們需要保留更多上下文資料。而 ICMSP 通過將 NVMe 儲存上的 KV 快取納入上下文記憶體地址空間,並支援跨推理任務持久化儲存,有效緩解了這一困境。輝達創始人兼CEO黃仁勳表示:“人工智慧正在徹底變革整個計算架構 —— 如今,這場變革已延伸至儲存領域。人工智慧不再侷限於一次性互動的聊天機器人,而是能理解物理世界、進行長周期推理、立足事實、借助工具完成實際工作,並具備短期和長期記憶的智能協作夥伴。借助BlueField-4,輝達與軟硬體合作夥伴正為人工智慧的下一個前沿領域重塑儲存架構。” 他在CES演講中提到,通過BlueField-4,機櫃中可直接部署KV快取上下文記憶體儲存。隨著 AI 模型規模擴展至兆參數等級,且支援多步驟推理,其生成的上下文資料量極為龐大,同時運行的此類模型數量也在不斷增加。KV 快取軟體(即 ICMSP)需適配GPU、GPU 伺服器及 GPU 機櫃叢集,這些裝置可能同時處理多種不同的推理工作負載。每個模型 / 智能體工作負載的參數集都需妥善管理,並能精準對接運行在特定 GPU 上的目標AI模型或智能體 —— 且這種對應關係可能隨任務調度動態變化。這意味著需要專門的 KV 快取上下文中繼資料管理機制。基於NVMe的KV快取儲存需實現跨層級相容,涵蓋 GPU、GPU 伺服器、GPU 機櫃乃至多機櫃叢集。輝達表示,ICMSP 不僅提升了 KV 快取容量,還加速了機櫃級 AI 系統叢集間的上下文共享。多輪互動 AI 智能體的持久化上下文特性,提高了響應速度,提升了 AI 工廠的吞吐量,並支援長上下文、多智能體推理的高效擴展。圖1 基於 NVMe 的 KV 快取儲存需實現跨層級相容,覆蓋GPU、GPU 伺服器、GPU機櫃乃至GPU機櫃叢集ICMSP 依賴Rubin GPU叢集級快取容量,以及輝達即將推出的BlueField-4資料處理器(DPU)—— 該處理器整合Grace CPU,吞吐量高達 800 Gbps。BlueField-4 將提供硬體加速的快取部署管理功能,消除中繼資料開銷,減少資料遷移,並確保GPU節點的安全隔離訪問。輝達的軟體產品(包括DOCA框架、Dynamo KV快取解除安裝引擎及其內建的 NIXL(輝達推理傳輸庫)軟體實現了 AI 節點間 KV 快取的智能加速共享。儲存架構必須重構,在這個過程中,上下文成為新瓶頸,主要體現在模型規模持續擴大、上下文(Context)長度不斷增加、多輪對話導致上下文(Context)累積以及並行使用者與會話數量增多等方面。圖2 黃仁勳在 CES 2026 展示的上下文瓶頸幻燈片Dynamo支援跨記憶體和儲存層級的協同工作,覆蓋GPU的高頻寬記憶體(HBM)、GPU 伺服器 CPU 的動態隨機存取儲存器(DRAM)、直連 NVMe SSD 及網路附加儲存。此外,還需搭配輝達Spectrum-X乙太網路,為基於RDMA的AI原生KV快取訪問提供高性能網路架構。輝達稱,ICMSP的能效將比傳統儲存提升5倍,令牌每秒處理量最高可提升5倍。圖3 黃仁勳在 CES 2026 展示的推理上下文記憶體儲存平台幻燈片行業反饋鑑於輝達在AI算力架構方面擁有絕對的話語權,ICMSP的推出必定會得到一眾合作夥伴的鼎力支援,以免錯失商機。輝達列出了眾多將通過BlueField-4支援ICMSP的儲存合作夥伴,BlueField-4 將於 2026 年下半年正式上市。首批合作夥伴包括 AIC、Cloudian、DDN、戴爾科技、HPE、日立資料系統、IBM、Nutanix、Pure Storage、超微(Supermicro)、VAST Data 和 WEKA。預計 NetApp、聯想(Lenovo)和 Hammerspace 也將後續加入。將KV快取解除安裝或擴展至NVMe SSD的架構理念,其實已有廠商率先實踐 —— 例如 Hammerspace的零級儲存技術(Tier zero tech)、VAST Data的開放原始碼軟體VAST Undivided Attention(VUA),以及WEKA的增強記憶體網格(Augmented Memory Grid)。戴爾也通過在PowerScale、ObjectScale和閃電計畫(Project Lightning,私人預覽版)儲存產品中整合LMCache和NIXL等技術,實現了KV快取解除安裝功能。這些均為基於BlueField-3的解決方案。如今,輝達旨在為所有儲存合作夥伴提供標準化的KV快取記憶體擴展框架。戴爾、IBM、VAST Data和WEKA已明確表示將支援 ICMSP。WEKA在題為《上下文時代已然來臨》的部落格中,詳細闡述了支援該平台的實施方案及核心原因,指出ICMSP是 “一類新型 AI 原生基礎設施,將推理上下文視為一級平台資源。這一架構方向與WEKA的增強記憶體網格高度契合,後者通過擴展 GPU 記憶體,實現了大規模、無限量、高速、高效且可復用的上下文儲存。”WEKA產品行銷副總裁Jim Sherhart表示:“為上下文資料套用為長期儲存資料設計的重量級持久性、複製和中繼資料服務,會產生不必要的開銷 —— 導致延遲增加、功耗上升,同時降低推理經濟性。”“推理上下文固然需要適當的管控,但它的特性與企業級資料不同,不應強行套用企業級儲存語義。傳統協議和資料服務帶來的開銷(如中繼資料路徑、小 I/O 放大、默認的持久性 / 複製機制、在錯誤層級施加的多租戶控制),可能將‘高速上下文’降級為‘低速儲存’。當上下文對性能至關重要且需頻繁複用的情況下,這種開銷會直接體現為尾部延遲增加、吞吐量下降和效率降低。”VAST Data 表示,其儲存/AI作業系統將運行在BlueField-4處理器上,“打破傳統儲存層級界限,提供機櫃級共享KV快取,為長上下文、多輪對話和多智能體推理提供確定性訪問性能。”VAST 全球技術合作副總裁John Mao稱:“推理正逐漸成為一個記憶體系統,而非單純的計算任務。未來的贏家不會是擁有最多原始計算資源的叢集,而是那些能以線速遷移、共享和管控上下文的叢集。連續性已成為新的性能前沿。如果上下文無法按需獲取,GPU 將陷入閒置,整個系統的經濟性將徹底崩塌。通過在輝達 BlueField-4 上運行 VAST AI 作業系統,我們正將上下文轉化為共享基礎設施 —— 默認高速、按需提供策略驅動管控,並能隨著智能體 AI 的規模擴展保持性能穩定性。”關於ICSMP,黃仁勳在CES 2026後答分析師會議上做了更多詳細的說明,其中最驚人的是黃仁勳表態希望未來輝達成為最大的儲存處理器公司,從而掌握更巨量資料話語權。Aaron Rakers- 富國銀行證券有限責任公司研究部:目前供應鏈面臨著諸多動態變化,比如 DRAM 價格、供應可用性等問題。我想瞭解你們對供應鏈的看法。黃仁勳(Jen-Hsun Huang:我們的供應鏈涵蓋了上游和下游。我們的優勢在於,由於我們的規模已經非常龐大,而且在如此大的規模下仍然保持快速增長,我們很早就開始為合作夥伴準備應對這種大規模的產能擴張。過去兩年,大家一直在和我討論供應鏈問題 —— 這是因為我們的供應鏈規模巨大,而且增長速度驚人。每個季度,我們的增長規模都相當於一家完整的公司,這還只是增量部分。我們每季度都在新增一家大型上市公司的規模。因此,我們在 MGX(機架級產品)方面所做的所有供應鏈最佳化工作。我們之所以如此注重元件標準化、避免生態系統和供應鏈資源浪費、並為合作夥伴提供大量投資(包括預付款支援),就是為了幫助他們擴大產能。我們談論的不是數百億美元,而是數千億美元的投入,以幫助供應鏈做好準備。因此,我認為我們目前的供應鏈狀況非常良好,這得益於我們與合作夥伴長期穩定的合作關係。而且,大家應該知道,我們是全球唯一一家直接採購 DRAM 的晶片公司。仔細想想,我們是全球唯一一家直接採購DRAM的晶片公司。有人問我們為什麼要這麼做?因為事實證明,將DRAM整合為CoWoS(晶圓級系統整合)並打造超級電腦的難度極大。而建立這樣的供應鏈體系,給了我們巨大的競爭優勢。現在市場環境雖然嚴峻,但我們很幸運擁有這樣的技術能力。說到功耗,看看我們的上游合作夥伴 —— 系統製造商、記憶體供應商、多層陶瓷電容器(MLCC)供應商、印刷電路板(PCB)供應商等,我們與他們都保持著緊密的合作。James Schneider- 高盛集團研究部:我想瞭解一下你們今天宣佈的上下文(Context)記憶體儲存控制技術。它在各類應用場景中的重要性如何?您是否認為它會成為某些特定客戶問題的性能瓶頸?我們是否可以期待你們在這個方向上繼續創新,就像你們過去在網路領域所做的那樣?黃仁勳(Jen-Hsun Huang):我們現在是全球最大的網路公司。我預計我們還將成為全球最大的儲存處理器公司,而且很可能我們的高端 CPU 出貨量也將超過其他任何公司。原因在於,Vera 和 Grace(以及 Vera 相關產品)已經應用於每個節點的智能網路介面卡(SmartNIC)中。我們現在是 AI 工廠的智能網路介面卡提供商。當然,很多雲服務提供商都有自己的智能網路介面卡(如亞馬遜的 Nitro),他們會繼續使用。但在外部市場,BlueField 系列產品取得了巨大的成功,而且 BlueField-4 將會表現更加出色。BlueField-4 的採用率(不僅僅是早期採用)正在快速增長。其上層的軟體層名為 DOCA(發音與 CUDA 相近),現在已經被廣泛採用。因此,在高性能網路的東西向流量(east-west traffic)方面,我們是市場領導者。在網路隔離的南北向流量(north-south networking)方面,我非常有信心我們也將成為市場領導者之一。而儲存領域目前是一個完全未被充分服務的市場。傳統的儲存基於 SQL 結構化資料,結構化資料庫相對輕量化。而 AI 資料庫的鍵值快取(KV caches)則極其龐大,你不可能將其掛在南北向網路上 —— 這會造成網路流量的巨大浪費。你需要將其直接整合到計算架構中,這就是我們推出這一新層級儲存技術的原因。這是一個全新的市場,很可能會成為全球最大的儲存市場 —— 它將承載全球 AI 的工作記憶體。這種儲存的規模將是巨大的,而且需要極高的性能。我非常高興的是,目前人們進行的推理工作負載已經超出了全球現有基礎設施的計算能力。因此,我們現在處理的上下文(Context)記憶體、令牌記憶體和鍵值快取的規模已經非常龐大,傳統的儲存系統已經無法滿足需求。當市場出現這種拐點,而你又有遠見能夠預見它的到來時,這就是進入一個新市場的最佳時機。而 BlueField-4 在這一領域具有絕對的競爭優勢,沒有任何產品能與之匹敵。Ken Chui- Robocap:我的問題同時涉及利潤率和技術。你們目前已經擁有 CPX 技術,通過收購 Grok,你們還獲得了可用於推理的 SRAM 技術。此外,你們的團隊一個月前發表了一篇論文,討論如何在 GPU 中使用 CPX 技術,從而減少對 HBM 的依賴 —— 因為可以用 GDDR7 替代 HBM。我們都知道 HBM 的成本非常高。因此,未來通過結合 Grok 的技術和你們內部的 CPX 技術,你們對 HBM 的使用會有何變化?這是否能更好地控制 HBM 的使用成本,從而對利潤率產生積極影響?黃仁勳(Jen-Hsun Huang):當然。我可以先描述一下這些技術各自的優勢,然後再談談面臨的挑戰。例如,CPX 在每美元預填充性能(prefill per dollar)方面比普通的 Rubin 更有優勢 ——Rubin CPX 的每美元預填充性能高於普通版 Rubin。如果將所有資料都儲存在 SRAM 中,那麼當然不需要 HBM 記憶體。但問題是,SRAM 能夠支援的模型規模比 HBM 小 100 倍左右。不過,對於某些工作負載來說,SRAM 的速度要比 HBM 快得多,因此性能會極其出色。因此,我認為它在預填充(prefill)和解碼(decode)等場景中會有明顯優勢。但問題在於,工作負載的形態一直在變化 —— 有時是混合專家模型(MOE),有時是多模態模型,有時是擴散模型(diffusion models),有時是自回歸模型(auto regressive models),有時是狀態空間模型(SSMs)。這些模型的形態和規模各不相同,對 NVLink、HBM 記憶體或其他元件的壓力也會不斷變化。因此,我的觀點是,由於工作負載變化如此之快,而且全球的創新速度也在加快,輝達之所以能夠成為通用解決方案,正是因為我們的靈活性。大家明白我的意思嗎?如果你的工作負載從早到晚都在變化,而且客戶需求各不相同,那麼我們的產品具有很強的通用性,幾乎適用於所有場景。你可能能夠針對某一種特定工作負載進行極致最佳化,但如果這種工作負載只佔總負載的 10%、5% 甚至 12%,那麼當它不被使用時,這部分資料中心資源就被浪費了 —— 而你只有 1 吉瓦的電力資源。關鍵在於,你不能把資料中心看作是擁有無限資金和空間的資源,而是要在有限的電力下實現整體利用率的最大化。架構越靈活,整體效益就越好。如果採用統一的架構 —— 例如,當我們更新 DeepSeek 模型時,資料中心內所有 GPU 的性能都會立即提升;當我們更新通義千問(Qwen)模型的庫時,整個資料中心的性能都會提升 —— 這樣的協同效應是非常顯著的。但如果你有 17 種不同的架構,每種架構只適用於特定場景,那麼整體的總擁有成本(TCO)反而會更高。這就是面臨的挑戰。即使在我們研發這些技術時,也非常清楚這一點 —— 這非常困難。 (EEPW)
3D NAND,靠它了
邊緣和雲端不斷增長的儲存需求,推動了多種應用對更高容量快閃記憶體的需求不斷增長。3D NAND快閃記憶體每12到18個月推出一次,其更新換代速度和性能提升幅度遠超大多數其他半導體器件。每一代新產品都能帶來50%更快的讀寫速度、40%更高的位密度、更低的延遲和更高的能效。3D快閃記憶體製造商通過堆疊和連接儲存單元,利用微小而深的通道,維持著如此驚人的生產速度。這些通道隨著每一代產品的推出而變得更小更深。一項突破性的低溫蝕刻技術,能夠在僅100奈米的開口下,鑽出數十億個深度達10微米的通道孔,且孔徑近乎垂直。在這樣一個重視能源效率和可持續性的行業中,這些創新的蝕刻工具旨在將能耗降低至以往低溫解決方案的一半,同時減少80%以上的碳排放。對於NAND快閃記憶體的蝕刻工藝而言,關鍵挑戰在於如何在保持合理蝕刻速率的同時,確保通道從上到下的垂直輪廓。建模在最佳化工藝配方方面發揮著越來越重要的作用,以確保垂直輪廓的一致性,避免關鍵尺寸偏差、彎曲以及儲存器孔內部的形狀畸變。即使只有少量資料,人工智慧也能幫助最佳化這些特徵的輪廓。這些儲存器輪廓之所以如此關鍵,是因為它們的均勻性直接關係到NAND快閃記憶體的性能,而性能的衡量指標是讀寫速度和程式設計/擦除效率。3D NAND晶片的主要生產商包括三星電子、西部資料、東芝旗下的鎧俠(Kioxa)、SK海力士等。通過堆疊更多更薄的二氧化矽和氮化矽交替層(ON),他們能夠在每一代器件中增加30%的字線數量。然後,利用深反應離子刻蝕(DRIE)技術在晶片上刻蝕出數十億個高縱橫比的圓柱體(深度與寬度之比超過50:1)。DRIE反應器優先將離子垂直導向,從而實現用於深溝槽隔離、矽通孔、MEMS腔體和其他垂直結構的平行結構。在NAND快閃記憶體中,即使這些特徵的原子級偏差極其微小,也會降低器件的電性能,導致良率和性能下降,並可能影響其可靠性。在深度為 10 微米、直徑為 100 奈米的孔中,允許的輪廓偏差僅為 10 奈米。“因此,如果您將 10 奈米的輪廓偏差視為深度的函數,那麼這小於 0.1% 的輪廓偏差,這確實令人印象深刻,” Lam Research全球蝕刻產品公司副總裁 Tae Won Kim 表示。3D NAND 如何擴展?3D NAND 晶片製造商利用三種關鍵方法擴展其器件(見圖 1)。快閃記憶體單元可以更緊密地排列(x 和 y 方向擴展),或者使用垂直連接進行堆疊。自 2014 年左右業界從 2D NAND 過渡到 3D NAND 以來,快閃記憶體製造商主要採用垂直方向的建構方式,同時將邏輯電路放置在儲存陣列下方,以進一步縮小尺寸(稱為晶片陣列下,或 CUA)。晶片製造商還在不增加面積的情況下增加每個單元的位數,從單位元擴展到每個單元 4 位元(四層單元)及更高,這增加了電壓狀態的數量。圖 1:NAND 快閃記憶體通過減小單元間距和尺寸、堆疊字線以及增加每個單元的位數來實現規模化我們是如何走到這一步的?NAND晶片製造商之間的競爭異常激烈,他們都力求在每個製造步驟中實現卓越的均勻性和重複性。這裡展示的是儲存器空穴通道蝕刻。其他重要的NAND高深寬比蝕刻工藝包括:狹縫:蝕刻區域,用於隔離字線,確保正常的電氣功能;多層觸點:連接不同金屬布線層的孔,以及樓梯:用於訪問每一層中的文字行的連接(見圖 2)。垂直通道蝕刻工藝完成後,氧化層、陷阱層和多晶矽通道會沿著孔的側壁沉積。這種結構通常被稱為“通心粉狀通道”。圖 2:三維 NAND 門環繞式架構示意圖,圖中顯示了一串垂直排列的電荷陷阱單元,採用氧化物-氮化物-氧化物 (ONO) 柵極介質,以及數量有限的字線在大多數NAND產品中,垂直排列的電荷陷阱單元取代了位於源極/漏極上方的浮柵(FG)電晶體。雖然兩種器件的工作原理類似,但電荷陷阱單元位於沉積在柵極氧化層(源極和漏極之間)的氮化物層中,本質上是一個內部帶有氮化矽陷阱層的垂直MOSFET器件。單元陣列完成後,晶片製造商通常會製造第二層或堆疊層,然後再將其連接成串。“但是,要確保這層厚度約為 30µm 的堆疊層之間直徑一致,會增加工藝的複雜性和成本,對高堆疊沉積和高縱橫比蝕刻工藝提出了挑戰,”imec 儲存器工藝整合團隊的高級整合研究員 Sana Rachidi 指出。雖然多層短層結構可以減輕高深寬比蝕刻裝置的負擔,但也增加了成本和複雜性,尤其是在第一層中的多個儲存器孔需要與第二層中的孔對齊,以便後續連接的情況下。這需要在需要對齊的短層結構和提高蝕刻性能以在ON堆疊中刻蝕更深區域之間進行權衡。目前,NAND 快閃記憶體供應商正儘可能地將多個儲存單元封裝在單層結構中,然後再建構第二層。“另一個趨勢是將外圍 CMOS 電路最佳化在不同的晶圓上,然後使用混合鍵合技術將其連接到儲存陣列堆疊層,”Rachidi 表示。“為了控制不斷增長的加工成本,他們還在垂直方向上進行進一步的縮放,即所謂的 Z 軸間距縮放。”為什麼需要低溫工藝?在傳統的反應離子刻蝕(RIE)工藝中,隨著微孔內材料的不斷去除,刻蝕速率會逐漸下降。2010年代,刻蝕裝置製造商開始探索低溫工藝(0°C至-30°C),以期通過結合低溫工藝和新型化學方法,提高RIE系統的生產效率並改善垂直刻蝕效果。通過保持晶圓低溫,高能氟離子和氧離子能夠有效地去除氧化氮化物層及其相關雜質。“較低的溫度可以抑制不必要的側壁刻蝕,同時增強離子遷移率和轟擊效果,” Lam Research公司的Kim表示。這種超低溫是通過在刻蝕平台上使用冷卻器以及對晶圓進行氦氣冷卻來實現的。從化學角度來看,更高的刻蝕速率源於中性物質表面擴散和物理吸附的增強。重要的是,工藝工程師需要控制孔頂部聚合物的形成,因為聚合物會阻礙離子流到達特徵底部。“孔輪廓是通過精確控制晶圓溫度和氣體化學性質來控制的,這利用了刻蝕側壁上中性物質吸附方式隨溫度變化而發生的從化學吸附到物理吸附的轉變,”Kim解釋道。所需的蝕刻深度不斷增加。東京電子的 Yoshihide Kihara 及其同事估計:“對於未來超過 400 層的晶片,為了維持當前的 2 層堆疊結構,每層儲存器通道孔的蝕刻深度至少需要 8µm。”這種新型化學方法既能提高刻蝕速率和孔深,又能減少碳排放。東京電子補充道:“通過使用HF氣體進行刻蝕,可以大幅降低傳統CF氣體的分壓,從而與第一代低溫工藝相比,溫室氣體的碳排放量可減少84%。”該公司還發現,少量含磷氣體(PF₃ )可作為催化劑,促進HF與SiO₂之間的反應,從而在較低溫度下提高刻蝕速率。低溫蝕刻技術的需求已經非常明確。Kim指出,Lam Research已經在用於3D NAND應用的生產晶圓廠中安裝了1000個低溫蝕刻腔。反應離子刻蝕(RIE)可採用兩種類型的反應器——電容耦合電漿體(CCP)和電感耦合電漿體(ICP)。通常,ICP更為常用,因為它的兩個電極可以獨立控制離子能量和離子密度,而射頻偏置功率則可將活性離子加速注入刻蝕孔中。RIE(反應離子刻蝕)裝置供應商眾多,包括應用材料公司(Applied Materials)、Plasma-Therm公司、牛津儀器公司(Oxford Instruments)和Sentech Instruments公司,但Lam Research和東京電子(TEL)是低溫刻蝕領域大批次生產的主導企業。東京電子於2023年推出了首款低溫刻蝕機,而Lam Research則於2024年7月推出了第三代低溫刻蝕機。Lam Research的Kim指出,這三代反應釜採用了三種不同的化學體系。(Lam Research並未透露目前使用的具體氣體種類。)成功蝕刻的另一個關鍵要素是用於形成孔和縫隙的光刻和蝕刻掩模。晶片製造商使用厚厚的非晶碳硬掩模(通過化學氣相沉積法沉積),並在其上旋涂玻璃和光刻膠,首先對硬掩模進行圖案化。這層厚掩模保護了蝕刻過程中需要保留的ON/ON/ON區域。Lam Research 還利用電漿體脈衝在刻蝕模式和鈍化模式之間切換。刻蝕過程的副產物非常重要,因為它們可以鈍化側壁,防止結構彎曲。垂直通道刻蝕的縱橫比已經接近 70:1,要過渡到 100:1 的縱橫比,控制起來將更具挑戰性。輪廓控制、人工智慧和蝕刻工藝建模在提升製造工藝成果方面發揮著越來越重要的作用。在開發用於最佳化NAND垂直通道蝕刻的蝕刻工藝時,值得注意的是,有超過30個可調的蝕刻參數,包括溫度、氣體流速、功率、工藝時間等等。由蔡成恩領導的宏碁公司工程師團隊,提出了一種基於人工智慧的方法,用於最佳化垂直通道(VC)結構中的蝕刻輪廓,從而最大限度地減少VC輪廓的形狀變形。與許多使用大型、多樣化資料集建構的人工智慧輔助建模計算不同,宏碁團隊利用來自25片已加工晶圓(包括晶圓中心、中間和邊緣)的資料,最佳化了蝕刻工藝,從而降低了關鍵尺寸(CD)的變化。這種方法降低了工藝開發的成本和時間。蔡及其同事報告稱:“半導體行業面臨的關鍵挑戰之一是在工藝開發初期就儘可能減少晶圓消耗,因為這對於降低成本和加快產品開發進度至關重要。” 該人工智慧程序能夠最佳化33個刻蝕參數,從而降低頂部CD、弓形CD(最寬點)、CD畸變和CD條紋程度的變化。宏碁人工智慧輔助調優方法的核心策略是基於全面的資料集對預訓練的Transformer模型進行微調。該微調過程將機器學習演算法應用於來自實際晶圓和DOE分割的小資料集。“通過將預測的刻蝕參數輸入模型,即可獲得最終的VC輪廓,從而使系統能夠高精度地模擬和預測VC結構,”宏碁團隊強調了領域知識的作用。“為了提高模型預測的精準性,我們基於該領域的專家知識,設定了一些具有特定約束條件的預設參數。這一步驟對於最佳化模型輸出並確保預測結果與實際可行的刻蝕條件相符至關重要。”利用透射電鏡(TEM)在垂直通道(VC)中10多個深度處的斜面切割測量資料,記錄了關鍵尺寸(CD)的變化,並通過機器學習(ML)確定了33個刻蝕參數的最佳化值。“通過建立高精度的刻蝕輪廓,該方法不僅提高了刻蝕結構的質量,還有助於半導體行業顯著降低成本。借助先進的最佳化技術,人工智慧輔助的調諧方法確保最終的垂直通道結構在最大限度減少形狀變形和保持對關鍵尺寸的嚴格控制方面表現出卓越的性能。”最重要的是,新的工藝配方降低了特徵畸變,這與NAND的性能和可靠性直接相關。“在初始工藝中,當VC形狀畸變嚴重時,閾值電壓會突然升高,表明在3D NAND程式設計過程中性能不穩定。”人工智慧輔助蝕刻工藝徹底消除了這種閾值電壓異常,從而實現了可預測且最佳化的器件性能。未來微縮面臨風險?為了在每一代產品中持續增加ON層數,縮小字線之間的z軸間距(現有器件的z軸間距約為40nm)似乎是合理的。然而,imec的研究人員警告說,隨著NAND快閃記憶體製造商在繼續使用現有材料的情況下縮小尺寸,會出現兩個物理問題——橫向電荷遷移和單元間干擾。電荷遷移和訊號干擾會降低閾值電壓、增大亞閾值擺幅、降低資料保持時間並提高程式設計/擦除電壓。imec 的研究人員表示:“當進一步減小字線層厚度時,電荷陷阱電晶體的柵極長度也會相應縮短。因此,柵極對溝道的控制力逐漸減弱,相鄰單元之間的靜電耦合也隨之增強。除了單元間的干擾外,儲存單元在垂直方向上的縮小還會導致橫向電荷遷移(或垂直電荷損失)。被困在 SiN 層內的電荷往往會穿過垂直方向的 SiN 層遷移,從而影響資料保持時間。”一種可以抑制單元間干擾的工藝改進方法是用低介電常數材料(低k值)的空氣間隙代替字線之間的氧化物介質。事實上,空氣間隙此前已在二維NAND器件中用於此目的。然而,在垂直結構中引入空氣間隙比在平面結構中要困難得多。Imec 最近設計了一種可重複的氣隙方案,該方案在沉積 ONO 堆疊層之前,先對柵極間氧化層進行凹陷處理。“氣隙的引入使其與字線自對準,從而可以精確控制其位置,並提供可擴展的解決方案。”研究人員和製造商將繼續探索這種及其他方案,以繼續縮小 3D NAND 的尺寸。結論低溫蝕刻是反應離子刻蝕工藝的一項關鍵發展,它能夠在3D NAND器件中形成極深極薄的腔體,用於垂直接觸、狹縫、階梯接觸和周邊接觸。晶片製造商正在最佳化30多個蝕刻參數,以確保從頂部到底部關鍵尺寸(CD)的垂直輪廓保持最小變化。隨著這項極具挑戰性的技術的推廣應用,工藝模擬和人工智慧輔助可以在配方最佳化方面發揮重要作用,而無需運行數百片開發晶圓。這可以節省成本並縮短產品上市時間。因此,業界可能會更加依賴虛擬製造來完成這些以及其他關鍵的製造步驟。 (半導體行業觀察)