#GPU
小摩最新預判:NAND周期更長更穩,eSSD成AI時代新主角
在全球資本市場緊盯 GPU 和高頻寬儲存器(HBM)的同時,NAND 快快閃記憶體儲器正悄然崛起,成為 AI 時代不可或缺的基礎設施資產。摩根大通(JPM-US,簡稱小摩)亞太區科技團隊在近期發佈的研究報告《半導體:NAND——更長、更強的上升周期》中指出,NAND 已進入由 AI 推理全面驅動的全新超級周期,其影響力可能超過以往任何一輪由消費電子推動的周期。過去 20多年,NAND 市場一直受供需波動影響。技術進步降低了成本,但廠商擴產又容易導致價格崩盤。小摩分析顯示,NAND 市場年均潛在成長率過去多在 7%~12% 之間,但預計 2025~2027年,這一數字將躍升至 34%,呈現前所未有的“斷層式”增長。更重要的是,這次增長不是單純靠出貨量堆積,而是“量價齊升”。小摩預計,今年 NAND 混合均價將上漲 40%,到2027 年價格仍能維持高位,僅小幅回落 2%。為什麼AI 推理能成為 NAND 的轉折點?關鍵在於推理階段的特殊需求:訓練階段強調算力和頻寬,HBM 無可替代;推理階段需要即時處理使用者指令,高速調取模型參數,延遲和上下文處理能力至關重要。隨著模型上下文擴展,GPU 內建 HBM 容量已捉襟見肘,行業開始引入 KV Cache Offloading 技術,把部分中間資料解除安裝到外部儲存。這讓企業級SSD(eSSD)從傳統“資料倉儲”升級為 AI 架構中的“二級儲存”,需求迅速增長。2024 年 eSSD 出貨量同比下降86%,刷新自 2012 年以來的紀錄。未來,AI伺服器單機儲存容量預計將超過 70TB,是普通伺服器的兩倍以上。到明年,eSSD 有望佔全球 NAND 需求總量的 48%,超過智慧型手機的 30% 和PC 的 22%,成為第一大應用場景。同時,HDD供應緊張也助推 NAND 上位。Seagate 和 Western Digital 因前幾年市場低迷大幅削減資本支出,導致大容量 HDD 交貨周期延長至兩年以上。面對“有貨優先於低價”的 AI 資料中心規則,客戶紛紛轉向 NAND,尤其青睞性價比提升的 QLC(四層單元 NAND)。雖然SSD 單位成本仍是 HDD 的 6~8 倍,但在能效和空間利用上優勢明顯,適合高密度 AI 資料中心。目前,SSD在“業務關鍵型”儲存領域滲透率僅 19%,還有很大提升空間。小摩估算,SSD 滲透率每提升 1%,即可為NAND 市場帶來約 20 億美元新增收入。值得注意的是,面對強勁需求和價格上漲,NAND 廠商並未盲目擴產。未來三年,產業資本支出佔銷售額比例將降至 15%~16%,遠低於過去十年的30%~50%,2018 年甚至高達 68%。原因在於技術瓶頸:NAND 堆疊層數已突破 300~400 層,刻蝕製程和晶圓應力控制難度極大,混合鍵合技術雖能緩解,但裝置昂貴且良率受限。市場預計,今年全球 NAND 晶圓產量僅增長 3%,而位元需求增速高達 21%,供需缺口將貫穿全年,支撐價格持續上行。原廠動作方面:鎧俠(Kioxia):CBA 架構優勢明顯,BiCS 8 技術量產推動伺服器業務營收從 2023 年的 20% 提升至2027 年的 61%。SK 海力士(SK Hynix):憑藉 Solidigm 在 QLC 和 eSSD 超大容量市場的統治力,以及 HBM 與 QLC 雙線優勢,長期看穩健。三星電子:雖然 QLC 佈局稍慢,但大產能和 V9 QLC 加速量產,有望收復失地,股價短期具備補漲潛力。美光(Micron):推出 232 層 TLC 的 6500 ION 系列,以“性能接近 TLC、價格接近 QLC”的策略受益美國本土資料中心建設。雖然NAND 價格上漲過快,可能推高筆記本等終端 BOM 成本,壓縮品牌商利潤,消費者換機節奏或延緩。但小摩認為,這次由 AI 推理驅動的需求革命與供給剛性深度交織,構成真正的“超級周期”。NAND 已不再是 DRAM 的陪襯,而是 AI 體系中高速“熱資料”管理的基石。 (半導體脈)
突發!黃仁勳“兆元宴”放話:ASIC取代GPU不合理也不現實!2026 產業鏈‘極度吃緊’!
黃仁勳放話:ASIC取代GPU不合理也不現實,輝達掌控整個AI基礎架構!2026年AI產業極度吃緊:This year is going to be very big!!黃仁勳台北宴請供應鏈高管核1月31日晚間,輝達CEO黃仁勳在台灣台北磚窯古早味懷舊餐廳,宴請輝達合作供應鏈高管,原定35人,實際到場近40位台企高管,僅1位大陸企業(勝宏科技)高管出席。宴會合影中,第一排就坐的有華碩施崇棠、聯發科蔡力行、台積電魏哲家等供應鏈資深高管;第二排及以後包括鴻海劉揚偉、和碩童子賢等多位台企高管。現場唯二女性為緯穎洪麗寧、同德股份劉盈君。黃仁勳開場致詞(站上椅子):“歡迎大家來到這裡!這稱不上是年度聚會,但我們一起工作這麼辛苦、這麼努力,所以我們每6個月應該聚在一起喝一杯。”黃仁勳提及2025年的挑戰:“2025年是非常充滿挑戰的一年,因為我們開始生產Grace Blackwell,現在回頭看,與Grace Blackwell相比,Hopper 簡直太簡單了。Hopper 的半導體系統在當時是最先進的,但Grace Blackwell又將先進技術推向極限,系統也相當困難,過去一年來,我們一起挑戰極限,在座的各位一起完成了不可思議的任務。”針對Grace Blackwell量產困難及設計修改,黃仁勳坦言:“今年運作模式跟以往也將有所不同,他對過去一年的成果非常滿意,也確實一路很挑戰,感謝大家一起工作,他也誠摯的要說謝謝,還有對不起。”關於產品進展,他表示:“目前GB300機櫃已經進入量產初期階段,GB200是輝達的第二代產品,量產非常順利,而Vera Rubin(第三代產品),希望量產會變得很簡單,現在供應鏈會跑得比以往任何時候都快,也感謝彼此的夥伴關係,相信今晚也是全台灣關注的一晚。”談及AI產業變化:“AI 變得有用,大語言模型變得非常有用,對產業也有用。也因此,現在 Token是可以賺錢的,2024年生成的 Token 沒那麼聰明,當 AI 不夠聰明時,就不太能獲利,現在 AI 變聰明了,就能有獲利模式。”黃仁勳回應關鍵問題:AI產業供需:“2026 年將是AI 產業‘極度吃緊的一年’,不論是高性能計算或低功耗應用,‘AI 要有智慧,就一定要有儲存’,今年對高頻寬記憶體(HBM)與LPDDR 的需求將大幅爆發,整體供應鏈面臨前所未有的壓力,但同時也將迎來‘非常好的一年’。”產品研發:“輝達目前已全面量產Grace Blackwell 架構,同步啟動下一代Vera Rubin 平台,Vera Rubin 是由六顆全球最先進晶片組成,製程與整合複雜度極高。”OpenAI融資:“輝達將參與OpenAI 下一輪融資,且金額可能是輝達史上最大的一筆戰略投資。OpenAI 是這個時代最具影響力的公司之一,輝達將持續加碼資金與算力支援。”ASIC晶片競爭:“外界擔憂AI專用晶片ASIC將取代GPU的疑慮不合理也不現實,因為輝達不是只做單一晶片,而是打造整個AI 基礎架構,這種規模與研發強度,不是單一ASIC 團隊可以追上的。”台灣供應鏈:“沒有台灣,輝達就不可能存在。預期未來十年台積電產能將遠超過倍數成長,是整個人類史上最大規模的科技基礎建設擴張之一。”△黃仁勳與台積電董事長魏哲家合影此外,黃仁勳透露:“輝達目前每年研發預算已達200 億美元,未來仍將以每年約50% 的速度成長,從Hopper 到Blackwell、再到Rubin,技術難度已從困難變成不可能,但也正因如此,必須持續高速投資,確保領先地位。”晚宴尾聲,他再度致謝:“今年是非常關鍵/盛大的一年(This year is going to be very big),換句話說,供應鏈會工作得很辛苦,但台灣供應鏈的優秀條件是獨一無二的。” (深科技)
這份首次公開的架構路線圖,藏著中國國產GPU的技術底氣與成長邏輯
5.2萬片交付背後:國產GPU規模商業化進入“放量期”。在大模型浪潮席捲全球、算力成為核心競爭力的當下,國產高端晶片的進展備受矚目。尤其在生成式AI走向規模化應用之後,訓練效率、推理成本、系統穩定性,正在深度反作用於模型能力。僅是實驗室指標與參數競賽,不足回答市場對國產算力“能否真用、是否好用”的拷問。近日,國產通用GPU“四小龍”之一的天數智芯,在上市後的首次生態合作夥伴大會上,給出了一份系統性的回應——罕見地一次性亮出了三張關鍵“底牌”:1、首次完整公佈天樞、天璇、天璣、天權四代GPU架構路線圖,明確提出分階段對標並超越NVIDIA Hopper、Blackwell、Rubin架構的技術目標。該公司在2025年已經邁出第一步,天數天樞整體效率較當前行業最優水平提升約60%,在DeepSeek V3的實測中實現超20%的表現。2、正式推出“彤央”系列四款邊端GPU新品,實測稠密算力覆蓋100T—300T區間,性能指標全面超越NV AGX Orin;3、首次對外披露商業落地成果,截至目前已服務超300家客戶,完成1000餘次部署,累計交付通用GPU超5.2萬片。天數智芯董事長兼CEO蓋魯江在會上強調,AI算力需“以全端自研築牢生態根基”。此次發佈,這家國產GPU代表企業已不侷限於單點突破,而是試圖從技術路徑、完整產品和可複製商業化三個維度,建構一個更具確定性的產業未來。01.首發三年超越路線圖:國產通用GPU不止於“可用”與以往國產GPU企業更強調“當代產品對標”不同,天數智芯此次發佈的一大變化,就是給出了一個明確的時間維度。天數智芯首次系統性披露了2025-2027年的架構演進路線圖。在天數天樞、天數天璇、天數天璣、天數天權四大系列架構框架下,其技術目標被清晰地對應到國際主流GPU架構的代際節奏之中:2025年,天數天樞架構實現對輝達Hopper架構的超越;2026年,天數天璇架構對標Blackwell,同年天璣架構實現對其的全面超越;2027年,天數天權架構將超越下一代的Rubin架構。在此之後,公司的目標將轉向“突破性計算晶片架構”的原創性設計。這釋放了一個強烈訊號——天數智芯不再迴避與全球GPU技術主線的正面對照,而是將自身演進節奏直接嵌入到同一技術坐標系中。天數智芯AI與加速計算技術負責人單天逸認為,專用晶片就像應試教育,在限定的“題庫”裡去完成計算任務。而天數所代表的通用晶片是為了回歸計算本質,支援所有類型的計算。它既能高效支援的當前熱點任務,也能支援那些我們還沒想像到的全新算子、全新架構。“我們始終堅信,不應讓算力的僵化限制演算法進化,硬體絕不應該成為束縛演算法探索的枷鎖,而要成為孵化新演算法的堅實底座。”單天逸將天數晶片比作新世紀的“算力風洞”,意在為研究者探索智慧的本質與邊界提供基礎工具。為了實現這種面向未來的通用性與高效能,天數智芯在架構層面進行了系列創新。這一路線圖並非簡單的算力堆疊,而是圍繞通用計算效率的系統性最佳化展開:1、TPC Broadcast設計,算力的核心瓶頸是頻寬,天數智芯不單純放大頻寬,而是追求單位頻寬最優效果。當檢測到相同地址資料時,晶片內部Load Store單元避免無效訪問,在上游進行廣播,大幅降低快取功耗,等效提升快取頻寬,以更小功耗和面積實現同等功能。2、Instruction Co-Exec設計,實現多類指令平行運行,除Tensor Core、Vector Core外,新增Scalar Core及指數、通訊等操作,通過X-Schedule模組以最低成本提升多指令平行處理能力,從容適配MMA、各類算子及DeepSeek V4等模型。3、Dynamic Warp Scheduling設計,微架構可駐留更多Warp,通過動態調度實現Warp有序協作,避免資源爭搶與閒置,持續輸出算力。值得一提的是,這些技術並不是針對某一個模型或某一類負載的“定製化性能”,而是一種長期可擴展的通用GPU架構邏輯。對產業與投資界而言,這份路線圖的價值在於提供了難得的“可預期性”。它標誌著國產高端GPU的競爭,正從初期的“解決有無問題”和“單點性能比拚”,邁入一個有明確技術爬坡路徑、可被持續驗證的新階段。02.雲邊端全端落地:“彤央”系列補齊邊端算力拚圖如果說路線圖解決的是“向那裡走”的問題,那麼產品矩陣則決定了“如何走”。本次大會的另一重頭戲,是天數智芯正式發佈了其邊端算力產品系列——“彤央”(TY)。“彤央”系列一次性推出了四款新品:TY1000、TY1100、TY1100_NX和TY1200,覆蓋100T-300T的實測稠密算力區間。在多項關鍵指標上,這一系列產品已全面超越同等級的輝達AGX Orin。但相比性能數字本身,更值得關注的是彤央系列的產品定位邏輯。“彤央”系列並非簡單意義上的“算力下沉版GPU”。天數智芯邊端事業部負責人郭為談道,其產品定位是圍繞“物理AI”這一前沿趨勢進行系統級設計。所謂“物理AI”,即讓AI不僅“會說話”,更能“會幹活”,理解並反饋物理世界規律,這正是具身智慧型手機器人、高等級自動駕駛、智能工廠等場景的核心需求。以性能最強的TY1200為例,它不僅在緊湊的機身內容納了300TOPS的算力,更搭載了完整的異構算力調度框架,能夠充分協調CPU與GPU資源。這一特性使其能夠應用於“機器人大小腦融合”這類複雜場景——傳統上,機器人的運動控制(“小腦”)與感知決策(“大腦”)由不同模組處理,容易因通訊延遲導致動作不協調。TY1200的高整合度與強算力,為在一顆晶片上實現協同控制提供了可能。實測資料證明了其產品力。在電腦視覺、自然語言處理乃至DeepSeek-32B大語言模型等多個場景的測試中,彤央TY1000的性能表現均優於市場主流產品輝達AGX Orin。“彤央”系列還考慮到客戶已有硬體方案的替換成本問題。該系列全部採用標準化的699Pin介面設計,在硬體上與輝達Orin系列產品實現了“Pin-to-Pin”相容,從而極大降低替換成本。可以看到,通過統一的通用GPU架構、開放的軟體生態以及一致的開發介面,天數智芯試圖在“物理AI”趨勢尚未全面爆發之前,提前完成算力形態的卡位。至此,天數智芯已經形成了覆蓋雲端訓練(天垓)、推理(智鎧)以及邊端計算(彤央)的完整全端自研算力矩陣。在架構層、軟體層和系統層實現統一,使得模型可以在不同算力形態之間平滑遷移。值得一提的是,這種“全端自研”的能力並非沒有技術門檻。從單卡性能,到多卡互聯,再到千卡級叢集的穩定運行,每一層都涉及架構設計、驅動最佳化與系統工程能力的長期積累。天數智芯披露,其千卡級叢集已穩定運行超過1000天,驗證了其系統的成熟度。03.5.2萬片交付背後:國產GPU商業化放量任何一條技術路線,最終都必須接受商業化的檢驗。天數智芯此次發佈會的第三大焦點,便是首次體系化地公開了其規模化商業落地成果,以實實在在的資料回應了市場關於國產GPU“能否用好”的疑問。其披露的最新資料顯示,天數智芯已向金融、網際網路、醫療、交通、科研等超過20個行業的超300家客戶,完成了超過1000次行業部署,數千卡叢集穩定運行1000天。天數智芯副總裁鄒翾在演講中列舉了一系列案例:在網際網路領域,其產品幫助頭部客戶將AI客服的Token處理成本降低了一半;在金融行業,基於其加速卡的研報生成效率提升了70%,量化交易決策響應可達毫秒級;在醫療場景,結構化電子病歷的生成時間從數分鐘縮短至30秒,腸胃鏡病灶的AI輔助定位精度提升了30%。另一個優勢是敏捷的模型適配能力。面對國內大模型以“季度”為單位的迭代速度,天數智芯通過與主流模型團隊深度合作,實現了“多數大模型發佈當天即可跑通”。目前,其平台已支援超過150種模型及變種穩定運行。例如,從DeepSeek V3升級到V3.2,因其已預先支援95%的算子,客戶僅需調整不到2%的模型結構即可完成適配。這種廣泛的行業覆蓋與深度應用,反過來也錘煉了其產品與解決方案的成熟度。郭為在問答環節坦誠分享道,早期拓展市場時面臨更多的是客戶的“排斥與冷淡”,尤其是那些純粹基於性價比和穩定性做選擇的商業客戶。破局之道在於“技術實力”。只要客戶願意嘗試,工程師便快速進場,通過深度調優呈現超出預期的性能,逐步建立信任。他甚至透露,一些深度合作的客戶在兩年內通過反饋機制提出了數百個問題或建議,這些來自真實場景的“壓力測試”和需求輸入,成為了產品迭代升級最寶貴的動力。在GPU競爭中,生態始終是決定成敗的核心壁壘。天數智芯對此有著清醒認知,其將“易遷移”作為核心競爭力之一,在軟體介面層深度相容CUDA等主流開發生態,支援PyTorch等主流框架,儘量避免客戶為遷移付出額外學習成本。從其商業化放量的財務資料看,2022-2024年,營收從1.894億元增長至5.395億元,復合年增長率高達68.8%;2025年上半年營收達3.243億元,同比增長64.2%。這些財務數字背後,是一個已經跑通並進入放量增長階段的商業閉環。04.結語:算力競爭正在回歸長期主義回顧整場發佈會,天數智芯反覆強調的關鍵詞並非“替代”,而是“賦能者”。其通用GPU架構已相容PyTorch、xllm等主流框架,支援150余種模型穩定運行;在實際項目中,開發與遷移成本僅為部分競品的三分之一;並已完成與主流CPU、伺服器廠商及雲平台的系統級適配。在智能社會逐步成型的過程中,真正稀缺的,並不是某一代晶片的峰值性能指標,而是一個能夠持續支撐演算法演進、應用擴展與產業規模化的底層算力平台。從清晰的路線圖,到完整的產品矩陣,再到正在放量的商業化資料,天數智芯正在給出一種更偏長期主義、也更具產業確定性的答案。國產GPU“行不行”,或許不再需要一句口號式回應,而正在被一項項工程進展與商業結果,逐步寫入現實。 (芯東西)
上海殺出500億隱形龍頭:中國第一
過去2個月,最吸金的賽道,莫過於中國國產GPU。那些1天賺700%、5年賺1000倍的神話,在這一輪全部實現,並且都繞不開一個關鍵詞:GPU四小龍——摩爾線程、天數智芯、沐曦、壁仞科技。一位長期跟蹤GPU產業的投資人對鉛筆道表示:誇張點說,過去5年,如果沒投GPU,相當於這一輪周期“白幹”。這種遺憾,不亞於移動網際網路時代錯過字節。這個機會窗口正越來越小。本月,隨著通用GPU企業——天數智芯在港股上市,募資約32億元,意味著四小龍最後一塊拼圖被補齊。值得注意的是:IPO之前,這家低調到幾乎不接受媒體採訪的公司,最近持續向市場釋放消息。1月26日,它亮出幾張底牌:公佈了2025到2027年的GPU架構路線圖,特別需要指出,2025年推出的天數天樞,在DeepSeekV3場景,性能已超輝達Hopper架構20%,這意味著天數的路線圖已經在兌現過程中。同時,這次發佈天數智芯還推出四款邊端產品彤央系列(可理解為“本地算力模組”),尺寸從口袋大小到桌面級;還披露了最新商業進展:覆蓋20個行業、300多個客戶、1000個聯合開發案例,數千卡叢集已穩定運行超1000天。這些動作,不禁引發好奇:它究竟能撐起多大的戲碼,能否持續創造千倍的收益神話,又會怎樣影響中國國產GPU的格局?- 01 - 新神話還是新泡沫這些動作背後,有一個特定背景,那就是目前的中國國產GPU,泡沫和機會一樣大——天數智芯這些動作,離機會更近,還是離泡沫更近?中國國產GPU的機會在那裡?多說無益,直接看輝達。過去10年,市值從幾百億美元,漲到兆美元,一年收入約1300億美金(2025財年),其中淨利潤超700億美元。這些數字背後,有一個幾乎共識的結論:AI的盡頭是算力;算力的盡頭,是GPU。AI要想聰明,必須燒錢、燒算力;而要想算力大,就必須“卡”多。這些元素中,錢、演算法都不稀缺,稀缺的幾乎只有一個:GPU。2020年之前,全球大部分的GPU產能,都卡在一家公司手裡:輝達。因此,中國國產GPU的起點,並不浪漫,只有三個字:買不到。尤其到2022年底,美國收緊AI晶片出口規則,相當於洪水撞上大壩,小路直接被堵死。這些“卡脖子”局面,逼得本土廠商必須自研。這支本土隊伍中,既包含了寒武紀、海光資訊等,也囊括著GPU四小龍:摩爾線程、天數智芯、沐曦、壁仞科技。此外,還包括各類超級獨角獸,比如燧原科技、崑崙芯等(見下表)。統計發現,這些公司的成立時間,可以分為兩類:一類成立於2019-2020年前後,正值中國國產GPU爆發前夕;另一類是先遣部隊,成立於2015年前後,風口還沒來就等在那裡,比如寒武紀、天數智芯、海光等。這些先遣部隊,成立之初,也不是完全奔著GPU而去。只是幹著幹著,風口來了。以天數智芯為例,2015年成立時(總部上海),它鎖定的並不是GPU,而是算力加速軟硬體產品,好比打遊戲時的“外掛工具”,能讓計算速度更快。但過程中,AI算力的需求,讓它發現GPU的供不應求。於是2018年,天數智芯轉向GPU研發,啟動首款產品(天垓100)的流片工作。這才有了後來的成果:實現中國通用GPU從0到1的首次突破,成為中國第一家自研、量產通用GPU的公司。這些隊伍,取得的成績也不盡相同。海光、寒武紀起步較早,成了第一批中國國產GPU上市公司,市值在5000億-7000億不等。剩下的“GPU四小龍”,上市時間接近,差異化也較大。觀察可以發現:錯位比較明顯的是天數智芯。它的成立時間最早,自研量產時間最早,晶片交付量靠前(通用GPU5.2萬枚),年收入排名第二(2024年)。基於這種全站自研通用GPU的技術優勢和實戰場景打磨的規模化商業落地優勢,不少投資人看好它的稀缺性和增長潛力。中國國產GPU四小龍市值及收入對比。- 02 - 偽需求與真痛點中國國產GPU現在熱度爆表,錢也追得凶,但能不能一直火下去,要回到一個根本問題:晶片好不好用,能不能被客戶認可。這個痛點下,中國國產GPU有三大流派。一類是“參數派”。這是最容易被市場看見的一類:指標好看。核心算力、記憶體頻寬、跑分成績都挺亮眼,宣傳材料資料一列一列地甩出去。另一類是“定製項目派”。它的風格是:先解決問題,再談指標,優點是:短期賺得穩、問題能解決,但想做成流水線大廠,天花板明顯。最後一派是“系統工程派”或者叫“解決方案派”,天數智芯就是這類企業。它是前面兩派的融合,既做晶片又承接定製項目,但不追求一次性表現,而是提供長期可運行的解決方案:不僅做硬體,還要自研軟體棧、工具鏈、編譯器和適配層等。這條路走的人不多,難度大。天數智芯副總裁鄒翾對鉛筆道說:“我們在中國首家建構了通用架構下的GPU全端設計能力,目的就是為了在客戶實際場景中實現好用、落地。”這三大路線差異較大,但面臨的瓶頸相同,那就是:直到今天,“中國國產卡”的份額依然很小。多家頭部算力中心負責人向鉛筆道表示:過去1-2年,中國國產晶片仍是少數選擇——就算是“老大哥”華為,也面臨這個瓶頸。具體的份額,可以用一組數字來形容:100張通用GPU裡,大約只有不到6.5張是中國國產卡(2025年/如圖)。天數智芯招股書中,對中國國產GPU份額的描述。“中國國產卡”為什麼份額少,是性能不行嗎?不完全是。據外媒報導,中國多款頭部晶片,關鍵性能與輝達旗艦產品(H100)相比,差距只有10%-20%。甚至某些產品,中國國產GPU還實現了反超。比如1月26日,天數智芯發佈的幾款邊端產品,打通客戶應用場景“最後一公里”,把雲端大算力能力折疊進方寸之間,將整合大算力的小巧產品,送到客戶的“手中”,就像在場景的端側產品中安裝了“大腦+小腦”,讓邊端場景的運行更加流暢。比如具身智能機器人,不但能夠走路,而且可以根據算力支撐的即時判斷能力,進行“勞動”。此外這個產品還可以應用在工業智能、交通智能、車陸運一體化協同。在這組產品中,“基礎款”的性能已反超國際卡3.7倍。天數智芯與輝達相關產品性能對比。性能的差距,為中國國產GPU爭回來不少分,但另一個更值得重視的問題是:晶片好不好用,客戶認不認可。- 03 - 破局思路中國國產GPU的破局思路是什麼?天數智芯副總裁鄒翾的建議是:回歸“好用”。“這麼多年,我們一直在思考:什麼是好用的GPU?如何衡量GPU價值?使用者核心訴求是什麼?我們的洞察就是簡單兩個字:好用——它不單單指的是價格優勢,還包括使用體驗:比如要花多少人力、多少物力、多少時間。”這聽起來可能有點抽象,他舉了兩個身邊案例。有家AI創業公司,金融大模型每季度至少迭代兩個版本,每次硬體適配,需要投入10人團隊,耗費兩周修改500至1000行程式碼。另一家傳統企業,需要用開源大模型建知識庫,因硬體介面不相容,落地周期常從一個月,延遲至兩到三個月。這些痛點,不只在1-2個案例身上體現。鄒翾介紹,截至去年底,天數智芯探索了20個行業,服務了300客戶,聯合開發了1000個案例,無一不指向這個答案:產品好用!。在客戶眼裡,這種“好用”,具體又包括什麼?天數智芯副總裁郭為向鉛筆道提到:客戶買不買你的產品,主要看三點。1、客戶現有使用習慣是否需要改變;2、是否提供本地化調優服務;3、是否有價格優勢。郭為表示,就算自己第一次拜訪客戶,也基本從這三點入手。這三句話背後,隱含著客戶的三大煩惱。1、別讓客戶為了“新卡”去改程式碼、換框架、重寫流程;2、通過貼身調優,把坑在前期填掉,幫客戶把系統真正跑穩;3、利用中國國產優勢,給客戶一個願意嘗試的理由。比如,天數智芯發佈了4款邊端產品:彤央系列(如下表)。天數智芯的新品,可用於機器人等新興場景。其中,副總裁郭為講述了一個客戶痛點。中國有家機器人未來獨角獸——格藍若,想選一款晶片,讓機器人“聽得清、想得快、說得明”。核心訴求之一,就是相容性。“我們模組採用的標準介面,和輝達的Orin完全相容。目前中國,機器人幾乎全行業採用的都是輝達標準,所以客戶的使用習慣等都不用改變,拿過去可以直接用。”最終,格藍若選擇了天數智芯。又比如,天數智芯還發佈了3年架構路線(如圖)。這些架構背後,主要的指引思路,也是“好用”:算得快、算得省、省力、可持續等。比如算得快(高利用率):天樞架構的“Attention效率>90%是個關鍵指標,意味著晶片幹正事的時間更多,浪費的算力更少。比如算得省。天樞架構追求更精細的“省電”模式,這就像給不同的任務(科學計算、AI推理)匹配最合適的“燃料”,在保證結果正確的前提下,最大限度降低功耗和成本。此外,為了讓客戶省錢,解決DDR儲存價格高的問題,天數智芯通過kv cache等技術,讓模型推理使用的記憶體量降低50%以上。- 04 - 結語未來幾年,通用GPU的中國國產化趨勢不可逆。據行業報告顯示,預計2029年,中國國產率有望達到50%。摩爾線程、天數智芯、沐曦、壁仞這四小龍,就像中國GPU市場的先遣部隊,各自搶佔陣地,也把初步經驗探索了出來:對使用者來說,買的不僅僅是卡,而是最終體驗。天數智芯此次向市場釋放消息,或許就是朝著這個目標,為下一輪競爭做鋪墊。 (鉛筆道)
中國首款:GPU 新王誕生!10倍性價比!
性價比之王!國內首款LPDDR6:推理GPU啟望S3發佈!曦望GPU路線圖公佈:“百萬 token 一分錢”!1月27日,杭州GPU創企曦望舉辦發佈會,披露三年產品路線圖,發佈啟望S3推理GPU晶片、寰望SC3超節點方案及推理雲計畫。S3晶片作為國內首款LPDDR6視訊記憶體GPGPU,推理性價比提升10倍以上,單位token成本降90%。發佈會同步啟動“百萬Token一分錢”合作,聯動多傢伙伴佈局生態,彰顯其深耕推理賽道、重構AI算力成本的決心。一、啟望S3晶片,以極致設計重塑推理性價比2026年1月27日,曦望在杭州披露三年產品路線圖,發佈專為大模型推理定製的啟望S3晶片。徐冰指出,為追求極致性價比,曦望“拋棄了傳統訓推一體GPU為訓練準備的冗餘設計,不追求峰值TFLOPS這種紙面資料,把真實業務場景中每個token的成本、能耗以及SLA穩定性作為所有設計決策的根本出發點”,並強調這三大指標“直接決定了最終的業務毛利率,直接影響了終端客戶群體的使用者體驗”。啟望S3有三大核心亮點:一是極致PPA,摒棄訓練冗餘元件,採用推理最佳化架構及先進第三方高速介面IP;二是採用合規先進國際工藝節點;三是作為國內首款LPDDR6視訊記憶體GPGPU晶片,頻寬較LPDDR5提升1倍以上,視訊記憶體容量較上一代提升4倍,經論證為當前推理最優解。曦望精準把控大模型黃金算力訪存比,避免資源浪費,晶片支援FP16至FP4多精度切換,適配MoE及長上下文模型需求。據王勇分享,啟望S3“取得了10倍以上的推理性價比提升”,單晶片性能較前代提升5倍,單位token成本下降約90%,力爭生命周期內實現百億級收入,將於今年上市。二、系統方案:寰望SC3超節點,建構高效推理基礎設施同步發佈的寰望SC3超節點方案,聚焦千億級以上參數多模態MoE推理需求,支援單域256卡一級互聯,適配PD分離、大EP部署,提升系統利用率與穩定性,可應對長上下文、多並行等複雜場景。該方案採用全液冷設計,PUE表現優異,支援模組化快速交付。王勇介紹,大EP部署下吞吐率提升20~25倍,“在同等推理能力量級下,該方案可將整體系統交付成本從行業常見的億元級降低至千萬元級,實現1個數量級的下降”。通過RDMA連接,可擴展為千卡級叢集,滿足大規模部署需求。軟體層面,其自研體系覆蓋驅動、算子庫等全鏈路,95%相容CUDA,降低遷移門檻,已適配DeepSeek、通義千問等百余種大模型,相容ModelScope平台90%以上主流模型形態。三、生態佈局:推理雲計畫,邁向“百萬token一分錢”目標曦望以“晶片+系統+生態”佈局,啟動推理雲計畫,與商湯、範式共建“百萬Token一分錢”合作,聯動杭鋼數字等平台落地浙江、輻射全國,同時與三一、協鑫等十余傢伙伴簽約,將推理能力嵌入製造、能源等多場景。聯席CEO王湛表示,新一代AI原生智算平台為核心支撐,具備四大優勢:軟硬體深度協同,自研核心與通訊庫,量化壓縮技術實現250%+性能提升且精度損失極小;資源彈性調度,通過GPU池化等技術按需供給;開箱即用,整合模型市場與工具;穩定可靠,具備高可用及智能維運能力。基於該平台,曦望以“推理即服務”升級商業模式,建構“晶片+雲基建”雙輪驅動,通過GPU池化整合算力,以MaaS為入口,為客戶提供零門檻一體化服務,成為“百萬Token一分錢”合作的技術核心。王勇補充,“百萬token一分錢”目標將在S3至S5迭代中逐步達成。據煒燁智算測算,目前曦望每百萬token價格約0.57元,遠低於行業7~14元水平。未來將以“token as a service”為核心,提供多元服務,輸出高性價比綠色算力。四、產品路線圖:三代迭代規劃,完善全鏈路產品矩陣曦望遵循“量產一代、發佈一代、預研一代”節奏,明確三年路線:2026年推啟望S3,2027年發佈S4高性能晶片,2028年推出S5安全可控晶片,以每年一迭代鞏固賽道優勢,邁向極致推理成本目標。圍繞啟望S3,曦望建構了覆蓋計算卡、伺服器、AI叢集、終端裝置的全鏈路產品矩陣,形成完整生態,為各行業提供一體化推理方案,強化“更懂AI的推理GPU廠商”定位,助力降低國內AI推理成本。五、企業根基:脫胎商湯,匯聚頂尖力量深耕推理賽道曦望成立於2020年5月,前身為商湯科技大晶片部門,是國內首家All in推理的GPU晶片公司。董事長徐冰明確表示:“我們是一家更懂AI的GPU晶片公司,而且是國內第一家All in推理的GPU晶片公司。” 其使命是“把大模型推理做到極致,要讓AI推理真正變得便宜穩定,而且隨處可用”。公司核心團隊超300人,多來自輝達、AMD、崑崙芯等頭部企業,核心骨幹平均擁有15年行業經驗,採用“雙引擎”架構:研發端聯席CEO王勇,曾任AMD、崑崙芯核心架構師,擁有20年晶片研發經驗,2020年加入商湯後帶領團隊實現兩代晶片一次性研發量產成功;商業化端聯席CEO王湛,為百度創始團隊成員、前集團副總裁,曾執掌百度搜尋8000人團隊,2025年初加入,負責產品化、商業化及組織文化建設。過去8年,曦望累計研發投入20億元,堅持GPU每年一迭代,成功量產啟望S1、S2。2025年,其推理GPU交付量突破1萬片,斬獲多個頭部訂單,收入大增;同年完成約30億元戰略融資,股東涵蓋商湯、三一、杭州資料集團等龍頭及多家國資、頂尖風投。王勇強調:“我們拒絕做跑分黨,不希望用benchmark來定義晶片,而是希望能夠做到幫客戶賺錢的算力。”曦望擁有全端GPGPU架構,率先提出用大容量DDR替代HBM、以高性價比推理晶片替代訓推一體晶片的理念。啟望S1於2018年研發、2020年量產,IP已授權索尼、小米,應用於AI攝影機及手機;啟望S2對標國際旗艦,2021年流片、2023年產品化,在DeepSeek滿血版適配中達國際巨頭80%推理性能,穩居國內第一梯隊。軟體棧實現95%CUDA相容,已適配商湯全系列小浣熊模型,與長城集團打造國產信創一體機,拓展多元垂直應用。 (深科技)
《威剛領軍記憶體族群出關!法人點名四大動能AI超級循環正式啟動》記憶體族群過去三季上演一場驚心動魄的重生劇碼,從國際大廠減產保價、報價觸底反彈,再到 AI 浪潮帶動 HBM(高頻寬記憶體)供不應求,激勵威剛、十銓、南亞科、華邦電相關概念股狂飆列入「處置股」,隨著分盤交易限制解除,法人點名四大關鍵動能成為股價核心燃料。記憶體產業之所以能被看好,不僅是產業景氣反彈,而是超級循環(Super Cycle)週期,關鍵在於 AI 帶來的結構性改變,由四大新動能支撐未來 6 到 12 個月股價上攻的核心燃料,首先是 HBM 的排擠效應,因 NVIDIA 的 GPU 如 H100, Blackwell 系列極度依賴 HBM3e,甚至未來的 HBM4,HBM 不僅價格是傳統 DRAM 的數倍,更必須消耗大量的晶圓產能。記憶體三大原廠如 SK 海力士與三星將大部分的資本支出與先進產能都移轉去生產 HBM,導致傳統 DRAM 的 DDR4、DDR5 供給遭到排擠,而這對於台灣的中下游廠商而言,卻是一個天大的好消息,因為原廠不願意做標準型記憶體市場,供給將持續緊俏,而這種「產能排擠效應」保證標準型 DRAM 的價格在未來一年難以深跌,甚至有續漲空間。第二是 AI PC 與 AI 手機的「容量倍增」紅利,如果說 HBM 是雲端的戰爭,那麼「邊緣運算(Edge AI)」就是終端的戰場,微軟定義的 AI PC,以及能夠運行生成式 AI 的旗艦手機,對記憶體的需求強勁,而要在裝置端運行一個像樣的 LLM(大型語言模型),記憶體就是最大的瓶頸,以 PC 端來說,現在 AI PC 起步標準就是 16GB,未來主流將推向 32GB 甚至 64GB。第三是 DDR5 與 DDR4 的黃金交叉,由於市場目前正處於世代交替的關鍵期,隨著 Intel 與 AMD 新平台的滲透率提升,DDR5 正式成為主流,過去因為 DDR5 太貴,消費者買不下手,但如今 DDR5 與 DDR4 的價差已縮小至 15%~20% 的甜蜜點,這將加速世代交替,而 DDR5 的技術難度較高,因此平均銷售單價(ASP)與毛利率都優於 DDR4。第四是 NAND Flash 市場迎來轉機,過去 Flash 殺價競爭最為慘烈,但 AI 伺服器不僅需要運算,更需要極高速的資料吞吐,因此 QLC (Quad-Level Cell) 企業級 SSD 正在快速取代傳統硬碟(HDD)在資料中心的地位,而 AI 訓練資料庫動輒數 PB,對於高容量、高密度的 Enterprise SSD 需求大增。法人指出,記憶體產業的這波漲勢,始於減產帶來的供需修復,飆漲於資金的投機熱潮,但最終將支撐於 AI 帶來的實質需求,首選的是具備研發能力、能切入 AI 伺服器或高階電競市場的控制 IC 設計廠與高階模組廠,次選是擁有龐大低價庫存,且通路佈局全球化的通路龍頭。
狂飆1034.71%!中國國產半導體最大贏家現身
2026年初,半導體行業迎來了一場"業績大考"。隨著超過50家上市公司密集發佈2025年度業績預告,一幅清晰的產業分化圖譜浮出水面:有人狂喜數錢,有人"關燈吃麵";有人乘AI東風扶搖直上,有人卻在周期低谷中苦苦掙扎。01 IC設計,冰火兩重天IC設計是本次業績分化最劇烈的賽道,數字晶片公司方面,可以看到收入高增長與虧損並存的現象,模擬晶片業績分化現象仍在持續。CPU、GPU算力晶片公司1月12日晚間,中國國產GPU晶片公司摩爾線程發佈2025年度業績預告,資料顯示2025年營收預計為14.50億元至15.20億元,較2024年增長230.70%至246.67%。2025年扣非淨利潤預計虧損10.40億元至11.50億元,與上年同期相比,虧損縮小幅度為29.59%到36.32%。值得注意的是,儘管淨利潤依舊虧損,但摩爾線程營業收入將連續四年保持高增態勢,同時淨虧損亦將連續四年實現縮小。1月23日,龍芯中科發佈2025年度業績預告。預計全年實現營收6.35億元,歸屬於上市公司股東的淨利潤為-4.49億元左右,扣除非經常性損益後的淨利潤約-5.03億元。儘管仍處於虧損狀態,但同比減虧約24%-28%。1月15日,景嘉微披露2025年度業績預告,預計2025年實現營業收入6.5億元至8.5億元,同比增長39.38%-82.27%,主要得益於圖形顯控領域產品的收入增長。歸母淨利潤虧損1.2億元至1.8億元,上年同期虧損1.65億元;扣非淨利潤虧損1.46億元至2.06億元,上年同期虧損2.04億元。可以看到,中國國產CPU、GPU等算力晶片企業的業績呈現出“營收高增、虧損縮小”的共性特徵,其中摩爾線程以230%以上的營收增速驚豔全場,雖仍處虧損,但虧損縮小近三分之一。這一表現背後,正是中國國產GPU在AI訓練和推理場景中的快速滲透,尤其在大模型訓練伺服器、邊緣計算節點等領域。算力晶片“高增伴虧損”,是中國國產力量突破高端晶片賽道的必經階段。全球AI算力需求爆發,給了中國國產算力晶片難得的市場窗口,這是營收高增的核心原因。但高端算力市場長期被海外巨頭壟斷,中國國產企業不僅要突破晶片設計、製造的技術難關,還得搭建適配的軟體生態,而生態建設需要長期投入,短期虧損本質是生態卡位的必要成本。MCU、SoC、CIS晶片公司如果說算力晶片是“風口上的巨人”,那麼MCU、SoC和CIS公司便是“靜水深流中的贏家”。1月7日,中科藍訊發佈2025年業績預增公告,2025年度預計實現營業收入為18.30億元到18.50億元,同比增長0.60%到1.70%;實現扣除非經常性損益的淨利潤為2.20億元到2.40億元,同比下降1.70%到9.89%。1月26日,瑞芯微發佈2025年業績預告,預計2025年實現淨利潤10.23億元到11.03億元,同比增長71.97%到85.42%,歸母淨利潤扣除非經常性損益後為9.93億元到10.73億元,同比增長84.44%到99.30%。預計公司2025年實現營業收入43.87億元到44.27億元,同比增長39.88%到41.15%。1月20日,全志科技發佈2025年度業績預告,預計歸屬於上市公司股東的淨利潤為2.51億元至2.95億元,同比增長50.53%至76.92%;歸屬於上市公司股東的扣除非經常性損益的淨利潤為2.1億元至2.55億元,同比增長81.28% 至120.12%。1月23日,復旦微電披露2025年度業績預告,預計2025年實現營業收入39.3億元至40.3億元,同比增長9.46%-12.25%;歸母淨利潤1.9億元至2.83億元,同比下降50.58%-66.82%;扣非淨利潤預計1.25億元-1.85億元,同比下降60.14%-73.07%。1月25日,中微半導發佈業績預告,預計公司2025年實現營收11.22億元左右,同比增長23.07%左右;預計2025年實現歸母淨利潤2.84億元左右,同比增長107.55%左右。預計2025年實現扣非淨利潤1.69億元左右,同比增長85.36%左右。1月26日,CMOS圖像感測器設計公司思特威發佈了2025年年度業績預告。預計2025年度實現營業收入88億元到92億元,較上年同期增加28.32億元到32.32億元,增幅47%到54%;預計2025年度實現歸屬於母公司所有者的扣除非經常性損益的淨利潤為9.66億元到10.2億元,同比增幅147%到161%。在數字晶片的另一大細分領域,MCU、SoC、CIS晶片企業的業績分化同樣顯著,核心差異或在於是否精準切入高增長賽道。比如中科藍訊主要佈局消費電子領域的音訊晶片,受手機、TWS耳機等傳統終端需求低迷影響,增長相對乏力。瑞芯微、全志科技聚焦AIoT、智能汽車等新興領域,受益於相關市場的爆發式增長;思特威則精準卡位車載、安防等高端CIS市場,在中國國產化浪潮中搶佔先機。復旦微電的業績下滑,則與特定行業需求波動及研發投入增加有關。儲存晶片公司2025年的儲存晶片行業迎來了“超級周期”,DRAM、NAND價格一路上漲,再加上AI伺服器對高性能儲存的需求爆發,整個產業鏈的企業都賺得盆滿缽滿。從已披露的業績來看,所有儲存企業都實現了高增長,部分企業淨利潤增幅超4倍,成了這次業績潮裡的“最大贏家”。1月13日,佰維儲存披露2025年業績預告,預計營收100億元-120億元,同比增長49.36%-79.23%;歸母淨利潤8.5億元-10億元,同比增加427.19%-520.22%;扣非淨利潤7.6億元-9億元,同比增加1034.71%-1243.74%。在本次統計的所有中國國產半導體公司中,佰維儲存堪稱最大贏家。其2025年扣非歸母淨利潤同比增幅高達1034.71%-1243.74%,突破1000%的驚人增長幅度,在所有披露業績的企業中遙遙領先。1月16日,瀾起科技發布公告,公司預計2025年度實現歸母淨利潤21.5億元至23.5億元,較上年同期增長52.29%至66.46%;預計實現歸母淨利潤(扣除非經常性損益)19.2億元至21.2億元,較上年同期增長53.81%至69.83%。1月21日,德明利發佈2025年業績預告,預計2025年實現營業收入103億元至113億元,同比增長115.82%至136.77%;預計歸屬於上市公司股東的淨利潤為6.5億元至8億元,同比增長85.42%至128.21%。扣除非經常性損益後的淨利潤預計為6.3億元至7.8億元,同比增長108.13%至157.68%。1月22日,兆易創新發佈業績預告,預計2025年度實現營業收入92.03億元左右,與上年同期相比增加18.47億元左右,同比增加25%左右。預計2025年歸屬於上市公司股東扣除非經常性損益後的淨利潤為14.23億元左右,與上年同期相比增加3.93億元左右,同比增長38%左右。儲存晶片全面爆發是周期與技術共振的結果,全球已進入AI驅動的超級周期,HBM將成核心競爭點。此外,據市場研究機構Counterpoint Research近日發佈的報告,儲存市場已進入“超級牛市”階段,當前行情甚至超越了2018年的歷史高點,與此同時,供應商議價能力已達到歷史最高水平。預計2026年第一季度儲存價格將再漲40%至50%,2026年第二季度繼續上漲約20%。在行業供需格局重構帶來的景氣周期中,中國國產儲存廠商正迎來寶貴的發展窗口。模擬晶片公司1月22日,思瑞浦發佈2025年度業績預告,預計2025年實現營業收入21.3億元至21.5億元,同比增長74.66%至76.30%;同期預計實現歸母淨利潤1.65億元至1.84億元,較上年同期增加3.62億元至3.81億元,實現扭虧為盈,歸屬於上市公司所有者扣除非經常性損益後的淨利潤為1.05億元-1.26億元。1月17日,艾為電子發佈2025年年度業績預告,預計實現歸屬於母公司所有者的淨利潤3億元至3.3億元,同比增幅區間為17.7%至29.47%。扣除非經常性損益後的淨利潤預計為2億元至2.3元,增長率在27.97%至47.17%之間。1月21日,翱捷科技發佈年度業績預告,預計2025年年度實現營業收入為38.17億元左右,同比增長12.73%左右;歸母淨利潤為-3.99億元左右,較上年同期相比,虧損金額減少2.94億元左右,虧損同比減少42.38%左右。扣非淨利潤為-5.79億元左右,較上年同期虧損減少18.04%左右。1月13日,卓勝微發佈2025年度業績預告,預計2025年實現營業收入37億元至37.5億元,同比下降約16%至18%;歸母淨利潤虧損2.55億元至2.95億元,同比下降約163.46%至173.41%。扣除非經常性損益後的淨利潤為-3.36億元至-3億元。模擬晶片行業經歷了長達近3年的去庫存“至暗時刻”,2025年四季度,頭部模擬晶片龍頭陸陸續續發佈漲價消息。模擬晶片全球頭部企業亞德諾計畫自2026年2月1日起全線漲價,其中普通商用級產品漲幅普遍在10%-15%之間,工業級產品漲幅約15%。此外,德州儀器啟動覆蓋3300餘款料號的全球性漲價計畫,約9%的料號漲幅突破100%,主要集中於停產料號或極低利潤產品;55%的料號漲幅則落在15%-30%區間。中國國產廠商方面,業績分化也比較明顯。主攻工業、汽車等高端賽道的廠商比如思瑞浦已經實現扭虧為盈,但堅守消費電子賽道的廠商受市場低迷和價格戰影響,增長空間有限。02 半導體裝置與封測,共迎紅利在AI算力革命和中國國產化的雙重推動下,半導體裝置和封測企業也迎來了業績增長期。裝置企業作為產業鏈的“賣鏟人”,受益於中國晶圓廠擴產和先進製程研發;封測企業則靠先進封裝技術,繫結AI晶片產業鏈,實現了價值提升。1月20日,芯碁微裝發佈業績預告,預計2025年淨利潤為2.75億元至2.95億元,同比增長71.13%至83.58%;扣非後淨利潤預計為2.64億元至2.84億元,同比增長77.7%至91.16%。1月22日,盛美上海發佈2025年度業績預告,預計營業收入為66.80億元-68.80億元,比上年同期增長18.91%-22.47%。1月23日,中微公司發佈2025年年度業績預告的自願性披露公告,公司預計營業收入約123.85億元,同比增長約36.62%。歸屬於母公司所有者的扣除非經常性損益的淨利潤為15.00億元至16.00億元,與上年同期相比將增加1.12億元至2.12億元,同比增加約8.06%至15.26%。2025年,晶片封測行業迎來關鍵轉折——繼上游晶圓製造、中游設計環節後,封測作為半導體產業“最後一公里”,不僅傳來集體漲價訊號,更在中國國產化處理程序中交出了“營收超50%”的亮眼成績單。1月20日,封測龍頭通富微電發佈2025年度業績預告,歸屬於上市公司股東的淨利潤預計為11億元至13.5億元,比上年同期增長62.34%至99.24%。扣除非經常性損益後的淨利潤預計為7.7億元至9.7億元,比上年同期增長23.98%至56.18%。全球儲存晶片產業鏈正迎來新一輪強勁的漲價周期,這一趨勢已迅速蔓延至下游封測環節。因產能利用率逼近極限,主要儲存封測大廠近期已將報價上調高達30%,並正醞釀後續進一步提價。據悉,受惠於DRAM與NAND Flash大廠全力衝刺出貨,力成、華東、南茂等頭部封測廠商訂單蜂擁而至,多家廠商證實“訂單真的太滿”,現有產能已無法滿足需求。為應對成本與供需失衡,各家廠商已正式啟動首輪漲價,漲幅直逼三成,且這股漲價潮預計將從一季度起直接體現在財報業績中。面對持續湧入的訂單,廠商態度轉趨強硬。相關企業透露,若供需緊張態勢持續,不排除短期內啟動第二波漲價。與此同時,南茂等廠商因僅能滿足約八成客戶訂單,正緊急向外採購裝置以擴充產能。市場分析指出,隨著各大儲存原廠將資源集中於先進工藝,標準型產品供給受擠壓,這將推升封測端議價能力。 (半導體產業縱橫)
瑞幸背後的晶片,藏不住了
瑞幸咖啡背後的晶片,藏不住了。當你走進瑞幸咖啡店,點一杯生椰拿鐵的所有過程,例如下單、出杯、核銷、取餐……這一切的背後其實都有一雙“眼睛”在盯著。在看什麼?它要即時識別訂單、判斷製作節奏、校驗物料狀態、監控裝置運行,還要把資料同步回總部,用於品控、調度和營運決策。這就是藏在瑞幸咖啡背後無數的邊緣側AI,它們有一個共性,那便是算力必須就近部署,響應必須足夠快,穩定性必須足夠強,成本還要可控。晶片,成了其中關鍵中的關鍵。就在今天,瑞幸背後晶片的廬山真面目終於浮出了水面——來自一家剛剛完成上市不久的中國國產通用GPU公司,天數智芯。前腳剛剛敲完鐘,時隔僅半個月時間,天數智芯便又一口氣發佈了四款邊端算力產品,彤央系列。而且不只是發佈的動作,像瑞幸已經在用的邊端算力,正是彤央。那麼這個系列的產品到底實力幾何,我們繼續往下看。一口氣發佈四款新品先來看名字。彤央之名,源自商周青銅器銘文,但在天數智芯的內部,彤央有著別樣的寓意:“彤”指向高能效計算能力,“央”則意味著在邊端場景中承擔核心算力樞紐的角色。換言之,這是一個為真實業務現場而生的算力系列。彤央系列的首發陣容,共包括四款產品:TY1000、TY1100,以及定位算力終端的TY1100_NX和TY1200。先看彤央TY1000。這是一個標準699Pin介面的模組,尺寸只有口袋大小,但在這個方寸之間,天數塞進了近200T的稠密算力。在實際測試中,無論是典型的CV任務,還是NLP推理,甚至是對參數規模達到32B的DeepSeek-R1模型進行推理,以及具身智能VLA模型及世界模型等場景,TY1000在多項指標上都展現出不弱於主流國際方案的表現。在天數智芯披露的測試資料中,TY1000在多類負載下的綜合效率,超過了輝達AGX Orin所對應的典型配置。雖然這並不意味著全面替代,但至少證明了一件事:在邊端通用推理這個維度,中國國產通用GPU已經具備了正面對比的能力。其次是彤央TY1100。這款產品在架構上進行了進一步升級,採用了12核ARM v9架構CPU,並在系統級算力供給上更加充沛。它面向的是對通用計算和AI推理都有較高要求的複雜場景,比如多感測器融合、邊緣資料預處理、即時決策等。如果說TY1000更偏向算力核心,那麼TY1100則更像是一塊完整的邊緣計算底座。接下來,是針對對視訊記憶體容量和性價比更加敏感使用者的TY1100_NX。更大的視訊記憶體配置,使其在多模型平行、長序列推理等場景中具備更高的穩定性,同時維持了即插即用的部署方式,降低了系統整合門檻。最後,便是彤央TY1200,則被天數智芯定義為算力終端。它的算力規格提升到了300 TOPS,更重要的是,它是面向終端形態的整體方案。這類產品的目標使用者,並不只是演算法工程師,還包括希望直接把AI能力裝進裝置的行業客戶。從產品組合上看,彤央系列並沒有走單點極致路線,而是刻意拉開了算力、形態和價格區間,覆蓋從算力模組到終端的不同部署需求。但天數智芯並沒有把重點只放在晶片的參數上。在生態層面,彤央系列在介面和形態上實現了與主流產品的Pin-to-Pin相容,大幅降低了客戶從既有方案遷移的成本。這一點,對於已經有成熟系統的工業和商業客戶來說,幾乎是“是否願意嘗試”的分水嶺。更重要的是,這些產品並不是為了發佈而發佈。在機器人領域,彤央與格藍若機器人合作進入企業實際應用場景;在工業側,比依電器等製造企業正在用其進行裝置智能化升級;在商業零售場景中,瑞幸咖啡只是其中一個典型案例;而在交通領域,彤央系列也已經參與到多個車路雲一體化試點中。當四個完全不同的行業場景,開始使用同一套通用GPU算力底座時,一個更大的問題隨之浮現:天數智芯真正想做的,究竟是什麼?天數智芯的“野心”也暴露了如果只看彤央系列,很容易理解為一家中國國產晶片公司想要率先補全雲邊端的業務版圖。但從其同樣於1月26日公開披露的架構路線圖來看,事情顯然沒有這麼簡單,在其業務大本營的雲端場景,天數有更野心勃勃的目標。天數智芯並不滿足於中國國產替代這個階段性目標。在多次公開場合中,它都明確提到,自己的長期目標是對標乃至超越輝達這樣的行業標竿。為此,天數智芯給出了一張明確到年份的架構路線圖。2025年天數智芯推出的天數天樞架構,超越輝達Hopper。據瞭解,這已經不是規劃,而是現實:該架構支援從高精度科學計算到AI精度計算,AI晶片在執行注意力機制相關計算時,算力的實際有效利用效率達到90%及以上。而測試資料顯示,天數天樞架構效率較當前行業平均水平提升60%,在DeepSeek V3場景平均比Hopper架構高約20%性能。到2026年,天數天璇架構,新增ixFP4精度支援,對標Blackwell;天數天璣架構,實現全場景AI與加速計算覆蓋,超越Blackwell。而在2027年,天數智芯規劃中的天權架構,則直接指向對Rubin架構的全面超越,重點融入更多精度支援與創新設計。支撐這條路線圖的背後,還有一整套底層技術能力。包括TPC Broadcast、Instruction Co-Exec、Dynamic Warp Scheduling在內的多項技術,構成了天數智芯在指令級平行、資源調度和算力利用率上的核心優勢。這些能力,決定了它是否真的具備在通用GPU賽道長期演進的可能性。那麼,天數智芯是否真的有這樣的實力?一個直觀的判斷方式,是看通用性。截至目前,天數智芯的通用GPU已經穩定運行400余種主流模型,並且強調Day 0適配能力;以DeepSeek為例,其在天數智芯平台上的適配和推理,已經成為客戶實際部署的一部分。第二個維度,是商業化落地。根據其公開披露的資料,天數智芯累計交付的晶片數量已經超過5.2萬片,服務客戶超過300家。在實際應用中,網際網路AI客服的算力成本被壓縮了一半,而單機性能翻倍;金融行業的研報生成效率提升了約70%;在高要求的叢集場景中,其千卡規模叢集已經實現了超過1000天的穩定運行。這些資料足夠耀眼,也足夠具體。尤其值得注意的是,天數智芯在招股書中,對客戶數量、量產發貨規模、卡級毛利等核心指標進行了相對完整的披露。這種攤開來講的方式,在當前的中國國產晶片行業中並不多見。也正是在這一點上,天數智芯與不少大廠自研晶片或專用NPU路線拉開了差距。它選擇了一條更難、也更慢的路——堅持通用GPU路線,從架構、指令集、編譯器到軟體棧進行全端自研。這意味著沒有盲區,也意味著每一步都必須自己趟過去。最後,回到瑞幸的那杯咖啡。當中國國產算力開始真正進入千行百業,進入門店、工廠、道路和裝置,晶片不再只是發佈會上的參數,已然是業務鏈條中不可或缺的一環。從這個角度看,此次發佈的意義,或許並不只在於發佈了四代架構圖,和四款邊端新品,而在於中國國產通用GPU,一邊抬頭,試圖超越行業標竿,並以更大的野心,嘗試面向無人區提出自己的路徑;一邊低頭,以一種更貼近現實的方式,不斷深入產業現場。而這,可能才是天數智芯真正想證明的事情。 (量子位)