#AI晶片
OpenAI簽下近700億AI晶片巨單!
將成為全球最大的高速AI推理平台。百億美元AI晶片大單來了!智東西1月15日報導,今天,OpenAI與美國AI晶片獨角獸Cerebras聯合宣佈,將部署750兆瓦的Cerebras晶圓級系統,為OpenAI客戶提供服務。該合作將於2026年起分階段落地,並於2028年之前完成,建成後將成為全球規模最大的高速AI推理平台。另據《華爾街日報》援引知情人士消息稱,這筆交易價值超過100億美元,同時,Cerebras正在洽談以220億美元的估值融資10億美元,這將使其估值升至原有的近3倍。知情人士稱,Cerebras仍計畫推進IPO。值得注意的是,OpenAI聯合創始人兼CEO山姆·奧特曼(Sam Altman)同時也是Cerebras的個人投資者。Cerebras打造的晶片以“大”著稱,能在一塊晶片上塞入4兆顆電晶體。OpenAI認為,Cerebras晶片的速度來自於將龐大的計算量、記憶體和頻寬整合在一塊巨型晶片上,消除了傳統硬體推理速度下降的瓶頸。Cerebras上大模型的響應速度,是基於GPU的系統的15倍。OpenAI稱,將Cerebras整合進其計算解決方案組合,旨在進一步提升AI響應速度。當AI能夠實現即時響應時,使用者可以完成更多工,停留時間更長,並運行價值更高的工作負載。在公告中,Cerebras稱雙方的合作醞釀了十年之久。OpenAI和Cerebras幾乎同時創立,自2017年以來,雙方團隊頻繁會面,分享研究成果、早期工作,並堅信模型規模和硬體架構終將深度融合。根據奧特曼與馬斯克相關訴訟中公開的法庭檔案顯示,早在2017年,OpenAI就曾討論過與Cerebras建立合作關係的可能性。OpenAI一直在尋找比輝達晶片更便宜、更高效的替代方案。去年,OpenAI宣佈正與博通合作開發定製晶片,並單獨簽署協議,使用AMD的新型MI450晶片。Cerebras CEO Andrew Feldman在接受《華爾街日報》採訪時稱,OpenAI和Cerebras於去年秋季開始正式洽談合作事宜,並在感恩節前簽署了合作意向書。Feldman認為,目前推動市場的因素是“對快速計算的非凡需求”。OpenAI基礎設施負責人Sachin Katti稱,隨著工程師不斷反饋現有晶片在運行AI應用時速度仍有提升空間,尤其是在程式設計相關任務上,OpenAI開始認真評估並推動與Cerebras的合作。Katti在採訪中提到:“算力是衡量OpenAI收入潛力的最關鍵因素。過去兩年裡,我們的整體計算能力幾乎每年翻倍,收入增長也呈現出同樣的趨勢。”Cerebras成立於2016年,在2024年提交上市申請時披露,其大部分收入來自一家客戶——總部位於阿布扎比的G42公司。次年,Cerebras撤回了上市計畫,轉而通過私募融資11億美元,彼時Cerebras的投後估值為81億美元。Feldman稱,Cerebras此後已與IBM和Meta簽署了新的合作協議。市場研究公司PitchBook的資料顯示,該公司已累計融資18億美元,還不包括新籌集的資金。結語:大模型商用引爆推理需求,多元算力路線獲頭部玩家押注隨著大模型進入大規模商用階段,如何在更短時間內、以更低成本完成推理,正成為影響使用者體驗、應用上限乃至商業化能力的關鍵。雖然輝達GPU仍是當前AI算力生態的絕對主流,但包括晶圓級架構、定製ASIC在內的多元算力路線,正在被頭部模型廠商納入基礎設施佈局。 (智東西)
全球半導體格局劇變:輝達首破千億,昔日霸主跌出前三
破紀錄的7930億美元!全球半導體格局劇變:輝達首破千億,昔日霸主跌出前三AI晶片的滾滾浪潮中,一家公司獨佔行業增長的三分之一以上,昔日晶片巨頭卻在這場競賽中節節敗退。2025年,全球半導體市場收入飆升至7930億美元,同比增長21%。這一前所未有的增長速度背後,AI成為最核心的推動力量。市場調研機構Gartner最新資料顯示,AI半導體——包括處理器、高頻寬記憶體和網路元件——持續推動半導體市場增長,預計到2025年將佔總銷售額的近三分之一。隨著AI基礎設施支出激增,預計2026年將超過1.3兆美元,AI半導體在市場中的主導地位將進一步鞏固。01 AI驅動,格局生變AI熱潮正在重塑全球半導體產業格局。2025年全球半導體市場呈現出前所未有的增長態勢,AI處理器銷售總額超過2000億美元,專為AI加速器打造的高頻寬記憶體(HBM)銷售額也突破300億美元,佔據DRAM市場的23%。三星電子、SK海力士和美光科技三大DRAM製造商,憑藉HBM產品斬獲了自身記憶體業務總營收中約23%的份額,成為AI熱潮的最大受益者之一。從區域市場看,美洲和亞太地區預計2025年將增長25%-30%,主要受邏輯電路和儲存器業務的推動。歐洲預計增長6%,而日本則預計下降4%。世界半導體貿易統計組織(WSTS)預測,2026年全球半導體市場規模將繼續增長超過25%,達到9750億美元。02 輝達領跑,千億美元里程碑在全球半導體供應商排名中,輝達以1257億美元的營收一騎絕塵,成為首家半導體銷售額突破1000億美元的供應商。這一數字較排名第二的三星電子高出近74%,貢獻了行業增長的35%以上。輝達的營收同比激增近64%,市場份額達到15.8%,展現出其在AI晶片領域的絕對領先地位。傳統晶片巨頭英特爾的市場份額則持續下滑,至2025年底僅為6%,是2021年的一半。英特爾的營收同比下降3.9%至479億美元,排名跌至第四。這一變化清晰地反映出英特爾在AI晶片領域的滯後,未能充分享受到AI熱潮帶來的增長紅利。03 儲存三巨頭,HBM成新戰場三星電子雖然保住了第二名的位置,但其半導體收入的增長主要依賴於儲存器業務(增長13%),非儲存器業務收入則同比下降8%。相比之下,SK海力士憑藉AI伺服器對HBM的強勁需求,以610億美元的營收躍升至第三位,同比增長37%,一舉將英特爾擠出前三甲。美光科技同樣依託HBM記憶體產品,營收實現50%的同比增長,達到415億美元,排名升至第五位。這一排名變化突顯了HBM在AI時代的重要性。隨著AI模型規模不斷擴大,對高速、大容量記憶體的需求日益增長,HBM已成為AI晶片不可或缺的組成部分。04 第二梯隊,差異化競爭高通營收穩健增長12%,達到370億美元,但增速遠低於深度受益於AI浪潮的晶片企業。這家公司主要依靠移動裝置晶片市場維持增長。博通與AMD則分別實現23%和35%的營收增長,排名第六和第七。博通以服務商身份助力其他企業開發AI加速器,而AMD的AI加速器業務營收佔比已大幅提升。蘋果營收增長約20%,達到246億美元,主要得益於自研晶片在iPhone、Mac等產品中的廣泛應用。聯發科以約185億美元的營收排名第十,其產品以面向智慧型手機、電視及汽車領域的ARM架構晶片為主。值得注意的是,純晶片代工商台積電等並未出現在Gartner的這份榜單中。原因是其不直接銷售自有晶片,而是為輝達、英特爾、AMD等企業提供代工服務。2025年,台積電營收同比增長31.6%,達到3.81兆新台幣,折合美元約1200億美元。05 未來趨勢,AI主導過半市場Gartner預測,到2029年,AI半導體將佔半導體總銷售額的50%以上,成為半導體市場增長的核心動力。隨著AI技術的不斷成熟和應用場景的持續拓展,AI晶片的需求將持續攀升。同時,HBM等高性能記憶體產品也將迎來更加廣闊的發展空間。這一趨勢正在加速半導體產業的技術演進和資本投入。AI不僅改變了市場需求結構,也在重塑整個產業的競爭格局。那些能夠快速適應這一變化、在AI領域提前佈局的公司,正獲得前所未有的增長機遇。另一方面,中國大陸半導體IDM營收最高的公司為聞泰科技,前三季度營收約300億元,全年估算按照400億元來算,距離排名第10的185億美元差距仍然很大。未進入前十的廠商方面,歐洲最大的晶片製造商英飛凌,2025財年營收達 146.6億歐元,折合美元約171億美元,這一規模大致能使其躋身全球半導體企業第11或12名,與德州儀器(TI)處於同一梯隊。專注於NAND快閃記憶體領域的閃迪,近期增長勢頭同樣強勁,資料中心業務貢獻突出。受NAND快閃記憶體價格大幅上漲的預期推動,自2025年秋季起,閃迪股價已實現數倍增長。全球半導體產業正站在一個新時代的門檻上,7930億美元的市場規模只是起點。隨著AI技術向各行各業滲透,半導體作為數字時代“基石”的地位將更加穩固,而這場由AI引領的產業變革,才剛剛拉開序幕。 (芯果)
這家日企卡住了AI晶片的脖子,黃仁勳親自登門搶購!
1月14日消息,據日經新聞報導,由於人工智慧(AI)需求爆發,導致AI晶片載板所需的高端電子級玻璃纖維布(glass cloth,簡稱“玻纖布”)供應短缺,就連蘋果公司都被迫與輝達、Google、亞馬遜、微軟等科技巨頭展開爭奪戰。而X平台的爆料顯示,輝達CEO黃仁勳為了穩固其AI晶片所需的高端玻纖布的供應,近日還親自拜訪了高端玻纖布龍頭供應商日東紡(Nittobo)。1月14日消息,據日經新聞報導,由於人工智慧(AI)需求爆發,導致AI晶片載板所需的高端玻璃纖維布(glass cloth,簡稱“玻纖布”)供應短缺,就連蘋果公司都被迫與輝達、Google、亞馬遜、微軟等科技巨頭展開爭奪戰。而X平台使用者@BourseAsieFR 的爆料顯示,輝達CEO黃仁勳為了穩固其AI晶片所需的高端玻纖布的供應,近日還親自拜訪了玻纖布龍頭供應商日東紡(Nittobo)。高端玻纖布為何如此緊缺?日東紡獨佔90%市場資料顯示,電子級玻纖布是IC載板與印刷電路板(PCB)的關鍵零元件,也是打造電子裝置所需的最基礎的材料,這些基板主要承載處理器並負責訊號傳輸。由於玻纖維的製造需在約1,300°C 高溫下進行熔融紡絲,裝置須使用昂貴的鉑金材料,且每一根纖維都必須比頭髮更細、完全圓潤、不得含有氣泡。業界人士指出,玻纖布的穩定性決定了基板品質。當前,AI晶片與高端處理器對於資料傳輸的穩定性與傳輸速度要求極高,就需要用到特殊規格的低膨脹係數(Low CTE)的高端玻纖布(又稱“T-glass”),因為其具有尺寸穩定、剛性高、利於高速訊號傳輸等特性,能支撐AI晶片與高端處理器所需的高頻、高密度設計。比如,目前輝達等廠商的高端AI晶片絕大多數都採用的是台積電的CoWoS封裝,其中用來支撐GPU/TPU/ASIC與高頻寬記憶體(HBM)的載板就需要用到特殊規格的Low CTE的高端玻纖布。目前全球能夠生產Low CTE玻纖布的企業主要有三家:日本的日東紡(Nittobo)、台灣的台灣玻璃、中國大陸的泰山玻璃纖維(Taishan Fiberglass)。此外還有一些小型供應商,比如宏和電子(Grace Fabric Technology,GFT)、建滔積層板(Kingboard Laminates Group)和Unitika。但是,日東紡一家公司佔據了全球超過90%的供應。輝達此前也一直是指定其AI晶片所需Low CTE玻纖布由日本的日東紡獨家供應,因為它是唯一一家符合其最嚴格質量要求的公司。日東紡成立於1923年,由成立於1898的Koriyama Kenshi Boseki Co., Ltd.和成立於1918年Fukushima Seiren Seishi Co., Ltd.合併而來,至今已有100多年的歷史。日東紡自1938年就成為了全球首家以工業規模生產玻璃纖維的企業,隨後也成為了完整掌握玻璃纖維整個生產產業鏈的企業。除了製造、加工和銷售玻璃纖維之外,日東紡也從事化學產品和藥品、紡織品、機械裝置的製造和銷售。在玻璃纖維業務方面,除了生產高端AI晶片所需的Low CTE 玻纖布之外,日東紡也生產AI伺服器當中對於訊號傳輸速率要求較高的晶片所需的低介電常數(Low DK)玻纖布,而在這一市場,日東紡也擁有著高達80%的市場份額,唯一的競爭對手是美國的AGY。但是,對於AI伺服器當中對於傳輸速率要求更高的800G交換機晶片,即使低介電常數玻纖布也難以滿足需求,為此日東紡還開發了更高效的NER玻纖布,目前在這類市場,日東紡的市場份額高達100%。@BourseAsieFR 分享的資料顯示,目前日東紡的 40%產能為面向高速訊號傳輸需求的低介電常數玻纖布;30%產能為面向AI晶片基板的低膨脹係數玻纖布;另外30%產能為標準的玻纖布。隨著全球AI晶片需求持續爆發,日東紡的產能已趕不上AI晶片市場驚人增長速度,導致其高端玻纖布從2025年年初就開始缺貨。因為除了輝達AI晶片的需求之外,AMD、Google、亞馬遜、微軟等眾多企業,都開始在自家AI晶片的載板中使用Low CTE玻纖布。AI伺服器對於Low DK玻纖布和NER玻纖布的需求也在快速增長。這也導致了高端玻纖布供應嚴重短缺,情況與去年下半年以來的DRAM晶片荒極為相似。相關報導顯示,自去年下半年以來,輝達、AMD 和微軟的高管們經常拜訪日東紡,希望取得日東紡的高端玻纖布供應。除了來自AI晶片的需求暴增之外,日東紡的產能擴張速度太慢也是導致缺貨的關鍵原因。日東紡首席執行長Hiroyuki Tada 曾表示,公司將優先考慮質量而非數量,並且由於風險方面的擔憂,不願以與AI市場相同的速度擴張產能。日東紡與南亞科技合作新建的生產線需要等到 2027 年才能投入營運,預計屆時產能可以提升20%。業內人士悲觀預測,供應狀況要到2027 年下半年日東紡新產能上線後,才會有實質性的改善,“即使你向日東紡施壓,沒有新增產能也無濟於事。”這也意味著高端玻纖布的供應短缺需要等到2027年才有可能緩解。台灣玻璃積極打入輝達供應鏈對於輝達來說,日東紡供應瓶頸將會直接導致其AI晶片的生產受限。因此,需要尋找其他供應商來滿足自身的需求。由於中國大陸的泰山玻纖隸屬於國有企業中國建材,為了避免挑動美國政府敏感的神經,輝達並未考慮將泰山玻纖納入其AI晶片所需的載板材料供應鏈。因此,輝達從去年年初就開始找台灣玻璃合作,希望將其納入供應鏈。據《天下》雜誌報導,2025年年初,輝達的高管們每隔幾天就會到訪位台灣玻璃總部,懇求他們加快生產。據台灣玻璃纖維事業部總經理林嘉佑介紹,台灣玻璃的Low CTE玻纖布在2025年初采通過認證,批次生產要到2025年4月份才能開始,但是初期產能也比較有限。除了低熱膨脹係數玻纖布之外,低介電常數(Low DK)玻纖布也同樣重要。林嘉佑解釋稱,“低熱膨脹係數用於基板,而低介電常數材料用於底層印刷電路板(PCB)。兩者對於製造人工智慧伺服器的核心部件都至關重要。”不過,據《日經亞洲》報導,即便台灣玻璃、泰山玻纖等廠商積極進入AI晶片和高端處理器所需Low CTE玻纖布市場,但是沒有那家科技巨頭願意冒險將高端晶片安裝在可能影響最終產品品質的基板上。因為,玻纖布深埋於基板內部,“一旦出問題,根本不可能拆出來重做”。蘋果找上宏和電子過去,玻纖布主要應用於智慧型手機與一般電子產品所需的處理器。不過,蘋果很早就開始將Low CTE玻纖佈導入了iPhone所搭載的A系列處理器的基板,當時Low CTE玻纖布的供應也比較穩定。但隨著輝達引領的AI 熱潮的爆發,不僅輝達的AI晶片對於Low CTE玻纖布的需求暴漲,AMD的AI晶片、Google的TPU、亞馬遜的AISC晶片等都開始大量採用同樣的高端玻纖布來作為晶片基板材料,這也直接造成了對於消費類電子客戶的需求的排擠。為了確保Low CTE玻纖布的供應,蘋果公司採取了罕見的積極行動。據報導,蘋果早在去年秋天便派遣員工進駐日本三菱瓦斯化學(Mitsubishi Gas Chemical,MGC),試圖確保用於BT 基板的材料供應,因為MGC 生產基板同樣需要日東紡的玻璃纖維布。蘋果公司還曾向日本政府官員求助,希望通過官方力量協調日東紡的產能分配,以滿足其2026 年的產品需求,特別是為了應對即將推出的首款折疊iPhone 以及預期的手機市場復甦。為瞭解決供應問題,蘋果公司也在努力尋找替代的供應來源。據兩名熟知內情的消息人士透露,蘋果公司已派員前往中國小型玻纖布製造商宏和電子材料(Grace Fabric Technology,GFT),並要求三菱瓦斯化學協助監督這家中國材料供應商的質量改良情況。除了蘋果之外,另一家手機晶片大廠高通也面臨通用的供應問題。據悉,高通也曾諮詢另一家較小的日本供應商Unitika,希望能緩解玻纖布供應緊張,但該公司的產能規模遠不及日東紡。 (芯智訊)
輝達,築起新高牆
日前,輝達一下子解密了六顆晶片,引起了全球轟動。但其實早在去年年底,就有一則重磅消息在AI晶片圈炸響:推理晶片初創公司 Groq 宣佈,已與輝達達成一項“非獨家許可協議”。公告只有寥寥數語,但隨之而來的資訊卻迅速改變了這筆交易的份量——Groq 創始人兼 CEO Jonathan Ross、總裁 Sunny Madra 以及多名核心成員,將一併加入輝達,參與授權技術的推進與規模化。如果只看形式,這並不是一次收購;如果只看結果,它卻幾乎具備了收購的全部要素。技術被許可,團隊被吸納,關鍵人物離場,Groq 雖然名義上繼續營運,但其最具決定性的資產——技術路線與靈魂人物——已然轉移。這是一種典型的“收購式招聘”,也是輝達近年來愈發嫻熟的一種操作方式:在不觸碰監管紅線的前提下,把潛在威脅納入自己的體系之中。更重要的是,這一步發生在一個極其敏感的時間點。AI 晶片的競爭,正在從“訓練為王”轉向“推理決勝”。輝達的 GPU 依舊牢牢統治著訓練市場,但在推理端,AMD、定製 ASIC、雲廠商自研晶片正在快速逼近,成本與供應鏈多元化成為大客戶最現實的訴求。Groq 的 LPU 正是為推理而生,主打極致低延遲和性能確定性,其創始人 Jonathan Ross 更被視為Google TPU 背後的關鍵推手——這不是一家可以被忽視的公司。因此,與其說輝達“買”下了 Groq,不如說它在競爭真正白熱化之前,提前拆掉了一段可能威脅自身根基的城梯。回看歷史,從 Mellanox 到未遂的 Arm,再到今天的 Groq,輝達並非只是在擴張版圖,而是在一磚一瓦地加高自己的防禦體系。輝達在乎的,似乎已不再是某一筆交易的得失,而是如何在訓練、推理、網路、軟體與生態的多條戰線上,同時構築起一道幾乎無法繞開的“城牆”。算力,並不是焦慮根源輝達與 Groq 達成交易,這件事本身的重要性,並不在於它是否會推出一款“非 GPU 的 AI 晶片”,而在於它暴露了輝達真正的焦慮來源。今天的輝達,幾乎已經在訓練算力層面取得了事實上的統治地位,但 AI 產業的重心正在悄然移動——從“誰能堆更多 FLOPS”,轉向“誰能更高效、更確定性地交付推理結果”。Groq 的價值並不在算力規模,而在系統哲學。它強調確定性延遲、強調編譯器對執行路徑的絕對控制、強調“推理不是硬體問題,而是系統問題”。這套思路,與 GPU 世界中長期存在的動態調度、非確定性執行形成鮮明對比。Groq 的創始人 Jonathan Ross 是 Google 第一代 TPU 的首席架構師。他在 2016 年離開 Google 後,試圖打造一個比 TPU 更快、更可控的“通用 AI 處理器”。Groq 的核心技術是自研的 LPU(Language Processing Unit)架構,這種架構拋棄了傳統的亂序執行和動態調度機制,採用靜態調度、資料路徑固定、執行流程可預測的“確定性設計”(deterministic design)。晶片內部採用 SRAM 技術,而非輝達 GPU 依賴的片外 HBM 視訊記憶體,這讓 Groq 在某些場景下實現了極致的低延遲。Groq 最初也曾試圖進入訓練市場,但很快發現這是一條死路:訓練市場的競爭邏輯是“大生態+大資本+大客戶”。Groq 的架構對主流 AI 框架(如 PyTorch、TensorFlow)的相容性有限,也缺乏成熟的編譯工具鏈,使得訓練任務的遷移成本極高。從 2023 年下半年開始,Groq 明確轉向推理即服務(Inference-as-a-Service)方向。2024 年,Groq 展示了其系統運行 Llama 2-70B 模型時,實現每秒超過 300 個 Token 的生成速度,遠超主流 GPU 系統。這一優勢讓 Groq 迅速吸引到一批對延遲敏感的垂直行業使用者,如金融交易系統、軍事資訊處理、語音/視訊同步字幕生成。Groq 將產品定位從“AI 晶片”擴展為“AI 處理平台”,通過 GroqCloud 平台向開發者提供 API 存取權,與 LangChain、LlamaIndex 等生態整合。正是這種“異類”,恰恰點中了輝達的軟肋。隨著大模型進入規模化落地階段,越來越多客戶開始關心延遲、能效、TCO 和系統複雜度,而不再只是顯示卡型號。推理正在走向碎片化:雲廠商自研 ASIC(AWS 的 Trainium 和 Inferentia、Google TPU、Microsoft Maia)、CPU+加速器混合部署、邊緣側異構系統層出不窮。如果輝達只停留在“賣最強 GPU”,它在推理端的話語權,遲早會被系統層慢慢侵蝕。對於輝達和黃仁勳而言,Groq 的意義並不是“補一塊晶片”,而是補一塊輝達尚未完全掌控的系統能力:對執行路徑的強約束、對延遲的可預測性、以及編譯器主導的算力使用方式。換句話說,如果說 GPU 是輝達的地基,那麼 Groq 代表的,是它試圖插入系統頂層的一根“控制梁”。對“叢集控制權”的長期執念而在與Groq達成交易之前,輝達其實早已悄然埋下了一條新的主線。很多人習慣從作業系統的角度理解算力生態,認為誰控制了 Linux 發行版、誰控制了核心,誰就掌握了計算世界的話語權。但在 AI 時代,這種邏輯已經開始失效。輝達對此看得非常清楚:真正重要的,不是節點上的作業系統,而是節點之上的叢集控制方式。這正是輝達在 2022 年 1 月收購 Bright Computing 的根本原因。當時這筆交易的金額未公開,但 Bright Computing 已完成兩輪融資,共籌集 1650 萬美元,其叢集管理工具 BCM 在全球擁有超過 700 家使用者。Bright Cluster Manager 並不是一個時髦的新工具,它誕生於傳統 HPC 世界,最初用於管理高度複雜、對穩定性和可預測性要求極高的超級計算系統。正因為如此,它並不追逐某一種特定技術潮流,而是長期圍繞“如何在大規模叢集中統一部署、監控、修復和調度”這個核心問題演進。BCM 最初是為管理傳統高性能計算(HPC)系統而設計的,但多年來,為了將其打造成為一款通用叢集控製器,BCM 也進行了適配,以支援 Hadoop、Spark、OpenStack、Kubernetes 和 VMware ESX 等對控制要求極高的分佈式系統。在被輝達收購併更名為 Base Command Manager 之後,這套工具被完整納入 AI Enterprise 軟體堆疊,成為輝達 AI 系統的“底層控制平面”。通過許可證模式,輝達不再只是交付硬體,而是開始按 GPU、按年份出售“系統能力”——AI Enterprise 許可證包含輝達捆綁並支援在其 GPU 加速系統上的庫、框架和其他工具,每個 GPU 每年的費用為 4500 美元。這一步的意義極其關鍵:它意味著輝達正式把“叢集管理”變成了自己的商業資產,而不是留給客戶或第三方去解決。輝達還設定了一個精妙的商業策略:對於每個節點包含 8 個 GPU 以內的叢集,提供免費的 BCM 許可證,但不提供任何技術支援,且“隨時可能被撤銷”。這意味著企業如果想要穩定的生產環境,就必須購買 AI Enterprise 許可證。免費版本不是慷慨,而是一種“試用即繫結”的策略。更重要的是,Base Command Manager 並不是孤立存在的。在其之上,輝達疊加了 Mission Control,用於自動部署所謂的“AI 工廠”:框架、工具、模型、容器運行環境、健康檢查和功耗最佳化一體化。Mission Control 包含 Run:ai 實現的 Kubernetes,用於編排容器;還包含 Docker,用於在容器內運行計算;此外,它還可以虛擬化 GPU,以提供更精細的計算粒度。Mission Control 會對系統進行健康檢查,並根據系統上運行的工作負載最佳化功耗。這套體系的目標並不是讓客戶擁有更多選擇,而是讓客戶在默認情況下就運行在輝達定義的最優路徑上。當然,這裡繞不開輝達在2024年對Run.ai的收購,Run.ai的核心價值不是又一個Kubernetes外掛,而是實現了GPU資源的抽象化管理:多租戶、彈性調度、優先順序控制、GPU虛擬化。在Run.ai的系統中,一個物理GPU可以被切分成多個虛擬實例,讓不同使用者、不同任務按需使用,同時保證隔離性和性能。為什麼輝達提前拿下了 Run:ai?因為調度權如果不在自己手裡,CUDA 生態的優勢就會被“平台化”稀釋。雲廠商可以通過調度層,讓客戶感知不到底層是誰的 GPU,甚至可以在調度中插入自研晶片作為替代選項。但就高性能計算(HPC)和人工智慧(AI)工作負載的裸機工作負載管理而言,輝達仍然需要一款工具。事實證明,BCM 正是執行這些健康檢查的工具,而解決問題的操作則通過 Slurm 工作負載管理器完成。輝達並沒有強行要求所有客戶拋棄既有體系,而是非常務實地接受了一個現實:在大量從 HPC 演進而來的 AI 叢集中,Slurm 依然是事實標準。許多高性能計算和人工智慧機構不想學習新東西——比如 Run:ai——而是想繼續使用 Slurm。對於那些最初以高性能計算中心起家的混合型人工智慧/高性能計算中心來說,這種情況可能尤為突出。這就為下一步的關鍵收購埋下了伏筆。開源不是放棄控制2025 年 12 月,輝達補上了這道牆的最後一塊磚:收購了 SchedMD,獲得了 Slurm 工作負載管理器背後的核心團隊和技術支援權。Slurm 項目始於 2001 年,由勞倫斯·利弗莫爾國家實驗室、Linux Network(已被 SGI 收購)、惠普以及 Groupe Bull(已被 Atos 收購併成立 Eviden)合作開發。據稱,Slurm 的設計靈感來源於超級電腦互連裝置製造商 Quadrics 開發的 RMS 叢集檔案總管。2010 年,該項目的兩位創始人 Morris Jette 和 Danny Auble 創立了 SchedMD,旨在為 Slurm 提供技術支援,從而為工作負載管理器的進一步開發提供資金。Slurm 最重要的優勢在於,過去十年中,在 Top500 超級電腦排行榜上出現的電腦中,約有 60% 使用 Slurm 作為其工作負載管理器,而不是 IBM/Platform Computing 的負載共享工具(LSF)、Altair 的可攜式批處理系統(PBS)、Adaptive Computing 的 Maui 和 Moab 以及 Sun/Univa Grid Engine。所有這些工作負載管理器/作業調度器都會將一組具有特定計算能力需求的工作負載進行“俄羅斯方塊”式的調度,最終使它們按照既定的優先順序順序高效運行。Slurm 過去十多年裡成為超級計算領域的事實標準,並不是因為它最激進,而是因為它足夠穩定、足夠中立,也足夠適配不斷變化的硬體環境。SchedMD 已向全球數百家 HPC 中心、雲建構商、超大規模資料中心和企業銷售了 Slurm 工作負載管理器的支援服務。過去十年,輝達和 SchedMD 一直在合作開發 Slurm。在輝達收購 Bright Computing 之前,BCM 支援不同的工作負載管理器,但隨著 Slurm 逐漸成為高性能計算中心乃至人工智慧領域工作負載管理的實際標準,它被選為 Bright Cluster Manager 的默認工作負載管理器,並在過去幾年中一直是輝達 Base Command Manager 的默認工作負載管理器。對輝達而言,真正危險的並不是 Slurm 開源,而是如果 Slurm 的演進方向、支援能力和企業級整合權掌握在自己控制之外,那麼整個 Base Command Manager 和 Mission Control 體系,都會留下一個無法掌控的“底座”。通過收購 SchedMD,輝達並沒有否定 Slurm 的開源屬性,反而在公開表態中反覆強調其“廠商中立性”。輝達表示,它將“繼續開發和分發 Slurm,使其成為開源、廠商中立的軟體,使其在各種硬體和軟體環境下都能被更廣泛的 HPC 和 AI 社區廣泛使用和支援”。但需要看清的是:開源並不等於沒有權力結構。誰來維護主幹程式碼、誰來提供企業級支援、誰來決定新特性的優先順序,這些問題,比許可證本身重要得多。輝達已同意為 SchedMD 的現有客戶提供支援,據推測,他們將通過聘用 SchedMD 的員工來實現這一點。但即便 Slurm 開源,也不意味著輝達會為開源版本的程式碼提供支援,或者將 Slurm 的所有未來功能都開源。輝達擁有大量專有驅動程式、框架和演算法,這個模式很可能會延續到 Slurm 身上。輝達顯然希望做到兩點:一方面,保持 Slurm 在 CPU、非輝達加速器等環境中的廣泛適用性,避免引發社區反彈;另一方面,把 Slurm 的商業支援、系統整合和 AI 方向演進,與自己的 AI Enterprise 體系深度繫結。這是一種極其典型的“高階控制”:不通過封閉程式碼來壟斷,而通過系統複雜度和服務整合來設立門檻。目前尚不清楚的是,Run:ai 和 Slurm 的功能將如何與 Base Command Manager 整合,從而為高性能計算(HPC)和人工智慧(AI)叢集提供一個自上而下的叢集和工作負載管理工具——而且不僅限於 AI 叢集,還要考慮到許多叢集中可能存在一些僅使用 CPU 的機器以及非輝達加速器。如果輝達試圖以任何方式限制它,其他人可以獲取 Slurm 程式碼(該程式碼以 GNU GPL v2.0 許可證提供),進行 fork 並繼續開發。但現實是,fork 程式碼容易,建立支援能力難。當所有人都在用同一套開源工具,但只有輝達能提供最優的整合方案時,開源本身就成了輝達生態的擴展。2024 年 10 月,輝達停止單獨銷售 Bright Cluster Manager,而僅將其作為 AI Enterprise Stack 的一部分提供。目前尚不清楚 AI Enterprise 的價格是高於還是低於之前單獨購買 Bright Cluster Manager 的許可,也不清楚有多少客戶曾在純 CPU 系統或其他類型的加速器上使用過這款早期工具。但這個動作的訊號意義很明確:輝達正在把所有系統元件打包成一個不可分割的整體。也正是在這裡,Run:ai、Slurm 和 Base Command Manager 的關係變得微妙而關鍵。前者代表雲原生和容器化世界,後者代表 HPC 傳統,而輝達的目標,是讓這兩套體系在自己的框架內完成融合,而不是彼此競爭。新的城牆,已經成型把Groq、Bright Computing、Run:ai 和 SchedMD 放在同一條時間線上看,輝達近幾年的收購邏輯就變得異常清晰:它正在系統性地收回 AI 計算體系中的“非硬體控制權”。GPU 仍然是輝達最鋒利的武器,但已經不再是唯一的壁壘。真正的新城牆,建立在三個層面之上:第一層:對叢集資源的調度權。從 Mellanox 的網路互聯技術,到 Bright Computing 的叢集管理,再到 SchedMD 的工作負載調度,輝達控制了算力如何連接、如何分配、如何排隊執行的完整鏈條。這不是簡單的硬體整合,而是把網路從“外設”變成了“AI 系統的一部分”。第二層:對工作負載執行路徑的定義權。Run:ai 提供的 GPU 虛擬化和資源抽象,Mission Control 提供的自動化部署和健康檢查,Slurm 提供的作業調度——這些工具共同定義了“任務應該怎麼跑、跑在那裡、用多少資源”。當執行路徑被輝達定義時,即使客戶理論上可以使用其他硬體,在實踐中也會發現遷移成本高得難以承受。第三層:對企業級支援與系統複雜度的掌控權。輝達通過 AI Enterprise 許可證模式,把所有這些工具打包成一個商業服務。客戶購買的不是單個元件,而是一整套“系統整合能力”。開放原始碼可以 fork,但企業級支援、最佳化經驗、最佳實踐,都掌握在輝達手中。一旦這三層疊加完成,客戶即便理論上“可以選擇別的硬體”,在實踐中也會發現遷移成本高得難以承受。從賣晶片到賣生態,輝達的商業模式已經發生質變。過去的輝達,GPU 是產品,賣出去就完成了交易。現在的輝達,GPU 是生態入口,是使用者進入輝達系統的第一步。收購的真實邏輯不是規模併購,而是精準補洞:在 AI 計算的完整鏈條中,那一環還沒有被控制?這也是為什麼說,輝達正在建構的已經不是傳統意義上的護城河,而是一座生態城牆。它不靠封鎖入口,而是通過系統整合,讓離開變得不再理性。在 AI 進入基礎設施階段之後,這種能力,或許比任何一代 GPU,都更加持久。從 Groq 到 SchedMD,從推理架構到工作負載管理,從硬體到系統,輝達用幾年時間完成了一次商業史上罕見的“生態圍城”。這座城牆的高度,已經不是用技術指標可以衡量的,而是用遷移成本、學習曲線、生態粘性來定義的。當所有人還在討論“誰能挑戰輝達的 GPU”時,輝達已經在思考:如何讓“挑戰”這件事本身變得不再可能。 (半導體行業觀察)
兩日雙響!豪威、兆易,清華系兩大半導體巨頭接連赴港敲鑼
兩日之內,港交所接連為兩大清華系半導體巨頭敲響上市鑼聲。港交所的敲鑼聲在兩日之內接連響起,奏響了清華系半導體軍團全球化的強音。1月12日,CMOS圖像感測器(CIS)龍頭豪威集團率先登陸港股;時隔僅一天,1月13日,儲存晶片龍頭兆易創新緊隨其後完成掛牌,兩家均出身清華系的A股半導體巨頭,以“背靠背”的姿態完成“A+H”雙資本平檯布局,這一波密集的上市動作並非偶然。在AI驅動儲存與感測需求爆發、全球半導體行業迎來量價齊升“超級周期”的關鍵節點,清華系雙巨頭的接連赴港,既是自身全球化戰略的關鍵落子,更折射出中國半導體企業借助資本力量搶佔產業高地的集體訴求。兩日雙響:清華系雙巨頭接連赴港掛牌2026年1月12日,豪威積體電路(集團)股份有限公司正式在香港聯合交易所主機板掛牌上市,成為今年上市的第一家“A+H”企業,同時也成為中國CIS領域首家實現“A+H”上市的企業,成就港股“圖像感測器第一股”。截至12日收盤,豪威集團在A股市值1616億元,在港股開盤價為108港元,較發行價上漲3.1%;收盤價為121.8港元,較發行價上漲16%;以收盤價計算,公司市值為1529億港元。1月13日,國記憶體儲晶片龍頭兆易創新正式登陸港交所,完成“A+H”雙資本平檯布局。此次上市發行價每股162.00港元(約合人民幣144.92元),開盤即漲45.06%至235.00港元(約合人民幣210.22元),總市值攀升至1637.40億港元(約合人民幣1465億元)。值得注意的是,截至前一交易日(1月12日)A股收盤,兆易創新總市值已達1749億元,兩地上市形成市值協同效應。同源清華:EE85班鑄就的造芯力量這兩家半導體巨頭的背後,都深深烙印著清華的印記。豪威集團的創始人虞仁榮,是清華大學電子工程系85班的傑出校友,在半導體行業蠻荒年代白手起家,締造出千億市值的行業龍頭;而豪威科技的前身,更是由同為清華電子工程系畢業的陳大同、洪筱英等人於1995年在美國創辦,憑藉全球首顆單晶片彩色CMOS圖像感測器一舉成名。兆易創新的清華基因同樣深厚。該公司由清華大學物理系校友朱一明創辦,聯合創始人舒清明同樣出自清華EE85班,與虞仁榮師出同門。值得一提的是,作為清華畢業的朱一明,不僅執掌兆易創新,同時還擔任中國DRAM 龍頭長鑫科技的董事長,一人掌舵兩家國記憶體儲領域的核心企業。我們能夠看到,當前國記憶體儲領域正處於從技術突破到產能落地的關鍵階段,在全球儲存晶片超級周期背景下加速推進自主化處理程序,而朱一明的雙重任職,恰好串聯起儲存晶片設計與DRAM自主研發兩大核心環節,形成“設計+製造”的協同聯動。除了虞仁榮、舒清明,卓勝微電子馮晨暉、格科微趙立新等十餘位上市公司創始人或高管均出自此屆,橫跨CIS、射頻、儲存等核心賽道。從豪威到兆易,兩日之內的接連敲鑼,不僅是兩家企業的高光時刻,更是清華系“聚是一團火,散是滿天星”造芯生態的集中展現。豪威科技:中國國產CIS龍頭豪威集團是一家全球化Fabless半導體設計公司,專注於半導體產品及解決方案的設計與銷售,主要提供圖像感測器解決方案、顯示解決方案及模擬解決方案。公司產品廣泛應用於智慧型手機、汽車、醫療、安防及新興市場(機器視覺、智能眼鏡及端側AI)等領域。業績方面,2023年、2024年、2025年前6個月,豪威集團營收分別為209.84億元、257.07億元和139.44億元。相應的淨利潤分別為5.44億元、32.79億元和20.20億元。其中,圖像感測器解決方案業務撐起了豪威集團營收的三分之二。2022年—2024年,該業務帶來的應收分別為136.74億元、155.35億元和191.9億元,分別佔總收入的68.3%、74%和74.7%。根據Frost&Sullivan資料,按2024年圖像感測器解決方案收入計,公司是全球第三大數字圖像感測器供應商,市場份額為13.7%。豪威集團表示,業績增長主要得益於公司緊抓市場機遇,快速提升汽車智能駕駛領域滲透率,以及在全景與運動相機等智能影像終端應用市場的顯著擴張。其中,公司推出的800萬像素CMOS圖像感測器OX08D10已成功進入輝達供應鏈。小米、華為等手機品牌的旗艦產品,都搭載了公司感測器。海外是豪威集團的主戰場。2022年至2024年,其來自中國大陸的營收佔比分別為16.7%、13.9%和15.0%,相應地,境外收入佔比則高達83.3%、86.1%和85.0%。對於此次IPO,公司明確提到,赴港上市是為了加快公司的國際化戰略及海外業務發展。兆易創新:踩准儲存超級周期,端側AI搶先佈局兆易創新是全球領先的晶片設計公司,“感存算控連”佈局不斷深化。該公司於2005年創立,是全球領先的Fabless晶片供應商,主營產品包括Flash、利基型DRAM、MCU、模擬晶片和感測器晶片, 以及完整的系統及解決方案等。兆易創新的上市時點,恰好踩中全球儲存晶片行業的復甦上行周期。這場由AI需求爆發驅動的超級周期,不僅打破了傳統儲存行業的供需平衡,更重新定義了產業競爭格局。根據最新市場資料,2025年第四季度DRAM合約價格同比上漲超過75%,部分產品如DDR5單月漲幅突破102%,DDR4漲幅超過92%。這場"漲價風暴"的背後,既有AI伺服器對儲存需求的指數級增長,也有國際巨頭產能戰略調整帶來的供給結構性短缺,更有地緣政治因素對全球供應鏈的深刻影響。行業紅利已直接傳導至兆易創新的業績表現。財務資料顯示,2023年受行業周期低谷影響,公司淨利潤一度收縮至1.61億元,而2024年迅速回暖,實現收入73.56億元、淨利潤11.01億元,同比大幅反彈;2025年上半年延續向好態勢,實現收入41.50億元、淨利潤5.88億元。值得關注的是,即便在行業低谷期,兆易創新仍堅持加大研發投入,2022年至2024年研發開支從9.36億元增至11.22億元,2025年上半年達5.68億元,為技術突破奠定基礎。截至2025年6月30日,公司擁有1556名技術僱員,佔總僱員數的73.2%,中國註冊專利達1016項。作為公司核心支柱,專用型儲存晶片貢獻了超過59%的收入,且毛利率已從2023年的30.3%回升至2025年上半年的36.9%。東海證券分析指出,國際大廠向高端儲存產品傾斜產能,為兆易創新在利基儲存市場創造了供給空缺,公司相關產品快速切入細分場景,成為業績復甦的核心動力。不同於國際巨頭聚焦AI伺服器高端儲存,兆易創新憑藉“全品類覆蓋+生態協同”的差異化策略,在端側AI領域搶佔先機。根據弗若斯特沙利文報告,以2024年銷售額計,兆易創新是全球唯一一家在NOR Flash、SLC NAND Flash、利基型DRAM和MCU四大領域均躋身全球前十的積體電路設計公司,其中NOR Flash、SLC NAND Flash、MCU三項位列中國第一,利基型DRAM、指紋感測器晶片位列中國第二。清華系造芯潮起,多家企業衝刺IPO一場由清華系主導的半導體上市潮,正席捲而來。另一家由朱一明於2016年創辦的長鑫科技,科創板IPO申請也已獲受理。作為中國大陸少數具備DRAM自主研發與量產能力的企業,長鑫填補了中國在高端儲存晶片領域的戰略空白。此次IPO擬募資295億元,規模位居科創板歷史第二。與此同時,AI晶片新銳燧原科技已完成IPO輔導,正籌備申報科創板。公司創始人趙立東正是EE85班的一員。曾在AMD、紫光集團等任職多年後,趙立東於2018年在上海創立燧原科技,聚焦雲端AI訓練與推理晶片,致力於為通用人工智慧打造算力底座。 (半導體產業縱橫)
彭博:中國最快本季內批准進口輝達H200晶片
彭博引述知情人士稱,中國計畫最快在本季度內允許部分使用者進口輝達的H200晶片。此舉將使這家全球市值最高的晶片公司重新進入中國這一重要市場。知情人士表示,中國官方正在準備有選擇地允許境內公司在商業領域使用該晶片。監於安全考慮,中國將不允許在軍用、敏感政府部門、關鍵基礎設施領域等領域使用該晶片。知情人士還稱,如果上述機構確有使用需求,則需要逐個申請,以一事一議的方式決定是否放行。即使附帶這些條件,中國部分放行H200晶片對輝達也意味著一個重大勝利。中國是全球最大的晶片市場之一。輝達行政總裁黃仁勳此前表示,中國的AI晶片市場規模有望達到500億美元。一位知情人士稱,阿里巴巴和字節跳動已同輝達私下接觸,分別表達各自購買超過20萬顆H200晶片的意向。這兩家企業,還有包括DeepSeek在內的一些中國初創企業,正快速迭代他們的人工智慧模型以同諸如OpenAI之類的美國對手競爭。輝達公司管理層本周表示,中國客戶對H200的需求很強勁,但是公司尚未與中國官方就允許進口進行直接對話,也不知道中國何時會放行進口。而對華出售晶片的許可申請已經提交給美國政府,美國政府正在確定許可的最終細節。 (格隆匯電報)
中國GPU集體爆發
2025年底,A股最火爆的主題,莫過於“中國國產GPU”。2025年12月5日,中國國產GPU玩家摩爾線程於科創板IPO上市,上市首日股價大漲468.78%,總市值超達3055億元,創下IPO稽核僅耗時122天的年度最快紀錄、及A股全面註冊制實施以來的最高打新收益紀錄。僅僅12天后,12月17日,上市首日的沐曦股份暴漲692.95%,總市值突破3300億元,其漲勢甚至比摩爾線程更驚人——按104.66元/股的發行價計算,股民打新中一簽便可盈利近30萬元,堪稱”大肉簽”。▲來源:優勢資本而在摩爾線程、沐曦股份之後,“GPU四小龍”的另外兩龍——燧原科技早已開啟了IPO之旅;壁仞科技則在今年1月2日正式在港交所掛牌,上市首日最高漲120%,成為首家“港股GPU概念股”。此外,礪算科技、曦望、瀚博半導體、格蘭非等眾多中國國產GPU創業公司也正奮起直追,更不用說已經上市的海光資訊、寒武紀、芯原股份等等GPU/AI晶片玩家,均迎來了技術、產品、融資、落地的全面突破。中國GPU,迎來了一次真正的爆發。然而僅僅在3年前,它們中的不少創業者,還曾被逼到最絕望的“至暗時刻”。“寒冬來了。”2022年,這是縈繞在所有中國國產晶片從業者心頭的一句悲言。就在2022年中秋節前,中國“AI晶片”四小龍之首寒武紀再次遭遇股東“清倉式減持”,公司第四、第五和第七大股東合計賣出了手中近78%的寒武紀持股。彼時,“跌跌不休”的寒武紀市值已下探到270億元,較巔峰時的千億市值跌沒了近八成。“寒王”作為上市公司,尚落得如此狼狽,GPU創業公司們則幾乎全軍覆沒:跟寒武紀一樣,日後的“GPU四小龍”燧原科技、摩爾線程都遭遇了資本離場,導致量產關鍵節點困難頻頻,不得不壓縮成本四處尋求“輸血”。各家公司的帳本,也都格外難看:沐曦股份當年虧損高達7.7億元,收入是幾乎可以忽略不計的42.7萬元;壁仞科技更是在2022年全年未能宣佈任何一筆融資,幾乎在靠“啃乾糧”度日。這批中國國產GPU創業公司普遍成立不到3年,正處於晶片研發任務最重、產品落地最緊要,也最需要錢的氣口——僅僅一款7nm晶片的設計加流片費用都能高達數億人民幣,其他環節如EDA、軟體、驅動、架構、驗證、測試更是個個都在“燒錢”,但卻在找錢上遇到了最嚴峻的挑戰。2022年相當長時間內,大量以上海為總部的GPU公司幾乎陷入停擺狀態。雪上加霜的是,年底,美國再次收緊對華高端晶片出口管制,中國國產GPU企業不僅面臨著更嚴峻的技術獲取環境、更劇烈的供應鏈不確定性,風險厭惡型資本也對“中國國產GPU”概念進一步拒之門外。那個冬天,冷得透骨,至今仍是很多行業中人最深刻的記憶。命運的轉折,往往藏在技術革命的裂縫中。2022年11月底,一位意料之外的“神秘嘉賓”,出現在太平洋彼岸。ChatGPT來了。幾乎在一夜之間,以ChatGPT為代表的大模型火遍了世界各地;在人類技術發展的歷史上,全球科技產業第一次以前所未有的速度達成了共識——要搞大模型。而中國國產GPU公司們,幾乎被這個從天而降的“餡餅”砸懵了。動輒百億參數的大模型訓練,堪稱AI算力的“吞金獸”,其對算力的飢渴,讓GPU從“硬體產品”躍升為“戰略資源”,遊戲規則也因此被徹底改寫。在此背景下,輝達、寒武紀市值一路瘋漲,晶片創業公司迎來大面積資本重估。剛從生死線上下來的中國國產GPU玩家們,也立馬轉身蹦極。雖然跟輝達、英特爾等海外巨頭動輒一代晶片百億美元的研發投入比起來,創業公司們能夠撬動的資源只是杯水車薪。但在2023~2025年這幾年間,中國國產GPU玩家們依然緊緊抓住時代機遇,大力投入研發,快速推動自家GPU產品升級,擁抱市場變化。▲來源:摩爾線程例如,摩爾線程只用了四年時間就完成了數代全功能GPU迭代,不久前的MUSA開發者大會上,它更是發佈了計算效能提高10倍的GPU架構“花港”,與支撐兆參數模型訓練的工程能力的萬卡智算叢集“誇娥”。壁仞科技的BR100晶片也實現了半精度浮點超過1000T,在超算中心市場實現出貨量同比增長超300%;沐曦股份的下一代C700,直接將性能瞄準了輝達H100,預計明年下半年流片。美國不斷加碼的管制措施,雖在短期內為中國國產GPU玩家帶來了不小的融資壓力,但也進一步刺激了中國科技廠商對自主可控GPU的重視。“大廠們”出於供應鏈安全考慮,紛紛加快部署中國國產GPU算力。更幸運的是,大模型從底層技術上,給了所有GPU廠商一次“換道超車”的機會。大模型技術的底層是Transformer架構,它雖然跟上一輪人臉識別、圖像識別技術一樣被稱為“人工智慧”,但其最底層的演算法,卻跟上一輪圖像識別所倚仗的深度神經網路(Deep Learning Network)有所不同。舉個例子,GPU包含硬體、也包含軟體部分。硬體部分很好理解,在人們看得見、摸得著的那塊金屬板上,所謂“7nm製程”、“電晶體數量”說的都是硬體。軟體部分則是一堆程式碼,負責“指導”冷冰冰的金屬塊去響應使用者發出的指令。硬體問題雖然難,卻並不是“無解”。軟體部分可太難了——過去十多年裡,全世界幾千萬名程式設計師在輝達GPU的軟體上不斷創作、最佳化、報BUG、修改,形成了一個牢不可破的“生態系統”,為美國GPU豎起了極高的生態壁壘。然而,這套生態是建立在上一代人工智慧技術(大模型出現之前)之上的。2022年11月,大模型橫空出世,突然給全世界“掀了桌子”。輝達做了30年的GPU,猛一回頭發現,自己跟中國這些成立不到3年的GPU公司,站在了同一起跑線上。這一天,中國GPU等了十年。中國GPU能走到今天,太難了。20世紀80年代,中國晶片產業曾經走過一段“造不如買,買不如租”的道路。當時,為了快速獲取經濟效益,一度被加大投入的中國晶片產業,轉而大規模引進國外技術和生產線,減少自主研發投入,也讓整個晶片產業陷入“引進—落後—再引進—再落後”的循環。晶片是一個龐大的概念,既包括CPU、GPU這些我們熟悉的品種,也包括ASIC(定製化專用晶片,如AI專用晶片)、儲存晶片、DSP數字訊號處理器等等。其中,CPU是電腦的“主司令”,GPU則是專攻大規模計算的“大將”。在早期資源有限時,中國國產晶片研發往往被迫將資源向“主司令”傾斜,自然也讓中國國產GPU的發展變得更加艱難。比CPU更難。直到2014年4月,景嘉微電子才成功研發出中國首款中國國產高性能、低功耗GPU晶片JM5400。彼時,輝達的獨立顯示卡的全球市場份額已經達到驚人的‌76%‌,連中國著名的超級電腦“天河一號A”,都被迫用的是輝達的GPU。然而,第一塊GPU僅僅是漫長征程的起點。因為底層技術空白點較多,IP大多受制於國外廠商,產品前端穩定性不理想,很長時間內,中國國產GPU即便是研發出來,也很難在主線中高端電子產品上得到普及化應用。沒有應用,就沒有銷售收入,沒有應用,也沒有客戶反饋,無法形成研發、應用、改良,提升的正向循環,這不但嚴重制約相關公司的收入和發展,也嚴重制約研發進度與品質。即便強大如華為海思,其手機晶片中的GPU性能也長久以來存在發熱、相容性差等問題,直到麒麟910手機晶片發佈後才逐漸走上正軌。而中國國產GPU的真正破局,始於一場被外部壓力“逼”出來的產業進擊。2017-2018年,美國步步緊逼的技術封鎖與上一輪人工智慧浪潮相遇,讓第一批中國國產“AI晶片”爆發,寒武紀、深鑑科技(後被美國晶片公司賽靈思收購)、地平線等明星創業公司都在此輪誕生。AI晶片是一種專用晶片,往往只針對少數AI演算法量身打造,設計難度更低,能更快緩解“缺芯”的燃眉之急。GPU則是個更強大的“全能將軍”,但設計難度更大,所需時間更長。直到2020年前後,經過了多年的市場培育、人才培養,中國GPU生態才慢慢有了成熟的苗頭。摩爾線程、沐曦股份、壁仞科技等一批中國國產GPU企業也正是這個時期相繼成立,並且開始將目標直指通用GPU,決心在國際巨頭的主賽道上“掰掰手腕”。與中國最早一批篳路藍縷的GPU研究人員不同,這一批中國國產GPU玩家大多都有著資深的晶片行業從業經驗,甚至是在國際巨頭公司有著長期紮實的歷練,他們深知自己面對的殘酷現實,但也對如何突圍更有思維和路徑。但市場競爭也是慘烈的。真正熬過2022年那場“寒冬”的晶片公司並不多,根據企查查資料,2023年,1.09萬家中國晶片相關企業進行工商註銷、吊銷——平均每天有30家晶片公司消失。2023年底,美國還故伎重演地將“GPU四小龍”之摩爾線程、沐曦半導體列入實體清單,這意味著兩家企業將無法獲得任何含美國技術產業工具。此後,重慶某GPU獨角獸被媒體報導因遭遇資金危機,公司瀕臨解散,400多位員工全部終止合同;曾經在2015年推出首款具有中國國產自主智慧財產權GPU的西安某半導體同樣被報導陷入裁員風波;上海一GPU創業公司被報導資金鏈斷裂,陷入營運困難。中國國產GPU每往前走一步,血淚都濕透了腳印。客觀來說,中國的GPU技術跟美國領先水平比起來,還有很大差距。當前,中國國產GPU產品普遍拿來對標的H100 GPU,已經是輝達上一代的技術產物——最新的輝達H200 GPU性能幾乎翻了一倍。而在中國國產GPU產業終於熬過寒冬,迎來第一縷春光時,美國近期卻突然宣佈放寬GPU管制,路透社更是替輝達放出消息稱,2026年春節前,輝達就能將一批全新的H200 GPU交付給中國客戶。▲來源:輝達中國美其名曰放寬管制,其實質是看到中國GPU企業持續突破,持續被中國客戶認可,於是著急忙慌,擔心中國GPU就此突圍,所以使出最大的力氣來搶市場。目的是,剿殺中國GPU於半途。而且,是用市值超過5兆美元,能輕鬆投入上百億美元進行一代晶片架構研發的超級殺手,來剿殺無論從企業自身那個層面比,都與之相距甚遠的根本不是對手的對手。這招夠狠的。但話又說回來了,中國科技產業,什麼樣的對手沒有遇到過?什麼樣的仗沒有打過?打不垮我們的,只會讓我們更強大。從曾經的一片荒蕪,到如今第一梯隊的集結與資本市場的認可,中國GPU產業在外壓內驅的雙重力量下,已駛入了自主發展的快車道。中國國產GPU的奮鬥歷程,將是中國自主創新精神“壓不倒、打不垮、擋不住”的最佳詮釋。最重要的,如今百年未有之大變局的大國科技發展趨勢,以及大模型取代深度神經網路,成為新一代人工智慧技術的領導者,都為中國國產GPU玩家們帶來了甚至比自身努力更重要的:歷史處理程序的加持。中國GPU,已經站在了百年難遇的“換道超車”良機之上。歷史的筆,已交到我們這一代人手中。 (華商韜略)
光有HBM不夠?海力士籌備2.5D封裝廠建設,欲與台積電競爭AI晶片製造
據ZDNet報導,SK海力士正在準備在美國印第安納州西拉斐特的新封裝工廠,建立第一個2.5D封裝量產生產線。西拉斐特封裝廠將是SK海力士在美國的第一家製造工廠,旨在成為人工智慧儲存器的先進封裝生產中心。海力士計畫於2028年下半年開始營運,投資38.7億美元。2.5D封裝通過在半導體和襯底之間放置矽中間層,來提高晶片的性能和功率效率,是將HBM與高性能系統整合的關鍵過程。NVIDIA的高性能AI加速器就是通過2.5D封裝將HBM與gpu和cpu相結合而建構的。如果海力士要獲得NVIDIA的使用批准,質量驗證不僅必須涵蓋HBM本身,還必須涵蓋2.5D封裝過程。換句話說,即使儲存器本身符合可靠性標準,封裝中的任何缺陷也都可能延遲產品的生產時間。在這種情況下,SK海力士推進2.5D封裝量產線,是為了加強包括HBM在內的整體AI半導體封裝能力。據說,SK海力士長期以來一直在進行2.5D封裝的內部研究和開發。然而,該報導指出,海力士目前缺乏足夠的國產裝置來進行批次生產規模的完整2.5D封裝工藝,該工藝實際上由台積電主導。SK海力士雖然擁有基本的2.5D封裝技術和裝置,但很難支援整合HBM的AI加速器所需的大規模系統級封裝(SiP)工具。因此,海力士將確保能夠為自己的HBM進行2.5D封裝的內部設施作為首要任務,一旦技術穩定並進一步完善,就可以進行研發以外的業務擴展。 (銳芯聞)