#智慧晶片
寒武紀688256
中科寒武紀科技股份有限公司(簡稱“寒武紀”)成立於2016年3月15日,由中科院計算技術研究所孵化,核心創始人陳天石、陳雲霽兄弟為人工智慧與晶片設計交叉領域的先行者。公司自成立起專注研發人工智慧晶片,致力於建構覆蓋雲端、邊緣端與終端的全場景智能處理器產品體系,2020年7月20日在上海證券交易所科創板上市,成為“A股AI晶片第一股”。公司簡介發展歷程技術奠基與早期突破(2016–2019)寒武紀在成立初期即聚焦底層核心技術研發,掌握了智能處理器微架構、指令集、SoC設計、編譯器、驅動等全端技術。2017年,公司首款商用終端AI處理器“寒武紀1A”被整合於華為麒麟970晶片,應用於Mate 10手機,成為全球首款商用AI手機晶片,一舉奠定行業地位。2018年,其升級版“寒武紀1H”繼續應用於麒麟980晶片,推動端側AI大規模落地。此階段,公司IP授權業務高度依賴華為,2019年該業務收入佔總收入92.56%。上市與持續虧損期(2020–2023)2020年7月,寒武紀登陸科創板,募資25.82億元,成為當時科創板稽核速度最快的企業之一。但上市後公司仍處於高投入、低回報階段,2020–2023年累計虧損近50億元。2020年財報顯示,公司淨虧損4.36億元,主要因持續加大雲端晶片(思元100、270、290)和軟體平台研發投入,以及股權激勵產生的股份支付費用。2019年,隨著華為自研NPU技術成熟,寒武紀IP授權收入驟降,公司被迫加速拓展新客戶,轉向雲端運算、營運商、金融等垂直行業。業績拐點與爆發式增長(2024–2025)2022年底全球AI大模型興起,疊加美國對華高端晶片出口限制,國產算力替代需求激增,寒武紀迎來關鍵轉折。2024年第三季度起,公司實現首次單季度盈利,開啟連續盈利周期。財務狀況發展前景寒武紀正處於從技術突破邁向規模化商業落地的關鍵躍升期,其發展前景由AI算力需求爆發、國產替代加速、全端生態建構與資本強力支援共同驅動公司業績爆發的核心動力來自雲端智能晶片及加速卡業務,思元590等新一代雲端晶片已在網際網路、金融、營運商等頭部客戶中實現規模化採購,訓練與推理性能接近國際主流產品,支撐大模型在搜尋、廣告、推薦等核心場景的落地。公司以自研的Cambricon Neuware軟體平台為核心,建構統一生態。該平台全面相容PyTorch、Triton等主流框架,成功適配DeepSeek-V3.2-Exp、Qwen、Llama等主流大模型,顯著降低開發者遷移成本。2025年10月,公司完成39.85億元定增,資金重點投向新一代大模型晶片平台與軟體平台建設。截至2025年9月30日,公司存貨達37.29億元,較上季度末增長38.6%,預示著強勁的訂單交付預期。寒武紀已成為中國AI晶片產業的代表性企業,2025年8月股價一度超越貴州茅台,市值突破6000億元,市盈率(PE-TTM)顯著高於行業平均水平,反映出資本市場對其技術稀缺性與國產替代敘事的高度認可。風險與挑戰客戶集中度高:2024年第一大客戶貢獻收入超92億元,單一客戶訂單波動可能對業績造成顯著影響。高估值回呼風險:當前估值水平遠超行業均值,若產品迭代或客戶拓展不及預期,存在估值回歸壓力。供應鏈與地緣政治風險:作為Fabless模式企業,且曾被列入實體清單,先進製程供應鏈的穩定性仍是長期挑戰。 (投研驛站riskon)
一度暴漲20%,創2019年以來最大日內漲幅!高通推出人工智慧晶片,在資料中心市場與輝達競爭
高通公司正憑藉新的晶片產品進入AI資料中心市場,旨在挑戰輝達公司的市場主導地位。該公司的新產品(包括明年出貨的AI200和27年問世的AI250)將作為獨立元件、加速卡或完整伺服器機櫃的一部分提供。新產品提供高達768GB記憶體,專注於能效和AI推理任務。受此消息提振,高通股價盤中漲20%,創2019年來盤中最大漲幅。全球最大手機晶片製造商高通正式進軍AI資料中心市場,推出全新晶片產品,意圖在行業增長最快的領域直接挑戰輝達公司的市場主導地位。受此消息提振,高通股價盤中漲20%,創2019年來盤中最大漲幅。10月27日,高通宣佈,其新款AI晶片AI200將於明年開始出貨。該產品將以獨立元件、可插入現有伺服器的加速卡或高通提供的完整伺服器機櫃等多種形式提供。沙烏地阿拉伯的人工智慧初創公司Humain將成為其首個客戶,該公司計畫從2026年開始部署基於新晶片的、總計200兆瓦的計算能力。此外,一款更先進的AI250晶片計畫於2027年問世。高通正押注其源於移動技術的功耗效率和前所未有的記憶體容量,以吸引主要客戶,此舉有望為公司開闢重要的新收入來源,並可能重塑這一領域的競爭格局。瞄準推理市場,主打記憶體與能效高通的新產品圍繞其神經處理單元(NPU)建構,這種晶片最初應用於智慧型手機,旨在以低功耗高效加速AI相關工作負載。該技術在高通的筆記型電腦晶片中得到進一步發展,如今已被擴展應用於功能最強大的電腦。公司高級副總裁Durga Malladi表示,新款晶片將提供高達768 GB的低功耗動態隨機存取記憶體,記憶體容量和訪問速度對處理海量AI資料的效率至關重要。這些新產品主要針對AI推理工作,即大語言模型訓練完成後,運行AI服務的計算環節。多元化戰略的關鍵一步長期以來,高通一直在尋求減少對智慧型手機業務的依賴。在CEO Cristiano Amon的推動下,公司已將業務擴展至汽車和個人電腦(PC)晶片領域。如今,正式推出資料中心產品,標誌著高通進入了目前最大的處理器市場。公司高級副總裁Durga Malladi稱,高通“在這一領域一直保持低調,花時間積蓄力量”。他透露,高通正在與所有最大的晶片採購方進行洽談,討論部署基於其硬體的伺服器機櫃。高通此舉將使其直接面對AI計算領域的領導者輝達。根據市場預測,輝達今年僅資料中心部門的收入就有望超過1800億美元,這一數字超過了包括高通在內的任何其他晶片製造商的總收入。若贏得微軟、亞馬遜和Meta等大型科技公司的訂單,將為高通帶來可觀的新收入。儘管高通在過去兩年實現了穩健的盈利增長,但其股價表現在2025年上漲了10%,落後於費城證券交易所半導體指數40%的漲幅。 (invest wallstreet)
清華大學魏少軍:人工智慧晶片發展需要顛覆性思維
在2025 IC WORLD高峰論壇上,清華大學長聘教授、國際歐亞科學院院士、北京積體電路學會理事長魏少軍發表了題為《人工智慧晶片發展需要顛覆性思維》的主題演講。本次演講主要分為三個部分:人工智慧是一場不能錯過的盛宴、人工智慧技術的發展無法擺脫地緣政治的影響、人工智慧晶片的發展需要顛覆性思維。01人工智慧是一場不能錯過的盛宴魏少軍首先指出,人工智慧是一場不容錯過的盛宴,對人類社會未來幾十年的影響可能更為深遠。以DeepSeek為例,其使用者增長速度遠超全球資訊網、TikTok和ChatGPT,這標誌著人工智慧應用新紀元的開啟。人工智慧的發展歷程漫長,從1943年神經元模型的建立,到1956年“人工智慧元年”的確立,再到後續基於神經網路的研究,共經歷了三次發展浪潮。當前這一輪人工智慧革命,實現了在諸多方面超越人類的重大突破。人們對人工智慧看法的演變,也能看到一個漸進的發展過程。大約七八年前,美國iRobot公司董事長兼CEO科林·安格爾曾說:“觀察全社會如何對待人工智慧技術將會很有趣,這一技術無疑會很酷。”當時他的看法還相對平和,認為這只是一個“有趣”且“酷”的技術,並未指出它將如何深刻影響世界。然而到了2024年初,輝達公司董事長兼CEO黃仁勳則提出:“每個國家都需要擁有主權AI基礎設施。”這一提法將人工智慧的戰略地位提升到了前所未有的高度。魏少軍表示,從工程學角度看,人類的日常活動在很大程度上與資訊處理系統類似,遵循一個從感知、傳輸、儲存、處理、決策到執行的流程。過去幾百年,以機械化、電力化和自動化為代表的工業革命,主要解決了延伸人類四肢能力的問題。上世紀中葉興起的資訊革命,則延伸了人們的感知能力。而當前正在發生的智能化革命,延伸的則是我們的大腦認知能力。當四肢和五官的能力都被延伸之後,大腦的認知能力就成為了最後一道需要攻克的難關。因此,可以說人工智慧是以人為本的科技革命的最高階段。魏少軍認為,隨著移動通訊、雲端運算等技術的發展,我們正進入新一輪以人工智慧為代表的產業革命。在雲、邊、端三個層面,應用規模將呈現從1到100再到1萬的指數級增長,其帶來的產業規模將以兆美元為單位計算。因此,中國絕不能錯過這次機遇。人工智慧發展有三大要素:演算法、資料和算力。可以將演算法類比為“生產方法”,資料是“生產資料”,算力則是“生產力”。當新的生產方法、生產資料和生產力相結合時,社會的生產關係也將隨之改變。魏少軍指出,人工智慧的極端重要性,使其不幸地捲入了地緣政治的漩渦。面對外部的限制措施和高科技領域的脫鉤風險,必須清醒地認識到,發展不以我們的意志為轉移,不能再抱有僥倖心理。在此過程中,中國處於一個只能進、不能退的境地。必須站在“百年未有之大變局”的格局下看待這個問題。02人工智慧晶片的發展需要顛覆性思維那麼,人工智慧到底該如何發展?傳統的思維認為,人工智慧是通過計算來實現的。未來的“智能化電腦”需要具備三個特點:第一,強大的可程式設計能力,以適應各種不同的業務;第二,高頻寬的計算和儲存路徑;第三,從雲向邊、端轉移過程中極高的能量效率,未來可能要達到每瓦幾百個Tops甚至更高的水平。魏少軍回顧了AI晶片的演進過程:早期並沒有專用的AI晶片,只能使用當時已有的器件,如CPU、GPU等,其主要目標是實現基本的人工智慧功能。但由於這些傳統器件無法滿足AI所需的算力和儲存密度,ASIC應運而生,例如Google的TPU。這些ASIC聚焦於特定應用,但很快又發現其專用性難以匹配快速發展的多樣化智能計算需求 。因此,以可重構、可配置為主要特徵的架構開始出現。然而,當大模型橫空出世後,之前的所有努力似乎都顯得準備不足。最終,以GPGPU為代表的產品開始主導市場,算力成為最重要的追求目標,性能是關鍵。如果只是沿用現有的晶片架構,大機率只能跟在別人後面,難以實現超越。當前人工智慧的發展雖然迅速,但也孕育著危機。魏少軍教授總結了三個現象:模型與架構的深度適配、架構與模型的深度繫結,以及對現有生態的極度依賴。以輝達為例,其GPU架構最初為模型發展提供了很好的平台。經過近二十年的發展,模型為了適配當時最好的硬體進行最佳化,而硬體又根據模型的需求進行迭代,兩者形成了一種深度融合甚至繫結的關係。這種深度繫結帶來的影響是極其深遠的。如果中國的AI發展走不出這個怪圈,就可能被鎖定在美國主導的競爭模式中,永遠跟隨其後。做晶片的人已經開始意識到這個問題,但做模型和軟體的人還沒有充分意識到。在此,魏少軍再次提及DeepSeek。它的重要性不僅在於提升民族自信,更在於開創了參數開放原始碼的先河。這極大地降低了AI技術的門檻,使得不僅是少數大公司,很多小公司也能參與到大模型的開發中,對AI技術的普及具有重大意義。魏少軍對人工智慧在中國率先大規模落地充滿信心。中國擁有14億人口,其中有大量敢於嘗試新事物的群體,這使得中國的網際網路生態異常活躍。同時,中國城鎮居民人均可支配收入已達到較高水平,而消費支出僅佔收入的約68%,剩餘的大量儲蓄可以轉化為巨大的消費潛力。在這種背景下,“人工智慧+”可以與各行各業相結合,催生出大量與中國文化、傳統、教育、習俗緊密相關的應用。未來的AI應用,很可能不會像Windows作業系統那樣全球統一,而是會呈現出地域化和文化多樣性的特徵。最後,通過對比ChatGPT和DeepSeek在翻譯一個包含中文特色語境的句子時的表現,魏少軍論證了基於本土語料訓練的模型在理解和表達上的優勢,並由此堅信,人工智慧的最終應用必然與國家和文化深度繫結。他指出,需要用顛覆性的思維,放棄沿用美國的技術思路,打造中國自己的人工智慧技術路徑。 (半導體產業縱橫)
輝達拋棄 FLOPS:晶片價值改寫為 Token 經濟
9 月 10 日,輝達宣佈將在 2026 年底前推出全新人工智慧晶片 Rubin CPX。這是 Blackwell 平台的繼任者,被定位為“視訊生成與 AI 程式設計”的專用加速晶片。與傳統 GPU 最大的不同在於,Rubin CPX 高度整合了視訊解碼、編碼與推理功能。過去,生成一小時視訊所需的處理量高達百萬級 token,遠超常規 GPU 的處理邊界。Rubin CPX 的設計目標,就是為這種指數級增長的算力需求提供 專用解決方案。更引人注目的是,輝達首次公開了經濟模型:向 Rubin CPX 系統投入1 億美元,最高可帶來 50 億美元 token 收入;硬體價值不再是一次性出貨,而是與 AI 應用的 token 消耗直接掛鉤。一|技術路徑的三步走1|算力邊界突破Rubin CPX 內建的視訊流水線將推理吞吐提升至 Blackwell 的 3–4 倍,面向1 小時視訊 ≈ 100 萬 token 的處理量做專門最佳化。2|系統級整合通過整合解碼、編碼、推理,CPX 取消了 CPU 與外部加速器之間的資料搬運,平均延遲縮短 40%–50%。3|能源效率提升在同等算力下,CPX 的能耗比常規 GPU 下降 30%–35%,這是視訊場景下能否規模化部署的關鍵。二|三個關鍵訊號🔍1|AI 視訊生成已成算力新高地視訊生成和 AI 程式設計是未來最消耗算力的兩大場景。視訊的處理量比文字/圖像高一個數量級,未來 AI 的增長曲線幾乎註定將在視訊領域展開。🔍2|資本邏輯正在轉向 token 維度過去,晶片的價值以 FLOPS 衡量。如今,Rubin CPX 把“投入產出比”直接對應到 token 消耗 = 現金流。這讓晶片廠商從硬體銷售變成持續的 token 分成,是資本市場更願意買單的模式。🔍 3|AI 晶片敘事全面升級輝達從 GPU 性能 → 雲算力租賃 → token 經濟回報,不斷迭代敘事。未來誰能承接更多的 token 消耗,誰就佔據 AI 基礎設施的制高點。三|市場觀察Rubin CPX 不只是一次硬體迭代,而是一次 商業邏輯的躍遷。它揭示了未來幾年晶片價值的核心:不再僅取決於算力極限;而在於 能否把 AI 應用的 token 消耗轉化為可見的現金流。換句話說,誰能把 token 經濟效應嵌入晶片,誰就有機會主導下一輪 AI 基建的資本溢價。四|資本市場的故事切換對投資者而言,這不僅是技術與商業模式的更新,更可能改變資本市場對輝達的估值框架。Rubin CPX 可能意味著輝達的收入模型,從過去的 一次性硬體銷售,逐步轉向 類訂閱的持續分成模式:硬體出貨只是起點,真正的價值在於 token 消耗帶來的長尾收益;這種模式讓輝達更像一家 “雲服務+軟體平台” 企業,而不是傳統半導體公司;對資本市場而言,這相當於從周期性硬體估值 轉向穩定現金流的 SaaS 估值,敘事天花板被再次抬高。這就是 Rubin CPX 背後更大的金融含義:輝達不只是在賣晶片,而是在賣“算力+現金流”的未來。一塊晶片,不止是算力的極限,而是現金流的起點。 (方到)
任澤平:924以來的這一輪十年一遇的“信心牛”由三大驅動力造就
經濟學家任澤平今日發文表示,總體判斷,2024年924以來的這一輪牛市有三大強勁驅動力:政策持續放鬆、新一輪科技革命、流動性充裕,屬於政策牛+科技牛+水牛疊加的信心牛。根據DDM估值模型,一輪牛市的驅動力量來自企業盈利、風險偏好和無風險利率。顯然這一輪牛市的驅動力並非來自分子層面的企業盈利。那麼,這一輪牛市的驅動力來自分母的風險偏好提升和無風險利率下降,這兩個因素是相互強化的。政策牛:去年924是宏觀政策放鬆的歷史性拐點,貨幣政策持續降息降准,樓市持續放鬆限購,財政10萬億化債,不斷加強民營經濟保護,萬億水電站基建投資推出,發展新質生產力重磅措施持續推出,等等。政策大幅超出市場預期,帶來了風險偏好的大幅提升,無風險利率的持續下降,進而引爆了此輪牛市。同時,2025年5月前後,中美關稅戰緩和、國內新質生產力發展取得重大突破、政策層面鼓勵資本市場併購重組等也一起提升了市場風險偏好。924是分水嶺,之前宏觀政策處於觀察週期,之後處於持續的放鬆週期,我們仍處在宏觀政策的放鬆週期之中。科技牛:每次全球經濟社會大週期的低谷都會醞釀一輪科技革命,當前以人工智慧、機器人、晶片半導體、創新藥、軍工、新消費等為代表的全球新一輪科技革命如火如荼,中國在發展硬科技、卡脖子技術等方面取得積極進展,在資產市場上表現為高風險偏好成長股板塊領漲這輪牛市。水牛:924宏觀持續放鬆以來,無風險利率持續下降,房地產市場銷售不振,居民出現“資產荒”,儲蓄率大幅上升,企業不願意貸款,流動性淤積在銀行體系內,出現“堰塞湖”效應。在賺錢效應帶動下,5月以來出現了散戶跑步入場、存款搬家的跡象。7月上交所開戶數量相比5月增長26%;7月M1同比增長5.6%,比5月的2.3%大幅上升,銀行存款定期化趨勢逆轉;7月非銀存款同比多增1.4萬億元。A股成為全球資本市場亮眼的星,一掃過去數年跑輸全球的低迷行情,國際機構紛紛進場。 (格隆匯電報)
速遞 | 輝達潛在對手Groq估值突破60億美元,開啟新一輪融資
人工智慧晶片領域的新銳力量Groq正加速追趕巨頭輝達。據知情人士透露,這家專注於為大型語言模型提供算力支援的晶片公司,正在與投資者洽談新一輪融資,目標籌資額在3億至5億美元之間。若交易達成,Groq的估值將躍升至60億美元,較其一年前完成股權融資時的28億美元估值翻了一番。01 沙烏地阿拉伯合作與業績飆升成關鍵驅動力Groq此時尋求融資,與其近期斬獲的重大合作密不可分。今年2月,Groq宣佈獲得來自沙烏地阿拉伯方面價值15億美元的“合作承諾”,旨在擴大其晶片產品在沙烏地阿拉伯的銷售版圖,儘管該承諾是否構成具有法律約束力的採購訂單尚不明確,但已然展示出Groq作為AI晶片新銳的市場吸引力。此外,Groq本周還宣佈將在芬蘭新建一座資料中心,專門用於部署其自研晶片。正是受益於與沙烏地阿拉伯等夥伴的深入合作,Groq向潛在投資者描繪了極其亮眼的增長前景:公司預計2024年營收將飆升至約5億美元,較去年9000萬美元的水平增長超過五倍。這一強勁預期無疑成為其融資談判的重要籌碼。02 獨特業務模式:雲服務與晶片銷售雙軌平行Groq的核心商業模式是為企業客戶提供基於其自研晶片的AI雲服務。企業使用者可以通過API介面便捷地呼叫Groq提供的AI算力,其使用體驗類似於呼叫OpenAI或亞馬遜AWS的AI模型服務。這是Groq主要的收入來源。同時,公司也直接向其他企業出售晶片系統及資料中心營運服務,加拿大電信巨頭Bell Canada便是其客戶之一。據Groq宣稱,其服務已吸引了近200萬開發者和團隊使用。03 挑戰巨頭的征程:機遇與挑戰並存總部位於加州聖何塞的Groq,是全球數十家立志從輝達手中分得AI晶片市場蛋糕的初創公司代表之一。本周三,輝達剛剛創下歷史,成為全球首家市值突破4兆美元的上市公司,彰顯了其在AI算力市場的絕對統治力,這也無疑給這些初創企業展示了輝達的霸主力量。Groq的創始人兼CEO Jonathan Ross擁有顯赫的技術背景,他是Google關鍵AI晶片TPU的發明者之一。帶著享譽業界的深厚技術積累和充滿野心的最終戰略目標,羅斯正帶領團隊致力於打造比輝達產品更經濟、速度更快且更節能的替代方案。04 技術聚焦推理,應用開源模型與輝達晶片廣泛應用於模型訓練不同,Groq的晶片主要發力於AI模型開發完成後的“推理”(inference)階段。模型訓練通常需要海量晶片集中部署並通過昂貴的網路裝置互聯。Groq強調,其晶片主要真度基於開源模型的AI應用,例如Meta的Llama 4、Mistral的Mixtral以及Google的Gemma。目前,Groq的晶片由知名晶圓代工廠GlobalFoundries負責生產。儘管擁有市場的關注和強勁的收入增長,但Groq的實際產能和部署量仍然為其未來發展增添了一絲疑雲。截至本月初,Groq實際部署上線的晶片數量約為7萬顆,這比其去年為今年第一季度設定的目標至少低了30%。在計算能力方面,Groq的晶片目前也還難以匹敵輝達的旗艦產品Hopper或Blackwell系列AI晶片。05 融資歷程與行業圖景迄今為止,Groq已通過股權融資籌集超過10億美元,其投資者陣容強大,包括資管巨頭BlackRock、科技巨頭思科和三星旗下的風險投資部門、D1 Capital、Lee Fixel創立的Addition以及Tiger Global Management等。然而,Groq及其同行們面臨著一個根本性挑戰:如何說服AI開發者放棄已成行業標準的輝達晶片生態?為尋求突破,許多初創公司正將目光投向輝達供應相對緊張的中東市場。例如,同樣位於矽谷的AI晶片初創公司SambaNova Systems正在向沙烏地阿拉伯石油巨頭沙烏地阿拉伯阿美供應晶片系統和軟體,後者正在開發名為Metabrain的大型語言模型項目。鑑於研發和生產AI晶片需要極其高昂的資本投入,這些挑戰者們正積極開拓包括債務融資在內的多元化融資管道。行業資料顯示,全球至少24家AI晶片初創公司的總融資額已超過70億美元。整個行業也處在動態變化中:專注於AI模型訓練晶片的Cerebras去年曾提交IPO申請,但因G42貢獻了其90%的營收,需審查其與阿聯科技集團 G42的緊密關係而暫時擱置。今年 5 月,Cerebras首席執行官表示仍希望年內完成上市。另一家初創公司D-Matrix則專注於開發大型語言模型推理晶片,該公司去年計畫融資2.5億美元,目前已籌集約1.2億美元。據消息人士稱,D-Matrix當前正努力再融資1.8億美元,以期達成總額3億美元的目標。Groq新一輪的融資動向,不僅是其自身發展的關鍵一步,也為觀察AI晶片市場格局演變提供了重要窗口。Groq此時加碼融資,既是借助市場熱度擴大業務,也是為接下來的技術和商業化進展積蓄彈藥。而面對仍然牢牢掌控市場主導地位的輝達,Groq和它的同行們要走的路還很長。附:AI晶片初創企業盤點1. Cerebras Systems▪成立背景:成立於2016年,由Andrew Feldman等人創立。Cerebras旨在解決AI模型訓練對計算資源日益增長的需求。▪核心產品:Wafer Scale Engine(WSE)晶片,最新版本WSE-3是目前全球最大的單晶片AI加速器,採用整個晶圓打造的超大晶片,擁有超過850,000個AI核心,20PB/s片內頻寬,系統功耗高達23kW。▪技術亮點:WSE繞開了多晶片通訊的頻寬瓶頸,提供高度平行和高頻寬的訓練環境,尤其適合訓練GPT類大模型和科學計算任務。還推出MemoryX、SwarmX等輔助系統,提升可擴展性。▪商業化路徑:推出Cerebras Cloud(託管訓練服務),並與G42合作在阿布扎比營運Condor Galaxy超級計算叢集,承接政府及科研訓練任務。▪融資與IPO計畫:累計融資超過7.2億美元,主要投資人包括Benchmark、Altimeter、JP Morgan、Samsung。2023年已向SEC遞交IPO申請,但由於G42關係(其佔營收90%)受到審查,IPO暫緩。2. SambaNova Systems▪成立時間與背景:創立於2017年,由史丹佛大學教授Kunle Olukotun領導,團隊包括來自Sun Microsystems、Oracle等企業的資深晶片和系統架構師。▪核心產品:DataScale 系列AI系統,基於自研Reconfigurable Dataflow Architecture(RDA)晶片架構,兼具硬體靈活性與性能效率。推出SambaNova Suite AI平台,支援定製化企業模型與推理服務。▪技術亮點:強調“系統+軟體+模型”的端到端解決方案,客戶無需理解硬體即可使用大模型;提供預訓練模型以及模型託管部署服務。▪商業化:客戶包括美國能源部、LLNL國家實驗室、沙烏地阿拉伯阿美等,在中東地區已有商用部署。▪融資情況:總融資金額超過10億美元,2021年D輪融資後估值達50億美元,投資者包括SoftBank Vision Fund、Google Ventures等。3. Tenstorrent▪成立時間與創始人:成立於2016年,由Jim Keller領導,他曾任AMD Zen、蘋果A系列晶片、特斯拉自動駕駛晶片等項目的首席架構師,技術背景深厚。▪產品與技術:Wormhole、Grendel等系列晶片,採用RISC-V架構與資料流平行處理方式,適用於訓練與推理雙場景。也推出可程式設計AI加速卡與軟體開發工具鏈。▪核心優勢:專注高性能通用計算晶片,強調開放架構、靈活性與IP授權能力,適合希望定製化AI硬體方案的客戶。▪商業化進展:產品主要用於AI推理,正在與汽車、工業、邊緣AI等場景整合,強調自研核心IP給合作夥伴。客戶覆蓋北美和亞洲多個市場。▪融資情況:累計融資超2.3億美元,2023年獲現代汽車、三星、Eclipse Ventures、Real Ventures等注資。戰略合作也在向韓國市場推進。4. D-Matrix▪成立時間與方向:成立於2019年,聚焦於為大語言模型提供高效推理晶片,專注“in-memory computing”架構,減少推理時的資料搬移開銷。▪核心產品:Corsair系列晶片,通過將計算單元與記憶體緊耦合,提升能效比,適合ChatGPT、Claude等Transformer模型的前端部署。▪技術亮點:能效比遠高於GPU,主打低功耗、高吞吐,適合邊緣資料中心或私有雲推理部署。支援精度範圍靈活配置(INT4~FP16)。▪商業化路徑:已進入樣品出貨階段,正與多個資料中心和LLM服務商測試整合。客戶未公開,重點佈局企業級模型呼叫服務。▪融資進度:已融資約1.2億美元,正尋求追加1.8億美元以完成總計3億美元的C輪,投資方包括 Playground Global、SK Hynix 等。5. Mythic AI▪成立時間與願景:成立於2012年,致力於邊緣AI晶片開發,聚焦模擬計算(Analog Compute)與數字架構結合的低功耗設計。▪主要產品:M1076 Analog Matrix Processor,可部署於安防攝影機、無人機、工業機器人等邊緣裝置。▪技術核心:基於Flash記憶體電路設計的模擬矩陣運算,極大降低AI晶片功耗與成本。相比數字AI晶片,功耗可降低10倍以上。▪商業化應用:已部署於一些軍事及工業場景,但規模仍小。客戶較為保密,開發周期長,受限於模擬計算精度和可重複性問題。▪融資情況:累計融資超過1.7億美元,投資者包括SoftBank Ventures、Lockheed Martin Ventures、HP Tech Ventures等。 (每日天使)
黃仁勳:美對華出口管制“失敗”,輝達市場份額暴跌!
輝達CEO黃仁勳稱,美國對中國人工智慧晶片的出口管制已經“失敗”,導致美國公司損失數十億美元。本週三,輝達首席執行官黃仁勳表示,美國對中國人工智慧晶片的出口管制是“失敗的”,因為這不僅沒有攔住中國在晶片領域的自主發展步伐,反而給美國公司造成了數十億美元的銷售損失。▌美出口管制攔不住中國自研腳步本週三,在中國台北舉行的台北國際電腦展(COMPUTEX 2025)的新聞發佈會上,黃仁勳針對美國拜登政府的《人工智慧擴散規則(Intelligence Diffusion Rule)》發表了上述言論。《人工智慧擴散規則》於1月13日由拜登政府發佈,原預計於5月15日生效。該規則將各國家和地區劃分為三個等級,針對不同等級設定不同人工智慧晶片出口管制規則。該規則完全封鎖了美國向中國出口尖端人工智慧晶片的道路。而川普政府在5月13日已經廢除了這一規則。“總而言之,出口管制是失敗的,”黃仁勳表示,“一開始支撐《人工智慧擴散規則》的基本假設,首先被證明是根本錯誤的。”在美國限制向中國銷售先進的人工智慧晶片後,反而更加刺激中國在晶片領域的自主研發,發展出了不依賴國外製造商的自主供應鏈。黃仁勳表示,儘管受到美國的限制,但中國的晶片自研仍在繼續。5月13日,美國商務部工業和安全域正式發佈檔案,廢除拜登政府的《人工智慧擴散規則Intelligence Diffusion Rule》,並宣佈宣佈採取額外措施加強對全球半導體的出口管制。黃仁勳讚揚了川普對人工智慧的態度,並表示,通過取消先前的限制,川普總統已經表明,他明白美國公司並不是這種技術的唯一提供者。“川普總統意識到這完全是錯誤的目標,”他在提到之前的規定時說。▌中國的激烈競爭黃仁勳還表示,自前任總統拜登執政以來,輝達在中國的市場份額已從95%降至50%。他稱,世界上一半以上的人工智慧研究人員現在都身處中國。由於美國對人工智慧晶片的出口管制,這些專家被迫轉向研發中國本土技術。“我們在中國面臨的競爭非常激烈,”黃仁勳表示,“他們希望我們永遠不要回到中國。”中國是輝達晶片的關鍵市場之一。黃仁勳估計,明年中國整個人工智慧市場的價值約為500億美元,這對該公司來說是一個重大機遇。今年4月,輝達曾表示,在川普政府限制其H20人工智慧晶片向中國出口後,該公司將承擔55億美元的費用。本週早些時候,黃仁勳又估計,與H20相關的收入損失將達到約150億美元。2022年,拜登政府實際上禁止了中國晶片製造商生產先進晶片的先進微晶片和裝置的出口,試圖以此阻礙中國半導體產業發展。最近,美國商務部又發佈指南,以所謂推定違反美出口管製為由,企圖在全球停用中國先進計算晶片,包括特定的華為昇騰晶片。本週一,商務部新聞發言人就美國企圖全球停用中國先進計算晶片發表談話。發言人稱,美方措施是典型的單邊霸凌和保護主義做法,嚴重損害全球半導體產業鏈供應鏈穩定,剝奪其他國家發展先進計算晶片和人工智慧等高科技產業的權利。中方強調,美方措施涉嫌構成對中國企業採取的歧視性限制措施。任何組織和個人執行或協助執行美方措施,將涉嫌違反《中華人民共和國反外國製裁法》等法律法規,須承擔相應法律責任。 (科創板日報)
深夜突發!超越輝達H100 !華為昇騰 910D 人工智慧晶片深度分析! 2025
在全球人工智慧晶片競爭白熱化的背景下,華為即將推出的昇騰 910D 晶片成為行業焦點。作為對標輝達高端 AI 晶片的國產新銳,昇騰 910D 不僅承載著技術突破的使命,更有望重塑 AI 晶片市場格局。當前,華為已啟動該晶片的測試接洽工作,計畫於 5 月獲取首批樣本,標誌著國產 AI 晶片向高端領域發起新挑戰。一、昇騰 910D 對比 910 晶片的優勢(一)架構革新與算力躍升昇騰 910D 採用了深度最佳化後的自研架構,相比早期的昇騰 910B,在架構層面進行了深度改良。通過精簡約 30% 的冗餘電路 ,讓晶片的運算效率大幅提升,半精度算力達到 320 TFLOPS。而昇騰 910B 的半精度算力遠低於這一數值,這種架構使得昇騰 910D 在處理大規模矩陣運算、複雜神經網路模型訓練時,能夠更加高效快速地完成任務,顯著縮短運算周期。(二)散熱與功耗的雙重最佳化昇騰 910D 搭載了先進的液冷散熱技術,支援晶片在 45℃高溫下仍能全速運行,功耗卻僅為 350W。反觀昇騰 910C,可能在散熱技術上相對傳統,導致其在高負載執行階段溫度升高,影響晶片性能發揮,且功耗較高。(三)叢集互聯性能提升昇騰 910D 每秒能搬運 4TB 資料,實現晶片間的高速通訊,使得多晶片並聯組成的叢集算力密度提升 5 倍 。相比之下,昇騰 910 其他規格晶片在叢集協作時,資料傳輸速度和協同效率較低。這種強大的叢集互聯性能,讓昇騰 910D 在支撐大型 AI 叢集運算,如文心一言這樣的大語言模型訓練時,能顯著縮短訓練周期,提高模型迭代速度。AI云原生智能算力架构只专注于万亿赛道!分享最新一线AI大模型、云原生、智能算力架构技术!434篇原创内容公众号二、橫向對標:昇騰 910D 與國產競品的實力較量三、國際競爭:昇騰 910D 與全球主流晶片的多維對比(一)性能參數全面超越與輝達 H100 相比,昇騰 910D 在半精度算力上提升 25%(320 TFLOPS vs 256 TFLOPS),功耗降低 50%(350W vs 700W)。通過 5 晶片並聯方案,其在文心一言訓練中縮短周期 27%,自動駕駛模型迭代速度提升 1.8 倍,展現出強大的計算效能。(二)成本與生態雙重優勢成本競爭力:單價 14.5 萬元較 H100 的 24 萬元降低 40%,液冷系統成本較風冷降低 20%,顯著降低企業部署成本。本土生態適配:針對中文 NLP 任務最佳化,文言文翻譯精準率提升 12%,更貼合國內應用場景;依託 MindSpore 框架建構的生態體系,在資料安全與本地化部署上具備天然優勢。(三)全球競品對標分析華為昇騰 910D 晶片的推出,不僅是技術層面的重大突破,更是國產 AI 晶片在全球市場的重要戰略佈局。隨著該晶片從測試走向商用,其有望憑藉性能、成本、生態的綜合優勢,加速國產替代處理程序,推動全球 AI 產業進入全新的競爭格局。未來,昇騰 910D 能否引領行業變革,值得持續關注。 (AI雲原生智能算力架構)