DeepSeek一句話,滬指重回3800

這一切,又要說回到DeepSeek和「UE8M0 FP8」的「演算法換算力」上。

8月21日,深度求索(DeepSeek)公司在官方微信公眾號發文,發布DeepSeek-V3.1模型。官方帳號在置頂評論表示:“UE8M0 FP8是針對即將發布的下一代中國國產晶片設計。”

先甭管「UE8M0 FP8」是什麼,「下一代國產晶片」這句話,直接把8月22日的上證綜合指數送上3800點,創下2015年8月20日以來新高。科創板晶片全數上漲,晶片指數上升10.05%。海光資訊、寒武紀兩家市值超千億的晶片巨頭雙雙漲停。

今天(8月25日)早盤,A股三大指數集體高開,滬指續創十年新高。



8月22日,美媒引述消息人士報導,「後門事件」爆發後,輝達已經告知一些零件供應商暫停生產「中國特供」H20晶片。

同一天,半導體領域的不斷突破為中國股市帶來了久違的信心,國產人工智慧軟體和硬體正加速形成「閉環」,走在局部突破加國產替代的高速路上。


股市大漲

同時,有著大模型世界領先地位的深度求索,不以押注輝達「地表最強」GPU為目標,反而以「演算法換算力」,回身等待正發力奔跑的國產算力晶片商,體現的是深遠的眼光和理智的情懷。

股市苦低迷久矣。歷經10年,上證指數由晶片企業領跑,終於漲至2015年8月中旬的最高水準。

2015年8月,央行下調人民幣匯率,引發金融波動。2017年後川普拋出「貿易戰」,新冠疫情持續三年,曾經突破5000點的上證綜合指數,一度跌至2500點以下,此後也一直明顯落後於歐美和日本股市。

中國新興科技企業深度求索崛起,兩番攪動股市。

今年1月,堪與Open AI最新模型媲美的DeepSeek-R1發布,引發輝達、博通、微軟以及光刻機製造商阿斯麥的股價全線下跌,刺激中國科技公司中芯國際、小米、比亞迪、騰訊、阿里巴巴、網易和京東股價持續上漲。


1月28日,受DeepSeek-R1發布影響,美國科技股暴跌

8月22日,深度求索宣布更新的V3.1模型具有「針對下一代國產晶片」的最佳化方式,極大利多中國算力晶片企業,股市隨之出現晶片股領漲、科技股普漲的局面。

與10年前市值(綜合A股、港股和美股)排名前十的中國企業相比,互聯網公司和電動汽車公司存在感大增,騰訊、阿里巴巴和比亞迪均榜上有名,台灣的台積電更是憑藉先進製程製造技術盤踞榜首。

新興產業的壯大,離不開國家戰略的指引。在2015年至2023年中國上市企業中,高性能工具機、機器人領域和半導體領域的企業,收到的國家補貼佔營業收入的比例超過2%。

深度求索兩度引爆中國股市,不僅意味著經濟發展動力的隱形轉移,更折射出中國企業「戮力同心」的團結自主意志。


Deepseek

也就是說,在先進的科技領域,特別是半導體及人工智慧領域,中國的創業企業正起到「領頭羊」的作用,其他供應鏈公司和科技企業百花齊放,用先進生產力帶動中國經濟發展。


演算法換算力

引發晶片股狂歡的「UE8M0 FP8」,到底是什麼?

「UE8M0 FP8」是一種電腦儲存和處理資料的數位格式,核心作用是用更少的儲存空間和運算資源,高效處理AI模型訓練或推理這類對資料精度有要求但又不用特別精確的任務。

它的作用是壓縮資料。FP8指的是8位元浮點數,這是它的核心技術類型。簡單而言,就是用8個「0」或「1」來表示一個數字,比傳統的16位元、32位元格式節省「空間」。


8位元浮點數比傳統的16位元、32位元格式節省“空間”

UE8M0是FP8格式下的一個具體的細分規格,重點解決「表示範圍」和「精度」的平衡-既不會因為追求節省空間而讓數字表示範圍太窄(例如裝不下太大或太小的數),也可以保證AI計算需要的基礎精度,避免算出來的結果偏差太大。

其達到的指數級提升至少包含三個方面,一是算力密度倍增,相同晶片面積下,FP8計算單元數是FP16的兩到三倍。二是功耗砍半,其能耗僅FP16的四分之一。三是可以裝進手機,儲存開銷降低一半以上,大模型的端側部署成為可能。

總結來說,「UE8M0 FP8」就是為AI場景設計出來的「高效資料格式」,能讓大模型跑得更快,佔用的記憶體/顯存更少,還不影響核心效能-屬於深度求索的傳統藝能,演算法換算力。

其實,大部分已經量產的國產算力晶片仍沿用FP16/BF16+INT8的運算通路,尚未整合FP8。


主流浮點精度類型

截至2025年8月,在A股(含已揭露招股書、處於上市審核階段)明確「產品已支援FP8運算精度」的 GPU/AI 晶片公司只有兩家:摩爾線程和沐曦,其產品分別對應的是MTT S500和C500系列。

深度求索最新獨創的UE8M0格式,主要是與下一代FP8的國產晶片形成了「中國式協同」。而「下一代晶片」有誰,深度求索沒有說,暫時只能從中國信通院8月初公佈的一批「DeepSeek大模型適配廠商」一窺端倪。

在「首批通過DeepSeek適配測試名單」中,包含中國電信的星辰MaaS平台;華為的推理伺服器;寒武紀的AIDC一體機;崑崙芯的P800一體機;海光的DCU加速卡;沐曦的C550一體機及智算群集;中昊體英的泰則枅體的DCU加速卡;沐曦的C550一體機及智算群集;中昊基英的泰則旌的泰則中科;

這其中最被看好的是寒武紀,因此市場反應十分直觀:8月22日寒武紀漲停,市值超過5000億,單日猛增866億美元,取代中芯國際,位居中國半導體行業第一位。目前,寒武紀股價超過1000元,僅次於貴州茅台。


寒武紀漲停


中國式協同

這也是「中國式協同」的根本意義:一家世界頂尖公司還不算,供應鏈上的公司都要做到世界頂級。想想之前微軟和英特爾搞個了「Wintel」也正是同樣的道理。

在中國人工智慧領域,深度求索的佈局正在打造「國產大模型+國產晶片+國產軟體系統」的國產化閉環。

不過,閉環只是相對的,中國半導體製造已經擺脫了「簡單複製」階段,但還沒到「反向輸出」的階段,達不到TikTok和Shein「定義全球標準」的程度。

從製程來看,7奈米及以下先進製程,EUV光刻機、高階EDA以及ArFi光阻依然存在「卡脖子」的現實,只能透過「DUV加多重曝光」實現有限的量產,性能和良率均落後於台積電2至3代。


EUV微影機

從設計來看,海思、寒武紀和平頭哥的晶片並不比英威達和高通差,只是在製造環節被鎖定在7奈米。

其他領域則都是好消息,例如成熟過程基本自主循環,成熟過程產能大規模擴張,設備和材料小批量試水出海,特別是大基金三期和地方政府基金在本年度預計投資3000億元,力度也是罕見的。

而且,美國主導的出口管制,無論是「小院高牆」的《晶片法案》,還是屢屢加碼的高昂關稅,都加速了中國國產供應鏈自力更生,「被逼出來的創新」正在成為「中國製造」的堅實基礎。

因此,回過頭來看深度求索的「演算法換算力」尤其可貴。即使GPU算力最強的輝達,一邊清H20的庫存,一邊要賣給中國更高的版本B30A,深度求索依然選擇適配算力較低的國產芯片,這不是技術問題,而是意志問題:有了頂流DeepSeek的幫助,中國國產芯片不僅能供給國內論需求,更將獲得國際話語權。(南風窗)