#龍芯中科
正式流片!龍芯發表首款GPGPU晶片,為中國AI晶片開闢「第二戰場」!
中國AI晶片最近熱鬧非凡,寒武紀、摩爾線程、壁仞、沐曦等輪番創新高,但基本上都是ASIC技術路線,通用GPU一直沒有大的突破與進步。最近,龍芯中科在最新的投資者交流活動中透露,龍芯首款獨立GPU晶片9A1000已於2025年12月完成流片,定位為入門級獨立顯示卡。據理解,龍芯9A1000具備數十TOPS的AI算力,旨在與龍芯CPU形成自主配套方案以提升系統整體性價比;其圖形性能與AMD RX550相當,其發佈於2017年。具體性能參數如下:關於製程工藝資訊,根據目前公開資訊,龍芯官方並未揭露9A1000改採用的具體製程。這是一個關鍵的技術資訊缺口。另外,龍芯的GPGPU技術路線將圖形渲染、科學計算及AI加速功能整合在單一晶片內,旨在從端側應用做起,初期主要面向AI推理場景。當然,龍芯9A1000的首要目標是與龍芯自研的CPU(如3A6000)形成深度協同的「自我配套」方案,以提升龍芯電腦整機的性價比和市場競爭力。同時,據理解龍芯已規劃下一代產品9A2000及9A3000系列產品,定位中高階顯示卡,目標應用於桌面及伺服器。其性能將顯著提升,單精度浮點算力(FP32)計畫達到5 TFlops,INT8算力目標為160 TOPS,並支援雙晶片互聯技術。預計2026年將推進9A2000的研發工作。同時,9A1000在流片成功後,將進入測試、量產及市場匯入階段,與龍芯CPU配套的整機方案可望在政務、教育等信創市場獲得應用。為突破應用生態壁壘,龍芯正致力於為9A1000開發Windows作業系統下的驅動程式。此舉若能成功,將大幅拓寬產品的潛在應用範圍。同時,在軟體生態建設方面,龍芯中科持續深化龍架構OpenEuler、OpenAnolis、OpenHarmony等主流開源社群的適配與最佳化。而且,目前龍芯圍繞自研GPGPU,已完成Linux、OpenHarmony及嵌入式三大平台的圖形驅動開發,並最佳化了BLAS、DNN等關鍵計算庫,實現對OnnxRuntime、Ollama等AI框架的支援,可流暢運行YOLO、ResNet等主流AI推理模型。在相容性層面,龍芯二進位翻譯系統已達到「基本可用」水平,尤其在外設支援上取得顯著突破,已相容於印表機、掃描器、金融終端等多種裝置,該優勢已在部分招投標項目中轉化為實際競爭力。下一代晶片將透過硬體增強進一步提升對主流桌面系統的支援水準。如若龍芯GPU進入產業應用,加上早已應用的龍芯CPU產品-3A6000/3B6000/3C6000;這表示龍芯中科將持續在政務信創市場發力,並向伺服器、網路儲存、雲終端等更廣闊的資訊化市場滲透。在科技和產品不斷取得進展之際,龍芯中科的財務狀況也得到進一步的改善。龍芯虧損額從2024年的6.25億元,預測2025年虧損大幅下降到2.90 億元,較去年年增53.57%。根據不同平台分析師預測資料。富途牛牛的資料顯示,對龍芯2026年收入的一致預測為14.205億元;而同花順的資料預測,2026年龍芯淨利潤平均值為0.17億元,這也意味著龍芯在連續虧損3年之後,預計於2026年扭虧為盈。同時,在開放市場取得突破,基於龍芯平台的網路儲存、密碼伺服器、瘦客戶機等產品已實現典型應用落地。作為國內唯一可對外進行CPU核心技術授權的自主廠商,公司正透過技術授權模式吸引生態夥伴,共同拓展龍架構產業生態。綜合來看,龍芯中科透過推出9A1000,正從單一的CPU供應商轉型為「CPU+GPU」的全平台解決方案供應商。同時,在產業應用和市場拓展上,龍芯中科也透過驅動開發和生態建設進一步拓展了邊界。因此,龍芯9A1000未必能立刻改變高端AI訓練市場的格局,但切實地豐富了國產算力的技術路線、產品形態和商業模式,為在更多關鍵領域實現自主可控提供了另一種可能。對於國產AI晶片而言,其核心意義並不在於追求頂級的單項性能,而在於它驗證了一條以「生態自主」和「特定場景融合」為核心的國產晶片發展新路徑。 (飆叔科技洞察)
超3000億美元!佔據全球54%,4大中國晶片如何攻下智能製造新領地?
一款晶片,正在成為全球工業智能升級的核心戰場。資料顯示,2024年全球智能製造市場規模已達2870億美元,而支撐這一龐大系統的“核心大腦”——嵌入式CPU,正迎來前所未有的技術爆發與市場重構。12月7日,備受關注的特斯拉人形機器人團隊完成中國“審廠”;根據供應鏈業內人士透露,此次“審廠”或為配合2026年一季度特斯拉Optimus Gen3機器人的發佈進行量產準備。這意味著,特斯拉機器人產業鏈和全球智能製造產業鏈即將迎來落地時刻。其中,嵌入式CPU作為產業落地不可或缺的核心部件,成為國際科技巨頭與中國國產廠商競相佈局的戰略高地。2024年,全球智能製造市場規模約為2870億美元。而這一數字在2025年預計將突破3260億美元,年複合增長率保持在13.5%左右的高速區間。這一增長背後,是工業自動化裝置、智慧型手機器人等細分領域的突出表現。國際嵌入式CPU巨頭恩智浦、德州儀器、意法半導體等憑藉長期技術積累和全產業鏈佈局,在工業智能製造高端市場佔據主導地位。以意法半導體為例,其計畫在2025-2027年間重點投資12英吋矽基和8英吋碳化矽先進製造設施。其中,義大利Agrate的12英吋晶圓廠目標產能將實現翻倍,法國Crolles的12英吋晶圓廠到2027年周產能將逐步提升至14,000片,以強化智能功率和混合訊號技術的量產能力。在中國本土化方面,意法半導體採取了務實的策略。該公司與華虹集團合作,在中國本土代工生產40nm eNVM MCU產品,實現了STM32產品供應鏈的本地化。同時,還與三安光電在重慶合資建設8英吋碳化矽晶圓工廠,進一步貼近中國工業市場需求。這種全球佈局與本地化生產相結合的模式,成為國際廠商在中國市場保持競爭力的關鍵策略。中國作為全球最大的製造業市場,以及全球製造業的核心樞紐,其智能製造市場表現尤為亮眼。截至2023年底,中國智能製造裝備產業規模已超過3.2兆元,培育了421家國家級示範工廠、萬餘家省級數位化車間和智能工廠。2024年,中國市場工業機器人銷量達到30.2萬台,佔全球市場比重高達54%。這一轉變為國產嵌入式CPU廠商提供了難得的崛起機遇。如瑞芯微2025年前三季度的業績報告顯示,公司營業收入達31.45億元,同比增長45.46%,淨利潤7.80億元,同比增長121.65%。工業應用、機器人等領域已成為瑞芯微的核心增長引擎。其旗艦產品RK3588系列採用8nm工藝,整合了四核Cortex-A76與四核Cortex-A55處理器,NPU算力高達6TOPS,已被人形機器人廠商逐際動力LimX Oli等產品採用。同時,工業級版本也在智能倉儲、工業視覺檢測等場景得到廣泛應用。2025年,推出的RK182X系列端側算力協處理器,進一步完善了工業AI算力佈局。另外,全志科技在機器人與工業控制領域的佈局同樣成效顯著。該公司2025年前三季營業收入達21.61億元,同比增長28.21%,淨利潤2.78億元,同比增長84.41%。全志科技的MR系列機器人晶片整合了CPU+GPU+NPU異構架構,算力達3-4TOPs而功耗僅5W,支援毫秒級響應,為小米CyberDog、宇樹Unitree系列等產品提供運行支援。在工業控制領域,其T536晶片採用異構多核架構,整合了四核A55應用處理器、RISC-V即時處理器和2T NPU,支援ECC全通路資料校驗,適配工業閘道器、PLC、3D印表機等場景。而另一個國產嵌入式CPU巨頭——國芯科技則選擇了另一條路徑——聚焦自主可控AI MCU晶片。通過RISC-V架構與AI技術融合,該公司推出的CCR4001S和CCR7002兩款工業級AI MCU晶片,內建0.3TOPS@INT8的AI加速子系統,支援多種深度學習框架。國芯科技CCR4001S晶片已與孔皆智能合作推出AI直流拉弧檢測方案,提升了檢測效率和精度,降低了誤報率,實現了從傳統方案到AI MCU方案的技術革新。作為國產晶片自主程度最高的——龍芯中科則以自主LoongArch架構為核心,建構了覆蓋工業控制的產品體系。2024年推出的2K1500嵌入式SoC採用雙核LA264架構,主頻達1.5–2.0GHz,整合了豐富工控介面,適用於工業閘道器、邊緣控製器等場景。通過“CPU+作業系統+硬體平台”的全端佈局,龍芯中科已在電力、軌道交通等領域實現規模化應用。因此,在人形機器人熱潮與製造業智能化轉型的雙重機遇下,正推動嵌入式CPU行業進入高品質發展階段。國際廠商憑藉技術積累和產能佈局鞏固高端市場優勢。國產廠商則憑藉著異構計算、RISC-V、AI融合等技術領域的創新,也促進了國產嵌入式CPU向更高算力、更低功耗、更強安全性方向發展。未來,供應鏈自主可控與全球化協同創新的平衡,將成為廠商競爭的關鍵。在這場工業智能化的浪潮中,嵌入式CPU不僅是技術的較量,更是生態與戰略的全面競爭。 (飆叔科技洞察)
中國AI晶片,集體增加存貨
2025年上半年,中國國產AI晶片持續獲得熱捧,多家廠商業績持續高增。在旺盛的AI推理需求支撐下,中國頭部AI晶片廠商左手積累產成品,右手儲備關鍵材料,以應對未來市場發展。21世紀經濟報導記者梳理公司財報發現,總收入規模與海光資訊還有一定差距的寒武紀,在上半年卻與前者的淨利潤規模已經十分接近;海光資訊在上半年相比同業,有較大比例花費用在了銷售上;龍芯中科雖然盈利能力依然面臨壓力,但在市場周期回暖處理程序中,旗下核心產品毛利率表現已經逐漸回歸,近期其攜“三劍客”進入市場,接下來有望看到進一步商用的好消息。當然,中國AI晶片廠商的份額仍有較大提升空間。從沐曦股份披露的回覆問詢公告可見,政策支援對國內市場採用國產AI晶片有一定驅動,但更大程度還是來自於內生競爭力提升和國內開源生態的密切聯動。訂單與存貨“齊飛”從收入規模看,分別有CPU和DCU(GPGPU的一種)業務的海光資訊一直都在穩健增長態勢中。上半年海光資訊實現營業收入54.64億元,同比增長45.21%;歸母淨利潤12.01億元,同比增長40.78%。同時,在旺盛的AI推理需求支撐下,正式擺脫“多年虧損”帽子的寒武紀追趕勢頭猛烈。上半年實現營業收入28.81億元,同比增長4347.82%;歸屬於上市公司股東的淨利潤10.38億元,上年同期為虧損5.3億元,同比增長295.85%。寒武紀無論從總資產還是營收規模都與海光資訊有一定差距,但在淨利潤層面實現了快速接近。寒武紀在公告中提到,淨利潤大幅增長源於營業收入增長,期內公司在持續拓展市場,助力人工智慧應用落地。相比之下,收入規模有限的龍芯中科,盈利能力也在持續改善。公告提到,公司發展的主要矛盾開始從產品研發端轉向市場銷售端,營收開始進入新一輪增長周期。上半年實現營業收入2.44億元,同比增長10.9%;歸母淨利潤為虧損2.94億元,上年同期為虧損2.38億元,同比下降23.53%。其中,傳統優勢的安全應用工控市場恢復增長,上半年8722.93萬元營收已經接近2024年全年水平;資訊化類晶片營收1.15億元,同比增長5.01%,65.45%的毛利率對公司整體盈利能力有拉動作用;公司持續調整收入結構,減少了整機型解決方案銷售。最終實現毛利率42.44%,同比提高12.77個百分點,正逐步恢復到正常水平。頭部AI晶片公司收入快速增長的另一面,是延續了一季度態勢,仍在積極儲備存貨,代表未來訂單兌現空間的合同負債表現同樣強勁。寒武紀在上半年有存貨26.9億元,佔總資產比例31.95%,去年末則佔總資產的26.41%,期內比上年期末增加51.64%。根據披露,主要為本期產成品增加所致。合同負債的增長更為迅猛,期內為5.43億元,佔總資產比例的6.45%,去年末佔總資產比例僅0.01%,財報顯示,這主要因截至期內,公司預收合同款項相比上年期期末增加61223.22%所致。海光資訊有類似表現,公司上半年合同負債大幅增加242.1%至30.91億元,佔總資產比例9.57%,主要為收到客戶預定合同貨款。存貨方面也在提前準備,期內公司有60.13億元存貨,相比去年末增加10.84%,佔總資產的18.62%。拆解來看,存貨中增加最多的為產成品和原材料。國內AI晶片廠商積極增加存貨,均有戰略性發展考慮。根據沐曦股份披露,在一季度公司的原材料構成中,HBM(高頻寬記憶體)和晶圓是整體原材料帳面餘額中佔比最高的細分類目,近兩年來,二者之和幾乎構成了原材料主要來源。尤其截至今年3月末,公司存貨中HBM佔比大幅提升到1.23億元,佔整體原材料的63.73%。沐曦股份在回覆上交所問詢的公告中提到,公司核心原材料晶圓、HBM的採購周期(從下單至交付)平均為6個月左右,採購周期較長且不可避免受到國際供應政策和供應商產能分配的影響,具有一定不確定性,因此提前備貨比例較高。典型如HBM,目前全球技術最前沿的HBM主要由SK海力士、美光和三星供應,三者都為海外供應商,由此提前儲備一定存貨,實則在情理之中。此外,存貨變化還有季節性因素影響。沐曦股份提到,公司在一季度的原材料佔比由7.78%上升至21.64%,主要原因為在2025年一季度集中大量備貨原材料,而2024年期末處於原材料備貨空窗期。應對成長挑戰當然,相比GPU巨頭輝達的絕對領先市場地位,國內AI晶片廠商仍有較高提升空間。目前國內採取了不同技術路線爭奪市場的方式,且開放生態、產業鏈深度協同是其中關鍵。國內AI晶片參與者並非全部擠在GPU賽道,目前與輝達相同路線競爭的主要玩家包括海光資訊、沐曦股份、天數智芯、壁仞科技、摩爾執行緒等;另一個不容忽視的ASIC定製化晶片市場,差異化競爭思路更為明顯,參與者則包括華為海思、寒武紀以及國內科技巨頭生態鏈中企業如崑崙芯、平頭哥等。相比通用計算場景,ASIC晶片可以針對特定AI推理場景進行定製化設計,因此近兩年來愈發受到雲端運算廠商如Meta、亞馬遜等公司青睞,這也是國內ASIC晶片備受關注的原因。目前國內頭部AI晶片廠商的商業化都取得了一定進展。根據Bernstein Research資料,輝達和AMD在2024年中國AI加速晶片市場中分別佔據66%、5%份額;國內企業中,華為海思佔約23%份額,沐曦股份市場份額約為1%。根據IDC資料,2024年中國資料中心加速晶片市場中,出貨量在10000張以上的GPU公司(不含ASIC晶片公司)包括輝達、沐曦股份和天數智芯。寒武紀提到,公司產品持續在營運商、金融、網際網路等多個重點行業規模化部署並通過了客戶嚴苛環境的驗證。海光CPU系列產品相容x86指令集以及國際上主流作業系統和應用軟體,應用於電信、金融、網際網路、教育、交通等行業;海光DCU系列產品可廣泛應用於巨量資料處理、人工智慧、商業計算等應用領域。龍芯中科在上半年更是發佈了備受矚目的3C6000系列產品。根據官方說法,其綜合性能達到2023年市場主流產品水平,對標英特爾公司這一年發佈的第三代至強可擴展架構伺服器晶片。公司將接下來進入市場的重點產品稱為“三劍客”,在公告中提到,將探索基於3C6000系列CPU的儲存伺服器、網路安全裝置、密碼伺服器等專用伺服器市場,探索基於2K3000/3B6000M系列CPU的雲終端、雲筆電等專用終端市場。當然,目前面臨的挑戰依然是顯性的,沐曦股份在回覆問詢函時進行了闡述。例如在採購方面,目前國內網際網路企業採購GPU仍以可售的國際產品為主,國產GPU佔比較低且多數集中於推理場景,訓練場景需要更大規模叢集測試的時間與資源投入,因此國產GPU產品匯入較慢。雖然國產GPU依託通用型架構優勢,具備相容CUDA的理論基礎及路徑可行性,但生態適配、迭代和培育建設是一項長期、複雜的系統性工程。當然對於沐曦股份來說,自身的劣勢在於,目前在網際網路企業客戶開拓及產品匯入方面,相比部分國內友商進度有所滯後。這類廠商在部分推理場景下可能會使用國產算力晶片,但通常也是優先選擇自有產品或者扶持其投資的生態鏈企業。當然,該公司也是國內少數真正實現千卡叢集大規模商業化應用的GPU供應商,並正在研發和推動萬卡叢集的落地,目前已成功支援128B MoE大模型等完成全量預訓練。據介紹,沐曦股份的算力網路覆蓋國家人工智慧公共算力平台、營運商智算平台和商業化智算中心,下游應用領域覆蓋金融、交通、能源、醫療健康、大文娛等行業。公司正在進行功能測試,預計於2025年底進入風險量產的曦雲C600系列,已經與多家頭部網際網路大廠或AI大模型廠商、國家人工智慧公共算力平台、金融、能源、交通等客戶推進接洽交流、產品評測等,頭部伺服器OEM廠商也在積極適配曦雲C600樣片。該系列還增加了對FP8資料格式的支援,尤其是FP8 Tensor及Tensor轉置指令。開放生態加速度要真正推動國產AI晶片生態持續規模發展,開放包容的產業鏈環境尤為重要。近期DeepSeek在官方檔案中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度,其是針對即將發佈的下一代國產晶片設計,就是一種明確表態。有國產晶片公司高管就對21世紀經濟報導記者指出,很樂於見到有DeepSeek這類企業,告訴大家那些是趨勢,這可以讓國產晶片廠商有更多機會與模型廠商發揮協同作用。其公司一方面會沿著DeepSeek為代表的精益求精路線,在有限資源範圍內,儘可能多地推進計算實現;另一方面仍然不可忽視OpenAI“大力出奇蹟”的路線。海光資訊則進一步在推動產業鏈整合。公司在公告中提到,隨著智算伺服器從模組化走向高密度整合化,晶片廠商必須與產業鏈上下游深度協同,實現晶片、整機平台全程同步研發,推動“硬體—軟體—生態”系統化協同發展。這側面解釋了其與中科曙光進行業務整合的邏輯所在。為了更大力度投入生態,海光資訊在上半年還產生了大量支出。期內公司銷售費用2.034億元,相比上年同期的0.7116億元,同比增加185.83%;其中增加較多的是市場推廣費,期內為1.106億元,同比增加330.35%。公告中解釋,這源於期內加大了市場推廣力度,快速擴充市場和行銷團隊,同時推進生態建設令相關市場費用同比有大幅增加。此外記者還發現,國內營運商也在大力推動Scale up和Scale out兩條重要技術路線的生態合力,以期更好驅動基於國內AI晶片生態的計算效率提升。國產AI晶片自去年以來突飛猛進的發展,是多年來持續大力投入研發、蓄力的結果。隨著國內AI產業生態以開放姿態共同發力,市場份額層面也將不斷進步。 (21世紀經濟報導)