#技術封鎖
荷蘭與中國在晶片產業上達成合作,美國的技術封鎖和長臂管轄會危害全球供應鏈的穩定,中國需要ASML的裝置,ASML需要中國市場
01前沿導讀荷蘭政府的外交大臣費爾德坎普在近幾日與中國進行了會晤,中荷雙方就如今的半導體出口管制問題進行了探討。據中國外交部發言人毛寧女士表示,在出口管制上面,中方已多次表明立場。國際上的某些個別國家以國家安全的概念,對中國實行技術封鎖、對其他國家實行長臂管轄,嚴重危害了全球供應鏈的穩定。中國和荷蘭在半導體領域的互補性強,雙方會在半導體領域繼續保持合作,共同維護全球半導體供應鏈的穩定性。02雙方合作從1954年中荷兩國建設代辦級外交關係以來,雙方就一直秉承著合作共贏的政策向前發展。荷蘭是歐洲對華技術轉讓最活躍的國家之一,並且荷蘭處於中立位置,不涉足國際上面的政治站隊。截止到2024年,中荷雙邊的貿易金額連續四年突破千億美元數值,其中的半導體裝置、農業、綠色能源技術的合作佔比超過了40%。荷蘭的ASML公司,是美國EUV LLC技術聯盟的唯一裝置製造商。其公司能開發出全球唯一的EUV光刻機,離不開美國的技術支援,這也是美國可以對荷蘭施壓,禁止其出口給中國光刻機裝置的最大砝碼。#ASML在美國宣佈通過出口管制、《晶片法案》等方法來強化對華的技術封鎖後,處於中立地區的荷蘭也受到了波及。由於ASML公司的EUV光刻機需要美國的材料技術,所以美國對荷蘭施壓,緊急攔截了中芯國際花費1.2億美元從ASML採購的EUV裝置。#EUV光刻機根據SEMI的資料表示,中國是國際上面最大的半導體消費市場,也是對半導體產業需求最旺盛的國家。中國佔據了全球34%的半導體裝置份額,也是荷蘭ASML公司、美國應用材料公司、輝達公司的最大單一市場。ASML前CEO彼得·溫寧克曾多次遊說美國政府,勸其放寬對中國的限制條例。ASML的光刻機裡面有美國的技術材料,並且中國是全球晶片需求量最大的市場,如果對中國全面封鎖,不但會讓荷蘭和美國的相關企業受到經濟損失,而且還會讓中國加速開發自主技術裝置,從而在未來替換掉進口產品。ASML 壟斷了全球近乎90%的光刻機市場,而EUV市場則是由ASML完全統治。根據ASML的對華業務顯示,在2024年,ASML依然與中國市場建立了大約50億歐元的貿易輸出。根據荷蘭科技專家馬克·海金克表示,中國境內有800多台光刻機裝置,其中有一半都在中國企業的手中。根據產業推算,美國的出口限制並不會對ASML造成致命的經濟影響,但是卻會激發起中國企業的發展動力,先攻克過時的技術,然後直接向最先進的技術進發。03重塑產業鏈中國的晶片製造業是薄弱的環節,目前中國企業已經在後端製造裝置上實現了全流程的自主可控,下面就要解決在前端裝置上面存在的問題。根據Techinsights對華為產品的技術拆解顯示,華為最新的手機晶片依然延續了前幾代的國產7nm工藝,只是在設計上面進行了一定程度的最佳化調整,並未出現傳聞當中的國產5nm技術,也並沒有出現國產光刻機的製造工藝。現階段的中國晶片產業,在某些製造環節依然無法脫離海外裝置。#麒麟晶片ASML的第一任CEO弗裡茨·范霍特與第一任CTO馬丁·范登布林克曾經在美國製裁中國期間,來到中國上海進行技術訪問。據雙方在訪談中所述,中國的上海微電子公司雖然已經擁有了國產光刻機裝置,但是其被卡在了90nm節點,這與ASML的裝置差距巨大。#國產光刻機不過中國企業已經在開發更加先進的技術裝置,比如28nm浸潤式系統。但是在美國的制裁封鎖下,中國的光刻機將要付出更多的努力才能有所突破。在中國的光刻機業務沒有全面發展起來之前,ASML的裝置依然是中國市場所需的核心產品。ASML與中國市場的合作,本質上是技術全球化發展所推動的合作模式,海外的企業需要中國市場來銷售裝置獲取利潤,而中國企業需要海外的晶片裝置來製造產品,從而實現產業鏈的商業化發展。一旦切斷了這種合作供應的發展模式,不但對雙方的產業經濟造成影響,而且還會強行逼迫著中國企業去集合力量攻關困難,從而在未來形成一條獨屬於中國的國產晶片供應鏈,成為全球晶片產業的獨行軍,將來自於中國的技術產品蔓延到世界各地。 (逍遙漠)
華為昇騰910D晶片:中外AI晶片橫縱對比,從技術封鎖到生態突圍
提醒:更新下載,已領請忽略!《伺服器基礎知識全解終極版(第二版)》(含PPT和PDF)完成更新,請購買過“伺服器基礎知識全解(終極版)”和“架構師技術全店資料打包彙總(全)”的讀者,請在微店留言獲免費取更新。伺服器基礎知識全解終極版(第二版)(共227頁),內容圖文並茂,由淺入深,介紹全面,是世面罕見的伺服器學習資料,內包括伺服器基礎知識、CPU、記憶體、GPU、硬碟、智能網路卡等9個章節。本次主要更新內容:1、CPU更新(Intel/AMD架構演進,國產CPU架構)2、GPU更新(輝達GPU架構,從Fermi到Hopper,Rubin Ultra)3、記憶體技術、操作系統、儲存技術等更新4、已知問題修正5、更新內容40+頁PPT——————  正文開始  ——————在人工智慧晶片領域,華為昇騰910D晶片的問世備受矚目。作為昇騰系列的新成員,昇騰910D在技術和參數方面展現出諸多獨特優勢,無論是與910其他規格晶片橫向對比,還是與國產同類晶片以及國外主流產品較量,都有著可圈可點之處 。一、昇騰910D對比910晶片的優勢(一)架構與計算能力升級昇騰910D採用了最佳化後的自研架構,相比早期的昇騰910B,在架構層面進行了深度改良。例如,通過精簡約30%的冗餘電路 ,讓晶片的運算效率大幅提升,半精度算力達到320 TFLOPS。而昇騰910B的半精度算力遠低於這一數值,使得昇騰910D在處理大規模矩陣運算、複雜神經網路模型訓練時,能夠更加高效快速地完成任務。(二)先進的散熱與功耗管理昇騰910D搭載了先進的液冷散熱技術,支援晶片在45℃高溫下仍能全速運行,功耗卻僅為350W。反觀昇騰910C,可能在散熱技術上相對傳統,導致其在高負載執行階段溫度升高,影響晶片性能發揮,且功耗較高。(三)叢集互聯性能提升昇騰910D每秒能搬運4TB資料,實現晶片間的高速通訊,使得多晶片並聯組成的叢集算力密度提升5倍 。相比之下,昇騰910其他規格晶片在叢集協作時,資料傳輸速度和協同效率較低。這種強大的叢集互聯性能,讓昇騰910D在支撐大型AI叢集運算,如文心一言這樣的大語言模型訓練時,能顯著縮短訓練周期,提高模型迭代速度。二、昇騰910D對比國產同類晶片分析1、寒武紀思元370算力:思元370最大算力高達256TOPS(INT8)。昇騰910D目標性能參數對標NVIDIA H100的2000 BF16 TFLOPS,在半精度算力上優於思元370。晶片架構:思元370採用MLUarch03架構,昇騰910D則基於自研昇騰架構。生態系統:寒武紀有自己的軟體生態體系,支援主流深度學習框架。華為昇騰有MindSpore框架,與昇騰晶片深度繫結。2、燧原科技雲燧T10算力與應用場景:雲燧T10適用於雲端推理場景,提供低延遲、高能效的推理服務。昇騰910D專注於大模型訓練與高效推理場景,在大規模資料處理和複雜模型訓練方面更具優勢。硬體架構:燧原科技有自己獨特的晶片架構設計,而昇騰910D採用多晶片整合(chiplet)技術,通過最佳化計算單元和互聯架構提升性能。生態系統:燧原科技建構了配套的軟體系統,昇騰910D所在的昇騰系列也有更廣泛的合作生態。3、崑崙芯AI加速卡R200算力性能:崑崙芯AI加速卡R200基於崑崙芯2代AI晶片,專為深度學習、機器學習演算法的雲端和邊緣端計算設計。昇騰910D在算力規模和針對大模型訓練的最佳化上更為突出。生態適配:崑崙芯適用於多種主流框架和演算法模型,昇騰910D僅有MindSpore框架和最佳化,在華為生態及相關合作場景中會有優勢。4、天數智芯天垓100 GPGPU通用計算能力:天垓100 GPGP可適配主流CPU晶片/伺服器廠商,支援國內外主流軟硬體生態和各種深度學習框架等。性能特點:天垓100在通用計算方面表現良好,昇騰910D則在AI大模型訓練和推理的特定性能指標上有更高的追求。5、摩爾執行緒MTT S4000性能與功耗:單張MTT S4000性能不到昇騰910B的1/3,功耗還更高。昇騰910D在性能和能效比上相對更優。應用場景與生態:MTT S4000主要用於摩爾執行緒智算中心全端解決方案,支援CUDA零成本轉譯。昇騰910D依託華為生態,在智能駕駛、醫療影像分析等領域有深入應用。6、壁仞科技BR106B/BR106C功耗與性能:BR106B峰值功耗300W,BR106C峰值功耗150W。昇騰910D通過先進封裝與液冷散熱技術,在高算力下的功耗控制更優,且性能目標更高。技術特點:壁仞科技基於自研的Blink技術,實現卡間高速互聯。昇騰910D也在叢集互聯能力上有大幅提升,每秒能搬運4TB資料,實現晶片間的高速通訊。7、阿里平頭哥倚天710應用場景:倚天710採用5nm工藝,主要用於阿里雲資料中心,是業界性能最強的ARM伺服器晶片。昇騰910D專注於AI領域的大模型訓練與推理,應用場景更聚焦。晶片功能:倚天710在伺服器計算方面有優勢,昇騰910D在AI計算的專業能力上更為突出,擁有專為AI演算法最佳化的架構和計算單元。8、海光K100 AI版算力精度:海光K100 AI版在FP32模式下峰值算力為49T,在BF16/FP16模式下峰值算力為192T。昇騰910D的半精度算力目標對標NVIDIA H100,高於海光K100 AI版。生態系統:海光DCU的DTK軟體棧相容CUDA等生態,昇騰910D有MindSpore框架及相關最佳化生態,兩者在生態建設上各有特點。三、昇騰910D對比國外主流產品的優勢(一)性能參數優勢以輝達H100為例,昇騰910D在多個性能參數上實現超越。昇騰910D半精度算力達320 TFLOPS,較H100的256 TFLOPS提升25% ;功耗僅350W,較H100的700W降低50% 。在叢集方案上,昇騰910D通過5塊晶片並聯形成“超級電腦”,算力密度提升5倍,在文心一言訓練中縮短周期27% ,自動駕駛模型迭代速度提升1.8倍 ,展現出強大的計算實力和高效的運算能力,打破了國外主流產品在性能上的領先局面。(二)成本優勢昇騰910D在成本方面具備顯著優勢,其單價約14.5萬元,較輝達H100的24萬元降低40% 。此外,昇騰910D採用的液冷系統採購成本較傳統風冷降低20% 。對於大規模採購晶片用於資料中心建設和AI業務開展的企業來說,昇騰910D能夠在保證高性能的同時,大幅降低硬體採購成本和後期營運成本,提高企業的經濟效益,增強市場競爭力。(三)本土最佳化與適應性昇騰910D針對中文NLP任務進行了專門最佳化,文言文翻譯精準率比H100高12% 。在國內的應用環境中,對中文語言處理的最佳化使昇騰910D更貼合本土企業和使用者的需求,在處理中文文字相關的AI任務,如智能客服、文字生成、語言翻譯等方面,能夠提供更精準高效的服務。同時,在面對國內複雜的網路環境和資料安全要求時,昇騰910D基於國內供應鏈和技術體系,能更好地滿足資料安全和本地化部署的需求。(四)910D與國外AI晶片能力對比1、輝達H100算力:輝達H100的BF16算力約為2000 TFLOPS。昇騰910D目標性能參數對標輝達H100的2000 BF16 TFLOPS,從單晶片性能來看可能落後於輝達的Blackwell B200和Blackwell Ultra B300 GPU,但華為通過CloudMatrix 384超節點技術,可讓昇騰910D在與基於輝達當前Blackwell及未來Rubin架構GPU的計算單元競爭中佔據一席之地。晶片架構:H100基於Hopper架構,在大規模平行計算和深度學習方面有優勢。昇騰910D採用多晶片整合(chiplet)技術,通過最佳化計算單元和互聯架構,減少訊號傳輸延遲。生態系統:輝達的CUDA生態已經統治了全球90%的AI開發者,生態系統成熟且完善。華為的昇騰生態仍在建構之中,不過華為聯合DeepSeek等開源大模型企業,通過演算法最佳化降低對硬體製程的依賴,並且昇思MindSpore框架也在不斷髮展完善。2、輝達A100算力:A100的性能在當時也是非常強大的,適用於大規模AI訓練與推理,但具體算力指標與昇騰910D的目標對標H100的2000 BF16 TFLOPS有所不同。晶片架構:基於Ampere架構,在深度學習演算法上有最佳化。昇騰910D的架構則是針對大模型訓練與高效推理場景進行了專門設計,採用多層堆疊封裝技術等以提升能效比。生態系統:同樣依託CUDA生態,軟體支援和開發者社區龐大。昇騰910D所在的昇騰生態在不斷髮展,通過與國內企業和科研機構合作,拓展應用場景和軟體適配。3、AMD Instinct MI300系列算力與架構:首款CPU+GPU異構晶片,專為生成式AI和高性能計算最佳化,在HBM視訊記憶體容量等方面有優勢。昇騰910D專注於AI領域的大模型訓練與推理,採用自研昇騰架構,通過最佳化計算單元和互聯架構提升性能。生態系統:AMD不斷完善其軟體生態,以挑戰輝達在資料中心市場的地位。昇騰910D有昇思MindSpore框架及相關最佳化生態,在國內資料中心等場景的部署有一定優勢。4、英特爾Habana Gaudi2算力:針對AI訓練的ASIC晶片,對標輝達A100,在深度學習訓練任務上有不錯的表現。昇騰910D目標對標輝達H100,在算力規模和性能最佳化方向上有所不同。架構特點:採用獨特的架構設計,最佳化了AI訓練中的計算流程。昇騰910D採用多晶片整合和多層堆疊封裝技術,結合液冷散熱系統,提升能效比和穩定性。生態系統:英特爾建構了相應的軟體生態來支援晶片的應用。昇騰910D所在的昇騰生態通過與國內企業合作,在智能駕駛、醫療影像分析等領域有深入應用。5、GoogleTPU v4算力與應用:專用ASIC晶片,擅長大規模矩陣運算,主要支撐Google Cloud AI服務。昇騰910D面向大模型訓練與高效推理場景,在中國的三大電信營運商、網際網路頭部企業的資料中心有規模化部署。架構特性:採用專門的架構來加速矩陣運算和深度學習演算法。昇騰910D基於自研昇騰架構,通過最佳化計算單元和互聯架構,實現高性能和低延遲。6、Cerebras Systems Wafer Scale Engine(WSE-3)算力:基於整片晶圓的超大晶片,算力達百億億次等級,專攻大模型訓練。昇騰910D目標性能對標輝達H100,通過多晶片整合和最佳化架構來提升算力。架構與應用:其架構專為大模型訓練設計,有獨特的計算單元和互聯方式。昇騰910D通過CloudMatrix 384超節點技術等,建構大規模計算單元,適用於大模型訓練和多種AI應用場景。7、Graphcore Bow IPU架構特點:採用3D封裝技術,專為大規模平行計算設計,適合推薦系統與NLP任務。昇騰910D採用多層堆疊封裝技術,最佳化計算單元和互聯架構,適用於大模型訓練和推理等多種AI場景。生態與應用:在歐洲及一些特定領域有應用,建構了相應的軟體生態。昇騰910D在中國市場有廣泛應用,通過昇思MindSpore框架和生態合作,在智能駕駛、醫療影像分析等領域有優勢。8、Tenstorrent Grayskull/Elden架構特性:基於RISC - V架構的可擴展AI晶片,支援動態資料流處理。昇騰910D基於自研昇騰架構,採用多晶片整合和最佳化的互聯架構,以滿足大模型訓練和推理的高性能需求。應用場景:在一些AI應用場景中提供計算支援。昇騰910D專注於大模型訓練與高效推理,在中國的資料中心、智能駕駛等領域有明確的應用方向和優勢。華為昇騰910D晶片憑藉在技術優勢,在AI晶片領域嶄露頭角。無論是與同系列晶片對比,還是在國產同類晶片以及國外主流產品的競爭中,都有望推動中國乃至全球AI產業的發展與變革。 (架構師技術聯盟)
李稻葵:這兩大因素決定美對華技術封鎖將反噬其身
中國知名學者、清華大學中國經濟思想與實踐研究院院長李稻葵27日在京表示,今年是中國經濟增長轉暖的一年,暖意不僅體現在統計數字上,也將更多體現在民眾的實感上。而美國在技術領域對中國的限制,不可能阻擋中國科技的發展,甚至會適得其反,促進中國科技的進步。27日,李稻葵出席中國公共外交協會舉辦的“臨甲7號沙龍”專題吹風會,就兩會精神與中國經濟政策等話題與中外記者展開互動交流時作出上述判斷。清華大學中國經濟思想與實踐研究院院長 李稻葵(周騰 攝)談及2025年《政府工作報告》列出今年工作的十大任務,李稻葵認為,從經濟增長角度而言,有兩項任務代表了未來若干年經濟政策的新方向。一是盡全力提升內需,即十大任務裡的首位:“大力提振消費、提高投資效益,全方位擴大國內需求”;二是加快科技創新,推動新質生產力。《政府工作報告》首提“投資於人”意義重大李稻葵注意到,今年政府工作報告首次提出“投資於人”。報告提出,推動更多資金資源“投資於人”、服務於民生,支援擴大就業、促進居民增收減負、加強消費激勵,形成經濟發展和民生改善的良性循環。李稻葵分析認為:狹義的“投資於人”指公共財政向民生領域傾斜,廣義則是全社會資源聚焦於提升百姓的獲得感、幸福感。他列舉了“投資於人”在教育領域的應用:中國老百姓非常關注下一代的高等教育,2024年,全國高校在校生有4700多萬人,毛入學率為60.2%,“但這個比例還不夠,未來若干年‘投資於人’的具體的一個方向就是要多辦大學”。李稻葵認為,現在上海、浙江、廣東等地出現了企業家捐贈辦學的現象,通過本地辦學既滿足民眾教育需求,又為區域經濟儲備人才,這正是“投資於人”的應用實踐。消費提振政策密集發力 多項政策或將加碼李稻葵觀察到,在全國兩會結束後10天左右,中共中央辦公廳、國務院辦公廳於3月16日印發《提振消費專項行動方案》,這種政策響應速度讓“促銷費”的效應值得期待。“今年很多政策會不會加碼?很有可能。”李稻葵指出,一季度過後,4月初前後將是評估消費、物價、房地產市場和股市等表現的關鍵觀察點。外界可以從消費回升速度、物價水平、重點城市樓市交易量以及資本市場表現等維度來進行觀測,是否出台額外的政策支援將在很大程度上取決於這些關鍵經濟指標的運行軌跡。現在國家的政策儲備空間很充裕,李稻葵表示,目前中國的國債規模佔GDP的比例約為25%,這個比例低於全球各大主要國家,中央財政有充分的加槓桿空間。以舊換新政策加碼既能撬動消費又可增加稅收,重點城市購房限制逐步鬆綁預期強烈,政府預計將出台更有針對性的措施來刺激消費、促進創新。“2025年是中國經濟增長轉暖的一年。這個轉暖主要體現在我們老百姓的感受,而不僅僅是統計數字,是實際感受轉暖的一年,這在公共財政收入上也會得到體現。”李稻葵如是說。美國無法阻擋中國科技創新近年來,美國針對中國高科技企業實施了一系列打壓措施,外界普遍關注技術封鎖對中國科技發展的影響。在李稻葵看來,某些領域可能面臨短期挑戰,但整體影響可能適得其反,實際上可能推動中國技術進步,華為、深度求索(DeepSeek)的突破就是明證。某些美國政策制定者並不真正理解科技發展規律,也不清楚美國自身利益所在,他們出台的這些政策正在反噬自身,扼殺了晶片、人工智慧等領域通用技術的使用者基礎。作出這一判斷基於兩大因素:一是基礎科學研究的全球共享屬性。二是中國在技術商業化方面的人才規模優勢。“當今世界基礎研究是沒有任何溝通障礙的,基礎研究是全世界通用的。”包括英美等國在內的科學家們都有在全球分享成果的內在動力,沒人能阻斷這種知識流動,這也是科學界的普遍共識。而在技術轉化層面,中國龐大的工程師隊伍形成獨特優勢。當美國幾年前切斷供應後,中國很快就自主開發出來。中國憑藉龐大的工程師、架構師和程式設計師隊伍,建構替代方案並非難事。“在科技領域,當‘靶子’不再移動,後來者的追趕攻關只會越來越快。”李稻葵如是說。 (直新聞)