#利用率
三星產能利用率,僅為60%?
三星電子的晶圓代工業務正逐步恢復開工率。預計隨著尖端工藝和核心工藝晶圓投入量的增加,與去年相比,虧損將有所減少。據業內人士19日透露,三星電子今年上半年晶圓廠產能利用率預計平均約為60%,較去年下半年的50%提高了約10個百分點。由於未能為3奈米等尖端工藝爭取到主要客戶,三星電子的晶圓代工部門盈利能力大幅下滑。去年第一季度和第二季度,該非儲存器部門的營業虧損估計約為2兆韓元。然而,在去年第三季度和第四季度,該公司逐步復甦,虧損縮小至約1兆韓元。這得益於其現有核心工藝(如4奈米和8奈米工藝)晶圓投入量的增加,以及對傳統(成熟)8英吋工藝進行精簡的努力,包括減少一些低利潤產品。尤其值得一提的是,自去年年底以來,該公司已開始量產基於2奈米工藝的最新移動應用處理器“Exynos 2600”。該工藝的單晶圓良率預計約為50%。因此,三星電子晶圓廠的產能利用率總體呈現復甦態勢。預計今年上半年將達到60%左右,高於去年下半年的50%左右。三星電子也計畫將相關材料和零部件的訂單量提升至類似水平。一位半導體行業內部人士表示:“三星電子正在增加對代工廠的晶圓投入,因此今年的市場環境肯定會比去年好。”他還補充道:“由於其主要競爭對手台積電在尖端工藝方面面臨供應短缺,這對三星電子的代工廠來說是一個發展良機。”行業分析表明,三星電子的晶圓代工部門需要超過 80% 的開工率才能實現盈虧平衡。因此,三星電子可能需要通過穩定量產尖端工藝來贏得全球科技巨頭的信任。去年7月,三星電子與特斯拉簽署了一份價值22兆韓元的AI6晶片委託生產合同,這已經為此奠定了基礎。 (半導體芯聞)
突發!AI 算力資源利用率提升至 70%!華為發佈實現單卡同時承載多個 AI 工作負載
華為Flex:ai 技術架構解碼與國產算力產業鏈重構研究報告報告日期:2025 年 11 月23日核心結論:華為 Flex:ai 通過 "三層兩池一調度" 架構實現算力利用率從 35% 到 70% 的突破,其異構虛擬化技術將重構 AI 算力經濟模型,加速國產算力產業鏈的自主可控處理程序第一部分 產業困局:AI 算力的 "結構性浪費" 危機1.1 算力利用率的行業痛點1.1.1 全球算力資源浪費現狀行業資料顯示:全球 AI 算力資源平均利用率僅 30%-40%,超大規模資料中心閒置算力佔比達 62%典型場景浪費:推理場景:單個輕量推理任務獨佔整卡資源,視訊記憶體利用率常低於 20%訓練場景:模型訓練各階段算力需求波動達 5 倍以上,靜態分配導致資源空耗異構環境:多廠商硬體形成 "算力孤島",跨架構資源調度效率低下1.1.2 傳統調度模式的致命缺陷靜態繫結機制:任務生命周期內獨佔硬體資源,無法動態調整。架構相容問題:NVIDIA GPU 與國產 NPU 資源無法統一調度。調度顆粒度粗糙:以整卡為單位分配,缺乏精細化切分能力。1.1.3 算力成本的經濟壓力測試硬體成本:單張 NVIDIA A100 GPU 卡市場價約 15 萬元,8 卡伺服器採購成本超 150 萬元。營運成本:一台 8 卡 A100 伺服器日租金 4000 元,年營運成本達 146 萬元。效率損失:按 35% 利用率計算,企業每投入 1000 萬元算力成本,實際有效消耗僅 350 萬元。1.2 技術突圍的行業探索1.2.1 國際主流技術路線對比1.2.2 華為 "軟體補硬體" 的戰略選擇技術背景:先進製程受限導致單晶片性能差距,需通過系統級創新彌補戰略佈局:硬體層:昇騰晶片建構算力基礎系統層:Scale-up 超節點實現資源池化軟體層:Flex:ai 突破調度效率瓶頸協同效應:Atlas 950 超節點 + Flex:ai 使訓練效率提升 3 倍以上1.2.4 競品技術短板分析NVIDIA 生態鎖定:限制:vGPU/Run:ai 僅支援 NVIDIA 硬體,國產晶片適配需額外付費。成本:企業級許可年費達硬體成本的 30%。AMD 生態不完善:缺陷:缺乏統一調度平台,需與第三方工具整合(如 Kubeflow)。性能:跨卡調度延遲≥500μs(Flex:ai 為 200μs)。微軟區域限制:侷限:跨區域調度僅支援 Azure 雲環境,私有部署功能缺失。損耗:虛擬化性能損失達 8%-12%(Flex:ai≤3%)。第二部分 技術解碼:Flex:ai 的架構革命與核心創新2.1 整體技術架構解析2.1.1 "三層兩池一調度" 架構設計架構圖說明層級關係:自上而下分為 “管理層 - 控制平面 - 資料平面” 三層,底部為支撐性 “資源池”,形成 “三層兩池” 的核心結構,控制平面的 Hi Scheduler 為全域調度核心。模組功能:每個模組標註關鍵能力(如 “10% 粒度切分”“動態視訊記憶體壓縮”),明確技術落地細節。硬體適配:異構硬體資源池覆蓋 GPU/NPU/CPU 三類核心算力裝置,體現跨架構相容特性。性能指標:關鍵模組標註核心指標(如 “毫秒級調度”“算力損耗控制”),量化技術優勢。2.1.2 核心模組功能詳解2.1.2.1 控制平面核心元件1)Hi Scheduler 智能調度器毫秒級響應:任務調度延遲≤50ms智能演算法:融合強化學習的動態調度策略負載感知:即時監控資源使用率(採樣頻率 100ms / 次)2)異構硬體抽象層(HHAL)硬體適配:支援 NVIDIA CUDA、昇騰 CANN 等多架構介面標準化:提供統一的算力呼叫 API驅動管理:自動適配硬體驅動版本2.1.2.2 資料平面關鍵技術1)算力切分引擎切分粒度:10% 精度的虛擬算力單元分配演算法:基於任務優先順序的動態調整性能損耗:切分帶來的算力損耗≤3%2)視訊記憶體管理模組隔離機制:基於頁表虛擬化的視訊記憶體隔離分配單位:128MiB 整數倍視訊記憶體塊共享策略:支援跨任務視訊記憶體池化共享2.2 核心技術創新深度解析2.2.1 算力虛擬化三大突破突破一:精準切分技術(與上海交大聯合研發)技術原理:基於硬體性能計數器的算力感知實現方式:// 算力切分核心程式碼片段virtual_unit_t* create_virtual_unit(physical_card_t* card, float ratio){// 10%粒度校驗assert(ratio >= 0.1 && (int)(ratio*10) % 1 == 0);// 硬體資源預留card->reserve(ratio);// 建立虛擬單元returnnewvirtual_unit_t(card, ratio);}性能表現:單卡支援最多 10 個虛擬算力單元並行突破二:跨界聚合技術(與廈門大學聯合研發)技術路徑:RDMA 高速網路實現跨節點算力拉遠。延遲控制:跨節點算力呼叫延遲≤200μs。聚合能力:支援 1000 + 節點的異構算力池化。突破三:全域調度技術(與西安交大聯合研發)調度演算法:改進型遺傳演算法求解資源分配最優解。決策因子:任務優先順序、資源需求、負載狀態、硬體類型。調度效率:10000 任務叢集調度耗時≤2s。2.2.2 多卡均分調度技術解析2.2.2.1 兩種調度模式技術細節1) 視訊記憶體隔離模式技術特點:僅拆分視訊記憶體資源,算力按比例分配適用場景:低算力需求的推理任務配置示例:#kubectl命令列配置apiVersion: v1kind: Podmetadata:name:視訊記憶體隔離示例spec:containers:- name: ai-inferenceimage: tensorflow:latestresources:limits:volcano.sh/gpu-mem.128Mi: 1024  # 總視訊記憶體1024MiBvolcano.sh/gpu-card-count: 2     # 跨2張卡分配2)算顯隔離模式技術特點:同時拆分算力與視訊記憶體資源適用場景:訓練與推理混合負載配置示例:# 算顯隔離模式配置resources:limits:volcano.sh/gpu-mem.128Mi: 2048volcano.sh/gpu-core.percentage: 30  # 總算力30%volcano.sh/gpu-card-count: 3        # 跨3張卡分配2.2.2.2 調度約束與最佳化策略1)硬體約束:視訊記憶體分配必須為 128MiB 整數倍算力分配必須為 5% 整數倍多卡調度需位於同一 GPU 節點2)最佳化策略:裝箱調度:優先填充空閒資源集中的節點碎片回收:定期合併零散視訊記憶體塊(默認每 5 分鐘一次)優先順序搶佔:高優先順序任務可搶佔低優先順序資源2.2.3 異構算力管理技術2.2.3.1 多硬體架構適配方案2.2.3.2 硬體差異遮蔽機制指令集抽象:統一封裝不同硬體的計算指令記憶體模型適配:自動轉換異構記憶體訪問模式性能適配:根據硬體特性動態調整任務分配2.3 性能測試與技術對比2.3.1 核心性能指標測試資料2.3.2 與 Run:ai 技術深度對比2.3.2.1 技術架構差異硬體支援:Run:ai:僅支援 NVIDIA GPUFlex:ai:GPU/NPU/CPU 異構支援調度演算法:Run:ai:基於規則的靜態調度Flex:ai:強化學習動態調度資源池化:Run:ai:單叢集池化Flex:ai:跨叢集聯邦池化2.3.2.2 性能實測對比在千億參數大模型訓練場景下:硬體配置:64 張昇騰 910B(Flex:ai)vs 64 張 A100(Run:ai)訓練效率:Flex:ai 叢集完成訓練耗時 72 小時,Run:ai 叢集耗時 85 小時資源利用率:Flex:ai 69.8%,Run:ai 58.2%成本對比:按雲伺服器租金計算,Flex:ai 方案成本降低 42%2.4 技術白皮書核心參數2.4.1 相容性規範2.4.2 部署規格要求2.4.3 安全合規特性審計能力:全鏈路調度日誌留存≥180 天資料保護:支援視訊記憶體加密(AES-256)與聯邦學習隱私計算算力隔離等級:符合 ISO/IEC 27001 三級隔離標準儲存要求:分佈式儲存 IOPS≥10 萬(模型載入最佳化)網路要求:RDMA 網路頻寬≥100Gbps(跨節點調度)推薦叢集規模:32-1024 節點(支援彈性擴展)最小部署單元:1 台 2 卡伺服器(昇騰 310B/GPU A10)第三部分 GPU 虛擬化技術深度剖析3.1 GPU 虛擬化技術演進歷程3.1.1 技術發展四階段第一階段:整卡分配(2015 年前)技術特點:物理卡與任務直接繫結利用率:普遍低於 30%代表方案:Kubernetes 原生 GPU 調度第二階段:基於容器的分割(2015-2018)技術特點:基於 cgroups 的資源限制利用率:30%-40%代表方案:NVIDIA Docker第三階段:硬體輔助虛擬化(2018-2023)技術特點:GPU 硬體支援多虛擬機器共享利用率:40%-60%代表方案:NVIDIA vGPU、AMD MxGPU第四階段:智能池化調度(2023 年後)技術特點:軟體定義的異構算力池化利用率:60%+代表方案:Flex:ai、Run:ai3.1.2 關鍵技術指標演進3.2 Flex:ai 虛擬化技術實現原理3.2.1 算力虛擬化核心機制3.2.1.1 基於時間分片的算力調度調度周期:默認 10ms 一個調度周期分配演算法:加權公平佇列(WFQ)優先順序機制:支援 4 級優先順序調度3.2.1.2 算力隔離技術實現方式:基於硬體性能計數器的算力限制精度控制:±5% 的算力分配誤差衝突解決:任務爭搶資源時觸發優先順序仲裁3.2.2 視訊記憶體虛擬化技術解析3.2.2.1 視訊記憶體管理架構視訊記憶體虛擬化架構3.2.2.2 關鍵技術創新動態視訊記憶體壓縮壓縮演算法:自適應無失真壓縮(壓縮比 1.2-2.5 倍)觸發機制:視訊記憶體使用率超過 80% 時自動啟動性能影響:壓縮解壓耗時≤1ms跨卡視訊記憶體聚合實現方式:RDMA 基於記憶體的遠端視訊記憶體訪問訪問延遲:跨卡視訊記憶體訪問延遲≤50μs適用場景:大模型訓練的視訊記憶體擴展3.2.3 虛擬化性能損耗分析3.2.3.1 不同場景性能損耗測試3.2.3.2 損耗最佳化策略硬體輔助最佳化利用昇騰晶片的虛擬化加速指令NVIDIA GPU 的 MIG 技術協同軟體演算法最佳化預調度機制:提前預測任務資源需求批次處理:合併小額視訊記憶體分配請求3.3 虛擬化技術的行業應用價值3.3.1 推理場景的效率提升典型案例:某網際網路企業的圖像識別服務原有方案:100 張 GPU 卡支撐服務,利用率 32%最佳化方案:Flex:ai 虛擬化,50 張卡支撐同等負載效果:硬體成本降低 50%,響應延遲降低 20%3.3.2 訓練場景的資源最佳化典型案例:某 AI 公司的大模型訓練原有方案:64 張卡訓練,耗時 120 小時最佳化方案:Flex:ai 多工並行,同時訓練 3 個模型效果:資源利用率提升至 68%,單模型訓練成本降低 45%第四部分 產業鏈影響:重構國產算力生態格局4.1 對上游算力硬體產業的影響4.1.1 昇騰晶片生態的協同升級4.1.1.1 軟硬協同的技術優勢達文西架構適配:Flex:ai 深度最佳化昇騰晶片的算力調度性能提升資料:4.1.1.2 市場需求的拉動效應預測資料:Flex:ai 將帶動昇騰晶片 2026 年出貨量增長 80%應用擴展:從網際網路大廠向中小企業滲透場景延伸:醫療、製造等行業的算力需求啟動4.1.2 國產 GPU/NPU 產業的發展機遇4.1.2.1 相容適配帶來的市場空間適配計畫:Flex:ai 2026 年 Q1 將支援寒武紀、海光等國產晶片利多效應:降低國產晶片的生態適配成本競爭格局:從單一硬體比拚轉向系統級解決方案競爭4.1.2.2 技術迭代的推動作用倒逼升級:促使國產晶片廠商提升虛擬化支援能力標準共建:聯合制定國產算力虛擬化技術標準生態協同:形成 "晶片 - 軟體 - 應用" 的協同創新體系4.2 對中游基礎設施產業的影響4.2.1 AI 伺服器產業的結構調整4.2.1.1 硬體配置的最佳化方向伺服器設計:從 "多卡密集型" 向 "高效調度型" 轉變配置案例:傳統伺服器:8 卡全配置,功耗 5000W最佳化伺服器:4 卡 + Flex:ai,功耗 3000W,性能相當4.2.1.2 市場競爭的新焦點競爭要素:從硬體配置比拚轉向 "硬體 + 軟體" 解決方案能力頭部廠商應對:浪潮資訊:推出 Flex:ai 最佳化的 AI 伺服器系列華為:Atlas 950 超節點與 Flex:ai 深度整合4.2.2 雲服務產業的成本革命4.2.2.1 算力服務定價模式重構傳統模式:按卡 / 小時計費創新模式:按實際使用的算力百分比計費成本對比:某雲廠商 AI 算力服務定價4.2.2.2 雲廠商的競爭策略調整華為云:推出 "Flex 算力池" 服務,按實際使用量計費阿里云:加速適配 Flex:ai,重構算力調度平台騰訊云:聯合華為共建異構算力雲服務4.3 對下遊行業應用的賦能效應4.3.1 金融行業的算力最佳化實踐4.3.1.1 量化交易場景應用案例:某頭部券商的量化策略訓練原有困境:100 張 GPU 卡,利用率 35%,策略迭代周期 7 天最佳化方案:Flex:ai 虛擬化,50 張卡,利用率 68%效果:迭代周期縮短至 3 天,年成本節省 2000 萬元4.3.1.2 風險控制場景應用案例:某銀行的智能風控模型原有方案:推理服務佔用 60 張 GPU 卡最佳化方案:Flex:ai 多工並行,25 張卡支撐效果:硬體投入降低 58%,響應時間從 200ms 降至 80ms4.3.2 醫療行業的 AI 應用普及4.3.2.1 病理診斷場景典型案例:瑞金醫院 RuiPath 病理大模型項目背景:103 萬張病理切片資料訓練技術方案:16 張昇騰 910B+Flex:ai效果:算力利用率從 40% 提升至 70%,診斷精準率提升至 98.5%4.3.2.2 醫學影像分析應用價值:降低中小醫院 AI 影像裝置的投入門檻成本分析:單台影像分析裝置成本從 500 萬元降至 200 萬元普及預期:2026 年基層醫院 AI 影像裝置普及率提升 50%4.3.3 製造業的智能化升級4.3.3.1 工業質檢場景應用案例:某汽車廠商的零部件質檢原有方案:人工質檢,精準率 92%,效率低最佳化方案:AI 質檢 + Flex:ai 算力調度效果:精準率提升至 99.2%,算力成本降低 40%4.3.3.2 生產最佳化場景應用價值:實現製造過程的即時 AI 最佳化技術支撐:Flex:ai 的低延遲調度滿足即時性需求經濟效益:某電子廠商生產效率提升 15%,不良率降低 30%4.4 對開源生態與標準制定的影響4.4.1 魔擎社區的生態建構4.4.1.1 開源計畫與路線圖開源時間:2025 年 11 月 21 日同步開源版本規劃:V1.0:核心調度與虛擬化功能V1.5:增加多叢集管理能力(2026Q1)V2.0:支援邊緣算力調度(2026Q3)4.4.1.2 生態參與方預期核心參與:華為、上海交大、西安交大、廈門大學潛在參與:硬體廠商:寒武紀、海光資訊、兆易創新軟體廠商:寶蘭德、東方通、中科創達使用者企業:金融、網際網路、製造行業龍頭4.4.2 國產算力標準的制定推動4.4.2.1 技術標準的形成路徑基礎:Flex:ai 的技術架構與介面規範過程:聯合高校、企業、科研機構共同制定目標:形成 AI 算力調度的國家標準4.4.2.2 標準的行業價值打破壁壘:解決不同廠商算力裝置的相容問題降低成本:減少企業的異構算力適配成本提升競爭力:形成國產算力的技術話語權第五部分 應用案例:Flex:ai 的產業落地實踐5.1 網際網路行業:大模型訓練與推理最佳化5.1.1 某頭部網際網路企業的應用實踐5.1.1.1 項目背景業務需求:支撐 3 個千億參數大模型的訓練與推理原有設施:512 張 A100 GPU 卡,利用率 32%面臨問題:算力成本過高,模型迭代周期長5.1.1.2 解決方案算力池化改造:部署 Flex:ai 建構共享算力池實現 GPU 與昇騰 NPU 混合調度調度策略最佳化:訓練任務:夜間高優先順序調度推理任務:日間動態資源分配資源監控體系:即時監控算力利用率自動調整任務資源分配5.1.1.3 實施效果5.2 金融行業:智能風控與量化交易5.2.1 某股份制銀行的智能風控系統5.2.1.1 業務痛點風控模型:200 + 個機器學習模型算力需求:推理峰值需求波動大(5-20 倍)成本壓力:硬體投入年增長 30%5.2.1.2 技術實現多卡均分調度配置:# 風控模型推理任務配置apiVersion: batch/v1kind: Jobmetadata:name: risk-control-inferencespec:template:spec:containers:- name: inference-engineimage: risk-model:v2.0resources:limits:volcano.sh/gpu-mem.128Mi: 4096volcano.sh/gpu-core.percentage: 20volcano.sh/gpu-card-count: 4restartPolicy: Never動態擴縮容策略:高峰時段(9:00-17:00):算力分配提升至 80%低谷時段(0:00-6:00):算力分配降至 20%5.2.1.3 應用成效資源利用率:從 35% 提升至 68%成本節省:年算力成本降低 4500 萬元響應速度:風控決策延遲從 300ms 降至 120ms5.3 醫療行業:病理診斷與醫學影像分析5.3.1 瑞金醫院多模態病理大模型項目5.3.1.1 項目挑戰資料規模:103 萬張病理切片,資料量達 50TB算力需求:模型訓練需大規模算力支撐技術要求:保證診斷精度的同時降低算力成本5.3.1.2 技術方案算力架構設計:硬體:16 張昇騰 910B GPU 卡軟體:Flex:ai + 昇騰 CANN+MindSpore訓練最佳化策略:視訊記憶體隔離模式:拆分視訊記憶體資源支援多工平行算力切分:10% 粒度分配滿足不同切片分析需求5.3.1.3 實施成果訓練效率:16 張卡完成同等規模訓練(原需 32 張)診斷精度:覆蓋 19 個癌種,精準率達 98.5%臨床價值:病理診斷時間從 30 分鐘縮短至 5 分鐘5.4 製造業:工業質檢與生產最佳化5.4.1 某汽車零部件企業的 AI 質檢系統5.4.1.1 業務需求質檢對象:汽車發動機零部件,日均 10 萬件檢測要求:識別 0.1mm 級缺陷,精準率≥99%算力困境:推理任務波動大,資源浪費嚴重5.4.1.2 解決方案邊緣 - 雲端協同架構:邊緣端:部署輕量推理模型,即時檢測雲端:Flex:ai 管理中心算力,模型迭代資源調度策略:生產高峰:分配 70% 算力支撐推理生產低谷:分配 80% 算力用於模型更新5.4.1.3 應用效果檢測效率:從人工 2 秒 / 件提升至 0.1 秒 / 件缺陷識別率:從人工 92% 提升至 99.2%算力成本:年節省硬體投入 800 萬元5.5 能源行業:智能電網調度系統5.5.1 項目實施路徑試點階段(1-3 個月):部署 8 卡昇騰伺服器 + Flex:ai,覆蓋 10 個變電站驗證負荷預測模型算力適配性推廣階段(4-6 個月):擴容至 128 卡叢集,接入 1000 + 電力終端實現跨省算力調度最佳化階段(7-12 個月):接入新能源資料(風電 / 太陽能)調度演算法迭代至強化學習版本5.5.2 核心技術創新點時空協同調度:結合電網負荷時空分佈特徵,動態調整算力配比故障自癒機制:單節點故障時,Flex:ai 50ms 內完成算力遷移節能最佳化:非高峰時段自動降低算力至 20%,年節電超 120 萬度第六部分 開源生態:Flex:ai 的生態建構與發展6.1 魔擎社區的開源架構與規劃6.1.1 社區組織架構魔擎社區組織架構6.1.2 開源路線圖與版本規劃6.1.2.1 短期規劃(2025Q4-2026Q2)V1.0(2025.11):核心功能開源算力切分與池化基礎調度演算法昇騰 / NVIDIA 適配V1.2(2026.02):功能增強多叢集管理高級監控功能更多國產晶片適配V1.5(2026.05):生態擴展第三方工具整合行業解決方案範本完善的 API 文件6.1.2.2 長期規劃(2026Q3-2027)V2.0(2026.09):邊緣算力支援邊緣 - 雲端協同調度低功耗最佳化離線模式支援V3.0(2027.06):智能自治AI 驅動的自動調度故障自修復資源需求預測6.2 社區生態的建構策略6.2.1 開發者生態培育6.2.1.1 開發者支援計畫培訓體系:線上課程:Flex:ai 技術入門到精通線下 workshop:每月舉辦行業專場認證體系:Flex:ai 架構師 / 開發者認證激勵機制:貢獻者獎勵:程式碼貢獻者可獲得華為雲資源創新大賽:舉辦 Flex:ai 應用創新競賽社區領袖:培養行業技術帶頭人6.2.1.2 開發工具鏈支援整合開發環境:提供 Flex:ai 外掛偵錯工具:即時監控算力調度狀態範本庫:行業應用的配置範本6.2.2 合作夥伴生態建設6.2.2.1 硬體合作夥伴計畫適配支援:為硬體廠商提供適配指南聯合測試:共建相容性測試平台解決方案:聯合推出 "硬體 + 軟體" 套餐6.2.2.2 行業解決方案合作金融行業:聯合銀行、證券企業開發解決方案醫療行業:與醫院、醫療裝置廠商共建 AI 醫療平台製造業:與工業企業合作開發智能製造方案6.3 開源生態的行業價值6.3.1 降低 AI 算力使用門檻技術普惠:中小企業可低成本使用先進算力調度技術學習成本:開源文件與社區支援降低技術學習難度部署成本:相比商業方案,部署成本降低 70%6.3.2 加速技術創新與迭代協同創新:全球開發者共同參與技術改進快速迭代:社區反饋驅動版本快速更新技術擴散:核心技術向全行業普及第七部分 未來展望:AI 算力的 "精耕時代"7.1 技術演進方向7.1.1 調度演算法的智能化升級7.1.1.1 AI 驅動的調度決策技術路徑:融合大語言模型的調度策略生成實現目標:資源需求預測準確率≥90%調度最佳化目標自動適配業務場景故障預測與提前調度7.1.1.2 跨域調度技術發展技術方向:跨資料中心調度邊緣 - 雲端協同調度算力與儲存協同調度7.1.2 虛擬化技術的性能突破7.1.2.1 硬體輔助虛擬化升級晶片支援:下一代昇騰晶片將整合專用虛擬化加速單元性能目標:虛擬化損耗降至 1% 以下7.1.2.2 記憶體計算融合技術創新:視訊記憶體與記憶體的統一池化管理應用價值:解決大模型訓練的記憶體牆問題7.2 行業發展趨勢7.2.1 算力成本結構重構7.2.1.1 定價模式變革發展方向:從按硬體計費轉向按算力效用計費計費維度:實際算力使用量任務完成質量響應時間保障7.2.1.2 算力交易市場形成市場形態:基於 Flex:ai 的算力交易平台交易模式:空閒算力拍賣、算力期貨等創新模式7.2.2 AI 算力的普惠化發展7.2.2.1 中小企業 AI 賦能技術支撐:Flex:ai 降低中小企業 AI 應用門檻預期效果:2027 年中小企業 AI 滲透率提升至 60%7.2.2.2 行業應用深化發展方向:從網際網路行業向傳統行業深度滲透重點領域:醫療、教育、農業、製造等7.3 面臨的挑戰與應對策略7.3.1 技術挑戰與解決方案7.3.1.1 異構相容性難題挑戰:不同廠商硬體的深度適配應對:建立統一的硬體抽象層社區共建適配標準提供適配測試工具7.3.1.2 大規模叢集調度複雜性挑戰:萬級節點叢集的調度效率應對:分層調度架構區域化資源管理平行調度演算法7.3.2 生態競爭與合作7.3.2.1 國際技術競爭競爭格局:與 NVIDIA vGPU、Run:ai 等方案的競爭應對策略:強化異構支援優勢加速開源生態建設深化行業應用適配7.3.2.2 標準制定競爭挑戰:國際算力調度標準的話語權爭奪應對:主導國內標準制定積極參與國際標準組織推動開源標準國際化第八部分 結論:Flex:ai 引領算力革命8.1 技術突破的核心價值8.1.1 效率革命:從粗放使用到精細管理算力利用率:實現從 35% 到 70% 的翻倍提升資源配置:從靜態繫結到動態池化管理模式:從硬體為中心到應用為中心8.1.2 成本革命:重構 AI 算力經濟模型直接成本:企業算力成本降低 40%-60%間接效益:模型迭代速度提升 80% 以上產業影響:啟動千億級閒置算力資源8.2 對國產算力產業的戰略意義8.2.1 技術自主可控的重要突破打破壟斷:減少對 NVIDIA 調度技術的依賴建立標準:形成國產算力調度技術體系生態建構:帶動產業鏈上下游協同發展8.2.2 產業競爭力的全面提升技術優勢:形成 "軟體 + 硬體" 的系統級競爭力市場機遇:加速國產算力裝置的規模化應用國際影響:提升中國在 AI 算力領域的話語權8.3 未來發展的關鍵方向8.3.1 技術持續創新聚焦方向:調度演算法智能化、虛擬化性能最佳化目標願景:實現算力利用率 90% 的終極目標8.3.2 生態協同發展核心策略:開源社區為核心,聯合產業鏈各方發展目標:建構全球領先的 AI 算力調度生態8.3.3 行業深度賦能重點領域:製造業、醫療、金融等實體經濟最終價值:以算力效率提升推動產業數位化轉型結語:華為 Flex:ai 的發佈,不僅是一項技術突破,更是 AI 算力產業發展的重要里程碑。它標誌著 AI 算力從 "規模擴張" 進入 "效率提升" 的精耕時代,為國產算力產業鏈提供了突破瓶頸的關鍵路徑。在硬體受限的背景下,Flex:ai 通過軟體創新實現的 "算力倍增" 效應,將加速 AI 技術的普惠化處理程序,為中國 AI 產業的高品質發展注入強勁動力。 (AI雲原生智能算力架構)
中芯國際:承接大量急單!
11月18日消息,中芯國際表示,該公司的產線非常滿,三季度產能利用率達到95.8%,訂單很多,產線供不應求。四季度指引沒有大的躍升的原因之一是手機市場現在儲存器特別緊缺,價格也漲得非常厲害。“中芯國際承接了大量模擬、儲存包括 NOR/NAND Flash、MCU 等急單,為保障交付,主動將部分非緊急手機訂單延後,這也使得手機業務佔比短期有所下降。”該公司稱。據中芯國際財報顯示,該公司前三季度營收約495.1億元,同比增加18.2%;歸屬於上市公司股東的淨利潤約38.18億元,同比大增41.1%;毛利率為 23.2%,同比增長5.6個百分點。單看第三季度,中芯國際營業收入171.62億元,環比增長6.9%;實現淨利潤15.17億元,同比增長43.1%;毛利率為25.5%,環比上升4.8個百分點;產能利用率上升至95.8%,環比增長3.3個百分點。財報顯示,中芯國際的產能利用率進一步提升,從第二季度的92.5%上升至95.8%,折合8英吋標準邏輯月產產能達到百萬片。整體來看,儲存的影響是雙向的。對當前是提拉訂單,對來年是看不清。據觀察,儲存供應短缺或過剩5%就有可能給價格帶來成倍的影響。目前行業供應存在缺口,預計高價位態勢將持續。此外,NOR Flash、NAND Flash及MCU等產品驗證周期長、替代門檻高。即便有新廠商嘗試進入,從流片到規模化量產也需至少16個月。這意味著在未來一段時間內,現有供應商的市場地位將保持穩定,難以被快速替代。在11月4日舉行的業績說明會上,中芯國際聯合首席執行官趙海軍表示,公司產量上升“主要是因為產業鏈切換加速進行,以及管道還在備貨補庫存,公司積極配合客戶保證出貨”。晶圓平均銷售單價環比增長3.8%,是由於產品組合變化,製程複雜的產品出貨增加。趙海軍提到,四季度雖然是傳統淡季,客戶備貨有所放緩,但產業鏈切換迭代效應持續,淡季不淡。因此,公司給出的四季度收入指引為環比持平到增長 2%;產線整體上繼續保持滿載;毛利率指引為 18%到20%,與三季度指引相比持平。據此預測,公司全年銷售收入預計超過90億美元。 (半導體技術天地)
中芯國際:接大量急單!
11月18日消息,中芯國際表示,該公司的產線非常滿,三季度產能利用率達到95.8%,訂單很多,產線供不應求。四季度指引沒有大的躍升的原因之一是手機市場現在儲存器特別緊缺,價格也漲得非常厲害。“中芯國際承接了大量模擬、儲存包括 NOR/NAND Flash、MCU 等急單,為保障交付,主動將部分非緊急手機訂單延後,這也使得手機業務佔比短期有所下降。”該公司稱。據中芯國際財報顯示,該公司前三季度營收約495.1億元,同比增加18.2%;歸屬於上市公司股東的淨利潤約38.18億元,同比大增41.1%;毛利率為 23.2%,同比增長5.6個百分點。單看第三季度,中芯國際營業收入171.62億元,環比增長6.9%;實現淨利潤15.17億元,同比增長43.1%;毛利率為25.5%,環比上升4.8個百分點;產能利用率上升至95.8%,環比增長3.3個百分點。財報顯示,中芯國際的產能利用率進一步提升,從第二季度的92.5%上升至95.8%,折合8英吋標準邏輯月產產能達到百萬片。整體來看,儲存的影響是雙向的。對當前是提拉訂單,對來年是看不清。據觀察,儲存供應短缺或過剩5%就有可能給價格帶來成倍的影響。目前行業供應存在缺口,預計高價位態勢將持續。此外,NOR Flash、NAND Flash及MCU等產品驗證周期長、替代門檻高。即便有新廠商嘗試進入,從流片到規模化量產也需至少16個月。這意味著在未來一段時間內,現有供應商的市場地位將保持穩定,難以被快速替代。在11月4日舉行的業績說明會上,中芯國際聯合首席執行官趙海軍表示,公司產量上升“主要是因為產業鏈切換加速進行,以及管道還在備貨補庫存,公司積極配合客戶保證出貨”。晶圓平均銷售單價環比增長3.8%,是由於產品組合變化,製程複雜的產品出貨增加。趙海軍提到,四季度雖然是傳統淡季,客戶備貨有所放緩,但產業鏈切換迭代效應持續,淡季不淡。因此,公司給出的四季度收入指引為環比持平到增長 2%;產線整體上繼續保持滿載;毛利率指引為 18%到20%,與三季度指引相比持平。據此預測,公司全年銷售收入預計超過90億美元。 (國芯網)
全球汽車產業真的“嚴重產能過剩”了嗎?
全球並非同此涼熱:國際車企密集關閉工廠,中國汽車產能利用率為72.2%“當今世界汽車工業嚴重產能過剩,我們決定不再建設新的汽車生產工廠,不搞重複建設。”吉利控股集團董事長李書福近日的公開發言,引起廣泛關注。李書福在2025中國汽車重慶論壇上說,要充分利用全球過剩產能,盡最大可能的展開務實合作、資源重組,這樣能利用成熟的質量保證體系、熟練的技術工人,還能提高同行過剩產能的利用率,以友善的姿態參與全球市場競爭,為中國汽車工業“走出去”樹立良好品牌形象。儘管中國汽車產銷正在高歌猛進,但全球並非同此涼熱,世界經濟增長乏力使得汽車需求低迷,汽車產量從2023年的9400萬輛下降到9300萬輛,疊加新能源車普及速度不及預期,產能過剩成了共性,不少國際車企都在關閉工廠、大幅裁員。以美國為例,金融資料平台YCharts的統計顯示,2025年一季度美國汽車產業的產能利用率是65.28%,是近幾年最低點。業內公認,70%-80%為產能利用率的健康範圍。《財經》瞭解到,李書福的表態更多從全球汽車產業佈局的視角出發,強調中國車企“走出去”時,應該多利用當地的過剩產能,而非只考慮新建工廠。李書福所指並非中國汽車產業存在嚴重產能過剩,從資料來看,中國也不存在這一情況。根據中國國家統計局的官方資料,2021年-2024年,汽車整車製造、汽車零部件及配件等汽車製造業產能利用率分別為74.7%、72.7%、74.6%和72.2%。1. 全球車企密集關閉工廠中國和全球汽車市場並非同此涼熱,中國是為數不多銷量仍在增長的地區。從2019年到2024年,隨著新能源汽車的快速發展,中國汽車銷量從2576.9萬輛上升到3143.6萬輛。但在歐洲和北美汽車市場,都面臨傳統燃油車需求下降、新能源車普及速度不及預期的困境。美國2024年的銷量是1590萬輛,歐盟2024年銷量約1284萬輛,均低於其2019年的銷量水平。銷量下滑對應的正是產能過剩。金融資料平台YCharts的統計顯示,2025年一季度美國汽車產業的產能利用率是65.28%,低於此前一季度的65.46%,也低於去年同期的71.81%。(圖源:YCharts)行業標準通常認為,產能利用率在70%-80%為健康範圍,低於70%可能表明存在過剩。全球經濟增長乏力、需求低迷是主要原因。博世集團董事會主席史蒂凡·哈通(Stefan Hartung)博士說,全球正面臨汽車需求低迷的問題,全球汽車產量下滑從9400萬輛降至9300萬輛,尤其是電動汽車,電動出行、燃料電池與輔助駕駛等未來技術的普及速度遠低於行業預期,且這些技術在不同市場的發展速度差異很大。基於此,多家國際車企都宣佈了關閉工廠和裁員的計畫。日產汽車在5月13日宣佈,到2027財年將在全球關閉7家工廠,工廠數量從目前的17家精簡為10家。2024財年的全球產能(不含中國)為350萬輛,計畫2027財年減至250萬輛。伴隨工廠的關閉,日產將在國內外裁員2萬人。由於經濟環境艱難,大眾汽車集團也已經在2024年告知員工,計畫關閉十家德國工廠裡的至少三家、裁撤數以萬計員工,並收縮其在德國所有剩餘工廠規模。這是大眾自1926年成立以來首次關閉德國境內的工廠。為了減少產能、控製成本,車企先後宣佈關廠計畫。2025年2月,奧迪位於布魯塞爾的工廠正式關閉,由於該廠生產的奧迪Q8 e-tron銷量低迷,這座擁有76年歷史、曾肩負奧迪電動化轉型重要使命的工廠迎來終章。李書福的此番表態,正值中國汽車“走出去”之際,強調世界汽車工業存在產能過剩,中國車企要充分利用過剩產能,為中國汽車工業樹立良好的品牌形象。比亞迪(002594.SZ)、奇瑞汽車和長城汽車(601633.SS)等多家中國汽車車企已經在海外建設工廠——這和吉利出海的路徑不同。2月的一份公告顯示,吉利將投資雷諾的巴西子公司,成為其少數股東,並利用雷諾的工廠生產電動及低排放汽車,具體金額未披露。儘管該協議仍需獲得相關監管機構批准,但不難看出,吉利利用雷諾巴西工廠進行出海、不再新建工廠的舉措,和李書福的最新發言一脈相承,強調“以友善的姿態參與全球市場競爭,贏得更多全球同行的掌聲”。2. 中國汽車產能利用率為72.2%根據中國國家統計局的官方資料,2021年-2024年,汽車整車製造、汽車零部件及配件等汽車製造業產能利用率分別為74.7%、72.7%、74.6%和72.2%。(圖源:國家統計局)2018年上半年以前,中國汽車製造業產能利用率均保持在80%以上,但隨著車市進入存量競爭階段以及新能源汽車產能的擴建,近年來產能利用率有所下降,但也維持在70%以上。需要指出的是,產能過剩是結構性的,並非普遍性的。由於銷量下滑,合資車企的產能過剩較明顯;而不少國產新能源車企的產能還處於緊缺狀態。“目前中國至少擁有3000多萬輛燃油車的產能,以及已經建成的2000多萬輛新能源汽車產能。然而,油電轉換僅吸納了200萬-300萬輛燃油車的產能,新能源汽車的大部分產能是新建的。燃油車的產銷量和盈利率大幅下滑,導致大量產能閒置,許多企業正面臨生死存亡的嚴峻挑戰,部分企業已經停產甚至倒閉。”在3月28日舉辦的中國電動汽車百人會論壇上,工信部前副部長蘇波指出。以全球新能源汽車銷量第一的比亞迪來看,從2021年開始的四年裡,產能利用率一直高於99.5%。最高時,2023年的產能利用率甚至達到160%,產能、產量分別為190萬輛和303.4萬輛(說明部分生產基地進行雙班生產)。隨著多個生產基地的建成,2024年,比亞迪的產能利用率回到100%,這一年的產能、產量均為428萬輛。小米汽車的產能利用率甚至接近接近200%。現在下單小米汽車,提車大概在6個-7個月之後,甚至更長。小米集團創始人雷軍表示,擴產迫在眉睫。小米汽車一期工廠的設計產能是15萬輛/年,即額定月產能為1.25萬輛,而小米通過雙班生產、產線調優等手段,月產能提升至2.4萬輛,產能利用率接近200%。設計產能同樣為15萬輛/年的二期工廠即將竣工,最快2025年8月正式投產。合資車企方面,產能利用率對比十分鮮明。上汽大眾的年銷量,從2018年最高峰的206.51萬輛,滑落到2024年的114.81萬輛。結合超200萬輛的設計產能來看,2024年,上汽大眾產能利用率降至約55%,有約100萬輛的產能處於閒置狀態。上汽大眾銷售與市場執行副總經理、上海上汽大眾汽車銷售有限公司總經理傅強坦言,之前大眾品牌有250萬輛的年產能,未來需要的年產能在150萬至200萬輛之間,多出來的50萬到100萬輛的年產能可能就是現在營運的包袱,上汽大眾要適當進行調整。根據《中國汽車報》的報導,北京現代的產能利用率長期低於30%,而神龍汽車武漢工廠的部分生產線已經閒置多年。瑞銀中國汽車行業研究主管鞏旻對《財經》表示,2020年到2024年,中國本土品牌的產能利用率從65%爬升到了84%,同一時間,外資品牌產能利用率從73%跌到了56%,預計有1000萬輛冗餘產能需削減。鞏旻表示,部分汽車企業正在削減燃油車產能或通過向海外出口解決產能過剩危機,但整體而言,全球汽車製造商需要重新定位中國市場,專注於高端或者利基市場。 (財經汽車)