華為AI晶片產業發展深度分析2024


一、引言

1.1 華為AI晶片發展背景:

華為,作為全球通訊設備與消費性電子產業的領導企業,始終致力於技術創新與前瞻佈局。早在2013年,華為便敏銳洞察到人工智慧(AI)技術的巨大潛力及其對各行各業深遠影響,開始積極建構自身在AI領域的戰略版圖。華為的AI策略不僅涵蓋軟體演算法、平台服務,更關鍵的是在硬體層面,尤其是AI晶片的研發與產業化推進,旨在打造端到端、全場景的AI解決方案,以滿足未來數位化社會對智慧運算能力的旺盛需求。

華為AI晶片的研發歷程可追溯至2017年,當時華為宣布進軍AI晶片領域,並在隨後的全聯接大會上發布了首款AI晶片——昇騰系列,標誌著華為正式邁入全球AI晶片競賽的前沿。昇騰系列晶片基於自主研發的達文西架構,專為AI運算設計,具備高算力、高能效比、靈活可擴展等特點,迅速在業界樹立起技術標竿。此後,華為持續加大研發投入,不斷迭代升級昇騰系列產品,涵蓋從雲端訓練到邊緣推理的全端應用場景。

華為在AI晶片市場的定位獨特且明確,旨在建構全面自主可控的AI基礎設施。這既包括高效能的AI處理器,也涵蓋配套的軟體開發工具、演算法庫、應用框架等,形成完整的AI生態系統。華為AI晶片不僅服務自家的終端設備、伺服器產品及雲端服務,也透過開放平台策略,廣泛賦能各行各業的合作夥伴,協助他們快速開發與部署AI應用,共同推動AI產業的繁榮與發展。

1.2 本文研究目的與意義:

理解技術優勢: 對華為AI晶片進行全端深度分析,首要目的是揭示其核心技術優勢。這包括深入剖析其晶片架構設計概念、硬體創新點(如運算單元設計、記憶體管理、互連技術等)、軟體堆疊完整性(包括編譯器、執行時間、開發框架、模型庫等),以及軟硬體協同優化機制。透過對這些技術細節的細緻解讀,可以揭示華為如何透過技術創新,實現高算力、低能耗、易編程、廣兼容等關鍵性能指標,從而在激烈的市場競爭中脫穎而出。

評估市場競爭力: 全端分析有助於全面評估華為AI晶片的市場競爭力。這涉及對其在不同應用場景(如資料中心、邊緣運算、物聯網終端等)的適用性、效能表現、成本效益、使用者口碑等方面的考察,以及與主要競品(如NVIDIA、Google、Intel等公司的AI晶片產品)的比較分析。此外,華為在生態系統建設、合作夥伴關係、客戶服務等方面的措施也是評估其市場競爭力的重要維度。

洞察未來發展趨勢: 透過深度分析,可以洞察華為AI晶片的發展策略、技術研發路線、市場策略的演進趨勢,以及在應對產業共通性挑戰(如摩爾定律放緩、能源效率瓶頸、資料安全與隱私保護等)上的創新思路與實踐。這些洞察對於理解華為在AI晶片領域的長期發展規劃,預測其的技術突破、市場佈局、生態建構等具有重要價值,同時也為相關產業參與者、投資者、政策制定者提供了決策參考。

二、華為AI晶片產品線概覽

2.1 現有產品梳理:

昇騰系列AI晶片

華為昇騰系列AI晶片是其在AI領域的重要產品線,旨在為雲端、邊、端等各類應用場景提供強大的智慧運算能力。以下是昇騰系列部分關鍵產品的梳理:

  1. 昇騰910(Ascend 910)
    • 發佈時間: 2018年10月首次發布,後續有更新版本推出。
    • 主要特性:昇騰910是華為面向雲端訓練場景的旗艦級AI晶片,採用達文西架構,具有超大規模的運算核心數、高頻寬記憶體介面和高效的片上互聯。它在單晶片上實現了極高的運算密度和強大的算力,被譽為全球已發布的單晶片運算密度最大、訓練速度最快的AI晶片。其算力遠超同代競品,可支援大規模深度學習模型的高效訓練。
    • 應用場景:主要應用於資料中心、公有雲、私有雲等環境下的AI模型訓練,服務於影像辨識、語音辨識、自然語言處理、推薦系統、強化學習等多種複雜AI任務,尤其適用於科研機構、大型網路公司和企業級客戶的高效能運算需求。
  2. 昇騰310(Ascend 310)
    • 發佈時間: 2018年10月與昇騰910一同發布,後續也有迭代更新。
    • 主要特性:昇騰310定位於邊緣運算與輕量伺服器場景,同樣基於達文西架構設計,具備優秀的能效比與即時推理能力。此晶片支援多種精度運算,能夠在低功耗下完成即時的AI推理任務,適用於嵌入式設備、智慧攝影機、自動駕駛車輛等邊緣設備。
    • 應用場景:廣泛應用於智慧城市、智慧交通、智慧製造、智慧家庭、行動終端等領域,為即時視訊分析、物件偵測、語音喚醒、自然語言互動等功能提供算力支援。
  3. 昇騰其他型號
    • 昇騰Mini系列:針對邊緣和端側小型化設備設計,進一步降低耗電量和體積,適用於智慧穿戴、物聯網終端等資源受限場景。

2.2 技術路線與演進:

華為AI晶片的技術路線始終堅持自主創新,圍繞達文西架構為核心進行迭代演進,逐步提升晶片的算力、能源效率比與適用性。

架構設計創新:

  • 達文西架構:華為獨創的達文西架構是昇騰系列AI晶片的基礎,其特點是採用「3D Cube」立體運算引擎,透過將運算、儲存、通訊資源進行深度融合與調度,實現資料流的高效處理。這種架構特別適合深度神經網路的平行運算需求,有效降低了資料搬運的開銷,提高了運算效率。

算力提升策略:

  • 計算核心數量與結構優化:隨著晶片迭代,華為不斷提升單晶片上AI運算核心(如達文西核心或CANN核心)的數量,並優化核心結構,如改進運算單元設計、增強資料並行與任務並行能力,以實現更高的理論峰值算力。
  • 高速互聯與記憶體存取:透過引入先進的高速匯流排技術和增大記憶體頻寬,確保大量運算核心間的資料交換無瓶頸,同時優化記憶體層次結構和訪存策略,減少資料存取延遲,提高實際應用中的有效算力。

能效優化手段:

  • 精準功耗管理:華為在晶片設計中融入精細化的功耗管理技術,如動態電壓頻率調整(DVFS)、任務調度最佳化等,確保在滿足效能需求的同時,最大限度地降低功耗。
  • 計算精度可配置:支援INT8、INT16、FP16、FP32等多種運算精度,讓使用者根據實際任務需求選擇適當的精度,以達到效能與功耗之間的平衡。對於許多推理任務,使用較低精度即可保持高準確度,顯著節省能源。
  • 硬體加速技術:整合專門的硬體加速模組,如矩陣乘法加速器、張量運算單元等,針對性地提升特定AI運算任務的能效。

三、華為AI晶片核心技術解析

3.1 架構設計:

Da Vinci架構是華為昇騰系列AI晶片的核心硬體架構,以其獨特的設計在平行運算、異質運算和模型加速方面展現了顯著的創新優勢。

平行運算:Da Vinci架構採用「3D Cube」立體運算引擎,將運算單元(如向量處理器VP、標量處理器SP、張量處理器TP等)以三維網格方式組織,形成高度並行的運算陣列。這種設計使得資料可以在三維空間中流動,大大減少了資料搬運距離和時間,並提高了計算效率。同時,每個計算單元都支援向量計算,能夠有效率地處理大規模並行的神經網路操作,如卷積、矩陣乘法等。

異質運算:Da Vinci架構內包含了多種類型的運算單元,它們在功能、效能和功耗上各有側重,構成異質運算體系。例如,標量處理器擅長處理控制流程和條件分支等複雜邏輯,向量處理器擅長處理密集的數學運算,張量處理器則專注於高效率的矩陣運算。這種異質設計使得晶片能夠在同一時間內處理不同類型的任務,既滿足了深度學習模型多樣化的運算需求,也實現了運算資源的高效利用。

模型加速:Da Vinci架構針對深度學習模型進行了深度最佳化。其內建的張量計算單元(Tensor Processing Unit, TPU)專為神經網路運算設計,支援高效的矩陣乘法和卷積運算。此外,架構中還整合了大量的硬體加速器,例如用於激活函數計算的激活器、用於歸一化操作的歸一化器等,進一步加速模型執行。透過高效的快取系統和記憶體管理機制,確保了資料在計算單元間的快速流動,避免了記憶體存取瓶頸,提升了整體模型執行速度。

Ascend Core作為華為AI晶片的硬體基礎單元,是指達文西核心(Da Vinci Core)或類似的專用AI計算核心。這類核心是上述平行運算、異質運算和模型加速能力的具體實現載體,具備高效處理深度學習任務的特性,如支援INT8/INT16/FP16等多種精度運算,能夠在低功耗下提供高吞吐量的推理效能。

3.2 軟體棧與工具鏈:

華為為AI晶片建構了完善的軟體堆疊與工具鏈,旨在簡化開發流程,提升開發效率,促進生態共建。

編譯器:華為提供了昇騰晶片優化的編譯器,如Ascend Compiler,能夠將高階語言編寫的AI模型程式碼轉換為高效能運行在昇騰晶片上的機器碼。編譯器支援自動算子融合、指令級最佳化、記憶體最佳化等技術,確保模型在硬體上有效率地執行。

執行環境:華為提供了一套完整的執行時間系統,如Ascend Runtime,負責管理和調度AI晶片資源,包括記憶體分配、任務調度、硬體加速器呼叫等。運行時環境與硬體緊密耦合,透過高效率的驅動程式和中間層服務,為上層應用提供穩定、高效能的服務介面。

開發框架:華為推出了自研的深度學習架構MindSpore,其設計充分考慮了昇騰晶片的特性,支援模型自動並行、自動微分、自動混合精度等特性,大大簡化了模型開發和部署過程。 MindSpore也提供豐富的API、預訓練模型和教學文檔,幫助開發者快速建立和訓練AI模型。

模型庫:華為維護了一個包含眾多預訓練模型的模型庫,涵蓋電腦視覺、自然語言處理、語音辨識等多個領域。這些模型經過最佳化,可以直接在昇騰晶片上有效運行,為開發者提供了豐富的開箱即用資源。

透過這一整套軟體堆疊與工具鏈,華為大幅降低了開發者使用昇騰晶片的門檻,促進了AI應用的快速開發與部署。同時,開放的軟體生態吸引了廣大開發者和合作夥伴加入,共同建構繁榮的AI應用生態,增強了華為AI晶片的市場吸引力和競爭力。

3.3 演算法最佳化與模型壓縮:

華為在AI演算法層面採取了一系列最佳化策略,以提升模型在昇騰晶片上的推理和訓練效率,同時降低模型儲存和運算資源需求。

模型量化:華為支持INT8甚至更低精度的模型量化,透過將浮點模型轉換為整數模型,大幅減少模型大小和計算複雜度,同時藉助昇騰晶片對低精度計算的良好支持,確保模型精度損失最小化。

模型剪枝:華為在框架和工具鏈中整合模型剪枝技術,透過對模型權重進行分析,去除對輸出影響較小的連接或通道,精簡模型結構,降低計算量和記憶體佔用,提高推理速度。

知識蒸餾:華為支持知識蒸餾技術,透過讓一個大模型(教師模型)教導一個小模型(學生模型),使小模型在保持較高精度的同時,具備更小的模型尺寸和更快的推理速度,特別適用於資源有限的邊緣設備。

在軟體硬體協同方面,華為的軟體堆疊深度最佳化以充分利用昇騰晶片的硬體特性。例如,MindSpore框架能夠自動識別模型結構,進行算子融合和並行化調度,使得模型在硬體上高效執行;編譯器能夠產生針對昇騰晶片優化的指令集,減少資料搬運和冗餘計算;運行時環境則負責精細的資源管理和任務調度,確保硬體資源充分利用。

透過上述演算法優化與模型壓縮技術,以及軟硬體的深度協同,華為AI晶片能夠在保證模型性能的前提下,顯著提升推理與訓練效率,降低資源需求,適應從雲端到邊緣的各種應用場景,展現出強大的技術實力和生態整合能力。

四、華為AI晶片性能評估與應用案例

4.1 性能基準測試:

華為AI晶片,尤其是昇騰系列,已參與多項國際公認的AI基準測試,如MLPerf和AIBench,透過這些測試平台,我們可以客觀地評估其性能,並與競品進行橫向比較。

算力:在MLPerf等測試中,華為AI晶片展現了強大的單晶片及叢集算力。以最新的昇騰晶片為例,其在影像分類、語音辨識、自然語言理解等任務上取得了優異成績,單位時間內能處理的樣本數量遠超業界平均。與競品相比,如英偉達的高階GPU,儘管在絕對性能上可能存在差距(如英偉達新發布的GPU性能可達華為AI晶片的14倍),但華為AI晶片在特定AI工作負載上展現出高度最佳化的效能,尤其是在大規模平行運算和張量處理方面,能有效應對深度學習模型的高強度運算需求。

能源效率:華為AI晶片在設計上著重能效比,透過先進的製程製程、低功耗架構設計與動態電源管理技術,實現高效能與低功耗的平衡。在MLPerf Energy Efficiency(能源效率)測試中,華為AI晶片往往能在完成相同AI任務時消耗更低的功率,特別是在資料中心和邊緣運算場景下,其能效優勢更為明顯,有助於降低總體營運成本和碳排放。

相容性:華為AI晶片支援多種程式設計模型和框架,如TensorFlow、PyTorch以及自家的MindSpore等,確保開發者可以輕鬆遷移現有模型,無需重寫大量程式碼。此外,華為積極建構開放的生態系統,透過提供豐富的SDK、API和工具鏈,確保其AI晶片能無縫融入各類AI應用環境,包括公有雲、私有雲、邊緣運算節點等。在AIBench等相容性測試中,華為AI晶片表現出良好的跨平台、跨裝置相容性,證明其在多場景下的部署靈活性和通用性。

總結來說,儘管在某些極端性能指標上華為AI晶片可能不及部分競品,但在實際AI工作負載的算力、能效和兼容性方面,華為憑藉其針對性的設計優化和全面的軟體支持,展現出了顯著的競爭優勢,特別是在大規模AI應用部署和長期營運成本控制方面,為用戶提供了極具吸引力的選擇。

4.2 應用場景案例分析:

智慧城市:華為AI晶片為智慧城市提供了強大的運算引擎。例如,在視訊監控領域,搭載華為AI晶片的智慧攝影機能夠即時分析大量視訊串流,精準辨識行人、車輛、異常行為等,協助城市管理部門實現精細化管理。晶片的高能效特性使得此類邊緣設備能夠在低功耗下持續運行,而內建的視覺預處理模組則進一步優化了資料處理流程,降低了對網路頻寬的需求。透過與華為雲的連動,這些邊緣端的智慧分析結果可迅速匯聚至中央平台,進行大數據分析與決策支持,形成智慧城市的神經網路。

自動駕駛:在自動駕駛汽車中,華為AI晶片作為運算平台的核心組件,承擔環境感知、路徑規劃、決策控制等關鍵任務。其強大的平行運算能力和對深度學習模型的高效支持,使得車輛能夠在短時間內處理來自雷射雷達、攝影機、毫米波雷達等感測器的海量數據,即時產生高精度的周圍環境模型。晶片的低延遲特性和高可靠性對於確保自動駕駛系統的安全性至關重要。此外,華為也正在建構開放的自動駕駛軟體平台,吸引產業鏈合作夥伴共同開發自動駕駛解決方案,推動產業創新。

雲端運算:在華為雲端服務中,昇騰AI晶片被廣泛應用於大規模AI訓練和推理服務。華為雲端提供的AI開發平台和模型市場,讓用戶能夠直接利用昇騰晶片的強大算力進行模型訓練和部署,大大縮短了AI專案的研發週期。在雲端資料中心內部,透過叢集化部署昇騰晶片,華為能夠提供大規模分散式訓練服務,滿足企業級使用者對超大規模模型訓練的需求。同時,華為雲也利用昇騰晶片的高能源效率特性,提供綠色節能的AI雲端服務,響應永續發展的號召。

邊緣運算:在邊緣運算場景,如工業物聯網、遠距醫療、零售分析等,華為AI晶片賦能邊緣設備進行即時數據分析與決策。例如,在智慧製造中,搭載昇騰晶片的邊緣伺服器可以就近處理產線上的感測器數據,即時監測設備狀態、預測故障,甚至調整生產參數以優化產出。由於資料無需傳輸到雲端,這種邊緣運算模式既保證了資料隱私,也降低了網路延遲,提升了業務回應速度。

五、華為AI晶片生態建構與合作關係

5.1 開發者生態:

華為高度重視AI晶片開發者生態的建設,透過一系列措施為開發者提供全方位的支持,以促進AI技術的創新應用和產業生態的發展。

社區支持:華為建立了活躍的開發者社區,如華為開發者聯盟、MindSpore社區等,為AI晶片開發者提供了一個交流經驗、獲取最新技術資訊、提出問題並得到專業解答的平台。社區內定期舉辦線上研討會、技術講座、開源專案討論等活動,鼓勵開發者積極參與,形成知識共享和協作創新的良好氛圍。此外,華為也透過開發者論壇、部落格、技術文件庫等方式,提供豐富的技術文件、範例程式碼和最佳實踐,幫助開發者快速上手華為AI晶片及其配套軟體堆疊。

培訓資源:華為推出了多種形式的培訓課程和教育資源,涵蓋AI晶片基礎知識、開發工具使用、模型優化技巧、產業解決方案開發等內容。這些資源包括線上課程、訓練營、線下研討會、技術認證培訓等,旨在提升開發者的技術能力,並適應不斷演進的AI晶片技術和應用場景。華為也與大學、研究機構合作,開展學術交流、聯合培養項目,為AI晶片領域的未來發展儲備人才。

認證體系:華為建立了完善的AI晶片開發者認證體系,如華為認證人工智慧工程師(HCIA-AI)、華為認證人工智慧高級工程師(HCIP-AI)等,為開發者的職業發展提供權威資格認可。透過這些認證,開發者可以系統地掌握華為AI晶片相關的技術原理、開發方法和最佳實踐,增強在就業市場上的競爭力。同時,認證體係也為華為及合作夥伴篩選招募具備華為AI晶片開發能力的專業人才提供了標準基礎。

華為的上述舉措對吸引和培育開發者群體產生了顯著影響:

  • 擴大開發者基數:豐富且易用的開發資源降低了AI晶片開發的學習門檻,吸引了許多初學者和跨領域開發者加入,擴大了華為AI晶片的開發者基數。
  • 提升開發者技能:專業的訓練課程和認證體系幫助開發者快速提陞技術水平,適應複雜AI應用的開發需求,增強了華為AI晶片在實際專案中的應用效果。
  • 激發創新活力:活躍的社區環境促進了開發者之間的交流與合作,催生了許多創新應用和解決方案,豐富了華為AI晶片的應用生態。
  • 強化品牌忠誠度:透過提供持續的技術支援和服務,華為建立起與開發者之間緊密的聯繫,增強了開發者對華為AI晶片品牌的認同感和忠誠度,有利於形成穩定的開發者社群。

5.2 合作夥伴網路:

華為在AI晶片領域建構了廣泛而深入的策略合作夥伴網絡,涵蓋軟硬體供應商、ISV(獨立軟體開發商)、系統整合商、科研機構、產業用戶等多個層面。以下是一些具代表性的合作夥伴及合作模式:

硬體合作夥伴:華為與中國外多家硬體製造商合作,如伺服器廠商、儲存設備供應商等,共同開發以華為AI晶片為基礎的客製化硬體解決方案,提升整體系統的效能與效率。這些合作有助於華為AI晶片更好地融入不同產業的IT基礎設施,拓寬市場覆蓋範圍。

軟體與演算法合作夥伴:華為與AI軟體平台供應商、演算法開發商等合作,如深度學習框架開發商、AI中介軟體供應商等,確保華為AI晶片支援主流開發工具和演算法庫,提升開發者的使用體驗。透過合作,華為能夠提供更完整的AI開發環境,加速AI應用的開發與部署。

產業解決方案合作夥伴:華為與產業ISV、系統整合商合作,共同開發針對特定產業的AI解決方案,如金融風控、醫療影像診斷、智慧製造等。這些合作夥伴運用華為AI晶片的強大算力,結合各自在產業領域的專業知識,打造出具競爭力的產業應用,推動AI技術在各行各業的落地。

科學研究與教育合作夥伴:華為與知名大學、研究機構合作,進行尖端技術研發、人才培育以及產學研轉化計畫。這類合作有助於華為維持技術領先,同時透過聯合培養計畫為AI晶片產業輸送高品質人才。

合作成果體現在以下幾個方面:

  • 豐富產品組合:透過與各類型合作夥伴的緊密合作,華為建構了涵蓋硬體、軟體、演算法、解決方案在內的多元化產品組合,滿足不同客戶群的多樣化需求。
  • 加速市場滲透:合作夥伴的產業經驗與客戶網路有助於華為AI晶片快速打入各垂直產業市場,擴大市場份額,尤其是在政府、電信、能源、運輸等關鍵領域。
  • 推動技術創新:與科學研究機構的合作推動了華為在AI晶片及相關技術領域的持續創新,如新型晶片架構、高效編譯器、大模型訓練技術等,維持華為在AI賽道的競爭力。
  • 共建生態標準:華為與合作夥伴共同參與制定產業標準、介面規範等,推動AI晶片產業的標準化發展,提升華為AI晶片在業界的話語權與影響力。

智慧醫療:

  • 案例名稱:華為與某省級醫院合作的AI輔助診斷系統
  • 合作模式:華為與該院攜手,利用華為昇騰AI晶片及MindSpore框架,共同開發AI輔助診斷系統。
  • 合作成果:該系統基於華為AI晶片的強大算力,對海量醫療影像資料(如CT、MRI)進行高效處理和深度學習模型訓練,實現了多種疾病的快速、準確診斷。 AI輔助診斷系統大大減輕了醫生的工作負擔,提高了診斷效率和準確性,有效緩解了醫療資源緊張的問題。此外,華為也與醫院合作,透過持續的數據收集和模型優化,不斷提升系統的診斷效能。

智慧製造

  • 案例名稱:華為與某大型製造業合作的智慧質檢解決方案
  • 合作模式:華為與該企業合作,將昇騰AI晶片整合到生產線的質檢環節,透過即時分析高清攝影機擷取的影像數據,實現對產品品質的自動化檢測。
  • 合作成果:以華為AI晶片為基礎的智慧質檢系統能夠精確識別產品缺陷,如表面刮痕、尺寸偏差等,顯著提高了質檢效率和準確率,並減少了人工誤檢和漏檢。同時,系統還能即時回饋品質檢驗結果,指導生產過程的最佳化,有效提升了企業的生產效率與產品品質。此外,此解決方案的部署和維運由華為與企業共同完成,確保了系統的穩定運作和持續最佳化。

自動駕駛

  • 案例名稱:華為與某汽車製造商合作的自動駕駛平台
  • 合作模式:華為與該汽車製造商深度合作,將昇騰AI晶片作為自動駕駛運算平台的核心,整合到車輛的自動駕駛系統中,負責處理來自各種感測器(如攝影機、雷達、雷射雷達)的海量數據,實現環境感知、路徑規劃、決策控制等功能。
  • 合作成果:以華為AI晶片為基礎的自動駕駛平台,車輛能夠在複雜路況下達到L4等級的自動駕駛,大幅提升了行車安全性和駕駛舒適性。華為AI晶片的高算力和低延遲特性,確保了自動駕駛系統的即時響應和精準決策。此外,華為也與汽車製造商分享自動駕駛數據,共同推進演算法最佳化和模型迭代,持續提升自動駕駛系統的效能和使用者體驗。

六、華為AI晶片面臨的挑戰與因應策略

6.1 技術挑戰:

先進製程:華為AI晶片面臨的主要技術挑戰之一是先進製程技術的取得。由於國際情勢及貿易限制,華為在取得最先進的半導體製造技術(如台積電的5nm及以下製程)方面受到限制,這可能導致其AI晶片在電晶體密度、性能提升和能耗效率方面相較於競爭對手有所滯後。因應措施包括:

  • 自主研發與合作創新:華為持續加大研發投入,積極探索自主晶片製造技術,如透過與中國半導體產業鏈上下游企業合作,推動本土先進製程技術的研發與產業化進程。
  • 最佳化晶片設計:透過架構創新、電路設計最佳化、封裝技術改良等手段,提升現有製程條件下晶片的效能與能效,盡量縮小與最先進製程晶片的效能差距。
  • 多元供應鏈策略:尋找並培養替代供應商,分散供應鏈風險,確保在受限環境下仍能獲得必要的晶片製造能力。

功耗控制:隨著AI應用向邊緣運算、行動裝置等低功耗場景擴展,如何在確保效能的同時有效控制晶片功耗成為重要課題。挑戰在於:

  • 高效能效比設計:需在晶片架構、電路設計、電源管理等方面實現技術創新,確保在提供強大AI算力的同時,維持低功耗運作。
  • 動態功耗管理:開發先進的動態電壓頻率調整(DVFS)、任務調度演算法等技術,根據實際工作負載動態調節晶片工作狀態,減少不必要的能耗。

華為的因應策略包括:

  • 持續研發低功耗技術:投資研發低功耗運算架構、新型儲存技術、智慧電源管理方案等,提升晶片整體能源效率比。
  • 軟硬體協同最佳化:透過深度整合硬體設計與軟體堆疊(如編譯器、執行時間環境、框架),實現從演算法到硬體的全端功耗最佳化。

演算法創新:隨著AI技術的快速發展,新的演算法模型不斷湧現,對AI晶片的運算需求也在不斷變化。挑戰在於:

  • 快速適應演算法演進:晶片設計需具備足夠的彈性與前瞻性,以適應深度學習、強化學習、元學習等新興演算法模式的要求。
  • 模型壓縮與加速技術:在不犧牲模型精度的前提下,實現模型的小型化和高效推理,以適應資源有限的邊緣設備。

華為的因應策略包括:

  • 加強基礎研究與合作:與學術界、產業緊密合作,追蹤前沿演算法趨勢,提前佈局未來晶片設計。
  • 打造開放創新平台:透過開源框架(如MindSpore)、模型庫、開發者社群等,吸引開發者參與演算法創新,推動演算法與硬體的深度整合。

6.2 市場與政策環境:

全球半導體供應鏈波動:全球供應鏈的不穩定可能導致原物料短缺、價格上漲、交貨週期延長等問題,對華為AI晶片的生產和供應造成影響。華為的因應策略包括:

  • 供應鏈多元化:積極尋求替代供應商,減少對單一地區或供應商的依賴,並提高供應鏈韌性。
  • 庫存管理與需求預測:最佳化庫存策略,精準預測市場需求,確保關鍵材料與零件的充足供應。

地緣政治因素:國際貿易摩擦與科技封鎖對華為AI晶片的國際市場拓展、技術合作帶來挑戰。華為採取的策略包括:

  • 本土化策略:加強與本土產業鏈的合作,推動國產化替代,降低對外部市場的依賴。
  • 法律手段與外交努力:透過法律途徑維護自身權益,同時積極進行外交溝通,爭取國際社會的理解與支持。

產業標準制定:全球AI晶片產業標準的製定對華為的市場地位和產品競爭力有重要影響。華為採取的策略包括:

  • 積極參與標準制定:在國際標準化組織中發揮積極作用,推動華為技術成為業界標準的一部分。
  • 推動互通性與開放生態:倡導開放標準與接口,促進不同AI晶片平台之間的互通性,建構包容性較強的AI生態。

七、華為AI晶片未來展望

7.1 技術趨勢預測:

新架構探索:隨著AI演算法的複雜性增加和應用場景的多元化,華為繼續探索創新的晶片架構以適應未來需求。這包括:

  • 神經擬態運算:華為會研究神經擬態晶片架構,模擬人腦神經網路的分散式、事件驅動和自適應特性,以實現更高的能效比和更強的即時學習能力。
  • 存內運算:鑑於資料搬運在AI運算中的瓶頸,華為投入存內運算架構的研究,將運算單元與儲存單元緊密結合,減少資料移動,提升運算效率。

異構運算融合:隨著異構運算在AI領域的價值日益凸顯,華為會深化對不同運算單元(如CPU、GPU、TPU、FPGA等)的整合設計,以實現更靈活、高效的運算資源調度:

  • 靈活異質平台:華為將推出更靈活的異質運算平台,支援多種運算單元的動態配置與協同工作,適應不同AI任務的算力需求。
  • 統一程式介面:發展統一的程式設計模型與API,簡化異質環境下的程式設計難度,提升開發效率。

軟體定義硬體:隨著軟體在硬體設計與最佳化中的作用日益增強,華為將加大在軟體定義硬體方向的投入:

  • 可重構硬體:研究可重構硬體技術,使晶片架構在運作時可依軟體需求動態調整,實現硬體資源的按需分配。
  • 進階編譯器與執行時間:開發更智慧的編譯器與執行時間系統,能夠自動辨識並最佳化AI工作負載,最大化硬體效能。

7.2 市場策略與目標:推測華為在AI晶片市場的定位調整、目標客戶群拓展、新業務領域佈局等策略方向

市場定位調整:華為將進一步明確其在AI晶片市場的高階定位,並強化其在高效能運算、資料中心、企業級AI解決方案等領域的領導地位。

目標客戶群拓展:華為將瞄準更廣泛的產業客戶,如智慧城市、智慧製造、金融科技、醫療健康等領域,提供客製化的AI晶片解決方案,同時加強與中小企業的合作,透過雲端服務等形式提供普惠AI能力。

新業務領域佈局:華為在新興AI應用領域進行佈局,如邊緣運算、物聯網、元宇宙等,開發適用於這些場景的輕量化、低功耗AI晶片,以及相應的軟體和服務生態。

八、結論

為AI晶片憑藉其獨特的Da Vinci架構、全端軟體支援、深度演算法優化以及在主流基準測試中的優秀表現,展現了強大的核心競爭力。華為在建構開發者生態、深化合作夥伴關係方面的努力,為其AI晶片在智慧醫療、自動駕駛、雲端運算等領域的廣泛應用奠定了堅實基礎。面對技術挑戰與複雜的市場環境,華為透過加強自主研發、供應鏈多元化、積極參與標準制定等策略,展現出適應市場變化、因應政策風險的能力。

展望未來,華為可望在新架構探索、異質運算融合、軟體定義硬體等尖端技術方向持續創新,順應AI晶片產業發展趨勢。在市場策略上,華為或將更聚焦於高端市場、拓展產業客戶群、佈局新興業務領域,進一步鞏固並提升其在全球AI晶片市場的領先地位。儘管面臨諸多挑戰,華為在AI晶片領域的持續創新與影響力值得期待,並可望在全球AI產業發展中扮演重要角色。

以下是具體產品生態分析:

1 昇騰 910 與 310 基礎晶片族,由下而上搭建龐大生態體系

1.1 昇騰 910AI 訓練處理器+昇騰 310AI 推理處理器

華為從 2004 年開始投資研發第一顆嵌入式處理晶片,歷經 15 年,投入超過 2 萬名工程師,形成了以「鯕鵬+昇騰」為核心的基礎晶片族。此外,還有較邊緣的 SSD控制晶片、智慧網卡晶片、智慧管理晶片等產品。為適應 AI 運算的高效能要求,一般認為基礎硬體具備至少 64 核心、8 個記憶體通道、PCIe 4.0 、多合一 SoC 、xPU 高速互聯、100GE 高速 I/O 等六個特徵。而支援 64 個核心的鯤鵬 920 及晶片組能夠滿足以上要求。


圖表 1 以「鯕鵬+昇騰」為核心的基礎晶片族

昇騰 310 高能效比推理型 AI 處理器,基於達文西架構,本質上是一塊 SoC ,集成了多個運算單元,包括 CPU (8 個 a55 )、AI Core 、數位視覺預處理子系統等。除了CPU 之外,此晶片真正的算力擔當是採用了達文西架構的 AI Core 。

這些 AI Core 透過特別設計的架構和電路實現了高通量、大算力和低功耗,特別適合處理深度學習中神經網路必須的常用計算。

目前晶片能對整數數(INT8 、INT4 ) 或對浮點數(FP16 )提供強大的算力。根據海思官網揭露,此晶片 FP16 算力為 8TOPS ,INT8 算力 16TOPS ,採用 12nm 製程製造。

昇騰910,高效能訓練AI 處理器,效能接近英偉達A100(40GB),半精度(FP16)算力達到320 TFLOPS,整數精度(INT8)算力達到640 TOPS,功耗310W,採用7nm先進製程。

此外,昇騰910 整合了HCCS、PCIe 4.0 和RoCE v2 接口,為建構橫向擴展(Scale Out)和縱向擴展(Scale Up)系統提供了靈活高效的方法。 HCCS 是華為自研的高速互聯接口,片內RoCE 可用於節點間直接互聯。



圖表 2 昇騰 910 處理器 圖表 3 昇騰 310 處理器

1.2 開發者套件、加速卡、加速模組,完整的硬體生態

基於昇騰晶片族,華為開發了一系列加速卡產品:Atlas 300T 訓練卡,基於昇騰 910 AI 晶片,晶片整合 32 個華為達文西 AI Core + 16 個 TaiShan 核,能夠提供業界領先的 280 TFLOPS FP16 算力,並整合了一枚100GE RoCE v2 網卡,支援 PCIe 4.0 和 1*100G RoCE 高速接口,出口總頻寬 56.5 Gb/s ,無需外置網卡,訓練資料和梯度同步效率提升 10%-70% 記憶體規格方面,包括32GB 的 HBM 和 16GB 的 DDR4 。


圖表 4Atlas 300T 訓練卡 圖表 5 Atlas 300T 訓練卡拆解圖

Atlas 300T A2 訓練卡,強化了高速介面和對PCIe5.0 的支持,整合20 個AI 核、8個CPU Core、1*200GE RoCE,提供280 TFLOPS FP16 算力。



圖表 6 Atlas 300T A2 訓練卡 圖表 7 Atlas 300T A2 訓練卡介面圖

Atlas 300I Pro 推理卡,LPDDR4X 24 GB ,總頻寬 204.8 GB/s ,融合「通用處理器、AI Core 、編解碼」 於一體,提供超強 AI 推理、目標檢索等功能,具有超強算力、超高能效、高效能特徵檢索、安全啟動等優勢,可廣泛應用於 OCR 辨識、語音分析、搜尋推薦、內容審核等諸多 AI 應用情境。單卡最大提供 140 TOPS INT8 算力,2 TOPS/W 超高能效比。


圖 8 Atlas 300I Pro 推理卡

Atlas 300I Duo 推理卡,LPDDR4X 48GB ,總頻寬 408GB/s ,從表觀上看是兩枚昇騰 310 的組合產品,從算力來看,單卡最大提供 280 TOPS INT8 算力,支援 16 core * 1.9 GHz CPU 運算能力,也約為單一晶片的兩倍。在此性能基礎上,該產品支援256 路高清視訊即時分析。


圖 9 Atlas 300I Duo 推理卡主機板 圖表 10 Atlas 300I Duo 推理卡

Atlas 200I DK A2 開發者套件,是一款高效能的 AI 開發者套件,4 核心 CPU ,可提供 8TOPS INT8 的運算能力,可實現影像、視訊等多種資料分析與推理運算,可廣泛用於教育、機器人、無人機等場景。以智慧小車為例,Atlas 200I DK A2 借助影像處理神經網絡,實現影像識別,基於此實現自動駕駛控制。

Atlas 500 A2 智慧小站是面向邊緣應用的產品,具有環境適應性強、超強運算效能、雲邊協同等特點,可在邊緣環境廣泛部署,滿足在交通、社區、園區、商場、超市等複雜環境區域的應用需求。


圖表 11 Atlas 200I DK A2 主機板 圖表 12 Atlas 200I A2 加速模組


圖 13 Atlas 500 A2 智慧小站


1.3 伺服器:  arm 和 x86 相容,風冷和液冷並用

Atlas 800 訓練伺服器(型號 9000 )是基於華為鯕鵬 920+昇騰 910 處理器的 AI訓練伺服器,實現完全自主可控,廣泛應用於深度學習模型開發和 AI 訓練服務場景。

此伺服器面向公有雲、網際網路、營運商、政府、交通、金融、大學、電力等領域,具有高運算密度、高能源效率比、高網路頻寬、易擴展、易管理等優點,支援單機和整機櫃銷售,支援風冷和液冷應用,滿足企業機房部署和大規模資料中心集群部署。

Atlas 800 訓練伺服器(型號 9010 )則是基於華為昇騰 910+Intel V5 Cascade Lake 處理器的 AI 訓練伺服器,其基於更成熟的 X86 結構。


圖表 14 Atlas 800 (型號 9000 )訓練伺服器水冷拆解圖

Atlas 800 推理伺服器(型號:3000 )最大可支援 8 個 Atlas 300I/V Pro ,提供強大的即時推理能力和視訊分析能力,廣泛應用於中心側 AI 推理場景。Atlas 800 推理伺服器(型號:3010 )則是基於 Intel 處理器的推理伺服器,最多可支援 7 個 Atlas 300I/V Pro ,支援 896 路高清視訊即時分析,廣泛應用於中心側 AI 推理場景。


圖表 15 Atlas 800 推理伺服器(型號:3000)

集群方面,Atlas 900 PoD 集群基礎單元搭載超 32 顆超強算力的鯕鵬 920 處理器,47U 高度可最大提供 20.4 PFLOPS FP16 AI 算力,採用液冷散熱,最大功耗為 46kw 。

Atlas 900 AI 叢集由數千顆昇騰訓練處理器構成,透過華為叢集通訊庫和作業調度平台,整合 HCCS 、  PCIe 和 RoCE 三種高速接口,充分釋放昇騰訓練處理器的強大效能。

其總算力最大可拓展至 3.2 EFLOPS ,全節點 200G 網路互聯。這可以讓研究人員更快的進行影像、語音、自然語言等 AI 模型訓練,更有效率的進行科學研究探索,加速自動駕駛的商用進程。


圖表 16 Atlas 900 PoD 示意圖 圖表 17 Atlas 900 PoD 拆解圖


圖表 18 Atlas 900 AI 集群

2 AI 生態並非只有 CUDA ,各地算力集群建設快速推進

2.1 AI 算力生態並非只有 CUDA

異質運算架構(CANN )是標英偉達的 CUDA + CuDNN 的核心軟體層,包括引擎、編譯器、執行器、算子函式庫等,承載電腦的單元為 AI 晶片,異質運算架構主要負責調度分配計算到對應的硬體上。

從層級來看,CANN 上承 AI 框架,下接 AI 處理器硬件,先進的異質架構使得神經網路執行過程的硬體互動時間有效縮短,從而實現對硬體效能的進一步利用。


圖表 19 Atlas 900 AI 集群

在 CANN 的基礎之上,昇騰提供了昇思深度學習框架,旨在實現易於開發、高效執行、全場景覆蓋三大目標。相容性上,適合包括昇騰系列產品、英偉達 NVIDIA 系列產品、Arm 系列的高通驍龍、華為麒麟的晶片等系列產品。

其中,易開發表現為 API 友善、調試難度較低;高效執行包括運算效率、資料預處理效率和分散式訓練效率;全場景則指框架同時支援雲端、邊緣以及端側場景。


圖表 20 昇騰計算產業生態

豐富的大模型庫,目前已收錄「紫東.太初」、「武漢.Luojia 」、「鵬程.盤古」、「鵬程.神農」、「空天·靈眸」等大模型,分別適用於多模態、遙感、中文自然語言、醫學、空天資訊化等領域。

以「鵬程.盤古」為例,作為業界首個千億級參數中文自然語言處理大模型,可支援知識問答、知識檢索、知識推理、閱讀理解等豐富的下游應用。

該模型由鵬城實驗室為首的技術團隊聯合攻關,首次基於「鵬城雲腦Ⅱ」和國產 MindSpore 框架的自動混合併行模式實現在 2048 卡算力集群上的大規模分佈式訓練,訓練出業界首個 2000 億參數以中文為核心的預訓練生成語言模型。

鵬程·盤古α預訓練模型支援豐富的場景應用,在知識問答、知識檢索、知識推理、閱讀理解等文本生成領域表現突出,具備很強的小樣本學習能力。

模型基於國產全端式軟硬體協同生態(MindSpore+CANN+昇騰 910+ModelArts )。


圖表 21 MindSpore 超大規模自動並行

2.2 智算中心建設快速推進,全國算力網絡正在形成

武漢人工智慧運算中心基於昇騰 AI 基礎軟硬體建設,於 2021 年 5 月 31 日正式完工並投入運營,上線即算力資源滿載使用。於 2022 年 2 月 7 日完成擴容,總算力達200P ,並再次飽和運作。

西安未來人工智慧計算中心於 2021 年 5 月正式啟動建設,建設週期近四個月,於2021 年 9 月 9 日正式上線運營,第一期包含 AI 算力 300P 、HPC 算力 8P 。

中原人工智慧運算中心,基於「黃河鯕鵬+昇騰技術」底座,是中原地區人工智慧產業的重大算力支援基礎設施。本計畫總投資 10 億元,於 2021 年 10 月 21 日正式上線。第一期建設規模為 100P AI 算力,未來將達到 300P AI 算力。截止到 2022 年底,該中心服務中原企業客戶 60 餘家,大學學院客戶 30 餘家,科學研究單位 10 餘家,同時還有省外活躍客戶百餘家,平均算力使用率約 90% 。

南京人工智慧計算中心,基於南京市委市政府的產業規劃,以及華為與江北新區共建昇騰產業的合作協議,南京人工智慧計算中心於 2022 年 5 月完成基礎平台建設,第一期規劃 40P 算力,上線即接近飽和,目前平均算力使用率在 95%以上。截止到 2022年 12 月,算力中心的應用已初具規模,與 200 多家合作夥伴推出超過 150 多個人工智慧解決方案。

成都智算中心包括算力達 300P 的人工智慧算力平台,以及城市智腦平台和科學研究創新平台,目前是西南部最大的人工智慧運算中心。正式營運以來,中心已與 80 餘家企業及科學研究團隊展開合作,平均算力利用率達 85%以上,實現上線即飽和營運。

杭州人工智慧計算中心,一期面積 2000 平方米,第一期規模 40P ,二期擴容後總規模將達到 140P 。計算中心採用自主可控的昇騰 AI 集群,為政府、企業、研究機構、校等提供公共普惠算力。該中心已於 2022 年 5 月 20 日在杭州市濱江區海創基地上線。


圖表 22 武漢人工智慧計算中心 圖表 23 西安人工智慧計算中心


圖表 24 中原人工智慧計算中心 圖表 25 南京人工智慧計算中心


圖表 26 成都智算中心 圖表 27 杭州人工智慧計算中心

3 昇騰夥伴網絡,五類定位建構產業矩陣

3.1 整機硬體夥伴:傳統伺服器大廠+新銳硬體加工廠商

對於整機硬體合作夥伴,昇騰社群對此有明確的定義:擁有自有品牌產品,能在昇騰產品基礎上二次開發或加工生產,並銷售與服務至最終用戶的合作夥伴

從官網標註的等級來看,主要分為領先級、優選級和認證級。其中包括伺服器產業領導者寶德、新華三、清華同方等,也包括 2020 年成立的華鯤振宇等新銳企業或生產主體,以及神州數位等和華為長期維持合作關係的通路端重點企業。其中部分合作夥伴已實現鯕鵬系列伺服器的量產出貨,具備長期客製化伺服器的生產能力。


圖表 28 昇騰生態夥伴-整機硬體夥伴

高度細化的定級標準,進一步印證市場規模。昇騰官方公佈了不同級別的整機硬體合作夥伴認證標準,其中對戰略級、領先級、優選級合作夥伴市場規模要求為大於等於20 億、10 億、5 億,營銷活動大於等於 12 、8 、6 次每年。以上要求一方面釋放出昇騰交易規模和市場體量的發展趨勢,另一方面也說明了昇騰正致力於發力行銷和產品打造。

此外,不同層級合作夥伴在價格優惠政策上也存在進階差異,更高階能夠獲得更優惠的價格政策,以及華為展間展示等權益。


圖表 29 昇騰整機硬體夥伴認證要求


圖表 30 昇騰整機硬體夥伴專屬權益


圖表 31 昇騰整機硬體夥伴通用權益

目前,昇騰整機硬體大致可分為訓練型伺服器和推理型伺服器兩大類。

訓練型伺服器方面:以寶德 PR420 為例,該機為四路鯤鵬訓練伺服器,搭載 4 枚鯤鵬 920 高效能通用處理器(基於 ARM v8 ),8 張昇騰 910 系列訓練加速卡,並支援2 個 PCIe 4.0 擴充插槽。本機具有最強算力密度、超高能效與高速網路頻寬等特性。

此伺服器廣泛應用於深度學習模型開發與訓練,適用於智慧城市、智慧醫療、天文探索、石油探勘等需要大算力的產業領域。


圖表 32 寶德自強訓練伺服器 PR420KI

推理型伺服器方面:以長江計算 G220K V2 為例,此機型搭載基於昇騰 310 的Atlas300I Pro 推理卡,最大支援 8 張,CPU 方面則選用兩枚鯕鵬 920 ,相較於訓練機型對於效能的高規格,推理機型更重視能效比和成本控制。

Atlas 300I Pro 單卡功耗僅72W ,為 Al 伺服器算力加速同時提供更優的能源效率比。在 8 張 Atlas 300I Pro 推理卡的支援下,整機可提供 1024 路高清視訊即時分析 (1080P 解析度 30FPS) 。


圖表 33 長江計算 G220K V2 推理伺服器

3.2 IHV 硬體夥伴:邊緣運算賦能千行百業

IHV 硬體廠商主要涉及邊緣運算硬件,用於工控終端、資料擷取、嵌入式智慧運算等場景,並且已經出現較大規模的場景落地。根據昇騰官網對 IHV 合作夥伴的定義,即能夠基於華為昇騰部件進行二次開發,形成自有品牌硬體產品並進行銷售的硬體夥伴。


圖表 34 IHV 硬體合作夥伴

以昇騰優選夥伴凌華科技為例,其邊緣運算盒子採用置華為昇騰 Atlas 200 AI 智慧型運算模組,整合高效能 Ascend 310 AI 處理器,可實現影像、影片等多種資料分析與推理計算,可廣泛用於智慧製造、安防、智慧交通、機器人、無人機等邊緣運算應用場景。以餐飲領域為例,一台邊緣盒子可擷取多路視訊監控,並對影像進行即時分析,辨識出不規範行為並上報給管理側。


圖表 35 凌華科技邊雲協同案例

3.3 應用軟體夥伴:電力與智慧城市等場景國產化落地

應用軟體夥伴:開發、銷售自有智慧財產權的應用程式、軟體、垂直細分應用程式等產品,能對接昇騰產品,有能力二次開發的軟體夥伴。目前來看,主要涵蓋智慧城市、智慧交通、電力資訊化等領域,有助於推動關鍵領域的硬體國產化,合作夥伴包括:華雁智科、以薩、雲天勵飛、格靈深瞳、雲端從科技、智洋創新等。


圖表 36 應用軟體合作夥伴

以薩視訊影像全目標結構化解決方案,對海量視訊資料實施高效、全目標、一體化解析,充分挖掘資料價值,賦能交通管理、市域治理等領域的多場景實戰應用。基於昇騰 AI ,此方案讓視訊影像資料分析處理能力由原來的 20 路提升到現在的 60 路,實現3 倍效能提高,達到業界領先水準。


圖表 37 以薩技術視訊影像結構化解決方案

4 昇騰產業鏈相關企業梳理

4.1 神州數碼:華為老牌合作夥伴,AI 伺服器產品先驅

神州數碼於 2020 年建成首個鯕鵬超算中心(廈門),旗下鯤泰系列產品契合中國企業信創需求,並完成了對國產中間件、數據庫、操作系統的適配,多次中標項目彰顯行業競爭力。

「鯤鵬+鯤泰」佈局國產設備賽道,核心技術解決「卡脖子」問題。2020 年初,公司加入華為鯕鵬生態系,加速佈局和升級自有品牌「神州鯤泰」從而打造「鯕鵬+鯤泰」系列產品。借力鯕鵬,公司伺服器產品運算能力以及耗能處於國產化 CPU 標竿水準。

2022 年公司發布神州鯤泰人工智慧推理伺服器,以「鯕鵬+昇騰」為核心,可提供 128個處理核心的算力,同時最大可支援 8 張華為 Atlas 300 推理卡。目前神州數位已取得各行業數位化解決方案和人工智慧數位化解決方案的實踐案例,在未來,其核心技術加速推動信創產品的發展。


圖表 38 神州數位旗下昇騰產品目錄

信創產品持續得標,品牌影響力逐漸提升。神州信創產品定位為:「華為鯕鵬 CPU 」為核心,以自身豐厚產業應用案例為輔助,建構自身信創產品生態,建構各產業應用平台。神州數位連續贏得「國家稅務總局 2021 年稅務系統線上批量集中採購電腦設備補充入圍項目」、 「廈門集美區鯕鵬等信創適配服務營運」、「中國移動 2021 年至 2022年人工智慧通用計算設備集中採購」、「中國移動 2021 年至 2022 年 PC 伺服器集中採購」項目等。


圖表 39 神州數位旗下昇騰產品目錄

股權激勵明確業績前瞻,高成長率凸顯投資價值。

1 )IT 分銷業務方面,公司持續實踐「數位中國」之理想,以生態體系為依托,緊抓產業熱點機遇,聚合更多的廠商和合作夥伴,為客戶提供更全更優的產品、方案和服務,在持續推動分銷業務複合成長的同時,賦能產業數位轉型和數位經濟發展。

2 )雲端服務方面,神州數位以建構雲端原生為基礎,打造開源化能力,向下聚合,向上服務於應用轉型管理,打造包括雲端管理服務(MSP )、數位化解決方案(ISV )、視訊雲產品及服務等數位化服務。

3 )對於信創服務方面,神州數碼堅持自主創新、生態聚合推出神州鯤泰系列產品,並迅速在政企、金融、運營商、互聯網、交通、能源等多個行業取得突破落地。


圖表 40 神州數位分業務營收狀況


圖表 41 神州數位分業務毛利率

4.2 同方股份:自主控制守門員,昇騰產品覆蓋廣泛

2022 年 4 月 16 日,同方電腦與華為技術有限公司在京舉行昇騰萬裡夥伴授牌儀式,同方正式成為昇騰整機硬體合作夥伴,並簽署 Powered by Ascend (PBA) 品牌授權協議,共同推進人工智慧產業繁榮發展。

從產品分佈來看,訓練型、推理型伺服器均有涉及,搭配 cpu 包括鯕鵬、飛騰、英特爾系列,以 2U 伺服器為主。此外,同方也已推出了基於鯕鵬的個人電腦、儲存型伺服器、通用型伺服器等一系列產品,形成了完整的產品矩陣。


圖表 42 同方股份旗下昇騰產品目錄

從合作案例來看,同方合作的昇騰軟硬體能夠順利完成通用 AI 系統的國產替代,並且展現出較高辨識準確度。


圖表 43 同方昇騰合作案例一 圖表 44 同方昇騰合作案例二

4.3 科大訊飛:星火一體機,訊飛星火將與昇騰 AI 強強聯合

星火一體機可私有化部署大模型,實現專屬、安全、自主可控。今年 7 月 6 日,科大訊飛公佈訊飛星火將與昇騰 AI 強強聯合,打造以中國自主創新為基礎的通用智慧新底座。這次發表會,科大訊飛與華為再度合作,聯合發布星火一體機,讓企業可以在國產自主創新的平台上,更方便、更自主、更安全可控地私有化部署大模型。

本設備可提供對話開發、任務編排、插件執行、知識存取、提示工程等 5 種客製化最佳化模式,以及辦公室、程式碼、客服、維運、行銷、採購等 10 種以上即開即用的豐富場景包,支援 3 種模型尺寸供使用者選擇。劉慶峰表示,有了這些能力,就可以使得每個企業、每個產業、每一所學校、每個醫院都有機會建構自己的專屬大模型。目前,訊飛星火已完成的在金融、政務、汽車等領域的 9 個專屬大模型的數據顯示,在場景任務優化和私域知識增強等方面平均效果能夠提升 20% 。


圖表 45 同方股份旗下昇騰產品目錄

4.4 潤和軟體:智能物聯領域的昇騰 AI 落地

潤和軟體打造的危化品儲存室智慧安全管控解決方案借助於昇思 MindSpore AI 框架快速訓練視覺演算法模型,整合華為昇騰強大 AI 算力與潤和智慧視覺分析引擎,快速落地作業安全規範的智能化。對防護要求、作業流程等紙本化規範進行智慧化改造,預防此期間可能發生的違規操作,為作業人員的安全提供堅實保障。

潤和軟體提供的智慧安全管控解決方案,在規定的監管區域內,進行人員檢測,並檢查作業人員裝備規範性,包括作業服、呼吸器、氧氣面罩等,同時分析穿戴序列,對作業時間進行監管。目前,該方案已實現規模化應用,在某石化企業上線後,迅速將其月均違規作業次數降為 0 。


圖表 46 潤和軟體智慧視覺分析引擎

(AI雲原生智慧算力架構)