在數位化浪潮的推動下,伺服器市場持續蓬勃發展,各大廠商紛紛加大投入,力求在這場激烈的競爭中佔據一席之地。
01 伺服器市場,強勁增長
AI的到來,引爆了伺服器市場。
TechInsights最新資料顯示,到2028年,伺服器市場規模將達到2730億美元,年複合增長率為18%。要知道,在2022年,全球伺服器市場規模為1215.8億美元,這一數值在當下時點已不容小覷,然而這僅僅是2028年的一半。
到2028年,專為AI應用設計的伺服器將佔市場份額的59%,復合年增長率為49%。
再看中國市場。
中國正成為全球最主要的伺服器增長市場。2021年中國伺服器市場規模達到250.9億美元;2022年中國伺服器市場規模為273.4億美元。
根據IDC、浪潮資訊、清華大學全球產業研究院聯合編制的《2022—2023全球計算力指數評估報告》顯示,2022年,中國整體伺服器市場規模保持6.9%的正增長,佔全球市場比重達25%,2017年至2022年的複合增長率達48.8%。
AI伺服器方面,IDC預計2023年中國AI伺服器市場規模將達到91億美元,同比增長82.5%;2027年將達到134億美元,年均複合增長率為21.8%。
在伺服器市場持續繁榮的當下,CPU的地位愈發凸顯。CPU作為其核心部件,其性能和功耗直接影響著伺服器的整體表現,也因此成為市場關注的焦點。
02 伺服器CPU架構之爭
與GPU不同,CPU主要完成的是通用計算和邏輯控制的工作,打個比方,如果GPU是一個高效的執行者,那麼CPU可以看做一個能力全面的調度者。
CPU作為電腦系統運算和控制的核心,是資訊處理、程式執行的最終執行單元。
目前CPU行業主要由三大生態體系主導:
一是基於x86指令系統和Windows作業系統的Wintel體系,主要用於伺服器與電腦等;在Wintel體系中,CPU廠商生產晶片,作業系統廠商提供作業系統。
二是基於Arm指令系統和Android作業系統的AA體系,主要用於低功耗和高度節能的應用,例如雲端運算伺服器和邊緣計算裝置。在AA體系中,CPU廠商對晶片或系統廠商進行指令系統或IP核授權,作業系統廠商提供基礎版作業系統,由整機廠商定製專用晶片和發行版作業系統。
在算力多元化的新時代,儘管x86架構依然佔據著伺服器CPU市場超九成的份額,穩坐行業巨頭之位,但競爭從未停止。
近年來,ARM也正加速進入伺服器領域,這一表現在中國市場尤為明顯。按照Gartner的資料,2023年一季度全球Arm伺服器出貨量佔比是7%,如果以全球出貨量330.5萬台來估算,那麼Arm伺服器出貨量大約在23.135萬台左右,其中約40%即9.254萬台是出口到了中國市場,在中國伺服器市場整體出貨量達89.7萬台的背景下,佔到了10.32%。
除了我們熟知的x86和Arm,RISC-V這一新興架構正以其開放、靈活的特性,為伺服器晶片提供更加廣闊的發展機遇。RISC-V以其模組化、可擴展的設計,允許開發者根據具體需求定製指令集,從而打造出高效、節能且高度適配特定應用場景的伺服器晶片。
一起看看不同賽道的競爭格局。
03 伺服器CPU晶片,激戰打響
x86架構
首先看x86架構。基於x86架構的伺服器CPU市場中的主要玩家有英特爾、AMD以及中國大陸的海光、兆芯等。
AMD在最近幾年的表現極為強勁。根據MercuryResearch最新發佈的x86處理器市場份額資料顯示,2024年第一季度AMD在伺服器、桌面和移動端均獲得了更高的市場份額,分別達23.6%、23.9%、19.3%。
值得注意的是,在2021年第一季度AMD伺服器市場份額只有8.9%。
英特爾是x86伺服器CPU領域毫無爭議的霸主,不過,即便是有著多年深厚積累的英特爾,也不得不面對來自AMD的市場侵蝕。
中國國產廠商海光主攻伺服器晶片,而兆芯則個人PC、伺服器都有涉及。
海光資訊是中國國產高端CPU的領軍者。海光CPU主要面向複雜邏輯計算、多工調度等通用處理器應用場景需求,相容國際主流x86處理器架構和技術路線。海光CPU已經有海光一號、海光二號、海光三號實現商業化,公司目前在售的海光CPU產品主要為海光三號。
從應用場景角度看,公司將海光CPU產品分為7000、5000和3000三個系列,不同系列具有不同的性能。7000系列主要應用於高端伺服器,主要面向資料中心、雲端運算等複雜應用領域。5000系列主要面向政務、企業和教育領域的資訊化建設中的中低端伺服器需求。3000系列主要應用於工作站和邊緣計算伺服器,面向入門級計算領域。其中7000系列CPU是海光收入的主要構成。
兆芯也是x86伺服器CPU市場的參與者,目前兆芯已經形成了開先系列桌面處理器和開勝系列伺服器處理器兩大產品線。伺服器處理器的產品系列有開勝KH-40000系列處理器、開勝KH-30000系列處理器、開勝KH-20000系列處理器、開勝ZX-C+FC-1080/1081系列處理器。
開勝 KH-40000系列伺服器處理器,採用“永豐”自主核心微架構,支援自主互連技術ZPI3.0,單顆處理器整合最高32核心,具備64MB快取記憶體,支援8通道DDR4記憶體,適用於雲端運算、巨量資料分析、視訊處理、資料庫備份、高性能儲存,以及超融合一體機等解決方案的搭建和部署。
基於x86架構和生態優勢,兆芯在黨政和商用領域應用廣泛,尤其在PC產業上使用Wintel生態,優勢明顯。不過由於架構版權問題,導致兆芯過去的產品性能相較同期競品仍有所差距;在後續的推進中,兆芯不僅著眼於性能最佳化,還堅定地致力於提升自主可控能力,奮力追趕行業步伐。
今年年初,基於兆芯自研處理器開勝KH-40000/32的雙路通用超雲伺服器正式落地,型號為R3210Z11。
隨著中國政府對半導體產業的持續支援,以及國內外市場需求的增長,兆芯CPU有望在全球CPU市場中佔據一席之地。
Arm架構入局者愈來愈多
再看Arm架構。基於Arm架構的伺服器CPU市場中的主要玩家有華為鯤鵬、飛騰等。
在通用計算處理器領域,華為鯤鵬在2014年發佈鯤鵬912處理器,2016年發佈鯤鵬916處理器。2019年1月華為正式發佈鯤鵬920晶片。
鯤鵬920是目前業界領先的ARM-based處理器。該處理器採用7nm製造工藝,由華為公司自主設計完成。通過最佳化分支預測演算法、提升運算單元數量、改進記憶體子系統架構等一系列微架構設計,大幅提高處理器性能。典型主頻下,SPECintBenchmark評分超過930,超出業界標竿25%。同時,能效比優於業界標竿30%。鯤鵬920以更低功耗為資料中心提供更強性能。
得益於強大的計算能力、高並行處理能力和優秀的能效比,鯤鵬伺服器主要應用於雲端運算、巨量資料分析、資料庫、AI訓練與推理等多種場景,並建構了從底層晶片到作業系統、再到上層應用軟體的全端中國國產化解決方案。
中國移動2021-2022年PC伺服器集采項目中,採用海光晶片的伺服器達59982台,佔比20.90%,採用鯤鵬晶片的伺服器達58901台,佔比20.53%,鯤鵬與海光伺服器招標數量接近1:1,整體中國國產伺服器佔比高達41.43%。
不僅是中國移動,在中國電信AI算力伺服器(2023-2024年)集采項目中,中國國產伺服器的採購數量佔比亦達47.5%。從金額來看,超80億元的採購總額中,鯤鵬伺服器約佔28億元。今年3月,中國移動2024年PC伺服器集采中標公告顯示,華為鯤鵬再次佔據較大份額。
飛騰是PKS(飛騰P、麒麟K、安全S)生態體系主導者,其黨政市場佔有率高。飛騰晶片產品具有譜系全、性能高、生態完善、自主化程度高等特點,目前主要包括高性能伺服器CPU(飛騰騰雲S系列)、高效能桌面CPU(飛騰騰銳D系列)、高端嵌入式CPU(飛騰騰瓏E系列)和飛騰套片四大系列,為從端到雲的各型裝置提供核心算力支撐。
基於飛騰CPU的產品在國內政務辦公、金融、電信、電力、能源、軌交、教育和醫療等行業資訊系統領域已實現批次應用。
同時,飛騰聯合5000家生態夥伴,打造3200余種硬體方案,適配近30000款軟體,相容200萬級移動APP,建構了國內最龐大的資訊產業生態,有力支撐了中國自主資訊體系的發展。飛騰在全國政府信創中標超過300萬片,市佔率超過50%,有力支撐了國家信創工程推進,並逐步向更複雜的電子政務、智慧政府領域延伸。在電信行業,搭載飛騰CPU的伺服器在三大營運商的雲資源池中得到廣泛部署,服務了大量中國國產化項目。
近年來,ARM架構的興起下,許多巨頭紛紛開始自研ARM架構的伺服器晶片,包括國外的亞馬遜、Google甚至微軟,國內的騰訊、阿里巴巴等。
ARM能夠擠進伺服器市場的核心優勢在於,基於ARM的伺服器可以支援多樣化和快速變化的工作負載,並且更具可擴展性和成本效益;其次,對於不同的利基型市場能夠提供更高的定製化,生態系統也更靈活;另外,ARM架構伺服器體積相對較小,符合現今微型資料中心的需求。
技術變化帶來的機會是全球性的,不限於地域,不限於公司規模,除了這些龍頭企業還有諸多初創公司邁進ARM CPU的圈子,包括啟靈芯、鴻鈞微、遇賢微等。
然而,Arm在伺服器CPU這條道路上還有很多困難需要面對,在這之中自然也有不少初創公司倒在這波熱潮中,比如前面提到的啟靈芯。這些公司需要克服技術、市場、生態等多方面的挑戰,才能在競爭激烈的伺服器市場中立足。
自研指令集的龍芯和申威
除了以上兩大架構,中國晶片市場還有一些廠商通過其他架構不斷研發與創新並取得了不錯的成績,比如分別走MIPS、Alpha路線的龍芯中科和申威,他們不僅通過獨特的架構設計推出了高性能的晶片產品,而且在自主可控方面也取得了較高的水平。
龍芯中科是中國科學院計算所自主研發的通用CPU,採用自主LoongISA指令系統,相容MIPS指令,所有IP模組皆為自主設計,擁有片內安全機制,可信性高。龍芯處理器以32位核64位單核及多核CPU/SOC為主,主要面向高端嵌入式、個人電腦、伺服器和高性能機等應用。
龍芯產品體系分為三大系列,龍芯1號系列為低功耗、低成本的專用嵌入式SoC或MCU處理器,主要面向嵌入式專用應用領域,如物聯終端、儀器裝置、資料採集等,主要根據需求定製;龍芯2號系列為低功耗通用處理器,採用單晶片SoC設計,應用場景面向工業控制與終端等領域,如網路裝置、行業終端、智能製造等,定位於Intel的凌動系列;龍芯3號系列為高性能通用處理器,通常整合4個及以上64位高性能處理器核,與橋片配套使用,應用場景面向桌面和伺服器等資訊化領域,對標Intel的酷睿/至強系列。
申威處理器以Alpha指令集為基礎進行拓展,高度自主可控。申威在研發出第一代基於Alpha指令集的CPU後,將指令集取代為自研的自主可控申威64位指令集,完全區別於原有Alpha指令集。申威處理器專注於高性能計算,尤其是在伺服器領域,浮點運算算力與同期外國處理器相當。申威SW26010是中國首個採用中國國產自研架構且性能強大的電腦晶片。
申威在伺服器領域向上至超算領域的應用場景中性能強大,優勢較為明顯。2016年6月20日,搭載了40960顆申威SW26010並運行中國國產作業系統神威睿思的神威太湖之光獲得全球超級電腦第一名,神威太湖之光峰值計算速度達每秒12.54億億次,是全球首台峰值計算速度超過十億億次的超級電腦,持續性能為每秒9.3億億次,軟體硬體平行,均為申威自主設計。
04 越來越多廠商擁抱RISC-V
RISC-V架構在最近兩年異常火熱。一位三年前重點關注ArmCPU創業公司的投資人表示:“我很久沒看ArmCPU的創業公司了,現在CPU的創業方向是RISC-V。”
RISC-V如何成為一眾廠商的追捧呢?
中國工程院院士倪光南在達摩院玄鐵RISC-V生態大會上提到,對比x86,RISC-V可能從以下兩個方面實現超越:
其一,今天x86架構仍壟斷著伺服器和桌面領域,這是因為過去幾十年裡,x86架構在這些領域形成了強大的生態,以至於其他架構因生態較為薄弱而不能取代它,假以時日這種情況會發生變化。另一方面,現在的x86架構也已經不是純粹的CISC了,實際上在它內部也用硬體將某些CISC指令轉化為它內部的RISC指令再予以執行。
其二, 在後PC時代,CPU架構的競爭力不僅要體現在性能上,還需在晶片面積、能耗、價格、研發周期、生態支援等等方面全方位地體現出來。以此衡量,x86架構不但在新興領域沒有優勢,而且在傳統領域市場總量也不會有多大增長,甚至其份額也可能被RISC-V所蠶食。
從市場的視角審視,RISC-V不僅契合了中國對於晶片自主研發與掌控的戰略需求,同時也為專用伺服器市場帶來了前所未有的定製化機遇。隨著技術發展的深入,當傳統CPU的性能提升遭遇瓶頸時,市場將逐漸轉向更為精細化和專業化的定製化需求,這將成為RISC-V伺服器進一步拓展其應用領域的契機。
目前國內外已有不少公司進入了RISC-V伺服器賽道,不過其中部分公司主要涉及伺服器中的AI加速晶片。IP公司包括阿里達摩院、SiFive、Ventana、Tenstorrent等;晶片公司包括算能、進迭時空、希姆計算、藍芯算力、微核芯、超睿科技等。
2019年7月,阿里達摩院面向高性能市場發佈了RISC-V處理器核—玄鐵C910,後來基於玄鐵C910設計了曳影1520SoC。
2021年12月,SiFive發佈了IP核P650,據瞭解,該產品配有128KB一級快取、2MB二級快取、16MB三級快取(16核)等組態,性能指標為11.xSPECInt/GHz,對標ARMCortex-A77,可用於資料中心等場景。
去年3月,北京算能科技發佈了首款中國國產64核RISC-V伺服器處理器SOPHONSG2042,隨後在8月的第三屆滴水湖中國RISC-V產業論壇上又首次披露了其新一代的RISC-V伺服器晶片——SOPHONSG2044的相關資訊。
VentanaMicroSystems成立於2018年,總部位於美國庫比蒂諾。2022年12月,Ventana公司就曾發佈了全球首款基於RISC-V架構的伺服器CPU——VeyronV1。而在2023RISC-V峰會上,Ventana又發佈了其第二代伺服器CPU——VeyronV2,在指令擴展、核心設計、互聯標準、製程工藝等眾多方面進行了全面升級,官方宣稱其性能超越了AMD的高端伺服器晶片Epyc9754,堪稱最強RISC-V伺服器CPU。
目前,開源RISC-V在中國具有超大規模的市場、豐富的應用場景和龐大的工程師群體推動下,已成為中國最受歡迎的CPU晶片架構之一。然而RISC-V和x86、ARM生態上還是有一些差距,無論從軟體規模上還是性能最佳化程度上,都還沒有達到x86和ARM的水平。因此,RISC-V進入伺服器市場還存在諸多挑戰。
從創新性、成本乃至性能等角度來看,其實Arm以及未來的RISC-V都會是極具競爭力的伺服器CPU架構,可現今的伺服器仍是一個固執且切入周期較長的市場,x86目前尚未觸及設計和工藝的瓶頸,即便有了AI加速器、DPU等元件的加入,伺服器架構並沒有發生劇變,所以x86在未來的十年內依然將佔據主導地位。
只不過隨著設計方法、製造工藝的同步,Arm已經在該領域開啟了較為成熟的商業化處理程序,隨著時間的推移,市場份額會逐漸升高。
倪光南曾多次表示,中國在晶片產業發展過程中應當重視RISC-V架構。至於何時RISC-V能真正有望來到“三分天下”,業內人士表示如果Arm授權體系出現一些變數,同時RISC-V的高性能進展更順利、核性能提升很快,生態進展也很順利的前提下,很快Arm就會與RISC-V正面交鋒。
當然,RISC-V作為後來者,面臨的挑戰還有很多。除了生態建構依然在完善處理程序中,這種開源架構也要避免類似此前MIPS架構所帶來的分散化、碎片化難題。
05 中國國產CPU迎來窗口期
中信證券表示,未來三年可能是中國國產算力晶片發展關鍵窗口期,目前中國國產算力硬體理論性能可接近國際主流,“生態優勢有望形成正反饋循環,進而支撐市場地位持續領先”。
在2023年11月28日舉行的2023龍芯產品發佈暨使用者大會上,新一代通用處理器龍芯3A6000發佈。北京市經信局副局長顧瑾栩表示,龍芯此次發佈的自主通用處理器3A6000性能追平國際先進水平,作為北京市技術創新企業的代表,其全面發力加速實現自主資訊技術的重大跨越,為實現科技自立自強提供堅實支撐。
工業和資訊化部電子資訊司副司長史惠康表示,3A6000處理器的推出說明中國國產CPU在自主可控程度和產品性能上已雙雙達到新高度,也證明了國內有能力在自研CPU架構上做出一流的產品。並希望能加快先進封裝、記憶體一體化整合等相關的技術攻關,不斷推出具有國際競爭力的產品。 (半導體產業縱橫)
