微軟自研晶片,打響拋棄輝達第二槍

在資料中心領域,英偉達(輝達)除了能提供廣為人知的AI晶片——GPU以外,他們在產品「百寶箱」中還能提供一系列其他的產品,為客戶提供服務。例如DPU,就是其一極具競爭力的產品?所謂DPU,依照英偉達所說,是一種新型可程式處理器,集三個關鍵要素於一身。 DPU 是一種SOC ( System On Chip ,系統單晶片),它結合了:

1. 業界標準的、高效能及軟體可編程的多核心CPU ,通常基於已應用廣泛的Arm 架構,與其他的SOC 元件密切配合。

2. 高效能網路介面,能以線速或網路中的可用速度解析、處理數據,並有效率地將數據傳輸到GPU 和CPU 。

3. 各種靈活且可編程的加速引擎, 為AI 、機器學習、安全、電信和儲存等應用作業負載,並提升其效能。


所有這些DPU 功能對於實現安全的、裸機的、原生雲端運算的下一代雲端大規模運算至關重要。

根據數據,2020年全球DPU產業市場規模達30.5億美元,預計2025年全球DPU產業市場規模將超過245.3億美元,期間CAGR高達51.73%。

正因為擁有如此效能和市場前景,除了英偉達以外,不少第三方晶片供應商正在進入這個市場。例如英特爾、AMD、Marvell等知名晶片巨頭。中國如雲豹智能、中科能測數和雲脈芯聯等新興廠商也躍躍欲試。

但同時,那些雲端廠商也紛紛入局,微軟就是最新的一個。


微軟,入局DPU

根據the information透露,微軟正在開發一款新的網路卡,可以提高其Maia AI 伺服器晶片的效能,並有可能減少該公司對晶片設計商Nvidia的依賴。

報導引述知情人士的話稱,微軟執行長薩蒂亞·納德拉(Satya Nadella ) 已任命網路設備開發商瞻博網路(Juniper Networks) 聯合創始人普拉迪普·辛杜(Pradeep Sindhu) 來領導網卡工作。

報導補充說,這款新網卡類似於Nvidia 的ConnectX-7 卡。

NVIDIA ConnectX-7 網路卡提供最多4 個連接埠和最高400Gb/s 的吞吐量,可為雲端、電信、AI 和企業工作負載提供資料中心規模的硬體加速網路、儲存、安全和管理服務。 ConnectX-7 透過加速交換和封包處理(ASAP2)、進階RoCE、GPUDirect Storage,以及用於TLS、IPsec 和MACsec 加密和解密的內嵌硬體加速等功能,為敏捷、高效能網路解決方案提供支援。 ConnectX-7 使組織能夠在高頻寬和高密度環境中滿足當前和未來的網路需求。



為了協調工作,組成人工智慧叢集的伺服器需要能夠共享儲存在各自記憶體池中的資料。資料共享請求通常必須經過伺服器的中央處理單元。 Nvidia 的ConnectX-7 轉接器包含一種名為RDMA 的技術,可繞過CPU,從而顯著加快資料擷取速度。

該器件還具有其他一些性能優化功能。值得注意的是,它可以執行網路安全任務,例如加密資料流量,否則這些任務將由伺服器的CPU 執行,從而為應用程式提供更多的CPU 容量。 ConnectX-7 也卸載了檢測資料傳輸錯誤所涉及的一些計算。

來到微軟方面,他們之前曾在一篇文章中談到了關於DPU的使用:「SmartNIC 或資料處理單元(DPU) 帶來了加倍發揮軟體定義基礎設施優勢的機會,而無需犧牲(虛擬機)VM或容器中的業務線應用程式所需的主機資源。借助DPU,我們可以啟用SR-IOV,消除合成資料路徑產生的主機CPU 消耗,同時享受SDN 的優勢。隨著時間的推移,我們預計DPU 將提供更大的優勢,並重新定義我們的旗艦邊緣產品(例如Azure Stack HCI)的主機架構。”

在同一篇部落格中,微軟以英偉達的產品為例,講述了自己在網路卡上面的一些實踐與優勢。而在這個產品出來以後。則是繼自研AI晶片Maia之外,微軟打響拋棄英偉達晶片依賴的第二槍。

對微軟來說,除了自己原本的團隊以外,在去年收購的Fungible,是公司進軍這個市場的另一場依仗。


Fungible,微軟的底氣

微軟在收購Fungible的公告中說,Fungible 一家可組合基礎設施供應商,旨在透過高效、低功耗的資料處理單元(DPU) 加速資料中心的網路和儲存效能。 Fungible的技術有助於實現高效能、可擴展、分解、橫向擴展的資料中心基礎設施,並具有可靠性和安全性。

從Fungible的背景看來,這單收購對其DPU業務無疑是如虎添翼。知名半導體分析師Dylan Patel曾寫道,Fungible 曾經是最熱門的半導體新創公司之一Fungible 是第一家針對雲端級DPU 的商業晶片公司,先於英特爾、Nvidia、Pensando (AMD) 和Marvell。

而作為一家致力於開發和建構資料處理單元(DPU) 晶片的廠商,Fungible擁有一個夢幻團隊。創辦人Pradeep Sindhu 和Bertrand Serlet 都擁有傑出的科技背景。 Sindhu 是瞻博網路(Juniper Networks) 的創始執行長兼董事長,然後是副董事長、首席技術長和首席科學家,後來加入了新創公司Fungible。 Serlet 曾任蘋果軟體工程資深副總裁,之後創立了消費者雲端儲存業務Upthere,該公司於2017 年被西部數據收購。在此之前,他曾擔任蘋果軟體工程資深副總裁、史蒂夫‧賈伯斯旗下NeXT 的軟體工程總監。



Fungible 認為,DPU 可以解決資料中心效率低下的五個根本原因。所有資料中心計算均透過資料包進行。網路、儲存、虛擬化和安全堆疊透過資料包進行分發。因此,有比將所有內容轉移到x86 系統上更有效的方法來將計算和資料結合在一起並執行工作。



Fungible指出,DPU 本質上一側是PCIe,另一側是乙太網路。對於這四個主要的超分解構建塊,其DPU 提供了一個「TrueFabric」技術,讓人們可以將所有這些元素帶入網路。對於那些具有網絡背景的人來說,一切最終都會回到具有連接設備的網絡,這與那些開始構建更大的CPU 或GPU 的人不同。



據介紹,TrueFabric 是一種大規模的IP-over-Ethernet 結構協議,可提供完整的網路橫斷面頻寬,具有低平均和尾部延遲、端對端QoS、無擁塞連接性以及伺服器節點之間的安全性。 TrueFabric協定完全符合標準,並可與乙太網路上的TCP/IP 互通,確保資料中心SpineLeaf 網路可以採用標準離線建構架子乙太網路交換器。

具體到產品方面,Fungible開發了兩款令人印象深刻的DPU晶片:用於儲存、分析、人工智慧伺服器或安全設備使用的設備前端F1,以及用於裸機伺服器虛擬化、節點安全、儲存啟動器、本地實例儲存和網路網路虛擬化的伺服器為基礎的S1。



首先看F1方面,如圖所示,我們可以看到一組八個資料集群,它們被分成8x 24 個執行緒集群。有一個用於晶片安全和控制平面的控制集群。 F1 DPU 具有800Gbps 網路速度,例如8x 100GbE。有64 個PCIe Gen3/Gen4 通道分為四個x16 主機;資料集群基於具有SMT=4設計的MIPS核心。這意味著每個資料集群有24 個線程,加上它們的本地快取、加速器以及與更大晶片結構的連接。該系統具有8GB 高速HBM2 記憶體以及DDR4 ECC 記憶體控制器;它還可以支援NVDIMM-N,這非常有趣,因為它有效地在DPU 層級添加了持久記憶體功能。


來到S1方面,據介紹,這是Fungible DPU系列專用處理器中的第二個設備,針對以資料為中心的計算進行了最佳化。作為業界最靈活的200 Gbps DPU,S1能夠比通用CPU 更有效率地執行以資料為中心的運算。 S1DPU 從主機伺服器中的x86 核心完全卸載整個儲存、網路、安全性和虛擬化堆疊,從而釋放超過50% 的x86 CPU 週期來運行應用程式工作負載。

Fungible表示,雖然F1 DPU 專為儲存、安全、AI 和分析伺服器等高效能獨立裝置而設計,但S1 DPU 在標準PCIe 適配器的佔用空間和功率範圍內最大限度地提高了效能。 S1 先進的SoC 架構整合了運行完全分離的控制平面和資料平面的多核心處理器叢集。這些集群透過快速片上網路(NoC) 互連到精心挑選的硬體加速器區塊集合。 SoC 透過標準乙太網路連接埠和支援端點(EP) SR-IOV 和Root Complex (RC) 功能的PCIeGen3/Gen 4 控制器與外部元件互動。

雖然開始表現驚艷,但Dylan Patel在其文章中披露,該公司從2022年8月該公司在8 月份裁員,並在當年11 月份縮減產品線後,放棄了其可組合基礎設施的雄心,專注於DPU 增強型NVMe/TCP 儲存陣列。依照知情人士所說,之所以會出現這樣的結果,是因為Fungible想要關注的(儲存)市場已經被財力雄厚、產品非常成熟的成熟企業所飽和。這對他們來說將是一個挑戰。

Fungible在回應媒體提問時也表示:「早在2020年,Fungible 決定透過收購和有機開發,以更高級別的可組合性軟體解決方案來增強其DPU 產品組合。儘管我們盡了最大努力,但與Fungible 基於DPU 的儲存技術所取得的成功相比,Fungible 仍無法在編排(orchestration)領域取得成功。這促使我們將工作重點放在由Fungible DPU 實現的橫向擴展存儲上,並可在我們的Fungible 存儲在集群解決方案中使用,以推動公司的成功。”

但最後,如Dylan Patel所說,在多方籌集資金未果之後,Fungible曾想出售給Meta,但最終他們無法獲得任何支持。具體到微軟方面,這家雲端巨頭最初考慮與Fungible 進行客製化晶片交易,但最終決定以低價收購該公司、員工和智慧財產權。

於是,產生了文章開頭的故事。


DPU,機會在哪裡?

DPU一開始光芒四射,但隨著明星新貴被收購,雲端巨頭和晶片巨頭紛紛殺入之後,其前景似乎有了更多的不確定性。如blocksandfiles在早前透露,DPU新創公司Nebulon或已經被英偉達之前,而在Fungible之前,明星公司Mellanox被英偉達收購,AMD也拿下了Pensando。

雲端廠商方面,AWS擁有內部Nitro技術;阿里雲有神龍;華為也有自研DPU產品。再加上之前說到的DPU晶片廠商,由此可見,對於DPU廠商來說,留給他們的機會其實不是太多。有消息人士表示,在他們看來,在DPU方面,可組合基礎設施和其他晶片開發新創公司有三種潛在的市場途徑:

1.建立可組合的基礎設施公司;

2.成為其他OEM、ODM 和雲端的軍火商,提供組件和隨附軟體;

3.建造一個特定的盒子,例如儲存或GPU 伺服器;


Blocksandfiles在文章中也強調:

DPU 市場已被證明是一個難以攻克的難題。大型伺服器供應商相對較少:戴爾、HPE、聯想、超微,以及落後一些的思科。如果其中一個或多個採用您的DPU 作為標準組件,您就有很大機會成為一般市場供應商。但從DPU 新創公司Fungible 和Pensando的發展看來,這並沒有發生。

如果非常大的伺服器買家(例如超大規模供應商)如果不直接收購業務,也可以採用供應商的DPU(Fungible 就發生了這種情況)。微軟在2020年底以1.9億美元的價格收購了它。當這類企業被收購時,它們就成為內部系統組件供應商,而不是一般市場供應商。

此外,處理器供應商可以開發自己的DPU——Intel及其IPU;Nvidia 與BlueField 合作,或收購DPU 新創公司,就像AMD在2022 年4 月以19 億美元收購Pensando一樣。這使得Kalray和Nebulon 在不願採用的伺服器OEM 市場上難以銷售DPU 產品,企業也不清楚DPU 的好處採用專有的基礎設施技術,背後沒有大而可信的名字。在這樣的背景下,小小的晶片公司如何與Intel、AMD、Nvidia 競爭?

“總而言之,一般的DPU 市場尚未出現”,Blocksandfiles總結說。(半導體產業觀察)


參考連結

1. https://blocksandfiles.com/2024/02/13/nebulons-strange-capers/

2. https://www.servethehome.com/fungible-f1-dpu-for-distributed-compute/