一顆小小的Retimer晶片新戰爭

由AI伺服器這波浪潮催生下的Retimer晶片需求,Astera Labs公司是目前最大的獲利者。該公司的retimer晶片已悄悄應用於80%以上的AI伺服器。國際大的CPU和GPU晶片廠商AMD、Intel和NVIDIA等都是他的客戶。 2024年3月19日,Astera Labs宣布首次公開發行(IPO),在人工智慧的熱情下,其估值從45億美元逐漸上升到51.8億美元。據了解,該公司也獲得了英特爾的創投部門的青睞,在B輪融資中就投資了Astera Labs。


人工智慧又帶火一枚晶片。

在人工智慧的淘金熱中,輝達吃肉,小型關鍵參與者喝湯。這次我們要說的是正發力在Retimer這個小型晶片的供應商。目前一台典型的配8塊GPU的主AI伺服器需要8顆甚至16顆PCIe 5.0 Retimer晶片。


什麼是Retimer?不為人知的Retimer,高速互連背後的功臣

在現今的AI伺服器中,通常會有多個Retimer,事實上,每個加速卡內部都包含一個重定時器。這點可以從2022年10月Meta Platforms的「Grand Teton」AI系統中窺見一斑。 The nextplatform所發表的最新框圖顯示了交換器和重定時器在Grand Teton 系統中的使用情況。從圖中可以看出,交換器和Retimer的數量是相同的,只是拓樸結構有所不同。


那什麼是Retimer?它的作用是什麼?

Retimer的出現是PCIe發展到某一階段的必然產物。在PCIe 4.0及更早版本之前,資料傳輸速率相對較低,對訊號完整性的要求不高。但到了PCIe 5.0時代,資料傳輸速率提高到32GT/s,訊號衰減和抖動問題開始突出。 PCIe 6.0實現了更高的傳輸速度,達到64GT/s,是PCIe 5.0的兩倍。

在PCIe技術中,隨著資料傳輸速率的提高,插入損耗也會增加。 PCIe 規範有精確的插入損耗預算,如下圖所示,PCIe 6.0版本的插入損耗預算為32dB,意思是在設計時必須確保訊號在傳輸過程中的總損失不超過32dB,以保持訊號品質;在滿足在插入損耗預算的情況下,對於PCIe 6.0而言,PCB電路板的最大走線長度為3.4英吋(約8.64公分),超過這個長度可能會導致訊號品質下降,影響資料傳輸的可靠性。

上圖顯示了不同PCIe代的插入損耗和PCB的最大走線長度


而且一個不可忽視的變化是,當今的AI伺服器由於配備了多個GPU和大型NVMe儲存陣列,其機箱尺寸通常比現在的1U伺服器在垂直和水平方向上都大得多。這就要求更長的PCIe傳輸距離,但PCIe Gen6能夠支援的最長距離卻在減少。


(圖片來源:Astera Labs)


如何解決PCIe訊號鏈路的插入損耗問題,提高PCIe訊號傳輸距離是業界面臨的重要問題。

一種想法是選用低損的PCB,但這成本高昂。光是主機板就可能會帶來較大的成本增加,而且並不能有效覆蓋多連接器應用場景。例如,PCB材料「Megtron 6」的成本約為最受歡迎且最具成本效益的PCB材料「FR4」的七倍;

另一種想法就是引入適當的鏈路擴展器件如Retimer。使用PCIe Retimer晶片,採用類比訊號與數位訊號調理技術、重定時技術,來補償頻道損耗並消除各種抖動的影響,進而提升PCIe訊號的完整性,增加高速訊號的有效傳輸距離。尤其是來到PCIe 5.0之後,更高的數據速率,更緊張的損耗預算,更短的走線長度,使得Retimer晶片技術路徑的優勢更加明顯。

說了這麼多,那究竟這個Retimer是什麼?其實早在2017年PCIe 4.0規範發佈時,首次正式定義了兩個術語「redriver」 和「retimer」。

根據Semianalysis的描述,Redriver(重驅動器)本質上是一種類比訊號放大器元件,用於抵消PCB 引起的頻率相關衰減。形象來說,它就像「擴音器」一樣,可以增強訊號。

Retimer(重定時器)則是一種混合訊號數位/類比設備,具有協定感知能力,可完全恢復資料、提取嵌入式時脈並使用乾淨的時脈重新傳輸資料的新副本。簡單來說,它不是像重型驅動器那樣的“擴音器”,更像是一個高品質麥克風+專用音頻設備,將校正後的信號饋送到揚聲器。重定時器就是一個小型晶片,用來執行PCIe SerDes功能以及有關訊號完整性的監控和資料收集。


圖源:瀾起科技財報


根據Valuates Reports的報告,全球PCIe重定時器市場預計將從2023年的1.47億美元成長到2029年的11.069億美元,預測期內複合年增長率(CAGR) 為40.0%。亞太地區是最大的消費地區,市佔率接近37%。北美是僅次於亞太地區的第二大消費地區。



黑馬殺出,巨人回歸,Retimer市場風雲再起

從歷史上看,連結是資料中心市場中競爭極其激烈但利潤率高的部分。儘管在交換器和DSP領域進行了多次競爭,Broadcom和Marvell仍然能夠以超過80% 的收入份額和超過65% 的毛利率佔據主導地位。據了解,每個重定時器的成本高達20美元以上。

在Retimer這個利潤高地,市場競爭相對激烈。 Valuates Reports報告中指出,Astera Labs、瑞薩電子、Parade Technologies、德州儀器、Microchip Technology、瀾起科技等公司是這一領域的領導者,前六家公司擁有關鍵技術和專利,市佔率最高,達到92%。(其中,德州儀器的DS160PT801 重定時器目前最高支援PCIe 4.0,而瑞薩電子的重定時器目前最高只支援PCIe 3.0。)

由AI伺服器這波浪潮催生下的Retimer晶片需求,Astera Labs公司是目前最大的獲利者。該公司的retimer晶片已悄悄應用於80%以上的AI伺服器。國際大的CPU和GPU晶片廠商AMD、Intel和NVIDIA等都是他的客戶。 2024年3月19日,Astera Labs宣布首次公開發行(IPO),在人工智慧的熱情下,其估值從45億美元逐漸上升到51.8億美元。據了解,該公司也獲得了英特爾的創投部門的青睞,在B輪融資中就投資了Astera Labs。

Astera Labs 2017年在一個車庫成立,有點類似賈伯斯創立蘋果公司,具有濃厚的矽谷風。公司核心人員背景強大,該公司聯合創始人Jitendra Mohan、Sanjay Gajendra 和Casey Morrison 曾在德州儀器(TI) 的高速介面業務部門工作。 Astera Labs是一家純粹的專用連接解決方案的公司,專注於PCIe和相關協議,例如CXL。 Astera Labs 的財務長Mike Tate曾擔任Annapurna Labs、Netlogic MicroSystems、Marvell Technology 和Galileo Technology 等多家公司的財務長,並在任職期間領導了多次合併、收購和IPO。 Astera Labs 的商務長Thad Omura擔任Marvell 快閃記憶體和CXL 業務的行銷副總裁。記憶體連接業務部副總裁兼總經理Sanjay Charagulla先前在Rambus領導了Compute Express Link™ (CXL) 業務部門的組建。

2019年,Astera Labs 率先在業界推出適用於PCIe 4.0 和PCIe 5.0 的Aries 智慧重定時器,在2021年就為該公司創造了3,480萬美元的收入。

Astera Labs足稱得上是一匹黑馬。

成立僅4年多,該公司就登上了產業領導地位。 Astera Labs的智慧型DSP Aries 5成為AMD EPYC Genoa/ Bergamo 和Intel Xeon Sapphire Rapids 和Emerald Rapids PCIe Gen5 伺服器中最常見的PCIe/CXL重定時器。 Arm也與之有合作,Arm表示,與Astera Labs的合作對於確保基於Arm Neoverse 運算平台的AI 客製化晶片解決方案新時代的更高效能連接至關重要。

Microchip 在2020年也發表了一款PCIe 5.0/CXL 2.0的重定時器-XpressConnect。據悉,XpressConnect重定時器可將PCIe 5.0/CXL 1.1 訊號的覆蓋範圍擴大三倍,延遲比PCIe 規範要求低80%,接腳間延遲低於10ns。可提供多達16 個PCIe Gen 5 通道的多通道。 Microchip也與英特爾合作了參考設計。

由於Broadcom的誤判,Broadcom在PCIe 5.0 重定時器上姍姍來遲。在PCIe4.0的時候,Broadcom的交換器和重定時器都是一起發布的。現今市面上有Astera Labs 重定時器的Broadcom PCIe 交換器並不罕見。其實原本Broadcom是打算放棄這個市場的。他們最初認為,在PCIe 5.0時代,重定時器將會成為一種通用的配套晶片,Retimer會成為一個成熟的商品,大約有3~4家供應商提供。因此,Broadcom將重點放在了交換器等更複雜的PCIe 5.0產品。然而,Broadcom後來發現,重定時器的技術難度比預期更高,客戶也遇到了許多使用問題。

因此,Broadcom不得不重新投入精力,開發更可靠、易用的重定時器產品,並協助客戶解決使用問題。

2024年3月,Broadcom發布了新的支援PCIe Gen5、PCIe Gen6/CXL 的retimer產品——Vantage 5和6,重新進入PCIe重定時器市場。他們有16 和8 通道選項。這些通道可以分叉,因此如果您有四個PCIe Gen5 x4 驅動器,它們可以共用一個16 通道重定時器。 Broadcom 也支援低延遲CXL。


Broadcom正在5nm上建造Vantage 5和Vantage 6,來體現競爭優勢。從下圖可以看出,Vantage 5的典型功耗為10W,Vantage 6的典型功耗為13W。

同時,Astera Labs的競爭勢頭很旺,在Broadcom推出重定時器產品之後的不久,Astera Labs也宣布了最新一代的retimer晶片——Aries 6,可以為GPU、加速器、CPU、NIC 和CXL 內存控制器之間提供PCIe 6.x和CXL 3.x連接。

從技術指標來看,比Broadcom的Vantage 6重定時器功耗更低,PCIe 6.x 16 通道配置的典型功率為11W。而Astera Labs 的另一個優勢就是時間。 Aries 6 已經出樣,公司擁有重定時器板和互通實驗室,已經在測試設備。但相比Astera Labs,Broadcom擁有包括測試板、重定時器、PCIe交換器等在內的完整套件,因此可以將之進行捆綁,快速實施其重定時器和真正的PCIe/CXL 生態系統產品。

隨著Broadcom的回歸,Retimer晶片市場再起風雲。 Broadcom已經將重定時器業務規劃進了其路線圖中。從Broadcom 和Astera Labs兩大市場玩家的產品可以看出,如今Retimer已經不再只是圍繞著PCIe競爭,而是捲到了CXL。說CXL可能又是另一個故事了,業界不少人認為,CXL在接下來伺服器中的作用愈發凸顯,儲存大廠已經開卷CXL了。但也有不同的聲音認為,CXL在AI時代已死。未來根據系統配置,Retimer 晶片可以靈活地切換PCIe 或CXL 模式。


BroadcomPCI-Express交換器和重定時器路線圖(圖源:servethehome)


中國兩大Retimer晶片雙雄

如前文所述,在前六大Retimer晶片市場中,中國佔據2席,分別是大陸的瀾起科技和台灣的譜瑞科技。兩家公司都在Retimer晶片領域取得了長足的進步,並逐漸成為全球Retimer晶片市場的重要力量。

瀾起科技在202403的投資者關係活動中表示,隨著AI伺服器的成長,需要配置GPU BOX的場景越來越多,將增加對PCIe Retimer 晶片的需求。目前一台典型的配8 塊GPU 的主流AI 伺服器需要8顆甚至16顆PCIe 5.0 Retimer晶片。根據產業分析,PCIe 5.0 Retimer 晶片的市場規模較PCIe 4.0 可望大幅成長,同時,出於供應安全的考慮,顧客一般會選擇2-3 家PCIe 5.0 Retimer晶片供應商來供貨。


PCIe 5.0 Retimer晶片在某主流AI 伺服器的應用範例


瀾起科技PCIe 4.0 Retimer晶片於2020年9月成功實現量產,2021年12月,瀾起科技發佈公告將研發PCIe 5.0重定時器晶片並實現產業化。 2023 年1 月,瀾起科技宣布量產PCIe 5.0/CXL 2.0 Retimer晶片,據該公司聲稱,其是全球第二家宣布量產該產品的廠商。該晶片符合PCI-SIG 和CXL 行業組織的相關技術規範,採用業界主流封裝,傳輸速率高達32GT/s,在業界率先支援低於5 ns 的超低傳輸延遲。

瀾起科技的Retimer晶片典型應用場景(圖片來源:瀾起科技)


據了解,瀾起科技已與CPU、交換晶片、固態硬碟、GPU 及網卡等領域的主要合作夥伴緊密協作,完成了PCIe 5.0 Retimer 晶片嚴苛的互通測試。經過前期客戶導入,預計今年實現規模出貨。瀾起科技也正在進行PCIe 6.0 Retimer晶片的研發。

台灣的譜瑞科技也已經推出了針對PCIe 5.0/CXL的重定時器PS8936,它能夠支援16對雙向傳輸通道,也支援CXL 2.0 Alt 模式。譜瑞科技成立於2005年,是一家Fabless公司,20211年在台灣掛牌上市。 Parade Technologies, Inc. 為譜瑞公司100%擁有的美國子公司。


結語

一枚小小的Retimer晶片,正成為資料中心領域內不可或缺的關鍵互連組件,它們在連接CPU與GPU、NVMe SSD、Riser卡等高速外設時發揮著至關重要的作用。 Retimer晶片將是PCIe 5.0和之後版本系統不可或缺的元件,「剛性化」趨勢已然呈現。這也將為國產Retimer晶片的發展開啟廣闊的空間。(半導體產業觀察)