#AI+互聯
輝達9億美元重注Enfabrica:超級網路卡成為下一代AI互聯核心?
輝達近期對Enfabrica的9億美元戰略投資,標誌著下一代互聯技術已成為AI基礎設施的關鍵戰場。在該公司的產品矩陣中,3.2 Tbps的ACF(Accelerated Compute Fabric (ACF)-S超級網路卡以其高度整合的晶片架構脫穎而出,技術實現遠超輝達自有的ConnectX-8系列。與僅整合PCIe交換晶片的CX8(如上圖所示)不同,ACF-S (如下圖所示)在單晶片上融合了乙太網路交換(Packet Switch)與PCIe交換(Memory Switch)功能,形成一個高度整合的裝置。這一設計顯著增強了GPU橫向和縱向擴展互聯、記憶體解耦方面的能力。一、核心應用場景1.記憶體解構在長上下文AI推理邁向百萬令牌等級的處理程序中,KV快取對GPU視訊記憶體的巨大需求已成為制約性能與成本的根本性瓶頸。業界大模型開始探索分佈式KV Cache池和分級Cache機制,比如Kimi的Mooncake架構(如上圖所示)和SGLang的HiCache架構。Enfabrica 的 EMFASYS(彈性記憶體架構系統)通過 ACF-S 高速互聯協議建構基於 DDR 的裝置級池化記憶體資源,實現了計算與記憶體的徹底解耦。該系統支援通過RDMA乙太網路訪問的共用記憶體池架構,以模組化方式靈活擴充記憶體容量,為長上下文推理引擎提供了可線性擴展的記憶體資源池,顯著降低了對高成本 GPU 或 HBM 的依賴。據 Enfabrica 宣稱,EMFASYS 可為大規模推理負載擴展高達 18TB 的 DDR5 記憶體容量,並將單令牌生成成本降低多達 50%,從而在提升性能的同時最佳化了 AI 推理的總體經濟效益。2. 縱向擴展網路:從PCIe到乙太網路當前,國內多數GPU仍依賴PCIe建構縱向擴展(Scale-Up)網路,但PCIe交換晶片的頻寬能力較乙太網路交換晶片低一個數量級,制約了系統規模的進一步擴展。ACF-S通過實現PCIe至乙太網路的協議轉換,有效解決了這一瓶頸:每個GPU通過PCIe介面直連ACF-S;資料流量在晶片內部轉換為乙太網路報文;網路卡提供4×800G乙太網路連接埠,支援多平面、高頻寬的縱向擴展網路,具備負載平衡與冗餘保護能力。這一轉換標誌著縱向擴展網路從PCIe走向乙太網路已成為明確的技術趨勢。3. 增強型橫向擴展RNIC:整合PCIe交換能力在橫向擴展(如上圖所示)場景中,GPU通過PCIe交換晶片連接RNIC,RNIC連接到橫向擴展網路。ACF-S作為整合PCIe交換功能的超級網路卡,使CPU與GPU能夠直接連接到該超級網路卡,無需外接PCIe交換晶片(如下圖所示)。在跨節點All-to-All通訊等場景中,現有架構需消耗GPU的流式多處理器即SM資源執行資料複製與轉發(見下圖,來自Insight into DeeSeek-V3論文,DeepSeek-V3洞察論文個人解讀,DeepSeek最新論文深度解讀 (續))。此外,基於PTX的節點內跨軌道跳轉同樣需要消耗SM計算資源。ACF-S裝置內的網路卡之間已實現以太互聯,封包可在NIC之間通過乙太網路交換晶片轉發,上述在節點限制路由由SM執行的資料面轉發任務可以完全解除安裝至ACF-S,無需消耗SM資源,從而顯著提升通訊效率。二、ACF-S與輝達CX8關鍵能力對比從上圖中可以發現,輝達自家的CX8超級網路卡也整合了PCIe Switch。但是,仍然沿用了之前在DGX H100/H200架構下的連接拓撲(如下圖所示),即GPU以及NIC在PCIe Switch上並沒有實現全互聯,而是分為兩個相對獨立的連接拓撲。如此一來,要實現DeepSeek-V3的節點限制路由以及Rail-only組網下節點內的跨軌道中轉,仍然需要消耗SM計算資源。相比較而言,ACF-S更勝一籌。三、結論Enfabrica ACF-S代表了一類新型“超級網路卡”,它在單一晶片上融合了縱向與橫向擴展網路能力。通過整合乙太網路與PCIe交換功能,ACF-S實現了大規模KV快取資源池、高效整合的PCIe轉乙太網路縱向擴展網路模組。輝達此次重金投資表明,此類融合互聯架構將成為支撐下一代AI工作負載擴展的關鍵基石。 (網路技術趨勢洞察)
財富FORTUNE:AI熱只是另一次互聯網泡沫?
人工智能預示著“第四次工業革命”的開始,還是另外一次互聯網泡沫?兩者皆有可能。 OpenAI執行長薩姆·奧爾特曼 OpenAI的生成式人工智能聊天機器人ChatGPT在2 022年11月發布後不到兩個月就吸引了超過1億用戶,這項新技術引起了投資界和實體領域的關注。微軟(Microsoft)在對OpenAI的首筆投資中,大手筆追加投資100億美元,事實證明這最終對谷歌(Google)在搜索領域的主導地位構成了挑戰。谷歌的母公司Alphabet的應對措施是發布了自己的生成式人工智能聊天機器人Bard,日益激烈的人工智能競賽令市場欣喜若狂,因此在Bard發布過程中的一個小錯誤,引發了股價暴跌,使Alphabet的市值在一天內縮水了1,000億美元。 Bard和ChatGPT等生成式人工智能係統基於“大語言模型”,容易出現錯誤和偏離預定腳本,這是該類系統存在的一個關鍵問題。這些“幻覺”以及人工智能搶走人類就業或者被壞人利用來傳播虛假信息的可能性,使埃隆·馬斯克等億萬富翁警告,人工智能可能造成文明“毀滅”。然而,特斯拉(Tesla)的首席執行官馬斯克也認為,人工智能技術能夠提高工作效率,帶來“富足的時代”。美國參議院多數黨領袖查克·舒默也表示,人工智能的興起顯然是一個“革命性的時刻”,將“改變地球上的生命”。但這位紐約州參議員承認,美國國會需要對該技術採取更多的監管措施,而且其未來充滿了不確定性。
泡沬的產品多得是, 總是需要有人來戳破它.