蘇姿丰,投了只賣AMD算力的AI獨角獸

估值至少達到341億元。

芯東西5月20日消息,據《福布斯》昨日報導,美國AI模型開發商Zyphra正在進行5億美元的新一輪融資,美國晶片巨頭AMD也參與了投資。消息人士稱,Zyphra的估值將至少達到50億美元

Zyphra成立於2020年,開發先進的開源AI模型,並提供雲基礎設施服務。大多數AI實驗室默認採用輝達晶片,而Zyphra卻完全站在AMD派系,其模型的訓練和推理均在AMD硬體上運行,這既節省了成本,又帶來了供應鏈優勢。

Zyphra Cloud是一個由AMD提供技術支援的全端式新雲平台,專為AI原生初創公司、企業和前沿AI超大規模資料中心而設計。

該平台最初基於AMD MI355X GPU,支援領先的開源模型的無伺服器推理,現已擴展到裸機AMD基礎設施,提供兩種主要部署模式:按需部署的裸機GPU叢集,適用於靈活的工作負載;以及定製化的超大規模AMD基礎設施,適用於大規模訓練和推理部署。

目前,MI355的15兆瓦容量已投入使用。

Zyphra Cloud中,Zyphra Inference推理雲提供生產級模型服務,專為大型MoE模型和具有長上下文以及大型KV和prefix cache的長時間運行的代理工作負載而設計,由MI355X GPU和TensorWave合作提供支援,可處理包括Kimi-K2.6、DeepSeek-V3.2、GLM-5.1等先進開源模型。其模型服務價格如下:

昨日,Zyphra預告將發佈其基於MI355X的推理的首個端到端基準測試結果,並稱其推理最佳化顯著優於AMD基線,並縮小了MI355X和B200在運行Kimi K2.6、GLM-5.1、DeepSeek-V3.2等模型時的性能差距。

其最佳化包括:

  • 樹狀注意力:用於長上下文注意力的平衡樹狀簡化
  • TSP:在節點內部鏈路上保持模型平行組
  • 跨核心、HIP圖、RCCL進行調優
  • EAGLE推測性解碼針對ROCm進行了調整

更長的上下文時間能更好地發揮其優勢。隨著上下文時間的增加,TSP和樹狀注意力機制能夠帶來更大的性能提升,從而縮小與B200的差距。在單請求解碼和TTFT方面,B200當前仍領先於Zyphra的技術堆疊和AMD基線,但Zyphra看到了縮小差距的途徑。

Zyphra解釋了為什麼選擇MI355X:每個GPU配備288GB HBM3E,而B200則配備180GB,這意味著更多的駐留KV和prefix cache、更大的模型、更長的上下文,實現更低的延遲和更高的吞吐量。

相比B200,MI355X的單節點HBM記憶體預算在GLM 5.1、DeepSeek-V3.2和DeepSeek-V4-Pro(即將推出)上大約翻了一番。

接下來,Zyphra計畫支援DeepSeek-V4-Pro,擴展到1.6T參數和1M上下文、訓練資訊量化、基於擴散的推測器,以及服務引擎方面的工作。

該公司還計畫將支援範圍擴展至下一代AMD平台,包括MI450系列及後續產品。 (芯東西)