#輝達Arm
吉姆·凱勒新作!性能最強RISC-V CPU來了,叫板輝達Arm
前蘋果晶片大神新作,專為高性能計算而生。今日,美國AI晶片企業Tenstorrent推出高性能RISC-V CPU——TT-Ascalon,宣告其性能超越當下所有市場上已有RISC-V CPU。該CPU適用於伺服器、AI基礎設施、汽車高性能計算(HPC)及高級駕駛輔助系統(ADAS)等廣泛場景。Tenstorrent產品戰略副總裁Aniket Saha談道:“RISC-V核心幾乎覆蓋所有應用,但此前一直缺乏真正的高性能產品。Ascalon填補了這一空白,作為專為先進計算設計的RISC-V CPU,具備完整的出口合規性和全球可用性。”▲Tenstorrent產品戰略副總裁Aniket Saha在講解產品Tenstorrent於2016年創立於加拿大,於2023年將註冊地和總部遷往美國,2025年由晶片產業傳奇人物、前蘋果A系列及特斯拉自動駕駛晶片主導研發人吉姆・凱勒(Jim Keller)出任CEO,其於2025年剛剛憑藉開放式芯粒架構(OCA)成為RISC-V生態核心參與者。該公司近期剛剛被傳出推進至少8億美元的新融資,目前已完成多輪累計超10億美元融資,估值達32億美元。投資者對Tenstorrent的興趣源自其被認為是撕開輝達集中市場一條口子的重要潛力,其已通過大量開源技術避免了使用輝達成本較高的頻寬記憶體(HBM)。回到Tenstorrent今日的最新發佈來看,Ascalon的架構具有多方面創新,其通過業界標準SPEC CPU基準測試驗證,單核性能達到22 SPECint 2006/GHz、>2.3 SPECint 2017/GHz和>3.6 SPECfp 2017/GHz,並可在Samsung SF4X工藝節點下實現>2.5 GHz主頻,展現了其強大的設計和在先進工藝節點上的可擴展性。▲TT-Ascalon架構性能情況據Tenstorrent RISC-V核心副總裁Divyang Agrawal介紹,該產品的一大特徵是完全相容RISC-V RVA23規範。軟體生態決定了開發者能實現什麼。那麼Ascalon架構的生態系統在那裡?如何確保它能融入整個RISC-V生態?RVA23配置檔案標準化了應用級處理器需實現的功能集,這將直接整合到軟體工具鏈中。通過標準化,它不僅支援各類標準、安全擴展,還支援最新的RISC-V向量擴展,這正是其CPU與AI產品線共同採用的一大核心技術。並且,Ascalon整合高性能RVV1.0向量引擎,支援硬體虛擬化、先進記憶體管理和高級中斷架構。此外,Ascalon還具備安全性和RAS(可靠性、可用性和可維護性)特性,包括側通道攻擊防護。在推出Ascalon的同時,Tenstorrent還宣佈Ascalon全面支援GCC、LLVM和Qemu,並已完成上游合入,開發者和客戶可立即部署使用。通過本次發佈,Tenstorrent確保為RVA23建構的軟體能在Ascalon及任何符合RVA23規範的處理器上無縫運行,為開發者提供可靠保障。▲Ascalon全面支援GCC等軟體生態Divyang Agrawal補充道:“通過Ascalon,我們為客戶提供了集高性能核心、系統IP、RVA23相容工具鏈和完整技術資料於一體的整體解決方案。這為客戶開發從高性能計算到機器人等計算平台提供了關鍵建構模組,助力開發者拓展RISC-V生態。”Tenstorrent在產品設計時的一大原則是:一個設計方案的最終實現形態,取決於其目標應用領域。因此,他們從一開始就通盤考量了基礎設施、工具鏈、設計方法學以及設計本身。其架構被設計為高度可配置和參數化。Tenstorrent同時強調IP設計要有遠見。擁有IP、一套可配置的參數固然重要,但這還不夠。Tenstorrent認為其還需要提供一套能夠立即部署的完整方案,Tenstorrent團隊希望強調的是其可擴展性。Tenstorrent提供了從單連接埠到最多8連接埠的可配置性,從單一核心擴展至最多包含八個核心、共享快取的叢集,並會持續演進。Ascalon連接埠被認為是Arm的重要替代選項。▲Tenstorrent提供了從單連接埠到最多8連接埠的可配置性最後,當晶片流片之後,晶片偵錯能力至關重要。Tenstorrent認為,在設計中嵌入強大的偵錯能力,並控製成本,這再次成為其區別於普通IP供應商的一個關鍵。目前市面上已有的開發平台,大多不允許開發者在上面進行真正意義上的高性能軟體開發。但Tenstorrent使得從高性能計算(HPC)到嵌入式設計的軟體開發成為可能。正如Divyang Agrawal所說,將所有要素整合,Tenstorrent提供的是一個完整的解決方案。▲Tenstorrent提供的是一個完整的解決方案在生態合作方面,Tenstorrent通過其Innovation License(創新授權)計畫,為合作夥伴提供自主創新的路徑,該計畫使合作夥伴能夠基於Tenstorrent技術建構差異化且自主可控的解決方案。同時,Tenstorrent已與CoreLab建立合作夥伴關係,推動區域客戶支援和設計最佳化,幫助客戶高效採用並快速部署其IP。此外,Tenstorrent還在今日與知名軟體定義汽車平台供應商AutoCore.ai達成戰略合作。Ascalon RISC-V處理器為後者的AutoCore軟體平台提供強大的算力支援,加速RISC-V在汽車領域的應用落地。 (芯東西)
輝達首款Arm PC晶片曝光:性能超越高通驍龍X Elite
6月11日消息,傳聞已久的輝達(NVIDIA)首款Arm PC晶片首次在Geekbench測試資料庫被曝光,其跑分成績超越了高通的驍龍 X Elite,這也意味著輝達即將進軍基於Windows on Arm平台的PC市場,與高通正面競爭。△GB10 Grace Blackwell超級晶片根據統資訊顯示,輝達的這款AI PC晶片代號為“N1X” ,擁有20執行緒的CPU,主頻為2.81GHz。由於基於Arm CPU通常缺乏像英特爾 Lion Cove 那樣的 SMT(同步多執行緒),因此該處理器應該是配備了20核心的Arm CPU。猜測可能是基於此前的GB10超級晶片的Grace CPU的修改版本。輝達此前推出的個人AI 超級電腦“Project DIGITS”(DGX Spark )所搭載的GB10 Grace Blackwell超級晶片,其中的Grace CPU(10個Cortex-X925+10個Cortex-A725核心)正是由輝達與聯發科聯合設計的,同時還整合了輝達的Blackwell GPU。不過,Geekbench的檢測資訊顯示,“N1X”的CPU是基於Armv8指令集,而GB10的20核CPU是基於Armv9指令集,那麼這是否意味著輝達與高通一樣拿了Armv8指令集授權來打造自己的CPU核心架構呢?不過,此前亦有Geekbench錯誤將Armv8指令集CPU讀取為Armv9指令集的記錄。系統資訊還顯示,N1X 搭載的是一塊惠普開發板(HP 83A3),運行 Linux(Ubuntu 24.04.1)系統。同時,該開發板可能配備 128GB 系統記憶體,其中 8GB 預留給了GPU。從“N1X”的測試結果來看, N1X 在單核和多核測試中分別獲得了 3096 分和 18837 分。即使在不同的環境下,它的性能也遠超英特爾 Arrow Lake-HX、AMD Ryzen AI MAX(Strix Halo)、高通驍龍X Elite。即便是與英特爾酷睿Ultra 9 285HX和AMD Ryzen AI Max+395等頂級的AI PC處理器相比,其CPU性能也並不遜色多少。不過,與蘋果M4 MAX相比仍有一定差距。目前還不清楚N1X則GPU、NPU等其他關鍵計算單元的資訊。但總體來看,N1X有可能是基於此前推出的面向個人超級電腦的GB10超級晶片的減配版本,因此大機率會與GB10一樣配備基於Blackwell架構的GPU,不過考慮到面向的是移動平台,需要對功耗進行控制,因此其難以配備像GB10那樣強的6144個CUDA核心的GPU。雖然從目前輝達N1X的測試成績來看,表現非常不錯,但是N1X可能需要等待2026年才會正式推出,而高通明年也會面向Arm AI PC的處理器也將升級到基於Oryon V3核心的驍龍X2系列,屆時有可能會在性能上拉近與N1X的距離,甚至實現反超。需要指出的是,N1X可能與GB10一樣依然是由輝達和聯發科合作設計的,結合了聯發科在高性能低功耗CPU叢集設計上的技術優勢和輝達在GPU和AI方面的技術優勢,有望推動一些傳統PC廠商,以及一些同時有做筆記本產品的手機廠商選擇採用。根據之前The verge 報導,戴爾(Dell)旗下電競品牌Alienware可能將會推出首款搭載該晶片的遊戲本。而此次曝光的“N1X”測試是基於惠普的開發板,似乎也意味著惠普等傳統PC廠商也可能會推出相關產品 (芯智訊)