CUDA要涼？Claude 30分鐘剷平輝達護城河，AMD要笑醒了

2026/01/24

•

輝達護城河要守不住了？Claude Code半小時程式設計，直接把CUDA後端遷移到AMD ROCm上了。

一夜之間，CUDA護城河被AI終結了？

這幾天，一位開發者johnnytshi在Reddit上分享了一個令人震驚的操作：

Claude Code僅用了30分鐘，便將一段完整的CUDA後端程式碼，成功移植到AMD的ROCm上。

整個過程，沒有手寫一行程式碼。

這架勢，簡直是要填平這兩個生態系統之間的鴻溝。

更關鍵的是，這次移植完全沒有依賴傳統的「中間轉換工具」，如Hipify翻譯層，而是一鍵通過CLI完成。

就連AMD軟體副總Anush E.為之震驚，GPU程式設計的未來，是AI智能體的。

消息一出，整個科技圈瞬間沸騰，很多人直呼：輝達CUDA護城河要守不住了.....

這究竟是怎麼回事？

Claude手撕CUDA，僅30分鐘

Claude Code是在一個智能體框架運行的，這意味著它可以自己「動腦子」。

在執行過程中，他不會機械地轉換關鍵詞，而去真正理解程式碼，即特定核函數的底層邏輯。

開發者johnnytshi介紹，這次移植中，最棘手的資料佈局差異問題也被AI解決了，確保了核心核心計算邏輯保持一致。

令人驚嘆的是，johnnytshi在短短30分鐘內，就把整個CUDA後端移植到了AMD ROCm上，而且中間沒用任何翻譯層。

另外一個好處當然是，不用費勁去搭像Hipify這種複雜的翻譯環境了；直接在命令列（CLI）裡就能幹活。

如今，全網都被CUDA護城河被攻破呼聲淹沒了。

畢竟，輝達霸主地位，很大程度上建立在CUDA這個幾乎成為行業標準的程式設計生態上。

無數AI框架、深度學習庫、科學計算工具都深度依賴它。

AMD的ROCm雖然功能強大，卻一直面臨生態相容性，以及開發者遷移成本高的痛點。

現在，一個Claude卻用極短時間踢碎了門檻，說不定未來更多CUDA程式碼可能輕鬆在AMD GPU跑起來了。

實現細節

GitHub中，johnnytshi本人也更新了日誌和說明。

為AMD GPU實現了完整的ROCm後端，從而在RDNA 3.5及其他AMD架構上支援基於注意力機制的現代國際象棋網路。

GitHub：https://github.com/LeelaChessZero/lc0/pull/2375

在src/neural/backends/rocm/中加入了完整的ROCm後端
實現了注意力網路架構（多頭自注意力、FFN、嵌入層）
使用rocBLAS進行GEMM運算，使用MIOpen進行摺積運算
針對RDNA 3.5上的FP16性能最佳化了NCHW佈局
提供三種後端變體：rocm (FP32)、rocm-fp16 (FP16)、rocm-auto (自動檢測)
MIOpen是必選依賴（類似於CUDA的cuDNN）
通過rocm_agent_enumerator自動檢測AMD GPU架構
編譯選項：-Drocm=true -Damd_gfx=gfx1151（或使用自動檢測）

性能說明：

FP16性能：在Strix Halo (Radeon 8060S, gfx1151) 上 >2000 nps
自動Batch Size調優（RDNA 3.5上min_batch=64）
測試過rocWMMA，但rocBLAS性能更好

驗證情況（Strix Halo - Radeon 8060S, gfx1151）：

測試模型：768x15x24h-t82-swa-7464000.pb.gz 和 maia-1900.pb.gz
後端：rocm-fp16功能正常，能生成正確的走法
環境：ROCm 7.2.53150, MIOpen 3.5.1
注：僅在RDNA 3.5上進行了測試；其他AMD架構暫未驗證

GPU未來，是AI智能體主場

當然，這次演示也有侷限性。

對於簡單或中等複雜度的核心，Claude Code表現得非常出色。更重要的是，寫核函數的核心就在於搞定「深度硬體」最佳化。

不過，一部分覺得Claude Code在這方面還是差點火候——

如果遇到那些針對特定硬體快取層級，記憶體訪問模式做過極致最佳化的複雜核心，AI目前還難以完全取代人類專家。

即便如此，這一事件釋放出的訊號已經足夠強烈。

過去幾個月，ZLUDA項目、還有微軟內部的嘗試，都想要打破CUDA的壟斷。

但它們大多依賴規則對應或中間層，自動化程度和智能水平有限。

Claude Code代表的智能體式程式設計，直接跳過了這些環節，用「理解+自主決策」的方式填平生態鴻溝。

正如AMD軟體副總所言，GPU程式設計的未來，是AI智能體主場。

全員AI程式設計，濃度高達100%

如今的Claude Code已經讓整個矽谷入坑了（Claude-Pilled）。

兩天前，CEO Dario Amodei在達沃斯上再出暴論：軟體工程師們沒有時間了。未來6-12個月，AI能夠徹底取代這些人！

甚至，Anthropic內部工程師已經不再手寫程式碼了，全是Claude完成。

別不信，是真的。

就在Wired最新採訪中，Claude Code之父Boris Cherny坦承，「自己100%程式碼都是AI寫的」。

或許Anthropic工程師怎麼也沒有想到，一個「副業項目」竟讓矽谷如此狂熱。

Boris Cherny回憶道，「一年前我們發佈Claude Code時，甚至不確定『智能體程式設計』能不能成，但火爆來得太快了」。

Cherny個人經歷就是最好的縮影：

剛發佈時，他只有5%程式碼是用Claude Code寫的；

到了去年5月，有了Opus 4和Sonnet 4，這個比例變成了30%；

而現在，有了Opus 4.5，他在過去兩個月裡100%的程式碼都是由Claude Code完成。

在Anthropic內部，這種全員AI化更是到了極致。

幾乎100%技術員工都在使用Claude Code，甚至連Claude Code團隊本身95%的程式碼也是由自身寫出來的。

史丹佛AI教授都在用了

不得不說，AI程式設計的進化速度令人咋舌。

回望2021到2024年，大多數工具不過是高級版的「自動補全」，在開發者打字時卑微地建議幾行程式碼。

但到了2025年初，隨著Cursor和Windsurf等初創發佈早期的Agentic程式設計產品，遊戲規則改變了——

開發者只需用大白話描述功能，剩下的髒活累活全扔給AI智能體完成。

Claude Code也在這個時間點，真正誕生了。

Boris Cherny坦承，早期版本也曾跌跌撞撞，甚至陷入死循環。但Anthropic下了一步狠棋：不為當下的AI能力開發產品，而要為AI即將抵達的未來而建構。

這一賭注押對了。隨著Anthropic下一代旗艦Claude Opus 4.5的發佈，AI程式設計迎來了真正的「拐點」。

史丹佛大學AI講師、Workera CEO Kian Katanforoosh最近就把公司全員遷移到了Claude Code。

他直言，對於高級工程師來說，Claude Code比Cursor、Windsurf更能打。

Katanforoosh感嘆道，最近唯一讓我看到程式設計能力有階躍式提升的模型，就是Claude Opus 4.5。

「它給人的感覺不像是在模仿人類寫程式碼，而是它真的找到了一種更聰明的解決路徑」。

據傳，微軟內部也在大規模採用Claude Code了。

年入超10億美金的「副業」

Claude Code大獲成功，給Anthropic帶來了最直觀的效益。

去年，AI程式設計智能體業務徹底爆發。11月，Anthropic宣佈Claude Code在上線不到一年內，年度經常性收入（ARR）就突破了10億美元。

到2025年底，ARR至少又增長了1億美元。

彼時，該產品約佔Anthropic總ARR（約90億美元）的12%。雖然比起向大企業提供 AI 系統的核心業務來說還算「小弟」，但它已是公司增長最快的類股之一。

儘管Anthropic在AI程式設計領域看似獨孤求敗，但Claude Opus 4.5的光環其實照亮了整個賽道。

競爭對手Cursor也在11月達到了10億美元ARR，OpenAI、Google和xAI更是磨刀霍霍，試圖用自研模型分一杯羹。

但Anthropic沒打算停下。

前幾天，他們又發佈了Cowork——這是一款面向非程式設計領域的AI智能體。

它能管理你電腦裡的檔案、操作各種軟體，而且完全不需要你在程式碼終端裡敲命令。

不是取代，是進化

提及Cowork時，Cherny透露自己已經用瘋了。

比如項目管理，他會讓Cowork盯著工程師的任務表格，誰沒填名字，AI就會自動在Slack上發消息催人。

Cherny感慨道，「這是我當工程師以來最爽的時候，因為我不再需要做那些枯燥乏味的髒活了」。

面對那些因不再需要親自寫程式碼而感到失落的工程師，Cherny給出了他的建議：

這行業一直在變。我祖父在蘇聯用穿孔卡片程式設計；後來變成了機器碼；再後來是C語言、Java、Python。

這是一條不斷抽象化的連續體，AI智能體只是這條線上的最新一個點。

如今，Cherny每天早上起床會在手機上啟動3-4個程式設計智能體，到了公司再在終端裡開幾個。

任何時候，他都有五到十個智能體在跑任務。

Cherny總結道，「AI智能體將接管生活中所有繁瑣的事——填表、搬運資料、發郵件。這會具有顛覆性，我們必須適應」。

話又說回來，Anthropic能不能先解決下Claude使用量？

(新智元)