輝達護城河要守不住了?Claude Code半小時程式設計,直接把CUDA後端遷移到AMD ROCm上了。
一夜之間,CUDA護城河被AI終結了?
這幾天,一位開發者johnnytshi在Reddit上分享了一個令人震驚的操作:
Claude Code僅用了30分鐘,便將一段完整的CUDA後端程式碼,成功移植到AMD的ROCm上。
整個過程,沒有手寫一行程式碼。
這架勢,簡直是要填平這兩個生態系統之間的鴻溝。
更關鍵的是,這次移植完全沒有依賴傳統的「中間轉換工具」,如Hipify翻譯層,而是一鍵通過CLI完成。
就連AMD軟體副總Anush E.為之震驚,GPU程式設計的未來,是AI智能體的。
消息一出,整個科技圈瞬間沸騰,很多人直呼:輝達CUDA護城河要守不住了.....
這究竟是怎麼回事?
Claude Code是在一個智能體框架運行的,這意味著它可以自己「動腦子」。
在執行過程中,他不會機械地轉換關鍵詞,而去真正理解程式碼,即特定核函數的底層邏輯。
開發者johnnytshi介紹,這次移植中,最棘手的資料佈局差異問題也被AI解決了,確保了核心核心計算邏輯保持一致。
令人驚嘆的是,johnnytshi在短短30分鐘內,就把整個CUDA後端移植到了AMD ROCm上,而且中間沒用任何翻譯層。
另外一個好處當然是,不用費勁去搭像Hipify這種複雜的翻譯環境了;直接在命令列(CLI)裡就能幹活。
如今,全網都被CUDA護城河被攻破呼聲淹沒了。
畢竟,輝達霸主地位,很大程度上建立在CUDA這個幾乎成為行業標準的程式設計生態上。
無數AI框架、深度學習庫、科學計算工具都深度依賴它。
AMD的ROCm雖然功能強大,卻一直面臨生態相容性,以及開發者遷移成本高的痛點。
現在,一個Claude卻用極短時間踢碎了門檻,說不定未來更多CUDA程式碼可能輕鬆在AMD GPU跑起來了。
GitHub中,johnnytshi本人也更新了日誌和說明。
為AMD GPU實現了完整的ROCm後端,從而在RDNA 3.5及其他AMD架構上支援基於注意力機制的現代國際象棋網路。
src/neural/backends/rocm/中加入了完整的ROCm後端rocm (FP32)、rocm-fp16 (FP16)、rocm-auto (自動檢測)rocm_agent_enumerator自動檢測AMD GPU架構-Drocm=true -Damd_gfx=gfx1151(或使用自動檢測)性能說明:
驗證情況(Strix Halo - Radeon 8060S, gfx1151):
768x15x24h-t82-swa-7464000.pb.gz 和 maia-1900.pb.gzrocm-fp16功能正常,能生成正確的走法當然,這次演示也有侷限性。
對於簡單或中等複雜度的核心,Claude Code表現得非常出色。更重要的是,寫核函數的核心就在於搞定「深度硬體」最佳化。
不過,一部分覺得Claude Code在這方面還是差點火候——
如果遇到那些針對特定硬體快取層級,記憶體訪問模式做過極致最佳化的複雜核心,AI目前還難以完全取代人類專家。
即便如此,這一事件釋放出的訊號已經足夠強烈。
過去幾個月,ZLUDA項目、還有微軟內部的嘗試,都想要打破CUDA的壟斷。
但它們大多依賴規則對應或中間層,自動化程度和智能水平有限。
Claude Code代表的智能體式程式設計,直接跳過了這些環節,用「理解+自主決策」的方式填平生態鴻溝。
正如AMD軟體副總所言,GPU程式設計的未來,是AI智能體主場。
如今的Claude Code已經讓整個矽谷入坑了(Claude-Pilled)。
兩天前,CEO Dario Amodei在達沃斯上再出暴論:軟體工程師們沒有時間了。未來6-12個月,AI能夠徹底取代這些人!
甚至,Anthropic內部工程師已經不再手寫程式碼了,全是Claude完成。
別不信,是真的。
就在Wired最新採訪中,Claude Code之父Boris Cherny坦承,「自己100%程式碼都是AI寫的」。
或許Anthropic工程師怎麼也沒有想到,一個「副業項目」竟讓矽谷如此狂熱。
Boris Cherny回憶道,「一年前我們發佈Claude Code時,甚至不確定『智能體程式設計』能不能成,但火爆來得太快了」。
Cherny個人經歷就是最好的縮影:
剛發佈時,他只有5%程式碼是用Claude Code寫的;
到了去年5月,有了Opus 4和Sonnet 4,這個比例變成了30%;
而現在,有了Opus 4.5,他在過去兩個月裡100%的程式碼都是由Claude Code完成。
在Anthropic內部,這種全員AI化更是到了極致。
幾乎100%技術員工都在使用Claude Code,甚至連Claude Code團隊本身95%的程式碼也是由自身寫出來的。
不得不說,AI程式設計的進化速度令人咋舌。
回望2021到2024年,大多數工具不過是高級版的「自動補全」,在開發者打字時卑微地建議幾行程式碼。
但到了2025年初,隨著Cursor和Windsurf等初創發佈早期的Agentic程式設計產品,遊戲規則改變了——
開發者只需用大白話描述功能,剩下的髒活累活全扔給AI智能體完成。
Claude Code也在這個時間點,真正誕生了。
Boris Cherny坦承,早期版本也曾跌跌撞撞,甚至陷入死循環。但Anthropic下了一步狠棋:不為當下的AI能力開發產品,而要為AI即將抵達的未來而建構。
這一賭注押對了。隨著Anthropic下一代旗艦Claude Opus 4.5的發佈,AI程式設計迎來了真正的「拐點」。
史丹佛大學AI講師、Workera CEO Kian Katanforoosh最近就把公司全員遷移到了Claude Code。
他直言,對於高級工程師來說,Claude Code比Cursor、Windsurf更能打。
Katanforoosh感嘆道,最近唯一讓我看到程式設計能力有階躍式提升的模型,就是Claude Opus 4.5。
「它給人的感覺不像是在模仿人類寫程式碼,而是它真的找到了一種更聰明的解決路徑」。
據傳,微軟內部也在大規模採用Claude Code了。
Claude Code大獲成功,給Anthropic帶來了最直觀的效益。
去年,AI程式設計智能體業務徹底爆發。11月,Anthropic宣佈Claude Code在上線不到一年內,年度經常性收入(ARR)就突破了10億美元。
到2025年底,ARR至少又增長了1億美元。
彼時,該產品約佔Anthropic總ARR(約90億美元)的12%。雖然比起向大企業提供 AI 系統的核心業務來說還算「小弟」,但它已是公司增長最快的類股之一。
儘管Anthropic在AI程式設計領域看似獨孤求敗,但Claude Opus 4.5的光環其實照亮了整個賽道。
競爭對手Cursor也在11月達到了10億美元ARR,OpenAI、Google和xAI更是磨刀霍霍,試圖用自研模型分一杯羹。
但Anthropic沒打算停下。
前幾天,他們又發佈了Cowork——這是一款面向非程式設計領域的AI智能體。
它能管理你電腦裡的檔案、操作各種軟體,而且完全不需要你在程式碼終端裡敲命令。
提及Cowork時,Cherny透露自己已經用瘋了。
比如項目管理,他會讓Cowork盯著工程師的任務表格,誰沒填名字,AI就會自動在Slack上發消息催人。
Cherny感慨道,「這是我當工程師以來最爽的時候,因為我不再需要做那些枯燥乏味的髒活了」。
面對那些因不再需要親自寫程式碼而感到失落的工程師,Cherny給出了他的建議:
這行業一直在變。我祖父在蘇聯用穿孔卡片程式設計;後來變成了機器碼;再後來是C語言、Java、Python。
這是一條不斷抽象化的連續體,AI智能體只是這條線上的最新一個點。
如今,Cherny每天早上起床會在手機上啟動3-4個程式設計智能體,到了公司再在終端裡開幾個。
任何時候,他都有五到十個智能體在跑任務。
Cherny總結道,「AI智能體將接管生活中所有繁瑣的事——填表、搬運資料、發郵件。這會具有顛覆性,我們必須適應」。
話又說回來,Anthropic能不能先解決下Claude使用量?
(新智元)