眾所周知,輝達壟斷了全球AI晶片——GPU的供應,並且還供不應求,為此輝達市值屢創新高,一舉突破3萬億美元大關,成為僅次於微軟的全球第二市值,也成為全球人工智慧產業最成功的“賣鏟人”。
輝達除了掌控全球最先進GPU之外,其還有一個必殺技那就是——CUDA生態所建構的護城河。我們知道目前全球絕大部分AI大模型都輝達GPU的硬體上運行,中國國內各AI大廠也不例外。
於是,全球各大科技大廠都在做的兩件事:那就是自研AI晶片,以及如何繞過CUDA。
自研晶片上,大家耳熟能熟的Google、微軟、Meta、OpenAI、亞馬遜等國際巨頭們正忙得不亦樂乎;同樣的中國國內大廠阿里、位元組、百度、騰訊等同樣不敢落伍,在自研晶片的路上勇往直前。
可如何破局CUDA,大佬們似乎總沒那麼順手,雖然AMD也有ROCm試圖建立自己的GPU生態,但與輝達相比差得很遠;另外英特爾牽頭,拉上Google、Arm、高通、三星和其他科技公司組成一個聯盟——UXL(Unified Acceleration Foundation 統一加速基金會),其主要目的就是打破目前CUDA的壟斷,為開發者提供一個更加靈活和通用的處理器解決方案。但隨著英特爾自身深陷巨額虧損和一系列麻煩之中,UXL的聲音似乎也漸漸平息了。
也就是說,無論打破輝達CUDA的壟斷,並非如英特爾CEO基辛格喊喊口號——讓我們一起消滅CUDA,就可以實現的。
幸好,我們吸取教訓沒有“一步到位”直接取代輝達的CUDA,而是優先解決國產AI晶片的相容性問題。
根據9月29日中國算力大會上的消息,中國移動在大會上發佈了一款用於晶片架構遷移的工具——“芯合”,其主要是幫助使用者將基於輝達生態鏈編寫的程式碼遷移到華為或其他國產硬體平台上,從而降低算力使用者的遷移成本。
也就是說,基於目前大部分國產AI大模型等其他基礎設施都是基於輝達GPU而搭建的,自然也就運行在CUDA環境之中了;但隨著美國晶片禁令的不斷升級,以及國產AI晶片的崛起,遷移成本過高成為各國產廠商的一塊“心病”。
而中國移動的“芯合”正好可以減少國產AI大模型的遷移成本,從而為國產Ai晶片的替代輝達GPU成為了可能,也讓國產AI晶片更快、更容易被市場接受。
其實,芯合早於2023年10月就已發佈,也就是說在正式應用之前已經小規模試用了一段時間。根據測試使用者的反饋,“芯合”幫助省去了手動修改大量程式碼的工作。此外,遷移工具可以在不同生態之間切換,不需要重新編寫整個程序。遷移過程中可能會給使用者帶來性能損耗,但損耗可以維持在10%以內。
這意味著,國產算力在獨立生態體系的建設上邁出了關鍵性的一步,對於打破CUDA壟斷和輝達GPU依賴將具有重要作用;同時,也為國產GPU替代打開了大門。
其實,此次中國移動“芯合”先解決相容性問題,再逐步豐富國產AI生態應用,最終實現國產AI生態的獨立。此路徑與華為鴻蒙,先相容Android,豐富生態,並最終推出“純血鴻蒙”的路徑是一致的,也是被證明是有效的。
解決國產AI生態,或國產算力生態單薄的難題並非一蹴而就,需要有步驟,有策略的進行;如此才能既保證現有AI應用及產業不受影響,同時又逐步豐富國產AI生態應用,從而實現更為自主而獨立的國產算力生態。
因此,“芯合”工具的發佈及大規模應用標誌著中國在算力國產化道路上邁出了關鍵一步,對於推動國產GPU的應用和普及具有重要意義。 (飆叔科技洞察)