溢價三倍都要緊急收購Groq,輝達為何匆匆忙忙?

12月24日,平安夜裡,網上都在說輝達要以200億美元收購AI晶片公司Groq,200億美元的現金可不是小數目,要知道,2019年輝達收購Mellanox才花了69億美元。

巧合的是,Groq三個月前的估值也有69億美元,現在,輝達花大約三倍的價格收購Groq,看得出很著急。為什麼這麼著急收購呢?

在介紹這個之前,要說清楚的是,這次輝達不是收購Groq這家公司,而是用200億美元獲得Groq的非排他性技術授權,還有核心人才引進的協議。

這不是普通的收購,況且,以輝達現在的規模,這次收購很容易受到監管機構的反對,此前400億美元收購ARM就是前車之鑑。

為了避免重蹈覆轍,這次輝達拿到了非排他性技術授權,意味著別人也可以拿到這樣的技術授權,包括英特爾、AMD或者AWS或者Azure都可以。

但是,由於Groq公司的多數核心人才都加入了輝達,即使拿到這些技術授權,熟悉這些的工程師都不在了,後續迭代和維護誰來做呢?

儘管原來的公司還會繼續營運,看似對市場沒什麼不利影響,但其實,Groq公司顯然已經空心化了,未來還能走多遠都會是一個問題。

這項交易能否順利進行?會不會遭到反對?會不會有別的公司,比如英特爾和AMD,以及AWS和Azure、或者Meta跳出來也要拿到這種授權呢?畢竟這是連AI晶片霸主都覬覦的技術呢?

這裡分析一下為什麼老黃要急著收購Groq?

Groq的晶片產品叫LPU(Language Processing Unit),是市場上少數能在推理速度和延遲表現上對輝達有挑戰的公司之一,如果這家公司被Google、亞馬遜或者Meta收購,輝達會很難受。

Groq的優勢不是算得比GPU更猛,而是算得有更多的確定性。怎麼說呢?它把所有調度複雜度前移到編譯期,讓晶片執行階段像流水線一樣持續滿速跑,這在大模型推理場景下能顯著降低延遲、提高實際吞吐。

而GPU恰恰相反,GPU追求的是高度通用與靈活性,需要處理複雜的調度器、同步機制和分支預測邏輯,在面對不規則、變化多端的工作負載時表現會很出色。但是,大模型推理這類場景的變化不多,GPU的通用性和靈活性就成了劣勢。

而且,輝達的B200 GPU非常依賴片外HBM來儲存模型權重,在即時、小Batch推理中,計算單元需要頻繁跨晶片訪問HBM,訪存延遲沒法降低,計算效率會更低。

相比之下,Groq的LPU 將關鍵權重等資料放置在230MB的片上SRAM中,顯著減少了片外訪存與等待狀態,這樣計算效率就高了,資料處理跟流水線一樣。

這麼一番對比,LPU比GPU推理性能更好,推理效率更高,成本也更低,這顯然會讓GPU面臨壓力。這種模式的成功已經不是第一次了,Google的TPU也有類似的效果。

他們都證明了一件事,就是GPU並不是最適合做推理的,這次收購意味著輝達也承認了這一點。

這意味著越流越多的企業用自研ai推理處理器的做法是對的,比如AWS的Trainium晶片,當業內形成這種共識,也意味著會有更多雲廠商會走上這條路。

這顯然會對輝達不利。

摩根士丹利預測,到 2026 年底,推理市場將佔AI計算總需求的50%以上,超越了訓練場景。

未來增長看推理,輝達牢牢掌控了訓練市場,推理市場如果還固守GPU,顯然是不行的。

你要是老黃,你會咋辦?自研一個來對抗?研發出來黃花菜都涼了,最好還是趕緊收購吧,於是就有了現在的故事。

有趣的是,這次200億美元,Groq的創始人Jonathan Ross就是Google初代TPU的主要架構師之一,也會加入輝達,把這項經過驗證的技術交給輝達。

這是目前成功率最高的方式。 (科技巴圖魯)