人工智慧晶片領域的新銳力量Groq正加速追趕巨頭輝達。
據知情人士透露,這家專注於為大型語言模型提供算力支援的晶片公司,正在與投資者洽談新一輪融資,目標籌資額在3億至5億美元之間。
若交易達成,Groq的估值將躍升至60億美元,較其一年前完成股權融資時的28億美元估值翻了一番。
Groq此時尋求融資,與其近期斬獲的重大合作密不可分。
今年2月,Groq宣佈獲得來自沙烏地阿拉伯方面價值15億美元的“合作承諾”,旨在擴大其晶片產品在沙烏地阿拉伯的銷售版圖,儘管該承諾是否構成具有法律約束力的採購訂單尚不明確,但已然展示出Groq作為AI晶片新銳的市場吸引力。
此外,Groq本周還宣佈將在芬蘭新建一座資料中心,專門用於部署其自研晶片。
正是受益於與沙烏地阿拉伯等夥伴的深入合作,Groq向潛在投資者描繪了極其亮眼的增長前景:公司預計2024年營收將飆升至約5億美元,較去年9000萬美元的水平增長超過五倍。
這一強勁預期無疑成為其融資談判的重要籌碼。
Groq的核心商業模式是為企業客戶提供基於其自研晶片的AI雲服務。
企業使用者可以通過API介面便捷地呼叫Groq提供的AI算力,其使用體驗類似於呼叫OpenAI或亞馬遜AWS的AI模型服務。這是Groq主要的收入來源。
同時,公司也直接向其他企業出售晶片系統及資料中心營運服務,加拿大電信巨頭Bell Canada便是其客戶之一。
據Groq宣稱,其服務已吸引了近200萬開發者和團隊使用。
總部位於加州聖何塞的Groq,是全球數十家立志從輝達手中分得AI晶片市場蛋糕的初創公司代表之一。
本周三,輝達剛剛創下歷史,成為全球首家市值突破4兆美元的上市公司,彰顯了其在AI算力市場的絕對統治力,這也無疑給這些初創企業展示了輝達的霸主力量。
Groq的創始人兼CEO Jonathan Ross擁有顯赫的技術背景,他是Google關鍵AI晶片TPU的發明者之一。
帶著享譽業界的深厚技術積累和充滿野心的最終戰略目標,羅斯正帶領團隊致力於打造比輝達產品更經濟、速度更快且更節能的替代方案。
與輝達晶片廣泛應用於模型訓練不同,Groq的晶片主要發力於AI模型開發完成後的“推理”(inference)階段。
模型訓練通常需要海量晶片集中部署並通過昂貴的網路裝置互聯。
Groq強調,其晶片主要真度基於開源模型的AI應用,例如Meta的Llama 4、Mistral的Mixtral以及Google的Gemma。
目前,Groq的晶片由知名晶圓代工廠GlobalFoundries負責生產。
儘管擁有市場的關注和強勁的收入增長,但Groq的實際產能和部署量仍然為其未來發展增添了一絲疑雲。
截至本月初,Groq實際部署上線的晶片數量約為7萬顆,這比其去年為今年第一季度設定的目標至少低了30%。
在計算能力方面,Groq的晶片目前也還難以匹敵輝達的旗艦產品Hopper或Blackwell系列AI晶片。
迄今為止,Groq已通過股權融資籌集超過10億美元,其投資者陣容強大,包括資管巨頭BlackRock、科技巨頭思科和三星旗下的風險投資部門、D1 Capital、Lee Fixel創立的Addition以及Tiger Global Management等。
然而,Groq及其同行們面臨著一個根本性挑戰:如何說服AI開發者放棄已成行業標準的輝達晶片生態?
為尋求突破,許多初創公司正將目光投向輝達供應相對緊張的中東市場。
例如,同樣位於矽谷的AI晶片初創公司SambaNova Systems正在向沙烏地阿拉伯石油巨頭沙烏地阿拉伯阿美供應晶片系統和軟體,後者正在開發名為Metabrain的大型語言模型項目。
鑑於研發和生產AI晶片需要極其高昂的資本投入,這些挑戰者們正積極開拓包括債務融資在內的多元化融資管道。
行業資料顯示,全球至少24家AI晶片初創公司的總融資額已超過70億美元。
整個行業也處在動態變化中:專注於AI模型訓練晶片的Cerebras去年曾提交IPO申請,但因G42貢獻了其90%的營收,需審查其與阿聯科技集團 G42的緊密關係而暫時擱置。
今年 5 月,Cerebras首席執行官表示仍希望年內完成上市。
另一家初創公司D-Matrix則專注於開發大型語言模型推理晶片,該公司去年計畫融資2.5億美元,目前已籌集約1.2億美元。據消息人士稱,D-Matrix當前正努力再融資1.8億美元,以期達成總額3億美元的目標。
Groq新一輪的融資動向,不僅是其自身發展的關鍵一步,也為觀察AI晶片市場格局演變提供了重要窗口。
Groq此時加碼融資,既是借助市場熱度擴大業務,也是為接下來的技術和商業化進展積蓄彈藥。而面對仍然牢牢掌控市場主導地位的輝達,Groq和它的同行們要走的路還很長。
1. Cerebras Systems
▪成立背景:成立於2016年,由Andrew Feldman等人創立。Cerebras旨在解決AI模型訓練對計算資源日益增長的需求。
▪核心產品:Wafer Scale Engine(WSE)晶片,最新版本WSE-3是目前全球最大的單晶片AI加速器,採用整個晶圓打造的超大晶片,擁有超過850,000個AI核心,20PB/s片內頻寬,系統功耗高達23kW。
▪技術亮點:WSE繞開了多晶片通訊的頻寬瓶頸,提供高度平行和高頻寬的訓練環境,尤其適合訓練GPT類大模型和科學計算任務。還推出MemoryX、SwarmX等輔助系統,提升可擴展性。
▪商業化路徑:推出Cerebras Cloud(託管訓練服務),並與G42合作在阿布扎比營運Condor Galaxy超級計算叢集,承接政府及科研訓練任務。
▪融資與IPO計畫:累計融資超過7.2億美元,主要投資人包括Benchmark、Altimeter、JP Morgan、Samsung。2023年已向SEC遞交IPO申請,但由於G42關係(其佔營收90%)受到審查,IPO暫緩。
2. SambaNova Systems
▪成立時間與背景:創立於2017年,由史丹佛大學教授Kunle Olukotun領導,團隊包括來自Sun Microsystems、Oracle等企業的資深晶片和系統架構師。
▪核心產品:DataScale 系列AI系統,基於自研Reconfigurable Dataflow Architecture(RDA)晶片架構,兼具硬體靈活性與性能效率。推出SambaNova Suite AI平台,支援定製化企業模型與推理服務。
▪技術亮點:強調“系統+軟體+模型”的端到端解決方案,客戶無需理解硬體即可使用大模型;提供預訓練模型以及模型託管部署服務。
▪商業化:客戶包括美國能源部、LLNL國家實驗室、沙烏地阿拉伯阿美等,在中東地區已有商用部署。
▪融資情況:總融資金額超過10億美元,2021年D輪融資後估值達50億美元,投資者包括SoftBank Vision Fund、Google Ventures等。
3. Tenstorrent
▪成立時間與創始人:成立於2016年,由Jim Keller領導,他曾任AMD Zen、蘋果A系列晶片、特斯拉自動駕駛晶片等項目的首席架構師,技術背景深厚。
▪產品與技術:Wormhole、Grendel等系列晶片,採用RISC-V架構與資料流平行處理方式,適用於訓練與推理雙場景。也推出可程式設計AI加速卡與軟體開發工具鏈。
▪核心優勢:專注高性能通用計算晶片,強調開放架構、靈活性與IP授權能力,適合希望定製化AI硬體方案的客戶。
▪商業化進展:產品主要用於AI推理,正在與汽車、工業、邊緣AI等場景整合,強調自研核心IP給合作夥伴。客戶覆蓋北美和亞洲多個市場。
▪融資情況:累計融資超2.3億美元,2023年獲現代汽車、三星、Eclipse Ventures、Real Ventures等注資。戰略合作也在向韓國市場推進。
4. D-Matrix
▪成立時間與方向:成立於2019年,聚焦於為大語言模型提供高效推理晶片,專注“in-memory computing”架構,減少推理時的資料搬移開銷。
▪核心產品:Corsair系列晶片,通過將計算單元與記憶體緊耦合,提升能效比,適合ChatGPT、Claude等Transformer模型的前端部署。
▪技術亮點:能效比遠高於GPU,主打低功耗、高吞吐,適合邊緣資料中心或私有雲推理部署。支援精度範圍靈活配置(INT4~FP16)。
▪商業化路徑:已進入樣品出貨階段,正與多個資料中心和LLM服務商測試整合。客戶未公開,重點佈局企業級模型呼叫服務。
▪融資進度:已融資約1.2億美元,正尋求追加1.8億美元以完成總計3億美元的C輪,投資方包括 Playground Global、SK Hynix 等。
5. Mythic AI
▪成立時間與願景:成立於2012年,致力於邊緣AI晶片開發,聚焦模擬計算(Analog Compute)與數字架構結合的低功耗設計。
▪主要產品:M1076 Analog Matrix Processor,可部署於安防攝影機、無人機、工業機器人等邊緣裝置。
▪技術核心:基於Flash記憶體電路設計的模擬矩陣運算,極大降低AI晶片功耗與成本。相比數字AI晶片,功耗可降低10倍以上。
▪商業化應用:已部署於一些軍事及工業場景,但規模仍小。客戶較為保密,開發周期長,受限於模擬計算精度和可重複性問題。
▪融資情況:累計融資超過1.7億美元,投資者包括SoftBank Ventures、Lockheed Martin Ventures、HP Tech Ventures等。 (每日天使)