隨著DeepSeek的爆火,中國國產大模型雲服務平台SiliconCloud(矽基流動)開始被大家關注。
2月1日,矽基流動和華為雲宣佈聯合⾸發並上線基於華為雲昇騰雲服務的DeepSeekR1/V3推理服務。基於自研推理加速引擎加持,矽基流動和華為雲昇騰雲服務支援部署的DeepSeek模型可獲得持平全球⾼端GPU部署模型的效果。
矽基流動(siliconflow)成立於2023年8月,由袁進輝博士創立。袁進輝是清華大學電腦系的博士,並曾在微軟亞洲研究院任職,是一位“拿著錘子找釘子”的“技術派”。
矽基流動紮根AI Infra(AI基礎設施),袁進輝將公司定位為“token工廠”,希望通過自研推理引擎,讓開發者實現“token自由”,讓模型像水電一樣能按需使用。矽基流動的使命就是降低大模型應用成本和開發門檻,加速AGI(人工通用智能)普惠人類的發展處理程序。
AI Infra之所以重要,在於它是整個AI生態系統的基石。它連接算力和應用的AI中間層基礎設施,涵蓋了資料準備、模型訓練、模型部署和應用整合等環節。而在其眾多組成部分中,AI推理(AI Inference)的比重尤為突出。現在,AI領域的主戰場正悄然從訓練向推理轉移。在模型規模不斷擴大的同時提升推理效率和性能已是行業的關注點,成為推動AI應用落地的核心問題。“而且在AI推理市場,我還有未盡的使命。”袁進輝說。
以下為甲子光年對袁進輝的採訪:
問:為什麼選擇在Infra方向創業?
袁進輝:核心原因有兩個:一是這個領域的空間足夠大,二是確定性夠高。這點大家很容易理解。所謂確定性高,就是在行業早期,基礎設施層面的機會往往是最為穩妥的,類似於“賣鏟子、賣水”的角色,空間也非常廣闊。從整個行業的機會來看,可以分為應用層和底層基礎設施。基礎設施作為服務全行業的底座,有三個主要的切入點:晶片、模型和基礎設施(Infra)。最終,這三者如果要取得長遠的成功,都會走向類似於雲端運算(cloud)的形態,將模型和晶片整合在一起。我認為,從Infra的角度往雲端運算方向發展,機會並不比其他方向小。
問:為什麼要以推理部署為中心?
袁進輝:推理的計算需求和消耗的算力遠遠超過了訓練。雖然我們可以不用展開具體公式,但大家都知道,這主要取決於token的量。
訓練的token量是固定的,類似一個游泳池,資料量有限;而推理的資料量則像一條不斷流動的大河,幾乎是無止境的。另外,訓練的客戶集中度非常高,幾乎不可能有外部的創業公司能夠獨立承擔這類大規模訓練任務。原因在於,他們缺乏長期營運上千、上萬張GPU叢集的能力去打磨模型。
此外,訓練的提升空間已經非常有限。如果大家在一線從事相關工作,應該瞭解當前MFU理論(機器使用率)可以做到70%,而現在最好的訓練效率大約在50%到接近60%左右。剩下的提升空間不多了。而推理還有很大的最佳化潛力,特別是隨著O1等技術的出現,test-time compute也帶來了新的機會。
問:去年8 月創立矽基流動時,如何說服投資人支援?
袁進輝:關鍵在於 “人” 和 “事”。團隊經受過考驗,在 AI方向人才稀缺;AI Infra 前景好,從推理切入合理,“事” 本身的吸引力和市場空間能匯聚人才,但外界可能更看重 “人”。
問:模型廠商能提供推理服務,AI推理還能單獨成為生意嗎?
袁進輝:能。AI推理市場空間大、標準化程度高且有專業性。AI應用廣泛,token生成量巨大,推理成本高昂但使用量持續增長;其底層技術使用介面統一,便於標準化;用好推理存在技術門檻,標準化推理部署產品能滿足共性需求。
問:全球AI 推理市場規模有多大?
袁進輝:可從兩方面推算。一是依據生成token 數量,全球AI 企業眾多,token生成量不斷增加,按一定成本標準可推算市場規模;二是從算力運行推理任務角度,推理所需GPU 數量超過訓練且持續增長,結合伺服器成本、租金及利潤可推出市場規模。
問:矽基流動與定位為 “算力營運商” 的 AI Infra 公司有何不同?
袁進輝:矽基流動核心產品是SiliconCloud,提供一站式大模型API 雲服務平台。我們更像 “模型能力供應商”,將算力加工成接近使用者需求的產品,即成品模型,而非原始算力資源,也因此稱自己為 “token 工廠”“模力社區” 。
問:矽基流動與海外做AI 推理的公司有何異同?
袁進輝:相同點是對市場理解、瞄準需求及核心產品追求的指標相似。不同點在於產品類型和定價體系不同,市場選擇有差異。海外同行多關注美國市場,矽基流動起點是國內市場,也參與全球開放原始碼專案,吸引了海外需求。
問:矽基流動如何在全球眾多AI 推理企業中脫穎而出?
袁進輝:現在可用產品證明優勢。在完全競爭市場中,保持持續小幅領先很關鍵,競爭是綜合的,不同階段側重不同,初期應聚焦一個關鍵點。
問:矽基流動的稀缺性體現在那?
袁進輝:團隊在AI infra 積累深厚,在深度學習框架等項目經驗豐富。在文生圖和語言模型推理速度上優勢明顯,用輝達GPU 跑模型,速度領先。
問:矽基流動做了那些別人沒做或不願做的事?
袁進輝:我們最佳化消費級GPU 等低端硬體。消費級GPU 性價比高但最佳化難度大,很多廠商不願投入資源,我們解決了這一問題,給使用者更多選擇。
問:矽基流動會進入AI 應用領域嗎?
袁進輝:不會,我們專注於AI Infra 和相關工具,解決場景共性問題,建構工具箱和工具鏈,轉變為雲端產品。
問:矽基流動推出多款主流伺服器永久免費服務的原因是什麼?
袁進輝:這是一種策略,免費服務面向開發者,提供小模型,有流量限制,目的是引流和培養使用習慣,對企業使用者的更高需求服務則收費。
問:矽基流動目前主要市場在國內還是海外?
袁進輝:我們優先服務PLG 覆蓋的市場化客戶,這類客戶海外市場機會更大;大B 市場是第二階段目標。
問:中國AI 企業應如何出海?
袁進輝:海外市場付費意願和能力強,建議先進入。海外企業服務生態完善,做差異化優勢的標準化產品更有優勢。
問:AI行業出海,人需要跟著業務出去嗎?
袁進輝:只做海外市場,人出去更有優勢;偏底層產品、服務中小企業或通過PLG 開拓市場,人不一定需要出國;服務大企業則需線下拜訪,在美國必須有本地銷售團隊。
問:為什麼用 “偉大” 形容程式碼類應用 Cursor?
袁進輝:Cursor這類程式設計工具能理解和索引整個項目,讓無程式設計能力的人通過自然語言互動實現小應用程式,打開了 “人人都能成為開發者” 的可能性。
問:Cursor是你心目中的 “超級應用” 嗎?
袁進輝:是的。雖然當前使用者群體未達幾億,但從價值和潛力看,它在生產環節潛力巨大,在其他領域還未出現類似潛力的應用。
問:面對各類大模型產品,你的心態有何變化?
袁進輝:技術突破時興奮,但技術投入和發佈頻率高,出現 “審美疲勞”,人們開始反思技術實際價值,興奮度下降,對實際應用的期待增加。
問:矽基流動成立一年,是否達到預期?
袁進輝:基本達到。技術指標、核心引擎表現及產品推出符合預期,使用者反饋良好。未達到預期的是應用普及速度,服務規模和token 生成量未達預想。
問:OneFlow被收購後,有想過不做AI Infra 方向嗎?
袁進輝:沒有。我的專長是發揮技術價值,希望產品在多場景產生影響,所以選擇做基礎設施層。
問:年初你問自己 “我成長了嗎”,現在覺得自己成長了嗎?
袁進輝:成長了。這一年節奏快,成長主要體現在日常業務上,如市場、產品迭代、資源組態等,在體系化搭建上更加成熟。 (藍血研究)