1000億美元!華人幹出全球第四大AI獨角獸

年化收入已達37億美元。

又一家千億美元估值AI獨角獸即將誕生!

智東西8月20日報導,昨日,AI資料分析平台Databricks宣佈,該公司已經簽署了K輪融資的條款清單,預計將在現有投資者的支援下很快完成,這輪融資對Databricks的估值已經超過了1000億美元,估值與8個月前的620億美元相比,上漲了超61%。

▲Databricks官宣新融資(圖源:Databricks官網)

據TechCrunch援引知情人士的消息稱,Databricks最新一輪融資規模約為10億美元,投資方包括a16z、Thrive Capital等,並且獲得了“瘋狂的超額認購”。

成立於2013年的Databricks,主要提供統一的資料與AI平台服務,幫助企業整合和處理大規模資料,用於資料工程、資料科學、機器學習與AI應用,也能為電商、金融、醫療等領域的企業提供資料服務。其創始團隊中還有華人,聯合創始人兼首席架構師為Reynold Xin(辛湜)。

作為獨特的“湖倉一體”資料庫架構開創者,Databricks是資料智能領域的代表性企業,也是AI時代重要的資料基礎設施提供商。截至目前,有超過60%的財富500強企業採用了Databricks的資料智能平台來管理資料,並將其與AI結合。

Crunchbase的資料顯示,Databricks目前是全球估值排名第八的獨角獸企業。完成K輪融資後,Databricks有望成為僅次於OpenAI、字節跳動、xAI,估值排名全球第四的AI獨角獸企業。

值得一提的是,輝達也是Databricks的投資方之一,曾領投Databricks的I輪融資,規模為5億美元,但並未參與本輪融資。

Databricks稱,本輪融資中獲得的資金,將被用於加速Databricks的AI戰略,這包括進一步擴大企業級智能體服務Agent Bricks、投資面向AI Agent最佳化的新資料庫Lakebase,並支援未來的AI領域收購,深化AI研究。

01. 成立12年估值1000億刀客戶規模已突破1.5萬

Databricks的創始團隊由七位加州大學伯克利分校的教授和研究生組成,自2013年成立以來,陸續吸引了大約80家投資者的關注。

該公司的創始人大部分為加州大學伯克利分校AMPLab成員,共同打造了開源分散式運算框架Apache Spark,還創下資料排序速度的世界紀錄。後來,他們決定將相關技術商業化運作,Databricks應運而生。

▲Databricks七位創始人(圖源:福布斯)

據The Information報導,早期投資者稱,Databricks的創始人們對如何賺錢幾乎沒有直覺,董事會原本打算在外部聘請有經驗的領導者擔任CEO,但發現時任Databricks工程副總裁的Ali Ghodsi在員工中很有聲望。

接任CEO後,投資者對教授出身的Ghodsi還是有些遲疑。Ghodsi加緊研讀商業書籍,惡補了企業管理的方法。如今,他以親力親為地方式管理這家企業,高強度工作,風格強硬,並憑藉這種方式帶領Databricks快速發展,也獲得了客戶的信賴。

▲Ali Ghodsi(圖源:Databricks)

Adobe的首席資料官Bin Mu曾如此評價Ghodsi:“如果我遇到一個大問題,他會在接下來的一個小時內解決這個問題。”

Databricks的創始人團隊中還有華人身影。其聯合創始人兼首席架構師為Reynold Xin(辛湜),他高中畢業後前往加拿大多倫多大學就讀本科,後續在加州大學伯克利分校AMPLab完成博士學業,畢業後直接參與Databricks的創立。

▲辛湜(圖源:Linkedin)

“湖倉一體”架構是Databricks最重要的護城河之一。這一技術起源於DataBricks團隊創業前打造的Apache Spark項目,將資料倉儲的結構化資料儲存功能,與資料湖的非結構化和半結構化資料儲存能力融合,從而提升資料處理的效率與可靠性。

在AI時代,湖倉一體架構的價值愈發凸顯。AI訓練、推理過程中都需要使用到大量的結構化、半結構化和非結構化資料,湖倉一體架構能對這些資料統一儲存管理,支援即時資料攝入、處理和分析,還能彈性伸縮,從而降低儲存和計算成本。

湖倉一體架構也具備向量化檢索、與機器學習框架(如PyTorch)整合等AI原生設計,可簡化AI資料處理的流程。

2022年,OpenAI推出ChatGPT並引發全球AI熱潮後,Databricks聯合創始人兼CEO Ghodsi看到了AI對資料分析領域的巨大潛力,決定加大對AI技術的投資。當時,Databricks預計2022財年至2025財年期間的總現金消耗成本為15億美元。

2023年,Databricks還斥資13億美元收購了大模型創企MosaicML,此次收購幫助 Databricks在2024年3月份發佈了一個開源模型,但並未推出後續版本,轉而使用開源模型。

Databricks的一體化資料智能平台提供AutoML(自動化模型訓練)、Mosaic AI(模型部署)、AI Playground(無程式碼互動測試)、Unity Catalog Agent工具管理、MLflow整合等AI服務,支援從資料管理、訓練、部署到監控的AI開發全流程,可整合大模型、工具鏈,與資料平台無縫融合。

2024年時,Ghodsi稱,截至當年11月,包括Mosaic在內的生成式AI產品收入同比增長了300%

02. 連發多款AI Agent服務年化收入達到37億美元

在去年年底拿下100億美元的巨額融資後,Databricks在AI領域的動作不斷,推出多款新產品與服務,還在收購市場斬獲一家AI創企。

Agent是近期Databricks投資、發展AI技術的主線。今年5月,Databricks宣佈收購無伺服器Postgres資料庫(一種開放原始碼的對象關係型資料庫)公司Neon。Neon使用AI Agent來驅動資料庫的配置,其平台上八成的資料庫均由AI自動打造。

這筆交易的規模達到10億美元,Databricks可借此進一步消除傳統資料庫的彈性伸縮瓶頸,為AI Agent提供“AI優先”的底層資料庫功能。

收購Neon後不久,Databricks在今年6月推出了兩款Agent服務。

其中,Agent Bricks可用於自動化建立AI Agent,使用者只需提供對任務的簡單描述,並通過Databricks的資料庫向Agent提供企業資料,就能完成Agent建立。

Agent Bricks已經針對常見的行業用例進行了最佳化,比如結構化資訊提取、知識輔助、自訂文字轉換和多智能體系統等,企業可以用其完成對電子郵件、法律文書等內容的處理。

Databricks還推出了Lakebase,這是一款用於AI應用和Agent的新型完全託管Postgres資料庫。

Lakebase由Databricks此前收購的Neon提供技術支撐,與Databricks的資料湖倉平台Lakehouse深度整合,把業務資料和分析資料融合在一起,既能用來運行大規模分析,又能支援即時應用,滿足了AI Agent對快速查詢資料的需求。

這兩項服務起到了互補的作用,Agent Bricks顯著簡化了企業打造Agent的流程,而Lakebase能為這些Agent提供合適的資料庫。雖然都仍處在預覽階段,不過其易用性、生態整合度、相容性等獲得了市場的認可。

各類AI服務的推出,也成為Databricks的新增長點。今年6月,Databricks高管在一場投資者活動上稱,該公司的年化收入會在7月份達到37億美元(約合人民幣265.6億元)同比增長50%。同時,Databricks的客戶數量已經達到了15000多家

03. 外部力量大力推動本輪融資但還面臨多方競爭

Databricks已經成為矽谷當今最炙手可熱的投資標的之一,累計融資額近200億美元。收穫新一輪融資後,Ghodsi接受了CNBC的採訪,他稱在Figma完成IPO並股價飆升後,“我的手機被投資者轟炸了”,這輪融資“肯定有來自外部的大力推動”。

這也顯示出,投資方希望在Databricks這家同樣炙手可熱的AI企業IPO之前,分得一杯羹。在去年12月底官宣的J輪融資中,Databricks獲得了100億美元的巨額融資,創下當年度的融資紀錄,目前並不缺乏營運資金

Ghodsi稱,目前投資者最關心的問題就是,Databricks的Agentic AI服務能否真正地自動化工作流程,有沒有給企業帶來價值?Ghodsi對此的回應是,這些服務仍處在早期階段,目前更注重解決企業的日常任務。

Databricks的本輪融資,印證了市場對此類新型AI資料基礎設施公司的濃厚興趣,不過,Databricks仍需面對來自Snowflake、甲骨文等對手的競爭。

成立時間與Databricks相仿的Snowflake,被普遍認為是前者的主要競爭對手之一。Snowflake源自雲資料倉儲(Data Warehouse),主打結構化資料分析、易用性與企業級安全性。Databricks的Lakehouse則強調對結構化與非結構化資料的處理能力及AI/ML能力。

在AI時代,兩家公司的業務重合度不斷提升,都推出了資料Agent服務,在收購上也選擇了相同的方向——Snowflake於今年收購了Postgres資料庫創企Crunchy Data,與Databricks收購的Neon類似。Snowflake目前的市值約為642億美元,低於Databricks目前的估值。

▲Snowflake股價變動(圖源:雅虎財經)

甲骨文這樣的老牌資料庫企業,也在加緊佈局AI相關的資料產品。甲骨文於2024年推出了生成式AI Agent服務,提供檢索增強生成(RAG)等功能。今年3月,該公司進一步推出AI Agent Studio,作為企業建立、擴展、部署和管理AI Agent和Agent團隊的綜合平台,也能為Agent接入企業的自有資料。

諸如微軟Azure、Google雲、AWS等大型雲基礎設施公司也是這一市場中的重要參與者,並相繼推出了AI相關的資料服務。

諮詢公司IDC的報告顯示,2025年,在全球資料平台軟體提供商中,Databricks在能力維度排名全球第一,與Google、甲骨文、Snowflake等共同處於領導者範疇,但在規模上略小於Google和Snowflake。

04. 結語:Databricks接近自由現金流盈利,下一步會是IPO嗎?

多家分析機構指出,Databricks雖然仍在虧損,但在營運效率和成本控制上已有顯著改善,並有望在2025年實現自由現金流盈利。

隨著美股IPO市場回暖以及AI相關股票的驚人漲幅,投資者對Databricks潛在IPO的表現普遍看好——而近期一輪由投資者力推完成的融資,便成為最好的佐證。

不過,Databricks目前尚未提交IPO申請,其高管對相關事項的表述也較為模糊,僅透露有IPO意向,但未明確時間。 (智東西)