#Databricks
AI晶片黑馬融資53億,估值490億
人工智慧推理晶片開發商 Groq Inc. 今天宣佈已籌集 7.5 億美元的新資金。Databricks Inc. 的支持者 Disruptive 領投了此輪融資。思科系統公司 (Cisco Systems Inc.)、三星電子公司 (Samsung Electronics Co.)、德國電信資本合夥公司 (Deutsche Telekom Capital Partners) 和多家投資公司也參與了此次融資。Groq 目前的估值為 690 萬美元,高於去年的 28 億美元。Groq 推出了一款名為語言處理單元 (LPU) 的處理器。該公司聲稱,該晶片能夠以比顯示卡高 10 倍的能效運行某些推理工作負載。Groq 表示,LPU 的高效運行得益於多項競爭對手晶片所不具備的最佳化。協調運行 AI 模型所涉及的不同處理器元件可能會消耗大量的計算能力。據 Groq 稱,其 LPU 降低了這種開銷,從而為推理留下了更多的處理能力。該公司表示,其晶片可以運行包含 1 兆個參數的模型。Groq 的 LPU 使用自訂編譯器減少了與電路協調任務相關的開銷。編譯器會在推理工作負載啟動之前計算出那個電路應該執行那個任務,從而無需在執行階段運行必要的計算。Groq 的編譯器還以其他方式最佳化 AI 模型。許多晶片使用一種稱為量化的技術來壓縮神經網路,這可以減少其記憶體佔用,但會犧牲一些輸出質量。Groq 表示,其編譯器使用了該技術的改進版本 RealScale。該技術僅壓縮神經網路中量化後輸出質量不會顯著下降的部分。LPU 的另一個賣點是它具有所謂的確定性架構。因此,可以以單個時鐘周期的粒度預測每個給定計算操作所需的時間。據 Groq 稱,LPU 的可預測性有助於實現原本難以實現的性能最佳化。該公司將其晶片作為名為 GroqRack 的裝置的一部分出售。該系統包含九台伺服器,每台伺服器都配備多個邏輯處理器 (LPU)。Grok 表示,GroqRack 所需的外部網路硬體比同類競爭產品更少,從而降低了成本,並且無需進行大規模裝置升級即可安裝在資料中心。該公司還通過雲平台提供晶片訪問。該平台名為 GroqCloud,託管由 LPU 驅動的 AI 模型,開發人員可以通過應用程式程式設計介面 (API) 將其整合到自己的軟體中。Groq 將利用新融資來擴展支援 GroqCloud 的資料中心網路。此次投資正值有報導稱,一家競爭對手的推理晶片供應商正在尋求新一輪融資之際。據報導,總部位於加州聖克拉拉的Rivos正在洽談以20億美元的估值籌集至多5億美元。該公司正在開發一款將顯示卡與中央處理器核心相結合的片上系統。Groq打造的LPU是什麼?Groq 建構快速的 AI 推理。Groq LPU AI 推理技術可提供卓越的 AI 計算速度、質量和規模經濟性。Groq AI 推理基礎架構,特別是GroqCloud,由語言處理單元 (LPU) 提供支援,這是一種新型處理器。Groq 完全從零開始建立和建構了 LPU,以滿足 AI 的獨特需求。LPU 能夠以更快的速度運行大型語言模型 (LLM) 和其他領先模型,並且在架構層面,與 GPU 相比,其能源效率最高可提高 10 倍。Groq LPU 通過四個核心設計原則以及其架構提供如此卓越的性能。具體而言,這些原則包括:軟體優先、可程式設計裝配線架構、確定性計算和網路和片上儲存器。■ LPU設計原則1:軟體優先Groq LPU 架構秉承軟體優先的原則,旨在簡化軟體開發人員最大化硬體利用率的工作,並將儘可能多的控制權交到開發人員手中。GPU 功能多樣、性能強大,能夠處理各種不同的計算任務。但它們也十分複雜,給軟體帶來了額外的負擔。它必須考慮工作負載在多個晶片內部和跨晶片執行方式的差異性,這使得調度執行階段執行和最大化硬體利用率變得更加困難。為了最大限度地提高 GPU 的硬體利用率,每個新的 AI 模型都需要編寫特定於模型的核心。這正是我們“軟體優先”原則如此重要的原因——對於 GPU 而言,軟體始終是硬體的次要因素。Groq LPU 從一開始就專為線性代數計算而設計——這是 AI 推理的主要需求。通過將重點限制線上性代數計算上並簡化多晶片計算範式,Groq 採用了一種獨特的 AI 推理和晶片設計方法。該 LPU 採用可程式設計流水線架構,使 AI 推理技術能夠使用通用的、獨立於模型的編譯器,並始終秉持其軟體優先的原則。軟體始終處於主導地位,完全控制推理的每個步驟。目標是使軟體開發人員能夠更輕鬆地最大化硬體利用率,並將儘可能多的控制權交到開發人員手中。軟體優先不僅僅是一種設計原則——它實際上是 Groq 建構其第一代 GroqChip™ 處理器的方式。在設計編譯器架構之前,我們從未接觸過晶片設計。編譯器接受來自多個不同框架的工作負載,並通過多個階段運行這些工作負載。當編譯器對應並調度程序在一個或多個邏輯處理器 (LPU) 上執行階段,它會最佳化性能和利用率。最終,程序將涵蓋整個執行過程中的所有資料移動資訊。■ LPU設計原則2:可程式設計裝配線架構Groq LPU 的主要定義特徵是其可程式設計流水線架構。LPU 具有資料“傳送帶”,用於在晶片的 SIMD(單指令/多資料)功能單元之間傳輸指令和資料。在組裝過程的每個步驟中,功能單元都會通過傳送帶接收指令。這些指令會告知功能單元應該從那裡獲取輸入資料(那條傳送帶)、應該使用這些資料執行那些功能以及應該將輸出資料放置在何處。此過程完全由軟體控制;無需硬體同步。LPU可程式設計流式架構支援晶片內和晶片間的流水線流程。晶片間頻寬充足,使資料傳送帶能夠像晶片內一樣輕鬆地在晶片間傳輸。即使在最大容量下,也無需路由器或控製器來實現晶片間連接。晶片內部和晶片間的裝配線流程消除了瓶頸。無需等待計算或記憶體資源即可完成任務。由於沒有瓶頸需要管理,晶片上無需額外控製器。裝配線運行順暢高效,完美同步。與 GPU 的工作方式相比,這是一個巨大的進步。GPU 採用多核“中心輻射”模型運行,這種模型中低效的資料分頁方法需要大量開銷,以便在晶片內部和跨晶片的計算單元和記憶體單元之間來回傳輸資料。GPU 還利用機架內部和跨機架的多層外部交換機和網路晶片進行相互通訊,這進一步加劇了軟體調度的複雜性。這導致多核方法難以程式設計。■ LPU設計原則3:確定性計算和網路為了使裝配線高效運行,必須高度確定每個步驟的確切耗時。如果某項任務的執行時間差異過大,這種差異就會影響整條裝配線。高效的裝配線需要高度精確的確定性。LPU 架構具有確定性,這意味著每個執行步驟都完全可預測,甚至可以精確到最小執行周期(也稱為時鐘周期)。軟體控制的硬體能夠高度精確地瞭解操作發生的時間和地點,以及執行所需的時間。Groq LPU 通過消除關鍵資源(即資料頻寬和計算)的爭用來實現高度確定性。晶片(傳送帶)擁有充足的資料路由容量,晶片的功能單元也擁有充足的計算能力。不同任務使用相同資源不會出現問題,因此不會因資源瓶頸而導致執行延遲。晶片之間的資料路由也是如此。LPU 資料傳送帶也在晶片之間運行,因此連接晶片會形成更大的可程式設計流水線。資料流在編譯期間由軟體靜態調度,並且每次程式執行時都以相同的方式執行。■ LPU設計原則4:片上儲存器LPU 包含片上記憶體和計算功能,可大幅提高資料儲存和檢索的速度,同時消除時序差異。確定性可確保裝配線高效運行並消除每個計算階段的差異性,而片上記憶體則可使其運行速度更快。GPU 使用獨立的高頻寬記憶體晶片,這帶來了複雜性——需要多層記憶體快取、交換機和路由器來來回回傳輸資料——同時也消耗了大量的能源。將記憶體整合在同一晶片上可以提高每次 I/O 操作的效率和速度,並消除複雜性和不確定性。Groq 片上 SRAM 的記憶體頻寬高達 80 TB/秒,而 GPU 片外 HBM 的記憶體頻寬約為 8 TB/秒。僅憑這一點差異,LPU 的速度就提升了 10 倍,而且 LPU 還無需往返於單獨的記憶體晶片來檢索資料,從而獲得了顯著的提升。晶片內部和晶片間的流水線流程消除了瓶頸,無需等待計算或記憶體資源即可完成任務。正是得益於這些設計,Groq LPU能 提供卓越的速度、質量和經濟實惠的規模化解決方案。得益於其固有的設計原則,LPU 的性能優勢將持久有效。GPU 的速度和成本將繼續降低,Groq 亦是如此,而且速度會更快。我們目前的晶片組採用 14 奈米工藝製造。隨著我們逐步邁向 4 奈米工藝,LPU 架構的性能優勢將更加顯著。Groq強調,上述是 Groq 指導 LPU 產品開發的“首要原則”。即使 GPU 製造商試圖縮小差距,公司也能確保保持顯著的性能優勢。 (EDA365電子論壇)
Databricks 與 OpenAI 達成 1 億美元合作,共推企業級 AI 解決方案
資料分析與人工智慧領域的重要參與者 Databricks 宣佈與 OpenAI 建立深度合作關係,雙方簽署了一份價值 1 億美元、為期多年的合作協議。根據協議,Databricks 將在其資料平台和 AI 產品 Agent Bricks 中整合 OpenAI 的先進模型(包括即將發佈的 GPT-5),旨在幫助企業更安全地利用自有資料部署生成式 AI 工具。這一戰略合作折射出當前企業加速擁抱 AI 解決方案的行業趨勢。Databricks 作為基於雲的資料平台,專注於提供資料工程、協同資料科學和機器學習服務,其核心使命是簡化和加速企業的資料分析與 AI 應用流程。OpenAI 則是以"確保通用人工智慧造福全人類"為宗旨的研究機構,其開發的 GPT 系列模型已在各行業得到廣泛應用。與 Databricks × Anthropic 合作的對比今年三月,Databricks 與 Anthropic 達成一項為期五年、目標金額 1 億美元的合作,旨在將 Claude 引入受監管的企業資料環境。從結構和敘事來看,此次 OpenAI 的合作與上述協議如出一轍:同樣是多年期、九位數規模的雄心,強調“基於資料的智能體”,並承諾通過原生路由和評估機制讓團隊能為不同任務選擇合適模型。競爭層面的解讀很直接:Databricks 正在實施多模型搶佔策略,通過投入資金確保 Claude 和 GPT 同時“上架”,再依靠評估結果和成本曲線決定每項任務的最佳模型。對 Anthropic 而言,這提高了其在 Databricks 管道內的差異化門檻;而對 OpenAI 來說,則是在少數真正具有企業級影響力的資料平台中追平了 Anthropic 的佈局。戰略背景近期被列為具備資料駐留控制功能的指定服務“Agent Bricks”,是 Databricks 將“演示級智能體”轉化為可量化監管系統的工具。結合其開源模型線 gpt-oss,Databricks 在統一治理框架下建構了可靠的“閉源+開源”組合。再加上近期通過併購降低智能體延遲和資料管道成本的動作,其戰略意圖顯而易見:在湖倉平台內建構智能體運行環境,再引入全球頂尖模型為其賦能。這一佈局的成功前提是,其可靠性與總成本必須優於企業去年已自建的堆疊方案。行業觀察此次合作凸顯了企業級 AI 市場的兩個關鍵動向:一方面,像 Mastercard 這類頭部客戶對 AI 工具的需求正在激增;另一方面,AI 廠商需要通過戰略合作確保技術落地場景。OpenAI 通過此協議獲得穩定收入來源,有利於其基礎設施擴建規劃,而 Databricks 則借此強化了在激烈競爭中的差異化優勢。 (InfraNative)
對標Databricks,AI原生多模態資料智能平台 MOI發佈
Matrix Origin MOI對標Databricks與Snowflake,AI原生多模態資料智能平台正式發佈。2025年9月13日,Matrix Origin正式推出AI原生多模態資料智能平台MatrixOneIntelligence(MOI)以及超融合異構雲原生資料庫MatrixOne(MO)。此次發佈標誌著資料智能領域邁出關鍵一步,特別是在人工智慧與資料基礎設施的深度融合方面。MOI的推出旨在通過技術創新加速AI在企業中的落地,為行業帶來更高效、智能的資料處理與分析解決方案。超融合架構 + Data Git:MO的核心優勢MatrixOne的核心在於其超融合架構,旨在解決企業長期存在的資料孤島問題。通過整合不同類型的資料來源,MO可提供統一的資料訪問與管理平台,從而簡化資料處理流程、降低營運成本。MO創新性地引入了“Data Git”概念,該功能顯著縮短AI項目的開發周期,尤其在處理複雜資料場景時,大幅提升項目敏捷性。這一版本控制機制使團隊能夠更高效協作、追蹤資料變更,並快速回滾至歷史狀態,對AI模型迭代與資料治理至關重要。MOI:下一代資料基礎設施的戰略佈局MOI被定位為下一代Data Infrastructure,其核心目標是為企業提供一站式AI資料智能平台。該平台支援自然語言驅動的工作流,意味著使用者可通過自然語言指令運算元據、進行分析與決策,極大降低使用門檻。技術上,MOI對標Databricks與Snowflake,後兩者在資料智能領域已取得顯著成就。Matrix Origin此次戰略舉措旨在通過技術創新縮小與行業領先者的差距,為企業提供更具競爭力的解決方案。Matrix Origin深耕資料智能多年,客戶涵蓋網際網路、金融、能源、製造、醫療等多個行業,表明MOI具備廣闊的應用前景,能夠滿足不同領域對資料智能的多樣化需求。Matrix Origin在資本市場亦展現出強勁的增長勢頭。公司已於2024年5月完成數百萬美元Pre-A輪融資,並於2025年8月獲得超過2億元人民幣的資金,目前正在進行新一輪融資。這表明資本市場對Matrix Origin的發展前景持樂觀態度,為MOI的持續研發與市場拓展提供了充足的資金支援。隨著人工智慧技術的不斷發展,對資料智能平台的需求將持續增長。Matrix Origin有望憑藉其技術優勢與市場經驗,在這一領域取得更大突破。MOI的發佈不僅展現了Matrix Origin的技術實力,也預示著資料智能行業將迎來新一輪變革。未來,資料智能平台領域的技術創新將圍繞以下幾個主流方向展開:1. 生成式AI與增強分析:通過自然語言互動、自動生成洞察與決策建議,降低分析門檻,實現“人人可用”的 analytics。2.多模態資料融合與即時處理:支援文字、圖像、語音、時序等多模態資料的統一儲存、索引與即時計算,滿足AI應用對多樣化資料的需求。3.Data as Code(資料即程式碼):借鑑DevOps理念,實現資料版本控制、CI/CD、可觀測性,提升資料開發效率與治理水平,類似MO的“Data Git”。4. 邊緣智能與雲邊協同:將AI能力下沉至邊緣節點,實現低延遲、高隱私的資料處理,同時與雲端協同,最佳化資源利用。5.智能體(Agent)編排與自動化決策:通過多智能體協作、任務規劃與執行,實現從資料到行動的閉環自動化,推動企業營運智能化。6. 資料安全與隱私計算:在資料共享與分析過程中,融合差分隱私、聯邦學習、同態加密等技術,保障資料合規使用。7. 量子計算與AI融合:探索量子計算在複雜最佳化、特徵提取等AI任務中的應用潛力,提升計算效率。這些趨勢將共同推動資料智能平台向“AI原生、多模態、自動化、可信任”方向演進,成為企業數位化轉型的核心基礎設施。 (壹號講獅)
躺在風口上的矽谷教授!身家180億不離講台,捧出7家AI創企
7家創企,118個科研項目背後的傳奇教授。這位擁有25億美元(約合人民幣179億元)身家的大學教授,為何還堅守在一線課堂?智東西9月2日報導,近日,AI資料平台Databricks在最新一輪融資後,估值突破1000億美元(約合人民幣7162億元),有望成為全球估值第四高的AI獨角獸,這也讓外界關注到其聯合創始人兼董事長、加州大學伯克利分校(後簡稱UCB)教授Ion Stoica,以及他橫跨產業與學術界的傳奇經歷。Stoica現年60歲,自2000年起開始在UCB任教,此後25年來均未離開這一校園。2010年至今,Stoica在UCB電腦學院參與了3所重要實驗室的創辦和管理。這些實驗室在巨量資料、雲端運算和AI時代貢獻了118個科研項目,其中不乏影響力廣泛、幾乎成為AI領域核心基礎設施的項目,如巨量資料框架Spark、分佈式執行框架Ray、大模型推理框架vLLM等。▲Ion Stoica(圖源:YouTube)他還通過親自參與創業、指導創業或是提供人脈與資金支援的方式,創辦或孵化了至少7家知名創企,分佈於資料基礎設施、生成式AI等行業。除了估值已經突破1000億美元的Databricks,Stoica聯合創辦了估值10億美元的AI託管計算平台Anyscale、估值6億美元的LMArena(大模型競技場)和估值3億美元的視訊流分析技術公司Conviva等企業。Stoica是高性能AI與資料分析平台Alluxio創始人李浩源、資料中心作業系統創企Mesosphere創始人Benjamin Hindman的博士生導師,這兩家創企均發源於開放原始碼專案,曾得到Stoica的指導。目前,Stoica還在大模型記憶技術創企Letta擔任顧問。儘管取得了商業上的成功,但Stoica仍然心繫教育、科研。今年秋天,Stoica將繼續留在課堂,教授作業系統和系統程式設計的本科課程。通過在矽谷的人脈,Stoica給自己的實驗室拉來了極為豪華的贊助商陣容,包括輝達、Meta、螞蟻集團、AMD、Google、亞馬遜、華為等知名企業。他還給將自己創業獲得的資產投入科研,給實驗室提供資金支援。在向《福布斯》分析自己成功的原因時,Stoica稱,這要歸功於他對科研的專注:“這是一種創造的過程,不斷探索新想法。”在本文中,我們將回顧Stoica傳奇的創業與科研經歷,並瞭解他對自己成功經歷的思考和總結。01. 師從北大電腦校友張暉 06年首次開啟創業Stoica於2000年在卡耐基梅隆大學(後簡稱CMU)完成博士學業,導師是該校史上最年輕的終身教授張暉(北大電腦學院84級院友)。同年,他加入UCB,並從教至今。UCB地處矽谷,有極為濃厚的創業氛圍,Stoica也在2006年了自己的第一個創業項目——Conviva。▲Conviva的創始團隊(圖源:Conviva官網)2006年,串流媒體內容逐漸興起,YouTube已經成為主流平台之一。Stoica與他的導師張暉看到了市場對線上視訊體驗最佳化的需求,並在CMU和UCB的科研成果基礎之上開始創業,聯合創辦了Conviva。早期,Conviva專注於即時視訊流分析,成為全球最早實現影片播放自適應的平台之一。該公司通過AI技術識別視訊平台的播放質量問題,並收集使用者的觀看資料(包括正在觀看的內容、使用者喜好等),形成分析報告。Conviva的主要客戶包括美國福克斯公司(FOX)、NBC環球集團旗下的串流媒體平台Peacock等。Stoica原本在Conviva擔任CTO一職,但目前已經不在Conviva擁有正式管理層職位。他仍然留在董事會,每週都會與團隊見面。成立以來,Conviva已經完成了7輪融資,總融資額為1.1億美元。其上一輪融資於2017年完成,當時投後估值約為3億美元。02. 給巨量資料時代打造核心基礎設施 成果轉化為千億估值創企在創辦Conviva的同時,Stoica也沒有停下學術與科研的腳步。UCB電腦科學學部有每5年成立一個合作實驗室的傳統,Stoica深度參與了該學部近15年來成立的三大實驗室,帶領成員做出了頗具學術與行業影響力的成果。2011年,UCB成立了AMP(演算法、機器與人)實驗室。在官宣實驗室成立的演講中,Stoica稱,AMP實驗室希望通過緊密整合演算法、機器和人力,實現對巨量資料的理解。在其存續的5年間,AMP實驗室打造了25個科研項目,包括開源分佈式資源管理框架Apache Mesos、開源分佈式巨量資料處理框架Apache Spark、開源分佈式資料編排平台Alluxio(原名Tachyon)等,成為巨量資料基礎設施領域的重要貢獻者。這三大開放原始碼專案,最後都轉化為創企:Databricks(總融資208億美元,估值超1000億美元)Databricks是Stoica參與創辦的第二家創企,主營業務是AI資料分析平台。其創始團隊由七位加州大學伯克利分校的教授和研究生組成,大都來自Stoica所管理的AMP實驗室。▲Databricks創始團隊,Stoica為左數第二位(圖源:Databricks)2009年,Databricks的創始團隊開發出開源分佈式巨量資料處理框架Spark,並不斷維護、更新這一項目,還一度創下了資料排序速度的世界紀錄。在將Spark作為開放原始碼專案營運一段時間後,Databricks的聯合創始人、UCB副教授的Matei Zaharia稱,Stoica希望將Spark變成一家初創公司,以鼓勵使用者更認真地對待此類來自高校實驗室的研究。2013年,Databricks正式成立。憑藉著開放原始碼專案Spark的成功,Databricks在A輪融資時便獲得來自a16z的1400萬美元融資。2013年-2016年,Stoica擔任Databricks CEO一職,深度參與公司日常管理與決策。他在2016年將CEO一職交棒給了曾在AMP實驗室擔任訪問學者的Ali Ghodsi。對於這一決定,他在接受《福布斯》採訪時說道:“超過這個時間就意味著離開伯克利,所以我必須做出選擇,我選擇了回去。”如今,Databricks已經成長為估值超過1000億美元的超級獨角獸,服務超過60%的財富500強企業。Stoica仍在這一公司擔任董事會執行主席的職務。▲Stoica擔任Databricks董事會執行主席(圖源:Databricks)Alluxio(總融資額7300萬美元,估值暫未披露)Alluxio原名Tachyon,是一個以記憶體為中心、容錯的虛擬分佈式儲存系統,旨在解決Apache Spark生態系統內的資料共享挑戰。2015年,Alluxio正式成立,早期投資者為a16z——這是一家與Stoica關係密切的投資機構。其創始人兼CEO李浩源在AMPLab完成了相關研究,論文指導者便包括其博士生導師Stoica。▲Alluxio目前的管理團隊,上排左一為李浩源(圖源:Alluxio官網)隨著技術趨勢轉向混合雲和多雲架構以及AI,Alluxio不斷髮展,為AI和資料密集型工作負載的資料訪問提供解決方案。如今,Alluxio的AI加速平台為全球十大網際網路公司中的九家提供支援。Alluxio已經完成4輪融資,其最近一輪融資於2021年底完成,由高瓴創投領投,融資額達5000萬美元。不過,其估值暫時未對外披露。Mesosphere/D2iQ(總融資2.5億美元,最高估值7.75億美元)Mesosphere成立於2013年,Stoica的學生Benjamin Hindman在其中擔任CIPO(首席智慧財產權官)的職務。這家公司的主要技術來自於開放原始碼專案Apache Mesos,而Benjamin Hindman是這一項目的核心作者。DCOS(資料中心作業系統)是Mesosphere的核心產品。Mesosphere將資料中心抽象為“單一大機器”,通過分佈式核心調度和資源管理,為大規模計算與資料密集型工作負載提供統一的運行平台。2015年,Mesosphere宣佈獲得a16z等頂級風投的投資。隨著容器化、微服務和雲原生趨勢的興起,Mesosphere後續在產品上逐漸轉型,支援Kubernetes,並在2019年正式更名為D2iQ。D2iQ的解決方案主要面向混合雲與企業級Kubernetes平台,幫助客戶簡化雲原生應用的部署與維運。迄今為止,D2iQ融資總額接近2.5億美元,投資方包括a16z、Khosla創投、惠普等,其估值曾經在2018年完成的D輪融資後達到7.75億美元。微軟、Google等都曾傳出有收購D2iQ的意向,但因D2iQ管理層反對而未能完成交易。2023年底,D2iQ宣佈終止營運,公司資產將進行清盤,並分配給債權人。03. 指導高性能分佈式執行框架Ray科研 衍生創企估值已達10億美元2017年初,Stoica參與到了UCB RISE(即時智能安全執行)實驗室的建立與管理工作中。當時,Stoica等人已經意識到,資料生成、計算和執行之間的循環正在閉合,AI已成現實,計算的影響正在擴展到世界的每一個角落。RISE實驗室與AMP實驗室一脈相承,期望能在巨量資料分析的基礎上,進一步發展相關技術堆疊,幫助應用程式即時地、智能地且安全地與環境進行互動。在大規模機器學習和強化學習領域,RISE實驗室貢獻了超41個開放原始碼專案,其中影響力最大的當屬高性能分佈式執行框架Ray,這一項目成功轉化為創企Anyscale。Anyscale(總融資2.59美元,估值10億美元)2019年,Anyscale成立,創始團隊包括Stoica、Philipp Moritz(Stoica的博士生)和Robert Nishihara等人。Stoica目前在Anyscale擔任董事會執行主席的職位。Philipp Moritz和Robert Nishihara是Ray的主要作者,這一項目大幅度提升了分散式運算的易用性,讓開發者能夠用簡單的API,把單機Python程序擴展到大規模分佈式環境。Stoica指導這兩位作者完成了Ray的相關研究。▲Stocia與Anyscale其他聯合創始人的合影(圖源:Anyscale官網)Ray提供了統一的程式設計方式,開發者不必關心底層分佈式細節。相比於傳統的Spark、Hadoop,Ray更靈活,支援低延遲的任務調度和多種計算模式(批處理、流式、線上推理等)。這一項目在AI/ML領域影響力尤其大,業內許多流行的庫都是基於Ray建構的,如Ray Tune超參數調優框架、Ray RLlib強化學習庫等。在此基礎上,Anyscale為Ray提供了完全託管計算平台,加入了最佳化、可觀察性、資料治理和開發人員工具等,使其成為運行Ray工作負載的最佳平台之一。目前,Uber、OpenAI、Shopify和亞馬遜等頭部企業的開發人員正在使用Ray建構機器學習平台。Anyscale成立6年來共完成4輪融資,總融資額達2.59億美元。2022年完成C輪融資後,其最新估值為10億美元。04. 實驗室3年貢獻52個項目 幫大模型造擂台、記憶庫2022年,Stoica又推動了天空計算實驗室(Sky Computing Lab)的成立。天空計算是雲平台之上的一層,其目標是實現雲之間的相互協作,讓應用程式能夠在任何雲提供商上實現“一次寫入,隨處運行”。天空計算實驗室近年來已經貢獻了52個項目,打造了本輪生成式AI浪潮中重要的基礎設施,包括大模型推理引擎vLLM、AI作業框架SkiPilot、大模型評估平台Chatbot Arena(現名LMArena)、視訊生成模型評估平台Video Arena、智能體記憶系統MemGPT等,其中,LMArena和MemGPT已經實現公司化運作。LMArena(總融資1億美元,估值6億美元)LMArena由Stoica和他的學生Wei-Lin Chiang、Anastasasios N. Angelopoulos等人聯合創辦,Stoica擔任LMArena的董事長。這一平台通過“人類偏好投票”方式,公開評估大語言模型性能。當使用者在這一平台上提交提示詞後,會有兩個匿名模型作答,然後基於使用者選擇判斷哪個模型表現更佳。LMArena的資料與排行榜廣受業界關注,甚至成為不少模型發佈前的重要參考。目前,LMArena託管了400多個AI模型,平台使用者投票數達到350多萬張。今年年初,LMArena完成1億美元的種子輪融資,領投機構為a16z,投後估值達6億美元。融資完成後,LMArena團隊發佈了全新設計的平台,最佳化了介面和投票流程,並逐步加入登錄、聊天記錄保存、WebDev Arena等功能模組。Letta(總融資1000萬美元,估值7000萬美元)Letta成立於2024年,由天空計算實驗室的兩位博士生Sarah Wooders和Charles Packer創辦。其中,Stoica是Sarah Wooders的博士生導師,並在該公司擔任顧問。▲Letta創始團隊(圖源:Letta)Letta的核心技術源自MemGPT,後者是天空計算實驗室的一個開放原始碼專案。MemGPT提出了“大模型作業系統”的概念,專注於大模型的上下文管理和長期記憶能力,讓大模型變得“有狀態”(Stateful)。2023年10月,MemGPT項目在正式發佈論文和程式碼之前,就憑藉一份白皮書迅速走紅。該項目正式發佈在GitHub上後,已經收穫1.8萬星標收藏,有近2000個分支項目。Letta目前的主要產品包括Letta雲(打造和部署有狀態Agent的雲平台)和用於增強Agent處理外部檔案能力的Letta檔案系統。2024年9月,Letta獲得1000萬美元種子輪融資,估值達7000萬美元。05. 靠拉贊助和創業反哺科研 80多名學生從中受益Stoica過去15年內主持工作的三所實驗室,擁有不少共同的特點:開源、前沿、與產業密切結合。這些特點讓它們不止停留在學術機構的層面,還擁有孵化器般的能力。自2011年的AMP實驗室以來,Stoica就特別注重與產業界的密切合作。AMP實驗室拉來了Google、SAP、亞馬遜、華為、IBM、英特爾、微軟、VMWare等企業作為贊助商。此後,Stoica的實驗室還獲得了輝達、Meta、螞蟻集團、AMD、博通、三星、Lambda等企業的支援。同時,通過不斷創業,Stoica的創業項目還使他成為了億萬富翁,現資產大約有25億美元,他將一部分個人資產投入實驗室的營運工作中。這些真金白銀的支援讓Stoica的實驗室擁有資金和資源,得以同時開展大量研究項目。目前,Stoica在UCB擔任研究資金削減問題工作組的主席。他鼓勵其他教授向他一樣通過創業獲取資金,在美國政府削減科研資助的大背景下繼續科研。但成為億萬富翁並非Stoica的目標。Stoica在接受《福布斯》採訪時稱:“我仍然是一名學者,如果賺錢是唯一的驅動力,那我就去IPO了。這是最簡單的方法,但我不是出於這一目的而創業,我想創造有意義的東西。”他還認為,自己在創業中獲得的成功,得益於對科研的專註:“這是一種創造的過程,不斷探索新想法。”此外,大學的科研項目大多具有開源性質,能吸引企業使用,而大部分公司不會開源最佳系統。基於開放原始碼專案打造的企業,在起步階段就能獲得不少聲量。將Stoica留在學術界的原因,可能是他的學生們。他向《福布斯》說道:“這些處在成長期的年輕人不知道什麼做的成,什麼做不成,但他們有信念,能做出讓人出乎意料的解決方案。”由Stoica親自指導的80多名學生從他的資源和關係網中受益,他們絕大多數都在學術界、大公司就職,或是擁有自己的初創公司,其中包括在Databricks工作的至少7名學生。06. 結語:高校前沿探索仍有望轉化為巨大商業價值當今的AI浪潮中,有越來越多頗具影響力的成果,誕生在產業界,這也讓外界一度懷疑:在計算資源要求越來越高、規模效應越來越強烈的AI領域,學術界的價值何在?而Stoica教授的成功經歷證明,在高校進行的開源、前沿探索項目,往往能對產業界起到極為重要的補充和啟發性作用。在以適當的方式轉化為企業後,仍然可以貢獻巨大的產業和商業價值。 (智東西)
Databricks精準踩中AI時代的兩大風口,躍升為全球第四大AI獨角獸
Databricks之所以能夠躍升為全球第四大AI獨角獸(估值1000億美元,僅次於OpenAI、字節跳動和xAI),核心在於其精準踩中了AI時代的兩大風口:資料基礎設施與AI智能體,並通過“技術+收購”雙輪驅動實現爆發式增長。一、技術根基:從Spark到LakehouseDatabricks的起點是加州大學伯克利分校實驗室的Apache Spark項目,該開源框架打破了資料排序的世界紀錄,為海量資料處理提供了高效工具。基於Spark的深厚積累,Databricks推出了“湖倉一體”(Lakehouse)架構,將資料湖的靈活性與資料倉儲的管理能力融合,成為AI訓練所需的資料底座。這一架構既解決了企業資料孤島問題,又提供了高性能計算能力,契合了AI時代對大規模、多樣化資料處理的迫切需求。從伯克利 AMPLab 到 Apache Spark2013 年,7 位 UC Berkeley AMPLab 的成員(含華人聯合創始人 Reynold Xin)把實驗室裡拿下資料排序世界紀錄的 Apache Spark 商業化,創辦了 Databricks。Spark 的高性能分散式運算為後來的“湖倉一體”架構奠定了核心技術壁壘。二、戰略升級:All in AI與AI智能體佈局2022年ChatGPT引爆生成式AI熱潮後,Databricks CEO敏銳意識到AI在資料分析領域的巨大潛力,果斷帶領公司全力押注AI。為此,公司制定了清晰的戰略方向——聚焦AI智能體(Agent),並推出兩大核心產品:-Agent Bricks:一個易用的“智能體”生產線,幫助企業快速建構和部署AI agent,執行從員工入職到個性化HR問答等日常任務。- Lakebase:專為AI agent最佳化的高速資料庫,基於開源Postgres打造,旨在解決傳統資料庫在AI場景下的性能瓶頸。這一戰略佈局使Databricks從傳統的資料平台升級為AI驅動的智能體平台,搶佔了AI應用落地的關鍵賽道。三、資本助力:千億估值融資與延遲IPODatabricks的崛起離不開資本的強力助推。2024年12月,公司完成100億美元J輪融資,估值620億美元;僅8個月後,新一輪K輪融資將其估值推高至1000億美元,增長61%。資本狂熱背後,是投資者對AI基礎設施稀缺資產的爭奪——Databricks服務的15000+客戶中,包括60%以上的《財富》500強企業,年化收入達37億美元且增速50%,財務表現遠超競爭對手。投資方包括 a16z、Thrive Capital、阿布扎比 MGX、貝萊德等頂級機構,融資被“瘋狂超額認購”。資本看好其“AI 時代資料基礎設施”定位,預期未來 IPO 將複製 Figma 上市後的飆升行情。值得注意的是,CEO明確表示,新融資將用於推遲IPO,以規避公開市場的短期壓力,專注於長期技術投入和生態擴張。這種“延遲上市”策略為公司提供了更大的戰略靈活性,也反映了資本對確定性增長的追逐。四、生態擴張:巨頭合作與人才爭奪為鞏固行業地位,Databricks積極建構合作夥伴生態,與微軟、Google Cloud、Anthropic、SAP、Palantir等巨頭深化合作,滲透更多行業場景。同時,公司正大規模擴張團隊,目前約9000名員工,年內計畫新增3000人,以應對激烈的AI人才競爭。Databricks的崛起是技術前瞻性、戰略聚焦與資本槓桿共同作用的結果:它以資料基礎設施切入AI價值鏈上游,通過Lakehouse架構和AI智能體佈局鎖定未來增長,再借資本之力加速擴張並延遲IPO以保持戰略定力。這一系列組合拳,使其成功躋身全球AI獨角獸前列。Databricks 用 12 年把實驗室裡的 Spark “火花”先煉成湖倉一體的“鋼筋水泥”,再在 AI 風口上加固成資料智能的“摩天大樓”,最終借助資本狂潮,完成從學術項目到千億美元獨角獸的跨越。 (壹號講獅)
1000億美元!潮汕80後幹出全球第五大AI獨角獸!
繼SpaceX、OpenAI、字節跳動和xAI之後,又一家千億美元估值AI獨角獸即將誕生!其創始人團隊中還有一個華人身影——來自潮汕的80後華人技術大牛辛湜。01 AI資料分析平台Databricks將成為全球第5家估值超千億美元獨角獸當地時間周二,全球領先的資料、分析和人工智慧公司Databricks發佈公告稱,公司正在進行一輪超過10億美元的K輪融資,各方已經簽署了投資條款清單,預計將在現有投資者的支援下很快完成。這輪融資對Databricks的估值已經超過了1000億美元(約合人民幣7179.1億元),估值與8個月前的620億美元(約合人民幣4451.0億元)相比,上漲了超61%。Databricks官宣新融資(圖源:Databricks官網)據報導,Databricks這一輪最新融資的投資方包括a16z、Thrive Capital等,並且獲得了“瘋狂的超額認購”。公司預計新增資金將用於加速人工智慧戰略,並推動全球增長。值得注意的是,Databricks目前是全球估值排名第八的獨角獸企業,隨著這輪最新融資完成後,將使其估值突破1000億美元,成為僅次於航空航天科技公司SpaceX(估值超3000億美元)、人工智慧領軍企業OpenAI(估值超3000億美元),移動網際網路巨頭字節跳動估值超3000億美元)以及馬斯克的人工智慧公司xAI(估值超1100億美元)之後的,估值排名全球五的AI獨角獸企業。02 去年剛完成100億美元創紀錄融資輝達也是投資者Databricks成立於2013年,主要提供統一的資料與AI平台服務,幫助企業更高效地管理和分析大規模資料,用於資料工程、資料科學、機器學習與AI應用,也能為電商、金融、醫療等領域的企業提供資料服務。來源:公司官網Databricks是獨特的“湖倉一體”資料庫架構開創者,這一資料庫架構打通資料儲存、查詢、分析的整套流程,近年來還引入可視化工具和生成式AI功能。用股民能理解的話來講,諸如MySQL這樣的普通資料庫只能儲存結構化的規整資料,但Databricks是“資料庫+量化投研+AI實驗室”的組合平台——既能直接儲存原始股票資訊、社交媒體輿情、公司公告,也能使用這些資料生成報表、寫投研分析,還能在平台上訓練AI模型,用來生成選股策略。據瞭解,自成立12年來,Databricks已先後完成了14輪融資。去年11月,Databricks完成了一輪100億美元的融資,當時公司估值達到620億美元,成為當年最大的 VC 輪融資,同時也是有史以來最大的 VC 輪融資之一。今年1月,Databricks又完成了52.5億美元的債務融資。2014年11月,Databricks官宣完成100億美元的融資值得一提的是,輝達也是Databricks的投資方之一,曾領投Databricks的I輪融資,規模為5億美元,但並未參與本輪最新融資。如今,Databricks已成為資料智能領域的代表性企業,也是AI時代重要的資料基礎設施提供商。截至目前,有超過60%的財富500強企業採用了Databricks的資料智能平台來管理資料,並將其與AI結合。03 創始人團隊有華人身影是位潮汕80後Databricks的創始團隊由7位加州大學伯克利分校的教授和資料科學家組成。該公司的創始人大部分為加州大學伯克利分校AMPLab成員,共同打造了開源分散式運算框架Apache Spark,還創下資料排序速度的世界紀錄。後來,他們決定將相關技術商業化運作,Databricks應運而生。Databricks七位創始人 圖源:福布斯值得注意的是,Databricks的創始人團隊中有一位華人身影,其聯合創始人兼首席架構師Reynold Xin(中文名:辛湜)祖籍潮汕,他也是潮創會北美分會成員。據瞭解,辛湜出生於1986年,小學時就開始接觸程式設計,高中就讀於深圳中學。高中時,辛湜和朋友合作編寫了FastBoard程序網站(Celeste的前身)和當時國內最大的PHP網站。Databricks聯合創始人兼首席架構師辛湜高中畢業後,辛湜前往加拿大多倫多大學就讀工程科學專業,之後在加州大學伯克利分校攻讀電腦博士學位。在攻讀博士之前,他還在 Google 做過分佈式系統開發,參與了 IBM 分佈式的 DB2 核心的開發。2016年,辛湜回到母校深圳中學演講2010年,在加州大學伯克利分校博士畢業後,這位技術大牛開始參與創業,直接參與了Databricks的創立。2013年,辛湜與加州大學伯克利分校的其他六位博士生共同創立了 Databricks。Databricks 最初打造的巨量資料工具Spark,可以幫助企業以極快的速度分析其內部巨量資料,辛湜和團隊將Spark打造成為了全球最大最熱門的巨量資料開放原始碼專案,也憑此獲得了在矽谷的立足之地。Databricks 在成立不到一年的時間,就迅速獲得了由 Andreessen Horowitz 領投的 A 輪融資 1400 萬美元。2020年末,Databricks推出智能資料倉儲產品Databricks SQL,並迅速成為Snowflake 的強勁競爭對手。04 年化收入達到37億美元現如今,Databricks已經成為矽谷當今最炙手可熱的投資標的之一,累計融資額近200億美元。收穫新一輪融資後,Databricks首席執行官Ali Ghodsi接受了CNBC的採訪,他稱在Figma完成IPO並股價飆升後,“手機被投資者轟炸了”,投資人每天都在聯絡他,詢問是否可以投資。Databricks的本輪融資,印證了市場對此類新型AI資料基礎設施公司的濃厚興趣,不過,Databricks仍需面對來自Snowflake、甲骨文等對手的競爭。今年6月時,Databricks的高管曾告訴投資者,公司的年化收入到7月時能達到37億美元,同比增速為50%。而主要競爭對手、巴菲特投資的Snowflake,預期在截至明年1月的財年裡實現45億美元收入,年增長率為25%。截至周二收盤,Snowflake的最新市值為642億美元。諮詢公司IDC的報告顯示,2025年,在全球資料平台軟體提供商中,Databricks在能力維度排名全球第一,與Google、甲骨文、Snowflake等共同處於領導者範疇,但在規模上略小於Google和Snowflake。 (天下潮商傳媒)
1000億美元!華人幹出全球第四大AI獨角獸
年化收入已達37億美元。又一家千億美元估值AI獨角獸即將誕生!智東西8月20日報導,昨日,AI資料分析平台Databricks宣佈,該公司已經簽署了K輪融資的條款清單,預計將在現有投資者的支援下很快完成,這輪融資對Databricks的估值已經超過了1000億美元(約合人民幣7179.1億元),估值與8個月前的620億美元(約合人民幣4451.0億元)相比,上漲了超61%。▲Databricks官宣新融資(圖源:Databricks官網)據TechCrunch援引知情人士的消息稱,Databricks最新一輪融資規模約為10億美元(約合人民幣71.8億元),投資方包括a16z、Thrive Capital等,並且獲得了“瘋狂的超額認購”。成立於2013年的Databricks,主要提供統一的資料與AI平台服務,幫助企業整合和處理大規模資料,用於資料工程、資料科學、機器學習與AI應用,也能為電商、金融、醫療等領域的企業提供資料服務。其創始團隊中還有華人,聯合創始人兼首席架構師為Reynold Xin(辛湜)。作為獨特的“湖倉一體”資料庫架構開創者,Databricks是資料智能領域的代表性企業,也是AI時代重要的資料基礎設施提供商。截至目前,有超過60%的財富500強企業採用了Databricks的資料智能平台來管理資料,並將其與AI結合。Crunchbase的資料顯示,Databricks目前是全球估值排名第八的獨角獸企業。完成K輪融資後,Databricks有望成為僅次於OpenAI、字節跳動、xAI,估值排名全球第四的AI獨角獸企業。值得一提的是,輝達也是Databricks的投資方之一,曾領投Databricks的I輪融資,規模為5億美元,但並未參與本輪融資。Databricks稱,本輪融資中獲得的資金,將被用於加速Databricks的AI戰略,這包括進一步擴大企業級智能體服務Agent Bricks、投資面向AI Agent最佳化的新資料庫Lakebase,並支援未來的AI領域收購,深化AI研究。01.成立12年估值1000億刀客戶規模已突破1.5萬Databricks的創始團隊由七位加州大學伯克利分校的教授和研究生組成,自2013年成立以來,陸續吸引了大約80家投資者的關注。該公司的創始人大部分為加州大學伯克利分校AMPLab成員,共同打造了開源分散式運算框架Apache Spark,還創下資料排序速度的世界紀錄。後來,他們決定將相關技術商業化運作,Databricks應運而生。▲Databricks七位創始人(圖源:福布斯)據The Information報導,早期投資者稱,Databricks的創始人們對如何賺錢幾乎沒有直覺,董事會原本打算在外部聘請有經驗的領導者擔任CEO,但發現時任Databricks工程副總裁的Ali Ghodsi在員工中很有聲望。接任CEO後,投資者對教授出身的Ghodsi還是有些遲疑。Ghodsi加緊研讀商業書籍,惡補了企業管理的方法。如今,他以親力親為地方式管理這家企業,高強度工作,風格強硬,並憑藉這種方式帶領Databricks快速發展,也獲得了客戶的信賴。▲Ali Ghodsi(圖源:Databricks)Adobe的首席資料官Bin Mu曾如此評價Ghodsi:“如果我遇到一個大問題,他會在接下來的一個小時內解決這個問題。”Databricks的創始人團隊中還有華人身影。其聯合創始人兼首席架構師為Reynold Xin(辛湜),他高中畢業後前往加拿大多倫多大學就讀本科,後續在加州大學伯克利分校AMPLab完成博士學業,畢業後直接參與Databricks的創立。▲辛湜(圖源:Linkedin)“湖倉一體”架構是Databricks最重要的護城河之一。這一技術起源於DataBricks團隊創業前打造的Apache Spark項目,將資料倉儲的結構化資料儲存功能,與資料湖的非結構化和半結構化資料儲存能力融合,從而提升資料處理的效率與可靠性。在AI時代,湖倉一體架構的價值愈發凸顯。AI訓練、推理過程中都需要使用到大量的結構化、半結構化和非結構化資料,湖倉一體架構能對這些資料統一儲存管理,支援即時資料攝入、處理和分析,還能彈性伸縮,從而降低儲存和計算成本。湖倉一體架構也具備向量化檢索、與機器學習框架(如PyTorch)整合等AI原生設計,可簡化AI資料處理的流程。2022年,OpenAI推出ChatGPT並引發全球AI熱潮後,Databricks聯合創始人兼CEO Ghodsi看到了AI對資料分析領域的巨大潛力,決定加大對AI技術的投資。當時,Databricks預計2022財年至2025財年期間的總現金消耗成本為15億美元。2023年,Databricks還斥資13億美元收購了大模型創企MosaicML,此次收購幫助 Databricks在2024年3月份發佈了一個開源模型,但並未推出後續版本,轉而使用開源模型。Databricks的一體化資料智能平台提供AutoML(自動化模型訓練)、Mosaic AI(模型部署)、AI Playground(無程式碼互動測試)、Unity Catalog Agent工具管理、MLflow整合等AI服務,支援從資料管理、訓練、部署到監控的AI開發全流程,可整合大模型、工具鏈,與資料平台無縫融合。2024年時,Ghodsi稱,截至當年11月,包括Mosaic在內的生成式AI產品收入同比增長了300%。02.連發多款AI Agent服務年化收入達到37億美元在去年年底拿下100億美元的巨額融資後,Databricks在AI領域的動作不斷,推出多款新產品與服務,還在收購市場斬獲一家AI創企。Agent是近期Databricks投資、發展AI技術的主線。今年5月,Databricks宣佈收購無伺服器Postgres資料庫(一種開放原始碼的對象關係型資料庫)公司Neon。Neon使用AI Agent來驅動資料庫的配置,其平台上八成的資料庫均由AI自動打造。這筆交易的規模達到10億美元,Databricks可借此進一步消除傳統資料庫的彈性伸縮瓶頸,為AI Agent提供“AI優先”的底層資料庫功能。收購Neon後不久,Databricks在今年6月推出了兩款Agent服務。其中,Agent Bricks可用於自動化建立AI Agent,使用者只需提供對任務的簡單描述,並通過Databricks的資料庫向Agent提供企業資料,就能完成Agent建立。Agent Bricks已經針對常見的行業用例進行了最佳化,比如結構化資訊提取、知識輔助、自訂文字轉換和多智能體系統等,企業可以用其完成對電子郵件、法律文書等內容的處理。Databricks還推出了Lakebase,這是一款用於AI應用和Agent的新型完全託管Postgres資料庫。Lakebase由Databricks此前收購的Neon提供技術支撐,與Databricks的資料湖倉平台Lakehouse深度整合,把業務資料和分析資料融合在一起,既能用來運行大規模分析,又能支援即時應用,滿足了AI Agent對快速查詢資料的需求。這兩項服務起到了互補的作用,Agent Bricks顯著簡化了企業打造Agent的流程,而Lakebase能為這些Agent提供合適的資料庫。雖然都仍處在預覽階段,不過其易用性、生態整合度、相容性等獲得了市場的認可。各類AI服務的推出,也成為Databricks的新增長點。今年6月,Databricks高管在一場投資者活動上稱,該公司的年化收入會在7月份達到37億美元(約合人民幣265.6億元),同比增長50%。同時,Databricks的客戶數量已經達到了15000多家。03.外部力量大力推動本輪融資但還面臨多方競爭Databricks已經成為矽谷當今最炙手可熱的投資標的之一,累計融資額近200億美元。收穫新一輪融資後,Ghodsi接受了CNBC的採訪,他稱在Figma完成IPO並股價飆升後,“我的手機被投資者轟炸了”,這輪融資“肯定有來自外部的大力推動”。這也顯示出,投資方希望在Databricks這家同樣炙手可熱的AI企業IPO之前,分得一杯羹。在去年12月底官宣的J輪融資中,Databricks獲得了100億美元的巨額融資,創下當年度的融資紀錄,目前並不缺乏營運資金。Ghodsi稱,目前投資者最關心的問題就是,Databricks的Agentic AI服務能否真正地自動化工作流程,有沒有給企業帶來價值?Ghodsi對此的回應是,這些服務仍處在早期階段,目前更注重解決企業的日常任務。Databricks的本輪融資,印證了市場對此類新型AI資料基礎設施公司的濃厚興趣,不過,Databricks仍需面對來自Snowflake、甲骨文等對手的競爭。成立時間與Databricks相仿的Snowflake,被普遍認為是前者的主要競爭對手之一。Snowflake源自雲資料倉儲(Data Warehouse),主打結構化資料分析、易用性與企業級安全性。Databricks的Lakehouse則強調對結構化與非結構化資料的處理能力及AI/ML能力。在AI時代,兩家公司的業務重合度不斷提升,都推出了資料Agent服務,在收購上也選擇了相同的方向——Snowflake於今年收購了Postgres資料庫創企Crunchy Data,與Databricks收購的Neon類似。Snowflake目前的市值約為642億美元,低於Databricks目前的估值。▲Snowflake股價變動(圖源:雅虎財經)甲骨文這樣的老牌資料庫企業,也在加緊佈局AI相關的資料產品。甲骨文於2024年推出了生成式AI Agent服務,提供檢索增強生成(RAG)等功能。今年3月,該公司進一步推出AI Agent Studio,作為企業建立、擴展、部署和管理AI Agent和Agent團隊的綜合平台,也能為Agent接入企業的自有資料。諸如微軟Azure、Google雲、AWS等大型雲基礎設施公司也是這一市場中的重要參與者,並相繼推出了AI相關的資料服務。諮詢公司IDC的報告顯示,2025年,在全球資料平台軟體提供商中,Databricks在能力維度排名全球第一,與Google、甲骨文、Snowflake等共同處於領導者範疇,但在規模上略小於Google和Snowflake。04.結語:Databricks接近自由現金流盈利,下一步會是IPO嗎?多家分析機構指出,Databricks雖然仍在虧損,但在營運效率和成本控制上已有顯著改善,並有望在2025年實現自由現金流盈利。隨著美股IPO市場回暖以及AI相關股票的驚人漲幅,投資者對Databricks潛在IPO的表現普遍看好——而近期一輪由投資者力推完成的融資,便成為最好的佐證。不過,Databricks目前尚未提交IPO申請,其高管對相關事項的表述也較為模糊,僅透露有IPO意向,但未明確時間。 (智東西)
1000億美元!華人幹出全球第四大AI獨角獸
年化收入已達37億美元。又一家千億美元估值AI獨角獸即將誕生!智東西8月20日報導,昨日,AI資料分析平台Databricks宣佈,該公司已經簽署了K輪融資的條款清單,預計將在現有投資者的支援下很快完成,這輪融資對Databricks的估值已經超過了1000億美元,估值與8個月前的620億美元相比,上漲了超61%。▲Databricks官宣新融資(圖源:Databricks官網)據TechCrunch援引知情人士的消息稱,Databricks最新一輪融資規模約為10億美元,投資方包括a16z、Thrive Capital等,並且獲得了“瘋狂的超額認購”。成立於2013年的Databricks,主要提供統一的資料與AI平台服務,幫助企業整合和處理大規模資料,用於資料工程、資料科學、機器學習與AI應用,也能為電商、金融、醫療等領域的企業提供資料服務。其創始團隊中還有華人,聯合創始人兼首席架構師為Reynold Xin(辛湜)。作為獨特的“湖倉一體”資料庫架構開創者,Databricks是資料智能領域的代表性企業,也是AI時代重要的資料基礎設施提供商。截至目前,有超過60%的財富500強企業採用了Databricks的資料智能平台來管理資料,並將其與AI結合。Crunchbase的資料顯示,Databricks目前是全球估值排名第八的獨角獸企業。完成K輪融資後,Databricks有望成為僅次於OpenAI、字節跳動、xAI,估值排名全球第四的AI獨角獸企業。值得一提的是,輝達也是Databricks的投資方之一,曾領投Databricks的I輪融資,規模為5億美元,但並未參與本輪融資。Databricks稱,本輪融資中獲得的資金,將被用於加速Databricks的AI戰略,這包括進一步擴大企業級智能體服務Agent Bricks、投資面向AI Agent最佳化的新資料庫Lakebase,並支援未來的AI領域收購,深化AI研究。01. 成立12年估值1000億刀客戶規模已突破1.5萬Databricks的創始團隊由七位加州大學伯克利分校的教授和研究生組成,自2013年成立以來,陸續吸引了大約80家投資者的關注。該公司的創始人大部分為加州大學伯克利分校AMPLab成員,共同打造了開源分散式運算框架Apache Spark,還創下資料排序速度的世界紀錄。後來,他們決定將相關技術商業化運作,Databricks應運而生。▲Databricks七位創始人(圖源:福布斯)據The Information報導,早期投資者稱,Databricks的創始人們對如何賺錢幾乎沒有直覺,董事會原本打算在外部聘請有經驗的領導者擔任CEO,但發現時任Databricks工程副總裁的Ali Ghodsi在員工中很有聲望。接任CEO後,投資者對教授出身的Ghodsi還是有些遲疑。Ghodsi加緊研讀商業書籍,惡補了企業管理的方法。如今,他以親力親為地方式管理這家企業,高強度工作,風格強硬,並憑藉這種方式帶領Databricks快速發展,也獲得了客戶的信賴。▲Ali Ghodsi(圖源:Databricks)Adobe的首席資料官Bin Mu曾如此評價Ghodsi:“如果我遇到一個大問題,他會在接下來的一個小時內解決這個問題。”Databricks的創始人團隊中還有華人身影。其聯合創始人兼首席架構師為Reynold Xin(辛湜),他高中畢業後前往加拿大多倫多大學就讀本科,後續在加州大學伯克利分校AMPLab完成博士學業,畢業後直接參與Databricks的創立。▲辛湜(圖源:Linkedin)“湖倉一體”架構是Databricks最重要的護城河之一。這一技術起源於DataBricks團隊創業前打造的Apache Spark項目,將資料倉儲的結構化資料儲存功能,與資料湖的非結構化和半結構化資料儲存能力融合,從而提升資料處理的效率與可靠性。在AI時代,湖倉一體架構的價值愈發凸顯。AI訓練、推理過程中都需要使用到大量的結構化、半結構化和非結構化資料,湖倉一體架構能對這些資料統一儲存管理,支援即時資料攝入、處理和分析,還能彈性伸縮,從而降低儲存和計算成本。湖倉一體架構也具備向量化檢索、與機器學習框架(如PyTorch)整合等AI原生設計,可簡化AI資料處理的流程。2022年,OpenAI推出ChatGPT並引發全球AI熱潮後,Databricks聯合創始人兼CEO Ghodsi看到了AI對資料分析領域的巨大潛力,決定加大對AI技術的投資。當時,Databricks預計2022財年至2025財年期間的總現金消耗成本為15億美元。2023年,Databricks還斥資13億美元收購了大模型創企MosaicML,此次收購幫助 Databricks在2024年3月份發佈了一個開源模型,但並未推出後續版本,轉而使用開源模型。Databricks的一體化資料智能平台提供AutoML(自動化模型訓練)、Mosaic AI(模型部署)、AI Playground(無程式碼互動測試)、Unity Catalog Agent工具管理、MLflow整合等AI服務,支援從資料管理、訓練、部署到監控的AI開發全流程,可整合大模型、工具鏈,與資料平台無縫融合。2024年時,Ghodsi稱,截至當年11月,包括Mosaic在內的生成式AI產品收入同比增長了300%。02. 連發多款AI Agent服務年化收入達到37億美元在去年年底拿下100億美元的巨額融資後,Databricks在AI領域的動作不斷,推出多款新產品與服務,還在收購市場斬獲一家AI創企。Agent是近期Databricks投資、發展AI技術的主線。今年5月,Databricks宣佈收購無伺服器Postgres資料庫(一種開放原始碼的對象關係型資料庫)公司Neon。Neon使用AI Agent來驅動資料庫的配置,其平台上八成的資料庫均由AI自動打造。這筆交易的規模達到10億美元,Databricks可借此進一步消除傳統資料庫的彈性伸縮瓶頸,為AI Agent提供“AI優先”的底層資料庫功能。收購Neon後不久,Databricks在今年6月推出了兩款Agent服務。其中,Agent Bricks可用於自動化建立AI Agent,使用者只需提供對任務的簡單描述,並通過Databricks的資料庫向Agent提供企業資料,就能完成Agent建立。Agent Bricks已經針對常見的行業用例進行了最佳化,比如結構化資訊提取、知識輔助、自訂文字轉換和多智能體系統等,企業可以用其完成對電子郵件、法律文書等內容的處理。Databricks還推出了Lakebase,這是一款用於AI應用和Agent的新型完全託管Postgres資料庫。Lakebase由Databricks此前收購的Neon提供技術支撐,與Databricks的資料湖倉平台Lakehouse深度整合,把業務資料和分析資料融合在一起,既能用來運行大規模分析,又能支援即時應用,滿足了AI Agent對快速查詢資料的需求。這兩項服務起到了互補的作用,Agent Bricks顯著簡化了企業打造Agent的流程,而Lakebase能為這些Agent提供合適的資料庫。雖然都仍處在預覽階段,不過其易用性、生態整合度、相容性等獲得了市場的認可。各類AI服務的推出,也成為Databricks的新增長點。今年6月,Databricks高管在一場投資者活動上稱,該公司的年化收入會在7月份達到37億美元(約合人民幣265.6億元),同比增長50%。同時,Databricks的客戶數量已經達到了15000多家。03. 外部力量大力推動本輪融資但還面臨多方競爭Databricks已經成為矽谷當今最炙手可熱的投資標的之一,累計融資額近200億美元。收穫新一輪融資後,Ghodsi接受了CNBC的採訪,他稱在Figma完成IPO並股價飆升後,“我的手機被投資者轟炸了”,這輪融資“肯定有來自外部的大力推動”。這也顯示出,投資方希望在Databricks這家同樣炙手可熱的AI企業IPO之前,分得一杯羹。在去年12月底官宣的J輪融資中,Databricks獲得了100億美元的巨額融資,創下當年度的融資紀錄,目前並不缺乏營運資金。Ghodsi稱,目前投資者最關心的問題就是,Databricks的Agentic AI服務能否真正地自動化工作流程,有沒有給企業帶來價值?Ghodsi對此的回應是,這些服務仍處在早期階段,目前更注重解決企業的日常任務。Databricks的本輪融資,印證了市場對此類新型AI資料基礎設施公司的濃厚興趣,不過,Databricks仍需面對來自Snowflake、甲骨文等對手的競爭。成立時間與Databricks相仿的Snowflake,被普遍認為是前者的主要競爭對手之一。Snowflake源自雲資料倉儲(Data Warehouse),主打結構化資料分析、易用性與企業級安全性。Databricks的Lakehouse則強調對結構化與非結構化資料的處理能力及AI/ML能力。在AI時代,兩家公司的業務重合度不斷提升,都推出了資料Agent服務,在收購上也選擇了相同的方向——Snowflake於今年收購了Postgres資料庫創企Crunchy Data,與Databricks收購的Neon類似。Snowflake目前的市值約為642億美元,低於Databricks目前的估值。▲Snowflake股價變動(圖源:雅虎財經)甲骨文這樣的老牌資料庫企業,也在加緊佈局AI相關的資料產品。甲骨文於2024年推出了生成式AI Agent服務,提供檢索增強生成(RAG)等功能。今年3月,該公司進一步推出AI Agent Studio,作為企業建立、擴展、部署和管理AI Agent和Agent團隊的綜合平台,也能為Agent接入企業的自有資料。諸如微軟Azure、Google雲、AWS等大型雲基礎設施公司也是這一市場中的重要參與者,並相繼推出了AI相關的資料服務。諮詢公司IDC的報告顯示,2025年,在全球資料平台軟體提供商中,Databricks在能力維度排名全球第一,與Google、甲骨文、Snowflake等共同處於領導者範疇,但在規模上略小於Google和Snowflake。04. 結語:Databricks接近自由現金流盈利,下一步會是IPO嗎?多家分析機構指出,Databricks雖然仍在虧損,但在營運效率和成本控制上已有顯著改善,並有望在2025年實現自由現金流盈利。隨著美股IPO市場回暖以及AI相關股票的驚人漲幅,投資者對Databricks潛在IPO的表現普遍看好——而近期一輪由投資者力推完成的融資,便成為最好的佐證。不過,Databricks目前尚未提交IPO申請,其高管對相關事項的表述也較為模糊,僅透露有IPO意向,但未明確時間。 (智東西)