“一場關於Data與AI的融合革命正在資料庫領域悄然上演。
當大模型掀起全球智能浪潮,當企業資料量以指數級攀升,一個問題愈發緊迫:AI時代,我們需要什麼樣的資料庫?
是繼續沿用“一個業務多個庫”的碎片化架構?還是尋求一種更統一、更智能、更融合的資料底座?
2025年11月18日,OceanBase用實力給出了答案。在年度發佈會上,OceanBase發佈並開源了其首款AI資料庫OceanBase seekdb(簡稱seekdb)。開發者僅需三行程式碼,即可快速建構知識庫、智能體等AI應用,輕鬆應對百億級多模資料檢索,真正實現“開箱即用”的AI資料基座。
據介紹,該產品支援向量、全文、標量及空間地理資料的統一混合搜尋,深度融合AI推理與資料處理,並相容Hugging Face、LangChain等30余種主流AI框架。這一產品實現了資料庫從傳統“業務支撐系統”邁向“AI原生資料入口”的新功能,也是OceanBase自啟動“Data×AI”戰略以來的一份答卷。
毫無疑問,我們正站在AI技術重塑產業格局的十字路口。資料庫的角色正在被徹底重構——它不再僅僅是儲存資料的倉庫、記錄交易的帳本或進行分析的引擎,而是正在成為智能系統中真正可信的“資料中樞”。
長期以來默默居於幕後的資料庫基礎設施,正在被AI浪潮推向舞台中央,經歷著從被動“儲存資料”到主動“理解資料”的戰略躍遷,這不僅要求資料庫具備資料管理能力,更需要深度融合模型能力,實現資料與智能的有機結合。
在技術快速迭代的背景下,資料庫領域呈現出三個“變”與“不變”。
三個變化:資料處理量級正在從傳統的GB/TB級躍升至PB/EB級,這對資料庫的擴展性提出了前所未有的挑戰;多模混合搜尋成為剛需,企業需要同時處理結構化、半結構化和非結構化資料;技術平權趨勢明顯,資料庫使用者從專業的開發者擴展到普通的業務人員。
三個不變:資料庫的核心價值保持不變,仍然需要處理事務和分析問題,這是企業營運的基礎;優秀的查詢最佳化器在處理複雜查詢時依然不可或缺;豐富的生態相容功能仍然是資料庫成功的關鍵因素。
這三個“變”與“不變”,構成了OceanBase把握AI時代機遇的重要坐標。
“AI的真正瓶頸不在模型,而在資料。”OceanBase CEO楊冰指出,“尤其在金融、政務等高敏感場景,傳統多系統架構不僅複雜低效,更易引發權限與延遲風險。”
面對時代的挑戰,OceanBase提出了獨具特色的“一體化”解決方案。
為什麼是一體化?
符合技術發展規律:從早期的大型機集中式,到網際網路時代的分佈式架構,再到AI時代的一體化融合,技術發展呈現出"合久必分,分久必合"的螺旋式上升規律。一體化架構正是這種規律在當前階段的體現。
響應企業核心訴求:維護多套系統的成本、複雜度以及資料一致性問題,已經成為很多企業的"不能承受之重"。一體化架構通過簡化技術堆疊,顯著降低了企業的總擁有成本(TCO)。
為AI應用提供最優資料通路:當智能成為業務的核心競爭力時,資料的處理效率直接決定了企業的創新速度。一體化架構為AI應用提供了最簡化的資料通路,加速了從資料到價值的轉化過程。
OceanBase一體化涵蓋架構、負載和多雲三個維度:
架構一體化:單機與分佈式的統一
讓使用者無需在“性能”與“擴展性”之間做選擇題。同一套引擎既能在單機環境下穩定運行,也能在分佈式環境中彈性擴展。
負載一體化:TP、AP與AI的融合
更突破性的是,OceanBase實現了TP(事務處理)、AP(分析處理)與AI工作負載在單一引擎內的融合。
多雲一體化:一套架構,全球運行
在雲原生層面,OceanBase已穩定運行於阿里雲、華為雲、騰訊雲、AWS、Azure等七大主流雲平台。這種多雲原生能力讓企業真正實現“一套架構,全球運行”,為出海企業提供了關鍵的技術支點。
如果說一體化架構是骨骼,那麼混合搜尋就是OceanBase在AI時代的"智能大腦"。
為什麼混合搜尋如此關鍵?
我們來看一個場景。當使用者提出"找一下去年華東區銷量最好的幾款新能源汽車的相關技術文件"這樣的需求時,傳統的單一搜尋方式就顯得力不從心。
這個看似簡單的查詢實際上涉及多個維度的資料處理:需要向量搜尋來理解"銷量最好"的語義含義;需要關係查詢來過濾"去年""華東區""新能源汽車"這些條件;需要全文檢索在技術文件中匹配關鍵內容;還需要圖索引來關聯車型與技術文件的關係。
OceanBase的混合搜尋技術將稠密向量、稀疏向量、全文搜尋、關係過濾等進行深度融合,通過智能的全域重排序輸出最優結果。這種能力使得資料庫不再是被動的資料儲存容器,而是能夠"理解"使用者意圖的智能助手。
在OceanBase技術團隊的思考中,向量搜尋只是AI資料庫的初級階段,最終都將演進為混合搜尋。
基於對AI時代,資料庫的戰略思考,以及一體化架構的技術突破,OceanBase推出了AI原生資料庫——seekdb。
“seekdb不是傳統資料庫的功能疊加,而是專為AI時代重構的AI原生資料庫。”楊冰表示,“它繼承OceanBase的程式碼和設計理念,更輕量、更敏捷,目標是成為大模型與私有資料融合計算的‘即時入口層’。我們希望與開發者一起,在混合搜尋、多模融合等方向加速迭代、大膽創新。”
據Gartner預測,到2028年,支援生成式AI的資料庫支出將達2180億美元,佔市場74%。但MIT研究顯示,超95%的企業AI項目因多模態資料割裂、系統鏈路冗長、權限管理複雜難以落地。seekdb帶來三大核心突破:
一是AI原生混合搜尋能力。seekdb支援在一個查詢中融合向量檢索、全文搜尋與標量過濾,採用“粗排+精排”多階段檢索機制,在低延遲的同時提升精度。依託成熟的事務引擎,它支援即時寫入與ACID一致性,並相容MySQL生態。此外,seekdb支援標量、向量、文字、JSON和GIS等多模資料的統一儲存與檢索。例如,在反欺詐場景中,可直接查詢“近7天交易超5萬元、位置異常且行為類似歷史欺詐樣本”,無需跨系統呼叫,兼顧性能與安全。
二是極簡部署,開箱即用。seekdb最低僅需1核CPU、2GB記憶體,支援pip install一鍵安裝、秒級啟動,相容嵌入式與客戶端/伺服器雙部署模式,可輕鬆整合至智能Agent、開發工具鏈或本地應用,大幅降低AI應用的工程門檻。
三是更開發者友好。seekdb以Apache 2.0協議全球開源,開發者可自由使用、修改和擴展。產品全面相容HuggingFace、Dify、LangChain等30余種AI框架及MCP大模型協議,無縫融入AI生態;並提供SQL及PythonSDK,適配不同開發習慣。同期開放原始碼的PowerRAG智能文件解析框架與PowerMem分層記憶架構,後者在LOCOMO Benchmark上以73.70分登頂SOTA,Token消耗降低96%,大幅節省推理成本。
作為OceanBase“Data×AI”戰略的關鍵一環,seekdb既可獨立使用,也可平滑融入新發佈的OceanBase 4.4一體化融合版本。該版本首次將TP、AP與AI能力整合於單一核心,兼具分佈式擴展、多雲部署與金融級高可用,幫助企業避免後期架構重構風險。商用LTS版本將於2026年2月2日推出。
目前,OceanBase的混合搜尋能力已在多個行業成功落地,充分驗證了其技術價值:中國聯通基於混合搜尋建構統一AI知識庫,有效解決了私有文件的權限管理與高效檢索難題;螞蟻百寶箱則基於混合搜尋實現智能體的即時線上搜尋,顯著提升了資訊獲取的精準性與響應效率。
“這不僅是技術產品,更是開發範式的躍遷。”楊冰表示,“傳統資料庫只‘存’資料,而seekdb能‘理解’資料語義,混合搜尋正是AI原生資料庫的關鍵分水嶺。”過去十五年,OceanBase在“雙11”等極限場景錘煉出的工程化能力,正轉化為AI時代的底層優勢,在AI原生混合搜尋、多模融合、TP/AP/AI一體化、多雲原生等方向持續突破。
OceanBase CEO楊冰在發佈會上透露了一組令人振奮的數字:自2020年商業化以來,OceanBase全球客戶數已突破4000家,連續五年年均增速超過100%。目前,其技術已深入金融、政務、通訊、零售、製造、網際網路等十余個領域,服務覆蓋16個國家和地區、60多個地域、240多個可用區。
這一成績的背後是OceanBase"專有雲+公有雲"的雙輪驅動戰略,更根植於15年技術深耕與工程化能力實踐。
專有云:核心系統的信任之選
OceanBase專有雲憑藉卓越的穩定性和一致性,成為高要求領域的核心系統首選。過去一年客戶數增長50%,在金融領域實現全面突破,正加速拓展至政務、電信、交通、能源、醫療等政企領域:
•覆蓋全部政策性銀行、5/6國有大行,覆蓋超100家資產規模千億級以上銀行
•在非銀領域,75%頭部保險、80%頭部券商、60%頭部基金公司已部署OceanBase
政企領域拓展全面提速:
•人社系統:江西率先完成養老保險全國統籌系統升級,獲人社部認可;海南、重慶、浙江等十余省份相繼跟進;目前服務全國1/3省級人社系統
•通訊領域:深度覆蓋三大營運商,中國移動1/3省級公司、中國聯通超300套核心系統、中國電信翼支付全鏈路完成部署;廣東移動六大區域核心CRM/計費系統實現從集中式向分佈式架構升級,打造“廣東樣板”
公有云:第二增長曲線加速成長
作為“第二增長曲線”,OB Cloud近三年客戶數年均增長115%,營收佔比達30%。其多雲原生能力支援七大雲平台無縫運行,助力高德實現性能提升25%、成本降低50%,支撐安踏併購後業務高速增長。
全球化佈局與生態建設
OceanBase已建立覆蓋全球的服務網路,在馬來西亞、歐洲、北美設立三大服務中心,建構“Follow-the-sun”支援體系。生態建設成效顯著,合作夥伴貢獻專有雲超70%收入,公有雲生態收入年增速達300%。
站在十五年新起點,OceanBase正式開啟“Data×AI”新範式。
“十五年磨一劍,OceanBase將持續深化‘Data×AI’戰略。”楊冰表示,“以‘一體化’理念推進架構、儲存與負載的全面融合,打造面向未來的一體化資料底座;同時加大全球開源投入,加速全球化處理程序,堅定邁向世界級資料庫。”
OceanBase用4000家客戶的實踐表明,在AI時代,一體化不是選擇題,而是必答題。當資料與智能的邊界日益模糊,當即時與融合成為剛需,誰能更好地打通資料與AI的任督二脈,誰就能在未來的競爭中佔據先機。
這條路並不好走,但正如OceanBase十五年來的堅持——做基礎設施,是良心活。世界級資料庫的夢想,正在一步步照進現實。 (資料猿)