華為高斯:20年就為了讓中國數據回歸
看了這張圖,你大概懂是什麼意思。但有人說,你華為非得自己做資料庫嗎?做個高斯資料庫非得做那麼全嗎?
現在國內許多技術領域,已經呈現出百花齊放的景象,可在20年前,華為只能孤軍奮戰,數據庫尤其如此,因為基礎軟體實在重要,華為在這個領域“屬不太懂的一家”,只能硬著頭皮往前拱。
為什麼華為非得做高斯資料庫(GaussDB)?GaussDB能解決哪些問題?GaussDB算成功了嗎?
01 華為為自己找了一個舞台叫做刀尖
2007年,華為找不到能與電信計費很好契合的資料庫給客戶,只好組織人手自研記憶體資料庫,專案代號GMDB。GMDB沒有能夠大規模商用,它的核心價值是鍛鍊了大批人,因為當時國內對資料庫核心開發知之甚少,有經驗者寥寥。2010年,華為資料庫研發團隊開始對2007年版本進行全面重構,並寫下了重構版本的第一行程式碼:「typedef struct st_database{...}database_t;」即資料庫物件的定義。
華為真正下決定做資料庫始於2011年,這一年華為成立2012實驗室,下設高斯實驗室,開始啟動面向OLAP資料庫的研發預演,主要孵化GaussDB 200(後來的DWS數倉OLAP),基於PostgreSQL修改發布了V1R3和GaussDB 100的單機主備版本,這也是有人說華為都是基於PG的原因。
2014年到2017年,高斯實驗室開始自研OLTP資料庫,從兩個方向進行探索,團隊A基於Oracle的RAC方式做V2集群項目,此項目2015年被終止,但這個方向的人力一直延續到2017年;團隊B基於GaussDB 200孵化了GaussDB 300,即現在GaussDB V5的前身。
其間2015年,華為與工商銀行一起聯合創新,Gauss OLAP資料庫開始在工商銀行上線。從一開始的十幾個節點到後來的單一群集超過二百個節點。
2018年,團隊A連人帶技術到儲存產品線發展了GaussDB 100(又叫GaussDB T),團隊B則留在2012高斯實驗室繼續做GaussDB 300。這一年華為第一個Gauss HATP資料庫問世,並成功登陸中國民生銀行。
2019年底,GaussDB 100和GaussDB 300合併為GaussDB V5版本,幾乎所有的核心人員重新回歸2012高斯實驗室。
02 “就做塔尖上的一點點”
GaussDB是不是華為的戰略產品,我們並不知道!但外界始終認為華為做資料庫的態度並不堅決,投入的人力也不多,大概就500人左右;甚至在2020年有傳聞稱華為要關閉GaussDB。
其實資料庫是一個非常困難的方向,不僅要向前走,時不時還要殺回馬槍。既要孵化現實主義的產品與解決方案,做到“極簡架構、極低成本、極高品質、極優體驗”,也要關注未來的發展趨勢。2020年海量資料開始爆炸性成長,資料分析的訴求越來越旺盛,客戶基於雲端化模式來建構資料分析系統的願望也越來越強烈。高斯資料庫在還沒走穩的情況下,需要面對轉型的壓力。
2020年Gartner預測資料顯示,到2021年雲端資料庫在整個資料庫市場的佔比將首次達到50%;到2023年75%的資料庫要跑在雲端平台上。華為於是決定將GaussDB資料庫併入華為雲,在業務層面取消了GaussDB資料庫線下純軟體銷售和交付的模式,調整為依托華為雲與華為雲Stack,以雲端服務方式對客戶銷售;在組織層面,將華為資料庫研發組織融合,統歸華為雲端BU和2012高斯實驗室,統籌資料庫策略,佈局全球七大區域11個研究所,力求打造世界級資料庫;在生態方面,華為於2020年6月30日開源OpenGauss社群版本,鼓勵有能力的合作夥伴推出基於OpenGauss的資料庫,共同建構資料庫產業生態。
2020年7月,華為雲端發布關係型資料庫GaussDB(for MySQL)與非關係型資料庫GaussDB NoSQL系列兩大雲端原生資料庫新品,打造涵蓋關係型和非關係型資料庫在內的GaussDB系列全場景服務。
2021年,華為雲端企業級分散式資料庫GaussDB全網商用,並推出重大核心新特性—Ustore儲存引擎。
2022年,GaussDB企業級分散式資料庫內核,獲得全球權威資訊技術安全性評估標準CC EAL4+等級認證。
2023年6月7日,在華為全球智慧金融高峰會上,華為執行董事、華為雲端CEO張平安正式發表新一代分散式資料庫GaussDB。華為自己也終於把內部使用了27年之久的Oracle資料庫,全部平滑地遷移到GaussDB。
張平安介紹說,GaussDB不僅可以全面取代Oracle,還具備比Oracle更好的高可用、高性能、高彈性,雙集群,雙活切換資料零丟失,故障恢復時間縮短10倍。同時,開發的Ugo遷移工具,讓傳統資料庫95%的語法實現自動轉化,讓資料庫遷移到高斯變得輕鬆簡單,應用改造成本降低90%以上。
GaussDB資料庫已在銀行、保險、證券、能源等關鍵基礎產業得到驗證和廣泛應用。華為終於在資料庫領域,給了世界一個更優選擇。
張平安表示,「我們對所有中端、低端、小容量的資料庫沒有任何興趣,國內有很多的資料庫廠商都可以滿足,但只要是攻堅克難的場景,我們願意第一個上。這是我們資料庫的定位,即使它可能是塔尖上的一點點,帶來的收入、利潤並不大,我們也願意做」。
GaussDB資料庫已成為目前國內唯一能夠做到全端自主的國產品牌。
03 高斯批判,狗糧還得繼續吃
但故事並沒完。
2020年11月4日,任正非在企業業務及雲端業務報告會上強調:
「我們的價值觀與宗旨,還沒有很好地體現在客戶利益至上、我們的雲端服務上,我們還要踏實努力。讓客戶用電一樣方便使用華為的雲端服務,才是我們的目的。我們要集中優勢兵力聚焦在做好我們的華為雲端平台及其提供的雲端服務。我們現在存在的問題是一個服務能力、多個責任中心,力量碎片化。華為雲端首先要在極致性價比、可用性、資料安全性等基礎能力上構築核心競爭力;同時針對所聚焦的產業、聚焦的場景做好使能層,建構好雲生態體系,構築有競爭力的獲客能力。“
這項要求,也包括了高斯資料庫。
技術成功最終是為客戶創造價值,從而實現自己的商業成功。
華為內部員工喜歡回到「以顧客為中心「的原點來看問題。基於此,對高斯資料庫提出了不少批評意見:
- GaussDB 100 、GaussDB 200 V1R3 、 GaussDB 200 V3R1 、GaussDB T, OpenGauss等,形成了許多的歷史版本,沒有能說清楚演進關係,適用場景,及後續演進方向;
- 客戶端難用,基本什麼功能沒有,就連最基礎的導出DML、DDL的SQL功能都沒有;
- GaussDB的交易型資料庫核心是基於PG的,還是用自研內核的?似乎有一段時間在這兩個來回折騰,沒有一個方向指引;
- 高斯DB還是出了不少技術問題,客戶問題很多,如果把工作當成了學習成長,那麼這個產品一定會做出問題;
- 要加快步伐,與Oracle的差距何其大;
- 聽聽市場的聲音,別閉門造車,友商遷移18套oracle業務系統,支援多租戶十幾個節點就夠了,我們要50多個節點;
- 我們的資料庫能不能先把分散式只能使用一半儲存空間的問題解決了,請對準客戶痛點吧!
- 基礎軟體的創新任重道遠,既需要科學家來做創新,又需要工程師們一行行程式碼高品質實現,最後還需要根據客戶場景不斷磨合、不斷優化,缺一不可;
- 真正要把資料庫做好,全面趕超oracle、HANA、SQL Service、DB2還有很長的路要走,封面要技術專家和工程師不斷持續的投入。
華為內部不喜歡粉飾太平,恰恰願意動不動就炮轟某個產品,某個組織。華為始終堅信兩個邏輯,一是「以顧客為中心“,二是「自己的狗糧自己吃」。前者是堅持的態度和方向,後者是做事的決心和標準。
最終,我們會看到,高斯資料庫,不只是做中國金融業的王者,也會成為全球資料庫的王者,應該不會有之一。(風起堂觀察)