2023,數(shù)據(jù)庫國產(chǎn)替代走到哪了?
中國國產(chǎn)數(shù)據(jù)庫迎來機遇和挑戰(zhàn)。隨著國有大行積極推進核心系統(tǒng)遷移,數(shù)據(jù)庫成為其中的重中之重。各大廠商如阿里云、騰訊云、達夢、星環(huán)科技和華為云都在加大研發(fā)力度,進行軟硬一體協(xié)同,加速完成對固有“IOE”的替換。此時,戰(zhàn)場已變成龐大的市場。
如今,戰(zhàn)場不僅銀行,參戰(zhàn)者也不僅單獨的一家。對中國的國產(chǎn)數(shù)據(jù)庫而言,機會和挑戰(zhàn)都在加速涌來。
2023,數(shù)據(jù)庫格局正在變化,愈演愈烈。
如果說哪個環(huán)節(jié)是如今國產(chǎn)替代的最火熱環(huán)節(jié),那數(shù)據(jù)庫無疑是最多人選擇的答案,甚至是之一。
2018年10月,張家港農(nóng)商銀行的企業(yè)客戶信息系統(tǒng)(ECIF)數(shù)據(jù)庫被順利替換為騰訊分布式數(shù)據(jù)庫TDSQL,這是國內(nèi)第一家進行核心系統(tǒng)遷移的銀行機構(gòu)。而在接下來的幾年時間里,各個國有大行都開啟了核心系統(tǒng)遷移的路程,其中數(shù)據(jù)庫是重中之重。
“現(xiàn)階段數(shù)據(jù)庫的替換開始從國有大行向農(nóng)商行等區(qū)域銀行開始遷移,整體投入非常大”。一位互聯(lián)網(wǎng)大廠金融負責(zé)人告訴產(chǎn)業(yè)家。
如果說芯片上的卡脖子,中國的企業(yè)需要幾代人來填補。那么在數(shù)據(jù)庫這些軟件測,中國的國產(chǎn)數(shù)據(jù)庫廠商正在奮起直追,不論是今年阿里云和騰訊云數(shù)據(jù)庫的先后打榜,再或者是之前達夢、星環(huán)科技的上市,以及華為云數(shù)據(jù)庫最近公布的軟硬一體協(xié)同,都在昭示著中國的國產(chǎn)數(shù)據(jù)庫正在盡全力完成對固有“IOE”的替換。
如今,戰(zhàn)場不僅銀行,參戰(zhàn)者也不僅單獨的一家。對中國的國產(chǎn)數(shù)據(jù)庫而言,機會和挑戰(zhàn)都在加速涌來。
一、2023,國產(chǎn)數(shù)據(jù)庫遷移潮
據(jù)2022年9月國資委79號文件,截止到2027年“2+8+N”黨政與八大行業(yè)完成100%國產(chǎn)替代,替換范圍涵蓋芯片、基礎(chǔ)軟件、操作系統(tǒng)、中間件等領(lǐng)域。然而,目前這些行業(yè)的國產(chǎn)滲透率只有10%。
在所有行業(yè)中,金融是國產(chǎn)化進程最快的行業(yè)。從2022年到2023年的數(shù)據(jù)中就可以看出這一趨勢。
據(jù)墨天輪不完全統(tǒng)計:2022年國產(chǎn)數(shù)據(jù)庫行業(yè)共收到51次中標喜訊。其中,金額最大的是中興通訊、OceanBase、亞信AntDB、萬里數(shù)據(jù)庫4家聯(lián)合中標中國移動1.45888億元超級大單。
單家中標金額最大的是阿里云,其中標廣東移動2022-2023年主備式自主可控 OLTP 數(shù)據(jù)庫,金額達到了967.28 萬。
從采購單位性質(zhì)分析,46%的采購單位集中在金融領(lǐng)域;其次是政府,占比達18%。這一趨勢也延續(xù)到了2023年。
根據(jù)公開數(shù)據(jù):2023年1月-5月國產(chǎn)數(shù)據(jù)庫共中標15次,中標最多的行業(yè)是金融業(yè)。其中銀行的數(shù)據(jù)庫國產(chǎn)替代進程步伐更快,并且?guī)缀醵际呛诵臉I(yè)務(wù)數(shù)據(jù)庫的替換。
從替換成果來看,2023年云原生數(shù)據(jù)庫和湖倉一體數(shù)據(jù)庫的趨勢已經(jīng)開始顯現(xiàn)。
在國內(nèi)政策和國際環(huán)境的雙重作用下,國產(chǎn)數(shù)據(jù)庫百花齊放,起步較早的國產(chǎn)數(shù)據(jù)庫廠商在穩(wěn)定性和性能上已經(jīng)可以與國際大廠同臺競技。這些國產(chǎn)數(shù)據(jù)庫在金融、政府、能源等重要行業(yè)已經(jīng)得到多次驗證。
實際上,在所有國產(chǎn)數(shù)據(jù)庫中,每家數(shù)據(jù)庫所具有的特性各不相同。不同行業(yè)對數(shù)據(jù)庫的要求也都不同。綜合多方報告來看,OceanBase是目前國內(nèi)企業(yè)使用頻次最高的國產(chǎn)數(shù)據(jù)庫,排名第二的是達夢。而其中在各個行業(yè)這個指標也是有所不同,比如銀行未來最多計劃使用的是華為云GaussDB,而互聯(lián)網(wǎng)行業(yè)最多未來計劃使用的國產(chǎn)數(shù)據(jù)庫是阿里云的PolarDB。
目前看來,Oracle、MySQL和微軟等海外數(shù)據(jù)庫在國內(nèi)部署占比依舊是最高的。
此外,一個最真實的問題是,目前國產(chǎn)數(shù)據(jù)庫與國外數(shù)據(jù)庫的是否還有差距?
首先,在數(shù)據(jù)層面,有三點考量因素:數(shù)據(jù)一致性、數(shù)據(jù)安全性和代碼安全性,這也是最重要的考量因素。尤其在金融和政府等行業(yè),數(shù)據(jù)安全永遠排在第一位。
數(shù)據(jù)一致性是指交易發(fā)生的同時性。比如A給B轉(zhuǎn)賬50元,A賬戶上減少50元的同時,B賬戶上也要增加50元。這種因素對于銀行和券商極為重要。
總體來看,相較于國外數(shù)據(jù)庫,國內(nèi)數(shù)據(jù)庫在數(shù)據(jù)層面的表現(xiàn)欠佳。Oracle、MySQL和微軟的SQL Server都有極強的數(shù)據(jù)一致性和安全性。而國內(nèi)數(shù)據(jù)庫除了部分廠商表現(xiàn)與國外數(shù)據(jù)庫相當(dāng),其平均水平與國外仍有一段差距。
但值得一提的是,國外數(shù)據(jù)庫在代碼安全性上表現(xiàn)并不好,整體弱于國內(nèi)數(shù)據(jù)庫。其中,阿里的OceanBase、南大通用的Gbase8a和華為云的GaussDB這這方面有不錯的參數(shù)表現(xiàn)。
第二,在功能層面,包括兼容與遷移能力、事務(wù)處理能力和大數(shù)據(jù)實時處理能力。在這一點上,國內(nèi)外數(shù)據(jù)庫表現(xiàn)相當(dāng)。在此之中,廠商最擔(dān)心的因素是兼容性。因為更換了數(shù)據(jù)庫后,向下需要擔(dān)心服務(wù)器、芯片和操作系統(tǒng)的適配性,向上還要考慮OA、ERP等應(yīng)用系統(tǒng)的兼容性。
在效果層面,包括穩(wěn)定性、可靠性與性價比。其中,穩(wěn)定性也是廠商和機構(gòu)在選購時最在意的因素??梢园l(fā)現(xiàn),在這些最重要的因素,國外數(shù)據(jù)庫的表現(xiàn)都非常出色,國內(nèi)數(shù)據(jù)庫廠商則良莠不一。
而這些問題在具體的交付過程中,則會被一一顯現(xiàn)出來。
二、國產(chǎn)替代,長路漫漫
數(shù)據(jù)庫作為基礎(chǔ)軟件,需要幾十年如一日的積淀。如今,去O的進程在中國已經(jīng)進行了15年,但國內(nèi)數(shù)據(jù)庫市場滲透率仍不足10%。關(guān)于“國產(chǎn)數(shù)據(jù)庫真的能替代Oracle嗎?”這一問題,至今還在被持續(xù)熱議。
根據(jù)艾瑞咨詢2022年數(shù)據(jù)庫使用情況調(diào)查結(jié)果顯示,在數(shù)據(jù)遷移難度、數(shù)據(jù)庫一站式管理、運維與備份復(fù)雜度是數(shù)據(jù)庫用戶遇到最多的幾個難題。
- 數(shù)據(jù)庫遷移難度大,占比19.2%,難點聚焦于遷移過程中的兼容性、數(shù)據(jù)安全、停機時間、數(shù)據(jù)校驗和性能保證等。
- 缺乏數(shù)據(jù)庫的一站式管理,占比14.8%,當(dāng)前市場上的一站式管理平臺以管控類為主,主要面向DBA等專業(yè)技術(shù)人員,而對開發(fā)、業(yè)務(wù)、運維等其他角色的門檻偏高。
- 運維與備份的復(fù)雜度高,占比14.3%,隨著技術(shù)路線的靈活度和復(fù)雜度提升,運維與備份和難度勢必增加。
從數(shù)據(jù)庫廠商的角度分析,國產(chǎn)數(shù)據(jù)庫的幾大通病聚集在研發(fā)、專利和代碼自主化程度上。這些都是經(jīng)常被人詬病的幾大難點。
首先,國產(chǎn)數(shù)據(jù)庫廠商研發(fā)人數(shù)占比過低,超60%的廠商研發(fā)人員還不過百人,這與國外形成了鮮明對比。其次,在國產(chǎn)數(shù)據(jù)庫專利方面,所有國產(chǎn)關(guān)系型數(shù)據(jù)庫的專利數(shù)加在一起不足4000件,而單Oracle的專利數(shù)就達到了14000件。最后,國內(nèi)目前很多代碼自主化率并不高,大部分國產(chǎn)數(shù)據(jù)庫都是在現(xiàn)有的開源基礎(chǔ)上進行修改。
此外,根據(jù)大部分使用國產(chǎn)數(shù)據(jù)庫的口碑來看,國產(chǎn)數(shù)據(jù)庫在性能、功能和可用性方面也存在問題。
首先看性能方面,國產(chǎn)數(shù)據(jù)庫的性能并不是均衡發(fā)展的。與Oracle相比,有些國產(chǎn)數(shù)據(jù)庫OLTP的性能較好,有些則是OLAP的性能更好。所以,國產(chǎn)數(shù)據(jù)庫要想克服這一問題,就需要針對不同類型的數(shù)據(jù)庫,采用不同的解決方案。
其次是功能方面。像Oracle等傳統(tǒng)商業(yè)數(shù)據(jù)庫有幾十年的積淀,國內(nèi)“年輕”的數(shù)據(jù)庫還有很長的路要走。在這種情況下,國產(chǎn)數(shù)據(jù)庫要想實現(xiàn)“彎道超車”,就不能沿著Oracle的老路繼續(xù)走,而是根據(jù)國內(nèi)的數(shù)據(jù)需求,制定出一條符合自己的數(shù)據(jù)庫類型,在保障性能和主要功能的前提下,實現(xiàn)功能上的差異。
最后則是最關(guān)鍵的可用性方面。由于Oracle數(shù)據(jù)庫較為成熟,所謂的“成熟”,具體來說是,其使用率較高,修復(fù)的bug也較多。而國產(chǎn)數(shù)據(jù)庫較為年輕,仍有許多未發(fā)現(xiàn)的漏洞。針對這種問題,解決辦法只能靠所有使用國產(chǎn)數(shù)據(jù)庫的企業(yè)共同努力。
此外,在數(shù)據(jù)庫國產(chǎn)替代的過程中,企業(yè)還會考慮的一個更大的問題是遷移難度和遷移成本,在遷移成本中,也包括兼容性的問題。一般來說,一家企業(yè)完成數(shù)據(jù)庫的國產(chǎn)替代需要花上2~3年的時間,在這過程中需要評估改造難度。
比如在國產(chǎn)數(shù)據(jù)庫選型過程中,會考慮到與上層應(yīng)用系統(tǒng)的兼容性問題。因為目前,大部分傳統(tǒng)行業(yè)的應(yīng)用系統(tǒng)仍然使用的國外的系統(tǒng)。像一家大型制造業(yè)企業(yè),或者一家傳統(tǒng)銀行,其內(nèi)部上上下下的應(yīng)用系統(tǒng)不可能跟著數(shù)據(jù)庫的更換而更換。一旦兼容性出現(xiàn)問題,損失重大。
但受政策驅(qū)動,全行業(yè)在2027年都要完成100%的國產(chǎn)替代,屆時,企業(yè)對于兼容性問題的考量也會削弱。
雖然目前國產(chǎn)數(shù)據(jù)庫的成熟度還不比國外,但在政策和市場需求側(cè)多方面影響下,國產(chǎn)數(shù)據(jù)庫不無“彎道超車”的可能。
三、數(shù)據(jù)庫遷移潮,正在加速到來
2023年,國產(chǎn)數(shù)據(jù)庫正在進入「狂飆」時代。在國內(nèi)對分布式數(shù)據(jù)庫需求增加,國內(nèi)傳統(tǒng)行業(yè)數(shù)字加速轉(zhuǎn)型,業(yè)務(wù)復(fù)雜度升級的基礎(chǔ)上,傳統(tǒng)數(shù)據(jù)庫局限性愈加凸顯。
從2000年到2023年,國內(nèi)數(shù)據(jù)庫一路高歌猛進,經(jīng)歷了非常重要的三個轉(zhuǎn)折點。
第一個轉(zhuǎn)折點是2000年BAT時代的到來。
當(dāng)年,互聯(lián)網(wǎng)大廠興起,國內(nèi)數(shù)據(jù)庫也迎來了自己的光輝十年。國產(chǎn)數(shù)據(jù)庫終于可以通過自己的技術(shù)力量,不依賴國外高端業(yè)務(wù)就可以做好。
第二個轉(zhuǎn)折點是在2010年后,當(dāng)時是4G時代。
國內(nèi)互聯(lián)網(wǎng)一路演進,在那片土壤下生長出了很多種應(yīng)用,比如短視頻和微博。這些App的興起,讓國內(nèi)對數(shù)據(jù)庫的需求不再局限于關(guān)系型數(shù)據(jù)。彼時,國內(nèi)云廠商也有了自己的積淀,可以提供適用全場景的數(shù)據(jù)庫。
第三個轉(zhuǎn)折點則是今天,2020年后,隨著傳統(tǒng)行業(yè)高速發(fā)展,Oracle、DB2局限性越來越明顯。
在BAT時代和4G時代積累的數(shù)據(jù)庫,也愈加能承載諸如保險公司和能源公司等行業(yè)的數(shù)據(jù)需求和業(yè)務(wù)復(fù)雜度需求。這也為國產(chǎn)數(shù)據(jù)庫“彎道超車”提供了充足的可能性。
除了市場需求的變化,信創(chuàng)也是所有央企國企考慮使用國產(chǎn)數(shù)據(jù)庫的首要因素。以央企為例,如果不進行國產(chǎn)數(shù)據(jù)庫的替換,不僅面臨Oracle數(shù)據(jù)庫被禁止使用的問題,還會遇到許可證費用增加的問題。
首先,中美國際環(huán)境在很長一段時間都會處于緊張狀態(tài),貿(mào)易戰(zhàn)和科技戰(zhàn)加劇。美國政府不知何時會在未來的某一天,以國家安全等為由,禁止央企或其他中國企業(yè)使用美國廠商研發(fā)的數(shù)據(jù)庫產(chǎn)品和技術(shù)。
而Oracle在央企占比十分大,并且都是企業(yè)經(jīng)營管理的核心系統(tǒng)。一旦被禁止應(yīng)用,將將產(chǎn)生不可估量的影響與損失。
其次,近兩年隨著傳統(tǒng)行業(yè)數(shù)字化程度加深,很多央企對Oracle數(shù)據(jù)庫的應(yīng)用不僅限于應(yīng)用水平較低的數(shù)據(jù)存儲。如果應(yīng)用繼續(xù)深入,也會帶來Oracle數(shù)據(jù)庫許可費用的大幅增加。
最后,由于Oracle數(shù)據(jù)庫誕生于三四十年前,其技術(shù)架構(gòu)存在一定局限性,如采用集中式架構(gòu)無法線性擴展,穩(wěn)定性、性能強依賴硬件。對于那些越來越多的并發(fā)量大、峰值高等帶有互聯(lián)網(wǎng)場景的數(shù)字化應(yīng)用系統(tǒng),Oracle數(shù)據(jù)庫將無法支撐。
從市場需求到業(yè)務(wù)復(fù)雜度,從信創(chuàng)要求到技術(shù)架構(gòu)局限性,當(dāng)下的種種因素都驅(qū)使著國產(chǎn)數(shù)據(jù)庫遷移的加速到來。
四、國產(chǎn)數(shù)據(jù)庫,走向何方
從2023年國產(chǎn)數(shù)據(jù)庫的中標情況可以看出,未來國產(chǎn)數(shù)據(jù)庫有兩大發(fā)展趨勢——云原生、湖倉一體。
首先,云原生數(shù)據(jù)庫就是從根本上改變技術(shù)架構(gòu),讓數(shù)據(jù)庫實現(xiàn)真正意義上的橫向擴展。因為云本身具有彈性、可擴展性的特點,云原生數(shù)據(jù)庫可以在全面云化的基礎(chǔ)設(shè)施環(huán)境中,按照使用情況進行更細粒度的計費。
對于云原生數(shù)據(jù)庫,現(xiàn)在有一種說法,云原生數(shù)據(jù)庫已進入2.0時代,更強調(diào)一個能集成多種引擎的全面數(shù)據(jù)庫解決方案。簡言之,云原生數(shù)據(jù)庫可以充分發(fā)揮云上的優(yōu)勢,讓每個分區(qū)都可以充分享受云帶來的彈性和高可用能力。
對此,華為云給出的解釋是,業(yè)務(wù)是否“生于云、長于云”,決定了企業(yè)是否能充分享受到云原生數(shù)據(jù)庫帶來的極致體驗。
這種彈性能力在關(guān)鍵時刻就會發(fā)揮作用。比如,雙十一場景下,龐大的數(shù)據(jù)量如果用傳統(tǒng)數(shù)據(jù)庫,只能靠硬件堆砌。但云原生數(shù)據(jù)庫就可以解決這一瓶頸,利用彈性可用這一優(yōu)點成為問題的突破口。
從另一種角度看,云原生數(shù)據(jù)庫也是國產(chǎn)數(shù)據(jù)庫“換道超車”的一種可能性。
以阿里云當(dāng)年自研數(shù)據(jù)庫為例,當(dāng)時阿里決定做雙十一,創(chuàng)造了淘寶業(yè)務(wù)數(shù)據(jù)量的峰值,加上互聯(lián)網(wǎng)業(yè)務(wù)所需的彈性,Oracle數(shù)據(jù)庫集群已無法滿足,將阿里“逼上”自研數(shù)據(jù)庫的這條路。
后來阿里云時代,在阿里云不斷服務(wù)客戶的過程中,積累了如云數(shù)據(jù)庫的托管服務(wù)RDS、云原生數(shù)據(jù)庫PolarDB和分布式版本PolarDB-X等豐富的數(shù)據(jù)庫服務(wù)。
過去幾十年,數(shù)據(jù)庫經(jīng)歷了從早期的關(guān)系型數(shù)據(jù)庫,到數(shù)據(jù)倉庫和關(guān)系型數(shù)據(jù)庫配合,OLTP和OLAP兩個領(lǐng)域的細分,再到開源數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫,最后到今天云原生數(shù)據(jù)庫的發(fā)展歷程。
今天,云原生之所以成為未來數(shù)據(jù)庫的一大發(fā)展趨勢,一方面是因為數(shù)據(jù)規(guī)模爆炸性增長;另一方面是數(shù)據(jù)的生產(chǎn)和處理的實時化和一體化需求越來越強,對于一站式數(shù)據(jù)管理與服務(wù)的需求也隨之增強。第三,用戶處理數(shù)據(jù)對智能化的要求,也推動云原生數(shù)據(jù)庫的發(fā)展。
據(jù)Gartner預(yù)測,2022年,全世界75%的數(shù)據(jù)庫會以云的方式運行。未來,數(shù)據(jù)庫領(lǐng)域的核心發(fā)展方向是云原生+分布式,以及由此帶來的幾個核心技術(shù)布局:安全穩(wěn)定、自動化與智能化、數(shù)據(jù)庫大數(shù)據(jù)一體化、數(shù)據(jù)倉庫與數(shù)據(jù)湖、多模數(shù)據(jù)庫以及軟硬件結(jié)合。
另一大趨勢是湖倉一體。
簡單理解湖倉一體是,數(shù)據(jù)湖+數(shù)據(jù)倉庫的結(jié)合。其中,數(shù)據(jù)湖的特點是存儲非結(jié)構(gòu)化的數(shù)據(jù),這些數(shù)據(jù)往往比較雜亂,但使用起來很方便,可以從中任意挑選數(shù)據(jù)隨意組合。數(shù)據(jù)湖更適用于前期的開發(fā)。
數(shù)據(jù)倉庫則相反,它主要存儲結(jié)構(gòu)化、經(jīng)過處理的數(shù)據(jù)。這些數(shù)據(jù)的“排序”非常規(guī)范、有序,但用起來卻沒那么靈活。
但兩者各有利弊,如果能將數(shù)據(jù)湖的靈活與數(shù)據(jù)倉庫的規(guī)范結(jié)合到一起,就可以實現(xiàn)讓數(shù)據(jù)先在數(shù)據(jù)湖中進行開發(fā);再將整理后的數(shù)據(jù)在數(shù)據(jù)倉庫中存儲,讓數(shù)據(jù)在湖與倉之間自由流動。
湖倉一體的優(yōu)勢已愈加明顯。從各類做湖倉一體的數(shù)據(jù)庫廠商來看,各家技術(shù)路線各不同,有些選擇自研,有些則基于開源,而有些是自身云平臺的產(chǎn)品組合。但最終目的都是為了降低數(shù)據(jù)在不同平臺間的流動,比如國內(nèi)的阿里云和華為云,會通過各類云上的工具打通不同產(chǎn)品或組件間的數(shù)據(jù)流通。
隨著業(yè)務(wù)需求量和復(fù)雜度的攀升,未來國產(chǎn)數(shù)據(jù)庫也會持續(xù)進化。目前,國產(chǎn)數(shù)據(jù)庫在政策和業(yè)務(wù)環(huán)境等多重因素的驅(qū)動下,正在一路狂飆。但國產(chǎn)數(shù)據(jù)庫若想看到“爆發(fā)點”,還需要“彎道超車”。
作者:思杭;編輯:皮爺?
來源公眾號:產(chǎn)業(yè)家(ID:chanyejiawang),專注深度產(chǎn)業(yè)互聯(lián)網(wǎng)內(nèi)容
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @產(chǎn)業(yè)家 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!