充分利用中國數據庫管理系統的發(fā)展,滿(mǎn)足企業(yè)機構不斷演進(jìn)的需求
中國獨特的商業(yè)環(huán)境和對技術(shù)自主可控的強烈需求,帶來(lái)了中國數據庫管理系統(以下簡(jiǎn)稱(chēng)為“數據庫”)市場(chǎng)的繁榮和多樣性。
本文引用地址:http://dyxdggzs.com/article/202303/444181.htm雖然中國的數據庫廠(chǎng)商在許多方面,如云生態(tài)系統的建立和云財務(wù)治理等方面,仍然落后于以亞馬遜云服務(wù)、谷歌、微軟和甲骨文為代表的外國廠(chǎng)商,但在中國獨特的業(yè)務(wù)環(huán)境下,本土廠(chǎng)商的產(chǎn)品演進(jìn)十分迅速,且產(chǎn)生了差異化優(yōu)勢,因此在一些應用場(chǎng)景中具備競爭力。
中國本土數據庫具有以下幾個(gè)主要技術(shù)特征。
分布式事務(wù)型數據庫的采用率正在上升
分布式事務(wù)型數據庫已經(jīng)成為企業(yè)機構支撐核心業(yè)務(wù)系統的現實(shí)選擇,它們在中國的使用增長(cháng)速度要快于世界其他地區。
Gartner對分布式事務(wù)型數據庫(DTDB)的定義是:可在任何分布式數據庫實(shí)例節點(diǎn)上執行事務(wù)的數據庫。這項技術(shù)的特點(diǎn)在于,在接受地理上分散分布的節點(diǎn)寫(xiě)入的同時(shí),保持數據完整性和一致性,且性能合格。
在中國的移動(dòng)互聯(lián)網(wǎng)蓬勃發(fā)展過(guò)程中,實(shí)現業(yè)務(wù)敏捷性的主要阻礙是數據工作負載規?;乃俣群统杀?。工作負載的需求增長(cháng),不僅使業(yè)務(wù)性能降低,而且,如果企業(yè)機構決定擴充資源,則還會(huì )帶來(lái)額外的高昂硬件成本。使用DTDB,不僅可以支持應?的?并發(fā)和?數據吞吐量,還可以減少對由外國?商提供的?型機硬件的依賴(lài)——這也與國家“?主可控”戰略舉措的?標相符。
今天,隨著(zhù)諸如分布式一致性共識算法和并發(fā)控制技術(shù)等大量技術(shù)創(chuàng )新的出現,DTDB可確保在不犧牲過(guò)多可擴展性和性能的情況下,實(shí)現數據的高度一致性。與此同時(shí),DTDB與公有云的兼容性也正在持續提升;因此,在資源使用不斷變化且難以預測的環(huán)境中,云部署將成為理想選擇。
數據密集型應用場(chǎng)景需要超高性能數據庫
在過(guò)去的三年間,新冠疫情進(jìn)一步加快了網(wǎng)上購物、線(xiàn)上出行和在線(xiàn)教育等數字化應用場(chǎng)景的普及。作為所有應用的核心數據基礎設施,數據庫需要提供更為強大的性能,以支持全部數據密集型應用場(chǎng)景。
一些典型的超高性能應用場(chǎng)景包括:
● 全國性社會(huì )活動(dòng),例如國家人口普查,需要能夠支持每秒100萬(wàn)至200萬(wàn)個(gè)查詢(xún),以及每秒處理10萬(wàn)至50萬(wàn)件事務(wù)。
● 大型活動(dòng)的轉播,例如奧運會(huì )或春晚,通常需要能夠支持1000萬(wàn)到2000萬(wàn)本土觀(guān)眾同時(shí)在線(xiàn)觀(guān)看。
● 許多中國超大規模企業(yè)的數據存儲總量已經(jīng)達到10PB至100PB,日增數據量超過(guò)10TB。
● 網(wǎng)上購物節活動(dòng),例如“雙十一”和“618”購物節,都會(huì )產(chǎn)生極高的事務(wù)數量。
● 中國龐大的互聯(lián)網(wǎng)用戶(hù)規模,會(huì )使一些常規的網(wǎng)絡(luò )活動(dòng),例如網(wǎng)上訂餐、網(wǎng)約車(chē)、在線(xiàn)教育等的工作負載成倍加大,導致高峰時(shí)段事務(wù)處理的工作負載尤為繁重。在高峰時(shí)段,事務(wù)處理工作負載有時(shí)比非高峰時(shí)段高100倍。
中國的數據庫廠(chǎng)商都在不斷演進(jìn)各類(lèi)技術(shù),以支持數據密集型應用場(chǎng)景。這些技術(shù)包括大規模并行處理(MPP)、分布式事務(wù)、內存數據處理和行列混合處理等。近年來(lái),一批初創(chuàng )廠(chǎng)商開(kāi)始快速獲得關(guān)注。這些廠(chǎng)商將超高性能作為其核心競爭差異化優(yōu)勢,豐富了企業(yè)機構的選擇面,但也使得市場(chǎng)狀況變得更加復雜。
各類(lèi)專(zhuān)業(yè)化的數據庫正不斷融合,成為集成各類(lèi)功能的統一型數據庫服務(wù)
在過(guò)去的15年間,中國企業(yè)機構采用了各類(lèi)專(zhuān)業(yè)化的數據庫,用于各類(lèi)不同類(lèi)型數據庫的操作和分析。比如:
● 非關(guān)系型數據庫,例如圖數據庫和文檔數據庫,可用于存儲和處理圖數據和文檔數據,以支持機器學(xué)習和圖分析。
● 時(shí)序數據庫和內存數據庫可用于支持時(shí)間敏感性應用場(chǎng)景,例如流分析和決策智能。
由于每個(gè)應用場(chǎng)景均有海量的數據庫產(chǎn)品可供選擇,相應地,連接這些數據庫的數據管道也越建越多,導致企業(yè)機構數據和分析架構的復雜性大大增加。這一復雜性也導致了運營(yíng)效率低下,獲取洞察的時(shí)間被延長(cháng)。為解決這一問(wèn)題,中國和全球的數據庫廠(chǎng)商都在采取行動(dòng),擴大各自產(chǎn)品的應用場(chǎng)景覆蓋范圍,形成了數據庫功能融合的局面。這一融合趨勢在多模型數據庫中得以體現。這類(lèi)數據庫可以通過(guò)多個(gè)應用編程接口(API)來(lái)支持多種存儲和持久保存數據的方式。
如圖1所示,Gartner從數據類(lèi)型和時(shí)間敏感性幾個(gè)方面對這一趨勢進(jìn)行了觀(guān)察研究。
圖1 數據庫產(chǎn)品的融合
評論