中國軟件根技術發(fā)展白皮書(2023年版)_第1頁
中國軟件根技術發(fā)展白皮書(2023年版)_第2頁
中國軟件根技術發(fā)展白皮書(2023年版)_第3頁
中國軟件根技術發(fā)展白皮書(2023年版)_第4頁
中國軟件根技術發(fā)展白皮書(2023年版)_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

中國軟件根技術發(fā)展白皮書(數據庫冊)目 錄前言 1一、數據庫概述 3(一)數據庫相關概念 3(二)數據庫分類 5(三)數據庫架構標準 6(四)數據庫產業(yè)鏈 8二、全球數據庫競爭格局和發(fā)展態(tài)勢 9(一)全球數據庫行業(yè)競爭格局 9(二)主流數據庫廠商產品分析 10Oracle 10IBM 11Microsoft 12Amazon 12Google 13(三)發(fā)展現狀 14數據庫是數字經濟發(fā)展的基礎技術和設施 14美國數據庫廠商長期壟斷全球數據庫市場 14數據庫技術路徑分化帶來市場分裂與競合 154.“開源+云”已經成為數據庫革新的關鍵力量 16(四)全球數據庫發(fā)展新態(tài)勢 16數據庫和硬件協同成為新興競爭力量 16數據庫領域的投資熱情正在逐年升溫 16中國數據庫迎來技術積累爆發(fā)增長期 17技術收斂是國產數據庫突圍有效路徑 18三、國產數據庫發(fā)展狀況 19(一)發(fā)展現狀 19(二)市場規(guī)模 20(三)國產數據庫主要廠商產品分析 21達夢數據庫 22南大通用 22神舟通用 23人大金倉 23華為公司 24阿里云 24騰訊云 25平凱星辰 25云和恩墨 26海量數據 27(四)國產數據庫在重點行業(yè)應用分析 27(五)國產數據庫廠商積極布局生態(tài)建設 28四、主流數據庫技術發(fā)展分析 30(一)關系型數據庫 30技術特點 30主流產品 31發(fā)展趨勢 31(二)非關系型數據庫 31技術特點 31主流產品 32發(fā)展趨勢 33五、國產數據庫發(fā)展面臨的形勢、問題及機遇 36(一)面臨的主要形勢 363(二)存在的主要問題 38產品種類繁多,競爭能力不足 38技術基礎薄弱,專業(yè)人才匱乏 38安全性能存憂,用戶使用存慮 38產品標準各異,缺乏行業(yè)標準 39產業(yè)資源分散,生態(tài)建設滯后 40(三)發(fā)展機遇 40利好政策出臺釋放巨大紅利 40數字化激發(fā)數據庫市場潛力 41數據庫國產化替代空間巨大 41行業(yè)技術實力積累整體增強 41六、國產數據庫發(fā)展基本判斷 43(一)國產數據庫技術路線收斂勢在必行 43(二)國產數據庫廠商應重視用戶的需求 43(三)存算分離+多讀多寫成為發(fā)展新趨勢 43(四)開源是國產數據庫發(fā)展的有效路徑 44七、建立以openGauss為代表的國產數據庫體系 45(一)內核創(chuàng)新研究,打造堅實數據底座 45(二)聯合產業(yè)資源,共建資源池化架構 46(三)滿足行業(yè)訴求,打造關基行業(yè)標桿 47(四)打造開源社區(qū),共建技術開發(fā)生態(tài) 48(五)走進高校課堂,培養(yǎng)專業(yè)技術人才 49八、發(fā)展對策建議 50(一)引導數據庫技術路線收斂提升競爭能力 50(二)強化存算分離+共享存儲標準體系建設 50(三)出臺專項政策支持首臺套和規(guī)?;瘧?50(四)強化數據庫技術創(chuàng)新集聚全產業(yè)鏈資源 51(五)集中支持開源社區(qū)加大產業(yè)鏈生態(tài)建設 514前 言黨的二十大報告明確提出,堅持創(chuàng)新在我國現代化建設全局中的核心地位,加快實現高水平科技自立自強,加快建設科技強國,并對完善科技創(chuàng)新體系、加快實施創(chuàng)新驅動發(fā)展戰(zhàn)略等作出了系列重要部署。基礎軟件根技術已經成為國家戰(zhàn)略科技競爭的制高點。要從根本上擺脫對單一技術供應鏈的依賴,必須堅持原始技術創(chuàng)新,堅定不移地摸索出一條獨立自主的軟件根技術產業(yè)體系發(fā)展之隨著數字化的深入推進,數據庫在技術架構、數據管理、數據安全創(chuàng)新,以及數據科學基礎研究、生態(tài)建設、“產學研用”深入合作等方面都面臨著巨大的挑戰(zhàn)?,F階段,我國數據庫行業(yè)市場前景廣闊,整體呈現出穩(wěn)步上升的發(fā)展勢頭,經過多年的技術沉淀和市場洗禮,正在經歷這為國產數據庫發(fā)展提供了良好的成長土壤。國產數據庫要實現突破式發(fā)展,需要與行業(yè)發(fā)展變化需求相協同,也需要產業(yè)界形成合力持續(xù)推動原始創(chuàng)新,還需要構建起完善健康的產業(yè)生態(tài)體系。1我們倡導國產數據庫技術收斂路線,鼓勵產業(yè)上下游生態(tài)鏈資源聯合起來共同打造具有國際競爭力的國產數據庫技術、產品和解決方案,推動我國數據庫產業(yè)高質量發(fā)展。2一、數據庫概述數字化正在改變世界萬物,而數字世界的底層,則是龐大數據庫作為信息系統(tǒng)的核心,在計算機中扮演著承上啟下的作用,向下實現調動計算、網絡、存儲等基礎資源,向上完成支撐各種應用軟件需求,是計算功能得以實現的基礎設施底座。數據庫的發(fā)展不僅影響著計算機技術的發(fā)展進程,也推動著經濟社會和數字中國的持續(xù)進步。(一)數據庫相關概念數據(Data):數據庫中存儲的基本對象,是描述實物的圖像、聲音、語言等,數據有多重表現形式,它們都可以經過數字化后存入計算機。數據庫(DB):長期存儲在計算機內的、有組織的、可數據模型是對現實世界數據特征的抽象。通俗地講數據模型就是對現實世界的模擬映射。專欄1數據模型是對現實世界數據特征的抽象。通俗地講數據模型就是對現實世界的模擬映射。專欄1:數據模型是數據庫系統(tǒng)的核心和基礎3概念模型,概念模型,也稱信息模型。按用戶的觀點來對數據和信息建模,用于數據庫設計。物理模型:對數據最底層的抽象,描述數據在系統(tǒng)內部的表示方法和存取方法、或者在磁盤或磁帶上的存儲方式和存取方法。?? ? ?fi?fi:嚴格定義的一組概念的集合。精確描述了系統(tǒng)的靜態(tài)特性、動態(tài)特性和完整性約束條件。?y??獨立性:通過DBMS,不同應用程序和用戶可以在同一數據庫下操作,各數據之間互相獨立,互不干擾。共享性:數據庫系統(tǒng)可以進行多用戶共享,多個用戶或應用程序獨立性:通過DBMS,不同應用程序和用戶可以在同一數據庫下操作,各數據之間互相獨立,互不干擾。共享性:數據庫系統(tǒng)可以進行多用戶共享,多個用戶或應用程序能夠同時訪問同一數據庫,進行數據的查詢和修改。集中性:通過DBMS,可以將不同的數據集中到同一數據庫中進行管理和維護,提高了數據的管理效率和數據間的聯系性。安全性:通過DBMS,可以實現對數據的安全保護,數據訪問控制和數據備份等功能。一致性:通過DBMS,不論是在單用戶還是多用戶的情況下,數據的一致性能夠得到保障。專欄2:數據庫管理系統(tǒng)的主要特性4(二)數據庫分類歷經70年的不斷發(fā)展,數據庫已經衍生出多種技術路徑和方向。為了更清楚地掌握數據庫之間的特性差異,數據庫產品可根據不同標準進行分類,常見的分類依據包括數據模型、架構模型、業(yè)務負載特征、部署方式、適配硬件架構等,其中數據結構類型是最常用的分類標準。根據數據模型分類:關系型數據庫、非關系型數據庫。根據架構模型分類:集中式數據庫、分布式數據庫。根據業(yè)務負載特性分類:事務型數據庫型數據庫(OLAP)、混合型數據庫?,F階段,最常見的數據庫模型是關系型數據庫和非關系型數據庫,國內超過90%故本文將以數據結構為重點對數據庫進行研究。關系型數據庫(RDB):一種采用關系模型來組織數據的???fi?:使用表結構,格式一致,易于維護;使用通用的SQL???fi?:使用表結構,格式一致,易于維護;使用通用的SQL語言操作,使用方便,可用于復雜查詢;數據存儲在磁盤中,安全性高。???@?:讀寫性能比較差,不能滿足海量數據的高效率讀寫;不節(jié)省空間,專欄3:關系型數據庫的優(yōu)缺點5建立在關系模型上,要遵循某些規(guī)則,比如數據中某字段值即使為空建立在關系模型上,要遵循某些規(guī)則,比如數據中某字段值即使為空仍要分配空間;固定的表結構,靈活度較低。文檔型(針對海量數據訪問場景)、列式數據庫、圖形數據庫四種類型。???fi?:key-value形式、文檔形式、圖片形式等,使用靈活,應用場景廣泛;速度快,效率高,文檔型(針對海量數據訪問場景)、列式數據庫、圖形數據庫四種類型。???fi?:key-value形式、文檔形式、圖片形式等,使用靈活,應用場景廣泛;速度快,效率高,NoSQL可以使用硬盤或者隨機存儲器作為載體,而關系型數據庫只能使用硬盤;海量數據的維護和處理非常輕松;具有擴展簡單、高并發(fā)、高穩(wěn)定性、成本低廉的優(yōu)勢;可以實現數據的分布式處理。???@?:暫時不提供SQL支持,學習和使用成本較高;沒有事務處理,沒有保證數據的完整性和安全性。適合處理海量數據,但是不一定安全;功能沒有關系型數據庫完善。專欄4:非關系型數據庫的優(yōu)缺點(三)數據庫架構標準產業(yè)數字化加速產生了諸如圖、流、時序和地圖空間等多種數據類型的海量數據,計算機體系架構正從以CPU為中心的架構向多樣性算力協同的對等架構演進。在多模數據和多樣性算力雙輪驅動下,數據庫架構需要與時俱進,有效利用多樣6性算力,進行資源的集約化管理和調度,實現多模數據的高效處理和數據價值挖掘。數據庫組件化架構標準以SQL標準作為應用接入的標準界面,并進一步往下延伸,分層定義分發(fā)、執(zhí)行、存儲引擎的交互接口,實現數據庫架構的可組裝可演進,打造面向未來的數據庫組件化技術生態(tài)。?1? $?fl!?fi??1所示的數據庫組件化架構標準中,SQL標準定義了全SQLSQL語句到執(zhí)行計劃的生成;存儲層實現數據的透明化企業(yè)級存儲能力;數據全生命周期管7理平臺實現智能運維、集群管理等公共能力。組件化架構標準在每一層都提供了擴展協同接口,以支持多樣性的SQL從而實現每一層基于業(yè)務負載的資源彈性伸縮。(四)數據庫產業(yè)鏈數據庫與芯片、操作系統(tǒng)并列為全球技術三大件,也是企IT2所示的數據庫上下游產CPU廠商、服務器主要是以數據庫、操作系統(tǒng)和中間件等組成的基礎軟件廠商;下游主要是以各行業(yè)的集成商、開發(fā)商組成的應用開發(fā)廠商。向上承接各類硬件、網絡服務資源,向下提供數據存儲、管理與分析服務,因此,數據庫的地位和作用突顯重要。?2? $1$?fi?‰?%8二、全球數據庫競爭格局和發(fā)展態(tài)勢數據庫最早起步于1964年,先后經歷了兩次發(fā)展熱潮。2080年代隨著關系型數據庫的理論突破和技術創(chuàng)新,全球數據庫行業(yè)迎來第一次發(fā)展熱潮。2000年以來,隨著移動互聯網的發(fā)展興起,數據庫的應用場景越來越豐富,推動了全球數據庫在2010-2019年進入第二次發(fā)展高峰期,大批新興企業(yè)50%進入云智能時代,全球數據庫產業(yè)正在進入第三次爆發(fā)式發(fā)展周期,整體呈現百花齊放、百家爭鳴的發(fā)展態(tài)勢。(一)全球數據庫行業(yè)競爭格局Oracle、IBM、Microsoft、Amazon、Google等主流廠商。關系型數據庫依然是現階段市場成熟度最高、應用范圍最廣的數據庫產品,占據全球約80%的市場份額,Oracle、IBM、Microsoft是行業(yè)的佼佼者。近年來,隨著云數據庫產品異軍突起,Amazon、Google等國際云數據庫廠商快速崛起,市場份額快速增長。此外,在商業(yè)化和開源并行發(fā)展的背景下,也涌現出MongoDB、Snowflake等一批以技術起家的數據庫獨立廠商,在各自的強勢領域深耕細作,占據了一席之地。9 AWSAWSGoogleIBMOracleMircosoft%fl?32022#;?? $9? OracleMircosoft%fl(二)主流數據庫廠商產品分析1.Oracle(e是全球知名的數據庫管理系統(tǒng)供應商,作為全球領袖級別的企業(yè)級數據管理解決方案供應商,Oracle提供的數據庫產品和系統(tǒng)已經逐漸成為業(yè)界標準,應用領域和范圍十分廣泛。Oracle旗下的數據庫產品覆蓋了不同的領域,包括企業(yè)級應用系統(tǒng)、小型應用程序、云環(huán)境等,產品形態(tài)也多樣化,適合不同類型的應用需求。主要產品:DatabaseOracleBerkeleyDBOracleRdbOracle等。主要應用領域:甲骨文數據庫產品長期以來一直是全球市102.IBM1977年:拉里2.IBM1977年:拉里·埃里森、鮑勃·明頓和愛德華·奧茨共同創(chuàng)建了甲骨文公司。專注于開發(fā)和銷售數據庫管理系統(tǒng)。1986年:甲骨文公司在納斯達克上市,成為公眾持股的公司。1990年:甲骨文開始轉型,從一個主要提供數據庫管理系統(tǒng)的公司變?yōu)橐粋€提供全方位企業(yè)級解決方案的公司。甲骨文發(fā)布了第一個ERP產品,使其開始在企業(yè)應用軟件領域占據一席之地。2004年:甲骨文提出并開始實施并購策略,先后收購了PeopleSoft、SiebelSystems等公司,進一步擴展了產品和服務的范圍。2010年:甲骨文完成對SunMicrosystems的收購,標志著甲骨文進入了硬件領域,并開始提供硬件和軟件一體化的解決方案。2012年:甲骨文發(fā)布了其首個公有云服務,開始轉型為云服務提供商。近年來,甲骨文在云服務、人工智能和大數據等新興領域進行了大量的研發(fā)和投資,以適應不斷變化的市場需求。啟示:甲骨文一直在不斷地調整和改變自身的發(fā)展策略,以適應不斷變化的市場環(huán)境。甲骨文始終保持著數據庫技術創(chuàng)新優(yōu)勢,積極應對各種挑戰(zhàn),從而保持了其在全球科技領域的領導地位。專欄5:甲骨文發(fā)展脈絡與啟示IBM的佼佼者。IBM數據庫是一款功能強大、安全可靠、適應性強的數據庫產品,廣泛應用于多個行業(yè)和領域中,可以為企業(yè)帶來高效、穩(wěn)定、成本優(yōu)化的數據管理能力。主要產品:IBMDB2、IBMInformix、IBMCloudant等。11主要應用領域:(1)企業(yè)級應用,支持企業(yè)級高吞吐量工業(yè)自動化等;(3)移動應用,支持移動應用的后臺數據存儲和處理,如社交應用、移動支付等;(4)云環(huán)境,支持云PaaS、SaaS等云服務模式。3.Microsoft微軟公司(Microsoft)是一家美國跨國科技企業(yè),主要以研發(fā)、制造、授權和提供廣泛的電腦軟件服務業(yè)務為主。隨著互聯網和數字化時代的到來,數據管理越來越成為各個企業(yè)的助力企業(yè)通過從海量數據中獲得有價值的信息,增強企業(yè)決策的數據支撐能力。主要產品:SQLServer、AzureSQL、AzureCosmosDB、Access等。主要應用領域:微軟數據庫軟件作為高效穩(wěn)定的數據管理工具,廣泛應用于銀行、電力、通訊、零售等行業(yè),為企業(yè)在數據管理領域提供著強大的支持。4.Amazon近10年以來,全球數據庫市場加速變革,云數據庫尤其是云原生數據庫成為整個數據庫市場的關鍵變量。亞馬遜公司(Amazon)作為全球云原生數據庫的領導者,其基于云原生數據庫,構建起涵蓋數據存儲、查詢、數據分析、機器學習、12商業(yè)智能、編目與治理的端到端的數據戰(zhàn)略。、AmazonTimestream、AmazonQLDB、AmazonKeyspace、AmazonNeptuneServerless等。工業(yè)、社交網絡、物聯網、銀行等各種應用場景中得到了廣泛的應用。5.Google谷歌公司(Google)是全球最大的互聯網公司之一,谷歌工業(yè)、社交網絡、物聯網、銀行等各種應用場景中得到了廣泛的應用。5.Google谷歌公司(Google)是全球最大的互聯網公司之一,谷歌數據庫為高性能和大規(guī)模的數據處理、存儲和管理提供了出色的解決方案。在Gartner公布的2022年全球數據庫管理系統(tǒng)的市場份額排名中,作為純云廠商的亞馬遜云科技,超越了老牌傳統(tǒng)數據庫廠商甲骨文和25.3%。亞馬遜云科技已經連續(xù)8年位居Gartner云數據庫管理系統(tǒng)領導者象限,更是在愿景完備性和執(zhí)行能力兩個維度都超出所有對手。專欄6:亞馬遜成為全球數據庫管理系統(tǒng)領導者GoogleCloudSQL、GoogleCloudSpanner、AlloyDBforPostgreSQL、BigQuery等。主要應用領域:廣泛應用在金融、IT、生物醫(yī)藥、物流、電商零售、物聯網、政府等領域。13(三)發(fā)展現狀數據庫是數字經濟發(fā)展的基礎技術和設施近年來,數字技術加速融入經濟社會發(fā)展的各個領域和全過程,進入數字經濟時代的重要特征是生產力的全面數字化,產生的數據量也呈現爆炸式增長,數據要素價值日益顯現,海量數據需要領先且強大的數字基礎設施存儲與管理,數據庫則扮演了核心角色。只有建立起強大的數據技術軟件體系,才能滿足數字經濟發(fā)展的需要,而數據庫為數字中國建設和數字經濟社會的穩(wěn)定及健康發(fā)展提供了基礎技術和設施保障。美國數據庫廠商長期壟斷全球數據庫市場全球數據庫市場主要由傳統(tǒng)IT巨頭、云計算廠商、獨立數據庫廠商三大勢力進行角逐,傳統(tǒng)IT巨頭(Oracle、IBM、Microsoft)多在關系模型領域深耕,整體占據市場主導地位,同時隨著云計算、大數據的快速發(fā)展使得需求有了進一步的爆發(fā),推動了云數據庫廠商(Amazon、Google)的快速崛起。美國Oracle、IBM、Microsoft、Amazon、Google五家科技巨頭公司聯合占據了全球數據庫75%以上的市場份額,全球數據庫行業(yè)呈現美國一家獨大的局面。在國內,Oracle、Microsoft等國際廠商也占據了超過65%的數據庫市場份額,與國際市場面臨著相似的境況。143.3.數據庫技術路徑分化帶來市場分裂與競合過去10年,全球有近300家數據庫企業(yè)相繼成立,而全球數據庫產業(yè)絕大部分市場份額主要被美國科技巨頭占據,其他90%以上的數據庫企業(yè)生存艱難。這些數據庫企業(yè)中,一部分基于其他商業(yè)或開源數據庫做二次開發(fā)的數據庫產品,一部分通過自研開發(fā)數據庫產品,還有一部分企業(yè)在一些垂直細分在傳統(tǒng)數據庫領域,由于國外數據庫廠商起步較早,同時在發(fā)展過程中不斷進行戰(zhàn)略布局和產品迭代,已經形成了先發(fā)優(yōu)勢,代表性企業(yè)有Oracle、IBM、Microsoft等。伴隨云計算、大數據等技術的快速發(fā)展,互聯網巨頭在數據庫市場大放異彩,云計算巨頭的數據庫產品借勢快速發(fā)展,代表性企業(yè)有亞馬遜、谷歌、華為、阿里、騰訊等。在商業(yè)化和開源并行發(fā)展的同時,也涌現出一批技術起家的數據MongoDB、Snowflake等公司。IT領域強勢,云計算廠商以及獨立數據庫廠商在非關系型領域以及OLAP領域更具競爭力。云計算廠商更多的是依靠云計算、大數據的快速發(fā)展崛起,同時,獨立數據庫公司更加依賴開源來快速提升產品影響力和市場認知度,同時社區(qū)的力量也可以讓公司的產品快速迭代升級。專欄7:全球數據庫市場呈現三雄爭霸局面未來絕大部分數據庫企業(yè)可能會逐漸消亡或被頭部公司吞并收購,只有那些迎合市場發(fā)展需求,保持技術領先優(yōu)勢、生態(tài)完善的企業(yè)才能存活下來,數據庫市場將有可能從分散逐步收斂走向集中化。154.“開源+云”已經成為數據庫革新的關鍵力量++(四)全球數據庫發(fā)展新態(tài)勢數據庫和硬件協同成為新興競爭力量隨著新型硬件成本逐漸降低,充分利用新興硬件資源提升數據庫性能是未來數據庫發(fā)展的重要方向之一。在需求側,隨著數據量暴增和實時性的要求越來越高,數據庫圍繞處理器、內存、存儲和網絡四個硬件架構方向不斷突破和創(chuàng)新。新興硬件技術將塑造未來數據庫的發(fā)展趨勢,向著更高的性能、更好的可擴展性和更低的總體成本發(fā)展。數據庫和新興硬件之間的融合創(chuàng)新,將共同推動機器學習、人工智能、大數據分析、大語言模型等領域技術的發(fā)展進步。數據庫領域的投資熱情正在逐年升溫2022年全球數據庫市場規(guī)模超過975億美元,同比增長14%。中國軟協預測,未來3-5年內,全球數據庫市場將保10%-15%2025年市場規(guī)模有望突破1250億美元。1614001200100080060040020002021¢2022¢ 2023E2024E2025E]§fi?(§亍y)?42021–2025#;?? $?§????據不完全統(tǒng)計,2021-202232家開源商業(yè)公司獲得融資且有多家公司在短時間內獲得多輪融資,其中單輪融資數1億美元的企業(yè)數量占比接近20%1000萬美元的企業(yè)數量占比超過50%。其中,數據庫領域成為開源融資界的寵兒。2022年數據庫商業(yè)公司獲得融資的數量占比接近所有行業(yè)融資額的25%,明顯高于其他行業(yè)公司,這說明市場對數據庫行業(yè)的投資熱情仍然很高。中國數據庫迎來技術積累爆發(fā)增長期當前,中國數據庫市場迎來黃金發(fā)展期,國內擁有一個蓬勃發(fā)展的大市場,大市場帶來了豐富的應用場景,為國內數據庫技術實力的提升提供了優(yōu)勢基礎。另外,開源模式為技術創(chuàng)新的擴散應用提供了良好的成長土壤,也為全球經濟的轉型發(fā)17展提供了廣闊的創(chuàng)新思路。我國在全球開源體系中占據重要地位,國內在數據庫、人工智能、操作系統(tǒng)領域的開源項目日益活躍,這跟中國互聯網行業(yè)的市場特點和當前技術發(fā)展緊密相關。以華為openGauss為代表的國產數據庫相繼開源,國內的數據庫開源社區(qū)、開源人才、開源組織、開源項目的數量和質量正在持續(xù)提升,加速推動了國產數據庫技術的迭代升級發(fā)展。技術收斂是國產數據庫突圍有效路徑經過近十年的快速發(fā)展,國產數據庫已經具備應用在關鍵基礎設施行業(yè)的技術儲備。隨著政策利好、數字化轉型大潮以及市場教育逐漸成熟,國內企業(yè)的IT支出提升,推動著數據庫行業(yè)迎來發(fā)展機遇。但是國內廠商眾多、技術路線分散導致數據庫市場嚴重內卷,對于客戶來說也會出現難以選擇廠商的問題。預計未來5-10年,我國數據庫市場將會產生激烈競爭,最終可能突圍留下技術成熟度高、安全可控、生態(tài)布局完善的少數幾家頭部企業(yè),其它更多的數據庫企業(yè)將會逐漸融入到頭部企業(yè)生態(tài)圈,實現良性循環(huán)發(fā)展。18三、國產數據庫發(fā)展狀況國產數據庫在過去三十多年里一直處于追趕狀態(tài),經過最近十年的細心打磨沉淀,國產數據庫已經取得了顯著進步,涌現出了一批較為成熟的國產數據庫產品,并與國外數據庫產品(一)發(fā)展現狀數據庫是數字基礎設施的根技術,在數據庫發(fā)展的歷史進程中,前五十年數據庫世界的主角都是美國科技廠商。自2000年以來,我國開始陸續(xù)出現商業(yè)數據庫廠商,特別是國產數據庫軟件在過去幾年中快速成長,呈現出持續(xù)向好的發(fā)展勢頭。國產數據庫開發(fā)不斷引入最新的技術和算法,提高數據庫的性能和功能。例如,一些國產數據庫產品采用了列存儲、分布式架構、內存計算、存算分離、軟硬協同等先進技術,以滿足大數據、實時分析等新興應用需求?!猣i?fl???$??性,以滿足不同行業(yè)和用戶的需求。國產數據庫軟件除了基本的SQL支持,還具備數據處理和分析功能。?國產數據庫在商業(yè)化方面也積極的進展。一些公司提供了商業(yè)許可證的產品版本,并提供了技術支持、培訓和咨詢等服務,以滿足企業(yè)用戶的需求?!猣l?fi?∈?fl?國產數據庫中的一些產品越來越19重視開源模式,吸引了大量的社區(qū)貢獻者和用戶參與,形成了活躍的開發(fā)和生態(tài)系統(tǒng)。如華為公司開發(fā)的openGauss企業(yè)級開源關系數據庫,受到業(yè)內的廣泛關注和使用。總體來看,隨著國家不斷提高對信息安全和自主可控的重視程度,在國家政策的驅動下,國內數據庫企業(yè)更加重視自主研發(fā)創(chuàng)新能力,相繼推出了眾多具有自主知識產權、性能完備的數據庫產品,在國內數據庫市場已經占據了一席之地。(二)市場規(guī)模隨著數字經濟的興起,各領域數字化轉型深入推進,千行百業(yè)對數據庫的應用需求顯著增加,促進了我國數據庫市場的繁榮發(fā)展。根據中國軟協市場調查數據顯示,2022年我國數據364.527.4億7.5%2023-2025年我國數據庫市場將保持高速增長態(tài)勢,年平均增速為35%2025年市場900億元。201000896.8800664.3600492.1400364.520002022¢2023E 2024E2025E]§fi?(§y)?52022–2025#§?? $?§???52022–2025#§?? $?§????(三)國產數據庫主要廠商產品分析據不完全統(tǒng)計,國內現有數據庫企業(yè)數量超過250家,數280個,本文選取了具有行業(yè)代表性的10家企業(yè)進行重點分析。21達夢數據庫武漢達夢數據庫股份有限公司成立于2000年,是國內領先的數據庫產品開發(fā)服務商,國內數據庫基礎軟件產業(yè)發(fā)展的關鍵推動者。公司為客戶提供各類數據庫軟件及集群軟件、云計算與大數據等一系列數據庫產品及相關技術服務,致力于成為國際頂尖的全棧數據產品及解決方案提供商。達夢公司擁有數據管理與數據分析領域的核心前沿技術,擁有主要產品全部核心源代碼的自主知識產權。主要產品:DM8、DMDPC、GDMBASE、DMCDM、啟云數據庫等。中國航信、中國移動、中國煙草等在內的知名用戶,成功應用于金融、能源、航空、通信、政府、醫(yī)療、教育等多個領域。南大通用天津南大通用數據技術股份有限公司成立于2004年,自成立以來始終堅持自主創(chuàng)新,產品的核心技術及底層代碼自主分布式事務型、云原生數據倉庫等全技術棧的數據產品體系及服務解決方案,在國內數據庫市場具有較高的品牌知名度。主要產品:XDM、GBase8d等。主要應用領域:南大通用自主研發(fā)的GBase系列數據庫產3432個省級行政區(qū)域,22為金融、電信、政務、能源、交通等百余個行業(yè)上萬家用戶提供產品和服務,目前已建立節(jié)點超過35000個,管理數據總量超過400PB。神舟通用天津神舟通用數據技術有限公司隸屬于中國航天科技集團,是北京神舟航天軟件技術股份有限公司控股子公司,是國內從事數據庫、數據挖掘分析產品研發(fā)的專業(yè)公司,是國內最具影響力的基礎軟件企業(yè)之一。神舟通用公司獲得了國家核高基科技重大專項重點支持,是核高基專項的牽頭承擔單位。主要產品:神通關系型數據庫、神通KStore海量數據管理系統(tǒng)等。主要應用領域:神通數據庫已經廣泛應用于政府、軍隊、軍工、金融、電信、航天、郵政、能源、互聯網、交通運輸、制造業(yè)、教育、煙草、稅務、審計等各個領域的涉密信息系統(tǒng)和信息系統(tǒng)安全等級要求較高的核心信息系統(tǒng)等領域。在國民經濟支柱行業(yè),尤其是對于具有自主可信需求的領域,神通數據庫也為其提供了可靠的數據存儲管理支持。人大金倉北京人大金倉信息技術股份有限公司成立于1999年,是較早成立的擁有自主知識產權的國產數據庫企業(yè),也是中國電子科技集團成員企業(yè)。公司專注數據庫領域20余載,具備出色的數據庫產品研發(fā)及服務能力。曾先后承擔國家“863”、23等重大課題研究。主要產品:KES、KADB、KFS等。主要應用領域:人大金倉具備國內先進的數據庫產品、服務及解決方案體系,廣泛服務于電子政務、國防軍工、能源、金融、電信等60余個重點行業(yè)和關鍵領域,累計裝機部署超百萬套。2022KES入選國務院國資委發(fā)布十項國有企業(yè)數字技術典型成果。華為公司華為公司是全球領先的數字基礎設施和智能終端服務商。openGauss是華為公司自主研發(fā)的一款全面友好開放,攜手伙伴共同打造的企業(yè)級開源關系型數據庫。openGauss提供面向多核架構的極致性能、全鏈路的業(yè)務、數據安全、基于AI的調優(yōu)和高效運維的能力。openGauss深度融合華為在數據庫領域多年的研發(fā)經驗,結合企業(yè)級場景需求,持續(xù)構建競爭力特性。主要產品:openGauss、GaussDB等。loT智能家居、車聯網等行業(yè)領域。阿里云阿里云是全球領先的云計算及人工智能科技公司,為200多個國家和地區(qū)的企業(yè)、開發(fā)者和政府機構提供服務。阿里云24擁有強大且豐富的云數據庫產品家族,涵蓋關系型數據庫、非關系型數據庫、數據倉庫、數據庫生態(tài)工具四大版塊,可以為企業(yè)數據生產和集成、實時處理、分析與發(fā)現、開發(fā)與管理提供全鏈路生命周期的服務。主要產品:PolarDB、RDS等。主要應用領域:阿里云數據庫已經應用于多個行業(yè),支持騰訊云騰訊云是騰訊旗下云計算服務公司,提供全球領先的云計算、大數據、人工智能等技術產品與服務。騰訊云數據庫為企業(yè)提供完善的關系型數據庫、非關系型數據庫、分析型數據庫和數據庫生態(tài)工具。用戶可以通過產品選擇和組合搭建,實現高可靠、高可用性、高性能等數據庫需求。主要產品:TDSQL-C、forMySQL、TDSQLforPostgreSQL、forRedis等。主要應用領域:騰訊云數據庫服務超過2000+的金融政企,行業(yè)覆蓋銀行、保險、證券、政務、互聯網金融等各個領域。其中,TDSQL目前已成功打造粵省事、深圳地鐵、中國銀行、富途證券、閱文集團、游族網絡、騰訊游戲等多個項目方案。平凱星辰北京平凱星辰科技發(fā)展有限公司(PingCAP)是業(yè)界領先25解決方案與咨詢、技術支持與培訓認證服務,致力于為全球行業(yè)用戶提供穩(wěn)定高效、安全可靠、開放兼容的新型數據服務平臺,解放企業(yè)生產力,加速企業(yè)數字化轉型升級。主要產品:TiDB。主要應用領域:TiDB3000家企業(yè)級用1000家,覆蓋美國、法國、挪威、愛沙尼亞、日本、澳大利亞、新西蘭、新加坡、印度、越南、秘信息安全、互聯網、物流等各個行業(yè),產品用戶數在國內處于領先位置。其中,在金融、電信、互聯網、物流、高端制造業(yè)等對數據庫要求較高的領域廣受歡迎。云和恩墨云和恩墨(北京)信息技術有限公司創(chuàng)立于2011年,是中國領先的數據庫系統(tǒng)軟件提供商,在數據管理、承載、加工和應用領域為各個組織提供可信賴的產品、服務和解決方案。云和恩墨以數據庫為核心,向下提供數據庫一體機平臺、向上提供數據庫云管平臺,形成了端到端的數據庫解決方案。此外,公司打造的墨天輪社區(qū)已成為國內最大的數據庫生態(tài)社區(qū)。主要產品:MogDB、Uqbar、zCloud、zData等。能源、政務、制造、交通、醫(yī)療、商貿81000多家企業(yè)級客戶,特別是在電信、金融等領域擁有廣泛的成功案例。26海量數據北京海量數據技術股份有限公司成立于2007年,是國內以數據庫為主營業(yè)務的上海主板上市公司。海量數據始終堅持自主技術研發(fā)和創(chuàng)新,擁有北京、杭州、廣州三大研發(fā)基地,團隊技術人員占比超過65%。G100、E100、AtlasDB等。主開發(fā)環(huán)境和IT架構,目前廣泛應用于政務、制造、金融、通信、能源、交通、國防、軍工、醫(yī)療、教育等多個重點行業(yè)。特別是在制造行業(yè)的細分領域中擁有較高的市場占有率。(四)國產數據庫在重點行業(yè)應用分析近幾年以來,國產數據庫在技術創(chuàng)新、市場競爭和用戶認可度等方面取得了顯著進步,國產OLAP和非關系型數據庫逐漸成為國內眾多企業(yè)和機構的首選數據庫解決方案,并且在黨政軍、金融、電信、能源、電力、醫(yī)療、教育、交通、公共事業(yè)等領域和關鍵行業(yè)取得了重要應用成就。同時,一些國產數據庫廠商開始瞄準走向國際市場,積極主動地參與到全球競爭中。通過技術創(chuàng)新、合作伙伴關系和市場營銷等多種方式,爭取更多的國際用戶和業(yè)務機會,提升在全球數據庫市場的競爭力。分行業(yè)來看,金融、電信、政府、制造、交通五大行業(yè)占據數據庫服務市場的份額超過85%。各行業(yè)的數據庫服務市場份額比例分別為金融24.3%、電信19.6%、政府17.2%、制造15.3%、交通9.8%。279.824.39.824.313.813.817.217.2¤嚌$?§?fi?弙%fl19.615.3?7????? $¤嚌$?§?fi?弙%fl19.615.3未來幾年,隨著我國在基礎軟件研究領域的不斷進步,國產數據庫技術將會在更多的行業(yè)領域發(fā)揮關鍵性作用,支撐千行百業(yè)實現數字化變革和高質量發(fā)展。(五)國產數據庫廠商積極布局生態(tài)建設中間件的適配工作,ISV、集成商、二次開發(fā)商、IT咨詢公司都是數據庫廠商生態(tài)伙伴體系中的重要參與者?,F階段,企業(yè)自建生態(tài)難度較大,兼容生態(tài)成為主要選擇。生態(tài)伙伴賦能企業(yè)發(fā)中。28要驅動力。X86替換小型機,DB2的市場份額逐漸下降;軟硬件分離的趨勢,導致Intel+微軟的操作系統(tǒng)得Oracle、MySQL發(fā)展壯大的機會。合作伙伴生態(tài)是Oracle早期占領中國市場的核心要素之一,早期Oracle中國區(qū)90%要驅動力。X86替換小型機,DB2的市場份額逐漸下降;軟硬件分離的趨勢,導致Intel+微軟的操作系統(tǒng)得Oracle、MySQL發(fā)展壯大的機會。合作伙伴生態(tài)是Oracle早期占領中國市場的核心要素之一,早期Oracle中國區(qū)90%以上收入來自2000多個合作伙伴。專欄8:國產數據庫公司發(fā)展的戰(zhàn)略重點在于生態(tài)擴展29四、主流數據庫技術發(fā)展分析數據模型決定了數據庫的邏輯結構以及數據的存儲、組織和操作方式,是數據庫的核心要素,數據模型的變遷史是數據庫技術架構升級的主線。關系型和非關系型數據庫是業(yè)界使用最多最普遍的主流分類方式,故本文主要從數據結構分類的角度對數據庫技術的發(fā)展進行深入分析。(一)關系型數據庫技術特點關系型數據庫具備ACID[1]特性,是常見的主流數據庫類型。關系型數據庫在維護數據庫完整性、數據一致性方面優(yōu)勢突出,適用于對數據安全性及事務支持要求較高的應用場景??蓴U展性能良好。關系型數據庫可以輕松地進行垂直和水平擴展,包括添加更多的CPU、內存、磁盤等。同時,關系型數據庫還支持分區(qū),可以將數據庫水平分成多個部分,從而實現更高的吞吐量。SQL是關系型數據庫的核心查詢語言SQL的關系型數據庫可以無縫地與其他數據庫軟件(BI報表、ETL工具等)集成。這樣,用戶可以將數據頻繁地從一個環(huán)境轉移到另一個環(huán)境,同時也方便了開發(fā)人員在多個數據庫之間進行操作和查詢。ACIa??(Atomicity~?(Consistency?y(Isolations?)‰(Durability)?30成熟和穩(wěn)定性高。關系型數據庫走過了40多年的發(fā)展和完善過程,已經變得越來越成熟和穩(wěn)定。與數據庫配套的相關軟件和工具逐漸趨于完善,有大量的模板和文檔可供使用,同時也有一個龐大和信息充沛的社區(qū)來維護、支持。主流產品市場上主流的關系型數據庫包括Oracle、MySQL、IBMDB2、AmazonRDS、MicrosoftSQLServer、MicrosoftAccess、PostgreSQL等多個產品種類,每種數據庫的語法、功能和特性也各具特色。發(fā)展趨勢關系型數據庫仍然在許多方面具有非常重要的功能作用,(二)非關系型數據庫技術特點區(qū)別于關系型數據庫,NoSQLBASE[2]模型。BASE:aa$?)(BasicallyAvaliable)sfi‰?(Softstate)s 8~?‰(Eventualconsistency)?31NoSQL數據庫具有易擴展、大數據量、高性能、靈活和高可用的特點。易擴展。NoSQL數據庫種類繁多,但都有一個共同的特點,即不具有關系數據庫的關系型特性。數據之間無關系,這樣就非常容易擴展。無形之間,在架構的層面上帶來了可擴展的能力。大數據量、高性能。NoSQL數據庫都具有非常高的讀寫性能,尤其在大數據量下,同樣表現優(yōu)秀。這得益于它的無MySQLQueryCache。NoSQLCacheCache,NoSQL數據庫在這個層面上來說性能就要高很多。數據類型靈活。NoSQL數據庫無須事先為要存儲的數據建立字段,隨時可以存儲自定義的數據格式。高可用。NoSQL數據庫在不太影響性能的情況下,就可以方便地實現高可用的架構。比如Cassandra、HBase模型,通過復制模型也能實現高可用。主流產品市場上常見的NoSQL數據庫包括鍵值型數據庫、列族數據庫、文檔數據庫、圖數據庫、時序數據庫、空間數據庫等。MemcacheDBBerkeleyDB、Redis、ApacheIgnite、Riak等。32列族數據庫:適用于分布式數據存儲與管理,將同一能局限。典型產品:Hbase、Cassandra、Hypertable等。文檔數據庫:適用于存儲文檔數據,數據結構靈活,但缺乏統(tǒng)一查詢語法。典型產品:MongoDB、ApacheCouchDB、ArangoDB、Couchbase、CosmosDB、IBMDomino、MarkLogic、OrientDB等。圖數據庫:適用于圖像數據、社交網絡、推薦系統(tǒng),專注構建關系圖譜,支持復雜的圖形算法,但只能支持一定的數據規(guī)模。典型產品:Neo4J、FlockDB、AllegroGraph等。時序數據庫:為包含個體、時間、狀態(tài)信息的實時流數據進行存儲、檢索和管理數據庫,適合于物聯網、性能監(jiān)控服務。典型產品:InfluxDB、Kdb+、Prometheus、Graphite、TimescaleDBTSDB等??臻g數據庫:針對二維或多維的空間數據進行存儲和管理的數據庫,適合于地圖服務和時空分析場景。典型產品:OracleSpatial、PostGIS、MicrosoftSQLServerSpatial等。發(fā)展趨勢NoSQL數據庫擴展性好,儲存模式簡單,查詢速度更快。隨著云計算的發(fā)展和大數據時代的到來,關系型數據庫越來越無法滿足行業(yè)發(fā)展需要,NoSQL數據庫將成為云時代數據庫領域的重要增長引擎。33?§fi?? $fiNoSQL? $fiafik?fl$fi??flNPSQL?flfi預定義的模式沒有預定義的模式$結構化查詢語言(SQL)沒有聲明性查詢語言—¤fi嚴格的一致性最終一致性$a支持不支持??ACIDCAP,BASEfl$縱向擴展橫向擴展(分布式)(三)數據庫技術架構演進數據庫隨底層IT架構、數據特征、企業(yè)需求等因素的變化及發(fā)展而呈現出漸進式的演進特征,涌現出新的數據模型、產品架構、負載需求以及部署方式,數據模型變遷、分析型需求崛起、分布式架構的演進以及開源模式的流行等要素對推動數據庫架構的不斷革新產生重要影響?!? ? q?數據模型作為數據描述的主要手段,是連接真實世界和邏——yfl????fl伴隨著數據庫在各行業(yè)領域的逐漸滲透,場景應用累積的大量數據僅靠原來的業(yè)務支持系統(tǒng)已經無法完成信息價值的提OLAP技術路徑從中獨立出來,并預示著大數據時代的到來。34——y$fi?fi??ScaleUpScaleout,分布式架構的誕生使得數據庫得以實現橫向擴容以及更好的并行處理能力。隨著技術的不斷發(fā)展和應用場景的不斷豐富、變化,分布式架構也在不斷進行演進和完善,未來可能向智能化、自動化及可信任的分布式架構演進?!猣l??⒛ 3?開源作為一種高效開放共享的軟件開發(fā)組織模式,從MySQL到PostgreSQL,開源生態(tài)圈的加速建立也在技術浪潮中影響著數據庫廠家技術路線的選擇?!? fl$? ?$數據庫面臨著技術收斂與新興技術潮流下的分化發(fā)展考然而隨著企業(yè)數字化進程的推進,部署多套系統(tǒng)帶來了數據一致性與運維管理等方面的挑戰(zhàn),因此出現了技術收斂的趨勢,對應多模、數據湖倉等發(fā)展方向。另一方面,數據庫持續(xù)與新IT技術結合以進一步提升性能,主要對應原生分布式、云數據庫、智能自治、結合新硬件等發(fā)展方向。35五、國產數據庫發(fā)展面臨的形勢、問題及機遇(一)面臨的主要形勢???:$?fl?$??%???fi??,????fi$?flfifi?$fl???當前我國數字經濟的發(fā)展逐步走向深化應用、規(guī)模發(fā)展、普惠共享的新階段,需要逐步擺脫對國外根技術的嚴重依賴,普惠共享的新階段,需要逐步擺脫對國外根技術的嚴重依賴,以確保我國的產業(yè)升級不受制于人,數據庫是需要重點關注的基礎軟件根技術領域。?fi?:fl?fi?$???fl],?fi? #長期以來,全球流行的Oracle、SQLServer、DB2等數據庫全部都被美國所掌握。隨著俄烏戰(zhàn)爭的爆發(fā),美國眾多企業(yè)也開始配合美國政府的行動,對俄羅斯進行制裁。截至2023月,陸續(xù)已有百余家歐美企業(yè)對俄羅斯進行制裁,或暫停在俄羅斯的業(yè)務,或退出俄羅斯市場。美國最大的數據庫公司甲骨文也對俄羅斯進行制裁,暫停啟示:在當前國際貿易摩擦加劇、國際局勢多變的情況下,數據庫軟件作為最重要的IT基礎設施之一,我國必須做好防范,要加快實現數據庫國產化和自主可控。專欄9:甲骨文數據庫斷供俄羅斯啟示?‰flfl?從2016年信創(chuàng)概念被首次提出,到2020年信創(chuàng)運動的逐漸興起,再到2022年逐步深化發(fā)展,數據庫等核心基礎軟件產品,在相關政策的驅動下,逐漸從“能用”向“好用”轉變。36fifl??:?fi? flfifl????fi???‰?fl?根據調查數據統(tǒng)計,排名前五的國產數據庫廠商的市場份fifl??:?fi? flfifl????fi???‰?fl?根據調查數據統(tǒng)計,排名前五的國產數據庫廠商的市場份。國國家戰(zhàn)略高度:數據庫是信息化建設的基礎設施之一,國家需要加強對數據庫軟件的自主研發(fā)和掌控,以保障國家信息化建設的安全和可持續(xù)發(fā)展。技術革新驅動:國產數據庫軟件的研發(fā)和生產可以促進國內技術的與時俱進,進一步提高國內企業(yè)的競爭力。數據安全形勢:關鍵行業(yè)的數據涉及到國家安全和經濟安全,如果使用國外數據庫軟件,可能會存在數據泄露和被竊取的風險。自主可控需要:使用國產數據庫軟件可以保證數據的自主可控,避免因為技術原因無法對數據進行有效管理和控制。專欄10:數據庫為什么實現國產化HTAP等增量數據庫市場,本土數據庫品牌的優(yōu)勢也愈發(fā)明顯。2023年隨著疫情管控的放開,國內關系型數據庫市場格局正在重塑,數據庫廠商的業(yè)務開展加速步入正軌,企業(yè)數據庫建設項目廣泛開展,基于構建市場新格局角度,2024年將是國產數據庫實現突破的關鍵轉折之年。37(二)存在的主要問題我國是全球數據體量最大,應用類型最豐富的國家之一。各種新業(yè)態(tài)、新場景正在國內蓬勃涌現,龐大的數據要素市場亟待釋放。數據庫產業(yè)作為數據價值的載體,當前還存在市場碎片化、技術創(chuàng)新迭代滯后、產業(yè)生態(tài)不健全等問題。產品種類繁多,競爭能力不足我國國產數據庫市場存在嚴重的碎片化現象,雖然廠商數量眾多,但“小、散、弱”的問題十分突出,無法形成對國外數據庫巨頭的競爭優(yōu)勢。據統(tǒng)計,我國數據庫廠商數量已超過250家,國產數據庫產品超過300種。而大多數廠商的數據庫產品都是來自于開源項目,這些企業(yè)研發(fā)的數據庫產品缺乏核心技術,在國內數據庫市場競爭力較弱,發(fā)展空間比較有限。技術基礎薄弱,專業(yè)人才匱乏數據庫技術門檻高、研發(fā)周期長、工程要求高,做出一款好的數據庫產品需要大量的專業(yè)技術人才長期進行研發(fā)。但由于國產數據庫的研發(fā)歷史較短,技術成熟度欠缺,與國外產品相比還存在許多缺陷和差距。同時,經過調研發(fā)現國內數據庫研發(fā)人才儲備比較匱乏,研發(fā)人數占比過低,超過60%的廠商研發(fā)人員不足百人,跟國際主流數據庫廠商對比差距明顯。專業(yè)人才儲備不足,嚴重制約了數據庫技術的研發(fā)和創(chuàng)新,導致產品市場競爭力不足。安全性能存憂,用戶使用存慮國內目前很多代碼自主化率并不高,大部分國產數據庫都38一般來說,一家企業(yè)完成數據庫的國產替代需要花上2-3一般來說,一家企業(yè)完成數據庫的國產替代需要花上2-3年的時間,在這過程中需要評估改造難度。MySQLMySQL提供運維服務的商業(yè)MySQL所采用GPL協議無法做到自主可控。MySQLGPLv2協議具有傳染MySQL以及二次開發(fā)的國產數據庫也必須開源和免費。GPLv2GPL軟件二次開發(fā)的代碼都要履行開源義務,使用不慎很容易導致私有代碼被動開源。此外,美國商務部工業(yè)和安全局(BIS)發(fā)布的《信息安全控制:網絡安全物項》,就美國實體對相關國家及地區(qū)分享網絡安全漏洞設立許可申請,限制中國等獲得網絡安全漏洞的能力。這意味著國內企MySQLMySQL安全漏洞,存在數據庫生態(tài)安全風險。專欄11:以MySQL構建的數據庫生態(tài)存在安全風險產品標準各異,缺乏行業(yè)標準國內數據庫發(fā)展正處在百花齊放、百家爭鳴階段,市場上出現了不同的架構、不同的技術路線、不同的編程接口。由于各家公司的數據庫產品標準各異,導致系統(tǒng)與系統(tǒng)之間產生兼39國產數據庫行業(yè)亟需制定規(guī)范統(tǒng)一的行業(yè)標準規(guī)范。產業(yè)資源分散,生態(tài)建設滯后國產數據庫廠商普遍缺乏對產品的長遠發(fā)展藍圖和規(guī)劃,沒有清晰的產品路線圖,也未建立起長期持續(xù)發(fā)展的機制。由于當前國內數據庫產業(yè)研發(fā)缺乏明確的分工,各廠商將有限的研發(fā)人才投入到數據庫技術堆棧的各個領域,導致各個數據庫廠商在研發(fā)過程中重復研發(fā)全棧技術,造成了大量的人力資源浪費。數據庫系統(tǒng)生態(tài)建設需要研發(fā)針對新應用場景的評測方法需要培育包括用戶、產業(yè)鏈廠商、研發(fā)梯隊的社區(qū)隊伍。國產數據庫系統(tǒng)廠商起步相對較晚,發(fā)展時間較短,做好生態(tài)建設也是難點問題。(三)發(fā)展機遇數據庫是數字經濟高質量發(fā)展的基礎設施,保障數據庫行業(yè)健康發(fā)展,對于促進數字經濟發(fā)展與實體經濟深度融合具有重要的底層支撐作用。利好政策出臺釋放巨大紅利近年來,國家十分重視國產數據庫產業(yè)發(fā)展,圍繞信息技知識產權等多個領域相繼出臺了專門的支持政策。借助政策東風,國產數據庫廠商奮發(fā)有為,市場版圖快速擴張。另外,作為信創(chuàng)領域基礎軟件的重要組成部分,數據庫的國產化替代也40在加速進行中,GaussDB、PolarDB、DM8、GBase、TiDB等數據庫產品是近年來備受關注的一批國產數據庫產品,在各自的領域和場景下都有著廣泛的應用。數字化激發(fā)數據庫市場潛力近年來,隨著數字經濟的蓬勃發(fā)展和數字化轉型的深入推進,各行各業(yè)數字化轉型對國產數據庫的需求顯著增加,產業(yè)生態(tài)也在逐步建立和完善布局,行業(yè)發(fā)展基礎已初步搭建完成,市場環(huán)境的變動也給國產數據庫廠商帶來了諸多利好,國產數據庫的應用領域范圍和市場份額有望隨之進一步擴大,未來增長空間值得期待。數據庫國產化替代空間巨大很長一段時間以來,海外數據庫廠商在我國占據了絕大部分的市場份額。伴隨著我國數字經濟占比的逐年提高、數字基礎設施規(guī)模能級的大幅提升、數據資源體系的加快構建,各行各業(yè)對數字信息安全的重視程度不斷提高,國產化的替代意愿正在增強。同時國產數據庫產品在價格、性能、功能等方面都取得長足進步,基本具備了與國外產品同臺競爭的能力,應用領域也不再限于黨政、金融領域,開始廣泛拓展到電信、交通國產數據庫市場有望迎來新的發(fā)展窗口。行業(yè)技術實力積累整體增強在2013年之前,我國大多數公司主要使用美國企業(yè)的數據庫工具,其他國產數據庫也受到外國相關技術的支撐。近年41來,隨著互聯網的興起和快速發(fā)展,多種類型的數據呈爆發(fā)式增長,各種創(chuàng)新業(yè)務場景層出不窮,進而促進了供給端廠商技術和產品架構的持續(xù)創(chuàng)新。以華為公司為代表的一批國產數據庫廠商,重視基礎研究與根技術的創(chuàng)新投入,堅持自主獨立研發(fā),擁有對關鍵基礎設施行業(yè)應用的技術和人才儲備,國產數據庫廠商的整體技術實力得到了顯著提升。42六、國產數據庫發(fā)展基本判斷(一)國產數據庫技術路線收斂勢在必行通過對行業(yè)用戶、數據庫廠商、專家學者的深入調研,結合對國內外操作系統(tǒng)發(fā)展進程的對比研究分析,我們認為,在當前錯綜復雜的國際形勢下,資源過度分散、無效內耗競爭是國產數據庫難以與國外數據庫競爭、大規(guī)模應用的重要原因?,F階段有必要集中國家力量、集合行業(yè)資源,重點支持少數幾家國內領先的數據庫根社區(qū)推動技術收斂,短期內快速推進國產化替代、強化生態(tài)建設,持續(xù)推動中國標準和產業(yè)鏈出海參與全球競爭。(二)國產數據庫廠商應重視用戶的需求現階段很多客戶使用的數據庫還是以國外產品為主,換用國產數據庫產品則會面臨各種遷移和兼容性問題,客戶在進行應用遷移時普遍不愿花費額外的財力、人力進行應用改造,只想實現簡單便捷的無縫遷移,以減少數據遷移和運維成本??蛻魣鼍岸藭r效性要求倒逼數據庫廠商不斷提升產品兼容性能,提供異構數據庫的平滑遷移工具或者解決方案。(三)存算分離+多讀多寫成為發(fā)展新趨勢隨著數字化轉型的深入,很多行業(yè)用戶存在著大量云與互聯網業(yè)務場景,業(yè)務形態(tài)逐漸變化,業(yè)務動態(tài)性增強,這對基礎設施資源的靈活性和利用率提出了更高要求。在業(yè)務場景、硬件技術快速發(fā)展等多重因素的驅動下,國產數據廠商正逐步43解決當前存算一體架構存在的問題。因此,新型存算分離架構2-3算一體”向“存算分離”、由一寫多讀向多讀多寫架構演進。(四)開源是國產數據庫發(fā)展的有效路徑開源是當今基礎軟件在全球范圍內取得成功的最優(yōu)路徑,開源軟件商業(yè)化能力得到市場的正向反饋,因此開源將成為國通過將底層技術開源,可以吸引更多專業(yè)人員加入開發(fā)、測試、維護,這不僅可以降低廠商售后和服務的成本,還可以進一步提高數據庫軟件的質量,同時有利于構建生態(tài)。華為公司openGauss有望成為國內主流的數據庫技術路線之一,基于openGauss的商業(yè)版公司有望脫穎而出。44(一)內核創(chuàng)新研究,打造堅實數據底座openGauss11個研究所的上千名數據庫專家研究開發(fā)的一款數據庫產品,采用技術自立、發(fā)展獨立、長期演進的技術路線。openGauss圍繞內核高性能、高安全、1)高性能:基于NUMA-Aware架構優(yōu)化,多版本并發(fā)控制等技術大幅提升單機性能;自研In-placeUpdate引擎,采用原位更新和Undo空間統(tǒng)一分配機制,節(jié)約空間利用率。2)AZRTO<10s的業(yè)務恢復能力;引入Paxos分布式一致性協議,實現多地多中心的高可用能力;采用并行流水線解碼技術,支撐基于openGauss的單元化多活容災架構業(yè)界領先。高安全:率先在開源數據庫中提供可商用的全密態(tài)能力,實現一次加密,全程保密,對敏感數據提供強大的保護;實現庫內原生區(qū)塊鏈算法和多方共識技術,對于數據修改可追溯,防抵賴,實現數據真實可信。AI能力,為系統(tǒng)性能調優(yōu)、故障預測、系統(tǒng)運維提供高效助力;基于AI的優(yōu)化器ABO實現智能基數估計,貝葉斯網絡算法大幅提升多列基數估計準確度;DB4AI內置幾十種常見的ML算法和模型,并通過SQLAI能力,使用戶無障礙獲得AI訓練和推45理能力,實現會SQL就會用AI。(二)聯合產業(yè)資源,共建資源池化架構推出了基于資源池化架構的數據庫組件?8openGauss??‰!?fi?資源池化架構由計算池化層、內存池化層、存儲池化層組成,資源池化架構每層的功能劃分如下:存儲池化:對應組件化架構標準的存儲層,支持多種存儲,如分布式存儲、企業(yè)存儲、對象存儲,實現一份數據服務于多種計算。通過高效裸設備訪問,元數據共享,實現數據SQLNDP技術,大幅提SQLI/O流量。46內存池化:對應組件化架構標準的存儲引擎,實現計算節(jié)點間內存的互聯,通過同步事務信息和數據庫緩存,實現多節(jié)點下的多版本快照一致性讀能力,結合RoCESCM等Commit加速和大容量內存訪問等能力。X86TP行存加速、AP列存加速、AI訓練推理、向量數據庫等全方位的數據服務,實現多模融合,使用最佳的引擎滿足不同業(yè)務處理訴求。同時,openGauss推出數據全生命周期管理工具DataKit,發(fā)、智能運維的全場景數據管理功能。openGaussDataPod和openGaussDataKit為組件化架構標準提供了參考實現,通

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論