數(shù)據(jù)庫生態(tài)工具行業(yè)發(fā)展概況_第1頁
數(shù)據(jù)庫生態(tài)工具行業(yè)發(fā)展概況_第2頁
數(shù)據(jù)庫生態(tài)工具行業(yè)發(fā)展概況_第3頁
數(shù)據(jù)庫生態(tài)工具行業(yè)發(fā)展概況_第4頁
數(shù)據(jù)庫生態(tài)工具行業(yè)發(fā)展概況_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)庫生態(tài)工具行業(yè)發(fā)展概況數(shù)據(jù)庫行業(yè)潛力空間廣闊中國數(shù)據(jù)庫市場規(guī)??焖僭鲩L。根據(jù)賽迪顧問,2021年中國數(shù)據(jù)庫管理系統(tǒng)市場保持快速增長,規(guī)模達(dá)到223.5億元。賽迪顧問預(yù)測,中國數(shù)據(jù)庫市場十四五時期仍將保持高速增長,伴隨新冠疫情影響因素緩解,行業(yè)信息化需求有望逐步釋放,同時新基建、東數(shù)西算等國家級工程也會促進(jìn)數(shù)據(jù)庫市場規(guī)模不斷增長,預(yù)計(jì)2025年中國數(shù)據(jù)庫市場規(guī)模將達(dá)到600.6億元。金融政府互聯(lián)網(wǎng)和運(yùn)營商是數(shù)據(jù)庫主要下游市場。從行業(yè)結(jié)構(gòu)來看,金融行業(yè)2021年信息化建設(shè)提速,是銷售占比最高的市場。受益于政府信息化建設(shè)及信息技術(shù)應(yīng)用創(chuàng)新在政府市場的率先推廣,政府市場成為銷售額占比第二?;ヂ?lián)網(wǎng)、運(yùn)營商、能源也是數(shù)據(jù)庫主要市場。另外,交通、制造行業(yè)市場的增速也均高于市場平均水平,行業(yè)數(shù)字化轉(zhuǎn)型的快速展開帶動了市場需求的增加。數(shù)據(jù)庫管理行業(yè)發(fā)展情況及發(fā)展趨勢(一)數(shù)據(jù)庫管理系統(tǒng)概述數(shù)據(jù)庫管理系統(tǒng)是按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲和管理數(shù)據(jù)的倉庫,是一種用于建立、使用、操縱和管理數(shù)據(jù)庫的大型基礎(chǔ)軟件,既是業(yè)務(wù)數(shù)據(jù)的存儲中心,也是統(tǒng)計(jì)分析計(jì)算的基礎(chǔ),對IT核心系統(tǒng)起著關(guān)鍵性作用,是信息化時代、大數(shù)據(jù)時代中各行各業(yè)不可或缺的重要基礎(chǔ)軟件。按其管理的數(shù)據(jù)結(jié)構(gòu),可分為關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫(NoSQL,包括鍵值型、文檔型、圖、對象型等);按其設(shè)計(jì)架構(gòu)可分為集中式數(shù)據(jù)庫和分布式數(shù)據(jù)庫;按其部署模式可分為本地?cái)?shù)據(jù)庫和云數(shù)據(jù)庫;按其應(yīng)用場景可分為OLTP事務(wù)型數(shù)據(jù)庫、OLAP分析型數(shù)據(jù)庫、HTAP混合型數(shù)據(jù)庫;按其存儲介質(zhì)可分為磁盤數(shù)據(jù)庫和內(nèi)存數(shù)據(jù)庫;按其商業(yè)模式可分為商業(yè)數(shù)據(jù)庫和非商業(yè)數(shù)據(jù)庫。關(guān)系型數(shù)據(jù)庫是目前應(yīng)用最廣泛、最成熟的數(shù)據(jù)庫類型,它是建立在關(guān)系模型基礎(chǔ)上的數(shù)據(jù)庫,相對其他非關(guān)系型數(shù)據(jù)庫有易理解、高度通用、生態(tài)成熟等優(yōu)勢。隨著互聯(lián)網(wǎng)、移動網(wǎng)絡(luò)、大數(shù)據(jù)等新技術(shù)、新業(yè)態(tài)的發(fā)展,為應(yīng)對更多樣、更敏捷的信息處理需求,以及更大規(guī)模、更大容量的數(shù)據(jù)訪問和存儲需求,非關(guān)系型數(shù)據(jù)庫、分布式數(shù)據(jù)庫、HTAP混合負(fù)載、云數(shù)據(jù)庫等逐漸興起,與現(xiàn)有關(guān)系型數(shù)據(jù)庫形成了良好的市場互補(bǔ)關(guān)系。目前,國際主流的數(shù)據(jù)庫廠商有Oracle、微軟、IBM、MongoDB、亞馬遜、谷歌等。從2000年前后,我國開始陸續(xù)出現(xiàn)商業(yè)數(shù)據(jù)庫廠商,其主要代表有達(dá)夢數(shù)據(jù)、人大金倉、神舟通用、通用數(shù)據(jù)等。近年來,國內(nèi)互聯(lián)網(wǎng)、通信科技巨頭華為、騰訊、阿里等企業(yè)也紛紛加速布局?jǐn)?shù)據(jù)庫產(chǎn)業(yè),借助云計(jì)算優(yōu)勢進(jìn)行相關(guān)數(shù)據(jù)庫服務(wù)的研發(fā)。(二)數(shù)據(jù)庫管理上下游行業(yè)概況數(shù)據(jù)庫軟件作為基礎(chǔ)軟件,其上游主要是CPU芯片、服務(wù)器主機(jī)、存儲設(shè)備、操作系統(tǒng)等基礎(chǔ)軟硬件行業(yè)。目前國內(nèi)市場上除IBMPower小型機(jī),以及Intel、AMD等主要國際PC服務(wù)器生態(tài)體系外,眾多國產(chǎn)生態(tài)體系也走在快速發(fā)展的路上。其中CPU主要包括飛騰、龍芯、申威、鯤鵬、海光、兆芯等品牌,服務(wù)器主要包括浪潮、長城、曙光、聯(lián)想等品牌,操作系統(tǒng)則有麒麟軟件、統(tǒng)信軟件等廠商。達(dá)夢數(shù)據(jù)庫與相關(guān)國內(nèi)外上游計(jì)算生態(tài)企業(yè)有著良好合作關(guān)系,能夠提供經(jīng)過良好兼容優(yōu)化的各類數(shù)據(jù)產(chǎn)品。此外,在上游存儲設(shè)備領(lǐng)域,達(dá)夢也與宏杉、H3C、華為、浪潮、曙光、長城、聯(lián)想、EMC等主流廠商的存儲產(chǎn)品具有良好的兼容適配性。數(shù)據(jù)庫軟件的下游主要為應(yīng)用軟件開發(fā)業(yè),既包括傳統(tǒng)信息化應(yīng)用,如電子商務(wù)、企業(yè)ERP、財(cái)務(wù)管理、工業(yè)生產(chǎn)控制等,也包括新型的應(yīng)用如大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等。數(shù)據(jù)庫軟件作為信息化系統(tǒng)中不可或缺的組成部分,廣泛覆蓋政府、金融、能源、教育、交通等大多數(shù)涉及國計(jì)民生的領(lǐng)域。目前我國應(yīng)用軟件產(chǎn)業(yè)整體發(fā)展較為成熟,在各行業(yè)領(lǐng)域擁有豐富的產(chǎn)品供給,形成了大量行業(yè)獨(dú)立應(yīng)用軟件開發(fā)商(ISV)。ISV是達(dá)夢數(shù)據(jù)庫與用戶的重要橋梁,承擔(dān)著數(shù)據(jù)庫的應(yīng)用和集成工作。達(dá)夢數(shù)據(jù)與眾多行業(yè)頭部ISV達(dá)成了良好的合作關(guān)系,完成了多個行業(yè)信息系統(tǒng)與達(dá)夢數(shù)據(jù)庫的兼容適配和優(yōu)化,并已經(jīng)實(shí)現(xiàn)了規(guī)?;瘧?yīng)用推廣。與ISV的合作將是達(dá)夢下游生態(tài)建設(shè)的持續(xù)投入方向。數(shù)據(jù)庫廠商競爭日趨激烈從全球范圍來看,頭部數(shù)據(jù)庫廠商屹立不倒,中下游廠商競爭激烈。根據(jù)Gartner發(fā)布的2011-2021年數(shù)據(jù)庫管理系統(tǒng)市場份額統(tǒng)計(jì)顯示,Oracle、微軟、AWS、IBM、SAP等頭部傳統(tǒng)數(shù)據(jù)庫廠商的市場排名基本穩(wěn)定。近年來隨著互聯(lián)網(wǎng)的不斷發(fā)展和云技術(shù)的興起,華為、阿里、谷歌、騰訊等互聯(lián)網(wǎng)大廠也加入了數(shù)據(jù)庫市場的競爭中,依靠自身的資源優(yōu)勢迅速進(jìn)入了排名前列。隨著數(shù)字經(jīng)濟(jì)快速發(fā)展以及數(shù)據(jù)量的爆發(fā)式增長,新興數(shù)據(jù)庫廠商不斷涌現(xiàn),中下游廠商之間的競爭也愈發(fā)激烈,市場排名變動較為明顯。從中國范圍看,新數(shù)據(jù)庫產(chǎn)品加速涌現(xiàn),頭部廠商競爭仍然激烈。根據(jù)墨天輪統(tǒng)計(jì),2022年4月時共有205個國產(chǎn)數(shù)據(jù)庫產(chǎn)品參與排名,2022年11月這個數(shù)字增長到了246個。頭部數(shù)據(jù)庫產(chǎn)品之間的競爭也非常激烈,PingCAP旗下的TiDB長期位于國產(chǎn)數(shù)據(jù)庫榜首,其他數(shù)據(jù)庫產(chǎn)品的排名則變動明顯。中國數(shù)據(jù)庫領(lǐng)域暫未出現(xiàn)某幾個廠商獨(dú)大的現(xiàn)象。搜索引擎數(shù)據(jù)庫中Elasticsearch占據(jù)優(yōu)勢地位。根據(jù)DB-Engines數(shù)據(jù),2022年11月共有26款搜索引擎數(shù)據(jù)庫參與排名,Elasticsearch自2016年起就一直占據(jù)榜首地位,Splunk和Solr也一直居于前三名。排名中僅有兩款中國產(chǎn)品,一款為阿里云日志服務(wù),排名第19位,另一款為日志易,排名第24位。多模數(shù)據(jù)庫、人工智能、數(shù)據(jù)安全將成為未來數(shù)據(jù)庫領(lǐng)域的發(fā)展趨勢。隨著數(shù)據(jù)量的爆炸式增長,數(shù)據(jù)類型也愈發(fā)豐富多變,對數(shù)據(jù)庫的能力提出了挑戰(zhàn),數(shù)據(jù)庫技術(shù)也呈現(xiàn)出快速革新的趨勢。目前多模數(shù)據(jù)庫、人工智能和安全能力成為了數(shù)據(jù)庫領(lǐng)域的主要技術(shù)發(fā)展趨勢。數(shù)據(jù)庫是信創(chuàng)基礎(chǔ)軟件重要部分?jǐn)?shù)據(jù)庫是信創(chuàng)基礎(chǔ)軟件的重要部分,是信息系統(tǒng)的核心。我國信息技術(shù)軟硬件底層標(biāo)準(zhǔn)、架構(gòu)、產(chǎn)品、以及生態(tài)體系被外國把控,這些上游核心技術(shù)遭遇美國嚴(yán)重影響了我國關(guān)鍵科技和產(chǎn)業(yè)的發(fā)展。近年來,出臺多項(xiàng)信創(chuàng)相關(guān)的支持政策、指導(dǎo)意見,大力支持信創(chuàng)產(chǎn)業(yè)持續(xù)發(fā)展,努力實(shí)現(xiàn)。數(shù)據(jù)庫作為信息系統(tǒng)的核心,在計(jì)算機(jī)中承擔(dān)著承上啟下的重要作用,向下調(diào)用硬件基礎(chǔ)資源,向上是各種應(yīng)用軟件的重要支撐引擎。隨著我國數(shù)據(jù)經(jīng)濟(jì)的快速發(fā)展,數(shù)據(jù)量的快速提升,作為信創(chuàng)基礎(chǔ)軟件重要環(huán)節(jié)的國產(chǎn)數(shù)據(jù)庫將迎來重大機(jī)遇。通常意義上的數(shù)據(jù)庫即指數(shù)據(jù)庫系統(tǒng)(DatabaseSystem,簡稱DBS),由數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、應(yīng)用程序、管理員四部分組成。數(shù)據(jù)庫是指長期存儲在計(jì)算機(jī)內(nèi),有組織的、可共享的大量數(shù)據(jù)集合,包括數(shù)字、文字、圖像、音頻、視頻等數(shù)據(jù)形式。數(shù)據(jù)庫管理系統(tǒng)(DatabaseManagementSystem,簡稱DBMS)是位于用戶和操作系統(tǒng)之間的一層數(shù)據(jù)管理軟件,負(fù)責(zé)對數(shù)據(jù)進(jìn)行組織和存儲管理,以及獲取和維護(hù)數(shù)據(jù)。應(yīng)用程序是為了提高數(shù)據(jù)庫系統(tǒng)管理能力的軟件補(bǔ)充,并可以使數(shù)據(jù)管理過程更加直觀和友好,它負(fù)責(zé)連接、訪問和管理DBMS中存儲的數(shù)據(jù),允許用戶進(jìn)行增刪改減。管理員主要職責(zé)是運(yùn)維和管理數(shù)據(jù)庫管理系統(tǒng)。其中,DBMS是數(shù)據(jù)庫系統(tǒng)的基礎(chǔ)和核心。數(shù)據(jù)庫管理系統(tǒng)作為能夠使用戶定義、創(chuàng)建、維護(hù)和控制訪問數(shù)據(jù)庫的軟件系統(tǒng),其數(shù)據(jù)結(jié)構(gòu)和技術(shù)架構(gòu)不斷發(fā)展,呈現(xiàn)關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫并存、集中式與分布式并存的技術(shù)現(xiàn)狀。1)按數(shù)據(jù)結(jié)構(gòu)分為關(guān)系型和非關(guān)系型:關(guān)系型數(shù)據(jù)庫又稱為SQL數(shù)據(jù)庫,它建立在關(guān)系模型基礎(chǔ)上,取代了層次模型和網(wǎng)絡(luò)模型,以行和列的形式存儲數(shù)據(jù),以便于用戶理解。常見的Oracle、MySQL等數(shù)據(jù)庫均為關(guān)系型數(shù)據(jù)庫。非關(guān)系型數(shù)據(jù)庫也稱作NoSQL數(shù)據(jù)庫,采用不同于關(guān)系數(shù)據(jù)行列組織的數(shù)據(jù)模型,數(shù)據(jù)結(jié)構(gòu)類型復(fù)雜,是對傳統(tǒng)關(guān)系型數(shù)據(jù)庫的拓展與補(bǔ)充。搜索引擎數(shù)據(jù)庫就屬于非關(guān)系型數(shù)據(jù)庫。信創(chuàng)加速數(shù)據(jù)庫,搜索引擎數(shù)據(jù)庫空間廣闊國家多項(xiàng)政策促進(jìn)數(shù)據(jù)庫行業(yè)發(fā)展,信創(chuàng)推動國產(chǎn)數(shù)據(jù)庫加速替代。2018年,中興通訊被列入美國實(shí)體清單后,《科技日報》總結(jié)出了35項(xiàng)被外國的關(guān)鍵技術(shù),數(shù)據(jù)庫就是其中一項(xiàng)。預(yù)計(jì)未來國產(chǎn)數(shù)據(jù)庫在金融、能源、教育、電信等更多行業(yè)將加速落地,國產(chǎn)數(shù)據(jù)庫廠商迎來重大發(fā)展機(jī)遇。數(shù)字化轉(zhuǎn)型持續(xù)推進(jìn),搜索引擎數(shù)據(jù)庫的重要性逐漸提高。在信創(chuàng)產(chǎn)業(yè)政策的推動下,國產(chǎn)數(shù)據(jù)庫有望快速發(fā)展,但目前的主流仍是關(guān)系型數(shù)據(jù)庫,主要用于處理結(jié)構(gòu)化數(shù)據(jù),而非結(jié)構(gòu)化數(shù)據(jù)在日常業(yè)務(wù)中占據(jù)多數(shù),具有優(yōu)異全文搜索能力的搜索引擎數(shù)據(jù)庫的重要性愈發(fā)體現(xiàn)。隨著我國數(shù)字化轉(zhuǎn)型浪潮的進(jìn)一步推動與數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)的占比將越來越高,搜索引擎數(shù)據(jù)庫正成為非結(jié)構(gòu)化大數(shù)據(jù)處理分析領(lǐng)域中重要的基礎(chǔ)支撐軟件。目前國內(nèi)市場上占據(jù)主流的搜索引擎數(shù)據(jù)庫仍為Elasticsearch,亟需一款高效優(yōu)秀的國產(chǎn)搜索引擎數(shù)據(jù)庫作為。Elasticsearch安全風(fēng)險加劇,搜索引擎數(shù)據(jù)庫自主可控和迫在眉睫。在過去幾年內(nèi),Elasticsearch數(shù)據(jù)泄露事件頻發(fā),甚至一個月被曝6次數(shù)據(jù)泄露。2019年,2000萬條個人信息和稅務(wù)記錄通過Elasticsearch被泄露。2021年,Elasticsearch服務(wù)器再次發(fā)生泄露,超過8.7億條記錄或147GB個人信息數(shù)據(jù)在網(wǎng)上曝光。根據(jù)Group-IB報告顯示,2021年網(wǎng)絡(luò)上暴露的Elasticsearch實(shí)例超過10萬個,約占2021年暴露數(shù)據(jù)庫總數(shù)的30%。Elasticsearch數(shù)據(jù)泄露事件頻發(fā)給國內(nèi)各行業(yè)用戶敲響了數(shù)據(jù)安全的警鐘。同時,Elasticsearch在2021年更改了其開源協(xié)議,對其產(chǎn)品的許可協(xié)議增加了限制,也帶來了更多的商業(yè)風(fēng)險。對我國搜索引擎數(shù)據(jù)庫領(lǐng)域來說,自主可控和迫在眉睫。搜索引擎數(shù)據(jù)庫市場前景廣闊。對全球搜索引擎數(shù)據(jù)庫的市場規(guī)模進(jìn)行了簡單測算,根據(jù)Gartner預(yù)測,到2025年全球圖數(shù)據(jù)庫的市場規(guī)模將達(dá)到32億美元。根據(jù)DB-Engines數(shù)據(jù)庫類型流行度的占比,預(yù)計(jì)2025年全球搜索引擎數(shù)據(jù)庫市場規(guī)模將達(dá)到82億美元,整體數(shù)據(jù)庫市場規(guī)模將超過1700億美元。在假設(shè)中國搜索引擎數(shù)據(jù)庫市場占全球市場比例等于整體數(shù)據(jù)庫市場的情況下,預(yù)計(jì)2025年中國的搜索引擎數(shù)據(jù)庫市場將達(dá)到32億元,占全球搜索引擎數(shù)據(jù)庫市場的5.6%。數(shù)據(jù)庫領(lǐng)域的技術(shù)發(fā)展趨勢隨著數(shù)據(jù)庫發(fā)展進(jìn)入后關(guān)系型階段,數(shù)據(jù)結(jié)構(gòu)也越來越多樣化,半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)占比不斷提升。對于數(shù)據(jù)結(jié)構(gòu)多樣但是每種數(shù)據(jù)存儲功能需求不高的用戶來說,不同的數(shù)據(jù)結(jié)構(gòu)采用不同數(shù)據(jù)庫存儲的話成本較高,使用也比較繁瑣。多模數(shù)據(jù)庫的出現(xiàn)滿足了靈活的數(shù)據(jù)存儲的管理需求,將各種類型的數(shù)據(jù)進(jìn)行統(tǒng)一的管理,降低了運(yùn)維和開發(fā)成本,是未來數(shù)據(jù)庫技術(shù)發(fā)展的趨勢。對于搜索引擎數(shù)據(jù)庫來說,多模型可能更加重要,能夠在不同的數(shù)據(jù)結(jié)構(gòu)中實(shí)現(xiàn)高精度的搜索是搜索引擎數(shù)據(jù)庫一直追求的目標(biāo);在大數(shù)據(jù)時代,傳統(tǒng)數(shù)據(jù)庫的業(yè)務(wù)能力逐漸無法滿足龐大的數(shù)據(jù)處理與分析需求,越來越多的數(shù)據(jù)庫廠商將人工智能技術(shù)融入到了數(shù)據(jù)庫領(lǐng)域,通過AI來使得數(shù)據(jù)庫實(shí)現(xiàn)計(jì)算和存儲資源的優(yōu)化、異常識別、數(shù)據(jù)可視化等功能,確保數(shù)據(jù)庫高效運(yùn)行。在搜索引擎數(shù)據(jù)庫領(lǐng)域,機(jī)器學(xué)習(xí)算法也已經(jīng)得到了廣泛應(yīng)用。Elasticsearch中現(xiàn)在已經(jīng)內(nèi)置了機(jī)器學(xué)習(xí)模塊,可以方便地實(shí)現(xiàn)可視化、數(shù)據(jù)分類、異常檢測等功能。近年來數(shù)據(jù)泄露等安全事件頻發(fā),以及數(shù)據(jù)上云的趨勢顯著,數(shù)據(jù)庫面臨的安全隱患也更加多樣,對數(shù)據(jù)庫的數(shù)據(jù)安全提出了挑戰(zhàn)。在我國信創(chuàng)產(chǎn)業(yè)發(fā)展的大趨勢下,數(shù)據(jù)庫的自主可控與安全更是重要的基礎(chǔ)?;陔[私計(jì)算和區(qū)塊鏈技術(shù)的數(shù)據(jù)庫產(chǎn)品是近期的發(fā)展方向,協(xié)助提升數(shù)據(jù)可信與安全。數(shù)據(jù)庫行業(yè)發(fā)展趨勢數(shù)據(jù)庫誕生于20世紀(jì)60年代,經(jīng)歷近十年蝶變,到了70年代,IBM提出了商用的關(guān)系型數(shù)據(jù)庫,此后,這種商用數(shù)據(jù)庫經(jīng)過包括Honeywell、IBM、微軟等主流廠商的迭代更新,逐漸推廣于市場。隨著數(shù)據(jù)化趨勢的發(fā)展和大數(shù)據(jù)時代的到來,數(shù)據(jù)庫逐漸從燈光邊緣來到舞臺中心,成為了大數(shù)據(jù)時代最為重要的基礎(chǔ)設(shè)施之一。自商業(yè)化后,長期以來,商用關(guān)系型數(shù)據(jù)庫始終處于本地化部署階段,直到2010年以后,數(shù)據(jù)庫逐漸發(fā)展出了以下三大新趨勢:第一,數(shù)據(jù)庫的多元化。隨著人們的需求逐漸多元化,一些非關(guān)系型的數(shù)據(jù)庫得到了蓬勃發(fā)展,可以適應(yīng)更多應(yīng)用場景。第二,數(shù)據(jù)庫上云。隨著云技術(shù)、通訊和網(wǎng)絡(luò)技術(shù)的大發(fā)展,數(shù)據(jù)庫逐漸從本地部署向云上轉(zhuǎn)化。第三,數(shù)據(jù)庫的開源。最早的數(shù)據(jù)庫是以閉源為主,后來逐漸有更多開源的數(shù)據(jù)庫入場。數(shù)據(jù)庫分類依據(jù)包括數(shù)據(jù)結(jié)構(gòu)、部署方式、功能、架構(gòu)等。按照數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)庫可分為關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫等,關(guān)系型數(shù)據(jù)庫建立在關(guān)系模型上是多個關(guān)系(即二維表)的集合,非關(guān)系型數(shù)據(jù)庫采用鍵值、寬列、文檔、圖等結(jié)構(gòu)靈活存儲,滿足傳統(tǒng)關(guān)系型數(shù)據(jù)庫所無法覆蓋的場景。按照部署方式,數(shù)據(jù)庫可分為云數(shù)據(jù)庫和本地部署模式數(shù)據(jù)庫等。按照功能,業(yè)務(wù)系統(tǒng)的數(shù)據(jù)處理分為聯(lián)機(jī)事務(wù)處理(OLTP)與聯(lián)機(jī)分析處理(OLAP)兩類,OLTP對響應(yīng)時間和并發(fā)訪問量要求較高,OLAP則適用處理大量復(fù)雜數(shù)據(jù)。按照架構(gòu),數(shù)據(jù)庫可分為集中式、分布式等。從數(shù)據(jù)結(jié)構(gòu)來看,目前數(shù)據(jù)庫產(chǎn)品仍以關(guān)系型為主,非關(guān)系型產(chǎn)品發(fā)展迅速。根據(jù)DB-Engines的數(shù)據(jù)庫流行度趨勢,2013年至今排名前三名均為關(guān)系型數(shù)據(jù)庫。但非關(guān)系型數(shù)據(jù)庫產(chǎn)品得益于在互聯(lián)網(wǎng)、金融、公共衛(wèi)生、社交網(wǎng)絡(luò)等涉及復(fù)雜關(guān)系溯源、關(guān)系鏈條跟蹤等場景下的顯著優(yōu)勢,近年來也得到技術(shù)和市場的廣泛關(guān)注。搜索引擎數(shù)據(jù)庫簡介搜索引擎數(shù)據(jù)庫是一類專門用于數(shù)據(jù)內(nèi)容搜索的NoSQL數(shù)據(jù)庫,是非結(jié)構(gòu)化大數(shù)據(jù)處理分析領(lǐng)域中重要的基礎(chǔ)支撐軟件。在數(shù)據(jù)爆炸式增長的當(dāng)下,非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)成為了全球數(shù)據(jù)量的主要來源。非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)復(fù)雜,沒有預(yù)定義的數(shù)據(jù)模型,不方便用傳統(tǒng)的數(shù)據(jù)庫二維邏輯來表現(xiàn),但卻蘊(yùn)含著巨量的價值信息,如何高效地處理分析非結(jié)構(gòu)化數(shù)據(jù)是數(shù)據(jù)庫領(lǐng)域面臨的機(jī)遇和挑戰(zhàn)。在這樣的時代背景下,搜索引擎數(shù)據(jù)庫的概念逐漸發(fā)展起來。它可以提供快速的數(shù)據(jù)檢索服務(wù),是搜索引擎系統(tǒng)的底層支撐。而常見的谷歌、百度等是搜索引擎,它的概念更加寬泛,不僅涵蓋搜索引擎數(shù)據(jù)庫,還包含了爬蟲、網(wǎng)頁權(quán)重計(jì)算、檢索詞糾錯、知識圖譜和個性化推薦等模塊。搜索引擎數(shù)據(jù)庫的應(yīng)用廣泛。搜索引擎數(shù)據(jù)庫早期又稱全文數(shù)據(jù)庫、非結(jié)構(gòu)化數(shù)據(jù)庫等,因?yàn)樗阉饕鏀?shù)據(jù)庫誕生的初期主要是解決關(guān)系型數(shù)據(jù)庫中長文本檢索效率低下的問題而誕生的,但是隨著技術(shù)的發(fā)展,目前的搜索引擎數(shù)據(jù)庫已經(jīng)不僅僅可以處理長文本數(shù)據(jù),也可以處理常見的數(shù)值、日期等結(jié)構(gòu)化數(shù)據(jù),還可以處理IP、地理位置信息、圖片、音視頻等非結(jié)構(gòu)化數(shù)據(jù)。憑借在數(shù)據(jù)查詢效率方面的優(yōu)勢,搜索引擎數(shù)據(jù)庫在數(shù)據(jù)處理方面的地位越來越高,并在應(yīng)用程序搜索、網(wǎng)站搜索、企業(yè)搜索、智能問答、圖像與語音搜索、語義搜索、業(yè)務(wù)分析和安全分析等方面有著廣泛的應(yīng)用。搜索引擎數(shù)據(jù)庫伴隨著搜索引擎的發(fā)展而發(fā)展?;ヂ?lián)網(wǎng)上第一個真正意義的搜索引擎是由蒙特利爾大學(xué)學(xué)生AlanEmtage于19

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論