數(shù)據(jù)實時同步軟件行業(yè)發(fā)展基本情況_第1頁
數(shù)據(jù)實時同步軟件行業(yè)發(fā)展基本情況_第2頁
數(shù)據(jù)實時同步軟件行業(yè)發(fā)展基本情況_第3頁
數(shù)據(jù)實時同步軟件行業(yè)發(fā)展基本情況_第4頁
數(shù)據(jù)實時同步軟件行業(yè)發(fā)展基本情況_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)實時同步軟件行業(yè)發(fā)展基本情況數(shù)據(jù)庫行業(yè)背景及發(fā)展趨勢分析中國數(shù)據(jù)庫市場將迎來高增長態(tài)勢,首先是政策利好,國家大力支持國產(chǎn)數(shù)據(jù)庫廠商的發(fā)展;其次是需求拉動,國產(chǎn)化和數(shù)字化轉(zhuǎn)型帶動需求的爆發(fā)式增長;同時,供給端傳統(tǒng)、初創(chuàng)和跨界各類型廠商厚積薄發(fā),產(chǎn)品和技術經(jīng)歷了多年工程實踐的打磨走向成熟;此外,國內(nèi)企業(yè)對基礎軟件的付費意愿和IT支出占比在逐年提升,有利于市場的長期發(fā)展。未來,中國數(shù)據(jù)庫多場景現(xiàn)狀與融合需求長期并存,云數(shù)據(jù)庫(包括公有、非公有各種形式)成為主流;開源成為產(chǎn)業(yè)互聯(lián)網(wǎng)時代數(shù)據(jù)庫廠商的破局之刃;人工智能延伸DBA的能力半徑,優(yōu)化數(shù)據(jù)庫性能,是數(shù)據(jù)庫下一步發(fā)展的目標。數(shù)據(jù)庫領域的技術發(fā)展趨勢隨著數(shù)據(jù)庫發(fā)展進入后關系型階段,數(shù)據(jù)結(jié)構(gòu)也越來越多樣化,半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)占比不斷提升。對于數(shù)據(jù)結(jié)構(gòu)多樣但是每種數(shù)據(jù)存儲功能需求不高的用戶來說,不同的數(shù)據(jù)結(jié)構(gòu)采用不同數(shù)據(jù)庫存儲的話成本較高,使用也比較繁瑣。多模數(shù)據(jù)庫的出現(xiàn)滿足了靈活的數(shù)據(jù)存儲的管理需求,將各種類型的數(shù)據(jù)進行統(tǒng)一的管理,降低了運維和開發(fā)成本,是未來數(shù)據(jù)庫技術發(fā)展的趨勢。對于搜索引擎數(shù)據(jù)庫來說,多模型可能更加重要,能夠在不同的數(shù)據(jù)結(jié)構(gòu)中實現(xiàn)高精度的搜索是搜索引擎數(shù)據(jù)庫一直追求的目標;在大數(shù)據(jù)時代,傳統(tǒng)數(shù)據(jù)庫的業(yè)務能力逐漸無法滿足龐大的數(shù)據(jù)處理與分析需求,越來越多的數(shù)據(jù)庫廠商將人工智能技術融入到了數(shù)據(jù)庫領域,通過AI來使得數(shù)據(jù)庫實現(xiàn)計算和存儲資源的優(yōu)化、異常識別、數(shù)據(jù)可視化等功能,確保數(shù)據(jù)庫高效運行。在搜索引擎數(shù)據(jù)庫領域,機器學習算法也已經(jīng)得到了廣泛應用。Elasticsearch中現(xiàn)在已經(jīng)內(nèi)置了機器學習模塊,可以方便地實現(xiàn)可視化、數(shù)據(jù)分類、異常檢測等功能。近年來數(shù)據(jù)泄露等安全事件頻發(fā),以及數(shù)據(jù)上云的趨勢顯著,數(shù)據(jù)庫面臨的安全隱患也更加多樣,對數(shù)據(jù)庫的數(shù)據(jù)安全提出了挑戰(zhàn)。在我國信創(chuàng)產(chǎn)業(yè)發(fā)展的大趨勢下,數(shù)據(jù)庫的自主可控與安全更是重要的基礎。基于隱私計算和區(qū)塊鏈技術的數(shù)據(jù)庫產(chǎn)品是近期的發(fā)展方向,協(xié)助提升數(shù)據(jù)可信與安全。數(shù)據(jù)庫行業(yè)面臨的機遇與挑戰(zhàn)(一)數(shù)據(jù)庫行業(yè)面臨的機遇1、數(shù)據(jù)庫存量市場巨大根據(jù)信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告(2021年)》,2020年全球數(shù)據(jù)庫市場規(guī)模達到671億美元,其中中國數(shù)據(jù)庫市場規(guī)模為240.9億元,占比約5.2%,市場空間廣闊。新基建及國家信息化建設政策的不斷推進將有利于達夢數(shù)據(jù)的快速發(fā)展。達夢數(shù)據(jù)在產(chǎn)品成熟度、兼容性、遷移方法等多方面得到了大量用戶的認可,在參加的多次國產(chǎn)數(shù)據(jù)庫選型測試中均滿足了用戶對于系統(tǒng)功能、性能等多方面的要求。2、數(shù)據(jù)庫下游行業(yè)的高速發(fā)展在大數(shù)據(jù)和5G通信技術迅猛發(fā)展的背景下,數(shù)據(jù)傳輸速率大幅提升,越來越多的數(shù)據(jù)密集型應用應運而生。人們需要面對的數(shù)據(jù)結(jié)構(gòu)愈發(fā)復雜,需要存儲和處理的數(shù)據(jù)量也愈發(fā)增多。根據(jù)信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告(2021年)》,預計到2025年,全球數(shù)據(jù)庫市場規(guī)模將達到798億美元,其中中國數(shù)據(jù)庫市場總規(guī)模將達到688億元,年復合增長率為23.4%。在海量復雜數(shù)據(jù)的存儲、調(diào)用、處理和分析等工作中,數(shù)據(jù)庫管理系統(tǒng)軟件扮演著不可或缺的重要角色。在未來,數(shù)據(jù)庫行業(yè)的市場空間仍較為廣闊,數(shù)據(jù)量的增加和數(shù)據(jù)復雜度的提升將驅(qū)動數(shù)據(jù)庫市場的長期快速發(fā)展。3、數(shù)據(jù)庫國家產(chǎn)業(yè)政策利好為了促進國產(chǎn)軟件行業(yè)更快更好發(fā)展,國家頒布了《十四五國家信息化規(guī)劃》《十四五推進國家信息化規(guī)劃》《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》《新時期促進集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策》等一系列法規(guī)和政策,兩次修訂《著作權法》和《計算機軟件保護條例》,對各行業(yè)信息化建設的總體部署、主攻方向、重大任務和重點工程、優(yōu)先行動、組織實施;信息化的總體要求與任務;稅收、投資、收入分配、人才吸引與培養(yǎng)、產(chǎn)業(yè)技術開發(fā)、行業(yè)組織與管理和知識產(chǎn)權保護等多個方面給予政策保障和支持。國家產(chǎn)業(yè)政策為國產(chǎn)數(shù)據(jù)庫行業(yè)未來的發(fā)展營造了良好的環(huán)境。在新基建及信息化安全產(chǎn)業(yè)政策的大背景下,預計基礎軟件行業(yè)將在未來3-5年保持快速發(fā)展。4、數(shù)據(jù)庫信息安全重要性提高在大數(shù)據(jù)與人工智能時代,數(shù)據(jù)庫軟件已經(jīng)深入滲透到關乎國計民生的各行各業(yè),成為生產(chǎn)生活不可或缺的基礎設施。而在當前日益復雜的國際局勢下,政府、金融等關鍵領域的信息安全對國家而言至關重要。近年來國際發(fā)生了數(shù)次重大信息安全事件,為防范信息泄露風險,關鍵的政、商等領域使用的數(shù)據(jù)庫產(chǎn)品必須具備極高的安全性。(二)數(shù)據(jù)庫行業(yè)面臨的挑戰(zhàn)1、數(shù)據(jù)庫軟件領域高端人才稀缺人力成本高企行業(yè)屬于軟件和信息技術服務業(yè),為技術和人才高度密集型產(chǎn)業(yè),人力成本較高。行業(yè)內(nèi)人才的專業(yè)素質(zhì)和技術水平是影響企業(yè)市場競爭力的關鍵因素,而受限于國內(nèi)數(shù)據(jù)庫行業(yè)起步較晚,數(shù)據(jù)庫技術的專業(yè)人才仍存在較大的缺口。當前,行業(yè)研發(fā)人才儲備模式主要還是以校園招聘與內(nèi)部培養(yǎng)為主,人才儲備數(shù)量與質(zhì)量均存在不足。在分布式數(shù)據(jù)庫、云數(shù)據(jù)庫等新興先進數(shù)據(jù)庫技術不斷加速發(fā)展的背景下,行業(yè)未來需要進一步完善人才培養(yǎng)機制,建立健全人才招聘網(wǎng)絡,更多引入在數(shù)據(jù)庫、存儲、操作系統(tǒng)等領域的頂尖人才,也因此面對著人力成本與資金壓力的挑戰(zhàn)。2、互聯(lián)網(wǎng)科技巨頭加速布局數(shù)據(jù)庫產(chǎn)業(yè)近年來,國內(nèi)互聯(lián)網(wǎng)科技巨頭紛紛加速布局數(shù)據(jù)庫產(chǎn)業(yè),借助云計算優(yōu)勢進行相關數(shù)據(jù)庫服務的研發(fā)。2010年,螞蟻金服正式推出自主研發(fā)的金融級分布式關系型數(shù)據(jù)庫OceanBase;2017年,阿里云推出自研關系型云數(shù)據(jù)庫PolarDB;華為在2019年5月發(fā)布了企業(yè)級AI-Native數(shù)據(jù)庫GaussDB;騰訊云于2020年宣布將原TDSQL、CynosDB、TBase三個數(shù)據(jù)庫品牌整合升級為統(tǒng)一的企業(yè)級分布式數(shù)據(jù)庫TDSQL。互聯(lián)網(wǎng)企業(yè),特別是云計算巨頭,通過把握公有云平臺入口,控制數(shù)據(jù)庫服務流量,結(jié)合云計算巨頭自身的低成本自研/開源產(chǎn)品,對傳統(tǒng)數(shù)據(jù)庫產(chǎn)品構(gòu)成了強勁競爭。針對這一挑戰(zhàn),作為獨立數(shù)據(jù)庫產(chǎn)品提供商的達夢,采取多云、跨云策略,可在多種云平臺中提供達夢數(shù)據(jù)庫服務,有效避免平臺綁定,為用戶提供多種選擇。3、數(shù)據(jù)庫產(chǎn)品技術仍需持續(xù)發(fā)展改進國外數(shù)據(jù)庫產(chǎn)品應用場景豐富,尤其在高端場景的應用廣度和深度上仍有優(yōu)勢。基于龐大的客戶基數(shù)與運行時間所積累的技術改進與運維經(jīng)驗也是其數(shù)據(jù)庫軟件產(chǎn)品性能得以不斷迭代、改進的重要因素。數(shù)據(jù)庫行業(yè)未來發(fā)展趨勢(一)市場規(guī)模持續(xù)擴大,數(shù)據(jù)庫行業(yè)需求具備成長空間根據(jù)信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告(2021年)》,2020年全球數(shù)據(jù)庫市場規(guī)模達到671億美元,其中中國數(shù)據(jù)庫市場規(guī)模為240.9億元,占比約5.2%,市場空間廣闊。預計到2025年,全球數(shù)據(jù)庫市場規(guī)模將達到798億美元,其中中國數(shù)據(jù)庫市場總規(guī)模將達到688億元,年復合增長率為23.4%。伴隨著數(shù)據(jù)規(guī)模的高速增長,全球數(shù)據(jù)庫市場增長迅速,整體市場空間巨大。(二)信息安全備受重視,數(shù)據(jù)庫國產(chǎn)率顯著提升長期以來,以Intel、Microsoft、Apple、Oracle、IBM、Qualcomm、Google、Cisco等國際巨頭為首的國外IT廠商在操作系統(tǒng)、數(shù)據(jù)庫、芯片、服務器、辦公軟件、智能終端等領域占據(jù)了市場的較大份額,深入了政府、海關、郵政、金融、鐵路、民航、醫(yī)療等各行業(yè)環(huán)節(jié)。與此同時,近年來信息泄露事件層出不窮,信息安全和供應鏈安全越來越得到國家、公眾的重視。為保證信息安全,信息化安全建設勢在必行。從整體IT產(chǎn)業(yè)鏈來看,我國數(shù)據(jù)庫產(chǎn)業(yè)屬于較具競爭力的一環(huán),初步邁向好用階段。從技術水平來看,經(jīng)過多年的研發(fā)和實踐,國產(chǎn)數(shù)據(jù)庫已經(jīng)走過了學習摸索的階段,進入到了服務市場乃至引領創(chuàng)新的全新階段,在集群技術、安全技術、分布式技術等領域取得了顯著進展。從市場收入來看,國產(chǎn)廠商近年來得到快速發(fā)展。據(jù)賽迪顧問數(shù)據(jù),2011年主要中國數(shù)據(jù)庫廠商市場收入總和僅1.56億元,而2020年主要中國數(shù)據(jù)庫廠商市場收入已達到16.43億元,增長逾10倍。(三)事務和分析齊頭并重,數(shù)據(jù)庫生態(tài)呈多樣性發(fā)展在數(shù)據(jù)量爆炸式增長的大數(shù)據(jù)時代,數(shù)據(jù)存儲結(jié)構(gòu)也越來越靈活多樣。日益變革的新興業(yè)務不斷催生了愈發(fā)豐富的數(shù)據(jù)庫技術和產(chǎn)品形態(tài)需求。這些變化對現(xiàn)有的聯(lián)機事務處理(OLTP)與聯(lián)機分析處理(OLAP)涇渭分明的架構(gòu)提出了挑戰(zhàn)。傳統(tǒng)架構(gòu)下,企業(yè)通常選擇建立、維護不同數(shù)據(jù)庫以便支持兩類不同的任務。其管理和維護成本往往較高,且在OLTP與OLAP系統(tǒng)間也存在較大的數(shù)據(jù)延遲,企業(yè)難以開展敏捷、實時的數(shù)據(jù)商業(yè)分析活動。因此,能夠統(tǒng)一支持OLTP和OLAP的數(shù)據(jù)庫成為了眾多企業(yè)的需求。目前,產(chǎn)業(yè)界正基于創(chuàng)新的計算存儲框架研發(fā)HTAP數(shù)據(jù)庫,通過實現(xiàn)基于同一引擎同時支撐業(yè)務系統(tǒng)運行和分析決策場景的功能,避免傳統(tǒng)架構(gòu)中在線與離線數(shù)據(jù)庫之間大量的數(shù)據(jù)交互,提升信息化系統(tǒng)的整體性能。(四)AI技術發(fā)展迅速,數(shù)據(jù)庫智能化程度逐步提升面對大規(guī)模數(shù)據(jù)和不同的應用場景,傳統(tǒng)數(shù)據(jù)庫組件存在業(yè)務類型不敏感、查詢優(yōu)化能力弱等問題。目前有研究通過將機器學習算法替代傳統(tǒng)數(shù)據(jù)庫組件的方式以實現(xiàn)更高的查詢和存儲效率并自動化處理各種任務,例如自動管理計算與存儲資源、自動防范惡意訪問與攻擊、主動實現(xiàn)數(shù)據(jù)庫智能調(diào)優(yōu)等。機器學習算法可以分析大量數(shù)據(jù)記錄,標記異常值和異常模式,幫助企業(yè)提高安全性,防范入侵者破壞,還可以在系統(tǒng)運行時自動、連續(xù)、無人工干預地執(zhí)行修補、調(diào)優(yōu)、備份和升級操作,盡可能減少人為錯誤或惡意行為,確保數(shù)據(jù)庫高效運行、安全無失。(五)云計算成為新一代IT基礎設施,云原生數(shù)據(jù)庫得到發(fā)展在云計算技術的不斷發(fā)展催生出將數(shù)據(jù)庫部署在云上的需求后,通過云服務形式提供數(shù)據(jù)庫功能的云數(shù)據(jù)庫應運而生。與傳統(tǒng)數(shù)據(jù)中心采用的物理服務器、物理網(wǎng)絡、物理存儲設施不同,云計算環(huán)境下普遍采用基于容器化、微服務、Serverless等理念進行基礎設施的架構(gòu),對數(shù)據(jù)庫的運行環(huán)境假定提出了挑戰(zhàn)。云原生數(shù)據(jù)庫技術以云化運行環(huán)境為前提,在設計上通常結(jié)合分布式技術并普遍采用計算存儲分離、日志即數(shù)據(jù)的設計思想,能夠靈活調(diào)動資源進行擴縮容,可進一步實現(xiàn)資源池化、彈性變配、集約運維等能力,以應對更便捷、更低門檻實現(xiàn)云上數(shù)字化轉(zhuǎn)型與升級的挑戰(zhàn)。(六)開源與非開源數(shù)據(jù)庫共存,形成市場互補態(tài)勢開源數(shù)據(jù)庫通常是免費的社區(qū)數(shù)據(jù)庫,其源代碼對外開放,開發(fā)人員可以在其原始設計基礎上修改或使用。它以較低的成本、豐富的產(chǎn)品和活躍的社區(qū)支持為日益復雜的企業(yè)需求提供了相應的解決方案。開源數(shù)據(jù)庫雖然避免了高昂的授權費用和服務費用,但在易用性、配套能力、服務能力、版本更新方面往往存在一定的缺陷,從而增加了額外成本和使用風險。對于大型企業(yè)用戶,非開源商業(yè)數(shù)據(jù)庫廠商在知識產(chǎn)權、信息安全、產(chǎn)品功能完善度、代碼理解程度、技術服務水平等方面具有更大的優(yōu)勢。未來一段時間內(nèi),開源數(shù)據(jù)庫和非開源數(shù)據(jù)庫在市場上將面向不同用戶群體,形成市場互補態(tài)勢。數(shù)據(jù)庫市場方興未艾,關系型數(shù)據(jù)庫仍為主流關系型數(shù)據(jù)庫占據(jù)數(shù)據(jù)庫市場絕對主流,搜索引擎數(shù)據(jù)庫份額較低。從全球范圍來看,關系型數(shù)據(jù)庫仍是目前的主流市場。根據(jù)DB-Engines統(tǒng)計,關系型數(shù)據(jù)庫流行度占比高達71.3%,非關系型數(shù)據(jù)庫僅為28.7%,其中搜索引擎數(shù)據(jù)庫占4.6%。所有數(shù)據(jù)庫綜合排名TOP10中有7家為關系型數(shù)據(jù)庫。從中國范圍來看,目前我國數(shù)據(jù)庫產(chǎn)品數(shù)量分布呈現(xiàn)以關系型為主,非關系型數(shù)據(jù)庫為輔的局面。根據(jù)墨天輪統(tǒng)計,截至2022年11月,我國數(shù)據(jù)庫產(chǎn)品中有關系型數(shù)據(jù)庫159個,非關系型數(shù)據(jù)庫87個,其中流行度排名前十的全部是關系型數(shù)據(jù)庫。國產(chǎn)搜索引擎數(shù)據(jù)庫產(chǎn)品僅有兩款。數(shù)據(jù)庫管理系統(tǒng)市場持續(xù)加快增長。據(jù)Gartner報告顯示,2021年全球數(shù)據(jù)庫管理系統(tǒng)市場收入接近800億美元,相比2020年增加了145億美元,同比增速達到22.3%,2020年這個數(shù)字是19%,市場規(guī)模正在加速增長。據(jù)統(tǒng)計,數(shù)據(jù)庫管理系統(tǒng)市場已連續(xù)六年實現(xiàn)增長,自2017年以來,市場規(guī)模已經(jīng)翻了一倍,四年的年復合增長率達到19.7%。非關系型數(shù)據(jù)庫市場規(guī)模增速顯著高于整體市場,收入占比逐年提升,互聯(lián)網(wǎng)廠商占據(jù)較大市場份額。據(jù)Gartner統(tǒng)計,2021年全球非關系型數(shù)據(jù)庫管理系統(tǒng)的收入達到148億美元,約占全球數(shù)據(jù)庫管理系統(tǒng)總收入的19%,在2017年時該占比僅為8%,五年內(nèi)占比也翻了一倍。其中純非關系型數(shù)據(jù)庫管理系統(tǒng)廠商(Aerospike,Couchbase,Neo4j,MongoDB等8家)的收入達到23億美元,大部分收入仍來自于互聯(lián)網(wǎng)廠商的非關系型數(shù)據(jù)庫產(chǎn)品,其中亞馬遜的非關系型數(shù)據(jù)庫收入達到64億美元,占據(jù)非關系型數(shù)據(jù)庫總收入的43.2%,谷歌的非關系型數(shù)據(jù)庫收入達到28億美元,占非關系型數(shù)據(jù)庫總收入的18.6%。中國數(shù)據(jù)庫市場規(guī)模增速較快,國產(chǎn)化率有望提升。據(jù)中國信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告2021》統(tǒng)計,2025年中國的數(shù)據(jù)庫市場規(guī)模將達到688億元,5年年復合增長率達23.4%。目前,海外巨頭仍占據(jù)國內(nèi)數(shù)據(jù)庫市場較大份額,但國產(chǎn)數(shù)據(jù)庫經(jīng)歷多年沉淀,已經(jīng)具備初步競爭力。據(jù)《中國信創(chuàng)產(chǎn)業(yè)發(fā)展報告2021》統(tǒng)計,2020年數(shù)據(jù)庫國產(chǎn)化率已達47.4%。根據(jù)IDC統(tǒng)計,目前華為、達夢、人大金倉、阿里云等國產(chǎn)數(shù)據(jù)庫軟件已經(jīng)在市場中占有一定份額,未來隨著國產(chǎn)數(shù)據(jù)庫技術不斷提升,數(shù)據(jù)庫國產(chǎn)化率有望進一步擴張。從行業(yè)來看,2021年在國內(nèi)數(shù)據(jù)庫市場份額中占比最高的是金融行業(yè),達到了20.2%,其辦公系統(tǒng)和一般系統(tǒng)使用我國數(shù)據(jù)庫產(chǎn)品的機構(gòu)數(shù)量已經(jīng)超過40%。搜索引擎數(shù)據(jù)庫簡介搜索引擎數(shù)據(jù)庫是一類專門用于數(shù)據(jù)內(nèi)容搜索的NoSQL數(shù)據(jù)庫,是非結(jié)構(gòu)化大數(shù)據(jù)處理分析領域中重要的基礎支撐軟件。在數(shù)據(jù)爆炸式增長的當下,非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)成為了全球數(shù)據(jù)量的主要來源。非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)復雜,沒有預定義的數(shù)據(jù)模型,不方便用傳統(tǒng)的數(shù)據(jù)庫二維邏輯來表現(xiàn),但卻蘊含著巨量的價值信息,如何高效地處理分析非結(jié)構(gòu)化數(shù)據(jù)是數(shù)據(jù)庫領域面臨的機遇和挑戰(zhàn)。在這樣的時代背景下,搜索引擎數(shù)據(jù)庫的概念逐漸發(fā)展起來。它可以提供快速的數(shù)據(jù)檢索服務,是搜索引擎系統(tǒng)的底層支撐。而常見的谷歌、百度等是搜索引擎,它的概念更加寬泛,不僅涵蓋搜索引擎數(shù)據(jù)庫,還包含了爬蟲、網(wǎng)頁權重計算、檢索詞糾錯、知識圖譜和個性化推薦等模塊。搜索引擎數(shù)據(jù)庫的應用廣泛。搜索引擎數(shù)據(jù)庫早期又稱全文數(shù)據(jù)庫、非結(jié)構(gòu)化數(shù)據(jù)庫等,因為搜索引擎數(shù)據(jù)庫誕生的初期主要是解決關系型數(shù)據(jù)庫中長文本檢索效率低下的問題而誕生的,但是隨著技術的發(fā)展,目前的搜索引擎數(shù)據(jù)庫已經(jīng)不僅僅可以處理長文本數(shù)據(jù),也可以處理常見的數(shù)值、日期等結(jié)構(gòu)化數(shù)據(jù),還可以處理IP、地理位置信息、圖片、音視頻等非結(jié)構(gòu)化數(shù)據(jù)。憑借在數(shù)據(jù)查詢效率方面的優(yōu)勢,搜索引擎數(shù)據(jù)庫在數(shù)據(jù)處理方面的地位越來越高,并在應用程序搜索、網(wǎng)站搜索、企業(yè)搜索、智能問答、圖像與語音搜索、語義搜索、業(yè)務分析和安全分析等方面有著廣泛的應用。搜索引擎數(shù)據(jù)庫伴隨著搜索引擎的發(fā)展而發(fā)展。互聯(lián)網(wǎng)上第一個真正意義的搜索引擎是由蒙特利爾大學學生AlanEmtage于1990年開發(fā)的Archie,開創(chuàng)了現(xiàn)代搜索引擎領域。雖然當時WorldWideWeb還未出現(xiàn),但網(wǎng)絡中文件傳輸已經(jīng)相當頻繁,而這一搜索引擎用于FTP服務器上的文件。1995年,全文檢索引擎AltaVista推出,迅速成為當時最受歡迎的搜索引擎;同年,中國公司易寶北信推出了全文檢索數(shù)據(jù)庫TRSDatabaseServer,隨后獲得了國家科技進步二等獎。1997年Google、2001年百度搜索引擎相繼問世,DougCutting開發(fā)的開源全文索引引擎Lucene加入了Apache基金會,為后續(xù)多個搜索引擎數(shù)據(jù)庫的誕生提供了基礎,Solr、Elasticsearch等常用的搜索引擎數(shù)據(jù)庫都是基于Lucene開發(fā)的。Elastic公司于2011年成立,之后迅速成為全球領先的搜索引擎數(shù)據(jù)庫廠商,并于2018年上市。國內(nèi)廠商星環(huán)科技于2020年發(fā)布了新一代搜索引擎NewSearch,并在2021年更名為Scope。搜索引擎數(shù)據(jù)庫關注度正在提升。2022年11月17日,中國信通院組織召開了搜索型數(shù)據(jù)庫技術研討會,會議重點討論了搜索型數(shù)據(jù)庫的市場前景、技術趨勢、應用場景、發(fā)展態(tài)勢等議題,專家們認為我國在搜索型數(shù)據(jù)庫領域存在取得全球領先地位的可能性,同時搜索型數(shù)據(jù)庫的數(shù)據(jù)安全問題日益受到業(yè)界的關注。在信創(chuàng)產(chǎn)業(yè)發(fā)展的大背景下,我國關系型數(shù)據(jù)庫的發(fā)展如火如荼,已有多款關系型數(shù)據(jù)庫產(chǎn)品入選了國家信創(chuàng)產(chǎn)品目錄,一些產(chǎn)品性能已經(jīng)達到國際領先水平,但是搜索引擎數(shù)據(jù)庫領域的發(fā)展仍較為滯后。隨著信創(chuàng)政策不斷推進,搜索引擎數(shù)據(jù)庫作為高效處理非結(jié)構(gòu)化數(shù)據(jù)的基礎軟件,關注度正在逐步提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論