![數(shù)據(jù)庫未來發(fā)展趨勢(更新版)_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/bffc8702-5939-47db-a7d1-22b187a8f342/bffc8702-5939-47db-a7d1-22b187a8f3421.gif)
![數(shù)據(jù)庫未來發(fā)展趨勢(更新版)_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/bffc8702-5939-47db-a7d1-22b187a8f342/bffc8702-5939-47db-a7d1-22b187a8f3422.gif)
![數(shù)據(jù)庫未來發(fā)展趨勢(更新版)_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/bffc8702-5939-47db-a7d1-22b187a8f342/bffc8702-5939-47db-a7d1-22b187a8f3423.gif)
![數(shù)據(jù)庫未來發(fā)展趨勢(更新版)_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/bffc8702-5939-47db-a7d1-22b187a8f342/bffc8702-5939-47db-a7d1-22b187a8f3424.gif)
![數(shù)據(jù)庫未來發(fā)展趨勢(更新版)_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/bffc8702-5939-47db-a7d1-22b187a8f342/bffc8702-5939-47db-a7d1-22b187a8f3425.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、東華大學(xué)報(bào)告名稱:數(shù)據(jù)庫技術(shù)最新發(fā)展院: 業(yè): 名:t=r.號:指導(dǎo)老師:2015-12-101. 引言自從計(jì)算機(jī)問世以后,就有了處理數(shù)據(jù)、管理數(shù)據(jù)的需求,由此, 計(jì)算機(jī)技術(shù)新的研究分支數(shù)據(jù)庫技術(shù)應(yīng)運(yùn)而生。數(shù)據(jù)庫(Databases , 簡稱DB)是指長期保存在計(jì)算機(jī)的存儲設(shè)備上、并按照某種模型組 織起來的、可以被各種用戶或應(yīng)用共享的數(shù)據(jù)的集合。數(shù)據(jù)庫管理系統(tǒng)(Database Management Systems,簡稱DBMS 是指提供各種數(shù)據(jù) 管理服務(wù)的計(jì)算機(jī)軟件系統(tǒng),這種服務(wù)包括數(shù)據(jù)對象定義、數(shù)據(jù)存儲 與備份、數(shù)據(jù)訪問與更新、數(shù)據(jù)統(tǒng)計(jì)與分析、數(shù)據(jù)安全保護(hù)、數(shù)據(jù)庫 運(yùn)行管理以及數(shù)據(jù)庫建立和
2、維護(hù)等。從20隨著計(jì)算機(jī)應(yīng)用領(lǐng)域的不斷拓展和多媒體技術(shù)的發(fā)展,數(shù)據(jù)庫已 是計(jì)算機(jī)科學(xué)技術(shù)中發(fā)展最快、應(yīng)用最廣泛的重要分支之 世紀(jì)60年代末開始,數(shù)據(jù)庫系統(tǒng)已從第一代層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫, 第二代的關(guān)系數(shù)據(jù)庫系統(tǒng),發(fā)展到第三代以面向?qū)ο竽P蜑橹饕卣?的數(shù)據(jù)庫系統(tǒng)。關(guān)系數(shù)據(jù)庫理論和技術(shù)在7080年代得到長足的發(fā)展 和廣泛而有效地應(yīng)用,80年代,關(guān)系數(shù)據(jù)庫成為應(yīng)用的主流,幾乎所有新推出 的數(shù)據(jù)庫管理系統(tǒng)(DataBaseMa nageme ntSystemQBMS)產(chǎn)品都 是關(guān)系型的,他在計(jì)算機(jī)數(shù)據(jù)管理的發(fā)展史上是一個(gè)重要的里程碑, 這種數(shù)據(jù)庫具有數(shù)據(jù)結(jié)構(gòu)化、最低冗余度、較高的程序與數(shù)據(jù)獨(dú)立性、
3、 易于擴(kuò)充、易于編制應(yīng)用程序等優(yōu)點(diǎn),目前較大的信息系統(tǒng)都是建立 在關(guān)系數(shù)據(jù)庫系統(tǒng)理論設(shè)計(jì)之上的。但是,這些數(shù)據(jù)庫系統(tǒng)包括層次 數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫,不論其模型和技術(shù)上有何差別, 卻主要是面向和支持商業(yè)和事務(wù)處理應(yīng)用領(lǐng)域的數(shù)據(jù)管理。然而,隨提供的著用戶應(yīng)用需求的提高、硬件技術(shù)的發(fā)展和In ternet Intranet豐富多彩的多媒體交流方式,促進(jìn)了數(shù)據(jù)庫技術(shù)與網(wǎng)絡(luò)通信技術(shù)、人 工智能技術(shù)、面向?qū)ο蟪绦蛟O(shè)計(jì)技術(shù)、并行計(jì)算技術(shù)等相互滲透,互 相結(jié)合,成為當(dāng)前數(shù)據(jù)庫技術(shù)發(fā)展的主要特征,形成了數(shù)據(jù)庫新技術(shù)。目前,數(shù)據(jù)庫技術(shù)已相當(dāng)成熟,被廣泛應(yīng)用于各行各業(yè)中,成為現(xiàn)代 信息技術(shù)的重要組成部分,
4、是現(xiàn)代計(jì)算機(jī)信息系統(tǒng)和計(jì)算機(jī)應(yīng)用系統(tǒng)的基礎(chǔ)和核心02. 數(shù)據(jù)庫技術(shù)的發(fā)展歷程在數(shù)據(jù)庫系統(tǒng)出現(xiàn)以前,各個(gè)應(yīng)用擁有自己的專用數(shù)據(jù),通常存 放在專用文件中,這些數(shù)據(jù)與其他文件中數(shù)據(jù)有大量的重復(fù),造成了 資源與人力的浪費(fèi)。隨著機(jī)器內(nèi)存儲數(shù)據(jù)的日益增多,數(shù)據(jù)重復(fù)的問 題越來越突出。于是人們就想到將數(shù)據(jù)集中存儲、統(tǒng)一管理,這樣就 演變成數(shù)據(jù)庫管理系統(tǒng)而形成數(shù)據(jù)庫技術(shù)。數(shù)據(jù)庫的誕生以20世紀(jì)60年代IBM推出的數(shù)據(jù)庫管理產(chǎn)品IMS為 標(biāo)志。1969年IBM公司研制了基于層次模型數(shù)據(jù)庫管理系統(tǒng)IMS(In formation Man ageme ntSystem),并作為商品化軟件投入市場。數(shù)據(jù)庫的出現(xiàn),實(shí)現(xiàn)
5、了數(shù)據(jù)資源的整體管理。IMS系統(tǒng)的推出,使得 數(shù)據(jù)庫概念得到了普及,也使得人們認(rèn)識到數(shù)據(jù)的價(jià)值和統(tǒng)一管理的 必要性。由于IMS是將數(shù)據(jù)組織成層次的形式來管理,對非層次數(shù)據(jù) 使用虛擬紀(jì)錄,大量指針的使用降低了數(shù)據(jù)使用的效率,同時(shí),數(shù)據(jù)庫管理系統(tǒng)提供的數(shù)據(jù)模型機(jī)及數(shù)據(jù)庫語言比較低級,數(shù)據(jù)的獨(dú)立性 也比較差,給使用帶來了很大的局限性。為了克服這些缺點(diǎn),美國數(shù)據(jù)庫系統(tǒng)語言協(xié)會(CODASYL,即卩 Co nference On Data SystemLan guage)下屬的數(shù)據(jù)庫任務(wù)組(DBTG,即 DataBase Task Group )對數(shù)據(jù)庫的方法和技術(shù)進(jìn)行了系統(tǒng)研究,并提出了著名的DBTG
6、報(bào)告。該報(bào)告確定并建立了數(shù)據(jù)庫系統(tǒng)的許多基本概念、方法和技術(shù),報(bào)告 成為網(wǎng)狀數(shù)據(jù)模型的典型技術(shù)代表,它奠定了數(shù)據(jù)庫發(fā)展的基礎(chǔ),并 影響著以后的研究。網(wǎng)狀模型是基于圖來組織數(shù)據(jù)的,對數(shù)據(jù)的訪問 和操縱需要遍歷數(shù)據(jù)鏈來完成。因這種有效的實(shí)現(xiàn)方式對系統(tǒng)使用者 提出了很高的要求,所以阻礙了系統(tǒng)的推廣應(yīng)用。1970年IBM公司的E.F.Codd表了著名的基于關(guān)系模型的數(shù)據(jù)庫技術(shù)的論文大型共享數(shù)據(jù)庫數(shù)據(jù)的關(guān)系模型,并獲得1981年ACMB 靈獎(jiǎng),標(biāo)志著關(guān)系型數(shù)據(jù)庫模型的誕生。由于關(guān)系模型的簡單易理解 及其所具有的堅(jiān)實(shí)理論基礎(chǔ),整個(gè)20世紀(jì)70年代和80年代的前半期, 數(shù)據(jù)庫界集中圍繞關(guān)系數(shù)據(jù)庫進(jìn)行了大量的
7、研究和開發(fā)工作,對關(guān)系 數(shù)據(jù)庫概念的實(shí)用化投入了大量的精力。80年代以來,關(guān)系系統(tǒng)逐漸 代替網(wǎng)狀系統(tǒng)和層次系統(tǒng)而占領(lǐng)了市場。但是,關(guān)系模型不能用一張 表模型表示出復(fù)雜對象的語義,不擅長于數(shù)據(jù)類型較多、較復(fù)雜的領(lǐng) 域。在這種需求的驅(qū)動(dòng)下,數(shù)據(jù)庫模型又進(jìn)入了新的研究階段面向?qū)?象數(shù)據(jù)庫的研究。面向?qū)ο髷?shù)據(jù)庫是指支持面向?qū)ο筇匦缘臄?shù)據(jù)庫, 它提供了面向?qū)ο蟮慕7椒ā⒕幊陶Z言和數(shù)據(jù)庫語言。1989年在東京舉行了關(guān)于面向?qū)ο髷?shù)據(jù)庫的國際會議,第一次定義了面向?qū)ο髷?shù)據(jù)庫管理系統(tǒng)所應(yīng)實(shí)現(xiàn)的功能:支持復(fù)雜對象、支持 對象標(biāo)識、允許對象圭寸裝、支持類型或類、支持繼承、避免過早綁定、 計(jì)算性完整、可擴(kuò)充、能記住
8、數(shù)據(jù)位置、能管理非常大型的數(shù)據(jù)庫、 接收并發(fā)用戶、能從軟硬件失效中恢復(fù)、用簡單的方法支持?jǐn)?shù)據(jù)查詢0 作為一項(xiàng)新興的技術(shù),面向?qū)ο髷?shù)據(jù)庫的發(fā)展遠(yuǎn)不如關(guān)系數(shù)據(jù)庫成 熟。因此,面向?qū)ο髷?shù)據(jù)庫還有待于進(jìn)一步研究。3. 數(shù)據(jù)庫技術(shù)的現(xiàn)狀及發(fā)展趨勢1980年以前,數(shù)據(jù)庫技術(shù)的發(fā)展,主要體現(xiàn)在數(shù)據(jù)庫的模型設(shè)計(jì)上。進(jìn)入90年代后,計(jì)算機(jī)領(lǐng)域中其它新興技術(shù)的發(fā)展對數(shù)據(jù)庫技術(shù) 產(chǎn)生了重大影響。數(shù)據(jù)庫技術(shù)與網(wǎng)絡(luò)通信技術(shù)、人工智能技術(shù)、多媒 體技術(shù)等相互滲透,相互結(jié)合,使數(shù)據(jù)庫技術(shù)的新內(nèi)容層出不窮。數(shù) 據(jù)庫的許多概念、應(yīng)用領(lǐng)域,甚至某些原理都有了重大的發(fā)展和變化, 形成了數(shù)據(jù)庫領(lǐng)域眾多的研究分支和課題,產(chǎn)生了一系列新
9、型數(shù)據(jù)庫。分析目前數(shù)據(jù)庫的應(yīng)用情況,可以發(fā)現(xiàn):經(jīng)過多年的積累,企業(yè) 和部門積累的數(shù)據(jù)越來越多,許多企業(yè)面臨著“數(shù)據(jù)爆炸”可知識缺 乏的困境。如何解決海量數(shù)據(jù)的存儲管理、如何挖掘大量數(shù)據(jù)中包含 的信息和知識,已成為目前的急待解決的問題。所以,數(shù)據(jù)庫技術(shù)除 了核心問題的研究外,市場的需求導(dǎo)致了以下幾種數(shù)據(jù)庫的發(fā)展及一 些研究熱點(diǎn):3.1 分布式數(shù)據(jù)庫80年代,研制了許多分布式數(shù)據(jù)庫的原型系統(tǒng),攻克了分布式數(shù)據(jù)庫中許多理論和技術(shù)難點(diǎn)。90年代開始,主要的數(shù)據(jù)庫廠商對集中 式數(shù)據(jù)庫管理系統(tǒng)的核心加以改造,逐步加入分布處理功能,向分布 式數(shù)據(jù)庫管理系統(tǒng)發(fā)展。目前,分布式數(shù)據(jù)庫開始進(jìn)入實(shí)用階段。現(xiàn) 有的分
10、布式數(shù)據(jù)庫技術(shù)尚不能解決異構(gòu)數(shù)據(jù)和系統(tǒng)的許多問題。雖然 已有很多數(shù)據(jù)庫研究單位在進(jìn)行異構(gòu)系統(tǒng)集成問題的探索,并且已有 一些系統(tǒng)宣稱在一定程度上實(shí)現(xiàn)了異構(gòu)系統(tǒng)的互操作,但是異構(gòu)分布 式數(shù)據(jù)庫技術(shù)還未成熟。3.2 并行數(shù)據(jù)庫并行數(shù)據(jù)庫系統(tǒng)是在并行機(jī)上運(yùn)行的具有并行處理能力的數(shù)據(jù) 庫系統(tǒng)。最近,一些著名的數(shù)據(jù)庫廠商開始在數(shù)據(jù)庫產(chǎn)品中增加并行 處理能力,試圖在并行計(jì)算機(jī)系統(tǒng)上運(yùn)行。他們只是使用并行數(shù)據(jù)流 方法對原有系統(tǒng)加以簡單的擴(kuò)充,既沒有使用并行數(shù)據(jù)操作算法,也 沒有并行數(shù)據(jù)查詢優(yōu)化的能力,都不是真正的并行數(shù)據(jù)庫系統(tǒng)。目前, 并行數(shù)據(jù)庫的研究工作集中在體系結(jié)構(gòu)、并行算法與查詢優(yōu)化等。3.3 主動(dòng)數(shù)據(jù)
11、庫主動(dòng)數(shù)據(jù)庫是相對于傳統(tǒng)數(shù)據(jù)庫的被動(dòng)性而言的。許多實(shí)際的應(yīng) 用領(lǐng)域,如計(jì)算機(jī)集成制造系統(tǒng)、管理信息系統(tǒng)、辦公室自動(dòng)化系統(tǒng) 中常常希望數(shù)據(jù)庫系統(tǒng)在緊急情況下能根據(jù)數(shù)據(jù)庫的當(dāng)前狀態(tài),主動(dòng) 適時(shí)地做出反應(yīng),執(zhí)行某些操作,向用戶提供有關(guān)信息。傳統(tǒng)數(shù)據(jù)庫 系統(tǒng)是被動(dòng)的系統(tǒng),它只能被動(dòng)地按照用戶給出的明確請求執(zhí)行相應(yīng) 的數(shù)據(jù)庫操作,很難充分適應(yīng)這些應(yīng)用的主動(dòng)要求,因此在傳統(tǒng)數(shù)據(jù) 庫基礎(chǔ)上,結(jié)合人工智能技術(shù)和面向?qū)ο蠹夹g(shù)提出了主動(dòng)數(shù)據(jù)庫。主 動(dòng)數(shù)據(jù)庫的主要目標(biāo)是提供對緊急情況及時(shí)反應(yīng)的能力,同時(shí)提高數(shù) 據(jù)庫管理系統(tǒng)的模塊化程度。主動(dòng)數(shù)據(jù)庫通常采用的方法是在傳統(tǒng)數(shù) 據(jù)庫系統(tǒng)中嵌入!# (即事件一條件一動(dòng)作)規(guī)
12、則,在某一事件發(fā)生 時(shí)引發(fā)數(shù)據(jù)庫管理系統(tǒng)去檢測數(shù)據(jù)庫當(dāng)前狀態(tài),看是否滿足設(shè)定的條 件,若條件滿足,便觸發(fā)規(guī)定動(dòng)作的執(zhí)行。3.4 知識庫知識數(shù)據(jù)庫系統(tǒng)的功能是如何把由大量的事實(shí)、規(guī)則、概念組成 的知識存儲起來,進(jìn)行管理,并向用戶提供方便快速的檢索、查詢手 段。因此,知識數(shù)據(jù)庫可定義為:知識、經(jīng)驗(yàn)、規(guī)則和事實(shí)的集合。知 識數(shù)據(jù)庫系統(tǒng)應(yīng)具備對知識的表示方法;對知識系統(tǒng)化的組織管理; 知識庫的操作;庫的查詢與檢索;知識的獲取與學(xué)習(xí);知識的編輯;庫 的管理等功能。知識數(shù)據(jù)庫是人工智能技術(shù)與數(shù)據(jù)庫技術(shù)的結(jié)合。3.5 多媒體數(shù)據(jù)庫隨著多媒體技術(shù)的發(fā)展,多媒體應(yīng)用逐步深入,多媒體應(yīng)用涉及 大量的多媒體信息,它
13、們包括圖形、文本、圖像、聲音、視頻等信息。 多媒體信息系統(tǒng)的建立強(qiáng)烈地呼喚著管理多媒體的數(shù)據(jù)庫技術(shù),在這 樣的背景下,產(chǎn)生了多媒體數(shù)據(jù)庫技術(shù)。多媒體數(shù)據(jù)庫應(yīng)具備的功能 要求為:能表示和理解多媒體數(shù)據(jù),能刻畫、管理和表現(xiàn)各種媒體數(shù) 據(jù)的特性和相互關(guān)系;具備物理數(shù)據(jù)獨(dú)立性、邏輯數(shù)據(jù)獨(dú)立性和媒體 數(shù)據(jù)獨(dú)立性,媒體類型可擴(kuò)展;提供更為靈活的模式定義和修改功能, 支持模式進(jìn)化與演變,具備某些長事務(wù)處理的能力;提供多媒體訪問 的多種手段,近似性查詢,混合方式訪問等。多媒體數(shù)據(jù)管理系統(tǒng)在 多媒體應(yīng)用中非常重要,它為多媒體應(yīng)用提供了基本數(shù)據(jù)支撐。多媒 體數(shù)據(jù)庫的研究始于80年代中期,在多年的技術(shù)研究和系統(tǒng)開發(fā)
14、中, 獲得了很大的成果。但目前還沒有功能完善、技術(shù)成熟的多媒體數(shù)據(jù) 庫管理系統(tǒng)。3.6XML數(shù) 據(jù)庫經(jīng)過近幾年業(yè)界同仁的共同努力,XML數(shù)據(jù)庫技術(shù)取得了很大的 進(jìn)展,已經(jīng)有若干種XML數(shù)據(jù)庫產(chǎn)品問世并服務(wù)于社會生活的各個(gè)方 面。但是,XML數(shù)據(jù)庫的事業(yè)才剛剛開始,還有很多問題等待著我們 去解決。未來幾年,XML數(shù)據(jù)庫技術(shù)有可能在下述方面取得進(jìn)展:異 構(gòu)數(shù)據(jù)源的集成;底層索引結(jié)構(gòu);并發(fā)加鎖協(xié)議。XML模式規(guī)范化是 一個(gè)值得關(guān)注的方向。一旦取得突破,將會使我們可以像在關(guān)系庫中 那樣方便地設(shè)計(jì)XML數(shù)據(jù)庫的結(jié)構(gòu),消除數(shù)據(jù)的冗余和不一致現(xiàn)象。 目前,這一領(lǐng)域已經(jīng)成為學(xué)術(shù)界關(guān)注的熱點(diǎn)。但是,完整的、為業(yè)
15、界 所公認(rèn)的理論體系尚未建立。3.7 模糊數(shù)據(jù)庫模糊數(shù)據(jù)庫是在一般數(shù)據(jù)庫系統(tǒng)中引入”模糊”概念,進(jìn)而對模 糊數(shù)據(jù)、數(shù)據(jù)間的模糊關(guān)系與模糊約束實(shí)施模糊數(shù)據(jù)操作和查詢的數(shù) 據(jù)庫系統(tǒng)。模糊數(shù)據(jù)庫系統(tǒng)中的研究內(nèi)容涉及模糊數(shù)據(jù)庫的形式定 義、模糊數(shù)據(jù)庫的數(shù)據(jù)模型、模物數(shù)據(jù)庫語言設(shè)計(jì)、模糊數(shù)據(jù)庫設(shè)計(jì) 方法及模糊數(shù)據(jù)庫管理系統(tǒng)的實(shí)現(xiàn)。近年來,也有許多工作是對關(guān)系 之外的其它效據(jù)模型進(jìn)行模糊擴(kuò)展,如模糊E-R (實(shí)體一關(guān)系)、模 糊多媒體數(shù)據(jù)庫等。當(dāng)前,科研人員在模糊數(shù)據(jù)庫的研究、開發(fā)與應(yīng) 用系統(tǒng)的建立方面都做了不少工作,但是,擺在人們面前的問題是如 何進(jìn)一步研究與開發(fā)大型適用的模糊數(shù)據(jù)庫商業(yè)性系統(tǒng)。3.8
16、數(shù)據(jù)倉庫和聯(lián)機(jī)分析處理(OLAP)為了有效地支持決策分析,近幾年人們提出了數(shù)據(jù)倉庫的概念。數(shù)據(jù)倉庫就是從不同的源數(shù)據(jù)中抽取數(shù)據(jù),將其整理轉(zhuǎn)換成新的存儲 格式,為決策目的將數(shù)據(jù)聚合在一種特殊的格式中,這種支持管理決 策過程的、面向主題的、集成的、穩(wěn)定的、不同時(shí)的數(shù)據(jù)聚合稱為數(shù) 據(jù)倉庫(Data Warehouse)。數(shù)據(jù)倉庫中數(shù)據(jù)的組織方式有虛擬存儲、基于關(guān)系表的存儲和多維數(shù)據(jù)庫存儲3種存儲方式。整個(gè)倉庫系統(tǒng)可 分為數(shù)據(jù)源、數(shù)據(jù)存儲與管理、分析處理3個(gè)功能部分。由于數(shù)據(jù)倉 庫是集成信息的存儲中心,由數(shù)據(jù)存儲管理器收集整理源信息的數(shù)據(jù) 成為倉庫系統(tǒng)使用的數(shù)據(jù)格式和數(shù)據(jù)模型,并自動(dòng)監(jiān)測數(shù)據(jù)源中數(shù)據(jù)
17、的變化,反映到存儲中心,對數(shù)據(jù)倉庫進(jìn)行更新維護(hù)。而聯(lián)機(jī)分析處 理(OLAP)是數(shù)據(jù)倉庫上的最重要應(yīng)用,是決策分析的關(guān)鍵。數(shù)據(jù)倉 庫是為了有效地支持決策分析,而從操作數(shù)據(jù)庫中提取并經(jīng)過加工后 所得到的數(shù)據(jù)集合,是一個(gè)特殊的數(shù)據(jù)庫。數(shù)據(jù)倉庫也需要由一個(gè)數(shù)據(jù)庫管理系統(tǒng)支持,它有關(guān)系型和多維型兩類數(shù)據(jù)庫管理系統(tǒng)。3.9 數(shù)據(jù)挖掘數(shù)據(jù)挖掘(Data Mi ning)又稱數(shù)據(jù)開采,就是從大量的、不全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的人們事先不 知道的、但又是潛在有用的信息和知識的過程,提取的知識表現(xiàn)為概 念(Co ncepts )、規(guī)則(Rules )、規(guī)律模式約束等形式。在人工智能領(lǐng)域又
18、習(xí)慣稱其為數(shù)據(jù)庫中知識發(fā)現(xiàn)(KDD,即KnowledgeDiscovery in Database )。其本質(zhì)類似于人腦對客觀世界的反映,從客觀的事實(shí)中抽象成主觀的知識,然后指導(dǎo)客觀實(shí)踐,數(shù)據(jù)挖掘就 是從客體的數(shù)據(jù)庫中概括抽象提取規(guī)律性的東西以供決策支持系統(tǒng) 的建立和使用。數(shù)據(jù)開采以數(shù)據(jù)庫中的數(shù)據(jù)為數(shù)據(jù)源,整個(gè)過程可分為數(shù)據(jù)集成、數(shù)據(jù)選擇、預(yù)處理、數(shù)據(jù)開采、結(jié)果表達(dá)和解析等過程。開采的 范圍可針對多媒體數(shù)據(jù)庫、數(shù)據(jù)倉庫、Web數(shù)據(jù)庫、主動(dòng)型數(shù)據(jù)庫、 時(shí)間型及概率型數(shù)據(jù)庫等。采用的技術(shù)有人工神經(jīng)網(wǎng)絡(luò)、決策樹、遺 傳算法、規(guī)則歸納、分類、聚類、減維、模式識別、不確定性處理等。發(fā)現(xiàn)的知識有廣義型知識
19、、特征型知識、差異型知識、關(guān)聯(lián)型知識、 預(yù)測型知識、偏離型知識。目前數(shù)據(jù)采掘的研究和應(yīng)用所面臨的主要 挑戰(zhàn)是:對大型數(shù)據(jù)庫的數(shù)據(jù)采掘方法;對非結(jié)構(gòu)和無結(jié)構(gòu)數(shù)據(jù)庫中 的數(shù)據(jù)采掘操作;用戶參與的交互采掘;對采掘得到的知識的證實(shí)技 術(shù);知識的解釋和表達(dá)機(jī)制;由于數(shù)據(jù)庫的更新,原有知識的修正; 采掘所得知識庫的建立、使用和維護(hù)。3.10面向?qū)ο髷?shù)據(jù)庫及數(shù)據(jù)可視化技術(shù)面向?qū)ο髷?shù)據(jù)庫系統(tǒng)將數(shù)據(jù)作為能自動(dòng)重新得到和共享的對象 存儲,包含在對象中的是完成每一項(xiàng)數(shù)據(jù)庫事務(wù)處理指令,這些對象 可能包含不同類型的數(shù)據(jù),包括傳統(tǒng)的數(shù)據(jù)和處理過程,也包括聲音、 圖形和視頻信號,對象可以共享和重用。面向?qū)ο蟮臄?shù)據(jù)庫系統(tǒng)的
20、這 些特性通過重用和建立新的多媒體應(yīng)用能力使軟件開發(fā)變得容易,這 些應(yīng)用可以將不同類型的數(shù)據(jù)結(jié)合起來。面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的好處 是他支持WWW用能力。然而,面向?qū)ο蟮臄?shù)據(jù)庫是一項(xiàng)相對較新的技 術(shù),尚缺乏理論支持,他可能在處理大量包含很多事務(wù)的數(shù)據(jù)方面比 關(guān)系數(shù)據(jù)庫系統(tǒng)慢得多,但人們已經(jīng)開發(fā)了混合關(guān)系對象數(shù)據(jù)庫,這 種數(shù)據(jù)庫將關(guān)系數(shù)據(jù)庫管理系統(tǒng)處理事務(wù)的能力與面向?qū)ο髷?shù)據(jù)庫 系統(tǒng)處理復(fù)雜關(guān)系與新型數(shù)據(jù)的能力結(jié)合起來。數(shù)據(jù)可視化是指在計(jì)算機(jī)屏幕上以圖形或圖像方式,形象地向用 戶顯示各種數(shù)據(jù),使用戶快速地理解和吸收數(shù)據(jù)所表示的信息,以提 高人的大腦二次處理信息的速度和能力。可見,數(shù)據(jù)可視化是提高人
21、類吸收和處理信息的速度和能力的重要途徑。數(shù)據(jù)可視化是一個(gè)剛剛 開始的新的研究領(lǐng)域,還有許多問題有待探索。目前已經(jīng)被提出的數(shù) 據(jù)可視化技術(shù)有:幾何可視化技術(shù)、基于圖標(biāo)的可視化技術(shù)、基于象 素的可視化技術(shù)、分析可視化技術(shù)等。4. 數(shù)據(jù)庫技術(shù)的未來發(fā)展數(shù)據(jù)、計(jì)算機(jī)硬件和數(shù)據(jù)庫應(yīng)用,這三者推動(dòng)著數(shù)據(jù)庫技術(shù)與系 統(tǒng)的發(fā)展。數(shù)據(jù)庫要管理的數(shù)據(jù)的復(fù)雜度和數(shù)據(jù)量都在迅速增長;計(jì) 算機(jī)硬件平臺的發(fā)展仍然實(shí)踐著摩爾定律;數(shù)據(jù)庫應(yīng)用迅速向深度、 廣度擴(kuò)展。尤其是互聯(lián)網(wǎng)的出現(xiàn),極大地改變了數(shù)據(jù)庫的應(yīng)用環(huán)境, 向數(shù)據(jù)庫領(lǐng)域提出了前所未有的技術(shù)挑戰(zhàn)。這些因素的變化推動(dòng)著數(shù) 據(jù)庫技術(shù)的進(jìn)步,出現(xiàn)了一批新的數(shù)據(jù)庫技術(shù),如We
22、b數(shù)據(jù)庫技術(shù)、并 行數(shù)據(jù)庫技術(shù)、數(shù)據(jù)倉庫與聯(lián)機(jī)分析技術(shù)、數(shù)據(jù)挖掘與商務(wù)智能技術(shù)、 內(nèi)容管理技術(shù)、海量數(shù)據(jù)管理技術(shù)等。限于篇幅,本文不可能逐一去 展開來闡述這些方面的變化,只是從這些變化中歸納出數(shù)據(jù)庫技術(shù)發(fā) 展呈現(xiàn)出的突出特點(diǎn)。“四高”即DBMS具有高可靠性、高性能、高可伸縮性和高安全性。數(shù)據(jù)庫是企業(yè)信息系統(tǒng)的核心和基礎(chǔ),其可靠性和性能是企業(yè)領(lǐng)導(dǎo)人 非常關(guān)心的問題。因?yàn)?,一旦宕機(jī)會給企業(yè)造成巨大的經(jīng)濟(jì)損失,甚 至?xí)鸱傻募m紛。最典型的例子就是證券交易系統(tǒng),如果在一個(gè) 行情來臨的時(shí)候,由于交易量的猛增,造成數(shù)據(jù)庫系統(tǒng)的處理能力不 足,導(dǎo)致數(shù)據(jù)庫系統(tǒng)崩潰,將會給證券公司和股民造成巨大的損失。在我
23、國計(jì)算機(jī)應(yīng)用的早期,由于計(jì)算機(jī)系統(tǒng)還不是企業(yè)運(yùn)營必要的成 分,人們對數(shù)據(jù)庫的重要性認(rèn)識不足,而且為了經(jīng)費(fèi)上的節(jié)約常常采 用一些低層次的數(shù)據(jù)管理軟件,如dBASE等,或者盜版的軟件。但是, 隨著信息化進(jìn)程的深化,計(jì)算機(jī)系統(tǒng)越來越成為企業(yè)運(yùn)營的不可缺少 的部分,這時(shí),數(shù)據(jù)庫系統(tǒng)的穩(wěn)定和高效是必要的條件。在互聯(lián)網(wǎng)環(huán) 境下還要考慮支持幾千或上萬個(gè)用戶同時(shí)存取和7x24小時(shí)不間斷運(yùn) 行的要求,提供聯(lián)機(jī)數(shù)據(jù)備份、容錯(cuò)、容災(zāi)以及信息安全措施等。事實(shí)上,數(shù)據(jù)庫系統(tǒng)的穩(wěn)定和高效也是技術(shù)上長久不衰的追求。此外,從企業(yè)信息系統(tǒng)發(fā)展的角度上看,一個(gè)系統(tǒng)的可擴(kuò)展能力也是非常重要的。由于業(yè)務(wù)的擴(kuò)大,原來的系統(tǒng)規(guī)模和能力已
24、經(jīng)不再適應(yīng) 新的要求的時(shí)候,不是重新更換更高檔次的機(jī)器,而是在原有的基礎(chǔ) 上增加新的設(shè)備,如處理器、存儲器等,從而達(dá)到分散負(fù)載的目的。數(shù)據(jù)的安全性是另一個(gè)重要的課題,普通的基于授權(quán)的機(jī)制已經(jīng)不能 滿足許多應(yīng)用的要求,新的基于角色的授權(quán)機(jī)制以及一些安全功能要 素,如存儲隱通道分析、標(biāo)記、加密、推理控制等,在一些應(yīng)用中成 為切切實(shí)實(shí)的需要?!盎ヂ?lián)”指數(shù)據(jù)庫系統(tǒng)要支持互聯(lián)網(wǎng)環(huán)境下的應(yīng)用,要支持信息系統(tǒng)間“互聯(lián)互訪”,要實(shí)現(xiàn)不同數(shù)據(jù)庫間的數(shù)據(jù)交換和共享,要處 理以XML類型的數(shù)據(jù)為代表的網(wǎng)上數(shù)據(jù),甚至要考慮無線通訊發(fā)展帶 來的革命性的變化。與傳統(tǒng)的數(shù)據(jù)庫相比,互聯(lián)網(wǎng)環(huán)境下的數(shù)據(jù)庫系 統(tǒng)要具備處理更大量
25、的數(shù)據(jù)以及為更多的用戶提供服務(wù)的能力,要提 供對長事務(wù)的有效支持,要提供對XML類型數(shù)據(jù)的快速存取的有效支 持。“協(xié)同”面向行業(yè)應(yīng)用領(lǐng)域要求,在DBM駭心基礎(chǔ)上,開發(fā)豐富 的數(shù)據(jù)庫套件及應(yīng)用構(gòu)件,通過與制造業(yè)信息化、電子政務(wù)等領(lǐng)域應(yīng) 用套件捆綁,形成以DBM站核心的面向行業(yè)的應(yīng)用軟件產(chǎn)品家族。滿 足應(yīng)用需求,協(xié)同發(fā)展數(shù)據(jù)庫套件與應(yīng)用構(gòu)件,已成為當(dāng)今數(shù)據(jù)庫技 術(shù)與產(chǎn)品發(fā)展的新趨勢。規(guī)劃中的Oraclelli的主要擴(kuò)展方面據(jù)稱主 要也是各種面向應(yīng)用套件的支持。此外,數(shù)據(jù)庫的發(fā)展還有以下一些新特點(diǎn):提供持續(xù)的數(shù)據(jù)可用性構(gòu)建一個(gè)高可用性IT基礎(chǔ)架構(gòu),對所有希望在當(dāng)今瞬息萬變的 經(jīng)濟(jì)環(huán)境中立于不敗之地并
26、取得成功的企業(yè)而言都至關(guān)重要。作為數(shù)據(jù)庫市場的領(lǐng)跑者Oracle 在其最新的10g數(shù)據(jù)庫版本中 增強(qiáng)了 RAC技術(shù)。微軟公司在其最新的數(shù)據(jù)庫SQL Server 2005 中利用 數(shù)據(jù)庫鏡像、故障轉(zhuǎn)移群集和改進(jìn)聯(lián)機(jī)操作等特性,可將故障時(shí)間控 制到最低,并有助于確保企業(yè)系統(tǒng)隨時(shí)接受訪冋調(diào)用。用低成本實(shí)現(xiàn)系統(tǒng)的伸縮性大多數(shù)企業(yè)的每個(gè)主要應(yīng)用系統(tǒng)都擁有專門的存儲器和服務(wù)器, 這樣傳統(tǒng)的布署,個(gè)別看好像效果不錯(cuò)。但這樣做的后果就是必須付 出高昂的代價(jià),來滿足大量系統(tǒng)的維護(hù),而且因故障節(jié)點(diǎn)的增多,系 統(tǒng)更容易出現(xiàn)故障。此外,由于單個(gè)系統(tǒng)必須有足夠的規(guī)模以適應(yīng)高峰容量,但資源 卻難以從一個(gè)系統(tǒng)轉(zhuǎn)移到另一個(gè)系統(tǒng),結(jié)果導(dǎo)致企業(yè)存儲器和CPU 資源大量閑置。分析家認(rèn)為,目前企業(yè)內(nèi)部一般的存儲器的利用率僅 為50%,而 CPU利用率則是可憐的15-20%。(3)保證互聯(lián)網(wǎng)架構(gòu)下的安全企業(yè)將應(yīng)用架構(gòu)在互聯(lián)網(wǎng)平臺上,都面臨如何保護(hù)互聯(lián)網(wǎng)架構(gòu)下 的數(shù)據(jù)安全問題。各大數(shù)據(jù)庫廠商嗅到其中的巨大商機(jī),加強(qiáng)了其數(shù) 據(jù)庫產(chǎn)品在數(shù)據(jù)安全上的支持。甲骨文公司在其10g版本中提供的存儲數(shù)據(jù)加密、虛擬私有數(shù)據(jù)庫、Label Security 等技術(shù);微軟的SQL server 2005通過數(shù)據(jù)庫 加密、 缺省安全設(shè)置
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025住宅裝修物業(yè)管理合同(合同范本)
- 8《池子與河流》(說課稿)-2023-2024學(xué)年統(tǒng)編版語文三年級下冊
- 2025鍋爐拆除安全施工合同
- 2025有關(guān)電梯廣告的合同范本
- Unit 6 Disaster and Hope Understanding ideas 說課稿-2023-2024學(xué)年外研版高中英語(2019)必修第三冊
- 代理制 合同范本
- 農(nóng)業(yè)保險(xiǎn)代購合同范例
- 2024年春七年級地理下冊 第9章 第1節(jié) 美國說課稿 (新版)新人教版001
- 保安正式合同范例
- 買賣合同物業(yè)服務(wù)合同范例
- 職業(yè)衛(wèi)生培訓(xùn)課件
- 柴油墊資合同模板
- GB/T 44489-2024高級輔助駕駛地圖審查要求
- 2024-2030年中國體外除顫器行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報(bào)告
- 2024-2030年中國人力資源行業(yè)市場發(fā)展前瞻及投資戰(zhàn)略研究報(bào)告
- 2024-2030年中國樺樹汁行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報(bào)告
- 全冊(教案)外研版(一起)英語四年級下冊
- 偏差行為、卓越一生3.0版
- 國網(wǎng)浙江電科院:2024浙江工商業(yè)儲能政策及收益分析報(bào)告
- 中國兒童幽門螺桿菌感染診治專家共識2022
- JJG 4-2015鋼卷尺行業(yè)標(biāo)準(zhǔn)
評論
0/150
提交評論