版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)庫原理及應(yīng)用第一章數(shù)據(jù)庫基礎(chǔ)本章導(dǎo)讀隨著信息技術(shù)的飛速發(fā)展,信息已成為當(dāng)今社會各種活動的核心資源。通過對信息資源的進(jìn)一步開發(fā)利用,人們可以有效地提高工作效率,使各種社會資源得到最大限度的節(jié)約和利用。對信息資源的開發(fā)利用離不開數(shù)據(jù)庫技術(shù)。本章從數(shù)據(jù)與數(shù)據(jù)處理入手,介紹數(shù)據(jù)庫相關(guān)的基礎(chǔ)知識,包括數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫系統(tǒng)的基本概念,數(shù)據(jù)庫技術(shù)的發(fā)展,數(shù)據(jù)模型,數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)和數(shù)據(jù)庫領(lǐng)域的新技術(shù)等內(nèi)容。學(xué)習(xí)目標(biāo)熟悉數(shù)據(jù)、數(shù)據(jù)處理、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)與數(shù)據(jù)庫系統(tǒng)的基本概念。了解數(shù)據(jù)庫技術(shù)的發(fā)展過程。熟悉數(shù)據(jù)模型的基本概念,掌握概念模型的E-R圖表示方法。理解數(shù)據(jù)庫系統(tǒng)的三級模式結(jié)構(gòu)與二級映像等概念。了解數(shù)據(jù)庫領(lǐng)域的新技術(shù)。目錄1.1認(rèn)識數(shù)據(jù)庫1.2數(shù)據(jù)模型1.3數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)1.4數(shù)據(jù)庫領(lǐng)域的新技術(shù)1.5實(shí)戰(zhàn)訓(xùn)練——概念模型的應(yīng)用數(shù)據(jù)與信息01數(shù)據(jù)是對客觀事物、事件的記錄與描述,也是對客觀事物的邏輯歸納。數(shù)據(jù)可以是連續(xù)的,如聲音、圖像等;也可以是離散的,如符號、文字等。數(shù)據(jù)與其語義密不可分,語義指數(shù)據(jù)的含義。例如,“95”是一個數(shù)據(jù),被賦予特定的語義后,它可以表示某學(xué)生某門課的成績,這就是信息。簡單來講,信息是對數(shù)據(jù)的解釋,即信息=數(shù)據(jù)+語義例如,有一條學(xué)生成績信息:信息學(xué)院計算機(jī)一班的張三同學(xué)在數(shù)據(jù)庫原理及應(yīng)用考試中取得了95分的成績,轉(zhuǎn)換成計算機(jī)中的數(shù)據(jù),可以描述為(張三,信息學(xué)院,計算機(jī)一班,數(shù)據(jù)庫原理及應(yīng)用,95)。數(shù)據(jù)處理與數(shù)據(jù)管理02數(shù)據(jù)處理數(shù)據(jù)管理
數(shù)據(jù)管理是數(shù)據(jù)處理的核心,其過程比較復(fù)雜,主要包括數(shù)據(jù)的分類、組織、編碼、存儲、維護(hù)、檢索等操作。對于這些數(shù)據(jù)管理操作,人們需要一個通用、高效且使用方便的管理軟件,將數(shù)據(jù)有效地管理起來。數(shù)據(jù)庫技術(shù)正是瞄準(zhǔn)這一目標(biāo),研究、發(fā)展并完善起來的。
數(shù)據(jù)處理是將數(shù)據(jù)轉(zhuǎn)換成信息的過程,包括對數(shù)據(jù)進(jìn)行采集、管理、加工、變換和傳輸?shù)纫幌盗谢顒?。?shù)據(jù)處理的目的有兩個,其一是從大量的原始數(shù)據(jù)中抽取和推導(dǎo)出有價值的信息,作為決策的依據(jù);其二是借助計算機(jī)科學(xué)地保存和管理大量復(fù)雜的數(shù)據(jù),便于人們能夠充分地利用這些信息資源。數(shù)據(jù)與信息01
數(shù)據(jù)庫(DataBase,DB)是存儲在計算機(jī)內(nèi),有組織的、可共享的相關(guān)數(shù)據(jù)的集合,這種集合按一定的數(shù)據(jù)模型組織、描述并長期存儲,同時能夠以安全可靠的方法對數(shù)據(jù)進(jìn)行檢索。數(shù)據(jù)庫數(shù)據(jù)具有冗余度小、獨(dú)立性高、延展性強(qiáng)、共享性好,以及結(jié)構(gòu)化和永久性等特點(diǎn)。數(shù)據(jù)庫數(shù)據(jù)庫管理系統(tǒng)02
數(shù)據(jù)庫管理系統(tǒng)(DataBaseManagementSystem,DBMS)是指建立、運(yùn)用、管理和維護(hù)數(shù)據(jù)庫,并對數(shù)據(jù)庫進(jìn)行統(tǒng)一控制的系統(tǒng)軟件。SQLServerMySQLAccessOracle常見的數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫系統(tǒng)03
數(shù)據(jù)庫系統(tǒng)(DataBaseSystem,DBS)是指在計算機(jī)系統(tǒng)中引入數(shù)據(jù)庫后的系統(tǒng)。
它主要由數(shù)據(jù)庫、數(shù)據(jù)庫用戶、計算機(jī)硬件系統(tǒng)和計算機(jī)軟件系統(tǒng)等幾部分組成,如右圖所示。有時人們也將數(shù)據(jù)庫系統(tǒng)簡稱為數(shù)據(jù)庫。數(shù)據(jù)庫用戶指開發(fā)、管理和使用數(shù)據(jù)庫的人員,包括系統(tǒng)分析員、數(shù)據(jù)庫設(shè)計員、應(yīng)用程序員、數(shù)據(jù)庫管理員和最終用戶等。系統(tǒng)分析員負(fù)責(zé)確定應(yīng)用系統(tǒng)的需求分析和規(guī)范說明,他們和最終用戶及數(shù)據(jù)庫管理員一起確定系統(tǒng)的硬件配置,參與數(shù)據(jù)庫的概要設(shè)計;數(shù)據(jù)庫設(shè)計員負(fù)責(zé)確定數(shù)據(jù)庫中的數(shù)據(jù)和設(shè)計數(shù)據(jù)庫的各級模式;應(yīng)用程序員負(fù)責(zé)編寫使用數(shù)據(jù)庫的應(yīng)用程序;數(shù)據(jù)庫管理員負(fù)責(zé)數(shù)據(jù)庫的總體信息控制;最終用戶利用系統(tǒng)的接口或查詢語言訪問數(shù)據(jù)庫。人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)隨著計算機(jī)硬件和軟件的發(fā)展,數(shù)據(jù)管理經(jīng)歷3個發(fā)展階段。人工管理階段01在20世紀(jì)50年代中期以前,計算機(jī)主要用于科學(xué)計算。當(dāng)時的計算機(jī)硬件和軟件都不完善,硬件存儲設(shè)備只有卡片、紙帶和磁帶;軟件方面只有匯編語言,沒有操作系統(tǒng)和管理數(shù)據(jù)的軟件,因此只能采用人工方式對數(shù)據(jù)進(jìn)行管理。數(shù)據(jù)不保存數(shù)據(jù)不共享人工管理數(shù)據(jù)的特點(diǎn)數(shù)據(jù)不具獨(dú)立性無專門的數(shù)據(jù)管理軟件文件系統(tǒng)階段02在20世紀(jì)50年代后期至60年代中期,計算機(jī)硬件和軟件都有了極大的發(fā)展,計算機(jī)開始用于數(shù)據(jù)管理。這一時期,硬件方面出現(xiàn)了磁盤、磁鼓等直接存儲設(shè)備;軟件方面出現(xiàn)了高級語言和操作系統(tǒng),操作系統(tǒng)中的文件系統(tǒng)就是專門用來管理數(shù)據(jù)的軟件。文件系統(tǒng)階段相較于人工管理階段有了新的特點(diǎn):數(shù)據(jù)以文件的形式長期存儲,文件系統(tǒng)提供文件管理功能及存取方法,應(yīng)用程序與數(shù)據(jù)間具有一定的獨(dú)立性,文件形式多樣化,數(shù)據(jù)間具有一定的共享性等。1234文件系統(tǒng)階段的問題數(shù)據(jù)不一致性。由于相同的數(shù)據(jù)在不同的文件中重復(fù)存儲且各自管理,在應(yīng)用程序?qū)?shù)據(jù)進(jìn)行更新操作時,容易造成不同應(yīng)用程序更新的數(shù)據(jù)不一致的狀況。數(shù)據(jù)共享性差、冗余度較大。一個文件基本上只對應(yīng)一個應(yīng)用程序(下圖),文件仍然是面向應(yīng)用的。數(shù)據(jù)間聯(lián)系弱。文件與文件之間是獨(dú)立的,文件間的聯(lián)系必須通過應(yīng)用程序來構(gòu)造。數(shù)據(jù)獨(dú)立性差。應(yīng)用程序與數(shù)據(jù)緊密耦合,當(dāng)數(shù)據(jù)結(jié)構(gòu)發(fā)生變化時,需要修改相應(yīng)的應(yīng)用程序;反之,若應(yīng)用程序發(fā)生變化,也需改變數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)庫系統(tǒng)階段03到了20世紀(jì)60年代后期,硬件方面出現(xiàn)了大容量、存取快速的磁盤;硬件價格下降且軟件價格上升,使開發(fā)和維護(hù)系統(tǒng)軟件的成本相對增加。文件系統(tǒng)的數(shù)據(jù)管理方法無法適應(yīng)各種應(yīng)用程序的需要,于是數(shù)據(jù)庫技術(shù)應(yīng)運(yùn)而生,出現(xiàn)了統(tǒng)一管理數(shù)據(jù)的專門軟件系統(tǒng),即數(shù)據(jù)庫管理系統(tǒng),這標(biāo)志著數(shù)據(jù)庫系統(tǒng)階段的開始。數(shù)據(jù)庫系統(tǒng)在數(shù)據(jù)處理上有了明顯的功能提升。數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)獨(dú)立性高數(shù)據(jù)共享性高、冗余度小有統(tǒng)一的數(shù)據(jù)管理和控制功能特點(diǎn)(1)數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)庫中的數(shù)據(jù)不僅僅只針對某個應(yīng)用,而是面向整個組織;數(shù)據(jù)庫中不僅描述了數(shù)據(jù),還描述了數(shù)據(jù)之間的聯(lián)系,能夠較好地反映現(xiàn)實(shí)世界中事物之間的自然聯(lián)系。(2)數(shù)據(jù)共享性高、冗余度小數(shù)據(jù)共享是指數(shù)據(jù)庫中的一組數(shù)據(jù)集合可為多個應(yīng)用程序和多個用戶共同使用,節(jié)省存儲空間。在數(shù)據(jù)庫系統(tǒng)中,用戶和應(yīng)用程序不需要各自建立數(shù)據(jù)文件,而是從數(shù)據(jù)庫中存取其中的數(shù)據(jù)子集,該數(shù)據(jù)子集是通過DBMS從數(shù)據(jù)庫中經(jīng)過映射形成的邏輯文件。(3)數(shù)據(jù)獨(dú)立性高數(shù)據(jù)的獨(dú)立性是指數(shù)據(jù)庫中的數(shù)據(jù)與應(yīng)用程序間相互獨(dú)立,即數(shù)據(jù)的邏輯結(jié)構(gòu)、存儲結(jié)構(gòu)和存取方式的改變不影響應(yīng)用程序。
數(shù)據(jù)的獨(dú)立性可分為如下兩種。①數(shù)據(jù)的物理獨(dú)立性。
物理獨(dú)立性是指當(dāng)數(shù)據(jù)庫物理結(jié)構(gòu)發(fā)生改變時,通過修改映射可以使數(shù)據(jù)庫邏輯結(jié)構(gòu)不受影響,進(jìn)而使用戶邏輯結(jié)構(gòu)及應(yīng)用程序不必改變。②數(shù)據(jù)的邏輯獨(dú)立性。邏輯獨(dú)立性是指數(shù)據(jù)的邏輯結(jié)構(gòu)發(fā)生改變時,通過修改映射可以使用戶應(yīng)用程序不必改變。(4)有統(tǒng)一的數(shù)據(jù)管理和控制功能在數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)由數(shù)據(jù)庫管理系統(tǒng)統(tǒng)一管理和控制,數(shù)據(jù)庫可為多個用戶和應(yīng)用程序共享。數(shù)據(jù)庫中數(shù)據(jù)的共享是并發(fā)的,多個用戶可以同時存取數(shù)據(jù)庫中的同一數(shù)據(jù)。
為確保數(shù)據(jù)庫數(shù)據(jù)的正確性和有效性,數(shù)據(jù)庫管理系統(tǒng)提供了數(shù)據(jù)的安全性控制、數(shù)據(jù)的完整性控制、并發(fā)控制和數(shù)據(jù)恢復(fù)4個方面的數(shù)據(jù)控制功能。數(shù)據(jù)模型的概念01數(shù)據(jù)模型是對現(xiàn)實(shí)世界數(shù)據(jù)特征的抽象描述?,F(xiàn)實(shí)世界中的數(shù)據(jù)要轉(zhuǎn)換為抽象的數(shù)據(jù)庫數(shù)據(jù),需要經(jīng)過現(xiàn)實(shí)世界、信息世界、計算機(jī)世界這3個階段。數(shù)據(jù)模型是現(xiàn)實(shí)世界兩級抽象的結(jié)果。數(shù)據(jù)模型數(shù)據(jù)模型的組成要素02數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)操作數(shù)據(jù)完整性約束數(shù)據(jù)操作是指允許對數(shù)據(jù)庫中數(shù)據(jù)執(zhí)行的操作的集合,同時包括相應(yīng)的操作規(guī)則。數(shù)據(jù)結(jié)構(gòu)是實(shí)體和實(shí)體間聯(lián)系的表達(dá)和實(shí)現(xiàn)。數(shù)據(jù)完整性約束給出數(shù)據(jù)及其聯(lián)系應(yīng)具有的制約和依賴規(guī)則。數(shù)據(jù)模型的類型03概念模型也稱信息模型,屬于信息世界中的模型。它按照用戶的觀點(diǎn)對數(shù)據(jù)信息建模,是對現(xiàn)實(shí)世界的事物及其聯(lián)系的第一級抽象。邏輯模型屬于計算機(jī)世界中的模型,這類模型以計算機(jī)的觀點(diǎn)對數(shù)據(jù)進(jìn)行建模,是對現(xiàn)實(shí)世界的第二級抽象。物理模型是對數(shù)據(jù)最底層的抽象,是面向計算機(jī)系統(tǒng)的模型,它描述數(shù)據(jù)在磁盤或磁帶上的存儲方式和存取方法。數(shù)據(jù)模型按應(yīng)用層次分為相關(guān)術(shù)語01客觀存在并且可以相互區(qū)別的事物稱為實(shí)體。實(shí)體(Entity)實(shí)體所具有的某一特性。一個實(shí)體可以由多個屬性刻畫。屬性(Attribute)用實(shí)體名及其屬性名集合來抽象描述同類實(shí)體。實(shí)體型(EntityType)同型實(shí)體的集合稱為實(shí)體集。實(shí)體集(EntitySet)在實(shí)體型中能夠唯一標(biāo)識一個實(shí)體的屬性或?qū)傩约Q為實(shí)體的碼。碼(Key)(鍵、關(guān)鍵字)某一屬性的取值范圍稱為該屬性的域。域(Domain)現(xiàn)實(shí)世界中的聯(lián)系同樣也要抽象和反映到信息世界中來。聯(lián)系(Relationship)概念模型中實(shí)體型之間的聯(lián)系02實(shí)體型之間的聯(lián)系按照聯(lián)系中實(shí)體的個數(shù)可分為兩個實(shí)體型之間的聯(lián)系、兩個以上實(shí)體型之間的聯(lián)系和單個實(shí)體型內(nèi)部的聯(lián)系3種情況。一對一聯(lián)系(1∶1)多對多聯(lián)系(m∶n)一對多聯(lián)系(1∶n)這3種情況中,按照一個實(shí)體型中的實(shí)體個數(shù)與另一個實(shí)體型中的實(shí)體個數(shù)的對應(yīng)關(guān)系,均可分為以下3種類型。(1)一對一聯(lián)系(1∶1)實(shí)體集A中的一個實(shí)體至多與實(shí)體集B中的一個實(shí)體(也可沒有)相聯(lián)系,反之情況相同,則稱實(shí)體型A與實(shí)體型B有一對一聯(lián)系。(2)一對多聯(lián)系(1∶n)實(shí)體集A中的一個實(shí)體與實(shí)體集B中的n(n≥0)個實(shí)體相聯(lián)系,且實(shí)體集B中的一個實(shí)體至多與實(shí)體集A中的一個實(shí)體相聯(lián)系,則稱實(shí)體型A與實(shí)體型B有一對多聯(lián)系。(3)多對多聯(lián)系(m∶n)實(shí)體集A中的一個實(shí)體與實(shí)體集B中的n(n≥0)個實(shí)體相聯(lián)系,且實(shí)體集B中的一個實(shí)體與實(shí)體集A中的m(m≥0)個實(shí)體相聯(lián)系,則稱實(shí)體型A與實(shí)體型B之間有多對多聯(lián)系。概念模型的E-R圖表示方法03概念模型的表示方法有很多,其中最著名、最常用的是陳品山(PeterChen)于1976年提出的實(shí)體-聯(lián)系方法(Entity-RelationshipApproach),簡稱為E-R圖。E-R圖提供了表示實(shí)體、屬性和聯(lián)系的方法。在E-R圖中,用矩形表示實(shí)體,矩形內(nèi)部寫上實(shí)體名;用橢圓形表示屬性,內(nèi)部寫上屬性名,并用無向邊與相應(yīng)的實(shí)體相連。菱形表示聯(lián)系,內(nèi)部寫上聯(lián)系名,并用無向邊分別與有關(guān)實(shí)體相連,同時在無向邊旁標(biāo)上聯(lián)系的類型(1∶1,1∶n,m∶n)。E-R圖也可以表示兩個以上實(shí)體型之間或單個實(shí)體型內(nèi)部的聯(lián)系。例如,班級、學(xué)生和班干部3個實(shí)體型之間的一對多聯(lián)系,學(xué)生、教師和課程3個實(shí)體型之間的多對多聯(lián)系,以及教師實(shí)體內(nèi)部具有管理和被管理的一對多或多對多聯(lián)系(a)三個實(shí)體型一對多聯(lián)系
(b)三個實(shí)體型多對多聯(lián)系
(c)單個實(shí)體型內(nèi)部聯(lián)系層次模型
網(wǎng)狀模型面向?qū)ο竽P完P(guān)系模型邏輯模型層次模型01用樹形結(jié)構(gòu)表示實(shí)體類型及實(shí)體間聯(lián)系的數(shù)據(jù)模型稱為層次模型。它將實(shí)體之間的聯(lián)系抽象成一種自上而下的層次關(guān)系,用樹形結(jié)構(gòu)表示出來。父子節(jié)點(diǎn)之間的聯(lián)系是一對多聯(lián)系(1∶n)一個模型有且只有一個節(jié)點(diǎn)沒有雙親節(jié)點(diǎn),這個節(jié)點(diǎn)稱為根節(jié)點(diǎn)。層次模型的結(jié)構(gòu)特點(diǎn)根節(jié)點(diǎn)以外的其他節(jié)點(diǎn)有且只有一個雙親節(jié)點(diǎn)。層次模型的優(yōu)點(diǎn)是數(shù)據(jù)結(jié)構(gòu)簡單清晰、提供了良好的完整性支持、結(jié)構(gòu)間聯(lián)系簡單及數(shù)據(jù)查詢效率高等。但是這類模型不能直接表示兩個以上實(shí)體型間的復(fù)雜聯(lián)系,也不能表示實(shí)體型間的多對多聯(lián)系。模型受限、物理成分復(fù)雜等原因,使其不能用于表示非層次性的聯(lián)系。網(wǎng)狀模型02網(wǎng)狀模型在層次模型的基礎(chǔ)上去掉了兩個限制,可以更直接地描述現(xiàn)實(shí)世界。允許兩個節(jié)點(diǎn)之間有多種聯(lián)系允許一個節(jié)點(diǎn)有多個雙親節(jié)點(diǎn)允許一個以上的節(jié)點(diǎn)沒有雙親節(jié)點(diǎn)網(wǎng)狀模型的結(jié)構(gòu)特點(diǎn)網(wǎng)狀模型具有比層次模型更好的性能和高效率的存儲方式,但其數(shù)據(jù)結(jié)構(gòu)比較復(fù)雜,數(shù)據(jù)模式和系統(tǒng)實(shí)現(xiàn)均不理想。關(guān)系模型03關(guān)系模型的數(shù)據(jù)結(jié)構(gòu)是一張規(guī)范化的二維表,每個二維表都可以稱為關(guān)系,實(shí)體與實(shí)體之間的聯(lián)系也用關(guān)系表示。不同于前兩種模型,關(guān)系模型具有嚴(yán)格的數(shù)學(xué)理論依據(jù),結(jié)構(gòu)簡單易懂,存取路徑對用戶透明,具有更高的數(shù)據(jù)獨(dú)立性和安全保密性面向?qū)ο竽P?4以面向?qū)ο蟮挠^點(diǎn)描述實(shí)體的邏輯組織、對象間限制與聯(lián)系的模型是面向?qū)ο竽P汀_@類模型具有抽象性、封裝性、繼承性和多態(tài)性等特性,是面向?qū)ο蟮乃枷肱c數(shù)據(jù)庫技術(shù)相結(jié)合的產(chǎn)物,它能更完整地描述現(xiàn)實(shí)世界的數(shù)據(jù)結(jié)構(gòu),具有豐富的表達(dá)能力。但這類模型相對復(fù)雜,涉及知識比較多,目前普及程度不如關(guān)系模型。面向?qū)ο竽P蛿?shù)據(jù)庫系統(tǒng)根據(jù)不同的層次和角度可分為外部體系結(jié)構(gòu)和內(nèi)部體系結(jié)構(gòu)。從數(shù)據(jù)庫管理系統(tǒng)的角度看,雖然不同的數(shù)據(jù)庫系統(tǒng)實(shí)現(xiàn)的方式各不相同,但它們在內(nèi)部體系結(jié)構(gòu)上均可表示為三級模式結(jié)構(gòu),并提供二級映像?;谙鄬Ψ€(wěn)定的數(shù)據(jù)模式實(shí)現(xiàn)了數(shù)據(jù)的獨(dú)立性。數(shù)據(jù)庫系統(tǒng)的內(nèi)部體系結(jié)構(gòu)從邏輯上分為外模式、模式和內(nèi)模式三級抽象模式結(jié)構(gòu),并提供外模式/模式、模式/內(nèi)模式二級映像。
對于用戶而言,外模式、模式和內(nèi)模式分別對應(yīng)一般用戶模式、概念模式和物理模式,它們反映了看待數(shù)據(jù)庫的3個角度。數(shù)據(jù)庫系統(tǒng)的三級模式結(jié)構(gòu)和二級映像功能如右圖所示。模式01模式也稱為概念模式或概念視圖,是數(shù)據(jù)庫中全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,處于三級模式結(jié)構(gòu)的中間層,不涉及數(shù)據(jù)的物理存儲和硬件環(huán)境,與開發(fā)工具及程序設(shè)計語言無關(guān)。一個數(shù)據(jù)庫只有一個模式,模式是數(shù)據(jù)的邏輯表示,它描述了數(shù)據(jù)庫中存儲的具體數(shù)據(jù)及其之間存在的聯(lián)系。外模式02外模式又稱子模式或用戶模式,它是三級結(jié)構(gòu)的最外層,是數(shù)據(jù)庫用戶能夠看到并允許使用的那部分?jǐn)?shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,是數(shù)據(jù)庫用戶的數(shù)據(jù)視圖。外模式是模式的子集,一個數(shù)據(jù)庫可以有多個外模式。用戶可以根據(jù)系統(tǒng)所給的外模式,用查詢語言或應(yīng)用程序去操作部分?jǐn)?shù)據(jù),數(shù)據(jù)庫中的其余數(shù)據(jù)對于用戶來說是不可見的,所以外模式也是保證數(shù)據(jù)庫安全的一種有力措施。內(nèi)模式03內(nèi)模式又稱存儲模式或物理模式,是三層結(jié)構(gòu)中的最內(nèi)層,也是最靠近物理存儲的一層。它是對數(shù)據(jù)庫存儲結(jié)構(gòu)的描述,是數(shù)據(jù)在數(shù)據(jù)庫內(nèi)部的表達(dá)方式。為了在數(shù)據(jù)庫系統(tǒng)中實(shí)現(xiàn)3個抽象層次的聯(lián)系與轉(zhuǎn)換,數(shù)據(jù)庫管理系統(tǒng)在這三級模式之間提供了外模式/模式和模式/內(nèi)模式的二級映像。外模式/模式映像01數(shù)據(jù)庫中的同一個模式可以有任意多個外模式,對于每一個外模式,都存在一個外模式/模式映像,它確定了數(shù)據(jù)庫的局部邏輯結(jié)構(gòu)與全局邏輯結(jié)構(gòu)之間的對應(yīng)關(guān)系。
例如,在學(xué)生的邏輯結(jié)構(gòu)(學(xué)號,姓名,性別)中添加新的屬性“系別”時,學(xué)生的邏輯結(jié)構(gòu)變?yōu)椋▽W(xué)號,姓名,性別,系別),由數(shù)據(jù)庫管理員對各個外模式/模式映像做出相應(yīng)的改變,保證了數(shù)據(jù)的局部邏輯結(jié)構(gòu)不變,也就是保證了外模式不變。同樣,因?yàn)閼?yīng)用程序是依據(jù)數(shù)據(jù)的局部邏輯結(jié)構(gòu)所編寫,所以應(yīng)用程序不必改變,保證了數(shù)據(jù)與程序間的邏輯獨(dú)立性。模式/內(nèi)模式映像02數(shù)據(jù)庫中只有一個模式和一個內(nèi)模式,所以模式/內(nèi)模式映像是唯一的。模式/內(nèi)模式映像定義了數(shù)據(jù)的全局邏輯結(jié)構(gòu)與存儲結(jié)構(gòu),也就是模式與內(nèi)模式之間的關(guān)系。當(dāng)數(shù)據(jù)的存儲結(jié)構(gòu)發(fā)生變化,只需數(shù)據(jù)庫管理員對模式/內(nèi)模式映像做出相應(yīng)的改變,就能使模式保持不變,從而使應(yīng)用程序也不用發(fā)生改變,確保了數(shù)據(jù)的物理獨(dú)立性。隨著計算機(jī)軟硬件技術(shù)的進(jìn)步,特別是大數(shù)據(jù)、云計算的出現(xiàn),數(shù)據(jù)庫技術(shù)獲得了快速發(fā)展,新技術(shù)和新系統(tǒng)層出不窮。云數(shù)據(jù)庫01
云數(shù)據(jù)庫(CloudDataBase)是指被優(yōu)化或部署到一個虛擬計算環(huán)境中的數(shù)據(jù)庫。具有按需付費(fèi)、按需擴(kuò)展、高可用性及存儲整合等優(yōu)勢。01020304可以使用戶按照存儲容量和帶寬的需求付費(fèi)因?yàn)樵茢?shù)據(jù)庫基本采用多租戶的形式,能夠以共享資源的形式節(jié)省用戶的開銷??蓪?shí)現(xiàn)按需擴(kuò)展理論上云數(shù)據(jù)庫具有無限的可擴(kuò)展性,具有良好的彈性。云的可移植性可移植性是指可以將數(shù)據(jù)庫從一個地方移到另一個地方。用戶不必控制運(yùn)行原始數(shù)據(jù)庫,只需要一個有效的連接字符串就可以使用云數(shù)據(jù)庫。高可用性不存在單點(diǎn)失效的問題,一個節(jié)點(diǎn)失效,剩余的節(jié)點(diǎn)會接管任務(wù)。將一個現(xiàn)有的數(shù)據(jù)庫優(yōu)化到云環(huán)境,有以下好處:分布式數(shù)據(jù)庫02
分布式數(shù)據(jù)庫(DistributedDataBase)是指數(shù)據(jù)分別存儲在計算機(jī)網(wǎng)絡(luò)中的各臺計算機(jī)上的數(shù)據(jù)庫。分布式數(shù)據(jù)庫系統(tǒng)通常使用較小的計算機(jī)系統(tǒng),每臺計算機(jī)可單獨(dú)放在一個地方,其中都可能有DBMS的一份完整拷貝副本,或者部分拷貝副本,并具有自己局部的數(shù)據(jù)庫,位于不同地點(diǎn)的許多計算機(jī)通過網(wǎng)絡(luò)互相連接,共同組成一個完整的、全局的、邏輯上集中且物理上分布的大型數(shù)據(jù)庫。分布式數(shù)據(jù)庫相對傳統(tǒng)集中式數(shù)據(jù)庫具有更高的數(shù)據(jù)訪問速度、更強(qiáng)的可擴(kuò)展性和更高的并發(fā)訪問量等優(yōu)點(diǎn)。大數(shù)據(jù)01
大數(shù)據(jù)(BigData)也稱海量數(shù)據(jù)或巨量數(shù)據(jù),是指數(shù)據(jù)量大到無法利用傳統(tǒng)數(shù)據(jù)處理技術(shù)在合理的時間內(nèi)獲取、存儲、管理和分析的數(shù)據(jù)集合。
“大數(shù)據(jù)”一詞除用來描述信息時代產(chǎn)生的海量數(shù)據(jù)外,也用來命名與之相關(guān)的技術(shù)、創(chuàng)新與應(yīng)用。大數(shù)據(jù)的特征(4V)海量的數(shù)據(jù)規(guī)模(Volume)快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)價值密度低(Value)多樣的數(shù)據(jù)類型(Variety)大數(shù)據(jù)采集大數(shù)據(jù)預(yù)處理大數(shù)據(jù)存儲與管理大數(shù)據(jù)分析與挖掘大數(shù)據(jù)可視化展現(xiàn)大數(shù)據(jù)技術(shù)是指用非傳統(tǒng)的方式對大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,以挖掘出數(shù)據(jù)中蘊(yùn)含的價值的技術(shù)。根據(jù)大數(shù)據(jù)的處理流程,可以將其關(guān)鍵技術(shù)分為右側(cè)展現(xiàn)的技術(shù)。對于網(wǎng)絡(luò)上各種來源的數(shù)據(jù),包括社交網(wǎng)絡(luò)數(shù)據(jù)、電子商務(wù)交易數(shù)據(jù)、網(wǎng)上銀行交易數(shù)據(jù)、搜索引擎點(diǎn)擊數(shù)據(jù)、物聯(lián)網(wǎng)傳感器數(shù)據(jù)等,在被采集前都是零散的,沒有任何意義。大數(shù)據(jù)采集就是將這些數(shù)據(jù)寫入數(shù)據(jù)倉庫,整合在一起,以便對數(shù)據(jù)進(jìn)行綜合分析。
大數(shù)據(jù)采集包括網(wǎng)絡(luò)日志采集、網(wǎng)絡(luò)文件采集(提取網(wǎng)頁中的圖片、文本等)、關(guān)系型數(shù)據(jù)庫的接入等,常用的工具有Flume,Kakfa,Sqoop等。(1)大數(shù)據(jù)采集由于大數(shù)據(jù)的來源和種類繁多,這些數(shù)據(jù)有殘缺的、有虛假的、有過時的,因此,想要獲得高質(zhì)量的數(shù)據(jù)分析結(jié)果,必須在數(shù)據(jù)準(zhǔn)備階段提高數(shù)據(jù)的質(zhì)量,即對大數(shù)據(jù)進(jìn)行預(yù)處理。
大數(shù)據(jù)預(yù)處理是指將雜亂無章的數(shù)據(jù)轉(zhuǎn)化為相對單一且便于處理的結(jié)構(gòu)(數(shù)據(jù)抽?。?,或去除沒有價值甚至?xí)Ψ治鲈斐筛蓴_的數(shù)據(jù)(數(shù)據(jù)清洗),從而為后期的數(shù)據(jù)分析奠定基礎(chǔ)。(2)大數(shù)據(jù)預(yù)處理大數(shù)據(jù)存儲是指用存儲器把采集到的數(shù)據(jù)存儲起來,并建立相應(yīng)的數(shù)據(jù)庫,以便對數(shù)據(jù)進(jìn)行管理和調(diào)用。目前,主要采用HDFS分布式文件系統(tǒng)(HadoopDistributedFileSystem)和非關(guān)系型分布式數(shù)據(jù)庫(NoSQL)來存儲和管理大數(shù)據(jù)。常用的NoSQL數(shù)據(jù)庫包括HBase,Redis,Cassandra,MongoDB,Neo4j等。(3)大數(shù)據(jù)存儲與管理大數(shù)據(jù)分析與挖掘是指通過各種算法從大量的數(shù)據(jù)中找出潛在的有用信息,并研究數(shù)據(jù)的內(nèi)在規(guī)律和相互間的關(guān)系。常用的大數(shù)據(jù)分析與挖掘技術(shù)包括Spark,MapReduce,Hive,Pig,F(xiàn)link,Impala,Kylin,Tez,Akka,Storm,S4,Mahout,MLlib等。(4)大數(shù)據(jù)分析與挖掘大數(shù)據(jù)可視化展現(xiàn)是指利用可視化手段對數(shù)據(jù)進(jìn)行分析,并將分析結(jié)果用圖表或文字等形式展現(xiàn)出來,從而使讀者對數(shù)據(jù)的分布、發(fā)展趨勢、相關(guān)性和統(tǒng)計信息等一目了然。目前,常用的大數(shù)據(jù)可視化工具有Echarts和Tableau等。(5)大數(shù)據(jù)可視化展現(xiàn)主動數(shù)據(jù)庫02傳統(tǒng)數(shù)據(jù)庫一般只根據(jù)應(yīng)用程序的要求對數(shù)據(jù)庫進(jìn)行基本操作,僅作為一種被動的數(shù)據(jù)倉庫存在。主動數(shù)據(jù)庫(ActiveDataBase)是指在沒有用戶干預(yù)的情況下,能夠主動地對系統(tǒng)內(nèi)部或外部所發(fā)生的事件做出反應(yīng)的數(shù)據(jù)庫,是數(shù)據(jù)庫技術(shù)與人工智能技術(shù)相結(jié)合的產(chǎn)物。主動數(shù)據(jù)庫最大的特點(diǎn)就是讓數(shù)據(jù)庫系統(tǒng)具有主動服務(wù)的功能,并以一種統(tǒng)一的機(jī)制來實(shí)現(xiàn)各種主動服務(wù)需求。系統(tǒng)提供一個自動監(jiān)視模塊,不時地檢查著規(guī)劃中包含的各種事件是否發(fā)生,一旦發(fā)現(xiàn)某事件發(fā)生,就主動觸發(fā)執(zhí)行某個動作。這樣一來,數(shù)據(jù)庫管理系統(tǒng)就可以自動執(zhí)行由用戶預(yù)先設(shè)定的動作,可把諸如完整性約束、存取控制、例外處理、監(jiān)督和警告、狀態(tài)開關(guān)自動切換及檢索策略的切換,乃至復(fù)雜的演繹推理和實(shí)時處理等功能以一種統(tǒng)一的機(jī)制實(shí)施。雖然主動數(shù)據(jù)庫還有待發(fā)展,但其已經(jīng)在計算機(jī)集成制造、網(wǎng)絡(luò)管理和辦公自動化等領(lǐng)域有了廣泛的應(yīng)用。數(shù)據(jù)倉庫01反映歷史變化。數(shù)據(jù)倉庫系統(tǒng)通常記錄一個單位從過去某一時間點(diǎn)到目前時間點(diǎn)所有時期的信息,可通過這些信息對這一單位的發(fā)展歷程和未來趨勢做出分析和預(yù)測。面向主題。數(shù)據(jù)倉庫中的數(shù)據(jù)按照一定的主題域進(jìn)行組織,它們劃分為各自獨(dú)立的領(lǐng)域,每個領(lǐng)域都有自己的邏輯內(nèi)涵且互補(bǔ)不交叉。數(shù)據(jù)倉庫(DataWarehouse)是面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,通常用于輔助決策支持。集成性。數(shù)據(jù)倉庫中的數(shù)據(jù)是對原有分散的數(shù)據(jù)庫數(shù)據(jù)做抽取、清理后經(jīng)過加工匯總得到的,源數(shù)據(jù)經(jīng)統(tǒng)一與綜合之后才能進(jìn)入數(shù)據(jù)倉庫。相對穩(wěn)定。數(shù)據(jù)一旦加載到數(shù)據(jù)倉庫,一般情況下不會再修改或刪除,而是作為數(shù)據(jù)檔案長期保存。數(shù)據(jù)挖掘02
數(shù)據(jù)挖掘(DataMining)是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,也稱為知識發(fā)現(xiàn)。
簡單來講,數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識。數(shù)據(jù)挖掘間接挖掘在所有的屬性中尋找某種關(guān)系,如關(guān)聯(lián)規(guī)則和聚類等。直接挖掘利用可用的數(shù)據(jù)建立一個模型,這個模型是對一個特定屬性的描述,如分類、估值和預(yù)測等數(shù)據(jù)挖掘是交叉性學(xué)科,它是數(shù)據(jù)庫技術(shù)、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)、人工智能、可視化分析和模式識別等多門學(xué)科的融合。
它把現(xiàn)代企業(yè)中的原始數(shù)據(jù)轉(zhuǎn)換為人工智能的來源,對數(shù)據(jù)進(jìn)行操縱,提供可靠的、可以用來決策的信息。實(shí)戰(zhàn)目的01(1)學(xué)習(xí)使用PowerDesigner建模工具繪制概念模型圖(即E-R圖)。(2)學(xué)習(xí)使用PowerDesigner建模工具生成物理模型圖及對應(yīng)的SQL語句。實(shí)戰(zhàn)內(nèi)容及步驟02下面以訂貨管理系統(tǒng)(見右圖)為例,介紹在PowerDesigner中繪制概念模型圖的操作步驟。步驟1啟動PowerDesigner,其操作界面如圖所示。步驟2新建概念模型圖。在“ObjectBrowser”窗口中右擊“Workspace”,在彈出的快捷菜單中選擇“New”→“ConceptualDataModel”選項(xiàng),打開“NewConceptualDataModel”對話框,將模塊名修改為“訂貨管理”,單擊“OK”按鈕,如圖所示。步驟3添加客戶實(shí)體。在“Toolbox”窗口中選擇“Entity”選項(xiàng)
,然后在編輯窗口的合適位置單擊,即可添加實(shí)體。右擊編輯窗口空白處,使鼠標(biāo)變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院老人康復(fù)訓(xùn)練指導(dǎo)制度
- 《服務(wù)成就價值》課件
- 技術(shù)合同范本
- 2024年塔吊司機(jī)安全操作培訓(xùn)與勞動權(quán)益保障協(xié)議3篇
- 6 《哈姆萊特(節(jié)選)》(學(xué)案)-教案課件-部編高中語文必修下冊
- 2024年生日蛋糕定制與航空旅行禮品合作合同2篇
- 《脊柱區(qū)局部解剖學(xué)》課件
- 2025年湖北貨運(yùn)上崗證模擬考試題
- 2024年水路貨物運(yùn)輸節(jié)能減排管理細(xì)則合同3篇
- 2025年太原貨運(yùn)從業(yè)資格考試模擬考試題目及答案
- 技術(shù)工程部崗位職責(zé)說明書(工程部)
- 整理版鉸接式護(hù)坡施工指南
- 《光輝歲月》教案
- 英文審稿意見匯總
- 兒童早期口腔健康管理-948-2020年華醫(yī)網(wǎng)繼續(xù)教育答案
- 鋼卷尺檢定證書
- 新人教版五年級數(shù)學(xué)《位置》教學(xué)設(shè)計(第1課時) (2)
- 新電氣符號國標(biāo)
- 綜采隊班組民主會議記錄
- 三角函數(shù)及解三角形在高考中的地位和應(yīng)對策略
- 向下管理高爾夫?qū)崙?zhàn)
評論
0/150
提交評論