第三章 數(shù)據(jù)管理_第1頁
第三章 數(shù)據(jù)管理_第2頁
第三章 數(shù)據(jù)管理_第3頁
第三章 數(shù)據(jù)管理_第4頁
第三章 數(shù)據(jù)管理_第5頁
已閱讀5頁,還剩73頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三章數(shù)據(jù)管理第一節(jié)數(shù)據(jù)管理概述數(shù)據(jù)與信息是密切相關(guān)聯(lián)的,數(shù)據(jù)是信息的具體表現(xiàn)形式,它反映了信息的內(nèi)容。二、數(shù)據(jù)組織的層次一、信息與數(shù)據(jù)數(shù)據(jù)項(Field):是具有確定邏輯意義的數(shù)據(jù)的最小單位。用于說明事物的某方面性質(zhì)。數(shù)據(jù)庫(DataBase):存儲起來的相關(guān)數(shù)據(jù)的集合。記錄(Record):具有一定關(guān)系的數(shù)據(jù)項的一個有序集合。用于說明一個客觀存在的事物(或事物之間的聯(lián)系)。文件(File):同類記錄的有序集合。如圖關(guān)鍵字(Keyword):能唯一標識一條記錄的數(shù)據(jù)項的最小集合。數(shù)據(jù)庫中的數(shù)據(jù)由數(shù)據(jù)庫管理系統(tǒng)(DBMS)統(tǒng)一管理。三、數(shù)據(jù)管理技術(shù)的發(fā)展1.人工管理階段數(shù)據(jù)管理的特點:沒有軟件系統(tǒng)對數(shù)據(jù)進行管理;數(shù)據(jù)和程序結(jié)合為一個不可分割的整體;一組數(shù)據(jù)對應(yīng)于一個應(yīng)用程序。20世紀50年代中期以前。應(yīng)用程序1應(yīng)用程序2應(yīng)用程序n數(shù)據(jù)組1數(shù)據(jù)組2數(shù)據(jù)組n數(shù)據(jù)1數(shù)據(jù)2數(shù)據(jù)n.........人工管理下數(shù)據(jù)與應(yīng)用程序的聯(lián)系2.文件管理階段20世紀在50年代后期~60年代中期數(shù)據(jù)管理的特點:有了軟件系統(tǒng)對數(shù)據(jù)進行管理,程序與數(shù)據(jù)之間有了一定的獨立性;文件系統(tǒng)是用戶應(yīng)用程序與數(shù)據(jù)文件間的接口;各文件相互獨立,分散保管,數(shù)據(jù)的一致性不易控制。缺點:數(shù)據(jù)仍然是面向應(yīng)用的、文件不易擴充、數(shù)據(jù)共享有限等。應(yīng)用程序1應(yīng)用程序2應(yīng)用程序n......文件系統(tǒng)中數(shù)據(jù)與應(yīng)用程序的聯(lián)系文件2文件1文件n文件系統(tǒng)數(shù)據(jù)庫在數(shù)據(jù)管理方面的特點:3.數(shù)據(jù)庫系統(tǒng)階段20世紀60年代末期1.數(shù)據(jù)面向整體系統(tǒng)而不是面向某個應(yīng)用2.數(shù)據(jù)冗余度(dataredundancy)小4.數(shù)據(jù)共享性好3.具有較好的數(shù)據(jù)獨立性物理獨立性:數(shù)據(jù)的物理組織發(fā)生變化不影響數(shù)據(jù)的邏輯結(jié)構(gòu)。邏輯獨立性:數(shù)據(jù)庫的邏輯結(jié)構(gòu)改變時,無需改變應(yīng)用程序。5.數(shù)據(jù)的一致性好6.數(shù)據(jù)安全性、完整性和并發(fā)性保障第二節(jié)數(shù)據(jù)庫及其管理系統(tǒng)一、概述現(xiàn)實世界(RealWorld):存在于人們頭腦之外的客觀世界。信息世界(InformationWorld):現(xiàn)實世界在人們頭腦中的反映,人們把它用文字和符號記載下來。數(shù)據(jù)世界(DataWorld):信息世界的信息在機器世界中以數(shù)據(jù)形式存儲??陀^事物信息數(shù)據(jù)

認識形象化、具體化信息模型:實體、屬性、聯(lián)系事物:對象性質(zhì)聯(lián)系數(shù)據(jù)模型:實體文件、記錄屬性數(shù)據(jù)項(字段)聯(lián)系三個世界的關(guān)系:現(xiàn)實世界信息世界數(shù)據(jù)世界例子全體事物間關(guān)系實體集聯(lián)系(m:n)文件某廠全體職工的個人數(shù)據(jù)資料設(shè)備與零部件的加工關(guān)系個體實體記錄職工張三的數(shù)據(jù)特征事物間關(guān)系屬性聯(lián)系(1:1和1:n)數(shù)據(jù)項張三,男,25,工程師班級和學(xué)生的所屬關(guān)系三個世界術(shù)語對應(yīng)表客觀事物的關(guān)系與性質(zhì)實體聯(lián)系屬性數(shù)據(jù)庫文件記錄數(shù)據(jù)項轉(zhuǎn)換認識抽象信息世界現(xiàn)實世界數(shù)據(jù)世界二、信息模型實體(Entity):是指客觀存在的事物。

Entity:Aperson,place,thing,oreventaboutwhichinformationmustbekept.屬性(Attribute):是指實體具有的性質(zhì)或特性。

Attribute:Apieceofinformationdescribingaparticularentity.1.信息模型的要素例如:學(xué)生,課程,班級等。

實體個體:是指能相互區(qū)分的,特定的單個實體。實體集:同類個體的集合。

例如:學(xué)生(學(xué)號、姓名、性別等)

主碼:能唯一地標識一個實體的一個屬性或?qū)傩越M。

屬性由屬性名和屬性值來描述。例如:學(xué)生(學(xué)號、姓名)990001王丹實體與屬性的區(qū)分是相對的。實體型:屬性名的組合。一個實體型就代表了一個實體集。

聯(lián)系(Relationship)聯(lián)系是指客觀存在的事物之間的相互聯(lián)系。Relationship:arelationbetweenvariousentities.2.兩個實體集之間的聯(lián)系方式一對一聯(lián)系(1:1)實體集A中的任一個體至多與實體集B中的一個個體有聯(lián)系,實體集B中的任一個體也至多與實體集A中的一個個體有聯(lián)系,則稱實體集A與實體集B的聯(lián)系為一對一的聯(lián)系。

。。。。。。。。。。。。。。BA例如:班級與班長;車間與車間主任。一對多聯(lián)系(1:N)

。。。。。

。。。。。。。BA

如果實體集A中至少有一個個體與實體集B中的一個以上個體有聯(lián)系,且實體集B中的任一個體至多與實體集A中的一個個體有聯(lián)系,則稱實體集A與實體集B的聯(lián)系為一對多的聯(lián)系。例如:班級與學(xué)生;車間與工人。多對多聯(lián)系(M:N)。。。。。。。

。。。。。。。AB

如果實體集A中至少有一個個體與實體集B中的一個以上個體有聯(lián)系,且實體集B中至少有一個個體與實體集A中的一個以上個體有聯(lián)系,則稱實體集A與實體集B的聯(lián)系為多對多的聯(lián)系。例如:課程與學(xué)生;車間與零部件。3.建立信息模型的方法

建立信息模型就是要找出其實體集、實體集的屬性、實體集的聯(lián)系。E—RmodelAmethodologyfordocumentingDatabaseillustratingtherelationshipbetweenvariousentitiesinthedatabase.

1)實體—聯(lián)系方法(Entity—RelationshipApproach簡稱:E—R法)應(yīng)用E—R法建立的信息模型稱E—R模型。學(xué)生學(xué)號屬性實體集聯(lián)系2)E—R模型中

使用的符號:3)畫E—R圖步驟確定或者設(shè)計主碼

確定實體集

建立聯(lián)系對調(diào)查的組織進行認真的、仔細的分析和歸納,形成一個個實體集。在有關(guān)的實體集之間建立聯(lián)系,然后仔細進行分析和判斷,確定聯(lián)系的類型。標注各個實體集(或聯(lián)系)的屬性,并認真分析,確定每個實體的主碼,若不存在主碼,則設(shè)計一代碼作主碼。確定單一的父子關(guān)系結(jié)構(gòu)將M:N類型的聯(lián)系作為一個實體,這個聯(lián)系實體至少有兩個屬性,一般還具有自己的屬性。學(xué)生成績管理系統(tǒng)的E—R模型MN1N班級學(xué)生課程從屬選課班級人數(shù)名稱課程課號課名學(xué)時學(xué)生姓名學(xué)號性別……選課學(xué)號課程號成績練習(xí)題1、在生產(chǎn)車間管理數(shù)據(jù)庫的設(shè)計中,根據(jù)以下描述畫出實體——關(guān)系圖(E-R圖);各實體屬性列出三個即可。每個車間有一個車間主任,多名職工,可以加工使用多個零件;而每個車間主任只可管理一個車間,每個職工只屬于一個車間,有些零件可被多個車間加工使用。M11N零部件加工車間車間主任管理N11職工工作職工工號學(xué)歷姓名……車間代號面積名稱……零部件代號材料名稱……車間主任代號學(xué)歷姓名……數(shù)量加工車間代號數(shù)量零部件號……4)E—R圖特點一個聯(lián)系可定義在兩個以上的實體集上。如圖一個聯(lián)系可以定義在一個集合自身之上。如圖對給定的實體集,可以有兩個以上的聯(lián)系,他們必須給予不同的聯(lián)系名稱。如圖聯(lián)系的類型必須標注清楚。各實體的屬性可以不在E-R圖中描述,單獨進行描述。如圖5)如何區(qū)分實體與屬性盡量減少實體集,能作為屬性時不要作為實體集。作為屬性的事物,不能再有需要描述的性質(zhì)(屬性),也不能與其它事物有聯(lián)系。如圖作為屬性的事物與所描述的實體間只能是1:N(1:1)的對應(yīng)關(guān)系。如圖練習(xí)試按以下描述畫出實體——關(guān)系圖(E-R圖)。每種商品只能存放在某一倉庫中,每個倉庫卻可以存放不同的商品;每種商品可由多個銷售人員銷售給多個零售商,每個銷售人員也可以銷售多種商品給多個零售商,每個零售商可從多個銷售人員購買多種商品。各實體屬性列出三個即可。商品單價商品號名稱工齡姓名庫號大小位置N1MN銷售儲存銷售人員商品倉庫工號數(shù)量數(shù)量零售商號名稱地址L零售商三、數(shù)據(jù)模型1.數(shù)據(jù)模型與信息模型的關(guān)系數(shù)據(jù)模型是數(shù)據(jù)組織中各層次內(nèi)部、外部之間聯(lián)系的描述。是面向數(shù)據(jù)庫中數(shù)據(jù)的邏輯結(jié)構(gòu)。實體-實體型-實體集-個體-屬性-屬性名-屬性值-記錄;文件;數(shù)據(jù)項;特定記錄;

記錄型;數(shù)據(jù)項型;數(shù)據(jù)項值;數(shù)據(jù)庫不僅要描述數(shù)據(jù)項、記錄之間的聯(lián)系,而且要描述記錄型之間,也就是各種文件之間的聯(lián)系。2.常見數(shù)據(jù)模型概述網(wǎng)狀模型(networkmodel)層次模型(hierarchicalmodel)層次模型的數(shù)據(jù)結(jié)構(gòu)是一種樹型結(jié)構(gòu)。層次模型是有且僅有一個節(jié)點無雙親節(jié)點,這個節(jié)點即為樹根,而其它有且僅有一個雙親節(jié)點。如圖特點:處理效率較低,難以描述N:M的聯(lián)系。網(wǎng)狀模型是可以有一個以上的節(jié)點無父節(jié)點,且至少有一個節(jié)點的父節(jié)點多于一個。如圖網(wǎng)狀模型中,允許兩個記錄型間有兩種以上的聯(lián)系。如圖缺點:數(shù)據(jù)庫結(jié)構(gòu)復(fù)雜,因為記錄型之間的聯(lián)系是通過存取路徑實現(xiàn)的,加重應(yīng)用程序編寫的負擔。

關(guān)系模型(RelationalModel)關(guān)系模型是把數(shù)據(jù)的邏輯結(jié)構(gòu)歸結(jié)為滿足一定條件的二維表的模型,每一個關(guān)系為一個二維表,相當于一個文件。實體集及實體集間聯(lián)系,通過關(guān)系進行描述。如表關(guān)系模型的特點:用人們最熟悉的表格數(shù)據(jù)的形式,描述數(shù)據(jù)記錄之間的聯(lián)系。班號人數(shù)班級關(guān)系框架姓名年齡性別學(xué)生關(guān)系框架課號課名學(xué)時課程關(guān)系框架關(guān)系由關(guān)系框架和若干元組組成。如表姓名性別職稱教師關(guān)系框架關(guān)系模型的數(shù)據(jù)結(jié)構(gòu)在關(guān)系模型中,無論是對實體集還是實體集之間的聯(lián)系,均可以用關(guān)系來描述。例如從E-R圖導(dǎo)出關(guān)系數(shù)據(jù)模型把E-R圖轉(zhuǎn)換為一個個關(guān)系框架關(guān)鍵問題:怎樣建立不同聯(lián)系的關(guān)系模型。

對應(yīng)E-R圖中聯(lián)系,要根據(jù)聯(lián)系方式的不同,采取不同手段以使被它聯(lián)系的實體所對應(yīng)的關(guān)系彼此實現(xiàn)某種聯(lián)系。E-R圖中每一個實體,都相應(yīng)地轉(zhuǎn)換為一個關(guān)系,該關(guān)系應(yīng)包括對應(yīng)實體的全部屬性,并確定關(guān)鍵字。具體方法:1)如果兩個實體間是1:N聯(lián)系,就將“1”方的關(guān)鍵字納入“N”方實體對應(yīng)的關(guān)系中作為外部關(guān)鍵字,同時把聯(lián)系的屬性也一并納入“N”方的關(guān)系中。例如從E-R圖導(dǎo)出關(guān)系數(shù)據(jù)模型3)如果兩個實體間是1:1聯(lián)系,聯(lián)系本身并無屬性,轉(zhuǎn)換時只要在某個實體的關(guān)系中增加另一實體的關(guān)鍵字作為屬性即可,就能實現(xiàn)彼此間1:1

聯(lián)系。2)如果兩個實體間是M:N聯(lián)系,則需對聯(lián)系單獨建立一個關(guān)系,用來聯(lián)系雙方實體,該關(guān)系的屬性中至少要包括被它所聯(lián)系的雙方實體的關(guān)鍵字,如果聯(lián)系有屬性,也要納入這個聯(lián)系中。例如例如例題按照如下的實體聯(lián)系圖,完成關(guān)系數(shù)據(jù)庫邏輯模式的設(shè)計。M11N零部件加工聯(lián)系車間車間主任管理聯(lián)系N11職工工作聯(lián)系職工號學(xué)歷姓名……車間號面積名稱……零件號材料名稱……職工號學(xué)歷姓名……數(shù)量職工職工號,姓名,……,學(xué)歷,車間號車間車間號,車間名,……,面積零部件零部件號,零部件名,……,材料加工

車間號,零部件號,……,數(shù)量車間主任職工號,姓名,……,學(xué)歷,車間號零部件零部件號零部件名規(guī)格數(shù)量組成零部件(零部件號,零部件名,規(guī)格)組成(零部件號,子零部件號,數(shù)量)

一個聯(lián)系定義在一個集合自身之上MN職工領(lǐng)導(dǎo)1N學(xué)歷性別姓名工號職工(工號,姓名,性別,學(xué)歷,經(jīng)理工號)倉庫商品商店倉庫號倉庫名地址數(shù)量商店號商品名商品號商店名日期進貨MNP倉庫(倉庫號,倉庫名,地址)商店(商店號,商店名)商品(商品號,商品名)進貨(商店號,商品號,倉庫號,日期,數(shù)量)

一個聯(lián)系定義在兩個以上的實體集上關(guān)系的規(guī)范化第一范式(1NF):①關(guān)系中每個數(shù)據(jù)項(元組中每個分量)必須是一個不可分的數(shù)據(jù)項,且要求數(shù)據(jù)項沒有重復(fù)組。②列是同質(zhì)的,即每一列中所有數(shù)據(jù)項類型相同。各列指定一個相異的名字,列的次序任意。③各行相異,不允許有重復(fù)的行,行的次序任意。第二范式(2NF):指每個表必須有一個(且僅有一個)數(shù)據(jù)元素為主關(guān)鍵字,其它數(shù)據(jù)元素完全依賴于主關(guān)鍵字。第三范式(3NF):指表中的所有數(shù)據(jù)元素不但要能夠唯一地被主關(guān)鍵字所標識,而且它們之間還必須相互獨立,不存在其它的函數(shù)關(guān)系。如表如表如表第二節(jié)數(shù)據(jù)庫及其管理系統(tǒng)三、數(shù)據(jù)模型關(guān)系模式規(guī)范化練習(xí)車間考核職工完成生產(chǎn)定額關(guān)系W:W(日期,工號,姓名,工種,定額,超額,車間,車間主任)[分析]1.確定主關(guān)鍵字

因每個職工,每個月超額情況不同,而定額一般很少變動,因此為了識別不同職工以及同一職工不同月份超額情況,確定主關(guān)鍵字為“日期+工號”。

“超額”完全依賴于主關(guān)鍵字;“姓名”、“工種”和“車間”部分依賴于主關(guān)鍵字中的“工號”;“定額”直接依賴于“工種”;“車間主任”直接依賴于“車間”。[分析]

2.用箭頭標出各數(shù)據(jù)元素的函數(shù)依賴情況:工號日期超額車間工種姓名完全決定部分決定車間主任定額直接直接間接間接W(日期,工號,姓名,工種,超額,定額,車間,車間主任)[結(jié)論]

規(guī)范化后的表:(工號,姓名,工種,車間)(工種,定額)(日期,工號,超額)(車間,車間主任)范式化1、選課關(guān)系(學(xué)號,姓名,年齡,課程號,成績,學(xué)分)學(xué)生(學(xué)號,姓名,年齡);

課程(課程號,學(xué)分);

選課(學(xué)號,課程號,成績)。

2、學(xué)生關(guān)系(學(xué)號,姓名,年齡,所在學(xué)院,學(xué)院地點,學(xué)院電話)學(xué)生(學(xué)號,姓名,年齡,所在學(xué)院);

學(xué)院(學(xué)院,地點,電話)。將下列表轉(zhuǎn)化為符合范式關(guān)系的表

關(guān)系數(shù)據(jù)庫模型2014503/01/0101/13/0140585013702/29/0101/12/01203812015202/22/0102/02/014058數(shù)量零件號發(fā)貨日期訂貨日期供應(yīng)商編號145137152零件號鐵70.00壓縮機鋁22.50門把手鋼26.25門鎖材質(zhì)單價零件名稱112520384058供應(yīng)商編號智遠公司先鋒公司光明公司供應(yīng)商名稱112324海濱路51號114321五四路32號116044人民路44號郵編供應(yīng)商地址零件表供應(yīng)商表訂貨表10013705/01/0103/13/0140581014505/23/0104/05/011125從光明公司購進了哪些零件,數(shù)量?關(guān)系數(shù)據(jù)庫基本操作關(guān)系數(shù)據(jù)庫的三種基本操作:選擇:在表中找出符合指定條件的記錄;連接:把相關(guān)的表合并起來,向用戶提供比單個表更多的信息;投影:在已有表的基礎(chǔ)上,選定所需的列建立一個新表。在關(guān)系數(shù)據(jù)庫中,用戶需要用多個相關(guān)聯(lián)的表中的信息來生成管理所需要的報表,通過關(guān)系運算,可以將任何兩個有共同數(shù)據(jù)項的表關(guān)聯(lián)起來,這就是關(guān)系數(shù)據(jù)庫的威力所在。四、數(shù)據(jù)庫的結(jié)構(gòu)2.模式(Schema)內(nèi)模式是數(shù)據(jù)庫的存儲模式。具體描述了數(shù)據(jù)如何組織并存儲。內(nèi)模式一般由系統(tǒng)程序員根據(jù)計算機系統(tǒng)的軟硬件配置決定數(shù)據(jù)存取方式,并編制程序?qū)崿F(xiàn)存取。模式又稱概念模式,它是全局邏輯級的,是數(shù)據(jù)庫的整體邏輯結(jié)構(gòu),這種模式是數(shù)據(jù)庫管理員DBA看到的數(shù)據(jù)庫。此模式的設(shè)計與維護由專家和DBA實施。1.外模式(ExternalSchema)外模式又稱子模式,它是局部邏輯級的結(jié)構(gòu),是用戶可以看到和使用的數(shù)據(jù)庫。3.內(nèi)模式(InternalSchema)4.物理數(shù)據(jù)庫指數(shù)據(jù)庫在物理存儲設(shè)備上的組織。將下表進行范式化處理教師代碼姓名職稱研究課題號研究課題名教師代碼姓名職稱研究課題號研究課題名非2NF關(guān)系1.教師關(guān)系:(教師代碼,姓名,職稱)2.課題關(guān)系:(研究課題號,研究課題名)3.教師與課題關(guān)系:(教師代碼,研究課題號)將下表進行范式化處理產(chǎn)品代碼產(chǎn)品名生產(chǎn)廠名生產(chǎn)廠地址非3NF關(guān)系2.生產(chǎn)廠關(guān)系:(生產(chǎn)廠名,生產(chǎn)廠地址)1.產(chǎn)品關(guān)系:(產(chǎn)品代碼,產(chǎn)品名,生產(chǎn)廠名)產(chǎn)品代碼產(chǎn)品名生產(chǎn)廠名生產(chǎn)廠地址練習(xí)題試按以下描述畫出實體——關(guān)系圖(E-R圖):每種零件只能由一種材料構(gòu)成,每種材料卻可以構(gòu)成不同的零件;每種產(chǎn)品可由多個零件組成,每種零件又可以組成多種產(chǎn)品。各實體屬性列出三、四個即可。再根據(jù)E-R圖,完成關(guān)系數(shù)據(jù)庫邏輯模式的設(shè)計。產(chǎn)品產(chǎn)品號,產(chǎn)品名,產(chǎn)品單價零件零件號,零件名,零件單價,重量,材料號材料材料號,材料名,單位價格,計量單位組成產(chǎn)品號,零件號,零件數(shù)零件單價重量產(chǎn)品單價產(chǎn)品名材料號材料名單位價格N1MN組成構(gòu)成計量單位零件名產(chǎn)品零件材料產(chǎn)品號零件數(shù)零件號2、某汽配公司的配件信息一覽表,把它轉(zhuǎn)化為符合范式關(guān)系的表。練習(xí)配件編號配件名稱型號規(guī)格供應(yīng)商名稱供應(yīng)商地址單價數(shù)量班號學(xué)生課程成績考試時間學(xué)號姓名性別課號課名學(xué)時A01011王紅女A5數(shù)學(xué)808699.1012李軍男B3英語908899.6011王紅女B3英語909299.6………………………1、將下表進行范式化處理,使其滿足第三范式。五、用戶存取數(shù)據(jù)庫數(shù)據(jù)的過程DBMS用戶應(yīng)用程序用戶工作區(qū)①模式③用戶應(yīng)用程序外(子)模式②OS⑤存儲模式④⑧⑦日志⑨系統(tǒng)緩沖區(qū)數(shù)據(jù)庫⑥數(shù)據(jù)庫的結(jié)構(gòu)第三節(jié)關(guān)系數(shù)據(jù)庫系統(tǒng)及其應(yīng)用結(jié)構(gòu)化查詢語言SQL(StructuredQueryLanguage)特點集數(shù)據(jù)描述語言(DDL,DataDescriptionLanguage)、數(shù)據(jù)操縱語言(DML,DataManipulationLanguage)、數(shù)據(jù)控制語言(DCL,DataControlLanguage)為一體,可實現(xiàn)DB生命周期的全部活動。高度非過程化,用戶只要提干什么,不需指示怎么干。語言簡潔,接近英語口語。常用動詞:create,select,insert,update,delete,grantSQL支持C/S結(jié)構(gòu)。關(guān)系數(shù)據(jù)庫是目前最流行的數(shù)據(jù)庫。幾種常用的數(shù)據(jù)庫管理系統(tǒng)第四節(jié)數(shù)據(jù)倉庫一、定義Adatawarehouseisasubject-oriented,integrated,time-variant,andnonvolatilecollectionofdatainsupportofmanagement’sdecision-makingprocess.數(shù)據(jù)倉庫(DataWarehouse)是在企業(yè)管理和決策中面向主題的、集成的、與時間相關(guān)的、不可修改的數(shù)據(jù)集合,用以支持管理決策問題。數(shù)據(jù)倉庫是一個綜合的解決方案,是對原始的操作數(shù)據(jù)進行各種處理并轉(zhuǎn)換成有用信息的處理過程,它主要用來幫助有關(guān)主管部門做出更符合業(yè)務(wù)發(fā)展規(guī)律的決策。第四節(jié)數(shù)據(jù)倉庫1.DW的數(shù)據(jù)是面向主題的。一、定義數(shù)據(jù)倉庫主要有以下四個特征4.DW的數(shù)據(jù)是隨時間不斷變化的。3.DW的數(shù)據(jù)是不可更新的。2.DW的數(shù)據(jù)是集成的。

操作型數(shù)據(jù)庫中的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各業(yè)務(wù)系統(tǒng)之間各自分離;

DW關(guān)注決策者的數(shù)據(jù)建模與分析,而不是組織機構(gòu)的日常操作和事務(wù)處理;

DW中數(shù)據(jù)按照一定的主題進行組織,如顧客、供應(yīng)商、產(chǎn)品和銷售來組織;一個主題通常與多個操作型數(shù)據(jù)庫相關(guān)。

操作型數(shù)據(jù)庫之間相互獨立,可能異構(gòu);

DW中數(shù)據(jù)是對原有分散的數(shù)據(jù)庫數(shù)據(jù)作抽取的基礎(chǔ)上,經(jīng)過系統(tǒng)的加工、匯總和整理得到。

操作型數(shù)據(jù)庫中的數(shù)據(jù)通常實時更新;

DW中數(shù)據(jù)主要用于決策分析,對數(shù)據(jù)的操作主要是數(shù)據(jù)查詢;

操作型數(shù)據(jù)庫主要關(guān)心某一個時間段內(nèi)的數(shù)據(jù);

DW中記錄了一段時間的數(shù)據(jù),對單位發(fā)展歷程和未來趨勢做出定量分析和預(yù)測;

DW中數(shù)據(jù)通常包含較久遠的歷史數(shù)據(jù),因此總包含一個時間維,便于研究趨勢和變化。第四節(jié)數(shù)據(jù)倉庫如圖三、數(shù)據(jù)倉庫的體系結(jié)構(gòu)二、數(shù)據(jù)倉庫的應(yīng)用數(shù)據(jù)倉庫的應(yīng)用非常廣,如:證卷、稅務(wù)、保險業(yè)、銀行業(yè)、營銷業(yè)、保健業(yè)等。例如:銀行業(yè)務(wù)數(shù)據(jù)庫與數(shù)據(jù)倉庫的比較數(shù)據(jù)庫DB數(shù)據(jù)倉庫DW建立目的儲存處理、操作性數(shù)據(jù)分析數(shù)據(jù),發(fā)現(xiàn)潛在信息組織方式按事務(wù)處理組織數(shù)據(jù)按主題組織數(shù)據(jù)開發(fā)技術(shù)聯(lián)機事務(wù)處理OLTP聯(lián)機分析處理OLAP用戶及其規(guī)模業(yè)務(wù)人員,大量決策者,少數(shù)據(jù)來源當前近期數(shù)據(jù)歷史、匯總數(shù)據(jù)冗余度小大量冗余四、數(shù)據(jù)挖掘(DataMining)數(shù)據(jù)挖掘也稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabaseKDD):是從大量數(shù)據(jù)中提取可信、新穎、有效并能被人理解的模式的高級處理過程。第四節(jié)數(shù)據(jù)倉庫四、數(shù)據(jù)挖掘(DataMining)例如:美國加洲一個超級市場連鎖店數(shù)據(jù)挖掘的用途很多,如:可用在客戶關(guān)系管理中、醫(yī)學(xué)領(lǐng)域、市場營銷領(lǐng)域等。第四節(jié)數(shù)據(jù)倉庫數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關(guān)系:若將數(shù)據(jù)倉庫比作礦井,那么數(shù)據(jù)挖掘就是深入礦井采礦的工作.

數(shù)據(jù)挖掘是從數(shù)據(jù)倉庫中找出有用信息的一種過程與技術(shù)。三個實體集聯(lián)系的E—R圖供應(yīng)商工程項目零部件供應(yīng)聯(lián)系MLN樹型結(jié)構(gòu)A1B2B1B3C9C2C13C16C5C14樹型結(jié)構(gòu)示例工廠地址廠長名稱工作車間/科室職工設(shè)備類別名稱編號名稱代號使用從屬...年齡姓名...1N1L1M層次模型實例名稱廠長地址代號名稱……編號名稱類別姓名年齡……車間/科室廠長設(shè)備職工網(wǎng)狀模型產(chǎn)品1產(chǎn)品2部件1部件2部件3零件1零件2零件3零件4零件5零件6兩個記錄型間兩種以上的聯(lián)系示例維護使用工人設(shè)備NM11丁一…馬二…王三…設(shè)備A

…設(shè)備B

…設(shè)備C

…維護使用定義在一個集合自身之上的聯(lián)系定義在兩個實體上的不同聯(lián)系維護使用N工人設(shè)備MKL職工領(lǐng)導(dǎo)1N職工姓名工種性別發(fā)放勞動用品價格品名級別名稱職工姓名性別發(fā)放勞動用品價格品名級別名稱工種工作職工年齡工種……1N學(xué)生情況學(xué)生姓名班級選修課程任課教師成績丁江101911計算機基礎(chǔ)劉紅90王吉102931計算機基礎(chǔ)黎明92馮凡103963會計學(xué)張揚86...............MN1N班級學(xué)生教師從屬教學(xué)人數(shù)班號課程課號課名學(xué)時職稱年齡姓名性別性別姓名L5元關(guān)系表學(xué)生班級選修課程任課教師成績關(guān)系二維表關(guān)系的框架若干個元組五個分量(域)學(xué)生與班級、學(xué)生選課學(xué)習(xí)的情況聯(lián)系MN1N班級學(xué)生教師從屬教學(xué)人數(shù)班號課程課號課名學(xué)時職稱年齡姓名性別性別姓名L成績?nèi)温殹鞍嗉墶睂嶓w集

班號人數(shù)1019112510293140......學(xué)號姓名年齡性別20…01丁江18男20…02王吉17女.........課號課名學(xué)時C01計算機基礎(chǔ)54B05會計學(xué)36.........“學(xué)生”實體集“課程”實體集“教師”實體集職工號姓名性別職稱1998…劉紅女教授1995…黎明男講師.........“從屬”聯(lián)系“教學(xué)”聯(lián)系班號學(xué)號任職10191120…01班長10293120…02普通.........學(xué)號所選課號職工號成績20…01C011998…9020…02C011995…92.........關(guān)系的非規(guī)范形式示例廠名生產(chǎn)情況(每月)產(chǎn)品名稱數(shù)量F1P1300P2200P3400P4200P5100P6100F2P1300P2400F3P2200F4P2200P3300P4400關(guān)系的第一范式示例廠名產(chǎn)品名稱每月產(chǎn)量F1P1300F1P2200F1P3400F1P4200F1P5100F1P6100F2P1300F2P2400F3P2200F4P2200F4P3300F4P4400人事勞資關(guān)系表職工號姓名級別工資學(xué)歷畢業(yè)時間001張三技1083中專1957001張三技1083大學(xué)1968001張三技1083研究生1981002李四技1262大學(xué)1970此關(guān)系數(shù)據(jù)庫缺點:

1.冗余度高

2.維護困難

3.容易造成數(shù)據(jù)的矛盾各屬性間的依賴關(guān)系職工號學(xué)歷畢業(yè)時間工資級別姓名完全決定部分決定職工號姓名級別工資學(xué)歷畢業(yè)時間001張三技1083中專1957001張三技1083大學(xué)1968001張三技1083研究生1981002李四技1262大學(xué)1970人事工資關(guān)系表職工號姓名級別工資001張三技1083002李四技1262職工號學(xué)歷畢業(yè)時間001中專1957001大學(xué)1968001研究生1981002大學(xué)1970人事學(xué)歷關(guān)系表職工號學(xué)歷畢業(yè)時間工資級別姓名完全決定部分決定間接直接人員級別關(guān)系表職工號姓名級別001張三技10002李四技12級別工資技1083

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論