海南大學(xué)旅游信息管理chap004_第1頁
海南大學(xué)旅游信息管理chap004_第2頁
海南大學(xué)旅游信息管理chap004_第3頁
海南大學(xué)旅游信息管理chap004_第4頁
海南大學(xué)旅游信息管理chap004_第5頁
已閱讀5頁,還剩89頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章第四章 旅游數(shù)據(jù)資源管理技術(shù)旅游數(shù)據(jù)資源管理技術(shù)第四章第四章 旅游數(shù)據(jù)資源管理技術(shù)旅游數(shù)據(jù)資源管理技術(shù)【學(xué)習(xí)目標(biāo)】 掌握數(shù)據(jù)庫和數(shù)據(jù)倉庫概念掌握數(shù)據(jù)庫和數(shù)據(jù)倉庫概念 了解常用的數(shù)據(jù)庫管理系統(tǒng)了解常用的數(shù)據(jù)庫管理系統(tǒng) 使用常用的數(shù)據(jù)挖掘工具進(jìn)行統(tǒng)計(jì)決策使用常用的數(shù)據(jù)挖掘工具進(jìn)行統(tǒng)計(jì)決策【知識(shí)要點(diǎn)】 數(shù)據(jù)庫和數(shù)據(jù)倉庫數(shù)據(jù)庫和數(shù)據(jù)倉庫 數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng) 數(shù)據(jù)挖掘工具數(shù)據(jù)挖掘工具1第一節(jié)第一節(jié) 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展2第二節(jié)第二節(jié) 文件管理文件管理3第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型4第四節(jié)第四節(jié) 旅游企業(yè)中常用的數(shù)據(jù)庫管理系統(tǒng)旅游企業(yè)中常用的數(shù)據(jù)庫管理系統(tǒng)本章內(nèi)容本章

2、內(nèi)容5第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫第一節(jié)第一節(jié) 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展一、人工管理階段一、人工管理階段 數(shù)據(jù)量小、結(jié)構(gòu)簡單,如高階方程、曲線擬和等數(shù)據(jù)量小、結(jié)構(gòu)簡單,如高階方程、曲線擬和等外存為順序存取設(shè)備外存為順序存取設(shè)備 磁帶、卡片、紙帶,沒有磁盤等直接存取設(shè)備磁帶、卡片、紙帶,沒有磁盤等直接存取設(shè)備第一節(jié)第一節(jié) 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展一、人工管理階段一、人工管理階段 用戶用機(jī)器指令編碼,通過紙帶機(jī)輸入程序和數(shù)據(jù),用戶用機(jī)器指令編碼,通過紙帶機(jī)輸入程序和數(shù)據(jù),程序運(yùn)行完畢后,由用戶取走紙帶和運(yùn)算結(jié)果,再讓下程序運(yùn)行完畢后,由用戶取走紙帶

3、和運(yùn)算結(jié)果,再讓下一用戶上機(jī)操作一用戶上機(jī)操作數(shù)據(jù)管理發(fā)展數(shù)據(jù)管理發(fā)展-人工管理階段人工管理階段人工管理階段數(shù)據(jù)與程序的關(guān)系人工管理階段數(shù)據(jù)與程序的關(guān)系 數(shù)據(jù)不進(jìn)行保存數(shù)據(jù)不進(jìn)行保存 沒有專門的數(shù)據(jù)管沒有專門的數(shù)據(jù)管理軟件理軟件 數(shù)據(jù)面向應(yīng)用數(shù)據(jù)面向應(yīng)用 基本上沒有文件的基本上沒有文件的概念概念 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展- 外存有了磁盤、磁鼓等直接存取設(shè)備外存有了磁盤、磁鼓等直接存取設(shè)備 直接存取設(shè)備(直接存取設(shè)備(DASDDASD) 無須順序存取無須順序存取 由地址直接訪問所需記錄由地址直接訪問所需記錄 文件存儲(chǔ)空間的管理文件存儲(chǔ)空間的管理 目錄管理目錄管理 文件讀寫管理文件讀寫

4、管理 文件保護(hù)文件保護(hù) 向用戶提供操作接口向用戶提供操作接口 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展-文件系統(tǒng)階段數(shù)據(jù)與程序的關(guān)系文件系統(tǒng)階段數(shù)據(jù)與程序的關(guān)系數(shù)據(jù)可以長期保存在磁盤上數(shù)據(jù)可以長期保存在磁盤上數(shù)據(jù)仍是面向應(yīng)用的數(shù)據(jù)仍是面向應(yīng)用的文件系統(tǒng)提供數(shù)據(jù)與程序之文件系統(tǒng)提供數(shù)據(jù)與程序之間的存取方法間的存取方法數(shù)據(jù)冗余量大數(shù)據(jù)冗余量大文件之間缺乏聯(lián)系,相互孤文件之間缺乏聯(lián)系,相互孤立,仍然不能反映現(xiàn)實(shí)世界各立,仍然不能反映現(xiàn)實(shí)世界各種事物之間錯(cuò)綜復(fù)雜的聯(lián)系種事物之間錯(cuò)綜復(fù)雜的聯(lián)系數(shù)據(jù)管理技術(shù)發(fā)展數(shù)據(jù)管理技術(shù)發(fā)展-計(jì)算機(jī)管理的數(shù)據(jù)量大,關(guān)系復(fù)雜,共享性要求強(qiáng)計(jì)算機(jī)管理的數(shù)據(jù)量大,關(guān)系復(fù)雜,共享性

5、要求強(qiáng) 外存有了大容量磁盤,光盤軟件價(jià)格上升,硬件價(jià)格下降,編制和維外存有了大容量磁盤,光盤軟件價(jià)格上升,硬件價(jià)格下降,編制和維護(hù)軟件及應(yīng)用程序成本相對(duì)增加,其中維護(hù)的成本更高,力求降低護(hù)軟件及應(yīng)用程序成本相對(duì)增加,其中維護(hù)的成本更高,力求降低 數(shù)據(jù)管理技術(shù)發(fā)展數(shù)據(jù)管理技術(shù)發(fā)展-數(shù)據(jù)的結(jié)構(gòu)化。數(shù)據(jù)的結(jié)構(gòu)化。 數(shù)據(jù)共享性好。數(shù)據(jù)共享性好。 數(shù)據(jù)獨(dú)立性好。數(shù)據(jù)獨(dú)立性好。 數(shù)據(jù)存取粒度小。數(shù)據(jù)存取粒度小。 數(shù)據(jù)庫管理系統(tǒng)(數(shù)據(jù)庫管理系統(tǒng)(DBMSDBMS)對(duì))對(duì)數(shù)據(jù)進(jìn)行統(tǒng)數(shù)據(jù)進(jìn)行統(tǒng) 一的管理和控制。一的管理和控制。 為用戶提供了友好的接口。為用戶提供了友好的接口。 數(shù)據(jù)管理技術(shù)發(fā)展數(shù)據(jù)管理技術(shù)發(fā)展-

6、數(shù)據(jù)的結(jié)構(gòu)化。數(shù)據(jù)的結(jié)構(gòu)化。 數(shù)據(jù)共享性好。數(shù)據(jù)共享性好。 數(shù)據(jù)獨(dú)立性好。數(shù)據(jù)獨(dú)立性好。 數(shù)據(jù)存取粒度小。數(shù)據(jù)存取粒度小。 數(shù)據(jù)庫管理系統(tǒng)(數(shù)據(jù)庫管理系統(tǒng)(DBMSDBMS)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)對(duì)數(shù)據(jù)進(jìn)行統(tǒng) 一的管理一的管理和控制。和控制。 為用戶提供了友好的接口。為用戶提供了友好的接口。 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展-數(shù)據(jù)庫管理階段數(shù)據(jù)與程序的關(guān)系數(shù)據(jù)庫管理階段數(shù)據(jù)與程序的關(guān)系用戶用戶1用戶用戶2用戶用戶m應(yīng)用程序應(yīng)用程序1應(yīng)用程序應(yīng)用程序2應(yīng)用程序應(yīng)用程序3應(yīng)用程序應(yīng)用程序n數(shù)數(shù) 據(jù)據(jù) 庫庫 管管 理理 系系 統(tǒng)統(tǒng)數(shù)據(jù)庫數(shù)據(jù)庫數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)管理技術(shù)的發(fā)展-數(shù)據(jù)庫系統(tǒng)階段數(shù)據(jù)庫系統(tǒng)階

7、段 數(shù)據(jù)庫系統(tǒng)相關(guān)概念數(shù)據(jù)庫系統(tǒng)相關(guān)概念(DBS,Data Base System)由由4個(gè)部分組成個(gè)部分組成:(1 1)(2 2)(3 3)包括操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)及應(yīng)用程序。包括操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)及應(yīng)用程序。 (4 4)系統(tǒng)分析員和數(shù)據(jù)庫設(shè)計(jì)人員、應(yīng)用程序員、最終用戶、系統(tǒng)分析員和數(shù)據(jù)庫設(shè)計(jì)人員、應(yīng)用程序員、最終用戶、數(shù)據(jù)庫管理員。數(shù)據(jù)庫管理員。(DB,Data Base) 指長期存儲(chǔ)在計(jì)算機(jī)內(nèi)的,有組織,可共享的數(shù)據(jù)的集合。指長期存儲(chǔ)在計(jì)算機(jī)內(nèi)的,有組織,可共享的數(shù)據(jù)的集合。(Data Base Management System) 在操作系統(tǒng)的支持下工作,解決如何科學(xué)地組織和

8、存儲(chǔ)數(shù)據(jù),如在操作系統(tǒng)的支持下工作,解決如何科學(xué)地組織和存儲(chǔ)數(shù)據(jù),如何高效獲取和維護(hù)數(shù)據(jù)的系統(tǒng)軟件。何高效獲取和維護(hù)數(shù)據(jù)的系統(tǒng)軟件。 第二節(jié)第二節(jié) 文件管理文件管理 文件系統(tǒng)在操作系統(tǒng)中的作用文件系統(tǒng)在操作系統(tǒng)中的作用文件系統(tǒng)文件系統(tǒng)文件文件文件名稱、文件命名、文件類型文件名稱、文件命名、文件類型文件屬性、文件長度、文件時(shí)間文件屬性、文件長度、文件時(shí)間文件權(quán)限文件權(quán)限第二節(jié)第二節(jié) 文件管理文件管理 系統(tǒng)文件、庫文件、用戶文系統(tǒng)文件、庫文件、用戶文件件 普通文件、目錄文件、特殊文件普通文件、目錄文件、特殊文件 源文件、目標(biāo)文件、可執(zhí)行文件源文件、目標(biāo)文件、可執(zhí)行文件 第二節(jié)第二節(jié) 文件管理文件管

9、理文件的存取文件的存取 順序訪問、隨機(jī)訪問、索引訪問順序訪問、隨機(jī)訪問、索引訪問文件的操作文件的操作對(duì)文件自身的操作對(duì)文件自身的操作建立、刪除、打開、關(guān)閉、讀寫建立、刪除、打開、關(guān)閉、讀寫對(duì)記錄的操作對(duì)記錄的操作插入、刪除、修改、查找插入、刪除、修改、查找第二節(jié)第二節(jié) 文件管理文件管理物理結(jié)構(gòu)、邏輯結(jié)構(gòu)物理結(jié)構(gòu)、邏輯結(jié)構(gòu)常見的文件系統(tǒng)及特點(diǎn)常見的文件系統(tǒng)及特點(diǎn)Sysv、Minix、Ext、Ext2、NFS、HpfsFAT(FAT12、FAT16、FAT32) 、exFATNTFS第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型一、數(shù)據(jù)庫概念一、數(shù)據(jù)庫概念第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型一、數(shù)據(jù)庫概念一、數(shù)

10、據(jù)庫概念數(shù)據(jù)處理是指對(duì)各種形式的數(shù)據(jù)進(jìn)行收數(shù)據(jù)處理是指對(duì)各種形式的數(shù)據(jù)進(jìn)行收集、儲(chǔ)存、加工和傳播的一系列活動(dòng)的總和。集、儲(chǔ)存、加工和傳播的一系列活動(dòng)的總和。 數(shù)據(jù)管理指的是對(duì)數(shù)據(jù)的分類、組織、數(shù)據(jù)管理指的是對(duì)數(shù)據(jù)的分類、組織、編碼、儲(chǔ)存、檢索和維護(hù)。編碼、儲(chǔ)存、檢索和維護(hù)。 數(shù)據(jù)庫技術(shù)所研究的問題是如何科學(xué)地?cái)?shù)據(jù)庫技術(shù)所研究的問題是如何科學(xué)地組織和儲(chǔ)存數(shù)據(jù),如何高效地處理數(shù)據(jù)以獲組織和儲(chǔ)存數(shù)據(jù),如何高效地處理數(shù)據(jù)以獲取其內(nèi)在信息。取其內(nèi)在信息。 第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型一、數(shù)據(jù)庫概念一、數(shù)據(jù)庫概念在操作系統(tǒng)的支持下對(duì)數(shù)據(jù)庫進(jìn)行在操作系統(tǒng)的支持下對(duì)數(shù)據(jù)庫進(jìn)行統(tǒng)一管理和控制,應(yīng)用程序只有

11、通統(tǒng)一管理和控制,應(yīng)用程序只有通過過DBMSDBMS才能執(zhí)行。才能執(zhí)行。 數(shù)據(jù)庫的定義、建立和維護(hù)功能數(shù)據(jù)庫的定義、建立和維護(hù)功能 為數(shù)據(jù)存取功能為數(shù)據(jù)存取功能 數(shù)據(jù)庫運(yùn)行管理功能數(shù)據(jù)庫運(yùn)行管理功能 第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型一、數(shù)據(jù)庫概念一、數(shù)據(jù)庫概念數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化 數(shù)據(jù)冗余度小數(shù)據(jù)冗余度小 數(shù)據(jù)共享數(shù)據(jù)共享 具有較高的數(shù)據(jù)和程序獨(dú)立性具有較高的數(shù)據(jù)和程序獨(dú)立性 提供各種安全性功能提供各種安全性功能 第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型 現(xiàn)實(shí)世界、信息世界和數(shù)據(jù)世界之間的關(guān)系現(xiàn)實(shí)世界、信息世界和數(shù)據(jù)世界之間的關(guān)系第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)

12、庫模型二、關(guān)系數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型概念模型概念模型 實(shí)體(實(shí)體(EntityEntity)實(shí)體的屬性(實(shí)體的屬性(AttributeAttribute) 反映實(shí)體特性只涉及有限個(gè)屬性反映實(shí)體特性只涉及有限個(gè)屬性 屬性名、屬性值屬性名、屬性值 屬性的域?qū)傩缘挠驅(qū)傩缘娜≈捣秶鷮傩缘娜≈捣秶谌?jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型實(shí)體集實(shí)體集(Entity Unit) 所有屬性名完全相同實(shí)體的集合所有屬性名完全相同實(shí)體的集合 實(shí)體名實(shí)體名實(shí)體集的名稱實(shí)體集的名稱實(shí)體型實(shí)體型(Entity Type) 實(shí)體名及其所有屬性名的集合實(shí)體名及其所有屬性名的集合碼或關(guān)鍵字

13、碼或關(guān)鍵字(Key) 確定實(shí)體集中唯一實(shí)體的屬性確定實(shí)體集中唯一實(shí)體的屬性( (集集) )學(xué)號(hào)姓名性別生日 身份證10001張小小10002王欣欣10003胡曉海10005吳鳳 關(guān)系裝換10001 張小小10002 王欣欣DC10管理學(xué)FH02數(shù)據(jù)分析學(xué)號(hào)課號(hào)成績10001 DC109510001 FH028210002 DC1088第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型 概念模型與數(shù)據(jù)模型概念模型與數(shù)據(jù)模型 實(shí)體集之間的聯(lián)系實(shí)體集之間的聯(lián)系 一對(duì)一聯(lián)系(一對(duì)一聯(lián)系(1:11:1) 一對(duì)多聯(lián)系(一對(duì)多聯(lián)系(1:n1:n) 多對(duì)多聯(lián)系(多對(duì)多聯(lián)系(m:nm:n)第

14、三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型AR聯(lián)系名聯(lián)系名實(shí)體型實(shí)體型A實(shí)體型實(shí)體型R11(a) 一對(duì)一聯(lián)系一對(duì)一聯(lián)系A(chǔ)R聯(lián)系名聯(lián)系名實(shí)體型實(shí)體型A實(shí)體型實(shí)體型R1n(b) 一對(duì)多聯(lián)系一對(duì)多聯(lián)系A(chǔ)R聯(lián)系名聯(lián)系名實(shí)體型實(shí)體型A實(shí)體型實(shí)體型Rmn(c) 多對(duì)多聯(lián)系多對(duì)多聯(lián)系第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型概念模型常用實(shí)體概念模型常用實(shí)體聯(lián)系法表示,即聯(lián)系法表示,即E-RE-R圖圖在在E-RE-R圖中,長方形表示實(shí)體,橢圓表示屬性,用圖中,長方形表示實(shí)體,橢圓表示屬性,用無向邊把實(shí)體與其屬性連接起來。無向邊把實(shí)體與其屬性連接起來。菱形表示實(shí)體間的聯(lián)系,用無向邊把菱形與有關(guān)

15、實(shí)菱形表示實(shí)體間的聯(lián)系,用無向邊把菱形與有關(guān)實(shí)體連接起來并在無向邊旁標(biāo)上聯(lián)系的類型。體連接起來并在無向邊旁標(biāo)上聯(lián)系的類型。第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型教師與課程關(guān)系的教師與課程關(guān)系的E-R圖圖 講授講授nm工號(hào)工號(hào)姓名姓名性別性別生日生日職務(wù)職務(wù)職稱職稱專業(yè)專業(yè)課程號(hào)課程號(hào)名稱名稱學(xué)時(shí)學(xué)時(shí)教室教室開課時(shí)間開課時(shí)間教師教師課程課程第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型編排編排nm系號(hào)系號(hào)名稱名稱電話電話主任主任地址地址課程號(hào)課程號(hào)名稱名稱學(xué)時(shí)學(xué)時(shí)教室教室開課時(shí)間開課時(shí)間系系管理管理選擇選擇管理管理講授講授課程課程nmnm工號(hào)工號(hào)姓名姓名性別性別生日生日職務(wù)職務(wù)職稱職稱專業(yè)專業(yè)學(xué)號(hào)學(xué)號(hào)姓名姓名性

16、別性別生日生日民族民族入學(xué)日期入學(xué)日期籍貫籍貫學(xué)生學(xué)生教師教師11mm第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型練習(xí):有以練習(xí):有以下實(shí)體:廠下實(shí)體:廠家、商品、家、商品、代理商、銷代理商、銷售商、消費(fèi)售商、消費(fèi)者,請(qǐng)畫者,請(qǐng)畫E-RE-R圖。圖。第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型 數(shù)據(jù)模型數(shù)據(jù)模型在非關(guān)系模型中,概念模型中的實(shí)體、在非關(guān)系模型中,概念模型中的實(shí)體、實(shí)體型分別反映為記錄和記錄型,因此實(shí)體型分別反映為記錄和記錄型,因此圖的結(jié)點(diǎn)表示記錄型,結(jié)點(diǎn)之間的連接圖的結(jié)點(diǎn)表示記錄型,結(jié)點(diǎn)之間的連接弧表示記錄型之間的聯(lián)系?;”硎居涗浶椭g的聯(lián)系。第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)

17、庫模型二、數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型 基本層次聯(lián)系基本層次聯(lián)系 數(shù)據(jù)結(jié)構(gòu)可以分解為基本層次聯(lián)系。數(shù)據(jù)結(jié)構(gòu)可以分解為基本層次聯(lián)系。 兩個(gè)記錄型及它們之間的兩個(gè)記錄型及它們之間的一對(duì)多(一對(duì)一)的聯(lián)系一對(duì)多(一對(duì)一)的聯(lián)系稱為基本層次聯(lián)系。稱為基本層次聯(lián)系。 父記錄和子記錄父記錄和子記錄R1R2第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型數(shù)據(jù)模型數(shù)據(jù)模型非關(guān)系模型非關(guān)系模型 若一個(gè)基本層次聯(lián)系的集合滿足下列兩個(gè)條若一個(gè)基本層次聯(lián)系的集合滿足下列兩個(gè)條件,則它是層次模型件,則它是層次模型有且僅有一個(gè)無父結(jié)點(diǎn),這樣的結(jié)點(diǎn)稱為有且僅有一個(gè)無父結(jié)點(diǎn),這樣的結(jié)點(diǎn)稱為根結(jié)點(diǎn)。根結(jié)點(diǎn)。非根結(jié)點(diǎn)都

18、有且僅有一個(gè)父結(jié)點(diǎn)。非根結(jié)點(diǎn)都有且僅有一個(gè)父結(jié)點(diǎn)。第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型RR1R2R21R22第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型數(shù)據(jù)模型數(shù)據(jù)模型非關(guān)系模型非關(guān)系模型 若一個(gè)基本層次聯(lián)系集合中,至少有一個(gè)結(jié)若一個(gè)基本層次聯(lián)系集合中,至少有一個(gè)結(jié)點(diǎn)有一個(gè)以上的父結(jié)點(diǎn),則這種數(shù)據(jù)模型是點(diǎn)有一個(gè)以上的父結(jié)點(diǎn),則這種數(shù)據(jù)模型是網(wǎng)狀模型。網(wǎng)狀模型。可能有一個(gè)以上的結(jié)點(diǎn)無父結(jié)點(diǎn)可能有一個(gè)以上的結(jié)點(diǎn)無父結(jié)點(diǎn)結(jié)點(diǎn)與其父結(jié)點(diǎn)間聯(lián)系可能不止一個(gè)結(jié)點(diǎn)與其父結(jié)點(diǎn)間聯(lián)系可能不止一個(gè)第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型R1R2 (a) (b) (c)R

19、3R1R2R1R2R3R4第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型數(shù)據(jù)模型數(shù)據(jù)模型當(dāng)前廣泛應(yīng)用的數(shù)據(jù)庫管理系統(tǒng)幾乎都支當(dāng)前廣泛應(yīng)用的數(shù)據(jù)庫管理系統(tǒng)幾乎都支持關(guān)系模型,稱為關(guān)系型數(shù)據(jù)庫管理系統(tǒng)持關(guān)系模型,稱為關(guān)系型數(shù)據(jù)庫管理系統(tǒng). .關(guān)系模型用二維表表示實(shí)體及其相互聯(lián)系關(guān)系模型用二維表表示實(shí)體及其相互聯(lián)系對(duì)表的構(gòu)成形式有一定限制對(duì)表的構(gòu)成形式有一定限制第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型二、數(shù)據(jù)庫模型 數(shù)據(jù)模型數(shù)據(jù)模型關(guān)系模型的主要術(shù)語關(guān)系模型的主要術(shù)語 元組:行,對(duì)應(yīng)實(shí)體,相當(dāng)于記錄元組:行,對(duì)應(yīng)實(shí)體,相當(dāng)于記錄 屬性和屬性名:列,列的名稱屬性和屬性名:列,列

20、的名稱 分量:一個(gè)元組在一個(gè)屬性上的值分量:一個(gè)元組在一個(gè)屬性上的值 關(guān)系與關(guān)系名:整表是一個(gè)關(guān)系關(guān)系與關(guān)系名:整表是一個(gè)關(guān)系 關(guān)系模式:關(guān)系名及其所有屬性名集關(guān)系模式:關(guān)系名及其所有屬性名集合合第三節(jié)第三節(jié) 數(shù)據(jù)庫模型數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型二、關(guān)系數(shù)據(jù)庫模型 數(shù)據(jù)模型數(shù)據(jù)模型表中每一列都必須是不可分的基本項(xiàng)。表中每一列都必須是不可分的基本項(xiàng)。表中沒有完全相同的兩個(gè)元組。表中沒有完全相同的兩個(gè)元組。在一個(gè)關(guān)系模式中:在一個(gè)關(guān)系模式中:不能有兩個(gè)屬性具有相同的屬性名。不能有兩個(gè)屬性具有相同的屬性名。屬性間順序和元組間順序都是無關(guān)緊要的。屬性間順序和元組間順序都是無關(guān)緊要的。 第四節(jié)第四節(jié)

21、旅游企業(yè)中常用的數(shù)據(jù)庫管理系統(tǒng)旅游企業(yè)中常用的數(shù)據(jù)庫管理系統(tǒng)一、一、Oracle數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng) 完整的數(shù)據(jù)管理功能完整的數(shù)據(jù)管理功能 分布式數(shù)據(jù)庫系統(tǒng),支持分布式數(shù)據(jù)庫系統(tǒng),支持InternetInternet應(yīng)用應(yīng)用 提供界面友好、功能齊全的數(shù)據(jù)庫開發(fā)工具提供界面友好、功能齊全的數(shù)據(jù)庫開發(fā)工具 使用使用PL/SQLPL/SQL語言執(zhí)行各種操作語言執(zhí)行各種操作 可開放性、可移植性、可伸縮性可開放性、可移植性、可伸縮性 支持面向?qū)ο蟮墓δ埽珙?、方法、屬性等支持面向?qū)ο蟮墓δ?,如類、方法、屬性?對(duì)象對(duì)象/ /關(guān)系型數(shù)據(jù)庫管理系統(tǒng)關(guān)系型數(shù)據(jù)庫管理系統(tǒng) 目前最新版本是目前最新版本是O

22、racle 11gOracle 11g第四節(jié)第四節(jié) 旅游企業(yè)中常用的數(shù)據(jù)庫管理系統(tǒng)旅游企業(yè)中常用的數(shù)據(jù)庫管理系統(tǒng)二二、DB2數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng) 具有較好的可伸縮性、高層次的數(shù)據(jù)利用性、完整性、具有較好的可伸縮性、高層次的數(shù)據(jù)利用性、完整性、安全性、可恢復(fù)性安全性、可恢復(fù)性 與平臺(tái)無關(guān)的基本功能和與平臺(tái)無關(guān)的基本功能和SQLSQL命令命令 數(shù)據(jù)分級(jí)技術(shù)數(shù)據(jù)分級(jí)技術(shù) 查詢優(yōu)化器,支持多任務(wù)并行查詢查詢優(yōu)化器,支持多任務(wù)并行查詢 網(wǎng)絡(luò)支持能力,適用于大型分布式應(yīng)用系統(tǒng)網(wǎng)絡(luò)支持能力,適用于大型分布式應(yīng)用系統(tǒng) 可通過開放數(shù)據(jù)庫連接(可通過開放數(shù)據(jù)庫連接(ODBCODBC)接口、)接口、Java

23、Java數(shù)據(jù)庫連數(shù)據(jù)庫連接(接(JDBCJDBC)接口,或者)接口,或者CORBACORBA接口代理被任何應(yīng)用程序接口代理被任何應(yīng)用程序訪問訪問第四節(jié)第四節(jié) 旅游企業(yè)中常用的數(shù)據(jù)庫管理系統(tǒng)旅游企業(yè)中常用的數(shù)據(jù)庫管理系統(tǒng)三、三、MS Access數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng) Microsoft OfficeMicrosoft Office組件之一組件之一 桌面型數(shù)據(jù)庫管理系統(tǒng)桌面型數(shù)據(jù)庫管理系統(tǒng) 無需編寫任何代碼,可視化操作無需編寫任何代碼,可視化操作 包括表、窗體、查詢、報(bào)表、宏、模塊等要素包括表、窗體、查詢、報(bào)表、宏、模塊等要素 支持支持ODBCODBC與其他數(shù)據(jù)庫相連,實(shí)現(xiàn)數(shù)據(jù)交換和共享與

24、其他數(shù)據(jù)庫相連,實(shí)現(xiàn)數(shù)據(jù)交換和共享 與與OfficeOffice辦公軟件進(jìn)行數(shù)據(jù)交換和共享辦公軟件進(jìn)行數(shù)據(jù)交換和共享 支持嵌入和鏈接多媒體數(shù)據(jù)支持嵌入和鏈接多媒體數(shù)據(jù)第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫 數(shù)據(jù)倉庫簡介數(shù)據(jù)倉庫簡介 是一個(gè)數(shù)據(jù)集合,其中的數(shù)據(jù)來自于許多系是一個(gè)數(shù)據(jù)集合,其中的數(shù)據(jù)來自于許多系統(tǒng),用于支持管理報(bào)表生成和決策制定。統(tǒng),用于支持管理報(bào)表生成和決策制定。 數(shù)據(jù)倉庫使用用戶在業(yè)務(wù)活動(dòng)中收集的信息數(shù)據(jù)倉庫使用用戶在業(yè)務(wù)活動(dòng)中收集的信息來幫助用戶決策,使用戶更好、更巧妙、更來幫助用戶決策,使用戶更好、更巧妙、更快、更有效地操作業(yè)務(wù)??臁⒏行У夭僮鳂I(yè)務(wù)。 數(shù)據(jù)

25、倉庫是合理的業(yè)務(wù)智能架構(gòu)的關(guān)鍵部分。數(shù)據(jù)倉庫是合理的業(yè)務(wù)智能架構(gòu)的關(guān)鍵部分。第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫一、數(shù)據(jù)倉庫(一、數(shù)據(jù)倉庫(Data Warehouse)當(dāng)前報(bào)表架構(gòu)存在的問題當(dāng)前報(bào)表架構(gòu)存在的問題 可訪問性可訪問性 及時(shí)性及時(shí)性 格式格式 完整性完整性目標(biāo)、業(yè)務(wù)、智能目標(biāo)、業(yè)務(wù)、智能學(xué)籍?dāng)?shù)據(jù)學(xué)籍?dāng)?shù)據(jù)獎(jiǎng)罰數(shù)據(jù)獎(jiǎng)罰數(shù)據(jù)繳費(fèi)數(shù)據(jù)繳費(fèi)數(shù)據(jù)績點(diǎn)數(shù)據(jù)績點(diǎn)數(shù)據(jù)實(shí)習(xí)數(shù)據(jù)實(shí)習(xí)數(shù)據(jù)任職數(shù)據(jù)任職數(shù)據(jù)在校數(shù)據(jù)倉庫在校數(shù)據(jù)倉庫圖書借閱圖書借閱論文數(shù)據(jù)論文數(shù)據(jù)客戶數(shù)據(jù)客戶數(shù)據(jù)銷售銷售人力資源人力資源財(cái)務(wù)財(cái)務(wù)產(chǎn)品設(shè)計(jì)產(chǎn)品設(shè)計(jì)稅務(wù)稅務(wù)旅

26、行社數(shù)據(jù)倉庫旅行社數(shù)據(jù)倉庫服務(wù)外包服務(wù)外包企業(yè)規(guī)劃企業(yè)規(guī)劃招投標(biāo)招投標(biāo)規(guī)章制度規(guī)章制度競爭對(duì)手競爭對(duì)手第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫一、數(shù)據(jù)倉庫(一、數(shù)據(jù)倉庫(Data Warehouse) 數(shù)據(jù)倉庫定義為面向主題的、集成的、穩(wěn)定數(shù)據(jù)倉庫定義為面向主題的、集成的、穩(wěn)定的、不同時(shí)間的數(shù)據(jù)集合,用于支持經(jīng)營管的、不同時(shí)間的數(shù)據(jù)集合,用于支持經(jīng)營管理中決策制定過程。理中決策制定過程。面向主題面向主題集成性集成性穩(wěn)定性穩(wěn)定性第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫一、數(shù)據(jù)倉庫(一、數(shù)據(jù)倉庫(Data Warehouse)傳統(tǒng)輔助決策的軟件結(jié)構(gòu)是傳統(tǒng)輔助決策的軟件結(jié)

27、構(gòu)是“三部件三部件”型:總控部型:總控部件、數(shù)據(jù)庫部件和模型部件。件、數(shù)據(jù)庫部件和模型部件。問題處理和人機(jī)交互問題處理和人機(jī)交互(綜合部件)(綜合部件)模型庫管理系統(tǒng)模型庫管理系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)庫模型程序模型程序數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫一、數(shù)據(jù)倉庫(一、數(shù)據(jù)倉庫(Data Warehouse)傳統(tǒng)輔助決策的軟件結(jié)構(gòu)是傳統(tǒng)輔助決策的軟件結(jié)構(gòu)是“三部件三部件”型:總控部型:總控部件、數(shù)據(jù)庫部件和模型部件。件、數(shù)據(jù)庫部件和模型部件。第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫一、數(shù)據(jù)倉庫(一、數(shù)據(jù)倉庫(Data Warehouse)數(shù)據(jù)

28、倉庫在數(shù)據(jù)倉庫在DSS(決策支持系統(tǒng))中的地位(決策支持系統(tǒng))中的地位現(xiàn)代決策支持系統(tǒng)架構(gòu)基于數(shù)據(jù)倉庫、聯(lián)機(jī)處理分現(xiàn)代決策支持系統(tǒng)架構(gòu)基于數(shù)據(jù)倉庫、聯(lián)機(jī)處理分析和數(shù)據(jù)挖掘。析和數(shù)據(jù)挖掘。第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫一、數(shù)據(jù)倉庫(一、數(shù)據(jù)倉庫(Data Warehouse)數(shù)據(jù)倉庫已經(jīng)成為現(xiàn)代數(shù)據(jù)倉庫已經(jīng)成為現(xiàn)代DSS的主要數(shù)據(jù)源的主要數(shù)據(jù)源傳統(tǒng)傳統(tǒng)DSSDSS架構(gòu)的不足架構(gòu)的不足現(xiàn)代現(xiàn)代DSSDSS架構(gòu)的突破架構(gòu)的突破實(shí)際應(yīng)用案例實(shí)際應(yīng)用案例基于數(shù)據(jù)倉庫的高速公路營運(yùn)管理輔助基于數(shù)據(jù)倉庫的高速公路營運(yùn)管理輔助決策系統(tǒng)的概念模型決策系統(tǒng)的概念模型第五節(jié)第五節(jié) 旅游企業(yè)中

29、的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫基于數(shù)據(jù)倉庫的高速公路營運(yùn)管理輔助決策系統(tǒng)的概念模型基于數(shù)據(jù)倉庫的高速公路營運(yùn)管理輔助決策系統(tǒng)的概念模型車流量控制模型車流量控制模型路面監(jiān)測模型路面監(jiān)測模型速度限制模型速度限制模型事故呼叫模型事故呼叫模型高速公路數(shù)據(jù)倉庫高速公路數(shù)據(jù)倉庫時(shí)段控制模型時(shí)段控制模型環(huán)境維護(hù)模型環(huán)境維護(hù)模型模型管理系統(tǒng)模型管理系統(tǒng)驅(qū)動(dòng)模型庫驅(qū)動(dòng)模型庫數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)車流量過多嗎?車流量過多嗎?怎么處理?怎么處理?路面維修路面維修什么時(shí)間合適?什么時(shí)間合適?第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫練習(xí):請(qǐng)描述在電子商務(wù)領(lǐng)域中選擇物流服練習(xí):請(qǐng)描述在電子商務(wù)領(lǐng)域中選

30、擇物流服務(wù)商的決策過程。務(wù)商的決策過程。第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫二、數(shù)據(jù)挖掘(二、數(shù)據(jù)挖掘(Data Mining) 起因:豐富的數(shù)據(jù),貧乏的知識(shí)起因:豐富的數(shù)據(jù),貧乏的知識(shí) 發(fā)展:發(fā)展:2020世紀(jì)世紀(jì)8080年代開始,數(shù)據(jù)挖掘技術(shù)年代開始,數(shù)據(jù)挖掘技術(shù)逐步發(fā)展起來逐步發(fā)展起來 快速發(fā)展原因:快速發(fā)展原因:擁有巨大的數(shù)據(jù)資源,以及將這些數(shù)據(jù)資擁有巨大的數(shù)據(jù)資源,以及將這些數(shù)據(jù)資源轉(zhuǎn)換為信息和知識(shí)資源的巨大需求源轉(zhuǎn)換為信息和知識(shí)資源的巨大需求 數(shù)據(jù)挖掘可被看作是數(shù)據(jù)管理與分析技術(shù)數(shù)據(jù)挖掘可被看作是數(shù)據(jù)管理與分析技術(shù)的自然進(jìn)化產(chǎn)物的自然進(jìn)化產(chǎn)物第五節(jié)第五節(jié) 旅游企業(yè)

31、中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫二、數(shù)據(jù)挖掘(二、數(shù)據(jù)挖掘(Data Mining)數(shù)據(jù)挖掘基本知識(shí)數(shù)據(jù)挖掘基本知識(shí)數(shù)據(jù)挖掘:數(shù)據(jù)挖掘:在大量的數(shù)據(jù)中挖掘感興趣的知識(shí)(規(guī)則,規(guī)律,模式,約在大量的數(shù)據(jù)中挖掘感興趣的知識(shí)(規(guī)則,規(guī)律,模式,約束),從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)(哪些令人感興趣的、有用的、隱束),從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)(哪些令人感興趣的、有用的、隱含的、先前未知的和可能有用的模式或知識(shí))。含的、先前未知的和可能有用的模式或知識(shí))。數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)從大量數(shù)據(jù)中抽取挖掘出未知的、有價(jià)值的模式或規(guī)律從大量數(shù)據(jù)中抽取挖掘出未知的、有價(jià)值的模式或規(guī)律等知識(shí)的復(fù)雜過程。等知識(shí)的復(fù)雜過程。整個(gè)知識(shí)

32、挖掘過程由若干挖掘步驟組成,數(shù)據(jù)挖掘僅是整個(gè)知識(shí)挖掘過程由若干挖掘步驟組成,數(shù)據(jù)挖掘僅是其中一個(gè)主要步驟。其中一個(gè)主要步驟。數(shù)據(jù)挖掘?qū)嵗龜?shù)據(jù)挖掘?qū)嵗谖骞?jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫目標(biāo):挖掘的不僅僅是數(shù)據(jù)目標(biāo):挖掘的不僅僅是數(shù)據(jù) 如:目標(biāo)市場,客戶關(guān)系管理,市場占有量分析等。如:目標(biāo)市場,客戶關(guān)系管理,市場占有量分析等。數(shù)據(jù)從哪里來?數(shù)據(jù)從哪里來?-數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備 如:信用卡交易,會(huì)員卡,商家的優(yōu)惠劵,消費(fèi)者投訴電話,公眾生如:信用卡交易,會(huì)員卡,商家的優(yōu)惠劵,消費(fèi)者投訴電話,公眾生活方式研究等?;罘绞窖芯康取D繕?biāo)市場目標(biāo)市場 構(gòu)建一系列的構(gòu)建一系列的“客戶群模型客戶群

33、模型”,這些顧客具有相同特征:興趣愛好,這些顧客具有相同特征:興趣愛好,收入水平,消費(fèi)習(xí)慣,等等。收入水平,消費(fèi)習(xí)慣,等等。交叉市場分析交叉市場分析 貨物銷售之間的相互聯(lián)系和相關(guān)性,以及基于這種聯(lián)系上貨物銷售之間的相互聯(lián)系和相關(guān)性,以及基于這種聯(lián)系上的推測,如網(wǎng)上購物,會(huì)有推介(客戶可能感興趣的貨物)的推測,如網(wǎng)上購物,會(huì)有推介(客戶可能感興趣的貨物)財(cái)務(wù)計(jì)劃財(cái)務(wù)計(jì)劃 現(xiàn)金流轉(zhuǎn)分析和預(yù)測現(xiàn)金流轉(zhuǎn)分析和預(yù)測資源計(jì)劃資源計(jì)劃 總結(jié)和比較資源和花費(fèi)總結(jié)和比較資源和花費(fèi)競爭競爭 對(duì)競爭者和市場的監(jiān)控對(duì)競爭者和市場的監(jiān)控 將顧客按等級(jí)分組和基于等級(jí)的定價(jià)過程將顧客按等級(jí)分組和基于等級(jí)的定價(jià)過程 將定價(jià)策

34、略應(yīng)用于競爭更激烈的市場中將定價(jià)策略應(yīng)用于競爭更激烈的市場中體育競賽體育競賽 NBA30個(gè)球隊(duì)中,有個(gè)球隊(duì)中,有25個(gè)球隊(duì)使用了個(gè)球隊(duì)使用了IBM分析機(jī)構(gòu)的數(shù)分析機(jī)構(gòu)的數(shù)據(jù)挖掘工具,通過分析每個(gè)對(duì)手的數(shù)據(jù)(蓋帽、助攻、犯據(jù)挖掘工具,通過分析每個(gè)對(duì)手的數(shù)據(jù)(蓋帽、助攻、犯規(guī)等數(shù)據(jù)),來獲得比賽時(shí)的對(duì)抗優(yōu)勢(shì)。規(guī)等數(shù)據(jù)),來獲得比賽時(shí)的對(duì)抗優(yōu)勢(shì)。網(wǎng)絡(luò)營銷網(wǎng)絡(luò)營銷 通過挖掘客戶網(wǎng)絡(luò)訪問日志(根據(jù)通過挖掘客戶網(wǎng)絡(luò)訪問日志(根據(jù)IP地址,跟蹤這個(gè)地址,跟蹤這個(gè)IP地地址看這個(gè)客戶訪問了哪些網(wǎng)頁,瀏覽了哪些商品,然后我址看這個(gè)客戶訪問了哪些網(wǎng)頁,瀏覽了哪些商品,然后我們想客戶推銷合適的商品),發(fā)現(xiàn)客戶的偏好

35、。們想客戶推銷合適的商品),發(fā)現(xiàn)客戶的偏好。1.了解應(yīng)用領(lǐng)域了解應(yīng)用領(lǐng)域 了解相關(guān)的知識(shí)的應(yīng)用的目標(biāo)了解相關(guān)的知識(shí)的應(yīng)用的目標(biāo)2.創(chuàng)建目標(biāo)數(shù)據(jù)集創(chuàng)建目標(biāo)數(shù)據(jù)集 選擇數(shù)據(jù),如客戶購買模式,從電子商務(wù)網(wǎng)站,零售店等數(shù)據(jù)庫中獲取選擇數(shù)據(jù),如客戶購買模式,從電子商務(wù)網(wǎng)站,零售店等數(shù)據(jù)庫中獲取3.數(shù)據(jù)清理和預(yù)處理。數(shù)據(jù)清理和預(yù)處理。 把從不同數(shù)據(jù)庫來的數(shù)據(jù)整合成一個(gè)整體把從不同數(shù)據(jù)庫來的數(shù)據(jù)整合成一個(gè)整體-數(shù)據(jù)倉庫數(shù)據(jù)倉庫(60%60%)4. 數(shù)據(jù)縮減和變換數(shù)據(jù)縮減和變換-更加符合數(shù)據(jù)挖掘要求更加符合數(shù)據(jù)挖掘要求 找到有用的特征,維數(shù)縮減找到有用的特征,維數(shù)縮減/ /變量縮減,比如你只對(duì)某變量縮減,比如

36、你只對(duì)某產(chǎn)品的年度銷售數(shù)據(jù)感興趣,而目前只有產(chǎn)品的年度銷售數(shù)據(jù)感興趣,而目前只有365365份日銷售數(shù)份日銷售數(shù)據(jù),因此我們要把這些數(shù)據(jù)匯總成年度數(shù)據(jù),把據(jù),因此我們要把這些數(shù)據(jù)匯總成年度數(shù)據(jù),把365365變成變成一份數(shù)據(jù)。一份數(shù)據(jù)。5.選擇數(shù)據(jù)挖掘的功能(方法)選擇數(shù)據(jù)挖掘的功能(方法) 數(shù)據(jù)總結(jié),分類模型數(shù)據(jù)挖掘,回歸分析,數(shù)據(jù)總結(jié),分類模型數(shù)據(jù)挖掘,回歸分析,聚類分析等聚類分析等7.數(shù)據(jù)挖掘:數(shù)據(jù)挖掘:尋找感興趣的模式尋找感興趣的模式8.模式評(píng)估和知識(shí)表示模式評(píng)估和知識(shí)表示 對(duì)不同的用戶采用不同的數(shù)據(jù)表現(xiàn)形式,如對(duì)不同的用戶采用不同的數(shù)據(jù)表現(xiàn)形式,如圖表,如向經(jīng)理匯報(bào)。圖表,如向經(jīng)理匯

37、報(bào)。9.運(yùn)用發(fā)現(xiàn)的知識(shí)。運(yùn)用發(fā)現(xiàn)的知識(shí)。第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫二、數(shù)據(jù)挖掘(二、數(shù)據(jù)挖掘(Data Mining) 數(shù)據(jù)倉庫是創(chuàng)建商務(wù)智能過程中,繼數(shù)據(jù)數(shù)據(jù)倉庫是創(chuàng)建商務(wù)智能過程中,繼數(shù)據(jù)庫技術(shù)后進(jìn)一步的發(fā)展(超過數(shù)據(jù)庫)。庫技術(shù)后進(jìn)一步的發(fā)展(超過數(shù)據(jù)庫)。 數(shù)據(jù)挖掘工具是人們用于數(shù)據(jù)倉庫和商務(wù)數(shù)據(jù)挖掘工具是人們用于數(shù)據(jù)倉庫和商務(wù)智能推理過程中,支持決策、解決問題或智能推理過程中,支持決策、解決問題或創(chuàng)造競爭優(yōu)勢(shì)而挖掘有價(jià)值信息時(shí)所必需創(chuàng)造競爭優(yōu)勢(shì)而挖掘有價(jià)值信息時(shí)所必需的工具。的工具。數(shù)據(jù)挖掘:數(shù)據(jù)庫中的知識(shí)挖掘數(shù)據(jù)挖掘:數(shù)據(jù)庫中的知識(shí)挖掘支持商業(yè)決支持商業(yè)決策的潛能不策的潛能不斷增長斷增長數(shù)據(jù)表示形式數(shù)據(jù)表示形式信息發(fā)現(xiàn)信息發(fā)現(xiàn)統(tǒng)計(jì)分析、查詢等統(tǒng)計(jì)分析、查詢等數(shù)據(jù)倉庫數(shù)據(jù)倉庫在線分析處理(在線分析處理(OLAP)多維分析多維分析數(shù)據(jù)源數(shù)據(jù)源電子商務(wù)網(wǎng)站、論文、文件、咨詢機(jī)構(gòu)、數(shù)據(jù)庫、電子商務(wù)網(wǎng)站、論文、文件、咨詢機(jī)構(gòu)、數(shù)據(jù)庫、OLTPDBA最終用戶最終用戶商業(yè)分析家商業(yè)分析家數(shù)據(jù)分析家數(shù)據(jù)分析家第五節(jié)第五節(jié) 旅游企業(yè)中的數(shù)據(jù)倉庫旅游企業(yè)中的數(shù)據(jù)倉庫三、常用的數(shù)據(jù)挖掘工具三、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論