![數(shù)據(jù)倉庫習(xí)題答案_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/6/fab7df26-d062-41bc-b4eb-4c4bb6eb1883/fab7df26-d062-41bc-b4eb-4c4bb6eb18831.gif)
![數(shù)據(jù)倉庫習(xí)題答案_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/6/fab7df26-d062-41bc-b4eb-4c4bb6eb1883/fab7df26-d062-41bc-b4eb-4c4bb6eb18832.gif)
![數(shù)據(jù)倉庫習(xí)題答案_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/6/fab7df26-d062-41bc-b4eb-4c4bb6eb1883/fab7df26-d062-41bc-b4eb-4c4bb6eb18833.gif)
![數(shù)據(jù)倉庫習(xí)題答案_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/6/fab7df26-d062-41bc-b4eb-4c4bb6eb1883/fab7df26-d062-41bc-b4eb-4c4bb6eb18834.gif)
![數(shù)據(jù)倉庫習(xí)題答案_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/6/fab7df26-d062-41bc-b4eb-4c4bb6eb1883/fab7df26-d062-41bc-b4eb-4c4bb6eb18835.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上第一章1.為什么不能依靠傳統(tǒng)的業(yè)務(wù)處理系統(tǒng)進(jìn)行決策分析? (P1-3)2.在將數(shù)據(jù)源中的數(shù)據(jù)加載到數(shù)據(jù)倉庫之前需要完成那些工作?為什么要進(jìn)行這些工作?(數(shù)據(jù)準(zhǔn)備P13-14 另外加“抽取” )3.(選做)如果創(chuàng)建一個數(shù)據(jù)倉庫,主要是分析關(guān)于客戶的人口統(tǒng)計(收入、家庭人口、家庭位置、愛好等)。數(shù)據(jù)倉庫的目的在于將特定的產(chǎn)品推銷給合適的潛在客戶群。這個數(shù)據(jù)倉庫應(yīng)該從哪些地方獲取數(shù)據(jù)源,數(shù)據(jù)倉庫的體系結(jié)構(gòu)應(yīng)該包含哪些部分。(P12, 8) 4.從數(shù)據(jù)挖掘與數(shù)據(jù)庫、統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)的關(guān)系來討論什么是數(shù)據(jù)挖掘? 5.在數(shù)據(jù)挖掘過程中需要涉及到哪些過程?(P31-35) (1).
2、 確定挖掘?qū)ο笄逦囟x出業(yè)務(wù)問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步.(2)數(shù)據(jù)準(zhǔn)備1) 數(shù)據(jù)的選擇:選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù).2) 數(shù)據(jù)的預(yù)處理:研究數(shù)據(jù)的質(zhì)量, 并確定將要進(jìn)行的挖掘操作的類型.、(3) 模型的構(gòu)建:建立一個分析模型.這個分析模型是針對挖掘算法建立的。(4)數(shù)據(jù)挖掘:對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘.(5)結(jié)果分析:解釋并評估結(jié)果.其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會用到可視化技術(shù).(6)知識的應(yīng)用:將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去,使其在實際的管理決策分析中得到應(yīng)用6.在現(xiàn)實中有哪些人需要使用數(shù)據(jù)挖掘技術(shù)來幫助他的工作? (P35
3、)第二章名詞解釋; 維 :關(guān)于一個組織想要記錄的透視或?qū)嶓w。 維表 :對維各個屬性的描述。 事實 :數(shù)值的度量。 事實表: 包括事實的名稱或度量,以及每個相關(guān)維表的關(guān)鍵字。 元數(shù)據(jù): 數(shù)據(jù)的數(shù)據(jù),可以對數(shù)據(jù)倉庫中的各種數(shù)據(jù)進(jìn)行詳細(xì)的描述與說明,說明每個數(shù)據(jù)的上下關(guān)系,使每個數(shù)據(jù)具有符合現(xiàn)實的真實含義,使用戶可以了解這些數(shù)據(jù)之間的關(guān)系. 粒度 :數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細(xì)程度和級別.星型模型 : 最常用的數(shù)據(jù)倉庫設(shè)計結(jié)構(gòu)的實現(xiàn)模式。使數(shù)據(jù)倉庫形成了一個集成系統(tǒng),為用戶提供分析服務(wù)對象。核心是事實表,圍繞事實表的是維度表。通過事實表將各種不同的維度表連接起來,各個維度表都連接到中央事實表。 雪花模型
4、: 對星型模型的冗余的維度表進(jìn)一步分解,對星型模型中的維度表進(jìn)行了規(guī)范化處理。問答:n 1.簡述olap 與oltp的區(qū)別; Olap:在線分析處理;oltp:聯(lián)機(jī)事務(wù)處理。 n 2.在一般的信息管理中采用哪些概念模型來描述信息處理的對象,這些概念數(shù)據(jù)模型是否適合數(shù)據(jù)倉庫的開發(fā)環(huán)境?略答:一般的業(yè)務(wù)處理系統(tǒng)中廣泛采用實體-關(guān)系模型(ERD)來描述信息處理的對象,但 它無法表述數(shù)據(jù)倉庫中所需要的分析數(shù)據(jù)、描述數(shù)據(jù)和細(xì)節(jié)數(shù)據(jù)之間的關(guān)系,無法反映出時間屬性的存在和作用,更無法表現(xiàn)出數(shù)據(jù)的導(dǎo)出關(guān)系,因要對其進(jìn)行修改,得到星型模型或雪花模型。(CRUD矩陣在數(shù)據(jù)倉庫的高層模型中反應(yīng)實體的生成、引用、更新
5、和刪除不屬于概念模型的范疇)n 3.航空公司希望能夠分析在其服務(wù)旅客中的常客旅行趨勢,這樣可以為公司正確定位航空市場中的??褪袌?。并且希望能夠跟蹤不同航線上旅客的季節(jié)變化情況和增長,并跟蹤在不同航班上所消費的食品和飲料情況,這樣可以幫助航空公司安排不同航線上的航班和食品供應(yīng)。現(xiàn)在所面對的任務(wù)是為其設(shè)計一個數(shù)據(jù)倉庫的概念模型、邏輯模型和物理數(shù)據(jù)模型。航班旅客食物/飲料ERD模型雪花(概念)模型消費事實表旅客編號ID航班編號ID食物編號ID飲料編號ID季節(jié)ID乘坐次數(shù)旅客類型食物消費數(shù)量食品消費金額初次乘坐時間旅客編號ID省、市、縣、街聯(lián)系方式郵編航班編號ID航線編號機(jī)票價格機(jī)艙類型飛行里程始發(fā)地
6、目的地食物編號ID食物類別食品價格飲料編號ID飲料類別飲料價格季節(jié)ID季節(jié)類型旅客編號ID姓名、年齡職業(yè)、收入地址、身份證旅客編號 姓名 證件類型 證件號 職業(yè) 收入 乘坐季節(jié)旅客類別旅客編號 省 市 縣 街道郵政編碼聯(lián)系方式航班狀況航班號航線號飛行里程始發(fā)地目的地乘坐次數(shù)食物消費食物消費狀況食物編號食物類別消費數(shù)量旅客編號旅客邏輯模型食品消費季節(jié)狀況季節(jié)ID季節(jié)類型飲料消費飲料消費狀況飲料編號飲料類別消費數(shù)量事實表:消費事實表(旅客編號ID int12,航班編號ID int12,食物編號ID int12,飲料編號ID int12,季節(jié)ID int12,乘坐次數(shù)int12,旅客類型char 2
7、,食物消費數(shù)量int 4,食品消費金額 float 8,初次乘坐時間datatime 8)維表:(1) 旅客基本情況表 (編號 int12, 姓名 char12, 證件類型 chat12 , 證件號 char18, 職業(yè) char12, 收入 smallmoney 4, 乘坐季節(jié) datatime 8)(2) 旅客變動情況表(編號 int12,省char20,市char20,縣char20,街道char20 ,郵編 int 6, 聯(lián)系方式 varchar 50)(3) 食品消費情況表 (食品編號 int12, 名稱 char12, 類別 char 2, 數(shù)量 int 4)(4) 飲料消費情況表
8、 飲料編號 int12, 名稱 char12, 類別 char 2, 數(shù)量 int 4)(5) 航班情況表 (航班號 char12, 航線號 char12, 飛行里程 int4, 始發(fā)站 char10, 目的地 char 10, 時間 datatime 8)n 4.為建立第3題中的數(shù)據(jù)倉庫,需要哪些元數(shù)據(jù)?這些元數(shù)據(jù)在不同的階段應(yīng)該發(fā)揮什么作用?略答:元數(shù)據(jù):旅客基本信息,初次乘坐時間,食品消費情況,航班情況等 初次乘坐時記錄其編號,便于以后查詢和修改 每次乘坐時記錄航班狀況和食品消費狀況作用:p56-58 第三章1.為什么說數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)、逐步提升的開發(fā)過程? (P67)2.數(shù)
9、據(jù)倉庫的生命周期應(yīng)該包含哪幾個階段?需要完成哪些工作?(P65)數(shù)據(jù)倉庫的生命周期開發(fā)過程:(要求展開) 規(guī)劃分析階段:規(guī)劃與確定需求、開發(fā)概念模型、開發(fā)邏輯模型;設(shè)計實施階段:設(shè)計體系結(jié)構(gòu)、數(shù)據(jù)庫與元數(shù)據(jù)設(shè)計、數(shù)據(jù)抽取轉(zhuǎn)換與加載、開發(fā)中間件、填充與測試數(shù)據(jù)倉庫;使用維護(hù)階段:數(shù)據(jù)倉庫應(yīng)用、數(shù)據(jù)倉庫維護(hù)、數(shù)據(jù)倉庫評價。數(shù)據(jù)倉庫的生命周期開發(fā)特點:(1) 數(shù)據(jù)倉庫開發(fā)是從數(shù)據(jù)出發(fā)的;(2) 數(shù)據(jù)倉庫使用的需求不能在開發(fā)初期明確;(3) 數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的啟發(fā)式過程。3.在數(shù)據(jù)倉庫的需求分析中需要對哪些人員進(jìn)行需求調(diào)查,應(yīng)該調(diào)查哪些內(nèi)容?(P73)4.請為購買商品趨勢分析設(shè)計一個數(shù)據(jù)倉
10、庫的星型模型,并給出維表的層次結(jié)構(gòu)。(P78圖3.4,維表層次P75 表3-1 )5.在數(shù)據(jù)倉庫的開發(fā)過程中需要對哪些模型進(jìn)行評審,不同模型的評審內(nèi)容有哪些?(概念模型 P80,邏輯模型 P90,物理模型 P95)第四章 名詞解釋:維 (p106):決策分析的角度或出發(fā)點多維數(shù)據(jù)集(p107):數(shù)據(jù)立方體或超立方體。上卷(p110):從較低層次的數(shù)據(jù)開始沿某一個維的概念分層向上歸約 ,得到概括性的數(shù)據(jù)下鉆(p110):從較高層次的數(shù)據(jù)開始沿某一個維的概念分層向下或引入新的維來實現(xiàn),得到細(xì)節(jié)數(shù)據(jù);多維的切片(p109):在某兩個維上取一定區(qū)間的維成員或全部維成員,而其余的維上選定一個維成員的操作
11、。多維的切塊(p110): 在切片的基礎(chǔ)上,進(jìn)一步確定各個維成員的區(qū)間得到的片段體,即由多個切片疊合起來的。旋轉(zhuǎn)(p110): 對多維數(shù)據(jù)集改變其顯示得維方向,得到不同視角的數(shù)據(jù)多維OLAP(MOLAP) (p114):基于多維數(shù)據(jù)庫存儲方式建立起來的OLAP關(guān)系OLAP(ROLAP) (p118):基于關(guān)系數(shù)據(jù)庫存儲方式建立起來的OLAP問答:1.什么是OLAP?OLAP是一種技術(shù)?還是一種數(shù)據(jù)庫?(p105)在線分析處理或聯(lián)機(jī)分析處理 ,是一個應(yīng)用廣泛的數(shù)據(jù)倉庫使用技術(shù)。它可以根據(jù)分析人員的要求,快速、靈活地對大量數(shù)據(jù)進(jìn)行復(fù)雜的查詢處理,并以直觀的、容易理解的形式將查詢結(jié)構(gòu)提供給決策人員。
12、2.OLAP的系統(tǒng)結(jié)構(gòu)是怎樣的?這種結(jié)構(gòu)在進(jìn)行在線分析時有什么特點?(p113-114)OLAP的系統(tǒng)結(jié)構(gòu)分為瘦客戶端系統(tǒng)和胖客戶端系統(tǒng)。胖客戶端系統(tǒng):將多維數(shù)據(jù)存儲于客戶端和OLAP服務(wù)器,這種系統(tǒng)由于客戶在進(jìn)行在線分析處理時,需要將數(shù)據(jù)加載到客戶端,容易產(chǎn)生網(wǎng)絡(luò)瓶頸。瘦客戶端系統(tǒng):多維數(shù)據(jù)集不存儲在客戶端,存在OLAP服務(wù)器中,這在網(wǎng)絡(luò)中所需傳輸?shù)闹皇欠治鎏幚砗蟮慕Y(jié)果,而不是多維數(shù)據(jù)集。3.MOLAP和ROLAP在OLAP的數(shù)據(jù)存儲中各有什么特點?在什么情況下,選擇MOLAP?在什么情況下,選擇ROLAP?(p122-123 MOLAP:將數(shù)據(jù)和聚合都存儲于多維數(shù)據(jù)結(jié)構(gòu)中。ROLAP:將數(shù)據(jù)和聚合都存儲于關(guān)系數(shù)據(jù)結(jié)構(gòu)中;如果需要建立一個大型的,功
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度物資訂購策劃管理協(xié)議
- 2025年企業(yè)員工購物券福利采購合同范本
- 魚塘綜合利用承包經(jīng)營合同2025
- 2025年度企業(yè)職業(yè)素養(yǎng)提升策略協(xié)議
- 2025年寫字樓租賃權(quán)益協(xié)議
- 2025年企業(yè)郵箱租賃合同樣本
- 2025年中期企業(yè)合作口頭借款協(xié)議書
- 2025年股權(quán)投資與合作策劃協(xié)議樣本
- 2025年雙邊商業(yè)合作協(xié)議
- 2025年兄弟共有財產(chǎn)分配轉(zhuǎn)讓協(xié)議書
- 《地理信息系統(tǒng)GIS》全套教學(xué)課件
- 技術(shù)序列學(xué)習(xí)地圖(2023年)
- 中國銀行(香港)有限公司招聘筆試真題2023
- 15萬噸水廠安裝工程施工組織設(shè)計方案
- 自動體外除顫器項目創(chuàng)業(yè)計劃書
- 養(yǎng)老機(jī)構(gòu)績效考核及獎勵制度
- 2024年越南煤礦設(shè)備再制造行業(yè)現(xiàn)狀及前景分析2024-2030
- 長塘水庫工程環(huán)評報告書
- 病案管理質(zhì)量控制指標(biāo)檢查要點
- DL-T5001-2014火力發(fā)電廠工程測量技術(shù)規(guī)程
- 平行四邊形的判定(27張)-完整課件
評論
0/150
提交評論