數(shù)據(jù)倉庫習(xí)題答案_第1頁
數(shù)據(jù)倉庫習(xí)題答案_第2頁
數(shù)據(jù)倉庫習(xí)題答案_第3頁
數(shù)據(jù)倉庫習(xí)題答案_第4頁
數(shù)據(jù)倉庫習(xí)題答案_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章1. 為什么不能依靠傳統(tǒng)的業(yè)務(wù)處理系統(tǒng)進(jìn)行決策分析?(P1-3)2在將數(shù)據(jù)源中的數(shù)據(jù)加載到數(shù)據(jù)倉庫之前需要完成那些工作?為什么要進(jìn)行 這些工作?(數(shù)據(jù)準(zhǔn)備P13-14另外加“抽取”)3. (選做)如果創(chuàng)建一個(gè)數(shù)據(jù)倉庫,主要是分析關(guān)于客戶的人口統(tǒng)計(jì)(收入、家庭人口、家庭位置、愛好等)。數(shù)據(jù)倉庫的目的在于將特定的產(chǎn)品推銷給合適的 潛在客戶群。這個(gè)數(shù)據(jù)倉庫應(yīng)該從哪些地方獲取數(shù)據(jù)源,數(shù)據(jù)倉庫的體系結(jié)構(gòu)應(yīng)該包含哪些部分。(P12,8)4. 從數(shù)據(jù)挖掘與數(shù)據(jù)庫、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)的關(guān)系來討論什么是數(shù)據(jù)挖掘?5. 在數(shù)據(jù)挖掘過程中需要涉及到哪些過程?(P31-35)(1).確定挖掘?qū)ο笄逦囟x出業(yè)務(wù)問

2、題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步(2)數(shù)據(jù)準(zhǔn)備1)數(shù)據(jù)的選擇:選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù) 2)數(shù)據(jù)的預(yù)處理:研究數(shù)據(jù)的質(zhì)量,并確定將要進(jìn)行的挖掘操作的類型.、(3)模型的構(gòu)建:建立一個(gè)分析模型這個(gè)分析模型是針對挖掘算法建立的。4)數(shù)據(jù)挖掘:對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘(5)結(jié)果分析:解釋并評估結(jié)果.其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定 通常會(huì)用到可視化技術(shù).(6)知識(shí)的應(yīng)用:將分析所得到的知識(shí)集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去 使其在實(shí)際的管理決策分析中得到應(yīng)用6. 在現(xiàn)實(shí)中有哪些人需要使用數(shù)據(jù)挖掘技術(shù)來幫助他的工作? (P35)第二章 名詞解釋;維:關(guān)于一個(gè)組織想要記錄的

3、透視或?qū)嶓w。維表:對維各個(gè)屬性的描述。事實(shí):數(shù)值的度量。事實(shí)表:包括事實(shí)的名稱或度量,以及每個(gè)相關(guān)維表的關(guān)鍵字。元數(shù)據(jù):數(shù)據(jù)的數(shù)據(jù),可以對數(shù)據(jù)倉庫中的各種數(shù)據(jù)進(jìn)行詳細(xì)的描述與說明 ,說 明每個(gè)數(shù)據(jù)的上下關(guān)系,使每個(gè)數(shù)據(jù)具有符合現(xiàn)實(shí)的真實(shí)含義,使用戶可以了解這 些數(shù)據(jù)之間的關(guān)系粒度:數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細(xì)程度和級(jí)別星型模型:最常用的數(shù)據(jù)倉庫設(shè)計(jì)結(jié)構(gòu)的實(shí)現(xiàn)模式。使數(shù)據(jù)倉庫形成了一個(gè) 集成系統(tǒng),為用戶提供分析服務(wù)對象。核心是事實(shí)表,圍繞事實(shí)表的是維度表。 通過事實(shí)表將各種不同的維度表連接起來,各個(gè)維度表都連接到中央事實(shí)表。雪花模型:對星型模型的冗余的維度表進(jìn)一步分解, 對星型模型中的維度表進(jìn) 行了

4、規(guī)范化處理。問答:1簡述olap與oltp的區(qū)別;Olap:在線分析處理;oltp :聯(lián)機(jī)事務(wù)處理。特征OLTPOLAP任務(wù)特點(diǎn)操作處理信息處理面向事務(wù)分析用戶辦事員、DBA、數(shù)據(jù)庫專業(yè)人員經(jīng)理、主管、數(shù)據(jù)分析員功能日常操作長期信息分析.決策支持DB設(shè)計(jì)基于E-R,面向應(yīng)用星型/雪花,面向主體數(shù)據(jù)最新的、詳細(xì)的歷史的、匯總的視圖詳細(xì)的.二維關(guān)系型匯總的、多維的任務(wù)單位簡短的事務(wù)復(fù)雜的杳詢訪問數(shù)據(jù)量數(shù)十個(gè)數(shù)百萬個(gè)用戶數(shù)數(shù)千個(gè)數(shù)百個(gè)DB規(guī)模100M-數(shù) GB100GB-數(shù) TB優(yōu)先性咼性能、咼可用性高靈活性、端點(diǎn)用戶自治爭芳3雖旦l里、 甲比乂 口1 口 J2. 在一般的信息管理中采用哪些 概念模

5、型來描述信息處理的對象,這些概 念數(shù)據(jù)模型是否適合數(shù)據(jù)倉庫的開發(fā)環(huán)境?略答:一般的業(yè)務(wù)處理系統(tǒng)中廣泛采用實(shí)體-關(guān)系模型(ERD)來描述信息處 理的對象,但它無法表述數(shù)據(jù)倉庫中所需要的分析數(shù)據(jù)、描述數(shù)據(jù)和細(xì)節(jié) 數(shù)據(jù)之間的關(guān)系,無法反映出時(shí)間屬性的存在和作用, 更無法表現(xiàn)出數(shù)據(jù) 的導(dǎo)出關(guān)系,因要對其進(jìn)行修改,得到星型模型或雪花模型。(CRUD矩陣在數(shù)據(jù)倉庫的高層模型中反應(yīng)實(shí)體的生成、引用、更新和刪除不屬于概念模型的范疇)3. 航空公司希望能夠分析在其服務(wù)旅客中的??吐眯汹厔?,這樣可以為公司正確定位航空市場中的??褪袌?。并且希望能夠跟蹤不同航線上旅客的 季節(jié)變化情況和增長,并跟蹤在不同航班上所消費(fèi)的

6、食品和飲料情況,這樣可以幫助航空公司安排不同航線上的航班和食品供應(yīng)?,F(xiàn)在所面對的任務(wù)是為其設(shè)計(jì)一個(gè)數(shù)據(jù)倉庫的概念模型、邏輯模型和物理數(shù)據(jù)模型。事實(shí)表:消費(fèi)事實(shí)表(旅客編號(hào)ID int12,航班編號(hào)ID int12,食物編號(hào)ID int12,飲料編號(hào)ID int12,季節(jié)ID int12,乘坐次數(shù)int12,旅客類型 char 2,食物消費(fèi)數(shù)量int 4,食品消費(fèi)金額float 8,初次乘坐時(shí)間 datatime 8)維表:(1) 旅客基本情況表(編號(hào)int12,姓名char12,證件類型chat12 ,證件 號(hào) char18,職業(yè) char12,收入 smallmoney 4,乘坐季節(jié) dat

7、atime8)(2) 旅客變動(dòng)情況表(編號(hào) int12,省char20,市char20,縣char20,街 道 char20 ,郵編 int 6,聯(lián)系方式 varchar 50)(3)食品消費(fèi)情況表(食品編號(hào)int12,名稱char12,類別char 2,數(shù)量 int 4)(4) 飲料消費(fèi)情況表 飲料編號(hào)int12,名稱char12,類別char 2,數(shù)量 int 4)(5)航班情況表(航班號(hào)char12,航線號(hào)char12,飛行里程int4,始發(fā)站 char10,目的地 char 10,時(shí)間 datatime 8)4. 為建立第3題中的數(shù)據(jù)倉庫,需要哪些元數(shù)據(jù)?這些元數(shù)據(jù)在不同的階段應(yīng)該發(fā)揮

8、什么作用?略答:元數(shù)據(jù):旅客基本信息,初次乘坐時(shí)間,食品消費(fèi)情況,航班情況等初次乘坐時(shí)記錄其編號(hào),便于以后查詢和修改 每次乘坐時(shí)記錄航班狀況和食品消費(fèi)狀況作用:p56-58第三章1為什么說數(shù)據(jù)倉庫的開發(fā)是一個(gè)不斷循環(huán)、 逐步提升的開發(fā)過程?( P67)2. 數(shù)據(jù)倉庫的生命周期應(yīng)該包含哪幾個(gè)階段?需要完成哪些工作? (P65)數(shù)據(jù)倉庫的生命周期開發(fā)過程:(要求展開)規(guī)劃分析階段:規(guī)劃與確定需求、開發(fā)概念模型、開發(fā)邏輯模型;設(shè)計(jì)實(shí)施階段:設(shè)計(jì)體系結(jié)構(gòu)、數(shù)據(jù)庫與元數(shù)據(jù)設(shè)計(jì)、數(shù)據(jù)抽取轉(zhuǎn)換與加 載、開發(fā)中間件、填充與測試數(shù)據(jù)倉庫;使用維護(hù)階段:數(shù)據(jù)倉庫應(yīng)用、數(shù)據(jù)倉庫維護(hù)、數(shù)據(jù)倉庫評價(jià)。數(shù)據(jù)倉庫的生命周期

9、開發(fā)特點(diǎn):(1) 數(shù)據(jù)倉庫開發(fā)是從數(shù)據(jù)出發(fā)的;(2) 數(shù)據(jù)倉庫使用的需求不能在開發(fā)初期明確;(3) 數(shù)據(jù)倉庫的開發(fā)是一個(gè)不斷循環(huán)的啟發(fā)式過程。3. 在數(shù)據(jù)倉庫的需求分析中需要對哪些人員進(jìn)行需求調(diào)查,應(yīng)該調(diào)查哪些內(nèi)容?(P73)4請為購買商品趨勢分析設(shè)計(jì)一個(gè)數(shù)據(jù)倉庫的星型模型,并給出維表的層次結(jié)構(gòu)。(P78圖3.4,維表層次P75表3-1)5. 在數(shù)據(jù)倉庫的開發(fā)過程中需要對哪些模型進(jìn)行評審,不同模型的評審內(nèi)容有哪些?(概念模型 P80,邏輯模型P90,物理模型 P95)第四章名詞解釋:維(p106):決策分析的角度或出發(fā)點(diǎn)多維數(shù)據(jù)集(p107):數(shù)據(jù)立方體或超立方體。上卷(p110):從較低層次

10、的數(shù)據(jù)開始沿某一個(gè)維的概念分層向上歸約,得到概括性的數(shù)據(jù)下鉆(p110):從較高層次的數(shù)據(jù)開始沿某一個(gè)維的概念分層向下或引入新的維來 實(shí)現(xiàn),得到細(xì)節(jié)數(shù)據(jù);多維的切片(p109):在某兩個(gè)維上取一定區(qū)間的維成員或全部維成員,而其余的 維上選定一個(gè)維成員的操作。多維的切塊(p110):在切片的基礎(chǔ)上,進(jìn)一步確定各個(gè)維成員的區(qū)間得到的片段 體,即由多個(gè)切片疊合起來的。旋轉(zhuǎn)(p110):對多維數(shù)據(jù)集改變其顯示得維方向,得到不同視角的數(shù)據(jù)多維OLAP(MOLAP) (p114):基于多維數(shù)據(jù)庫存儲(chǔ)方式建立起來的 OLAP關(guān)系OLAP(ROLAP) (p118):基于關(guān)系數(shù)據(jù)庫存儲(chǔ)方式建立起來的 OLAP

11、問答:1.什么是OLAP ? OLAP是一種技術(shù)?還是一種數(shù)據(jù)庫?(p105)在線分析處理或聯(lián)機(jī)分析處理,是一個(gè)應(yīng)用廣泛的數(shù)據(jù)倉庫使用技術(shù)。 它可以根 據(jù)分析人員的要求,快速、靈活地對大量數(shù)據(jù)進(jìn)行復(fù)雜的查詢處理, 并以直觀的、 容易理解的形式將查詢結(jié)構(gòu)提供給決策人員。2.0LAP的系統(tǒng)結(jié)構(gòu)是怎樣的?這種結(jié)構(gòu)在進(jìn)行在線分析時(shí)有什么特點(diǎn)?(P113-114)OLAP的系統(tǒng)結(jié)構(gòu)分為瘦客戶端系統(tǒng)和胖客戶端系統(tǒng)。胖客戶端系統(tǒng):將多維數(shù)據(jù)存儲(chǔ)于客戶端和 OLAP服務(wù)器,這種系統(tǒng)由 于客戶在進(jìn)行在線分析處理時(shí),需要將數(shù)據(jù)加載到客戶端,容易產(chǎn)生網(wǎng)絡(luò)瓶 頸。瘦客戶端系統(tǒng):多維數(shù)據(jù)集不存儲(chǔ)在客戶端,存在OLAP服務(wù)器中,這在網(wǎng)絡(luò)中所需傳輸?shù)闹皇欠治鎏幚砗蟮慕Y(jié)果,而不是多維數(shù)據(jù)集。3.MOLAP和ROLAP在OLAP的數(shù)據(jù)存儲(chǔ)中各有什么特點(diǎn)?在什么情況下, 選擇MOLAP ?在什么情況下,選擇 ROLAP ?(p122-123 MOLAP :將數(shù)據(jù)和聚合都存儲(chǔ)于多維數(shù)據(jù)結(jié)構(gòu)中。 ROLAP :將數(shù)據(jù)和聚合都存儲(chǔ)于關(guān)系數(shù)據(jù)結(jié)構(gòu)中;如果需要建立一個(gè)大型的,功能復(fù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論