《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程實驗指導(dǎo)書_第1頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程實驗指導(dǎo)書_第2頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程實驗指導(dǎo)書_第3頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程實驗指導(dǎo)書_第4頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程實驗指導(dǎo)書_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程的實驗指導(dǎo)實驗1數(shù)據(jù)倉庫的構(gòu)建一、實驗的目的和要求實驗的目的1 .理解數(shù)據(jù)庫和數(shù)據(jù)倉庫的差異和聯(lián)系2 .掌握數(shù)據(jù)倉庫的基本方法和相關(guān)工具的使用。(2)實驗要求利用實驗室和指導(dǎo)老師提供的實驗軟件,認(rèn)真完成規(guī)定的實驗項目,真實記錄實驗中遇到的各種問題和解決方法和過程,描繪了模擬實驗例的數(shù)據(jù)倉庫模型。 實驗結(jié)束后,應(yīng)該根據(jù)實驗情況寫實驗報告。二、實驗設(shè)備和軟件基于NT的局域網(wǎng)、服務(wù)器和客戶機安裝MS SQL Server服務(wù)系統(tǒng)和Analysis Services系統(tǒng)。三、實驗內(nèi)容以SQL Server為系統(tǒng)平臺,設(shè)計、構(gòu)建數(shù)據(jù)庫,并在此基礎(chǔ)上創(chuàng)建數(shù)據(jù)倉庫。四、實驗程序啟動SQ

2、L Server服務(wù)SQL Server服務(wù)在SQL Server實例啟動時啟動。 啟動SQL Server服務(wù)后,用戶可以與服務(wù)器建立新連接。 SQL Server服務(wù)可以在本地或遠(yuǎn)程作為Microsoft Windows NT 4.0或Windows 2000服務(wù)啟動和停止。啟動MSSQLServerOLAPServices如果SQL Server服務(wù)是默認(rèn)實例,則在為名為MSSQLServer的實例命名時,它被稱為MSSQL $實例名稱。3 .建立系統(tǒng)數(shù)據(jù)源連接 Microsoft Windows NT 4.0用戶:單擊“開始”按鈕,指向“設(shè)置”,單擊“控制面板”,然后雙擊“數(shù)據(jù)源(OD

3、BC )”。 Windows 2000用戶:單擊“開始”按鈕,指向“設(shè)置”,單擊“控制面板”,雙擊“管理工具”,然后雙擊“數(shù)據(jù)源(ODBC )”。在系統(tǒng)DSN標(biāo)簽上單擊“添加”按鈕。選擇“microsoftaccessdriver (*.MDB )”,然后單擊“完成”按鈕。在“數(shù)據(jù)源名稱”框中輸入教程,然后在“數(shù)據(jù)庫”下單擊“選擇”。在“選擇數(shù)據(jù)庫”對話框中,導(dǎo)航到“c : 程序文件 microsoftanalysisservicessamples”,然后單擊FoodMart 2000.mdb。 單擊“確定”按鈕。4 .建立數(shù)據(jù)庫和數(shù)據(jù)源數(shù)據(jù)庫結(jié)構(gòu)的構(gòu)建方法在“分析管理器”樹視圖中,展開分析服

4、務(wù)器。點擊服務(wù)器名稱,建立與analysis服務(wù)器的連接。右鍵單擊服務(wù)器名,然后單擊“新建數(shù)據(jù)庫”命令。在“數(shù)據(jù)庫”對話框的“數(shù)據(jù)庫名稱”框中輸入教程,然后單擊“確定”按鈕。在Analysis Manager樹窗格中,展開服務(wù)器,然后展開您創(chuàng)建的教程數(shù)據(jù)庫。建立數(shù)據(jù)源;在Analysis Manager樹窗格中,右鍵單擊“教程”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新建數(shù)據(jù)源”命令。 在“數(shù)據(jù)鏈接屬性”對話框中,單擊“提供程序”標(biāo)簽,然后單擊“microsoftelocommenterdbaproviderfordodbcdrivers”。單擊“連接”標(biāo)簽,然后從“使用數(shù)據(jù)源名稱”列表中單擊“

5、教程”。點擊“連接測試”,確認(rèn)一切正常工作。 “microsoftdatalink”對話框?qū)@示一條消息,表示連接成功。 在消息框中單擊“確定”按鈕。單擊“確定”按鈕,關(guān)閉“數(shù)據(jù)鏈接屬性”對話框。5 .建立立方結(jié)構(gòu)當(dāng)前用戶是foodmart公司的數(shù)據(jù)庫管理員。 FoodMart是一家大型連鎖店,在美國、墨西哥、加拿大有銷售業(yè)務(wù)。 市場部想按產(chǎn)品和顧客分析1998年進(jìn)行的所有銷售業(yè)務(wù)數(shù)據(jù)。 使用存儲在公司數(shù)據(jù)倉庫中的數(shù)據(jù),可以構(gòu)建多維數(shù)據(jù)結(jié)構(gòu)(多維數(shù)據(jù)集),市場分析家可以在查詢數(shù)據(jù)庫時快速響應(yīng)。 制作銷售分析的立方體。打開多維數(shù)據(jù)集向?qū)г凇胺治龉芾砥鳂洹贝案裰?,右鍵單擊“教程”數(shù)據(jù)庫下的“多維數(shù)

6、據(jù)集”文件夾,單擊“新建多維數(shù)據(jù)集”菜單,然后單擊“向?qū)А泵?。向多維數(shù)據(jù)集添加度量值度量值是要分析的數(shù)據(jù)庫中的量化值。 典型的度量值是銷售、成本和預(yù)算數(shù)據(jù)。 度量的值根據(jù)立方的不同維類別進(jìn)行分析。在多維數(shù)據(jù)集向?qū)У摹皻g迎”步驟中,單擊“下一步”按鈕。在“從數(shù)據(jù)源中選擇數(shù)值數(shù)據(jù)表”步驟中,展開“教程”數(shù)據(jù)源,然后單擊sales_fact_1998。點擊“參照數(shù)據(jù)”按鈕,顯示“sales_fact_1998”表的數(shù)據(jù)。 數(shù)據(jù)瀏覽完成后,關(guān)閉“數(shù)據(jù)瀏覽”窗口,然后單擊“下一步”按鈕。要定義多維數(shù)據(jù)集的度量值,請雙擊“事實數(shù)據(jù)表數(shù)據(jù)列”中的store_sales。 對store_cost和unit_

7、sales列重復(fù)此過程,然后單擊“下一步”按鈕。建立時間維度在向?qū)У摹斑x擇多維數(shù)據(jù)集維”步驟中,單擊“新建維”命令。 啟動維向?qū)?。在“歡迎”步驟中,點擊“下一步”按鈕。在“選擇維的創(chuàng)建方法”步驟中,選擇“星型架構(gòu):一維表”選項,然后單擊“下一步”按鈕。在“選擇維表”步驟中,單擊“time_by_day”。 單擊“瀏覽數(shù)據(jù)”按鈕,顯示“time_by_day”表中包含的數(shù)據(jù)。 確認(rèn)time_by_day表后,單擊“下一步”按鈕。在“選擇維類型”步驟中,選擇“時間維”選項,然后單擊“下一步”按鈕。然后定義維的級別。 在“創(chuàng)建時間維層”步驟中,單擊“選擇時間層”,單擊“年、季度、月”,然后單擊“下一

8、步”按鈕。在“選擇高級選項”的步驟中,單擊“下一步”按鈕。在向?qū)У淖詈笠徊街校斎搿癟ime”作為新維的名稱。點擊“完成”返回“多維數(shù)據(jù)集向?qū)А?。多維數(shù)據(jù)集向?qū)КF(xiàn)在在“多維數(shù)據(jù)集維”列表中顯示“時間”維。建立產(chǎn)品維度再次單擊“新建維”命令。 在歡迎使用維向?qū)Р襟E中,單擊下一步按鈕。在“選擇維的創(chuàng)建方法”步驟中,選擇“雪花架構(gòu):多個相關(guān)維表”選項,然后單擊“下一步”按鈕。在“選擇維表”步驟中,雙擊Product和product_class,將其添加到“選定的表”中。 單擊“下一步”按鈕。維向?qū)У摹皠?chuàng)建和編輯聯(lián)接”步驟顯示在上一步中選擇的兩個表及其聯(lián)接。 單擊“下一步”按鈕。要定義l維的級別,請在

9、可用列中雙擊product_category、product_subcategory、brand_name。 雙擊每一列,將其名稱顯示在“維級別”下。 選擇所有三列后,單擊“下一步”按鈕。l在“指定成員鍵列”步驟中,單擊“下一步”按鈕。l在“選擇高級選項”步驟中,單擊“下一步”按鈕。l在向?qū)У淖詈笠徊街?,在“維名稱”框中輸入Product,并保持“與其他多維數(shù)據(jù)集共享此維”復(fù)選框處于選中狀態(tài)。 單擊“完成”按鈕。l產(chǎn)品維現(xiàn)在顯示在“多維數(shù)據(jù)集維”列表中。建立客戶維度點擊“新建維”命令。在“歡迎”步驟中,單擊“下一步”按鈕。在“選擇創(chuàng)建維的方法”步驟中,選擇“星型架構(gòu):一維表”選項,然后單擊“下

10、一步”按鈕。在“選擇維表”步驟中,單擊“客戶”,然后單擊“下一步”按鈕。在“選擇維類型”步驟中,單擊“下一步”按鈕。要定義維級別,請在可用列中雙擊Country、State_Province、City、lname。 雙擊每一列,其名稱將顯示在“維級別”下。 選擇了所有四列后,單擊“下一步”按鈕。在“指定成員鍵列”的步驟中,單擊“下一步”按鈕。在“選擇高級選項”的步驟中,單擊“下一步”按鈕。在向?qū)У淖詈笠徊?,在“維名稱”框中輸入Customer。 保持選中“與其他多維數(shù)據(jù)集共享此維”復(fù)選框。 單擊“完成”按鈕。多維數(shù)據(jù)集向?qū)КF(xiàn)在在“多維數(shù)據(jù)集維”列表中顯示“客戶”維。完成立方體的生成在多維數(shù)據(jù)集

11、向?qū)е?,單擊“下一步”按鈕。顯示“事實數(shù)據(jù)表行數(shù)”的信息后,點擊“是”按鈕。在多維數(shù)據(jù)集向?qū)У淖詈笠徊街?,將多維數(shù)據(jù)集命名為“Sales”,然后單擊“完成”按鈕。向?qū)шP(guān)閉,啟動包含剛創(chuàng)建的多維數(shù)據(jù)集的多維數(shù)據(jù)集編輯器。 點擊藍(lán)色或黃色標(biāo)題欄,如下圖所示排列表。實驗二維數(shù)據(jù)的組織和分析(OLAP )一、實驗的目的和要求實驗的目的1 .理解維度(表)、成員、層次(粒度)等基本概念及其關(guān)系2 .了解多維數(shù)據(jù)集創(chuàng)建的基本原理和過程理解和掌握OLAP分析的基本過程和方法(2)實驗要求利用實驗室導(dǎo)師提供的實驗軟件,認(rèn)真完成規(guī)定的實驗內(nèi)容,真實記錄實驗中遇到的各種問題和解決方法和過程,并根據(jù)實驗案例描繪多維

12、數(shù)據(jù)組織模型及其OLAP操作過程。 實驗結(jié)束后,應(yīng)該根據(jù)實驗情況寫實驗報告。二、實驗設(shè)備和軟件基于NT的局域網(wǎng),服務(wù)器和客戶機安裝MS SQL Server服務(wù)系統(tǒng)和分析服務(wù)系統(tǒng)。三、實驗內(nèi)容使用Analysis Server工具創(chuàng)建維、度量值和多維數(shù)據(jù)集(模擬方案)。2 .使用維瀏覽器查詢、編輯多維數(shù)據(jù)。3 .對立方體進(jìn)行切片、切片、旋轉(zhuǎn)、鉆孔操作。四、實驗程序1 .編輯多維數(shù)據(jù)集使用多維數(shù)據(jù)集向現(xiàn)有的銷售多維數(shù)據(jù)集添加維。有兩種方法可以啟用多維數(shù)據(jù)集編輯器。在Analysis Manager樹窗格中,右鍵單擊現(xiàn)有多維數(shù)據(jù)集,然后單擊“編輯”命令。使用多維數(shù)據(jù)集編輯器直接創(chuàng)建新多維數(shù)據(jù)集。

13、除非您是高級用戶,否則不推薦此方法。從上一節(jié)的操作繼續(xù)時,應(yīng)該已經(jīng)在多維數(shù)據(jù)集編輯器中。多維數(shù)據(jù)集的“架構(gòu)”窗格中顯示與數(shù)值數(shù)據(jù)表(黃色標(biāo)題欄)連接的維表(藍(lán)色標(biāo)題欄)。 在多維數(shù)據(jù)集編輯器的樹窗格中,可以在層次樹中預(yù)覽多維數(shù)據(jù)集的結(jié)構(gòu)。 通過單擊左窗格底部的屬性按鈕,可以編輯多維數(shù)據(jù)集的屬性。使用存儲設(shè)計向?qū)碓O(shè)計存儲在“分析管理器樹”窗格中,展開教程數(shù)據(jù)庫下的多維數(shù)據(jù)集文件夾,右鍵單擊銷售多維數(shù)據(jù)集,然后單擊編輯命令。在“歡迎”步驟中單擊“下一步”按鈕。選擇“MOLAP”作為數(shù)據(jù)保存類型,點擊“下一步”按鈕。在“設(shè)置聚合選項”中,單擊“提高性能”。 在此框中輸入40作為指定的百分比。此操作

14、指示Analysis Services將性能提高40%,而不管所需的磁盤空間如何。 使用此優(yōu)化功能,管理員可以在查詢的性能要求和存儲聚合數(shù)據(jù)所需的磁盤空間之間取得平衡。點擊開始按鈕。當(dāng)Analysis Services設(shè)計聚合時,可以顯示向?qū)в覀?cè)的“性能和大小”圖表。 由此可以看出,為了提高性能,需要增加磁盤容量. 聚合設(shè)計過程完成后,單擊“下一步”按鈕。2 .參考多維數(shù)據(jù)集數(shù)據(jù)使用多維數(shù)據(jù)集瀏覽器對Sales數(shù)據(jù)進(jìn)行切片和切片。如何使用多維數(shù)據(jù)集瀏覽器顯示多維數(shù)據(jù)集數(shù)據(jù)在Analysis Manager樹窗格中,右鍵單擊銷售多維數(shù)據(jù)集,然后單擊“瀏覽數(shù)據(jù)”命令。顯示多維數(shù)據(jù)集瀏覽器,并顯示由

15、多維數(shù)據(jù)集維和度量值組成的網(wǎng)格。 另外四個維顯示在瀏覽器的頂部。替換網(wǎng)格維的方法要用其他維替換網(wǎng)格中的維,請將上方框中的維直接拖放到要交換維的列上。 在此過程中,請確保指針的形狀為兩端的箭頭。使用此拖放方法,選擇“產(chǎn)品”維按鈕,將其拖動到網(wǎng)格上,然后直接拖放到“測量”上。 Product和Measures維在多維數(shù)據(jù)集瀏覽器中交換位置。注:如果要將維添加到網(wǎng)格,而不是添加到其他維,請將該維拖到網(wǎng)格的中心。按時間篩選數(shù)據(jù)單擊Time維旁邊的箭頭。展開“所有時間”和“1998”節(jié)點,然后單擊“第1季”。 網(wǎng)格中的數(shù)據(jù)將被篩選,篩選的數(shù)據(jù)僅反映季度情況。l通過拖放來交換產(chǎn)品維和客戶維。 單擊Product,并將其拖到Country維中。雙擊l網(wǎng)格中包含“喚醒工具”的單元格。 多維數(shù)據(jù)集已展開,包含子類別列。l完成后,單擊關(guān)閉按鈕關(guān)閉多維數(shù)據(jù)集瀏覽器。3 .編輯多維數(shù)據(jù)集您可以使用立方結(jié)構(gòu)編輯器修改現(xiàn)有的立方結(jié)構(gòu)。 使用多維數(shù)據(jù)集編輯器向現(xiàn)有的銷售多維數(shù)據(jù)集添加維有兩種方法可以啟用多維數(shù)據(jù)集編輯器。在Analysis Manager樹窗格中,右鍵單擊現(xiàn)有多維數(shù)據(jù)集,然后單擊“編輯”命令。使用l多維數(shù)據(jù)集編輯器直接創(chuàng)建新多維數(shù)據(jù)集。 除非您是高級

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論