![數(shù)據(jù)倉庫與數(shù)據(jù)挖掘習(xí)題課63ppt課件_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/7a63d739-10e4-405e-a68d-bc192f37ad10/7a63d739-10e4-405e-a68d-bc192f37ad101.gif)
![數(shù)據(jù)倉庫與數(shù)據(jù)挖掘習(xí)題課63ppt課件_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/7a63d739-10e4-405e-a68d-bc192f37ad10/7a63d739-10e4-405e-a68d-bc192f37ad102.gif)
![數(shù)據(jù)倉庫與數(shù)據(jù)挖掘習(xí)題課63ppt課件_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/7a63d739-10e4-405e-a68d-bc192f37ad10/7a63d739-10e4-405e-a68d-bc192f37ad103.gif)
![數(shù)據(jù)倉庫與數(shù)據(jù)挖掘習(xí)題課63ppt課件_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/7a63d739-10e4-405e-a68d-bc192f37ad10/7a63d739-10e4-405e-a68d-bc192f37ad104.gif)
![數(shù)據(jù)倉庫與數(shù)據(jù)挖掘習(xí)題課63ppt課件_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/7a63d739-10e4-405e-a68d-bc192f37ad10/7a63d739-10e4-405e-a68d-bc192f37ad105.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、習(xí)題一習(xí)題一假定用于分析的數(shù)據(jù)包含屬性age.數(shù)據(jù)元組age值(以遞增序)是:13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70.(a) 運(yùn)用min-max規(guī)范化將age值35變換到0.0,1.0區(qū)間。(b) 運(yùn)用z-score規(guī)范化變換age值35,其中age的規(guī)范差為12.94歲。(c) 運(yùn)用小數(shù)定標(biāo)規(guī)范化變換age值35。(d) 對(duì)于給定的數(shù)據(jù),他情愿運(yùn)用哪種方法?陳說他的理由。解答一解答一(a) 運(yùn)用min-max規(guī)范化將ag
2、e值35變換到0.0,1.0區(qū)間。 minA=13,maxA=70,new_minA=0.0,new_maxA=1.0,而v=35,(b) 運(yùn)用z-score規(guī)范化變換age值35,其中age的規(guī)范差為12.94歲。3860. 00 . 00 . 00 . 113701335 min_min_max_minmaxminAAAAAAnewnewnewvv963.2927809 2770524645403635433230 2725422221202191621513A39. 03892. 09421.12037. 59421.12963.2935AssAvv解答一解答一( (續(xù)續(xù)) )(c) 運(yùn)
3、用小數(shù)定標(biāo)規(guī)范化變換age值35。 由于最大的絕對(duì)值為70,所以j=2。(d) 對(duì)于給定的數(shù)據(jù),他情愿運(yùn)用哪種方法?陳說他的理由。 答:更傾向于選擇小數(shù)定標(biāo)規(guī)范化。由于小數(shù)定標(biāo)規(guī)范化會(huì)堅(jiān)持?jǐn)?shù)據(jù)的分布,這種變換更直觀并容易解釋 35. 01035102jvv習(xí)題二習(xí)題二2.14 假設(shè)12個(gè)銷售價(jià)錢記錄組曾經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215。運(yùn)用如下每種方法將其劃分成三個(gè)箱。(a) 等頻等深劃分。(b) 等寬劃分。解答二解答二(a) 等頻等深劃分。(b) 等寬劃分。 每個(gè)區(qū)間的寬度是:(215-5)/3=70bin15,10,11,13bin115
4、,35,50,55bin172,91,204,215bin15,10,11,13,15,35,50,55,72bin191bin1204,215習(xí)題三習(xí)題三3假定BigUniversity的數(shù)據(jù)倉庫包含如下4個(gè)維:student(student_name, area_id, major, status, university),course(course_name, department),semester(semester, year)和instructor(dept, rank);2個(gè)度量:count和avg_grade。在最低概念層,度量avg_grade存放學(xué)生的實(shí)踐課程成果。在較高概
5、念層,avg_grade存放給定組合的平均成果。(a)為該數(shù)據(jù)倉庫畫出雪花形方式圖。(b)由根本方體student, course, semester, instructor開場,為列出BigUniversity每個(gè)學(xué)生的CS課程的平均成果,該當(dāng)運(yùn)用哪些特殊的OLAP操作。(c)假設(shè)每維有5層包括all,如“studentmajorstatusuniversityall,該立方體包含多少方體?解答三解答三解答三解答三b)由根本方體student, course, semester, instructor開場,為列出BigUniversity每個(gè)學(xué)生的CS課程的平均成果,該當(dāng)運(yùn)用哪些特殊的OLA
6、P操作。 這些特殊的聯(lián)機(jī)分析處置OLAP操作有:沿課程course維從course_id“上卷到department。沿學(xué)生student維從student_id“上卷到university。取department=“CS和university=“Big University,沿課程course維和學(xué)生student維切塊。沿學(xué)生student維從university下鉆到student_name。c)假設(shè)每維有5層包括all,如“studentmajorstatusuniversityall,該立方體包含多少方體?這個(gè)立方體將包含54=625個(gè)方體。習(xí)題四習(xí)題四4 假定數(shù)據(jù)倉庫包含4個(gè)維:
7、date(day, month, quarter, year), spectator(spectator_name, status, phone, address), location(location_name, phone#, street, city, province, country)和game(game_name, description, description, producer);2個(gè)度量: count和charge。其中, charge是觀眾在給定的日期觀看節(jié)目的付費(fèi)。觀眾可以是學(xué)生、成年人或老人,每類觀眾有不同的收費(fèi)規(guī)范。 (a) 畫出該數(shù)據(jù)倉庫的星形方式圖。 (b) 由
8、根本方體 date, spectator, location, game開場,為列出2019 年學(xué)生觀眾在GM-Place 的總代價(jià),該當(dāng)執(zhí)行哪些OLAP 操作? 解答四解答四解答四解答四(b)由根本方體 date, spectator, location, game開場,為列出2019 年學(xué)生觀眾在GM-Place 的總代價(jià),該當(dāng)執(zhí)行哪些OLAP 操作? 這些特殊的聯(lián)機(jī)分析處置OLAP操作有: 沿date維從date id “上卷到y(tǒng)ear沿game維從game id “上卷到all沿location維從location id “上卷到location name沿spectator維從spe
9、ctator id “上卷到status取status=“students,location name=“GM Place和year=2019切塊習(xí)題五習(xí)題五5給定兩個(gè)對(duì)象,分別表示為22,1,42,10,20,0,36,8:(a)計(jì)算兩個(gè)對(duì)象之間的歐幾里得間隔(b)計(jì)算兩個(gè)對(duì)象之間的曼哈頓間隔(c)計(jì)算兩個(gè)對(duì)象之間的明考斯基間隔,p=3習(xí)題六習(xí)題六假設(shè)數(shù)據(jù)發(fā)掘的義務(wù)是將如下 8個(gè)點(diǎn)(用(x,y)代表位置)聚類為3個(gè)簇: A1(2,10), A2(2,5),A3(8,4), B1(5,8),B2(7,5), B3(6,4), C1(1,2), C2(4,9)間隔函數(shù)是歐幾里德間隔.假設(shè)初始選擇
10、A1, B1,C1為每個(gè)聚類的中心.用k-平均算法來給出(a) 在第一次循環(huán)執(zhí)行后的三個(gè)聚類中心(b) 最后的三個(gè)簇解答六解答六(a) (2,10),(6,6),(1.5,3.5)(b) A1 B1 C2A3 B2 C3A2 C1d2A1A2A3B1B2B3C1C2102536+369+425+2516+361+644+129+49+99+1604+91+1616+361+131+641+95316+364529058第一次迭代: 中心為1: A1(2,10), 2: B1(5,8), 3: C1(1,2)因此:1: A1 (2,10)2:A3, B1,B2, B3, C2 (6, 6)3:
11、A2, C1 (1.5,3.5)d2A1A2A3B1B2B3C1C2102536+369+425+2516+361+644+123217852441133.52+6.52.52+1.526.52+0.523.52+4.525.52+1.524.52+0.520.52+1.522.52+5.52第二次迭代: 中心為1: (2,10), 2: (6,6), 3: (1.5,3.5)1: A1, C2 (3.5,9.5)2:A3, B1,B2, B3 (6.5, 5.25)3: A2, C1 (1.5,3.5)d2A1A2A3B1B2B3C1C211+.521+4.5252+5.5222+1.524
12、2+4.5232+5.5222+7.5212+.5224.52+7.524.52+0.2521.52+1.2521.52+2.752.52+0.252.52+1.2525.52+3.2522.52+3.7523.52+6.52.52+1.526.52+0.523.52+4.525.52+1.524.52+0.520.52+1.522.52+5.52第三次迭代: 中心為1: (3.5,9.5 ), 2: (6.5,5.25), 3: (1.5,3.5)1: A1, B1,C2 (11/3,9)2:A3, B2, B3 (7, 13/3)3: A2, C1 (1.5,3.5)d2A1A2A3B1B2B
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)境風(fēng)險(xiǎn)管理在建筑設(shè)計(jì)中的體現(xiàn)
- 物流配送網(wǎng)絡(luò)優(yōu)化策略在電子商務(wù)中的應(yīng)用
- 校園內(nèi)科學(xué)教育課程的深度探索
- 校園金融知識(shí)普及新生的理財(cái)觀念培養(yǎng)
- 游戲化營銷電子游戲在商業(yè)推廣中的應(yīng)用
- 員工滿意度方案
- 構(gòu)建多元科普模式促進(jìn)科學(xué)素質(zhì)提高研究
- 2024-2025學(xué)年高中生物 第6章 生態(tài)環(huán)境的保護(hù) 第1節(jié) 人口增長對(duì)生態(tài)環(huán)境的影響說課稿 新人教版必修3
- 2023八年級(jí)數(shù)學(xué)上冊(cè) 第15章 軸對(duì)稱圖形與等腰三角形15.1 軸對(duì)稱圖形第1課時(shí) 軸對(duì)稱圖形說課稿 (新版)滬科版
- Unit5 Colours(說課稿)-2024-2025學(xué)年人教新起點(diǎn)版英語一年級(jí)上冊(cè)
- 物業(yè)服務(wù)和后勤運(yùn)輸保障服務(wù)總體服務(wù)方案
- 2025年極兔速遞有限公司招聘筆試參考題庫含答案解析
- 2025年北京市文化和旅游局系統(tǒng)事業(yè)單位招聘101人筆試高頻重點(diǎn)提升(共500題)附帶答案詳解
- 中學(xué)學(xué)校2024-2025學(xué)年第二學(xué)期教學(xué)工作計(jì)劃
- 人大代表小組活動(dòng)計(jì)劃人大代表活動(dòng)方案
- 2023年護(hù)理人員分層培訓(xùn)、考核計(jì)劃表
- 《銷售培訓(xùn)實(shí)例》課件
- 2025年四川省新高考八省適應(yīng)性聯(lián)考模擬演練(二)地理試卷(含答案詳解)
- 【經(jīng)典文獻(xiàn)】《矛盾論》全文
- Vue3系統(tǒng)入門與項(xiàng)目實(shí)戰(zhàn)
- 2024年寧夏回族自治區(qū)中考英語試題含解析
評(píng)論
0/150
提交評(píng)論