


版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘考試題目關(guān)聯(lián)分析一、10 個選擇1. 以下屬于關(guān)聯(lián)分析的是( )A CPU性能預(yù)測B購物籃分析C自動判斷鳶尾花類別D股票趨勢建模2. 維克托 ?邁爾 -舍恩伯格在大數(shù)據(jù)時代:生活、工作與思維的大變革一書中,持續(xù)強(qiáng)調(diào) 了一個觀點(diǎn):大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙, 與此同時, 我們 更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系, 而不是因果關(guān)系。 其中, 數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下哪個算法直接挖掘()A K-meansBBayes NetworkCDApriori3. 置信度 (confidence)是衡量興趣度度量()的指標(biāo)。A簡潔性B確定性C實(shí)用性D新穎性算法的加速過程依賴于以
2、下哪個策略( )A抽樣B剪枝C緩沖D并行5. 以下哪個會降低 Apriori 算法的挖掘效率( )A支持度閾值增大B項數(shù)減少C事務(wù)數(shù)減少D減小硬盤讀寫速率算法使用到以下哪些東東( )A格結(jié)構(gòu)、有向無環(huán)圖B二叉樹、哈希樹C格結(jié)構(gòu)、哈希樹D多叉樹、有向無環(huán)圖7. 非頻繁模式( )A其置信度小于閾值B令人不感興趣C包含負(fù)模式和負(fù)相關(guān)模式D對異常數(shù)據(jù)項敏感) 注:分別以 1、2、3 代表之 8. 對頻繁項集、頻繁閉項集、極大頻繁項集的關(guān)系描述正確的是(B2 可以還原出無損的 1D2與 1是完全等價的)B查找D剪枝)B WekaD KnimeA3 可以還原出無損的 1C3與 2 是完全等價的 tree
3、在 Apriori 算法中所起的作用是A存儲數(shù)據(jù)C加速查找10. 以下不屬于數(shù)據(jù)挖掘軟件的是(A SPSS ModelerC Apache Spark二、10 個填空1. 關(guān)聯(lián)分析中表示關(guān)聯(lián)關(guān)系的方法主要有: 和 。2. 關(guān)聯(lián)規(guī)則的評價度量主要有:和。3. 關(guān)聯(lián)規(guī)則挖掘的算法主要有:和。4. 購物籃分析中,數(shù)據(jù)是以的形式呈現(xiàn)。5. 一個項集滿足最小支持度,我們稱之為 。6. 一個關(guān)聯(lián)規(guī)則同時滿足最小支持度和最小置信度,我們稱之為 。7. 在回歸與相關(guān)分析中,因變量值隨自變量值的增大(減小)而減?。ㄔ龃螅┑默F(xiàn)象叫 做。8. 極大頻繁項集不能無損還原出頻繁項集,是因為它不包含頻繁項集的 信息。9.
4、 經(jīng)典的 Apriori 算法是逐層掃描的,也就是說它是 (選:深度 /寬度)優(yōu)先的。10. 數(shù)據(jù)挖掘大概步驟包括:輸入數(shù)據(jù) 預(yù)處理 挖掘 后處理 輸出知識。其中,輸出的 知識可以有很多種表示形式, 兩種極端的形式是: 內(nèi)部結(jié)構(gòu)難以被理解的黑匣子, 比如說 人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練得出的網(wǎng)絡(luò); 模式結(jié)構(gòu)清晰的匣子, 這種結(jié)構(gòu)容易被人理解, 比如說決 策樹產(chǎn)生的樹。那么,關(guān)聯(lián)分析中輸出的知識的表示形式主要是 (選: 黑匣子 /清晰結(jié)構(gòu) ) 。三、10 個判斷( )1. 啤酒與尿布的故事是聚類分析的典型實(shí)例。( )算法是一種典型的關(guān)聯(lián)規(guī)則挖掘算法。( )3. 支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標(biāo)。( )4
5、. 可信度是對關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。( )5.給定關(guān)聯(lián)規(guī)則 A B,意味著:若 A發(fā)生, B也會發(fā)生。( )6. 頻繁閉項集可用來無損壓縮頻繁項集。( )7. 關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。( )算法產(chǎn)生的關(guān)聯(lián)規(guī)則總是確定的。( )9. 不滿足給定評價度量的關(guān)聯(lián)規(guī)則是無趣的。( )10. 對于項集來說,置信度沒有意義。四、5個簡答1. 簡述關(guān)聯(lián)規(guī)則產(chǎn)生的兩個基本步驟。算法是從事務(wù)數(shù)據(jù)庫中挖掘布爾關(guān)聯(lián)規(guī)則的常用算法,該算法利用頻繁項集性質(zhì)的先驗知 識,從候選項集中找到頻繁項集。請簡述 Apriori 算法的基本原理。3. 簡述 Apriori 算法的優(yōu)點(diǎn)和缺點(diǎn)。4. 針對 Apriori 算法
6、的缺點(diǎn),可以做哪些方面的改進(jìn)?5. 強(qiáng)關(guān)聯(lián)規(guī)則一定是有趣的嗎?為什么?數(shù)據(jù)挖掘考試題目 +參考答案、 10 個選擇1. 以下屬于關(guān)聯(lián)分析的是(B )ACPU性能預(yù)測B購物籃分析C自動判斷鳶尾花類別D股票趨勢建模2. 維克托 ?邁爾 -舍恩伯格在大數(shù)據(jù)時代:生活、工作與思維的大變革一書中,持續(xù)強(qiáng)調(diào) 了一個觀點(diǎn):大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙, 與此同時, 我們 更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系, 而不是因果關(guān)系。 其中, 數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下 哪個算法直接挖掘( D )A其置信度小于閾值B令人不感興趣A K-meansB Bayes NetworkCD Apriori3
7、. 置信度 (confidence) 是衡量興趣度度量( B )的指標(biāo)。A簡潔性B確定性C實(shí)用性D新穎性算法的加速過程依賴于以下哪個策略( B )A抽樣B剪枝C緩沖D并行5. 以下哪個會降低 Apriori算法的挖掘效率( D )A支持度閾值增大B項數(shù)減少C事務(wù)數(shù)減少D減小硬盤讀寫速率算法使用到以下哪些東東(C )A格結(jié)構(gòu)、有向無環(huán)圖B二叉樹、哈希樹C格結(jié)構(gòu)、哈希樹D多叉樹、有向無環(huán)圖7. 非頻繁模式( D )C包含負(fù)模式和負(fù)相關(guān)模式D對異常數(shù)據(jù)項敏感8.對頻繁項集、頻繁閉項集、極大頻繁項集的關(guān)系描述正確的是( B ) 注:分別以 1、 2、3代表之 A 3可以還原出無損的 1B2 可以還原出
8、無損的 1C3與 2是完全等價的D2與 1是完全等價的tree 在 Apriori 算法中所起的作用是( C )A存儲數(shù)據(jù)B查找C加速查找D剪枝10. 以下不屬于數(shù)據(jù)挖掘軟件的是( C )A SPSS ModelerB WekaC Apache SparkD Knime二、10 個填空1. 關(guān)聯(lián)分析中表示關(guān)聯(lián)關(guān)系的方法主要有: 項集 和 關(guān)聯(lián)規(guī)則 。2. 關(guān)聯(lián)規(guī)則的評價度量主要有: 支持度 和 置信度 。3. 關(guān)聯(lián)規(guī)則挖掘的算法主要有: Apriori 和 FP-Growth 。4. 購物籃分析中,數(shù)據(jù)是以 不對稱二元變量 的形式呈現(xiàn)。5. 一個項集滿足最小支持度,我們稱之為 頻繁項集 。6.
9、 一個關(guān)聯(lián)規(guī)則同時滿足最小支持度和最小置信度,我們稱之為 強(qiáng)規(guī)則 。7. 在回歸與相關(guān)分析中, 因變量值隨自變量值的增大 (減小)而減?。ㄔ龃螅┑默F(xiàn)象叫做 負(fù) 相關(guān) 。8. 極大頻繁項集不能無損還原出頻繁項集,是因為它不包含頻繁項集的 支持度 信息。9. 經(jīng)典的 Apriori 算法是逐層掃描的,也就是說它是 寬度 ( 選:深度/ 寬度)優(yōu)先的。10. 數(shù)據(jù)挖掘大概步驟包括:輸入數(shù)據(jù) 預(yù)處理 挖掘 后處理 輸出知識。其中,輸出的 知識可以有很多種表示形式, 兩種極端的形式是: 內(nèi)部結(jié)構(gòu)難以被理解的黑匣子, 比如說 人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練得出的網(wǎng)絡(luò); 模式結(jié)構(gòu)清晰的匣子, 這種結(jié)構(gòu)容易被人理解, 比如
10、說決 策樹產(chǎn)生的樹。 那么,關(guān)聯(lián)分析中輸出的知識的表示形式主要是 清晰結(jié)構(gòu) ( 選:黑匣子 /清晰結(jié)構(gòu) ) 。三、10 個判斷( ? )1. 啤酒與尿布的故事是聚類分析的典型實(shí)例。( ? )算法是一種典型的關(guān)聯(lián)規(guī)則挖掘算法。( ? )3. 支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標(biāo)。( ? )4. 可信度是對關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。( ? ) 5.給定關(guān)聯(lián)規(guī)則 A B,意味著:若 A發(fā)生, B也會發(fā)生。( ? )6. 頻繁閉項集可用來無損壓縮頻繁項集。( ? )7. 關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。( ? )算法產(chǎn)生的關(guān)聯(lián)規(guī)則總是確定的。( ? )9. 不滿足給定評價度量的關(guān)聯(lián)規(guī)則是無趣的。( ? )
11、10. 對于項集來說,置信度沒有意義。四、5個簡答1. 簡述關(guān)聯(lián)規(guī)則產(chǎn)生的兩個基本步驟。答:關(guān)聯(lián)規(guī)則產(chǎn)生的兩個基本步驟為: 根據(jù)給定的支持度從項集中產(chǎn)生頻繁項集; 根據(jù) 給定的置信度從頻繁項集中產(chǎn)生關(guān)聯(lián)規(guī)則。算法是從事務(wù)數(shù)據(jù)庫中挖掘布爾關(guān)聯(lián)規(guī)則的常用算法,該算法利用頻繁項集性質(zhì)的先驗知 識,從候選項集中找到頻繁項集。請簡述 Apriori 算法的基本原理。 答:關(guān)聯(lián)規(guī)則的產(chǎn)生并不依賴于 Apriori 算法, Apriori 算法用來加速規(guī)則的產(chǎn)生過程。 Apriori 算法的加速過程依賴于這樣一個先驗原理:“頻繁項集的子集是頻繁的”。3. 簡述 Apriori 算法的優(yōu)點(diǎn)和缺點(diǎn)。答: Apriori 算法的優(yōu)點(diǎn):結(jié)構(gòu)簡單、易于理解。Apriori 算法的缺點(diǎn):產(chǎn)生大量的候選項集, I/O 開銷較大。4. 針對 Apriori 算法的缺點(diǎn),可以做哪些方面的改進(jìn)?I/O 開銷較大。由此,可以答: Apriori 算法的缺點(diǎn)主要是產(chǎn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 溝槽支撐施工方案
- 數(shù)字監(jiān)控施工方案
- 市政消防施工方案
- 橫向路基銜接施工方案
- 用房施工方案
- 2025年度車輛借出免責(zé)與環(huán)保責(zé)任協(xié)議
- 二零二五年度雙向轉(zhuǎn)診醫(yī)療綜合管理與服務(wù)合同
- 二零二五年度中式燒烤連鎖品牌加盟合同
- 二零二五年度校園體育賽事志愿者招募培訓(xùn)合同
- 二零二五年度餐廳消費(fèi)兒童優(yōu)惠合同
- G -B- 16914-2023 燃?xì)馊紵骶甙踩夹g(shù)條件(正式版)
- DZ∕T 0372-2021 固體礦產(chǎn)選冶試驗樣品配制規(guī)范(正式版)
- JB-QGL-TX3016AJB-QTL-TX3016A火災(zāi)報警控制器安裝使用說明書
- 細(xì)菌的分離培養(yǎng)與培養(yǎng)特性觀察課件講解
- 國家電網(wǎng)公司輸變電工程工藝標(biāo)準(zhǔn)庫變電工程部分
- 海上風(fēng)電場工程結(jié)構(gòu)安全監(jiān)測建設(shè)規(guī)范
- 壓力管道焊接2020年壓力管道檢驗師培訓(xùn)課件
- 乳腺疏通課件
- 《5G無線網(wǎng)絡(luò)規(guī)劃與優(yōu)化》 課件 羅暉 第4-6章 5G行業(yè)應(yīng)用-5G無線網(wǎng)絡(luò)優(yōu)化
- 甲狀腺功能減退危象課件
- 《體育開學(xué)第一課:體育常規(guī)教育》課件
評論
0/150
提交評論