數(shù)據(jù)挖掘考試題目——簡答題_第1頁
數(shù)據(jù)挖掘考試題目——簡答題_第2頁
數(shù)據(jù)挖掘考試題目——簡答題_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘考試題目簡答題(1) 什么是數(shù)據(jù)挖掘?什么是知識發(fā)現(xiàn)?答:數(shù)據(jù)挖掘是在大型數(shù)據(jù)存儲庫中,自動地發(fā)現(xiàn)有用的信息的過程。知識發(fā)現(xiàn)是將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個過程。(2) 數(shù)據(jù)挖掘要解決的問題包括哪五項?答:可伸縮、高維性、異種數(shù)據(jù)和復(fù)雜數(shù)據(jù)、數(shù)據(jù)的所有權(quán)與分布、非傳統(tǒng)的分析。(3) 數(shù)據(jù)的屬性分別包括哪幾種類型?分別可執(zhí)行什么操作?答:標(biāo)稱(nomial)相異性序數(shù)(ordinal)區(qū)間(interval)比率(ratio) =和序 <、>、加法+、-乘法×、÷(4) 數(shù)據(jù)中遺漏值的處理策略包括哪幾種?答:1、刪除數(shù)據(jù)對象或?qū)傩?,如遺漏數(shù)據(jù)對象很少

2、2、估計遺漏值,如插值或最近鄰法3、在分析時忽略遺漏值,如忽略屬性計算相似度(5) 數(shù)據(jù)預(yù)處理的工作可以包括哪兩類?答:1、選擇分析所需要的數(shù)據(jù)對象和屬性2、創(chuàng)建或改變屬性(6) 聚集的目的是什么?答:1、數(shù)據(jù)約減 2、改變尺度3、提高數(shù)據(jù)的穩(wěn)定性(7) 有效抽樣的定義是什么?答:1、如果樣本是有代表性的,則使用樣本與使用整個數(shù)據(jù)集的效果幾乎一樣2、樣本具有足夠的代表性的前提是它近似地具有與原數(shù)據(jù)集相同的感興趣的性質(zhì)(8) 維歸約的目的是什么?答:1、避免維災(zāi)難 2、減少數(shù)據(jù)挖掘算法的時間與空間開銷 3、便于模型的理解與數(shù)據(jù)的可視化4、刪除無關(guān)特征并降低噪聲(9) 特征子集的選擇方法中,除了基

3、于領(lǐng)域知識和窮舉法,還包括三種方法?請列舉并簡要說明答:1、嵌入法:特征子集選擇算法作為數(shù)據(jù)挖掘算法的一部分自然存在 2、過濾法:使用某種獨立于數(shù)據(jù)挖掘任務(wù)的方法,在數(shù)據(jù)挖掘算法運行前進 行 特征選擇3、包裝法:將目標(biāo)數(shù)據(jù)挖掘算法作為黑盒,使用類似理想算法的方法,但并 不枚舉所有可能(10) 當(dāng)滿足什么性質(zhì)時,距離可以稱為度量?答:1、非負性,d(p, q) >=0 ,當(dāng)且僅當(dāng)p = q時d(p, q) = 0 2、對稱性,d(p, q) = d(q, p) 3、三角不等式:d(p, r) <=d(p, q) + d(q, r) 同時滿足以上三個性質(zhì)的距離稱為度量。(11) 簡述A

4、priori算法的優(yōu)點和缺點。答:Apriori算法的優(yōu)點:結(jié)構(gòu)簡單、易于理解。Apriori算法的缺點:產(chǎn)生大量的候選項集,I/O開銷較大。(12) 簡述構(gòu)造FP樹時第一步通常必須要做什么,為什么?答:第一步就是掃描一次數(shù)據(jù)集,確定每個項的支持度計數(shù)。丟棄非頻繁項,而將頻繁項按照支持度遞減排序。這樣做的目的是最大限度的壓縮數(shù)據(jù),要不樹就會比較茂盛,則達不到計算優(yōu)化的目的。(13) 簇評估的主要任務(wù)是什么。答 : 確定數(shù)據(jù)集的聚類趨勢。 確定正確的簇個數(shù)。 不引用附加的信息,評估聚類分析結(jié)果對數(shù)據(jù)的擬合情況。 將聚類分析結(jié)果與已知的客觀結(jié)果比較。 比較兩個簇集,確定哪個更好。(14) 寫出K均值算法的優(yōu)缺點。答:優(yōu)點:(1)可以用于各種數(shù)據(jù)類型          (2)有效缺點:(1)不能處理非球形簇、不同尺寸和不同密度的簇(2)離群點的數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論