2019年公需培訓(xùn)數(shù)據(jù)挖掘答案.doc_第1頁(yè)
2019年公需培訓(xùn)數(shù)據(jù)挖掘答案.doc_第2頁(yè)
2019年公需培訓(xùn)數(shù)據(jù)挖掘答案.doc_第3頁(yè)
2019年公需培訓(xùn)數(shù)據(jù)挖掘答案.doc_第4頁(yè)
2019年公需培訓(xùn)數(shù)據(jù)挖掘答案.doc_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)挖掘1、(單選,4分)以下哪項(xiàng)不屬于知識(shí)發(fā)現(xiàn)的過(guò)程?( )A、數(shù)據(jù)清理 B、數(shù)據(jù)挖掘 C、知識(shí)可視化表達(dá) D、數(shù)據(jù)測(cè)試 答案:D2、(單選,4分)以下哪些不屬于數(shù)據(jù)挖掘的內(nèi)容?( )A、分類 B、聚類 C、離群點(diǎn)檢測(cè) D、遞歸分析 答案:D3、(單選,4分)以下哪個(gè)不是常見的屬性類型? ( )A、A標(biāo)稱屬性 B、數(shù)值屬性 C、高維屬性 D、序數(shù)屬性 答案:C4、(單選,4分)以下哪個(gè)度量屬于數(shù)據(jù)散度的描述? ( )A、均值 B、中位數(shù) C、標(biāo)準(zhǔn)差 D、眾數(shù) 答案:C5、(單選,4分)以下哪個(gè)度量不屬于數(shù)據(jù)中心趨勢(shì)度描述?( D )A、A均值 B、中位數(shù) C、眾數(shù) D、四分位數(shù) 答案:D6、(單選,4分)對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)清理、集成、變換、規(guī)約是數(shù)據(jù)挖掘哪個(gè)步驟的任務(wù)?( )A、頻繁模式挖掘 B、分類和預(yù)測(cè) C、數(shù)據(jù)預(yù)處理 D、噪聲檢測(cè) 答案:C7、(單選,4分)聚類分析是數(shù)據(jù)挖掘的一種重要技術(shù),以下哪個(gè)算法不屬于聚類算法?( )A、K-Means B、DBSCAN C、SVM D、EM 答案:C8、(單選,4分)建立一個(gè)模型,通過(guò)這個(gè)模型根據(jù)已知的變量值來(lái)預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)?( )A、根據(jù)內(nèi)容檢索 B、建模描述 C、預(yù)測(cè)建模 D、尋找模式和規(guī)則 答案:C9、(單選,4分)當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí). 可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?( )A、分類 B、聚類 C、關(guān)聯(lián)分析 D、隱馬爾可夫鏈 答案:B10、(單選,4分)在構(gòu)造決策樹時(shí),以下哪種不是選擇屬性的度量的方法? ( )A、信息增益 B、信息增益率 C、基尼指數(shù) D、距離 答案:D11、(單選,4分)知識(shí)發(fā)現(xiàn)流程最核心的步驟是什么? ( )A、數(shù)據(jù)挖掘 B、數(shù)據(jù)預(yù)處理 C、模式評(píng)估 D、知識(shí)表示 答案:A12、(單選,4分)將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?( )A、頻繁模式挖掘 B、分類和預(yù)測(cè) C、數(shù)據(jù)預(yù)處理 D、數(shù)據(jù)流挖掘 答案:C13、(單選,4分)以下哪個(gè)度量屬于數(shù)據(jù)中心性的描述? ( )A、均值 B、極差 C、眾數(shù) D、標(biāo)準(zhǔn)差 答案:A14、(單選,4分)類分析是數(shù)據(jù)挖掘的一種重要技術(shù),以下哪個(gè)算法不屬于聚類算法?( )A、K-Means B、DBSCAN C、KNN D、EM 答案:C15、(單選,4分)某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會(huì)購(gòu)買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題? ( )A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn) B、聚類 C、分類 D、自然語(yǔ)言處理 答案:A16、(單選,4分)以下哪些算法是分類算法?( )A、DBSCAN B、C4.5 C、K-Mean D、EM 答案:B17、(單選,4分)K-means算法的缺點(diǎn)不包括?( )A、K必須是事先給定的 B、選擇初始聚類中心 C、對(duì)于“噪聲”和孤立點(diǎn)數(shù)據(jù)是敏感的 D、可伸縮、高效 答案:D18、(單選,4分)機(jī)器學(xué)習(xí)中,下面哪些方法不可以避免分類中的過(guò)擬合問題?( )A、增加樣本數(shù)量 B、增加模型復(fù)雜度 C、去除噪聲 D、正則化 答案:B19、(單選,4分)下面那個(gè)不屬于知識(shí)發(fā)現(xiàn)過(guò)程。( )A、數(shù)據(jù)清理與集成 B、數(shù)據(jù)統(tǒng)計(jì) C、數(shù)據(jù)挖掘 D、模式評(píng)估和知識(shí)表示 答案:B20、(單選,4分)在構(gòu)造決策樹時(shí),以下那個(gè)不屬于選擇屬性的度量? ( )A、信息增益 B、信息增益率 C、基尼指數(shù) D、信息熵 答案:D21、(單選,4分)關(guān)于頻繁模式,下面哪一個(gè)陳述是正確的? ( )A、K項(xiàng)集頻繁則K-1項(xiàng)則必定不頻繁 B、K項(xiàng)集頻繁則K-1項(xiàng)則必定頻繁 C、K項(xiàng)集不頻繁則K-1項(xiàng)則必定頻繁 D、以上都不正確 答案:B22、(單選,4分)DBSCAN算法最大的挑戰(zhàn)是? ( )A、確定聚類個(gè)數(shù) B、確定聚類形狀 C、確定半徑及MINPTS D、確定評(píng)估指標(biāo) 答案:C23、(單選,4分)以下那個(gè)不屬于分類算法? ( )A、KNN B、樸素貝葉斯 C、K-MEANS D、SVM 答案:C24、(單選,4分)以下哪些陳述是不正確的? ( )A、聚類可以發(fā)現(xiàn)數(shù)據(jù)內(nèi)部結(jié)構(gòu) B、聚類可以作為其他任務(wù)的預(yù)處理 C、聚

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論