數據挖掘測試題_第1頁
數據挖掘測試題_第2頁
數據挖掘測試題_第3頁
數據挖掘測試題_第4頁
數據挖掘測試題_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1.某超市研究銷售紀錄數據后發(fā)現,買啤酒的人很大概率也會購買尿布,這種屬于數據挖掘的哪種問題?AA.關聯規(guī)則發(fā)現B.聚類C.分類D.自然語言處理2.以下兩種描述分別對應哪兩種對分類算法的評價標準?A(a)警察抓小偷,描述警察抓的人中有多少個是小偷的標準。(b)描述有多少比例的小偷給警察抓了的標準。Precision,RecallRecall,PrecisionCPrecision,ROCD.Recall,ROC3.將原始數據進行集成、變換、維度規(guī)約、數值規(guī)約是在以下哪個步驟的任務?CA.頻繁模式挖掘B.分類和預測C.數據綜合度越高,粒度也就越大,級別也就越高;D.粒度的具體劃分將直接影響數據倉庫中的數據量以及查詢質量.30.有關數據倉庫的開辟特點,不正確的描述是:AA.數據倉庫開辟要從數據出發(fā);B.數據倉庫使用的需求在開辟出去就要明確;C.數據倉庫的開辟是一個不斷循環(huán)的過程,是啟示式的開辟;D.在數據倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較切當的處理流,數據倉庫中數據分析和處理更靈便,且沒有固定的模式C.數據預處理D.數據流挖掘.當不知道數據所帶標簽時,可以使用哪種技術促使帶同類標簽的數據與帶其他標簽的數據相分離?BA.分類B.聚類C.關聯分析D.隱馬爾可夫鏈.什么是KDD?AA.數據挖掘與知識發(fā)現B.領域知識發(fā)現C.文檔知識發(fā)現D.動態(tài)知識發(fā)現.使用交互式的和可視化的技術,對數據進行探索屬于數據挖掘的哪一類任務?AA.探索性數據分析B.建模描述C.預測建模D.尋覓模式和規(guī)則.為數據的總體分布建模;把多維空間劃分成組等問題屬于數據挖掘的哪一類任務?BA.探索性數據分析.建模描述C.預測建模D.尋覓模式和規(guī)則8.建立一個模型,通過這個模型根據已知的變量值來預測其他某個變量值屬于數據挖掘的哪一類任務?CA.根據內容檢索B.建模描述C.預測建模D.尋覓模式和規(guī)則9.用戶有一種感興趣的模式并且希翼在數據集中找到相似的模式,屬于數據挖掘哪一類任務?A.根據內容檢索B.建模描述C.預測建模D.尋覓模式和規(guī)則.下面哪種不屬于數據預處理的方法?DA變量代換B離散化C會萃D估計遺漏值.假設12個銷售價格記錄組已經排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內?BA第一個B第二個C第三個D第四個.上題中,等寬劃分時(寬度為50),15又在哪個箱子里?AA第一個B第二個C第三個D第四個.下面哪個不屬于數據的屬性類型:DA標稱B序數C區(qū)間D相異.在上題中,屬于定量的屬性類型是:CA標稱B序數C區(qū)間D相異.惟獨非零值才重要的二元屬性被稱作:CA計數屬性B離散屬性C非對稱的二元屬性D對稱屬性.以下哪種方法不屬于特征選擇的標準方法:DA嵌入B過濾C包裝D抽樣.下面不屬于創(chuàng)建新屬性的相關方法的是:BA特征提取B特征修改C映射數據到新的空間D特征構造.考慮值集{1、2、3、4、5、90),其截斷均值(p=20%)是CA2B3C3.5D5.下面哪個屬于映射數據到新的空間的方法?AA傅立葉變換B特征加權C漸進抽樣D維歸約20.燧是為消除不確定性所需要獲得的信息量,投擲均勻正六面體骰子的端是:BA1比特B2.6比特C3.2比特D3.8比特.假設屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內。對屬性income的73600元將被轉化為:DA0.821B1224C1.458D0.716.假定用于分析的數據包含屬性age。數據元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題:使用按箱平均值平滑方法對上述數據進行平滑,箱的深度為3o第二個箱子值為:AA18.3B22.6C26.8D27.9A31B24C55D3.一所大學內的各年紀人數分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數是:AA一年級B二年級C三年級D四年級.下列哪個不是專門用于可視化時間空間數據的技術:BA等高線圖B餅圖C曲面圖D矢量場圖.在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是:DA有放回的簡單隨機抽樣B無放回的簡單隨機抽樣C分層抽樣D漸進抽樣.數據倉庫是隨著時間變化的,下面的描述不正確的是CA.數據倉庫隨時間的變化不斷增加新的數據內容;捕捉到的新數據會覆蓋原來的快照;C.數據倉庫隨事件變化不斷刪去舊的數據內容;D.數據倉庫中包含大量的綜合數據,這些綜合數據會隨著時間的變化不斷地進行重新綜合..關于基本數據的元數據是指:DA.基本元數據與數據源,數據倉庫,數據集市和應用程序等結構相關的信息;基本元數據包括與企業(yè)相關的管理方面的數據和信息;C.基本元數據包括日志

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論