數(shù)據(jù)挖掘知到智慧樹章節(jié)測試課后答案2024年秋吉林師范大學(xué)_第1頁
數(shù)據(jù)挖掘知到智慧樹章節(jié)測試課后答案2024年秋吉林師范大學(xué)_第2頁
數(shù)據(jù)挖掘知到智慧樹章節(jié)測試課后答案2024年秋吉林師范大學(xué)_第3頁
數(shù)據(jù)挖掘知到智慧樹章節(jié)測試課后答案2024年秋吉林師范大學(xué)_第4頁
數(shù)據(jù)挖掘知到智慧樹章節(jié)測試課后答案2024年秋吉林師范大學(xué)_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)挖掘知到智慧樹章節(jié)測試課后答案2024年秋吉林師范大學(xué)第一章單元測試

下列屬于數(shù)據(jù)挖掘任務(wù)的是()。

A:根據(jù)性別劃分公司的顧客B:預(yù)測一堆骰子的結(jié)果C:計算公司的總銷售額D:利用歷史記錄預(yù)測公司的未來股價

答案:利用歷史記錄預(yù)測公司的未來股價下面不屬于數(shù)據(jù)分析和挖掘的類型的是()。

A:數(shù)據(jù)庫數(shù)據(jù)B:數(shù)據(jù)矩陣C:分類算法D:數(shù)據(jù)倉庫數(shù)據(jù)

答案:分類算法下列有關(guān)離群點的分析錯誤的是()。

A:離群點即是噪聲數(shù)據(jù)B:一般情況下離群點會被當(dāng)做噪音而丟棄C:在某些特殊應(yīng)用中離群點有特殊的意義D:信用卡在不常消費地區(qū)突然消費大量金額的現(xiàn)象屬于離群點分析的范疇

答案:離群點即是噪聲數(shù)據(jù)下列關(guān)于模式識別的相關(guān)說法中錯誤的是()。

A:醫(yī)療診斷屬于模式識別的研究內(nèi)容之一B:自然語言理解也包含模式識別問題C:手機(jī)的指紋解鎖技術(shù)不屬于模式識別的應(yīng)用D:模式識別的本質(zhì)是抽象出不同事物中的模式并由此對事物進(jìn)行分類

答案:手機(jī)的指紋解鎖技術(shù)不屬于模式識別的應(yīng)用常見的機(jī)器學(xué)習(xí)方法包含()。

A:無監(jiān)督學(xué)習(xí)B:網(wǎng)絡(luò)擁塞控制C:半監(jiān)督學(xué)習(xí)D:有監(jiān)督學(xué)習(xí)

答案:無監(jiān)督學(xué)習(xí);半監(jiān)督學(xué)習(xí);有監(jiān)督學(xué)習(xí)目前數(shù)據(jù)分析和數(shù)據(jù)挖掘面臨的挑戰(zhàn)性問題包括()。

A:數(shù)據(jù)類型的多樣化B:分析與挖掘結(jié)果可視化C:離群點數(shù)據(jù)D:高維度數(shù)據(jù)

答案:數(shù)據(jù)類型的多樣化;分析與挖掘結(jié)果可視化;高維度數(shù)據(jù)數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)則,從而能更好的完成描述數(shù)據(jù)、預(yù)測數(shù)據(jù)等任務(wù)。()

A:對B:錯

答案:對事務(wù)數(shù)據(jù)庫的每個記錄代表一個事務(wù)。()

A:對B:錯

答案:對離群點是指全局或者局部范圍內(nèi)偏離一般水平的觀測對象。()

A:錯B:對

答案:對無監(jiān)督學(xué)習(xí)可以在沒有標(biāo)記的數(shù)據(jù)集上進(jìn)行學(xué)習(xí)。()

A:對B:錯

答案:對

第二章單元測試

軍銜所屬的屬性類型為()。

A:標(biāo)稱屬性B:序數(shù)屬性C:二元屬性D:數(shù)值屬性

答案:序數(shù)屬性一所大學(xué)內(nèi)的各年紀(jì)人數(shù)分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數(shù)是()。

A:三年級B:一年級C:二年級D:四年級

答案:一年級考慮數(shù)據(jù)集{12243324556826},其四分位數(shù)極差是()。

A:31B:3C:24D:55

答案:31已知點X的空間坐標(biāo)為(3,4,2),點Y的空間坐標(biāo)為(1,6,1),則X和Y的歐幾里得距離是()。

A:4B:5C:6D:3

答案:3中心趨勢度量包括()。

A:中位數(shù)B:四分位數(shù)C:眾數(shù)D:均值

答案:中位數(shù);眾數(shù);均值分散度量趨勢包含()。

A:方差B:眾數(shù)C:分位數(shù)D:極差

答案:方差;分位數(shù);極差離散屬性總是具有有限個值。()

A:錯B:對

答案:錯二元屬性的相異性有兩種,一種是對稱的二元相異屬性,一種是非對稱的二元相異屬性。()

A:對B:錯

答案:對屬性可以分為標(biāo)稱屬性、二元屬性、序數(shù)屬性和數(shù)值屬性四類。()

A:對B:錯

答案:對余弦相似性利用向量空間中兩個向量夾角的余弦值來衡量兩個個體間的差異。余弦值越接近0,夾角越大,向量之間匹配越大。余弦值越接近1,夾角越小,向量之間匹配越小。()

A:錯B:對

答案:錯

第三章單元測試

我們要進(jìn)行數(shù)據(jù)預(yù)處理,是因為原始數(shù)據(jù)大多都是()。

A:“不可靠的”B:“混亂的”C:“海量的”D:“臟數(shù)據(jù)”

答案:“臟數(shù)據(jù)”數(shù)據(jù)規(guī)范化方法包括()。

A:數(shù)據(jù)集成B:數(shù)據(jù)歸約C:最大最小規(guī)范化D:數(shù)據(jù)泛化

答案:最大最小規(guī)范化假設(shè)12個銷售價記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內(nèi)()。

A:第四個B:第一個C:第二個D:第三個

答案:第二個將原始數(shù)據(jù)進(jìn)行集成、變換、維度歸約、數(shù)值歸約是在以下哪個步驟的任務(wù)()。

A:數(shù)據(jù)預(yù)處理B:數(shù)據(jù)流挖掘C:分類和預(yù)測D:頻繁模式挖掘

答案:數(shù)據(jù)預(yù)處理數(shù)據(jù)清理包括以下哪些處理()。

A:缺失值的處理B:不一致數(shù)據(jù)的處理C:重復(fù)數(shù)據(jù)的處理D:噪聲的處理

答案:缺失值的處理;不一致數(shù)據(jù)的處理;噪聲的處理在現(xiàn)實世界的數(shù)據(jù)中,元組在某些屬性上缺少值是常有的。描述處理該問題的各方法中正確的有()。

A:使用屬性的平均值填充空缺值B:忽略元組C:使用與給定元組屬同一類的所有樣本的平均值D:從數(shù)據(jù)中挑選一個數(shù)據(jù)填寫

答案:使用屬性的平均值填充空缺值;忽略元組;使用與給定元組屬同一類的所有樣本的平均值數(shù)據(jù)預(yù)處理的任務(wù)包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約和數(shù)據(jù)泛化。()

A:對B:錯

答案:錯噪聲是指被測量的變量產(chǎn)生的錯誤或誤差。()

A:錯B:對

答案:錯數(shù)據(jù)歸約就是指對數(shù)據(jù)集進(jìn)行簡化表示。()

A:錯B:對

答案:對在使用分箱法實現(xiàn)特征離散化時,可以用每個箱中的中位數(shù)或平均數(shù)替換箱中所有的值。()

A:對B:錯

答案:對

第四章單元測試

回歸分析的步驟順序為()。①進(jìn)行相關(guān)分析②建立預(yù)測模型③確定變量④確定預(yù)測值⑤計算預(yù)測誤差。

A:③⑤①②④B:③①⑤②④C:③②①⑤④D:①③④⑤②

答案:③②①⑤④某地區(qū)調(diào)查了2~9歲兒童的身高,由此建立的身高y(cm)與年齡x(歲)的回歸模型為y?=8.25x+60.13,下列敘述正確的是()。

A:該地區(qū)2~9歲的兒童每年的身高約增加8.25cmB:利用這個模型可以準(zhǔn)確地預(yù)測該地區(qū)每個2~9歲兒童的身高C:該地區(qū)9歲兒童的平均身高是134.38cmD:該地區(qū)一個兒童的身高為142.63cm

答案:該地區(qū)2~9歲的兒童每年的身高約增加8.25cm回歸分析按照涉及變量的多少,分為()。

A:線性回歸分析和多元回歸分析B:一元回歸分析和多元回歸分析C:線性回歸分析和非線性回歸分析D:一元回歸分析和非線性回歸分析

答案:一元回歸分析和多元回歸分析()是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。

A:回歸分析B:趨勢分析C:帕累托圖D:因果圖

答案:回歸分析下列關(guān)系中具有相關(guān)關(guān)系的是()。

A:蘋果的產(chǎn)量與氣候之間的關(guān)系B:人的年齡與他擁有的財富之間的關(guān)系C:曲線上的點與該點的坐標(biāo)之間的關(guān)系D:森林中的同一種樹木,其斷面直徑與高度之間的關(guān)系

答案:蘋果的產(chǎn)量與氣候之間的關(guān)系;人的年齡與他擁有的財富之間的關(guān)系;森林中的同一種樹木,其斷面直徑與高度之間的關(guān)系在回歸分析中,檢驗線性相關(guān)顯著性常用的三種檢驗方法,包含()。

A:相關(guān)系數(shù)顯著性檢驗法B:x2檢驗法C:t檢驗法D:F檢驗法

答案:相關(guān)系數(shù)顯著性檢驗法;t檢驗法;F檢驗法多元線性回歸是研究處理兩個變量之間關(guān)系的最簡單模型。()

A:錯B:對

答案:錯F檢驗運用服從F分布的統(tǒng)計量或方差比作為統(tǒng)計檢驗,通過顯著性水平檢驗度量回歸方程的線性關(guān)系是否顯著。()

A:對B:錯

答案:對應(yīng)用回歸預(yù)測法時,即使變量之間不存在相關(guān)關(guān)系,也可以對這些變量應(yīng)用回歸預(yù)測法。()

A:對B:錯

答案:錯某塊農(nóng)田糧食的產(chǎn)量與施肥量之間的關(guān)系為不確定性關(guān)系。()

A:錯B:對

答案:對

第五章單元測試

某蘋果數(shù)據(jù)集如下所示,K近鄰分類法(K取3)對(色度=8.8,高度=7.1,寬度=7.0)的蘋果進(jìn)行分類的結(jié)果為()。

A:綠蘋果B:金冠蘋果C:綠蘋果或布瑞本D:布瑞本

答案:布瑞本某二分類問題的訓(xùn)練樣本如下表所示,由此計算得的屬性類別的Gini指標(biāo)值為()。

A:0.7B:0.3C:0.5D:0.48

答案:0.48下列是有關(guān)于是否購買電腦的數(shù)據(jù)集,其中學(xué)歷,是否結(jié)婚,收入為特征,表中最后一列類別代表是否購買電腦,則數(shù)據(jù)集的信息熵為()。

A:0.376B:0.254C:0.971D:0.865

答案:0.971下列是有關(guān)于是否投保的數(shù)據(jù)集,第二列至第四列為特征,表中最后一列類別代表是否投保,按照“年薪”進(jìn)行劃分的信息增益率為()。

A:0.061B:0.485C:0D:0.327

答案:0.327決策樹分類的主要包括()。

A:對訓(xùn)練集進(jìn)行訓(xùn)練B:使用測試數(shù)據(jù)集進(jìn)行預(yù)測,評估決策樹模型C:對初始決策樹進(jìn)行樹剪枝D:由所得到的決策樹提取分類規(guī)則

答案:對訓(xùn)練集進(jìn)行訓(xùn)練;使用測試數(shù)據(jù)集進(jìn)行預(yù)測,評估決策樹模型;對初始決策樹進(jìn)行樹剪枝;由所得到的決策樹提取分類規(guī)則下列哪些是樸素貝葉斯分類的優(yōu)缺點()。

A:樸素貝葉斯分類做了類條件獨立假設(shè),大幅降低了計算開銷B:容易實現(xiàn)并在大多數(shù)情況下可以取得較好的結(jié)果C:類條件獨立在實際應(yīng)用中缺乏準(zhǔn)確性,因為變量之間經(jīng)常存在依賴關(guān)系,這種依賴關(guān)系影響了樸素貝葉斯分類器的準(zhǔn)確性D:需要大量訓(xùn)練數(shù)據(jù)以覆蓋類條件概率空間,引入了很大開銷

答案:容易實現(xiàn)并在大多數(shù)情況下可以取得較好的結(jié)果;類條件獨立在實際應(yīng)用中缺乏準(zhǔn)確性,因為變量之間經(jīng)常存在依賴關(guān)系,這種依賴關(guān)系影響了樸素貝葉斯分類器的準(zhǔn)確性決策樹是用樣本的屬性作為樹的結(jié)構(gòu),用樣本屬性的取值作為樹分支的結(jié)點。()

A:對B:錯

答案:錯ID3算法無法避免過擬合問題,而C4.5算法則可以避免。()

A:對B:錯

答案:錯KNN的主要思想是計算每個訓(xùn)練數(shù)據(jù)(每個訓(xùn)練數(shù)據(jù)都有一個唯一的類別標(biāo)識)到待分類元組的距離,取和待分類元組距離最近的k個訓(xùn)練數(shù)據(jù)集,k個數(shù)據(jù)中哪個類別的訓(xùn)練數(shù)據(jù)占多數(shù),則待分類元組就屬于那個類別。()

A:對B:錯

答案:對惰性學(xué)習(xí)法的“惰性”體現(xiàn)在它不急于在收到測試對象之前構(gòu)造分類模型。()

A:對B:錯

答案:對

第六章單元測試

DIANA算法中,定義兩個數(shù)據(jù)點之間的平均距離的為()。

A:范式距離B:簇的直徑C:平均相異度D:歐幾里得距離

答案:平均相異度基于()的聚類方法是基于距離判斷數(shù)據(jù)對象相似度的聚類。

A:劃分B:層次C:密度D:網(wǎng)格

答案:劃分聚類質(zhì)量評估的主要任務(wù)不包括()

A:確定簇數(shù)B:確定聚類質(zhì)量C:估計聚類趨勢D:確定層次結(jié)構(gòu)

答案:確定層次結(jié)構(gòu)下面哪種距離度量方法為歐幾里得距離()。

A:B:C:D:

答案:數(shù)據(jù)挖掘?qū)垲惖牡湫鸵蟀ǎǎ?/p>

A:處理噪聲數(shù)據(jù)的能力B:聚類高維數(shù)據(jù)的能力C:可解釋性和可用性D:增量聚類和對輸入次序不敏感

答案:處理噪聲數(shù)據(jù)的能力;聚類高維數(shù)據(jù)的能力;可解釋性和可用性;增量聚類和對輸入次序不敏感數(shù)據(jù)的哪些特性對聚類分析具有很強(qiáng)的影響()。

A:規(guī)模B:稀疏性C:高維性D:噪聲和離群點

答案:規(guī)模;稀疏性;高維性;噪聲和離群點在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差。()

A:錯B:對

答案:錯基于密度的聚類方法可以發(fā)現(xiàn)任意形狀的簇。()

A:對B:錯

答案:對DBSCAN算法能夠很好的區(qū)分原始數(shù)據(jù)的形狀,但受限于用戶指定的參數(shù)。()

A:對B:錯

答案:對K-中心點算法采用簇中對象的平均值作為參考點。()

A:對B:錯

答案:錯

第七章單元測試

下列幾種數(shù)據(jù)挖掘功能中被廣泛的用于購物籃分析的是()。

A:聚類分析B:分類和預(yù)測C:演變分析D:關(guān)聯(lián)分析

答案:關(guān)聯(lián)分析關(guān)聯(lián)規(guī)則的支持度公式為()。

A:support(A=>B)=P(A∩B);B:support(A=>B)=P(B|A);C:support(A=>B)=P(A∪B);D:support(A=>B)=P(A|B)

答案:support(A=>B)=P(A∪B);計算{面包(A)=>啤酒(E)}的支持度:()。(保留小數(shù)點后一位)

A:0.4B:0.1C:0.3D:0.2

答案:0.2某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題()。

A:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B:聚類C:自然語言處理D:分類

答案:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)某個食品連鎖店每周的事務(wù)記錄如下表所示,每個事務(wù)表示在一項收款機(jī)業(yè)務(wù)中賣出的商品項集,假定min_sup=40%,min_conf=40%,使用Apriori算法生成的強(qiáng)關(guān)聯(lián)規(guī)則有()。

A:{啤酒}->{面包}B:{果凍}->{牛奶}C:{面包}->{花生醬}D:{花生醬}->{面包}

答案:{面包}->{花生醬};{花生醬}->{面包}下列關(guān)于FP-growth算法優(yōu)缺點的表述中,正確的有()。

A:FP-growth算法處理產(chǎn)生的條件樹時會占用很多資源B:FP-growth算法無須多次掃描數(shù)據(jù)庫,節(jié)省了運行時間C:FP-growth算法在建立FP-tree時占用空間較小D:相比于Apriori算法,F(xiàn)P-growth算法運行速度要快一個數(shù)量級

答案:FP-growth算法處理產(chǎn)生的條件樹時會占用很多資源;FP-growth算法無須多次掃描數(shù)據(jù)庫,節(jié)省了運行時間;相比于Apriori算法,F(xiàn)P-growth算法運行速度要快一個數(shù)量級Aprior算法包括連接和剪枝兩個基本步驟。()

A:對B:錯

答案:對具有較高的支持度的項集具有較高的置信度。()

A:對B:錯

答案:錯關(guān)聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則。()

A:對B:錯

答案:錯大型數(shù)據(jù)庫中的關(guān)聯(lián)規(guī)則挖掘包含找出所有頻繁項集和由頻繁項集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則兩個過程。()

A:對B:錯

答案:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論