數(shù)據(jù)挖掘智慧樹知到期末考試答案章節(jié)答案2024年青島大學(xué)_第1頁(yè)
數(shù)據(jù)挖掘智慧樹知到期末考試答案章節(jié)答案2024年青島大學(xué)_第2頁(yè)
數(shù)據(jù)挖掘智慧樹知到期末考試答案章節(jié)答案2024年青島大學(xué)_第3頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余4頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)挖掘智慧樹知到期末考試答案+章節(jié)答案2024年青島大學(xué)k-means算法對(duì)同一個(gè)數(shù)據(jù)集,如果初始中心選擇不同,其聚類結(jié)果也可能不一樣。()

答案:對(duì)一個(gè)頻繁閉合項(xiàng)目集的所有閉合子集一定是頻繁的。()

答案:對(duì)FP-Growth算法將提供頻繁項(xiàng)集的數(shù)據(jù)集壓縮到一棵頻繁模式樹上,但仍保留項(xiàng)集的關(guān)聯(lián)信息,通過(guò)不斷地迭代FP-tree的構(gòu)造和投影過(guò)程來(lái)發(fā)現(xiàn)頻繁模式。()

答案:對(duì)即使是同一個(gè)數(shù)據(jù)集,如果k選擇不同,k-means算法聚類結(jié)果可能完全不一樣。()

答案:對(duì)給定全局項(xiàng)集I和交易數(shù)據(jù)集D,對(duì)于I的非空項(xiàng)集I1,若其支持度小于或等于最小支持度閾值,則稱I1為頻繁項(xiàng)集。()

答案:錯(cuò)密度聚類算法中,若Y為噪聲點(diǎn),則只要讓?duì)抛銐虼螅蜻m當(dāng)減小MinPts,就可以使Y不再是噪聲點(diǎn)。()

答案:對(duì)聚類發(fā)現(xiàn)的離群點(diǎn)一定沒(méi)有用處。()

答案:錯(cuò)聚類分析是有監(jiān)督的學(xué)習(xí)過(guò)程。()

答案:錯(cuò)所謂閉項(xiàng)集,就是指一個(gè)項(xiàng)集X,它所有超集的支持度計(jì)數(shù)都小于它本身的支持度計(jì)數(shù)。()

答案:對(duì)噪聲和離群點(diǎn)給聚類過(guò)程帶來(lái)的影響之一,是會(huì)產(chǎn)生空簇。()

答案:對(duì)AprioriSome算法可以看作是AprioriAll算法的改進(jìn),具體過(guò)程分為兩個(gè)階段:()。

答案:前推階段###回溯階段數(shù)據(jù)不一致性的成因:()。

答案:不同的數(shù)據(jù)源###違反了函數(shù)依賴性CF樹存儲(chǔ)了層次聚類的簇的特征,有三個(gè)參數(shù):()。

答案:枝平衡因子β###葉平衡因子λ###空間閾值τ數(shù)據(jù)預(yù)處理(DataPreprocessing)是指:為達(dá)到挖掘算法進(jìn)行知識(shí)獲取研究所要求的最低規(guī)范和標(biāo)準(zhǔn),在對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘的主要處理以前,先對(duì)原始數(shù)據(jù)進(jìn)行必要的一系列的處理工作,具體包括()。

答案:離散###集成###歸約###清理###轉(zhuǎn)換經(jīng)典的規(guī)則歸納算法有()。

答案:FOIL###AQ###CN2KDD是一個(gè)多步驟的處理過(guò)程,一般分為哪些階段()。

答案:數(shù)據(jù)抽取###數(shù)據(jù)預(yù)處理###模式評(píng)估###問(wèn)題定義###數(shù)據(jù)挖掘PAM算法的優(yōu)點(diǎn)為()。

答案:消除了k-平均算法對(duì)于孤立點(diǎn)的敏感性,方法更加健壯。###對(duì)小的數(shù)據(jù)集非常有效GSP算法中產(chǎn)生候選序列模式主要分兩步()。

答案:連接階段###剪枝階段統(tǒng)計(jì)學(xué)中常用的預(yù)測(cè)方法是()。

答案:回歸聚類特征CF有個(gè)特性,即可以()。

答案:求和BIRCH算法的核心()。

答案:聚類特征k-means算法中,簇中心不再發(fā)生變化就等價(jià)于簇內(nèi)差異函數(shù)w(C)的值達(dá)到()。

答案:最小下列哪個(gè)算法屬于基于劃分的聚類算法?()。

答案:K-means大數(shù)據(jù)的特征有()。

答案:Variety###Volume###Value###Velocity數(shù)據(jù)挖掘是在沒(méi)有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。()

答案:對(duì)同時(shí)滿足最小支持度閾值和最小置信度閾值的關(guān)聯(lián)規(guī)則稱為強(qiáng)關(guān)聯(lián)規(guī)則,是有意義有價(jià)值的。()

答案:對(duì)AGNES算法僅可用于規(guī)模相對(duì)較小的數(shù)據(jù)集。()

答案:對(duì)CF樹是一棵高度平衡樹,用來(lái)存儲(chǔ)層次聚類的聚類特征。()

答案:對(duì)凝聚的層次聚類算法是一種自底向上的策略,初始時(shí)先將每個(gè)對(duì)象作為一個(gè)簇,然后合并這些原子簇為越來(lái)越大的簇,直到某個(gè)終結(jié)條件被滿足。()

答案:對(duì)學(xué)習(xí)階段的任務(wù)是挖掘分類規(guī)則。()

答案:對(duì)k-prototype算法可以對(duì)離散與數(shù)值屬性兩種混合的數(shù)據(jù)進(jìn)行聚類。()

答案:對(duì)可以把數(shù)據(jù)分析分為以下4個(gè)層次:數(shù)據(jù)統(tǒng)計(jì),OLAP,數(shù)據(jù)挖掘,大數(shù)據(jù)。()

答案:對(duì)DBSCAN算法對(duì)噪聲和離群點(diǎn)非常敏感。()

答案:對(duì)數(shù)據(jù)挖掘?qū)崿F(xiàn)了用其他方法不可能實(shí)現(xiàn)的方法來(lái)發(fā)現(xiàn)信息,但它必須受到規(guī)范,應(yīng)當(dāng)在適當(dāng)?shù)恼f(shuō)明下使用。()

答案:對(duì)CF樹的構(gòu)造過(guò)程實(shí)際上是一個(gè)數(shù)據(jù)對(duì)象的插入過(guò)程。()

答案:對(duì)k-modes算法實(shí)現(xiàn)了對(duì)離散數(shù)據(jù)的快速聚類。()

答案:對(duì)DBSCAN算法是一種部分聚類算法,即聚類中所有簇的并集不一定能覆蓋數(shù)據(jù)集的全部。()

答案:對(duì)分裂的層次聚類算法采用自頂向下的策略,它首先將所有對(duì)象置于一個(gè)簇中,然后逐漸細(xì)分為越來(lái)越小的簇,直到達(dá)到了某個(gè)終結(jié)條件。()

答案:對(duì)分類屬于一種無(wú)指導(dǎo)的學(xué)習(xí)方法。()

答案:錯(cuò)數(shù)據(jù)挖掘的對(duì)象可以是任何類型的數(shù)據(jù)源。()

答案:對(duì)數(shù)據(jù)挖掘是一種決策支持過(guò)程。()

答案:對(duì)OLAP就是數(shù)據(jù)挖掘。()

答案:錯(cuò)數(shù)據(jù)挖掘技術(shù)可以應(yīng)用于大數(shù)據(jù)分析。()

答案:對(duì)數(shù)據(jù)挖掘的任務(wù)有關(guān)聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。()

答案:對(duì)基本的Apriori算法產(chǎn)生頻繁項(xiàng)集的過(guò)程主要分為()。

答案:連接步###剪枝步KNN算法的優(yōu)缺點(diǎn)()。

答案:KNN對(duì)于樣本不均衡的數(shù)據(jù)效果不好,需要進(jìn)行改進(jìn)###K值的選取非常重要###KNN算法是最簡(jiǎn)單有效的分類算法,且容易實(shí)現(xiàn)###KNN對(duì)于隨機(jī)分布的數(shù)據(jù)集分類效果較差,對(duì)于類內(nèi)間距小,類間間距大的數(shù)據(jù)集分類效果好,而且對(duì)于邊界不規(guī)則的數(shù)據(jù)效果較好。數(shù)據(jù)歸約的策略有()。

答案:數(shù)據(jù)壓縮###數(shù)據(jù)立方體聚集###維歸約###數(shù)值歸約多維數(shù)據(jù)模型最典型的數(shù)據(jù)模式包括()。

答案:星型模式###事實(shí)星座模式###雪花模式從宏觀上看,數(shù)據(jù)挖掘過(guò)程主要由三個(gè)部分組成,即()。

答案:數(shù)據(jù)挖掘###數(shù)據(jù)整理###結(jié)果的解釋評(píng)估k-means的改進(jìn)算法在使用時(shí),還存在如下問(wèn)題:()

答案:k-prototype中權(quán)重a的確立###k條初始記錄的選取###K值的確立壓縮算法分為()。

答案:有損壓縮###無(wú)損壓縮關(guān)聯(lián)規(guī)則挖掘算法有()。

答案:Close###FP-Growth###Apriori規(guī)范化常用的方法有()。

答案:z-score規(guī)范化###最小-最大規(guī)范化###小數(shù)定標(biāo)規(guī)范化為了提高Apriori算法的效率,研究人員們提出了一系列的改進(jìn)算法,這些算法中主要采用的改進(jìn)方法有:()。

答案:采樣###使用分割技術(shù)###動(dòng)態(tài)項(xiàng)集計(jì)數(shù)###基于Hash的項(xiàng)集計(jì)數(shù)###減少交易記錄存放數(shù)據(jù)歸約表示的無(wú)參方法包括()。

答案:聚類###直方圖###取樣決策樹分類模型的建立通常分為哪些步驟()。

答案:決策樹修剪###決策樹生成分類器的構(gòu)造方法有()。

答案:神經(jīng)網(wǎng)絡(luò)方法###機(jī)器學(xué)習(xí)方法###粗糙集###統(tǒng)計(jì)方法BIRCH算法的主要優(yōu)點(diǎn)有()。

答案:可以識(shí)別噪音數(shù)據(jù)###聚類速度快###節(jié)約內(nèi)存決策樹的剪枝策略有:()。

答案:后剪枝###預(yù)先剪枝BIRCH算法的主要缺點(diǎn)有()。

答案:BIRCH算法在整個(gè)過(guò)程中一旦中斷,一切必須從頭再來(lái)###聚類的結(jié)果可能和真實(shí)的類別分布不同###對(duì)高維特征的數(shù)據(jù)聚類效果不好貝葉斯分類方法都有:()。

答案:NBC###BAN###GBN###TAN時(shí)間序列合適的建模方法有:()。

答案:一元時(shí)間序列###序列的分布規(guī)律###離散型時(shí)間序列###連續(xù)型時(shí)間序列###多元時(shí)間序列下列哪個(gè)算法不屬于基于劃分的聚類算法?()。

答案:Agnes###BIRCH###CUREk-means算法中,每個(gè)簇由()

答案:簇的中心點(diǎn)來(lái)表示下列哪個(gè)算法屬于密度聚類算法?()。

答案:DBSCAN下列哪個(gè)算法屬于K中心點(diǎn)算法?()。

答案:PAMk-means算法在實(shí)際計(jì)算中可能會(huì)出現(xiàn)空簇的主要原因是()。

答案:存在離群點(diǎn)關(guān)聯(lián)規(guī)則挖掘算法最為著名的是Agrawal等人提出的:()

答案:Apriori人臉識(shí)別中的主要技術(shù)就是來(lái)自于數(shù)據(jù)挖掘中的()。

答案:分類算法如果某天共有1000個(gè)顧客到商場(chǎng)購(gòu)買物品,其中有100個(gè)顧客同時(shí)購(gòu)買了鐵錘和鐵釘,那么上述的關(guān)聯(lián)規(guī)則的支持度就是()

答案:10%如果購(gòu)買鐵錘的顧客中有70%的人購(gòu)買了鐵釘,那么置信度是()。

答案:70%FPGrowth的算法只進(jìn)行幾次數(shù)據(jù)集掃描,就可以找出所有的頻繁項(xiàng)集。()。

答案:2BIRCH算法中使用什么結(jié)構(gòu)來(lái)幫助我們快速的聚類,()。

答案:樹型結(jié)構(gòu)數(shù)據(jù)挖掘是面向應(yīng)用的。()

答案:對(duì)數(shù)據(jù)挖掘就是從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過(guò)程。()

答案:對(duì)數(shù)據(jù)挖掘所得到的信息應(yīng)具有先知,有效和實(shí)用三個(gè)特征。()

答案:對(duì)序列模式挖掘經(jīng)典算法有:()。

答案:PrefixSpan###AprioriSome###GSP###AprioriAllAprioriSome算法的優(yōu)缺點(diǎn)()。

答案:AprioriSome跳躍式計(jì)算候選,會(huì)在某種程度上減少遍歷數(shù)據(jù)集次數(shù)###對(duì)于較低的支持度,數(shù)據(jù)集中有較長(zhǎng)的大序列的情況下,采用AprioriSome比較好。###AprioriSome會(huì)產(chǎn)生比較多的候選,可能在回溯階段前就占滿內(nèi)存。AprioriAll算法存在的問(wèn)題()。

答案:在轉(zhuǎn)換階段產(chǎn)生巨大的開銷###很難找到長(zhǎng)序列模式###需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行多次掃描###容易生成大量的候選項(xiàng)集GSP算法存在的問(wèn)題()。

答案:需要對(duì)序列數(shù)據(jù)集進(jìn)行多次掃描###當(dāng)序列數(shù)據(jù)集比較大時(shí),容易生成龐大的候選序列###對(duì)長(zhǎng)序列模式的處理效率比較低()是對(duì)關(guān)聯(lián)規(guī)則重要性的衡量,反映關(guān)聯(lián)是否是普遍存在的規(guī)律。()

答案:支持度關(guān)聯(lián)規(guī)則挖掘最為著名的是Agrawal等人提出的()及其改進(jìn)算法。()

答案:Apriori給定全局項(xiàng)集I和交易數(shù)據(jù)集D,對(duì)于I的非空項(xiàng)集I1,若其支持度()最小支持度閾值min_sup,則稱I1為頻繁項(xiàng)集。()

答案:大于或等于()是對(duì)關(guān)聯(lián)規(guī)則準(zhǔn)確度的衡量,度量關(guān)聯(lián)規(guī)則的強(qiáng)度。()

答案:置信度樸素貝葉斯分類器對(duì)()數(shù)據(jù)具有較好的分類效果()。

答案:完全獨(dú)立的數(shù)據(jù)###函數(shù)依賴的數(shù)據(jù)下列哪些是決策樹分類算法?()。

答案:C4.5###CART###ID3下列哪些是分類算法?()。

答案:ID3###KNN###C4.5分類分析的兩個(gè)階段分別為:()。

答案:分類階段###學(xué)習(xí)階段下列哪個(gè)選項(xiàng)不是DBSCAN算法的缺點(diǎn)?()。

答案:能夠識(shí)別出噪聲點(diǎn)下列哪個(gè)算法屬于層次聚類算法?()。

答案:DIANA聚類分析中,通常使用()來(lái)衡量?jī)蓚€(gè)對(duì)象之間的相異度。()。

答案:距離下列哪個(gè)算法不屬于層次聚類算法?()。

答案:K-means處理空缺值的主要方法有()。

答案:使用與給定元組屬同一類的所有樣本的平均值。###使用一個(gè)全局常量填補(bǔ)空缺值###使用屬性的平均值填補(bǔ)空缺值。###忽略元組常用的數(shù)據(jù)轉(zhuǎn)換方法有()。

答案:聚集###數(shù)據(jù)概化###屬性構(gòu)造###平滑不完整數(shù)據(jù)的成因有()。

答案:數(shù)據(jù)收集時(shí)和數(shù)據(jù)分析時(shí)的不同考慮因素###數(shù)據(jù)收集的時(shí)候就缺乏合適的值###人為/硬件/軟件問(wèn)題數(shù)據(jù)集成時(shí)需解決的三個(gè)基本問(wèn)題為()。

答案:冗余問(wèn)題###模式集成的過(guò)程中涉及到的實(shí)體識(shí)別問(wèn)題###數(shù)據(jù)集成過(guò)程中數(shù)值沖突的檢測(cè)與處理給定一個(gè)數(shù)值屬性,怎樣才能平滑數(shù)據(jù),去掉噪聲?()。

答案:分箱(binning)###計(jì)算機(jī)和人工檢查結(jié)合###聚類###回歸

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論