數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測(cè)試課后答案2024年秋中國(guó)石油大學(xué)(華東)_第1頁
數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測(cè)試課后答案2024年秋中國(guó)石油大學(xué)(華東)_第2頁
數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測(cè)試課后答案2024年秋中國(guó)石油大學(xué)(華東)_第3頁
數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測(cè)試課后答案2024年秋中國(guó)石油大學(xué)(華東)_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余5頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)挖掘與石油勘探開發(fā)知到智慧樹章節(jié)測(cè)試課后答案2024年秋中國(guó)石油大學(xué)(華東)第一章單元測(cè)試

根據(jù)數(shù)據(jù)挖掘的對(duì)象不同,數(shù)據(jù)挖掘技術(shù)可分為分類規(guī)則挖掘、聚類規(guī)則挖掘和關(guān)聯(lián)規(guī)則挖掘等。()

A:錯(cuò)B:對(duì)

答案:錯(cuò)

第二章單元測(cè)試

數(shù)據(jù)倉(cāng)庫的數(shù)據(jù)量通常較大,且強(qiáng)調(diào)數(shù)據(jù)可以進(jìn)行實(shí)時(shí)更新。()

A:對(duì)B:錯(cuò)

答案:錯(cuò)數(shù)據(jù)倉(cāng)庫通常指一個(gè)數(shù)據(jù)環(huán)境,而不是指一件產(chǎn)品,它提供用戶用于決策支持的當(dāng)前和歷史數(shù)據(jù),這些數(shù)據(jù)在傳統(tǒng)的數(shù)據(jù)庫中通常不方便得到。()

A:錯(cuò)B:對(duì)

答案:對(duì)ETL過程的作用是為了識(shí)別錯(cuò)誤數(shù)據(jù),而不是處理它們。()

A:對(duì)B:錯(cuò)

答案:對(duì)粒度是對(duì)數(shù)據(jù)倉(cāng)庫中數(shù)據(jù)的綜合程度高低的一個(gè)衡量。粒度越小,細(xì)節(jié)程度越低,回答查詢的種類越豐富。()

A:錯(cuò)B:對(duì)

答案:錯(cuò)由于數(shù)據(jù)倉(cāng)庫的設(shè)計(jì)是一個(gè)不斷改進(jìn)和完善的螺旋式發(fā)展過程,在剛開始時(shí)選擇部分比較重要的主題作為數(shù)據(jù)倉(cāng)庫設(shè)計(jì)的起點(diǎn)是很有必要的。()

A:對(duì)B:錯(cuò)

答案:對(duì)

第三章單元測(cè)試

知識(shí)評(píng)估的主要目的是評(píng)估所得知識(shí)是否符合商業(yè)目標(biāo)。()

A:錯(cuò)B:對(duì)

答案:對(duì)數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、缺失值處理、異常值檢測(cè)和處理等步驟,但不包括特征選擇和降維操作。()

A:對(duì)B:錯(cuò)

答案:錯(cuò)在數(shù)據(jù)分析中,分箱技術(shù)可用于將連續(xù)型變量離散化為若干個(gè)區(qū)間,并對(duì)每個(gè)區(qū)間進(jìn)行編碼。()

A:對(duì)B:錯(cuò)

答案:對(duì)在數(shù)據(jù)預(yù)處理中,可以直接刪除包含缺失值的樣本,而不考慮填補(bǔ)缺失值的方法。()

A:錯(cuò)B:對(duì)

答案:錯(cuò)規(guī)范化(標(biāo)準(zhǔn)化)是數(shù)據(jù)預(yù)處理中常用的操作之一,通過將數(shù)據(jù)按比例縮放到特定的范圍,使得數(shù)據(jù)具有相似的尺度和分布。()

A:錯(cuò)B:對(duì)

答案:對(duì)

第四章單元測(cè)試

數(shù)據(jù)可視化依照(),可以分為科學(xué)可視化和信息可視化。

A:信息傳遞方式B:數(shù)據(jù)對(duì)象C:數(shù)據(jù)類別D:數(shù)據(jù)屬性

答案:數(shù)據(jù)對(duì)象以下()不屬于格式塔理論的八大原則。

A:重復(fù)原則B:經(jīng)驗(yàn)原則C:連續(xù)原則D:好圖原則

答案:重復(fù)原則數(shù)據(jù)清洗過程主要處理哪些數(shù)據(jù)()。

A:不一致數(shù)據(jù)B:最大值C:噪聲值D:缺失值

答案:不一致數(shù)據(jù);噪聲值;缺失值在可視化流程概念圖中,各個(gè)模塊的聯(lián)系僅僅是順序的線性聯(lián)系。()

A:對(duì)B:錯(cuò)

答案:錯(cuò)直接體繪制中使用到的光線投射算法是基于射線掃描過程的。()

A:錯(cuò)B:對(duì)

答案:對(duì)

第五章單元測(cè)試

構(gòu)造分類模型的步驟是()。

A:方法評(píng)估標(biāo)準(zhǔn)B:選擇分類方法C:數(shù)據(jù)準(zhǔn)備D:選擇優(yōu)化方法

答案:方法評(píng)估標(biāo)準(zhǔn);選擇分類方法;數(shù)據(jù)準(zhǔn)備ID3算法的類別屬性可以取的值有()。

A:yesB:wrongC:falseD:success

答案:yes;false;success決策樹的缺點(diǎn)包括()

A:決策樹算法不穩(wěn)定(數(shù)據(jù)中很小的變化可能導(dǎo)致生成一個(gè)完全不同的樹)B:輸出屬性必須是分類性,不允許輸出連續(xù)屬性C:測(cè)試屬性選取問題D:數(shù)值型數(shù)據(jù)必須離散化

答案:決策樹算法不穩(wěn)定(數(shù)據(jù)中很小的變化可能導(dǎo)致生成一個(gè)完全不同的樹);輸出屬性必須是分類性,不允許輸出連續(xù)屬性;測(cè)試屬性選取問題;數(shù)值型數(shù)據(jù)必須離散化由于連續(xù)屬性沒有可劃分的結(jié)點(diǎn),這個(gè)時(shí)候要用到連續(xù)屬性離散化技術(shù),最簡(jiǎn)單的策略就是采用二分法(bi-partition)對(duì)連續(xù)屬性進(jìn)行處理,C4.5決策樹算法采用的就是這種機(jī)制。()

A:錯(cuò)B:對(duì)

答案:對(duì)哪種方法是用于避免過擬合的決策樹剪枝策略?()。

A:特征選擇B:損失函數(shù)最小化C:聚類分析D:正則化

答案:正則化

第六章單元測(cè)試

在層次聚類中,聚類的停止標(biāo)準(zhǔn)可以是基于哪種方法?()。

A:密度B:方差C:距離D:類別數(shù)量

答案:距離按照聚類的尺度,聚類算法可以分為()

A:離散型數(shù)據(jù)聚類算法B:基于互聯(lián)性的聚類算法C:基于密度的聚類算法D:基于距離的聚類算法

答案:基于互聯(lián)性的聚類算法;基于密度的聚類算法;基于距離的聚類算法以下說法正確的是()

A:帶權(quán)的歐氏距離計(jì)算公式就是歐式距離計(jì)算公式中的每一個(gè)平方項(xiàng)都加一個(gè)權(quán)重。B:距離函數(shù)不需要要滿足同一性和對(duì)稱性。C:余弦相似度中,余弦值的范圍在[-1,1],值越接近1,兩個(gè)對(duì)象越不相似。D:基于在數(shù)據(jù)標(biāo)準(zhǔn)化后,兩個(gè)對(duì)象之間的差異程度可以由兩個(gè)對(duì)象之間的距離來確定,常用的距離計(jì)算公式有歐氏距離和Manhattan距離等。

答案:帶權(quán)的歐氏距離計(jì)算公式就是歐式距離計(jì)算公式中的每一個(gè)平方項(xiàng)都加一個(gè)權(quán)重。;基于在數(shù)據(jù)標(biāo)準(zhǔn)化后,兩個(gè)對(duì)象之間的差異程度可以由兩個(gè)對(duì)象之間的距離來確定,常用的距離計(jì)算公式有歐氏距離和Manhattan距離等。那個(gè)不是層次聚類方法的距離度量法:()。

A:最短距離B:最長(zhǎng)距離C:相對(duì)距離D:中間距離

答案:相對(duì)距離k-means算法的缺點(diǎn)沒有什么:()。

A:計(jì)算方法復(fù)雜B:對(duì)孤立點(diǎn)敏感C:對(duì)噪聲敏感D:用戶需事先指定k的個(gè)數(shù)

答案:計(jì)算方法復(fù)雜

第七章單元測(cè)試

頻繁項(xiàng)集、最大頻繁項(xiàng)集之間的關(guān)系是:()

A:頻繁項(xiàng)集=最大頻繁項(xiàng)集B:沒有關(guān)系C:最大頻繁項(xiàng)集?頻繁項(xiàng)集D:頻繁項(xiàng)集?最大頻繁項(xiàng)集

答案:頻繁項(xiàng)集?最大頻繁項(xiàng)集下面的購(gòu)物籃中,如果顧客購(gòu)買了薯片,他們還會(huì)購(gòu)買()

A:面包B:水果C:牛奶D:牛奶和面包

答案:牛奶事務(wù)數(shù)據(jù)庫如下所示,假定支持度閾值為50%,在產(chǎn)生候選3-項(xiàng)集時(shí),候選2-項(xiàng)集中需要剪枝的是()

A:a、cB:b、dC:c、dD:a、d

答案:b、d;a、d關(guān)聯(lián)規(guī)則挖掘的最終目標(biāo)是發(fā)現(xiàn)滿足最小支持度的所有項(xiàng)集。()

A:錯(cuò)B:對(duì)

答案:錯(cuò)利用Apriori先驗(yàn)性質(zhì)可以加快頻繁項(xiàng)集的生成過程。()

A:對(duì)B:錯(cuò)

答案:對(duì)

第八章單元測(cè)試

計(jì)算TF-IDF時(shí),某個(gè)單詞的詞頻越低,且包含該單詞的文章越多,則相應(yīng)的值()。

A:越小B:越大C:無影響

答案:越小計(jì)算TF-IDF時(shí),中l(wèi)og里的分子和分母分別代表什么?()

A:分子表示文檔的數(shù)量,分母表示索引詞出現(xiàn)的文檔數(shù)量B:分子表示文檔中單詞的數(shù)量,分母表示文檔數(shù)量C:分子表示文檔的數(shù)量,分母表示文檔數(shù)量D:分子表示文檔中單詞的數(shù)量,分母表示索引詞出現(xiàn)的文檔數(shù)量

答案:分子表示文檔的數(shù)量,分母表示索引詞出現(xiàn)的文檔數(shù)量SVD矩陣分解后得到的Σ矩陣的主對(duì)角線元素的含義什么?()

A:無特殊意義B:用作標(biāo)記C:特征值D:用作計(jì)數(shù)

答案:特征值當(dāng)矩陣A為方陣時(shí),對(duì)其進(jìn)行特征分解的結(jié)果為()。

A:B:C:D:

答案:當(dāng)矩陣A不是方陣時(shí),對(duì)其進(jìn)行特征分解的結(jié)果為()。

A:B:C:D:

答案:

第九章單元測(cè)試

導(dǎo)致推薦算法變得火熱的主要原因?yàn)椋ǎ?/p>

A:信息爆炸導(dǎo)致信息過載,用戶需求不明確B:信息爆炸導(dǎo)致信息過載,用戶需求明確C:互聯(lián)網(wǎng)和數(shù)字化內(nèi)容的快速發(fā)展D:重要的商業(yè)價(jià)值

答案:信息爆炸導(dǎo)致信息過載,用戶需求不明確根據(jù)熱度排行榜為用戶進(jìn)行內(nèi)容推薦的方式屬于()。

A:根據(jù)用戶的手機(jī)信息B:利用用戶注冊(cè)信息C:利用物品的內(nèi)容信息D:利用非個(gè)性化推薦

答案:利用非個(gè)性化推薦基于用戶的協(xié)同過濾的特點(diǎn)有()。

A:適用于用戶較少的場(chǎng)合B:用戶有新行為不一定造成推薦結(jié)果的立即變化C:適用于物品數(shù)明顯小于用戶數(shù)的場(chǎng)合D:用戶有新行為一定會(huì)導(dǎo)致推薦結(jié)果的實(shí)時(shí)變化

答案:適用于用戶較少的場(chǎng)合;用戶有新行為不一定造成推薦結(jié)果的立即變化基于協(xié)同過濾的推薦系統(tǒng)一般應(yīng)用于有用戶評(píng)分的系統(tǒng)之中,通過分?jǐn)?shù)去刻畫用戶對(duì)于物品的喜好。()

A:錯(cuò)B:對(duì)

答案:對(duì)大型成熟網(wǎng)站的推薦系統(tǒng)一般是基于各種推薦算法的優(yōu)缺點(diǎn)以及適合場(chǎng)景分析的情況下,選擇單一的推薦算法使用。()

A:對(duì)B:錯(cuò)

答案:錯(cuò)

第十章單元測(cè)試

根據(jù)網(wǎng)絡(luò)的定義與表示,以下哪些陳述是正確的?()

A:鄰接矩陣是分析網(wǎng)絡(luò)結(jié)構(gòu)的一個(gè)有效工具,其元素表示節(jié)點(diǎn)之間是否存在連邊。B:根據(jù)網(wǎng)絡(luò)中邊的有向性和是否有權(quán)重,網(wǎng)絡(luò)可以被分為無向無權(quán)、有向無權(quán)、無向有權(quán)和有向有權(quán)四種類型。C:在網(wǎng)絡(luò)科學(xué)中,一個(gè)網(wǎng)絡(luò)不能同時(shí)具有自環(huán)和重邊。D:圖提供了一種方法,通過抽象的點(diǎn)和線表示實(shí)際網(wǎng)絡(luò),使得研究者能夠通過現(xiàn)象看本質(zhì)。E:網(wǎng)絡(luò)的拓?fù)湫再|(zhì)與網(wǎng)絡(luò)中節(jié)點(diǎn)的具體物理特性無關(guān),而只與節(jié)點(diǎn)之間的連接方式有關(guān)。

答案:鄰接矩陣是分析網(wǎng)絡(luò)結(jié)構(gòu)的一個(gè)有效工具,其元素表示節(jié)點(diǎn)之間是否存在連邊。;根據(jù)網(wǎng)絡(luò)中邊的有向性和是否有權(quán)重,網(wǎng)絡(luò)可以被分為無向無權(quán)、有向無權(quán)、無向有權(quán)和有向有權(quán)四種類型。;圖提供了一種方法,通過抽象的點(diǎn)和線表示實(shí)際網(wǎng)絡(luò),使得研究者能夠通過現(xiàn)象看本質(zhì)。;網(wǎng)絡(luò)的拓?fù)湫再|(zhì)與網(wǎng)絡(luò)中節(jié)點(diǎn)的具體物理特性無關(guān),而只與節(jié)點(diǎn)之間的連接方式有關(guān)。在小世界網(wǎng)絡(luò)中,下列關(guān)于小世界現(xiàn)象的描述,哪個(gè)是正確的?()

A:任意兩個(gè)節(jié)點(diǎn)之間的平均距離與網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量成線性關(guān)系增長(zhǎng)。B:網(wǎng)絡(luò)的聚類系數(shù)接近0,表明網(wǎng)絡(luò)中幾乎沒有集聚成團(tuán)的現(xiàn)象。C:任意兩個(gè)節(jié)點(diǎn)之間的平均距離與網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量的對(duì)數(shù)成比例增長(zhǎng)。D:網(wǎng)絡(luò)的所有節(jié)點(diǎn)都直接相連,形成一個(gè)完全圖。

答案:任意兩個(gè)節(jié)點(diǎn)之間的平均距離與網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量的對(duì)數(shù)成比例增長(zhǎng)。關(guān)于網(wǎng)絡(luò)的基本性質(zhì),以下哪項(xiàng)描述是正確的?()

A:無向網(wǎng)絡(luò)的平均度與網(wǎng)絡(luò)中節(jié)點(diǎn)數(shù)量成正比。B:在無向網(wǎng)絡(luò)中,網(wǎng)絡(luò)的平均度是所有節(jié)點(diǎn)度數(shù)之和的兩倍除以節(jié)點(diǎn)總數(shù)。C:有向網(wǎng)絡(luò)中,節(jié)點(diǎn)的出度總是小于入度。D:在任何網(wǎng)絡(luò)中,所有節(jié)點(diǎn)的度都相同。

答案:在無向網(wǎng)絡(luò)中,網(wǎng)絡(luò)的平均度是所有節(jié)點(diǎn)度數(shù)之和的兩倍除以節(jié)點(diǎn)總數(shù)。介數(shù)中心性(BetweennessCentrality)主要衡量了一個(gè)節(jié)點(diǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論