大數(shù)據(jù)工具應(yīng)用智慧樹知到答案章節(jié)測試2023年_第1頁
大數(shù)據(jù)工具應(yīng)用智慧樹知到答案章節(jié)測試2023年_第2頁
大數(shù)據(jù)工具應(yīng)用智慧樹知到答案章節(jié)測試2023年_第3頁
大數(shù)據(jù)工具應(yīng)用智慧樹知到答案章節(jié)測試2023年_第4頁
大數(shù)據(jù)工具應(yīng)用智慧樹知到答案章節(jié)測試2023年_第5頁
免費預覽已結(jié)束,剩余7頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章測試2011年麥肯錫研究院提出的大數(shù)據(jù)定義是:大數(shù)據(jù)是指其大小超出了常規(guī)數(shù)據(jù)庫工具獲取、儲存、管理和(

)能力的數(shù)據(jù)集。

A:分析

B:訪問

C:計算

D:應(yīng)用

答案:A用4V來概括大數(shù)據(jù)的特點的話,一般是指:Value、Velocity、Volume和(

)。

A:Vainly

B:Valley

C:Vagary

D:Variety

答案:D大數(shù)據(jù)分析四個方面的工作主要是:數(shù)據(jù)分類、(

)、關(guān)聯(lián)規(guī)則挖掘和時間序列預測。

A:數(shù)據(jù)清洗

B:數(shù)據(jù)計算

C:數(shù)據(jù)統(tǒng)計

D:數(shù)據(jù)聚類

答案:D新浪和京東聯(lián)合推出的大數(shù)據(jù)商品推薦,是由京東盲目推送到當前瀏覽新浪網(wǎng)站的用戶的頁面上的。

A:對

B:錯

答案:B目前的大數(shù)據(jù)處理技術(shù)只能處理結(jié)構(gòu)化數(shù)據(jù)。

A:對

B:錯

答案:B第二章測試我們常用的微軟Office套件中的Access數(shù)據(jù)庫軟件的數(shù)據(jù)庫文件格式后綴名是(

)。

A:dbf

B:mdb

C:mdf

D:xls

答案:B大多數(shù)日志文件的后綴名是(

)。

A:log

B:xml

C:txt

D:csv

答案:A本課程重點介紹的weka軟件的專有文件格式是(

)。

A:keymap

B:value

C:ARFF

D:MongoDB

答案:C數(shù)據(jù)清洗工作的目的主要是要解決數(shù)據(jù)的完整性、唯一性、合法性和(

)。

A:專業(yè)性

B:共享性

C:一致性

D:排他性

答案:C八爪魚軟件的“自定義采集”工作方式下,需要在軟件里輸入一個(

)來作為采集的目標。

A:用戶名

B:關(guān)鍵詞

C:網(wǎng)頁地址

D:電話號碼

答案:C八爪魚軟件的采集規(guī)則可以通過文件的形式來導入或者導出,這種文件的后綴名是(

)。

A:gif

B:jpg

C:png

D:otd

答案:DExcel可以通過“數(shù)據(jù)有效性”按鈕操作來規(guī)范數(shù)據(jù)輸入的范圍。

A:錯

B:對

答案:BExcel不能導入txt或csv格式的文件。

A:對

B:錯

答案:B八爪魚軟件只能對軟件內(nèi)建了“簡易采集”規(guī)則的網(wǎng)站采集數(shù)據(jù)。

A:對

B:錯

答案:B八爪魚軟件進行自定義采集時,需要了解對網(wǎng)頁的頁面結(jié)構(gòu)。

A:對

B:錯

答案:A第三章測試使用DBSCAN算法對鳶尾花數(shù)據(jù)集(Iris.arff)進行聚類,將epsilon參數(shù)設(shè)置為0.2,minPoints參數(shù)設(shè)置為5,忽略class屬性,那么將形成(

)個簇。

A:

3

B:

1

C:

2

D:

4

答案:C使用EM算法對天氣數(shù)據(jù)集(weather.numeric.arff)進行聚類,將numClusters設(shè)置為4,即簇數(shù)為4,其他參數(shù)保持默認值,忽略play屬性,從結(jié)果中可知,下列選項中,(

)是錯誤的。

A:

模型的最大似然估計值是-7.18

B:

這組數(shù)據(jù)用算法迭代15次

C:

第四個簇的先驗概率是0.14

D:

第四個簇的實例數(shù)為4

答案:D使用SimpleKMeans算法對天氣數(shù)據(jù)集(weather.numeric.arff)進行聚類,保持默認參數(shù),即3個簇以及歐氏距離。選擇play屬性為忽略屬性,從結(jié)果中可知,下列選項中,(

)是錯誤。

A:

平方和誤差為8.928

B:

這組數(shù)據(jù)用算法迭代四次

C:

產(chǎn)生了三個中心點

D:

聚合為3個簇,分別有7,3,4個實例

答案:B使用線性回歸(LinearRegression)分類器和用M5P分類器對cpu.arff分別進行分類,由其輸出的誤差指標可知(

)。

A:

LinearRegression的平均絕對誤差比M5P的平均絕對誤差小

B:

LinearRegression的平均方根誤差比M5P的平均方根誤差大

C:

LinearRegression的相對誤差比M5P的相對誤差小

D:

LinearRegression的標準誤差比M5P的標準誤差小

答案:B刪去cpu.arff數(shù)據(jù)文件中的CACH屬性后,使用M5P分類器構(gòu)建方案,在結(jié)果中,到達LM2的實例數(shù)有(

)個。

A:

30

B:

165

C:

23

D:

21

答案:D根據(jù)J48分類器訓練weather.nominal.arff所生產(chǎn)的決策樹,當outlook=sunny;temperature=cool;humidity=high;windy=TRUE時,分類的結(jié)果是(

)。

A:

無法分類

B:

沒有結(jié)果

C:

No

D:

Yes

答案:C根據(jù)J48分類器訓練iris.arff所生產(chǎn)的決策樹,當sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2時,分類的結(jié)果是(

)。

A:

Iris-versicolor

B:

Iris-setosa

C:

Iris-virginica

D:

無法分類

答案:B關(guān)于Weka離散化說明正確的是(

)。

A:

離散化是將數(shù)值屬性轉(zhuǎn)換為字符串型屬性

B:

離散化包括無監(jiān)督離散化和有監(jiān)督離散化

C:

等寬離散化是使實例分布均勻的

D:

有監(jiān)督離散化有兩種等寬和等頻方法

答案:B以下(

)不是Weka的數(shù)據(jù)類型。

A:

numeric

B:

string

C:

nominal

D:

decimal

答案:D關(guān)于Weka的文件類型描述錯誤的是(

)。

A:

Weka處理的數(shù)據(jù)集類似于關(guān)系數(shù)據(jù)庫橫行實例,豎行屬性

B:

@relation定義數(shù)據(jù)集名稱,@data之后呈現(xiàn)實例,每一行就是一個實例

C:

arff是ASCII文件,可以用Word等文本編輯器打開查看

D:

Weka可以打開文件格式有.arff、.csv、.xlsx

答案:D以下屬于關(guān)聯(lián)分析的是(

)。

A:

自動判斷鳶尾花類別

B:

CPU性能預測

C:

購物籃分析

D:

股票趨勢建模

答案:C大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應(yīng)該注重數(shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下(

)算法直接挖掘。

A:

K-means

B:

BayesNetwork

C:

C4.5

D:

Apriori

答案:D某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的(

)問題。

A:

分類

B:

聚類

C:

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

D:

自然語言處理

答案:C在進行自動選擇屬性時,必須設(shè)立兩個對象,其中確定使用什么方法為每個屬性子集分配一個評估值的對象是下面的(

)。

A:

規(guī)則挖掘

B:

元分類器

C:

搜索方法

D:

屬性評估器

答案:D以下屬于屬性空間的搜索方法的是(

)。

A:

GainRatioAttributeEval

B:

BestFirst

C:

SymmetricalUncertAttributeEval

D:

PrincipalComponents

答案:B在weka軟件探索者界面中,利用Visualize標簽頁通過更改各個參數(shù)來進行數(shù)據(jù)集的可視化屬性設(shè)置后,需要單擊以下(

)按鈕,所有更改才會生效。

A:

Fastscrolling

B:

Update

C:

SelectAttribute

D:

SubSample

答案:B給定關(guān)聯(lián)規(guī)則AB,意味著:若A發(fā)生,B也會發(fā)生。

A:對

B:錯

答案:B支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標。

A:對

B:錯

答案:ARanker方法既可以用于單個屬性評估器,又可以用于屬性子集評估器。

A:對

B:錯

答案:B利用weka軟件進行數(shù)據(jù)可視化時,用戶可以選擇類別屬性對數(shù)據(jù)點著色,如果類別屬性是標稱型,則顯示為彩色條。

A:錯

B:對

答案:A第四章測試貝葉斯網(wǎng)絡(luò)中的節(jié)點代表(

)。

A:隨機函數(shù)

B:隨機變量

C:隨機過程

D:變量

答案:B貝葉斯網(wǎng)絡(luò)中,節(jié)點需給出概率分布描述,對于離散型隨機變量而言,可以用(

)的形式表示。

A:正態(tài)分布

B:

均勻分布

C:條件概率密度函數(shù)

D:條件概率表

答案:D貝葉斯網(wǎng)絡(luò)中節(jié)點之間的邊代表(

)。

A:隨機關(guān)系

B:概率因果

C:隨機結(jié)果

D:組合關(guān)系

答案:A貝葉斯網(wǎng)絡(luò)保存的文件格式是(

)。

A:

TXT

B:DOCX

C:XMLBIF

D:XLS

答案:C下面(

)不是反向傳播神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。

A:輸出層

B:計算層

C:輸入層

D:隱含層

答案:B神經(jīng)網(wǎng)絡(luò)中的節(jié)點代表(

)。

A:激勵函數(shù)

B:隨機函數(shù)

C:隨機變量

D:激勵變量

答案:A下列(

)不是常見的激勵函數(shù)。

A:線性函數(shù)

B:正弦函數(shù)

C:閾值函數(shù)

D:Sigmoid函數(shù)

答案:B在貝葉斯網(wǎng)絡(luò)編輯界面時,如果節(jié)點的名稱沒法完全顯示,需要從(

)菜單項進行調(diào)整。

A:Tools|SetData

B:Tools|Layout

C:View|ZoomOut

D:View|ZoomIn

答案:BWEKA中選擇神經(jīng)網(wǎng)絡(luò)分類器操作時,應(yīng)該選擇(

)。

A:functions條目下的MultilayerPerceptron分類器

B:rules條目下的PART

C:默認的分類器

D:functions條目下的SGD分類器

答案:A下面關(guān)于PackageManager安裝后的目錄說明不正確的是(

)。

A:lib子目錄存放包所需要的說明文件

B:src子目錄存放源代碼文件

C:doc子目錄存放API文檔

D:sample-data子目錄存放數(shù)據(jù)集文件

答案:A第五章測試Tableau是一款定位于數(shù)據(jù)可視化敏捷開發(fā)和實現(xiàn)()展現(xiàn)工具。Tableau連續(xù)第6年在Gartner分析和商業(yè)智能魔力象限中蟬聯(lián)領(lǐng)導者殊榮。

A:商業(yè)統(tǒng)計

B:商務(wù)計算

C:商業(yè)行為

D:商務(wù)智能

答案:D以下()不是Tableau的數(shù)據(jù)類型?

A:Boolean

B:Decimal

C:Date

D:String

答案:BTableau可以用來實現(xiàn)交互的、()的分析和儀表板應(yīng)用,從而幫助我們快速地認識和理解數(shù)據(jù)。

A:離散性

B:可視化

C:連續(xù)性

D:智能化

答案:B下列說法錯誤的是()。

A:用戶僅需要通過輕點鼠標和簡單拖放就可以迅速創(chuàng)建出智能、精美、直觀和具有強交互性的報表和儀表盤

B:Tableau通過內(nèi)存數(shù)據(jù)引擎,可以直接查詢外部數(shù)據(jù)庫同時動態(tài)的從數(shù)據(jù)倉庫抽取實時數(shù)據(jù),極大的提高了數(shù)據(jù)訪問和查詢效率

C:Tableau不提供應(yīng)用編程接口

D:Tableau允許從多個數(shù)據(jù)源訪問數(shù)據(jù),包括帶分隔符的文本文件、Excel文件、SQL數(shù)據(jù)庫、Oracle數(shù)據(jù)庫和多維數(shù)據(jù)庫等

答案:C度量往往是()字段,度量是我們的指標。度量常常是連續(xù)的,連續(xù)的字段在圖表中形成軸.將其拖放到功能區(qū)時,Tableau默認會進行()。

A:數(shù)值,混合運算

B:分類,混合運算

C:數(shù)值,聚合運算

D:分類,聚合運算

答案:C關(guān)于數(shù)據(jù)分層描述錯誤的是()。

A:數(shù)據(jù)分層的層級結(jié)構(gòu)由數(shù)據(jù)維度的上下順序決定

B:數(shù)據(jù)分層可以實現(xiàn)向上鉆取

C:數(shù)據(jù)分層的層次結(jié)構(gòu)可以手工調(diào)整

D:數(shù)據(jù)分層可以實現(xiàn)向下鉆取

答案:B以下不屬于集的創(chuàng)建方式的是()。

A:[常規(guī)]創(chuàng)建

B:[分組]創(chuàng)建

C:[條件]創(chuàng)建

D:[頂部]創(chuàng)建

答案:BTableau右邊數(shù)據(jù)目錄欄中,不能單擊右鍵創(chuàng)建參數(shù)的緯度是()。

A:參數(shù)

B:度量

C:緯度

D:集

答案:D以下不是創(chuàng)建計算字段時的運算邏輯的是()。

A:日期

B:用戶

C:表結(jié)構(gòu)

D:數(shù)字

答案:C儀表板版面大小設(shè)計選項,()不屬于大小設(shè)計選項。

A:固定大小

B:自動

C:自定義

D:范圍

答案:C第六章測試Logistic函數(shù)的定義域是()。

A:(0,+INF)

B:(-INF,+INF)

C:(-INF,1)

D:[0,1]

答案:B下列敘述錯誤的是()。

A:邏輯回歸采用Sigmoid函數(shù)對樣本數(shù)據(jù)進行擬合,以構(gòu)建回歸模型

B:邏輯回歸預測事件發(fā)生的概率并分析導致事件發(fā)生的因素

C:邏輯回歸是一種監(jiān)督機器學習算法

D:邏輯回歸主要用于回歸分析

答案:D使用IBk分類器和SMO分類器對vote.arff分別進行分類,由其輸出的結(jié)果可知()。

A:SMO對democrat的分類正確率比IBk小

B:IBk對republican的分類正確率比SMO大

C:IBk正確分類百分比比SMO大

D:SMO對democrat和republican的分類正確率都比IBk大

答案:DA:0或1

B:0或-1

C:true或false

D:1或-1

答案:D以下描述錯誤的是()。

A:SVM尋找具有最小邊緣的超平面,因此經(jīng)常被稱為最小邊緣分類器

B:k-最近鄰算法(K-NN)是一種消極學習器

C:SVM對噪聲不具備魯棒性

D:聚類分析可以看作是一種非監(jiān)督的分類

答案:A線性支持向量機的最大化間隔正確的描述是()。

A:

B:

C:

D:

答案:B以下計算距離的公式中,計算歐氏距離的是()。

A:

B:

C:

D:

答案:D第七章測試以下數(shù)據(jù)和信息的說法,不正確的是()。

A:數(shù)據(jù)對用戶來說是有價值的

B:數(shù)據(jù)的形式是多樣化的

C:凡是可以電子化記錄下來的都是數(shù)據(jù)

D:信息是客觀世界各種事物特征的反映

答案:A以下關(guān)于數(shù)據(jù)分析的方法,正確的是()。

A:分析是一個過程,分析的對象是信息

B:數(shù)據(jù)分析的目的就是解決我們現(xiàn)實中的某個問題

C:數(shù)據(jù)分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論