大數(shù)據(jù)技術(shù)導(dǎo)論期末復(fù)習題2023-5(附參考答案)_第1頁
大數(shù)據(jù)技術(shù)導(dǎo)論期末復(fù)習題2023-5(附參考答案)_第2頁
大數(shù)據(jù)技術(shù)導(dǎo)論期末復(fù)習題2023-5(附參考答案)_第3頁
大數(shù)據(jù)技術(shù)導(dǎo)論期末復(fù)習題2023-5(附參考答案)_第4頁
大數(shù)據(jù)技術(shù)導(dǎo)論期末復(fù)習題2023-5(附參考答案)_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

一、選擇題

可視分析是一種()?

[A.]交互式用戶界面模型

[B.]結(jié)構(gòu)化用戶界面模型

[C1非結(jié)構(gòu)化用戶界面模型

[D.]獨立式用戶界面模型

【答案】A

2

數(shù)據(jù)科學(xué)的研究對象是()?

[A.]藥品成分

【B.】文學(xué)作品

[C,1數(shù)據(jù)界的數(shù)據(jù)

[D.]人類歷史

【答案】C

3

卜.而不是研究數(shù)據(jù)方法的是O?

[A.]統(tǒng)計學(xué)

[B.J機器學(xué)習

[C.1心理分析

[D.]數(shù)據(jù)挖掘

【答案】C

4

下面是數(shù)據(jù)科學(xué)的主要研究內(nèi)容的是()?

[A.]數(shù)據(jù)泄露

[B.]數(shù)據(jù)交易

[C]數(shù)據(jù)盜竊

[D.1數(shù)據(jù)分析

【答案】D

5

下面不是數(shù)據(jù)產(chǎn)品開發(fā)的特征的是()?

[A)多樣性

[B,]無競爭性

[C.J增值性

[D.]層次性

【答案】B

下面不屬于互聯(lián)網(wǎng)大數(shù)據(jù)的是()?

[AJ視頻

[B.]圖片

[C]音頻

[D.]心情

【答案】D

下面不屬于大數(shù)據(jù)的特性是O?

[A.1數(shù)據(jù)量大

[B.]多樣性

(C1真實性差

[D.]具有價值

【答案】C

卜.面屬于結(jié)構(gòu)化數(shù)據(jù)的是()?

[A1表格數(shù)據(jù)

[B.]圖形

[C.1圖像

[D.]HTML文檔

【答案】A

下面不屬于大數(shù)據(jù)的處理過程的是()?

[A.]數(shù)據(jù)獲取、儲存

[B.]數(shù)據(jù)清洗

(CJ數(shù)據(jù)分析

[D.]數(shù)據(jù)安全

【答案】D

10

下面不屬于大數(shù)據(jù)離線處理特點的是O?

[A.]數(shù)據(jù)保存時間短

[B.]數(shù)據(jù)不會發(fā)生改變

(C.1可進行復(fù)雜的批量計算

[D.]方便查詢計算結(jié)果

【答案】A

11

下面不屬于大數(shù)據(jù)處理模式的是()?

[A.]離線處理

[B.J在線處理

[C1手動計算

[D.]交互處理

【答案】C

12

下面僅屬于大數(shù)據(jù)在線處理模式的是()?

【A.】批量計算

[B.]流式計算

[C,1手動計算

[D.]交互處理

【答案】B

13

卜.而不屬于流式數(shù)據(jù)源的是O?

[A.]硬盤數(shù)據(jù)

[B.J傳感器數(shù)據(jù)

[C.1圖像數(shù)據(jù)

[D.]流媒體傳輸

【答案】A

14

下面不屬于流式數(shù)據(jù)的特點的是()?

[A.1實時性

[B.]層次性

[C1易失性

[D.]突發(fā)性

【答案】B

15

下而不屬于大數(shù)據(jù)計算模式的類型的是()?

【A.】批量計算

[B.]手動計算

[C.1流式計算

[D.]交互式計算

【答案】B

16

下面不屬于數(shù)據(jù)流技術(shù)應(yīng)用的方式是()?

1A.1指定查詢

[B.]模糊查詢

[C1即席計算

[D.]中間計算

【答案】B

17

下面不屬于判斷大數(shù)據(jù)應(yīng)用成功的指標是()?

[A.]創(chuàng)造價值

[B.]具備高速度

(C.1在本質(zhì)上提高

[D.]低性能

【答案】D

18

基于任務(wù)的定義和分類,下列不屬于可視分析關(guān)注點的是O?

[A.]以用戶價值為關(guān)注點

(B.J以用戶意圖為關(guān)注點

[C.J以同戶行為為關(guān)注點

[D.]以軟件操作為關(guān)注點

【答案】A

19

下而不屬于企業(yè)大數(shù)據(jù)應(yīng)用成功的考慮因素是()?

[A.]成本

[B.]客戶滿意度

【C.】附加收益

[D.]工人滿意度

【答案】D

20

下面不屬于大數(shù)據(jù)在通訊行業(yè)的應(yīng)用是()?

[A.]預(yù)測客戶行為

【B.】市場監(jiān)控

[C1智能電表

[D.]市場預(yù)警

【答案】C

21

MapReduce以什么方式進行分布式計兌()?

[A.]文本

[B.J函數(shù)

[C1數(shù)據(jù)集

[D.]矩陣

【答案】B

22

在Hadoop中,將每一次計算請求稱為一個()?

[A.]文本

[B.]函數(shù)

(C.1數(shù)據(jù)集

[D.J作業(yè)

【答案】D

23

在Hadoop中,將每個作業(yè)拆分為若干個()?

[A.J文本

[B.]Map任務(wù)

[C1數(shù)據(jù)集

[D.)Reduce任務(wù)

【答案】B

24

在Hadoop中,作業(yè)服務(wù)器被稱為()?

[A.]Job

[B.]Map

[C.]Master

[D.]Reduce

【答案】C

25

下列不屬于一個作業(yè)的計算流程的是()?

[A.]作業(yè)開始

【B.】作業(yè)修改

[C.]Map任務(wù)分配

(D.JReduce任務(wù)執(zhí)行

【答案】B

26

下列不屬于Map任務(wù)的執(zhí)行的子步驟的是(〉?

[A.]輸入準備

[B.]輸入修改

【C.】算法執(zhí)行

[D.]輸出生成

【答案】B

27

在MapReduce模型編程中,不屈于其步驟的是()?

[A.]遍歷數(shù)據(jù)

[B.]映射鍵值

[C]數(shù)據(jù)分組

[D.]數(shù)據(jù)插補

【答案】D

28

Hadoop的核心是()和MapReduceo

[A.]NTFS

[B.]GFS

[C.]HDFS

[D.]FS

【答案】C

29

下列不屬于單詞計數(shù)的Map過程的是()?

[A.]按列分割文件

(B.)分詞處理

【C.】按行分割文件

[D.]排序與合并

【答案】A

30

WordCount完成的功能是統(tǒng)計()?

[A.]按列分割文件數(shù)

[B.]輸入文件中單詞頻數(shù)

[C1按行分割文件數(shù)

[D.]輸入文件中單詞頻率

【答案】B

31

Hadoop開發(fā)環(huán)境部署內(nèi)容不包括()?

[A.]安裝SSH協(xié)議

[B.]Hadoop系統(tǒng)部署

(C.J偽分布式Hadoop環(huán)境部署

[D.]電腦斷網(wǎng)

【答案】D

32

Reduce任務(wù)目標是()?

[A.]輸入文件

[B.]輸入數(shù)據(jù)

[C.]輸入圖表

【D.】將若干個Map任務(wù)生成的中間文件匯總到最后的輸出文件

【答案】D

33

Hadoop作業(yè)服務(wù)器不負責()?

[A.]接受用戶提交的作業(yè)

[B.]任務(wù)的分配

[C1執(zhí)行具體的任務(wù)

[D.]管理所有的任務(wù)服務(wù)器

【答案】C

34

卜.列不屬于文本數(shù)據(jù)語義特征的是()?

[A.]詞頻

[B.]邏輯結(jié)構(gòu)

[C.1動態(tài)演化規(guī)律

[D.]數(shù)據(jù)結(jié)構(gòu)

【答案】D

35

文本數(shù)據(jù)是典型的()?

[A.]結(jié)構(gòu)化數(shù)據(jù)

[B.]半結(jié)構(gòu)化數(shù)據(jù)

[C,1讓結(jié)構(gòu)化數(shù)據(jù)

(D.)混合結(jié)構(gòu)數(shù)據(jù)

【答案】C

36

MapReduce模型將數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的各節(jié)點,每個節(jié)點將已完成的工作

和狀態(tài)更新,周期性地報告給()。

[A.]作業(yè)

[B.J任務(wù)

[C1作業(yè)服務(wù)器

[D.]任務(wù)服務(wù)器

【答案】C

37

MapReduce模型的最大優(yōu)點體現(xiàn)在()?

[A.]輸入方便

[B.J分布式處理

[CJ各類型數(shù)據(jù)輸入

[D.]算法簡單

【答案】B

38

MapReduce模型適用場景的特點()?

[A.]數(shù)據(jù)可實時處理

[B.]任務(wù)不可分解

[C.1任務(wù)可分解

[D.]任務(wù)需要順序執(zhí)行

【答案】C

39

MapReduce將計算過程分解的最大好處是()?

[A.]復(fù)雜化

【B.】快捷化

[C.1并行化

[D.]低成本

【答案】C

40

下列不屬于MapReduce模型的限制因素的是()?

[A.1任務(wù)要求

[B.]數(shù)據(jù)不可無限分割

[C1通信開銷

[D.]集群規(guī)模

【答案】A

41

下列不屬于信息可視化的分類的是()?

[A.]一維信息可視化

[B.]三維信息可視化

[C.J截面數(shù)據(jù)可視化

[D.]時序信息可視化

【答案】C

42

下列屬于傳統(tǒng)數(shù)據(jù)獲取的特點的是()?

[A.]數(shù)據(jù)源多種多樣

[B.]數(shù)據(jù)量巨大

[CJ結(jié)構(gòu)單一

[D.]結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)

【答案】C

43

下列不屬于大數(shù)據(jù)獲取的特點的是()?

[A.]數(shù)據(jù)源多種多樣

[B.]數(shù)據(jù)量巨大

(C.1結(jié)構(gòu)單一

[D.]結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)

【答案】C

44

卜.列屬于大數(shù)據(jù)獲取的特點的是<)?

[A.]數(shù)據(jù)源單一

【B.】數(shù)據(jù)量較小

[C.]結(jié)構(gòu)單一

[D.]包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)

【答案】D

45

氣泡圖由什么演化而來是()?

[A.]直方圖

[B.]條形圖

[C1散點圖

[D.]折線圖

【答案】C

46

下列不屬于文本數(shù)據(jù)的是<)?

[A.]廣告

[B.J音頻

[C.1雜志

[D.]圖書

【答案】B

47

下列不屬于文本數(shù)據(jù)的獲取特點的是()?

[A.]靈活度高

[B.]速度快

[C1按需獲取

[D.]易處理

【答案】D

48

下列屬于意見建議類用戶反饋的特點的是()?

[A.]反饋量大

[B.]反饋速度快

[C,1針對性強

[D.]傳播快

【答案】C

49

下列不屬于空間數(shù)據(jù)的特性的是<)?

[A.1定位

[B.]定量

[C]定性

[D.]時空關(guān)系

【答案】B

50

下列不屬于網(wǎng)站內(nèi)部數(shù)據(jù)庫中的數(shù)據(jù)的是()?

[A.]用戶信息數(shù)據(jù)

[B.1野外實測數(shù)據(jù)

[C,1網(wǎng)站產(chǎn)品數(shù)據(jù)

【D.】網(wǎng)站運營數(shù)據(jù)

【答案】B

51

卜.列不屬于網(wǎng)站數(shù)據(jù)采集的數(shù)據(jù)的是()?

[A.]非結(jié)構(gòu)化數(shù)據(jù)

[B.J半結(jié)構(gòu)化數(shù)據(jù)

[C.1結(jié)構(gòu)化數(shù)據(jù)

[D.]實驗測試數(shù)據(jù)

【答案】D

52

下列不屬于網(wǎng)絡(luò)爬蟲工作過程的是()?

[A.]獲取網(wǎng)頁

[B.]修改網(wǎng)頁

[C1解析網(wǎng)頁

[D.1儲存數(shù)據(jù)

【答案】B

53

下列不屬于通用網(wǎng)絡(luò)爬蟲的特點及要求的是()?

[A.]數(shù)量巨大

[B.]范圍較小

[C1存儲空間要大

[D.]爬行速度要快

【答案】B

54

下列不屬于通用網(wǎng)絡(luò)爬蟲的結(jié)構(gòu)的是()?

[A.]頁面爬行模塊

[B.J頁而分析模塊

[CJ頁面數(shù)據(jù)庫

[D.]頁面修改模塊

【答案】D

55

下列不屬于網(wǎng)頁的爬蟲策略的是()?

[A.]深度優(yōu)先搜索策略

[B.J精確選擇搜索策略

[C.J廣度優(yōu)先搜索策略

[D.]最佳優(yōu)先搜索策略

【答案】B

56

卜.列不屬于通用網(wǎng)絡(luò)爬蟲的局限性的是()?

[A.]無用網(wǎng)頁較多

[B.J對非結(jié)構(gòu)化數(shù)據(jù)獲取相對容易

[C.1難以支持基于語義信息的查詢

[D.]有限的網(wǎng)絡(luò)爬蟲服務(wù)器資源與無限的網(wǎng)絡(luò)數(shù)據(jù)資源之間的沖突

【答案】B

57

下列屬于聚焦網(wǎng)絡(luò)爬蟲的特點的是()?

[A.]數(shù)量巨大

[B.]范圍較大

[C1精準篩選

[D.]爬行速度慢

【答案】C

58

下列屬于淺聚焦網(wǎng)絡(luò)爬蟲的核心特點的是()?

[A.]數(shù)量巨大

[B.]范圍較大

[C1精準篩選

[D.]選定URL種子

【答案】D

59

下列不屬于爬蟲對抓取目標的定義原則的是()?

[A.]目標網(wǎng)頁特征

[B.J目標數(shù)據(jù)量

[CJ目標數(shù)據(jù)模式

[D.]領(lǐng)域概念

【答案】B

60

下列不屬于網(wǎng)絡(luò)爬蟲的數(shù)據(jù)抓取方式的是()?

[A.]預(yù)先給定的初始抓取種子樣本

[B.]預(yù)先給定的網(wǎng)頁分類目錄和與分類目錄對應(yīng)的種子樣本

[C.1通過用戶行為確定的抓I僅目標樣例

[D.]自行編寫種子樣本

【答案】D

61

卜.列不屬于NoSQL數(shù)據(jù)庫的特點的是()?

[A.]需預(yù)定義數(shù)據(jù)模型

[B.J支持透明橫向擴展

【C.】將數(shù)據(jù)進行分區(qū)

[D.]保證最終致性

【答案】A

62

下列不屬于NoSQL數(shù)據(jù)庫的存儲方式的是()?

[A.1行式存儲

[B.]鍵值式存儲

[C1圖形式存儲

【D.】文檔式存儲

【答案】A

63

下列不屬于NoSQL數(shù)據(jù)庫的鍵值式存儲的常見形式的是()?

[A.]臨時型

[B.J附加型

[C1混合型

[D.]永久型

【答案】B

64

下列不屬于數(shù)據(jù)庫架構(gòu)混合應(yīng)用模式的是()?

[A.]OldSQL+NewSQL混合模式

[B.JOldSQL+NoSQL+NewSQL混合模式

[C.]OldSQL+NoSQL混合模式

[D.]NewSQL+NoSQL混合模式

【答案】B

65

下列不屬于大數(shù)據(jù)抽取方式的是<)?

[A.]同構(gòu)同質(zhì)數(shù)據(jù)抽取

(B.)異構(gòu)同質(zhì)數(shù)據(jù)抽取

[C.1同構(gòu)異質(zhì)數(shù)據(jù)抽取

【D.】文件型數(shù)據(jù)抽取

【答案】B

66

下列不屬于增量數(shù)據(jù)抽取特點的是O?

[A.]抽取發(fā)生變化的數(shù)據(jù)

[B.]快捷

[C.J處理量更多

[D.]需要與數(shù)據(jù)裝載時的更新策略相對應(yīng)

【答案】C

67

下列不屬于地域空間可視化展現(xiàn)的功能的是()?

[AJ認識功能

[B.]模擬功能

[C.J載負功能

[D.]學(xué)習功能

【答案】D

68

時間戳是能表示一份數(shù)據(jù)在某個特定時間之前已經(jīng)存在的、完整的、可驗證的一個數(shù)據(jù),

其通常是()?

[A.]一個數(shù)據(jù)集

[B.]一個字符序列

[C.1一個日志文件

[D.]一段儲存代碼

【答案】B

69

下列不屬于基于?時間戳的增量數(shù)據(jù)抽取方式的優(yōu)點的是()?

[A.]性能優(yōu)異

[B.]系統(tǒng)設(shè)計清晰

[C1數(shù)據(jù)抽取簡單

[D.]對業(yè)務(wù)系統(tǒng)無其他要求

【答案】D

70

下列不屬于MD5(消息摘要算法)的特點的()?

[A.]對源系統(tǒng)的傾入性較小

[B.]被動地進行全表數(shù)據(jù)的比對

[C.1性能優(yōu)異

[D.]準確性不穩(wěn)定

【答案】C

71

下列不屬于數(shù)據(jù)清洗的是<)?

[A.]檢查數(shù)據(jù)的完整性

【B.】修改數(shù)據(jù)

[C1填補數(shù)據(jù)

[D.]消除重復(fù)

【答案】B

72

下列不屬于數(shù)據(jù)質(zhì)量的要素的是()?

[A.]準確性

[B.]完整性

[C1異質(zhì)性

[D.]及時性

【答案】C

73

卜.列不屬于數(shù)據(jù)質(zhì)量一致性的是<)?

[A.]數(shù)據(jù)編碼一致性

[B.]數(shù)據(jù)大小一致性

[C.1指標統(tǒng)計一致性

[D.]指標計算一致性

【答案】B

74

【答案】D

75

卜.列不屬于數(shù)據(jù)清洗算法標準的是()?

[A.]返回率

[B.J錯誤返回率

[C]正確返回率

[D.]精確度

【答案】C

76

下列不會造成文本記錄重復(fù)相似的是()?

[A.]插入

[B.]交換

[C1等價表述

[D.]刪除冗余

【答案】D

77

下列不屬于文本相似度計算的應(yīng)用領(lǐng)域的是()?

[A.]信息檢索

[B.J數(shù)據(jù)挖掘

[C.1文檔修改

[D.]機器翻譯

【答案】C

78

下列不屬于文本相似度計算流程的是()?

[A.]文本排序

[B.]文本分詞

[C1統(tǒng)計詞頻

[D.]寫出詞頻向量

【答案】A

79

增量數(shù)據(jù)抽取方式只抽取()?

[A.]PB級數(shù)據(jù)

[B.]不變數(shù)據(jù)

[C,1變化數(shù)據(jù)

(D.)有價值數(shù)據(jù)

【答案】C

80

數(shù)據(jù)清洗算法的衡量標準主要包含()、錯誤返回率和精確度。

[A.]冗余度

[B.]返回率

[C.J可用性

[D.]一致性

【答案】B

81

下列不屬于數(shù)據(jù)轉(zhuǎn)換中適合對數(shù)轉(zhuǎn)換的數(shù)據(jù)是()?

[A.]部分正偏態(tài)數(shù)據(jù)

[B.]等比數(shù)據(jù)

[C,J等差數(shù)據(jù)

[D.]數(shù)值相差不大的數(shù)據(jù)

【答案】C

82

卜.列不屬于數(shù)據(jù)轉(zhuǎn)換中適合平方根轉(zhuǎn)換的數(shù)據(jù)是<)?

[A.]泊松分布數(shù)據(jù)

[B.J輕度偏態(tài)數(shù)據(jù)

[C.1樣本方差和平均數(shù)呈現(xiàn)正相關(guān)的數(shù)據(jù)

[D.]數(shù)值相差不大的數(shù)據(jù)

【答案】D

83

噪聲是指測量數(shù)據(jù)中的()?

[A.]隨機誤差

【B.】均值

[C]方差

[D.1極差

【答案】A

84

下列不屬于地圖的構(gòu)成要素的是<)?

[A.]圖形要素

【B.】價格要素

[C1數(shù)學(xué)要素

[D.]輔助要素

【答案】B

85

下列不屬于數(shù)據(jù)平滑方法的是()?

[A.]移動平均法

[B.J最大最小值標準化

[C]指數(shù)平滑法

[D.]分箱平滑法

【答案】B

86

下列不屬于移動平均法的是()?

[A.]一次移動平均法

[B.]二次移動平均法

[C,1混合移動平均法

【D.】多次移動平均法

【答案】C

87

卜.列屬于一次移動平均法的適用范圍的是O?

[A.]水平變動的時間序列數(shù)據(jù)

[B.J長期變動趨勢的時間序列數(shù)據(jù)

[C.1循環(huán)性變動的時間序列數(shù)據(jù)

[D.]季節(jié)變動趨勢的時間序列數(shù)據(jù)

【答案】A

88

下列屬于二次移動平均法的適用范圍的是<)?

[A.]水平變動的時間序列數(shù)據(jù)

[B.]長期變動趨勢的時間序列數(shù)據(jù)

[C1循環(huán)性變動的時間序列數(shù)據(jù)

【D.】直線上升或下降趨勢的時間序列數(shù)據(jù)

【答案】D

89

下列不屬于指數(shù)平滑法的適用范圍的是()?

[A.]穩(wěn)定變化態(tài)勢的時間序列數(shù)據(jù)

[B.]不穩(wěn)定變化的時間序列數(shù)據(jù)

[C1規(guī)則變化的時間序列數(shù)據(jù)

[DJ直線上升或下降趨勢的時間序列數(shù)據(jù)

【答案】B

90

下列不屬于指數(shù)平滑法的適用范圍的是()?

[A.]近期趨勢預(yù)測

[B.J短期趨勢預(yù)測

[CJ中期趨勢預(yù)測

[D.]長期趨勢預(yù)測

【答案】D

91

下列不屬于分箱平滑法參照的是()?

[A.]箱內(nèi)數(shù)值的均值

[B.]箱內(nèi)數(shù)值的中值

[C.1箱內(nèi)數(shù)值的邊界值

[D.]箱內(nèi)數(shù)值的方差

【答案】D

92

數(shù)據(jù)規(guī)范化是將原來的度量值轉(zhuǎn)換為()?

[A.]無量綱的值

[B.J原來度量值的均值

【C.】原來度量值的方差

[D.]原來度量值的極差

【答案】A

93

下列不屬于數(shù)據(jù)規(guī)范化的作用的是()?

[A.1加快學(xué)習速度

[B.]規(guī)范事物概念

[C1避免單位的影響

[D.]呈現(xiàn)數(shù)據(jù)的集中程度

【答案】D

假定某屬性x的最小值、最大值分別為12000和98000,將屬性x映射到[0,1]中,根據(jù)

最小最大規(guī)范化方法,x的值73600(設(shè)定值)將轉(zhuǎn)換為()?

[A.]0.716

[B.]0.616

[C.10.516

[D.]0.816

【答案】A

Z分數(shù)規(guī)范化方法依據(jù)的是原始數(shù)據(jù)的()?

[A.]均值和中位數(shù)

[B.J中位數(shù)和極差

[C1極差和方差

【D.】均值和標準差

【答案】D

如果x的平均值和標準差分別為54000和16000。使用z分數(shù)規(guī)范化方法,X的值73600

被轉(zhuǎn)換為()?

[A.]1.125

[B.]1.025

[C]1.225

[D.11.325

【答案】C

97

Z分數(shù)規(guī)范化方法中對于離群點,均值絕對偏差相比標準差()?

[A.]更有效

[B.]更平穩(wěn)

[C1更精確

[D.]更魯棒

【答案】D

98

小數(shù)定標規(guī)范化方法中,其小數(shù)點移動的位數(shù)依賴于()?

[A.]最大絕對值

[B.]最小絕對值

[C.J均值絕對值

[D.]中位數(shù)絕對值

【答案】A

99

數(shù)據(jù)平滑方法主要有指數(shù)平滑法、移動平均法和()?

[A.]統(tǒng)計法

[B.]最短距離法

[C.1分箱平滑法

[D.]聚類方法

【答案】C

100

數(shù)據(jù)規(guī)范方法主要有最小最大規(guī)范法、z分數(shù)規(guī)范法和()?

[A.]極差規(guī)范法

[B.J小數(shù)定標規(guī)范法

【C.】模糊規(guī)范法

[D.]聚類方法

【答案】B

101

下列不屬于數(shù)據(jù)約簡策略的是()?

[A.]特征約簡

[B.]樣本約簡

[C1數(shù)值約簡

[D.]文本約簡

【答案】D

102

下列不屬于特征約簡的步驟的是<)?

[A.]搜索過程

[B.]填補過程

[C1評估過程

[D.]分類過程

【答案】B

103

【答案】B

104

系統(tǒng)抽樣乂稱之為()?

[A.]隨機抽樣

[B.]等距抽樣

【C.】分層抽樣

[D.]類型抽樣

【答案】B

105

下列不屬于影響突出對比的可視化展現(xiàn)是()?

[A.]比例選擇

[B]顏色使用

[C.1圖形形狀

[D.]圖形內(nèi)容

【答案】D

106

卜.列不屬于檢驗假設(shè)方法的是()?

[A.]提出假設(shè)

[B.J選擇統(tǒng)計量

【C.】修正統(tǒng)計量

[D.]根據(jù)顯著性水平進行判斷

【答案】C

107

分層抽樣又稱之為()?

[A.]隨機抽樣

[B.]等距抽樣

[CJ系統(tǒng)抽樣

[D.]類型抽樣

【答案】D

108

數(shù)據(jù)立方體是一類多維矩陣,讓用戶從多個角度探索和分析數(shù)據(jù)集,通常是一次同時考慮

幾個維度<)?

[A.]一個

[B.]兩個

[C1三個

[D.]四個

【答案】C

109

三維的數(shù)據(jù)立方體看作是一組類似的互相拄加起來的()?

[A.]一維表格

[B.J二維表格

[C1三維表格

[D.]四維表格

【答案】B

110

【答案】c

111

維數(shù)災(zāi)難通常是指在涉及()計算的問題中,隨著維數(shù)的增加?計算量呈指數(shù)倍增長的一

種現(xiàn)象。

[A.]數(shù)字

[B.]文本

[C]向量

[D.]矩陣

【答案】C

112

下列不屬于維數(shù)災(zāi)難問題的特點()?

[A.]計算量巨大

[B.]成本降低

[C]結(jié)果不理想

[D.]無法反映數(shù)據(jù)的本質(zhì)特征

【答案】B

113

下列不屬于數(shù)據(jù)約簡的特點()?

[A.]計算量巨大

(B.)成本降低

[C1較少存儲量

[D.]方便分類

【答案】A

114

下列不屬于數(shù)據(jù)約簡的分類基準的是()?

[A.]約簡維數(shù)的大小

[B.]成本的大小

[C]數(shù)據(jù)時序

[D,]有無監(jiān)督信息

【答案】B

115

下列不屬于數(shù)據(jù)約簡中有無監(jiān)督信息分類的是()?

[A.]監(jiān)督式維數(shù)約簡

[B.]半監(jiān)督式維數(shù)約簡

[C.J非監(jiān)督式維數(shù)約簡

[D.]混合式維數(shù)約簡

【答案】D

116

下列不屬于無參數(shù)值約簡技術(shù)的是O?

[A.]直方圖

[B.]聚類

[C1選擇

[D.]線性回歸模型

【答案】D

117

下列不屬于信息孤島帶來的問題的是()?

[A.]數(shù)據(jù)不能共享

[B.]冗余數(shù)據(jù)

[C1數(shù)據(jù)優(yōu)化

[D.]垃圾數(shù)據(jù)

【答案】C

118

數(shù)據(jù)集成最復(fù)雜和困難的任務(wù)是<)?

[A.]數(shù)據(jù)插補

[B.]數(shù)據(jù)格式轉(zhuǎn)換

[C.1數(shù)據(jù)修改

[DJ冗余數(shù)據(jù)處理

【答案】B

119

下列不屬于數(shù)據(jù)集成的核心問題是O?

[A.J有效性

[B.]異構(gòu)性

[C1分布性

[D.]自治性

【答案】A

120

下列不屬于數(shù)據(jù)集成的構(gòu)成方式的是()?

[A.]聯(lián)邦數(shù)據(jù)庫集成模式

[B.]中間件集成模式

[C1數(shù)據(jù)倉庫集成模式

【D.】地區(qū)數(shù)據(jù)庫集成模式

【答案】D

121

大數(shù)據(jù)需要分析的是()?

[A.]發(fā)展趨勢

[B.J發(fā)展現(xiàn)狀

[C1發(fā)展模式

[D.]發(fā)展制度

【答案】A

122

大數(shù)據(jù)分析的核心是()?

[A.]數(shù)據(jù)收集

[B.]數(shù)據(jù)管理

[C1數(shù)據(jù)挖掘

[D.]數(shù)據(jù)交易

【答案】C

123

下列不屬于數(shù)據(jù)挖掘的特點的是<)?

[A.]數(shù)據(jù)量大

[B.]目標清晰

[C.1處理不同類型的數(shù)據(jù)

[D.]結(jié)果不易解釋

【答案】B

124

下列屬于數(shù)據(jù)分析的特點的是()?

(A.l數(shù)據(jù)量大

[B.]目標不清晰

[C.1處理不同類型的數(shù)據(jù)

[D.]結(jié)果不易解釋

【答案】A

125

從分析的結(jié)果上看,大數(shù)據(jù)分析主要分為()?

[A.]探索性數(shù)據(jù)分析、證實性數(shù)據(jù)分析、定性數(shù)據(jù)分析

[B.]證實性數(shù)據(jù)分析、定性數(shù)據(jù)分析、離線數(shù)據(jù)分析

[C.1探索性數(shù)據(jù)分析、定性數(shù)據(jù)分析、離線數(shù)據(jù)分析

[D.]探索性數(shù)據(jù)分析、證實性數(shù)據(jù)分析、離線數(shù)據(jù)分析

【答案】A

126

從分析方式上看,大數(shù)據(jù)分析主要分為()?

[A.]在線數(shù)據(jù)分析、離線數(shù)據(jù)分析、交互式數(shù)據(jù)分析

[B.J交互式數(shù)據(jù)分析、在線數(shù)據(jù)分析、定性數(shù)據(jù)分析

[C1定性數(shù)據(jù)分析、離線數(shù)據(jù)分析、交互式數(shù)據(jù)分析

[D.]離線數(shù)據(jù)分析、在線數(shù)據(jù)分析、定性數(shù)據(jù)分析

【答案】A

127

探索性數(shù)據(jù)分析是基于什么角度來說明數(shù)據(jù)分析方法的()?

[A.]數(shù)據(jù)本身

[B.J數(shù)據(jù)范圍

[C1模型假設(shè)

[D.]統(tǒng)計推斷

【答案】A

128

下列不屬于探索性數(shù)據(jù)分析的特點的是O?

[A.]分離出數(shù)據(jù)的模式

[B.]分離出數(shù)據(jù)的特點

(C1揭示數(shù)據(jù)對模型的偏離

[D.]計算模型對數(shù)據(jù)的擬合度

【答案】D

129

下列不屬于探索性數(shù)據(jù)分析的內(nèi)容的是()?

[A.J檢查數(shù)據(jù)錯誤

[B.]填補數(shù)據(jù)缺失

[C1獲取數(shù)據(jù)分布特征

[D.]觀察數(shù)據(jù)規(guī)律

【答案】B

130

下列不屬于數(shù)據(jù)位置特征的是O?

[A.]均值

[B.]中位數(shù)

[C.1方差

[D.]四分位數(shù)

【答案】C

131

下列不屬于數(shù)據(jù)分散性特征的是O?

[A.]均值

【B.】極差

[C1方差

[D,]變異系數(shù)

【答案】A

132

統(tǒng)計學(xué)是收集、分析、表述和O的科學(xué)?

[A.]整理數(shù)據(jù)

[B.]計算數(shù)據(jù)

[CJ填補數(shù)據(jù)

[D.]解釋數(shù)據(jù)

【答案】D

133

統(tǒng)計的基礎(chǔ)是()?

[A.]統(tǒng)計工作

[B.]計算數(shù)據(jù)

[C1統(tǒng)計數(shù)據(jù)

[D.]統(tǒng)計科學(xué)

【答案】A

134

下列不屬于模型的組成的是()?

[A.]目標

[B.]數(shù)據(jù)

[C1變量

[D.]關(guān)系

【答案】B

135

下列不屬于相關(guān)系數(shù)的是<)?

[A.]簡單相關(guān)系數(shù)

[B.]復(fù)相關(guān)系數(shù)

[C1典型相關(guān)系數(shù)

[D.J常態(tài)相關(guān)系數(shù)

【答案】D

136

下列不屬于相關(guān)分析的是()?

[A.]線性相關(guān)分析

[B.]復(fù)相關(guān)分析

【C.】偏相關(guān)分析

(D.]距離分析

【答案】B

137

下列不屬于回歸分析的步驟的是<)?

[A.]確定自變量與因變量

[B.]對變量進行分類

[C,J根據(jù)變量進行回歸建模

[D.]模型檢驗

【答案】B

138

下列不屬于回歸分析的類別的是<)?

[A.]一元回歸分析

[B.]二元回歸分析

[C1多元回歸分析

[D.]線性回歸分析

【答案】B

139

下列不屬于判別分析的類別的是()?

[A.]兩組判別法

[B.]多組判別法

[C1逐步判別法

[D.]面積判別法

【答案】D

140

下列不屬于判別方法的是<)?

[A.]最大似然法

[B.]最小二乘法

[C.1距離判別法

【D.】貝葉斯判別法

【答案】B

141

Z分數(shù)規(guī)范化方法中,下列可以替換標準差的是()?

[A.J均值

[B.]方差

[C1極差

[D.]平均值絕對偏差

【答案】D

142

下列不屬于確定樣本子集大小的因素的是()?

[A.1計算成本

[B.]存儲要求

[C1估計量的范用

CD.)估計量的精度

【答案】C

二、判斷題

1

計算機科學(xué)是算法與算法變換的科學(xué)。()

[A.]V

[B.]x

【答案】A

計算機科學(xué)是算法與算法變換的科學(xué)。

2

數(shù)據(jù)科學(xué)是通過科學(xué)方法探索數(shù)據(jù),以獲得有價值的發(fā)現(xiàn)。O

[A.]V

[B.Jx

【答案】A

數(shù)據(jù)科學(xué)是通過科學(xué)方法探索數(shù)據(jù)?,以獲得有價值的發(fā)現(xiàn)。

3

數(shù)據(jù)科學(xué)的發(fā)展不僅可以推動學(xué)科的發(fā)展,而且能夠助推相關(guān)產(chǎn)業(yè)的發(fā)展與進步。O

[A.]V

[B.]x

【答案】A

數(shù)據(jù)科學(xué)的發(fā)展不僅可以推動數(shù)學(xué)、計算機科學(xué)、人工智能、統(tǒng)計學(xué)、天體信息學(xué)、生物

信息學(xué)、計算社會學(xué)等學(xué)科的發(fā)展,而且能夠大力助推相關(guān)產(chǎn)業(yè)的發(fā)展與進步。

4

數(shù)據(jù)科學(xué)家不需要具備計算機科學(xué)、統(tǒng)計學(xué)的知識和應(yīng)用領(lǐng)域的行業(yè)經(jīng)驗。()

[A.]V

[B.]x

【答案】B

數(shù)據(jù)科學(xué)家需要具備計算機科學(xué)、統(tǒng)計學(xué)的知識和應(yīng)用領(lǐng)域的亍業(yè)經(jīng)驗。

Cyber空間是指以計算機技術(shù)、現(xiàn)代通信網(wǎng)絡(luò)技術(shù)、虛擬現(xiàn)實技術(shù)等信息技術(shù)的綜合運用

為基礎(chǔ),以知識和信息為內(nèi)容的新型空間。()

[A.]V

[B.]x

【答案】A

Cyber空間是指以計算機技術(shù)、現(xiàn)代通信網(wǎng)絡(luò)技術(shù)、虛擬現(xiàn)實技術(shù)等信息技術(shù)的綜合運用

為基礎(chǔ),以知識和信息為內(nèi)容的新型空間。

數(shù)據(jù)能夠記錄人類的行為,包括工作、生活和社會的發(fā)展。()

[A.]V

[B.]x

【答案】A

數(shù)據(jù)能夠記錄人類的行為,包括工作、生活和社會的發(fā)展。

研究數(shù)據(jù)僅僅包括數(shù)據(jù)采集和數(shù)據(jù)分析。()

[A.]V

[B.]x

【答案】B

研究數(shù)據(jù)主要包括數(shù)據(jù)采集、數(shù)據(jù)存儲和數(shù)據(jù)分析。

數(shù)據(jù)加工與傳統(tǒng)數(shù)據(jù)處理的不同之處在于,其更加強調(diào)數(shù)據(jù)處理中的增值過程。()

[A.]V

[B.]x

【答案】A

數(shù)據(jù)加工與傳統(tǒng)數(shù)據(jù)處理的不同之處在于,其更加強調(diào)數(shù)據(jù)處理中的增值過程。

大數(shù)據(jù)只來自互聯(lián)網(wǎng)世界。()

[A.]V

[B.]X

【答案】B

大數(shù)據(jù)主要來自互聯(lián)網(wǎng)世界與物理世界。

10

數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。()

[A.]J

[B.]X

【答案】A

數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。

11

網(wǎng)頁數(shù)據(jù)是?種半結(jié)構(gòu)化數(shù)據(jù)。()

[A.]V

[B.]X

【答案】A

網(wǎng)頁數(shù)據(jù)就是一種典型的半結(jié)構(gòu)化數(shù)據(jù)。

12

批量計算是一種在線計算,支持海量作業(yè)并發(fā)規(guī)模,系統(tǒng)自動完成資源管理、作業(yè)調(diào)度和

數(shù)據(jù)加載,并按實際使用量計費。<)

[A.]J

[B.]X

【答案】B

批量計算是一種離線計和。

13

靜態(tài)數(shù)據(jù)是流式數(shù)據(jù)。O

[A.]J

[B.]X

【答案】B

靜態(tài)數(shù)據(jù)不是流式數(shù)據(jù)。

14

流式計鳧適用于無須先存儲,可以直接進行數(shù)據(jù)計算,實時性要求很嚴格,但對數(shù)據(jù)的精

確度要求較寬松的應(yīng)用場景。()

[A.]J

[B.JX

【答案】A

流式計算適用于無須先存儲,可以直接進行數(shù)據(jù)計算,實時性要求很嚴格,但對數(shù)據(jù)的精

確度要求較寬松的應(yīng)用場景。

15

實時計算系統(tǒng)的設(shè)計需要考慮高延遲、高性能、分布式、可擴展、高容錯。()

[A.]V

[B.]X

【答案】B

實時計和系統(tǒng)的設(shè)計需要考慮低延遲、高性能、分布式、可擴展、高容錯。

16

流式查詢主要有兩種方式,一種是指定查詢,另一種是即席查狗。O

[A.]V

[B.]X

【答案】A

流式查詢主要有兩種方式,一種是指定查詢,另一種是即席查洵。

17

流式數(shù)據(jù)的處理是批量處理。()

[A.]V

[B.]X

【答案】B

流式數(shù)據(jù)的處理也是連續(xù)處理,而不是批量處理。

18

流式計算不宜用持久穩(wěn)定關(guān)系建模,而適用瞬態(tài)數(shù)據(jù)流建模。()

[A.]J

[B.]X

【答案】A

流式計算不宜用持久穩(wěn)定關(guān)系建模,而適用瞬態(tài)數(shù)據(jù)流建模。

19

為了更有效地處理數(shù)據(jù),應(yīng)該盡可能地限制靜態(tài)數(shù)據(jù)。O

[A.]J

[B.]X

【答案】A

為了有效地處理數(shù)據(jù),人們應(yīng)該盡可能地限制靜態(tài)數(shù)據(jù)。

20

大數(shù)據(jù)的無序性是指各數(shù)據(jù)流之間無序,而同一數(shù)據(jù)流內(nèi)部各數(shù)據(jù)元素之間是有序的。()

[A.]J

[B.]X

【答案】B

大數(shù)據(jù)的無序性是指各數(shù)據(jù)流之間無序,而同一數(shù)據(jù)流內(nèi)部各數(shù)據(jù)元素之間也無序。

21

MapReduce由Map和Reduce兩個階段組成,用戶只需要編寫Map和Reduce兩個函數(shù)就可

以完成簡單的分布式程序的設(shè)計。<)

[A.]V

[B.]X

【答案】A

MapReduce由Map和Reduce兩個階段組成,用戶只需要編寫Map和Reduce兩個函數(shù)就可

以完成簡單的分布式程序的設(shè)計。

22

Map相對獨立且并行運行,對存儲系統(tǒng)中的文件按列處理,并產(chǎn)生鍵值對。()

[A.]V

[B.]X

【答案】B

M叩相對獨立且并行運行,對存儲系統(tǒng)中的文件按行處理,并產(chǎn)生鍵值對。

23

在Hadoop中,將每一次計兜清求稱為一個作業(yè)。()

[A.]V

[B.JX

【答案】A

在Hadoop中,將每一次計算請求稱為一個作業(yè)。

24

馬分布式文件系統(tǒng)相比,MapReduce框架可定制性強。()

[A.]J

[B.]X

【答案】A

與分布式文件系統(tǒng)相比,MapReduce框架還有一個特點就是可定制性強。

25

通常一個作業(yè)的輸入都是基于分布式文件系統(tǒng)的文件,而對于一個Map任務(wù)而言,它的輸

入是輸入文件的一個數(shù)據(jù)塊,或者是數(shù)據(jù)塊的一部分,也可跨越數(shù)據(jù)塊。()

[A.]J

[B.JX

【答案】B

通常一個作業(yè)的輸入都是基于分布式文件系統(tǒng)的文件,而對于一個Map任務(wù)而言,它的輸

入是輸入文件的一個數(shù)據(jù)塊,或者是數(shù)據(jù)塊的一部分,但通常不跨越數(shù)據(jù)塊。

26

Reduce任務(wù)與Map任務(wù)的最大不同是Map任務(wù)的文件都存儲「本地,而Reduce任務(wù)需要

到多處采集。O

[A.]V

[B.]X

【答案】A

Reduce任務(wù)與Map任務(wù)的最大不同是Map任務(wù)的文件都存儲于木地,而Reduce任務(wù)需要

到多處采集。

27

MapReduce模型適用場景的特點是任務(wù)可被分解成相互聯(lián)系的子問題。()

[A.]V

[B.]X

【答案】B

M叩Reduce模型適用場景的特點是任務(wù)可被分解成相互獨立的子問題。

28

可視分析是一種獨立式的圖形用戶界面模型。()

[A.]V

[B.JX

【答案】B

可視分析是一種交互式的圖形用戶界面模型。

29

在單詞計數(shù)的Map過程中需要將文件進行按列分割。()

[A.]J

[B.]X

【答案】B

在單詞計數(shù)的Map過程中需要將文件進行按行分割。

30

在單詞計數(shù)中,Reduce方法的輸入?yún)?shù)key為單個單詞,而value是由各Mapper?類上對應(yīng)

單詞的計數(shù)值所組成的列表,所以只要遍歷value并求和,即可得到某個單詞出現(xiàn)的總次

數(shù)。()

[A.]J

[B.JX

【答案】A

在單詞計數(shù)中,Reduce方法的輸入?yún)?shù)key為單個單詞,而value是由各Mapper類上對應(yīng)

單詞的計數(shù)值所組成的列表,所以只要遍歷value并求和,即可得到某個單詞出現(xiàn)的總次

數(shù)。

31

WordCount完成的功能是統(tǒng)計輸入文件中的每個單詞出現(xiàn)的頻率()

[A.]V

[B.]X

【答案】B

WordCount完成的功能是統(tǒng)計輸入文件中的每個單詞出現(xiàn)的次數(shù)。

32

在MapReduce程序執(zhí)行過程中,用戶程序中的MapReduce類庫首先將輸入文檔進行分

割,用戶也可以通過設(shè)置參數(shù)對■其大小進行控制()

[A.]J

[B.]X

【答案】A

在MapReduce程序執(zhí)行過程中,用戶程序中的MapReduce類庫首先將輸入文檔進行分

割,用戶也可以通過設(shè)置參數(shù)對其大小進行控制。

33

在MapReduce程序執(zhí)行過程中,由Master負責分配任務(wù),分配的原則是Master選擇空閑

的Worker并為其分配一個Mwp任務(wù)或一個Reduce任務(wù)()

[A.]V

[B.]X

【答案】A

在MapReduce程序執(zhí)行過程中,由Master負責分配任務(wù),分配的原則是Master選擇空閑

的Worker并為其分配一個Map任務(wù)或一個Reduce任務(wù)。

34

網(wǎng)站外部數(shù)據(jù)主要包括互聯(lián)網(wǎng)環(huán)境數(shù)據(jù)、競爭對手數(shù)據(jù)、合作;火伴數(shù)據(jù)和用戶數(shù)據(jù)等。O

[A.]J

[B.]X

【答案】A

網(wǎng)站外部數(shù)據(jù)主要包括互聯(lián)網(wǎng)環(huán)境數(shù)據(jù)、競爭對手數(shù)據(jù)、合作;火伴數(shù)據(jù)和用戶數(shù)據(jù)等。

35

在MapReduce程序執(zhí)行過程中,Map和Reduce函數(shù)接收的都是鍵值對。()

[A.]J

[B.]X

【答案】A

在MapReduce程序執(zhí)行過程中,Map和Reduce函數(shù)接收的都是鍵值對。

36

MapReduce模型通過將數(shù)據(jù)箕的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的各節(jié)點,每個節(jié)點將已完成的

工作和狀態(tài)更新,周期性地報告給Worker。()

[A.]J

[B.]X

【答案】B

MapReduce模型通過將數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的各‘6點,每個門點將已完成的

工作和狀態(tài)更新,周期性地報告給Master。

37

MapReduce的基本原理就是將大數(shù)據(jù)分成小塊逐個分析,最后將提取出來的數(shù)據(jù)匯總分

析,進而獲得需要的結(jié)果。()

[A.]V

[B.]X

【答案】A

MapReduce的基木原理就是闿大數(shù)據(jù)分成小塊逐個分析,最后將提取出來的數(shù)據(jù)匯總分

析,進而獲得需要的結(jié)果。

38

MapReduce模型中,Map針對每一個輸入元素都要生成一個輸出元素,Reduce針對每一個

輸入列表都要生成一個輸出元素。()

[A.]J

[B.]X

【答案】A

MapReduce模型中,Map針對每一個輸入元素都要生成一個輸出元素,Reduce針對每一個

輸入列表都要生成一個輸出元素。

39

通常情況下如果集群的規(guī)模在白個節(jié)點以上,MapReduce的速度可以和節(jié)點的數(shù)目成正

比。()

[A.]V

[B.]X

【答案】A

通常情況卜.如果集群的規(guī)模在百個節(jié)點以上,MapReduce的速度可以和節(jié)點的數(shù)目成正

比。

40

由于集群模式和單節(jié)點模式運行Hadoop系統(tǒng)都需要使用SSH登錄,因此在安裝Hadoop系

統(tǒng)之前,首先需要安裝配置SSH協(xié)議。()

[A.]V

[B.]X

【答案】A

由于集群模式和單節(jié)點模式運行Hadoop系統(tǒng)都需要使用SSH登錄,因此在安裝Hadoop系

統(tǒng)之前,首先需要安裝配置SSH協(xié)議。

41

獲取的數(shù)據(jù)是指已被轉(zhuǎn)換為電信號的各種物理量,如溫度、水,立、風速、壓力等。()

[A.]J

[B.]X

【答案】A

獲取的數(shù)據(jù)是指已被轉(zhuǎn)換為電信號的各種物理量,如溫度、水位、風速、壓力等。

42

大數(shù)據(jù)的獲取要避免重復(fù)數(shù)據(jù)。()

[A.]J

[B.]X

【答案】A

大數(shù)據(jù)的獲取要避免重復(fù)數(shù)據(jù)。

43

在互聯(lián)網(wǎng)營銷中,用戶反饋承擔的核心任務(wù)是為產(chǎn)品收集用戶輿情信息。<)

[A.]V

[B.JX

【答案】A

在互聯(lián)網(wǎng)營銷中,用戶反饋承擔的核心任務(wù)是為產(chǎn)品收集用戶輿情信息。

44

圖像數(shù)字化是進行數(shù)字圖像處理的前提。()

[A.]J

[B.]X

【答案】A

圖像數(shù)字化是進行數(shù)字圖像處理的前提。

45

圖像數(shù)字化是將連續(xù)色調(diào)的模擬圖像經(jīng)采樣量化后轉(zhuǎn)換成數(shù)字影像的過程。()

[A.]V

[B.]X

【答案】A

圖像數(shù)字化是將連續(xù)色調(diào)的模擬圖像經(jīng)采樣量化后轉(zhuǎn)換成數(shù)字影像的過程。

46

圖像信息獲取的方法只有掃描技術(shù)。<)

[A.]V

[B.]X

【答案】B

圖像信息獲取的主要方法是掃描技術(shù),另種方法是直接運用數(shù)字攝影技術(shù)。

47

圖形數(shù)字化是將圖形的連續(xù)模擬量轉(zhuǎn)換成離散的數(shù)字量的過程.()

[A.]V

[B.]X

【答案】A

圖形數(shù)字化是將圖形的連續(xù)模擬量轉(zhuǎn)換成離散的數(shù)字量的過程.

48

空間數(shù)據(jù)是一種用點、線、面以及實體等基本空間數(shù)據(jù)結(jié)構(gòu)來表示自然世界的數(shù)據(jù)。()

[A.]J

[B.]X

【答案】A

空間數(shù)據(jù)是一種用點、線、面以及實體等基本空間數(shù)據(jù)結(jié)構(gòu)來表示自然世界的數(shù)據(jù)。

49

空間數(shù)據(jù)的獲取不包括對多媒體數(shù)據(jù)進行獲取。()

[A.]J

[B.]X

【答案】B

空間數(shù)據(jù)獲取的任務(wù)包括對地圖數(shù)據(jù)、野外實測數(shù)據(jù)、空間定位數(shù)據(jù)、攝影測量與遙感圖

像、多媒體數(shù)據(jù)等進行獲取。

50

網(wǎng)站內(nèi)部數(shù)據(jù)是網(wǎng)站最容易獲取的數(shù)據(jù),其通常存放在網(wǎng)站的文件系統(tǒng)或數(shù)據(jù)庫中,也是

與網(wǎng)站自身最為密切相關(guān)的數(shù)據(jù),是網(wǎng)站分析最常用的數(shù)據(jù)來源。()

[A.]J

[B.]X

【答案】A

網(wǎng)站內(nèi)部數(shù)據(jù)是網(wǎng)站最容易獲取的數(shù)據(jù),其通常存放在網(wǎng)站的文件系統(tǒng)或數(shù)據(jù)庫中,也是

與網(wǎng)站自身最為密切相關(guān)的數(shù)據(jù),是網(wǎng)站分析最常用的數(shù)據(jù)來源。

51

網(wǎng)站數(shù)據(jù)采集只是將網(wǎng)站上的結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁中提取出來,并將其存儲到統(tǒng)一的本地數(shù)

據(jù)文件中。O

[A.]V

[B.]X

【答案】B

網(wǎng)站數(shù)據(jù)采集是將網(wǎng)站上的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁中提取出

來,并將其存儲到統(tǒng)一的本地數(shù)據(jù)文件中。

52

網(wǎng)絡(luò)爬蟲的過程主要分為獲取網(wǎng)頁、解析網(wǎng)頁和存儲數(shù)據(jù)三部分,其是按照一定的獲取網(wǎng)

頁規(guī)則,自動地抓取互聯(lián)網(wǎng)數(shù)據(jù)的軟件。()

[A.]J

[B.]X

【答案】A

網(wǎng)絡(luò)爬蟲的過程主要分為獲雙網(wǎng)頁、解析網(wǎng)頁和存儲數(shù)據(jù)三部分,其是按照一定的獲取網(wǎng)

頁規(guī)則,自動地抓取互聯(lián)網(wǎng)數(shù)據(jù)的軟件。

53

網(wǎng)絡(luò)爬蟲可以分為通用網(wǎng)絡(luò)爬蟲、聚焦網(wǎng)絡(luò)爬蟲、增量式網(wǎng)絡(luò)爬蟲、深層網(wǎng)絡(luò)爬蟲等。()

[A.]J

[B.]X

【答案】A

網(wǎng)絡(luò)爬蟲可以分為通用網(wǎng)絡(luò)爬蟲、聚焦網(wǎng)絡(luò)爬蟲、增量式網(wǎng)絡(luò)爬蟲、深層網(wǎng)絡(luò)爬蟲等。

54

網(wǎng)絡(luò)爬蟲從一個或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程

中,不斷從當前頁面上抽取新的URL放入隊列,直到滿足系統(tǒng)的停止條件為止。()

[A.]J

[B.]X

【答案】A

網(wǎng)絡(luò)爬蟲從一個或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程

中,不斷從當前頁面上抽取新的URL放入隊列,直到滿足系統(tǒng)的停止條件為止。

55

通用網(wǎng)絡(luò)爬蟲又稱為全網(wǎng)爬蟲,其可將爬行對象從一些種子URL擴充到整個Web,主要為

門戶站點搜索引擎和大型Web服務(wù)采集數(shù)據(jù)。()

[A.]V

[B.]X

【答案】A

通用網(wǎng)絡(luò)爬蟲又稱為全網(wǎng)爬蟲,其可將爬行對象從一些種子URL擴充到整個Web,主要為

門戶站點搜索引擎和大型Web服務(wù)采集數(shù)據(jù)。

56

網(wǎng)頁的爬行策略可以分為深度優(yōu)先搜索策略、廣度優(yōu)先搜索策略、最佳優(yōu)先搜索策略和反

向鏈接數(shù)搜索策略,其中深度優(yōu)先搜索策略是域常使用的方法.()

[A.]J

[B.]X

【答案】B

網(wǎng)頁的爬行策略可以分為深度優(yōu)先搜索策略、廣度優(yōu)先搜索策略、最佳優(yōu)先搜索策略和反

向鏈接數(shù)搜索策略,其中廣度優(yōu)先搜索策略和最佳優(yōu)先搜索策咯是經(jīng)常使用的方法。

57

聚焦網(wǎng)絡(luò)爬蟲又稱為主題爬蟲,是面向特定主題的一種網(wǎng)絡(luò)爬蟲程序。()

[A.]V

[B.JX

【答案】A

聚焦網(wǎng)絡(luò)爬蟲又稱為主題爬蟲,是而向特定主題的一種網(wǎng)絡(luò)爬蟲程序。

58

聚焦網(wǎng)絡(luò)爬蟲與通用網(wǎng)絡(luò)爬蟲的區(qū)別之處在于聚焦網(wǎng)絡(luò)爬蟲在實施網(wǎng)頁抓取時要進行主題

篩選,盡量保證只抓取與主題相關(guān)的網(wǎng)頁信息。()

[A.]V

[B.]X

【答案】A

聚焦網(wǎng)絡(luò)爬蟲與通用網(wǎng)絡(luò)爬蟲的區(qū)別之處在于聚焦網(wǎng)絡(luò)爬蟲在實施網(wǎng)頁抓取時要進行主題

篩選,盡量保證只抓取與主題相關(guān)的網(wǎng)頁信息。

59

網(wǎng)頁分析算法可以歸納為基于網(wǎng)絡(luò)拓撲、基于網(wǎng)頁內(nèi)容和基于用戶訪問行為三種類型。()

[A.]J

[B.JX

【答案】A

網(wǎng)頁分析算法可以歸納為基于網(wǎng)絡(luò)拓撲、基于網(wǎng)頁內(nèi)容和基于用戶訪問行為三種類型。

60

網(wǎng)絡(luò)拓補分析算法是基于網(wǎng)慶之間的鏈接,通過已知的網(wǎng)頁或數(shù)據(jù)對與其有直接或間接鏈

接關(guān)系的對象作出評價的算法,其又分為網(wǎng)頁粒度、網(wǎng)站粒度兩種算法。<)

[A.]V

[B.]X

【答案】B

網(wǎng)絡(luò)拓補分析算法是基于網(wǎng)頁之間的鏈接,通過已知的網(wǎng)頁或數(shù)據(jù)對與其有直接或間接鏈

接關(guān)系的對象作出評價的算法,其又分為網(wǎng)頁粒度、網(wǎng)站粒度以及網(wǎng)頁塊粒度三種冕法。

61

從應(yīng)用的構(gòu)建架構(gòu)角度出發(fā),我們可以將數(shù)據(jù)庫歸納為OldSQL數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫和

NewSQL數(shù)據(jù)庫。()

[A.]J

[B.]X

【答案】A

從應(yīng)用的構(gòu)建架構(gòu)角度出發(fā),我們可以將數(shù)據(jù)庫歸納為OldSQL數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫和

NewSQL數(shù)據(jù)庫。

62

OldSQL數(shù)據(jù)庫是指傳統(tǒng)的關(guān)系數(shù)據(jù)庫,NoSQL數(shù)據(jù)庫是指非結(jié)構(gòu)化數(shù)據(jù)庫,而NewSQL數(shù)

據(jù)庫是介于OldSQL數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫兩者之間的數(shù)據(jù)庫。()

[A.]V

[B.]X

【答案】A

OldSQL數(shù)據(jù)庫是指傳統(tǒng)的關(guān)系數(shù)據(jù)庫,NoSQL數(shù)據(jù)庫是指非結(jié)構(gòu)化數(shù)據(jù)庫,而NewSQL數(shù)

據(jù)庫是介于OldSQL數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫兩者之間的數(shù)據(jù)庫。

63

OldSQL數(shù)據(jù)庫適用于數(shù)據(jù)分析應(yīng)用,NewSQL數(shù)據(jù)庫適用于事務(wù)處理應(yīng)用,NoSQL數(shù)據(jù)庫

適用于互聯(lián)網(wǎng)應(yīng)用。()

[A.]J

[B.JX

【答案】B

OldSQL數(shù)據(jù)庫適用于事務(wù)處理應(yīng)用,NewSQL數(shù)據(jù)庫適用于數(shù)據(jù)分析應(yīng)用,NoSQL數(shù)據(jù)庫

適用于互聯(lián)網(wǎng)應(yīng)用。

64

大數(shù)據(jù)可視分析通過交互可視界面來進行分析、推理和決策,可視分析與各個領(lǐng)域的數(shù)據(jù)

形態(tài)、大小及其應(yīng)用密切相關(guān)。()

[A.]J

[B.]X

【答案】A

大數(shù)據(jù)可視分析通過交互可視界面來進行分析、推理和決策,可視分析與各個領(lǐng)域的數(shù)據(jù)

形態(tài)、大小及其應(yīng)用密切相關(guān)。

65

NoSQL主要指非關(guān)系型、分布式、不提供ACID特性的數(shù)據(jù)庫設(shè)計模式。()

[A.]J

[B.]X

【答案】A

NoSQL主要指非關(guān)系型、分布式、不提供ACID特性的數(shù)據(jù)庫設(shè)計模式。

66

NoSQL數(shù)據(jù)庫代表了--系列的、不同類型的相互關(guān)聯(lián)的數(shù)據(jù)存造與處理的技術(shù)的集合。()

[A.]J

[B.]X

【答案】A

NOSQL數(shù)據(jù)庫代表了一系列的、不同類型的相互關(guān)聯(lián)的數(shù)據(jù)存楮與處理的技術(shù)的集合。

67

NoSQL數(shù)據(jù)庫與SQL數(shù)據(jù)庫顯著的區(qū)別是NoSQL數(shù)據(jù)庫不使隹SQL作為查詢語言,其數(shù)據(jù)

存儲不使用固定的表格模式,具有橫向可擴展性的特征。()

[A.]J

[B.]X

【答案】A

NoSQL數(shù)據(jù)庫與SQL數(shù)據(jù)庫顯著的區(qū)別是NoSQL數(shù)據(jù)庫不使外SQL作為查詢語言,其數(shù)據(jù)

存儲不使用固定的表格模式,具有橫向可擴展性的特征。

68

NewSQL數(shù)據(jù)庫是指各種新型的可擴展/高性能數(shù)據(jù)庫,這類數(shù)據(jù)庫不僅具有NoSQL數(shù)據(jù)

庫對海量數(shù)據(jù)的存儲管理能力,還保持了傳統(tǒng)數(shù)據(jù)庫的ACID和SQL等特性。()

[A.]V

[B.]X

【答案】A

NewSQL數(shù)據(jù)庫是指各種新型的可擴展/高性能數(shù)據(jù)庫,這類數(shù)據(jù)庫不僅具有NoSQL數(shù)據(jù)

庫對海量數(shù)據(jù)的存儲管理能力,還保持了傳統(tǒng)數(shù)據(jù)庫的ACID和SQL等特性。

69

在大數(shù)據(jù)抽取之前,無需清楚數(shù)據(jù)源的類型和數(shù)據(jù)的類型,可直接抽取。<)

[A.]V

[B.]X

【答案】B

在大數(shù)據(jù)抽取之前,需要清楚數(shù)據(jù)源的類型和數(shù)據(jù)的類型。

70

增量數(shù)據(jù)抽取機制能夠?qū)I(yè)務(wù)系統(tǒng)中的變化數(shù)據(jù)按一定的頻率準確地捕獲到,同時不能對

業(yè)務(wù)系統(tǒng)造成太大的壓力,也不能影響現(xiàn)有業(yè)務(wù)。相對全量數(shù)據(jù)抽取,增量數(shù)據(jù)抽取的設(shè)

計更簡單。()

[A.]J

[B.]X

【答案】B

增量數(shù)據(jù)抽取機制能夠?qū)I(yè)務(wù)系統(tǒng)中的變化數(shù)據(jù)按一定的頻率準確地捕獲到,同時不能對

業(yè)務(wù)系統(tǒng)造成太大的壓力,也不能影響現(xiàn)有業(yè)務(wù)。相對全量數(shù)據(jù)抽取,增量數(shù)據(jù)抽取的設(shè)

計更好雜。

71

時間戳是能表示一份數(shù)據(jù)在某個特定時間之前已經(jīng)存在的、完整的、可驗證的一個數(shù)據(jù),

其通常是一個字符序列,唯一標識某一刻的時間。<)

[A.]V

[B.]X

【答案】A

時間戳是能表示一份數(shù)據(jù)在某個特定時間之前已經(jīng)存在的、完整的、可驗證的?個數(shù)據(jù),

其通常是一個字符序列,唯一標識某一刻的時間。

72

使用基于時間戳的增量數(shù)據(jù)抽取方式進行數(shù)據(jù)抽取時,系統(tǒng)通過比較上次抽取時間與時間

戳字段的值來決定抽取的數(shù)據(jù)。()

[A.]J

[B.]X

【答案】A

使用基于時間瞰的增量數(shù)據(jù)抽取方式進行數(shù)據(jù)抽取時,系統(tǒng)通過比較上次抽取時間與時間

戳字段的值來決定抽取的數(shù)據(jù)。

73

時間戳方式的優(yōu)點是性能優(yōu)弁,系統(tǒng)設(shè)計清晰,數(shù)據(jù)抽取相對復(fù)雜,可以實現(xiàn)數(shù)據(jù)的遞增

加載。()

[A.]V

[B.]X

【答案】B

時間戳方式的優(yōu)點是性能優(yōu)異,系統(tǒng)設(shè)計清晰,數(shù)據(jù)抽取相對簡單,可以實現(xiàn)數(shù)據(jù)的遞增

加載。

74

數(shù)據(jù)清洗是數(shù)據(jù)預(yù)處理的重要部分,其主要工作是檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性,對

其中的噪聲數(shù)據(jù)進行平滑,對丟失的數(shù)據(jù)進行填補,以及對重縣的數(shù)據(jù)進行消除等。()

[A.]V

[B.]X

【答案】A

數(shù)據(jù)清洗是數(shù)據(jù)預(yù)處理的重要部分,其主要工作是檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性,對

其中的噪聲數(shù)據(jù)進行平滑,對丟失的數(shù)據(jù)進行填補,以及對重要的數(shù)據(jù)進行消除等。

75

準確性、完整性、一致性和及時性稱為數(shù)據(jù)質(zhì)量的四要素。()

[A.]J

[B.]X

【答案】A

我們利用準確性、完整性、一致性和及時性來描述數(shù)據(jù)質(zhì)量,通常將其稱為數(shù)據(jù)質(zhì)量的四

要素。

76

數(shù)據(jù)清洗的目的是消除臟數(shù)據(jù),主要消除異常數(shù)據(jù)、清除重復(fù)數(shù)據(jù)、保證數(shù)據(jù)的完整性

等,進而提高數(shù)據(jù)的可利用性。O

[A.]V

[B.JX

【答案】A

數(shù)據(jù)清洗的目的是消除臟數(shù)據(jù),主要消除異常數(shù)據(jù)、清除重豆數(shù)據(jù)、保證數(shù)據(jù)的完整性

等,進而提高數(shù)據(jù)的可利用性。

77

數(shù)據(jù)清洗的過程是指通過分析臟數(shù)據(jù)產(chǎn)生的原因和存在形式,構(gòu)件數(shù)據(jù)清洗的模型和算法

來完成對臟數(shù)據(jù)的清除,進而實現(xiàn)將不符合要求的數(shù)據(jù)轉(zhuǎn)化成滿足數(shù)據(jù)應(yīng)用要求的數(shù)據(jù),

為數(shù)據(jù)分析與建模建立基礎(chǔ)。()

[A.]J

[B.JX

【答案】A

數(shù)據(jù)清洗的過程是指通過分析臟數(shù)據(jù)產(chǎn)生的原因和存在形式,構(gòu)建數(shù)據(jù)清洗的模型和算法

來完成對臟數(shù)據(jù)的清除,進而實現(xiàn)將不符合要求的數(shù)據(jù)轉(zhuǎn)化成滿足數(shù)據(jù)應(yīng)用要求的數(shù)據(jù),

為數(shù)據(jù)分析與建模建立基礎(chǔ)。

78

數(shù)據(jù)清洗的標準只包含返回率和精確度兩個方面。()

[A.lV

[B.]X

【答案】B

數(shù)據(jù)清洗的衡量標準包括返回率、錯誤返回率、精確度。

79

k-NN近鄰缺失數(shù)據(jù)填充嵬法是一種簡單快速的齊法,它利用本身具有完整記錄的屬性值實

現(xiàn)對缺失屬性值的估計。<)

[A.]V

[B.]X

【答案】A

k-NN近鄰缺火數(shù)據(jù)填充算法是一種簡單快速的算法,它利用木身具有完整記錄的屬性值實

現(xiàn)對缺失屬性值的估計。

80

聚類就是將數(shù)據(jù)集分組為多個類或簇,在同一個簇中的數(shù)據(jù)對象(記錄)之間具有較高的

相似度,而不同簇中的對象差別不大。()

[A.]J

[B.]X

【答案】B

聚類就是將數(shù)據(jù)集分組為多個類或簇,在同一個簇中的數(shù)據(jù)對象(記錄)之間具有較高的

相似度,而不同簇中的對象差別就比較大。

81

數(shù)據(jù)轉(zhuǎn)換可將原始數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)分析的形式,如果數(shù)據(jù)轉(zhuǎn)換處理不當,將嚴重扭曲

數(shù)據(jù)本身的內(nèi)涵,改變數(shù)據(jù)原本的形態(tài)。O

[A.]J

[B.]X

【答案】A

數(shù)據(jù)轉(zhuǎn)換可將原始數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)分析的形式,如果數(shù)據(jù)轉(zhuǎn)換處理不當,將嚴重扭曲

數(shù)據(jù)本身的內(nèi)涵,改變數(shù)據(jù)原本的形態(tài)。

82

對數(shù)轉(zhuǎn)換是將原始數(shù)據(jù)的自然對數(shù)值作為分析數(shù)據(jù),如果原始數(shù)據(jù)中有零,可以在底數(shù)中

加上一個小數(shù)值。()

[A.]V

[B

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論