《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第3版)》期末復(fù)習(xí)題庫(含答案)

上傳人：無*** IP屬地：河北上傳時間：2024-01-03 格式：PDF 頁數(shù)：39 大小：6.57MB 積分：12 舉報 版權(quán)申訴

《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第3版)》期末復(fù)習(xí)題庫(含答案)_第2頁

《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第3版)》期末復(fù)習(xí)題庫(含答案)_第3頁

《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第3版)》期末復(fù)習(xí)題庫(含答案)_第4頁

《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第3版)》期末復(fù)習(xí)題庫(含答案)_第5頁

已閱讀5頁，還剩34頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

第一章大數(shù)據(jù)概述

單選題

1、第一次信息化浪潮主要解決什么問題？B

(A)信息傳輸

(B)信息處理

(C)信息爆炸

(D)信息轉(zhuǎn)換

2、下面哪個選項屬于大數(shù)據(jù)技術(shù)的“數(shù)據(jù)存儲和管理"技術(shù)層面的功能？A

(A)利用分布式文件系統(tǒng)、數(shù)據(jù)倉庫、關(guān)系數(shù)據(jù)庫等實現(xiàn)對結(jié)構(gòu)化、半結(jié)構(gòu)化和非

結(jié)構(gòu)化海量數(shù)據(jù)的存儲和管理

(B)利用分布式并行編程模型和計算框架，結(jié)合機器學(xué)習(xí)和數(shù)據(jù)挖掘算法，實現(xiàn)對

海量數(shù)據(jù)的處理和分析

(C)構(gòu)建隱私數(shù)據(jù)保護體系和數(shù)據(jù)安全體系，有效保護個人隱私和數(shù)據(jù)安全

(D)把實時采集的數(shù)據(jù)作為流計算系統(tǒng)的輸入，進行實時處理分析

3、在大數(shù)據(jù)的計算模式中，流計算解決的是什么問題？D

(A)針對大規(guī)模數(shù)據(jù)的批量處理

(B)針對大規(guī)模圖結(jié)構(gòu)數(shù)據(jù)的處理

(C)大規(guī)模數(shù)據(jù)的存儲管理和查詢分析

(D)針對流數(shù)據(jù)的實時計算

4、大數(shù)據(jù)產(chǎn)業(yè)指什么？A

(A)一切與支撐大數(shù)據(jù)組織管理和價值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟活動的集合

(B)提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)

(C)提供數(shù)據(jù)分享平臺、數(shù)據(jù)分析平臺、數(shù)據(jù)租售平臺等服務(wù)的企業(yè)

(D)提供分布式計算、數(shù)據(jù)挖掘、統(tǒng)計分析等服務(wù)的各類企業(yè)

5、下列哪一個不屬于大數(shù)據(jù)產(chǎn)業(yè)的產(chǎn)業(yè)鏈環(huán)節(jié)？A

(A)數(shù)據(jù)循環(huán)層

(B)數(shù)據(jù)源層

(C)數(shù)據(jù)分析層

(D)數(shù)據(jù)應(yīng)用層

6、下列哪一個不屬于第三次信息化浪潮中新興的技術(shù)？A

(A)互聯(lián)網(wǎng)

(B)云計算

(C)大數(shù)據(jù)

(D)物聯(lián)網(wǎng)

7、云計算平臺層(PaaS)指的是什么？A

(A)操作系統(tǒng)和圍繞特定應(yīng)用的必需的服務(wù)

(B)將基礎(chǔ)設(shè)施(計算資源和存儲)作為服務(wù)出租

(C)從一個集中的系統(tǒng)部署軟件，使之在一臺本地計算機上(或從云中遠程地)運行的

一個模型

(D)提供硬件、軟件、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施以及提供咨詢、規(guī)劃和系統(tǒng)集成服務(wù)

8、下面關(guān)于云計算數(shù)據(jù)中心的描述正確的是：A

(A)數(shù)據(jù)中心是云計算的重要載體，為各種平臺和應(yīng)用提供運行支撐環(huán)境

(B)數(shù)據(jù)中心就是放在企業(yè)內(nèi)部的一臺中心服務(wù)器

(C)每個企業(yè)都需要建設(shè)一個云計算數(shù)據(jù)中心

(D)數(shù)據(jù)中心不需要網(wǎng)絡(luò)帶寬的支撐

9、下列哪個不屬于物聯(lián)網(wǎng)的應(yīng)用？D

(A)智能物流

(B)智能安防

(C)環(huán)保監(jiān)測

(D)數(shù)據(jù)清洗

10、下列哪項不屬于大數(shù)據(jù)的發(fā)展歷程？D

(A)成熟期

(B)萌芽期

(C)大規(guī)模應(yīng)用期

(D)迷茫期

多選題

1、第三次信息化浪潮的標(biāo)志是哪些技術(shù)的興起？BCD

(A)個人計算機

(B)物聯(lián)網(wǎng)

(C)云計算

(D)大數(shù)據(jù)

2、信息科技為大數(shù)據(jù)時代提供哪些技術(shù)支撐？ABC

(A)存儲設(shè)備容量不斷增加

(B)網(wǎng)絡(luò)帶寬不斷增加

(C)CPU處理能力大幅提升

(D)數(shù)據(jù)量不斷增大

3、大數(shù)據(jù)具有哪些特點？ABCD

(A)數(shù)據(jù)的“大量化”

(B)數(shù)據(jù)的“快速化”

(C)數(shù)據(jù)的“多樣化”

(D)數(shù)據(jù)的“價值密度比較低”

4、下面哪個屬于大數(shù)據(jù)的應(yīng)用領(lǐng)域？ABCD

(A)智能醫(yī)療研發(fā)

(B)監(jiān)控身體情況

(C)實時掌握交通狀況

(D)金融交易

5、大數(shù)據(jù)的兩個核心技術(shù)是什么？AC

(A)分布式存儲

(B)分布式應(yīng)用

(C)分布式處理

(D)集中式存儲

6、云計算關(guān)鍵技術(shù)包括什么？ABCD

(A)分布式存儲

(B)虛擬化

(C)分布式計算

(D)多租戶

7、云計算的服務(wù)模式和類型主要包括哪三類？ABC

(A)軟件即服務(wù)(SaaS)

(B)平臺即服務(wù)(PaaS)

(C)基礎(chǔ)設(shè)施即服務(wù)(laaS)

(D)數(shù)據(jù)采集即服務(wù)(DaaS)

8、物聯(lián)網(wǎng)主要由下列哪些部分組成的？ABCD

(A)應(yīng)用層

(B)處理層

(C)感知層

(D)網(wǎng)絡(luò)層

9、物聯(lián)網(wǎng)的關(guān)鍵技術(shù)包括哪些？ABC

(A)識別和感知技術(shù)

(B)網(wǎng)絡(luò)與通信技術(shù)

(C)數(shù)據(jù)挖掘與融合技術(shù)

(D)信息處理一體化技術(shù)

10、大數(shù)據(jù)對社會發(fā)展的影響有哪些？ABC

(A)大數(shù)據(jù)成為一種新的決策方式

(B)大數(shù)據(jù)應(yīng)用促進信息技術(shù)與各行業(yè)的深度融合

(C)大數(shù)據(jù)開發(fā)推動新技術(shù)和新應(yīng)用的不斷涌現(xiàn)

(D)大數(shù)據(jù)對社會發(fā)展沒有產(chǎn)生積極影響

第二章大數(shù)據(jù)處理架構(gòu)Hadoop

單選題

1、下列哪個不屬于Hadoop的特性?A

(A)成本高

(B)高可靠性

(C)高容錯性

(D)運行在Linux平臺上

2、Hadoop框架中最核心的設(shè)計是什么？A

(A)為海量數(shù)據(jù)提供存儲的HDFS和對數(shù)據(jù)進行計算的MapReduce

(B)提供整個HDFS文件系統(tǒng)的NameSpace(命名空間)管理、塊管理等所有服務(wù)

(C)Hadoop不僅可以運行在企業(yè)內(nèi)部的集群中，也可以運行在云計算環(huán)境中

(D)Hadoop被視為事實上的大數(shù)據(jù)處理標(biāo)準

3、在一個基本的Hadoop集群中，DataNode主要負責(zé)什么？D

(A)負責(zé)執(zhí)行由JobTracker指派的任務(wù)

(B)協(xié)調(diào)數(shù)據(jù)計算任務(wù)

(C)負責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲

(D)存儲被拆分的數(shù)據(jù)塊

4、Hadoop最初是由誰創(chuàng)建的？B

(A)Lucene

(B)DougCutting

(C)Apache

(D)MapReduce

5、下列哪一個不屬于Hadoop的大數(shù)據(jù)層的功能？C

(A)數(shù)據(jù)挖掘

(B)離線分析

(C)實時計算

(D)BI分析

6、在一個基本的Hadoop集群中，SecondaryNameNode主要負責(zé)什么？A

(A)幫助NameNode收集文件系統(tǒng)運行的狀態(tài)信息

(B)負責(zé)執(zhí)行由JobTracker指派的任務(wù)

(C)協(xié)調(diào)數(shù)據(jù)計算任務(wù)

(D)負責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲

7、下面哪一項不是Hadoop的特性？B

(A)可擴展性高

(B)只支持少數(shù)幾種編程語言

(C)成本低

(D)能在linux上運行

8、在Hadoop項目結(jié)構(gòu)中，HDFS指的是什么？A

(A)分布式文件系統(tǒng)

(B)分布式并行編程模型

(C)資源管理和調(diào)度器

(D)Hadoop上的數(shù)據(jù)倉庫

9、在Hadoop項目結(jié)構(gòu)中，MapReduce指的是什么？A

(A)分布式并行編程模型

(B)流計算框架

(C)Hadoop上的工作流管理系統(tǒng)

(D)提供分布式協(xié)調(diào)一致性服務(wù)

10、下面哪個不是Hadoopl.O的組件：(C)

(A)HDFS

(B)MapReduce

(C)YARN

(D)NameNode和DataNode

多選題

1、Hadoop的特性包括哪些？ABCD

(A)高可擴展性

(B)支持多種編程語言

(C)成本低

(D)運行在Linux平臺上

2、下面哪個是Hadoop2.0的組件？AD

(A)ResourceManager

(B)JobTracker

(C)TaskTracker

(D)NodeManager

3、一個基本的Hadoop集群中的節(jié)點主要包括什么？ABCD

(A)DataNode:存儲被拆分的數(shù)據(jù)塊

(B)JobTracker:協(xié)調(diào)數(shù)據(jù)計算任務(wù)

(C)TaskTracker:負責(zé)執(zhí)行由JobTracker指派的任務(wù)

(D)SecondaryNameNode:幫助NameNode收集文件系統(tǒng)運行的狀態(tài)信息

4、下列關(guān)于Hadoop的描述，哪些是正確的？ABCD

(A)為用戶提供了系統(tǒng)底層細節(jié)透明的分布式基礎(chǔ)架構(gòu)

(B)具有很好的跨平臺特性

(C)可以部署在廉價的計算機集群中

(D)曾經(jīng)被公認為行業(yè)大數(shù)據(jù)標(biāo)準開源軟件

5、Hadoop集群的整體性能主要受到什么因素影響？ABCD

(A)CPU性能

(B)內(nèi)存

(C)網(wǎng)絡(luò)

(D)存儲容量

6、下列關(guān)于Hadoop的描述，哪些是錯誤的？AB

(A)只能支持一種編程語言

(B)具有較差的跨平臺特性

(C)可以部署在廉價的計算機集群中

(D)曾經(jīng)被公認為行業(yè)大數(shù)據(jù)標(biāo)準開源軟件

7、下列哪一項不屬于Hadoop的特性？AB

(A)較低可擴展性

(B)只支持java語言

(C)成本低

(D)運行在Linux平臺上

第三章分布式文件系統(tǒng)HDFS

單選題

1、分布式文件系統(tǒng)指的是什么？A

(A)把文件分布存儲到多個計算機節(jié)點上，成千上萬的計算機節(jié)點構(gòu)成計算機集群

(B)用于在Hadoop與傳統(tǒng)數(shù)據(jù)庫之間進行數(shù)據(jù)傳遞

(C)一個高可用的，高可靠的，分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng)

(D)一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng)，可以處理消費者規(guī)模的網(wǎng)站中的所

有動作流數(shù)據(jù)

2、下面哪一項不屬于計算機集群中的節(jié)點？B

(A)主節(jié)點(MasterNode)

(B)源節(jié)點(SourceNode)

(C)名稱結(jié)點(NameNode)

(D)從節(jié)點(SlaveNode)

3、在HDFS中，默認一個塊多大？A

(A)64MB

(B)32KB

(D)16KB

4、下列哪一項不屬于HDFS采用抽象的塊概念帶來的好處？C

(A)簡化系統(tǒng)設(shè)計

(B)支持大規(guī)模文件存儲

(C)強大的跨平臺兼容性

(D)適合數(shù)據(jù)備份

5、在HDFS中，NameNode的主要功能是什么？D

(A)維護了blockid到datanode本地文件的映射關(guān)系

(B)存儲文件內(nèi)容

(C)文件內(nèi)存保存在磁盤中

(D)存儲元數(shù)據(jù)

6、下面對Fslmage的描述，哪個是錯誤的？D

(A)Fslmage文件沒有記錄每個塊存儲在哪個數(shù)據(jù)節(jié)點

(B)Fslmage文件包含文件系統(tǒng)中所有目錄和文件inode的序列化形式

(C)Fslmage用于維護文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)

(D)Fslmage文件記錄了每個塊具體被存儲在哪個數(shù)據(jù)節(jié)點

7、下面對SecondaryNameNode第二名稱節(jié)點的描述，哪個是錯誤的？A

(A)SecondaryNameNode一般是并行運行在多臺機器上

(B)它是用來保存名稱節(jié)點中對HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點重啟的時

間

(C)SecondaryNameNode通過HTTPGET方式從NameNode上獲取到Fslmage和

EditLog文件，并下載到本地的相應(yīng)目錄下

(D)SecondaryNameNode是HDFS架構(gòu)中的一個組成部分

8、HDFS采用了什么模型？B

(A)分層模型

(B)主從結(jié)構(gòu)模型

(C)管道-過濾器模型

(D)點對點模型

9、在Hadoop項目結(jié)構(gòu)中，HDFS指的是什么？A

(A)分布式文件系統(tǒng)

(B)流數(shù)據(jù)讀寫

(C)資源管理和調(diào)度器

(D)Hadoop上的數(shù)據(jù)倉庫

10、下列關(guān)于HDFS的描述，哪個不正確？D

(A)HDFS還采用了相應(yīng)的數(shù)據(jù)存放、數(shù)據(jù)讀取和數(shù)據(jù)復(fù)制策略，來提升系統(tǒng)整體讀

寫響應(yīng)性能

(B)HDFS采用了主從(Master/Slave)結(jié)構(gòu)模型

(C)HDFS采用了冗余數(shù)據(jù)存儲，增強了數(shù)據(jù)可靠性

(D)HDFS采用塊的概念，使得系統(tǒng)的設(shè)計變得更加復(fù)雜

多選題

1、HDFS要實現(xiàn)以下哪幾個目標(biāo)？ABC

(A)兼容廉價的硬件設(shè)備

(B)流數(shù)據(jù)讀寫

(C)大數(shù)據(jù)集

(D)復(fù)雜的文件模型

2、HDFS特殊的設(shè)計，在實現(xiàn)優(yōu)良特性的同時，也使得自身具有一些應(yīng)用局限性，主要包

括以下哪幾個方面？BCD

(A)較差的跨平臺兼容性

(B)無法高效存儲大量小文件

(C)不支持多用戶寫入及任意修改文件

(D)不適合低延遲數(shù)據(jù)訪問

3、HDFS采用抽象的塊概念可以帶來以下哪幾個明顯的好處？ACD

(A)支持大規(guī)模文件存儲

(B)支持小規(guī)模文件存儲

(C)適合數(shù)據(jù)備份

(D)簡化系統(tǒng)設(shè)計

4、在HDFS中，名稱節(jié)點(NameNode)主要保存了哪些核心的數(shù)據(jù)結(jié)構(gòu)？AD

(A)Fslmage

(B)DN8

(C)Block

(D)EditLog

5、數(shù)據(jù)節(jié)點(DataNode)的主要功能包括哪些？ABC

(A)負責(zé)數(shù)據(jù)的存儲和讀取

(B)根據(jù)客戶端或者是名稱節(jié)點的調(diào)度來進行數(shù)據(jù)的存儲和檢索

(C)向名稱節(jié)點定期發(fā)送自己所存儲的塊的列表

(D)用來保存名稱節(jié)點中對HDFS元數(shù)據(jù)信息的備份，并減少名稱節(jié)點重啟的時間

6、HDFS的命名空間包含什么？BCD

(A)磁盤

(B)文件

(C)塊

(D)目錄

7、下列對于客服端的描述，哪些是正確的？ABCD

(A)客戶端是用戶操作HDFS最常用的方式，HDFS在部署時都提供了客戶端

(B)HDFS客戶端是一個庫，暴露了HDFS文件系統(tǒng)接口

(C)嚴格來說，客戶端并不算是HDFS的一部分

(D)客戶端可以支持打開、讀取、寫入等常見的操作

8、HDFS只設(shè)置唯一一個名稱節(jié)點，這樣做雖然大大簡化了系統(tǒng)設(shè)計，但也帶來了哪些明

顯的局限性？ABCD

(A)命名空間的限制

(B)性能的瓶頸

(C)隔離I可題

(D)集群的可用性

9、HDFS數(shù)據(jù)塊多副本存儲具備以下哪些優(yōu)點？ABC

(A)加快數(shù)據(jù)傳輸速度

(B)容易檢查數(shù)據(jù)錯誤

(C)保證數(shù)據(jù)可靠性

(D)適合多平臺上運行

10、HDFS具有較高的容錯性，設(shè)計了哪些相應(yīng)的機制檢測數(shù)據(jù)錯誤和進行自動恢復(fù)？

BCD

(A)數(shù)據(jù)源太大

(B)數(shù)據(jù)節(jié)點出錯

(C)數(shù)據(jù)出錯

(D)名稱節(jié)點出錯

第四章分布式數(shù)據(jù)庫HBase

單選題

1、下列關(guān)于BigTable的描述,哪個是錯誤的？A

(A)爬蟲持續(xù)不斷地抓取新頁面，這些頁面每隔一段時間地存儲到BigTable里

(B)BigTable是一個分布式存儲系統(tǒng)

(C)BigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問題

(D)網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引，從BigTable得到網(wǎng)頁

2、下列選項中，關(guān)于HBase和BigTable的底層技術(shù)對應(yīng)關(guān)系，哪個是錯誤的？B

(A)GFS與HDFS相對應(yīng)

(B)GFS與Zookeeper相對應(yīng)

(C)MapReduce與HadoopMapReduce相對應(yīng)

(D)Chubby與Zookeeper相對應(yīng)

3、在HBase中，關(guān)于數(shù)據(jù)操作的描述，下列哪一項是錯誤的？C

(A)HBase采用了更加簡單的數(shù)據(jù)模型，它把數(shù)據(jù)存儲為未經(jīng)解釋的字符串

(B)HBase操作不存在復(fù)雜的表與表之間的關(guān)系

(C)HBase不支持修改操作

(D)HBase在設(shè)計上就避免了復(fù)雜的表和表之間的關(guān)系

4、在HBase訪問接口中，Pig主要用在哪個場合？D

(A)適合HadoopMapReduce作業(yè)并行批處理HBase表數(shù)據(jù)

(B)適合HBase管理使用

(C)適合其他異構(gòu)系統(tǒng)在線訪問HBase表數(shù)據(jù)

(D)適合做數(shù)據(jù)統(tǒng)計

5、HBase中需要根據(jù)某些因素來確定一個單元格，這些因素可以視為一個“四維坐標(biāo)”，

下面哪個不屬于“四維坐標(biāo)”？B

(A)行鍵

(B)關(guān)鍵字

(C)列族

(D)時間戳

6、關(guān)于HBase的三層結(jié)構(gòu)中各層次的名稱和作用的說法，哪個是錯誤的？A

(A)Zookeeper文件記錄了用戶數(shù)據(jù)表的Region位置信息

(B)-ROOT-表記錄了.META.表的Region位置信息

(C).META.表保存了HBase中所有用戶數(shù)據(jù)表的Region位置信息

(D)Zookeeper文件記錄了-ROOT-表的位置信息

7、下面關(guān)于主服務(wù)器Master主要負責(zé)表和Region的管理工作的描述，哪個是錯誤的？D

(A)在Region分裂或合并后，負責(zé)重新調(diào)整Region的分布

(B)對發(fā)生故障失效的Region服務(wù)器上的Region進行遷移

(C)管理用戶對表的增加、刪除、修改、查詢等操作

(D)不支持不同Region服務(wù)器之間的負載均衡

8、HBase只有一個針對行健的索引，如果要訪問HBase表中的行，下面哪種方式是不可行

的？B

(A)通過單個行健訪問

(B)通過時間戳訪問

(C)通過一個行健的區(qū)間來訪問

(D)全表掃描

9、下面關(guān)于Region的說法，哪個是錯誤的？C

(A)同一個Region不會被分拆到多個Region服務(wù)器

(B)為了加快訪問速度，.META.表的全部Region都會被保存在內(nèi)存中

(C)一個-ROOT-表可以有多個Region

(D)為了加速尋址，客戶端會緩存位置信息，同時，需要解決緩存失效問題

多選題

1、關(guān)系數(shù)據(jù)庫已經(jīng)流行很多年，并且Hadoop已經(jīng)有了HDFS和MapReduce,為什么需要

HBase?ABCD

(A)Hadoop可以很好地解決大規(guī)模數(shù)據(jù)的離線批量處理問題,但是,受限于Hadoop

MapReduce編程框架的高延遲數(shù)據(jù)處理機制，使得Hadoop無法滿足大規(guī)模數(shù)

據(jù)實時處理應(yīng)用的需求上

(B)HDFS面向批量訪問模式，不是隨機訪問模式

(C)傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫無法應(yīng)對在數(shù)據(jù)規(guī)模劇增時導(dǎo)致的系統(tǒng)擴展性和性能

問題

(D)傳統(tǒng)關(guān)系數(shù)據(jù)庫在數(shù)據(jù)結(jié)構(gòu)變化時一般需要停機維護；空列浪費存儲空間

2、HBase與傳統(tǒng)的關(guān)系數(shù)據(jù)庫的區(qū)別主要體現(xiàn)在以下哪幾個方面？ABCD

(A)數(shù)據(jù)類型

(B)數(shù)據(jù)操作

(C)存儲模式

(D)數(shù)據(jù)維護

3、HBase訪問接口類型包括哪些？ABCD

(A)NativeJavaAPI

(B)HBaseShell

(C)ThriftGateway

(D)RESTGateway

4、下列關(guān)于數(shù)據(jù)模型的描述，哪些是正確的？ABCD

(A)HBase采用表來組織數(shù)據(jù)，表由行和列組成，列劃分為若干個列族

(B)每個HBase表都由若干行組成，每個行由行鍵(rowkey)來標(biāo)識

(C)列族里的數(shù)據(jù)通過列限定符(或列)來定位

(D)每個單元格都保存著同一份數(shù)據(jù)的多個版本，這些版本采用時間戳進行索引

5、HBase的實現(xiàn)包括哪三個主要的功能組件？ABC

(A)庫函數(shù)：鏈接到每個客戶端

(B)一個Master主服務(wù)器

(C)許多個Region服務(wù)器

(D)廉價的計算機集群

6、HBase的三層結(jié)構(gòu)中，三層指的是哪三層？ABC

(A)Zookeeper文件

(B)-ROOT-表

(C),META.表

(D)數(shù)據(jù)類型

7、以下哪些軟件可以對HBase進行性能監(jiān)視？ABCD

(A)Master-status(自帶)

(B)Ganglia

(C)OpenTSDB

(D)Ambari

8、Zookeeper是一個很好的集群管理工具,被大量用于分布式計算,它主要提供什么服務(wù)？

ABC

(A)配置維護

(B)域名服務(wù)

(C)分布式同步

(D)負載均衡服務(wù)

9、下列關(guān)于Region服務(wù)器工作原理的描述，哪些是正確的？ABCD

(A)每個Region服務(wù)器都有一個自己的HLog文件

(B)每次刷寫都生成一個新的StoreFile,數(shù)量太多，影響查找速度

(C)合并操作比較耗費資源，只有數(shù)量達到一個閾值才啟動合并

(D)Store是Region服務(wù)器的核心

10、下列關(guān)于HLog工作原理的描述，哪些是正確的？ABCD

(A)分布式環(huán)境必須要考慮系統(tǒng)出錯。HBase采用HLog保證

(B)HBase系統(tǒng)為每個Region服務(wù)器配置了一個HLog文件

(C)Zookeeper會實時監(jiān)測每個Region服務(wù)器的狀態(tài)

(D)Master首先會處理該故障Region服務(wù)器上面遺留的HLog文件

第五章NoSQL數(shù)據(jù)庫

單選題

1、下列哪個不屬于NoSQL數(shù)據(jù)庫的特點？D

(A)靈活的可擴展性

(B)靈活的數(shù)據(jù)模型

(C)與云計算緊密融合

(D)數(shù)據(jù)存儲規(guī)模有限

2、下面關(guān)于NoSQL和關(guān)系數(shù)據(jù)庫的簡單比較，哪個是錯誤的？B

(A)RDBMS有關(guān)系代數(shù)理論作為基礎(chǔ)，No$QL沒有統(tǒng)一的理論基礎(chǔ)

(B)NoSQL很難實現(xiàn)橫向擴展，RDBMS可以很容易通過添加更多設(shè)備來支持更大規(guī)

模的數(shù)據(jù)

(C)RDBMS需要定義數(shù)據(jù)庫模式，嚴格遵守數(shù)據(jù)定義，NoSQL一般不存在數(shù)據(jù)庫模

式，可以自由靈活定義并存儲各種不同類型的數(shù)據(jù)

(D)RDBMS借助于索引機制可以實現(xiàn)快速查詢，很多NoSQL數(shù)據(jù)庫沒有面向復(fù)雜

查詢的索引

3、下列哪一項不屬于NoSQL的四大類型？D

(A)文檔數(shù)據(jù)庫

(B)圖數(shù)據(jù)庫

(C)列族數(shù)據(jù)庫

(D)時間戳數(shù)據(jù)庫

4、下列關(guān)于鍵值數(shù)據(jù)庫的描述，哪一項是錯誤的？D

(A)擴展性好，靈活性好

(B)大量寫操作時性能高

(C)無法存儲結(jié)構(gòu)化信息

(D)條件查詢效率高

5、下列關(guān)于列族數(shù)據(jù)庫的描述，哪一項是錯誤的？A

(A)查找速度慢，可擴展性差

(B)功能較少，大都不支持強事務(wù)一致性

(C)容易進行分布式擴展

(D)復(fù)雜性低

6、下列哪一項不屬于數(shù)據(jù)庫事務(wù)具有ACID四性？A

(A)間斷性

(B)原子性

(C)一致性

(D)持久性

7、下面關(guān)于MongoDB說法，哪一項是正確的？D

(A)具有較差的水平可擴展性

(B)設(shè)置個別屬性的索引來實現(xiàn)更快的排序

(C)提供了一個面向文檔存儲，操作復(fù)雜

(D)可以實現(xiàn)替換完成的文檔(數(shù)據(jù))或者一些指定的數(shù)據(jù)字段

8、下列關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫的比較，哪個說法是錯誤的？D

(A)在一致性方面，RDBMS強于NoSQL

(B)在數(shù)據(jù)完整性方面，RDBMS容易實現(xiàn)

(C)在擴展性方面，NoSQL比較好

(D)在可用性方面，NoSQL優(yōu)于RDBMS

9、關(guān)于文檔數(shù)據(jù)庫的說法，下列哪一項是錯誤的？A

(A)數(shù)據(jù)是規(guī)則的

(B)性能好(高并發(fā))

(C)缺乏統(tǒng)一的查詢語法

(D)復(fù)雜性低

多選題

1、關(guān)系數(shù)據(jù)庫已經(jīng)無法滿足Web2.0的需求，主要表現(xiàn)在以下幾個方面？ABC

(A)無法滿足海量數(shù)據(jù)的管理需求

(B)無法滿足數(shù)據(jù)高并發(fā)的需求

(C)無法滿足高可擴展性和高可用性的需求

(D)使用難度高

2、下列關(guān)于MySQL集群的描述，哪些是正確的？ABCD

(A)復(fù)雜性：部署、管理、配置很復(fù)雜

(B)數(shù)據(jù)庫復(fù)制：MySQL主備之間一般采用復(fù)制方式，很多時候是異步復(fù)制

(C)擴容問題：如果系統(tǒng)壓力過大需要增加新的機器，這個過程涉及數(shù)據(jù)重新劃分

(D)動態(tài)數(shù)據(jù)遷移問題：如果某個數(shù)據(jù)庫組壓力過大，需要將其中部分數(shù)據(jù)遷移出

去

3、關(guān)系數(shù)據(jù)庫引以為傲的兩個關(guān)鍵特性(完善的事務(wù)機制和高效的查詢機制)，到了

Web2.0時代卻成了雞肋，主要表現(xiàn)在以下哪幾個方面？ACD

(A)Web2.0網(wǎng)站系統(tǒng)通常不要求嚴格的數(shù)據(jù)庫事務(wù)

(B)Web2.0網(wǎng)站系統(tǒng)基本上不用關(guān)系數(shù)據(jù)庫來存儲數(shù)據(jù)

(C)Web2.0并不要求嚴格的讀寫實時性

(D)Web2.0通常不包含大量復(fù)雜的SQL查詢

4、下面關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫的比較，哪些是正確的？ABCD

(A)關(guān)系數(shù)據(jù)庫以完善的關(guān)系代數(shù)理論作為基礎(chǔ)，有嚴格的標(biāo)準

(B)關(guān)系數(shù)據(jù)庫可擴展性較差，無法較好支持海量數(shù)據(jù)存儲

(C)NoSQL可以支持超大規(guī)模數(shù)據(jù)存儲

(D)NoSQL數(shù)據(jù)庫缺乏數(shù)學(xué)理論基礎(chǔ)，復(fù)雜查詢性能不高

5、下列關(guān)于文檔數(shù)據(jù)庫的描述，哪些是正確的？AD

(A)性能好(高并發(fā))，靈活性高

(B)具備統(tǒng)一的查詢語法

(C)文檔數(shù)據(jù)庫支持文檔間的事務(wù)

(D)復(fù)雜性低，數(shù)據(jù)結(jié)構(gòu)靈活

6、下列關(guān)于圖數(shù)據(jù)庫的描述，哪些是正確的？ABCD

(A)專門用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)

(B)比較適合于社交網(wǎng)絡(luò)、模式識別、依賴分析、推薦系統(tǒng)以及路徑尋找等問題

(C)靈活性高，支持復(fù)雜的圖算法

(D)復(fù)雜性高，只能支持一定的數(shù)據(jù)規(guī)模

7、NoSQL的三大基石？ABC

(A)CAP

(B)最終一致性

(C)BASE

(D)DN8

8、關(guān)于NoSQL的三大基石之一的CAP,下列哪些說法是正確的？ACD

(A)一致性，是指任何一個讀操作總是能夠讀到之前完成的寫操作的結(jié)果量

(B)一個分布式系統(tǒng)可以同時滿足一致性、可用性和分區(qū)容忍性這三個需求

(C)可用性，是指快速獲取數(shù)據(jù)

(D)分區(qū)容忍性，是指當(dāng)出現(xiàn)網(wǎng)絡(luò)分區(qū)的情況時(即系統(tǒng)中的一部分節(jié)點無法和其

他節(jié)點進行通信)，分離的系統(tǒng)也能夠正常運行

9、當(dāng)處理CAP的問題時，可以有哪幾個明顯的選擇？ABC

(A)CA：也就是強調(diào)一致性(C)和可用性(A),放棄分區(qū)容忍性(P)

(B)CP：也就是強調(diào)一致性(C)和分區(qū)容忍性(P),放棄可用性(A)

(C)AP：也就是強調(diào)可用性(A)和分區(qū)容忍性(P),放棄一致性(C)

(D)CAP：也就是同時兼顧可用性(A)、分區(qū)容忍性(P)和一致性(C),當(dāng)時系統(tǒng)

性能會下降很多

10、數(shù)據(jù)庫事務(wù)具有ACID四性，下面哪幾項屬于四性？ABD

(A)原子性

(B)持久性

(C)間斷性

(D)一致性

第六章云數(shù)據(jù)庫

單選題

1、下列哪個不屬于云計算的優(yōu)勢？D

(A)按需服務(wù)

(B)隨時服務(wù)

(C)通用性

(D)價格不菲

2、下列關(guān)于云數(shù)據(jù)庫的描述，哪個是錯誤的？C

(A)云數(shù)據(jù)庫是部署和虛擬化在云計算環(huán)境中的數(shù)據(jù)庫

(B)云數(shù)據(jù)庫是在云計算的大背景下發(fā)展起來的一種新興的共享基礎(chǔ)架構(gòu)的方法

(C)云數(shù)據(jù)庫價格不菲，維護費用極其昂貴

(D)云數(shù)據(jù)庫具有高可擴展性、高可用性、采用多租形式和支持資源有效分發(fā)等特

點

3、下列哪一個不屬于云數(shù)據(jù)庫產(chǎn)品？A

(A)本地安裝MySQL

(B)阿里云RDS

(C)OracleCloud

(D)百度云數(shù)據(jù)庫

4、UMP系統(tǒng)是構(gòu)建在一個大的集群之上的，下列哪一項不屬于系統(tǒng)向用戶提供的功能？D

(A)讀寫分離

(B)分庫分表

(C)數(shù)據(jù)安全

(D)資源合并

5、下列關(guān)于UMP系統(tǒng)功能的說法，哪個是錯誤的？D

(A)充分利用主從庫實現(xiàn)用戶讀寫操作的分離，實現(xiàn)負載均衡

(B)UMP系統(tǒng)實現(xiàn)了對于用戶透明的讀寫分離功能

(C)UMP采用的兩種資源隔離方式(用Cgroup限制MySQL進程資源和在Proxy服

務(wù)器端限制QPS)

(D)UMP系統(tǒng)只設(shè)計了一種機制來保證數(shù)據(jù)安全

6、下列關(guān)于阿里云RDS的說法，哪個是錯誤的？D

(A)RDS是阿里云提供的關(guān)系型數(shù)據(jù)庫服務(wù)

(B)RDS由專業(yè)數(shù)據(jù)庫管理團隊維護

(C)RDS具有安全穩(wěn)定、數(shù)據(jù)可靠、自動備份

(D)RDS實例，是用戶購買RDS服務(wù)的基本單位，在實例中，用戶只能創(chuàng)建一個數(shù)

據(jù)庫

7、下面哪一項不是云數(shù)據(jù)庫的特性？B

(A)動態(tài)可擴展

(B)高成本

(C)易用性

(D)大規(guī)模并行處理

8、下列哪個不是UMP系統(tǒng)中的角色？D

(A)Controller服務(wù)器

(B)Proxy服務(wù)器

(C)愚公系統(tǒng)

(D)阿斯隆服務(wù)器

9、關(guān)于UMP系統(tǒng)架構(gòu)依賴的開源組件Mnesia,說法錯誤的是哪一項？B

(A)Mnesia是一個分布式數(shù)據(jù)庫管理系統(tǒng)

(B)Mnesia的數(shù)據(jù)庫模式(schema)只能在未運行前靜態(tài)重配置

(C)Mnesia的這些特性，使其在開發(fā)云數(shù)據(jù)庫時被用來提供分布式數(shù)據(jù)庫服務(wù)

(D)Mnesia支持事務(wù)，支持透明的數(shù)據(jù)分片

10、關(guān)于UMP系統(tǒng)架構(gòu)的Controller服務(wù)器，說法錯誤的是哪一項？C

(A)Controller服務(wù)器向UMP集群提供各種管理服務(wù)

(B)Controller服務(wù)器上運行了一組Mnesia分布式數(shù)據(jù)庫服務(wù)

(C)當(dāng)其它服務(wù)器組件需要獲取用戶數(shù)據(jù)時，不可以向Controller服務(wù)器發(fā)送請求獲

取數(shù)據(jù)

(D)為了避免單點故障，保證系統(tǒng)的高可用性，UMP系統(tǒng)中部署了多臺Controller

服務(wù)器

多選題

1、云數(shù)據(jù)庫具有以下哪些特性？ABCD

(A)動態(tài)可擴展

(B)高可用性

(C)免維護

(D)安全

2、下列關(guān)于云數(shù)據(jù)庫的描述，哪些是正確的？ABCD

(A)Amazon是云數(shù)據(jù)庫市場的先行者

(B)GoogleCloudSQL是谷歌公司推出的基于MySQL的云數(shù)據(jù)庫

(C)從數(shù)據(jù)模型的角度來說，云數(shù)據(jù)庫并非一種全新的數(shù)據(jù)庫技術(shù)

(D)云數(shù)據(jù)庫并沒有專屬于自己的數(shù)據(jù)模型

3、UMP系統(tǒng)架構(gòu)設(shè)計遵循了以下哪些原則？ABCD

(A)保持單一的系統(tǒng)對外入口，并且為系統(tǒng)內(nèi)部維護單一的資源池

(B)消除單點故障，保證服務(wù)的高可用性

(C)保證系統(tǒng)具有良好的可伸縮，能夠動態(tài)地增加、刪減計算與存儲節(jié)點

(D)保證分配給用戶的資源也是彈性可伸縮的

4、UMP系統(tǒng)架構(gòu)依賴的哪些開源組件？ABCD

(A)Mnesia

(B)LVS

(C)RabbitMQ

(D)ZooKeeper

5、下列關(guān)于UMP系統(tǒng)架構(gòu)的描述，哪些是正確的？ACD

(A)信息統(tǒng)計服務(wù)器定期將采集到的用戶的連接數(shù)

(B)Web控制臺無法向用戶提供系統(tǒng)管理界面

(C)LVS(LinuxVirtualServer)即Linux虛擬服務(wù)器

(D)UMP系統(tǒng)借助于LVS來實現(xiàn)集群內(nèi)部的負載均衡

6、為什么說云數(shù)據(jù)庫是個性化數(shù)據(jù)存儲需求的理想選擇？ABCD

(A)云數(shù)據(jù)庫可以滿足大企業(yè)的海量數(shù)據(jù)存儲需求

(B)云數(shù)據(jù)庫可以滿足中小企業(yè)的低成本數(shù)據(jù)存儲需求

(C)云數(shù)據(jù)庫可以滿足企業(yè)動態(tài)變化的數(shù)據(jù)存儲需求

(D)前期零投入、后期免維護的數(shù)據(jù)庫服務(wù)，可以很好滿足它們的需求

7、下列關(guān)于云數(shù)據(jù)庫與其他數(shù)據(jù)庫的關(guān)系，哪些是正確的？ABD

(A)從數(shù)據(jù)模型的角度來說，云數(shù)據(jù)庫并非一種全新的數(shù)據(jù)庫技術(shù)

(B)云數(shù)據(jù)庫并沒有專屬于自己的數(shù)據(jù)模型，云數(shù)據(jù)庫所采用的數(shù)據(jù)模型可以是關(guān)

系數(shù)據(jù)庫所使用的關(guān)系模型

(C)同一個公司只能提供采用不同數(shù)據(jù)模型的單個云數(shù)據(jù)庫服務(wù)

(D)許多公司在開發(fā)云數(shù)據(jù)庫時，后端數(shù)據(jù)庫都是直接使用現(xiàn)有的各種關(guān)系數(shù)據(jù)庫

或NoSQL數(shù)據(jù)庫產(chǎn)品

8、以下哪些是Amazon的云數(shù)據(jù)庫產(chǎn)品？ABC

(A)AmazonRDS:云中的關(guān)系數(shù)據(jù)庫

(B)AmazonSimpleDB:云中的鍵值數(shù)據(jù)庫

(C)AmazonDynamoDB:云中的數(shù)據(jù)倉庫

(D)AmazonElastiCache:云中的分布式內(nèi)存緩存

9、Microsoft的云數(shù)據(jù)庫產(chǎn)品SQLAzure具有以下哪些特性？ABCD

(A)屬于關(guān)系型數(shù)據(jù)庫：支持使用TSQL來管理、創(chuàng)建和操作云數(shù)據(jù)庫

(B)支持存儲過程：它的數(shù)據(jù)類型、存儲過程和傳統(tǒng)的SQLServer具有很大的相似

性

(C)支持大量數(shù)據(jù)類型

(D)支持云中的事務(wù)：支持局部事務(wù)，但是不支持分布式事務(wù)

第七章MapReduce

單選題

1、下列傳統(tǒng)并行計算框架，說法錯誤的是哪一項？B

(A)刀片服務(wù)器、高速網(wǎng)、SAN,價格貴，擴展性差上

(B)共享式(共享內(nèi)存/共享存儲)，容錯性好

(C)編程難度高

(D)實時、細粒度計算、計算密集型

2、下列關(guān)于MapReduce模型的描述，錯誤的是哪一項？D

(A)MapReduce采用“分而治之"策略

(B)MapReduce設(shè)計的一個理念就是“計算向數(shù)據(jù)靠攏”

(C)MapReduce框架采用了Master/Slave架構(gòu)

(D)MapReduce應(yīng)用程序只能用Java來寫

3、MapReducel.O的體系結(jié)構(gòu)中，JobTracker是主要任務(wù)是什么？A

(A)負責(zé)資源監(jiān)控和作業(yè)調(diào)度，監(jiān)控所有TaskTracker與Job的健康狀況

(B)使用"slot"等量劃分本節(jié)點上的資源量(CPU、內(nèi)存等)

(C)會周期性地通過“心跳”將本節(jié)點上資源的使用情況和任務(wù)的運行進度匯報給

TaskTracker

(D)會跟蹤任務(wù)的執(zhí)行進度、資源使用量等信息，并將這些信息告訴任務(wù)(Task)

4、下列關(guān)于MapReduce工作流程，哪個描述是正確的？A

(A)所有的數(shù)據(jù)交換都是通過MapReduce框架自身去實現(xiàn)的

(B)不同的Map任務(wù)之間會進行通信

(C)不同的Reduce任務(wù)之間可以發(fā)生信息交換

(D)用戶可以顯式地從一臺機器向另一臺機器發(fā)送消息

5、下列關(guān)于MapReduce的說法，哪個描述是錯誤的？D

(A)MapReduce具有廣泛的應(yīng)用，比如關(guān)系代數(shù)運算、分組與聚合運算等

(B)MapReduce將復(fù)雜的、運行于大規(guī)模集群上的并行計算過程高度地抽象到了兩

個函數(shù)

(C)編程人員在不會分布式并行編程的情況下，也可以很容易將自己的程序運行在

分布式系統(tǒng)上，完成海量數(shù)據(jù)集的計算

(D)不同的Map任務(wù)之間可以進行通信

6、下列關(guān)于Map和Reduce函數(shù)的描述，哪個是錯誤的？C

(A)Map將小數(shù)據(jù)集進一步解析成一批＜key,value〉對，輸入Map函數(shù)中進行處理

(B)Map每一個輸入的＜k1,v1＞會輸出一批＜k2,v2＞?＜k2,v2＞是計算的中間

結(jié)果

(C)Reduce輸入的中間結(jié)果＜k2,List(v2)＞中的List(v2)表示是一批屬于不同k2的

value

(D)Reduce輸入的中間結(jié)果＜k2,List(v2)＞中的List(v2)表示是一批屬于同一個k2

的value

7、下面哪一項不是MapReduce體系結(jié)構(gòu)主要部分？A

(A)Client

(B)JobTracker

(C)TaskTracker以及Task

(D)Job

8、關(guān)于MapReducel.O的體系結(jié)構(gòu)的描述，下列說法錯誤的是？A

(A)Task分為M叩Task和ReduceTask兩種，分別由JobTracker和TaskTracker

啟動

(B)slot分為Mapslot和Reduceslot兩種，分別供MapTask和ReduceTask使

用

(C)TaskTracker使用"slot"等量劃分本節(jié)點上的資源量(CPU、內(nèi)存等)

(D)TaskTracker會周期性接收JobTracker發(fā)送過來的命令并執(zhí)行相應(yīng)的操作(如啟

動新任務(wù)、殺死任務(wù)等)

9、下列說法錯誤的是？C

(A)HadoopMapReduce是MapReduce的開源實現(xiàn)，后者比前者使用門檻低很多

(B)MapReduce采用非共享式架構(gòu)，容錯性好

(C)MapReduce主要用于批處理、實時、計算密集型應(yīng)用

(D)MapReduce采用“分而治之”策略

多選題

1、MapReduce相較于傳統(tǒng)的并行計算框架有什么優(yōu)勢？ABCD

(A)非共享式，容錯性好

(B)普通PC機，便宜，擴展性好

(C)編程簡單，只要告訴MapReduce做什么即可

(D)批處理、非實時、數(shù)據(jù)密集型

2、MapReduce體系結(jié)構(gòu)主要由以下那幾個部分構(gòu)成？ABCD

(A)Client

(B)JobTracker

(C)TaskTracker

(D)Task

3、下列關(guān)于MapReduce的體系結(jié)構(gòu)的描述，說法正確的有？ABD

(A)用戶編寫的MapReduce程序通過Client提交到JobTracker端

(B)JobTracker負責(zé)資源監(jiān)控和作業(yè)調(diào)度

(C)TaskTracker監(jiān)控所有TaskTracker與Job的健康狀況

(D)TaskTracker使用"slot"等量劃分本節(jié)點上的資源量(CPU、內(nèi)存等)

4、MapReduce的作業(yè)主要包括什么?AB

(A)從磁盤或從網(wǎng)絡(luò)讀取數(shù)據(jù)，即I。密集工作

(B)計算數(shù)據(jù)，即CPU密集工作

(C)針對不同的工作節(jié)點選擇合適硬件類型

(D)負責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲

5、對于MapReduce而言，其處理單位是split。split是一個邏輯概念，它包含哪些元數(shù)據(jù)

信息？AB

(A)數(shù)據(jù)起始位置

(B)數(shù)據(jù)長度

(C)數(shù)據(jù)所在節(jié)點

(D)數(shù)據(jù)大小

6、下列關(guān)于Map端的Shuffle的描述，哪些是正確的？BC

(A)MapReduce默認為每個M叩任務(wù)分配1000MB緩存

(B)多個溢寫文件歸并成一個或多個大文件，文件中的鍵值對是排序的

(C)當(dāng)數(shù)據(jù)很少時，不需要溢寫到磁盤，直接在緩存中歸并，然后輸出給Reduce

(D)每個M叩任務(wù)分配多個緩存，使得任務(wù)運行更有效率

7、MapReduce的具體應(yīng)用包括哪些?ABCD

(A)關(guān)系代數(shù)運算(選擇、投影、并、交、差、連接)

(B)分組與聚合運算

(C)矩陣-向量乘法

(D)矩陣乘法

8、MapReduce執(zhí)行的全過程包括以下哪幾個主要階段？ABCD

(A)從分布式文件系統(tǒng)讀入數(shù)據(jù)

(B)執(zhí)行Map任務(wù)輸出中間結(jié)果

(C)通過Shuffle階段把中間結(jié)果分區(qū)排序整理后發(fā)送給Reduce任務(wù)

(D)執(zhí)行Reduce任務(wù)得到最終結(jié)果并寫入分布式文件系統(tǒng)

9、下列說法正確的是？ABCD

(A)MapReduce體系結(jié)構(gòu)主要由四個部分組成，分別是：Client、JobTracker、

TaskTracker以及Task

(B)Task分為M叩Task和ReduceTask兩種，均由TaskTracker啟動

(C)在MapReduce工作流程中，所有的數(shù)據(jù)交換都是通過MapReduce框架自身去

實現(xiàn)的

(D)在MapReduce工作流程中，用戶不能顯式地從一臺機器向另一臺機器發(fā)送消息

第八章Hadoop再探討

單選題

1、Hadoopl.O的核心組件(僅指MapReduce和HDFS,不包括Hadoop生態(tài)系統(tǒng)內(nèi)的Pig、

Hive、HBase等其他組件)，下列哪項是它的不足？B

(A)抽象層次高

(B)表達能力有限，抽象層次低，需人工編碼

(C)價格昂貴

(D)可維護性低

2、下面哪個選項不屬于Hadoopl.O的問題？D

(A)單一名稱節(jié)點，存在單點失效問題

(B)單一命名空間，無法實現(xiàn)資源隔離

(C)資源管理效率低

(D)很難上手

3、下列哪項是Hadoop生態(tài)系統(tǒng)中Spark的功能？D

(A)處理大規(guī)模數(shù)據(jù)的腳本語言

(B)工作流和協(xié)作服務(wù)引擎，協(xié)調(diào)Hadoop上運行的不同任務(wù)

(C)不支持DAG作業(yè)的計算框架

(D)基于內(nèi)存的分布式并行編程框架，具有較高的實時性，并且較好支持迭代計算

4、在Hadoop生態(tài)系統(tǒng)中，Kafka主要解決Hadoop中存在哪些的問題？A

(A)Hadoop生態(tài)系統(tǒng)中各個組件和其他產(chǎn)品之間缺乏統(tǒng)一的、高效的數(shù)據(jù)交換中介

(B)不同的MapReduce任務(wù)之間存在重復(fù)操作，降低了效率

(C)延遲高，而且不適合執(zhí)行迭代計算

(D)抽象層次低，需要手工編寫大量代碼

5、下列哪一個不屬于HDFS1.0中存在的問題？A

(A)無法水平擴展

(B)單點故障問題

(C)單一命名空間

(D)系統(tǒng)整體性能受限于單個名稱節(jié)點的吞吐量

6、關(guān)于HDFSFederation的設(shè)計的描述，哪個是錯誤的？A

(A)屬于不同命名空間的塊可以構(gòu)成同一個“塊池”

(B)HDFSFederation中，所有名稱節(jié)點會共享底層的數(shù)據(jù)節(jié)點存儲資源，數(shù)據(jù)節(jié)點

向所有名稱節(jié)點匯報

(C)設(shè)計了多個相互獨立的名稱節(jié)點

(D)HDFS的命名服務(wù)能夠水平擴展

7、下列關(guān)于MapReducel.O的描述，錯誤的是？B

(A)JobTracker"大包大攬”導(dǎo)致任務(wù)過重

(B)不存在單點故障

(C)容易出現(xiàn)內(nèi)存溢出(分配資源只考慮MapReduce任務(wù)數(shù)，不考慮CPU、內(nèi)存)

(D)資源劃分不合理(強制劃分為slot,包括Mapslot和Reduceslot)

8、下列哪個不屬于YARN體系結(jié)構(gòu)中ResourceManager的功能？D

(A)處理客戶端請求

(B)監(jiān)控NodeManager

(C)資源分配與調(diào)度

(D)處理來自ApplicationMaster的命令

9、下列哪個不屬于YARN體系結(jié)構(gòu)中ApplicationMaster的功能？D

(A)任務(wù)調(diào)度、監(jiān)控與容錯

(B)為應(yīng)用程序申請資源

(C)將申請的資源分配給內(nèi)部任務(wù)

(D)處理來自ResourceManger的命令

多選題

1、下列選項中，哪些屬于Hadoopl.O的核心組件的不足之處？ABCD

(A)實時性差(適合批處理，不支持實時交互式)

(B)資源浪費(Map和Reduce分兩階段執(zhí)行)

(C)執(zhí)行迭代操作效率低

(D)難以看到程序整體邏輯

2、Hadoop的優(yōu)化與發(fā)展主要體現(xiàn)在哪幾個方面？ABC

(A)Hadoop自身核心組件M叩Reduce的架構(gòu)設(shè)計改進

(B)Hadoop自身核心組件HDFS的架構(gòu)設(shè)計改進

(C)Hadoop生態(tài)系統(tǒng)其它組件的不斷豐富

(D)Hadoop生態(tài)系統(tǒng)減少不必要的組件，整合系統(tǒng)

3、下列哪些屬于Hadoop2.0相對于Hadoopl.O的改進？ABCD

(A)設(shè)計了HDFSHA

(B)提供名稱節(jié)點熱備機制

(C)設(shè)計了HDFSFederation,管理多個命名空間

(D)設(shè)計了新的資源管理框架YARN

4、下面哪個屬于不斷完善的Hadoop生態(tài)系統(tǒng)中的組件？ABC

(A)Pig

(B)Tez

(C)Kafka

(D)DN8

5、HDFS1.0主要存在哪些問題？ACD

(A)單點故障問題

(B)不可以水平擴展

(C)單個名稱節(jié)點難以提供不同程序之間的隔離性

(D)系統(tǒng)整體性能受限于單個名稱節(jié)點的吞吐量

6、HDFSFederation相對于HDFS1.0的優(yōu)勢主要體現(xiàn)在哪里？BCD

(A)能夠解決單點故障問題

(B)HDFS集群擴展性

(C)性能更高效

(D)良好的隔離性

7、JobTracker主要包括哪三大功能？ABC

(A)資源管理

(B)任務(wù)調(diào)度

(C)任務(wù)監(jiān)控

(D)數(shù)據(jù)即服務(wù)

8、YARN體系結(jié)構(gòu)主要包括哪三部分？ABD

(A)ResourceManager

(B)NodeManager

(C)DataManager

(D)ApplicationMaster

9、在YARN體系結(jié)構(gòu)中，ApplicationMaster主要功能包括哪些？ABC

(A)當(dāng)用戶作業(yè)提交時，ApplicationMaster與ResourceManager協(xié)商獲取資源，

ResourceManager會以容器的形式為ApplicationMaster分配資源

(B)把獲得的資源進一步分配給內(nèi)部的各個任務(wù)(Map任務(wù)或Reduce任務(wù))，實現(xiàn)

資源的“二次分配”

(C)定時向ResourceManager發(fā)送“心跳”消息，報告資源的使用情況和應(yīng)用的進

度信息

(D)向ResourceManager匯報作業(yè)的資源使用情況和每個容器的運行狀態(tài)

第九章數(shù)據(jù)倉庫Hive

單選題

1,下列有關(guān)Hive和Impala的對比錯誤的是:(D)

AHive與Impala使用相同的元數(shù)據(jù)

BHive與Impala中對SQL的解釋處理比較相似，都是通過詞法分析生成執(zhí)行計劃

CHive適合于長時間的批處理查詢分析，而Impala適合于實時交互式SQL查詢

DHive在內(nèi)存不足以存儲所有數(shù)據(jù)時，會使用外存，而Impala也是如此

2.下列關(guān)于Hive基本操作命令的解釋錯誤的是：(C)

Acreatedatabaseuserdb;〃倉犍數(shù)據(jù)庫userdb

Bcreatetableifnotexistsusr(idbigint,namestring,ageint);〃如果usr表不存在,

創(chuàng)建表usr,含三個屬性id,name,age

Cloaddatalocalinpath'/usr/local/data,overwriteintotableusr;〃把目

錄'/usr/local/data'下的數(shù)據(jù)文件中的數(shù)據(jù)以追加的方式裝載進usr表

Dinsertoverwritetablestudentselect*fromuserwhereage>10;〃向表usrl

中插入來自usr表的age大于10的數(shù)據(jù)并覆蓋student表中原有數(shù)據(jù)

3.下面哪個不可能是Hive的執(zhí)行弓I擎:（C）

A.M叩Reduce

B.Tez

C.Storm

D.Spark

4.下面描述錯誤的是：（C）

A.Hive的功能十分強大，可以支持采用SQL方式查詢Hadoop平臺上的數(shù)據(jù)

B.在實際應(yīng)用中，Hive也暴露出不穩(wěn)定的問題，在極少數(shù)情況下，甚至?xí)霈F(xiàn)端口不響應(yīng)

或者進程丟失的問題

C.在HiveHA中，在Hadoop集群上構(gòu)建的數(shù)據(jù)倉庫是由單個Hive實例進行管理的

D.在HiveHA中，客戶端的查詢請求首先訪問HAProxy,由HAProxy對訪問請求進行轉(zhuǎn)發(fā)

5.以下哪個不是數(shù)據(jù)倉庫的特性：（C）

A.面向主題的

B.集成的

C.動態(tài)變化的

D,反映歷史變化的

6.下面關(guān)于Hive的描述錯誤的是：（D）

A.Hive是一個構(gòu)建在Hadoop之上的數(shù)據(jù)倉庫工具

B.Hive是由Facebook公司開發(fā)的

C.Hive在某種程度上可以看作是用戶編程接口，其本身并不存儲和處理數(shù)據(jù)

D.Hive定義了簡單的類似SQL的查詢語言——HiveQL,它與大部分SQL語法無法兼容

7.下面關(guān)于Hive的描述錯誤的是：（D）

A.HBase與Hive的功能是互補的，它實現(xiàn)了Hive不能提供的功能

B.當(dāng)采用MapReduce作為執(zhí)行引擎時，用HiveQL語句編寫的處理邏輯，最終都要轉(zhuǎn)化為

MapReduce任務(wù)來運行

C.Hive一般用于處理靜態(tài)數(shù)據(jù)，主要是BI報表數(shù)據(jù)

D.Hive主要是用于滿足實時數(shù)據(jù)流的處理需求

8.關(guān)于Hive和傳統(tǒng)關(guān)系數(shù)據(jù)庫的對比分析，下面描述錯誤的是：（B）

A.Hive一般依賴于分布式文件系統(tǒng)HDFS,而傳統(tǒng)數(shù)據(jù)庫則依

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第3版)》期末復(fù)習(xí)題庫(含答案)

文檔簡介

溫馨提示

最新文檔

評論

《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第3版)》期末復(fù)習(xí)題庫(含答案)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔