Hadoop期末復(fù)習(xí)題庫_第1頁
Hadoop期末復(fù)習(xí)題庫_第2頁
Hadoop期末復(fù)習(xí)題庫_第3頁
Hadoop期末復(fù)習(xí)題庫_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

一、選擇題(可能是單選可能是不定選擇題)

一個M叩Reduce程序中的MapTask的個數(shù)由什么決定?(c)

A、輸入的總文件數(shù)

B、客戶端程序設(shè)置的mapTask的個數(shù)

C、FilelnputFormat.getSplits(JobContextjob)計算出的邏輯切片的數(shù)量

D、輸入的總文件大小/數(shù)據(jù)塊大小

關(guān)于SecondaryNameNode哪項是正確的?(c)

A.它是NameNode的熱備

B.它對內(nèi)存沒有要求

C.它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間

I).SecondaryNameNode應(yīng)與NameNode部署到一個節(jié)點

HBase中的批量加載底層使用(a)實現(xiàn)。

A、MapReduce

B、Hive

C、Coprocessor

D、BloomFilter

DFS檢查點(Checkpoint)的作用是可以減少下面哪個組件的啟動時間?(b)

A.SecondaryNameNodeB.NameNodeC.DataNodeI).JournalNode

如下哪一個命令可以幫助你知道shell命令的用法(c)o

A、man

B、pwd

C、help

D、more

解壓.tar.gz結(jié)尾的HBase壓縮包使用的Linux命令是(a)。

A、tar-zxvf

B、tar-zx

C>tar-s

D、tar-nf

YARNWeb界面默認占用哪個端口?(b)

A、50070

B、8088

C、50090

D、9000

Flume的Agent包含以下那些組件?(ac)

A.Source

B.ZNode

C.Channel

D.Sink

面描述HBase的Region的內(nèi)部結(jié)構(gòu)不正確的是?(d)

A.每個Storerfl一個MemStore和0至多個StoreFile組成

B.Region由一個或者多個Store組成

C.MemStore存儲在內(nèi)存中,StoreFile存儲在HDFS

D.每個Store保存一個Co1umn

關(guān)于HDFS集群中的DataNodc的描述正確的是?(bed)

A.一個DataNode上存儲一個數(shù)據(jù)塊的多個副本

B.存儲客戶端上傳的數(shù)據(jù)的數(shù)據(jù)塊

C.響應(yīng)客戶端的所有讀寫數(shù)據(jù)請求,為客戶端的存儲和讀取數(shù)據(jù)提供支撐

D.當Datanode讀取數(shù)據(jù)塊的時候,會計算它的校驗和(checksum),如果計算后的校驗和,

與數(shù)據(jù)塊創(chuàng)建時值不一樣,說明該數(shù)據(jù)塊已經(jīng)損壞

下面關(guān)于使用Hive的描述中正確的是?(bd)

A.Hive支持數(shù)據(jù)刪除和修改

B.Hive中的join查詢只支持等值鏈接,不支持非等值連接

C.Hive中的join查詢支持左外連接,不支持右外連接

【).Hive默認倉庫路徑為/user/hive/warehouse/

HDFS的NameNode負責管理文件系統(tǒng)的命名空間,將所有的文件和文件夾的元數(shù)據(jù)保存在

一個文件系統(tǒng)樹中,這些信息也會在硬盤上保存成以下文件:()。

A、日志

B、命名空間鏡像

C、兩者都是

D、兩者都不是

HDFS的是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,默認的最基本的存儲單位

是64M,具有高容錯、高可靠性、高可擴展性、高吞吐率等特征,適合的讀寫任務(wù)是(c)0

A、一次寫入,少次讀寫

B、多次寫入,少次讀寫

C、一次寫入,多次讀寫

D、多次寫入,多次讀寫

以下關(guān)于ZooKeeper的描述,哪個是正確的?(abed)

A.ZooKeeper采用Zab協(xié)議來實現(xiàn)消息傳輸?shù)囊恢滦?/p>

B.ZooKeeper節(jié)點可以向Leader同步最新數(shù)據(jù)

C.ZooKeeper采用樹形層次結(jié)構(gòu)的數(shù)據(jù)模型

D.ZooKeeper中的數(shù)據(jù)節(jié)點分為臨時節(jié)點和永久節(jié)點

關(guān)于HDFS的文件寫入,正確的是(c)a

A、支持多用戶對同一文件的寫操作

B、用戶可以在文件任意位置進行修改

C、默認將文件塊復(fù)制成三份存放

D、復(fù)制的文件塊默認都存在同一機架上

Flume的Agent包含以下那些組件?(acd)

A.Source

B.ZNode

C.Channel

D.Sink

HDFS集群中的NameNode職責包括?(abc)

A、維護HDFS集群的目錄樹結(jié)構(gòu)

B、維護HDFS集群的所有數(shù)據(jù)塊的分布、副本數(shù)和負載均衡

C、響應(yīng)客戶端的所有讀寫數(shù)據(jù)請求

D、負責保存客戶端上傳的數(shù)據(jù)

YARN中,任務(wù)進度監(jiān)控是向哪個組件匯報的?(c)

A.ResourceManager

B.NodeManager

C.ApplicationMaster

I).Container

有關(guān)MapReduce的輸入輸出,說法錯誤的是(b)。

A、鏈接多個MapReduce作業(yè)時,序列文件是首選格式

B.FilelnputFormat中實現(xiàn)的getSplits()可以把輸入數(shù)據(jù)劃分為分片,分片數(shù)目和大小任意

定義

C、想完全禁止輸出,可以使用NullOutputFormat

D、每個reduce需將它的輸出寫入自己的文件中,輸出無需分片

下列哪些說法是正確的?':)

A.Hadoop適合數(shù)據(jù)的隨機讀寫。

B.Hadoop的數(shù)據(jù)塊大小(BlockSize)是不可以修改的。

C.Hadoop集群默認沒有嚴格的權(quán)限管理和安全措施保障。

D.因為IIDFS有多個副本,所以NameNode是不存在單點問題的。

MapReduce更擅長:(a)

A.離線計算

B.實時計算

C.流式計算

I).DAG(有向圖)計算

MapReduce編程模型中以下組件哪個是最后執(zhí)行的?(c)

A.Mapper

B.Partitioner

C.Reducer

D.RecordReader

關(guān)于Flume與Sqoop的描述正確的是:()

A.Flume用于實時采集日志,一般用于實時計算

B.Sqoop主要采集關(guān)系型數(shù)據(jù)庫中數(shù)據(jù),常用于離線計算批量處理

C.Sqoop腳本最終會變成提交到Y(jié)ARN上的一個個map任務(wù)

D.Sqoop只支持從關(guān)系型數(shù)據(jù)庫導(dǎo)入到IIDFS,不支持從IIDFS導(dǎo)入到關(guān)系型數(shù)據(jù)庫。

二、填空題。

Hadoop的數(shù)據(jù)塊默認冗余度是________,Hadoop1.x數(shù)據(jù)塊大小默認是________MB,

Hadoop2.x數(shù)據(jù)塊大小默認是MB.

Hadoop是項目的總稱。主要是由一和―組成。

大數(shù)據(jù)的核心問題是________和_________,這兩個核心問題分別對應(yīng)Hadoop的

和這兩個技術(shù)。

—程序負責HDFS數(shù)據(jù)存儲。

—是IIBase中分布式存儲和負載均衡的最小單元。

結(jié)束后臺進程的命令是Io

安裝Hadoop,執(zhí)行hadoop格式化的命令是:。

Hadoop完全分布模式安裝好后,通過jps命令可以查看進程。進程可分兩類,一類進程屬

于HDFS,進程包括NameNode、、,另一類進程屬于YARN,進

程的包括、

四、判斷題

Client端上傳文件到HDFS,數(shù)據(jù)經(jīng)過NameNode傳遞給DataNode

IIDFSFederation,當一個Nanienode掛掉了,不會影響其他Namenode

Hbase的Region由一個或者多個Store組成

Zookcoper通過命令"create-s/tmptmpvalue”可以創(chuàng)建一個臨時節(jié)

MapReduce程序只能對key排序

MapReduce擅長對PB級以上海顯數(shù)據(jù)進行實時處理

Zookeeper服務(wù)端默認的對外服務(wù)端口是3888

五、應(yīng)用題

提示:理解Hbase的shell指令相關(guān)操作。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論