《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第1頁
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第2頁
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第3頁
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第4頁
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)

第三章

一、單選題

1、下列選項中,若是哪個節(jié)點(diǎn)關(guān)閉了,就無法訪問Hadoop集群()o

?A、namenode

?B、datanode

?C>secondarynamenode

?D、yarn

參考答案:A

2、下列說法中,關(guān)于客戶端從HDFS中讀取數(shù)據(jù)的說法錯誤的是()o

?A、客戶端會選取排序靠前的DataNode來依次讀取Block塊

?B、客戶端會把最終讀取出來所有的Block塊合并成一個完整的最終文件

?C、客戶端會選取排序靠后的DataNode來依讀取Block塊

?D、如果客戶端本身就是DataNode,那么將從本地直接獲取數(shù)據(jù)

參考答案:C

3、下列選項中,用于檢驗數(shù)據(jù)完整性的信息的是()o

?A、心跳機(jī)制

?B、ACK機(jī)制

?C,選舉機(jī)制

?D、垃圾回收機(jī)制

參考答案:B

4、下列選項中,關(guān)于HDFS說法錯誤的是()o

?A、HDFS是Hadoop的核心之一

?B、HDFS源于Google的GFS論文

?C、HDFS用于存儲海量大數(shù)據(jù)

?D、HDFS是用于計算海量大數(shù)據(jù)

參考答案:D

5、下列選項中,用于存放部署Hadoop集群服務(wù)器的是()o

?A、namenode

?B、datanode

?C、rack

?D、metadata

參考答案:C

答案解析:Rack是用來存放部署Hadoop集群服務(wù)器的機(jī)架。

6,下列選項中,用于刪除HDFS上文件夾的方法是()o

?A、delete()

?B、rename()

?C>mkdirs()

?D、copyToLocalFile()

參考答案:A

答案解析:FileSystem對象調(diào)用delete()方法可以刪除文件夾,delete()方法接收兩

個參數(shù),第一個參數(shù)表示要刪除的文件夾路徑,第二個參數(shù)用于設(shè)置是否遞歸刪除目

錄。

7、下列選項中,關(guān)于HDFS的架構(gòu)說法正確的是()o

?A、HDFS采用的是主備架構(gòu)

?B、HDFS采用的是主從架構(gòu)

?C、HDFS采用的是從備架構(gòu)

?D、以上說法均錯誤

參考答案:B

答案解析:HDFS采用主從架構(gòu)(Master/Slave架構(gòu))。

8、下列選項中,用于上傳文件的Shell命令是()o

?A、-1s

?B、-mv

?C>-cp

?D>-put

參考答案:D

二、多選題

1、下列選項中,關(guān)于數(shù)據(jù)塊說法正確的是()o

?A、磁盤進(jìn)行數(shù)據(jù)讀/寫的最大單位

?B、磁盤進(jìn)行數(shù)據(jù)讀/寫的最小單位

?C、數(shù)據(jù)塊是抽象的塊

?D、DataNode是按block對數(shù)據(jù)進(jìn)行存儲。

參考答案:B,C.D

2、下列說法中,關(guān)于crontab表達(dá)式說法正確的是()。

?A、通過執(zhí)行crontab表達(dá)式可以執(zhí)行定時任務(wù)

?B、crontab表達(dá)式是由6個參數(shù)決定

?C、Crontab表達(dá)式是由5個參數(shù)決定

?D、以上說法均正確

參考答案:A,B

3、下列說法中,關(guān)于使用JavaAPI操作HDFS說法正確的是()。

?A、需要引入hadoop-common依賴

?B、需要引入hadoop-hdfs依賴

?C、需要引入hadoop-client依賴

?D、以上說法均錯誤

參考答案:A,B.C

4,下列選項中,關(guān)于Metadata元數(shù)據(jù)說法正確的是()。

?A、元數(shù)據(jù)維護(hù)HDFS文件系統(tǒng)中文件和目錄的信息

?B、元數(shù)據(jù)記錄與文件內(nèi)容存儲相關(guān)的信息

?C、元數(shù)據(jù)用來記錄HDFS中所有DataNode的信息

?D、元數(shù)據(jù)用于維護(hù)文件系統(tǒng)名稱并管理客戶端對文件的訪問

參考答案:A,B.C

答案解析:NameNode用于維護(hù)文件系統(tǒng)名稱并管理客戶端對文件的訪問。

三、判斷題

1、HDFS目前不支持并發(fā)多用戶的寫操作,寫操作只能在文件末尾追加數(shù)據(jù)。

?對

?錯

參考答案:對

答案解析:HDFS目前不支持并發(fā)多用戶的寫操作,寫操作只能在文件末尾追加數(shù)據(jù)。

2、HDFS中提供SecondaryNameNode節(jié)點(diǎn),是為了取代掉NameNode節(jié)點(diǎn)。

?對

?錯

參考答案:錯

3、在Windows平臺開發(fā)HDFS項目時,若不設(shè)置Hadoop開發(fā)環(huán)境,也是沒問題的。

?對

?錯

參考答案:錯

答案解析:在Windows平臺開發(fā)HDFS項目時,若不設(shè)置Hadoop開發(fā)環(huán)境,則會報以

下的錯誤:java.io.lOException:(nul1)entryincommandstring:nullchmod

0644o

4、傳統(tǒng)文件系統(tǒng)存儲數(shù)據(jù)時,若文件太大,會導(dǎo)致上傳和下載非常耗時。

?對

?錯

參考答案:對

答案解析:傳統(tǒng)文件系統(tǒng)存儲數(shù)據(jù)時,若文件太大,會導(dǎo)致上傳和下載非常耗時。

5、Hadoop在設(shè)計時考慮到數(shù)據(jù)的安全與高效,數(shù)據(jù)文件默認(rèn)在HDFS上存放一份。

?對

?錯

參考答案:錯

答案解析:Hadoop在設(shè)計時考慮到數(shù)據(jù)的安全與高效,數(shù)據(jù)文件默認(rèn)在HDFS上存放

三份。

6、在采集數(shù)據(jù)的過程中,通過在滾動完文件的名稱后添加一個標(biāo)識的策略,不能避免

因日志文件過大而導(dǎo)致上傳效率低的問題。

?對

?錯

參考答案:錯

答案解析:為了避免因日志文件過大而導(dǎo)致上傳效率低,可以采取在滾動完文件的名

稱后添加一個標(biāo)識的策略來解決這個問題。

7、DataNode在客戶端或者NameNode的調(diào)度下,存儲并檢索數(shù)據(jù)塊,對數(shù)據(jù)塊進(jìn)行創(chuàng)

建、刪除等操作。

?對

?錯

參考答案:對

8、Namenode存儲的是元數(shù)據(jù)信息,元數(shù)據(jù)信息并不是真正的數(shù)據(jù),真正的數(shù)據(jù)是存儲

在DataNode中。

?對

?錯

參考答案:對

9、在安裝配置windows平臺hadoop,配置后直接運(yùn)行是沒有問題的。

?對

?錯

參考答案:錯

10、DataNode是HDFS集群的主節(jié)點(diǎn),NameNode是HDFS集群的從節(jié)點(diǎn)。

?對

?錯

參考答案:錯

答案解析:NameNode是HDFS集群的主節(jié)點(diǎn),DataNode是HDFS集群的從節(jié)點(diǎn)。

11、在Linux中,mkdir命令主要用于在指定路徑下創(chuàng)建子目錄。

?對

?錯

參考答案:對

答案解析:mkdir命令主要用于在指定路徑下創(chuàng)建子目錄。

12、在Hadoop2.x版本下,Block數(shù)據(jù)塊的默認(rèn)大小是64M。

?對

?錯

參考答案:錯

答案解析:在Hadoop2.x版本下,Block數(shù)據(jù)塊的默認(rèn)大小是128M。

13、由于Hadoop是使用Java語言編寫的,因此可以使用JavaAPI操作Hadoop文件

系統(tǒng)。

?對

?錯

參考答案:對

答案解析:由于Hadoop是使用Java語言編寫的,因此可以使用JavaAPI操作

Hadoop文件系統(tǒng)。

14、HDFS適用于低延遲數(shù)據(jù)訪問的場景,例如毫秒級實時查詢。

?對

,錯

參考答案:錯

15、由于Hadoop的設(shè)計對硬件要求低,因此無需構(gòu)建在昂貴的高可用性機(jī)器上,導(dǎo)致

無法保證數(shù)據(jù)的可靠性、安全性和高可用性。

?對

?錯

參考答案:錯

16、通過擴(kuò)容的方式,解決不了傳統(tǒng)文件系統(tǒng)遇到存儲瓶頸的問題。

?對

?錯

參考答案:

答案解析:通過擴(kuò)容的方式,可以解決傳統(tǒng)文件系統(tǒng)遇到存儲瓶頸的問題。

17、SecondaryNameNode可以有效解決Hadoop集群單點(diǎn)故障問題。

?對

?錯

參考答案:對

四、填空題

1、HDFS是可以由[]組成,每個服務(wù)器機(jī)器存儲文件系統(tǒng)數(shù)據(jù)的一部分。

參考答案:【成百上千臺服務(wù)器機(jī)器】

答案解析:HDFS是可以由成百上千臺服務(wù)器機(jī)器組成,每個服務(wù)器機(jī)器存儲文件系統(tǒng)

數(shù)據(jù)的一部分。

2、DataNode中的數(shù)據(jù)塊是以文件的類型存儲在磁盤中,其中包含兩個文件,一是

【】,二是每個數(shù)據(jù)塊對應(yīng)的一個元數(shù)據(jù)文件。

參考答案:【數(shù)據(jù)本身】

3、DataNode之間需要建立[]通道,用于傳輸數(shù)據(jù)包。

參考答案:【Pipeline】

答案解析:DataNode之間需要建立Pipeline通道,用于傳輸數(shù)據(jù)包。

4、在HDFS寫數(shù)據(jù)的流程中,數(shù)據(jù)是以【】的形式進(jìn)行發(fā)送。

參考答案:【數(shù)據(jù)包】

答案解析:在HDFS寫數(shù)據(jù)的流程中,數(shù)據(jù)是以數(shù)據(jù)包的形式進(jìn)行發(fā)送。

5、傳統(tǒng)的文件系統(tǒng)對海量數(shù)據(jù)的處理方式是將數(shù)據(jù)文件直接存儲在【】臺服務(wù)器上。

參考答案:【一】

6、在NameNode內(nèi)部是以元數(shù)據(jù)的形式,維護(hù)著兩個文件,分別是FsImage鏡像文件

和【】文件。

參考答案:【EditLog日志】

7、【】會自動加載HDFS的配置文件core-site,xml,從中獲取Hadoop集群的配置信

息。

參考答案:【Configuration實例】

8、【】節(jié)點(diǎn),負(fù)責(zé)記錄文件系統(tǒng)名稱空間或其屬性的任何更改操作,并存儲配置文件

中設(shè)置備份的數(shù)量。

參考答案:[NameNode]

答案解析:NameNode節(jié)點(diǎn),負(fù)責(zé)記錄文件系統(tǒng)名稱空間或其屬性的任何更改操作,并

存儲配置文件中設(shè)置備份的數(shù)量。

9、NameNode和DataNode通過【】,可以檢測DataNode是否工作。

參考答案:【心跳檢測機(jī)制】

10、一般關(guān)于日志文件產(chǎn)生都是根據(jù)【】而決定。

參考答案:【業(yè)務(wù)】

答案解析:一般日志文件產(chǎn)生是由業(yè)務(wù)決定

11、一個元數(shù)據(jù)文件包括數(shù)據(jù)長度、【】以及時間戳。

參考答案:【塊數(shù)據(jù)校驗和】

12、HDFS采用的是1】的數(shù)據(jù)一致性模型。

參考答案:【一次寫入,多次讀取】

答案解析:HDFS采用的是“一次寫入,多次讀取”的數(shù)據(jù)一致性模型。

13、客戶端從HDFS中查找數(shù)據(jù),即為【】數(shù)據(jù);Client從HDFS中存儲數(shù)據(jù),即為

Write(寫)數(shù)據(jù)。

參考答案:【Read(讀)】

14、擴(kuò)容的方式有兩種,分別是【】和橫向擴(kuò)容。

參考答案:【縱向擴(kuò)容】

15、HDFS與現(xiàn)有的分布式文件系統(tǒng)的主要區(qū)別是HDFS具有[】能力。

參考答案:【高度容錯】

16、NameNode主要以[]的形式對數(shù)據(jù)進(jìn)行管理和存儲。

參考答案:【元數(shù)據(jù)】

答案解析:NameNode主要以元數(shù)據(jù)的形式對數(shù)據(jù)進(jìn)行管理和存儲。

17、文件系統(tǒng)對象FileSystem提供的方法【】用于從HDFS復(fù)制文件到本地磁盤。

參考答案:[copyToLocalFileO]

18、客戶端發(fā)起文件上傳請求,通過【】協(xié)議與NameNode建立通訊。

參考答案:【RPC】

19、在HDFS中,通過執(zhí)行【】命令查看HDFS根目錄下的所有文件及文件夾。

參考答案:【hadoopfs-Is]

答案解析:在HDFS中,通過執(zhí)行“hadoopfsTs”命令查看HDFS根目錄下的所有文

件及文件夾。

五、簡答題

1、簡述單點(diǎn)故障的產(chǎn)生。

參考答案:當(dāng)存儲數(shù)據(jù)塊的服務(wù)器中突然有一臺機(jī)器宕機(jī),我們就無法正常的獲取文

件了,這個問題被稱為單點(diǎn)故障

2、簡述HDFS的優(yōu)點(diǎn)和缺點(diǎn)。

參考答案:HDFS分布式文件系統(tǒng)具有優(yōu)點(diǎn)和缺點(diǎn)。優(yōu)點(diǎn)有高容錯、流式數(shù)據(jù)訪問、支

持超大文件、高數(shù)據(jù)吞吐量以及可構(gòu)建在廉價的機(jī)器上;缺點(diǎn)有高延遲、不適合小文

件存取場景以及不適合并發(fā)寫入。

3、簡述Fslmage鏡像文件和EditLog日志文件。

參考答案:Fslmage鏡像文件用于存儲整個文件系統(tǒng)命名空間的信息,EditLog日志文

件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。

答案解析:Fslmage鏡像文件用于存儲整個文件系統(tǒng)命名空間的信息,EditLog日志文

件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。

4、簡述NameNode管理分布式文件系統(tǒng)的命名空間。

參考答案:在NameNode內(nèi)部是以元數(shù)據(jù)的形式,維護(hù)著兩個文件,分別是Fslmage鏡

像文件和EditLog日志文件。其中,F(xiàn)slmage鏡像文件用于存儲整個文件系統(tǒng)命名空間

的信息,EditLog日志文件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。當(dāng)NameNode

啟動的時候,F(xiàn)slmage鏡像文件就會被加載到內(nèi)存中,然后對內(nèi)存里的數(shù)據(jù)執(zhí)行記錄的

操作,以確保內(nèi)存所保留的數(shù)據(jù)處于最新的狀態(tài),這樣就加快了元數(shù)據(jù)的讀取和更新

操作。

答案解析:在NameNode內(nèi)部是以元數(shù)據(jù)的形式,維護(hù)著兩個文件,分別是Fslmage鏡

像文件和EditLog日志文件。其中,F(xiàn)slmage鏡像文件用于存儲整個文件系統(tǒng)命名空間

的信息,EditLog日志文件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。當(dāng)NameNode

啟動的時候,F(xiàn)slmage鏡像文件就會被加載到內(nèi)存中,然后對內(nèi)存里的數(shù)據(jù)執(zhí)行記錄的

操作,以確保內(nèi)存所保留的數(shù)據(jù)處于最新的狀態(tài),這樣就加快了元數(shù)據(jù)的讀取和更新

操作。

5、簡述HDFS中提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論