《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第1頁(yè)
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第2頁(yè)
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第3頁(yè)
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第4頁(yè)
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》習(xí)題解答(二)

第三章

一、單選題

1、下列選項(xiàng)中,若是哪個(gè)節(jié)點(diǎn)關(guān)閉了,就無(wú)法訪問(wèn)Hadoop集群()o

?A、namenode

?B、datanode

?C>secondarynamenode

?D、yarn

參考答案:A

2、下列說(shuō)法中,關(guān)于客戶端從HDFS中讀取數(shù)據(jù)的說(shuō)法錯(cuò)誤的是()o

?A、客戶端會(huì)選取排序靠前的DataNode來(lái)依次讀取Block塊

?B、客戶端會(huì)把最終讀取出來(lái)所有的Block塊合并成一個(gè)完整的最終文件

?C、客戶端會(huì)選取排序靠后的DataNode來(lái)依讀取Block塊

?D、如果客戶端本身就是DataNode,那么將從本地直接獲取數(shù)據(jù)

參考答案:C

3、下列選項(xiàng)中,用于檢驗(yàn)數(shù)據(jù)完整性的信息的是()o

?A、心跳機(jī)制

?B、ACK機(jī)制

?C,選舉機(jī)制

?D、垃圾回收機(jī)制

參考答案:B

4、下列選項(xiàng)中,關(guān)于HDFS說(shuō)法錯(cuò)誤的是()o

?A、HDFS是Hadoop的核心之一

?B、HDFS源于Google的GFS論文

?C、HDFS用于存儲(chǔ)海量大數(shù)據(jù)

?D、HDFS是用于計(jì)算海量大數(shù)據(jù)

參考答案:D

5、下列選項(xiàng)中,用于存放部署Hadoop集群服務(wù)器的是()o

?A、namenode

?B、datanode

?C、rack

?D、metadata

參考答案:C

答案解析:Rack是用來(lái)存放部署Hadoop集群服務(wù)器的機(jī)架。

6,下列選項(xiàng)中,用于刪除HDFS上文件夾的方法是()o

?A、delete()

?B、rename()

?C>mkdirs()

?D、copyToLocalFile()

參考答案:A

答案解析:FileSystem對(duì)象調(diào)用delete()方法可以刪除文件夾,delete()方法接收兩

個(gè)參數(shù),第一個(gè)參數(shù)表示要?jiǎng)h除的文件夾路徑,第二個(gè)參數(shù)用于設(shè)置是否遞歸刪除目

錄。

7、下列選項(xiàng)中,關(guān)于HDFS的架構(gòu)說(shuō)法正確的是()o

?A、HDFS采用的是主備架構(gòu)

?B、HDFS采用的是主從架構(gòu)

?C、HDFS采用的是從備架構(gòu)

?D、以上說(shuō)法均錯(cuò)誤

參考答案:B

答案解析:HDFS采用主從架構(gòu)(Master/Slave架構(gòu))。

8、下列選項(xiàng)中,用于上傳文件的Shell命令是()o

?A、-1s

?B、-mv

?C>-cp

?D>-put

參考答案:D

二、多選題

1、下列選項(xiàng)中,關(guān)于數(shù)據(jù)塊說(shuō)法正確的是()o

?A、磁盤(pán)進(jìn)行數(shù)據(jù)讀/寫(xiě)的最大單位

?B、磁盤(pán)進(jìn)行數(shù)據(jù)讀/寫(xiě)的最小單位

?C、數(shù)據(jù)塊是抽象的塊

?D、DataNode是按block對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。

參考答案:B,C.D

2、下列說(shuō)法中,關(guān)于crontab表達(dá)式說(shuō)法正確的是()。

?A、通過(guò)執(zhí)行crontab表達(dá)式可以執(zhí)行定時(shí)任務(wù)

?B、crontab表達(dá)式是由6個(gè)參數(shù)決定

?C、Crontab表達(dá)式是由5個(gè)參數(shù)決定

?D、以上說(shuō)法均正確

參考答案:A,B

3、下列說(shuō)法中,關(guān)于使用JavaAPI操作HDFS說(shuō)法正確的是()。

?A、需要引入hadoop-common依賴

?B、需要引入hadoop-hdfs依賴

?C、需要引入hadoop-client依賴

?D、以上說(shuō)法均錯(cuò)誤

參考答案:A,B.C

4,下列選項(xiàng)中,關(guān)于Metadata元數(shù)據(jù)說(shuō)法正確的是()。

?A、元數(shù)據(jù)維護(hù)HDFS文件系統(tǒng)中文件和目錄的信息

?B、元數(shù)據(jù)記錄與文件內(nèi)容存儲(chǔ)相關(guān)的信息

?C、元數(shù)據(jù)用來(lái)記錄HDFS中所有DataNode的信息

?D、元數(shù)據(jù)用于維護(hù)文件系統(tǒng)名稱并管理客戶端對(duì)文件的訪問(wèn)

參考答案:A,B.C

答案解析:NameNode用于維護(hù)文件系統(tǒng)名稱并管理客戶端對(duì)文件的訪問(wèn)。

三、判斷題

1、HDFS目前不支持并發(fā)多用戶的寫(xiě)操作,寫(xiě)操作只能在文件末尾追加數(shù)據(jù)。

?對(duì)

?錯(cuò)

參考答案:對(duì)

答案解析:HDFS目前不支持并發(fā)多用戶的寫(xiě)操作,寫(xiě)操作只能在文件末尾追加數(shù)據(jù)。

2、HDFS中提供SecondaryNameNode節(jié)點(diǎn),是為了取代掉NameNode節(jié)點(diǎn)。

?對(duì)

?錯(cuò)

參考答案:錯(cuò)

3、在Windows平臺(tái)開(kāi)發(fā)HDFS項(xiàng)目時(shí),若不設(shè)置Hadoop開(kāi)發(fā)環(huán)境,也是沒(méi)問(wèn)題的。

?對(duì)

?錯(cuò)

參考答案:錯(cuò)

答案解析:在Windows平臺(tái)開(kāi)發(fā)HDFS項(xiàng)目時(shí),若不設(shè)置Hadoop開(kāi)發(fā)環(huán)境,則會(huì)報(bào)以

下的錯(cuò)誤:java.io.lOException:(nul1)entryincommandstring:nullchmod

0644o

4、傳統(tǒng)文件系統(tǒng)存儲(chǔ)數(shù)據(jù)時(shí),若文件太大,會(huì)導(dǎo)致上傳和下載非常耗時(shí)。

?對(duì)

?錯(cuò)

參考答案:對(duì)

答案解析:傳統(tǒng)文件系統(tǒng)存儲(chǔ)數(shù)據(jù)時(shí),若文件太大,會(huì)導(dǎo)致上傳和下載非常耗時(shí)。

5、Hadoop在設(shè)計(jì)時(shí)考慮到數(shù)據(jù)的安全與高效,數(shù)據(jù)文件默認(rèn)在HDFS上存放一份。

?對(duì)

?錯(cuò)

參考答案:錯(cuò)

答案解析:Hadoop在設(shè)計(jì)時(shí)考慮到數(shù)據(jù)的安全與高效,數(shù)據(jù)文件默認(rèn)在HDFS上存放

三份。

6、在采集數(shù)據(jù)的過(guò)程中,通過(guò)在滾動(dòng)完文件的名稱后添加一個(gè)標(biāo)識(shí)的策略,不能避免

因日志文件過(guò)大而導(dǎo)致上傳效率低的問(wèn)題。

?對(duì)

?錯(cuò)

參考答案:錯(cuò)

答案解析:為了避免因日志文件過(guò)大而導(dǎo)致上傳效率低,可以采取在滾動(dòng)完文件的名

稱后添加一個(gè)標(biāo)識(shí)的策略來(lái)解決這個(gè)問(wèn)題。

7、DataNode在客戶端或者NameNode的調(diào)度下,存儲(chǔ)并檢索數(shù)據(jù)塊,對(duì)數(shù)據(jù)塊進(jìn)行創(chuàng)

建、刪除等操作。

?對(duì)

?錯(cuò)

參考答案:對(duì)

8、Namenode存儲(chǔ)的是元數(shù)據(jù)信息,元數(shù)據(jù)信息并不是真正的數(shù)據(jù),真正的數(shù)據(jù)是存儲(chǔ)

在DataNode中。

?對(duì)

?錯(cuò)

參考答案:對(duì)

9、在安裝配置windows平臺(tái)hadoop,配置后直接運(yùn)行是沒(méi)有問(wèn)題的。

?對(duì)

?錯(cuò)

參考答案:錯(cuò)

10、DataNode是HDFS集群的主節(jié)點(diǎn),NameNode是HDFS集群的從節(jié)點(diǎn)。

?對(duì)

?錯(cuò)

參考答案:錯(cuò)

答案解析:NameNode是HDFS集群的主節(jié)點(diǎn),DataNode是HDFS集群的從節(jié)點(diǎn)。

11、在Linux中,mkdir命令主要用于在指定路徑下創(chuàng)建子目錄。

?對(duì)

?錯(cuò)

參考答案:對(duì)

答案解析:mkdir命令主要用于在指定路徑下創(chuàng)建子目錄。

12、在Hadoop2.x版本下,Block數(shù)據(jù)塊的默認(rèn)大小是64M。

?對(duì)

?錯(cuò)

參考答案:錯(cuò)

答案解析:在Hadoop2.x版本下,Block數(shù)據(jù)塊的默認(rèn)大小是128M。

13、由于Hadoop是使用Java語(yǔ)言編寫(xiě)的,因此可以使用JavaAPI操作Hadoop文件

系統(tǒng)。

?對(duì)

?錯(cuò)

參考答案:對(duì)

答案解析:由于Hadoop是使用Java語(yǔ)言編寫(xiě)的,因此可以使用JavaAPI操作

Hadoop文件系統(tǒng)。

14、HDFS適用于低延遲數(shù)據(jù)訪問(wèn)的場(chǎng)景,例如毫秒級(jí)實(shí)時(shí)查詢。

?對(duì)

,錯(cuò)

參考答案:錯(cuò)

15、由于Hadoop的設(shè)計(jì)對(duì)硬件要求低,因此無(wú)需構(gòu)建在昂貴的高可用性機(jī)器上,導(dǎo)致

無(wú)法保證數(shù)據(jù)的可靠性、安全性和高可用性。

?對(duì)

?錯(cuò)

參考答案:錯(cuò)

16、通過(guò)擴(kuò)容的方式,解決不了傳統(tǒng)文件系統(tǒng)遇到存儲(chǔ)瓶頸的問(wèn)題。

?對(duì)

?錯(cuò)

參考答案:

錯(cuò)

答案解析:通過(guò)擴(kuò)容的方式,可以解決傳統(tǒng)文件系統(tǒng)遇到存儲(chǔ)瓶頸的問(wèn)題。

17、SecondaryNameNode可以有效解決Hadoop集群?jiǎn)吸c(diǎn)故障問(wèn)題。

?對(duì)

?錯(cuò)

參考答案:對(duì)

四、填空題

1、HDFS是可以由[]組成,每個(gè)服務(wù)器機(jī)器存儲(chǔ)文件系統(tǒng)數(shù)據(jù)的一部分。

參考答案:【成百上千臺(tái)服務(wù)器機(jī)器】

答案解析:HDFS是可以由成百上千臺(tái)服務(wù)器機(jī)器組成,每個(gè)服務(wù)器機(jī)器存儲(chǔ)文件系統(tǒng)

數(shù)據(jù)的一部分。

2、DataNode中的數(shù)據(jù)塊是以文件的類型存儲(chǔ)在磁盤(pán)中,其中包含兩個(gè)文件,一是

【】,二是每個(gè)數(shù)據(jù)塊對(duì)應(yīng)的一個(gè)元數(shù)據(jù)文件。

參考答案:【數(shù)據(jù)本身】

3、DataNode之間需要建立[]通道,用于傳輸數(shù)據(jù)包。

參考答案:【Pipeline】

答案解析:DataNode之間需要建立Pipeline通道,用于傳輸數(shù)據(jù)包。

4、在HDFS寫(xiě)數(shù)據(jù)的流程中,數(shù)據(jù)是以【】的形式進(jìn)行發(fā)送。

參考答案:【數(shù)據(jù)包】

答案解析:在HDFS寫(xiě)數(shù)據(jù)的流程中,數(shù)據(jù)是以數(shù)據(jù)包的形式進(jìn)行發(fā)送。

5、傳統(tǒng)的文件系統(tǒng)對(duì)海量數(shù)據(jù)的處理方式是將數(shù)據(jù)文件直接存儲(chǔ)在【】臺(tái)服務(wù)器上。

參考答案:【一】

6、在NameNode內(nèi)部是以元數(shù)據(jù)的形式,維護(hù)著兩個(gè)文件,分別是FsImage鏡像文件

和【】文件。

參考答案:【EditLog日志】

7、【】會(huì)自動(dòng)加載HDFS的配置文件core-site,xml,從中獲取Hadoop集群的配置信

息。

參考答案:【Configuration實(shí)例】

8、【】節(jié)點(diǎn),負(fù)責(zé)記錄文件系統(tǒng)名稱空間或其屬性的任何更改操作,并存儲(chǔ)配置文件

中設(shè)置備份的數(shù)量。

參考答案:[NameNode]

答案解析:NameNode節(jié)點(diǎn),負(fù)責(zé)記錄文件系統(tǒng)名稱空間或其屬性的任何更改操作,并

存儲(chǔ)配置文件中設(shè)置備份的數(shù)量。

9、NameNode和DataNode通過(guò)【】,可以檢測(cè)DataNode是否工作。

參考答案:【心跳檢測(cè)機(jī)制】

10、一般關(guān)于日志文件產(chǎn)生都是根據(jù)【】而決定。

參考答案:【業(yè)務(wù)】

答案解析:一般日志文件產(chǎn)生是由業(yè)務(wù)決定

11、一個(gè)元數(shù)據(jù)文件包括數(shù)據(jù)長(zhǎng)度、【】以及時(shí)間戳。

參考答案:【塊數(shù)據(jù)校驗(yàn)和】

12、HDFS采用的是1】的數(shù)據(jù)一致性模型。

參考答案:【一次寫(xiě)入,多次讀取】

答案解析:HDFS采用的是“一次寫(xiě)入,多次讀取”的數(shù)據(jù)一致性模型。

13、客戶端從HDFS中查找數(shù)據(jù),即為【】數(shù)據(jù);Client從HDFS中存儲(chǔ)數(shù)據(jù),即為

Write(寫(xiě))數(shù)據(jù)。

參考答案:【Read(讀)】

14、擴(kuò)容的方式有兩種,分別是【】和橫向擴(kuò)容。

參考答案:【縱向擴(kuò)容】

15、HDFS與現(xiàn)有的分布式文件系統(tǒng)的主要區(qū)別是HDFS具有[】能力。

參考答案:【高度容錯(cuò)】

16、NameNode主要以[]的形式對(duì)數(shù)據(jù)進(jìn)行管理和存儲(chǔ)。

參考答案:【元數(shù)據(jù)】

答案解析:NameNode主要以元數(shù)據(jù)的形式對(duì)數(shù)據(jù)進(jìn)行管理和存儲(chǔ)。

17、文件系統(tǒng)對(duì)象FileSystem提供的方法【】用于從HDFS復(fù)制文件到本地磁盤(pán)。

參考答案:[copyToLocalFileO]

18、客戶端發(fā)起文件上傳請(qǐng)求,通過(guò)【】協(xié)議與NameNode建立通訊。

參考答案:【RPC】

19、在HDFS中,通過(guò)執(zhí)行【】命令查看HDFS根目錄下的所有文件及文件夾。

參考答案:【hadoopfs-Is]

答案解析:在HDFS中,通過(guò)執(zhí)行“hadoopfsTs”命令查看HDFS根目錄下的所有文

件及文件夾。

五、簡(jiǎn)答題

1、簡(jiǎn)述單點(diǎn)故障的產(chǎn)生。

參考答案:當(dāng)存儲(chǔ)數(shù)據(jù)塊的服務(wù)器中突然有一臺(tái)機(jī)器宕機(jī),我們就無(wú)法正常的獲取文

件了,這個(gè)問(wèn)題被稱為單點(diǎn)故障

2、簡(jiǎn)述HDFS的優(yōu)點(diǎn)和缺點(diǎn)。

參考答案:HDFS分布式文件系統(tǒng)具有優(yōu)點(diǎn)和缺點(diǎn)。優(yōu)點(diǎn)有高容錯(cuò)、流式數(shù)據(jù)訪問(wèn)、支

持超大文件、高數(shù)據(jù)吞吐量以及可構(gòu)建在廉價(jià)的機(jī)器上;缺點(diǎn)有高延遲、不適合小文

件存取場(chǎng)景以及不適合并發(fā)寫(xiě)入。

3、簡(jiǎn)述Fslmage鏡像文件和EditLog日志文件。

參考答案:Fslmage鏡像文件用于存儲(chǔ)整個(gè)文件系統(tǒng)命名空間的信息,EditLog日志文

件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。

答案解析:Fslmage鏡像文件用于存儲(chǔ)整個(gè)文件系統(tǒng)命名空間的信息,EditLog日志文

件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。

4、簡(jiǎn)述NameNode管理分布式文件系統(tǒng)的命名空間。

參考答案:在NameNode內(nèi)部是以元數(shù)據(jù)的形式,維護(hù)著兩個(gè)文件,分別是Fslmage鏡

像文件和EditLog日志文件。其中,F(xiàn)slmage鏡像文件用于存儲(chǔ)整個(gè)文件系統(tǒng)命名空間

的信息,EditLog日志文件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。當(dāng)NameNode

啟動(dòng)的時(shí)候,F(xiàn)slmage鏡像文件就會(huì)被加載到內(nèi)存中,然后對(duì)內(nèi)存里的數(shù)據(jù)執(zhí)行記錄的

操作,以確保內(nèi)存所保留的數(shù)據(jù)處于最新的狀態(tài),這樣就加快了元數(shù)據(jù)的讀取和更新

操作。

答案解析:在NameNode內(nèi)部是以元數(shù)據(jù)的形式,維護(hù)著兩個(gè)文件,分別是Fslmage鏡

像文件和EditLog日志文件。其中,F(xiàn)slmage鏡像文件用于存儲(chǔ)整個(gè)文件系統(tǒng)命名空間

的信息,EditLog日志文件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。當(dāng)NameNode

啟動(dòng)的時(shí)候,F(xiàn)slmage鏡像文件就會(huì)被加載到內(nèi)存中,然后對(duì)內(nèi)存里的數(shù)據(jù)執(zhí)行記錄的

操作,以確保內(nèi)存所保留的數(shù)據(jù)處于最新的狀態(tài),這樣就加快了元數(shù)據(jù)的讀取和更新

操作。

5、簡(jiǎn)述HDFS中提

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論