(完整版)hadoop練習(xí)題--帶答案_第1頁(yè)
(完整版)hadoop練習(xí)題--帶答案_第2頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Hadoop 練習(xí)題 姓名: _ 單項(xiàng)選擇題 分?jǐn)?shù): _ 1. 下面哪個(gè)程序負(fù)責(zé) HDFS 數(shù)據(jù)存儲(chǔ)。 a) NameNode b) Jobtracker c) Data node V d) sec on daryNameNode e) tasktracker 2. HDfS 中的 block 默認(rèn)保存幾份? a) 3 份 V b) 2 份 c) 1 份 d) 不確定 3. 下列哪個(gè)程序通常與 NameNode 在一個(gè)節(jié)點(diǎn)啟動(dòng)? a) Secon daryNameNode b) DataNode c) TaskTracker d) Jobtracker V 4. Hadoop 作者 a) Ma

2、rti n Fowler b) Kent Beck c) Doug cutting V 5. HDFS 默認(rèn) Block Size a) 32MB b) 64MB V c) 128MB 6. 下列哪項(xiàng)通常是集群的最主要的性能瓶頸 a) CPU b) 網(wǎng)絡(luò) c) 磁盤V d) 內(nèi)存 7. 關(guān)于 SecondaryNameNode 哪項(xiàng)是正確的? a) 它是 NameNode 的熱備 b) 它對(duì)內(nèi)存沒(méi)有要求 c) 它的目的是幫助 NameNode 合并編輯日志,減少 NameNode 啟動(dòng)時(shí)間 d) SecondaryNameNode 應(yīng)與 NameNode 部署到一個(gè)節(jié)點(diǎn) 8. 一個(gè) gzip

3、文件大小 75MB,客戶端設(shè)置 Block 大小為 64MB,請(qǐng)我其占用幾個(gè) Block? a) 1 b) 2V c) 3 d) 4 9. HDFS 有一個(gè) gzip 文件大小 75MB,客戶端設(shè)置 Block 大小為 64MB。當(dāng)運(yùn)行 mapreduce 任務(wù)讀取該文件時(shí) input split 大小為? a) 64MB b) 75MBV c) 一個(gè) map 讀取 64MB ,另外一個(gè) map 讀取 11MB 10. HDFS 有一個(gè) LZO( with index)文件大小 75MB,客戶端設(shè)置 Block 大小為 64MB。當(dāng)運(yùn) 行 mapreduce 任務(wù)讀取該文件時(shí) input sp

4、lit 大小為? a) 64MB b) 75MB c) 一個(gè) map 讀取 64MB,另外一個(gè) map 讀取 11MB V 多選題: 11. 下列哪項(xiàng)可以作為集群的管理工具 a) PuppetV b) PdshV c) Cloudera ManagerV d) Rsync + ssh + scpV 12. 配置機(jī)架感知的下面哪項(xiàng)正確 a) 如果一個(gè)機(jī)架出問(wèn)題,不會(huì)影響數(shù)據(jù)讀寫(xiě)V b) 寫(xiě)入數(shù)據(jù)的時(shí)候會(huì)寫(xiě)到不同機(jī)架的 DataNode 中V c) MapReduce 會(huì)根據(jù)機(jī)架獲取離自己比較近的網(wǎng)絡(luò)數(shù)據(jù)V 13. Client 端上傳文件的時(shí)候下列哪項(xiàng)正確 a) 數(shù)據(jù)經(jīng)過(guò) NameNode 傳遞

5、給 DataNode b) Client 端將文件以 Block 為單位,管道方式依次傳到 DataNodeV c) Client 只上傳數(shù)據(jù)到一臺(tái) DataNode,然后由 NameNode 負(fù)責(zé) Block 復(fù)制工作 d) 當(dāng)某個(gè) DataNode 失敗,客戶端會(huì)繼續(xù)傳給其它 DataNode V 14. 下列哪個(gè)是 Hadoop 運(yùn)行的模式 a) 單機(jī)版V b) 偽分布式 c) 分布式V 15. Cloudera 提供哪幾種安裝 CDH 的方法 a) Cloudera managerV b) Tar ballV c) YumV d) RpmV 16. Ganglia 不僅可以進(jìn)行監(jiān)控,也

6、可以進(jìn)行告警。 ( ) 17. Nagios 不可以監(jiān)控 Hadoop 集群,因?yàn)樗惶峁?Hadoop 支持。( ) 18. 如果 NameNode 意外終止, SecondaryNameNode 會(huì)接替它使集群繼續(xù)工作。 ( ) 19. Cloudera CDH 是需要付費(fèi)使用的。 ( ) 20. Hadoop 是 Java 開(kāi)發(fā)的,所以 MapReduce 只支持 Java 語(yǔ)言編寫(xiě)。() 21. Hadoop 支持?jǐn)?shù)據(jù)的隨機(jī)寫(xiě)。 ( ) 22. NameNode 負(fù)責(zé)管理 metadata , client 端每次讀寫(xiě)請(qǐng)求,它都會(huì)從磁盤中讀取或則會(huì)寫(xiě) 入 metadata 信息并反饋

7、client 端。( ) 23. NameNode 本地磁盤保存了 Block 的位置信息。 ( ) 24. Slave 節(jié)點(diǎn)要存儲(chǔ)數(shù)據(jù),所以它的磁盤越大越好。 () 25. Hadoop 默認(rèn)調(diào)度器策略為 FIFO,并支持多個(gè) Pool 提交 Job。() 26. 集群內(nèi)每個(gè)節(jié)點(diǎn)都應(yīng)該配 RAID,這樣避免單磁盤損壞,影響整個(gè)節(jié)點(diǎn)運(yùn)行。 () 27. 因?yàn)?HDFS 有多個(gè)副本,所以 NameNode 是不存在單點(diǎn)問(wèn)題的。() 28. 每個(gè) map 槽就是一個(gè)線程。 ( ) 29. Mapreduce 的 input split 就是一個(gè) block 。( ) 30. Hadoop 環(huán)境變量中的 HADOOP_HEAPSIZ 囲于設(shè)置所有 Hadoop 守護(hù)線程的內(nèi)存。它默 認(rèn)是 200MB。() 31. DataNode 首次加入 cluster 的時(shí)候, 如果 log 中報(bào)告不兼容文件版本, 那需要 NameNode 執(zhí)行“ hadoop namenode -format ”

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論