Hadoop平臺(tái)構(gòu)建智慧樹知到期末考試答案章節(jié)答案2024年上海思博職業(yè)技術(shù)學(xué)院_第1頁
Hadoop平臺(tái)構(gòu)建智慧樹知到期末考試答案章節(jié)答案2024年上海思博職業(yè)技術(shù)學(xué)院_第2頁
Hadoop平臺(tái)構(gòu)建智慧樹知到期末考試答案章節(jié)答案2024年上海思博職業(yè)技術(shù)學(xué)院_第3頁
Hadoop平臺(tái)構(gòu)建智慧樹知到期末考試答案章節(jié)答案2024年上海思博職業(yè)技術(shù)學(xué)院_第4頁
Hadoop平臺(tái)構(gòu)建智慧樹知到期末考試答案章節(jié)答案2024年上海思博職業(yè)技術(shù)學(xué)院_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Hadoop平臺(tái)構(gòu)建智慧樹知到期末考試答案+章節(jié)答案2024年上海思博職業(yè)技術(shù)學(xué)院zookeeper集群使用的協(xié)議()。

答案:ZAB協(xié)議在spark生態(tài)組件中,哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理()。

答案:sparkcore下列通常是集群最主要的瓶頸是:()

答案:磁盤I/O在ps命令中什么參數(shù)是用來顯示所有用戶的進(jìn)程的?()

答案:a在Hadoop集群中,負(fù)責(zé)海量數(shù)據(jù)的存儲(chǔ)和分析的組件是___B______。

答案:HBasessh服務(wù)端的進(jìn)程名為()

答案:sshd以下哪項(xiàng)不屬于大數(shù)據(jù)思維的涵蓋內(nèi)容():

答案:通過采樣的手段獲取目標(biāo)群體的統(tǒng)計(jì)特性Hadoop的NameNode負(fù)責(zé)____A_____。

答案:管理HDFS的數(shù)據(jù)塊關(guān)于ZKFC故障轉(zhuǎn)移控制器,說法正確的是()。A.當(dāng)集群啟動(dòng)時(shí),主備節(jié)點(diǎn)的概念是很模糊的,當(dāng)ZKFC檢查到任意一個(gè)節(jié)點(diǎn)是健康狀態(tài),直接將其設(shè)置為主節(jié)點(diǎn)。

答案:當(dāng)zkfc檢查到兩個(gè)NN節(jié)點(diǎn)是健康狀態(tài),發(fā)起投票機(jī)制選出一個(gè)主節(jié)點(diǎn),一個(gè)備用節(jié)點(diǎn),并修改主備節(jié)點(diǎn)的狀態(tài)。顯示一個(gè)文件最后幾行的命令是:()

答案:tailHDFS是Hadoop提供的_____A____。

答案:分布式文件系統(tǒng)如何在文件中查找顯示所有以"*"打頭的行?()

答案:grep‘^*’file下面哪條命令可以把f1.txt復(fù)制為f2.txt?()

答案:catf1.txt>f2.txt關(guān)于hadoopMapReduce分片(split)的概念,下列說法不正確的是()

答案:split是一個(gè)物理的存儲(chǔ)概念在Hadoop中,可以使用___C______進(jìn)行流式數(shù)據(jù)處理。

答案:Flume在Hadoop中,可以使用_____C____執(zhí)行高級(jí)數(shù)據(jù)查詢。

答案:YARNHBase默認(rèn)使用什么作為其底層文件存儲(chǔ)系統(tǒng)?()

答案:HDFSZookeeper角色分配不包括()

答案:protecter在Hadoop中,可以使用____C_____進(jìn)行消息傳遞。

答案:Flume在思維方式方面,不是大數(shù)據(jù)顯著影響的是()。

答案:存儲(chǔ)而非計(jì)算RDD可以從hadoop兼容的文件系統(tǒng)生成,生成之后通過調(diào)用RDD算子對RDD的數(shù)據(jù)進(jìn)行部分更新。()

答案:錯(cuò)在Hadoop集群中,HBase負(fù)責(zé)數(shù)據(jù)的增刪改查。()

答案:對Hbase的最小存儲(chǔ)單元不是Region而是一個(gè)Cell單元。()

答案:對假設(shè)HDFS在寫入數(shù)據(jù)是只存2份,那么在寫入過程中,HDFSClient先將數(shù)據(jù)寫入Datanode1,再將數(shù)據(jù)寫入Datanode2。()

答案:錯(cuò)對高價(jià)值高度聚合的信息和知識(shí)的批次處理是大數(shù)據(jù)行業(yè)主要商業(yè)訴求.()

答案:錯(cuò)Hadoop集群具體來說包含兩個(gè)集群:HDFS集群和YARN集群,兩者邏輯上分離,但物理上常在一起()

答案:對在Hadoop中,可以使用Kafka進(jìn)行實(shí)時(shí)數(shù)據(jù)處理。()

答案:錯(cuò)在HDFSNameNode中Fslmage中并沒有記錄具體的記錄塊在哪些數(shù)據(jù)節(jié)點(diǎn)上存儲(chǔ)的,是通過數(shù)據(jù)節(jié)點(diǎn)和名稱節(jié)點(diǎn)在運(yùn)行時(shí)不斷通過溝通而實(shí)時(shí)維護(hù)這些信息的,而這些信息都是存儲(chǔ)到內(nèi)存單中去了。()

答案:錯(cuò)HBase中Compaction的目的是減少同一個(gè)Region,同一個(gè)ColumnFamily下的文件數(shù)目。()

答案:對Hadoop中的HDFS是用來處理非結(jié)構(gòu)化數(shù)據(jù)的。()

答案:錯(cuò)Hadoop的NameNode負(fù)責(zé)存儲(chǔ)HDFS的文件。()

答案:錯(cuò)大數(shù)據(jù)不是萬能的,所以我們要將大數(shù)據(jù)方法結(jié)合傳統(tǒng)的推理預(yù)測方法,才得到一個(gè)更加精確的結(jié)果。()

答案:對HDFS系統(tǒng)不支持?jǐn)?shù)據(jù)的修改。()

答案:對HDFS集群中的數(shù)據(jù)節(jié)點(diǎn)一般是一個(gè)節(jié)點(diǎn)運(yùn)行一個(gè)數(shù)據(jù)節(jié)點(diǎn)進(jìn)程,負(fù)責(zé)處理文件系統(tǒng)客戶端的讀/寫請求,在名稱節(jié)點(diǎn)的統(tǒng)一調(diào)度下進(jìn)行數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制等操作。()

答案:對一個(gè)Java源程序文件中只能定義一個(gè)public類。()

答案:錯(cuò)spark是由C編程語言實(shí)現(xiàn)的。()

答案:錯(cuò)Yarn-client和Yarn-cluster主要區(qū)是ApplicationMaster進(jìn)程的區(qū)別.()

答案:對使用Shell命令insert對HBase中的一張表進(jìn)行數(shù)據(jù)添加操作。()

答案:錯(cuò)Spark是基于內(nèi)存的計(jì)算,所有Spark程序運(yùn)行過程中的數(shù)據(jù)只能存儲(chǔ)在內(nèi)存中。()

答案:錯(cuò)在Hadoop中,可以使用Flume進(jìn)行消息傳遞。()

答案:對Hadoop是一種分布式計(jì)算平臺(tái)。()

答案:對對于大數(shù)據(jù)而言,最基本、最重要的要求就是減少錯(cuò)誤、保證質(zhì)量。因此,大數(shù)據(jù)收集的信息量要盡量精確。()

答案:錯(cuò)MapReduce是分布式并行計(jì)算框架,其計(jì)算模式屬于流計(jì)算,實(shí)時(shí)性好。()

答案:錯(cuò)因?yàn)镠DFS有多個(gè)副本,所以NameNode是不存在單點(diǎn)問題的。()

答案:錯(cuò)Flume傳輸數(shù)據(jù)過程中,sink取走數(shù)據(jù)并寫入目的地后,會(huì)將event從channe中刪除。()

答案:對HBase是Hadoop中的關(guān)系型數(shù)據(jù)庫。()

答案:對Hadoop集群中的任務(wù)調(diào)度和資源管理是由HBase完成的。()

答案:錯(cuò)每個(gè)map槽就是一個(gè)線程。()

答案:錯(cuò)Hadoop支持?jǐn)?shù)據(jù)的隨機(jī)寫。()

答案:錯(cuò)Hadoop是一種關(guān)系型數(shù)據(jù)庫。()

答案:錯(cuò)配置Hadoop時(shí),JAVA_HOME包含在()

答案:hadoop-env.sh基于Hadoop開源大數(shù)據(jù)平臺(tái)主要提供了針對數(shù)據(jù)分布式計(jì)算和存儲(chǔ)能力,如下屬于分布式存儲(chǔ)組件的有()。

答案:HDFS;HBaseHadoop自身具有嚴(yán)格的權(quán)限管理和安全措施保障集群正常運(yùn)行。()

答案:錯(cuò)Hadoop及其生態(tài)系統(tǒng),可以部署在()。

答案:Linux;UNIXHadoop的三種安裝模式包括以下哪種()。

答案:完全分布式模式;單機(jī)模式;偽分布模式SparkStreaming計(jì)算基于DStream將流式計(jì)算分解成一系列短小的批處理作業(yè)。()

答案:錯(cuò)spark的master和worker通過什么方式進(jìn)行通信的()。

答案:AkkaSpark任務(wù)的每個(gè)stage可劃分為job,劃分的標(biāo)記是shuffle。()

答案:錯(cuò)Spark任務(wù)的Executor可以執(zhí)行多個(gè)task。()

答案:錯(cuò)Spark和Hadoop都不適用于迭代計(jì)算的場景。()

答案:錯(cuò)下列不屬于非關(guān)系型數(shù)據(jù)庫的是()。

答案:Hive以下屬于HiveSQL中DDL數(shù)據(jù)定義語言的是()。

答案:建表;刪除表;修改表Hive是一種數(shù)據(jù)倉庫處理工具,使用類sql的HivesqlL語言實(shí)現(xiàn)數(shù)據(jù)查詢功能,所有Hive的數(shù)據(jù)都存儲(chǔ)在HDFS中。()

答案:錯(cuò)Hive中的這條命令“LOADDATALOCAL

INPATH'/opt/college/person.csv'OVERWRITE

into

tableperson;”是個(gè)什么類型的操作(

)。

答案:從Linux本地文件person.csv導(dǎo)入;導(dǎo)入數(shù)據(jù)到表personHIVE的元數(shù)據(jù)可存儲(chǔ)在哪里()。

答案:mysql數(shù)據(jù)庫;derby數(shù)據(jù)庫Hive中的這條命令“droptableperson;”是什么含義(

答案:刪除表關(guān)于hive建表基本描述正確的是()。

答案:創(chuàng)建外部表需要制定external關(guān)鍵字加載數(shù)據(jù)到Hive表,哪種方式不正確()。

答案:Hive支持Insertinto單條記錄的方法,所以可以直接在命令行插入單條記錄對hive中表數(shù)據(jù)操作描述正確的是()。

答案:hive不可以修改特定行值、列值對于Hive中關(guān)于普通表和外部表描述不正確的是()。

答案:外部實(shí)質(zhì)是將已存在于HDFS上的文件路徑跟表關(guān)聯(lián)起來Hadoop是當(dāng)前大數(shù)據(jù)平臺(tái)的事實(shí)標(biāo)準(zhǔn),下列對Hadoop的描述中正確的是()。

答案:Hadoop在當(dāng)前衍生出一系列優(yōu)秀的開源項(xiàng)目,包括Hbase、Hive、Pig等;Hadoop是一個(gè)由Apache基金會(huì)開發(fā)的分布式系統(tǒng)開源架構(gòu);Hadoop的初始設(shè)計(jì)思路來源于Google發(fā)布的學(xué)術(shù)論文;Hadoop的兩個(gè)核心部分是HDFS和MapReduce計(jì)算框架MapReduce與HBase的關(guān)系,()描述是正確的。

答案:兩者不是強(qiáng)關(guān)聯(lián)關(guān)系,沒有MapReduce,HBase可以正常運(yùn)行;MapReduce可以直接訪問HBaseMapReduce程序?qū)?shù)據(jù)的處理主要分為下列哪些過程()。

答案:map;reduce;shuffleMapReduce的inputsplit一定是一個(gè)block。()

答案:錯(cuò)Mapreduce過程中,以下屬于Shuffle機(jī)制的是()。

答案:Sort/Merge;combine;Copy;PartitionHBase依賴()技術(shù)框架提供消息通信機(jī)制。

答案:Zookeeper下列()選項(xiàng)是安裝HBase前所必須安裝的。

答案:操作系統(tǒng);JDKHadoop的HBase主要特點(diǎn)有哪些()

答案:可伸縮;高可靠性;面向列;高性能HBase的數(shù)據(jù)文件HFile中一個(gè)Keyvalue格式包含哪些信息()。

答案:value;Key;TimeStamp;KeytypeHBase系統(tǒng)用于記錄Region相關(guān)信息的表,具體的表包含()。

答案:…META.;-ROOT-以下哪個(gè)不是HDFS的守護(hù)進(jìn)程()。

答案:MrappMaster/YarnChild下列關(guān)于HDFS的描述正確的是()

答案:NameNode磁盤元數(shù)據(jù)不保存Block的位置信息HDfS中的block默認(rèn)保存幾份()。

答案:3下列哪個(gè)屬性是hdfs-site.xml中的配置()。

答案:yarn.resourcemanager.addressHDFS是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征,適合的讀寫任務(wù)是()。

答案:一次寫入,多次讀Hadoop生態(tài)系統(tǒng)中,被作為ETL使用的軟件是()。

答案:SqoopHadoop作為分布式計(jì)算技術(shù)的杰出代表,其主要特征包括()。

答案:健壯性;簡單性;高效性;可靠性以下命令組成錯(cuò)誤的是()。

答案:bin/hadoopfs-cat/hadoopdata/y/txt想要修改集群的備份數(shù)量,可以修改哪個(gè)()。

答案:hdfs-site.xml關(guān)于Hadoop單機(jī)模式和偽分布式模式的說法,正確的是()。

答案:后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況()在許多情況下,能夠達(dá)到99.999%的可用性。

答案:集群解壓.tar.gz結(jié)尾的HBase壓縮包使用的Linux命令

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論