




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、樂智教育大數(shù)據(jù)課程-期中測評您的姓名: 填空題 *_有一批海量數(shù)據(jù),需要實現(xiàn)復(fù)雜計算分析,此時建議使用下面哪個計算引擎? 單選題MapReduceSpark(正確答案)YARNHDFS有一批海量數(shù)據(jù),后期主要側(cè)重于快速的讀寫,有修改需求,此時建議存儲到哪個存儲系統(tǒng)中? 單選題HDFSHBase(正確答案)MySQLRedis在shell命令行中向HDFS上傳文件,需要使用哪個命令? 單選題uploadsetinsertput(正確答案)針對HDFS中NameNode的職責(zé)描述,錯誤的是: 單選題NameNode是整個文件系統(tǒng)的管理節(jié)點NameNode中負(fù)責(zé)維護(hù)File與Block list的關(guān)
2、系NameNode中負(fù)責(zé)存儲文件數(shù)據(jù)(正確答案)NameNode負(fù)責(zé)接收用戶讀寫請求3個5M的文件和1個130M的文件,在HDFS中會產(chǎn)生多少個Block塊? 單選題345(正確答案)6HDFS中的哪個進(jìn)程是負(fù)責(zé)定期將edits文件中的內(nèi)容合并到fsimage中的? 單選題NameNodeDataNodeSecondaryNameNode(正確答案)NodeManagerHive中的數(shù)據(jù)存儲在哪里? 單選題HBaseHDFS(正確答案)本地磁盤MapReduceKafka的消費(fèi)者設(shè)置哪種策略可以實現(xiàn)消費(fèi)最新的數(shù)據(jù)? 單選題beforeearliestlatest(正確答案)after針對HDF
3、S中的小文件問題,可以使用下面哪種解決方案? 單選題Sequencefile(正確答案)NlineFileTextFileDBFileMapReduce中,哪個步驟默認(rèn)是可選的? 單選題排序分組規(guī)約(正確答案)分區(qū)MapReduce編程的時候,針對字符串需要使用哪種數(shù)據(jù)類型? 單選題StringText(正確答案)TextWritableStringWritable在Hadoop2.x中,一個Block塊的大小默認(rèn)是: 單選題64M100M128M(正確答案)256MKafka中生產(chǎn)數(shù)據(jù)時,希望Leader節(jié)點回復(fù)收到消息才確認(rèn)接收成功,此時需要設(shè)置ack的值為? 單選題01(正確答案)23在
4、Hive中,想要實現(xiàn)全局排序需要使用? 單選題SORT BYORDER BY(正確答案)CLUSTER BYDISTRIBUTE BYHive中創(chuàng)建外部表,需要使用關(guān)鍵字: 單選題createexternal(正確答案)partitionlocationHive中哪種類型的表適合做數(shù)據(jù)抽樣? 單選題內(nèi)部表外部表分區(qū)表桶表(正確答案)針對MapReduce程序數(shù)據(jù)傾斜優(yōu)化的手段,錯誤的是: 單選題增加Reduce任務(wù)個數(shù)把傾斜的key打散針對join操作,如果有一個小表,可以考慮實現(xiàn)map端join增加Reduce階段的內(nèi)存(正確答案)YARN中的哪種調(diào)度器可以實現(xiàn)多隊列且隊列內(nèi)部任務(wù)先進(jìn)先出?
5、 單選題FIFO SchedulerCapacity Scheduler(正確答案)Fair SchedulerQueueScheduler針對Spark中RDD的描述,錯誤的是: 單選題RDD數(shù)據(jù)只能存放在內(nèi)存中(正確答案)RDD在抽象上來說是一種元素數(shù)據(jù)的集合,它是被分區(qū)的RDD提供的有容錯性,可以自動從節(jié)點失敗中恢復(fù)過來RDD可以通過集合或者文件來創(chuàng)建下面哪個算子可以解決Spark RDD中數(shù)據(jù)傾斜的問題? 單選題reduceByKeymapPartitionsgroupByKeyrepartition(正確答案)針對Hive的描述,錯誤的是: 單選題Hive的數(shù)據(jù)存儲在HDFS中Hiv
6、e不支持?jǐn)?shù)據(jù)更新Hive底層執(zhí)行引擎可以使用TezHive的數(shù)據(jù)格式是由操作系統(tǒng)決定的(正確答案)HDFS中的Federation機(jī)制無法解決哪個問題? 單選題保證HDFS的高可用(正確答案)提高HDFS集群的讀寫吞吐率實現(xiàn)良好的隔離性提高HDFS集群的擴(kuò)展性Spark這種架構(gòu)不適合應(yīng)用在下面哪個場景中? 單選題低延時的海量數(shù)據(jù)計算需求低延時SQL交互查詢需求準(zhǔn)實時(秒級)海量數(shù)據(jù)計算需求海量離線數(shù)的分布式存儲(正確答案)Spark中執(zhí)行下面哪個算法不會真正執(zhí)行任務(wù)? 單選題reduceByKey(正確答案)countByKeyforeachreduceSpark中下面哪個算子在執(zhí)行的時候不會
7、產(chǎn)生Shuffle? 單選題distinctreduceByKeymap(正確答案)repartition如何指定Hive表中的字段分隔符? 單選題row format delimitedlines terminated bycolumn terminated byfields terminated by(正確答案)使用什么命令向Hive表中加載數(shù)據(jù)? 單選題load data(正確答案)insert intoadd dataalter table如何查看Hive中表t1的詳細(xì)建表語句? 單選題desc t1show create table t1(正確答案)describe t1show t
8、1在zookeeper中修改節(jié)點/abc上的值為1,寫法正確的是: 單選題set /abc 1(正確答案)create /abc 1modify /abc 1get /abc 1向HBase的表t1中添加數(shù)據(jù),寫法正確的是: 單選題put t1,rowkey1,info,abcput t1,rowkey1,info,age:abcput t1,rowkey1,level:abc,age:xyzput t1,rowkey1,level:abc,xyz(正確答案)HBase中,如果一個列族中如果有3列,那么這3列會分到幾個文件中存儲? 單選題1(正確答案)234針對HBase的應(yīng)用場景的介紹,錯誤
9、的是: 單選題適合半結(jié)構(gòu)和非結(jié)構(gòu)數(shù)據(jù)適合存儲記錄稀疏的數(shù)據(jù)適合存儲多版本數(shù)據(jù)適合海量數(shù)據(jù)分析(正確答案)HRegionServer包含了HLog和? 單選題HRegion(正確答案)HMasterHDFSData下面Spark中哪個算子容易導(dǎo)致driver端內(nèi)存溢出? 單選題mapcountcollect(正確答案)takeSpark中想要獲取RDD中的前N個元素,需要使用什么算子? 單選題collecttake(正確答案)countforeachSpark中哪一種持久化策略表示只存儲到內(nèi)存,并且不序列化。 單選題MEMORY_ONLY(正確答案)persist()MEMORY_AND_DIS
10、KMEMORY_ONLY_SERFlume中的哪個組件表示是臨時存儲數(shù)據(jù)的管道? 單選題SourceActionTransformationChannel(正確答案)Flume中的哪種組件可以實現(xiàn)文件的實時監(jiān)控采集? 單選題Spooling Directory SourceExec Source(正確答案)NetCat TCP/UDP SourceKafka SourceFlume中的哪個攔截器可以實現(xiàn)正則抽取功能? 單選題Timestamp InterceptorSearch and Replace InterceptorStatic InterceptorRegex Extractor I
11、nterceptor(正確答案)Flume中的哪種Channel選擇器會將Source采集過來的Event發(fā)往所有Channel? 單選題Replicating Channel Selector(正確答案)More Channel SelectorMultiplexing Channel SelectorRandom Channel SelectorHive支持修改數(shù)據(jù),但是不支持刪除數(shù)據(jù)。 判斷題對錯(正確答案)Hive中的分區(qū)表:表的定義和數(shù)據(jù)的生命周期互相不約束,數(shù)據(jù)只是表對hdfs上的某一個目錄的引用而已。 判斷題對錯(正確答案)HBase中,若MemStore中的數(shù)據(jù)有丟失,則可以從
12、HLog上恢復(fù)。 判斷題對(正確答案)錯HBase中,每一行數(shù)據(jù)中的Rowkey字段不是必須的,可以為null。 判斷題對錯(正確答案)HBase中,針對具有多個歷史版本數(shù)據(jù)的字段,會按照時間戳正序排序。 判斷題對錯(正確答案)HBase中minor合并時會忽略之前標(biāo)記為刪除狀態(tài)的數(shù)據(jù)。 判斷題對錯(正確答案)spark中的map和flatmap算子的區(qū)別是flatmap可以返回多條元素 判斷題對(正確答案)錯spark中的廣播變量可以保證每個Executor內(nèi)部只保存1份變量數(shù)據(jù)。 判斷題對錯(正確答案)spark中的持久化,只是將數(shù)據(jù)保存在內(nèi)存中或者本地磁盤文件中,RDD的lineage(血緣關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)勞動合同解除范本大全
- 授權(quán)代理銷售合同書
- 蔬菜購銷合同范例
- 合同性質(zhì)變更-股權(quán)轉(zhuǎn)讓登記協(xié)議
- 房地產(chǎn)投資合同風(fēng)險防范
- 股權(quán)反擔(dān)保合同模板及范本
- 夫妻離婚房產(chǎn)過戶合同范本
- 技術(shù)員保密合同版
- 股權(quán)轉(zhuǎn)讓合同實施路徑探討
- 建筑工程施工居間合同范本
- JJF1175-2021試驗篩校準(zhǔn)規(guī)范-(高清現(xiàn)行)
- 產(chǎn)品結(jié)構(gòu)設(shè)計概述課件
- 八年級下綜合實踐教案全套
- 胸痹心痛中醫(yī)診療方案及臨床路徑
- 第8課《山山水水》教學(xué)設(shè)計(新人教版小學(xué)美術(shù)六年級上冊)
- word 公章 模板
- 世界技能大賽PPT幻燈片課件(PPT 21頁)
- 中學(xué)生防溺水安全教育課件(PPT 44頁)
- Python程序設(shè)計ppt課件完整版
- T∕ZSQX 008-2020 建設(shè)工程全過程質(zhì)量行為導(dǎo)則
- 《腹膜透析》ppt課件
評論
0/150
提交評論