華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)_第1頁(yè)
華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)_第2頁(yè)
華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)_第3頁(yè)
華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)_第4頁(yè)
華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:華為大數(shù)據(jù)練習(xí)華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages華為大數(shù)據(jù)練習(xí)第1部分:?jiǎn)雾?xiàng)選擇題,共47題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.對(duì)于運(yùn)行在MapReduce平臺(tái)上的應(yīng)用程序,此應(yīng)用程序所依賴的jar包會(huì)被放到()。A)HIVEB)HBASEC)HDFSD)DB答案:C解析:[單選題]2.HDFS的副本放置策略中,同一機(jī)架不同的服務(wù)器之間的距離是:()。A)3B)2C)1D)4答案:B解析:[單選題]3.以下哪項(xiàng)不屬于數(shù)據(jù)存儲(chǔ)組件?()A)HBaseB)StormC)HDFSD)MySQL答案:B解析:ApacheStorm是一個(gè)免費(fèi)開(kāi)源、分布式、高容錯(cuò)的實(shí)時(shí)計(jì)算系統(tǒng)。Storm令持續(xù)不斷的流計(jì)算變得容易,彌補(bǔ)了Hadoop批處理所不能滿足的實(shí)時(shí)要求。Storm經(jīng)常用于在實(shí)時(shí)分析、在線機(jī)器學(xué)習(xí)、持續(xù)計(jì)算、分布式遠(yuǎn)程調(diào)用和ETL等領(lǐng)域。[單選題]4.DAYU重跑作業(yè)實(shí)例時(shí),不屬于重跑開(kāi)始位置是:()。A)從錯(cuò)誤節(jié)點(diǎn)開(kāi)始重跑B)從指定的節(jié)點(diǎn)開(kāi)始重跑C)從第一個(gè)節(jié)點(diǎn)開(kāi)始重跑D)從上一個(gè)實(shí)例的節(jié)點(diǎn)開(kāi)始跑答案:D解析:[單選題]5.以下()組件負(fù)責(zé)生成和維護(hù)全局事務(wù)ID、事務(wù)快照、時(shí)間戳等全局唯一信息。A)GTMB)WLMC)CND)DN答案:A解析:[單選題]6.HDFS中Namenode的主備仲裁,是由:()組件控制的。A)HDFSClientB)NodeManagerC)ResourceManagerD)ZooKeeperFailoverController答案:D解析:[單選題]7.HBase表設(shè)計(jì)為什么-般不超過(guò)兩個(gè)列簇?()A)過(guò)多的列簇StoreFile過(guò)多,Compaction壓力大B)過(guò)多的列簇I0開(kāi)銷大C)過(guò)多的列簇不適合讀寫分離D)過(guò)多的列簇會(huì)導(dǎo)致memstoreflush時(shí)I0壓力過(guò)大答案:B解析:[單選題]8.Loader特點(diǎn)不包含?()A)圖形化B)實(shí)時(shí)性C)高性能D)安全答案:B解析:[單選題]9.Hbase元數(shù)據(jù)MetaRegion路由器信息存放在()。A)ZookeeperB)Meta表C)HMasterD)Root表答案:B解析:[單選題]10.新建?表/文件遷移作業(yè)?作業(yè)第一步不需要填寫的信息是:()。A)作業(yè)名稱B)源連接名稱C)目的連接名稱D)字段名稱答案:D解析:[單選題]11.離線批處理工具不包含以下哪項(xiàng)?()A)MapReduceB)SQLC)StormD)Spark答案:C解析:[單選題]12.MVCC用于解決()事務(wù)沖突。A)讀讀B)寫寫C)讀寫D)上述都包括答案:C解析:[單選題]13.下列代碼的作用是?()StringgraphName=?graphbase?;Api.createGraph(graphName);A)創(chuàng)建圖B)獲得圖C)刪除圖D)修改圖答案:A解析:[單選題]14.YARN服務(wù)中,如果要給隊(duì)列QuqueA設(shè)置容量為30%,應(yīng)該配置()參數(shù)。A)yarn.scheduler.capacity.root.QueueA.user-limit-factorB)yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC)yarn.scheduler.capacity.root.QueueA.capacityD)yarn.scheduler.capacity.root.QueueA.state答案:C解析:[單選題]15.下面這段代碼的作用是什么?()Try{Rsp=restClientTest.performRequest(?HEAD?,?/?+index,params);If(HttpStatus.SC_OK==rsp.getStatusLine().getStatusCode()){LOG.info(?Checkindexsuccessful,indexisexist:?+index);Returntrue;}If(HttpStatus.SC_NOT_FOUND==rsp.getStatusLine().getStatusCode()){LOG.info(?indexisnotexist:?+index);Returnfalse;}}A)判斷索引是否可用B)判斷索引分片是否存在C)判斷索引是否存在D)判斷索引類型答案:C解析:[單選題]16.當(dāng)前傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)主要面臨的挑戰(zhàn)是()?A)數(shù)據(jù)量爆炸式增長(zhǎng),要求數(shù)據(jù)處理平臺(tái)具備彈性擴(kuò)展能力。B)數(shù)據(jù)處理時(shí)效性需求提高,要求數(shù)據(jù)處理平臺(tái)速度夠快。C)多類型數(shù)據(jù)融合,要求數(shù)據(jù)處理平臺(tái)功能更加強(qiáng)大。D)以上全都正確。答案:D解析:[單選題]17.Loader頁(yè)面是基于開(kāi)源()的圖形化數(shù)據(jù)遷移管理工具()A)HadoopB)HueC)KettleD)Sqoop答案:D解析:[單選題]18.關(guān)于GaussDB200的邏輯架構(gòu),下列說(shuō)法正確的是()?A)DN是實(shí)際數(shù)據(jù)節(jié)點(diǎn),所以只負(fù)責(zé)存儲(chǔ)數(shù)據(jù)。B)CN是協(xié)調(diào)節(jié)點(diǎn),協(xié)助CM管理整個(gè)集群。C)CM是集群的管理模塊,那么負(fù)責(zé)集群的日常管理和運(yùn)維。D)GTM是全局事務(wù)控制器,負(fù)責(zé)生成和維護(hù)全局事務(wù)ID等全局唯一信息。答案:D解析:[單選題]19.YARN的基于標(biāo)準(zhǔn)調(diào)度,是對(duì)下列選項(xiàng)中的()進(jìn)行標(biāo)簽化。A)AppMasterB)ResourceManagerC)NodeManagerD)Container答案:C解析:[單選題]20.以下哪項(xiàng)不屬于Apache頂級(jí)項(xiàng)目?()A)SparkB)StormC)FlinkD)Eclipse答案:D解析:[單選題]21.離線批處理方案的應(yīng)用場(chǎng)景不包括?()A)占用計(jì)算存儲(chǔ)資源多B)快速高效,實(shí)時(shí)的數(shù)據(jù)處理C)數(shù)據(jù)處理格式多樣D)處理大規(guī)模數(shù)據(jù)答案:B解析:[單選題]22.DAYU數(shù)據(jù)開(kāi)發(fā)中,以下不屬于作業(yè)優(yōu)先級(jí)是:()。A)高B)中C)極高D)低答案:C解析:[單選題]23.以下()文件格式為純行式存儲(chǔ)。A)ORCFileB)ParquetFileC)SequenceFileD)RCFile答案:C解析:[單選題]24.若要對(duì)圖片進(jìn)行檢索,一般選擇什么工具較好?()A)MySQLB)HiveC)HDFSD)ElasticSearch答案:D解析:[單選題]25.安裝FusionInsightHD的Streaming組件是,Nimbus角色要求安裝()個(gè)節(jié)點(diǎn)。A)4B)3C)2D)1答案:C解析:[單選題]26.下列哪個(gè)選項(xiàng)可以用來(lái)判斷HBase表是否存在?()A)admin.tableExists(tableName)B)admin.tableExists(TableName.value0f(tableName))C)admin.getTable(tableName)D)tables.containsKey(tableName))答案:B解析:[單選題]27.在Spark中,假設(shè)lines是一個(gè)DStream對(duì)象,filter語(yǔ)句可以過(guò)濾掉80%的數(shù)據(jù),針對(duì)以下兩個(gè)語(yǔ)句說(shuō)法正確的是:()。X:lines.filter(...).groupByKey(...)Y:lines.groupByKey(...).filter(...)A)X比Y的性能更高B)X比Y的性能更低C)X和Y和性能一樣D)無(wú)法確性X和Y的性能差異答案:A解析:[單選題]28.考慮以下場(chǎng)景,當(dāng)公安人員需要根據(jù)某犯罪人員發(fā)現(xiàn)其犯罪同伙時(shí),最適合使用下列哪個(gè)工具?()A)GraphBaseB)HBaseC)HDFSD)ElasticSearch答案:A解析:[單選題]29.Kafka消息默認(rèn)保存時(shí)間為多少天?()A)14天B)30天C)1天D)7天答案:D解析:[單選題]30.關(guān)于GaussDB200的數(shù)據(jù)導(dǎo)入導(dǎo)出下列說(shuō)法正確的是()?A)使用gsq1元命令和COPY命令在使用和用法上是一樣的。B)GDS在數(shù)據(jù)導(dǎo)入時(shí)可以做預(yù)處理,比如非法字符替換、容錯(cuò)處理、數(shù)據(jù)聚合等。C)COPY方式使用簡(jiǎn)單,一般用在大量數(shù)據(jù)的導(dǎo)入導(dǎo)出中。D)INSERT數(shù)據(jù)寫入適合數(shù)據(jù)量不大,并發(fā)度不高的場(chǎng)景。答案:B解析:[單選題]31.Spark自帶的資源管理框架是:()。A)StandaloneB)MesosC)YARND)Docker答案:B解析:[單選題]32.數(shù)據(jù)庫(kù)利用()進(jìn)行死鎖檢測(cè)。A)DAGB)RPCC)WFGD)DLC答案:C解析:[單選題]33.下面()子句專用于GroupBy操作中的條件過(guò)濾功能。A)WHERE子句B)HAVING子句C)LIMIT子句D)ORDERBY子句答案:B解析:[單選題]34.Flink的窗口,按窗口行為劃分不包含以下哪種?(A)A)容量窗口B)滑動(dòng)窗口C)滾動(dòng)窗口D)會(huì)話窗口答案:A解析:[單選題]35.Streaming主要通過(guò)zookeeper提供以下的()實(shí)現(xiàn)事件偵聽(tīng)。A)分布式鎖機(jī)制B)WatcherC)CheckpointD)ACK答案:B解析:[單選題]36.以下關(guān)于Flink關(guān)鍵特性描述不正確的是:()。A)SparkStreaming與Flink相比,時(shí)延更低B)Flink流式處理引擎能夠同時(shí)提供支持流處理和批處理應(yīng)用的功能C)checkpoint實(shí)現(xiàn)了Flink的容錯(cuò)D)與FusionInghtHD中的Streaming相比,F(xiàn)link具有更高的吞吐量答案:A解析:[單選題]37.部署FusionInsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署()個(gè)。A)1B)3C)4D)2答案:D解析:[單選題]38.對(duì)ElasticSearch檢索流程描述正確的是?()A)檢索節(jié)點(diǎn)匯總結(jié)果發(fā)送給客戶端B)分片節(jié)點(diǎn)匯總結(jié)果發(fā)送給客戶端C)檢索節(jié)點(diǎn)不需要匯總結(jié)果直接把結(jié)果發(fā)送給客戶端D)分片節(jié)點(diǎn)不需要匯總結(jié)果直接把結(jié)果發(fā)送給客戶端答案:A解析:[單選題]39.Hive數(shù)據(jù)倉(cāng)庫(kù)分層表的描述不準(zhǔn)確的是?()A)DWD層:結(jié)構(gòu)和粒度與原始表保持一致,簡(jiǎn)單清晰B)ST層:數(shù)據(jù)集市層C)DWS層:以DWD為基礎(chǔ),進(jìn)行輕度匯總D)ODS層:原始數(shù)據(jù)層答案:B解析:[單選題]40.華為FusionInsightHD是國(guó)內(nèi)首家符合國(guó)家金融等級(jí)保護(hù)的大數(shù)據(jù)平臺(tái),其安全性體現(xiàn)在以下()方面。A)系統(tǒng)安全B)權(quán)限認(rèn)證C)數(shù)據(jù)安全D)以上全部正確答案:D解析:[單選題]41.TOPN操作最適合采用哪種Redis數(shù)據(jù)結(jié)構(gòu)?()A)SetB)HashC)ListD)SortedSet答案:D解析:[單選題]42.Redis不適用于以下哪個(gè)應(yīng)用場(chǎng)景?()A)獲取PB級(jí)Value數(shù)據(jù)B)獲取TOPN操作C)獲取手機(jī)驗(yàn)證碼D)獲取最新N個(gè)數(shù)據(jù)的操作答案:A解析:[單選題]43.對(duì)融合數(shù)倉(cāng)解決方案描述正確的是?()A)數(shù)倉(cāng)與大數(shù)據(jù)的并行架構(gòu)B)低成本高擴(kuò)展性的傳統(tǒng)數(shù)倉(cāng)架構(gòu)C)以數(shù)倉(cāng)為核心,大數(shù)據(jù)平臺(tái)為延伸的融合架構(gòu)D)大數(shù)據(jù)平臺(tái)為核心的架構(gòu)答案:C解析:[單選題]44.下面()不是二進(jìn)制類型。A)BLOBB)RAWC)BYTEAD)TEXT答案:D解析:[單選題]45.gateway在ElasticSearch中的含義是?()A)網(wǎng)關(guān)B)索引的存儲(chǔ)方式C)rpc請(qǐng)求接口D)索引快照的存儲(chǔ)方式答案:D解析:gateway的主要職責(zé)是用來(lái)對(duì)數(shù)據(jù)進(jìn)行長(zhǎng)持久化(持久化了之后加上版本信息,不就可以自由的往還于過(guò)去未來(lái)之間了嗎?),另外,整個(gè)集群重啟之后可以通過(guò)gateway重新恢復(fù)數(shù)據(jù),是一種索引快照的存儲(chǔ)方式[單選題]46.flume傳輸數(shù)據(jù)過(guò)程中,為了防止數(shù)據(jù)不丟失,使用的Channel類型是?()A)MemoryChannelB)FileChannelC)JDBCChannelD)HDFSChannel答案:B解析:[單選題]47.Flume的高級(jí)組件不包含以下哪個(gè)?()A)SinkProcessorB)ChannelSelectorC)SourceInterceptorD)ChannelInterceptor答案:D解析:第2部分:多項(xiàng)選擇題,共31題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]48.GraphBase數(shù)據(jù)底層可以存儲(chǔ)在哪里?()A)HBaseB)MySQLC)HDFSD)ElasticSearch答案:AD解析:[多選題]49.對(duì)GaussDB200集群管理模塊(CM)描述不正確的是?()A)負(fù)責(zé)接收來(lái)自應(yīng)用的訪問(wèn)請(qǐng)求B)負(fù)責(zé)存儲(chǔ)數(shù)據(jù)C)全局事務(wù)管理D)由CMAgent、OMMonitor和主備CMServer組成答案:ABC解析:[多選題]50.DAYU作業(yè)的節(jié)點(diǎn)庫(kù)中MRSKafka的失敗策略是:()。A)終止當(dāng)前作業(yè)執(zhí)行計(jì)劃B)繼續(xù)執(zhí)行下一節(jié)點(diǎn)C)掛起當(dāng)前作業(yè)執(zhí)行計(jì)劃D)終止后續(xù)節(jié)點(diǎn)執(zhí)行計(jì)劃答案:ABCD解析:[多選題]51.FusionlnsightHD中,一個(gè)完整的StreamingCQL應(yīng)用程序至少包含:()部分。A)創(chuàng)建輸入流B)創(chuàng)建輸出流C)業(yè)務(wù)操作語(yǔ)句(例如SELECT、INSERT、JION等)D)應(yīng)用提交語(yǔ)句答案:ABC解析:[多選題]52.Redis的LIST數(shù)據(jù)結(jié)構(gòu),適用于:()場(chǎng)景。A)構(gòu)建隊(duì)列系統(tǒng),例如消息隊(duì)列B)uniq操作,例如獲取某段時(shí)間所有:數(shù)據(jù)的排重值C)取最新N個(gè)數(shù)據(jù)操作:例如對(duì)某條微博,獲取最新的10個(gè)評(píng)論D)模擬棧操作答案:ACD解析:[多選題]53.實(shí)時(shí)場(chǎng)景的典型特點(diǎn)是?()A)數(shù)據(jù)量大B)數(shù)據(jù)格式多C)時(shí)延要求高D)交互式查詢答案:BCD解析:[多選題]54.在DAYU數(shù)據(jù)質(zhì)量模塊中,新建規(guī)則塊時(shí)系統(tǒng)內(nèi)置的模板規(guī)則共計(jì)19種,分為四種類型,具體為:()。A)庫(kù)級(jí)規(guī)則B)表級(jí)規(guī)則C)字段級(jí)規(guī)則D)跨字段級(jí)規(guī)則答案:ABCD解析:[多選題]55.Zookeeper可以為FusionInsightHD中的()組件提供分布式管理支持。A)HiveB)LoaderC)HbaseD)Spark答案:ACD解析:[多選題]56.HBase讀數(shù)據(jù)時(shí)需要讀取哪幾部分?jǐn)?shù)據(jù)?()A)HlogB)MemStoreC)HfileD)HDFS答案:BC解析:[多選題]57.Flume中以下哪些選項(xiàng)屬于SinkProcessor的類型?()A)FailoverSinkProcessorB)BlankSinkProcessorC)DefaultSinkProcessorD)LoadbalanceSinkProcessor答案:ACD解析:[多選題]58.FusionInsightHD系統(tǒng)中使用Streaming客戶端shell命令提交拓?fù)渲?,使用StormUI查看發(fā)現(xiàn)該拓?fù)溟L(zhǎng)時(shí)間沒(méi)有:處理數(shù)據(jù),可能原因有:()。A)拓?fù)錁I(yè)務(wù)邏輯錯(cuò)誤,提交之后無(wú)法正常運(yùn)行B)Supervisor是:在Topology中接收數(shù)據(jù)然后執(zhí)行處理的組件C)拓?fù)溥^(guò)于復(fù)雜或者并發(fā)太大,導(dǎo)致worker啟動(dòng)時(shí)間過(guò)長(zhǎng),超過(guò)supervisor的等待時(shí)間D)Supervisor的slots資源被消耗盡,拓?fù)涮峤簧先ズ蠓植坏絪lot去啟動(dòng)worker進(jìn)程答案:ABCD解析:[多選題]59.FusionlnsightHD中,關(guān)于Ooze的作業(yè)管理,對(duì)于己暫停的作業(yè)可以進(jìn)行()操作。A)killB)runC)resumeD)submit答案:AC解析:[多選題]60.Hive支持下列()類型。A)分區(qū)表B)分桶表C)傾斜表D)分區(qū)+分桶表答案:ABCD解析:[多選題]61.在HBase表設(shè)計(jì)中,對(duì)于多項(xiàng)業(yè)務(wù)公用rowkey,導(dǎo)致數(shù)據(jù)訪問(wèn)矛盾的情況,可以有()應(yīng)對(duì)策略。A)折中法(rowkey設(shè)計(jì)兼顧A和B的業(yè)務(wù)需求)B)冗余法(用空間換時(shí)間廠效率)C)創(chuàng)建二級(jí)索引D)預(yù)分region答案:ABC解析:[多選題]62.F1ink中的計(jì)算時(shí)間包含以下哪幾種?()A)DelayTimeB)ProcessingTimeC)EventTimeD)IngestionTime答案:BC解析:[多選題]63.下面關(guān)于FusionInsightLibrA權(quán)限授予的描述正確的有:()。A)權(quán)限授予最小化,只需要SELECT權(quán)限的不需要授予其他權(quán)限B)不要為了方便隨便授予ALLPRIVILEGES權(quán)限C)謹(jǐn)慎授予可能改變表內(nèi)容的操作(update、insert)權(quán)限D(zhuǎn))管理好權(quán)限周期,超過(guò)時(shí)間及時(shí)使用REVOKE回收權(quán)限答案:ABCD解析:[多選題]64.執(zhí)行Hbase讀取數(shù)據(jù)業(yè)務(wù),需要從:()讀取。A)HmasterB)HfileC)HlogD)MetaStore答案:BD解析:[多選題]65.以下哪些是Hive支持的表類型?A)分區(qū)表B)分桶表C)傾斜表D)外部表答案:ABCD解析:[多選題]66.以下能表示為布爾類型?真?值的是:()。A)TRUEB)'t'C)'true'D)'y'答案:ABCD解析:[多選題]67.Google發(fā)布的三篇論文是哪些?()A)GFSB)HDFSC)MapReduceD)BigTable答案:ACD解析:[多選題]68.HBase可以使用下列哪些方法插入數(shù)據(jù)?()A)putB)loadC)arrayD)bulkload答案:AD解析:[多選題]69.Redis使用場(chǎng)景包含以下哪些特點(diǎn)?()A)支持持久化B)豐富數(shù)據(jù)結(jié)構(gòu)存取C)低時(shí)延D)高性能答案:ABCD解析:Redis提供了靈活多變的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)操作,主要應(yīng)用于如下場(chǎng)景:1、取最新N個(gè)數(shù)據(jù)的操作,比如獲取某網(wǎng)站的最新文章。2、排行榜應(yīng)用,取TOPN操作。這個(gè)需求與上面需求的不同之處在于,前面操作以時(shí)間為權(quán)重,這個(gè)是以某個(gè)條件為權(quán)重,比如按點(diǎn)擊的次數(shù)排序。3、需要精準(zhǔn)設(shè)定過(guò)期時(shí)間的應(yīng)用,如用戶會(huì)話信息。4、計(jì)數(shù)器應(yīng)用,比如記錄用戶訪問(wèn)網(wǎng)站次數(shù)。5、構(gòu)建隊(duì)列系統(tǒng),例如消息隊(duì)列。6、緩存,如緩存關(guān)系數(shù)據(jù)庫(kù)中的頻繁訪問(wèn)的表數(shù)據(jù)。7、發(fā)布/訂閱功能,pub/sub8、手機(jī)驗(yàn)證碼,使用expire設(shè)置驗(yàn)證碼失效時(shí)間。[多選題]70.在數(shù)據(jù)同步管理中,創(chuàng)建同步任務(wù)的流程為場(chǎng)景選擇、同步實(shí)例、()、()、預(yù)檢查、任務(wù)確認(rèn)六步。A)源庫(kù)設(shè)置B)源庫(kù)及目標(biāo)庫(kù)C)設(shè)置同步D)實(shí)例創(chuàng)建答案:BC解析:[多選題]71.下面這條GaussDB200的SQL語(yǔ)句?selectname,count(1)fromstudentgroupbyname?可能涉及的算子有哪些?()A)FilterB)StreamingC)GroupAggregateD)HashAggregate答案:ABCD解析:[多選題]72.下面哪些是GaussDB200的特點(diǎn)()?A)支持集群在線擴(kuò)容。B)支持就地升級(jí)。C)支持自動(dòng)降級(jí)。D)支持標(biāo)準(zhǔn)SQL。答案:ABD解析:[多選題]73.以下關(guān)于KafkaPrtition說(shuō)法正確的是:()。A)引入Partition機(jī)制,保證了Kafka的高吞吐能力B)每個(gè)Partition都是:有:序且不可變的消息隊(duì)列C)Partition數(shù)量絕對(duì)了每個(gè)consumergroup中并發(fā)消費(fèi)者的最大數(shù)量D)每個(gè)Partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)log文件答案:ABCD解析:[多選題]74.以下屬于物化算子的有:()。A)ResultB)SortC)AggD)Material答案:BCD解析:[多選題]75.在Loader歷史作業(yè)記錄中,可以查看以下()內(nèi)容。A)作業(yè)狀態(tài)B)臟數(shù)據(jù)鏈接C)錯(cuò)誤行/文件數(shù)量D)作業(yè)開(kāi)始時(shí)間/運(yùn)行時(shí)間答案:ABCD解析:[多選題]76.大數(shù)據(jù)離線批處理場(chǎng)景中常見(jiàn)的數(shù)據(jù)源包括?()A)數(shù)據(jù)庫(kù)B)批量文件數(shù)據(jù)C)流式數(shù)據(jù)Socket流D)網(wǎng)頁(yè)日志流答案:ABCD解析:[多選題]77.關(guān)于數(shù)據(jù)訂閱訂閱數(shù)據(jù)變更類型,正確的是:()。A)updateB)deleteC)insertD)replace答案:ABCD解析:[多選題]78.Flink支持的時(shí)間操作類型包括:以下()選項(xiàng)。A)結(jié)束時(shí)間B)處理時(shí)間C)采集時(shí)間D)事件時(shí)間答案:BD解析:第3部分:判斷題,共10題,請(qǐng)判斷題目是否正確。[判斷題]79.ISA類數(shù)據(jù)采集的數(shù)據(jù)源是textfile。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.在Spark中,累加器可以實(shí)現(xiàn)高速并行的計(jì)數(shù)器和變量求和;在Spark的應(yīng)用程序開(kāi)發(fā)過(guò)程中,只有在Driver上獲取此計(jì)數(shù)器的值。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.在Flume級(jí)聯(lián)傳輸過(guò)程中,可以使用failover模式傳輸,這樣如果下一跳的Flume節(jié)點(diǎn)故障或者數(shù)據(jù)接受異常時(shí),可以自動(dòng)切換到另外一路上繼續(xù)傳輸。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.MapReduce過(guò)程中,默認(rèn)情況下一個(gè)分片就是一個(gè)塊,也是一個(gè)mapTask。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.數(shù)據(jù)中臺(tái)對(duì)外提供可復(fù)用的數(shù)據(jù)處理服務(wù)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.KafkaConsumer寫數(shù)據(jù)的總體流程是,Consumer連接指定的TopicPartition所在的LeaderBroker,用主動(dòng)的方式從Kafka中獲取消息。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.Hbase中OpenScanner的過(guò)程,會(huì)創(chuàng)建兩種不同的Scanner來(lái)讀取Hfile和MetaStore的數(shù)據(jù),Hfile對(duì)應(yīng)的scanner為StoreFileScanner,MetaStore對(duì)應(yīng)的Scanner為MetaStoreScanner。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]86.FusionlnsigtHD中,用戶想通過(guò)HBaseshell操作來(lái)查詢某個(gè)HBase表中的內(nèi)容,這種場(chǎng)景下推薦管理員給這個(gè)用戶分配一個(gè)機(jī)機(jī)賬號(hào)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]87.HDFS運(yùn)行時(shí),NameNode會(huì)將文件系統(tǒng)的元數(shù)據(jù)從磁盤中全部加載到內(nèi)存,因此文件系統(tǒng)所能存儲(chǔ)的文件總數(shù)受限于NameNode的內(nèi)存容量。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]88.SparkOnYarn模式下的driver只能運(yùn)行在客戶端。A)正確B)錯(cuò)誤答案:錯(cuò)解析:第4部分:?jiǎn)柎痤},共12題,請(qǐng)?jiān)诳瞻滋幪顚懻_答案。[問(wèn)答題]89.E1asticSearch的recovery在集群新增或刪除節(jié)點(diǎn)時(shí)發(fā)生。()A)TRUEB)FALSE

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論