版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第頁HCIP大數(shù)據(jù)復(fù)習(xí)測(cè)試有答案1.HDFS基本系統(tǒng)架構(gòu)中,副本配置通常存儲(chǔ)()份。A、1B、2C、3D、4【正確答案】:C2.以下哪個(gè)選項(xiàng)屬于大數(shù)據(jù)消息系統(tǒng)?A、HDFSB、MapReduceC、YarnD、Kafka【正確答案】:D3.以下哪一個(gè)選項(xiàng)不屬于實(shí)時(shí)檢索項(xiàng)目構(gòu)建的基本流程?A、環(huán)境準(zhǔn)備B、應(yīng)用調(diào)試、部署C、代碼工程D、市場(chǎng)營(yíng)銷【正確答案】:D4.關(guān)于HBase的說法中,以下哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、HBase是一個(gè)NoSQL數(shù)據(jù)庫B、HBase對(duì)于大表的讀寫訪問需要分鐘級(jí)的時(shí)延,C、HBase需要依賴HDFS作為底層的文件存儲(chǔ)系統(tǒng)D、HBase需要依賴Zookeeper進(jìn)行協(xié)同服務(wù)【正確答案】:B5.以下關(guān)于RDD的描述中,錯(cuò)誤的是哪一項(xiàng)?A、RDD默認(rèn)是存儲(chǔ)于內(nèi)存。B、RDD是分布式彈性數(shù)據(jù)集。C、RDD的創(chuàng)建只能依賴HDFS。D、用戶可以選擇不同的存儲(chǔ)級(jí)別緩存RDD以便重用?!菊_答案】:C6.以下哪種資源不是大數(shù)據(jù)集群在進(jìn)行數(shù)據(jù)傳輸過程中遇到的瓶頸?A、網(wǎng)絡(luò)B、CPUC、磁盤/OD、內(nèi)存【正確答案】:B7.以下有關(guān)Hive多表關(guān)聯(lián)的描述,正確的是哪一個(gè)選項(xiàng)?A、Hive最右邊的表是大表,且無法通過命令指定哪張表是大表B、Hive在進(jìn)行多表關(guān)聯(lián)時(shí),從右往左進(jìn)行關(guān)聯(lián)操作C、在HiveSQL中,建議把小表寫在右邊,這樣可以提高執(zhí)行效率D、一般情況下有多少張表進(jìn)行join連接操作,就會(huì)啟動(dòng)多少個(gè)MapReduce任務(wù)【正確答案】:B8.以下哪一項(xiàng)不是SparkSQL的適用場(chǎng)景?A、實(shí)時(shí)數(shù)據(jù)查詢B、需要處理PB級(jí)的大容量數(shù)據(jù)C、結(jié)構(gòu)化數(shù)據(jù)處理D、對(duì)數(shù)據(jù)處理的實(shí)時(shí)性要求不高的場(chǎng)景【正確答案】:A9.Hive表與MySQL類似存在分區(qū)的概念,那么對(duì)于Hive的分區(qū),以下描述中,正確的是哪一項(xiàng)?A、Hive的分區(qū)針對(duì)的是文件,分桶針對(duì)的是文件夾。B、Hive的分區(qū)數(shù)量可以通過參數(shù)動(dòng)態(tài)生成。C、Hive的分區(qū)和分桶是以一個(gè)概念。D、Hive的分區(qū)字段與MySQL一樣必須存在?!菊_答案】:B10.Hive中hive>DESCRIBEinvites這一命令可以實(shí)現(xiàn)以下哪一功能?A、修改表B、瀏覽表C、描述表D、創(chuàng)建表【正確答案】:C11.下列關(guān)于ElasticSearch的說法錯(cuò)誤的是哪一項(xiàng)?A、可以擴(kuò)展到上百臺(tái)服務(wù)器,處理PB級(jí)別的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)B、分布式文件存儲(chǔ),并將每一個(gè)字段都編入索引,使其可以被搜索C、實(shí)時(shí)分析的分布式搜索引擎D、ElasticSearch可以存儲(chǔ)和檢索PB的數(shù)據(jù),只適用于離線批處理場(chǎng)景?!菊_答案】:D12.Hive中trim()函數(shù)的功能是以下哪一選項(xiàng)?A、字符串截取B、返回近似值。C、計(jì)算絕對(duì)值D、去除空字符串【正確答案】:D13.以下關(guān)于KeyBy算子的描述,錯(cuò)誤的是哪一項(xiàng)?A、數(shù)據(jù)類型轉(zhuǎn)換是KeyedStream->DataStreamB、每個(gè)分區(qū)包含具有相同key的元素C、邏輯地將一個(gè)流拆分成不相交的分區(qū)D、在內(nèi)部以hash的形式實(shí)現(xiàn)的【正確答案】:A14.關(guān)于HBase,以下描述正確的是哪一項(xiàng)?A、對(duì)于絕大部分企業(yè)級(jí)大數(shù)據(jù)平臺(tái)而言,HBase底層需依賴HDFS存儲(chǔ)海量數(shù)據(jù)B、HBase可輕易實(shí)現(xiàn)海量數(shù)據(jù)的全局A,CID特性C、HBase和Zookeeper不是強(qiáng)綁定的D、HBase無法存儲(chǔ)結(jié)構(gòu)稀疏的表格【正確答案】:A15.以下關(guān)于SinkProcessor的描述,錯(cuò)誤的是哪一項(xiàng)?A、DefaultSinkProcessor是默認(rèn)類型,需要配置SinkgroupsB、FalloverSinkProcessor是故障轉(zhuǎn)移機(jī)制C、主要作用是針對(duì)Sinkgroups的處理策略設(shè)置D、L0A,DbalanceSinkProcessor是負(fù)載均衡機(jī)制【正確答案】:A16.大數(shù)據(jù)環(huán)境下的隱私擔(dān)憂,主要表現(xiàn)為以下哪個(gè)選項(xiàng)?A、用戶畫像的生成B、病毒入侵C、個(gè)人信息的被識(shí)別與暴露D、內(nèi)存溢出【正確答案】:C17.以下哪一個(gè)組件可以將SQL語句轉(zhuǎn)化為HBase的Scan操作?ApacheStormB、ApachePhoenixC、ApacheMapReduceD、ApacheHDFS【正確答案】:B18.以下哪一選項(xiàng)不屬于分布式架構(gòu)應(yīng)對(duì)故障的策略?()A、單集群跨AZ高可用B、異地容災(zāi)集群C、數(shù)據(jù)多副本,支持磁盤熱拔插D、滾動(dòng)升級(jí)/補(bǔ)丁【正確答案】:D19.以下關(guān)于Sqoop數(shù)據(jù)導(dǎo)入原理的描述中,錯(cuò)誤的是哪一項(xiàng)?A、Sqoop在import時(shí),需要指定split-by參數(shù)。B、Sqoop會(huì)根據(jù)傳入的num-mappers來確定劃分幾個(gè)區(qū)域。C、Sqoop根據(jù)不同的split-by參數(shù)值來進(jìn)行切分,然后將切分出來的區(qū)域分配到不同map中。D、num-nappers越大效率越高?!菊_答案】:D20.Spark中A,Ction算子返回的是以下哪一選項(xiàng)?A、依賴關(guān)系B、DAG圖C、RDDD、計(jì)算結(jié)果或者是寫入存儲(chǔ)操作【正確答案】:D21.以下關(guān)于HliveStreaming的描述,錯(cuò)誤的是哪一頂?A、通過FlinkSQL可以更簡(jiǎn)單的對(duì)Hive表中的數(shù)據(jù)進(jìn)行讀寫等操作B、Flink1.11的HiveStreaming功能大大提高了Hive數(shù)倉的實(shí)時(shí)性C、HiveStreaming對(duì)ETL作業(yè)非常有利D、HiveStreaming不支持流式持續(xù)查詢的需求【正確答案】:D22.以下關(guān)于GES四大特點(diǎn)的描述,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、查詢分析一體:提供豐富的圖分析算法,實(shí)現(xiàn)了查詢分析一體化,可以為關(guān)系分析、路徑規(guī)劃、營(yíng)銷推薦等業(yè)務(wù)提供多樣的分析能力B、高性能:對(duì)分布式圖形計(jì)算引擎進(jìn)行了深度優(yōu)化,能達(dá)到小時(shí)級(jí)響應(yīng)速度的查詢能力C、簡(jiǎn)單易用:支持Gremlin查詢語言,兼容不同用戶的使用習(xí)慣D、大規(guī)模:具有高效的數(shù)據(jù)組織能力,可以更有效地對(duì)百億節(jié)點(diǎn)千億邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析【正確答案】:B23.以下HBase讀取數(shù)據(jù)的命令中,錯(cuò)誤的是哪一項(xiàng)?A、scan'my_table',(STARTROW=>'123001',Limit=>2)B、get'my_table','123001'C、scan'my_table'D、scan'my_table','123001'【正確答案】:D24.以下哪一個(gè)概念是ElasticSearch中的邏輯命名空間?A、TypeB、SchemaC、IndexD、NameSpace【正確答案】:C25.以下哪個(gè)場(chǎng)景是HDFS適合做的?A、大量小文件存儲(chǔ)B、流式數(shù)據(jù)訪問C、隨機(jī)寫入D、低延遲讀取【正確答案】:B26.關(guān)于GES特點(diǎn),以下描述中正確的是哪一項(xiàng)?A、簡(jiǎn)單易用:支持SQL查詢語言,兼容不同用戶的使用習(xí)慣B、高性能:對(duì)分布式圖形計(jì)算引警進(jìn)行了深度優(yōu)化,具有高井發(fā)、最快可達(dá)分鐘級(jí)時(shí)延的實(shí)時(shí)查詢能力C、大規(guī)模:最大可支持百萬節(jié)點(diǎn)千萬邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析D、查詢分析一體:提供豐富的圖分析算法,實(shí)現(xiàn)了查詢分析一體化【正確答案】:D27.Spark處理數(shù)據(jù)時(shí)產(chǎn)生的中間產(chǎn)物會(huì)存放到以下哪一選項(xiàng)中?A、磁盤B、網(wǎng)絡(luò)C、內(nèi)存D、云上【正確答案】:C28.Redis中哪個(gè)命令是查看鍵的剩余生存時(shí)間?A、ttlB、expireatC、persistD、expire【正確答案】:A29.以下哪一項(xiàng)不屬于Flink組件的滾動(dòng)聚合算子?A、KeyBy()B、minBy()C、min()D、sum()【正確答案】:A30.消息系統(tǒng)Kafka如何保證高吞吐能力?A、Partition機(jī)制B、持久性機(jī)制C、多訂閱者機(jī)制D、冗余備份機(jī)制【正確答案】:A31.df.select($"id",$"name").orderBy($"id",desc).show關(guān)于以上代碼,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、該行代碼會(huì)按照從小到大進(jìn)行排序B、使用該代碼之前,需要先創(chuàng)建或?qū)?shù)據(jù)注冊(cè)成為DataFrame,并起名為dfC、該代碼是SparkSQL的查詢語句D、如果不加。show函數(shù),該命令不會(huì)返回查詢的結(jié)果【正確答案】:A32.關(guān)于ElasticSearch生態(tài)圈,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、elasticsearch-head:深度集成Hadoop和ElasticSearch的項(xiàng)目,是官方維護(hù)的一個(gè)子項(xiàng)目Beats:專門用于發(fā)送數(shù)據(jù)的平臺(tái),可以將數(shù)據(jù)無縫傳輸給Logstash或是ElasticSearchC、Logstash:具備實(shí)時(shí)數(shù)據(jù)傳輸能力的管道,著重日志相關(guān)處理D、Kibana:開源的分析和可視化平臺(tái),基于ElasticSearch的搜索與分析能力,拿到用于上層分析和可視化需要的結(jié)果【正確答案】:A33.在Flume架構(gòu)中,以下哪一種類型的Sink支持將數(shù)據(jù)寫入到Solr中?A、thiftsinkB、filerollsinkC、MorphlineSolrsinkD、hdfssink【正確答案】:C34.關(guān)于ElasticSearch的說法,下列錯(cuò)誤的是哪一項(xiàng)?A、ElasticSearch可以把一個(gè)完整的索引分成多個(gè)分片B、ElasticSearch可以不需要Zookeeper的支特、C、EsMaster可以臨時(shí)管理集群級(jí)別刷的一些變更D、ElasticSearch可以設(shè)置多個(gè)索引的副本【正確答案】:B35.在華為云GES中,想要給圖g中id為"Katherine"的用戶添加朋友為"zhangsan"。以下哪一個(gè)選項(xiàng)能正確實(shí)現(xiàn)上述目的?A、g.addV('friends').from(g.V("Katherine")).to(g.V("zhangsan"))B、g.addV('friends').from(g.V("zhangsan")).to(g.V("Katherine"))C、g.addE('friends').from(g.V("zhangsan")).to(g.V("Katherine"))D、g.addE('friends').from(g.V("Katherine").to(g.V("zhangsan"))【正確答案】:D36.以下關(guān)于Redis中String類型的描述,錯(cuò)誤的是哪一項(xiàng)?A、一個(gè)字符串類型的值存儲(chǔ)的最大容量是1MBB、字符串類型是Redis中最基本的數(shù)據(jù)類型C、可以存儲(chǔ)圖片D、可以存儲(chǔ)文本數(shù)據(jù)【正確答案】:A37.Hive與傳統(tǒng)數(shù)據(jù)倉庫的區(qū)別不包括以下哪一選項(xiàng)?A、索引B、易用性C、面向?qū)ο驞、執(zhí)行引擎【正確答案】:C38.關(guān)于HBase中HRegionServer的故障處理機(jī)制,以下說法中哪一項(xiàng)是錯(cuò)誤的?A、共用日志優(yōu)點(diǎn):恢復(fù)時(shí)需要分拆日志;缺點(diǎn):提高對(duì)表的寫操作性能B、根據(jù)日志記錄所屬的Region對(duì)象對(duì)HLog數(shù)據(jù)進(jìn)行拆分,分別放到相應(yīng)Region對(duì)象的目錄下C、Zookeeper會(huì)實(shí)時(shí)監(jiān)測(cè)每個(gè)HRegionServer的狀態(tài),當(dāng)某個(gè)HRegionServer發(fā)生故障時(shí),Zookeeper會(huì)通知HMasterD、HMaster首先會(huì)處理發(fā)生故障的HRegionServer上面遺留的HLog文件,這個(gè)遺留的HLog文件中包含了來自多個(gè)Region對(duì)象的日志記錄【正確答案】:A39.某大數(shù)據(jù)業(yè)務(wù)人員在查詢某張表的業(yè)務(wù)數(shù)據(jù)時(shí),希望查詢出來的數(shù)值結(jié)果保留兩位小數(shù)他應(yīng)該使用哪個(gè)函數(shù)來實(shí)現(xiàn)?A、randB、absC、trimD、round【正確答案】:D40.不同的Channel提供的持久化水平也是不一樣的,其中()不會(huì)持久化;A、MemoryChannel、JDBCChannel、FileChannelB、FileChannel、JDBCChannel、MemoryChannelC、JDBCChannel、MemoryChannel、FileChanelD、MemoryChannel、FileChannel、JDBCChannel【正確答案】:D41.假設(shè)現(xiàn)在要做一個(gè)可以根據(jù)線索指導(dǎo)運(yùn)維人員進(jìn)行排障的功能,你建議選擇下列哪個(gè)工具實(shí)現(xiàn)該功能?A、LuceneB、HBaseC、GESD、ElasticSearch【正確答案】:D42.Spark讀取任務(wù)參數(shù)優(yōu)先級(jí)最高的是以下哪一選項(xiàng)?A、動(dòng)態(tài)參數(shù)B、代碼配置C、配置文件D、客戶端配置【正確答案】:B43.以下哪個(gè)選項(xiàng)不屬于智慧城市所需要的技術(shù)?AI計(jì)算B、大數(shù)據(jù)C、手工制作D、智慧交通【正確答案】:C44.某大數(shù)據(jù)運(yùn)維人員想通過shell命令上傳某個(gè)文件至HDFS文件系統(tǒng)中。以下哪個(gè)命令能幫助他完成這個(gè)操作?A、-putB、-getC、-uploadD、-cat【正確答案】:A45.關(guān)于HBase中的BloomFilter,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、BloomFilter用來優(yōu)化一些隨機(jī)讀取的場(chǎng)景,即Get場(chǎng)景BloomFilter可以被用來快速的判斷一條數(shù)據(jù)在一個(gè)大的數(shù)據(jù)集合中是否存在C、如果BloomFilter判斷結(jié)果為“該條數(shù)據(jù)不存在”,這一結(jié)果擁有一定的誤判率D、HBase的BloomFilter的相關(guān)數(shù)據(jù),被保存在HFile中【正確答案】:C46.以下描述中,哪一個(gè)選項(xiàng)屬于HDFS的使用場(chǎng)景?A、海量氣象數(shù)據(jù)存儲(chǔ)B、集群資源調(diào)配管理C、社交媒體數(shù)據(jù)流式分析D、數(shù)據(jù)采集與分發(fā)【正確答案】:A47.HBase默以使用什么組件作為其底層文件存儲(chǔ)系統(tǒng)()A、FileB、KafkaC、MemoryD、HDFS【正確答案】:D48.Hive架構(gòu)中有一個(gè)Driver模塊用于對(duì)SQL語句進(jìn)行轉(zhuǎn)化,那么對(duì)于Driver的描述中,正確的是哪一項(xiàng)?A、Driver中的Compiler負(fù)責(zé)對(duì)HiveQL生成的執(zhí)行計(jì)劃和MapReduce任務(wù)進(jìn)行優(yōu)化B、Driver中的Optimizer負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)。C、Driver中的Executor負(fù)責(zé)按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)Driver指Java的JDBC連接所用的Driver類。【正確答案】:C49.企業(yè)級(jí)數(shù)據(jù)分析平臺(tái)的演進(jìn)趨勢(shì)不包括以下哪一階段A、無組織架構(gòu)階段B、單一架構(gòu)階段C、存算分離架構(gòu)階段D、存算融合架構(gòu)階段【正確答案】:A50.以下哪一選項(xiàng)不屬于華為云MRS中Manager的特點(diǎn)?A、一鍵式部署、升級(jí)B、運(yùn)維難度高C、管理員可全面掌握集群運(yùn)行狀態(tài)D、故障快速定位【正確答案】:B51.在MRSHDFS中,將HDFS根目錄下的a.txt重命名為b.txt,以下哪一個(gè)選項(xiàng)可以實(shí)現(xiàn)上述目的?A、hdfsdfs-rm/a.txt/b.txtB、hdfsdfs-mv/a.txt/b.txtC、hdfsdfs-put/a.txt/b.txtD、hdfsdfs-1s/a.txt/b.txt【正確答案】:B52.GES基于ElasticSearch于的索引機(jī)制,能根據(jù)索引快速查詢數(shù)據(jù)。A、對(duì)(參考答案)B、錯(cuò)【正確答案】:A53.在HDFS中"認(rèn)為硬件,總是不可靠的"體現(xiàn)了以下哪一個(gè)特性?A、高吞吐量B、大文件存儲(chǔ)C、高容錯(cuò)性D、彈性伸縮【正確答案】:C54.在HDFS的架構(gòu)中NameNode主要存儲(chǔ)元數(shù)據(jù)。以下哪個(gè)不是元數(shù)據(jù)?A、文件位置B、文件大小C、文件權(quán)限D(zhuǎn)、文件數(shù)據(jù)【正確答案】:D55.關(guān)于Spark中的DataSet,以下哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、DataSet與RDD高度類似,但在利用SparkSQL進(jìn)行處理時(shí)性能比RDD好B、DataSet不需要反序列化就可執(zhí)行大部分操作C、DataSet是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合DataSet執(zhí)行sot、filter、shuffle等操作需要進(jìn)行反序列化【正確答案】:A56.關(guān)于HBase集群架構(gòu)組成各部分描述錯(cuò)誤的是哪一選項(xiàng)?A、正常HBase表只有一個(gè)Region,不支持分裂B、Client可用于緩存維護(hù)已經(jīng)訪問過的Region的位置信息C、HRegionServer負(fù)責(zé)處理數(shù)據(jù)讀寫請(qǐng)求D、HMaster主要負(fù)責(zé)Region的管理工作【正確答案】:A57.SparkRDD常用算子包含Transformation算子和A,Ction算子,下列哪一個(gè)選項(xiàng)屬于ACtion算子?A、MapB、saveAsTextFileC、reduceByKeyD、filter【正確答案】:B58.以下關(guān)于數(shù)據(jù)倉庫分層優(yōu)點(diǎn)的描述中,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、分層可將復(fù)雜問題簡(jiǎn)單化B、分層之后真實(shí)數(shù)據(jù)與統(tǒng)計(jì)數(shù)據(jù)耦合在一起,減少了存儲(chǔ)空間消耗C、分層可以隔離原始數(shù)據(jù)D、分層可減少重復(fù)開發(fā)【正確答案】:B59.如果想把Redis的Key中存儲(chǔ)的數(shù)字值減1,該使用下列哪一個(gè)命令?A、incrbyB、decrC、decrbyD、incr【正確答案】:B60.以下關(guān)于SparkSQL中DataSet的描述中,錯(cuò)誤的是哪一項(xiàng)?A、DataSet是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合。B、DataSet是"懶惰"的,只在執(zhí)行A,Ction操作時(shí)觸發(fā)計(jì)算C、DataSet需要反序列化才可以執(zhí)行大部分操作。DataSet與RDD高度類似【正確答案】:C61.以下描述中,哪一項(xiàng)不是實(shí)時(shí)檢索技術(shù)在金融行業(yè)的應(yīng)用特點(diǎn)?A、高并發(fā)B、查詢條件復(fù)雜C、時(shí)延要求高D、存在海量圖片小文件【正確答案】:B62.HiveSQL中DDL指定是哪一種語言?A、數(shù)據(jù)刪除語言B、數(shù)據(jù)查詢語言C、數(shù)據(jù)管理語言D、數(shù)據(jù)定義語言【正確答案】:D63.下列哪一個(gè)命令可以清空Redis實(shí)例下所有數(shù)據(jù)庫的數(shù)據(jù)A、dropallB、flushallC、dropdbD、flushdb【正確答案】:B64.Kafka的shell命令中,哪一個(gè)參數(shù)是設(shè)置副本個(gè)數(shù)?A、broker-listB、partitionsC、bootstrap-serverD、replication-fA,Ctor【正確答案】:D65.Irange是Redis中哪種數(shù)據(jù)類型的命令?A、SetB、ListC、HashD、String【正確答案】:B66.實(shí)時(shí)處理的步驟中,實(shí)時(shí)計(jì)算的前一步是以下哪一項(xiàng)?A、實(shí)時(shí)展示B、實(shí)時(shí)落地C、實(shí)時(shí)緩存存儲(chǔ)D、實(shí)時(shí)采集【正確答案】:C67.關(guān)于HBase的RowKey,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、RowKey默認(rèn)最大長(zhǎng)度64KB,實(shí)際應(yīng)用中一般為10~100字節(jié)B、在HBase中,每一個(gè)RowKey都是一串字節(jié)數(shù)組C、RowKey是一個(gè)長(zhǎng)整型對(duì)象D、RowKey默認(rèn)按照字典序存儲(chǔ)【正確答案】:C68.以下大數(shù)據(jù)精準(zhǔn)廣告發(fā)展方向不包括哪一項(xiàng)?A、平臺(tái)化B、自動(dòng)化C、精準(zhǔn)化D、價(jià)值化【正確答案】:A69.基于WAL(預(yù)寫式日志W(wǎng)rite-AheadLog)實(shí)現(xiàn)持久化的Channel類型,是以下的哪一項(xiàng)?A、FileChannelB、ODBCChannelC、JDBCChannelD、MemoryChannel【正確答案】:A70.下面哪一項(xiàng)不是Kafka的組件?A、BrokersB、ConsumerC、TopicD、Zookeeper【正確答案】:D71.關(guān)于ElasticSearch核心概念,以下哪一項(xiàng)說法是錯(cuò)誤的?A、Document文檔,是可以被素引的基本單位,特指最頂層結(jié)構(gòu)或根對(duì)象序列化成的JSoN數(shù)據(jù)B、Mapping:映射,用來約束字段的類型,可以根據(jù)數(shù)據(jù)自動(dòng)創(chuàng)建,相當(dāng)于數(shù)據(jù)庫中的ShemaC、Type:文檔類型,文檔類型使得同一個(gè)素引中在存儲(chǔ)結(jié)構(gòu)不同的文檔時(shí),只需要依據(jù)文檔類型就可以找到對(duì)應(yīng)的參數(shù)映射信息,方便文檔的存儲(chǔ)D、Index:是ElasticSearch中一個(gè)邏輯命名空間,與關(guān)系數(shù)據(jù)庫實(shí)例DatA,Base相當(dāng),只能存放結(jié)構(gòu)化數(shù)據(jù)【正確答案】:D72.RedisMaster-Slave采用Master-Slave架構(gòu),由Masterslave節(jié)點(diǎn)管理工作。A、對(duì)B、錯(cuò)(參考答案)【正確答案】:B73.有關(guān)實(shí)時(shí)檢索技術(shù)在金融行業(yè)的應(yīng)用,以下哪一項(xiàng)說法是錯(cuò)誤的?()A、實(shí)時(shí)檢索技術(shù)可完成查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款等B、底層可以整合多方數(shù)據(jù),形城關(guān)系網(wǎng)絡(luò),查詢關(guān)聯(lián)關(guān)系,可用于反洗錢、風(fēng)控等場(chǎng)景C、對(duì)于簡(jiǎn)單查詢的場(chǎng)景,要求響應(yīng)時(shí)間在10分鐘左右D、可以根據(jù)ID(日志類型、卡號(hào)等)和時(shí)間段進(jìn)行查詢【正確答案】:C74.在HBase中,實(shí)現(xiàn)不同HRegionServer之間的負(fù)載均衡是由以下哪一個(gè)組件負(fù)責(zé)管理的?A、HfileB、HlogC、HMasterD、MemStore【正確答案】:C75.以下哪一選項(xiàng)不是批流融合的實(shí)時(shí)決策系統(tǒng)的優(yōu)勢(shì)?A、維護(hù)難度大B、吞吐量高C、可靠性高D、批-流融合計(jì)算【正確答案】:A76.在大數(shù)據(jù)業(yè)務(wù)處理的場(chǎng)景中,常常說不適合存儲(chǔ)大量的小文件。這主要是受以下哪個(gè)組件的影響?A、YarnB、HDFSC、HiveD、MapReduce【正確答案】:B77.Spark2.0中引入了()的概念,它為用戶提供了一個(gè)統(tǒng)的切入點(diǎn)來使用Spark的各項(xiàng)功能。A、SparkSessionB、SparkTextC、SparkConfD、SparkContext【正確答案】:A78.關(guān)于HBase的RegionSplit,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、RegionSplit過程不需要HMaster進(jìn)行管理B、將大表分裂出多個(gè)Region有助于提高數(shù)據(jù)的讀寫效率C、RegionSplit速度很快,因?yàn)椴]有真正拆分?jǐn)?shù)據(jù)D、在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)Region【正確答案】:C79.Kafka運(yùn)行時(shí)直接依賴于以下哪一個(gè)組件?A、HBaseB、HDFSC、SparkD、Zookeeper【正確答案】:D80.關(guān)于HBase的概念視圖,以下描述中正確的是哪一項(xiàng)?A、HBase是一個(gè)面向列的非關(guān)系型數(shù)據(jù)庫B、HBase的每一行數(shù)據(jù)可以有不同的行鍵C、HBase表格數(shù)據(jù)以文件塊的形式存放在內(nèi)存中D、HBase的每一個(gè)Region都是固定大小,每個(gè)Region都是64MB【正確答案】:A81.以下哪一選項(xiàng)不是統(tǒng)一元數(shù)據(jù)管理的優(yōu)勢(shì)?A、元數(shù)據(jù)統(tǒng)一管理、統(tǒng)一訪問和使用B、提供可視化元數(shù)據(jù)管理工具C、使用事實(shí)標(biāo)準(zhǔn)Hivemetastore接口,業(yè)務(wù)易對(duì)接D、數(shù)據(jù)訪問分散授權(quán),數(shù)據(jù)安全無保障【正確答案】:D82.在大數(shù)據(jù)分析場(chǎng)景中,以下說法哪一項(xiàng)是不正確的?A、SparkSQL:新型SQL處理引擎,速度比Hive快,處理SQL類的批處理任務(wù)B、HDFS:基于大數(shù)據(jù)的數(shù)據(jù)倉庫平臺(tái)C、FLink:流批一體式計(jì)算引擎D、Hive:類SQL查詢,傳統(tǒng)批處理引擎,速度較慢【正確答案】:B83.Redis中Hash數(shù)字類型不含以下哪種操作?A、hgetallB、hsetC、hmgetD、size【正確答案】:D84.HBase的Region的是由哪個(gè)服務(wù)進(jìn)程來管理的?A、HRegionServerB、ZooKeeperC、DataNodeD、HMaster【正確答案】:A85.StructuredStreaming中持續(xù)地查詢最新計(jì)算結(jié)果至寫出。這個(gè)過程叫做什么?()A、ContinuousstringB、continousqueryC、mapqueryD、continousphrase【正確答案】:B86.altertabletableNamesettblproperties('EXTERNAL'='FALSE'):執(zhí)行該Hive命令能實(shí)現(xiàn)以下哪一個(gè)目標(biāo)?A、修改內(nèi)部表tableName為外部表B、移動(dòng)tableName數(shù)據(jù)到外部存儲(chǔ)系統(tǒng)C、刪除tableName表的元數(shù)據(jù)信息D、修改外部表tableName為內(nèi)部表【正確答案】:D87.以下關(guān)于Redis持久化的描述,錯(cuò)誤的是哪一項(xiàng)?A、RDB方式的持久化是通過快照完成的B、AOF方式的持久化是通過日志文件的方式C、可以手動(dòng)執(zhí)行save或者bgsave命令讓redis執(zhí)行快照D、Redis默認(rèn)的持久化方式是AOF【正確答案】:D88.關(guān)于RDD,下列說法錯(cuò)誤的是哪一項(xiàng)?A、RDD默認(rèn)存儲(chǔ)在磁盤B、RDD是一個(gè)只讀的,可分區(qū)的分布式數(shù)據(jù)集C、RDD具有血(Lineage).D、RDD是Spark對(duì)基礎(chǔ)數(shù)據(jù)的抽象【正確答案】:A89.HBase客戶端提供了很多命令,關(guān)于list命令,下列正確是哪一項(xiàng)?A、查看所有的表B、查詢命名空間C、查看幫助命令D、查詢表數(shù)據(jù)【正確答案】:A90.關(guān)于HDFS單名稱節(jié)點(diǎn)體系結(jié)構(gòu)的局限性,以下哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn),一旦這個(gè)唯一的名稱節(jié)點(diǎn)發(fā)生故障,會(huì)導(dǎo)致整個(gè)集群變得不可用B、HDFS只設(shè)置唯一個(gè)名稱節(jié)點(diǎn),資源和數(shù)據(jù)可以方便的完成隔離C、HDFS只設(shè)置唯-一個(gè)名稱節(jié)點(diǎn),會(huì)帶來命名空間的限制D、HDFS只設(shè)置唯一個(gè)名稱節(jié)點(diǎn),會(huì)帶來性能的瓶頸和吞吐量的瓶頸【正確答案】:B91.關(guān)于分布式圖數(shù)據(jù)庫,以下描述正確的是哪一項(xiàng)?A、圖數(shù)據(jù)庫將數(shù)據(jù)切分為多個(gè)數(shù)據(jù)塊進(jìn)行存儲(chǔ),數(shù)據(jù)塊大小固定128MBB、圖數(shù)據(jù)庫以"圖"這種數(shù)據(jù)結(jié)構(gòu)來存儲(chǔ)和查詢數(shù)據(jù)C、圖數(shù)據(jù)庫采用ER實(shí)體關(guān)系進(jìn)行存儲(chǔ)D、圖數(shù)據(jù)庫與關(guān)系型數(shù)據(jù)庫可以靈活轉(zhuǎn)化【正確答案】:B92.編寫Scala代碼時(shí),通過以下哪個(gè)算子可以實(shí)現(xiàn)數(shù)據(jù)過?A、filterB、collectC、mapD、flatmap【正確答案】:A93.下列哪一項(xiàng)不是ElasticSearch的擴(kuò)展插件?A、es-HadoopB、ElasticSearch-headC、HadoopD、Logstash【正確答案】:C94.Kafka集群必須依賴于下列哪一個(gè)組件?A、FlumeB、ZookeeperC、YarnD、HDFS【正確答案】:B95.StructuredStreaming的底層源碼是以下哪一項(xiàng)?A、JavaB、PythonCD、Scala【正確答案】:D96.ElasticSearch數(shù)據(jù)寫入階段有很多調(diào)優(yōu)方式,下列錯(cuò)誤的是哪一項(xiàng)?A、盡量使用自動(dòng)生成的idB、禁用wildcardC、寫入前副本數(shù)設(shè)置為0D、寫入過程中:采取bulk批量寫入【正確答案】:B97.以下哪一選項(xiàng)不屬于MRS日常運(yùn)維不影響業(yè)務(wù)這一特性?A、修改配置滾動(dòng)重啟B、擴(kuò)縮容業(yè)務(wù)無感知C、滾動(dòng)升級(jí)/補(bǔ)丁D、單集群跨AZ高可用【正確答案】:D98.以下關(guān)于Redis中Hash類型描述,錯(cuò)誤的是哪一項(xiàng)?A、Hash類型適合存儲(chǔ)對(duì)象B、Hash類型的字段和字段值只能是字符串C、Hash類型的值存儲(chǔ)了字段和字段值的映射D、Hash類型的鍵至多可以存儲(chǔ)2~32個(gè)字段【正確答案】:D99.關(guān)于ElasticSearch內(nèi)部架構(gòu),以下描述中錯(cuò)誤的是哪一項(xiàng)?()A、Plugins:插件可以通過自定義的方式擴(kuò)展加強(qiáng)Elasticsearch的基本功能,比如可以自定義類型映射,分詞器,本地腳本等B、transport:代表Elasticsearch內(nèi)部節(jié)點(diǎn)或集群與客戶端的交互方式,默認(rèn)內(nèi)部是使用tcp協(xié)議進(jìn)行交互C、Discovery:該模塊主要負(fù)責(zé)集群中節(jié)點(diǎn)的自動(dòng)發(fā)現(xiàn)和Master節(jié)點(diǎn)的選舉D、Gateway:代表ElasticSearch.與客戶端交流的方式【正確答案】:D100.某大數(shù)據(jù)業(yè)務(wù)人員需針對(duì)某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個(gè)數(shù)據(jù)為時(shí)間類型yyyyMMdd.那么可以使用以下哪一項(xiàng)作為字段類型?A、varcahrB、stringC、intD、double【正確答案】:B1.以下哪些選項(xiàng)是Hive數(shù)據(jù)倉庫分層的優(yōu)點(diǎn)?A、隔離原始數(shù)據(jù)B、復(fù)雜問題簡(jiǎn)單化C、減少重復(fù)開發(fā)D、清晰數(shù)據(jù)結(jié)構(gòu)【正確答案】:ABCD2.大數(shù)據(jù)技術(shù)在我們身邊應(yīng)用的越來越廣,以下場(chǎng)景中有哪些場(chǎng)景可以應(yīng)用大數(shù)據(jù)技術(shù)?A、廣告精準(zhǔn)營(yíng)銷B、游戲畫面實(shí)時(shí)刷新C、人物畫像D、道路智能規(guī)劃【正確答案】:ACD3.實(shí)時(shí)檢索解決方案的項(xiàng)目流程包括以下哪些選項(xiàng)?A、應(yīng)用部署B(yǎng)、代碼工程C、項(xiàng)目環(huán)境準(zhǔn)備D、應(yīng)用開發(fā)【正確答案】:ABCD4.以下哪些選項(xiàng)是網(wǎng)站日志的特點(diǎn)?A、價(jià)值密度低B、數(shù)據(jù)的業(yè)務(wù)種類多C、數(shù)據(jù)結(jié)構(gòu)復(fù)雜D、數(shù)據(jù)量大【正確答案】:ABCD5.大數(shù)據(jù)分離架構(gòu)有以下哪些優(yōu)勢(shì)?A、異構(gòu)流數(shù)據(jù)實(shí)時(shí)處理B、交互式實(shí)時(shí)查間C、結(jié)構(gòu)化數(shù)據(jù)快速查詢D、復(fù)雜計(jì)算模型靈活編程接口【正確答案】:ABCD6.華為企業(yè)云數(shù)據(jù)湖具有以下哪些優(yōu)勢(shì)?A、開放接口,支持開放實(shí)時(shí)標(biāo)準(zhǔn),構(gòu)建豐富生態(tài),自助式數(shù)據(jù)開發(fā)與分析B、存儲(chǔ)和計(jì)算分離,支持更多用戶并發(fā)和更大數(shù)據(jù)量C、更多數(shù)據(jù)通過實(shí)時(shí)、虛擬方式入湖,數(shù)據(jù)產(chǎn)生即可見、可用D、數(shù)據(jù)集中,開放共享、統(tǒng)一目錄管理,避免跨系統(tǒng)數(shù)據(jù)搬遷【正確答案】:ABCD7.HBase讀數(shù)據(jù)時(shí)需要讀取哪幾部分?jǐn)?shù)據(jù)?A、HfileB、MemStoreC、HDFSD、Hlog【正確答案】:AB8.以下關(guān)于Redis中set數(shù)據(jù)類型srandmemberkey[count]命令的描述正確的是A、如果count為正數(shù),且小于集合基數(shù),那么命令返回一個(gè)包含count個(gè)元素的數(shù)組,數(shù)組中的元素各不相同B、如果count為負(fù)數(shù),那么命令返回一個(gè)數(shù)組,數(shù)組中的元素可能會(huì)重復(fù)出現(xiàn)多次,而數(shù)組的長(zhǎng)度為count的絕對(duì)值C、如果count大于等于集合基數(shù),那么返回整個(gè)集合。D、如果count為負(fù)數(shù),那么命令返回一個(gè)數(shù)組,數(shù)組中的元素各不相同,且數(shù)組的長(zhǎng)度小于count的絕對(duì)值?!菊_答案】:ABC9.以下哪些選項(xiàng)是Loader組件的特點(diǎn)?()A、圖形化B、高性能C、高可靠D、安全【正確答案】:ABCD10.以下哪幾項(xiàng)是屬于ElasticSearch的查詢類型?A、基于全文檢索B、基于分值數(shù)檢索C、基于元數(shù)據(jù)檢索D、基于詞條檢索【正確答案】:ABCD11.關(guān)于HBase二級(jí)索引的理解,以下哪些選項(xiàng)是正確的?A、Hindex是華為公司開發(fā)的純Java編寫的HBase二級(jí)索引B、多表索引也是HBase二級(jí)索引的特色之C、二級(jí)索引方便了基于列值來查找列值的應(yīng)用場(chǎng)景D、ApacheHBase只有一個(gè)針對(duì)行健的索引【正確答案】:ABCD12.以下關(guān)于FileChannel的描述中,正確的是哪些項(xiàng)?A、不同的FileChannel均需要配置多個(gè)checkpoint目錄B、不同的FileChannel均需要配置一個(gè)checkpoint目錄C、支持對(duì)數(shù)據(jù)進(jìn)行持久化D、需要配置數(shù)據(jù)目錄和checkpoint目錄【正確答案】:ACD13.關(guān)于HBase的基本架構(gòu),以下描述中正確的有哪些項(xiàng)?A、在HBase中,每一個(gè)Store對(duì)應(yīng)一個(gè)ColumnQualifierB、每一次觸發(fā)Flush都會(huì)生成新的HFileC、在HBase中,由HMaster直接管理RegionD、HBase允許多臺(tái)HRegionServer同時(shí)工作【正確答案】:ABD14.以下關(guān)于處理時(shí)間的描述,正確的是哪些項(xiàng)?A、處理時(shí)間不需要流和機(jī)器之間的協(xié)調(diào)B、處理時(shí)間是指每臺(tái)機(jī)器的系統(tǒng)時(shí)間C、處理時(shí)間能提供最好的性能和最低延遲D、處理時(shí)間不能提供消息事件的時(shí)序性保證【正確答案】:ABCD15.關(guān)于MRS的Redis增強(qiáng)特性描述正確的是()。A、支持?jǐn)?shù)據(jù)導(dǎo)入導(dǎo)出工具B、自研Arm架構(gòu)C、集群可靠性保障D、完善的集群管理功能【正確答案】:ABCD16.以下哪些選項(xiàng)是容易造成Hive數(shù)據(jù)傾斜的原因?()A、groupbyB、joinC、distinctcountD、droptable【正確答案】:ABC17.HBaseFilter有以下哪幾項(xiàng)?A、RowFilterB、KeyOnlyFilterC、MFilterListD、SingleColumnValueFilter【正確答案】:ABCD18.數(shù)據(jù)融合分析包括以下哪些場(chǎng)景?A、視頻數(shù)據(jù)處理,需要AI和大數(shù)據(jù)結(jié)合分析B、IOT數(shù)據(jù),業(yè)務(wù)時(shí)效性要求,依賴更實(shí)時(shí)、高效的數(shù)據(jù)處理C、日志類的半結(jié)構(gòu)化數(shù)據(jù),結(jié)合機(jī)器學(xué)習(xí)能力的批處理D、實(shí)時(shí)營(yíng)銷,流數(shù)據(jù)與歷史數(shù)據(jù)結(jié)合,實(shí)現(xiàn)更全面的用戶行為刻畫【正確答案】:ABCD19.下面選項(xiàng)哪些是HBase數(shù)據(jù)查詢過濾器Filter的比較器?A、BinaryComparatorB、SubStringComparatorC、BinaryPrefixComparatorD、RegexStringComparator【正確答案】:ABCD20.關(guān)于SparkRDD的說法中,以下哪些選項(xiàng)是正確的?A、RDD基于Lineage血統(tǒng)機(jī)制的高效容錯(cuò)(第n個(gè)節(jié)點(diǎn)出錯(cuò),可從第n-1個(gè)節(jié)點(diǎn)恢復(fù))B、RDD默認(rèn)存儲(chǔ)于磁盤上,如果磁盤空間不夠,會(huì)由磁盤刷寫至內(nèi)存中C、計(jì)算流程中會(huì)劃分Stage,Stage如果失敗會(huì)進(jìn)行特定次數(shù)的重試,重試時(shí)只計(jì)算失敗的數(shù)據(jù)分片D、RDD是只讀和可分區(qū)的;要想對(duì)RDD進(jìn)行操作,只能重新生成一個(gè)新的RDD【正確答案】:ACD21.以下關(guān)于Kafka的特點(diǎn)描述,正確的是哪些項(xiàng)?A、高吞吐B、分布式C、多訂閱者D、冗余備份【正確答案】:ABCD22.關(guān)于ApachePhoenix與HBase的搭配,以下哪些選項(xiàng)是正確的?A、PhoenixSQL只有命令行一種使用模式,無法對(duì)接JDBC進(jìn)行使用B、ApachePhoenix可以將SQL查詢編譯為一系列HBase掃描C、Phoenix在Hadoop中為低延遲應(yīng)用程序提供OLTP和運(yùn)營(yíng)分析能力D、ApachePhoenix可以為小型查詢提供毫秒級(jí)的性能,或者為數(shù)千萬行數(shù)據(jù)提供秒級(jí)的性能【正確答案】:BCD23.通過Loader的可視化界面,可以實(shí)現(xiàn)以下哪些操作?A、數(shù)據(jù)分析任務(wù)B、制定多種不同的數(shù)據(jù)源C、數(shù)據(jù)可視化操作D、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟【正確答案】:BCD24.Event的組成部分,包含以下哪些項(xiàng)?A、BodyB、FootC、HandD、Header【正確答案】:AD25.以下哪些選項(xiàng)是ZooKeeper在Kafka中的作用?A、索引數(shù)據(jù)的生成B、負(fù)載均衡CPU資源調(diào)配管理D、集群管理【正確答案】:ABD26.HBase中包含的典型的Filter有以下哪幾項(xiàng)?A、SingleColumnValueFilterB、FilterListC、RowFilterD、KeyOnlyFilter【正確答案】:ABCD27.Flink提供的窗口分配器,包含以下哪些項(xiàng)?A、全局窗口B、滾動(dòng)窗口C、滑動(dòng)窗口D、會(huì)話窗口【正確答案】:ABCD28.數(shù)據(jù)倉庫分層包括以下哪些選項(xiàng)?A、DWD層B、DWS層C、ADS層D、ODS層【正確答案】:ABCD29.關(guān)于Spark的應(yīng)用場(chǎng)景,請(qǐng)將場(chǎng)景與描述正確匹配()A、流處理秒級(jí)延遲的處理,可支持多種外部數(shù)B、數(shù)據(jù)挖掘在海量數(shù)據(jù)基礎(chǔ)上進(jìn)行復(fù)雜的挖掘分析C、迭代計(jì)算應(yīng)對(duì)復(fù)雜的數(shù)據(jù)處理邏輯【正確答案】:ABC30.Hive可以直接訪問以下哪些組件?A、HDFSB、DockerC、TensorFlowD、HBase【正確答案】:AD31.以下哪些選項(xiàng)是常用的數(shù)據(jù)結(jié)構(gòu)類型?A、結(jié)構(gòu)化數(shù)據(jù)B、非結(jié)構(gòu)數(shù)據(jù)C、無結(jié)構(gòu)化數(shù)據(jù)D、超結(jié)構(gòu)化數(shù)據(jù)【正確答案】:AB32.HDFS文件系統(tǒng)能夠支撐的數(shù)據(jù)量級(jí)有哪些?A、ZBB、TBC、PBD、EB【正確答案】:BC33.關(guān)于HBase觸發(fā)Flush操作,以下描述中正確的有哪些項(xiàng)?A、HBase定期刷新Memstore,默認(rèn)周期為24個(gè)小時(shí)B、Region中MemStore的總大小達(dá)到了預(yù)設(shè)的FlushSize閱值時(shí)會(huì)觸發(fā)Flush操作C、Flush操作和HLog中的文件數(shù)量沒有任何關(guān)系D、MemStore占用內(nèi)存的總量和RegionServer總內(nèi)存比值超出了預(yù)設(shè)的閱值大小時(shí)會(huì)觸發(fā)Flush操作【正確答案】:BD34.Hive組件的Driver由以下哪些項(xiàng)組成?A、MetaStoreB、CompilerC、ExecutorD、Optimizer【正確答案】:BCD35.以下哪些項(xiàng)屬于離線批處理場(chǎng)景的核心訴求?A、處理數(shù)據(jù)量巨大B、支特SQL類作業(yè)和自定義作業(yè)C、處理數(shù)據(jù)格式多樣D、處理時(shí)間要求不高【正確答案】:ABCD36.以下關(guān)于Spark的描述中,正確的有哪幾項(xiàng)?A、寬依賴是指父RDD的每個(gè)分區(qū)都可能被多個(gè)子RDD分區(qū)所使用。B、窄依賴跟寬依賴的區(qū)別是是否發(fā)生Shuffle.C、當(dāng)一個(gè)任務(wù)在spark執(zhí)行時(shí),該任務(wù)會(huì)被拆分成多個(gè)Stage,然后分配到不同的節(jié)點(diǎn)上進(jìn)行執(zhí)行。D、窄依賴是指父RDD的每個(gè)分區(qū)只被子RDD的一個(gè)分區(qū)所使用。【正確答案】:ABD37.有關(guān)華為實(shí)時(shí)檢索解決方案,以下描述中正確的有哪幾項(xiàng)?A、數(shù)據(jù)采集:文件數(shù)據(jù)通過批量加載寫入數(shù)據(jù);流式數(shù)據(jù)通過實(shí)時(shí)加載寫入數(shù)據(jù),圖數(shù)據(jù)可以使用華為GES的工具導(dǎo)入數(shù)據(jù)B、數(shù)據(jù)源:數(shù)據(jù)源的種類包括文件數(shù)據(jù)和流式數(shù)據(jù)等C、實(shí)時(shí)檢索引擎:適合快速檢索,也就是根據(jù)指定條件查詢結(jié)果,不適用于統(tǒng)計(jì)和復(fù)雜查詢D、GES:基于Hadoop生態(tài)的圖數(shù)據(jù)庫,即存放圖片的數(shù)據(jù)庫【正確答案】:ABC38.客戶端使用get方式讀取HBase用戶數(shù)據(jù)時(shí),需要查詢meta表的哪些數(shù)據(jù)?A、RegionServert地址B、Region分裂時(shí)間C、Region起始rowkeyD、Region大小【正確答案】:AC39.HBase中會(huì)觸發(fā)Flush操作的有以下哪幾項(xiàng)?A、RegionMemStore中的總大小,達(dá)到了預(yù)設(shè)的FlushSize閾值。B、HBaseMemstore定期刷新,默認(rèn)周期為1小時(shí)。C、MemStoreRegionServer占用內(nèi)存的總量和總內(nèi)存比值超出了預(yù)設(shè)的閾值大小。D、當(dāng)WALs中文件數(shù)量達(dá)到閾值時(shí)?!菊_答案】:ABCD40.一個(gè)典型的KafKa集群中包含以下哪些組件?A、一個(gè)ZooKeeper集群B、若干個(gè)BrockerC、若干個(gè)ProducerD、若干個(gè)Consumer【正確答案】:ABCD41.SparkSQL對(duì)SQL語句的處理和關(guān)系型數(shù)據(jù)庫采用了類似的方法。關(guān)于SparkSQL的處理邏輯,以下哪些選項(xiàng)是正確的?多選A、執(zhí)行(Execute):執(zhí)行優(yōu)化步驟獲取的最優(yōu)執(zhí)行計(jì)劃,返回從數(shù)據(jù)庫查詢的數(shù)據(jù)集B、詞法和語法解析(Parse):對(duì)讀入的SQL語句進(jìn)行詞法和語法解析(Parse),分辨出SQL語句中那些詞是關(guān)鍵詞,哪些是表達(dá)式,哪些DataSource等,判斷SQL語句是否規(guī)范,并形成邏輯計(jì)劃C、優(yōu)化(Optimize):SparkSQL會(huì)提供幾個(gè)執(zhí)行計(jì)劃,并針對(duì)數(shù)據(jù)進(jìn)行優(yōu)化,返回從數(shù)據(jù)庫查詢的數(shù)據(jù)集D、綁定(Bind):將SQL語句和數(shù)據(jù)庫的數(shù)據(jù)字典(列、表和視圖等)進(jìn)行綁定(Bind),如果相關(guān)的Projection和DataSource等都存在的話,則表示這個(gè)SQL語句是可以執(zhí)行的【正確答案】:ABCD42.FIink計(jì)算時(shí)間不包含以下哪幾種時(shí)間語義?A、StartTime(開始時(shí))B、EventTime(件)C、ProcessingTime(處理時(shí))DelayTime(延遲時(shí)間)【正確答案】:AD43.某大數(shù)據(jù)業(yè)務(wù)人員在不小心刪除了HDFS某個(gè)文件后,想通過回收站機(jī)制恢復(fù)數(shù)據(jù),但是在對(duì)應(yīng)的回收站目錄/user/root/.Trash中為什么找不到要恢復(fù)的數(shù)據(jù)?A、回收站中的數(shù)據(jù)超過了保留的期限,被系統(tǒng)刪除了。B、回收站機(jī)制并沒有開啟,導(dǎo)致沒有及時(shí)回收C、回收站通過回收間隔,對(duì)數(shù)據(jù)進(jìn)行了整理,需要進(jìn)入到指定時(shí)間間隔下才能找到D、查找的目錄可能出現(xiàn)了問題,需要核實(shí)刪除操作的用戶。【正確答案】:AB44.關(guān)于HBase的數(shù)據(jù)模型,以下哪些選項(xiàng)是正確的?A、表是由行和列構(gòu)成的,所有的列是從屬于某一個(gè)列族的B、所有的表都必須要有主鍵-keyC、應(yīng)用程序是以表的方式在HBase存儲(chǔ)數(shù)據(jù)的參考答案)D、HBase的表是按key排序的,排序方式是針對(duì)字節(jié)的【正確答案】:ABCD45.關(guān)于HBase性能優(yōu)化,以下描述中正確的有哪些選項(xiàng)?A、在使用HBaseJavaAPI時(shí),可以通過調(diào)用Table實(shí)例的get(List)批量讀取多行記錄,只需一次網(wǎng)絡(luò)1/O開銷,可以明顯的提升讀性能B、一張表里不要定義太多的列簇,因?yàn)槟硞€(gè)列簇在flush的時(shí)候,它鄰近的列簇也會(huì)因關(guān)聯(lián)效應(yīng)被觸發(fā)flush,最終導(dǎo)致系統(tǒng)產(chǎn)生更多的I/OC、在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)Region,當(dāng)數(shù)據(jù)寫入HBase時(shí),會(huì)按照RowKey對(duì)應(yīng)Region分區(qū)情況,在集群內(nèi)做數(shù)據(jù)的負(fù)載均衡D、在使用HBaseJavaAPI時(shí),可以通過調(diào)用Table實(shí)例的put(List)批量寫入多行記錄,只需一次網(wǎng)絡(luò)l/O開銷,可以明顯的提升寫性能【正確答案】:ABCD46.2019年以后,華為云數(shù)據(jù)湖CloudDataLake中數(shù)據(jù)管理包含以下哪些組件。AWSGlueB、DeltaLakeC、AtlasD、HUDI【正確答案】:ABCD47.某個(gè)業(yè)務(wù)人員發(fā)現(xiàn)某個(gè)查詢的HiveSQL執(zhí)行時(shí)間比較長(zhǎng),分析發(fā)現(xiàn)該SQL在被分解成多個(gè)階段執(zhí)行,導(dǎo)致執(zhí)行時(shí)間過長(zhǎng)。那么該業(yè)務(wù)人員可以執(zhí)行如下哪些操作來優(yōu)化該SQL語句?A、增加服務(wù)器內(nèi)存,來增加該SQL的執(zhí)行內(nèi)存。B、將SQL語句逐條執(zhí)行。C、針對(duì)業(yè)務(wù)邏輯,提前進(jìn)行數(shù)據(jù)過濾,避免后續(xù)JOIN操作太繁瑣。D、通過參數(shù)hive.exec.parallel開啟并行執(zhí)行,提高查詢效率【正確答案】:BD48.Spark中RDD是彈性數(shù)據(jù)集的原因包括以下哪些選項(xiàng)?A、基于Lineage的高效容錯(cuò)B、自動(dòng)進(jìn)行內(nèi)存和磁盤數(shù)據(jù)存儲(chǔ)的切換C、數(shù)據(jù)調(diào)度彈性D、Task失敗自動(dòng)重試【正確答案】:ABC49.SparkSQL使用場(chǎng)景豐富,可以處理的數(shù)據(jù)源包括()。A、HiveB、文本文件C、RDDD、Json【正確答案】:ABCD50.以下關(guān)于Filnk的窗口描述正確的是()。A、Flink窗口按窗口行為劃分:TumblingWindow-SlidingWindow.SessionWindow.B、窗口可以是時(shí)間驅(qū)動(dòng)的也可以是數(shù)據(jù)驅(qū)動(dòng)的。C、我們可以每30秒計(jì)算一次最近一分鐘用戶購買的商品總數(shù),這個(gè)就是時(shí)間滑動(dòng)窗口的應(yīng)用方式。D、會(huì)話窗口是將數(shù)據(jù)聚合到會(huì)話窗口中,由非活躍的間隙分隔開?!菊_答案】:ABCD51.Hive架構(gòu)中Driver包含以下哪些組件?A、ExecutorB、ChannelC、OptimizerD、Compiler【正確答案】:ACD52.Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪幾種Channel類型?A、FileChannelB、MemoryChannelC、HDFSChannelD、JDBCChannel【正確答案】:AD53.華為混合云MRS服務(wù)的優(yōu)勢(shì)有哪些?A、存算分離,TCO下降B、易管理,駕駛艙體驗(yàn)C、多場(chǎng)景融合,高性能D、易部署,所用即所得【正確答案】:ABCD54.以下關(guān)于華為云MRS提供的基于天氣大數(shù)據(jù)進(jìn)行海量數(shù)據(jù)離線分析應(yīng)用場(chǎng)景的描述中,哪些選項(xiàng)是正確的?A、可以利用Hive實(shí)現(xiàn)TB/PB級(jí)的數(shù)據(jù)分析B、可以通過可視化ETL工具Loader,將數(shù)據(jù)導(dǎo)出到DWS.完成BI分析C、可以使用OBS實(shí)現(xiàn)低成本存儲(chǔ)D、離線批處理必須依賴Flink組件完成計(jì)算【正確答案】:ABC55.Hive支持以下哪些計(jì)算引擎?A、MapReduceB、LoaderC、TezD、Spark【正確答案】:ACD解析:
三.判斷56.ElasticSearch用于日志搜索和分析,離不開其擁有的生態(tài)圈系統(tǒng)和解決方案,這些開源軟件之間互相配合使用,完美銜接,高效地滿足了多場(chǎng)景的應(yīng)用。那么其生態(tài)系統(tǒng)具體包括以下哪些內(nèi)容?A、數(shù)據(jù)持久化與分析層ElasticsearchB、數(shù)據(jù)接入層LogstashC、用戶接入層KibanaD、插件擴(kuò)展層【正確答案】:ABCD57.HBase中HMaster主要負(fù)責(zé)()A、Regionserverf負(fù)載均衡B、表的增刪改查C、Region分布調(diào)整D、用戶數(shù)據(jù)讀寫【正確答案】:ABC58.ELK指的是哪些組件?A、ElasticsearchB、LogstashC、KickstartD、Kibana【正確答案】:ABD59.下列關(guān)于大數(shù)據(jù)的說法中,錯(cuò)誤的是哪些選項(xiàng)?A、大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)的特征B、處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)C、大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析D、大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析【正確答案】:AC60.以下哪些選項(xiàng)不是Flink資源調(diào)度的方式?A、FlinkStandaloneB、FlinkOnZooKeeperC、FlinkOnDocker(參考答案)D、FlinkOnMesos【正確答案】:ABC61.以下哪些數(shù)據(jù)庫的引擎適合做數(shù)據(jù)倉庫?A、ExadataB、OracleC、RedisD、TeraData【正確答案】:ABD62.某大數(shù)據(jù)運(yùn)維人員需要將部分?jǐn)?shù)據(jù)導(dǎo)入Hive數(shù)據(jù)表中,以下哪些做法是可取的?A、將數(shù)據(jù)導(dǎo)入到FTP服務(wù)器中,通過創(chuàng)建外表的方式導(dǎo)入到Hive表中。B、將數(shù)據(jù)導(dǎo)入到HDFS文件系統(tǒng)中,通過loaddata命令導(dǎo)入到Hive表中。C、將數(shù)據(jù)導(dǎo)入到本地電腦中,然后使用loaddatalocal命令導(dǎo)入到Hive表中。D、將數(shù)據(jù)導(dǎo)入到集群服務(wù)器上,通過loaddatalocal命令導(dǎo)入到Hive表中。【正確答案】:ABD63.以下關(guān)于Spark流連接的描述中,正確的是哪些項(xiàng)?A、一個(gè)輸入流接收的任何行都可以與另一個(gè)來自未來的、尚未接收的輸入流中的任何行進(jìn)行匹配B、對(duì)于兩個(gè)輸入流,StructuredStreaming可以將過去的輸入流緩沖為流狀態(tài)C、支持將每個(gè)未來輸入流與過去的輸入流相匹配,從而生成連接結(jié)果D、Spark2.x支持流與流的連接【正確答案】:ABCD64.數(shù)據(jù)分析平臺(tái)云化和融合發(fā)展具有以下哪些特點(diǎn)?A、資源彈性分配B、超敏捷應(yīng)用C、交叉融合分析D、多場(chǎng)景分析【正確答案】:ABCD65.實(shí)時(shí)流的場(chǎng)景中,Kafka的使用主要是為了解決哪些問題?A、防止數(shù)據(jù)丟失B、系統(tǒng)解耦C、僅支持?jǐn)?shù)據(jù)同步分發(fā)D、消息的隨機(jī)讀取【正確答案】:ABCD66.Hive組件支持以下哪些運(yùn)行框架?A、MapReduceB、TezC、SparkD、Kafka【正確答案】:ABC67.以下哪些選項(xiàng)是華為云MRS使用HetuEngine的根本原因?A、企業(yè)傳統(tǒng)數(shù)倉,缺乏高效、統(tǒng)一的融合分析B、企業(yè)傳統(tǒng)數(shù)倉采用分系統(tǒng)構(gòu)建模式,導(dǎo)致數(shù)據(jù)冗余嚴(yán)重,阻礙企業(yè)快速轉(zhuǎn)型C、隨著數(shù)據(jù)量增長(zhǎng),業(yè)務(wù)對(duì)數(shù)據(jù)分析靈活性要求越來越高D、HetuEngine對(duì)浪涌式的數(shù)據(jù)進(jìn)行整合分析,發(fā)揮最大價(jià)值【正確答案】:ABCD68.以下哪些項(xiàng)可能是鍵值的返回值類型?A、StringB、zsetC、listD、set【正確答案】:ABCD69.以下關(guān)于Channel的描述中,錯(cuò)誤的是哪些項(xiàng)?A、Channel位于Source和Sink之間B、Channels不支持事務(wù)Channel的作用類似隊(duì)列D、Channels提供較強(qiáng)的順序保證【正確答案】:BD70.699.Spark運(yùn)行前需要讀取任務(wù)參數(shù),包含配置文件、動(dòng)態(tài)參數(shù)、代碼配置等,請(qǐng)連接將他們的優(yōu)先級(jí)進(jìn)行匹配。()A、高代碼配置B、中動(dòng)態(tài)參數(shù)C、低配置文件【正確答案】:ABC71.StructuredStreaming中OutPut的存儲(chǔ)方式包含以下哪幾種?A、UpdateModeB、ModifyModeCompleteModeD、AppendMode【正確答案】:ACD72.以下哪些場(chǎng)景可以使用HBase作為存儲(chǔ)系統(tǒng)?A、Row-Key查詢B、滿足ACID特性C、海量數(shù)據(jù)存儲(chǔ)D、大文件(T【正確答案】:ACD73.關(guān)于Elasticsearch的緩存機(jī)制,以下哪些選項(xiàng)是正確的?A、Elasticsearch緩存主要分三種:QueryCACheFielddataCACheRequestCACheB、QueryCAChe:屬于Node級(jí)別的緩存,是對(duì)一個(gè)查詢中包含的過濾器執(zhí)行結(jié)果進(jìn)行緩存C、RequestCAChe:Shard級(jí)別的緩存,是為了緩存"分片級(jí)"的本地結(jié)果集D、FielddataCAChe:Fielddata是專門針對(duì)分詞的字段在查詢期間的數(shù)據(jù)結(jié)構(gòu)的緩存【正確答案】:ABCD74.將Hive數(shù)倉分層后各層的名稱和對(duì)應(yīng)的描述進(jìn)行匹配。()A、ODS原始數(shù)據(jù)層B、ADS應(yīng)用層,為各種統(tǒng)計(jì)報(bào)表提供數(shù)據(jù)C、DWS將上一層數(shù)據(jù)進(jìn)行輕度匯總后得到的結(jié)果DWD結(jié)構(gòu)和粒度與原始表保持一-致簡(jiǎn)單清洗得到的結(jié)果【正確答案】:ABCD75.關(guān)于ElasticSearch的基本架構(gòu),以下描述中正確的有哪些項(xiàng)?A、ElasticSearch通過Discovery模塊來實(shí)現(xiàn)節(jié)點(diǎn)自動(dòng)發(fā)現(xiàn),以及Master節(jié)點(diǎn)選取B、ElasticSearch底層基于Lucence,將索引存儲(chǔ)在本地文件系統(tǒng)、共享文件系統(tǒng)或HDFS等文件系統(tǒng)中C、ElasticSearch支多種插件來擴(kuò)展加強(qiáng)功能D、ElasticSearch通過Java以及Restfulapi提供【正確答案】:ABCD76.針對(duì)以下場(chǎng)景描述,可以用于大數(shù)據(jù)實(shí)時(shí)檢索技術(shù)完成的有?A、主要根據(jù)ID(手機(jī)號(hào)碼)、時(shí)間段進(jìn)行用戶話費(fèi)清單、流量清單查詢B、可用于事后查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款等C、要求1秒內(nèi)響應(yīng),高并發(fā)(100以上請(qǐng)求)查詢條件簡(jiǎn)單(80%查詢是主鍵查詢,其他是簡(jiǎn)單條件組合查詢)D、根據(jù)ID(身份證,車牌號(hào)等)進(jìn)行查詢,可用于實(shí)時(shí)布控,車輛軌跡繪制,快速信息匯集【正確答案】:ABCD77.以下哪些選項(xiàng)不是HBase的典型應(yīng)用場(chǎng)景?A、挖掘潛在客戶B、存儲(chǔ)氣象數(shù)據(jù)C、統(tǒng)計(jì)訂單總額D、推薦最優(yōu)套餐【正確答案】:ACD78.關(guān)于Kafka組件部署規(guī)劃說法以下哪些選項(xiàng)是錯(cuò)誤的?A、Kafka會(huì)將元數(shù)據(jù)信息存放到ZooKeeper上B、在創(chuàng)建Topic時(shí),副本數(shù)不得大于當(dāng)前存活的Broker實(shí)例個(gè)數(shù),否則創(chuàng)建Topic將會(huì)失敗C、Kafka的Producer發(fā)送消息時(shí)可以指定該消息被哪個(gè)Consumer消費(fèi)D、Kafka安裝完成后就不能再配置數(shù)據(jù)存放目錄了【正確答案】:CD79.關(guān)于GES服務(wù)的常見基本概念,以下哪些選項(xiàng)是正確的?A、GES不存在無向邊B、在GES中,點(diǎn)的屬性(Property)表示了該頂點(diǎn)的附加信息,采用Keyvalue:結(jié)構(gòu)進(jìn)行保存C、個(gè)人的姓名、年齡、身份證、愛好等信息可以用VertexLA,Bel來表示D、"認(rèn)識(shí)/朋友關(guān)系"在圖中可以用邊來表示【正確答案】:ABCD80.OutPut可以定義的存儲(chǔ)方式包含以下哪些項(xiàng)?A、CompleteModeB、A,DdModeC、UpdateModeD、AppendMode【正確答案】:ACD81.所謂的大數(shù)據(jù)技術(shù)融合主要指哪些方面?A、計(jì)算融合B、數(shù)據(jù)融合C、算力融合D、批-流融合【正確答案】:ABCD82.Flink支持Source的有以下哪些選項(xiàng)?A、從集合中讀取數(shù)據(jù)B、自定義數(shù)據(jù)讀取C、從文件中讀取數(shù)據(jù)D、從消息隊(duì)列中讀取數(shù)據(jù)rk【正確答案】:ABCD83.計(jì)算十分鐘內(nèi)的單詞,每5分鐘更新一次,若程序在11:00開始運(yùn)行,在12:07收到一個(gè)數(shù)字,這個(gè)數(shù)字應(yīng)該對(duì)應(yīng)于以下哪些窗口的計(jì)算()A、12:05-12:15B、12:10-12:20C、12:00-12:10D、11:55-12:05【正確答案】:AC84.有關(guān)實(shí)時(shí)檢索引擎中各組件的聯(lián)系與定位,以下描述中正確的有哪些項(xiàng)?()A、ElasticSearch存儲(chǔ)數(shù)據(jù)性價(jià)比低,但是其能夠滿足場(chǎng)景中多級(jí)索引的實(shí)時(shí)查詢需求,同時(shí)還能夠?qū)ξ臋n分詞建立索引B、圖數(shù)據(jù)庫可以完美的解決復(fù)雜多級(jí)關(guān)系查詢分析,選用GES來解決圖數(shù)據(jù)的實(shí)時(shí)查詢需求C、與HBase相比,ElasticSearch在海量數(shù)據(jù)的情景下存儲(chǔ)性能不如HBase,故選擇HBase作為海量數(shù)據(jù)存儲(chǔ)的基石D、HBase加ElasticSearch的組合滿足了大部分的用戶實(shí)時(shí)檢索訴求【正確答案】:ABCD85.HDFS文件系統(tǒng)適用于哪些場(chǎng)景?A、大規(guī)模數(shù)據(jù)(TB及以上)B、流式數(shù)據(jù)訪問(寫一次,讀多次)C、頻繁修改文件(基本就是寫一次)D、商用硬件(一般硬件)【正確答案】:ABD86.ElasticSearch在部署時(shí),對(duì)Linux的設(shè)置有哪些優(yōu)化方法?A、堆內(nèi)存設(shè)置為:MinB、設(shè)置最大文件句柄數(shù)C、線程池+隊(duì)列大小根據(jù)業(yè)務(wù)需要做調(diào)整D、關(guān)閉緩存Swap【正確答案】:BC87.Loader具有對(duì)以下哪些數(shù)據(jù)源的讀取能力?A、HBaseB、HDFSC、HiveD、RDB【正確答案】:ABCD88.Redis寫命令同步的時(shí)機(jī),可以設(shè)置以下哪些項(xiàng)?A、appendfsynceveryminB、appendfsyncalwaysC、appendfsyncnoD、appendfsynceverysec【正確答案】:BCD89.關(guān)于ElasticSearch常見的API接口,以下描述中正確的有哪些項(xiàng)?A、SpringDataElasticsearch:第三方插件,與Spring生態(tài)集成度較高B、TransportClient:官方原生客戶端、,全部操作功能均支持,但內(nèi)部請(qǐng)求需要做Java序列化操作,導(dǎo)致項(xiàng)目可移值性較低C、JestClient:第三方插件,最早期的Rest第三方插件,社區(qū)和API都相對(duì)比較全面D、RestClient:官方新推API,屬于高級(jí)API,基于HttpRestful請(qǐng)求,可移值性更高,但功能不夠全面【正確答案】:ABCD90.以下哪些選項(xiàng)是大數(shù)據(jù)云化的優(yōu)勢(shì)與價(jià)值?A、提升業(yè)務(wù)分析及運(yùn)維體驗(yàn)效率B、資源共享C、資源彈性發(fā)放D、提升資源申請(qǐng)效率【正確答案】:ABCD91.關(guān)于Scan命令,下列說法正確的有哪些?A、scan可以通過setFilter方法添加過濾器B、scan可以通過setCA,Ching與setBatch方法提高速度C、scan可以通過setStartRow與setEndRow來限定范圍D、scan讀取數(shù)據(jù)是一次性全部把數(shù)據(jù)從服務(wù)端讀取到【正確答案】:ABC92.實(shí)時(shí)檢索的公安和金融行業(yè)應(yīng)用場(chǎng)景有哪些特征?A、高并發(fā)B、存在海量小文件C、查詢速度快D、查詢條件簡(jiǎn)單【正確答案】:ABCD93.關(guān)于HBase組件的描述,下列哪幾項(xiàng)是正確的?A、存儲(chǔ)數(shù)據(jù)是以K-V的形式B、是面向列的C、是一種NoSQL數(shù)據(jù)D、是分布式的【正確答案】:ABCD94.華為MRS服務(wù)具有以下哪些優(yōu)勢(shì)?A、高可用B、多場(chǎng)景融合C、存算分離D、彈性計(jì)算【正確答案】:ABCD95.在HBase中利用get命令查找某一個(gè)單元格對(duì)應(yīng)的數(shù)據(jù),以下哪些信息是必要的?()A、ColumnQualifier(限定符)信息B、Rowkey(行鍵)信息C、DataBlockID(數(shù)據(jù)塊編號(hào))信息D、ColumnFamily(列族)信息【正確答案】:ABD96.關(guān)于使用HBase的JavaAPI讀取數(shù)據(jù),以下描述中正確的是哪些項(xiàng)?A、QualifierFilter用于過HBase表中的列族信息B、HBaseFilter主要在Scan和Get過程中進(jìn)行數(shù)據(jù)過濾,通過設(shè)置一些過濾條件來實(shí)現(xiàn)條件查詢C、要從表中讀取數(shù)據(jù),首先需要實(shí)例化該表對(duì)應(yīng)的Table實(shí)例D、為了提高查詢效率,使用Scan命令時(shí)最好指定StartRow和StopRow【正確答案】:ABCD97.關(guān)于實(shí)施檢索項(xiàng)目的項(xiàng)目流程,以下描述中正確的有哪些項(xiàng)?A、實(shí)施檢索項(xiàng)目絕非一蹴而就,需要不斷調(diào)試,通過應(yīng)用運(yùn)維進(jìn)行項(xiàng)目選代,以便更好地適應(yīng)項(xiàng)目的實(shí)際要求B、在應(yīng)用開發(fā)階段可以參考樣例代碼,根據(jù)實(shí)際需求和具體應(yīng)用進(jìn)行有針對(duì)性的開發(fā)C、環(huán)境準(zhǔn)備階段是整個(gè)流程的第一步,常見的工作包括創(chuàng)建Java環(huán)境、搭建HBase和ElasticSearch集群等D、在實(shí)際業(yè)務(wù)中,安全認(rèn)證準(zhǔn)備工作目非常重要,通常可以選擇Kerberos和LDAP的組合完成這一工作【正確答案】:ABCD98.關(guān)于Hive導(dǎo)入數(shù)據(jù)的命令,以下哪些選項(xiàng)是正確的?A、loA,Ddatainpath可用于將HDFS上的數(shù)據(jù)導(dǎo)入Hive表中B、導(dǎo)入數(shù)據(jù)時(shí)必須指定導(dǎo)入哪張表格,也就是需要使用intotable關(guān)鍵詞+表名C、可以使用Local關(guān)鍵詞從本地文件系統(tǒng)導(dǎo)入數(shù)據(jù)至Hive,但是這里的Local指的是hiveserver服務(wù)所在的機(jī)器,而不是beeline客戶端所在的機(jī)器D、如果原先表中有數(shù)據(jù),想用新數(shù)據(jù)覆蓋舊數(shù)據(jù),可以添加overwrite參數(shù)進(jìn)行覆蓋【正確答案】:ABCD99.以下關(guān)于持續(xù)處理模型的描述,正確的是哪些項(xiàng)?A、對(duì)于偏移范圍的記錄異步寫入日志,以達(dá)到連續(xù)處理B、可以啟動(dòng)一系列的連續(xù)讀取、處理和寫入結(jié)果任務(wù)C、低延遲下,會(huì)丟失數(shù)據(jù)D、可以實(shí)現(xiàn)毫秒級(jí)延遲【正確答案】:ABD100.相較于大數(shù)據(jù)組件,傳統(tǒng)數(shù)據(jù)倉庫存在以下哪些劣勢(shì)?A、I/O存在瓶頸B、大規(guī)模數(shù)據(jù)實(shí)時(shí)性差C、拓展能力差D、架構(gòu)單一【正確答案】:ABCD1.在HBase中,KeyValue作為承載用戶數(shù)據(jù)的基本單元,需要保存一些對(duì)自身的描述信息,例如時(shí)間截、版本號(hào)等等。那么勢(shì)必會(huì)有一定的結(jié)構(gòu)化空間開銷。A、正確B、錯(cuò)誤【正確答案】:A2.Spark執(zhí)行效率高的一個(gè)關(guān)鍵因素是在處理數(shù)據(jù)時(shí)產(chǎn)生的中間產(chǎn)物(計(jì)算結(jié)果)存放在內(nèi)存中,減少了對(duì)磁盤的I/O操作。A、正確B、錯(cuò)誤【正確答案】:A3.Flink處理數(shù)據(jù)是無狀態(tài)的,處理一個(gè)事件與之前的事件無關(guān)。A、正確B、錯(cuò)誤【正確答案】:B4.大數(shù)據(jù)上云是萬物互聯(lián)時(shí)代的必然趨勢(shì),移動(dòng)終端構(gòu)成的物聯(lián)網(wǎng)只有通過云,才能快速將全渠道數(shù)據(jù)(新型生產(chǎn)資料)通過大數(shù)據(jù)和AI技術(shù)轉(zhuǎn)化成價(jià)值。A、正確B、錯(cuò)誤【正確答案】:A5.Kettlel中有兩種transformation腳本文件(轉(zhuǎn)換ktr結(jié)尾)和job(任務(wù)kjb結(jié)尾)。A、正確B、錯(cuò)誤【正確答案】:A6.在Spark中,RDD通過數(shù)據(jù)塊的方式將數(shù)據(jù)存放在內(nèi)存中,并且采用三副本機(jī)制提高數(shù)據(jù)的穩(wěn)定性。A、正確B、錯(cuò)誤【正確答案】:B7.Spark中的JDBCServer不是單點(diǎn)服務(wù),因此非常適合處理海量數(shù)據(jù)和高并發(fā)任務(wù)()A、正確B、錯(cuò)誤【正確答案】:B8.云上數(shù)據(jù)分析以敏捷無縫的部署和管理體驗(yàn)從技術(shù)、組織和人員等多維度提速企業(yè)數(shù)字化轉(zhuǎn)型。A、正確B、錯(cuò)誤【正確答案】:A9.Event是Flume數(shù)據(jù)傳輸?shù)幕締卧狝、正確B、錯(cuò)誤【正確答案】:A10.Redis中List是一個(gè)有序的字符串列表,列表內(nèi)部實(shí)現(xiàn)是使用雙向鏈表(linkedlist)實(shí)現(xiàn)的。A、正確B、錯(cuò)誤【正確答案】:A11.由于大數(shù)據(jù)本身的特性,一般大數(shù)據(jù)場(chǎng)景中不合適頻繁的讀取數(shù)據(jù),而適合頻繁的修改數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:B12.Source必須至少和一個(gè)channel關(guān)聯(lián)。A、正確B、錯(cuò)誤【正確答案】:A13.在海量日志離線分析過程中,數(shù)據(jù)分析師可以將網(wǎng)站日志收集到HDFS上存儲(chǔ),然后把日志加載到Hive中進(jìn)行統(tǒng)計(jì)分析與建模。A、正確B、錯(cuò)誤【正確答案】:A14.DAYU無縫連接華為云MRS、DWS、DLI等數(shù)據(jù)底座的開發(fā)。A、正確B、錯(cuò)誤【正確答案】:A15.在HBase的shell客戶端查看'ns'這個(gè)命名空間下所有數(shù)據(jù)文件的名稱時(shí),需要用到show_namespA,Ce'ns'命令。A、正確B、錯(cuò)誤【正確答案】:B16.BloomFilter可以被用來快速的判斷一條數(shù)據(jù)在一個(gè)大的數(shù)據(jù)集合中是否存在。A、正確B、錯(cuò)誤【正確答案】:A17.BloomFilter是一個(gè)列族(cf)級(jí)別的配置屬性,如果你在表中設(shè)置了BloomFilter,那么HBase會(huì)在生成StoreFilel時(shí)包含一份具有BloomFilter結(jié)構(gòu)的數(shù)據(jù),稱其為Metablock.A、正確B、錯(cuò)誤【正確答案】:A18.在使用HBaseJavaAPI時(shí),用戶可以通過org,Apache.Hadoop.hbase.client.A,Dmin實(shí)例的createTable快速建表,創(chuàng)建表后整張表只有一個(gè)Region,隨著數(shù)據(jù)量的增加會(huì)自動(dòng)分裂成多個(gè)Region。A、正確B、錯(cuò)誤【正確答案】:A19.在Spark2.x版中,SparkSQL適合進(jìn)行離線數(shù)據(jù)查詢,在某些場(chǎng)景下也可以適用于實(shí)時(shí)工作流任務(wù)。A、正確B、錯(cuò)誤【正確答案】:A20.實(shí)時(shí)流的處理場(chǎng)景我們可以選擇Flink框架,也可以使用Spark框架。A、正確B、錯(cuò)誤【正確答案】:A21.FIume不支持對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單處理,并寫到各種數(shù)據(jù)接受方(可定制)的能力。A、正確B、錯(cuò)誤【正確答案】:B22.Redis不支持在服務(wù)器端進(jìn)行集合的交井補(bǔ)運(yùn)算。A、正確B、錯(cuò)誤【正確答案】:B23.云數(shù)融合指的是大數(shù)據(jù)基礎(chǔ)設(shè)施上云,改變大數(shù)據(jù)服務(wù)的提供方式,各大云廠商均開始提供各類大數(shù)據(jù)服務(wù)產(chǎn)品,以滿足客戶的需求。()A、正確B、錯(cuò)誤【正確答案】:A24.在進(jìn)行HDFS元數(shù)據(jù)持久化時(shí),NameNode可以周期性觸發(fā)EditLog和Fslmage的合并。A、正確B、錯(cuò)誤【正確答案】:B25.Kafka中的Broker具有消息接收和消息分發(fā)的能力。A、正確B、錯(cuò)誤【正確答案】:B26.在華為MRS中的Manager上,管理人員可以一鍵式完成集群的安裝部署、升級(jí)、參數(shù)配置、組件啟停等操作。A、正確B、錯(cuò)誤【正確答案】:A27.實(shí)時(shí)檢索場(chǎng)景對(duì)于數(shù)據(jù)加載的要求比較高,實(shí)際業(yè)務(wù)中要求每小時(shí)加載TB級(jí)的數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:A28.在HBase表中,通過行、列族和列限定符確定一個(gè)單元格(cell),且表中存儲(chǔ)的數(shù)據(jù)需要嚴(yán)格定義好數(shù)據(jù)類型,比如Name列需定義為stringA、正確B、錯(cuò)誤【正確答案】:B29.某大數(shù)據(jù)業(yè)務(wù)人員希望確保某份關(guān)鍵數(shù)據(jù)在Hive中不會(huì)因?yàn)閐rop操作導(dǎo)致數(shù)據(jù)別除。他可以采用內(nèi)部表的方式來實(shí)現(xiàn),drop操作時(shí)只會(huì)刪除元數(shù)據(jù)而不會(huì)刪除表數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:B30.數(shù)據(jù)倉庫僅僅提供存儲(chǔ)功能,以及面向數(shù)據(jù)管理的服務(wù)。A、正確B、錯(cuò)誤【正確答案】:A31.大數(shù)據(jù)離線批處理支持SQL類作業(yè)和自定義作業(yè)。A、正確B、錯(cuò)誤【正確答案】:A32.HBase類似于傳統(tǒng)關(guān)系型數(shù)據(jù)庫,可以輕易滿足海量數(shù)據(jù)的全局ACID特性。A、正確B、錯(cuò)誤【正確答案】:B33.通過SparkSession提交SQL語句時(shí),任務(wù)會(huì)像普通Spark應(yīng)用一樣被提交到集群中分布式運(yùn)行。A、正確B、錯(cuò)誤【正確答案】:A34.Hive中刪除外部表時(shí),元數(shù)據(jù)和數(shù)據(jù)會(huì)一起被刪除。A、正確B、錯(cuò)誤【正確答案】:B35.在Hive的SQL語句執(zhí)行中,因?yàn)間roupby等關(guān)鍵字的使用會(huì)導(dǎo)致數(shù)據(jù)傾斜。因此為了表面數(shù)據(jù)傾斜,應(yīng)禁止該類操作執(zhí)行。A、正確B、錯(cuò)誤【正確答案】:B36.Spark是基于內(nèi)存的分布式批處理系統(tǒng),與磁盤沒有關(guān)系,因此在安裝Spark時(shí),不需要安裝HDFS。A、正確B、錯(cuò)誤【正確答案】:B37.HBase依賴于Zookeeper完成主備選舉,以及管理root表。A、正確B、錯(cuò)誤【正確答案】:A38.離線批處理對(duì)數(shù)據(jù)處理的時(shí)延要求高,處理的數(shù)據(jù)量較大,占用的計(jì)算存儲(chǔ)資源較多,通常通過MR作業(yè)、Spark作業(yè)或者HQL作業(yè)實(shí)現(xiàn)。A、正確B、錯(cuò)誤【正確答案】:B39.在HBase中,BloomFilter的數(shù)據(jù)被存在RDD的元數(shù)據(jù)中,一旦寫入無法更新,因?yàn)镽DD是不可變的。開啟BloomFilter會(huì)有一定的存儲(chǔ)及內(nèi)存cache開銷。A、正確B、錯(cuò)誤【正確答案】:B40.對(duì)于數(shù)據(jù)集市和數(shù)據(jù)倉庫而言,面向最終用戶或應(yīng)用的是數(shù)據(jù)集市,面向數(shù)據(jù)管理的是數(shù)據(jù)倉庫。A、正確B、錯(cuò)誤【正確答案】:A41.實(shí)時(shí)流處理系統(tǒng)中消費(fèi)后的數(shù)據(jù)可以存儲(chǔ)到關(guān)系型數(shù)據(jù)庫中,便于實(shí)時(shí)查詢判斷A、正確B、錯(cuò)誤【正確答案】:A42.Impala使用SQL的方式運(yùn)行。A、正確B、錯(cuò)誤【正確答案】:A43.向HBase插入數(shù)據(jù),只可使用put一種方法。A、正確B、錯(cuò)誤【正確答案】:B44.在ElasticSearch中,用戶可以通過Head請(qǐng)求查詢某個(gè)索引是否存在。A、正確B、錯(cuò)誤【正確答案】:A45.GES技術(shù)架構(gòu)包含了接口層、計(jì)算層和存儲(chǔ)層。A、正確B、錯(cuò)誤【正確答案】:A46.GES既支持分布式部署也支持單機(jī)部署。A、正確B、錯(cuò)誤【正確答案】:A47.開啟BloomFilter會(huì)有一定的磁盤存儲(chǔ)空間及內(nèi)存cA,Che的額外開銷A、正確B、錯(cuò)誤【正確答案】:A48.Flume中輪詢調(diào)度(RoundRobinScheduling)算法簡(jiǎn)潔,無需記錄當(dāng)前所有連接的狀態(tài)。A、正確B、錯(cuò)誤【正確答案】:A49.作為企業(yè)級(jí)大數(shù)據(jù)平臺(tái),F(xiàn)usionInsight具備四大能力包括一站式平臺(tái)、永遠(yuǎn)在線、易用成本低以及可持續(xù)演進(jìn)。A、正確B、錯(cuò)誤【正確答案】:A50.行鍵是按照字典序存儲(chǔ),因此,設(shè)計(jì)行鍵時(shí),要充分利用這個(gè)排序特點(diǎn),將經(jīng)常一起讀取的數(shù)據(jù)存儲(chǔ)到一塊,將最近可能會(huì)被訪問的數(shù)據(jù)放在一塊。A、正確B、錯(cuò)誤【正確答案】:A51.ElasticSearch支持QueryCA,Che緩存技術(shù),主要用于緩存Filter中的查詢結(jié)果,即對(duì)一個(gè)查詢中包含的過濾器執(zhí)行結(jié)果進(jìn)行緩存。A、正確B、錯(cuò)誤【正確答案】:A52.在HDF
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東松山職業(yè)技術(shù)學(xué)院《地圖與測(cè)量學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東水利電力職業(yè)技術(shù)學(xué)院《草食動(dòng)物生產(chǎn)學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東石油化工學(xué)院《工程技術(shù)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東汕頭幼兒師范高等專科學(xué)?!度沼锰沾蓜?chuàng)新設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東培正學(xué)院《商務(wù)公文寫作》2023-2024學(xué)年第一學(xué)期期末試卷
- 七年級(jí)上冊(cè)《第一章 有理數(shù)章末小結(jié)與考點(diǎn)檢測(cè)》課件
- 廣東茂名幼兒師范??茖W(xué)?!犊萍颊撐淖珜憣?shí)踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 關(guān)愛生命-慢病識(shí)別及管理(蘇州衛(wèi)生職業(yè)技術(shù)學(xué)院)學(xué)習(xí)通測(cè)試及答案
- 【備戰(zhàn)2021高考】全國(guó)2021屆高中地理試題匯編(11月份):E2內(nèi)外力作用對(duì)地形的影響
- 【名師一號(hào)】2020-2021學(xué)年高中英語(北師大版)必修5隨堂演練:第十四單元綜合測(cè)評(píng)
- 低滲透油田地質(zhì)開發(fā)特征及開發(fā)對(duì)策
- 22G101系列圖集常用點(diǎn)全解讀
- 污水處理廠的工藝流程設(shè)計(jì)
- 社區(qū)矯正人員心理健康講座模板課件
- 中國(guó)和新加坡的英漢雙語教育政策比較研究
- 危險(xiǎn)品運(yùn)輸車輛租賃合同
- 英語完形填空閱讀理解40篇
- 裝配式鋼結(jié)構(gòu)工程計(jì)量與計(jì)價(jià)PPT完整全套教學(xué)課件
- 小說面面觀(譯文經(jīng)典)
- 普通地質(zhì)學(xué)教材
- 《并聯(lián)機(jī)器人運(yùn)動(dòng)學(xué)》
評(píng)論
0/150
提交評(píng)論