HCIP大數(shù)據(jù)練習(xí)測試題附答案_第1頁
HCIP大數(shù)據(jù)練習(xí)測試題附答案_第2頁
HCIP大數(shù)據(jù)練習(xí)測試題附答案_第3頁
HCIP大數(shù)據(jù)練習(xí)測試題附答案_第4頁
HCIP大數(shù)據(jù)練習(xí)測試題附答案_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第頁HCIP大數(shù)據(jù)練習(xí)測試題附答案1.以下關(guān)于SparkSQL中DataSet的描述中,錯誤的是哪一項?A、DataSet是一個由特定域的對象組成的強(qiáng)類型集合。B、DataSet是"懶惰"的,只在執(zhí)行A,Ction操作時觸發(fā)計算C、DataSet需要反序列化才可以執(zhí)行大部分操作。DataSet與RDD高度類似【正確答案】:C2.StructuredStreaming中持續(xù)地查詢最新計算結(jié)果至寫出。這個過程叫做什么?()A、ContinuousstringB、continousqueryC、mapqueryD、continousphrase【正確答案】:B3.關(guān)于ElasticSearch的說法,下列錯誤的是哪一項?A、不支持非結(jié)構(gòu)化數(shù)據(jù)B、對Lucene進(jìn)行了擴(kuò)展C、原型環(huán)境和生產(chǎn)環(huán)境可無縫切換D、能夠水平擴(kuò)展【正確答案】:A4.以下哪一項不屬于目前經(jīng)常定義的Sink類型。A、ElasticSearchSinkB、RedisSinkC、KafkaSinkD、ODBCSink【正確答案】:D5.在大數(shù)據(jù)業(yè)務(wù)處理的場景中,常常說不適合存儲大量的小文件。這主要是受以下哪個組件的影響?A、YarnB、HDFSC、HiveD、MapReduce【正確答案】:B6.下列哪一項是HBase不適合的應(yīng)用場景?A、要求具有完全A,CID特性的應(yīng)用場景。B、半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用場景。C、高吞吐率應(yīng)用場景。D、海量數(shù)據(jù)(TE、PF、應(yīng)用場景【正確答案】:A7.以下關(guān)于Flink的描述,錯誤的是哪一項?A、Flink在維護(hù)一次完整的的應(yīng)用狀態(tài)時,不能無縫修復(fù)錯誤B、Flink是一個批處理和流處理結(jié)合的統(tǒng)一計算框架C、Flink支持大規(guī)模運行,在上千個節(jié)點運行時有很好的吞吐量和低延遲D、Flink沒有單點故障,提供高吞吐量和低延遲的能力【正確答案】:A8.StructuredStreaming程序執(zhí)行過程中,定義流計算過程之后是哪一個步驟?A、創(chuàng)建輸入數(shù)據(jù)源B、導(dǎo)入相關(guān)依賴模塊C、啟動流計算并計算輸出結(jié)果D、創(chuàng)建SparkSession對象【正確答案】:C9.以下哪一選項不是企業(yè)級大數(shù)據(jù)平臺的特點?A、可維護(hù)性差B、可平滑拓展C、數(shù)據(jù)共享D、資源共享【正確答案】:A10.實時檢索應(yīng)用場景不包含以下哪一順?A、通過用戶姓名查找購房記錄B、通過用戶銀行卡號查找轉(zhuǎn)賬記錄C、通過用戶興趣愛好推薦影視作品D、通過用戶身份證號查找住宿記錄【正確答案】:C11.下列關(guān)于Hive自定義函數(shù)的描述中,正確的是哪一項?A、一般自行編寫的函數(shù)都屬于臨時函數(shù),每次使用都需要重新創(chuàng)建B、如果創(chuàng)建的函數(shù)名與內(nèi)置的函數(shù)名重復(fù),在使用過程中以內(nèi)置的函數(shù)名為主。C、一般自行編寫的函數(shù)都屬于永久函數(shù),直接引用即可。D、Hive中的min以及max屬于UDAF函數(shù)。【正確答案】:A12.HiveSQL中DDL指定是哪一種語言?A、數(shù)據(jù)刪除語言B、數(shù)據(jù)查詢語言C、數(shù)據(jù)管理語言D、數(shù)據(jù)定義語言【正確答案】:D13.Flume的應(yīng)用中,如果要保證sink的負(fù)載均衡,需要使用以下哪一個組件?A、DefaultSinkProcessorB、StaticInterceptorC、ReplicatingChannelSelectorD、FailoverSinkProcessor【正確答案】:A14.以下哪一選項不是大數(shù)據(jù)的特點?A、容量大B、種類多C、速度快D、結(jié)構(gòu)單一【正確答案】:D15.Hive中詳細(xì)顯示函數(shù)的用法為以下哪一選項?A、hive>getfunctions;B、hive>descfunctionextendedupper;C、hive>descfunctionupper;D、hive>showfunctions;【正確答案】:B16.GES基于ElasticSearch于的索引機(jī)制,能根據(jù)索引快速查詢數(shù)據(jù)。A、對(參考答案)B、錯【正確答案】:A17.以下哪一項不屬于圖搜索引擎技術(shù)的典型應(yīng)用場景?A、通過關(guān)系網(wǎng)絡(luò),查詢關(guān)聯(lián)關(guān)系,可用于反洗錢、風(fēng)控等場景B、根據(jù)某人的常用聯(lián)系人網(wǎng)絡(luò),查詢其社交關(guān)系最密切的有關(guān)人員C、基于"人、事、地、物、組織、身份"等點狀實體,查詢在社會關(guān)系網(wǎng)絡(luò)中的關(guān)聯(lián)關(guān)系D、根據(jù)歷史數(shù)據(jù),擬合函數(shù),預(yù)測未來手機(jī)流量使用趨勢【正確答案】:D18.以下關(guān)于HBase緩存刷新的說法中,哪一個選項是錯誤的?A、系統(tǒng)會周期性地把MemStore緩存里的內(nèi)容刷寫到磁盤的StoreFile文件中,清空緩存,并在Hlog里面寫入一個標(biāo)記B、每個HRegionServer都有一個自己的HLog文件,每次啟動都檢查該文件C、如果發(fā)現(xiàn)最近一次執(zhí)行緩存刷新操作之后發(fā)生新的寫入操作,則先寫入MemStore,再刷寫到StoreFileD、每次刷寫都生成一個新的StoreFile文件,但每個Store中僅包含一個StoreFile文件【正確答案】:D19.以下有關(guān)Hive多表關(guān)聯(lián)的描述,正確的是哪一個選項?A、Hive最右邊的表是大表,且無法通過命令指定哪張表是大表B、Hive在進(jìn)行多表關(guān)聯(lián)時,從右往左進(jìn)行關(guān)聯(lián)操作C、在HiveSQL中,建議把小表寫在右邊,這樣可以提高執(zhí)行效率D、一般情況下有多少張表進(jìn)行join連接操作,就會啟動多少個MapReduce任務(wù)【正確答案】:B20.關(guān)于HBase中HRegionServer的故障處理機(jī)制,以下說法中哪一項是錯誤的?A、共用日志優(yōu)點:恢復(fù)時需要分拆日志;缺點:提高對表的寫操作性能B、根據(jù)日志記錄所屬的Region對象對HLog數(shù)據(jù)進(jìn)行拆分,分別放到相應(yīng)Region對象的目錄下C、Zookeeper會實時監(jiān)測每個HRegionServer的狀態(tài),當(dāng)某個HRegionServer發(fā)生故障時,Zookeeper會通知HMasterD、HMaster首先會處理發(fā)生故障的HRegionServer上面遺留的HLog文件,這個遺留的HLog文件中包含了來自多個Region對象的日志記錄【正確答案】:A21.HBase的Region的是由哪個服務(wù)進(jìn)程來管理的?A、HRegionServerB、ZooKeeperC、DataNodeD、HMaster【正確答案】:A22.下列哪一個命令可以清空Redis實例下所有數(shù)據(jù)庫的數(shù)據(jù)A、dropallB、flushallC、dropdbD、flushdb【正確答案】:B23.關(guān)于HBase集群架構(gòu)組成各部分描述錯誤的是哪一選項?A、正常HBase表只有一個Region,不支持分裂B、Client可用于緩存維護(hù)已經(jīng)訪問過的Region的位置信息C、HRegionServer負(fù)責(zé)處理數(shù)據(jù)讀寫請求D、HMaster主要負(fù)責(zé)Region的管理工作【正確答案】:A24.關(guān)于HBase的概念視圖,以下描述中正確的是哪一項?A、HBase是一個面向列的非關(guān)系型數(shù)據(jù)庫B、HBase的每一行數(shù)據(jù)可以有不同的行鍵C、HBase表格數(shù)據(jù)以文件塊的形式存放在內(nèi)存中D、HBase的每一個Region都是固定大小,每個Region都是64MB【正確答案】:A25.編寫Scala代碼時,通過以下哪個算子可以實現(xiàn)數(shù)據(jù)過?A、filterB、collectC、mapD、flatmap【正確答案】:A26.企業(yè)數(shù)據(jù)分析平臺在根據(jù)不同的業(yè)務(wù)場景需求,搭建不同的大數(shù)據(jù)分析平臺,如適應(yīng)離線批處理的Hadoop平臺;適應(yīng)實時處理的流計算平臺等,這種架構(gòu)屬于哪種類型的架構(gòu)?A、分離架構(gòu)B、融合架構(gòu)C、多維架構(gòu)D、單一架構(gòu)【正確答案】:A27.以下關(guān)于實時處理解決方案與其它解決方案的關(guān)系,錯誤的是哪一項?A、實時處理系統(tǒng)需要備份存儲B、實時處理系統(tǒng)不需要考慮HAC、實時處理處理后的數(shù)據(jù)可用于實時檢索D、實時處理處理后的數(shù)據(jù)可直接應(yīng)用至業(yè)務(wù)系統(tǒng)【正確答案】:B28.關(guān)于HBase的RowKey,以下描述中錯誤的是哪一項?A、RowKey默認(rèn)最大長度64KB,實際應(yīng)用中一般為10~100字節(jié)B、在HBase中,每一個RowKey都是一串字節(jié)數(shù)組C、RowKey是一個長整型對象D、RowKey默認(rèn)按照字典序存儲【正確答案】:C29.ElasticSearch所采用的搜索方式,是通過VALUE找KEY。而在全文搜索中VALUE就是我們要搜索的關(guān)鍵詞,通過VALUE找到對應(yīng)的文檔。A、對(參考答案)B、錯【正確答案】:A30.在HBase中,實現(xiàn)不同HRegionServer之間的負(fù)載均衡是由以下哪一個組件負(fù)責(zé)管理的?A、HfileB、HlogC、HMasterD、MemStore【正確答案】:C31.Redis中相對于RDB持久化,以下對AOF持久化描述錯誤的是哪一選項?AOF持久化是用快照的方式實現(xiàn)的B、發(fā)生故障時恢復(fù)速度慢C、內(nèi)存占用過多,文件體積大D、占用較多磁盤的10開銷【正確答案】:A32.有關(guān)實時檢索技術(shù)在金融行業(yè)的應(yīng)用,以下哪一項說法是錯誤的?()A、實時檢索技術(shù)可完成查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款等B、底層可以整合多方數(shù)據(jù),形城關(guān)系網(wǎng)絡(luò),查詢關(guān)聯(lián)關(guān)系,可用于反洗錢、風(fēng)控等場景C、對于簡單查詢的場景,要求響應(yīng)時間在10分鐘左右D、可以根據(jù)ID(日志類型、卡號等)和時間段進(jìn)行查詢【正確答案】:C33.Spark2.0中引入了()的概念,它為用戶提供了一個統(tǒng)的切入點來使用Spark的各項功能。A、SparkSessionB、SparkTextC、SparkConfD、SparkContext【正確答案】:A34.以下哪一項不屬于Flink組件的滾動聚合算子?A、KeyBy()B、minBy()C、min()D、sum()【正確答案】:A35.以下哪一項不是傳統(tǒng)數(shù)據(jù)處理系統(tǒng)面臨的問題?A、有限的擴(kuò)展能力B、海量數(shù)據(jù)的存儲成本高C、大數(shù)據(jù)處理能力不足D、數(shù)據(jù)源多樣【正確答案】:D36.下列哪一項不是ElasticSearch的擴(kuò)展插件?A、es-HadoopB、ElasticSearch-headC、HadoopD、Logstash【正確答案】:C37.以下哪一項不是SparkSQL的適用場景?A、實時數(shù)據(jù)查詢B、需要處理PB級的大容量數(shù)據(jù)C、結(jié)構(gòu)化數(shù)據(jù)處理D、對數(shù)據(jù)處理的實時性要求不高的場景【正確答案】:A38.Hive中trim()函數(shù)的功能是以下哪一選項?A、字符串截取B、返回近似值。C、計算絕對值D、去除空字符串【正確答案】:D39.Kafka的特點包括不包括以下哪一選項?A、消息持久化B、分布式C、高吞吐D、隨機(jī)讀取【正確答案】:D40.以下哪一選項不是統(tǒng)一元數(shù)據(jù)管理的優(yōu)勢?A、元數(shù)據(jù)統(tǒng)一管理、統(tǒng)一訪問和使用B、提供可視化元數(shù)據(jù)管理工具C、使用事實標(biāo)準(zhǔn)Hivemetastore接口,業(yè)務(wù)易對接D、數(shù)據(jù)訪問分散授權(quán),數(shù)據(jù)安全無保障【正確答案】:D41.下列關(guān)于Phoenix的說法錯誤的是哪一項?A、將SQL編譯成HBase原生的scansB、確定scan關(guān)鍵字的最佳開始和結(jié)束C、讓scan并行執(zhí)行D、PhoenixSQL只能使用JDBC連接【正確答案】:D42.Spark處理數(shù)據(jù)時產(chǎn)生的中間產(chǎn)物會存放到以下哪一選項中?A、磁盤B、網(wǎng)絡(luò)C、內(nèi)存D、云上【正確答案】:C43.以下關(guān)于RDD的描述中,錯誤的是哪一項?A、RDD默認(rèn)是存儲于內(nèi)存。B、RDD是分布式彈性數(shù)據(jù)集。C、RDD的創(chuàng)建只能依賴HDFS。D、用戶可以選擇不同的存儲級別緩存RDD以便重用?!菊_答案】:C44.Hive架構(gòu)中有一個Driver模塊用于對SQL語句進(jìn)行轉(zhuǎn)化,那么對于Driver的描述中,正確的是哪一項?A、Driver中的Compiler負(fù)責(zé)對HiveQL生成的執(zhí)行計劃和MapReduce任務(wù)進(jìn)行優(yōu)化B、Driver中的Optimizer負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)。C、Driver中的Executor負(fù)責(zé)按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)Driver指Java的JDBC連接所用的Driver類?!菊_答案】:C45.在大數(shù)據(jù)分析場景中,以下說法哪一項是不正確的?A、SparkSQL:新型SQL處理引擎,速度比Hive快,處理SQL類的批處理任務(wù)B、HDFS:基于大數(shù)據(jù)的數(shù)據(jù)倉庫平臺C、FLink:流批一體式計算引擎D、Hive:類SQL查詢,傳統(tǒng)批處理引擎,速度較慢【正確答案】:B46.StructuredStreaming不能提供以下哪幾種類型的保證?AtmostonceB、AtleastonceC、MorethanonceD、Exactlyonce【正確答案】:C47.關(guān)于HBase建表語句,以下描述中錯誤的是哪一項?A、利用HBase的JavaAPI時,需要用put語句完成建表B、在建表時可以預(yù)先創(chuàng)建多個RegionC、在華為云MRS提供的HBaseshell客戶端中建表時,需指定至少一個列族名稱D、在HBaseshell客戶端中可以通過create命令建表【正確答案】:A48.以下哪一個選項不是ElasticSearch底層存放索引快照的位置?A、HadoopHDFSB、LocalFileSystemC、SharedFileSystemD、IndexModule【正確答案】:D49.以下關(guān)于Flume的描述,錯誤的是哪一項?A、Flume不支持級聯(lián)(多個Flume對接起來),合并數(shù)據(jù)的能力B、Flume支持按照用戶定制采集數(shù)據(jù)的能力C、提供實時采集日志信息(taildir)到目的地的能力D、提供從固定目錄下采集日志信息到目的地(HDFS,HBase,Kafka)能力【正確答案】:A50.關(guān)于Flink的角色,下列哪一項說法是錯誤的?A、Client是Flink程序提交的客戶端,對用戶提交的Flink程序進(jìn)行預(yù)處理,并提交到Flink集群中處理。B、JobManager扮演著集群中的管理者M(jìn)aster的角色,它是整個集群的協(xié)調(diào)者。C、TaskManager負(fù)責(zé)從用戶提交的Flink程序配置中獲取JobManager的地址。D、TaskManager是實際負(fù)責(zé)執(zhí)行計算的Worker.【正確答案】:C51.StructuredStreaming是構(gòu)建在以下哪個引擎上的框架?A、SparkSQLB、SparkStreamingC、SparkCoreD、SparkMLlib【正確答案】:A52.ElasticSearch數(shù)據(jù)寫入階段有很多調(diào)優(yōu)方式,下列錯誤的是哪一項?A、盡量使用自動生成的idB、禁用wildcardC、寫入前副本數(shù)設(shè)置為0D、寫入過程中:采取bulk批量寫入【正確答案】:B53.以下哪個選項不屬于智慧城市所需要的技術(shù)?AI計算B、大數(shù)據(jù)C、手工制作D、智慧交通【正確答案】:C54.以下關(guān)于Redis中String類型的描述,錯誤的是哪一項?A、一個字符串類型的值存儲的最大容量是1MBB、字符串類型是Redis中最基本的數(shù)據(jù)類型C、可以存儲圖片D、可以存儲文本數(shù)據(jù)【正確答案】:A55.關(guān)于分布式圖數(shù)據(jù)庫,以下描述正確的是哪一項?A、圖數(shù)據(jù)庫將數(shù)據(jù)切分為多個數(shù)據(jù)塊進(jìn)行存儲,數(shù)據(jù)塊大小固定128MBB、圖數(shù)據(jù)庫以"圖"這種數(shù)據(jù)結(jié)構(gòu)來存儲和查詢數(shù)據(jù)C、圖數(shù)據(jù)庫采用ER實體關(guān)系進(jìn)行存儲D、圖數(shù)據(jù)庫與關(guān)系型數(shù)據(jù)庫可以靈活轉(zhuǎn)化【正確答案】:B56.關(guān)于HDFS單名稱節(jié)點體系結(jié)構(gòu)的局限性,以下哪一個選項是錯誤的?A、HDFS只設(shè)置唯一一個名稱節(jié)點,一旦這個唯一的名稱節(jié)點發(fā)生故障,會導(dǎo)致整個集群變得不可用B、HDFS只設(shè)置唯一個名稱節(jié)點,資源和數(shù)據(jù)可以方便的完成隔離C、HDFS只設(shè)置唯-一個名稱節(jié)點,會帶來命名空間的限制D、HDFS只設(shè)置唯一個名稱節(jié)點,會帶來性能的瓶頸和吞吐量的瓶頸【正確答案】:B57.HDFS里元數(shù)據(jù)持久化過程包括Fslmage持久化和Editlog持久化,其中EditLog持久化是通過以下哪一種方式完成的?A、圖片B、日志C、網(wǎng)頁D、快照【正確答案】:B58.下面哪一選項不屬于Redis的優(yōu)化方法?A、Slowlog配置B、精簡鍵值C、開啟AOF持久化D、限制Redis內(nèi)存大小【正確答案】:C59.以下關(guān)于KeyBy算子的描述,錯誤的是哪一項?A、數(shù)據(jù)類型轉(zhuǎn)換是KeyedStream->DataStreamB、每個分區(qū)包含具有相同key的元素C、邏輯地將一個流拆分成不相交的分區(qū)D、在內(nèi)部以hash的形式實現(xiàn)的【正確答案】:A60.()是一個實現(xiàn)了文件系統(tǒng)的抽象類,繼承自org.apache.hadoop.conf.Configured,并實現(xiàn)了Closeable接口,可以適用于多種文件系統(tǒng)。A、FileSystemB、FSDataOutputStroamC、FSDatalnputStreamD、FileConfiguration【正確答案】:A61.某大數(shù)據(jù)業(yè)務(wù)人員在查詢某張表的業(yè)務(wù)數(shù)據(jù)時,希望查詢出來的數(shù)值結(jié)果保留兩位小數(shù)他應(yīng)該使用哪個函數(shù)來實現(xiàn)?A、randB、absC、trimD、round【正確答案】:D62.如果想把Redis的Key中存儲的數(shù)字值減1,該使用下列哪一個命令?A、incrbyB、decrC、decrbyD、incr【正確答案】:B63.消息系統(tǒng)Kafka如何保證高吞吐能力?A、Partition機(jī)制B、持久性機(jī)制C、多訂閱者機(jī)制D、冗余備份機(jī)制【正確答案】:A64.下面哪一項不是Kafka的組件?A、BrokersB、ConsumerC、TopicD、Zookeeper【正確答案】:D65.以下哪一選項不屬于華為云MRS中Manager的特點?A、一鍵式部署、升級B、運維難度高C、管理員可全面掌握集群運行狀態(tài)D、故障快速定位【正確答案】:B66.某大數(shù)據(jù)業(yè)務(wù)人員需針對某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個數(shù)據(jù)為時間類型yyyyMMdd.那么可以使用以下哪一項作為字段類型?A、varcahrB、stringC、intD、double【正確答案】:B67.關(guān)于HBase,以下描述正確的是哪一項?A、對于絕大部分企業(yè)級大數(shù)據(jù)平臺而言,HBase底層需依賴HDFS存儲海量數(shù)據(jù)B、HBase可輕易實現(xiàn)海量數(shù)據(jù)的全局A,CID特性C、HBase和Zookeeper不是強(qiáng)綁定的D、HBase無法存儲結(jié)構(gòu)稀疏的表格【正確答案】:A68.關(guān)于華為云GES圖數(shù)據(jù)庫的Gremlin語言,以下描述中錯誤的是哪一項?A、Gremlin遍歷由一系列步驟組成,這些步驟相互解耦,互不影響,不存在嵌套問題B、Gremlin是一種函數(shù)式數(shù)據(jù)流語言,用戶可以使用簡潔的方式實現(xiàn)對復(fù)雜的屬性圖的遍歷或查詢C、ApacheTinkerPop是圖形數(shù)據(jù)庫和圖形分析系統(tǒng)的圖形計算框架D、Gremlin是ApacheTinkerPop框架下的圖遍歷語言【正確答案】:A69.Spark讀取任務(wù)參數(shù)優(yōu)先級最高的是以下哪一選項?A、動態(tài)參數(shù)B、代碼配置C、配置文件D、客戶端配置【正確答案】:B70.某大數(shù)據(jù)運維人員想通過shell命令上傳某個文件至HDFS文件系統(tǒng)中。以下哪個命令能幫助他完成這個操作?A、-putB、-getC、-uploadD、-cat【正確答案】:A71.以下哪一選項不是基于數(shù)據(jù)湖構(gòu)建一站式Al開發(fā)平臺ModelArts的特點?AI全流程開發(fā):高精度、高效率完成開發(fā)任務(wù)B、可視化管理:數(shù)據(jù)準(zhǔn)備、模型構(gòu)建部署可視化管理C、需自行安裝下載TensorFlow、PyTorch等主流計算框架D、在線推理、批量推理和邊緣推理,滿足多種業(yè)務(wù)場景訴求【正確答案】:C72.以下關(guān)于HDFS元數(shù)據(jù)持久化的描述中,哪一個選項是錯誤的?A、SecondaryNameNode合并成FsImage后回傳給主NameNode替換掉原有Fslmage,并將EditLog.new命名為EditLogB、在SecondaryNameNode的內(nèi)存中對FsImage文件和EditLog文件合并后產(chǎn)生新的Fslmage,叫做Fslmage.ckpC、將數(shù)據(jù)傳到SecondaryNameNode時,因數(shù)據(jù)讀寫不能同步進(jìn)行,此時NameNode產(chǎn)生一個新的日志文件EditLog.new用來存放這段時間的操作日志D、ActiveNameNode中的Fslmage和EditLog可以直接在本地完成合并操作,而不需要被拷貝到SecondaryNameNode中【正確答案】:D73.Hive數(shù)據(jù)存儲模型中不包括以下哪一結(jié)構(gòu)?A、分區(qū)B、表C、桶D、塊【正確答案】:D74.在華為云GES中,想要給圖g中id為"Katherine"的用戶添加朋友為"zhangsan"。以下哪一個選項能正確實現(xiàn)上述目的?A、g.addV('friends').from(g.V("Katherine")).to(g.V("zhangsan"))B、g.addV('friends').from(g.V("zhangsan")).to(g.V("Katherine"))C、g.addE('friends').from(g.V("zhangsan")).to(g.V("Katherine"))D、g.addE('friends').from(g.V("Katherine").to(g.V("zhangsan"))【正確答案】:D75.關(guān)于ElasticSearch性能優(yōu)化,以下哪一項說法是錯誤的?A、分片數(shù)不超過節(jié)點數(shù)的3倍,用較少的分片獲得更佳的性能B、索引創(chuàng)建好后依然可以動態(tài)調(diào)整分片數(shù)量C、分片最大容量不要超過E1asticSearch推薦的最大JVM堆空間32GD、副本數(shù)建議設(shè)置為1,過多的副本需要更多存儲空間【正確答案】:B76.HBase中一張表通過指定Regionf的StartKey為10、20和30進(jìn)行region分裂,那么行鍵為222的數(shù)據(jù)將屬于以下哪一個Region?A、[10,20]B、[20,30]C、[30,"+inf']D、[0,10]【正確答案】:C77.下列代碼的作用是?Stringvertexld=getVertexldByPropert(api,graphName,"person,name,mark");api.queryVertex(vertexld,graphName):A、查詢點B、查詢屬性C、查詢邊D、以上全不正確【正確答案】:A78.消費者在消費Kafka中數(shù)據(jù)的時候需要指定以下哪個選項的信息?A、TimeB、ObjectC、TopicD、Theme【正確答案】:C79.Spark中A,Ction算子返回的是以下哪一選項?A、依賴關(guān)系B、DAG圖C、RDDD、計算結(jié)果或者是寫入存儲操作【正確答案】:D80.大數(shù)據(jù)體量范圍一般是以下哪一選項?A、TB-PBB、GB-TBC、HB-GBD、KB-MB【正確答案】:A81.以下哪個選項屬于大數(shù)據(jù)消息系統(tǒng)?A、HDFSB、MapReduceC、YarnD、Kafka【正確答案】:D82.Kafka運行時直接依賴于以下哪一個組件?A、HBaseB、HDFSC、SparkD、Zookeeper【正確答案】:D83.Loader是基于哪個開源組件的圖形化遷移管理工具?A、HueB、spankC、SqoopD、Kettle【正確答案】:C84.以下描述中,哪一項不是實時檢索技術(shù)在金融行業(yè)的應(yīng)用特點?A、高并發(fā)B、查詢條件復(fù)雜C、時延要求高D、存在海量圖片小文件【正確答案】:B85.以下哪一項不屬于Hive的數(shù)學(xué)函數(shù)?A、rand()B、Abs()C、trim()D、round(【正確答案】:C86.對于數(shù)據(jù)倉庫而言,一般分為四層,ODS層、DWD層、DWS層和ADS層。以下關(guān)于數(shù)據(jù)倉庫分層的描述中,錯誤的是哪一項?A、ODS層為原始數(shù)據(jù)層,數(shù)據(jù)無需做變動直接導(dǎo)入B、DWS層基于DWD層進(jìn)行了數(shù)據(jù)清洗C、DWD層為數(shù)據(jù)明細(xì)層,也與ODS層數(shù)據(jù)一致。D、ADS層一般面向用戶,會將數(shù)據(jù)同步到關(guān)系型數(shù)據(jù)庫中【正確答案】:B87.關(guān)于GES特點,以下描述中正確的是哪一項?A、簡單易用:支持SQL查詢語言,兼容不同用戶的使用習(xí)慣B、高性能:對分布式圖形計算引警進(jìn)行了深度優(yōu)化,具有高井發(fā)、最快可達(dá)分鐘級時延的實時查詢能力C、大規(guī)模:最大可支持百萬節(jié)點千萬邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析D、查詢分析一體:提供豐富的圖分析算法,實現(xiàn)了查詢分析一體化【正確答案】:D88.關(guān)于Kalka的Topic,以下哪一項描述是錯誤的?A、Topic的Partition數(shù)量可以在創(chuàng)建時配置。B、Kafka集群中Topic可以設(shè)置多個。C、設(shè)置多副本可以增強(qiáng)Kaka服務(wù)的容災(zāi)能力。D、在創(chuàng)建Kafka的Topic時,必須設(shè)置Partition個數(shù)【正確答案】:D89.為了提高Kafka的容錯性,Kafka支持Partition的復(fù)制策略,以下關(guān)于LeA,DerPartition和FollowerPartition的描述哪一項是錯誤的?A、Kafkat對Partition的復(fù)制需要選出一個LeA,Der,由該LeA,Der負(fù)責(zé)Partition的讀寫操作,其他的副本節(jié)點只是負(fù)責(zé)數(shù)據(jù)的同步B、如果LeA,Der失效,那么將會有其他Follower來接管(成為新的LeA,DerC、一個Kafka集群各個節(jié)點間不可能互為LeA,Der和FollowerD、由于LeA,DerServer承載了全部的請求壓力,因此從集群的整體考慮,Kafka會將LeA,Der均橫的分散在每個實例上,來確保整體的性能穩(wěn)定【正確答案】:C90.以下哪一個函數(shù)不是Hive內(nèi)置的寧符串函數(shù)?A、substring()B、length()C、trim()D、round()【正確答案】:D91.HBase使用get方法讀取數(shù)據(jù)時,下列哪個選項是需要的?A、scan.setCaching(1000)B、Deletedelete=newDelete(rowKey)C、byte[]rowKey=Bytes.toBytes("012005000201")D、List<Put>puts=newArrayList<Put>【正確答案】:C92.Redis不適用于以下哪個應(yīng)用場景?A、獲取TOPN操作B、獲取PB級Value數(shù)據(jù)C、獲取最新N個數(shù)據(jù)的操作D、獲取手機(jī)驗證碼【正確答案】:B93.在華為云GES服務(wù)中,想要在一張已存在的圖g中添加id為張三,年齡為18-24,性別為M的user用戶。以下哪一個選項能正確實現(xiàn)上述目的?單選A、g.addVertex(label,'user',id.'張','Age','18-24')B、g.addE(id,"張三").from(g.V("Katherine").to(g.V("id","張三")C、g.addV("張三").property("Age","18-24").property("Gender","M")D、g.addV("user").property(id,"張三").property("Age","18-24")!property("Gender","M")【正確答案】:D94.altertabletableNamesettblproperties('EXTERNAL'='FALSE'):執(zhí)行該Hive命令能實現(xiàn)以下哪一個目標(biāo)?A、修改內(nèi)部表tableName為外部表B、移動tableName數(shù)據(jù)到外部存儲系統(tǒng)C、刪除tableName表的元數(shù)據(jù)信息D、修改外部表tableName為內(nèi)部表【正確答案】:D95.Redis默認(rèn)支持的數(shù)據(jù)庫個數(shù)是多少?A、10B、5C、16D、15【正確答案】:C96.關(guān)于實時檢索技術(shù)的應(yīng)用場景,以下描述中錯誤的是哪一個選項?A、運營商可以借助實時檢索技術(shù),查詢某個時間段用戶的流量記錄,以應(yīng)對不良APP偷跑流量引發(fā)的投訴B、實時檢索要求在小批量數(shù)據(jù)集上需達(dá)到毫秒級的時延C、在金融風(fēng)控場景中,利用實時檢索技術(shù),客戶可以在發(fā)生危險交易前及時止損D、公安系統(tǒng)數(shù)據(jù)量大、業(yè)務(wù)要求復(fù)雜,因此無法借助實時檢索技術(shù)提高處警效率【正確答案】:D97.某電商網(wǎng)站想要實現(xiàn)熱銷商品的實時TopN排名,可以使用哪種技術(shù)實現(xiàn)?A、Hive的關(guān)聯(lián)查詢分析B、HBaserowkey的索C、Elasticsearch的快速檢索D、Redis的排序計算【正確答案】:D98.某大數(shù)據(jù)開發(fā)人員在創(chuàng)建Hive表結(jié)構(gòu)時,發(fā)現(xiàn)原先創(chuàng)建的表存儲格式出現(xiàn)了問題。對于這一現(xiàn)象,以下描述中,錯誤的是哪一項?A、不同的存儲格式會影響表的處理效率B、必須修正回來,不然會導(dǎo)致數(shù)據(jù)無法查詢C、可以通過alter命令進(jìn)行修改D、錯誤的表存儲格式會影響10A,D命令加載,導(dǎo)致數(shù)據(jù)無法正常導(dǎo)入【正確答案】:B99.以下關(guān)于Sqoop數(shù)據(jù)導(dǎo)入原理的描述中,錯誤的是哪一項?A、Sqoop在import時,需要指定split-by參數(shù)。B、Sqoop會根據(jù)傳入的num-mappers來確定劃分幾個區(qū)域。C、Sqoop根據(jù)不同的split-by參數(shù)值來進(jìn)行切分,然后將切分出來的區(qū)域分配到不同map中。D、num-nappers越大效率越高。【正確答案】:D100.Hive表與MySQL類似存在分區(qū)的概念,那么對于Hive的分區(qū),以下描述中,正確的是哪一項?A、Hive的分區(qū)針對的是文件,分桶針對的是文件夾。B、Hive的分區(qū)數(shù)量可以通過參數(shù)動態(tài)生成。C、Hive的分區(qū)和分桶是以一個概念。D、Hive的分區(qū)字段與MySQL一樣必須存在?!菊_答案】:B1.關(guān)于ApachePhoenix與HBase的搭配,以下哪些選項是正確的?A、PhoenixSQL只有命令行一種使用模式,無法對接JDBC進(jìn)行使用B、ApachePhoenix可以將SQL查詢編譯為一系列HBase掃描C、Phoenix在Hadoop中為低延遲應(yīng)用程序提供OLTP和運營分析能力D、ApachePhoenix可以為小型查詢提供毫秒級的性能,或者為數(shù)千萬行數(shù)據(jù)提供秒級的性能【正確答案】:BCD2.下面哪幾項屬于ElasticSearch的RESTful請求方式?A、PostB、UpdateC、DeleteD、Get【正確答案】:ACD3.Flink提供的窗口分配器,包含以下哪些項?A、全局窗口B、滾動窗口C、滑動窗口D、會話窗口【正確答案】:ABCD4.Redis包含以下哪些數(shù)據(jù)類型?A、HashB、ListC、StringD、Set【正確答案】:ABCD5.以下哪些選項不屬于HDFS文件系統(tǒng)將文件分塊帶來的好處?A、數(shù)據(jù)備份比較麻煩B、簡化系統(tǒng)設(shè)計C、存儲效率有所降低D、支持大規(guī)模文件存儲【正確答案】:AC6.關(guān)于Hive導(dǎo)入數(shù)據(jù)的命令,以下哪些選項是正確的?A、loA,Ddatainpath可用于將HDFS上的數(shù)據(jù)導(dǎo)入Hive表中B、導(dǎo)入數(shù)據(jù)時必須指定導(dǎo)入哪張表格,也就是需要使用intotable關(guān)鍵詞+表名C、可以使用Local關(guān)鍵詞從本地文件系統(tǒng)導(dǎo)入數(shù)據(jù)至Hive,但是這里的Local指的是hiveserver服務(wù)所在的機(jī)器,而不是beeline客戶端所在的機(jī)器D、如果原先表中有數(shù)據(jù),想用新數(shù)據(jù)覆蓋舊數(shù)據(jù),可以添加overwrite參數(shù)進(jìn)行覆蓋【正確答案】:ABCD7.ElasticSearch的定位包含以下哪些方法?A、文檔檢素B、實時搜索C、主鍵查詢D、非主鍵查詢【正確答案】:ABCD8.以下關(guān)于Filnk的窗口描述正確的是()。A、Flink窗口按窗口行為劃分:TumblingWindow-SlidingWindow.SessionWindow.B、窗口可以是時間驅(qū)動的也可以是數(shù)據(jù)驅(qū)動的。C、我們可以每30秒計算一次最近一分鐘用戶購買的商品總數(shù),這個就是時間滑動窗口的應(yīng)用方式。D、會話窗口是將數(shù)據(jù)聚合到會話窗口中,由非活躍的間隙分隔開?!菊_答案】:ABCD9.以下哪些選項屬于Kafka高效文件存儲設(shè)計的特點?A、通過index元數(shù)據(jù)全部映射到memory,可以避免segmentfile的lo磁盤操作。B、Kafka把topic中一個parition大文件分成多個小文件段,通過多個小文件段,就容易定期清除或刪除已經(jīng)消費完文件,減少磁盤占用。C、通過索引信息可以快速定位message和確定response的最大大小。D、通過索引文件稀疏存儲,可以大幅降低index文件元數(shù)據(jù)占用空間大小【正確答案】:ABCD10.以下哪些選項屬于HBase常見的應(yīng)用場景?A、消息、訂單數(shù)據(jù)存儲B、用戶畫像數(shù)據(jù)存儲C、氣象數(shù)據(jù)存儲D、全年總銷售額統(tǒng)計分析【正確答案】:ABC11.通過Loader的可視化界面,可以實現(xiàn)以下哪些操作?A、數(shù)據(jù)分析任務(wù)B、制定多種不同的數(shù)據(jù)源C、數(shù)據(jù)可視化操作D、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟【正確答案】:BCD12.大數(shù)據(jù)融合架構(gòu)具有以下哪些優(yōu)勢?A、實現(xiàn)資源共享、實現(xiàn)管理自動化B、同一份數(shù)據(jù)可同時進(jìn)行批處理C、消除數(shù)據(jù)孤島,減少冗余D、流處理以及查詢多種計算模型【正確答案】:ABCD13.Flink有哪些狀態(tài)存儲方式?A、MemoryStateBA,CkendB、FsStateBA,CkendC、MySqlStateBA,CkendD、RocksDBStateBA,Ckend【正確答案】:ABD14.關(guān)于MRS的Redis增強(qiáng)特性描述正確的是()。A、支持?jǐn)?shù)據(jù)導(dǎo)入導(dǎo)出工具B、自研Arm架構(gòu)C、集群可靠性保障D、完善的集群管理功能【正確答案】:ABCD15.以下哪些選項是離線批處理的特點?A、多個作業(yè)調(diào)度復(fù)雜B、容易產(chǎn)生資源搶占C、處理數(shù)據(jù)量巨大,PB級D、處理時間要求高【正確答案】:ABC16.關(guān)于ElasticSearch的基本理解,以下哪些選項是正確的?A、ElasticSearch的全文檢索條件可以包括詞或短語B、ElasticSearch可以支持非結(jié)構(gòu)化數(shù)據(jù)檢索C、ElasticSearch自身就可以提供數(shù)據(jù)可視化操作D、ElasticSearch可以支持?jǐn)?shù)據(jù)清洗和分詞【正確答案】:ABD17.在HBase中利用get命令查找某一個單元格對應(yīng)的數(shù)據(jù),以下哪些信息是必要的?()A、ColumnQualifier(限定符)信息B、Rowkey(行鍵)信息C、DataBlockID(數(shù)據(jù)塊編號)信息D、ColumnFamily(列族)信息【正確答案】:ABD18.Redis中Key的expire生存時間不適合以下哪些場景?A、存儲特定用戶所有歷史信息B、限時優(yōu)惠活動C、限制網(wǎng)站訪客訪問頻率D、電商網(wǎng)站過去一年營銷總額統(tǒng)計【正確答案】:AD19.以下關(guān)于Channel的描述中,錯誤的是哪些項?A、Channel位于Source和Sink之間B、Channels不支持事務(wù)Channel的作用類似隊列D、Channels提供較強(qiáng)的順序保證【正確答案】:BD20.以下哪些選項是Loader提供的功能?A、可以指定多種不同數(shù)據(jù)源B、提供定時調(diào)度任務(wù),周期性執(zhí)行作業(yè)C、提供可視化向?qū)降淖鳂I(yè)配置管理界面D、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟【正確答案】:ABCD21.以下哪些選項是傳統(tǒng)大數(shù)據(jù)架構(gòu)面臨的挑戰(zhàn)?A、資源無法彈性B、業(yè)務(wù)上線速度慢C、多集群無法統(tǒng)一運維D、建設(shè)成本高【正確答案】:ABCD22.以下關(guān)于微批處理模型的描述,正確的是哪些項?A、在下一個微批處理之前,要將數(shù)據(jù)的偏移范圍保存在日志中B、當(dāng)前到達(dá)的數(shù)據(jù)需要在上一批次處理完,才能下一個批次數(shù)據(jù)繼續(xù)處理C、會有一定的延遲D、流計算引警在處理上一批次數(shù)據(jù)結(jié)束后,再對新數(shù)據(jù)進(jìn)行批量查詢【正確答案】:ABCD23.某大數(shù)據(jù)業(yè)務(wù)人員在不小心刪除了HDFS某個文件后,想通過回收站機(jī)制恢復(fù)數(shù)據(jù),但是在對應(yīng)的回收站目錄/user/root/.Trash中為什么找不到要恢復(fù)的數(shù)據(jù)?A、回收站中的數(shù)據(jù)超過了保留的期限,被系統(tǒng)刪除了。B、回收站機(jī)制并沒有開啟,導(dǎo)致沒有及時回收C、回收站通過回收間隔,對數(shù)據(jù)進(jìn)行了整理,需要進(jìn)入到指定時間間隔下才能找到D、查找的目錄可能出現(xiàn)了問題,需要核實刪除操作的用戶?!菊_答案】:AB24.Spark中RDD是彈性數(shù)據(jù)集的原因包括以下哪些選項?A、基于Lineage的高效容錯B、自動進(jìn)行內(nèi)存和磁盤數(shù)據(jù)存儲的切換C、數(shù)據(jù)調(diào)度彈性D、Task失敗自動重試【正確答案】:ABC25.以下哪些選項是容易造成Hive數(shù)據(jù)傾斜的原因?()A、groupbyB、joinC、distinctcountD、droptable【正確答案】:ABC26.關(guān)于使用HBase的JavaAPI讀取數(shù)據(jù),以下描述中正確的是哪些項?A、QualifierFilter用于過HBase表中的列族信息B、HBaseFilter主要在Scan和Get過程中進(jìn)行數(shù)據(jù)過濾,通過設(shè)置一些過濾條件來實現(xiàn)條件查詢C、要從表中讀取數(shù)據(jù),首先需要實例化該表對應(yīng)的Table實例D、為了提高查詢效率,使用Scan命令時最好指定StartRow和StopRow【正確答案】:ABCD27.以下哪些選項是網(wǎng)站日志的特點?A、價值密度低B、數(shù)據(jù)的業(yè)務(wù)種類多C、數(shù)據(jù)結(jié)構(gòu)復(fù)雜D、數(shù)據(jù)量大【正確答案】:ABCD28.以下哪些選項可以在華為云GES服務(wù)中實現(xiàn)?A、根據(jù)用戶的用戶畫像,為用戶推薦最合適的電影(推薦系統(tǒng))B、查詢兩個用戶Reed和Caspar的最短路徑(計算最短路徑)C、調(diào)用PageRank算法,查間圖中最關(guān)鍵的數(shù)據(jù)點(PageRank算法)D、查詢Hillary用戶的朋友的朋友的朋友(多級關(guān)系查詢)【正確答案】:ABCD29.下面選項哪些是HBase數(shù)據(jù)查詢過濾器Filter的比較器?A、BinaryComparatorB、SubStringComparatorC、BinaryPrefixComparatorD、RegexStringComparator【正確答案】:ABCD30.關(guān)于HBaseRegion分裂的描述中,以下哪些選項是正確的?A、Region拆分操作需要消耗大量時間B、拆分過程中的Region是不可讀的C、直到分裂過程結(jié)束,把存儲文件異步地寫到獨立的文件之后,才會讀取新文件D、在RegionSplit時,拆分之后的Regioni讀取的仍然是原存儲文件【正確答案】:BC31.下列關(guān)于大數(shù)據(jù)的說法中,錯誤的是哪些選項?A、大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時效性強(qiáng)的特征B、處理大數(shù)據(jù)需采用新型計算架構(gòu)和智能算法等新技術(shù)C、大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析D、大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析【正確答案】:AC32.HDFS文件系統(tǒng)適用于哪些場景?A、大規(guī)模數(shù)據(jù)(TB及以上)B、流式數(shù)據(jù)訪問(寫一次,讀多次)C、頻繁修改文件(基本就是寫一次)D、商用硬件(一般硬件)【正確答案】:ABD33.以下哪些選項可以提供文檔數(shù)據(jù)檢索服務(wù)?A、HDFSB、MapReduceC、ElasticSearchD、Lucene【正確答案】:CD34.由GESREST接口可以實現(xiàn)以下哪些操作?A、創(chuàng)建圖B、刪除圖C、創(chuàng)建edgelA,BelD、創(chuàng)建vertexIA,Bel【正確答案】:ABCD35.相較于大數(shù)據(jù)組件,傳統(tǒng)數(shù)據(jù)倉庫存在以下哪些劣勢?A、I/O存在瓶頸B、大規(guī)模數(shù)據(jù)實時性差C、拓展能力差D、架構(gòu)單一【正確答案】:ABCD36.2019年以后,華為云數(shù)據(jù)湖CloudDataLake中數(shù)據(jù)管理包含以下哪些組件。AWSGlueB、DeltaLakeC、AtlasD、HUDI【正確答案】:ABCD37.實時檢索的公安和金融行業(yè)應(yīng)用場景有哪些特征?A、高并發(fā)B、存在海量小文件C、查詢速度快D、查詢條件簡單【正確答案】:ABCD38.關(guān)于HBase中scan和get的描述,以下哪些選項是正確的?A、get命令可以指定查找特定的單元格B、scan可以用于掃描全表數(shù)據(jù)C、get命令必須指定行健信息D、scan命令無法指定行鍵的范圍【正確答案】:ABC39.華為企業(yè)云數(shù)據(jù)湖具有以下哪些優(yōu)勢?A、開放接口,支持開放實時標(biāo)準(zhǔn),構(gòu)建豐富生態(tài),自助式數(shù)據(jù)開發(fā)與分析B、存儲和計算分離,支持更多用戶并發(fā)和更大數(shù)據(jù)量C、更多數(shù)據(jù)通過實時、虛擬方式入湖,數(shù)據(jù)產(chǎn)生即可見、可用D、數(shù)據(jù)集中,開放共享、統(tǒng)一目錄管理,避免跨系統(tǒng)數(shù)據(jù)搬遷【正確答案】:ABCD40.以下關(guān)于AppendMode的描述中,正確的是哪些項?A、只適用于結(jié)果集中已經(jīng)存在的內(nèi)容不希望發(fā)生改變的情況B、當(dāng)時間間隔觸發(fā)時,只有在ResultTable中新增加的數(shù)據(jù)行會被寫入到外部存儲C、如果已經(jīng)存在的數(shù)據(jù)會被更新,推薦使用此方式D、如果已經(jīng)存在的數(shù)據(jù)會被更新,不適合適用此方式【正確答案】:ABD41.華為混合云MRS服務(wù)的優(yōu)勢有哪些?A、存算分離,TCO下降B、易管理,駕駛艙體驗C、多場景融合,高性能D、易部署,所用即所得【正確答案】:ABCD42.StructuredStreaming可以提供以下哪幾種類型的保證?A、OnlyOnceB、AtmostonceC、ExactlyonceD、Atleastonce【正確答案】:BCD43.離線批處理的數(shù)據(jù)來源可以是以下哪些選項?A、0GG日志流B、日志文件C、批量文件數(shù)據(jù)D、數(shù)據(jù)庫【正確答案】:ABCD44.關(guān)于SparkSQL和Hive的區(qū)別與聯(lián)系,以下哪些選項是正確的?A、SparkSQL的執(zhí)行引擎為SparkCore,Hive默認(rèn)執(zhí)行引擎為TezB、SparkSQL不可以使用Hive的自定義函數(shù)C、SparkSQL依賴Hive的元數(shù)據(jù)D、SparkSQL兼容絕大部分Hive的語法【正確答案】:ACD45.以下關(guān)于有界流的描述,哪些項是正確的?A、有界流處理通常被稱為批處理B、有定義流的開始,也有定義流的結(jié)束C、有界流可以在讀取所有數(shù)據(jù)后再進(jìn)行計算D、有界流所有數(shù)據(jù)可以被排序,所以并不需要有序攝取【正確答案】:ABCD46.以下哪些選項是GES圖數(shù)據(jù)庫用于存儲海量數(shù)據(jù)的基礎(chǔ)組件?A、SparkB、FlinkC、HBaseD、ElasticSearch【正確答案】:CD47.以下哪些算子是窄依賴?A、filterB、groupyByKeyC、mapD、union【正確答案】:ACD48.以下哪些選項是Hive數(shù)據(jù)倉庫分層的優(yōu)點?A、隔離原始數(shù)據(jù)B、復(fù)雜問題簡單化C、減少重復(fù)開發(fā)D、清晰數(shù)據(jù)結(jié)構(gòu)【正確答案】:ABCD49.大數(shù)據(jù)的價值體現(xiàn)在以下哪些方面?A、大數(shù)據(jù)實現(xiàn)了精準(zhǔn)營銷B、大數(shù)據(jù)助力智慧城市提升公共服務(wù)水平C、大數(shù)據(jù)給思維方式帶來了沖擊D、大數(shù)據(jù)為政策制定提供科學(xué)論據(jù)【正確答案】:ABD50.以下哪些選項是華為云MRS使用HetuEngine的根本原因?A、企業(yè)傳統(tǒng)數(shù)倉,缺乏高效、統(tǒng)一的融合分析B、企業(yè)傳統(tǒng)數(shù)倉采用分系統(tǒng)構(gòu)建模式,導(dǎo)致數(shù)據(jù)冗余嚴(yán)重,阻礙企業(yè)快速轉(zhuǎn)型C、隨著數(shù)據(jù)量增長,業(yè)務(wù)對數(shù)據(jù)分析靈活性要求越來越高D、HetuEngine對浪涌式的數(shù)據(jù)進(jìn)行整合分析,發(fā)揮最大價值【正確答案】:ABCD51.實時檢索的解決方案中有哪些組件?A、HadoopB、HiveC、ElasticSearchD、HBase【正確答案】:CD52.以下哪些是常用的數(shù)據(jù)采集工具?A、SqoopB、FlumeC、LoaderD、Kafka【正確答案】:ABC53.HBase中HMaster主要負(fù)責(zé)()A、Regionserverf負(fù)載均衡B、表的增刪改查C、Region分布調(diào)整D、用戶數(shù)據(jù)讀寫【正確答案】:ABC54.以下關(guān)于Source的描述中,正確的是哪些項?A、execsource執(zhí)行某個命令或者腳本,并將其執(zhí)行結(jié)果的輸出作為數(shù)據(jù)源B、httpsource支持http的post發(fā)送數(shù)據(jù)C、spoolingdirectorysource采集本地靜態(tài)文件D、Source有驅(qū)動和輪詢兩種類型【正確答案】:ABCD55.下列哪些選項是Flink的高抽象層API?A、DataStreamAPIB、DataSetAPIC、SQLAPID、TableAPI【正確答案】:CD56.有關(guān)實時檢索引擎中各組件的聯(lián)系與定位,以下描述中正確的有哪些項?()A、ElasticSearch存儲數(shù)據(jù)性價比低,但是其能夠滿足場景中多級索引的實時查詢需求,同時還能夠?qū)ξ臋n分詞建立索引B、圖數(shù)據(jù)庫可以完美的解決復(fù)雜多級關(guān)系查詢分析,選用GES來解決圖數(shù)據(jù)的實時查詢需求C、與HBase相比,ElasticSearch在海量數(shù)據(jù)的情景下存儲性能不如HBase,故選擇HBase作為海量數(shù)據(jù)存儲的基石D、HBase加ElasticSearch的組合滿足了大部分的用戶實時檢索訴求【正確答案】:ABCD57.大數(shù)據(jù)技術(shù)在我們身邊應(yīng)用的越來越廣,以下場景中有哪些場景可以應(yīng)用大數(shù)據(jù)技術(shù)?A、廣告精準(zhǔn)營銷B、游戲畫面實時刷新C、人物畫像D、道路智能規(guī)劃【正確答案】:ACD58.以下關(guān)于Redis使用場景特點的描述,正確的是哪些項?A、數(shù)據(jù)類型豐富B、支持持久化C、高性能D、低時延【正確答案】:ABCD59.請按步驟將調(diào)用HBase的JavaAPl進(jìn)行scan查詢的流程進(jìn)行排序。()A、針對查詢條件設(shè)置Scan對象的參數(shù)值B、創(chuàng)建一個Scan對象C、實例化該表對應(yīng)的Table實例D、設(shè)置緩存大小或起始結(jié)束的rowkeyE、解析處理結(jié)果F、提交Scan請求【正確答案】:ABCDEF60.以下關(guān)于Spark的惰性操作描述中,正確的有哪幾項?A、SparkACtion的程序只有執(zhí)行到算子時才會觸發(fā)。B、Spark的執(zhí)行需要人為觸發(fā),Spark自身不會自動觸發(fā)。C、SparkACtion程序在還沒有執(zhí)行到算子時,是不會進(jìn)行編譯的。D、Transformation屬于懶操作?!菊_答案】:AD61.有關(guān)HBase中Compaction操作的描述,以下哪些說法是正確的?A、MajorCompaction是小范圍的CompactionB、Compaction操作會排除當(dāng)前正在執(zhí)行合并的文件C、MinorCompaction是小范圍的CompactionD、Compaction分為Minor和Major兩類【正確答案】:BCD62.關(guān)于GES服務(wù)的常見基本概念,以下哪些選項是正確的?A、GES不存在無向邊B、在GES中,點的屬性(Property)表示了該頂點的附加信息,采用Keyvalue:結(jié)構(gòu)進(jìn)行保存C、個人的姓名、年齡、身份證、愛好等信息可以用VertexLA,Bel來表示D、"認(rèn)識/朋友關(guān)系"在圖中可以用邊來表示【正確答案】:ABCD63.HBase數(shù)據(jù)寫入過程會有多個步驟,請選擇正確的順序()A、查找對應(yīng)的region,在region中尋找列族先向memstore中寫入數(shù)據(jù)B、去表所在的regionserver進(jìn)行數(shù)據(jù)的添加C、當(dāng)memstore寫入的值變多,觸發(fā)溢弓操作(flush)D、clienti訪問Zookeeper,獲取元數(shù)據(jù)存儲所在的regionserverE、通過對應(yīng)的regionserver,拿到對應(yīng)的表存文的regionserverF、當(dāng)溢寫的文件過多時,會觸發(fā)文件的合并(Compact)操作【正確答案】:ABCDEF64.以下哪些屬于大數(shù)據(jù)的發(fā)展趨勢?A、從技術(shù)驅(qū)動轉(zhuǎn)變?yōu)樯虡I(yè)驅(qū)動B、從統(tǒng)計分析到認(rèn)知計算C、生態(tài)合作開放D、數(shù)據(jù)處理逐漸標(biāo)準(zhǔn)化、云化【正確答案】:ABCD65.關(guān)于HBase的基本架構(gòu),以下描述中正確的有哪些項?A、在HBase中,每一個Store對應(yīng)一個ColumnQualifierB、每一次觸發(fā)Flush都會生成新的HFileC、在HBase中,由HMaster直接管理RegionD、HBase允許多臺HRegionServer同時工作【正確答案】:ABD66.某大數(shù)據(jù)業(yè)務(wù)人員因誤操作,導(dǎo)致某條Hive的Insert語句執(zhí)行了多次,使得數(shù)據(jù)出現(xiàn)了重復(fù)的現(xiàn)象,為了避免下次再次出現(xiàn)這種問題,以下哪些操作是可取的?A、改造SQL語句,添加關(guān)鍵字Overwrite使得數(shù)據(jù)以覆蓋的方式寫入B、改造SQL語句,在插入前添加清空操作如truncateC、添加Hive表的唯一索引,保證數(shù)據(jù)不重復(fù)-D、添加權(quán)限,使得業(yè)務(wù)人員只能執(zhí)行單次插入。【正確答案】:CD67.HBase存儲模型包含以下哪些選項?A、列族(ColumnFamily)B、行鍵(RowKey)C、數(shù)據(jù)塊編號(DataBlockIDD、時間戳(TimeStamp)【正確答案】:ABCD68.下列是ElasticSearch批量索引流程,請選擇正確的順序()A、主分片節(jié)點按序操作,完成一個操作后再發(fā)送給其余復(fù)制節(jié)點執(zhí)行B、主分片節(jié)點報告給請求節(jié)點并返回至客戶端C、客戶端發(fā)送批量索引請求至任意節(jié)點后,節(jié)點將轉(zhuǎn)發(fā)請求至對應(yīng)主分片節(jié)點D、復(fù)制節(jié)點操作完成報告給主分片節(jié)點【正確答案】:ABCD69.華為MRS服務(wù)具有以下哪些優(yōu)勢?A、高可用B、多場景融合C、存算分離D、彈性計算【正確答案】:ABCD70.數(shù)據(jù)倉庫分層包括以下哪些選項?A、DWD層B、DWS層C、ADS層D、ODS層【正確答案】:ABCD71.關(guān)于GES的RESTful接口,以下描述中正確的有哪些選項?A、GESAPI向上層應(yīng)用提供統(tǒng)一的訪問入口,通過高度靈活的RESTAPI接口,封裝GES平臺的統(tǒng)一操作B、用戶可以通過GES的REST接口創(chuàng)建edgeIA,BelC、GES的REST請求分為Select,Put,Create和DeleteD、用戶可以通過GES的REST接口查詢數(shù)據(jù)點的信息【正確答案】:ABD72.Hive架構(gòu)中Driver包含以下哪些組件?A、ExecutorB、ChannelC、OptimizerD、Compiler【正確答案】:ACD73.關(guān)于Hive的優(yōu)點,以下哪些說法是正確的?A、Hive支持多種編程語言,包括Java和Python都可對接Hive進(jìn)行使用B、Hive速度非??欤梢灾睾撩爰墪r延的分析應(yīng)用C、理論上Hive依賴硬件程度較低,可適應(yīng)一般的普通機(jī)器D、Hive支持雙MetaStore機(jī)制,提高容錯性【正確答案】:ACD74.以下哪些場景可以使用HBase作為存儲系統(tǒng)?A、Row-Key查詢B、滿足ACID特性C、海量數(shù)據(jù)存儲D、大文件(T【正確答案】:ACD75.Hive可以直接訪問以下哪些組件?A、HDFSB、DockerC、TensorFlowD、HBase【正確答案】:AD76.關(guān)于Flink的任務(wù)調(diào)度,請選擇正確的順序()A、用戶提交的代碼生成StreamGraphB、經(jīng)過優(yōu)化生成JobGraphC、提交給JobManager進(jìn)行處理,根據(jù)JobGraph生成ExecutionGraphD、JobManager根據(jù)ExecutionGraph對Job進(jìn)行調(diào)度【正確答案】:ABCD77.Kafka創(chuàng)建Topic時如何將分區(qū)放置到不同的Broker中,請選擇正確的順序()A、第一個分區(qū)的第一個副本放置位置是隨機(jī)從brokerList選擇的B、其他分區(qū)的第一個副本放置位置相對于第0個分區(qū)依次往后移C、剩余的副本相對干第一個副本放置立置其實是由nextReplicaShift決定的,而這個數(shù)也是隨機(jī)產(chǎn)生的D、副本因子不能大于Broker的個數(shù)【正確答案】:ABCD78.Hive組件的Driver由以下哪些項組成?A、MetaStoreB、CompilerC、ExecutorD、Optimizer【正確答案】:BCD79.以下關(guān)于HBase刪除數(shù)據(jù)操作的描述中,哪些選項是正確的?A、對于一張正在使用的表,可以直接使用drop命令刪除整張表,而不需要其他任何操作B、HBase可利用Truncate命令清空表中數(shù)據(jù),并創(chuàng)建一張新表,C、刪除某單元格數(shù)據(jù),執(zhí)行命令:delete'cx_table_stu01','20200002','cf1:age'D、刪除整行數(shù)據(jù),執(zhí)行命令:deleteall'cx_table_stu01','20200002'【正確答案】:BCD80.以下哪些選項是Loader組件的特點?()A、圖形化B、高性能C、高可靠D、安全【正確答案】:ABCD81.以下哪些選項為當(dāng)前大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的特點?A、規(guī)模較大B、增速緩慢C、增速很快D、規(guī)模較小【正確答案】:AC82.Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪幾種Channel類型?A、FileChannelB、MemoryChannelC、HDFSChannelD、JDBCChannel【正確答案】:AD83.關(guān)于華為云MRS中Loader的描述,以下哪些選頂是正確的?多選A、Loader頁面是基于開源SqoopWebUI的圖形化數(shù)據(jù)遷移管理工具,該頁面托管在Hue的WebUl中B、Loader提供定時調(diào)度任務(wù),周期性執(zhí)行ETL作業(yè)C、Loader提供可視化向?qū)降淖鳂I(yè)配置管理界面D、Loader在界面中可指定多種不同的數(shù)據(jù)源、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟、配置集群存儲系統(tǒng)等【正確答案】:ABCD84.以下關(guān)于華為云MRS提供的基于天氣大數(shù)據(jù)進(jìn)行海量數(shù)據(jù)離線分析應(yīng)用場景的描述中,哪些選項是正確的?A、可以利用Hive實現(xiàn)TB/PB級的數(shù)據(jù)分析B、可以通過可視化ETL工具Loader,將數(shù)據(jù)導(dǎo)出到DWS.完成BI分析C、可以使用OBS實現(xiàn)低成本存儲D、離線批處理必須依賴Flink組件完成計算【正確答案】:ABC85.ElasticSearch用于日志搜索和分析,離不開其擁有的生態(tài)圈系統(tǒng)和解決方案,這些開源軟件之間互相配合使用,完美銜接,高效地滿足了多場景的應(yīng)用。那么其生態(tài)系統(tǒng)具體包括以下哪些內(nèi)容?A、數(shù)據(jù)持久化與分析層ElasticsearchB、數(shù)據(jù)接入層LogstashC、用戶接入層KibanaD、插件擴(kuò)展層【正確答案】:ABCD86.HDFS結(jié)構(gòu)中包含以下哪些組件?A、NameNodeB、SourceC、DataNodeD、Sink【正確答案】:AC87.以下哪些選項屬于HBase基本架構(gòu)的一部分?A、HMasterB、DataBlockC、RDDD、Store【正確答案】:AD88.以下關(guān)于無界流的描述,哪些項是正確的?A、處理無界數(shù)據(jù)通常要求以特定順序攝取事件B、無界流的數(shù)據(jù)必須持續(xù)處理,即數(shù)據(jù)被讀取后需要立刻處理C、有定義流的開始,但沒有定義流的結(jié)束D、數(shù)據(jù)源會無休止地產(chǎn)生數(shù)據(jù)【正確答案】:ABCD89.ElasticSearch在部署時,對Linux的設(shè)置有哪些優(yōu)化方法?A、堆內(nèi)存設(shè)置為:MinB、設(shè)置最大文件句柄數(shù)C、線程池+隊列大小根據(jù)業(yè)務(wù)需要做調(diào)整D、關(guān)閉緩存Swap【正確答案】:BC90.2019年以后,華為云數(shù)據(jù)湖CloudDataLake中分析引擎包含以下哪些組件?()A、SparkB、TensorFlowC、FlinkD、Presto【正確答案】:ABCD91.Redis使用場景包含以下哪些特點?A、高性能B、豐富數(shù)據(jù)結(jié)構(gòu)存取C、支持持久化D、低時延【正確答案】:ABCD92.關(guān)于GES的應(yīng)用場景,以下哪些選項是正確的?A、工業(yè):基于知識圖譜的設(shè)備故障診斷和預(yù)警B、物流和網(wǎng)規(guī):最優(yōu)路徑推薦C、金融:實時推薦、實時反欺詐,基于知識圖譜的風(fēng)控(信貸、保險)D、社交分析:尋找特定愛好的好友,或者通過好友的好友,找到用戶可能認(rèn)識的好友【正確答案】:ABCD93.以下哪些選項不是GES圖數(shù)據(jù)庫的典型應(yīng)用場景?A、氣象局根據(jù)過去48小時的氣象數(shù)據(jù),預(yù)測明天的降雨概率B、某社交軟件根據(jù)用戶的好友信息推薦潛在好友C、某運營商通過通話記錄來標(biāo)記用戶社交圈D、某商店根據(jù)過去十年的銷售記錄預(yù)測明年的大致銷量【正確答案】:AD94.Loader具有對以下哪些數(shù)據(jù)源的讀取能力?A、HBaseB、HDFSC、HiveD、RDB【正確答案】:ABCD95.以下哪些是運營商大數(shù)據(jù)平臺的能力需求?A、統(tǒng)一數(shù)據(jù)采集和整合能力B、互聯(lián)網(wǎng)化的數(shù)據(jù)開放能力C、大數(shù)據(jù)分析挖掘能力D、大數(shù)據(jù)安全能力【正確答案】:ABCD96.FIink可以部署在各種資源提供者上,也可以作為裸機(jī)硬件上的獨立群集,這里的資源提供者可以是()A、GESB、KubernetesC、YARND、ApacheMesos【正確答案】:BCD97.以下哪些項屬于實時數(shù)據(jù)處理系統(tǒng)的訴求?A、吞吐量高B、多數(shù)據(jù)源支持C、處理速度快D、可靠性高【正確答案】:ABCD98.Kafka消息傳輸保障通常會選用那種策略?AtMostOnceB、ExA,CtlyOnceC、AtLeaseOnceD、OnlyOnce【正確答案】:ABC99.以下關(guān)于FileChannel的描述中,正確的是哪些項?A、不同的FileChannel均需要配置多個checkpoint目錄B、不同的FileChannel均需要配置一個checkpoint目錄C、支持對數(shù)據(jù)進(jìn)行持久化D、需要配置數(shù)據(jù)目錄和checkpoint目錄【正確答案】:ACD100.某大數(shù)據(jù)業(yè)務(wù)人員因誤操作,導(dǎo)致刪除了部分HDFS的業(yè)務(wù)數(shù)據(jù)。為了避免再次出現(xiàn),如何從技術(shù)角度出發(fā)去規(guī)避這個問題?A、開啟HDFS的回收站機(jī)制,及時恢復(fù)數(shù)據(jù)。B、禁止HDFS的刪除操作。C、對業(yè)務(wù)人員進(jìn)行權(quán)限劃分,避免非法或敏感操作,如刪除等。D、平時注重安全信息的普及,多加宣傳?!菊_答案】:ABC1.實時檢索場景對于數(shù)據(jù)加載的要求比較高,實際業(yè)務(wù)中要求每小時加載TB級的數(shù)據(jù)。A、正確B、錯誤【正確答案】:A2.Flink核心是一個提供了數(shù)據(jù)分發(fā)以及并行化計算的流數(shù)據(jù)處理引擎,對無界和有界數(shù)據(jù)流進(jìn)行狀態(tài)計算。A、正確B、錯誤【正確答案】:A3.數(shù)據(jù)湖需要高性能、Schema校驗、事務(wù)型更新等能力,同時支持多個開源計算引擎生態(tài)。A、正確B、錯誤【正確答案】:A4.一個Group內(nèi)的Consumer只能消費不同的partition。A、正確B、錯誤【正確答案】:A5.在Hive的SQL語句執(zhí)行中,因為groupby等關(guān)鍵字的使用會導(dǎo)致數(shù)據(jù)傾斜。因此為了表面數(shù)據(jù)傾斜,應(yīng)禁止該類操作執(zhí)行。A、正確B、錯誤【正確答案】:B6.Impala使用SQL的方式運行。A、正確B、錯誤【正確答案】:A7.Body用來存放數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)為字節(jié)數(shù)組(ByteArray)。A、正確B、錯誤【正確答案】:A8.實時檢索的金融場景應(yīng)用中,可以查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款。A、正確B、錯誤【正確答案】:A9.每個KafkaTopic由一個或多個consumergroup組成,屬于同一個consumergroup的consumer都具有相同的groupID。A、正確B、錯誤【正確答案】:B10.某公司大數(shù)據(jù)業(yè)務(wù)存在早高峰特點,因此可以借助于華為云MRS服務(wù)依據(jù)用戶的預(yù)設(shè)策略,自動調(diào)整計算資源,使節(jié)點數(shù)自動隨業(yè)務(wù)負(fù)載變化而變化,保證業(yè)務(wù)峰值時集群平穩(wěn)健康運行,并降低整體使用成本。A、正確B、錯誤【正確答案】:A11.Flink處理數(shù)據(jù)是無狀態(tài)的,處理一個事件與之前的事件無關(guān)。A、正確B、錯誤【正確答案】:B12.大數(shù)據(jù)場景中對于數(shù)據(jù)的大小而言指的是數(shù)據(jù)的總量需要大,對于數(shù)據(jù)的數(shù)量要求不高。A、正確B、錯誤【正確答案】:B13.GESAPI向上層應(yīng)用提供統(tǒng)一的訪問入口,通過高度靈活的RESTAPI接口,封裝GES平臺的統(tǒng)一操作。A、正確B、錯誤【正確答案】:A14.BloomFilter是一個列族(cf)級別的配置屬性,如果你在表中設(shè)置了BloomFilter,那么HBase會在生成StoreFilel時包含一份具有BloomFilter結(jié)構(gòu)的數(shù)據(jù),稱其為Metablock.A、正確B、錯誤【正確答案】:A15.云數(shù)融合指的是大數(shù)據(jù)基礎(chǔ)設(shè)施上云,改變大數(shù)據(jù)服務(wù)的提供方式,各大云廠商均開始提供各類大數(shù)據(jù)服務(wù)產(chǎn)品,以滿足客戶的需求。()A、正確B、錯誤【正確答案】:A16.在海量日志離線分析過程中,數(shù)據(jù)分析師可以將網(wǎng)站日志收集到HDFS上存儲,然后把日志加載到Hive中進(jìn)行統(tǒng)計分析與建模。A、正確B、錯誤【正確答案】:A17.Flume支持級聯(lián)(多個Flume對接起來),合并數(shù)據(jù)的能力。A、正確B、錯誤【正確答案】:A18.實時流處理系統(tǒng)中,要求數(shù)據(jù)權(quán)限和資源隔離,多種流處理應(yīng)用之間要進(jìn)行資源控制和隔離,防止發(fā)生資源爭搶。A、正確B、錯誤【正確答案】:A19.Spark中的JDBCServer不是單點服務(wù),因此非常適合處理海量數(shù)據(jù)和高并發(fā)任務(wù)()A、正確B、錯誤【正確答案】:B20.實時檢索技術(shù)通常需要處理復(fù)雜的統(tǒng)計類分析和查詢,因此比較適合使用Hive進(jìn)行分析判斷A、正確B、錯誤【正確答案】:B21.MRS的Flink不支Kerberos持等進(jìn)行認(rèn)證,但支持SSL加密傳輸。A、正確B、錯誤【正確答案】:B22.Kettlel中有兩種transformation腳本文件(轉(zhuǎn)換ktr結(jié)尾)和job(任務(wù)kjb結(jié)尾)。A、正確B、錯誤【正確答案】:A23.在數(shù)字化轉(zhuǎn)型以及多樣數(shù)據(jù)、算力、業(yè)務(wù)敏捷的驅(qū)動下,大數(shù)據(jù)焦點轉(zhuǎn)向云服務(wù)方式創(chuàng)新,更加敏捷,成本更優(yōu)。A、正確B、錯誤【正確答案】:A24.在刪除表的時候,外部表只刪除元數(shù)據(jù),不刪除實際數(shù)據(jù)。()A、正確B、錯誤【正確答案】:A25.數(shù)據(jù)實時處理是指數(shù)據(jù)產(chǎn)生后立即就被消費。A、正確B、錯誤【正確答案】:B26.Spark支持流與流之間的連接操作。A、正確B、錯誤【正確答案】:A27.為了減少磁盤寫入的次數(shù),Broker會將消息暫時buffer起來,當(dāng)消息的個數(shù)達(dá)到一定閥值時,再flush到磁盤,這樣減少了磁盤調(diào)用的次數(shù)。A、正確B、錯誤【正確答案】:A28.Redis是一個高性能key-value內(nèi)存數(shù)據(jù)庫。A、正確B、錯誤【正確答案】:A29.在HBase中,BloomFilter的數(shù)據(jù)被存在RDD的元數(shù)據(jù)中,一旦寫入無法更新,因為RDD是不可變的。開啟BloomFilter會有一定的存儲及內(nèi)存cache開銷。A、正確B、錯誤【正確答案】:B30.在Spark中,RDD通過數(shù)據(jù)塊的方式將數(shù)據(jù)存放在內(nèi)存中,并且采用三副本機(jī)制提高數(shù)據(jù)的穩(wěn)定性。A、正確B、錯誤【正確答案】:B31.Hive中默認(rèn)創(chuàng)建的是外部表A、正確B、錯誤【正確答案】:B32.Flume的Source可以不用和channel關(guān)聯(lián),直接連接到sink。A、正確B、錯誤【正確答案】:B33.實時流處理要求秒級或者毫秒級時延A、正確B、錯誤【正確答案】:A34.Consumeri通過Pull的方式從Broker獲取數(shù)據(jù)消費。A、正確B、錯誤【正確答案】:A解析:

四.填空35.大數(shù)據(jù)離線批處理支持SQL類作業(yè)和自定義作業(yè)。A、正確B、錯誤【正確答案】:A36.在使用HBaseJavaAPI時,用戶可以通過org,Apache.Hadoop.hbase.client.A,Dmin實例的createTable快速建表,創(chuàng)建表后整張表只有一個Region,隨著數(shù)據(jù)量的增加會自動分裂成多個Region。A、正確B、錯誤【正確答案】:A37.在華為MRS中的Manager上,管理人員可以一鍵式完成集群的安裝部署、升級、參數(shù)配置、組件啟停等操作。A、正確B、錯誤【正確答案】:A38.MRS的安全模式一般是用于生產(chǎn)環(huán)境。A、正確B、錯誤【正確答案】:A39.HBase支持存儲大表數(shù)據(jù),表格規(guī)模可達(dá)數(shù)十億行、數(shù)百萬列。A、正確B、錯誤【正確答案】:A40.任何完整的大數(shù)據(jù)平臺,一般包括以下的幾個過程,數(shù)據(jù)采集一>數(shù)據(jù)存儲一>數(shù)據(jù)處理一>數(shù)據(jù)展現(xiàn)(可視化,報表和監(jiān)控)。其中,數(shù)據(jù)采集是所有數(shù)據(jù)系統(tǒng)必不可少的一個環(huán)節(jié),隨著大數(shù)據(jù)越來越被重視,數(shù)據(jù)采集的挑戰(zhàn)也變的尤為突出。A、正確B、錯誤【正確答案】:A41.窄依賴往往對應(yīng)著shuffle操作,需要在運行過程中將同一個父RDD的分區(qū)傳入到不同的子RDD分區(qū)中,中間可能涉及多個節(jié)點之間的數(shù)據(jù)傳輸。A、正確B、錯誤【正確答案】:A42.某大數(shù)據(jù)業(yè)務(wù)人員希望確保某份關(guān)鍵數(shù)據(jù)在Hive中不會因為drop操作導(dǎo)致數(shù)據(jù)別除。他可以采用內(nèi)部表的方式來實現(xiàn),drop操作時只會刪除元數(shù)據(jù)而不會刪除表數(shù)據(jù)。A、正確B、錯誤【正確答案】:B43.GES基于MySQL的分布式存儲機(jī)制,能夠處理海量數(shù)據(jù)。A、正確B、錯誤【正確答案】:B44.Hive架構(gòu)中Optimizer用于編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)。A、正確B、錯誤【正確答案】:B45.Hive中刪除外部表時,元數(shù)據(jù)和數(shù)據(jù)會一起被刪除。A、正確B、錯誤【正確答案】:B46.在ElasticSearch中,用戶可以通過Head請求查詢某個索引是否存在。A、正確B、錯誤【正確答案】:A47.開啟BloomFilter會有一定的磁盤存儲空間及內(nèi)存cA,Che的額外開銷A、正確B、錯誤【正確答案】:A48.對于大數(shù)據(jù)集群而言,只要開啟了HDFS的回收站機(jī)制,那么可以隨意刪除數(shù)據(jù),出錯了恢復(fù)即可。A、正確B、錯誤【正確答案】:B49.HBase的Region在split

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論