華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)

上傳人：1*** IP屬地：重慶上傳時(shí)間：2024-02-25 格式：DOCX 頁(yè)數(shù)：60 大?。?4.49KB 積分：3.6 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩55頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目：華為大數(shù)據(jù)練習(xí)華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages華為大數(shù)據(jù)練習(xí)第1部分：?jiǎn)雾?xiàng)選擇題，共127題，每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.要級(jí)聯(lián)刪除用戶創(chuàng)建的表等數(shù)據(jù)庫(kù)對(duì)象，使用關(guān)鍵字（）。A)STRICTB)CASCADEC)USAGE答案:B解析:[單選題]2.大數(shù)據(jù)技術(shù)的4V特征不包含以下哪項(xiàng)?（）A)VelocityB)VirtualC)VarietyD)Volume答案:B解析:[單選題]3.以下關(guān)于DWS數(shù)據(jù)庫(kù)透明加密的特點(diǎn)，錯(cuò)誤的是：（）。A)支持行存表數(shù)據(jù)加密，不支持列存表加密B)支持集群級(jí)別配置C)使用KMS服務(wù)加密D)加密密鑰層次結(jié)構(gòu)有三層答案:A解析:[單選題]4.關(guān)于Hive在FusionInsightHD中的架構(gòu)描述錯(cuò)誤的是：（）。A)只要有一個(gè)HiveServer不可用，整個(gè)Hive集群便不可用B)MotaStore用于提供元數(shù)據(jù)服務(wù)，依賴于DBServiceC)在同一時(shí)間點(diǎn)、HiveServer只要一個(gè)處于Active狀態(tài)，另一個(gè)則處于Standby狀態(tài)D)HiveServer負(fù)責(zé)接收客戶端請(qǐng)求.解析.執(zhí)行HQL命令并返回查詢結(jié)果答案:A解析:[單選題]5.創(chuàng)建數(shù)據(jù)同步任務(wù)后，對(duì)于增量同步中的任務(wù)，可以通過(guò):（）來(lái)增加或者移除同步數(shù)據(jù)庫(kù)和表，并提交同步任務(wù)。A)刪除同步對(duì)象B)編輯同步對(duì)象C)創(chuàng)建同步對(duì)象D)返回同步對(duì)象答案:B解析:[單選題]6.flume傳輸數(shù)據(jù)過(guò)程中，為了防止數(shù)據(jù)不丟失，使用的Channel類型是？（）A)MemoryChannelB)FileChannelC)JDBCChannelD)HDFSChannel答案:B解析:[單選題]7.Flume當(dāng)前不支持的source有（）A)HDFSsourceB)avrosourceC)HTTPsourceD)Kafkasource答案:A解析:A（由于Flume主要是為了將集群外的數(shù)據(jù)導(dǎo)入到集群內(nèi)，而如果數(shù)據(jù)已經(jīng)存在HDFS中，那么數(shù)據(jù)已經(jīng)在集群內(nèi)，所以沒(méi)有提供從HDFS中讀取數(shù)據(jù)的HDFSSource)[單選題]8.TOPN操作最適合采用哪種Redis數(shù)據(jù)結(jié)構(gòu)?（）A)SetB)HashC)ListD)SortedSet答案:D解析:[單選題]9.為保證流應(yīng)用的快照存儲(chǔ)的可靠性，快照主要存儲(chǔ)在:（）。A)本地文件系統(tǒng)中B)JobManager的內(nèi)存中C)HDFS中D)可靠性高的單擊數(shù)據(jù)庫(kù)中答案:C解析:[單選題]10.在增量同步階段，源數(shù)據(jù)庫(kù)和目標(biāo)數(shù)據(jù)庫(kù)之間的同步有時(shí)會(huì)存在一個(gè)時(shí)間差，稱為:（），單位為秒。A)延誤B)延后C)延遲D)時(shí)延答案:D解析:[單選題]11.HBase為什么適用于海量數(shù)據(jù)存儲(chǔ)?()A)HDFS做底層存儲(chǔ)B)多列簇特C)支持列存表D)集群規(guī)模小答案:A解析:[單選題]12.關(guān)于DataSet，下列說(shuō)法不正確的是:（）。A)DataSet不需要反序列化就可以執(zhí)行大部分操作B)DataSet是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合C)DataSet與RDD高度類似，性能比RDD好D)DataSet執(zhí)行sort，filter，shuffle登錄需要進(jìn)行反序列化答案:D解析:[單選題]13.執(zhí)行引擎的類型包括：（）。A)行執(zhí)行引擎B)向量化執(zhí)行引擎C)行列混合執(zhí)行引擎D)以上都是答案:D解析:[單選題]14.關(guān)于Spark中RDD的描述不準(zhǔn)確的是?（）A)RDD可以從HDFS輸入創(chuàng)建，或從與Hadoop兼容的其他存儲(chǔ)系統(tǒng)中輸入創(chuàng)建B)Spark的所有Transform操作都是基于RDD來(lái)實(shí)現(xiàn)的。C)RDD是只讀和可分區(qū)的。要想對(duì)RDD進(jìn)行操作，只能重新生成一個(gè)新的RDD。D)當(dāng)前RDD默認(rèn)是存儲(chǔ)于內(nèi)存，當(dāng)內(nèi)存不足時(shí)，RDD也不會(huì)溢出到磁盤中。答案:D解析:[單選題]15.對(duì)于HBase表設(shè)計(jì)描述錯(cuò)誤的是?（）A)一張表可以創(chuàng)建多個(gè)ColumnFamilyB)TTL默認(rèn)為一天C)Region建議預(yù)先創(chuàng)建D)MaxVersion無(wú)法人為修改答案:D解析:[單選題]16.當(dāng)Spark發(fā)生Shuffle時(shí)，MapTask的運(yùn)算結(jié)果會(huì)通過(guò)（）的形式把運(yùn)算結(jié)果分發(fā)到對(duì)應(yīng)的任務(wù)上去。()A)序列化B)鍵值化C)二進(jìn)制D)RDD答案:B解析:[單選題]17.有如下存儲(chǔ)過(guò)程，CREATEORREPLACEPROCEDUREprc_1(param1ININTEGERDEFAULT3，param2INOUTINTEGER)ASBEGINParam2：=paraml+param2；RETURN：END：調(diào)用如上存儲(chǔ)過(guò)程callprc_1(2，1)，結(jié)果是()?A)1B)2C)4D)3答案:D解析:[單選題]18.DLI支持以下（）字符碼的數(shù)據(jù)。A)UTF-8B)ASCIIC)GB2312D)Base64答案:A解析:[單選題]19.YARN調(diào)度器分配資源的順序是:（）。A)任意機(jī)器--本地資源--同機(jī)架B)任意機(jī)器--同機(jī)架--本地資源C)本地資源--同機(jī)架--任意機(jī)器D)同機(jī)架--任意機(jī)器--本地資源答案:C解析:[單選題]20.使用DLI的正確操作順序?yàn)椋海ǎ?。A)1.準(zhǔn)備數(shù)據(jù)2.編輯并提交作業(yè)3.購(gòu)買隊(duì)列4.查看作業(yè)狀態(tài)B)1.準(zhǔn)備數(shù)據(jù)2.購(gòu)買隊(duì)列3.編輯并提交作業(yè)4.查看作業(yè)狀態(tài)C)1.購(gòu)買隊(duì)列2.準(zhǔn)備數(shù)據(jù)3.編輯并提交作業(yè)4.查看作業(yè)狀態(tài)D)1.編輯并提交作業(yè)2.準(zhǔn)備數(shù)據(jù)3.購(gòu)買隊(duì)列4.查看作業(yè)狀態(tài)答案:C解析:[單選題]21.在Flink的運(yùn)行過(guò)程中，負(fù)責(zé)申請(qǐng)資源的角色是:（）。A)ResourceManagerB)JobManagerC)ClientD)TaskManager答案:B解析:[單選題]22.Action是RDD的算子的一個(gè)類型，不可以將結(jié)果寫入（）A)磁盤B)HDFSC)數(shù)據(jù)庫(kù)D)CPU答案:C解析:Action（執(zhí)行）：觸發(fā)Spark作業(yè)運(yùn)行，真正觸發(fā)轉(zhuǎn)換算子的計(jì)算；Action操作會(huì)對(duì)RDD計(jì)算出一個(gè)結(jié)果，并把結(jié)果返回到驅(qū)動(dòng)器程序Driver中，或把結(jié)果存儲(chǔ)到外部存儲(chǔ)系統(tǒng)（如HDFS，磁盤，cpu等）中。[單選題]23.以下關(guān)于Zookeeper關(guān)鍵特性中的原子性說(shuō)法正確的是:（）。A)客戶端發(fā)送的更新會(huì)按照他們發(fā)送的順序進(jìn)行應(yīng)用B)鞥新只能全部完成或失敗，不會(huì)部分完成C)一條消息被一個(gè)server接受，將會(huì)被所有的server接受D)集群中無(wú)論那臺(tái)服務(wù)器，對(duì)外展示的均是統(tǒng)一視圖答案:B解析:[單選題]24.HBase的主HMaster是：（）選舉的。A)由RegionServer進(jìn)行裁決B)HMaster為雙主模式，不需要進(jìn)行裁決C)通過(guò)ZooKeeper進(jìn)行裁決D)隨機(jī)選舉答案:C解析:[單選題]25.Kafka中Consumer使用什么方式來(lái)記錄讀取位置？(D)A)時(shí)間信息B)用戶信息C)設(shè)備信息D)偏移量信息答案:D解析:[單選題]26.以下（）組件負(fù)責(zé)控制系統(tǒng)資源的分配，防止過(guò)量業(yè)務(wù)負(fù)載對(duì)系統(tǒng)的沖擊而導(dǎo)致業(yè)務(wù)擁塞。A)GTMB)WLMC)CND)DN答案:B解析:[單選題]27.關(guān)于GaussDB200的數(shù)據(jù)并行導(dǎo)出，下列說(shuō)法正確的是()?A)Remote模式效率受網(wǎng)絡(luò)帶寬影響。B)Local模式效率受網(wǎng)絡(luò)帶寬影響。C)Remote模式是指將數(shù)據(jù)導(dǎo)出到集群本地服務(wù)器上。D)Local模式是指導(dǎo)出文件到本地電腦。答案:A解析:[單選題]28.Kafka集群在運(yùn)行期間，直接依賴于下列（）組件。A)sparkB)zookeeperC)hdfsD)hbase答案:B解析:[單選題]29.以下關(guān)于FusionInsightCTBase的描述不正確的是:（）。A)CTBase的讀寫接口，統(tǒng)一封裝了行定義的接口，自動(dòng)進(jìn)行冷字段的合并和解析，不需要在應(yīng)用程序中進(jìn)行合并和解析B)CTBase是基于Hbase的聚簇表開(kāi)發(fā)框架C)CTBase提供了一套WebUI進(jìn)行元數(shù)據(jù)定義，提供了只管醫(yī)用的表設(shè)計(jì)工具，降低表設(shè)計(jì)的難度D)CTBase的javaAPI提供了一套Hbase連接池管理的接口，內(nèi)部連接共享，減少客戶端應(yīng)用開(kāi)發(fā)的難度答案:B解析:[單選題]30.關(guān)于Hive自定義UDF描述錯(cuò)誤的是?（）A)普通的UDF，用于操作單個(gè)數(shù)據(jù)行，且產(chǎn)生一個(gè)數(shù)據(jù)行作為輸出。B)永久函數(shù)，可以在多個(gè)會(huì)話中使用，不需要每次創(chuàng)建。C)用戶定義表生成函數(shù)UDTF，用于接受多個(gè)輸入數(shù)據(jù)行，并產(chǎn)生一個(gè)輸出D)臨時(shí)函數(shù)，只能在當(dāng)前會(huì)話使用，重啟會(huì)話后需要重新創(chuàng)建。答案:B解析:[單選題]31.關(guān)于Kerberos的TGT以下說(shuō)法錯(cuò)誤的是:（）。A)TGT全稱為票據(jù)授權(quán)服務(wù)票據(jù)，主要由KDC服務(wù)器生成B)TGT一次生成之后，可以無(wú)限期使用。C)TGT在客戶端的存在方式可以是在內(nèi)存中存儲(chǔ)，也可以在本地以文件的形式存儲(chǔ)。D)TGT中主要的信息有當(dāng)前該票據(jù)的有效時(shí)長(zhǎng)和授予該TGT的服務(wù)端IP以及分發(fā)給的客戶端名稱。答案:B解析:[單選題]32.以下（）不是訂閱數(shù)據(jù)包含的內(nèi)容。A)服務(wù)IDB)數(shù)據(jù)庫(kù)類型C)表名D)庫(kù)名答案:B解析:[單選題]33.以下哪個(gè)不是離線批處理的核心訴求?（）A)處理數(shù)據(jù)格式多樣B)處理數(shù)據(jù)量巨大C)支持SQL類作業(yè)和自定義作業(yè)D)處理時(shí)間要求高答案:D解析:[單選題]34.Kafka消息默認(rèn)保存時(shí)間為多少天?()A)14天B)30天C)1天D)7天答案:D解析:[單選題]35.下面這條GaussDB200語(yǔ)句?calldbms_erval(1，'sysdate+1.0/24')；?的意思是()A)修改Job1的Interval為每隔1小時(shí)執(zhí)行一次。B)修改Job1的Interval為每隔1/24小時(shí)執(zhí)行一次。C)修改Job1的Interval為每隔24分鐘執(zhí)行一次。D)修改Job1的Interval為每隔24小時(shí)執(zhí)行一次。答案:A解析:[單選題]36.元數(shù)據(jù)采集任務(wù)的啟動(dòng)方式不包括：（）。A)循環(huán)執(zhí)行B)定時(shí)執(zhí)行C)手動(dòng)執(zhí)行D)定時(shí)立即執(zhí)行答案:A解析:[單選題]37.Flink快照機(jī)制的核心是barriers不包含以下哪個(gè)特點(diǎn)?()A)會(huì)阻斷數(shù)據(jù)流，重量級(jí)元組B)嚴(yán)格的按照線性流動(dòng)C)將前后周期快照數(shù)據(jù)分隔D)攜帶所屬快照周期的ID答案:A解析:[單選題]38.GaussDB200有兩張相同字段結(jié)構(gòu)和數(shù)據(jù)量的表table_1和table_2，tab1e_1是行存表，table_2是列存表，執(zhí)行SQL語(yǔ)句?selectnamefromtable_namewherenum=1?，table_1查詢了()數(shù)據(jù)量，table_2查詢了()數(shù)據(jù)量(一個(gè)單元格為一個(gè)數(shù)據(jù)量)。（）A)9，6B)3，9C)3，6D)9，9答案:A解析:[單選題]39.HBase中一個(gè)Region進(jìn)行Split操作時(shí)，將一個(gè)HFile文件真正分開(kāi)到兩個(gè)Region的過(guò)程發(fā)生在以下（）階段。A)Split過(guò)程中B)Flush過(guò)程中C)Compaction過(guò)程中D)HFile分開(kāi)過(guò)程中答案:C解析:[單選題]40.ETL工具工作過(guò)程不包含以下哪項(xiàng)?（）A)清洗B)傳遞C)心加載D)轉(zhuǎn)換答案:B解析:[單選題]41.solr中定義以下哪種字段支持后期自定義增加字段（）A)dynamicFieldB)copyFieldC)FieldD)以上都是答案:A解析:[單選題]42.查看Kafka某Topic的partition詳細(xì)信息時(shí)，使用如下（）命令。A)bin/kafka-topic.sh--createB)bin/kafka-topic.sh--deleteC)bin/kafka-topic.sh--listD)bin/kafka-topic.sh--describe答案:D解析:[單選題]43.GaussDB200在創(chuàng)建表時(shí)，需要注意以下哪些事項(xiàng)()?A)創(chuàng)建列存表之后，后續(xù)可以修改為行存表。B)創(chuàng)建列存表時(shí)壓縮級(jí)別默認(rèn)為HIGH。C)如果指定表空間為普通表空間，創(chuàng)建表時(shí)默認(rèn)是行式存儲(chǔ)。D)創(chuàng)建一個(gè)行存表之后，后續(xù)可以修改為列存表。答案:C解析:[單選題]44.下面（）不是二進(jìn)制類型。A)BLOBB)RAWC)BYTEAD)TEXT答案:D解析:[單選題]45.當(dāng)前傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)主要面臨的挑戰(zhàn)是()?A)數(shù)據(jù)量爆炸式增長(zhǎng)，要求數(shù)據(jù)處理平臺(tái)具備彈性擴(kuò)展能力。B)數(shù)據(jù)處理時(shí)效性需求提高，要求數(shù)據(jù)處理平臺(tái)速度夠快。C)多類型數(shù)據(jù)融合，要求數(shù)據(jù)處理平臺(tái)功能更加強(qiáng)大。D)以上全都正確。答案:D解析:[單選題]46.安全Kafka集群中，關(guān)于Kafka組的說(shuō)法錯(cuò)誤的是（）A)kafkaadmin組擁有Topic的所有權(quán)限B)kafka組用戶被授予Topic相關(guān)權(quán)限后，只有使用新API才能訪問(wèn)；C)Kafkasuper組用戶默認(rèn)具有所有的Topic的讀寫權(quán)限D(zhuǎn))kafka組用戶被授予Topic相關(guān)權(quán)限后，一定可以訪問(wèn)答案:D解析:[單選題]47.Client在HDFS上進(jìn)行文件寫入時(shí)，NameNode根據(jù)文件大小和配置情況，返回部分datanode信息，（）負(fù)責(zé)將文件劃分為多個(gè)Block,根據(jù)DataNode的地址信息，按順序?qū)K寫入到每一fDataNode。A)ClientB)ActiveNameNodeC)DataNodeD)StandbyNameNode答案:B解析:[單選題]48.Hadoop中MapReduce組件擅長(zhǎng)處理（）場(chǎng)景的計(jì)算任務(wù)。A)迭代計(jì)算B)離線計(jì)算C)實(shí)時(shí)交互計(jì)算D)流式計(jì)算答案:B解析:[單選題]49.對(duì)GaussDB200描述不正確的是?（）A)并行架構(gòu)B)易運(yùn)維，安全可靠C)行列不能混存D)節(jié)點(diǎn)多，易擴(kuò)展答案:C解析:[單選題]50.關(guān)于HDFS的文件塊的描述不準(zhǔn)確的是?（）A)文件塊越大尋址時(shí)間越短。B)文件塊(片)被存在哪個(gè)集群；誰(shuí)有權(quán)限查看、修改這個(gè)文件等信息放在元數(shù)據(jù)Metadata中C)文件塊的大小設(shè)置原則：最大化尋址開(kāi)銷。D)HDFS文件塊的大小在1.0版本時(shí)是64M，在2.0的時(shí)候是128M。答案:C解析:[單選題]51.下列關(guān)于存儲(chǔ)過(guò)程的特點(diǎn)說(shuō)法正確的是()A)編寫的SQL存儲(chǔ)在數(shù)據(jù)庫(kù)中，因此執(zhí)行速度快。B)創(chuàng)建時(shí)編譯，執(zhí)行時(shí)調(diào)用，因此開(kāi)發(fā)效率高。C)用戶創(chuàng)建的存儲(chǔ)過(guò)程或自定義函數(shù)可以重復(fù)調(diào)用，因此數(shù)據(jù)傳輸量少。D)通過(guò)指定存儲(chǔ)過(guò)程的訪問(wèn)權(quán)限，因此安全系數(shù)高。答案:D解析:[單選題]52.若要修改HBase表，下列API哪個(gè)最先被調(diào)用?()A)createConnection()B)getAdmin()C)getTable()D)getConnect()答案:A解析:[單選題]53.華為FusionInsightHD是國(guó)內(nèi)首家符合國(guó)家金融等級(jí)保護(hù)的大數(shù)據(jù)平臺(tái)，其安全性體現(xiàn)在以下（）方面。A)系統(tǒng)安全B)權(quán)限認(rèn)證C)數(shù)據(jù)安全D)以上全部正確答案:D解析:[單選題]54.在MapReduce的應(yīng)用程序開(kāi)發(fā)中，下列（）JAVA類負(fù)責(zé)管理和運(yùn)行一個(gè)計(jì)算任務(wù)。A)lobB)ContextC)FileSystemD)Configuration答案:A解析:[單選題]55.Spark是用以下（）編程語(yǔ)言實(shí)現(xiàn)的。A)CB)C++C)JAVAD)Scala答案:D解析:[單選題]56.大數(shù)據(jù)應(yīng)用開(kāi)發(fā)流程不包含以下哪項(xiàng)?（）A)需求分析B)可行性分析C)應(yīng)用推廣D)技術(shù)選型答案:C解析:[單選題]57.下面（）子句專用于GroupBy操作中的條件過(guò)濾功能。A)WHERE子句B)HAVING子句C)LIMIT子句D)ORDERBY子句答案:B解析:[單選題]58.哪個(gè)不是ElasticSearch生態(tài)圈中的技術(shù)?（C）A)beatsB)LogstashC)FlumeD)kibana答案:C解析:[單選題]59.GaussDB200支持幾種數(shù)據(jù)并行導(dǎo)入策略?()A)2B)1C)4D)3答案:D解析:為了使得數(shù)據(jù)能夠正確、不重復(fù)地分配給各DN，保證入庫(kù)數(shù)據(jù)的唯一性，GaussDB200對(duì)應(yīng)提供了三種策略：1、Normal策略：利用高斯數(shù)據(jù)服務(wù)工具GDS(GaussDataService)來(lái)管理用戶數(shù)據(jù)，將集群之外主機(jī)上的數(shù)據(jù)導(dǎo)入到集群中。2、Shared策略：利用網(wǎng)絡(luò)文件系統(tǒng)NFS(NetworkFileSystem)服務(wù)，將存放用戶數(shù)據(jù)的服務(wù)器統(tǒng)一掛載到各DN所在主機(jī)的相同路徑下，將集群之外主機(jī)上的數(shù)據(jù)導(dǎo)入到集群中。3、Private策略：用戶自行將數(shù)據(jù)文件上傳到各DN所在主機(jī)。[單選題]60.關(guān)于FusionInsightHDStreaming的Supervisor描述正確的是：（）。A)Supervisor是在Topology中接受數(shù)據(jù)然后執(zhí)行處理的組件B)Supervisor負(fù)責(zé)接受Nimbus分配的任務(wù)，啟動(dòng)和停止屬于自己管理的Worker進(jìn)程C)Supervisor負(fù)責(zé)資源分配和任務(wù)調(diào)度D)Supervisor是運(yùn)行具體處理邏輯的過(guò)程答案:B解析:[單選題]61.在FusioninsightHD的客戶端，執(zhí)行kinit｛賬號(hào)｝命令是為了得到KDC的（）內(nèi)容。A)Krb5.confB)TGTC)STD)jaas.conf答案:B解析:[單選題]62.Elasticsearch采用的搜索方式是?()A)倒排索引B)快速索引C)正排索引D)慢索引答案:A解析:[單選題]63.以下哪個(gè)選項(xiàng)屬于大數(shù)據(jù)消息系統(tǒng)?（）A)SparkB)KafkaC)HBaseD)Zookeeper答案:B解析:[單選題]64.離線批處理方案的應(yīng)用場(chǎng)景不包括?()A)占用計(jì)算存儲(chǔ)資源多B)快速高效，實(shí)時(shí)的數(shù)據(jù)處理C)數(shù)據(jù)處理格式多樣D)處理大規(guī)模數(shù)據(jù)答案:B解析:[單選題]65.在Zookeeper和Yarn的協(xié)同工作中，當(dāng)ActiveResourceManager產(chǎn)生故障時(shí),StandbyResourceManager會(huì)從（）目錄中獲取Application相關(guān)信息。A)metastoreB)StatestoreC)StoreageD)Warehouse答案:B解析:[單選題]66.在進(jìn)行整庫(kù)遷移時(shí)源端數(shù)據(jù)源類型為Oracle，目的端數(shù)據(jù)類型不支持:（）。A)RDSforMySQLB)MRS(Hive)C)CSSD)DWS答案:C解析:[單選題]67.Hive中的解釋器(complier)、優(yōu)化器(optimizer)、執(zhí)行器(executor)組件用于HQL語(yǔ)句從詞法分析、語(yǔ)法分析、編譯、優(yōu)化以及查詢計(jì)劃的生成。生成的查詢計(jì)劃存儲(chǔ)在()中，并在隨后由()調(diào)用執(zhí)行。()A)內(nèi)存、MapReduceB)HDFS、YarnC)HBase、YarnD)HDFS、MapReduce答案:D解析:[單選題]68.在網(wǎng)絡(luò)日志數(shù)據(jù)分析場(chǎng)景中，日志服務(wù)器通過(guò)1og4j將數(shù)據(jù)傳給()，()會(huì)對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的處理過(guò)濾，然后將數(shù)據(jù)按照日期存儲(chǔ)到()上。()A)Flume、Flume、HDFSB)Hive、Flume、LoaderC)HDFS、Flume、FlumeD)Spark、Sqoop、Flume答案:A解析:[單選題]69.()是一個(gè)實(shí)現(xiàn)了文件系統(tǒng)的抽象類，繼承自org.apache.hadoop.conf.Configured，并實(shí)現(xiàn)了C1oseable接口，可以適用于多種文件系統(tǒng)。()A)FSDataInputStreamB)FileConfigurationC)FSDataOutputStreamD)FileSystem答案:C解析:[單選題]70.以下哪項(xiàng)不屬于Apache頂級(jí)項(xiàng)目?（）A)SparkB)StormC)FlinkD)Eclipse答案:D解析:[單選題]71.以下兩種描述分別對(duì)應(yīng):（）兩種分類算法的評(píng)價(jià)標(biāo)準(zhǔn)。A)Precision，RecallB)Recall，PrecisionC)Precision，RocD)Recall，Roc答案:A解析:[單選題]72.華為8.0數(shù)據(jù)中臺(tái)架構(gòu)貼源層數(shù)據(jù)存儲(chǔ)產(chǎn)品是：（）。A)MRSB)GBase8AC)DWSD)DAYU答案:A解析:[單選題]73.以下哪個(gè)不是大數(shù)據(jù)的數(shù)據(jù)計(jì)算引擎?（）A)SparkB)MapReduceC)FlumeD)Flink答案:C解析:[單選題]74.MapReduce任務(wù)最終是在下列（）中被執(zhí)行的。A)NodeManagerB)containerC)ResourceManagerD)AppMaster答案:B解析:[單選題]75.關(guān)于創(chuàng)建api，以下描述正確的是:（）。A)創(chuàng)建api只能通過(guò)腳本模式創(chuàng)建B)創(chuàng)建api只能通過(guò)向?qū)Ｊ絼?chuàng)建C)創(chuàng)建api可以通過(guò)腳本模式和向?qū)Ｊ絻煞N方式創(chuàng)建D)以上說(shuō)法均不正確答案:C解析:[單選題]76.下來(lái)（）Redis命令屬于原子操作。A)INCR（將儲(chǔ)存的數(shù)字值增一）B)HINCRBY（為哈希表key中的域field的值加上增量increment）C)LPUSH（對(duì)鏈表的push操作）D)以上都是答案:D解析:[單選題]77.Hadoop平臺(tái)中HBase的Region是由:（）服務(wù)進(jìn)程來(lái)管理。A)HMasterB)DataNodeC)RegionServerD)ZooKeeper答案:C解析:[單選題]78.Flink的窗口，按窗口行為劃分不包含以下哪種?(A)A)容量窗口B)滑動(dòng)窗口C)滾動(dòng)窗口D)會(huì)話窗口答案:A解析:[單選題]79.DAYU數(shù)據(jù)開(kāi)發(fā)中，以下不屬于作業(yè)優(yōu)先級(jí)是:（）。A)高B)中C)極高D)低答案:C解析:[單選題]80.一般來(lái)說(shuō)，以下哪項(xiàng)不是大數(shù)據(jù)應(yīng)用開(kāi)發(fā)必備的能力？()A)理解相關(guān)業(yè)務(wù)背景B)掌握機(jī)房硬件運(yùn)維技巧C)具備JAVA/Scala編程能力，熟悉SQLD)熟悉LinuxShell命令答案:B解析:[單選題]81.下列關(guān)于Flinkbarrier描述錯(cuò)誤的是:（）。A)barrier周期性的插入到數(shù)據(jù)流中，并作為數(shù)據(jù)流的一部分隨之流動(dòng)B)barrier是Flink快照的核心C)一個(gè)barrier將本周期快照的數(shù)據(jù)與下一周期快照的數(shù)據(jù)分隔開(kāi)來(lái)D)在插入barrier的時(shí)候，會(huì)暫時(shí)阻斷數(shù)據(jù)答案:D解析:[單選題]82.在線遷移同步過(guò)程中可能因數(shù)據(jù)沖突、數(shù)據(jù)加工、異構(gòu)類型轉(zhuǎn)化、對(duì)象缺失等因素導(dǎo)致數(shù)據(jù)異常，用戶可以通過(guò)?異常數(shù)據(jù)?頁(yè)簽查看，以幫助異常寫入的排查。下列同步過(guò)程中，支持異常診斷的是:（）。A)Postgres->GaussDBB)Oracle->RDSforMySQLC)Mysql->GaussDB(forMySQL)D)Postgres->GaussDB答案:B解析:[單選題]83.HDFS的副本放置策略中，同一機(jī)架不同的服務(wù)器之間的距離是：（）。A)3B)2C)1D)4答案:B解析:[單選題]84.消息系統(tǒng)Kafka如何保證高吞吐能力?（）A)多訂閱者機(jī)制B)Partition機(jī)制C)持久性機(jī)制D)冗余備份機(jī)制答案:B解析:[單選題]85.Kafka集群中，Kafka服務(wù)端的角色是:（）。A)BrokerB)ConsumerC)ZookeeperD)Producer答案:A解析:[單選題]86.創(chuàng)建一個(gè)存儲(chǔ)過(guò)程proc_addCREATEORREPLACEPROCEDUREproc_add(param1inINTEGER，param2outINTEGER，param3inINTEGER)ASBEGINParam2：=param1+param3;END;,創(chuàng)建一個(gè)存儲(chǔ)過(guò)程proc_testCREATEORREPLACEPROCEDUREproc_test(resultoutINTEGER)AsDECLAREInput1INTEGER：=1;Input2INTEGER：=2;StatementVARCHAR2(200)：Param2INTEGER：BEGIN--聲明調(diào)用語(yǔ)句Statement：=?callproc_add(：co1_1，：co1_2，：co1_3)?；--執(zhí)行語(yǔ)句EXECUTEIMMEDIATEstatementUSINGINinput1，OUTparam2，INinput2;Result：=param2;END;執(zhí)行語(yǔ)句callproc_test(10)，結(jié)果是()。A)3B)無(wú)返回值C)4D)2答案:A解析:[單選題]87.HDFS集群跟目錄下存在一個(gè)文件text.txt,下列（）命令可以查到此文件所存儲(chǔ)的DatNode節(jié)點(diǎn)信息。A)hdfsfsck/test.txt-filesB)hdfsfsck/text.txt-locationsC)hdfsfsck/test.txt-blocksD)hdfsfsck/test.txt-list-corruptfileblocks答案:B解析:[單選題]88.數(shù)據(jù)質(zhì)量以（）為監(jiān)控對(duì)象，目前支持對(duì)離線數(shù)據(jù)的監(jiān)控。A)數(shù)據(jù)群B)數(shù)據(jù)集C)數(shù)據(jù)列D)數(shù)據(jù)模塊答案:B解析:[單選題]89.部署FusionInsightHD時(shí)，同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署（）個(gè)。A)1B)3C)4D)2答案:D解析:[單選題]90.以下哪項(xiàng)是Spark2.x程序統(tǒng)一入口?()A)StreamingContextB)SqlContextC)HiveContextD)SparkSession答案:D解析:[單選題]91.數(shù)據(jù)訂閱功能將數(shù)據(jù)庫(kù)中關(guān)鍵業(yè)務(wù)的數(shù)據(jù)變化信息緩存并提供統(tǒng)一的SDK接口，方便下游業(yè)務(wù)訂閱、獲取、并消費(fèi),關(guān)于數(shù)據(jù)訂閱服務(wù)開(kāi)發(fā)環(huán)境使用的JAVA版本SDK版本，描述正確的是:（）。A)JDK1.5以上版本B)JDK1.8以上版本C)JDK1.7以上版本D)JDK1.6以上版本答案:D解析:[單選題]92.關(guān)于Spark中RDD的描述不正確的是？()A)RDD可以從HDFS輸入創(chuàng)建，或從與Hadoop兼容的其他存儲(chǔ)系統(tǒng)中輸入創(chuàng)建B)當(dāng)前RDD默認(rèn)是存儲(chǔ)于內(nèi)存，當(dāng)內(nèi)存不足時(shí)，RDD也不會(huì)溢出到磁盤中。C)Spark的所有Transform操作都是基于RDD來(lái)實(shí)現(xiàn)的。D)RDD是只讀和可區(qū)分的。要想對(duì)RDD進(jìn)行操作，只能重新生成一個(gè)新的RDD答案:B解析:RDD具有容錯(cuò)機(jī)制，并且只讀不能修改，可以執(zhí)行確定的轉(zhuǎn)換操作創(chuàng)建新的RDD。具體來(lái)講，RDD具有以下幾個(gè)屬性。只讀：不能修改，只能通過(guò)轉(zhuǎn)換操作生成新的RDD。分布式：可以分布在多臺(tái)機(jī)器上進(jìn)行并行處理。彈性：計(jì)算過(guò)程中內(nèi)存不夠時(shí)它會(huì)和磁盤進(jìn)行數(shù)據(jù)交換。基于內(nèi)存：可以全部或部分緩存在內(nèi)存中，在多次計(jì)算間重用。[單選題]93.Loader頁(yè)面是基于開(kāi)源()的圖形化數(shù)據(jù)遷移管理工具()A)HadoopB)HueC)KettleD)Sqoop答案:D解析:[單選題]94.Loader特點(diǎn)不包含?（）A)圖形化B)實(shí)時(shí)性C)高性能D)安全答案:B解析:[單選題]95.SDK是消費(fèi)者在調(diào)用API時(shí)，需要在請(qǐng)求Header頭中添加身份認(rèn)證信息，而這個(gè)操作比較繁瑣，故我們?yōu)槭褂谜咛峁┝薙DK，簡(jiǎn)化用戶操作。目前華為SDK支持:（）種語(yǔ)言的支持。A)7B)8C)9D)10答案:C解析:[單選題]96.在線遷移新建任務(wù)配置時(shí)，在?場(chǎng)景選擇?頁(yè)面，不屬于源數(shù)據(jù)庫(kù)來(lái)源的是:（）。A)本地自建庫(kù)B)本云云數(shù)據(jù)庫(kù)C)本云ECS自建庫(kù)D)本地云上數(shù)據(jù)庫(kù)答案:D解析:[單選題]97.為了提高Kafka的容錯(cuò)性，Kafka支持Partition的復(fù)制策略，以下關(guān)于LeaderPartition和FollowerPartition的描述錯(cuò)誤的是：（）。A)Kafka針對(duì)Partition的復(fù)制需要選出一個(gè)Leader。由該Leader負(fù)責(zé)Partition的讀寫操作。其他的副本節(jié)點(diǎn)只是負(fù)責(zé)數(shù)據(jù)同步B)由于LeaderServer承載了全部的請(qǐng)求壓力。因此從集群的整體考慮，Kafka會(huì)將Leader均衡的分散在每個(gè)實(shí)例上，來(lái)確保數(shù)據(jù)均衡C)一個(gè)Kafka集群各個(gè)節(jié)點(diǎn)間不可能互為L(zhǎng)eader和FlowerD)如果Leader失效。那么將會(huì)有其他follower來(lái)接管(成為新的Leader)答案:C解析:[單選題]98.數(shù)據(jù)中臺(tái)功能架構(gòu)中數(shù)據(jù)接入包含：（）能力。A)數(shù)據(jù)交換B)監(jiān)控告警C)鏈路監(jiān)測(cè)D)任務(wù)調(diào)度答案:A解析:[單選題]99.以下關(guān)于Zookeeper的Leader節(jié)點(diǎn)在接收到數(shù)據(jù)變更請(qǐng)求后的讀寫流程說(shuō)法正確的是:（）。A)僅寫入內(nèi)存B)同時(shí)寫入硬盤和內(nèi)存C)先寫入內(nèi)存再寫入硬盤D)先寫入硬盤再寫入內(nèi)存答案:D解析:[單選題]100.以下不是EXPLAIN命令選項(xiàng)的是：（）。A)performanceB)prettyC)analyzeD)verbose答案:B解析:[單選題]101.哪個(gè)不是Hbase的操作語(yǔ)法？（）A)create?my_tb?,?info?B)listC)createtabletb1(idint,namestring)D)scan?my_tb?答案:C解析:[單選題]102.哪個(gè)是實(shí)時(shí)檢索解決方案的數(shù)據(jù)源?（）A)流數(shù)據(jù)B)以上都是C)文件數(shù)據(jù)D)圖數(shù)據(jù)答案:B解析:[單選題]103.下面哪個(gè)數(shù)據(jù)類型不是GaussDB200支持的數(shù)據(jù)類型()?A)JSON類型B)貨幣類型C)數(shù)值類型D)XML類型答案:D解析:[單選題]104.以下選項(xiàng)不屬于Flume的特點(diǎn)的是?()A)支持定制各類方數(shù)據(jù)發(fā)送B)支持結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)源C)支持多級(jí)聯(lián)操作D)支持?jǐn)?shù)據(jù)實(shí)時(shí)檢索答案:D解析:[單選題]105.以下哪項(xiàng)不提供交互式查詢服務(wù)？()A)PrestoB)ImpalaC)EchartD)Kylin答案:C解析:Presto是一個(gè)facebook開(kāi)源的分布式SQL查詢引擎，適用于交互式分析查詢，數(shù)據(jù)量支持GB到PB字節(jié)。Impala是Cloudera公司主導(dǎo)開(kāi)發(fā)的新型查詢系統(tǒng)，它提供SQL語(yǔ)義，能查詢存儲(chǔ)在Hadoop的HDFS和HBase中的PB級(jí)大數(shù)據(jù)。Echarts是一個(gè)由百度開(kāi)源的數(shù)據(jù)可視化，憑借著良好的交互性，精巧的圖表設(shè)計(jì)，得到了眾多開(kāi)發(fā)者的認(rèn)可。ApacheKylin?是一個(gè)開(kāi)源的分布式分析引擎，提供Hadoop之上的SQL查詢接口及多維分析（OLAP）能力以支持超大規(guī)模數(shù)據(jù)，最初由eBayInc.開(kāi)發(fā)并貢獻(xiàn)至開(kāi)源社區(qū)。它能在亞秒內(nèi)查詢巨大的Hive表。[單選題]106.Kafka中每種消息類別被稱為什么?()A)TopicB)ObjectC)SubjectD)Theme答案:A解析:[單選題]107.以下（）工具可以實(shí)現(xiàn)大量數(shù)據(jù)的快速導(dǎo)入和導(dǎo)出。A)gsqlB)GDSC)DataStudioD)DSC答案:B解析:[單選題]108.下面關(guān)于ACID解釋錯(cuò)誤的是:（）。A)A-atomictty原子性：事務(wù)的所有操作要么全部完成，要么全部不完成B)C-consistency一致性：事務(wù)始終保證系統(tǒng)處于一致性的狀態(tài)，不影響一致性C)I-Isolation隔離性：事務(wù)執(zhí)行是隔離的，3個(gè)隔離級(jí)別D)D-Durability持久性：事務(wù)的結(jié)果是持久的答案:C解析:[單選題]109.以下哪個(gè)選項(xiàng)不能做為Kafka的Consumer?()A)Real-timeMonitoringB)FrontEndC)DataWarehouseD)Hadoop答案:B解析:[單選題]110.下列關(guān)于批量數(shù)據(jù)遷移系統(tǒng)級(jí)限制和約束的說(shuō)法錯(cuò)誤的是：（）。A)批量數(shù)據(jù)遷移系統(tǒng)不會(huì)自動(dòng)備份用戶的作業(yè)配置，需要用戶通過(guò)作業(yè)的導(dǎo)出功能進(jìn)行備份。B)集群創(chuàng)建好以后支持修改規(guī)格。C)文件遷移時(shí)，單個(gè)任務(wù)支持千萬(wàn)數(shù)量的文件，如果待遷移目錄下文件過(guò)多，建議拆分到不同目錄并創(chuàng)建多個(gè)任務(wù)。D)不支持集群自動(dòng)升級(jí)到新版本，需要用戶通過(guò)作業(yè)的導(dǎo)出和導(dǎo)入功能，實(shí)現(xiàn)升級(jí)到新版本。答案:B解析:[單選題]111.在GaussDB200中，關(guān)于Schema和Database，下面說(shuō)法正確的是()?A)二者都能實(shí)現(xiàn)資源隔離。B)Database之間無(wú)法直接訪問(wèn)，但通過(guò)權(quán)限授予可以訪問(wèn)數(shù)據(jù)。C)相比于Database，Schema的隔離更加的徹底。D)Schema和用戶強(qiáng)相關(guān)的，通過(guò)權(quán)限控制語(yǔ)法可以實(shí)現(xiàn)不同用戶對(duì)各Schema的權(quán)限。答案:D解析:[單選題]112.關(guān)于Hive與Hadoop其他組件的關(guān)系，以下描述錯(cuò)誤的是：（）。A)Hive最終將數(shù)據(jù)存儲(chǔ)在HDFS中B)Hive是Hadoop平臺(tái)的數(shù)據(jù)倉(cāng)庫(kù)工具C)HQL可以通過(guò)MapReduce執(zhí)行任務(wù)D)Hive對(duì)HBase有強(qiáng)依賴答案:D解析:[單選題]113.YARN中設(shè)置隊(duì)列QueueA的最大使用資源量，需要配置（）參數(shù)。A)yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentB)yarn.scheduler.capacity.root.QueueA.maximum-capacityC)yarn.scheduler.capacity.root.QueueA.minimum-user-limit-factorD)yarn.scheduler.capacity.root.QueueA.state答案:B解析:[單選題]114.gateway在ElasticSearch中的含義是?()A)網(wǎng)關(guān)B)索引的存儲(chǔ)方式C)rpc請(qǐng)求接口D)索引快照的存儲(chǔ)方式答案:D解析:gateway的主要職責(zé)是用來(lái)對(duì)數(shù)據(jù)進(jìn)行長(zhǎng)持久化(持久化了之后加上版本信息，不就可以自由的往還于過(guò)去未來(lái)之間了嗎？)，另外，整個(gè)集群重啟之后可以通過(guò)gateway重新恢復(fù)數(shù)據(jù),是一種索引快照的存儲(chǔ)方式[單選題]115.將數(shù)據(jù)塊存儲(chǔ)大小設(shè)置為128M,HDFS客戶端在寫文件時(shí)，當(dāng)寫入一個(gè)100M大小的文件，實(shí)際占用儲(chǔ)存空間為:（）。A)128MB)100MC)64MD)50M答案:B解析:[單選題]116.以下（）不屬于開(kāi)源數(shù)據(jù)湖解決方案。A)DLIB)IcebergC)HudiD)OpenDelta答案:A解析:[單選題]117.Spark的中間數(shù)據(jù)放在()中，對(duì)于迭代運(yùn)算的效率更高，進(jìn)行批處理時(shí)更高效.（）A)SparkCoreB)磁盤C)HDFSD)內(nèi)存答案:D解析:[單選題]118.下面關(guān)于GaussDB200的跨集群協(xié)同分析，說(shuō)法正確的是（）？A)跨集群所指的集群是GaussDB集群。B)跨集群過(guò)程中只需要輸入集群IP地址和端口就可以訪問(wèn)其他集群的數(shù)據(jù)。C)跨集群協(xié)同分析支持SQL算子下推。D)跨集群協(xié)同分析時(shí)其他集群會(huì)將要查詢的數(shù)據(jù)移動(dòng)到目標(biāo)集群，供目標(biāo)集群查詢。答案:C解析:[單選題]119.以下關(guān)于數(shù)據(jù)收集工具的描述，不準(zhǔn)確的是?（）A)Loader是實(shí)現(xiàn)FusionInsightHD與關(guān)系型數(shù)據(jù)庫(kù)、文件系統(tǒng)之間交換數(shù)據(jù)和文件的數(shù)據(jù)加載工具。B)Loader提供了本集群內(nèi)部HDFS和HBase之間的數(shù)據(jù)導(dǎo)入或?qū)С?。C)Saoop是一款開(kāi)源的工具，主要用于在Hive與傳統(tǒng)的數(shù)據(jù)庫(kù)間進(jìn)行數(shù)據(jù)的傳遞，可以將關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)導(dǎo)入到Hadoop的HDFS中，也可將HDFS的數(shù)據(jù)導(dǎo)出到關(guān)系型數(shù)據(jù)庫(kù)中。D)Kett1e是一款國(guó)外開(kāi)源的ETL工具，純java編寫，目前僅可以在Linux上運(yùn)行，數(shù)據(jù)抽取高效穩(wěn)定。答案:D解析:[單選題]120.當(dāng)ElasticSearch集群有節(jié)點(diǎn)加入或退出時(shí)，集群數(shù)據(jù)會(huì)發(fā)生什么動(dòng)作?()A)數(shù)據(jù)重載B)數(shù)據(jù)分布C)數(shù)據(jù)更新D)數(shù)據(jù)重建答案:B解析:[單選題]121.Hive常被用來(lái)處理（）場(chǎng)景。A)事務(wù)性處理B)批量計(jì)算C)實(shí)時(shí)性計(jì)算D)流計(jì)算答案:B解析:[單選題]122.通過(guò)HDFS的Shell命令來(lái)操作HDFS，表示刪除文件的命令是？()A)hdfsdfs-catB)hdfsdfs-rmC)hdfsdfs-mkdirD)hdfsdfs-put答案:B解析:[單選題]123.在新建采集元數(shù)據(jù)任務(wù)中，配置數(shù)據(jù)源信息參數(shù)?選擇集群?僅數(shù)據(jù)源類型為:（）時(shí)呈現(xiàn)此參數(shù)。A)DWSB)CSSC)MRSHBaseD)DIS答案:B解析:[單選題]124.某開(kāi)發(fā)小組計(jì)劃利用GraphBase實(shí)現(xiàn)一些功能，以下哪些功能可以實(shí)現(xiàn)?()A)物流最優(yōu)路徑規(guī)劃B)社交分析C)金融反欺詐D)以上全都正確答案:D解析:[單選題]125.Zookeeper在分布式應(yīng)用中的主要作用不包括：（）選項(xiàng)。A)選舉Master節(jié)點(diǎn)B)保證各節(jié)點(diǎn)上數(shù)據(jù)的一致性C)分配集群資源D)存儲(chǔ)及群中服務(wù)器信息答案:C解析:[單選題]126.Agg算子的實(shí)現(xiàn)策略有：（）。A)4B)3C)2D)1答案:B解析:[單選題]127.Flume中基于WAL(預(yù)寫式日志W(wǎng)rite-AheadLog)實(shí)現(xiàn)Channel持久化的是?()A)MemoryChannelB)KafkaChannelC)FileChannelD)JDBCChannel答案:C解析:channel可以理解為一種臨時(shí)的存儲(chǔ)，source將event放入channel,sink取走它。flume提供了四種可以用于生產(chǎn)環(huán)境的channel。1、MemoryChannel基于內(nèi)存的channel，實(shí)際就是將event存放于內(nèi)存中一個(gè)固定大小的隊(duì)列中。其優(yōu)點(diǎn)是速度快，缺點(diǎn)是可能丟失數(shù)據(jù)。2、JDBCChannel將event存放于一個(gè)支持JDBC連接的數(shù)據(jù)庫(kù)中，目前官方推薦的是Derby庫(kù)，其優(yōu)點(diǎn)是數(shù)據(jù)可以恢復(fù)。3、FileChannel在磁盤上指定一個(gè)目錄用于存放event，同時(shí)也可以指定目錄的大小。優(yōu)點(diǎn)是數(shù)據(jù)可持久化，可恢復(fù)，相對(duì)于memorychannel來(lái)說(shuō)缺點(diǎn)是要頻繁的讀取磁盤，速度較慢。4、KafkaChannel在使用flume對(duì)接Kafka時(shí)，我們往往使用TailFileSource->MemoryChannel->KafkaSink的這種方式，然后將數(shù)據(jù)輸送到Kafka集群中。第2部分：多項(xiàng)選擇題，共83題，每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]128.在FusioninsightHD中，使用SparkSQL時(shí)，可以通過(guò)()方式（或工具）執(zhí)行SQL語(yǔ)句。A)JDBCB)spark-beelineC)spark-sql答案:ABC解析:[多選題]129.FusionInsightHD的HBase服務(wù)包含：()進(jìn)程。A)HMasterB)SlaveC)RegionServerD)DataNode答案:AC解析:[多選題]130.Flink支持的時(shí)間操作類型包括：以下()選項(xiàng)。A)結(jié)束時(shí)間B)處理時(shí)間C)采集時(shí)間D)事件時(shí)間答案:BD解析:[多選題]131.隨著大數(shù)據(jù)越來(lái)越被重視，數(shù)據(jù)采集的挑戰(zhàn)也變的尤為突出，常見(jiàn)的挑戰(zhàn)包括?()A)數(shù)據(jù)量大B)數(shù)據(jù)源多種多樣C)數(shù)據(jù)采集的可靠性保障D)避免重復(fù)數(shù)據(jù)答案:ABCD解析:[多選題]132.下列選項(xiàng)中，()是MapReduce一定會(huì)有：的過(guò)程。A)CombineB)MapC)ReduceD)Partition答案:BCD解析:[多選題]133.在產(chǎn)品選型時(shí)，數(shù)據(jù)中臺(tái)邏輯架構(gòu)中分析層要重點(diǎn)關(guān)注產(chǎn)品的特點(diǎn)包含：()方面。A)批量刪除能力B)強(qiáng)資源隔離能力C)高并發(fā)的查詢能力D)強(qiáng)大的OLTP能力答案:BC解析:[多選題]134.下面哪些關(guān)鍵詞是kafka的特點(diǎn)（）A)高吞吐B)分布式C)消息持久化D)支持消息的隨機(jī)讀寫答案:ABC解析:[多選題]135.以下選項(xiàng)對(duì)GraphBase概念描述正確的是?()A)Edge：邊，用于表示關(guān)系度B)VertexLabel：節(jié)點(diǎn)的標(biāo)簽，用于表示現(xiàn)實(shí)世界中的實(shí)體類型C)Vertex：節(jié)點(diǎn)/頂點(diǎn)，用于表示現(xiàn)實(shí)世界中的實(shí)體對(duì)象D)EdgeLabel：邊的標(biāo)簽，用于表示現(xiàn)實(shí)世界中的關(guān)系類型答案:ABCD解析:基本概念-Vertex和VertexLabelVertex：節(jié)點(diǎn)/頂點(diǎn)，用于表示現(xiàn)實(shí)世界中的實(shí)體對(duì)象。VertexLabel：節(jié)點(diǎn)的類型，用于表示現(xiàn)實(shí)世界中的實(shí)體類型，比如?人?，?電話?。在GraphBase中，每一個(gè)節(jié)點(diǎn)有且只有一個(gè)VertexLabel。當(dāng)不顯式指定VertexLabel時(shí)，采用默認(rèn)的VertexLabel。Edge：邊，用于表示頂點(diǎn)間的聯(lián)系。GraphBase的邊都是單向邊，如果需要雙向邊，則通過(guò)兩條相反方向的單向邊組成。GraphBase不存在無(wú)向邊。EdgeLabel：邊的類型，用于表示現(xiàn)實(shí)世界中的關(guān)系類型，比如?屬于關(guān)系?、?認(rèn)識(shí)/朋友關(guān)系?等。[多選題]136.Loader可以實(shí)現(xiàn)以下()轉(zhuǎn)換規(guī)則。A)長(zhǎng)整型時(shí)間轉(zhuǎn)換B)增量轉(zhuǎn)換C)拼接轉(zhuǎn)換D)空值轉(zhuǎn)換答案:ABCD解析:[多選題]137.Hive的自定義函數(shù)包括?（）A)UDAFB)UDCFC)UDTFD)UDF答案:ACD解析:[多選題]138.關(guān)于Redis特點(diǎn)，下面描述正確的是：()。A)低時(shí)延B)豐富的數(shù)據(jù)結(jié)構(gòu)C)豐富的數(shù)據(jù)結(jié)構(gòu)D)支持SQL查詢接口答案:ABC解析:[多選題]139.Flink能夠通過(guò)哪幾種方式提供容錯(cuò)機(jī)制?()A)窗口B)事件時(shí)間C)流重放D)狀態(tài)快照答案:ABCD解析:[多選題]140.采用Flume傳輸數(shù)據(jù)過(guò)程中，為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù)，可以使用：()Channel。A)memoryChannelB)JDBCChannelC)FileChannelD)HDFSChannel答案:BC解析:[多選題]141.以下關(guān)于Redis中set數(shù)據(jù)類型srandmemberkey[count]命令的描述哪些是正確的?()A)如果count為負(fù)數(shù)，那么命令返回一個(gè)數(shù)組，數(shù)組中的元素可能會(huì)重復(fù)出現(xiàn)多次，而數(shù)組的長(zhǎng)度為count的絕對(duì)值。B)如果count為正數(shù)，且小于集合基數(shù)，那么命令返回一個(gè)包含count個(gè)元素的數(shù)組，數(shù)組中的元素各不相同。C)如果count大于等于集合基數(shù)，那么返回整個(gè)集合。D)如果count為負(fù)數(shù)，那么命令返回一個(gè)數(shù)組，數(shù)組中的元素各不相同，且數(shù)組的長(zhǎng)度小于count的絕對(duì)值。答案:ABC解析:[多選題]142.KafkaConsumer跟蹤消費(fèi)記錄需要以下哪幾個(gè)選項(xiàng)的信息?()A)offsetB)producerC)partitionD)topic答案:ACD解析:[多選題]143.在哪些場(chǎng)景下不能使用HBase作為存儲(chǔ)系統(tǒng)（）？A)需要ACID特性B)海量數(shù)據(jù)存儲(chǔ)C)主鍵查詢D)大文件，視頻等答案:AD解析:[多選題]144.StructuredStreaming在OutPut階段可以定義不同的數(shù)據(jù)寫入方式，包括：以下()方式。A)GeneralModeB)AppendModeC)CompleteModeD)UpdateMode答案:BCD解析:[多選題]145.Spark有：()特點(diǎn)。A)快B)靈C)輕D)巧答案:ABCD解析:[多選題]146.HBase中HMaster主要負(fù)責(zé)什么?()A)用戶數(shù)據(jù)讀寫B(tài))表的增刪改查C)Regionserver負(fù)載均衡D)Region分布調(diào)整答案:BCD解析:[多選題]147.華為大數(shù)據(jù)產(chǎn)品FusionInsightHD中的Streaming具有：()關(guān)鍵特性。A)容災(zāi)能力B)靈活性C)消息可靠性D)可伸縮性答案:ABC解析:[多選題]148.Flume可以從以下哪些數(shù)據(jù)源上采集數(shù)據(jù)?()A)實(shí)時(shí)日志B)SyslogC)KafkaD)本地文件答案:ABCD解析:[多選題]149.下列關(guān)于Worker、Executor、Task說(shuō)法正確的是：()。A)每個(gè)Executor可以運(yùn)行多個(gè)TaskB)每個(gè)Worker可以運(yùn)行多個(gè)ExecutorC)每個(gè)Worker只能為一個(gè)拓?fù)溥\(yùn)行ExecutorD)每個(gè)Executor可以運(yùn)行不同組件的Task答案:ABD解析:[多選題]150.在大數(shù)據(jù)時(shí)代，企業(yè)所面臨的挑戰(zhàn)有：()。A)企業(yè)各個(gè)部門間數(shù)據(jù)分散，相同數(shù)據(jù)在各個(gè)部門內(nèi)部存儲(chǔ)格式不一致B)數(shù)據(jù)結(jié)構(gòu)多樣化C)競(jìng)爭(zhēng)對(duì)手的技術(shù)進(jìn)步D)數(shù)據(jù)在噪音、缺失、儲(chǔ)存不規(guī)范等問(wèn)題，需要進(jìn)行大量的數(shù)據(jù)預(yù)處理工作答案:ABCD解析:[多選題]151.與開(kāi)源的sqoop相比，Loader具有：()增強(qiáng)特性。A)高可靠性B)高性能C)安全性D)圖形化答案:ABCD解析:[多選題]152.FusionlnsightHD中，在使用Streaming的ACK機(jī)制時(shí)，說(shuō)法正確的是：()。A)啟用了Acker之后，Streaming會(huì)識(shí)別發(fā)送失敗的Tuple并自動(dòng)重發(fā)，無(wú)需人為干預(yù)。B)Acker會(huì)標(biāo)識(shí)處理超時(shí)或者處理失敗的消息為faiLC)從spout開(kāi)始，形成的Tuple樹(shù)中任何一個(gè)環(huán)節(jié)失敗都會(huì)標(biāo)記整棵樹(shù)失敗。D)應(yīng)用需要在spout的fail()接口方法中實(shí)現(xiàn)消息重發(fā)邏輯。答案:BCD解析:[多選題]153.CDM支持對(duì)已創(chuàng)建的連接進(jìn)行()操作。A)編輯B)測(cè)試連通性C)備份連接D)刪除連接答案:ABD解析:[多選題]154.YARN中從節(jié)點(diǎn)主要負(fù)責(zé)()工作。A)集群中所有：資源的統(tǒng)一管理和分配B)監(jiān)督container的生命周期C)監(jiān)控每個(gè)Container的資源使用情況D)管理日志和不同應(yīng)用程序用到的附屬服務(wù)答案:BC解析:[多選題]155.API網(wǎng)關(guān)是：華為云提供的一個(gè)API托管的應(yīng)用服務(wù)，API網(wǎng)管包括的功能有：()。A)API全生命周期的管理B)權(quán)限控制C)訪問(wèn)控制D)流量控制答案:ABCD解析:[多選題]156.國(guó)網(wǎng)數(shù)據(jù)中臺(tái)能力架構(gòu)中數(shù)據(jù)管理包含：()。A)模型管理B)數(shù)據(jù)質(zhì)量管理C)數(shù)據(jù)資產(chǎn)D)標(biāo)簽管理答案:ABCD解析:[多選題]157.Flume進(jìn)程級(jí)聯(lián)時(shí)，()sink類型用于接收上一跳Flume發(fā)送過(guò)來(lái)的數(shù)據(jù)。A)avrosinkB)thriftsinkC)HDFSsinkD)NullSink答案:BC解析:[多選題]158.FusioninsightHD中，在使用Streaming的ACK機(jī)制時(shí)，說(shuō)法正確的是：()。A)啟用了Acker之后，Streaming會(huì)識(shí)別發(fā)送失敗的Tuple并自動(dòng)重發(fā)，無(wú)需人為干預(yù)B)Acker會(huì)標(biāo)識(shí)處理超時(shí)或者處理失敗的消息為faiLC)從spout開(kāi)始，形成的Tuple樹(shù)中任何一個(gè)環(huán)節(jié)失敗都會(huì)標(biāo)記整棵樹(shù)失敗D)應(yīng)用需要在spout的fail()接口方法中實(shí)現(xiàn)消息重發(fā)邏輯答案:BCD解析:[多選題]159.數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)分層的優(yōu)點(diǎn)包括?（）A)減少重復(fù)開(kāi)發(fā)B)把復(fù)雜問(wèn)題簡(jiǎn)單化C)隔離原始數(shù)據(jù)D)減少數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)空間答案:ABC解析:[多選題]160.在產(chǎn)品選型時(shí)，數(shù)據(jù)中臺(tái)邏輯架構(gòu)中共享層要重點(diǎn)關(guān)注產(chǎn)品的特點(diǎn)包含：()方面。A)高效的訪問(wèn)能力B)支持?jǐn)?shù)據(jù)發(fā)放能力C)支持高效的數(shù)據(jù)更新、刪除能力D)智能的資源回收能力答案:ABC解析:[多選題]161.哪些是離線批處理的特點(diǎn)？()A)處理數(shù)據(jù)量巨大，PB級(jí)B)處理時(shí)間要求高C)容易產(chǎn)生資源搶占D)多個(gè)作業(yè)調(diào)度復(fù)雜答案:ACD解析:1、離線批處理，是指對(duì)海量歷史數(shù)據(jù)進(jìn)處理和分析，生成結(jié)果數(shù)據(jù)，供下一步數(shù)據(jù)應(yīng)用使用的過(guò)程。2、離線批處理對(duì)數(shù)據(jù)處理的時(shí)延要求不高，但是處理的數(shù)據(jù)量較大，占用的計(jì)算存儲(chǔ)資源較多，通常通過(guò)MR作業(yè)、Spark作業(yè)或者HQL作業(yè)實(shí)現(xiàn)。3、離線批處理的特點(diǎn)處理時(shí)間要求不高；處理數(shù)據(jù)量巨大；處理數(shù)據(jù)格式多樣；支持SQL類作業(yè)和自定義作業(yè)；[多選題]162.Hive執(zhí)行查詢的時(shí)候會(huì)調(diào)用哪些模塊?（）A)complierB)executorC)optimizerD)MetaStore答案:ABCD解析:[多選題]163.Hive支持下列()類型。A)分區(qū)表B)分桶表C)傾斜表D)分區(qū)+分桶表答案:ABCD解析:[多選題]164.數(shù)據(jù)質(zhì)量定義模塊包括：()。A)質(zhì)量維度定義B)檢驗(yàn)類別管理C)度量規(guī)則管理D)檢核方法管理答案:ABCD解析:[多選題]165.下列選項(xiàng)中，()是Spark的重要角色。A)NodeManagerB)ResourceManagerC)DataNOdeD)Driver答案:ABD解析:[多選題]166.在金融領(lǐng)域的大數(shù)據(jù)批量離線處理平臺(tái)中，以下描述正確的是？()A)金融領(lǐng)域的外部數(shù)據(jù)來(lái)源可以是征信信息、社交網(wǎng)絡(luò)和電商等B)在數(shù)據(jù)集成模塊，可以分為數(shù)據(jù)采集、數(shù)據(jù)操控和數(shù)據(jù)加載3個(gè)階段C)金融領(lǐng)域的內(nèi)部數(shù)據(jù)來(lái)源均為結(jié)構(gòu)化數(shù)據(jù)，包括信貸數(shù)據(jù)、信用卡數(shù)據(jù)和收單數(shù)據(jù)等D)金融領(lǐng)域的數(shù)據(jù)應(yīng)用層面均是面向金融機(jī)構(gòu)內(nèi)部的，如監(jiān)管報(bào)表系統(tǒng)，精確營(yíng)銷、BI應(yīng)用等，完全不對(duì)外或?qū)ζ渌聦贆C(jī)構(gòu)開(kāi)放。答案:AB解析:[多選題]167.DWS支持的隔離級(jí)別包括：()。A)讀已提交B)讀未提交C)可重復(fù)讀D)可串行化答案:AB解析:[多選題]168.在Kafak中，如下關(guān)于Producer發(fā)送數(shù)據(jù)的說(shuō)法錯(cuò)誤的是：()。A)Producer負(fù)責(zé)生產(chǎn)數(shù)據(jù)，Consumer負(fù)責(zé)消費(fèi)數(shù)據(jù)，Producer和Consumer之間需要建立Socket連接B)Producer既可以發(fā)送數(shù)據(jù)到Broker上，又可以發(fā)送數(shù)據(jù)到Consumer上C)Producer作為消息生產(chǎn)者，可直接將數(shù)據(jù)寫入ZooKeeperD)Producer連接任意一個(gè)正常的Broker實(shí)例就可以生產(chǎn)數(shù)據(jù)答案:ABC解析:[多選題]169.大數(shù)據(jù)離線批處理場(chǎng)景中常見(jiàn)的數(shù)據(jù)源包括？()A)數(shù)據(jù)庫(kù)B)批量文件數(shù)據(jù)C)流式數(shù)據(jù)Socket流D)網(wǎng)頁(yè)日志流答案:ABCD解析:[多選題]170.ZooKeeper在HBase中主要起什么作用?（）A)存儲(chǔ)表結(jié)構(gòu)數(shù)據(jù)B)管理元數(shù)據(jù)C)存儲(chǔ)用戶表數(shù)據(jù)D)主備切換答案:BD解析:[多選題]171.在HA模式下，HDFS里包含哪些組件?()A)DataNodeB)TaskManagerC)NameNodeD)SecondaryNameNode答案:ACD解析:[多選題]172.關(guān)于Hbase存儲(chǔ)模型的描述正確的是：()。A)即使是：key值相同，qualifier也相同的多個(gè)KeyValue也可能有：多個(gè)，此時(shí)使用時(shí)間戳來(lái)區(qū)分B)同一個(gè)key值可以關(guān)聯(lián)多個(gè)valueC)keyvalue中期有：時(shí)間戳，類型等關(guān)鍵信息D)每一個(gè)keyvalue都有：一個(gè)qualifier標(biāo)識(shí)答案:ABCD解析:[多選題]173.FusioninsightHD中，Hive客戶端()參數(shù)是用來(lái)控制reduce并發(fā)度的。A)hive.exec.reducers.bytes.per.reducerB)hive.exec-ducers.maxC)hive.exec.max.dynamic.partitionsD)hive.exec.max.dynamic.partitions.pemode答案:AB解析:[多選題]174.以下哪些選項(xiàng)是ElasticSearch主節(jié)點(diǎn)EsMaster功能?()A)參與文檔數(shù)據(jù)變更B)參與文檔數(shù)據(jù)搜索C)參與新建索引D)參與刪除索引答案:CD解析:Master節(jié)點(diǎn)的主要職責(zé)是和集群操作相關(guān)的內(nèi)容，例如創(chuàng)建或刪除索引、跟蹤哪些節(jié)點(diǎn)是集群的一部分，并決定哪些分片分配給相關(guān)的節(jié)點(diǎn)。穩(wěn)定的主節(jié)點(diǎn)對(duì)集群的健康是非常重要的。默認(rèn)情況下任何一個(gè)集群中的節(jié)點(diǎn)都有可能被選為主節(jié)點(diǎn)。索引數(shù)據(jù)和搜索查詢等操作會(huì)占用大量的CPU、內(nèi)存、IO資源，為了確保一個(gè)集群的穩(wěn)定，分離主節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)是一個(gè)比較好的選擇。[多選題]175.Spark適用于以下()場(chǎng)景。A)交互式查詢B)實(shí)時(shí)流處理C)批處理D)圖計(jì)算答案:ABCD解析:[多選題]176.FusionlnsightHD中，關(guān)于Ooze的作業(yè)管理，對(duì)于己暫停的作業(yè)可以進(jìn)行()操作。A)killB)runC)resumeD)submit答案:AC解析:[多選題]177.關(guān)于Kafka的Peoducer,如下說(shuō)法正確的是：()。A)Producer是：消息生產(chǎn)者B)Producer生產(chǎn)數(shù)據(jù)需要指定TopicC)可以同時(shí)起多個(gè)Producer進(jìn)程向同一個(gè)Topic進(jìn)行數(shù)據(jù)發(fā)送D)Producer生產(chǎn)數(shù)據(jù)時(shí)需要先連接ZooKeeper,而后才連接Broker答案:ABC解析:[多選題]178.FusionlnsightHD中，屬于Streaming的數(shù)據(jù)分發(fā)方式有：()。A)ShuffleGroupingB)FieldGroupingC)LocalGroupingD)DirectGrouping答案:ABCD解析:[多選題]179.常用的數(shù)據(jù)結(jié)構(gòu)類型是?（）A)結(jié)構(gòu)化數(shù)據(jù)B)無(wú)結(jié)構(gòu)化數(shù)據(jù)C)半結(jié)構(gòu)化數(shù)據(jù)D)非結(jié)構(gòu)化數(shù)據(jù)答案:ACD解析:[多選題]180.Google發(fā)布的三篇論文是哪些？（）A)GFSB)HDFSC)MapReduceD)BigTable答案:ACD解析:[多選題]181.對(duì)HBase的列族，可以設(shè)置()屬性。A)VersionsB)TTLC)CoprocessorD)Compression答案:ABD解析:[多選題]182.HBase讀寫用戶表數(shù)據(jù)時(shí)需要下列哪些角色參與?()A)RegionServerB)HMasterC)ZooKeeperD)Region答案:ACD解析:[多選題]183.關(guān)于表掃描算子的說(shuō)法正確的是()?A)對(duì)于點(diǎn)查或者范圍掃描等過(guò)濾太量數(shù)據(jù)的查詢，如果使用SeqScan全表掃描會(huì)比較快。B)表的數(shù)目比較少的時(shí)候，使用Seqscan效率更高。C)SQL的執(zhí)行計(jì)劃第一步就是從表掃描算子開(kāi)始的。D)SeqScan是指順序掃描表的所有信息。答案:ABC解析:對(duì)于SeqScan很好理解，就是按照表的記錄的排列順序從頭到尾依次檢索掃描，每次掃描要取到所有的記錄。這也是最簡(jiǎn)單最基礎(chǔ)的掃表方式，掃描的代價(jià)比較大；[多選題]184.FusionInsightHD系統(tǒng)中Hive支持的存儲(chǔ)格式包括：()。A)TextFileB)SequenceFileC)RCFileD)Hfile答案:ABC解析:[多選題]185.ElasticSearch具有什么特點(diǎn)?()A)支持集群拓展B)支持結(jié)構(gòu)化數(shù)據(jù)檢索C)支持非結(jié)構(gòu)化數(shù)據(jù)檢索D)支持事務(wù)機(jī)制答案:ABC解析:[多選題]186.下面哪些是GaussDB200的特點(diǎn)()?A)支持集群在線擴(kuò)容。B)支持就地升級(jí)。C)支持自動(dòng)降級(jí)。D)支持標(biāo)準(zhǔn)SQL。答案:ABD解析:[多選題]187.Redis使用場(chǎng)景包含以下哪些特點(diǎn)?()A)支持持久化B)豐富數(shù)據(jù)結(jié)構(gòu)存取C)低時(shí)延D)高性能答案:ABCD解析:Redis提供了靈活多變的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)操作，主要應(yīng)用于如下場(chǎng)景：1、取最新N個(gè)數(shù)據(jù)的操作，比如獲取某網(wǎng)站的最新文章。2、排行榜應(yīng)用，取TOPN操作。這個(gè)需求與上面需求的不同之處在于，前面操作以時(shí)間為權(quán)重，這個(gè)是以某個(gè)條件為權(quán)重，比如按點(diǎn)擊的次數(shù)排序。3、需要精準(zhǔn)設(shè)定過(guò)期時(shí)間的應(yīng)用，如用戶會(huì)話信息。4、計(jì)數(shù)器應(yīng)用，比如記錄用戶訪問(wèn)網(wǎng)站次數(shù)。5、構(gòu)建隊(duì)列系統(tǒng)，例如消息隊(duì)列。6、緩存，如緩存關(guān)系數(shù)據(jù)庫(kù)中的頻繁訪問(wèn)的表數(shù)據(jù)。7、發(fā)布/訂閱功能，pub/sub8、手機(jī)驗(yàn)證碼，使用expire設(shè)置驗(yàn)證碼失效時(shí)間。[多選題]188.大數(shù)據(jù)計(jì)算框架Spark中除了RDD，還有哪些數(shù)據(jù)類型？()A)DataSetB)DataFrameC)DataTypeD)DataSchema答案:AB解析:[多選題]189.對(duì)于HBaserowkey的設(shè)計(jì)原則，如下描述正確的是：()。A)訪問(wèn)權(quán)重高的屬性值放在RowKey前面B)訪問(wèn)權(quán)重高的屬性值放在Rowkey后半部分C)離散度好的屬性值放在Rowkey前半部分D)離散度好的屬性值放在Rowkey后半部分答案:AC解析:[多選題]190.計(jì)算10分鐘內(nèi)的單詞，每5分鐘更新一次。若程序在11：00開(kāi)始運(yùn)行，在12：07收到的一個(gè)數(shù)字。這個(gè)數(shù)字應(yīng)該對(duì)應(yīng)于以下哪些窗口的計(jì)數(shù)?()A)12：00-12：10B)11：55-12：05C)12：05-12：15D)12：10-12：20答案:AC解析:[多選題]191.SparkSQL使用場(chǎng)景豐富，可以處理的數(shù)據(jù)源包括?()A)JsonB)HiveC)文本文件D)RDD答案:ABCD解析:[多選題]192.大數(shù)據(jù)計(jì)算框架Flink的支持哪些資源調(diào)度方式?()A)DockerB)YARNC)StandaloneD)Mesos答案:ABCD解析:[多選題]193.下列關(guān)于聚集算子的說(shuō)法正確的是()？A)當(dāng)聚集縮減率較大時(shí)使用Hashagg。B)Hashagg性能最佳，一般聚集算子盡量都用Hashagg。C)通過(guò)設(shè)置enable_sort=off，可以關(guān)閉Sort+GroupAgg。D)聚集算子需要所有聚集列都支持排序。答案:AC解析:[多選題]194.執(zhí)行Hbase讀取數(shù)據(jù)業(yè)務(wù)，需要從：()讀取。A)HmasterB)HfileC)HlogD)MetaStore答案:BD解析:[多選題]195.以下屬于控制算子的有：()。A)HashJoinB)AppendC)AggD)RecursiveUnoin答案:BD解析:[多選題]196.對(duì)GaussDB200CUDesc機(jī)制描述正確的是?（）A)CUDesc為列存表B)采用Min/Max稀疏索引C)列存表的輔助表D)每條記錄對(duì)應(yīng)一個(gè)CU(60Krows)答案:BCD解析:[多選題]197.ElasticSearch支持的gateway類型有?()A)AmazonS3B)本地文件系統(tǒng)C)HDFSD)AmazonS5答案:ABC解析:gateway:Gateway模塊用于存儲(chǔ)es集群的MetaData，一般只放在兩個(gè)地方：內(nèi)存和本地文件系統(tǒng)[多選題]198.以下()措施能提高HBase的查詢性能。A)預(yù)分region,使region分布均勻，提高并發(fā)B)查詢頻繁屬性放在rowkey前面部分C)使用二級(jí)索引，適應(yīng)更多查詢場(chǎng)景D)同時(shí)讀取的數(shù)據(jù)存放在同一個(gè)cell中答案:ABCD解析:[多選題]199.創(chuàng)建數(shù)據(jù)庫(kù)可以指定兼容()參數(shù)。A)MySQLB)OraC)TDD)SQLServer答案:BC解析:[多選題]200.下面關(guān)于FusionInsightLibrADM的支持平臺(tái)描述正確的有：()。A)可以運(yùn)行在SUSE11.3系統(tǒng)上B)需要運(yùn)行在InternetExplorer9.0及以上版本C)JDK需要1.6及以上版本D)操作系統(tǒng)需要預(yù)留2G內(nèi)存，10G磁盤空間答案:ABD解析:[多選題]201.整庫(kù)遷移支持的源端數(shù)據(jù)源類型有：()。A)MySQLB)OracleC)HiveD)DWS答案:ABCD解析:[多選題]202.創(chuàng)建API時(shí)，需要填寫()信息。A)API名稱B)API目錄C)請(qǐng)求PathD)請(qǐng)求方法答案:ABCD解析:[多選題]203.gs_dump和gs_dumpa11的異同點(diǎn)是()A)二者都支持純文本格式數(shù)據(jù)的導(dǎo)出。B)ds_dump只支持純文本格式的數(shù)據(jù)導(dǎo)出，ds_dumpa11支持多種數(shù)據(jù)格式的數(shù)據(jù)導(dǎo)出。C)二者都支持公共全局對(duì)象的數(shù)據(jù)導(dǎo)出。D)ds_dump針對(duì)的是單個(gè)數(shù)據(jù)庫(kù)，ds_dumpa11針對(duì)的是所有數(shù)據(jù)庫(kù)。答案:ACD解析:[多選題]204.Flume中以下哪些選項(xiàng)屬于SinkProcessor的類型?()A)FailoverSinkProcessorB)BlankSinkProcessorC)DefaultSinkProcessorD)LoadbalanceSinkProcessor答案:ACD解析:[多選題]205.()屬于CLOG日志記錄的狀態(tài)。A)CommittedB)AbortedC)Sub-CommittedD)Inprogress答案:ABCD解析:[多選題]206.創(chuàng)建GaussDB200的索引時(shí)，應(yīng)注意以下哪些事項(xiàng)()A)索引的設(shè)計(jì)與業(yè)務(wù)強(qiáng)相關(guān)，與數(shù)據(jù)無(wú)關(guān)。B)一般在經(jīng)常排序的字段上添加索引。C)索引的設(shè)計(jì)與數(shù)據(jù)強(qiáng)相關(guān)，與業(yè)務(wù)無(wú)關(guān)。D)一般在熱點(diǎn)數(shù)據(jù)上添加索引。答案:ABD解析:[多選題]207.下面哪些關(guān)鍵詞是Kafka的特點(diǎn)？()A)高吞吐B)分布式C)消息持久化D)支持消息隨機(jī)讀取答案:ABC解析:[多選題]208.GaussDB200支持的語(yǔ)法包括（）A)DQL(數(shù)據(jù)查詢語(yǔ)言)B)DDL(數(shù)據(jù)定義語(yǔ)言)C)DML(數(shù)據(jù)操作語(yǔ)言)D)DCL(數(shù)據(jù)控制語(yǔ)言)答案:BCD解析:[多選題]209.YARN容量調(diào)度器的主要特性有：()。A)容量保證B)動(dòng)態(tài)更新配置文件C)靈活性D)多重租賃答案:ABCD解析:[多選題]210.以下哪些情況下可以采用Replication方式存儲(chǔ)數(shù)據(jù)()?()A)存儲(chǔ)的表的數(shù)據(jù)量較小B)需要較高的并發(fā)分析能力C)存儲(chǔ)的表的數(shù)據(jù)量較大D)以上全都正確答案:AB解析:第3部分：判斷題，共28題，請(qǐng)判斷題目是否正確。[判斷題]211.Kafak所有消息都會(huì)被持久化到硬盤中，同時(shí)Kafka通過(guò)對(duì)TopicPartition設(shè)置Replication來(lái)保障數(shù)據(jù)的可靠性。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]212.Flink適用于高并發(fā)處理數(shù)據(jù)、毫秒級(jí)時(shí)延應(yīng)用。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]213.Hbase的BloomFiliter是用來(lái)過(guò)濾數(shù)據(jù)。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]214.Hive中g(shù)roupby指的是通過(guò)一定規(guī)則將一個(gè)數(shù)據(jù)集劃分成若干個(gè)小的數(shù)據(jù)集，然后針對(duì)若干個(gè)小的數(shù)據(jù)集進(jìn)行分組處理。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]215.采用Nestloop算子實(shí)現(xiàn)連接操作沒(méi)有限制。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]216.Flume傳輸數(shù)據(jù)的過(guò)程中，Sink取走數(shù)據(jù)并寫入目的地后，會(huì)將events從channel中刪除。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]217.數(shù)據(jù)質(zhì)量監(jiān)控DQC（DataQualityControl）模塊是對(duì)數(shù)據(jù)庫(kù)里的數(shù)據(jù)質(zhì)量進(jìn)行質(zhì)量管理的工具。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]218.用戶權(quán)限管理基于角色的訪問(wèn)控制，提供可視化的多組統(tǒng)一的集群中用戶權(quán)限管理。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]219.Flume架構(gòu)中，一個(gè)source可以連接多個(gè)Channel。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]220.Zookeeper的增強(qiáng)性包括在

人人文庫(kù)> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

華為大數(shù)據(jù)練習(xí)(習(xí)題卷2)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔