版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第頁(yè)HCIP大數(shù)據(jù)練習(xí)測(cè)試卷1.altertabletableNamesettblproperties('EXTERNAL'='FALSE'):執(zhí)行該Hive命令能實(shí)現(xiàn)以下哪一個(gè)目標(biāo)?A、修改內(nèi)部表tableName為外部表B、移動(dòng)tableName數(shù)據(jù)到外部存儲(chǔ)系統(tǒng)C、刪除tableName表的元數(shù)據(jù)信息D、修改外部表tableName為內(nèi)部表【正確答案】:D2.在華為云GES中,想要給圖g中id為"Katherine"的用戶添加朋友為"zhangsan"。以下哪一個(gè)選項(xiàng)能正確實(shí)現(xiàn)上述目的?A、g.addV('friends').from(g.V("Katherine")).to(g.V("zhangsan"))B、g.addV('friends').from(g.V("zhangsan")).to(g.V("Katherine"))C、g.addE('friends').from(g.V("zhangsan")).to(g.V("Katherine"))D、g.addE('friends').from(g.V("Katherine").to(g.V("zhangsan"))【正確答案】:D3.關(guān)于實(shí)時(shí)檢索技術(shù)的應(yīng)用場(chǎng)景,以下描述中錯(cuò)誤的是哪一個(gè)選項(xiàng)?A、運(yùn)營(yíng)商可以借助實(shí)時(shí)檢索技術(shù),查詢某個(gè)時(shí)間段用戶的流量記錄,以應(yīng)對(duì)不良APP偷跑流量引發(fā)的投訴B、實(shí)時(shí)檢索要求在小批量數(shù)據(jù)集上需達(dá)到毫秒級(jí)的時(shí)延C、在金融風(fēng)控場(chǎng)景中,利用實(shí)時(shí)檢索技術(shù),客戶可以在發(fā)生危險(xiǎn)交易前及時(shí)止損D、公安系統(tǒng)數(shù)據(jù)量大、業(yè)務(wù)要求復(fù)雜,因此無(wú)法借助實(shí)時(shí)檢索技術(shù)提高處警效率【正確答案】:D4.Hive中詳細(xì)顯示函數(shù)的用法為以下哪一選項(xiàng)?A、hive>getfunctions;B、hive>descfunctionextendedupper;C、hive>descfunctionupper;D、hive>showfunctions;【正確答案】:B5.()是一個(gè)實(shí)現(xiàn)了文件系統(tǒng)的抽象類,繼承自org.apache.hadoop.conf.Configured,并實(shí)現(xiàn)了Closeable接口,可以適用于多種文件系統(tǒng)。A、FileSystemB、FSDataOutputStroamC、FSDatalnputStreamD、FileConfiguration【正確答案】:A6.以下哪一項(xiàng)不是SparkSQL的適用場(chǎng)景?A、實(shí)時(shí)數(shù)據(jù)查詢B、需要處理PB級(jí)的大容量數(shù)據(jù)C、結(jié)構(gòu)化數(shù)據(jù)處理D、對(duì)數(shù)據(jù)處理的實(shí)時(shí)性要求不高的場(chǎng)景【正確答案】:A7.關(guān)于HBase中HRegionServer的故障處理機(jī)制,以下說(shuō)法中哪一項(xiàng)是錯(cuò)誤的?A、共用日志優(yōu)點(diǎn):恢復(fù)時(shí)需要分拆日志;缺點(diǎn):提高對(duì)表的寫(xiě)操作性能B、根據(jù)日志記錄所屬的Region對(duì)象對(duì)HLog數(shù)據(jù)進(jìn)行拆分,分別放到相應(yīng)Region對(duì)象的目錄下C、Zookeeper會(huì)實(shí)時(shí)監(jiān)測(cè)每個(gè)HRegionServer的狀態(tài),當(dāng)某個(gè)HRegionServer發(fā)生故障時(shí),Zookeeper會(huì)通知HMasterD、HMaster首先會(huì)處理發(fā)生故障的HRegionServer上面遺留的HLog文件,這個(gè)遺留的HLog文件中包含了來(lái)自多個(gè)Region對(duì)象的日志記錄【正確答案】:A8.以下哪一選項(xiàng)不是大數(shù)據(jù)的特點(diǎn)?A、容量大B、種類多C、速度快D、結(jié)構(gòu)單一【正確答案】:D9.Flink的哪種機(jī)制可以保證task運(yùn)行失敗時(shí),其狀態(tài)能夠恢復(fù)?A、窗口B、事件時(shí)間C、檢查點(diǎn)D、有狀態(tài)處理【正確答案】:C10.關(guān)于HBase建表語(yǔ)句,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、利用HBase的JavaAPI時(shí),需要用put語(yǔ)句完成建表B、在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)RegionC、在華為云MRS提供的HBaseshell客戶端中建表時(shí),需指定至少一個(gè)列族名稱D、在HBaseshell客戶端中可以通過(guò)create命令建表【正確答案】:A11.在HDFS中"認(rèn)為硬件,總是不可靠的"體現(xiàn)了以下哪一個(gè)特性?A、高吞吐量B、大文件存儲(chǔ)C、高容錯(cuò)性D、彈性伸縮【正確答案】:C12.StructuredStreaming程序執(zhí)行過(guò)程中,定義流計(jì)算過(guò)程之后是哪一個(gè)步驟?A、創(chuàng)建輸入數(shù)據(jù)源B、導(dǎo)入相關(guān)依賴模塊C、啟動(dòng)流計(jì)算并計(jì)算輸出結(jié)果D、創(chuàng)建SparkSession對(duì)象【正確答案】:C13.以下哪一項(xiàng)不屬于Flink組件的滾動(dòng)聚合算子?A、KeyBy()B、minBy()C、min()D、sum()【正確答案】:A14.關(guān)于ElasticSearch性能優(yōu)化,以下哪一項(xiàng)說(shuō)法是錯(cuò)誤的?A、分片數(shù)不超過(guò)節(jié)點(diǎn)數(shù)的3倍,用較少的分片獲得更佳的性能B、索引創(chuàng)建好后依然可以動(dòng)態(tài)調(diào)整分片數(shù)量C、分片最大容量不要超過(guò)E1asticSearch推薦的最大JVM堆空間32GD、副本數(shù)建議設(shè)置為1,過(guò)多的副本需要更多存儲(chǔ)空間【正確答案】:B15.關(guān)于HBase中的BloomFilter,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、BloomFilter用來(lái)優(yōu)化一些隨機(jī)讀取的場(chǎng)景,即Get場(chǎng)景BloomFilter可以被用來(lái)快速的判斷一條數(shù)據(jù)在一個(gè)大的數(shù)據(jù)集合中是否存在C、如果BloomFilter判斷結(jié)果為“該條數(shù)據(jù)不存在”,這一結(jié)果擁有一定的誤判率D、HBase的BloomFilter的相關(guān)數(shù)據(jù),被保存在HFile中【正確答案】:C16.以下哪一項(xiàng)不屬于目前經(jīng)常定義的Sink類型。A、ElasticSearchSinkB、RedisSinkC、KafkaSinkD、ODBCSink【正確答案】:D17.Redis默認(rèn)支持的數(shù)據(jù)庫(kù)個(gè)數(shù)是多少?A、10B、5C、16D、15【正確答案】:C18.關(guān)于GES特點(diǎn),以下描述中正確的是哪一項(xiàng)?A、簡(jiǎn)單易用:支持SQL查詢語(yǔ)言,兼容不同用戶的使用習(xí)慣B、高性能:對(duì)分布式圖形計(jì)算引警進(jìn)行了深度優(yōu)化,具有高井發(fā)、最快可達(dá)分鐘級(jí)時(shí)延的實(shí)時(shí)查詢能力C、大規(guī)模:最大可支持百萬(wàn)節(jié)點(diǎn)千萬(wàn)邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析D、查詢分析一體:提供豐富的圖分析算法,實(shí)現(xiàn)了查詢分析一體化【正確答案】:D19.關(guān)于Kalka的Topic,以下哪一項(xiàng)描述是錯(cuò)誤的?A、Topic的Partition數(shù)量可以在創(chuàng)建時(shí)配置。B、Kafka集群中Topic可以設(shè)置多個(gè)。C、設(shè)置多副本可以增強(qiáng)Kaka服務(wù)的容災(zāi)能力。D、在創(chuàng)建Kafka的Topic時(shí),必須設(shè)置Partition個(gè)數(shù)【正確答案】:D20.以下哪一選項(xiàng)不是統(tǒng)一元數(shù)據(jù)管理的優(yōu)勢(shì)?A、元數(shù)據(jù)統(tǒng)一管理、統(tǒng)一訪問(wèn)和使用B、提供可視化元數(shù)據(jù)管理工具C、使用事實(shí)標(biāo)準(zhǔn)Hivemetastore接口,業(yè)務(wù)易對(duì)接D、數(shù)據(jù)訪問(wèn)分散授權(quán),數(shù)據(jù)安全無(wú)保障【正確答案】:D21.在GES圖引擎服務(wù)中,以下有關(guān)使用GremlinJavaAPI完成操作的描述中,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、同步提交指的是客戶端在提交完一個(gè)任務(wù)之后,就在原地等待,等待任務(wù)完完整整地運(yùn)行完畢拿到結(jié)果后,再執(zhí)行下一行代碼,會(huì)導(dǎo)致任務(wù)是串行執(zhí)行B、異步提交指的是客戶端在提交完一個(gè)任務(wù)之后,不在原地等待,結(jié)果直接執(zhí)行下一行代碼,會(huì)導(dǎo)致任務(wù)是并發(fā)執(zhí)行的C、Future<ResultSet>resultSet=Client.submitAsync("g.V().hasLabel('person').valueMap('name','age').limit(10)");該令屬于同步提交D、客戶端需和一個(gè)或多個(gè)Gremlinserver實(shí)例建立鏈接,基于Cluster對(duì)象創(chuàng)建Client【正確答案】:C22.以下哪個(gè)場(chǎng)景是HDFS適合做的?A、大量小文件存儲(chǔ)B、流式數(shù)據(jù)訪問(wèn)C、隨機(jī)寫(xiě)入D、低延遲讀取【正確答案】:B23.下面哪一選項(xiàng)不屬于Redis的優(yōu)化方法?A、Slowlog配置B、精簡(jiǎn)鍵值C、開(kāi)啟AOF持久化D、限制Redis內(nèi)存大小【正確答案】:C24.大數(shù)據(jù)技術(shù)的4V特征不包含以下哪項(xiàng)?A、VolumeB、VelocityC、VirtualD、Variety【正確答案】:C25.ElasticSearch數(shù)據(jù)寫(xiě)入階段有很多調(diào)優(yōu)方式,下列錯(cuò)誤的是哪一項(xiàng)?A、盡量使用自動(dòng)生成的idB、禁用wildcardC、寫(xiě)入前副本數(shù)設(shè)置為0D、寫(xiě)入過(guò)程中:采取bulk批量寫(xiě)入【正確答案】:B26.以下哪一項(xiàng)不屬于ElasticSearch客戶端可以執(zhí)行的curl命令?A、curl-XPOSTB、curl-XSELECTC、curl-XGETD、curl-XPUT【正確答案】:B27.如果使用Redis統(tǒng)計(jì)topN的元素,可以使用哪種數(shù)據(jù)類型?A、StoredSetB、ListC、HashD、Set【正確答案】:A28.實(shí)時(shí)處理的步驟中,實(shí)時(shí)計(jì)算的前一步是以下哪一項(xiàng)?A、實(shí)時(shí)展示B、實(shí)時(shí)落地C、實(shí)時(shí)緩存存儲(chǔ)D、實(shí)時(shí)采集【正確答案】:C29.在大數(shù)據(jù)分析場(chǎng)景中,以下說(shuō)法哪一項(xiàng)是不正確的?A、SparkSQL:新型SQL處理引擎,速度比Hive快,處理SQL類的批處理任務(wù)B、HDFS:基于大數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)C、FLink:流批一體式計(jì)算引擎D、Hive:類SQL查詢,傳統(tǒng)批處理引擎,速度較慢【正確答案】:B30.大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別不包括哪一方面?A、數(shù)據(jù)規(guī)模B、數(shù)據(jù)類型C、處理對(duì)象D、編程語(yǔ)言【正確答案】:D31.關(guān)于HBase的說(shuō)法中,以下哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、HBase是一個(gè)NoSQL數(shù)據(jù)庫(kù)B、HBase對(duì)于大表的讀寫(xiě)訪問(wèn)需要分鐘級(jí)的時(shí)延,C、HBase需要依賴HDFS作為底層的文件存儲(chǔ)系統(tǒng)D、HBase需要依賴Zookeeper進(jìn)行協(xié)同服務(wù)【正確答案】:B32.關(guān)于HBase的概念視圖,以下描述中正確的是哪一項(xiàng)?A、HBase是一個(gè)面向列的非關(guān)系型數(shù)據(jù)庫(kù)B、HBase的每一行數(shù)據(jù)可以有不同的行鍵C、HBase表格數(shù)據(jù)以文件塊的形式存放在內(nèi)存中D、HBase的每一個(gè)Region都是固定大小,每個(gè)Region都是64MB【正確答案】:A33.以下哪一選項(xiàng)不是企業(yè)級(jí)大數(shù)據(jù)平臺(tái)的特點(diǎn)?A、可維護(hù)性差B、可平滑拓展C、數(shù)據(jù)共享D、資源共享【正確答案】:A34.下面哪一項(xiàng)不是Kafka的組件?A、BrokersB、ConsumerC、TopicD、Zookeeper【正確答案】:D35.大數(shù)據(jù)體量范圍一般是以下哪一選項(xiàng)?A、TB-PBB、GB-TBC、HB-GBD、KB-MB【正確答案】:A36.編寫(xiě)Scala代碼時(shí),通過(guò)以下哪個(gè)算子可以實(shí)現(xiàn)數(shù)據(jù)過(guò)?A、filterB、collectC、mapD、flatmap【正確答案】:A37.關(guān)于HBasc的特性描述錯(cuò)誤的是?A、高可靠B、分布式C、不支持?jǐn)U容D、高性能【正確答案】:C38.在華為云GES服務(wù)中,想要在一張已存在的圖g中添加id為張三,年齡為18-24,性別為M的user用戶。以下哪一個(gè)選項(xiàng)能正確實(shí)現(xiàn)上述目的?單選A、g.addVertex(label,'user',id.'張','Age','18-24')B、g.addE(id,"張三").from(g.V("Katherine").to(g.V("id","張三")C、g.addV("張三").property("Age","18-24").property("Gender","M")D、g.addV("user").property(id,"張三").property("Age","18-24")!property("Gender","M")【正確答案】:D39.HDFS中-mkdir命令可以實(shí)現(xiàn)以下哪一選項(xiàng)的功能?A、創(chuàng)建目錄B、改變文件屬性C、顯示文件內(nèi)容D、顯示目錄【正確答案】:A40.以下哪一個(gè)選項(xiàng)不是GES的特點(diǎn)?A、大規(guī)模B、查詢分析互相解耦C、簡(jiǎn)單易用D、高性能【正確答案】:B41.下列哪一項(xiàng)是HBase不適合的應(yīng)用場(chǎng)景?A、要求具有完全A,CID特性的應(yīng)用場(chǎng)景。B、半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用場(chǎng)景。C、高吞吐率應(yīng)用場(chǎng)景。D、海量數(shù)據(jù)(TE、PF、應(yīng)用場(chǎng)景【正確答案】:A42.HDFS默認(rèn)的副本是幾份?A、3B、6C、5D、4【正確答案】:A43.以下關(guān)于HBase緩存刷新的說(shuō)法中,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、系統(tǒng)會(huì)周期性地把MemStore緩存里的內(nèi)容刷寫(xiě)到磁盤(pán)的StoreFile文件中,清空緩存,并在Hlog里面寫(xiě)入一個(gè)標(biāo)記B、每個(gè)HRegionServer都有一個(gè)自己的HLog文件,每次啟動(dòng)都檢查該文件C、如果發(fā)現(xiàn)最近一次執(zhí)行緩存刷新操作之后發(fā)生新的寫(xiě)入操作,則先寫(xiě)入MemStore,再刷寫(xiě)到StoreFileD、每次刷寫(xiě)都生成一個(gè)新的StoreFile文件,但每個(gè)Store中僅包含一個(gè)StoreFile文件【正確答案】:D44.HBase默以使用什么組件作為其底層文件存儲(chǔ)系統(tǒng)()A、FileB、KafkaC、MemoryD、HDFS【正確答案】:D45.以下哪一個(gè)組件可以將SQL語(yǔ)句轉(zhuǎn)化為HBase的Scan操作?ApacheStormB、ApachePhoenixC、ApacheMapReduceD、ApacheHDFS【正確答案】:B46.Spark中Task失敗會(huì)默認(rèn)進(jìn)行多少次的重試?A、2B、3C、4D、1【正確答案】:C47.HBase的Region的是由哪個(gè)服務(wù)進(jìn)程來(lái)管理的?A、HRegionServerB、ZooKeeperC、DataNodeD、HMaster【正確答案】:A48.以下哪一選項(xiàng)不是組件混合負(fù)載、資源統(tǒng)一調(diào)度帶來(lái)的客戶價(jià)值?A、混合負(fù)載,統(tǒng)一資源池調(diào)度,提升資源利用率B、支持授權(quán)用戶數(shù)量大幅減少CPU、GPU異構(gòu)計(jì)算調(diào)度D、資源池隔離,計(jì)算任務(wù)相互不影響【正確答案】:B49.Hive與傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別不包括以下哪一選項(xiàng)?A、索引B、易用性C、面向?qū)ο驞、執(zhí)行引擎【正確答案】:C50.某公司在進(jìn)行大數(shù)據(jù)離線批處理平臺(tái)的前期技術(shù)選型,以下哪個(gè)大數(shù)據(jù)組件不屬于高線批處理業(yè)務(wù)所涉及到的組件?A、HiveB、SparkC、HDFSD、Storm【正確答案】:D51.大數(shù)據(jù)技術(shù)一站式融合中計(jì)算融合指的是以下哪一選項(xiàng)?A、大數(shù)據(jù)基礎(chǔ)設(shè)施上云B、融合多樣性的算力,提升整體效率C、批、交互式、流等計(jì)算框架共用資源,分時(shí)復(fù)用D、大數(shù)據(jù)平臺(tái)的數(shù)據(jù)分析智能化以及數(shù)據(jù)治理的智能化【正確答案】:C52.關(guān)于ElasticSearch生態(tài)圈,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、elasticsearch-head:深度集成Hadoop和ElasticSearch的項(xiàng)目,是官方維護(hù)的一個(gè)子項(xiàng)目Beats:專門(mén)用于發(fā)送數(shù)據(jù)的平臺(tái),可以將數(shù)據(jù)無(wú)縫傳輸給Logstash或是ElasticSearchC、Logstash:具備實(shí)時(shí)數(shù)據(jù)傳輸能力的管道,著重日志相關(guān)處理D、Kibana:開(kāi)源的分析和可視化平臺(tái),基于ElasticSearch的搜索與分析能力,拿到用于上層分析和可視化需要的結(jié)果【正確答案】:A53.在MRSHDFS中,將HDFS根目錄下的a.txt重命名為b.txt,以下哪一個(gè)選項(xiàng)可以實(shí)現(xiàn)上述目的?A、hdfsdfs-rm/a.txt/b.txtB、hdfsdfs-mv/a.txt/b.txtC、hdfsdfs-put/a.txt/b.txtD、hdfsdfs-1s/a.txt/b.txt【正確答案】:B54.Hive表與MySQL類似存在分區(qū)的概念,那么對(duì)于Hive的分區(qū),以下描述中,正確的是哪一項(xiàng)?A、Hive的分區(qū)針對(duì)的是文件,分桶針對(duì)的是文件夾。B、Hive的分區(qū)數(shù)量可以通過(guò)參數(shù)動(dòng)態(tài)生成。C、Hive的分區(qū)和分桶是以一個(gè)概念。D、Hive的分區(qū)字段與MySQL一樣必須存在?!菊_答案】:B55.以下哪一個(gè)選項(xiàng)不是ElasticSearch底層存放索引快照的位置?A、HadoopHDFSB、LocalFileSystemC、SharedFileSystemD、IndexModule【正確答案】:D56.基于WAL(預(yù)寫(xiě)式日志W(wǎng)rite-AheadLog)實(shí)現(xiàn)持久化的Channel類型,是以下的哪一項(xiàng)?A、FileChannelB、ODBCChannelC、JDBCChannelD、MemoryChannel【正確答案】:A57.SparkRDD常用算子包含Transformation算子和A,Ction算子,下列哪一個(gè)選項(xiàng)屬于ACtion算子?A、MapB、saveAsTextFileC、reduceByKeyD、filter【正確答案】:B58.關(guān)于ElasticSearch的說(shuō)法,下列錯(cuò)誤的是哪一項(xiàng)?A、不支持非結(jié)構(gòu)化數(shù)據(jù)B、對(duì)Lucene進(jìn)行了擴(kuò)展C、原型環(huán)境和生產(chǎn)環(huán)境可無(wú)縫切換D、能夠水平擴(kuò)展【正確答案】:A59.Spark中劃分Stage的標(biāo)識(shí)是以下哪一選項(xiàng)?A、MapB、CombineC、ShuffleD、Reduce【正確答案】:C60.關(guān)于ElasticSearch,以下哪一個(gè)選項(xiàng)是正確的?A、ElasticSearch自身不帶RESTFULAPI接口B、ElasticSearch不支持分布式C、ElasticSearch只在數(shù)據(jù)量比較小的時(shí)候才有性能優(yōu)勢(shì)D、ElasticSearch可以支持模糊查詢【正確答案】:D61.關(guān)于HBase客戶端的使用,以下描述錯(cuò)誤的是哪一選項(xiàng)?A、插入數(shù)據(jù)需要用到put命令B、無(wú)法通過(guò)HBase客戶端創(chuàng)建命名空間C、創(chuàng)建表時(shí)可以指定列族名稱D、使用get命令查詢數(shù)據(jù)時(shí)需要指定行鍵信息【正確答案】:B62.關(guān)于HBase,以下描述正確的是哪一項(xiàng)?A、對(duì)于絕大部分企業(yè)級(jí)大數(shù)據(jù)平臺(tái)而言,HBase底層需依賴HDFS存儲(chǔ)海量數(shù)據(jù)B、HBase可輕易實(shí)現(xiàn)海量數(shù)據(jù)的全局A,CID特性C、HBase和Zookeeper不是強(qiáng)綁定的D、HBase無(wú)法存儲(chǔ)結(jié)構(gòu)稀疏的表格【正確答案】:A63.下列哪一個(gè)選項(xiàng)不是StructuredStreaming支持的sink輸出源。A、HBaseB、ConsoleC、HDFSD、Kafka【正確答案】:A64.下列關(guān)于Phoenix的說(shuō)法錯(cuò)誤的是哪一項(xiàng)?A、將SQL編譯成HBase原生的scansB、確定scan關(guān)鍵字的最佳開(kāi)始和結(jié)束C、讓scan并行執(zhí)行D、PhoenixSQL只能使用JDBC連接【正確答案】:D65.下列哪一項(xiàng)不是ElasticSearch的擴(kuò)展插件?A、es-HadoopB、ElasticSearch-headC、HadoopD、Logstash【正確答案】:C66.關(guān)于HBase的特點(diǎn),以下描述中錯(cuò)誤的是哪一項(xiàng)?A、高性能B、面向行C、可伸縮D、高可靠【正確答案】:B67.HBase使用get方法讀取數(shù)據(jù)時(shí),下列哪個(gè)選項(xiàng)是需要的?A、scan.setCaching(1000)B、Deletedelete=newDelete(rowKey)C、byte[]rowKey=Bytes.toBytes("012005000201")D、List<Put>puts=newArrayList<Put>【正確答案】:C68.Spark2.0中引入了()的概念,它為用戶提供了一個(gè)統(tǒng)的切入點(diǎn)來(lái)使用Spark的各項(xiàng)功能。A、SparkSessionB、SparkTextC、SparkConfD、SparkContext【正確答案】:A69.關(guān)于ElasticSearch內(nèi)部架構(gòu),以下描述中錯(cuò)誤的是哪一項(xiàng)?()A、Plugins:插件可以通過(guò)自定義的方式擴(kuò)展加強(qiáng)Elasticsearch的基本功能,比如可以自定義類型映射,分詞器,本地腳本等B、transport:代表Elasticsearch內(nèi)部節(jié)點(diǎn)或集群與客戶端的交互方式,默認(rèn)內(nèi)部是使用tcp協(xié)議進(jìn)行交互C、Discovery:該模塊主要負(fù)責(zé)集群中節(jié)點(diǎn)的自動(dòng)發(fā)現(xiàn)和Master節(jié)點(diǎn)的選舉D、Gateway:代表ElasticSearch.與客戶端交流的方式【正確答案】:D70.企業(yè)級(jí)數(shù)據(jù)分析平臺(tái)的演進(jìn)趨勢(shì)不包括以下哪一階段A、無(wú)組織架構(gòu)階段B、單一架構(gòu)階段C、存算分離架構(gòu)階段D、存算融合架構(gòu)階段【正確答案】:A71.Irange是Redis中哪種數(shù)據(jù)類型的命令?A、SetB、ListC、HashD、String【正確答案】:B72.以下關(guān)于Redis持久化的描述,錯(cuò)誤的是哪一項(xiàng)?A、RDB方式的持久化是通過(guò)快照完成的B、AOF方式的持久化是通過(guò)日志文件的方式C、可以手動(dòng)執(zhí)行save或者bgsave命令讓redis執(zhí)行快照D、Redis默認(rèn)的持久化方式是AOF【正確答案】:D73.HBase客戶端提供了很多命令,關(guān)于list命令,下列正確是哪一項(xiàng)?A、查看所有的表B、查詢命名空間C、查看幫助命令D、查詢表數(shù)據(jù)【正確答案】:A74.HBase中數(shù)據(jù)存儲(chǔ)的文件格式是下面哪一項(xiàng)?A、HFileB、HLogC、SequenceFileD、TextFile【正確答案】:A75.以下哪個(gè)選項(xiàng)不屬于HBase的架構(gòu)?A、ZooKeeperB、HRegionServerC、HMasterD、HRegion【正確答案】:D76.不同的Channel提供的持久化水平也是不一樣的,其中()不會(huì)持久化;A、MemoryChannel、JDBCChannel、FileChannelB、FileChannel、JDBCChannel、MemoryChannelC、JDBCChannel、MemoryChannel、FileChanelD、MemoryChannel、FileChannel、JDBCChannel【正確答案】:D77.Kafka運(yùn)行時(shí)直接依賴于以下哪一個(gè)組件?A、HBaseB、HDFSC、SparkD、Zookeeper【正確答案】:D78.Kafka日志數(shù)據(jù)文件默認(rèn)保留的最長(zhǎng)時(shí)間是多少小時(shí)?A、96B、48C、24D、168【正確答案】:D79.某大數(shù)據(jù)開(kāi)發(fā)人員在創(chuàng)建Hive表結(jié)構(gòu)時(shí),發(fā)現(xiàn)原先創(chuàng)建的表存儲(chǔ)格式出現(xiàn)了問(wèn)題。對(duì)于這一現(xiàn)象,以下描述中,錯(cuò)誤的是哪一項(xiàng)?A、不同的存儲(chǔ)格式會(huì)影響表的處理效率B、必須修正回來(lái),不然會(huì)導(dǎo)致數(shù)據(jù)無(wú)法查詢C、可以通過(guò)alter命令進(jìn)行修改D、錯(cuò)誤的表存儲(chǔ)格式會(huì)影響10A,D命令加載,導(dǎo)致數(shù)據(jù)無(wú)法正常導(dǎo)入【正確答案】:B80.以下哪一選項(xiàng)不屬于華為云MRS中Manager的特點(diǎn)?A、一鍵式部署、升級(jí)B、運(yùn)維難度高C、管理員可全面掌握集群運(yùn)行狀態(tài)D、故障快速定位【正確答案】:B81.大數(shù)據(jù)環(huán)境下的隱私擔(dān)憂,主要表現(xiàn)為以下哪個(gè)選項(xiàng)?A、用戶畫(huà)像的生成B、病毒入侵C、個(gè)人信息的被識(shí)別與暴露D、內(nèi)存溢出【正確答案】:C82.HiveSQL中DDL指定是哪一種語(yǔ)言?A、數(shù)據(jù)刪除語(yǔ)言B、數(shù)據(jù)查詢語(yǔ)言C、數(shù)據(jù)管理語(yǔ)言D、數(shù)據(jù)定義語(yǔ)言【正確答案】:D83.以下哪一選項(xiàng)不是批流融合的實(shí)時(shí)決策系統(tǒng)的優(yōu)勢(shì)?A、維護(hù)難度大B、吞吐量高C、可靠性高D、批-流融合計(jì)算【正確答案】:A84.以下關(guān)于大數(shù)據(jù)的描述正確的是哪一個(gè)選項(xiàng)?A、云計(jì)算就是大數(shù)據(jù)B、大數(shù)據(jù)必須基于云平臺(tái)C、大數(shù)據(jù)與云平臺(tái)融合是發(fā)展趨勢(shì)D、大數(shù)據(jù)可以解決所有事情【正確答案】:C85.離線批處理工具不包含以下哪項(xiàng)?A、SparkB、SQLC、MapReduceD、Storm【正確答案】:D86.Hive數(shù)據(jù)存儲(chǔ)模型中不包括以下哪一結(jié)構(gòu)?A、分區(qū)B、表C、桶D、塊【正確答案】:D87.為了提高Kafka的容錯(cuò)性,Kafka支持Partition的復(fù)制策略,以下關(guān)于LeA,DerPartition和FollowerPartition的描述哪一項(xiàng)是錯(cuò)誤的?A、Kafkat對(duì)Partition的復(fù)制需要選出一個(gè)LeA,Der,由該LeA,Der負(fù)責(zé)Partition的讀寫(xiě)操作,其他的副本節(jié)點(diǎn)只是負(fù)責(zé)數(shù)據(jù)的同步B、如果LeA,Der失效,那么將會(huì)有其他Follower來(lái)接管(成為新的LeA,DerC、一個(gè)Kafka集群各個(gè)節(jié)點(diǎn)間不可能互為L(zhǎng)eA,Der和FollowerD、由于LeA,DerServer承載了全部的請(qǐng)求壓力,因此從集群的整體考慮,Kafka會(huì)將LeA,Der均橫的分散在每個(gè)實(shí)例上,來(lái)確保整體的性能穩(wěn)定【正確答案】:C88.以下大數(shù)據(jù)精準(zhǔn)廣告發(fā)展方向不包括哪一項(xiàng)?A、平臺(tái)化B、自動(dòng)化C、精準(zhǔn)化D、價(jià)值化【正確答案】:A89.HDFS里元數(shù)據(jù)持久化過(guò)程包括Fslmage持久化和Editlog持久化,其中EditLog持久化是通過(guò)以下哪一種方式完成的?A、圖片B、日志C、網(wǎng)頁(yè)D、快照【正確答案】:B90.以下哪一個(gè)概念是ElasticSearch中的邏輯命名空間?A、TypeB、SchemaC、IndexD、NameSpace【正確答案】:C91.Hive中trim()函數(shù)的功能是以下哪一選項(xiàng)?A、字符串截取B、返回近似值。C、計(jì)算絕對(duì)值D、去除空字符串【正確答案】:D92.Hive架構(gòu)中有一個(gè)Driver模塊用于對(duì)SQL語(yǔ)句進(jìn)行轉(zhuǎn)化,那么對(duì)于Driver的描述中,正確的是哪一項(xiàng)?A、Driver中的Compiler負(fù)責(zé)對(duì)HiveQL生成的執(zhí)行計(jì)劃和MapReduce任務(wù)進(jìn)行優(yōu)化B、Driver中的Optimizer負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)。C、Driver中的Executor負(fù)責(zé)按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)Driver指Java的JDBC連接所用的Driver類。【正確答案】:C93.Kafka集群必須依賴于下列哪一個(gè)組件?A、FlumeB、ZookeeperC、YarnD、HDFS【正確答案】:B94.下列哪一個(gè)命令可以清空Redis實(shí)例下所有數(shù)據(jù)庫(kù)的數(shù)據(jù)A、dropallB、flushallC、dropdbD、flushdb【正確答案】:B95.在Flume架構(gòu)中,以下哪一種類型的Sink支持將數(shù)據(jù)寫(xiě)入到Solr中?A、thiftsinkB、filerollsinkC、MorphlineSolrsinkD、hdfssink【正確答案】:C96.關(guān)于HBase的RegionSplit,以下描述中錯(cuò)誤的是哪一項(xiàng)?A、RegionSplit過(guò)程不需要HMaster進(jìn)行管理B、將大表分裂出多個(gè)Region有助于提高數(shù)據(jù)的讀寫(xiě)效率C、RegionSplit速度很快,因?yàn)椴](méi)有真正拆分?jǐn)?shù)據(jù)D、在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)Region【正確答案】:C97.以下關(guān)于GES四大特點(diǎn)的描述,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、查詢分析一體:提供豐富的圖分析算法,實(shí)現(xiàn)了查詢分析一體化,可以為關(guān)系分析、路徑規(guī)劃、營(yíng)銷推薦等業(yè)務(wù)提供多樣的分析能力B、高性能:對(duì)分布式圖形計(jì)算引擎進(jìn)行了深度優(yōu)化,能達(dá)到小時(shí)級(jí)響應(yīng)速度的查詢能力C、簡(jiǎn)單易用:支持Gremlin查詢語(yǔ)言,兼容不同用戶的使用習(xí)慣D、大規(guī)模:具有高效的數(shù)據(jù)組織能力,可以更有效地對(duì)百億節(jié)點(diǎn)千億邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析【正確答案】:B98.某大數(shù)據(jù)開(kāi)發(fā)人員在創(chuàng)建分區(qū)表時(shí),不知道應(yīng)該如何設(shè)定分區(qū)寧段的字段類型。針對(duì)他的困擾,以下建議哪一項(xiàng)是合理的?A、分區(qū)字段的字段類型并不影響表的查詢效率。B、分區(qū)字段的字段類型應(yīng)該優(yōu)先滿足業(yè)務(wù)需求C、分區(qū)字段的字段類型必須沒(méi)有業(yè)務(wù)性。D、分區(qū)字段使用String字段即可?!菊_答案】:D99.HBase中一張表通過(guò)指定Regionf的StartKey為10、20和30進(jìn)行region分裂,那么行鍵為222的數(shù)據(jù)將屬于以下哪一個(gè)Region?A、[10,20]B、[20,30]C、[30,"+inf']D、[0,10]【正確答案】:C100.以下關(guān)于數(shù)據(jù)倉(cāng)庫(kù)分層優(yōu)點(diǎn)的描述中,哪一個(gè)選項(xiàng)是錯(cuò)誤的?A、分層可將復(fù)雜問(wèn)題簡(jiǎn)單化B、分層之后真實(shí)數(shù)據(jù)與統(tǒng)計(jì)數(shù)據(jù)耦合在一起,減少了存儲(chǔ)空間消耗C、分層可以隔離原始數(shù)據(jù)D、分層可減少重復(fù)開(kāi)發(fā)【正確答案】:B1.以下哪些選項(xiàng)不屬于HDFS文件系統(tǒng)將文件分塊帶來(lái)的好處?A、數(shù)據(jù)備份比較麻煩B、簡(jiǎn)化系統(tǒng)設(shè)計(jì)C、存儲(chǔ)效率有所降低D、支持大規(guī)模文件存儲(chǔ)【正確答案】:AC2.以下哪些屬于大數(shù)據(jù)的發(fā)展趨勢(shì)?A、從技術(shù)驅(qū)動(dòng)轉(zhuǎn)變?yōu)樯虡I(yè)驅(qū)動(dòng)B、從統(tǒng)計(jì)分析到認(rèn)知計(jì)算C、生態(tài)合作開(kāi)放D、數(shù)據(jù)處理逐漸標(biāo)準(zhǔn)化、云化【正確答案】:ABCD3.以下關(guān)于Loader的描述中,正確的有哪幾項(xiàng)?A、提供可視化向?qū)降淖鳂I(yè)配置管理界面。B、提供定時(shí)調(diào)度任務(wù),周期性執(zhí)行Loader作業(yè)。C、在界面中可指定多種不同的數(shù)據(jù)源、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟、配置集群存儲(chǔ)系統(tǒng)。D、是基于開(kāi)源Flume研發(fā),做了大量?jī)?yōu)化和擴(kuò)展?!菊_答案】:ABC4.以下哪些場(chǎng)景適合使用實(shí)時(shí)檢索技術(shù)完成部署?A、銀行事后查詢交易憑證,追溯交易B、運(yùn)營(yíng)商實(shí)時(shí)查詢用戶話費(fèi)清單、流量清單C、公安系統(tǒng)實(shí)時(shí)布控,車輛軌跡繪制,快速信息匯集D、公安系統(tǒng)基于"人、事、地、物、組織、身份"等點(diǎn)狀實(shí)體,查詢?cè)谏鐣?huì)關(guān)系網(wǎng)絡(luò)中的關(guān)聯(lián)關(guān)系【正確答案】:ABCD5.所謂的大數(shù)據(jù)技術(shù)融合主要指哪些方面?A、計(jì)算融合B、數(shù)據(jù)融合C、算力融合D、批-流融合【正確答案】:ABCD6.關(guān)于MRSHDFS中的df和du命令,以下哪些說(shuō)法是正確的?A、du命令主要用于統(tǒng)計(jì)某個(gè)文件夾內(nèi)文件的大小信息B、du命令可以添加-v命令,方便用戶了解每個(gè)輸出值的含義C、df命令主要用于統(tǒng)計(jì)文件系統(tǒng)的可用空間信息D、df命令中可以添加-h參數(shù),使得輸出結(jié)果容易被用戶讀懂【正確答案】:ABCD7.關(guān)于Kafka組件部署規(guī)劃說(shuō)法以下哪些選項(xiàng)是錯(cuò)誤的?A、Kafka會(huì)將元數(shù)據(jù)信息存放到ZooKeeper上B、在創(chuàng)建Topic時(shí),副本數(shù)不得大于當(dāng)前存活的Broker實(shí)例個(gè)數(shù),否則創(chuàng)建Topic將會(huì)失敗C、Kafka的Producer發(fā)送消息時(shí)可以指定該消息被哪個(gè)Consumer消費(fèi)D、Kafka安裝完成后就不能再配置數(shù)據(jù)存放目錄了【正確答案】:CD8.關(guān)于ElasticSearch常見(jiàn)的API接口,以下描述中正確的有哪些項(xiàng)?A、SpringDataElasticsearch:第三方插件,與Spring生態(tài)集成度較高B、TransportClient:官方原生客戶端、,全部操作功能均支持,但內(nèi)部請(qǐng)求需要做Java序列化操作,導(dǎo)致項(xiàng)目可移值性較低C、JestClient:第三方插件,最早期的Rest第三方插件,社區(qū)和API都相對(duì)比較全面D、RestClient:官方新推API,屬于高級(jí)API,基于HttpRestful請(qǐng)求,可移值性更高,但功能不夠全面【正確答案】:ABCD9.關(guān)于使用HBase的JavaAPI讀取數(shù)據(jù),以下描述中正確的是哪些項(xiàng)?A、QualifierFilter用于過(guò)HBase表中的列族信息B、HBaseFilter主要在Scan和Get過(guò)程中進(jìn)行數(shù)據(jù)過(guò)濾,通過(guò)設(shè)置一些過(guò)濾條件來(lái)實(shí)現(xiàn)條件查詢C、要從表中讀取數(shù)據(jù),首先需要實(shí)例化該表對(duì)應(yīng)的Table實(shí)例D、為了提高查詢效率,使用Scan命令時(shí)最好指定StartRow和StopRow【正確答案】:ABCD10.實(shí)時(shí)檢索解決方案的項(xiàng)目流程包括以下哪些選項(xiàng)?A、應(yīng)用部署B(yǎng)、代碼工程C、項(xiàng)目環(huán)境準(zhǔn)備D、應(yīng)用開(kāi)發(fā)【正確答案】:ABCD11.Hive可以直接訪問(wèn)以下哪些組件?A、HDFSB、DockerC、TensorFlowD、HBase【正確答案】:AD12.HBase讀數(shù)據(jù)時(shí)需要讀取哪幾部分?jǐn)?shù)據(jù)?A、HfileB、MemStoreC、HDFSD、Hlog【正確答案】:AB13.Redis使用場(chǎng)景包含以下哪些特點(diǎn)?A、高性能B、豐富數(shù)據(jù)結(jié)構(gòu)存取C、支持持久化D、低時(shí)延【正確答案】:ABCD14.以下哪些選項(xiàng)是ZooKeeper在Kafka中的作用?A、索引數(shù)據(jù)的生成B、負(fù)載均衡CPU資源調(diào)配管理D、集群管理【正確答案】:ABD15.關(guān)于GESREST接口的描述,以下哪些選項(xiàng)是正確的?A、REST接口請(qǐng)求分為HEA,B、GET、PUT、POST、DELETEC、REST接口通過(guò)http協(xié)議進(jìn)行通信,必須等待所發(fā)請(qǐng)求的響應(yīng),之后才可以繼續(xù)發(fā)送請(qǐng)求D、GESAPI向上層應(yīng)用提供統(tǒng)一的訪問(wèn)入口,通過(guò)高度靈活的RESTAPI接口,封裝GES平臺(tái)的統(tǒng)一操作E、GESREST接口對(duì)于GES版本沒(méi)有任何要求【正確答案】:ABC16.關(guān)于ElasticSearch的基本理解,以下哪些選項(xiàng)是正確的?A、ElasticSearch的全文檢索條件可以包括詞或短語(yǔ)B、ElasticSearch可以支持非結(jié)構(gòu)化數(shù)據(jù)檢索C、ElasticSearch自身就可以提供數(shù)據(jù)可視化操作D、ElasticSearch可以支持?jǐn)?shù)據(jù)清洗和分詞【正確答案】:ABD17.以下關(guān)于Channel的描述中,錯(cuò)誤的是哪些項(xiàng)?A、Channel位于Source和Sink之間B、Channels不支持事務(wù)Channel的作用類似隊(duì)列D、Channels提供較強(qiáng)的順序保證【正確答案】:BD18.StructuredStreaming中OutPut的存儲(chǔ)方式包含以下哪幾種?A、UpdateModeB、ModifyModeCompleteModeD、AppendMode【正確答案】:ACD19.以下關(guān)于Filnk的窗口描述正確的是()。A、Flink窗口按窗口行為劃分:TumblingWindow-SlidingWindow.SessionWindow.B、窗口可以是時(shí)間驅(qū)動(dòng)的也可以是數(shù)據(jù)驅(qū)動(dòng)的。C、我們可以每30秒計(jì)算一次最近一分鐘用戶購(gòu)買的商品總數(shù),這個(gè)就是時(shí)間滑動(dòng)窗口的應(yīng)用方式。D、會(huì)話窗口是將數(shù)據(jù)聚合到會(huì)話窗口中,由非活躍的間隙分隔開(kāi)。【正確答案】:ABCD20.Hive支持以下哪些計(jì)算引擎?A、MapReduceB、LoaderC、TezD、Spark【正確答案】:ACD解析:
三.判斷21.Flink有哪些狀態(tài)存儲(chǔ)方式?A、MemoryStateBA,CkendB、FsStateBA,CkendC、MySqlStateBA,CkendD、RocksDBStateBA,Ckend【正確答案】:ABD22.下列是ElasticSearch搜索數(shù)據(jù)過(guò)程,請(qǐng)選擇正確的順序()A、協(xié)調(diào)節(jié)點(diǎn)將搜索請(qǐng)求轉(zhuǎn)發(fā)到所有的shard對(duì)應(yīng)的primaryshard或replicashardB、由協(xié)調(diào)節(jié)點(diǎn)根據(jù)docid去各個(gè)節(jié)點(diǎn)上拉去實(shí)際的document數(shù)據(jù)最終返回給客戶端C、每個(gè)shard將自己的搜索結(jié)果返回給協(xié)調(diào)節(jié)點(diǎn)D、客戶端發(fā)送請(qǐng)求到一個(gè)協(xié)調(diào)節(jié)E、協(xié)調(diào)節(jié)點(diǎn)進(jìn)行數(shù)據(jù)的合并,排序,分頁(yè)等操作,產(chǎn)出最終結(jié)果【正確答案】:ABCDE23.以下關(guān)于Kafka日志清理的描述,正確的是哪些項(xiàng)?()A、默認(rèn)情況下對(duì)字節(jié)大小無(wú)限制B、清理方式有兩種;delete和compA,CtC、默認(rèn)最長(zhǎng)的保存時(shí)間是168小時(shí)D、默認(rèn)的清理方式是delete【正確答案】:ABCD24.Spark中RDD是彈性數(shù)據(jù)集的原因包括以下哪些選項(xiàng)?A、基于Lineage的高效容錯(cuò)B、自動(dòng)進(jìn)行內(nèi)存和磁盤(pán)數(shù)據(jù)存儲(chǔ)的切換C、數(shù)據(jù)調(diào)度彈性D、Task失敗自動(dòng)重試【正確答案】:ABC25.針對(duì)以下場(chǎng)景描述,可以用于大數(shù)據(jù)實(shí)時(shí)檢索技術(shù)完成的有?A、主要根據(jù)ID(手機(jī)號(hào)碼)、時(shí)間段進(jìn)行用戶話費(fèi)清單、流量清單查詢B、可用于事后查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款等C、要求1秒內(nèi)響應(yīng),高并發(fā)(100以上請(qǐng)求)查詢條件簡(jiǎn)單(80%查詢是主鍵查詢,其他是簡(jiǎn)單條件組合查詢)D、根據(jù)ID(身份證,車牌號(hào)等)進(jìn)行查詢,可用于實(shí)時(shí)布控,車輛軌跡繪制,快速信息匯集【正確答案】:ABCD26.以下關(guān)于Spark流連接的描述中,正確的是哪些項(xiàng)?A、一個(gè)輸入流接收的任何行都可以與另一個(gè)來(lái)自未來(lái)的、尚未接收的輸入流中的任何行進(jìn)行匹配B、對(duì)于兩個(gè)輸入流,StructuredStreaming可以將過(guò)去的輸入流緩沖為流狀態(tài)C、支持將每個(gè)未來(lái)輸入流與過(guò)去的輸入流相匹配,從而生成連接結(jié)果D、Spark2.x支持流與流的連接【正確答案】:ABCD27.以下哪些選項(xiàng)是離線批處理的特點(diǎn)?A、多個(gè)作業(yè)調(diào)度復(fù)雜B、容易產(chǎn)生資源搶占C、處理數(shù)據(jù)量巨大,PB級(jí)D、處理時(shí)間要求高【正確答案】:ABC28.關(guān)于ElasticSearch的基本架構(gòu),以下描述中正確的有哪些項(xiàng)?A、ElasticSearch通過(guò)Discovery模塊來(lái)實(shí)現(xiàn)節(jié)點(diǎn)自動(dòng)發(fā)現(xiàn),以及Master節(jié)點(diǎn)選取B、ElasticSearch底層基于Lucence,將索引存儲(chǔ)在本地文件系統(tǒng)、共享文件系統(tǒng)或HDFS等文件系統(tǒng)中C、ElasticSearch支多種插件來(lái)擴(kuò)展加強(qiáng)功能D、ElasticSearch通過(guò)Java以及Restfulapi提供【正確答案】:ABCD29.Flume中的Source類型包含以下哪幾種?AvroSourceB、JmsSourceC、KafkaSourceD、ThriftSource【正確答案】:ABCD30.關(guān)于Hive的優(yōu)點(diǎn),以下哪些說(shuō)法是正確的?A、Hive支持多種編程語(yǔ)言,包括Java和Python都可對(duì)接Hive進(jìn)行使用B、Hive速度非常快,可以支特毫秒級(jí)時(shí)延的分析應(yīng)用C、理論上Hive依賴硬件程度較低,可適應(yīng)一般的普通機(jī)器D、Hive支持雙MetaStore機(jī)制,提高容錯(cuò)性【正確答案】:ACD31.Redis包含以下哪些數(shù)據(jù)類型?A、HashB、ListC、StringD、Set【正確答案】:ABCD32.大數(shù)據(jù)其中一個(gè)最明顯的特征是數(shù)據(jù)量巨大,那么所謂的數(shù)據(jù)量巨大主要指哪些級(jí)別的數(shù)據(jù)量?A、TBB、ZBC、PBD、MB【正確答案】:AC33.Hive組件的Driver由以下哪些項(xiàng)組成?A、MetaStoreB、CompilerC、ExecutorD、Optimizer【正確答案】:BCD34.以下哪些選項(xiàng)是華為云MRS使用HetuEngine的根本原因?A、企業(yè)傳統(tǒng)數(shù)倉(cāng),缺乏高效、統(tǒng)一的融合分析B、企業(yè)傳統(tǒng)數(shù)倉(cāng)采用分系統(tǒng)構(gòu)建模式,導(dǎo)致數(shù)據(jù)冗余嚴(yán)重,阻礙企業(yè)快速轉(zhuǎn)型C、隨著數(shù)據(jù)量增長(zhǎng),業(yè)務(wù)對(duì)數(shù)據(jù)分析靈活性要求越來(lái)越高D、HetuEngine對(duì)浪涌式的數(shù)據(jù)進(jìn)行整合分析,發(fā)揮最大價(jià)值【正確答案】:ABCD35.華為MRS服務(wù)具有以下哪些優(yōu)勢(shì)?A、高可用B、多場(chǎng)景融合C、存算分離D、彈性計(jì)算【正確答案】:ABCD36.關(guān)于GES的RESTful接口,以下描述中正確的有哪些選項(xiàng)?A、GESAPI向上層應(yīng)用提供統(tǒng)一的訪問(wèn)入口,通過(guò)高度靈活的RESTAPI接口,封裝GES平臺(tái)的統(tǒng)一操作B、用戶可以通過(guò)GES的REST接口創(chuàng)建edgeIA,BelC、GES的REST請(qǐng)求分為Select,Put,Create和DeleteD、用戶可以通過(guò)GES的REST接口查詢數(shù)據(jù)點(diǎn)的信息【正確答案】:ABD37.Hive業(yè)務(wù)場(chǎng)景中,一張大表連接一張較小的維表,那么為了提高這個(gè)JOIN操作的效率,可以進(jìn)行如下哪些操作?A、設(shè)置參數(shù)hive.auto.convert.join為trueB、設(shè)置參數(shù)hive.groupby.skewindata為trueC、大表在前小表在后D、小表在前大表在后【正確答案】:ABD38.HBase中會(huì)觸發(fā)Flush操作的有以下哪幾項(xiàng)?A、RegionMemStore中的總大小,達(dá)到了預(yù)設(shè)的FlushSize閾值。B、HBaseMemstore定期刷新,默認(rèn)周期為1小時(shí)。C、MemStoreRegionServer占用內(nèi)存的總量和總內(nèi)存比值超出了預(yù)設(shè)的閾值大小。D、當(dāng)WALs中文件數(shù)量達(dá)到閾值時(shí)?!菊_答案】:ABCD39.大數(shù)據(jù)的價(jià)值體現(xiàn)在以下哪些方面?A、大數(shù)據(jù)實(shí)現(xiàn)了精準(zhǔn)營(yíng)銷B、大數(shù)據(jù)助力智慧城市提升公共服務(wù)水平C、大數(shù)據(jù)給思維方式帶來(lái)了沖擊D、大數(shù)據(jù)為政策制定提供科學(xué)論據(jù)【正確答案】:ABD40.某個(gè)業(yè)務(wù)人員發(fā)現(xiàn)某個(gè)查詢的HiveSQL執(zhí)行時(shí)間比較長(zhǎng),分析發(fā)現(xiàn)該SQL在被分解成多個(gè)階段執(zhí)行,導(dǎo)致執(zhí)行時(shí)間過(guò)長(zhǎng)。那么該業(yè)務(wù)人員可以執(zhí)行如下哪些操作來(lái)優(yōu)化該SQL語(yǔ)句?A、增加服務(wù)器內(nèi)存,來(lái)增加該SQL的執(zhí)行內(nèi)存。B、將SQL語(yǔ)句逐條執(zhí)行。C、針對(duì)業(yè)務(wù)邏輯,提前進(jìn)行數(shù)據(jù)過(guò)濾,避免后續(xù)JOIN操作太繁瑣。D、通過(guò)參數(shù)hive.exec.parallel開(kāi)啟并行執(zhí)行,提高查詢效率【正確答案】:BD41.HBase存儲(chǔ)模型包含以下哪些選項(xiàng)?A、列族(ColumnFamily)B、行鍵(RowKey)C、數(shù)據(jù)塊編號(hào)(DataBlockIDD、時(shí)間戳(TimeStamp)【正確答案】:ABCD42.Redis的AOF持久化中,寫(xiě)命令同步的時(shí)機(jī)有以下哪幾項(xiàng)?A、appendfsynceverysecB、appendfsyncnoneC、appendfsyncalwaysD、appendfsyncno【正確答案】:ACD43.關(guān)于SparkRDD的說(shuō)法中,以下哪些選項(xiàng)是正確的?A、RDD基于Lineage血統(tǒng)機(jī)制的高效容錯(cuò)(第n個(gè)節(jié)點(diǎn)出錯(cuò),可從第n-1個(gè)節(jié)點(diǎn)恢復(fù))B、RDD默認(rèn)存儲(chǔ)于磁盤(pán)上,如果磁盤(pán)空間不夠,會(huì)由磁盤(pán)刷寫(xiě)至內(nèi)存中C、計(jì)算流程中會(huì)劃分Stage,Stage如果失敗會(huì)進(jìn)行特定次數(shù)的重試,重試時(shí)只計(jì)算失敗的數(shù)據(jù)分片D、RDD是只讀和可分區(qū)的;要想對(duì)RDD進(jìn)行操作,只能重新生成一個(gè)新的RDD【正確答案】:ACD44.HDFS結(jié)構(gòu)中包含以下哪些組件?A、NameNodeB、SourceC、DataNodeD、Sink【正確答案】:AC45.以下關(guān)于AppendMode的描述中,正確的是哪些項(xiàng)?A、只適用于結(jié)果集中已經(jīng)存在的內(nèi)容不希望發(fā)生改變的情況B、當(dāng)時(shí)間間隔觸發(fā)時(shí),只有在ResultTable中新增加的數(shù)據(jù)行會(huì)被寫(xiě)入到外部存儲(chǔ)C、如果已經(jīng)存在的數(shù)據(jù)會(huì)被更新,推薦使用此方式D、如果已經(jīng)存在的數(shù)據(jù)會(huì)被更新,不適合適用此方式【正確答案】:ABD46.以下哪些選項(xiàng)可以提供文檔數(shù)據(jù)檢索服務(wù)?A、HDFSB、MapReduceC、ElasticSearchD、Lucene【正確答案】:CD47.實(shí)時(shí)流處理的步驟包含以下哪些選項(xiàng)?A、實(shí)時(shí)計(jì)算B、實(shí)時(shí)落地C、緩存隊(duì)列D、數(shù)據(jù)實(shí)時(shí)采集【正確答案】:ABCD48.以下關(guān)于有界流的描述,哪些項(xiàng)是正確的?A、有界流處理通常被稱為批處理B、有定義流的開(kāi)始,也有定義流的結(jié)束C、有界流可以在讀取所有數(shù)據(jù)后再進(jìn)行計(jì)算D、有界流所有數(shù)據(jù)可以被排序,所以并不需要有序攝取【正確答案】:ABCD49.以下哪些選項(xiàng)為當(dāng)前大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的特點(diǎn)?A、規(guī)模較大B、增速緩慢C、增速很快D、規(guī)模較小【正確答案】:AC50.以下哪些數(shù)據(jù)庫(kù)的引擎適合做數(shù)據(jù)倉(cāng)庫(kù)?A、ExadataB、OracleC、RedisD、TeraData【正確答案】:ABD51.以下關(guān)于事件時(shí)間的描述,正確的是哪些項(xiàng)?A、事件時(shí)間在事件進(jìn)入flink之前已經(jīng)嵌入事件,flink可以提取該時(shí)間B、事件時(shí)間是指事件在其設(shè)備上發(fā)生的時(shí)間C、基于事件時(shí)間進(jìn)行處理的流程序可以保證事件在處理的時(shí)候的順序性D、基于事件時(shí)間的處理往往有一定的滯后性【正確答案】:ABCD52.大數(shù)據(jù)技術(shù)在我們身邊應(yīng)用的越來(lái)越廣,以下場(chǎng)景中有哪些場(chǎng)景可以應(yīng)用大數(shù)據(jù)技術(shù)?A、廣告精準(zhǔn)營(yíng)銷B、游戲畫(huà)面實(shí)時(shí)刷新C、人物畫(huà)像D、道路智能規(guī)劃【正確答案】:ACD53.Flink提供的窗口分配器,包含以下哪些項(xiàng)?A、全局窗口B、滾動(dòng)窗口C、滑動(dòng)窗口D、會(huì)話窗口【正確答案】:ABCD54.請(qǐng)按順序匹配HBase客戶端寫(xiě)入數(shù)據(jù)的正確流程()A、寫(xiě)入磁盤(pán)上形成StoreFileB、定位HRegionServerC、寫(xiě)入數(shù)據(jù)到HLog中D、寫(xiě)入數(shù)據(jù)到MemStore中【正確答案】:ABCD55.相較于大數(shù)據(jù)組件,傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)存在以下哪些劣勢(shì)?A、I/O存在瓶頸B、大規(guī)模數(shù)據(jù)實(shí)時(shí)性差C、拓展能力差D、架構(gòu)單一【正確答案】:ABCD56.FIink計(jì)算時(shí)間不包含以下哪幾種時(shí)間語(yǔ)義?A、StartTime(開(kāi)始時(shí))B、EventTime(件)C、ProcessingTime(處理時(shí))DelayTime(延遲時(shí)間)【正確答案】:AD57.數(shù)據(jù)分析平臺(tái)云化和融合發(fā)展具有以下哪些特點(diǎn)?A、資源彈性分配B、超敏捷應(yīng)用C、交叉融合分析D、多場(chǎng)景分析【正確答案】:ABCD58.Redis中Key的expire生存時(shí)間不適合以下哪些場(chǎng)景?A、存儲(chǔ)特定用戶所有歷史信息B、限時(shí)優(yōu)惠活動(dòng)C、限制網(wǎng)站訪客訪問(wèn)頻率D、電商網(wǎng)站過(guò)去一年?duì)I銷總額統(tǒng)計(jì)【正確答案】:AD59.實(shí)時(shí)檢索的公安和金融行業(yè)應(yīng)用場(chǎng)景有哪些特征?A、高并發(fā)B、存在海量小文件C、查詢速度快D、查詢條件簡(jiǎn)單【正確答案】:ABCD60.StructuredStreaming可以把結(jié)果寫(xiě)入外部的存儲(chǔ)系統(tǒng),下列哪些選項(xiàng)是屬于外部存儲(chǔ)系統(tǒng)的存儲(chǔ)方式?A、CompleteModeB、AppendModeC、UpdateModeD、OutPutMode【正確答案】:ABC61.以下哪些選項(xiàng)不是GES圖數(shù)據(jù)庫(kù)的典型應(yīng)用場(chǎng)景?A、氣象局根據(jù)過(guò)去48小時(shí)的氣象數(shù)據(jù),預(yù)測(cè)明天的降雨概率B、某社交軟件根據(jù)用戶的好友信息推薦潛在好友C、某運(yùn)營(yíng)商通過(guò)通話記錄來(lái)標(biāo)記用戶社交圈D、某商店根據(jù)過(guò)去十年的銷售記錄預(yù)測(cè)明年的大致銷量【正確答案】:AD62.Flink的應(yīng)用場(chǎng)景,包含以下哪些項(xiàng)?A、基于規(guī)則的警報(bào)參考答案)B、業(yè)務(wù)流程管理C、異常檢測(cè)D、欺詐識(shí)別【正確答案】:ABCD63.HBase讀數(shù)據(jù)過(guò)程,需要讀取哪幾部分?jǐn)?shù)據(jù)?A、HFileB、MemStoreC、HMasterD、HLog【正確答案】:AB64.以下關(guān)于Redis使用場(chǎng)景特點(diǎn)的描述,正確的是哪些項(xiàng)?A、數(shù)據(jù)類型豐富B、支持持久化C、高性能D、低時(shí)延【正確答案】:ABCD65.以下關(guān)于處理時(shí)間的描述,正確的是哪些項(xiàng)?A、處理時(shí)間不需要流和機(jī)器之間的協(xié)調(diào)B、處理時(shí)間是指每臺(tái)機(jī)器的系統(tǒng)時(shí)間C、處理時(shí)間能提供最好的性能和最低延遲D、處理時(shí)間不能提供消息事件的時(shí)序性保證【正確答案】:ABCD66.以下哪些選項(xiàng)是Loader組件的特點(diǎn)?()A、圖形化B、高性能C、高可靠D、安全【正確答案】:ABCD67.關(guān)于華為云MRS提供的Loader服務(wù),以下描述正確的有哪些選項(xiàng)?A、在華為云MRS平臺(tái)中,Loader提供定時(shí)調(diào)度任務(wù),可周期性執(zhí)行導(dǎo)入/導(dǎo)出作業(yè)B、在MRS大數(shù)據(jù)平臺(tái)中,Loader需與Flink強(qiáng)綁定C、Loader基于開(kāi)源Sqoop研發(fā),做了大量?jī)?yōu)化和擴(kuò)展D、Loader底層通過(guò)MapReduce去實(shí)現(xiàn)批量數(shù)據(jù)的導(dǎo)入/導(dǎo)出及數(shù)據(jù)轉(zhuǎn)化工作【正確答案】:ACD68.關(guān)于GES的GremlinJavaAPI操作,以下描述正確的有哪些項(xiàng)?A、客戶端可以和一個(gè)或多個(gè)Gremlinserver實(shí)例建立鏈接,基于Cluster對(duì)象創(chuàng)建ClientB、JavaAPI僅支持同步提交任務(wù),不支持異步提交任務(wù)C、可以調(diào)用JavaAPI創(chuàng)建Iterator對(duì)象,對(duì)邊和點(diǎn)進(jìn)行遍歷D、GES無(wú)法通過(guò)JavaAPI刪除一張圖【正確答案】:AC69.有關(guān)華為實(shí)時(shí)檢索解決方案,以下描述中正確的有哪幾項(xiàng)?A、數(shù)據(jù)采集:文件數(shù)據(jù)通過(guò)批量加載寫(xiě)入數(shù)據(jù);流式數(shù)據(jù)通過(guò)實(shí)時(shí)加載寫(xiě)入數(shù)據(jù),圖數(shù)據(jù)可以使用華為GES的工具導(dǎo)入數(shù)據(jù)B、數(shù)據(jù)源:數(shù)據(jù)源的種類包括文件數(shù)據(jù)和流式數(shù)據(jù)等C、實(shí)時(shí)檢索引擎:適合快速檢索,也就是根據(jù)指定條件查詢結(jié)果,不適用于統(tǒng)計(jì)和復(fù)雜查詢D、GES:基于Hadoop生態(tài)的圖數(shù)據(jù)庫(kù),即存放圖片的數(shù)據(jù)庫(kù)【正確答案】:ABC70.以下關(guān)于KafkaPartition說(shuō)法正確的有哪幾項(xiàng)?A、每個(gè)Partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)log文件。B、每個(gè)Partition都是有序且不可變的消息隊(duì)列。C、Partition數(shù)量決定了每個(gè)Consumergroup中并發(fā)消費(fèi)者的最大數(shù)量。D、引入Partition機(jī)制,保證了Kafka的高吞吐能力?!菊_答案】:ABCD71.以下哪些項(xiàng)可能是鍵值的返回值類型?A、StringB、zsetC、listD、set【正確答案】:ABCD72.以下關(guān)于SqoopImport原理的描述中,哪些選項(xiàng)是正確的?A、Sqoop將任務(wù)劃分到每個(gè)map中,再處理數(shù)據(jù)庫(kù)中獲取的一行一行的值,寫(xiě)入到HDFS中B、Sqoop需要用到Spark或Flink才能完成數(shù)據(jù)的ImportC、split-by根據(jù)不同的參數(shù)類型有不同的切分方法,如比較簡(jiǎn)單的int型,Sqoop會(huì)取最大和最小split-by字段值,然后根據(jù)傳入的num-mappers來(lái)確定劃分幾個(gè)區(qū)域D、Sqoop在import時(shí),需要指定split-by參數(shù)。Sgoop根據(jù)不同的split-by參數(shù)值來(lái)進(jìn)行切分,然后將切分出來(lái)的區(qū)域分配到不同map中【正確答案】:ACD73.Flume傳輸數(shù)據(jù)過(guò)程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪幾種Channel類型?A、FileChannelB、MemoryChannelC、HDFSChannelD、JDBCChannel【正確答案】:AD74.數(shù)據(jù)倉(cāng)庫(kù)分層包括以下哪些選項(xiàng)?A、DWD層B、DWS層C、ADS層D、ODS層【正確答案】:ABCD75.ElasticSearch的定位包含以下哪些方法?A、文檔檢素B、實(shí)時(shí)搜索C、主鍵查詢D、非主鍵查詢【正確答案】:ABCD76.由GESREST接口可以實(shí)現(xiàn)以下哪些操作?A、創(chuàng)建圖B、刪除圖C、創(chuàng)建edgelA,BelD、創(chuàng)建vertexIA,Bel【正確答案】:ABCD77.Loader具有對(duì)以下哪些數(shù)據(jù)源的讀取能力?A、HBaseB、HDFSC、HiveD、RDB【正確答案】:ABCD78.以下哪些選項(xiàng)不是Flink資源調(diào)度的方式?A、FlinkStandaloneB、FlinkOnZooKeeperC、FlinkOnDocker(參考答案)D、FlinkOnMesos【正確答案】:ABC79.關(guān)于Hive導(dǎo)入數(shù)據(jù)的命令,以下哪些選項(xiàng)是正確的?A、loA,Ddatainpath可用于將HDFS上的數(shù)據(jù)導(dǎo)入Hive表中B、導(dǎo)入數(shù)據(jù)時(shí)必須指定導(dǎo)入哪張表格,也就是需要使用intotable關(guān)鍵詞+表名C、可以使用Local關(guān)鍵詞從本地文件系統(tǒng)導(dǎo)入數(shù)據(jù)至Hive,但是這里的Local指的是hiveserver服務(wù)所在的機(jī)器,而不是beeline客戶端所在的機(jī)器D、如果原先表中有數(shù)據(jù),想用新數(shù)據(jù)覆蓋舊數(shù)據(jù),可以添加overwrite參數(shù)進(jìn)行覆蓋【正確答案】:ABCD80.以下關(guān)于Source的描述中,正確的是哪些項(xiàng)?A、execsource執(zhí)行某個(gè)命令或者腳本,并將其執(zhí)行結(jié)果的輸出作為數(shù)據(jù)源B、httpsource支持http的post發(fā)送數(shù)據(jù)C、spoolingdirectorysource采集本地靜態(tài)文件D、Source有驅(qū)動(dòng)和輪詢兩種類型【正確答案】:ABCD81.以下哪些選項(xiàng)是Hive數(shù)據(jù)倉(cāng)庫(kù)分層的優(yōu)點(diǎn)?A、隔離原始數(shù)據(jù)B、復(fù)雜問(wèn)題簡(jiǎn)單化C、減少重復(fù)開(kāi)發(fā)D、清晰數(shù)據(jù)結(jié)構(gòu)【正確答案】:ABCD82.以下哪幾項(xiàng)是屬于ElasticSearch的查詢類型?A、基于全文檢索B、基于分值數(shù)檢索C、基于元數(shù)據(jù)檢索D、基于詞條檢索【正確答案】:ABCD83.ElasticSearch用于日志搜索和分析,離不開(kāi)其擁有的生態(tài)圈系統(tǒng)和解決方案,這些開(kāi)源軟件之間互相配合使用,完美銜接,高效地滿足了多場(chǎng)景的應(yīng)用。那么其生態(tài)系統(tǒng)具體包括以下哪些內(nèi)容?A、數(shù)據(jù)持久化與分析層ElasticsearchB、數(shù)據(jù)接入層LogstashC、用戶接入層KibanaD、插件擴(kuò)展層【正確答案】:ABCD84.以下關(guān)于無(wú)界流的描述,哪些項(xiàng)是正確的?A、處理無(wú)界數(shù)據(jù)通常要求以特定順序攝取事件B、無(wú)界流的數(shù)據(jù)必須持續(xù)處理,即數(shù)據(jù)被讀取后需要立刻處理C、有定義流的開(kāi)始,但沒(méi)有定義流的結(jié)束D、數(shù)據(jù)源會(huì)無(wú)休止地產(chǎn)生數(shù)據(jù)【正確答案】:ABCD85.下面選項(xiàng)哪些是HBase數(shù)據(jù)查詢過(guò)濾器Filter的比較器?A、BinaryComparatorB、SubStringComparatorC、BinaryPrefixComparatorD、RegexStringComparator【正確答案】:ABCD86.以下哪些選項(xiàng)屬于Elasticsearch內(nèi)部架構(gòu)的一部分?A、DistributeLuceneDirectoryB、SearchModuleC、DisoveryModuleD、IndexModule【正確答案】:ABCD87.關(guān)于GES服務(wù)的常見(jiàn)基本概念,以下哪些選項(xiàng)是正確的?A、GES不存在無(wú)向邊B、在GES中,點(diǎn)的屬性(Property)表示了該頂點(diǎn)的附加信息,采用Keyvalue:結(jié)構(gòu)進(jìn)行保存C、個(gè)人的姓名、年齡、身份證、愛(ài)好等信息可以用VertexLA,Bel來(lái)表示D、"認(rèn)識(shí)/朋友關(guān)系"在圖中可以用邊來(lái)表示【正確答案】:ABCD88.華為企業(yè)云數(shù)據(jù)湖具有以下哪些優(yōu)勢(shì)?A、開(kāi)放接口,支持開(kāi)放實(shí)時(shí)標(biāo)準(zhǔn),構(gòu)建豐富生態(tài),自助式數(shù)據(jù)開(kāi)發(fā)與分析B、存儲(chǔ)和計(jì)算分離,支持更多用戶并發(fā)和更大數(shù)據(jù)量C、更多數(shù)據(jù)通過(guò)實(shí)時(shí)、虛擬方式入湖,數(shù)據(jù)產(chǎn)生即可見(jiàn)、可用D、數(shù)據(jù)集中,開(kāi)放共享、統(tǒng)一目錄管理,避免跨系統(tǒng)數(shù)據(jù)搬遷【正確答案】:ABCD89.關(guān)于HBaseRegion分裂的描述中,以下哪些選項(xiàng)是正確的?A、Region拆分操作需要消耗大量時(shí)間B、拆分過(guò)程中的Region是不可讀的C、直到分裂過(guò)程結(jié)束,把存儲(chǔ)文件異步地寫(xiě)到獨(dú)立的文件之后,才會(huì)讀取新文件D、在RegionSplit時(shí),拆分之后的Regioni讀取的仍然是原存儲(chǔ)文件【正確答案】:BC90.關(guān)于HBase架構(gòu),以下描述中正確的有哪些項(xiàng)?A、HBase支持部署多臺(tái)HMaster,但通常只有一臺(tái)A,CtiveHMasterB、HBase的主節(jié)點(diǎn)叫做HMasterC、每一次觸發(fā)Flush操作,HBase都會(huì)生成一個(gè)新的HRegionServerD、HRegionServer之間的負(fù)載均衡需要HMaster來(lái)協(xié)調(diào)管理【正確答案】:ABD91.以下哪些選項(xiàng)是網(wǎng)站日志的特點(diǎn)?A、價(jià)值密度低B、數(shù)據(jù)的業(yè)務(wù)種類多C、數(shù)據(jù)結(jié)構(gòu)復(fù)雜D、數(shù)據(jù)量大【正確答案】:ABCD92.以下哪些選項(xiàng)可以在華為云GES服務(wù)中實(shí)現(xiàn)?A、根據(jù)用戶的用戶畫(huà)像,為用戶推薦最合適的電影(推薦系統(tǒng))B、查詢兩個(gè)用戶Reed和Caspar的最短路徑(計(jì)算最短路徑)C、調(diào)用PageRank算法,查間圖中最關(guān)鍵的數(shù)據(jù)點(diǎn)(PageRank算法)D、查詢Hillary用戶的朋友的朋友的朋友(多級(jí)關(guān)系查詢)【正確答案】:ABCD93.以下哪些選項(xiàng)屬于HBase基本架構(gòu)的一部分?A、HMasterB、DataBlockC、RDDD、Store【正確答案】:AD94.關(guān)于HBase性能優(yōu)化,以下描述中正確的有哪些選項(xiàng)?A、在使用HBaseJavaAPI時(shí),可以通過(guò)調(diào)用Table實(shí)例的get(List)批量讀取多行記錄,只需一次網(wǎng)絡(luò)1/O開(kāi)銷,可以明顯的提升讀性能B、一張表里不要定義太多的列簇,因?yàn)槟硞€(gè)列簇在flush的時(shí)候,它鄰近的列簇也會(huì)因關(guān)聯(lián)效應(yīng)被觸發(fā)flush,最終導(dǎo)致系統(tǒng)產(chǎn)生更多的I/OC、在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)Region,當(dāng)數(shù)據(jù)寫(xiě)入HBase時(shí),會(huì)按照RowKey對(duì)應(yīng)Region分區(qū)情況,在集群內(nèi)做數(shù)據(jù)的負(fù)載均衡D、在使用HBaseJavaAPI時(shí),可以通過(guò)調(diào)用Table實(shí)例的put(List)批量寫(xiě)入多行記錄,只需一次網(wǎng)絡(luò)l/O開(kāi)銷,可以明顯的提升寫(xiě)性能【正確答案】:ABCD95.在離線批處理的實(shí)驗(yàn)中,網(wǎng)站產(chǎn)生的日志包含如下哪些特點(diǎn)?A、數(shù)據(jù)量大B、價(jià)值密度高C、數(shù)據(jù)的業(yè)務(wù)種類多D、處理邏輯簡(jiǎn)單【正確答案】:AC96.關(guān)于HBase的數(shù)據(jù)模型,以下哪些選項(xiàng)是正確的?A、表是由行和列構(gòu)成的,所有的列是從屬于某一個(gè)列族的B、所有的表都必須要有主鍵-keyC、應(yīng)用程序是以表的方式在HBase存儲(chǔ)數(shù)據(jù)的參考答案)D、HBase的表是按key排序的,排序方式是針對(duì)字節(jié)的【正確答案】:ABCD97.Hive架構(gòu)中Driver包含以下哪些組件?A、ExecutorB、ChannelC、OptimizerD、Compiler【正確答案】:ACD98.關(guān)于Hive架構(gòu)中的Driver,以下哪些選項(xiàng)是正確的?A、Driver中的Compiler子模塊負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)B、Driver負(fù)責(zé)管理HiveQL執(zhí)行的生命周期,只對(duì)內(nèi)部表有效,外部表的處理流程不由Driver管理C、Driver中的Optimizer可分為邏輯優(yōu)化器和物理優(yōu)化器,分別對(duì)HiveQL生成的執(zhí)行計(jì)劃和MapReduce任務(wù)進(jìn)行優(yōu)化Driver中的Executor按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)【正確答案】:ACD99.以下關(guān)于微批處理模型的描述,正確的是哪些項(xiàng)?A、在下一個(gè)微批處理之前,要將數(shù)據(jù)的偏移范圍保存在日志中B、當(dāng)前到達(dá)的數(shù)據(jù)需要在上一批次處理完,才能下一個(gè)批次數(shù)據(jù)繼續(xù)處理C、會(huì)有一定的延遲D、流計(jì)算引警在處理上一批次數(shù)據(jù)結(jié)束后,再對(duì)新數(shù)據(jù)進(jìn)行批量查詢【正確答案】:ABCD100.某大數(shù)據(jù)業(yè)務(wù)人員在不小心刪除了HDFS某個(gè)文件后,想通過(guò)回收站機(jī)制恢復(fù)數(shù)據(jù),但是在對(duì)應(yīng)的回收站目錄/user/root/.Trash中為什么找不到要恢復(fù)的數(shù)據(jù)?A、回收站中的數(shù)據(jù)超過(guò)了保留的期限,被系統(tǒng)刪除了。B、回收站機(jī)制并沒(méi)有開(kāi)啟,導(dǎo)致沒(méi)有及時(shí)回收C、回收站通過(guò)回收間隔,對(duì)數(shù)據(jù)進(jìn)行了整理,需要進(jìn)入到指定時(shí)間間隔下才能找到D、查找的目錄可能出現(xiàn)了問(wèn)題,需要核實(shí)刪除操作的用戶。【正確答案】:AB1.GES技術(shù)架構(gòu)包含了接口層、計(jì)算層和存儲(chǔ)層。A、正確B、錯(cuò)誤【正確答案】:A2.Spark是基于內(nèi)存的分布式批處理系統(tǒng),與磁盤(pán)沒(méi)有關(guān)系,因此在安裝Spark時(shí),不需要安裝HDFS。A、正確B、錯(cuò)誤【正確答案】:B3.Flink處理數(shù)據(jù)是無(wú)狀態(tài)的,處理一個(gè)事件與之前的事件無(wú)關(guān)。A、正確B、錯(cuò)誤【正確答案】:B4.Kafka中的Broker具有消息接收和消息分發(fā)的能力。A、正確B、錯(cuò)誤【正確答案】:B5.MapReduce專注于離線計(jì)算,通常時(shí)間是幾十分鐘甚至更長(zhǎng)時(shí)間。由于實(shí)時(shí)計(jì)算的需求流式計(jì)算引擎開(kāi)始出現(xiàn),包括Storm、Flink、SparkStreaming。A、正確B、錯(cuò)誤【正確答案】:A6.Spark執(zhí)行效率高的一個(gè)關(guān)鍵因素是在處理數(shù)據(jù)時(shí)產(chǎn)生的中間產(chǎn)物(計(jì)算結(jié)果)存放在內(nèi)存中,減少了對(duì)磁盤(pán)的I/O操作。A、正確B、錯(cuò)誤【正確答案】:A7.ElasticSearchi能夠支持文檔檢索。A、正確B、錯(cuò)誤【正確答案】:A8.數(shù)據(jù)倉(cāng)庫(kù)僅僅提供存儲(chǔ)功能,以及面向數(shù)據(jù)管理的服務(wù)。A、正確B、錯(cuò)誤【正確答案】:A9.作為企業(yè)級(jí)大數(shù)據(jù)平臺(tái),F(xiàn)usionInsight具備四大能力包括一站式平臺(tái)、永遠(yuǎn)在線、易用成本低以及可持續(xù)演進(jìn)。A、正確B、錯(cuò)誤【正確答案】:A10.實(shí)時(shí)布控場(chǎng)景中,數(shù)據(jù)實(shí)時(shí)采集可以通過(guò)警務(wù)數(shù)據(jù)共享交換平臺(tái)與邊界平臺(tái),實(shí)時(shí)獲取出行住宿通訊視頻數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:A11.Loader是實(shí)現(xiàn)MRS與關(guān)系型數(shù)據(jù)庫(kù)、文件系統(tǒng)之間交換數(shù)據(jù)和文件的數(shù)據(jù)加載工具。(AA、正確B、錯(cuò)誤【正確答案】:B12.HBase類似于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù),可以輕易滿足海量數(shù)據(jù)的全局ACID特性。A、正確B、錯(cuò)誤【正確答案】:B13.為了減少磁盤(pán)寫(xiě)入的次數(shù),Broker會(huì)將消息暫時(shí)buffer起來(lái),當(dāng)消息的個(gè)數(shù)達(dá)到一定閥值時(shí),再flush到磁盤(pán),這樣減少了磁盤(pán)調(diào)用的次數(shù)。A、正確B、錯(cuò)誤【正確答案】:A14.Sqoop是一款開(kāi)源的工具,主要用于在Hadoop與傳統(tǒng)的數(shù)據(jù)庫(kù)間進(jìn)行數(shù)據(jù)的傳遞,例如可以將一個(gè)關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)導(dǎo)入到Hadoop的HDFS中,也可以將HDFS的數(shù)據(jù)導(dǎo)入到關(guān)系型數(shù)據(jù)庫(kù)中。A、正確B、錯(cuò)誤【正確答案】:A15.大數(shù)據(jù)指其大小超出典型數(shù)據(jù)軟件的采集、存儲(chǔ)、管理和分析等能力的數(shù)據(jù)集,一般范圍是從幾個(gè)TB到幾個(gè)PB。A、正確B、錯(cuò)誤【正確答案】:A16.每個(gè)KafkaTopic由一個(gè)或多個(gè)consumergroup組成,屬于同一個(gè)consumergroup的consumer都具有相同的groupID。A、正確B、錯(cuò)誤【正確答案】:B17.MRS的Flink不支Kerberos持等進(jìn)行認(rèn)證,但支持SSL加密傳輸。A、正確B、錯(cuò)誤【正確答案】:B18.Source必須至少和一個(gè)channel關(guān)聯(lián)。A、正確B、錯(cuò)誤【正確答案】:A19.大數(shù)據(jù)技術(shù)的解決方案思路是聚焦在單臺(tái)機(jī)器上,思考如何提升單機(jī)的性能,尋找更貴更好的服務(wù)器。A、正確B、錯(cuò)誤【正確答案】:B20.ElasticSearch倒排索引是通過(guò)關(guān)鍵詞查詢對(duì)應(yīng)的文檔編號(hào),再通過(guò)文檔編號(hào)找文檔。A、正確B、錯(cuò)誤【正確答案】:A21.BloomFilter可以被用來(lái)快速的判斷一條數(shù)據(jù)在一個(gè)大的數(shù)據(jù)集合中是否存在。A、正確B、錯(cuò)誤【正確答案】:A22.GES基于MySQL的分布式存儲(chǔ)機(jī)制,能夠處理海量數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:B23.通過(guò)SparkSession提交SQL語(yǔ)句時(shí),任務(wù)會(huì)像普通Spark應(yīng)用一樣被提交到集群中分布式運(yùn)行。A、正確B、錯(cuò)誤【正確答案】:A24.Kafka中每個(gè)Topic都由一個(gè)或者多個(gè)Partition構(gòu)成,Partition數(shù)量決定了每個(gè)Consumergroup中實(shí)際工作的并發(fā)消費(fèi)者的最大數(shù)量。A、正確B、錯(cuò)誤【正確答案】:A25.StructuredStreaming包括兩個(gè)處理模型,微批處理模型和持續(xù)處理模型。A、正確B、錯(cuò)誤【正確答案】:A26.對(duì)于數(shù)據(jù)集市和數(shù)據(jù)倉(cāng)庫(kù)而言,面向最終用戶或應(yīng)用的是數(shù)據(jù)集市,面向數(shù)據(jù)管理的是數(shù)據(jù)倉(cāng)庫(kù)。A、正確B、錯(cuò)誤【正確答案】:A27.HBase本身并沒(méi)有SQL語(yǔ)句的接口,需依賴其他組件,例如ApachePhoenix,將SQL查詢編譯為一系列HBase掃描。A、正確B、錯(cuò)誤【正確答案】:A28.數(shù)智融合是當(dāng)前大數(shù)據(jù)領(lǐng)域最受關(guān)注的趨勢(shì)之一,主要體現(xiàn)在大數(shù)據(jù)平臺(tái)的數(shù)據(jù)分析智能化以及數(shù)據(jù)治理的智能化。A、正確B、錯(cuò)誤【正確答案】:A29.Hive中的左半開(kāi)連接(LEFTSEMIJOIN)比通常的內(nèi)連接(INNERJOIN)要更高效,因?yàn)閷?duì)于左表中一條指定的記錄,在右邊表中一旦找到匹配的記錄,Hive就會(huì)立即停止掃描。即遇到右表重復(fù)記錄,左表會(huì)跳過(guò),而INNERJOIN則會(huì)一直遍歷。A、正確B、錯(cuò)誤【正確答案】:A30.在HDFS里,刪除文件時(shí),不會(huì)真正的刪除,其實(shí)是放入回收站,回收站里的文件可以用來(lái)快速恢復(fù)誤刪文件。A、正確B、錯(cuò)誤【正確答案】:A31.在Hive的SQL語(yǔ)句執(zhí)行中,因?yàn)間roupby等關(guān)鍵字的使用會(huì)導(dǎo)致數(shù)據(jù)傾斜。因此為了表面數(shù)據(jù)傾斜,應(yīng)禁止該類操作執(zhí)行。A、正確B、錯(cuò)誤【正確答案】:B32.HBase依賴于Zookeeper完成主備選舉,以及管理root表。A、正確B、錯(cuò)誤【正確答案】:A33.StructuredStreaming持續(xù)處理模型可以實(shí)現(xiàn)毫秒級(jí)延遲。A、正確B、錯(cuò)誤【正確答案】:A34.Hive中MetaStore是用于存儲(chǔ)表、列和Partition等元數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:A35.云上數(shù)據(jù)分析以敏捷無(wú)縫的部署和管理體驗(yàn)從技術(shù)、組織和人員等多維度提速企業(yè)數(shù)字化轉(zhuǎn)型。A、正確B、錯(cuò)誤【正確答案】:A36.華為云FusionInsight支持資源池隔離、獨(dú)占、親和性等調(diào)度策略,可以很好的解決任務(wù)之間資源搶占問(wèn)題,提供對(duì)任務(wù)的優(yōu)先級(jí)保障,為重點(diǎn)任務(wù)預(yù)留資源,保障穩(wěn)定運(yùn)行,這樣可以解決過(guò)去企業(yè)靠人工保障任務(wù)優(yōu)先級(jí)的問(wèn)題,節(jié)省人力成本。A、正確B、錯(cuò)誤【正確答案】:A37.ElasticSearch:緩存主要分三種:RocksDBCache、FileDBCache、StateBackEndCache。A、正確B、錯(cuò)誤【正確答案】:B38.flushall可以清空Redis實(shí)例下所有數(shù)據(jù)庫(kù)的數(shù)據(jù)。A、正確B、錯(cuò)誤【正確答案】:A39.Hive創(chuàng)建表時(shí)如果不指定數(shù)據(jù)庫(kù),則默認(rèn)為default數(shù)據(jù)庫(kù)。A、正確B、錯(cuò)誤【正確答案】:A40.Spark和MapReduce一樣不適用于迭代計(jì)算。A、正確B、錯(cuò)誤【正確答案】:B41.Consumeri通過(guò)Pull的方式從Broker獲取數(shù)據(jù)消費(fèi)。A、正確B、錯(cuò)誤【正確答案】:A解析:
四.填空42.向HBase插入數(shù)據(jù),只可使用put一種方法。A、正確B、錯(cuò)誤【正確答案】:B43.Hive數(shù)據(jù)存儲(chǔ)模型中分區(qū)對(duì)應(yīng)著表所在路徑的一個(gè)文件。A、正確B、錯(cuò)誤【正確答案】:B44.實(shí)時(shí)檢索技術(shù)通常需要處理復(fù)雜的統(tǒng)計(jì)類分析和查詢,因此比較適合使用Hive進(jìn)行分析判斷A、正確B、錯(cuò)誤【正確答案】:B45.Redis是個(gè)高性能key-value內(nèi)存數(shù)據(jù)庫(kù)。A、正確B、錯(cuò)誤【正確答案】:A46.實(shí)時(shí)流處理要求秒級(jí)或者毫秒級(jí)時(shí)延A、正確B、錯(cuò)誤【正確答案】:A47.離線分析平臺(tái)主要進(jìn)行數(shù)據(jù)處理和加工,將原始數(shù)據(jù)加工成明細(xì)數(shù)據(jù)。以及進(jìn)行離線跑批作業(yè)產(chǎn)生結(jié)果數(shù)據(jù),供上層應(yīng)用調(diào)用。A、正確B、錯(cuò)誤【正確答案】:A48.離線批處理對(duì)數(shù)據(jù)處理的時(shí)延要求高,處理的數(shù)據(jù)量較大,占用的計(jì)算存儲(chǔ)資源較多,通常通過(guò)M
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)田井施工合同
- 城市人行道改造圍擋施工合同
- 屋頂觀景臺(tái)防水施工合同
- 高校食堂經(jīng)營(yíng)合同范例
- 工廠員工車位租賃合同范本
- 企業(yè)用車租車合同范例
- 乳品檢驗(yàn)員解除聘用合同證明
- 保安隊(duì)長(zhǎng)聘用合同協(xié)議書(shū)
- 定采購(gòu)合同范例寫(xiě)
- 文創(chuàng)園區(qū)工作室租賃合同
- 集成電路高可靠高密度封裝(一期)項(xiàng)目可行性研究報(bào)告
- 《韓國(guó)的語(yǔ)言》課后答案
- 寵物醫(yī)療創(chuàng)新創(chuàng)業(yè)
- 報(bào)價(jià)單(產(chǎn)品報(bào)價(jià)單)
- 項(xiàng)目經(jīng)理及主要管理人員能力水平
- 工程倫理-工程案例分析
- 纜車合唱鋼琴伴奏譜
- 小學(xué)四年級(jí)上冊(cè)數(shù)學(xué)集體備課-記錄
- 《國(guó)家心力衰竭指南 2023》解讀
- 人才教育培訓(xùn)部門(mén)KPI設(shè)計(jì)
- 醫(yī)療設(shè)備培訓(xùn)方案
評(píng)論
0/150
提交評(píng)論