版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
華為HCIP認證大數(shù)據(jù)-H13-723培訓(xùn)考試復(fù)習題庫(含答案)一、單選題1.對于GaussDB200的數(shù)據(jù)并行導(dǎo)入策略Normal,下列說法錯誤的是()?C、數(shù)據(jù)導(dǎo)入時,支持單行數(shù)據(jù)大小小于1GB.用下列哪個工具?3.智能數(shù)據(jù)湖運營平臺指的是以下哪個選項?A、VASvideoAnalysisServiceA、HDFS文件塊的大小在1.0版本時是64M,在2.0的時候是128MB、文件塊(片)被存在哪個集群;誰有權(quán)限查看、修改這個文件等信息放在元5.以下關(guān)于公共安全行業(yè)專題分析與查詢業(yè)務(wù)場最描述錯誤的選項是()。A、滾動升級/補丁B、修改配置滾動重啟A、Spark順序為0)?18.以下哪項不屬于批量數(shù)據(jù)采集工具?()能?A、調(diào)整索引分片數(shù)C、壓縮素引C、PCK通過min/max稀疏素引實現(xiàn)事實表快速過掃描44.以下關(guān)于EasticSearch緩存機制的理解不正確的是()A、FilterA、通過GaussDB200的數(shù)據(jù)分布規(guī)則數(shù)據(jù)會自動分布.那么對表的設(shè)計可以比較49.以下關(guān)于StreamExecution持續(xù)查詢過程的描述哪項是正確的?LogicalPlan--計算完成mit--計算結(jié)果SinkB、offsets寫入offsetLog--獲取最新數(shù)據(jù)offsets--構(gòu)造LogicalPlan--優(yōu)化LogicalPlan--計算結(jié)果Sink--計算完成mitC、獲取offsetsoffsetsoffsetLogLogicalPlanD、獲取最新數(shù)據(jù)offsets--offsets寫入offsetLog--優(yōu)LogicaPlanLogicalPlan--計算結(jié)果Sink--計算完成mit55.以下哪個不是離線批處理的核心訴求?A、處理數(shù)據(jù)格式多樣B、處理教據(jù)量巨大C、支持SQL美作業(yè)和自走義作業(yè)D、處理時間要求高56.在SparkSQL中,()使用了新的編碼器,其編碼器的作用是將VM的對象與表結(jié)構(gòu)進行轉(zhuǎn)換,允許操作序列化數(shù)據(jù),可以提高內(nèi)存利用率。57.列哪一個命令可以清空Reis實例下所有數(shù)據(jù)庫的資料?A、ttlA、流式數(shù)據(jù)讀取B、大文件存儲與訪問<imgsrc="https://up.zaixiankaoshi./5443384imagepng端計算Key歸屬的槽位以及對應(yīng)serverB節(jié)點并連接一ServerB節(jié)點返回業(yè)務(wù)操C、ServerA節(jié)點返回集群拓撲一喜戶端計算Key歸屬的槽位以及對應(yīng)ServerB節(jié)點并連接戶端選擇集群任意一個ServerA節(jié)點連接-eerB節(jié)點返回業(yè)務(wù)操作結(jié)果對應(yīng)ServerB節(jié)點并連接-ServerA節(jié)點返回集群拓撲-ServerB節(jié)點返回業(yè)務(wù)操C、高并發(fā)B、事件時間C、檢查點存儲在0中,并在隨后由。調(diào)用執(zhí)行。94.HDFS創(chuàng)建目錄過程中,通過調(diào)用FileSystem實例的()方法查看該目錄是99.Hive調(diào)優(yōu)中,當連接一個較小和較大表的時候,把()的表直接放到內(nèi)存中去,然后再對()的表進行map操作。A、小,小B、小,大C、大,小D、大,大A、FlinkA、HBase118.存儲過程的調(diào)用有幾種方式()119.以下哪種Hive的方法可以用來對數(shù)據(jù)求和?A、trimA、正排素引B、倒排素引mepersonnamemarkoapiqueryVertexvertexldgraphA、查詢點123.StructuredStreaming中持續(xù)地查詢最新計算結(jié)果至寫出。這個過程叫做什么?124.ElasticSearchk可通過分片副本來優(yōu)化性能,下列策略錯誤的是哪一項?A、分片數(shù)不超過節(jié)點數(shù)的3倍,用較少的分片獲得更佳的性能B、副本數(shù)至少設(shè)置為3,保障數(shù)據(jù)的可靠性C、副本數(shù)建議設(shè)置為1,過多的副本需要更多存儲空間D、分片最大容量不要超過ElasticSearch推薦的最大JVM堆空間32G率損D、運營商可以借助實時檢索技術(shù),查詢某個A、admintableExiststableNameA、HDFS成的查詢計劃存儲在0中,并在隨后由。調(diào)用執(zhí)行。A、數(shù)據(jù)可視化->數(shù)據(jù)源->數(shù)據(jù)落地-〉數(shù)據(jù)處理150.關(guān)于RDD,下列說法錯誤的是哪一項?A、RDD具有血統(tǒng)機制(Lineage)。B、RDD默認存儲在磁盤。C、RDD是一個只讀的,可分區(qū)的分布式數(shù)據(jù)集。D、RDD是Spark對基礎(chǔ)數(shù)據(jù)的抽象。151.以下哪個框架可以同時滿足實時分析、高線分析、實時檢素的功能?152.HBase使用get方法讀取數(shù)據(jù)時,下列哪個選項是需要的?A、Deletedelete=newDeleterowkeyC、byte[rowKeyBytestoBytesD、熟悉LinuxShelI命令B、創(chuàng)建列存表時壓縮級別默認為HIGHA、序列化B、鍵值對C、二進制A、IntinfoindexisnotexistindexretuC、1天D、7天177.在GaussDB200的存儲過程中語句nimfcer=0C、修改變量number的值為0據(jù)Metadata中。D、HDFS文件塊的大小在1.0版本時是64,在2.0的時候是128M。dA、-cat191.關(guān)于GaussDB200的數(shù)據(jù)導(dǎo)入導(dǎo)出下列說法正確的是()?A、使用gsq1元命令和COPY命令在使用和用法上是一樣的。B、GDS在數(shù)據(jù)導(dǎo)入時可以做預(yù)處理,比如非法字符替換、容錯處理、數(shù)據(jù)聚合199.下列關(guān)于GaussDB200的Explain命令描述正確的是?()A、Explain命令主要顯示SQL的執(zhí)行計劃,對SQL調(diào)優(yōu)用處不大。C、通過設(shè)置GUC參數(shù)explainperfmode,可以顯示不同格式的執(zhí)行計劃。D、Explain可以完成對SQL的優(yōu)化,其D、高并發(fā)202.離線批處理常用的組件不包括哪個?204.現(xiàn)在有一億條數(shù)據(jù)要插入HBase使用下列哪個方式最好?A、StaticlnterceptorA、TB213.關(guān)于GaussDB200的發(fā)展史,下列說法錯誤的是()?A、g.V().hasLabel("testquothasLabelquottestquotvaluesquotagequhasLabelquottestquotvalueMapquotStr217.某開發(fā)小組計劃利用GraphBase實現(xiàn)一些功能,以下哪些功能可以實現(xiàn)?A、Spark223.關(guān)于Hive自定義UDF描述錯誤的是()A、普通的UDF,用于操作單個數(shù)據(jù)行,且產(chǎn)生225.HBase元數(shù)據(jù)MetaRegion路由信息保存的位置是下列一項?226.下面這條GaussDB200語句"calldbmsjob.broken(1.true)"的意思是()?A、停止任務(wù)TD為1的Job.227.GaussDB200數(shù)據(jù)并行導(dǎo)入Shared策略支持的數(shù)據(jù)格式是?A、CSy228.某大數(shù)據(jù)業(yè)務(wù)人員對某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個數(shù)據(jù)為時間類型yyyyMMdd,那么可以使用以下哪一項作為字段類型?A、varcahr229.在網(wǎng)絡(luò)日志數(shù)據(jù)分析場最中,日志服務(wù)器通過1性4將數(shù)據(jù)傳給(),()會對數(shù)據(jù)進行簡單的處理過濾,然后將數(shù)據(jù)按照日期存儲到。上。230.下列關(guān)于Hive自定義函數(shù)的描述中,正確的是哪一項?A、Hive中的min以及max屬于UDAF的數(shù)。B、一般自行編寫的函數(shù)都屬于臨時函數(shù).每次使用都需要重新創(chuàng)建。C、一般自行編寫的函數(shù)都屬于永久函數(shù).直接引用即可。D、如果創(chuàng)建的函數(shù)名與內(nèi)置的函數(shù)名重復(fù),在使用過程中以內(nèi)置的函數(shù)231.下對GaussDB200雙AZ集群描述不正確是?A、災(zāi)備集群不同步數(shù)據(jù)時,可以提供讀寫服務(wù)B、主集群不可用時,災(zāi)備集群提供正常服務(wù)C、主集群提供正常服務(wù),文備集群只同步數(shù)據(jù)D、周期性數(shù)據(jù)同步232.有一張表name,其中一,字段名為chinesename,類型為char(4),另一,字lues(gaosi','GaussDB)'會發(fā)生什么?()B、過多的列10開銷大235.下列哪段代碼是用于判斷ElasticSearch索引是否存在?publicbooleanisExistslndexStringindexNameIndicpublicbooleanisExistslndexStringindexNameIndicesExistsRepublicbooleanisExistslndexStringindexNameIndicesEA、netstat241.關(guān)于表連接算子的說法錯誤的是()?A、聚合操作如groupby會觸發(fā)NergeJoinB、表連接算子主要有NestloopMergeJoin.Minorjoin.HashJoinC、算子的選擇是SQL根據(jù)邏輯三行選擇的.與人為無關(guān)。D、默認情況下.執(zhí)行效率來說Hashjoin最高。242.離線批處理常用的組件不包括()。243.GES能夠處理海量數(shù)據(jù)的原因是()A、基于HBase的分布式存儲機制B、圖機制特性C、基于Elasticsearch的素引機制D、基于Spark的分布式內(nèi)存計算技術(shù)A、SQL語句通過SparkSQL模塊解析為DAG,交給SparkCore執(zhí)行。B、SparksSQL使用場景包括毫秒級實時查詢。C、通過SparkSession提交SQL語句。任務(wù)像普通Spark應(yīng)用一樣提交到集群中分布式運行D、SparksQL是Spark用來處理結(jié)構(gòu)化數(shù)據(jù)的一個模塊,可以在Spark應(yīng)用中直接使用SQL語句對數(shù)據(jù)進行操作。245.GaussDB200在創(chuàng)建表時,需要注意以下哪些事項()?A、創(chuàng)建列存表之后,后續(xù)可以修改為行存表。B、創(chuàng)建列存表時壓縮級別默認為HIGHC、如果指定表空間為普通表空間,創(chuàng)建表時默認是行式存儲D、創(chuàng)建一個行存表之后,后續(xù)可以修改為列存表。246.常用的數(shù)據(jù)收集工具不包括以下哪個選項?247.Kafka集群必須依賴于下列哪一個組件?248.Flune傳輸數(shù)據(jù)過程中,為了防止數(shù)據(jù)不丟失,使用的Channel類型是?249.創(chuàng)建分支語句如下,CREATEORREPLACEPROCEDUREproccase.branch(piresuWHENTHENpireturnWHENTWHENTHENpireturnELSEPireturnENDCAreturn;END:執(zhí)行如下語句CALLproccasebranch(3.2)的返回結(jié)果是()。250.下列哪個選項可用于查詢ElasticSearch的索引?251.以下哪項屬于Flume的基本數(shù)據(jù)單位?254.Flink的窗口,按窗口行為劃分不包含以下哪種?256.下面這段代碼的作用是什么?<imgsrc="https://up.zaixiankaoshi./5443A、判斷索引分片是否存在B、判斷索引是否可用C、判斷索引是否存在D、判斷索引類型257.Elasticsearch采用的搜索方式是?A、倒排索引B、快速索引A、數(shù)據(jù)可視化操作A、Explain通過指定option選項參數(shù)FORMAT來指定輸出格式,默認是text格實際開銷(單位為毫秒)和行數(shù)信息,對于判斷優(yōu)化器的估算準確提供依據(jù)。B、配置副本策略通常為3份A、UDAFD、scan讀取數(shù)據(jù)是一次性全部把數(shù)據(jù)從服務(wù)端讀取到10.實時檢索解決方案支持的數(shù)據(jù)采集有哪些?11.KafkaConsumer在跟蹤消費記錄時,需要以下哪幾個選項的信息?12.隨著大數(shù)據(jù)越來越被重視,數(shù)據(jù)采集的挑戰(zhàn)也變的尤為突出,常見的挑戰(zhàn)包括?B、數(shù)據(jù)源多種多樣C、數(shù)據(jù)采集的可靠性保障13.Flink有哪些狀態(tài)儲存方式?A、存儲特定用戶所有歷史信息B、限時的優(yōu)惠活動信息C、限制網(wǎng)站訪客訪問頻率D、網(wǎng)站積分排行榜B、本地文件系統(tǒng)16.Redis使用場景包含以下哪些特點?A、支持持久化B、豐富數(shù)據(jù)結(jié)構(gòu)在取的?A、邊寫邊讀B、低性能28.對于GaussDB200而言,字段的設(shè)計應(yīng)該注意以下哪些事項?33.以下哪些場最可以使用HBase作為存儲系統(tǒng)?A、Row-Key查詢43.下面關(guān)于GaussDB200的邏輯集群說法正確的是()?46.以下哪些選項是容易造成Hive數(shù)據(jù)傾斜的原因?D、對業(yè)務(wù)人員進行權(quán)限劃分,避免非法或敏感操作,如刪除等。A、表的增刪改查B、用戶數(shù)據(jù)讀寫54.在GaussDB200中,關(guān)于Schema和Database下面說法正確的是()A、二者都能實現(xiàn)資源隔離。B、Database之間無法直接訪問,但通過權(quán)限授子可以訪問數(shù)據(jù)。D、Schema和用戶強相關(guān)的,通過權(quán)限控制語法可以實現(xiàn)不同用戶對各Schema55.大數(shù)據(jù)計算框架Spark中除了RDD還有哪些數(shù)據(jù)類型?56.對GaussDB200集群管理模塊(CM)描述不正確的是?B、采用Min/Max稀疏素弓1D、每條記錄對應(yīng)一個CU(60Krows)58.計算10分鐘內(nèi)的單詞,每5分鐘更新次,若程序在12:00開始運行,在12:65.在ApacheHadoop中,關(guān)于HDFS的69.HBase的可視化Web界面可以查詢到077.以下哪些選項屬于離線批處理的特點?A、處理時間相對較長B、數(shù)據(jù)不落地、存儲量不大D、處理數(shù)據(jù)量相對較大78.數(shù)據(jù)倉庫分層的優(yōu)點包括以下哪些選項?A、減少重復(fù)開發(fā)量79.大數(shù)據(jù)計算框架Flink的支持以下哪些資源調(diào)度方式?80.實時檢索解決方案的項目流程包括以下哪些選項?A、應(yīng)用部署88.關(guān)于Loader特點描述正確的選項是()A、容量預(yù)留A、FailoverSinkProcessorA、filter96.所謂大數(shù)據(jù)技術(shù)融合主要4旨哪些方面?A、Binaryparator104.StructuredStreaming中OutPut定義的存儲方式包含以下哪幾種A、HBase108.某大數(shù)據(jù)運堆人員需要將部分數(shù)據(jù)導(dǎo)入Hive數(shù)據(jù)表取的?A、RDBA、最大支持512節(jié)點,10P級數(shù)據(jù)B、支持存儲海量小文件C、rowkey實時查詢延遲可達16ms116.StructuredStreaming不能提供以下哪幾種類型的保證?117.Region分裂時,下列哪些選項會參與?D、以上全不正確118.Kafka每個Partition在物理上對應(yīng)的文件夾下存儲哪些文件?A、素引文件C、用戶文件A、對于點查或者范圍掃描等過濾本量數(shù)據(jù)的查詢,如果使用SeqScan全表掃描121.ElasticSearch支持的gateway類型有?取的?B、改造SQL語句,在插入前添動加清空操作如truncate123.某開發(fā)團隊要使用ElasticSearch做檢索工具,下列哪些選項可以用ElasticSearch檢索?A、關(guān)系型數(shù)據(jù)庫數(shù)據(jù)C、T業(yè)A、HDFS138.以下選項對GraphBase概念描述正確的是?139.Hive特性包括哪些?140.以下對HDFS中提供文件讀寫的類描述正確的是()C、Explain通過指定option選項參數(shù)FORMAT來指定輸出格式,默認是text格B、配置副本策略通常為3份C、管理HDFSBaREj(NameSpace)B、我們可以每30秒計算一次最近一分鐘用戶鉱買的商品總數(shù),這個就是時間滑163.大數(shù)據(jù)其中一個最明顯的特征是數(shù)據(jù)量巨大,那么所謂的數(shù)據(jù)量巨大主要指哪些級別的數(shù)據(jù)量?A、MB164.ElasticSearch的核心概念包含哪些?165.以下Hive數(shù)據(jù)倉庫數(shù)據(jù)表分層的描述,準確的是?A、ADS層,為各種統(tǒng)計報表提供數(shù)據(jù),做分析處
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國旅游度假區(qū)行業(yè)資本規(guī)劃與股權(quán)融資戰(zhàn)略制定與實施研究報告
- 2025-2030年中國咖啡館行業(yè)并購重組擴張戰(zhàn)略制定與實施研究報告
- 新形勢下金融押運行業(yè)快速做大市場規(guī)模戰(zhàn)略制定與實施研究報告
- 2025-2030年中國商用廚房電器行業(yè)全國市場開拓戰(zhàn)略制定與實施研究報告
- 2025-2030年中國汽車分時租賃行業(yè)全國市場開拓戰(zhàn)略制定與實施研究報告
- 2025-2030年中國鈷行業(yè)開拓第二增長曲線戰(zhàn)略制定與實施研究報告
- 關(guān)于大學生對學校組織愛心活動的關(guān)注及其背后真實心理的調(diào)查
- 國有企業(yè)2024年工作情況總結(jié)及2025年工作計劃
- 2024-2030年中國金融系列行業(yè)市場全景分析及投資前景展望報告
- 電力工程招投標過程中的風險分析與管理措施
- 礦用液壓支架的設(shè)計液壓支架的設(shè)計
- 最新深基坑驗收記錄表-開挖條件驗收表4-2
- 勤工助學申請表
- 《茶館》教學反思
- DB44∕T 635-2009 政府投資應(yīng)用軟件開發(fā)項目價格評估及計算方法
- 安裝工程定額講義
- 復(fù)旦大學留學生入學考試模擬卷
- 【信息技術(shù)應(yīng)用能力提升工程2.0】A3演示文稿設(shè)計與制作 初中語文《雖有嘉肴》主題說明
- 小學四年級奧數(shù)教程30講(經(jīng)典講解)
- 爛尾樓工程聯(lián)建檢測與鑒定
- 汽車技術(shù)服務(wù)與營銷畢業(yè)論文備選題目
評論
0/150
提交評論