數(shù)據(jù)工程師培訓(xùn)題庫(一)_第1頁
數(shù)據(jù)工程師培訓(xùn)題庫(一)_第2頁
數(shù)據(jù)工程師培訓(xùn)題庫(一)_第3頁
數(shù)據(jù)工程師培訓(xùn)題庫(一)_第4頁
數(shù)據(jù)工程師培訓(xùn)題庫(一)_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、星環(huán)信息科技(上海)有限公司6、下列計算框架A . MapReduceTD懶據(jù)平智訓(xùn)證工程師試題B . MATLAB姓名:分?jǐn)?shù):【說 C . sparka)有觀鼠30題,每題2分,總計60分 b)主觀題4題,每題10分,總計40分7)、湃女單0卜卷和托管表描述正確的是()A處表甲數(shù)叫g(shù)儲在本g 托管用的數(shù)據(jù)存儲在hdfs上【不智、項硒w泗會減好共Incepto)上的元數(shù)據(jù)不會刪除數(shù)據(jù)文件,刪除外表兩者都 公確ijHFS服務(wù)中,為了保證 Name Node高可用性的角色不包括()&姍界ode會刪除Inceptor上的元數(shù)據(jù)不會刪除數(shù)據(jù)文件,刪除托管表兩者都會被肺屋阿皿1 NodeC、.

2、ZKFC管表或外表,incepotr上的元數(shù)據(jù)和數(shù)據(jù)文件都會被刪除D . Zookeeper8、以下對分桶表的描述正確的是()2、NAm卵*"螂岳怖SEE幽1碗柳吳的是(A;嘛怖覷H洲簡啟動時對數(shù)據(jù)有效性進(jìn)行檢查&楠麻照|沙塊進(jìn)行必要的復(fù)制或刪除R事幡樹鼾安全模式D.允許用戶對文件系統(tǒng)進(jìn)行讀寫操作9、以下關(guān)于inceptor excutor資源配置的說法正確的有()3、儂怛c贈得DF辨幄* 3atio殳黨戰(zhàn)於小為128M此時我們上傳一份64M 的數(shù)做文Ehu密州襁樣的是HDFS呢就咨 東使用的應(yīng)輯core數(shù)量C、 . 64xcutor內(nèi)核數(shù)和內(nèi)存配置比例一般為1 core:2

3、G memoryD、 . 1 Excutor分布可以指定每個節(jié)點運行的excutor數(shù)量或executor在集群上運行的總會支8他不能指定運行的節(jié)點D . 192M 10、假設(shè)使用場景中有如下查詢語句SELEC國eY/W花OUW歐AV蜘醐是()FROM Empwei源WHERE Depfrtmtn1度IT'管理groUp BYSOe擷口的數(shù)據(jù)塊ORdEr BY娥 Region;通過holodesk的cube和index手段對這種過濾率和聚合率高的業(yè)務(wù)進(jìn)行優(yōu)化,以下建5i孤麗 %務(wù)中,包含以下哪種角色()A. . ResRuAeMTABLE EmployeeB . NodeManager

4、RTiEs(C . AppacheionMAMrD . ConWrtment,''='Sex, Region'B. CREATE TABLE Employee TBLPROPERTIES ( 'cache' = 'RAM', ''='Sex, Region' ''='Department' )C. CREATE TABLE Employee TBLPROPERTIES ( 'cache' = "Department", '&

5、#39;='Department', ''='Sex, Region' )D. CREATE TABLE Employee TBLPROPERTIES ( 'cache' = 'RAM', ''='Department', '='Sex' )11、關(guān)于Hyperbase全局索引的描述,哪些是正確的()A.核心是倒排表B.全局索引概念是對應(yīng)Rowkey這個"一級"索引C.全局索引使用平衡二叉樹D.全局索引使用B+樹檢索數(shù)據(jù)12、以下為Hype

6、rbase分布式存儲的最小單元的是()A、Region serverB、RegionC、StoreFileD、Store13、以下有關(guān)Hyperbase說法正確的是()A、數(shù)據(jù)類型豐富,支持 String、Int、Char等類型B、Key/value 系統(tǒng),key 由 Row,Column Family,Column Qualifier 組成C、Hyperbase表中rowkey有序,按字典序降序排列D、以上說法都不正確14、以下關(guān)于StreamSQL的概念描述正確的是()A. Stream是數(shù)據(jù)流B. Streamjob是對一個或多個stream進(jìn)行計算并將結(jié)果寫進(jìn)一個流的任務(wù)C. Appl

7、ication 是一個或多個 streamjob 的集合D.以上說法都不正確星環(huán)信息科技(上海)有限公司星環(huán)信息科技(上海)有限公司15、某交通部門通過使用流監(jiān)控全市過往24小時各個卡口數(shù)據(jù),要求每分鐘更新一次,原始流為org_stream ,以下實現(xiàn)正確的是()A. CREATE STREAMWINDOW traffic_stream AS SELECT * FROM original_stream STREAM w1 AS (length '1' minute slide '24' hour);B. CREATE STREAM traffic_streamA

8、S SELECT * FROM original_streamSTREAMWINDOW w1 AS (length '1' minute slide '24' hour);C. CREATE STREAM traffic_streamAS SELECT * FROM original_streamSTREAMWINDOW w1 AS (length '24' hour slide '1' minute);D. CREAT6TREAMraffic_streamASSELECT* FROM)riginal_streamAS (leng

9、th'24' second slide '1' minute);16、以下不是 Zookeeper的功能是()A,配置管理B.集群管理C.分布式鎖D.存儲大量數(shù)據(jù)17、以下服務(wù)需要與 zookeeper進(jìn)行通信的是()A. HMasterB. Active NameNodeC. InceptorSQLD. Active ResourceManager18、下列是關(guān)于flume和sqoop對比的描述,不正確的是()A . flume 主要用來采集日志而 sqoop主要用來做數(shù)據(jù)遷移B . flume主要采集流式數(shù)據(jù)而sqoop主要用來遷移規(guī)范化數(shù)據(jù)C . flum

10、e 和sqoop都是分布式處理任務(wù)D . flume 主要用于采集多數(shù)據(jù)源小數(shù)據(jù)而sqoop用來遷移單數(shù)據(jù)源數(shù)據(jù)19、有關(guān)使用sqoop抽取數(shù)據(jù)的原理的描述不正確的是()A . sqoop 在抽取數(shù)據(jù)的時候可以指定map的個數(shù),map的個數(shù)決定在hdfs生成的數(shù)據(jù)文件的個數(shù)B . sqoop抽取數(shù)據(jù)是個多節(jié)點并行抽取的過程,因此map的個數(shù)設(shè)置的越多性能越好C . sqoop 任務(wù)的切分是根據(jù) split字段的(最大值-最小值)/map數(shù)D . sqoop 抽取數(shù)據(jù)的時候需要保證執(zhí)行當(dāng)前用戶有權(quán)限執(zhí)行相應(yīng)的操作20、sqoop抽取數(shù)據(jù)時需要做一些數(shù)據(jù)轉(zhuǎn)換的工作,下面說法不正確的是()A . -

11、fields-terminated- by ' 01 ' 用來設(shè)置在 hdfs生成的文件的分割符B . -hive-drop-import-delims用來設(shè)置在hdfs生成的文件的存儲形式為列存儲C . -null-string 'N'用來把所有的 String 類型的空值 轉(zhuǎn)換成hive 的NULL值D . -null-non-string 'N'用來把非 String 類型的空值 轉(zhuǎn)換成hive 的NULL21、下列有關(guān) A .flume B . flume C . flume D . flumeflume的描述不正確的是(是Apache的

12、一個子項目主要是一個日志采集,傳輸系統(tǒng)和sqoop功能相似,因此可以相互替代可以同時采集集群內(nèi)部和集群外部的日志數(shù)據(jù)22、下列sink中哪些是flume不支持的sink ()A . HDFS sinkB . kafka sinkC . memory sinkD . file roll sink23、以下對ElasticSearch描述不正確的是()E. ElasticSearch是分布式全文搜索引擎F. ElasticSearch集群中分 master 和 data節(jié)點G. ElasticSearch數(shù)據(jù)存儲在 HDFS±H. ElasticSearch數(shù)據(jù)可以按Shard分布在不同

13、的節(jié)點上24、下列不屬于kafka應(yīng)用場景的是()A .常規(guī)的消息收集B .網(wǎng)站活動性跟蹤C(jī) .日志收集D .關(guān)系型數(shù)據(jù)庫和大數(shù)據(jù)平臺之間的數(shù)據(jù)遷移25、TDH提供哪幾種認(rèn)證模式()A.所有服務(wù)使用簡單認(rèn)證模式一一所有服務(wù)都無需認(rèn)證即可互相訪問B.所有服務(wù)都啟用 Kerberos認(rèn)證,用戶要提供 Kerberos principal 和密碼(或者 keytab )來訪問各個服務(wù)C.所有服務(wù)都啟用 Kerberos同時Inceptor 啟用LDAPU證D.所有服務(wù)都啟用LDAPU證26、以下對各組件的運維頁面描述不正確的是()A.通過Name Node的50070頁面對HDFS進(jìn)行監(jiān)控B.通過R

14、esource Manager的8180對YARN±運行的任務(wù)進(jìn)行監(jiān)控C.通過HMaster的60010對HBase進(jìn)行監(jiān)控D.通過Hue Server的8888頁面登入 Hue27、Inceptor server服務(wù)無法啟動時,該如何查看日志是()A.查看TDH manager所在節(jié)點/var/log/inceptorsql*/目錄下的日志B. 查看 Inceptor server所在節(jié)點 /var/log/inceptorsql*/目錄下的日志C.查看Resource Manager所在節(jié)點/var/log/Yarn*/ 目錄下的日志D.查看任意節(jié)點/var/log/incept

15、orsql*/ 目錄下的日志星環(huán)信息科技(上海)有限公司星環(huán)信息科技(上海)有限公司28、以下對Hadoop組件的應(yīng)用場景描述正確的是()A. Hive主要用于構(gòu)建大數(shù)據(jù)數(shù)倉,主要做批處理、統(tǒng)計分析型業(yè)務(wù)B. Hbase主要用于檢索查詢的OLTP業(yè)務(wù)C.曰asticSearch主要用于全文檢索的關(guān)鍵字查詢業(yè)務(wù)D. Spark Streaming 主要用于實時數(shù)據(jù)的業(yè)務(wù)場景29、以下不屬于管理角色的是()A . Name NodeB . HMasterC . Resource ManagerD . Node Manager30、下面哪些工作不屬于集群預(yù)安裝工作()A .為集群中每個節(jié)點的安裝操作系統(tǒng)B .選一個節(jié)點作為管理節(jié)點,修改其/etc/hosts 文件C .安裝Transwarp Manager管理界面D .配置集群安全模式【客觀簡答題(每題 10分,共40分)】1、集群有8個節(jié)點,每個節(jié)點有8塊硬盤(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論