Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn) 習(xí)題及答案全 模塊1:項(xiàng)目需求篇-模塊5:項(xiàng)目數(shù)據(jù)可視化展示篇_第1頁(yè)
Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn) 習(xí)題及答案全 模塊1:項(xiàng)目需求篇-模塊5:項(xiàng)目數(shù)據(jù)可視化展示篇_第2頁(yè)
Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn) 習(xí)題及答案全 模塊1:項(xiàng)目需求篇-模塊5:項(xiàng)目數(shù)據(jù)可視化展示篇_第3頁(yè)
Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn) 習(xí)題及答案全 模塊1:項(xiàng)目需求篇-模塊5:項(xiàng)目數(shù)據(jù)可視化展示篇_第4頁(yè)
Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn) 習(xí)題及答案全 模塊1:項(xiàng)目需求篇-模塊5:項(xiàng)目數(shù)據(jù)可視化展示篇_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

思考與練習(xí)一、判斷題

1、云主機(jī)和物理機(jī)的壽命都是永久性的。()

2、對(duì)于實(shí)時(shí)性要求高的應(yīng)用,需要應(yīng)用實(shí)時(shí)處理架構(gòu)。()

3、數(shù)據(jù)倉(cāng)庫(kù)是用來(lái)存儲(chǔ)數(shù)據(jù)的而不是分析數(shù)據(jù)的。()

4、在DWS層中,用戶行為日志數(shù)據(jù)分為公共字段和事件字段。()

二、單選題

1、項(xiàng)目實(shí)施流程中沒(méi)有哪一步()

A.下載數(shù)據(jù)

B.數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)開(kāi)發(fā)

C.數(shù)據(jù)導(dǎo)出D.數(shù)據(jù)訪問(wèn)

2、數(shù)據(jù)分析在企業(yè)中的作用()

A.幫助企業(yè)經(jīng)營(yíng)者平衡企業(yè)的收益

B.干預(yù)經(jīng)營(yíng)者的決策

C.直接的獲取經(jīng)營(yíng)的利潤(rùn)

D.幫助企業(yè)經(jīng)營(yíng)者減少投入

3、數(shù)據(jù)結(jié)構(gòu)中哪項(xiàng)不是頁(yè)面入口的來(lái)源()

A.應(yīng)用首頁(yè)

B.登錄頁(yè)

C.push

D.詳情頁(yè)

三、多選題

1、Hadoop的三大發(fā)行版本是()

A.Apache

B.CDH

C.HDP

D.Java

2、流量分析常見(jiàn)指標(biāo)有哪些方面()

A.來(lái)源分析

B.受訪分析

C.訪客分析

D.轉(zhuǎn)化路徑分析3、網(wǎng)站流量數(shù)據(jù)分析的意義有哪些()

A.幫助網(wǎng)站運(yùn)營(yíng)人員獲取網(wǎng)站流量信息

B.從多方面提供網(wǎng)站分析的數(shù)據(jù)依據(jù)

C.幫助提高網(wǎng)站流量

D.提升網(wǎng)站用戶體驗(yàn)

參考答案:一、判斷題

1.錯(cuò)2.對(duì)3.錯(cuò)4.對(duì)

二、單選題

1.A2.C3.B

三、多選題

1.ABC2.ABCD3.ABCD思考與練習(xí)一、判斷題

1、Hadoop是一種分布式系統(tǒng)基礎(chǔ)架構(gòu),主要解決海量數(shù)據(jù)存儲(chǔ)和海量數(shù)據(jù)計(jì)算兩大

問(wèn)題。()2、在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。()

3、在Hadoop分布式集群中,不需要對(duì)集群中的每一個(gè)節(jié)點(diǎn)都進(jìn)行ip規(guī)劃。()

4、利用HDFS操作命令可以將數(shù)據(jù)文件從本地上傳到HDFS上,也可以將數(shù)據(jù)文件

從HDFS下載到本地。()

5、在HDFSAPI操作中,closeFileSystem方法的功能是釋放文件系統(tǒng)對(duì)象的資源。

()

6、MapReduce詞頻統(tǒng)計(jì)案例中,執(zhí)行map任務(wù)的最后階段,會(huì)將緩沖區(qū)的數(shù)據(jù)全部

寫入到磁盤。()

7、Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系統(tǒng),可用于海量

日志采集、聚合和傳輸。()

二、單選題

1、能在網(wǎng)絡(luò)中安全傳輸文件的軟件是()。

A.VMware

B.Xshell

C.IDEA

D.Xftp

2、創(chuàng)建了bigdata用戶的命令是()。

A.subigdata

B.bigdataALL

C.useraddbigdata

D.Sudoers

3、論文(),主要論證的核心是如何采用分布式的架構(gòu)對(duì)海量數(shù)據(jù)進(jìn)行分布式計(jì)算。A.GFS

B.BigTable

C.MapReduce

D.HDFS

4、假如我們?cè)O(shè)定HDFS塊的大小是128M,那么,一個(gè)大小為500M的數(shù)據(jù)文件,將會(huì)被

拆分成()個(gè)分片

A.2

B.3

C.4

D.5

5、在Linux命令行中,使用()命令格式化hive元數(shù)據(jù)庫(kù)

A.format

B.schematool

C.clear

D.del

6、在Hive中給表添加數(shù)據(jù),使用()方式給表添加數(shù)據(jù)效率更高。

A.insertinto

B.Load

C.append

D.Add

7、關(guān)系型數(shù)據(jù)庫(kù)與HDFS之間相互數(shù)據(jù)遷移的工具是()。

A.distcpB.fsck

C.fastcopy

D.sqoop

三、多選題

1、Notepad++功能有()。

A.制作一般的純文字說(shuō)明文件

B.編寫計(jì)算機(jī)程序代碼

C.語(yǔ)法高亮度顯示、語(yǔ)法折疊功能、支持宏、擴(kuò)充基本功能的外掛模組

D.可以連接虛擬機(jī),對(duì)虛擬機(jī)中的文件進(jìn)行編輯。

2、Hadoop主要包含()三大功能組件。

A.YARN

B.Hadoop

C.MapReduce

D.HDFS

3、Hadoop具有()優(yōu)勢(shì)。

A.高可靠性

B.高效性

C.高容錯(cuò)性

D.高擴(kuò)展性

4、下面說(shuō)法正確的是()。

A.JDK是Java語(yǔ)言的開(kāi)發(fā)環(huán)境

B.JDK包含JRE和JVMC.JRE是java運(yùn)行時(shí)的類庫(kù)

D.Java編程的核心就是JVM,JVM是JRE的一部分,它是一個(gè)虛擬出來(lái)的計(jì)算機(jī)。

5、在分布式文件系統(tǒng)HDFS當(dāng)中提供了兩種操作命令,是()。

A.hadoopfs

B.Hadoopdfs

C.hdfsdfs

D.hdfsfs

6、Hive是基于Hadoop技術(shù)的數(shù)據(jù)倉(cāng)庫(kù)工具,用來(lái)對(duì)數(shù)據(jù)進(jìn)行()。

A.提取

B.轉(zhuǎn)化

C.加載

D.分析

7、使用beeline客戶端遠(yuǎn)程訪問(wèn)Hive之前,需要啟動(dòng)的兩個(gè)服務(wù)是()。

A.hive--servicemetastore

B.hive--servermetastore

C.hive--servicehiveserver2

D.hive--servicehiveserver

8、Hive的復(fù)雜數(shù)據(jù)類型有()三種

A.ARRAY

B.MAP

C.STRUCT

D.Char9、成功安裝Zookeeper集群后,查看各節(jié)點(diǎn)的角色信息時(shí),會(huì)看到1個(gè)、多個(gè)()。

A.leader

B.follower

C.zookeeper

D.zkServer

10、Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),是Apache基金會(huì)開(kāi)源的消息隊(duì)列,

該框架由()編寫而成。

A.C++

B.Java

C.Scala

D.Python

參考答案:一、判斷題

1.對(duì)2.對(duì)3.錯(cuò)4.對(duì)5.對(duì)6.對(duì)7.對(duì)

二、單選題

1.D2.C3.C4.C5.B6.B7.D

三、多選題1.ABCD 2.ACD 3.ABCD 4.ABCD 5.AC 6.ABCD 7.BC 8.ABC 9.AB 10.BC思考與練習(xí)

一、判斷題

1、業(yè)務(wù)字段指的是每個(gè)移動(dòng)端固定的、共有的字段;公共字段代表的是用戶在app中

執(zhí)行過(guò)的所有操作。()

2、在Flume過(guò)程中,F(xiàn)lume對(duì)接本地磁盤文件,通過(guò)tailDir類型實(shí)時(shí)監(jiān)控當(dāng)前數(shù)據(jù)文

件中數(shù)據(jù)內(nèi)容的變化。()

3、ETL攔截器主要用于過(guò)濾時(shí)間戳不合法和json數(shù)據(jù)不完整的日志。()

4、Flume分流標(biāo)記攔截器主要是用于區(qū)分啟動(dòng)日志和事件日志。()

二、單選題

1、以下關(guān)于Flume的說(shuō)法正確的是____。()

A.Event是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>

B.Sink是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>

C.Channel是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>

D.Source是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>

2、Flume通過(guò)內(nèi)部的采集數(shù)據(jù)傳輸機(jī)制進(jìn)行快速的數(shù)據(jù)傳輸,傳輸完之后會(huì)將數(shù)據(jù)就

存儲(chǔ)到____中。()

A.Source

B.Channel

C.Kafka

D.HDFS

3、可以使用____命令,啟動(dòng)Kafka的一個(gè)消費(fèi)者。()。

A.kafka-console-consumer.shB.kafka-server-start.sh

C.kafka-topics.sh

D.kafka-console-producer.sh

4、在Flume消費(fèi)的整體流程中,第一部分是別名配置,在別名配置的過(guò)程當(dāng)中,配置了兩

個(gè)數(shù)據(jù)流用來(lái)處理()。

A.ETL和分流標(biāo)記攔截器

B.啟動(dòng)日志數(shù)據(jù)和事件日志數(shù)據(jù)

C.Flume環(huán)境變量

D.Flume數(shù)據(jù)消費(fèi)腳本

三、多選題

1、在Flume數(shù)據(jù)傳輸?shù)倪^(guò)程中,當(dāng)source將數(shù)據(jù)傳遞給channel時(shí),數(shù)據(jù)會(huì)先后經(jīng)過(guò)

()兩個(gè)攔截器。

A.ETL攔截器

B.時(shí)間戳攔截器

C.Flume分流標(biāo)記攔截器

D.UUID攔截器

2、Flume的安裝與部署可以分為下列哪三個(gè)步驟()。

A.將Flume安裝包上傳至Linux操作系統(tǒng)

B.解壓到指定目錄,進(jìn)行環(huán)境變量的配置

C.在Flume的配置文件中修改指定配置

D.啟動(dòng)Flume數(shù)據(jù)消費(fèi)腳本參考答案:

一、判斷題

1.錯(cuò)2.對(duì)3.對(duì)4.對(duì)

二、單選題

1.A2.C3.A4.B

三、多選題

1.AC2.ABC思考與練習(xí)

一、判斷題

1、在數(shù)據(jù)倉(cāng)庫(kù)中,ODS層的作用是保持?jǐn)?shù)據(jù)原貌,不做任何修改,起到備份數(shù)據(jù)的作

用()

2、在數(shù)據(jù)倉(cāng)庫(kù)中,DWD層的作用是對(duì)數(shù)據(jù)進(jìn)行清洗()

3、在ADS層中,通過(guò)在啟動(dòng)日志中統(tǒng)計(jì)不同設(shè)備ID出現(xiàn)的次數(shù)來(lái)分析用戶活躍?

()

4、在ADS層中,按照設(shè)備ID對(duì)日活表分組,登錄次數(shù)為1,且在一周前登錄的這種分析方式,分析沉默用戶?()

5、DWS層統(tǒng)計(jì)各個(gè)主題對(duì)象的當(dāng)天行為,服務(wù)于DWT層的主題寬表。DWS層的寬

表字段,是站在不同維度的角度去看事實(shí)表,重點(diǎn)關(guān)注事實(shí)表的度量值,通過(guò)與之關(guān)聯(lián)的事

實(shí)表,獲得不同的事實(shí)表的度量值()

二、單選題

1、在數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目中,我們?cè)贒WD層使用()手段清洗數(shù)據(jù)

A.RDD

B.Kettle

C.SQL

D.Python

2、在數(shù)據(jù)倉(cāng)庫(kù)中,用于數(shù)據(jù)清洗的是哪個(gè)層()

A.ODS

B.DWD

C.DWS

D.DWT

三、多選題

1、數(shù)據(jù)倉(cāng)庫(kù)一般分為()

A.ODS

B.DWD

C.DWS

D.DWT

E.ADS2、在數(shù)據(jù)倉(cāng)庫(kù)DWD層中,需要清洗哪些數(shù)據(jù)()

A.空值的去除

B.過(guò)濾核心字段

C.將用戶行為寬表和業(yè)務(wù)表進(jìn)行數(shù)據(jù)一致處理

D.創(chuàng)建分區(qū)表

3、在數(shù)據(jù)倉(cāng)庫(kù)中,ODS層做了什么業(yè)務(wù)()

A.保持?jǐn)?shù)據(jù)原貌

B.采用LZO壓縮

C.創(chuàng)建分區(qū)表

D.空去除

參考答案:

一、判斷題

1.對(duì)2.對(duì)3.對(duì)4.對(duì)5.對(duì)

二、單選題

1.C2.B

三、多選題1.ABCDE2.ABC3.ABC思考與練習(xí)一、判斷題

1、使用pyecharts工具繪圖時(shí),可直接進(jìn)行圖表的繪制,無(wú)需在程序中導(dǎo)入對(duì)應(yīng)的

圖表類。()

2、使用pyecharts工具繪圖時(shí),可以通過(guò)設(shè)置初始化配置項(xiàng)中的圖表ID,設(shè)置圖表

的唯一標(biāo)識(shí),以此來(lái)區(qū)分多個(gè)圖表。()

3、餅圖常用于表示不同分類的占比情況,通過(guò)弧度大小來(lái)對(duì)比各種分類。()

二、單選題

1、MySQL中,用于創(chuàng)建數(shù)據(jù)庫(kù)的命令是()。

A.dropdatabase數(shù)據(jù)庫(kù)名

B.use數(shù)據(jù)庫(kù)名

C.createtable數(shù)據(jù)庫(kù)名

D.createdatabase數(shù)據(jù)庫(kù)名

2、使用sqoop進(jìn)行從Hive到MySQL數(shù)據(jù)庫(kù)的數(shù)據(jù)遷移時(shí),其命令為()。125

第1章

A.sqoopimport

B.sqoopexport

C.sqoopjob

D.sqoopmerge

3、pyecharts中,柱狀圖類是()。

A.Bar

B.Line

C.Pie

D.Liquid

4、pyecharts中,餅圖類是()。

A.Bar

B.Line

C.Pie

D.Liquid

5、全局配置項(xiàng)可通過(guò)()方法設(shè)置。

A.add_yaxis

B.set_global_opts

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論