版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
思考與練習(xí)一、判斷題
1、云主機(jī)和物理機(jī)的壽命都是永久性的。()
2、對(duì)于實(shí)時(shí)性要求高的應(yīng)用,需要應(yīng)用實(shí)時(shí)處理架構(gòu)。()
3、數(shù)據(jù)倉(cāng)庫(kù)是用來(lái)存儲(chǔ)數(shù)據(jù)的而不是分析數(shù)據(jù)的。()
4、在DWS層中,用戶行為日志數(shù)據(jù)分為公共字段和事件字段。()
二、單選題
1、項(xiàng)目實(shí)施流程中沒(méi)有哪一步()
A.下載數(shù)據(jù)
B.數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)開(kāi)發(fā)
C.數(shù)據(jù)導(dǎo)出D.數(shù)據(jù)訪問(wèn)
2、數(shù)據(jù)分析在企業(yè)中的作用()
A.幫助企業(yè)經(jīng)營(yíng)者平衡企業(yè)的收益
B.干預(yù)經(jīng)營(yíng)者的決策
C.直接的獲取經(jīng)營(yíng)的利潤(rùn)
D.幫助企業(yè)經(jīng)營(yíng)者減少投入
3、數(shù)據(jù)結(jié)構(gòu)中哪項(xiàng)不是頁(yè)面入口的來(lái)源()
A.應(yīng)用首頁(yè)
B.登錄頁(yè)
C.push
D.詳情頁(yè)
三、多選題
1、Hadoop的三大發(fā)行版本是()
A.Apache
B.CDH
C.HDP
D.Java
2、流量分析常見(jiàn)指標(biāo)有哪些方面()
A.來(lái)源分析
B.受訪分析
C.訪客分析
D.轉(zhuǎn)化路徑分析3、網(wǎng)站流量數(shù)據(jù)分析的意義有哪些()
A.幫助網(wǎng)站運(yùn)營(yíng)人員獲取網(wǎng)站流量信息
B.從多方面提供網(wǎng)站分析的數(shù)據(jù)依據(jù)
C.幫助提高網(wǎng)站流量
D.提升網(wǎng)站用戶體驗(yàn)
參考答案:一、判斷題
1.錯(cuò)2.對(duì)3.錯(cuò)4.對(duì)
二、單選題
1.A2.C3.B
三、多選題
1.ABC2.ABCD3.ABCD思考與練習(xí)一、判斷題
1、Hadoop是一種分布式系統(tǒng)基礎(chǔ)架構(gòu),主要解決海量數(shù)據(jù)存儲(chǔ)和海量數(shù)據(jù)計(jì)算兩大
問(wèn)題。()2、在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。()
3、在Hadoop分布式集群中,不需要對(duì)集群中的每一個(gè)節(jié)點(diǎn)都進(jìn)行ip規(guī)劃。()
4、利用HDFS操作命令可以將數(shù)據(jù)文件從本地上傳到HDFS上,也可以將數(shù)據(jù)文件
從HDFS下載到本地。()
5、在HDFSAPI操作中,closeFileSystem方法的功能是釋放文件系統(tǒng)對(duì)象的資源。
()
6、MapReduce詞頻統(tǒng)計(jì)案例中,執(zhí)行map任務(wù)的最后階段,會(huì)將緩沖區(qū)的數(shù)據(jù)全部
寫入到磁盤。()
7、Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系統(tǒng),可用于海量
日志采集、聚合和傳輸。()
二、單選題
1、能在網(wǎng)絡(luò)中安全傳輸文件的軟件是()。
A.VMware
B.Xshell
C.IDEA
D.Xftp
2、創(chuàng)建了bigdata用戶的命令是()。
A.subigdata
B.bigdataALL
C.useraddbigdata
D.Sudoers
3、論文(),主要論證的核心是如何采用分布式的架構(gòu)對(duì)海量數(shù)據(jù)進(jìn)行分布式計(jì)算。A.GFS
B.BigTable
C.MapReduce
D.HDFS
4、假如我們?cè)O(shè)定HDFS塊的大小是128M,那么,一個(gè)大小為500M的數(shù)據(jù)文件,將會(huì)被
拆分成()個(gè)分片
A.2
B.3
C.4
D.5
5、在Linux命令行中,使用()命令格式化hive元數(shù)據(jù)庫(kù)
A.format
B.schematool
C.clear
D.del
6、在Hive中給表添加數(shù)據(jù),使用()方式給表添加數(shù)據(jù)效率更高。
A.insertinto
B.Load
C.append
D.Add
7、關(guān)系型數(shù)據(jù)庫(kù)與HDFS之間相互數(shù)據(jù)遷移的工具是()。
A.distcpB.fsck
C.fastcopy
D.sqoop
三、多選題
1、Notepad++功能有()。
A.制作一般的純文字說(shuō)明文件
B.編寫計(jì)算機(jī)程序代碼
C.語(yǔ)法高亮度顯示、語(yǔ)法折疊功能、支持宏、擴(kuò)充基本功能的外掛模組
D.可以連接虛擬機(jī),對(duì)虛擬機(jī)中的文件進(jìn)行編輯。
2、Hadoop主要包含()三大功能組件。
A.YARN
B.Hadoop
C.MapReduce
D.HDFS
3、Hadoop具有()優(yōu)勢(shì)。
A.高可靠性
B.高效性
C.高容錯(cuò)性
D.高擴(kuò)展性
4、下面說(shuō)法正確的是()。
A.JDK是Java語(yǔ)言的開(kāi)發(fā)環(huán)境
B.JDK包含JRE和JVMC.JRE是java運(yùn)行時(shí)的類庫(kù)
D.Java編程的核心就是JVM,JVM是JRE的一部分,它是一個(gè)虛擬出來(lái)的計(jì)算機(jī)。
5、在分布式文件系統(tǒng)HDFS當(dāng)中提供了兩種操作命令,是()。
A.hadoopfs
B.Hadoopdfs
C.hdfsdfs
D.hdfsfs
6、Hive是基于Hadoop技術(shù)的數(shù)據(jù)倉(cāng)庫(kù)工具,用來(lái)對(duì)數(shù)據(jù)進(jìn)行()。
A.提取
B.轉(zhuǎn)化
C.加載
D.分析
7、使用beeline客戶端遠(yuǎn)程訪問(wèn)Hive之前,需要啟動(dòng)的兩個(gè)服務(wù)是()。
A.hive--servicemetastore
B.hive--servermetastore
C.hive--servicehiveserver2
D.hive--servicehiveserver
8、Hive的復(fù)雜數(shù)據(jù)類型有()三種
A.ARRAY
B.MAP
C.STRUCT
D.Char9、成功安裝Zookeeper集群后,查看各節(jié)點(diǎn)的角色信息時(shí),會(huì)看到1個(gè)、多個(gè)()。
A.leader
B.follower
C.zookeeper
D.zkServer
10、Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),是Apache基金會(huì)開(kāi)源的消息隊(duì)列,
該框架由()編寫而成。
A.C++
B.Java
C.Scala
D.Python
參考答案:一、判斷題
1.對(duì)2.對(duì)3.錯(cuò)4.對(duì)5.對(duì)6.對(duì)7.對(duì)
二、單選題
1.D2.C3.C4.C5.B6.B7.D
三、多選題1.ABCD 2.ACD 3.ABCD 4.ABCD 5.AC 6.ABCD 7.BC 8.ABC 9.AB 10.BC思考與練習(xí)
一、判斷題
1、業(yè)務(wù)字段指的是每個(gè)移動(dòng)端固定的、共有的字段;公共字段代表的是用戶在app中
執(zhí)行過(guò)的所有操作。()
2、在Flume過(guò)程中,F(xiàn)lume對(duì)接本地磁盤文件,通過(guò)tailDir類型實(shí)時(shí)監(jiān)控當(dāng)前數(shù)據(jù)文
件中數(shù)據(jù)內(nèi)容的變化。()
3、ETL攔截器主要用于過(guò)濾時(shí)間戳不合法和json數(shù)據(jù)不完整的日志。()
4、Flume分流標(biāo)記攔截器主要是用于區(qū)分啟動(dòng)日志和事件日志。()
二、單選題
1、以下關(guān)于Flume的說(shuō)法正確的是____。()
A.Event是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>
B.Sink是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>
C.Channel是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>
D.Source是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>
2、Flume通過(guò)內(nèi)部的采集數(shù)據(jù)傳輸機(jī)制進(jìn)行快速的數(shù)據(jù)傳輸,傳輸完之后會(huì)將數(shù)據(jù)就
存儲(chǔ)到____中。()
A.Source
B.Channel
C.Kafka
D.HDFS
3、可以使用____命令,啟動(dòng)Kafka的一個(gè)消費(fèi)者。()。
A.kafka-console-consumer.shB.kafka-server-start.sh
C.kafka-topics.sh
D.kafka-console-producer.sh
4、在Flume消費(fèi)的整體流程中,第一部分是別名配置,在別名配置的過(guò)程當(dāng)中,配置了兩
個(gè)數(shù)據(jù)流用來(lái)處理()。
A.ETL和分流標(biāo)記攔截器
B.啟動(dòng)日志數(shù)據(jù)和事件日志數(shù)據(jù)
C.Flume環(huán)境變量
D.Flume數(shù)據(jù)消費(fèi)腳本
三、多選題
1、在Flume數(shù)據(jù)傳輸?shù)倪^(guò)程中,當(dāng)source將數(shù)據(jù)傳遞給channel時(shí),數(shù)據(jù)會(huì)先后經(jīng)過(guò)
()兩個(gè)攔截器。
A.ETL攔截器
B.時(shí)間戳攔截器
C.Flume分流標(biāo)記攔截器
D.UUID攔截器
2、Flume的安裝與部署可以分為下列哪三個(gè)步驟()。
A.將Flume安裝包上傳至Linux操作系統(tǒng)
B.解壓到指定目錄,進(jìn)行環(huán)境變量的配置
C.在Flume的配置文件中修改指定配置
D.啟動(dòng)Flume數(shù)據(jù)消費(fèi)腳本參考答案:
一、判斷題
1.錯(cuò)2.對(duì)3.對(duì)4.對(duì)
二、單選題
1.A2.C3.A4.B
三、多選題
1.AC2.ABC思考與練習(xí)
一、判斷題
1、在數(shù)據(jù)倉(cāng)庫(kù)中,ODS層的作用是保持?jǐn)?shù)據(jù)原貌,不做任何修改,起到備份數(shù)據(jù)的作
用()
2、在數(shù)據(jù)倉(cāng)庫(kù)中,DWD層的作用是對(duì)數(shù)據(jù)進(jìn)行清洗()
3、在ADS層中,通過(guò)在啟動(dòng)日志中統(tǒng)計(jì)不同設(shè)備ID出現(xiàn)的次數(shù)來(lái)分析用戶活躍?
()
4、在ADS層中,按照設(shè)備ID對(duì)日活表分組,登錄次數(shù)為1,且在一周前登錄的這種分析方式,分析沉默用戶?()
5、DWS層統(tǒng)計(jì)各個(gè)主題對(duì)象的當(dāng)天行為,服務(wù)于DWT層的主題寬表。DWS層的寬
表字段,是站在不同維度的角度去看事實(shí)表,重點(diǎn)關(guān)注事實(shí)表的度量值,通過(guò)與之關(guān)聯(lián)的事
實(shí)表,獲得不同的事實(shí)表的度量值()
二、單選題
1、在數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目中,我們?cè)贒WD層使用()手段清洗數(shù)據(jù)
A.RDD
B.Kettle
C.SQL
D.Python
2、在數(shù)據(jù)倉(cāng)庫(kù)中,用于數(shù)據(jù)清洗的是哪個(gè)層()
A.ODS
B.DWD
C.DWS
D.DWT
三、多選題
1、數(shù)據(jù)倉(cāng)庫(kù)一般分為()
A.ODS
B.DWD
C.DWS
D.DWT
E.ADS2、在數(shù)據(jù)倉(cāng)庫(kù)DWD層中,需要清洗哪些數(shù)據(jù)()
A.空值的去除
B.過(guò)濾核心字段
C.將用戶行為寬表和業(yè)務(wù)表進(jìn)行數(shù)據(jù)一致處理
D.創(chuàng)建分區(qū)表
3、在數(shù)據(jù)倉(cāng)庫(kù)中,ODS層做了什么業(yè)務(wù)()
A.保持?jǐn)?shù)據(jù)原貌
B.采用LZO壓縮
C.創(chuàng)建分區(qū)表
D.空去除
參考答案:
一、判斷題
1.對(duì)2.對(duì)3.對(duì)4.對(duì)5.對(duì)
二、單選題
1.C2.B
三、多選題1.ABCDE2.ABC3.ABC思考與練習(xí)一、判斷題
1、使用pyecharts工具繪圖時(shí),可直接進(jìn)行圖表的繪制,無(wú)需在程序中導(dǎo)入對(duì)應(yīng)的
圖表類。()
2、使用pyecharts工具繪圖時(shí),可以通過(guò)設(shè)置初始化配置項(xiàng)中的圖表ID,設(shè)置圖表
的唯一標(biāo)識(shí),以此來(lái)區(qū)分多個(gè)圖表。()
3、餅圖常用于表示不同分類的占比情況,通過(guò)弧度大小來(lái)對(duì)比各種分類。()
二、單選題
1、MySQL中,用于創(chuàng)建數(shù)據(jù)庫(kù)的命令是()。
A.dropdatabase數(shù)據(jù)庫(kù)名
B.use數(shù)據(jù)庫(kù)名
C.createtable數(shù)據(jù)庫(kù)名
D.createdatabase數(shù)據(jù)庫(kù)名
2、使用sqoop進(jìn)行從Hive到MySQL數(shù)據(jù)庫(kù)的數(shù)據(jù)遷移時(shí),其命令為()。125
第1章
A.sqoopimport
B.sqoopexport
C.sqoopjob
D.sqoopmerge
3、pyecharts中,柱狀圖類是()。
A.Bar
B.Line
C.Pie
D.Liquid
4、pyecharts中,餅圖類是()。
A.Bar
B.Line
C.Pie
D.Liquid
5、全局配置項(xiàng)可通過(guò)()方法設(shè)置。
A.add_yaxis
B.set_global_opts
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)文化宣傳合同范例
- 農(nóng)村裝修貸款合同范本
- 2021-2026年中國(guó)電力維護(hù)合板市場(chǎng)競(jìng)爭(zhēng)策略及行業(yè)投資潛力預(yù)測(cè)報(bào)告
- 中醫(yī)私承合同范本
- 一租房合同范本個(gè)人
- 獸藥代加工合同范本
- 上海汽車租車合同范本
- 保潔補(bǔ)簽合同范本
- 2025年度酒水行業(yè)知識(shí)產(chǎn)權(quán)保護(hù)與糾紛解決合同范本
- 勞務(wù)公司之間合同范本
- 《病史采集》課件
- 十大護(hù)理安全隱患
- 2025年新生兒黃疸診斷與治療研究進(jìn)展
- 廣東大灣區(qū)2024-2025學(xué)年度高一上學(xué)期期末統(tǒng)一測(cè)試英語(yǔ)試題(無(wú)答案)
- 失效模式和效應(yīng)分析護(hù)理
- 2025年四川中煙工業(yè)限責(zé)任公司招聘110人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025山東能源集團(tuán)新能源限公司招聘12人管理單位筆試遴選500模擬題附帶答案詳解
- 課題申報(bào)書:反饋對(duì)青少年努力投入的影響機(jī)制及干預(yù)研究
- 康復(fù)評(píng)定頸椎病
- 公司章程范本(完整版)
- 廠房委托經(jīng)營(yíng)管理合同范本
評(píng)論
0/150
提交評(píng)論