Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn)(山西職業(yè)技術(shù)學(xué)院)知到智慧樹答案_第1頁
Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn)(山西職業(yè)技術(shù)學(xué)院)知到智慧樹答案_第2頁
Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn)(山西職業(yè)技術(shù)學(xué)院)知到智慧樹答案_第3頁
Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn)(山西職業(yè)技術(shù)學(xué)院)知到智慧樹答案_第4頁
Hadoop大數(shù)據(jù)技術(shù)與項(xiàng)目實(shí)戰(zhàn)(山西職業(yè)技術(shù)學(xué)院)知到智慧樹答案_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

緒論單元測試第一章單元測試第二章單元測試第三章單元測試第四章單元測試第五章單元測試1【單選題】(2分)下列對大數(shù)據(jù)的特點(diǎn)描述不正確的是()正確答案:CA.數(shù)據(jù)體量巨大B.速度要求快C.價值密度高D.數(shù)據(jù)類型多樣1【判斷題】(1分)云主機(jī)和物理機(jī)的壽命都是永久性的。()正確答案:AA.錯B.對2【判斷題】(1分)對于實(shí)時性要求高的應(yīng)用,需要應(yīng)用實(shí)時處理架構(gòu)。()正確答案:AA.對B.錯3【判斷題】(1分)數(shù)據(jù)倉庫是用來存儲數(shù)據(jù)的而不是分析數(shù)據(jù)的。()正確答案:BA.對B.錯4【判斷題】(1分)在DWS層中,用戶行為日志數(shù)據(jù)分為公共字段和事件字段。()正確答案:AA.對B.錯5【單選題】(2分)項(xiàng)目實(shí)施流程中沒有哪一步()正確答案:AA.下載數(shù)據(jù)B.數(shù)據(jù)倉庫設(shè)計(jì)開發(fā)C.數(shù)據(jù)訪問D.數(shù)據(jù)導(dǎo)出6【單選題】(2分)數(shù)據(jù)分析在企業(yè)中的作用()正確答案:BA.幫助企業(yè)經(jīng)營者平衡企業(yè)的收益B.直接的獲取經(jīng)營的利潤C(jī).干預(yù)經(jīng)營者的決策D.幫助企業(yè)經(jīng)營者減少投入7【單選題】(2分)數(shù)據(jù)結(jié)構(gòu)中哪項(xiàng)不是頁面入口的來源()正確答案:BA.應(yīng)用首頁B.登錄頁C.詳情頁D.push8【多選題】(3分)Hadoop的三大發(fā)行版本是()正確答案:ABCA.ApacheB.HDPC.CDHD.Java9【多選題】(3分)流量分析常見指標(biāo)有哪些方面()正確答案:ABCDA.受訪分析B.轉(zhuǎn)化路徑分析C.來源分析D.訪客分析10【多選題】(3分)網(wǎng)站流量數(shù)據(jù)分析的意義有哪些()正確答案:ABCDA.幫助提高網(wǎng)站流量B.提升網(wǎng)站用戶體驗(yàn)C.幫助網(wǎng)站運(yùn)營人員獲取網(wǎng)站流量信息D.從多方面提供網(wǎng)站分析的數(shù)據(jù)依據(jù)1【判斷題】(1分)Hadoop是一種分布式系統(tǒng)基礎(chǔ)架構(gòu),主要解決海量數(shù)據(jù)存儲和海量數(shù)據(jù)計(jì)算兩大問題。()正確答案:AA.對B.錯2【判斷題】(1分)在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。()正確答案:BA.錯B.對3【判斷題】(1分)在Hadoop分布式集群中,不需要對集群中的每一個節(jié)點(diǎn)都進(jìn)行ip規(guī)劃。()正確答案:AA.錯B.對4【判斷題】(1分)利用HDFS操作命令可以將數(shù)據(jù)文件從本地上傳到HDFS上,也可以將數(shù)據(jù)文件從HDFS下載到本地。()正確答案:AA.對B.錯5【判斷題】(1分)在HDFSAPI操作中,closeFileSystem方法的功能是釋放文件系統(tǒng)對象的資源。()正確答案:BA.錯B.對6【判斷題】(1分)MapReduce詞頻統(tǒng)計(jì)案例中,執(zhí)行map任務(wù)的最后階段,會將緩沖區(qū)的數(shù)據(jù)全部寫入到磁盤。()正確答案:BA.錯B.對7【判斷題】(1分)Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系統(tǒng),可用于海量日志采集、聚合和傳輸。()正確答案:BA.錯B.對8【單選題】(2分)能在網(wǎng)絡(luò)中安全傳輸文件的軟件是()。正確答案:DA.XshellB.IDEAC.VMwareD.Xftp9【單選題】(2分)創(chuàng)建了bigdata用戶的命令是()。正確答案:DA.subigdataB.SudoersC.bigdataALLD.useraddbigdata10【單選題】(2分)論文(),主要論證的核心是如何采用分布式的架構(gòu)對海量數(shù)據(jù)進(jìn)行分布式計(jì)算。正確答案:DA.GFSB.HDFSC.BigTableD.MapReduce11【單選題】(2分)假如我們設(shè)定HDFS塊的大小是128M,那么,一個大小為500M的數(shù)據(jù)文件,將會被拆分成()個分片正確答案:AA.4B.2C.3D.512【單選題】(2分)在Linux命令行中,使用()命令格式化hive元數(shù)據(jù)庫正確答案:BA.clearB.schematoolC.delD.format13【單選題】(2分)在Hive中給表添加數(shù)據(jù),使用()方式給表添加數(shù)據(jù)效率更高。正確答案:CA.insertintoB.appendC.LoadD.Add14【單選題】(2分)關(guān)系型數(shù)據(jù)庫與HDFS之間相互數(shù)據(jù)遷移的工具是()。正確答案:AA.sqoopB.fastcopyC.distcpD.fsck15【多選題】(3分)Notepad++功能有()。正確答案:ABCDA.語法高亮度顯示、語法折疊功能、支持宏、擴(kuò)充基本功能的外掛模組B.編寫計(jì)算機(jī)程序代碼C.可以連接虛擬機(jī),對虛擬機(jī)中的文件進(jìn)行編輯。D.制作一般的純文字說明文件16【多選題】(3分)Hadoop主要包含()三大功能組件。正確答案:ACDA.MapReduceB.HadoopC.HDFSD.YARN17【多選題】(3分)Hadoop具有()優(yōu)勢。正確答案:ABCDA.高容錯性B.高可靠性C.高擴(kuò)展性D.高效性18【多選題】(3分)下面說法正確的是()。正確答案:ABCDA.JDK包含JRE和JVMB.JRE是java運(yùn)行時的類庫C.JDK是Java語言的開發(fā)環(huán)境D.Java編程的核心就是JVM,JVM是JRE的一部分,它是一個虛擬出來的計(jì)算機(jī)。19【多選題】(3分)在分布式文件系統(tǒng)HDFS當(dāng)中提供了兩種操作命令,是()。正確答案:ADA.hdfsdfsB.HadoopdfsC.hdfsfsD.hadoopfs20【多選題】(3分)Hive是基于Hadoop技術(shù)的數(shù)據(jù)倉庫工具,用來對數(shù)據(jù)進(jìn)行()。正確答案:ABCDA.加載B.分析C.轉(zhuǎn)化D.提取21【多選題】(3分)使用beeline客戶端遠(yuǎn)程訪問Hive之前,需要啟動的兩個服務(wù)是()。正確答案:ADA.hive--servermetastoreB.hive--servicemetastoreC.hive--servicehiveserverD.hive--servicehiveserver222【多選題】(3分)Hive的復(fù)雜數(shù)據(jù)類型有()三種正確答案:ABDA.MAPB.STRUCTC.CharD.ARRAY23【多選題】(3分)成功安裝Zookeeper集群后,查看各節(jié)點(diǎn)的角色信息時,會看到1個、多個()。正確答案:ABA.followerB.leaderC.zookeeperD.zkServer24【多選題】(3分)Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),是Apache基金會開源的消息隊(duì)列,該框架由()編寫而成。正確答案:CDA.PythonB.C++C.ScalaD.Java1【判斷題】(1分)業(yè)務(wù)字段指的是每個移動端固定的、共有的字段;公共字段代表的是用戶在app中執(zhí)行過的所有操作。()正確答案:AA.錯B.對2【判斷題】(1分)在Flume過程中,F(xiàn)lume對接本地磁盤文件,通過tailDir類型實(shí)時監(jiān)控當(dāng)前數(shù)據(jù)文件中數(shù)據(jù)內(nèi)容的變化。()正確答案:BA.錯B.對3【判斷題】(1分)ETL攔截器主要用于過濾時間戳不合法和json數(shù)據(jù)不完整的日志。()正確答案:BA.錯B.對4【判斷題】(1分)Flume分流標(biāo)記攔截器主要是用于區(qū)分啟動日志和事件日志。()正確答案:BA.錯B.對5【單選題】(2分)以下關(guān)于Flume的說法正確的是____。()正確答案:DA.Source是Flume數(shù)據(jù)傳輸?shù)幕締卧狟.Sink是Flume數(shù)據(jù)傳輸?shù)幕締卧狢.Channel是Flume數(shù)據(jù)傳輸?shù)幕締卧狣.Event是Flume數(shù)據(jù)傳輸?shù)幕締卧?【單選題】(2分)Flume通過內(nèi)部的采集數(shù)據(jù)傳輸機(jī)制進(jìn)行快速的數(shù)據(jù)傳輸,傳輸完之后會將數(shù)據(jù)就存儲到____中。()正確答案:AA.KafkaB.SourceC.HDFSD.Channel7【單選題】(2分)可以使用____命令,啟動Kafka的一個消費(fèi)者。()。正確答案:AA.kafka-console-consumer.shB.kafka-server-start.shC.kafka-topics.shD.kafka-console-producer.sh8【單選題】(2分)在Flume消費(fèi)的整體流程中,第一部分是別名配置,在別名配置的過程當(dāng)中,配置了兩個數(shù)據(jù)流用來處理()。正確答案:DA.Flume環(huán)境變量B.Flume數(shù)據(jù)消費(fèi)腳本C.ETL和分流標(biāo)記攔截器D.啟動日志數(shù)據(jù)和事件日志數(shù)據(jù)9【多選題】(3分)在Flume數(shù)據(jù)傳輸?shù)倪^程中,當(dāng)source將數(shù)據(jù)傳遞給channel時,數(shù)據(jù)會先后經(jīng)過()兩個攔截器。正確答案:CDA.UUID攔截器B.時間戳攔截器C.ETL攔截器D.Flume分流標(biāo)記攔截器10【多選題】(3分)Flume的安裝與部署可以分為下列哪三個步驟()。正確答案:ACDA.將Flume安裝包上傳至Linux操作系統(tǒng)B.啟動Flume數(shù)據(jù)消費(fèi)腳本C.在Flume的配置文件中修改指定配置D.解壓到指定目錄,進(jìn)行環(huán)境變量的配置1【判斷題】(1分)在數(shù)據(jù)倉庫中,ODS層的作用是保持?jǐn)?shù)據(jù)原貌,不做任何修改,起到備份數(shù)據(jù)的作用()正確答案:AA.對B.錯2【判斷題】(1分)在數(shù)據(jù)倉庫中,DWD層的作用是對數(shù)據(jù)進(jìn)行清洗()正確答案:BA.錯B.對3【判斷題】(1分)在ADS層中,通過在啟動日志中統(tǒng)計(jì)不同設(shè)備ID出現(xiàn)的次數(shù)來分析用戶活躍?()正確答案:AA.對B.錯4【判斷題】(1分)在ADS層中,按照設(shè)備ID對日活表分組,登錄次數(shù)為1,且在一周前登錄的這種分析方式,分析沉默用戶?()正確答案:BA.錯B.對5【判斷題】(1分)DWS層統(tǒng)計(jì)各個主題對象的當(dāng)天行為,服務(wù)于DWT層的主題寬表。DWS層的寬表字段,是站在不同維度的角度去看事實(shí)表,重點(diǎn)關(guān)注事實(shí)表的度量值,通過與之關(guān)聯(lián)的事實(shí)表,獲得不同的事實(shí)表的度量值()正確答案:BA.錯B.對6【單選題】(2分)在數(shù)據(jù)倉庫項(xiàng)目中,我們在DWD層使用()手段清洗數(shù)據(jù)正確答案:CA.KettleB.PythonC.SQLD.RDD7【單選題】(2分)在數(shù)據(jù)倉庫中,用于數(shù)據(jù)清洗的是哪個層()正確答案:BA.DWSB.DWDC.DWTD.ODS8【多選題】(3分)數(shù)據(jù)倉庫一般分為()正確答案:ABCDEA.ADSB.ODSC.DWTD.DWSE.DWD9【多選題】(3分)在數(shù)據(jù)倉庫DWD層中,需要清洗哪些數(shù)據(jù)()正確答案:BCDA.創(chuàng)建分區(qū)表B.過濾核心字段C.將用戶行為寬表和業(yè)務(wù)表進(jìn)行數(shù)據(jù)一致處理D.空值的去除10【多選題】(3分)在數(shù)據(jù)倉庫中,ODS層做了什么業(yè)務(wù)()正確答案:ABCA.采用LZO壓縮B.保持?jǐn)?shù)據(jù)原貌C.創(chuàng)建分區(qū)表D.空去除1【單選題】(2分)MySQL中,用于創(chuàng)建數(shù)據(jù)庫的命令是()。正確答案:CA.dropdatabase數(shù)據(jù)庫名;B.use數(shù)據(jù)庫名;C.createdatabase數(shù)據(jù)庫名;D.createtable數(shù)據(jù)庫名;2【單選題】(2分)使用sqoop進(jìn)行從Hive到MySQL數(shù)據(jù)庫的數(shù)據(jù)遷移時,其命令為()。正確答案:DA.sqoopimportB.sqoopmergeC.sqoopjobD.sqoopexport3【單選題】(2分)pyecharts中,柱狀圖類是()。正確答案:DA.LineB.PieC.LiquidD.Bar4【單選題】(2分)pyecharts中,餅圖類是()。正確答案:CA.BarB.LineC.PieD.Liquid5【單選題】(2分)全局配置項(xiàng)可通過()方法設(shè)置。正確答案:BA.add_yaxisB.set_global_optsC.set_series_optsD.reversal_axis6【判斷題】(1分)使用pyecharts工具繪圖時,可直接進(jìn)行圖表的繪制,無需在程序中導(dǎo)入對應(yīng)的圖表類。()正確答案:AA.錯B.對7【判斷題】(1分)使用pyecharts工具繪圖時,可以通過設(shè)置初始化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論