考試day16附有答案_第1頁
考試day16附有答案_第2頁
考試day16附有答案_第3頁
考試day16附有答案_第4頁
考試day16附有答案_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

考試day16[復(fù)制]以下關(guān)于sparkstreaming說法正確的是[單選題]*sparkstreaming分布式微批架構(gòu)(正確答案)sparkstreaming實時存儲架構(gòu)sparkstreaming是普通存儲架構(gòu)sparkstreaming分布式實時計算架構(gòu)storm和

spark

streaming

最大的區(qū)別

)[單選題]*科學(xué)統(tǒng)計支持是否具有schema是否是真正的實時計算框架(正確答案)不同公司的產(chǎn)品下面哪個不是RDD的特點[單選題]*可分區(qū)可序列化可修改(正確答案)可持久化spark默認(rèn)的存儲級別[單選題]*MEMORY_ONLY(正確答案)MEMORY_ONLY_SERMEMORY_AND_DISKMEMORY_AND_DISK_SERSpark是一種快速、通用、可擴展的()分析引擎[單選題]*大數(shù)據(jù)(正確答案)電商J2EE查詢下面哪個端口不是spark自帶服務(wù)的端口[單選題]*80808090(正確答案)180804040spark中的實時計算系統(tǒng)是哪個[單選題]*spark

corespark

streaming(正確答案)mlbaseGrophxspark組件不包含哪個[單選題]*sparkcorehdfs(正確答案)Graphxsparkstreamingspark以高效的方式處理()數(shù)據(jù)集[單選題]*單機集中式分布式(正確答案)NOSQLspark中reduceByKey算子具有以下哪個特性[單選題]*延遲執(zhí)行(正確答案)立即執(zhí)行一致性冗余性spark中資源管理的主節(jié)點[單選題]*master(正確答案)workerapplicationdriverstage的task數(shù)量是由什么決定的[單選題]*partition(正確答案)jobstagetaskschedulerspark中的flatmap算子的特性是以下哪個選項[單選題]*輸入輸出是一對一關(guān)系輸入輸出是一對多關(guān)系(正確答案)輸入輸出是多對多關(guān)系輸入輸出是多對一spark中的map算子適合處理以下哪種類型的數(shù)據(jù)[單選題]*簡單類型的數(shù)據(jù)(正確答案)key,value格式的數(shù)據(jù)復(fù)合類型的數(shù)據(jù)NTFS類型的數(shù)據(jù)spark中的maptoPair算子適合處理以下哪種類型的數(shù)據(jù)[單選題]*簡單類型的數(shù)據(jù)key,value格式的數(shù)據(jù)(正確答案)復(fù)合類型的數(shù)據(jù)NTFS類型的數(shù)據(jù)DataFrame和RDD最大的區(qū)別是什么[單選題]*科學(xué)統(tǒng)計支持多了schema(正確答案)存儲方式不一樣外部數(shù)據(jù)源支持RDD.reduceByKey()說法正確的是[單選題]*排序按key匯總(正確答案)分詞打印前5行RDD.takeOrdered()說法正確的是[單選題]*降序排列順序排列(正確答案)分組統(tǒng)計打印前5行spark是基于內(nèi)存計算的框架,以下不屬于spark組件的是[單選題]*SQLStreamingGraphXMahout(正確答案)spark內(nèi)部集成的資源調(diào)度框架是哪個[單選題]*driverstandalone(正確答案)masteryarnSparkStreaming支持的數(shù)據(jù)輸入源包括如下那些選項?*Kafka(正確答案)Flume(正確答案)Twitter(正確答案)ZeroMQ和簡單的TCP套接字(正確答案)SparkStreaming結(jié)果也能保存在很多地方比如如下那些選項?*HDFS(正確答案)數(shù)據(jù)庫(正確答案)Dashboards(正確答案)zookeeperpartition的哪些屬性是在spark進(jìn)行數(shù)據(jù)切分的時候決定的*partition大小(正確答案)partition個數(shù)(正確答案)partiton的所有者parrtition的一切下列spark算子中可以將數(shù)據(jù)持久化到硬盤上的算子是哪些*persist(正確答案)checkpoint(正確答案)cachemapspark中的distinct算子是由以下哪兩種算子實現(xiàn)的*map算子(正確答案)groupbykey算子(正確答案)reducebykey算子orderby算子spark框架的API支持哪種語言進(jìn)行開發(fā)*java(正確答案)python(正確答案)scala(正確答案)goETL指的是?*抽取(正確答案)轉(zhuǎn)換(正確答案)加載(正確答案)統(tǒng)計下列屬于Spark的優(yōu)點是*運算速度是HadoopMapReduce的10到100倍(正確答案)容易使用,支持多種語言開發(fā)(正確答案)方便部署,可以連接各種數(shù)據(jù)源(正確答案)不可以進(jìn)行機器學(xué)習(xí)以下屬于sparkrdd的方法的是*first(正確答案)count(正確答案)collect(正確答案)head對于spark框架的說法正確的是*運算速度是HadoopMapReduce的10到100倍(正確答案)容易使用,支持多種語言開發(fā)(正確答案)方便部署,可以連接各種數(shù)據(jù)源(正確答案)不可以進(jìn)行機器學(xué)習(xí)SparkStreaming類似于ApacheStorm,用于流式數(shù)據(jù)的處理[判斷題]*對(正確答案)錯SparkStreaming有高吞吐量和容錯能力強等特點[判斷題]*對(正確答案)錯SparkStreaming數(shù)據(jù)輸入后可以用Spark的高度抽象原語如:map、reduce、join、window等進(jìn)行運算[判斷題]*對(正確答案)錯DiscretizedStream是SparkStreaming的基礎(chǔ)抽象,代表持續(xù)性的數(shù)據(jù)流和經(jīng)過各種Spark原語操作后的結(jié)果數(shù)據(jù)流[判斷題]*對(正確答案)錯spark架構(gòu)本身就具有讀取hdfs數(shù)據(jù)的方法[判斷題]*對錯(正確答案)DStream是一系列連續(xù)的RDD來表示。每個RDD含有一段時間間隔內(nèi)的數(shù)據(jù)[判斷題]*對(正確答案)錯Storm架構(gòu)是一個實時的流式計算框架[判斷題]*對(正確答案)錯spark架構(gòu)在運行過程中是通過driver完成資源申請[判斷題]*對(正確答

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論