版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
阿里云ACA大數(shù)據(jù)復(fù)習(xí)題
一、選擇題
1.隨著數(shù)據(jù)爆炸式增長,傳統(tǒng)數(shù)據(jù)體系結(jié)構(gòu)已經(jīng)難以有效的處理大量數(shù)據(jù)集的數(shù)據(jù),主要是因為大數(shù)
據(jù)()[多選題]*
A、體量大V
B、來源多樣V
C、生成極快V
D、變化周期慢
E、多變V
2.大數(shù)據(jù)時代傳統(tǒng)數(shù)據(jù)架構(gòu)或典型數(shù)據(jù)庫軟件工具在處理海量數(shù)據(jù)時存在哪些方面的問題?()[多選
題]*
A、海量數(shù)據(jù)收集V
B、海量數(shù)據(jù)存儲V
C、海量數(shù)據(jù)管理V
D、海量數(shù)據(jù)的分析V
E、數(shù)據(jù)的共享訪問
3.在大數(shù)據(jù)大規(guī)模應(yīng)用階段,大數(shù)據(jù)的特征已經(jīng)發(fā)展到了8V。下列選項中屬于8V新特性的是()[多
選題]*
A."Veracity準確性"V
B."Virtual虛擬性"
C."Visualization可視性"V
D.”Validity合法性"V
E.”Vitality動態(tài)性7
4.在《大數(shù)據(jù)時代》一書中,維克托?邁爾-舍恩伯格和肯尼斯可耶提出大數(shù)據(jù)的"4V"特征。"4V"
特征包含()[多選題]*
A.Volume規(guī)模性V
B.Vitality動態(tài)性
C.Velocity高速性V
D.Variety多樣性V
E.Value價值性V
5.IBM提出的大數(shù)據(jù)"5V"特征和《大數(shù)據(jù)時代》一書中提出的“4V"的區(qū)別在于哪一個特征()[單
選題]*
A.Volume規(guī)模性
B.Veracity準確性V
C.Velocity高速性
D.Variety多樣性
E.Value價值性
6.大數(shù)據(jù)4V特征之一是"Value”,表明大數(shù)據(jù)本身具有價值,其提供的核心價值是(1[單選題]*
A.單位數(shù)據(jù)價值高,整體數(shù)據(jù)價值低
B.洞察與預(yù)測V
C.存儲與計算
D.資源優(yōu)化配置
E.傳統(tǒng)企業(yè)轉(zhuǎn)型
7.大數(shù)據(jù)的特征,由維克托邁爾-舍恩伯格和肯尼斯克耶編寫的《大數(shù)據(jù)時代》中提出,下哪一個描述
大數(shù)據(jù)的4V特征是錯誤的?()[單選題]*
A.Volume規(guī)模性
B.Velocity數(shù)據(jù)變化快
C.Value單位數(shù)據(jù)價值密度高V
D.Variety數(shù)據(jù)類型多
8.IBM提出的大數(shù)據(jù)"5V"特征和《大數(shù)據(jù)時代》一書中提出的“4V"的區(qū)別在于哪一個特征()[單
選題]*
A.Volume規(guī)模性
B.Veracity準確性V
C.Velocity高速性
D.Variety多樣性
EValue價值性
9.伴隨互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)據(jù)呈現(xiàn)出爆炸性增長。數(shù)據(jù)的存儲單位從過去的GB到TB,甚至達到
PB、EB。體現(xiàn)出大數(shù)據(jù)的()特征。[單選題]*
A.Volume規(guī)模性V
B.Veracity準確性
C.Velocity高速性
D.Variety多樣性
E.Value價值性
10.數(shù)據(jù)的種類和來源多樣化。包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),具體表現(xiàn)為網(wǎng)絡(luò)日志、音頻、
視頻、圖片、地理位置信息等等,多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。體現(xiàn)了大數(shù)據(jù)的()
特征。[單選題]*
A.Volume規(guī)模性
B.Veracity準確性
C.Velocity高速性
D.Variety多樣性V
E.Value價值性
11.商業(yè)上要求個性化推薦算法達到實時推薦的效果,如:某網(wǎng)站剛剛發(fā)布的新聞或視頻,用戶可以在
幾分鐘甚至更短的內(nèi)搜索到。體現(xiàn)了大數(shù)據(jù)的()特征。[單選題]*
A.Volume規(guī)模性
B.Veracity準確性
C.Velocity高速性V
D.Variety多樣性
E.Value價值性
12.阿里的"淘寶小貸,通過對貸款客戶、供應(yīng)商、經(jīng)營信用等全方位的評估,就可以在沒有見面情
況下,給客戶放款,這需要在海量的數(shù)據(jù)中判斷客戶的信用。在大數(shù)據(jù)應(yīng)用中有效客戶量或數(shù)據(jù)量,并不
是數(shù)據(jù)越大這個值越高,而是反比。體現(xiàn)了大數(shù)據(jù)的()特征。[單選題]*
A.Volume規(guī)模性
B.Veracity準確性
C.Velocity高速性
D.Variety多樣性
E.Value價值性V
13.我們購買電影票前,常常會打開支付寶的"電影演出"小程序,看看電影口碑評分,影評的真實
性會影響消費者的購買行為。收集的數(shù)據(jù)有真有假,那么會對大數(shù)據(jù)分析的結(jié)果有影響。體現(xiàn)了大數(shù)據(jù)的
()特征。[單選題]*
A.Volume規(guī)模性
B.Veracity準確性V
C.Velocity高速性
D.Variety多樣性
E.Value價值性
14.數(shù)據(jù)可視化指使用()等工具對數(shù)據(jù)進行編碼,在視覺上傳達定量信息。[多選題]*
A.點V
B.線V
C.二維數(shù)據(jù)庫表
D.統(tǒng)計圖或信息圖表V
E.圖表V
15.大數(shù)據(jù)處理流程一般分為5個步驟:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、(\數(shù)據(jù)分析與挖掘、數(shù)據(jù)可視化。[單
選題]*
A.數(shù)據(jù)存儲V
B.數(shù)據(jù)計算
C.數(shù)據(jù)集成
D.數(shù)據(jù)歸約
16.數(shù)據(jù)采集是數(shù)據(jù)預(yù)處理的第一步,它是指使用技術(shù)手段進行(\[單選題]*
A.數(shù)據(jù)存儲V
B.數(shù)據(jù)分析
C.數(shù)據(jù)收集
D.數(shù)據(jù)挖掘
17.數(shù)據(jù)預(yù)處理是將原始數(shù)據(jù)轉(zhuǎn)換為可理解的格式的過程,數(shù)據(jù)預(yù)處理的步驟不包含的選項是?()[單
選題]*
A.數(shù)據(jù)集成
B.數(shù)據(jù)清洗
C.數(shù)據(jù)脫敏V
D.數(shù)據(jù)歸約
E.數(shù)據(jù)變換
18.有專家在總結(jié)人類科研方式的時候,指出人類一共歷經(jīng)了經(jīng)驗科學(xué)、理論科學(xué)、計算科學(xué)和數(shù)據(jù)
密集型科學(xué)四種科研方式,其中數(shù)據(jù)密集型科學(xué)的代表實驗是?()[單選題]*
A.典型案例:伽利略球體落地實驗
B.典型案例:阿基米德浮力定律
C.典型案例:超級計算機模擬核爆炸實驗
D.典型案例:大數(shù)據(jù)提速藥物研發(fā)的應(yīng)用V
19.案例:政務(wù)數(shù)據(jù)中臺匯聚了自然人、法人組織、城市資產(chǎn)、城市感知、行為事件、地理空間、宏觀
經(jīng)濟、自然資源、公共服務(wù)、電子證照十大主題政務(wù)數(shù)據(jù),開展模型治理和數(shù)據(jù)清洗加工,事前以標準事
項庫為最佳實踐優(yōu)化地方事項庫,事中提供統(tǒng)一的標準數(shù)據(jù)服務(wù),事后對辦件庫分析得出優(yōu)化點反過來豐
富標準事項庫,形成事前事中事后的閉環(huán)。政務(wù)數(shù)據(jù)中臺基于政務(wù)行業(yè)數(shù)據(jù)模型及智能算法,助力各地政
府快速構(gòu)建數(shù)據(jù)智能應(yīng)用,提升各地區(qū)各部門網(wǎng)上政務(wù)服務(wù)水平。該案例體現(xiàn)了大數(shù)據(jù)在()領(lǐng)域的應(yīng)用。
[單選題]*
A.電商
B.人工智能
C.金融風(fēng)險管控
D.政府決策V
20.云計算是與信息技術(shù)、軟件、互聯(lián)網(wǎng)相關(guān)的一種服務(wù),這種計算資源共享池叫做"云",云計算把
許多計算資源集合起來,通過軟件實現(xiàn)自動化管理,只需要很少的人參與,就能讓資源被快速提供。關(guān)于
云計算的特點,描述正確的是?()[多選題]*
A.超大規(guī)模計算V
B.虛擬化V
C.通用性V
D.成本增加
E.維護難度加大
21.云計算的計算能力作為一種商品,可以在互聯(lián)網(wǎng)上流通,就像水、電、煤氣一樣,可以方便地取
用。體現(xiàn)了云計算的特點是()[單選題]*
A.通用性
B.動態(tài)擴展
C.按需服務(wù)V
D.虛擬化
22.云計算和大數(shù)據(jù)的關(guān)系密不可分,下列關(guān)于云計算和大數(shù)據(jù)的關(guān)系,描述正確的是()[多選題]*
A.大數(shù)據(jù)為云計算提供了技術(shù)基礎(chǔ)
B.云計算為大數(shù)據(jù)提供用武之地
C.云計算解決大數(shù)據(jù)應(yīng)用中存在的存儲、計算等問題,所以云計算是大數(shù)據(jù)的一種技術(shù)展現(xiàn)形式”
D大數(shù)據(jù)是以海量數(shù)據(jù)為基礎(chǔ),為各種計算服務(wù)技術(shù)提供數(shù)據(jù)支撐,保證技術(shù)應(yīng)用(云計算、物聯(lián)網(wǎng)
等)的可靠性V
23.下列選項中,對公有云、私有云、混合云描述正確的是?()[多選題]*
A.公有云是由云服務(wù)提供商控制,用于云服務(wù)用戶和資源的云部署模式V
B.私有云是由云服務(wù)客戶控制,用于單一云服務(wù)用戶和資源專用的云部署模式。部署在企業(yè)內(nèi)部,由
企業(yè)內(nèi)部管理,保證了網(wǎng)絡(luò)的安全V
C.混合云是由云服務(wù)提供商提供的多種本地資源的組合,但也可以包含多種不帶有本地組件的云平臺
和云服V
D.公有云采用服務(wù)租用模式,私有云必須由用戶一次性投入
24.阿里云的云計算提供了多種服務(wù)模式,其中應(yīng)用層使用的是()[單選題]*
A.SaaSV
B.PaaS
C.IaaS
D.全部本地布署
25.阿里云的云計算提供了多種服務(wù)模式,其中平臺層使用的是()[單選題]*
A.SaaS
B.PaaSV
C.IaaS
D.全部本地布署
26.阿里云的云計算提供了多種服務(wù)模式,其中基礎(chǔ)設(shè)施使用的是()[單選題]*
A.SaaS
B.PaaS
C.laaSV
D.全部本地布署
27.云計算和大數(shù)據(jù)的關(guān)系密不可分,關(guān)于云計算和大數(shù)據(jù)的區(qū)別,描述正確的是?()[單選題]*
A.大數(shù)據(jù)處理的對象是互聯(lián)網(wǎng)資源和應(yīng)用,云計算處理的對象是數(shù)據(jù)
B.大數(shù)據(jù)是一種互聯(lián)網(wǎng)的虛擬資源存貯,云計算總的來說是一種信息資產(chǎn)
C.”大數(shù)據(jù)的出現(xiàn)在于用戶服務(wù)需求的增長,及企業(yè)處理業(yè)務(wù)能力的提高,云計算的出現(xiàn)在于用戶和社會
各行各業(yè)所產(chǎn)生大的數(shù)據(jù)呈現(xiàn)幾何倍數(shù)的增長"
D.云計算的價值則是能幫助企業(yè)等壓縮其成本,起到節(jié)約效果。在龐大的數(shù)據(jù)中挖掘其中有效、有價
值的信息這就是大數(shù)據(jù)的價值V
28.()平臺供應(yīng)商將應(yīng)用軟件統(tǒng)一部署在自己的服務(wù)器上,客戶可以根據(jù)工作實際需求,通過互聯(lián)
網(wǎng)向廠商定購所需的應(yīng)用軟件服務(wù),按定購的服務(wù)多少和時間長短向廠商支付費用。[單選題]*
A.SaaSV
B.PaaS
C.IaaS
D.Nas
29.()平臺提供包括操作系統(tǒng)和圍繞特定應(yīng)用的必需的服務(wù),供應(yīng)商提供各種開發(fā)和分發(fā)應(yīng)用的解
決方案,比如虛擬服務(wù)器、操作系統(tǒng)和SDK、點外賣回家吃披薩,自供桌子碗筷等。[單選題]*
A.SaaS
B.PaaSV
C.IaaS
D.Nas
30.()平臺將基礎(chǔ)設(shè)施(計算資源和存儲)作為服務(wù)出租。如阿里云的各種云資源、自己購買原材料制
作披薩。[單選題]*
A.SaaS
B.PaaS
C.laaSV
D.Nas
31.關(guān)于云計算在許多領(lǐng)域有諸多應(yīng)用,如政務(wù)、教育、各種產(chǎn)業(yè)、醫(yī)療等有明顯的表現(xiàn),描述正確
的是()[多選題]*
A.政務(wù)云,部署公共安全管理、容災(zāi)備份、城市管理、應(yīng)急管理、智能交通、社會保障等應(yīng)用,通過
集約化建設(shè)、管理和運行,可以實現(xiàn)信息資源整合和政務(wù)資源共享,推動政務(wù)管理創(chuàng)新,加快向服務(wù)型政
府轉(zhuǎn)型V
B.醫(yī)療云,實現(xiàn)遠程醫(yī)療,電子病歷,專家會診等V
C.企業(yè)以低廉的成本建立財務(wù)、供應(yīng)鏈、客戶關(guān)系等管理應(yīng)用系統(tǒng),大大降低企業(yè)信息化門檻,迅速
提升企業(yè)信息化水平,對企業(yè)市場競爭力沒有明顯增加
D.教育云,整合教育資源,實現(xiàn)教育資源共享V
32.關(guān)于云計算在許多領(lǐng)域有諸多應(yīng)用,如政務(wù)、教育、各種產(chǎn)業(yè)、醫(yī)療等有明顯的表現(xiàn),描述正確
的是()[多選題]*
A.安全管理、容災(zāi)備份、城市管理、應(yīng)急管理、智能交通、社會保障等應(yīng)用,通過集約化建設(shè)、管理
和運行,可以實現(xiàn)信息資源整合和政務(wù)資源共享,推動政務(wù)管理創(chuàng)新,加快向服務(wù)型政府轉(zhuǎn)型V
B.醫(yī)療云,實現(xiàn)遠程醫(yī)療,電子病歷,專家會診等V
C.企業(yè)以低廉的成本建立財務(wù)、供應(yīng)鏈、客戶關(guān)系等管理應(yīng)用系統(tǒng),大大降低企業(yè)信息化門檻,迅速
提升企業(yè)信息化水平,對企業(yè)市場競爭力沒有明顯增加
D.教育云,整合教育資源,實現(xiàn)教育資源共享V
33.以下哪一項技術(shù)為大數(shù)據(jù)提供了技術(shù)基礎(chǔ),大數(shù)據(jù)為這項技術(shù)提供用武之地?()[單選題]*
A.內(nèi)存計算機
B.網(wǎng)絡(luò)計算機
C.云計算V
D.并行計算
34.云計算技術(shù)在大數(shù)據(jù)應(yīng)用過程中提供了哪些支持?()[多選題]*
A.海量數(shù)據(jù)存儲技術(shù)V
B.數(shù)據(jù)清洗和數(shù)據(jù)挖掘
C.分布式計算V
D.海量數(shù)據(jù)管理技術(shù)V
35.云計算和大數(shù)據(jù)的關(guān)系密不可分,下列關(guān)于云計算和大數(shù)據(jù)的關(guān)系,描述正確的是()[多選題]*
A.大數(shù)據(jù)為云計算提供了技術(shù)基礎(chǔ)
B.云計算為大數(shù)據(jù)提供用武之地
C.云計算解決大數(shù)據(jù)應(yīng)用中存在的存儲、計算等問題,所以云計算是大數(shù)據(jù)的一種技術(shù)展現(xiàn)形式V
D.大數(shù)據(jù)是以海量數(shù)據(jù)為基礎(chǔ),為各種計算服務(wù)技術(shù)提供數(shù)據(jù)支撐,保證技術(shù)應(yīng)用(云計算、物聯(lián)網(wǎng)
等)的可靠性V
36.隨著科技的發(fā)展,云計算和大數(shù)據(jù)關(guān)系密不可分,下列選項中,關(guān)于云計算與大數(shù)據(jù)的聯(lián)系,描
述正確的是?()[多選題]*
A.云計算為大數(shù)據(jù)提供了技術(shù)基礎(chǔ)V
B.大數(shù)據(jù)為云計算提供用武之地V
C.大數(shù)據(jù)是以技術(shù)為體系基礎(chǔ),解決云計算應(yīng)用中存在的存儲、計算等問題,所以云計算是大數(shù)據(jù)的
一種技術(shù)展現(xiàn)形式
D.大數(shù)據(jù)是以海量數(shù)據(jù)為基礎(chǔ),為各種計算服務(wù)技術(shù)提供數(shù)據(jù)支撐,保證技術(shù)應(yīng)用(云計算、物聯(lián)網(wǎng)
等)的可靠性V
37.物聯(lián)網(wǎng)(IoT.Internetofthings)即"萬物相連的互聯(lián)網(wǎng)",是互聯(lián)網(wǎng)基礎(chǔ)上的延伸和擴展的
網(wǎng)絡(luò),將各種信息傳感設(shè)備與網(wǎng)絡(luò)結(jié)合起來而形成的一個巨大網(wǎng)絡(luò),實現(xiàn)任何時間、任何地點,人、機、
物的互聯(lián)互通。下列選項中,屬于物聯(lián)網(wǎng)特點的是?()[多選題]*
A.整體感知V
B.可靠傳輸V
C.智能處理V
D.挖掘分析
38.物聯(lián)網(wǎng)可以利用射頻識別、二維碼、智能傳感器等感知設(shè)備感知獲取物體的各類信息。體現(xiàn)了物
聯(lián)網(wǎng)的()特點。[單選題]*
A.整體感知V
B.智能處理
C.可靠傳輸
D.挖掘分析
39.物聯(lián)網(wǎng)通過對互聯(lián)網(wǎng)、無線網(wǎng)絡(luò)的融合,將物體的信息實時、準確地傳送,以便信息交流、分享。
體現(xiàn)了物聯(lián)網(wǎng)的()特點。[單選題]*
A.挖掘分析
B.可靠傳輸V
C.智能處理
D.整體感知
40.使用各種智能技術(shù),對感知和傳送到的數(shù)據(jù)、信息進行分析處理,實現(xiàn)監(jiān)測與控制的智能化。體
現(xiàn)了物聯(lián)網(wǎng)的()特點。[單選題]
A.可靠傳輸
B.整體感知
C.智能處理V
D.挖掘分析
41.云計算、物聯(lián)網(wǎng)和大數(shù)據(jù)是時下最熱的三種技術(shù),三者之間緊密結(jié)合,相互聯(lián)系,促進技術(shù)生態(tài)
的繁榮發(fā)展。關(guān)于云計算、物聯(lián)網(wǎng)和大數(shù)據(jù)三者之間的關(guān)系,描述正確的是?()[多選題]*
A.大數(shù)據(jù)為云計算提供了技術(shù)基礎(chǔ)
B.物聯(lián)網(wǎng)是大數(shù)據(jù)的重要來源V
C.物聯(lián)網(wǎng)為云計算技術(shù)提供可廣闊的應(yīng)用空間V
D.云計算為物聯(lián)網(wǎng)提供海量數(shù)據(jù)存儲能力V
E.物聯(lián)網(wǎng)技術(shù)為大數(shù)據(jù)數(shù)據(jù)分析提供支持
F.云計算為大數(shù)據(jù)提供用武之地
42.針對狹義的Hadoop的描述,Hadoop使用()技術(shù)解決數(shù)據(jù)存儲的問題。()[單選題]*
A、HDFSV
B、Redis
C、MongoDB
D、MySQL
43.針對狹義的Hadoop的描述,Hadoop使用()技術(shù)解決分布式計算的問題。()[單選題]*
A、Flink
B、MaxCompute
C、MapReduceV
D、Storm
44.Hadoop底層會維護多個數(shù)據(jù)副本,當(dāng)某個節(jié)點出現(xiàn)故障后,也不會造成損失,為應(yīng)用穩(wěn)定運作提
供了保障。體現(xiàn)了Hadoop的()特點。()[單選題]*
A、高可靠V
B、高擴展
C、高效率
D、高容錯
E、低成本
45.Hadoop集群支持熱插拔,在增加或刪除節(jié)點時無需重新啟動集群,極大提高了集群擴展性能。體
現(xiàn)了Hadoop的()特點。()[單選題]*
A、高可靠
B、高擴展V
C、高效率
D、高容錯
E、低成本
46.Hadoop能夠在節(jié)點之間動態(tài)地移動數(shù)據(jù),并保證各個節(jié)點的動態(tài)平衡,因此處理速度非???。體
現(xiàn)了Hadoop的()特點。()[單選題]*
A、高可靠
B、高擴展
C、高效率V
D、高容錯
E、低成本
47.Hadoop能夠自動保存數(shù)據(jù)的多個副本,并且能夠自動將失敗的任務(wù)重新分配。體現(xiàn)了Hadoop
的()特點。()[單選題]*
A、高可靠
B、高擴展
C、高效率
D、高容錯V
E、低成本
48.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可以在不了解分布式底層細
節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。下列關(guān)于Hadoop的優(yōu)勢,描
述不正確的是()[單選題]*
A、對于Hadoop來說,當(dāng)存儲空間不夠,可以添加機器進行擴展如果計算能力不夠,可以配置添加
MapReduce節(jié)點來擴展
B、支持多數(shù)據(jù)源、在應(yīng)用、用戶方面僅支持單一使用
C、應(yīng)用范圍廣泛,可以處理文件、數(shù)據(jù)庫、半結(jié)構(gòu)化數(shù)據(jù)V
D、Hadoop是企業(yè)級的平臺,它高可靠、多租戶、而且具有很高的安全性
49.Hadoop是一個分布式計算平臺,用戶可以輕松地在Hadoop上開發(fā)、運行與處理海量數(shù)據(jù)的應(yīng)
用程序,它主要特點有()()[多選題]*
A、高可靠V
B、高精度
C、高擴展V
D、高效率V
E、高容錯V
50.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可以在不了解分布式底層細
節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。它包含哪些核心模塊?()[多
選題]*
A、Hadoop公共包
B、Hadoop分布式文件系統(tǒng)(HDFS)V
C、HadoopYARNV
D、Hadoop的分布式消息系統(tǒng)
E、HadoopM叩Reduce4
51.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可以在不了解分布式底層細
節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。關(guān)于Hadoop的基本模塊,描
述正確的是?()[單選題]*
A、Common:支持其他Hadoop模塊的通用程序包
B、HDFS:一個分布式文件系統(tǒng),能夠以高吞吐量訪問應(yīng)用中的數(shù)據(jù)V
C、MapReduce:一^??作業(yè)調(diào)度和資源管理框架
D、YARN:一個基于MapReduce的大數(shù)據(jù)并行處理程序
52.Hadoop是當(dāng)前最流行的大數(shù)據(jù)分布式基礎(chǔ)架構(gòu),它提供了許多與大數(shù)據(jù)相關(guān)的核心功能,并支持
許多核心項目。下列選項中,屬于Hadoop核心組件的是?()[單選題]*
A、Ambari(安裝、部署、配置、管理工具)
B、Oozie(作業(yè)流調(diào)度系統(tǒng))
C、Hive數(shù)據(jù)倉庫
D、MapReduce分布式計算框架V
53.HDFS是開源分布式文件系統(tǒng),用于(1是整個Hadoop生態(tài)中的重要組件之一。()[單選題]*
A、文件的存儲與管理V
B、查找文件和文件夾
C、復(fù)制、移動文件或文件夾
D、文件刪除和修改
54.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop組件HDFS是()[單選
題]*
A。工作流引擎
Bo資源管理系統(tǒng)
C,分布式文件系統(tǒng),
D。列式數(shù)據(jù)庫
55.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop組件MapReduce,描
述正確的是?[單選題]*
A.工作流引擎
Bo數(shù)據(jù)倉庫
C,分布式計算框架,
D.列式數(shù)據(jù)庫
56.M叩Reduce是一個分布式運算程序的編程框架,下面對M叩Reduce描述正確的是?()[多選
題]*
的核心為函數(shù)和函數(shù)
AoMapReduceMapReduceV
B。MapReduce用于大規(guī)模數(shù)據(jù)集的并行運算V
不需要應(yīng)開發(fā)者編寫程序來實現(xiàn)功能
CoMapReduce
D。MapReduce設(shè)計理念就是"計算向數(shù)據(jù)靠攏"V
57.M叩Reduce是一個分布式運算程序的編程框架,關(guān)于M叩Reduce的特點,描述正確的是?[多
選題]*
A.通過配置Map節(jié)點數(shù)與增加機器數(shù)來擴展計算能力V
B。當(dāng)分配了計算任的節(jié)點失效時,能自動切換到其它節(jié)點運行該任務(wù)V
Co提供了分布式編程接口,易于開發(fā)V
D。隨機處理數(shù)據(jù)、避免順序訪問數(shù)據(jù)
58.MapReduce是一個分布式運算程序的編程框架,關(guān)于MapReduce,描述正確的是()[單選題]*
A.適合海量靜態(tài)數(shù)據(jù)(批數(shù)據(jù))計算V
B,磁盤10開銷不大
C。易編程,適合實時計算
D。是分布式計算框架,當(dāng)一臺機器失敗后,可以手動切換至其他節(jié)點運行該任務(wù)
59.M叩Reduce是一個分布式運算程序的編程框架,下列選項中,屬于M叩Reduce的缺點是()[單
選題]*
A.并行計算能力有限
B。磁盤10開銷大V
C.延遲低
D。中間結(jié)果在內(nèi)存中
60.MapReduce是一個分布式運算程序的編程框架,關(guān)于MarReduce的優(yōu)點,描述正確的是?()[多
選題]*
A.實現(xiàn)簡單接口,即可完成分布式程序V
B??梢酝ㄟ^配置Map任務(wù)數(shù)來擴展計算能力V
C.使用在分布式計算框架,所以當(dāng)一臺機器失敗后,可以自動切換至其他節(jié)點運行該任務(wù)V
D。只適合少量的數(shù)據(jù)處理
61.下列選項中關(guān)于M叩Reduce描述正確的是()[單選題]*
A.支持離線數(shù)據(jù)與實時數(shù)據(jù)的處理
Bo在對數(shù)據(jù)處理過程中除了支持Map與Reduce方法外還可以自定義方法來完成數(shù)據(jù)的處理
C.使用在分布式計算框架,所以當(dāng)一臺機器失敗后,會導(dǎo)致計算任重啟
D。過多的磁盤操作缺乏對分布式內(nèi)存的支持,不能高效的支持迭代式計算V
62.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop組件YARN是()[單
選題]*
A。工作流引擎
B。資源管理系統(tǒng)V
C。分布式計算框架
D。列式數(shù)據(jù)庫
63.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Pig,描述
正確的是?()[單選題]*
A、工作流引擎V
B、數(shù)據(jù)倉庫
C、分布式計算框架
D、列式數(shù)據(jù)庫
64.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Hive,描述
正確的是?()[單選題]*
A、工作流引擎
B、數(shù)據(jù)倉庫V
C、分布式計算框架
D、列式數(shù)據(jù)庫
65.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件MapReduce,
描述正確的是?()[單選題]*
A、工作流引擎
B、數(shù)據(jù)倉庫
C、分布式計算框架V
D、列式數(shù)據(jù)庫
66.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組成,YARN是
()[單選題]*
A、工作流引擎V
B、數(shù)據(jù)倉庫
C、分布式計算框架
D、列式數(shù)據(jù)庫
67.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件HDFS是()
[單選題]*
A、工作流引擎
B、數(shù)據(jù)倉庫
C、分布式計算框架V
D、列式數(shù)據(jù)庫
68.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Sqoop是
()[單選題]*
A、工作流引擎
B、資源管理系統(tǒng)
C、分布式文件系統(tǒng)
D、ETL工具V
69.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Mahout是
()[單選題]*
A、工作流引擎
B、資源管理系統(tǒng)V
C、分布式文件系統(tǒng)
D、ETL工具
70.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Flume是)
[單選題]*
A、工作流引擎V
B、資源管理系統(tǒng)
C、分布式文件系統(tǒng)
D、ETL工具
71.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Ambari是
()[單選題]*
A、日志收集
B、數(shù)據(jù)挖掘庫
C、分布式文件系統(tǒng)
D、安裝、部署、配置、管理工具V
72.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件HBase是)
[單選題]*
A、工作流引擎
B、資源管理系統(tǒng)
C、分布式文件系統(tǒng)
D、列式數(shù)據(jù)庫V
73.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Zoopkeeper
是()[單選題]*
A、工作流引擎
B、資源管理系統(tǒng)V
C、分布式文件系統(tǒng)
D、列式數(shù)據(jù)庫
74.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件HBase的功能,
描述正確的是?()[單選題]*
A、可擴展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲V
B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能
C、可擴展的機器學(xué)習(xí)和數(shù)據(jù)挖掘庫
D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架
75.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Hive的功能,
描述正確的是?()[單選題]*
A、可擴展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲
B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能V
C、可擴展的機器學(xué)習(xí)和數(shù)據(jù)挖掘庫
D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架
76.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Pig的功能,
描述正確的是?()[單選題]*
A、可擴展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲
B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能
C、可擴展的機器學(xué)習(xí)和數(shù)據(jù)挖掘庫
D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架V
77.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Mahout,描
述正確的是?()[單選題]*
A、可擴展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲
B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能
C、可擴展的機器學(xué)習(xí)和數(shù)據(jù)挖掘庫V
D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架
78.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件ZooKeeper,
描述正確的是?()[單選題]*
A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)V
B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具
C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具
D、是一個基于工作流引擎的開源框架,提供對Hadoop。MapReduce和PigJobs的任務(wù)調(diào)度與協(xié)
調(diào)
E、是大數(shù)據(jù)集日志收集的框架
79.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Apache
Ambari,描述正確的是?()[單選題]*
A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)
B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具V
C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具
D、是一個基于工作流引擎的開源框架,提供對Hadoop。M叩Reduce和PigJobs的任務(wù)調(diào)度與協(xié)
調(diào)
E、是大數(shù)據(jù)集日志收集的框架
80.1隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Sqoop,描
述正確的是?()[單選題]*
A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)
B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具
C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具V
D、是一個基于工作流引擎的開源框架,提供對Hadoop。M叩Reduce和PigJobs的任務(wù)調(diào)度與協(xié)
調(diào)
E、是大數(shù)據(jù)集日志收集的框架
81.1下列選項中,關(guān)于Hadoop生態(tài)組件Oozie,描述正確的是?()[單選題]*
A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)
B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具
C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具
D、是一個基于工作流引擎的開源框架,提供對Hadoop。M叩Reduce和PigJobs的任務(wù)調(diào)度與協(xié)
調(diào)V
E、是大數(shù)據(jù)集日志收集的框架
82.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Flume,描述
正確的是?()[單選題]*
A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)
B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具
C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具
D、是一個基于工作流引擎的開源框架,提供對Hadoop。MapReduce和PigJobs的任務(wù)調(diào)度與協(xié)
調(diào)
E、是大數(shù)據(jù)集日志收集的框架V
83.Hadoop是當(dāng)前最流行的大數(shù)據(jù)分布式基礎(chǔ)架構(gòu),提供了許多與大數(shù)據(jù)相關(guān)的核心功能,并支持許
多核心項目。下列選擇中,屬于Hadoop生態(tài)圈組成的是?()[多選題]*
A、Ambari(安裝、部署、配置、管理工具)V
B、Oozie(作業(yè)流調(diào)度系統(tǒng))V
C、Hive數(shù)據(jù)倉庫V
D、MapReduce分布式計算框架V
E、Pig工作流引擎V
F、Kafka分布式消息
84.Hive是基于Hadoop的一個()工具,用于查詢和管理駐留在分布式存儲系統(tǒng)中的大型數(shù)據(jù)集。
()[單選題]*
A、關(guān)系型數(shù)據(jù)庫
B、數(shù)據(jù)倉庫V
C、非關(guān)系型數(shù)據(jù)庫
D、數(shù)據(jù)庫
85.Hive是構(gòu)建在Hadoop上的數(shù)據(jù)倉庫框架,關(guān)于Hive的描述正確的是?()[單選題]*
A、Hive的本質(zhì)是將MapReduce轉(zhuǎn)化成HQL程序,然后進一步提交給Hadoop框架執(zhí)行
B、不依賴分布式并行計算模型M叩Reduce處理數(shù)據(jù)
C、定義了簡單的類SQL查詢語言HiveQL,用戶可以通過編寫的HiveQL語句運行MapReduce任
務(wù)V
D、不依賴分布式文件系統(tǒng)HDFS存儲數(shù)據(jù)
86.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Hive,描述
正確的是?[單選題]*
A.工作流引擎
Bo數(shù)據(jù)倉庫V
C,分布式計算框架
D。列式數(shù)據(jù)庫
87.Hive是基于Hadoop的一個()的工具,用于查詢和管理在分布式存儲系統(tǒng)中的大型數(shù)據(jù)集。[單
選題]*
A.關(guān)系型數(shù)據(jù)庫
B,數(shù)據(jù)倉庫V
C。非關(guān)系型數(shù)據(jù)庫
D。數(shù)據(jù)庫
88.Hive是構(gòu)建在Hadoop上的數(shù)據(jù)倉庫框架,關(guān)于Hive的描述正確的是?[單選題]*
A.Hive的本質(zhì)是將MapReduce轉(zhuǎn)化成HQL程序,然后進一步提交給Hadoop框架執(zhí)行V
B.不依賴分布式并行計算模型MapReduce處理數(shù)據(jù)
C.定義了簡單的類SQL查詢語言HiveQL,用戶可以通過編寫的HiveQL語句運行M叩Reduce任務(wù)
D.不依賴分布式文件系統(tǒng)HDFS存儲數(shù)據(jù)
89.HBase是一個分布式的、面向列的開源數(shù)據(jù)庫,源于()的一篇論文《BigTable:一個結(jié)構(gòu)化數(shù)據(jù)
的分布式存儲系統(tǒng)》。()[單選題]*
A、GoogleV
B、Oracle
C、Apache
D、Microsoft
90.存儲數(shù)據(jù)的結(jié)構(gòu)可以分為:結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化。下列選項中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是?()
[單選題]*
A、JSON文檔
B、XML文檔
C、日志文件
D、圖片V
91.存儲數(shù)據(jù)的結(jié)構(gòu)可以分為:結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化。下列選項中,屬于半結(jié)構(gòu)化數(shù)據(jù)的是?()
[單選題]*
A、JSON文檔V
B、視頻
C、文本
D、圖片
92.以下內(nèi)容屬于()類型的數(shù)據(jù)?()
<student>
<name>Amy</name>
<age>18</name>
〈/student>"[單選題]*
A、結(jié)構(gòu)化
B、半結(jié)構(gòu)化V
C、非結(jié)構(gòu)化
93.以下內(nèi)容是應(yīng)用程序運行過程中產(chǎn)生的日志信息,它屬于()類型的數(shù)據(jù)?()
1997-07-01,10
1998-04-01,26
1997-05-01,-5
1989-06-01,25
1925-05-01,45”[單選題]*
A、結(jié)構(gòu)化
B、半結(jié)構(gòu)化V
C、非結(jié)構(gòu)化
94.HBase是一個分布式的、面向列的開源數(shù)據(jù)庫,關(guān)于HBase的特點,描述正確的是?()[多選題]
A、高可靠V
B、高性能V
C、高精度
D、可伸縮V
95.隨著大數(shù)據(jù)時代的發(fā)展,也八力生態(tài)圈組件越來越豐富。關(guān)于出血叩生態(tài)組件延2$6的功能,
描述正確的是?[單選題]*
A,可擴展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲V
B,數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能
C。可擴展的機器學(xué)習(xí)和數(shù)據(jù)挖掘庫
D。用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架
96.Mahout是ApacheSoftwareFoundation(ASF)旗下的-t?開源項目,以下關(guān)于Mahout
說法正確的是?()[單選題]*
A、存儲框架
B、數(shù)據(jù)管理框架
C、數(shù)據(jù)可視化專業(yè)工具
D、可擴展的機器學(xué)習(xí)算法及其實現(xiàn)V
97.Mahout是ApacheSo代wareFoundation(ASF)旗下的一^^開源項目,提供一些可擴展的()
領(lǐng)域經(jīng)典算法的實現(xiàn),旨在幫助開發(fā)人員更加方便快捷地實現(xiàn)算法,創(chuàng)建智能應(yīng)用程序。()[單選題]*
A、人工智能
B、機器學(xué)習(xí)V
C、云計算
D、數(shù)據(jù)分析
98.在創(chuàng)建智能應(yīng)用程序時,Mahout包含許多算法實現(xiàn),具體包含()[多選題]*
A、聚類V
B、分類V
C、線性回歸
D、推薦過濾V
E、頻繁子項挖掘V
99.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Mahout是
()[單選題]*
A,工作流引擎
Bo機器學(xué)習(xí)和數(shù)據(jù)挖掘庫V
C.分布式文件系統(tǒng)
D。ETL工具
100.下列對Hadoop生態(tài)組件Mahout,描述正確的是?()[單選題]*
A、可擴展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲
B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能
C、可擴展的機器學(xué)習(xí)和數(shù)據(jù)挖掘庫V
D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架
101.Pig是Hadoop生態(tài)圈的組件之一,Pig的數(shù)據(jù)處理語言采取()方式,一步一步地進行處理。
()[單選題]*
A、數(shù)據(jù)流V
B、并行計算
C、分布式計算
D、分布式協(xié)調(diào)服務(wù)
102.Pig是Hadoop生態(tài)圈的組件之一,關(guān)于Pig,描述正確的是?()[多選題]*
A、Pig是一個基于Hadoop的大規(guī)模數(shù)據(jù)分析平臺V
B、Pig是一個用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架V
C、Pig有一毒口SQL類似的執(zhí)行語句,處理的對象是HDFS上的文件V
D、Pig的數(shù)據(jù)處理語言采取分布式消息訂閱發(fā)布方式
103.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Pig,描述
正確的是?[單選題]*
A.大型數(shù)據(jù)集計算與分析平臺V
Bo數(shù)據(jù)倉庫
C.分布式計算框架
D.列式數(shù)據(jù)庫
104.ZooKeeper是()的框架。Hadoop的許多組件都依賴于ZooKeeper,比如HDFSNameNode
HA的自動切換、HBase的高可用,以及SparkStandalone模式Master的HA機制都是通過
ZooKeeper來實現(xiàn)的。()[單選題]*
A、分布式協(xié)調(diào)服務(wù)V
B、分布式計算
C、并行計算
D、分布式存儲
105.在Hadoop生態(tài)圈中,Zoopkeeper的主要作用是完成()[單選題]*
A、工作流引擎
B、分布式協(xié)調(diào)服務(wù)V
C、分布式文件系統(tǒng)
D、列式數(shù)據(jù)庫
106.Sqoop是Hadoop生態(tài)圈的組件之一,主要用于在(\數(shù)據(jù)倉庫(Hive)和Hadoop之間轉(zhuǎn)移數(shù)
據(jù)的框架。()[單選題]*
A、非關(guān)系型數(shù)據(jù)庫
B、關(guān)系數(shù)據(jù)庫V
C、NoSQL數(shù)據(jù)庫
107.Sqoop是Hadoop生態(tài)圈的組件之一,它可以將數(shù)據(jù)從Hadoop中導(dǎo)出到()數(shù)據(jù)庫中()[單
選題]*
A、Redis
B、MySQLV
C、Memcache
D、MongoDB
108.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Sqoop是
()[單選題]*
A.工作流引擎
Bo資源管理系統(tǒng)
C.分布式文件系統(tǒng)
工具
DoETLV
109.Flume是由Cloudera提供的一個分布式、高可靠、高可用的服務(wù),是用于分布式的()框架()
[單選題]*
A、企業(yè)業(yè)務(wù)數(shù)據(jù)收集
B、網(wǎng)絡(luò)數(shù)據(jù)收集
C、傳感器數(shù)據(jù)收集
D、日志收集V
110.Flume是Hadoop生態(tài)圈的組件之一,關(guān)于Flume的組件功能,描述正確的是()[多選題]*
A、Source負責(zé)接收日志數(shù)據(jù),不支持不同類型和不同格式的日志,所以需要對日志數(shù)據(jù)處理類型和
格式
B、Source將日志數(shù)據(jù)的寫入到Channel并負責(zé)處理操作"V
C、Sink負責(zé)從Channel中的獲取數(shù)據(jù),寫入到接收方,
D、Sink可以獲取接收方的數(shù)據(jù)
111.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Flume是
()的框架。[單選題]*
A。日志收集V
Bo數(shù)據(jù)挖掘庫
C。分布式文件系統(tǒng)
D。ETL工具
112.Ambari是Hadoop生態(tài)圈的組件之一,關(guān)于Ambari的功能描述,錯誤的是?()[單選題]*
A、Ambari提供了一個分步向?qū)?,用于在任意?shù)量的主機上安裝Hadoop服務(wù)
B、提供了一個儀表板來監(jiān)控Hadoop集群的健康和狀態(tài)??梢赃M行指標收集,不能實現(xiàn)對節(jié)點故障、
剩余磁盤空間不足等做出系統(tǒng)警報V
C、使用AmbariRESTAPI可以將Hadoop配置、管理和監(jiān)控功能輕松集成到他們自己的應(yīng)用程序
中
D、Ambari為在整個集群中啟動、停止和重新配置Hadoop服務(wù)提供集中管理
113.Ambari是Hadoop生態(tài)圈的組件之一Ambari是一種基于Web的工具支持ApacheHadoop
集群的()[多選題]*
A、配置V
B、管理V
C、監(jiān)控V
D、協(xié)調(diào)
114.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Ambari
是()[單選題]*
A.日志收集
Bo數(shù)據(jù)挖掘庫
C。分布式文件系統(tǒng)
D.安裝、部署、配置、管理工具V
115.Oozie是Hadoop生態(tài)圈的組件之一,關(guān)于Oozie,描述正確的是?()[多選題]*
A、Oozie是一個用來管理Hadoop生態(tài)圈job的工作流調(diào)度系統(tǒng)V
B、Oozie由Apache公司貢獻給Cloudera
C、Oozie是運行于JavaServlet容器上的一個JavaWeb應(yīng)用V
D、Oozie的目的是按照DAG(有向無環(huán)圖)調(diào)度一系列的Map/Reduce或者Hive等任務(wù)。V
116.Spark最早是源于加州大學(xué)伯克利分校的MateiZaharia等人發(fā)表的一篇論文。論文提出了一種
()的概念。()[單選題]*
A、分布式并行計算
B、分布式文件系統(tǒng)
C、分布式彈性數(shù)據(jù)集(RDD)V
D、分布式微服務(wù)
117.ApacheSpark是用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一()引擎。()[單選題]*
A、分析V
B、存儲
C、集成
D、挖掘
核心組件包含:、
118.ApacheSparkSparkStreamingSparkSQLXSparkCore,GraphX,MLlib,
下列哪個選項是對GraphX組件的描述?()[單選題]*
A、提供流計算組件
B、是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件
C、基于內(nèi)存多語言執(zhí)行的核心引擎
D、是一個分布式圖處理框架,它基于Spark平臺提供對圖計算和圖挖掘易用且簡潔的一個子系統(tǒng)V
119.ApacheSpark核心組件包含:SparkStreaming、SparkSQL.SparkCore.GraphX、MLlib,
下列哪個選項是對MLlib組件的描述?()[單選題]*
A、提供流計算組件
B、是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件
C、基于內(nèi)存多語言執(zhí)行的核心引擎
D、Spark機器學(xué)習(xí)庫V
120.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,關(guān)于Spark的特點描述,
正確的是?()[多選題]*
A、可以使用Python、SQL、Scala、Java或R語言,統(tǒng)一離線計算和實時計算開發(fā)方式V
B、通用的SQL分析,快速構(gòu)建分析報表,運行速度快于大多數(shù)數(shù)倉計算引擎V
C、大規(guī)??茖W(xué)計算,支持對PB級數(shù)據(jù)執(zhí)行探索性分析V
D、可以在桌面電腦上訓(xùn)練機器學(xué)習(xí)算法,但不能使用相同的代碼擴展到包含數(shù)千臺機器的集群上,需
要修改代碼
121.下列選項中()可以處理離線數(shù)據(jù)也可以處理實時數(shù)據(jù)的計算框架?()[單選題]*
A、SparkV
B、Strom
C、Hive
D、Pig
122.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的,下列選項中,哪些項不屬于Spark的特點?()
[單選題]*
A、批處理/流式數(shù)據(jù)
B、SQL分析
C、大規(guī)模數(shù)據(jù)存儲V
D、大規(guī)??茖W(xué)計算
E、機器學(xué)習(xí)
核心組件有:、、下
123.ApacheSparkSparkStreamingSparkSQLsSparkCore.GraphXMLlib,
列哪個選項是對SparkCore組件的描述?()[單選題]*
A、提供流計算組件
B、是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件
C、基于內(nèi)存多語言執(zhí)行的核心引擎V
D、GraphX是一個分布式圖處理框架
124.ApacheSpark核心組件有:SparkStreaming、SparkSQLSparkCore,GraphX、MLlib,下
列哪個選項是對SparkSQL組件的描述?()[單選題]*
A、提供流計算組件
B、是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件V
C、基于內(nèi)存多語言執(zhí)行的核心引擎
D、是一個分布式圖處理框架
E、Spark機器學(xué)習(xí)庫
125.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,下列選項中,哪些是Spark
的優(yōu)勢()?()[多選題]*
A、開發(fā)比較簡單,支持多語言開發(fā)V
B、提供了多個高層次、簡潔的APW
C、可以通過RDD彈性分布式數(shù)據(jù)集方式編程,具備容錯特征,能在并行計算中高效的進行數(shù)據(jù)共享,
提升計算性能V
D、統(tǒng)一采用DAG無向有環(huán)圖處理模式
126.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,下列選項中,哪些是Spark
的核心組件?()[多選題]*
A、SparkStreamingV
B、SparkSQLV
C、SparkGraphXV
D、Spark10
127.ApacheSpark是一款常用于大數(shù)據(jù)工作負載的開源分布式處理系統(tǒng),關(guān)于Spark核心組件的作
用,描述錯誤的是?()[單選題]*
A、SparkStreaming提供離線計算組件V
B、SparkSQL是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件
C、SparkCore基于內(nèi)存多語言執(zhí)行的核心引擎
D、GraphX是一個分布式圖處理框架
128.Datax是阿里云DataWorks數(shù)據(jù)集成的開源版本,在阿里巴巴集團內(nèi)被廣泛使用的()工具/
平臺。Datax實現(xiàn)了包括MySQL、Oracle,OceanBase、SQLServer,Postgre、HDFS、Hive、ADS、
HBase、TableStore(OTS),MaxCompute(ODPS),Hologres.DRDS等各種異構(gòu)數(shù)據(jù)源之間高效的數(shù)
據(jù)同步功能。()[單選題]*
A、實時數(shù)據(jù)同步
B、離線數(shù)據(jù)同步V
C、整庫增量同步
D、整表增量徒步
129.Datax是阿里云DataWorks數(shù)據(jù)集成的開源版本,關(guān)于Datax的描述,以下說法正確的是()
[多選題]*
A、Datax是離線數(shù)據(jù)同步工具V
B、Datax是在線數(shù)據(jù)同步工具
C、Datax支持異構(gòu)數(shù)據(jù)源V
D、Datax支持增量數(shù)據(jù)回放
130.Azkaban是一個批量工作流任務(wù)調(diào)度器。關(guān)于Azkaban,描述正確的是?()[單選題]*
A、Azkaban是一個批量工作流任務(wù)調(diào)度器
B、Azkaban主要用于在一個工作流內(nèi)以一個特定的順序運行一組工作和流程
C、Azkaban使用job文件建立任務(wù)之間的依賴關(guān)系,并提供一個易用的Web界面供用戶管理和
調(diào)度工作流
D、它的配置是通過簡單的update方式對數(shù)據(jù)表進行修改實現(xiàn),通過配置中的Dependencies來設(shè)
置依賴關(guān)系V
131.Azkaban是一個批量工作流任務(wù)調(diào)度器。關(guān)于Azkaban,描述不正確的是?[單選題]*
A.Azkaban是一個批量工作流任務(wù)調(diào)度器V
B.Azkaban主要用于在一個工作流內(nèi)以一個特定的順序運行一組工作和流程
c.Azkaban使用job文件建立任務(wù)之間的依賴關(guān)系,并提供一個易用的Web界面供用戶管理和調(diào)
度工作流
D.Azkaban是由Linkedin公司推出的任務(wù)調(diào)試器,它的配置是通過簡單的update方式對數(shù)據(jù)表進
行修改實現(xiàn)
13
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幫朋友貸款買車的合同3篇
- 數(shù)據(jù)庫租賃與信息服務(wù)合同3篇
- 教育學(xué)工作合同模板3篇
- 攜程旅行合同電子版3篇
- 教育培訓(xùn)導(dǎo)游勞動合同樣本3篇
- 工業(yè)生產(chǎn)設(shè)備采購合同3篇
- 文化傳媒勞務(wù)合同范本3篇
- 帝爾婚慶服務(wù)合同的適用范圍3篇
- 房屋買賣委托合同3篇
- 旅游合同與實際行程不符3篇
- UI設(shè)計·形考任務(wù)一
- 論文《后疫情時代信息技術(shù)與幼兒園教育深度融合的策略研究》
- 2023-2024學(xué)年江西省南昌市數(shù)學(xué)六年級第一學(xué)期期末復(fù)習(xí)檢測模擬試題含答案
- 醫(yī)院不擔(dān)當(dāng)、不作為問題專項治理實施方案
- 體外診斷試劑盒風(fēng)險分析報告
- -2023廣東高考英語聽說考試三問整理
- 9高考語文透析一題·詩歌鑒賞(手法技巧)《柳梢青 送盧梅坡 》
- 如何高效學(xué)習(xí)學(xué)習(xí)通超星課后章節(jié)答案期末考試題庫2023年
- DB3205T 1062-2023 制造業(yè)質(zhì)量管理數(shù)字化水平評價規(guī)范
- 貴州省建筑節(jié)能工程認定表
- 退出協(xié)議書(8篇)
評論
0/150
提交評論