




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)CDA考試大數(shù)據(jù)CDA考試(習(xí)題卷9)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)CDA考試第1部分:?jiǎn)雾?xiàng)選擇題,共47題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.下面對(duì)Streaming的特性說(shuō)法正確的是()?A)如果并不要求每個(gè)消息必須被處理(允許在處理過(guò)程中丟失一些信息),那么可以關(guān)閉消息的可靠處理機(jī)制,從而可以獲取較好的性能。B)關(guān)閉消息的可靠處理機(jī)制意味著系統(tǒng)中的消息數(shù)不會(huì)減少。C)將參數(shù)Config.TOPOLOGY_ACKERS設(shè)置為1可以關(guān)閉消息的可靠性處理機(jī)制D)Spout發(fā)送個(gè)消息時(shí),使用指定消息messageID的接口進(jìn)行發(fā)送可以關(guān)閉消息的可靠性處理機(jī)制。答案:A解析:[單選題]2.以下關(guān)于一元線性回歸分析中(y=b0+b1x+ε)的假定,描述錯(cuò)誤的是()。A)因變量y與自變量x之間具有線性關(guān)系B)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量C)誤差項(xiàng)ε的方差σ2D)因變量來(lái)自于正態(tài)總體答案:D解析:沒(méi)有這個(gè)假定[單選題]3.下面不屬于面訪式問(wèn)卷調(diào)查優(yōu)勢(shì)的是()A)可提高調(diào)查的回答率B)可提高調(diào)查數(shù)據(jù)的質(zhì)量C)能調(diào)節(jié)數(shù)據(jù)搜集所花費(fèi)的時(shí)間D)適合于樣本單位十分分散的情況答案:D解析:D是電話調(diào)查的優(yōu)勢(shì)。[單選題]4.定義問(wèn)題時(shí)通常使用以下哪種方法。()A)波特五力競(jìng)爭(zhēng)分析B)5W2H分析法C)描述性統(tǒng)計(jì)分析D)決策樹(shù)答案:B解析:[單選題]5.使用余弦相似度時(shí),結(jié)果等于1表示兩個(gè)向量()A)完全相同B)完全相反C)完全相關(guān)D)不確定答案:A解析:余弦相似度表示a、b兩個(gè)向量之間夾角的余弦值。等于1時(shí),表明兩個(gè)向量方向完全相同,越接近1,表明兩個(gè)向量越相似。[單選題]6.邏輯回歸模型中計(jì)算得到的發(fā)生概率p,一般作為()A)絕對(duì)概率B)相對(duì)概率C)絕對(duì)概率的自然對(duì)數(shù)D)相對(duì)概率的自然對(duì)數(shù)答案:B解析:p僅是相對(duì)的可能性,而不是絕對(duì)的發(fā)生概率。[單選題]7.部署FusioninsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署幾個(gè)?A)7B)3C)4D)2答案:D解析:[單選題]8.當(dāng)一元線性回歸模型的殘差出現(xiàn)異方差時(shí),我們可以嘗試哪項(xiàng)工作()A)對(duì)自變量做線性變換B)對(duì)因變量做線性變換C)對(duì)自變量做非線性變換D)自變量做歸一化處理答案:C解析:其余三個(gè)都是線性處理,不改變異方差[單選題]9.有序集的中間值或者中間兩個(gè)值平均是()。A)平均值B)中位數(shù)C)眾數(shù)D)以上都不是答案:B解析:[單選題]10.在使用對(duì)應(yīng)分析方法時(shí),()會(huì)幫助提升結(jié)果的有效性A)采用卡方檢驗(yàn)作為預(yù)分析B)精簡(jiǎn)變量C)異常值處理D)以上都是答案:D解析:對(duì)應(yīng)分析作為一種描述性的方法,觀察到的變量間聯(lián)系并沒(méi)有經(jīng)過(guò)驗(yàn)證,因此得出結(jié)論時(shí)要萬(wàn)分小心。比如可以采用卡方檢驗(yàn)等方法作為預(yù)分析,或者精簡(jiǎn)變量。即使在圖形中觀察到結(jié)論,也需要和原始數(shù)據(jù)反復(fù)觀察確認(rèn),避免錯(cuò)誤判斷。另外,對(duì)應(yīng)分析的結(jié)果也會(huì)受到異常值的影響。因此前期的數(shù)據(jù)清洗也非常重要。[單選題]11.開(kāi)始將N個(gè)樣品各自作為一類(lèi),并規(guī)定樣品之間的距離和類(lèi)與類(lèi)之間的距離,然后將距離最近的兩類(lèi)合并成一個(gè)新類(lèi),計(jì)算新類(lèi)與其他類(lèi)的距離,重復(fù)進(jìn)行兩個(gè)最近類(lèi)的合并,每次少一類(lèi),直至所有的樣品合并為一類(lèi),此種聚類(lèi)方法是()。A)K-meansB)SOM聚類(lèi)C)系統(tǒng)聚類(lèi)D)有序聚類(lèi)答案:C解析:系統(tǒng)聚類(lèi)法(hierarchicalclustermethod)一譯?分層聚類(lèi)法?。聚類(lèi)分析的一種方法。其做法是開(kāi)始時(shí)把每個(gè)樣品作為一類(lèi),然后把最靠近的樣品(即距離最小的群品)首先聚為小類(lèi),再將已聚合的小類(lèi)按其類(lèi)間距離再合并,不斷繼續(xù)下去,最后把一切子類(lèi)都聚合到一個(gè)大類(lèi)。[單選題]12.以下不屬于分類(lèi)模型評(píng)估中基于比率維度的指標(biāo)是()。A)KS值B)特異性C)Kappa統(tǒng)計(jì)量D)Lift值答案:C解析:[單選題]13.關(guān)于MapReduce的說(shuō)法正確的是()。A)MapReduce1.0用YARN框架來(lái)進(jìn)行資源調(diào)度的B)MapReduce是基于內(nèi)存計(jì)算的框架C)MapReduce是分布式文件存儲(chǔ)系統(tǒng)D)MapReduce1.0既是一個(gè)計(jì)算框架又是一個(gè)資源調(diào)度框架答案:D解析:[單選題]14.一群人中,吃東北大米的占60%,吃原陽(yáng)大米的占45%,兩種均吃的30%,隨機(jī)抽一人。則至少吃一種米的概率為()。A)0.82B)0.85C)0.8D)0.75答案:D解析:[單選題]15.以下選項(xiàng)哪個(gè)不屬于分類(lèi)算法?()A)KNN算法B)邏輯回歸C)C4.5算法D)TF-TDF算法答案:D解析:[單選題]16.下哪種不是Hive支持的數(shù)據(jù)類(lèi)型()。A)tructB)ntC)apD)ong答案:D解析:[單選題]17.查看kafka某Topic的partition詳細(xì)信息時(shí),使用如下那個(gè)命令?A)bin/kakfa-topicssh--createB)bin/kakfa-topicssh--deleteC)bin/kakfa-topics.sh-listD)bin/kakfa-topicssh--describe答案:D解析:[單選題]18.fusioninsight對(duì)于管理操作,下列錯(cuò)誤的是?A)可對(duì)服務(wù)進(jìn)行啟停重啟B)可以添加和卸載服務(wù)C)常用服務(wù)隱藏或顯示D)可查看服務(wù)的當(dāng)前狀態(tài)答案:C解析:[單選題]19.以下哪個(gè)不屬于波特五力競(jìng)爭(zhēng)分析模型的內(nèi)容。()A)潛在競(jìng)爭(zhēng)者威脅B)替代品威脅C)企業(yè)外部的機(jī)會(huì)D)供應(yīng)商議價(jià)能力答案:C解析:[單選題]20.下表為一交易數(shù)據(jù),請(qǐng)問(wèn)a→c的支持度(Support)為()。TIDItemsBought1a.b.c2a,c3a,e4b.e.gA)0.75B)0.5C)1D)0.666答案:B解析:[單選題]21.一項(xiàng)不屬Hive的流控特性()?A)已經(jīng)建立的總連接數(shù)閾值控制B)某個(gè)特定用戶(hù)已經(jīng)建立的連接數(shù)閾值控制C)每個(gè)用戶(hù)已經(jīng)建立的連數(shù)聞值控制D)單位時(shí)間內(nèi)所建立的連接數(shù)閾值控制答案:B解析:[單選題]22.設(shè)x為float型變量,y為double型變量,a為int型變量,b為long型變量,c為char型變量,則表達(dá)式x+y*a/x+b/y+c的值為()類(lèi)型。A)intB)longC)doubleD)char答案:C解析:[單選題]23.使用Hbase客戶(hù)端批量寫(xiě)入10條數(shù)據(jù),某個(gè)Hregionserver節(jié)點(diǎn)上包含該表的2個(gè)Region,分別為A和B,10條數(shù)據(jù)中有6條屬于A,4條屬于B,請(qǐng)問(wèn)寫(xiě)入這10條數(shù)據(jù)需要向該HregionServer發(fā)送幾次RPC請(qǐng)求?A)10B)6C)2D)1答案:D解析:[單選題]24.下面哪個(gè)函數(shù)是publicvoidaMethod({.}的重載函數(shù)?A)voidaMethod(){...}B)publicintaMethod(f...)C)publicvoidaMethod(){...}D)publicintaMethod(intm){...}答案:D解析:[單選題]25.spark的核心模塊是A)sparkstreamingB)sparkcoreC)mapreduceD)sparksql答案:B解析:[單選題]26.在Flask框架中設(shè)置路由的請(qǐng)求方法,可以使用參數(shù)()。A)requestB)requestsC)methodD)methods答案:D解析:[單選題]27.如果一組數(shù)據(jù)不是對(duì)稱(chēng)分布,按照切比雪夫不等式,至少約有75%的觀測(cè)值落在距均值()個(gè)標(biāo)準(zhǔn)差的區(qū)間范圍內(nèi)。A)1B)2C)3D)4答案:B解析:切比雪夫不等式公式為1-1/k^2,計(jì)算得出。[單選題]28.將巧克力藏在不透明的容器里,將無(wú)花果、開(kāi)心果等健康零食放在透明玻璃罐里。7周內(nèi)職員少攝入310萬(wàn)卡路里。這屬于()的案例。A)關(guān)聯(lián)規(guī)則B)聚類(lèi)規(guī)則C)分類(lèi)規(guī)則D)不能確定答案:A解析:[單選題]29.在以下語(yǔ)句中,哪個(gè)是降序查詢(xún)t1表中不同城市pm10的平均值():A)selectB)selectC)selectD)select答案:A解析:本題考查SQL語(yǔ)句中分組和排序的方法。SQL語(yǔ)句中求平均的函數(shù)是avg而不是mean,故B錯(cuò);C中asc表示升序排列,而D中默認(rèn)也是升序排列,故正確答案為A。[單選題]30.分析師小A想要在數(shù)據(jù)表中查詢(xún)名稱(chēng)里包含?新款?的產(chǎn)品。那么在進(jìn)行查詢(xún)時(shí),可以選擇以下哪種方式用來(lái)進(jìn)行模糊匹配()A)likeB)<>C)distinctD)between答案:A解析:可以通過(guò)使用like?%字符串%?的形式來(lái)進(jìn)行模糊匹配,尋找包含字符串取值的所有記錄。[單選題]31.每月例會(huì)報(bào)告的經(jīng)營(yíng)指標(biāo)匯總,屬于哪類(lèi)數(shù)據(jù)分析。()A)客戶(hù)行為的數(shù)據(jù)挖掘報(bào)告B)描述性數(shù)據(jù)分析報(bào)告C)產(chǎn)品和行為傾向報(bào)告D)以上都不對(duì)答案:B解析:按照慣例經(jīng)營(yíng)指標(biāo)匯總,通常是報(bào)告業(yè)績(jī)指標(biāo)的數(shù)量、金額、百分比或排名等信息,這類(lèi)分析多數(shù)歸屬于描述性數(shù)據(jù)分析,而且是單變量分析的內(nèi)容。AC項(xiàng)涉及行為特點(diǎn)和商品特征的關(guān)系,屬于多變量分析的內(nèi)容。多選題共20題,共40.0分[單選題]32.下面哪一個(gè)循環(huán)會(huì)導(dǎo)致死循環(huán)?A)for(intk=0;k<0;k++)B)for(intk=10;k>0;k--)C)for[intk=0;k<10;k--)D)for(intk=0;k>0;k++)答案:C解析:[單選題]33.在數(shù)據(jù)庫(kù)模型中,可以指定條件對(duì)記錄進(jìn)行排序,使用的方法是()。A)order_byB)filterC)orderD)group(答案:A解析:[單選題]34.關(guān)于被私有訪問(wèn)控制符private修飾的成員變量,以下說(shuō)法正確的是()A)可以被三種類(lèi)所引用:該類(lèi)自身、與它在同一個(gè)包中的其他類(lèi)在其他包中的該類(lèi)的子類(lèi)B)可以被兩種類(lèi)訪問(wèn)和引用:該類(lèi)本身、該類(lèi)的所有子類(lèi)C)只能被該類(lèi)自身所訪問(wèn)和修改D)只能被同一個(gè)包中的類(lèi)訪問(wèn)答案:C解析:[單選題]35.()圖形主要用于表示一個(gè)樣本中各組成部分的數(shù)據(jù)占全部數(shù)據(jù)的比例,多用于研究結(jié)構(gòu)性問(wèn)題。A)餅圖B)條形圖C)折線圖D)堆積圖答案:A解析:[單選題]36.Spark組件中哪個(gè)選項(xiàng)不屬于transformation操作?A)JoinB)distinctC)reduceByKeyD)reduce答案:D解析:[單選題]37.下列關(guān)于計(jì)算機(jī)存儲(chǔ)容量單位的說(shuō)法中,錯(cuò)誤的是()。A)1KB<1MB<1GBB)基本單位是字節(jié)(Byte)C)一個(gè)漢字需要一個(gè)字節(jié)的存儲(chǔ)空間D)一個(gè)字節(jié)能夠容納一個(gè)英文字符答案:C解析:[單選題]38.假設(shè)檢驗(yàn)中顯著性水平是()。A)推斷時(shí)犯取偽錯(cuò)誤的概率B)推斷時(shí)取偽棄真的概率C)正確推斷的概率D)是推斷的可信度答案:B解析:[單選題]39.實(shí)際應(yīng)用中,如果想要研究單個(gè)指標(biāo)的方差對(duì)結(jié)果的影響,在做主成分分析的時(shí)候應(yīng)該選擇使用()A)協(xié)方差矩陣B)相關(guān)系數(shù)矩陣C)關(guān)聯(lián)矩陣D)三者皆可答案:A解析:主成分分析時(shí)可以使用協(xié)方差矩陣或者相關(guān)系數(shù)矩陣。相關(guān)系數(shù)矩陣就是隨機(jī)變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣。通過(guò)隨機(jī)變量的標(biāo)準(zhǔn)化,相關(guān)系數(shù)矩陣剝離了單個(gè)指標(biāo)的方差,僅保留指標(biāo)間的相關(guān)性。而協(xié)方差矩陣更適用于研究單個(gè)指標(biāo)的方法對(duì)結(jié)果的影響。[單選題]40.指數(shù)平滑法中,下面哪個(gè)指標(biāo)可以反映對(duì)時(shí)間序列資料的修正程度?()A)平滑常數(shù)B)季節(jié)指數(shù)C)跨越期D)指數(shù)平滑數(shù)初始值答案:A解析:[單選題]41.下列關(guān)于網(wǎng)絡(luò)用戶(hù)行為的說(shuō)法中,錯(cuò)誤的是()。A)網(wǎng)絡(luò)公司能夠捕捉到用戶(hù)在其網(wǎng)站上的所有行為B)用戶(hù)離散的交互痕跡能夠?yàn)槠髽I(yè)提升服務(wù)質(zhì)量提供參考C)數(shù)字軌跡用完即自動(dòng)刪除D)用戶(hù)的隱私安全很難得以規(guī)范保護(hù)答案:C解析:[單選題]42.在Java中,?456?于()類(lèi)的對(duì)象。A)intB)StringC)IntegerD)Stri答案:B解析:[單選題]43.以下關(guān)于KafkaPartition偏移量的描述不正確的是?()A)每條消息在文件中的位置稱(chēng)為offset(偏移量)B)消費(fèi)者通過(guò)(offset/.partition.topic)跟蹤記錄C)唯一標(biāo)記一條消息D)Offset是一個(gè)String型字符串答案:D解析:[單選題]44.下列關(guān)于數(shù)據(jù)挖掘說(shuō)法正確的是()。A)數(shù)據(jù)挖掘更加注重預(yù)測(cè)B)數(shù)據(jù)挖掘在方法論上與統(tǒng)計(jì)模型沒(méi)有區(qū)別C)數(shù)據(jù)挖掘更加注重對(duì)于前期各種假設(shè)的檢驗(yàn)D)數(shù)據(jù)挖掘不屬于數(shù)據(jù)分析范疇答案:A解析:數(shù)據(jù)挖掘偏重預(yù)測(cè),統(tǒng)計(jì)模型偏重關(guān)系發(fā)現(xiàn)。[單選題]45.聚類(lèi)方法中,以下哪種方法需要指定聚類(lèi)個(gè)數(shù)。()A)層次聚類(lèi)B)K均值聚類(lèi)C)基于密度的聚類(lèi)D)基于網(wǎng)格的聚類(lèi)答案:B解析:[單選題]46.已知中國(guó)的成人平均身高服從正態(tài)分布。則在一次抽樣中,取到的身高小于等于中位數(shù)的概率為()。A)5%B)50%C)小于50%D)無(wú)法計(jì)算答案:B解析:對(duì)稱(chēng)分布,中位數(shù)和均值重合。[單選題]47.以下哪個(gè)不是Spark的分布式部署方式?(A)standaloneB)sparkonmesosC)sparkonYARND)Sparkonlocal答案:D解析:第2部分:多項(xiàng)選擇題,共29題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]48.關(guān)于右偏分布,下列說(shuō)法正確的是()。A)偏度系數(shù)小于0B)均值小于中位數(shù),中位數(shù)小于眾數(shù)C)偏度系數(shù)大于0D)均值大于中位數(shù),中位數(shù)大于眾數(shù)答案:CD解析:對(duì)描述性統(tǒng)計(jì)特征的綜合考核[多選題]49.以下關(guān)于華為大數(shù)據(jù)解決方案說(shuō)法正確的是()A)GAUSSDB是一款開(kāi)源數(shù)據(jù)庫(kù)產(chǎn)品B)Farmer是數(shù)據(jù)服務(wù)框架C)FusionInsightManager是一個(gè)分布式系統(tǒng)管理框架,管理員可以通過(guò)多接入點(diǎn)操控分布式集群D)FusioninsightHD是基于開(kāi)源大數(shù)據(jù)軟件Hadoop的增強(qiáng)版本答案:ABCD解析:[多選題]50.當(dāng)前,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的特點(diǎn)是()。A)規(guī)模較大B)規(guī)模較小C)增速很快D)增速緩慢答案:AC解析:[多選題]51.student表中記錄了同學(xué)每一次考試的成績(jī)。那么以下哪組sql代碼取數(shù)的結(jié)果中,id字段取值不會(huì)出現(xiàn)重復(fù)()A)selectB)selectC)selectD)select答案:AB解析:項(xiàng)A代碼以id的值作為分組依據(jù),統(tǒng)計(jì)每組score的最大值,因此最終取數(shù)結(jié)果中id的取值不會(huì)重復(fù)。distinct是去重函數(shù)。[多選題]52.時(shí)間序列預(yù)測(cè)方法分為()。A)平滑法預(yù)測(cè)B)ARIMA模型預(yù)測(cè)C)Winter法D)不能確定答案:AB解析:[多選題]53.HBase讀數(shù)據(jù)時(shí)需要讀取哪幾部分?jǐn)?shù)據(jù)()?A)HFileB)HlogC)MemStoreD)HDFS答案:AC解析:[多選題]54.實(shí)際業(yè)務(wù)中,數(shù)據(jù)常常來(lái)源于不同的數(shù)據(jù)表。以下連接方式中會(huì)包括兩個(gè)表的所有信息的有()A)innerB)leftC)fullD)union答案:CD解析:fulljoin為橫向連接,保留兩張表的全部信息。unionall為縱向連接,且不去除重復(fù)記錄。[多選題]55.以下哪些選項(xiàng)于fusioninsight數(shù)據(jù)安全性?A)操作系統(tǒng)安全加固B)組件數(shù)據(jù)加密C)數(shù)據(jù)完整性校驗(yàn)D)用戶(hù)權(quán)限認(rèn)證管理答案:BC解析:[多選題]56.在假設(shè)檢驗(yàn)中,關(guān)于P值說(shuō)法正確的是()A)P值是一個(gè)概率值B)P值小于顯著性水平,則拒絕原假設(shè)C)P值大于顯著性水平,則無(wú)法拒絕原假設(shè)D)P值的數(shù)值等于檢驗(yàn)統(tǒng)計(jì)量答案:ABC解析:P值等于密度函數(shù)下放,檢驗(yàn)統(tǒng)計(jì)量右側(cè)或左側(cè)的面積,具體需要根據(jù)原假設(shè)確定。[多選題]57.某銷(xiāo)售團(tuán)隊(duì)進(jìn)行客戶(hù)估值的時(shí)候,進(jìn)行了一次多元線性回歸,模型結(jié)果無(wú)效,可能的原因有()A)殘差標(biāo)準(zhǔn)誤太小了B)存在異方差C)自變量之間不存在相關(guān)性D)存在序列相關(guān)答案:BD解析:殘差標(biāo)準(zhǔn)誤小只能說(shuō)明擬合度好,相關(guān)性低能夠保證變量之間相互獨(dú)立的假設(shè)。[多選題]58.如果因變量和自變量之間的關(guān)系是非線性的,可以考慮使用()變換后,再進(jìn)行線性回歸A)因變量取對(duì)數(shù)B)自變量乘以2C)自變量平方D)因變量乘以2答案:AC解析:BD項(xiàng)都是線性變換,變換后的因變量和自變量仍然不存在線性關(guān)系。[多選題]59.邏輯回歸中常用的篩選變量的方法有()A)Wald檢驗(yàn)B)似然比檢驗(yàn)C)F檢驗(yàn)D)主觀判斷答案:AB解析:[多選題]60.以下關(guān)于閔可夫斯基距離和杰卡德相似系數(shù)的說(shuō)法,正確的是()A)歐氏距離可以看成是特殊形式的閔可夫斯基距離B)閔可夫斯基距離用于連續(xù)型數(shù)據(jù)C)杰卡德相似系數(shù)用于分類(lèi)數(shù)據(jù)D)杰卡德相似系數(shù)用于連續(xù)型數(shù)據(jù)答案:ABC解析:[多選題]61.對(duì)于HBase系統(tǒng)的使用場(chǎng)景,以下說(shuō)法正確的是()。A)需對(duì)數(shù)據(jù)進(jìn)行隨機(jī)讀操作或者隨機(jī)寫(xiě)操作B)大數(shù)據(jù)量并發(fā)操作C)需要進(jìn)行多表聯(lián)合查詢(xún)D)讀寫(xiě)訪問(wèn)均是非常簡(jiǎn)單的操作答案:ABD解析:[多選題]62.用戶(hù)對(duì)HBaseRegion服務(wù)的讀寫(xiě)過(guò)程,下面說(shuō)法確的是()。A)用戶(hù)寫(xiě)入數(shù)據(jù)時(shí),被分配到相應(yīng)Region服務(wù)器去執(zhí)行B)用戶(hù)數(shù)據(jù)首先被寫(xiě)入到MemStore和Hlog中C)只有當(dāng)操作寫(xiě)入Hlog之后,commit(調(diào)用才會(huì)將其返回給客戶(hù)端D)當(dāng)用戶(hù)讀取數(shù)據(jù)時(shí),Region服務(wù)器會(huì)直接去磁盤(pán)上面的StoreFile中尋找答案:ABC解析:[多選題]63.fusioninstghthd集群包含多種服務(wù),每種服務(wù)又有若干個(gè)角色組成,下面那些是角色?A)namenodeB)hbaseC)datanodeD)以上全都正確答案:AC解析:[多選題]64.Loader作業(yè)的配置包括以下哪些步驟()?A)基本信息B)輸入配置C)轉(zhuǎn)換D)輸出配置答案:ABCD解析:[多選題]65.以下關(guān)于靈敏度和特異度的說(shuō)法,正確的是()A)靈敏度越高,邏輯回歸模型越有效B)靈敏度越低,邏輯回歸模型越有效C)特異度越高,邏輯回歸模型越有效D)特異度越低,邏輯回歸模型越有效答案:AC解析:不管是靈敏度還是特異度,都是越高,說(shuō)明邏輯回歸模型越有效。[多選題]66.大數(shù)據(jù)采集中面臨的主要問(wèn)題有以下哪些?A)如何避免重復(fù)數(shù)據(jù)B)數(shù)據(jù)源多種多樣,數(shù)據(jù)量大、變化快C)如何保證數(shù)據(jù)的質(zhì)量D)如何保證數(shù)據(jù)采集的可靠性答案:ABCD解析:[多選題]67.從方向上,逐步回歸可以分為以下幾類(lèi)()A)向前選擇法B)向后刪除法C)雙向法D)完全法答案:ABC解析:從方向上,逐步回歸可以分為三類(lèi),分別是向前選擇法、向后刪除法和雙向法。[多選題]68.對(duì)于SCADA系統(tǒng)來(lái)說(shuō),需要監(jiān)視下列哪些數(shù)據(jù)A)遙測(cè)B)退信C)遙調(diào)D)遙控答案:AB解析:[多選題]69.C4.5算法是由RossQuinlan開(kāi)發(fā)的用于產(chǎn)生決策樹(shù)的算法,以下描述正確的有(1-A)每個(gè)節(jié)點(diǎn)的分支度只能為2B)使用gainratio作為節(jié)點(diǎn)分割的依據(jù)C)可以處理數(shù)值型態(tài)的字段D)可以處理空值的字段答案:BCD解析:[多選題]70.在Fusioninsight集群中,Spark主要與以下哪些組件進(jìn)行交互?)A)ABDB)YARNC)HiveD)Zookeeper答案:ABD解析:[多選題]71.描述數(shù)據(jù)集中趨勢(shì)的常見(jiàn)指標(biāo)是()。A)均值B)中位數(shù)C)眾數(shù)D)四分位數(shù)答案:ABC解析:[多選題]72.以下關(guān)于Fusioninsight中carborData說(shuō)法正確的有?()A)使用Carbon的目的是對(duì)大數(shù)據(jù)即席查詢(xún)提供超快速響應(yīng)。B)Carbon使用輕量級(jí)壓縮和重量級(jí)壓縮的組合壓縮算法壓縮數(shù)據(jù)可以減少60%-80%數(shù)據(jù)存儲(chǔ)空間,大大節(jié)省硬件存儲(chǔ)成本。C)Cabonr是一種新型ApacheHadoop本地文件格式,使用先進(jìn)的列式存儲(chǔ),索引,壓縮和編碼技木,以提高計(jì)算效率有助于加速超過(guò)PB數(shù)量級(jí)的數(shù)據(jù)查詢(xún),可用于更換的交互查詢(xún)。D)Carbon也是一種將數(shù)據(jù)源與Spark集成的高性能分析引擎答案:ABCD解析:[多選題]73.分析報(bào)告的模式包括以下哪些。()A)專(zhuān)題式B)綜合式C)工作匯報(bào)式D)金字塔式答案:ABCD解析:[多選題]74.回歸模型的檢驗(yàn)需要經(jīng)過(guò)以下哪些方面。()A)樣本容量B)模型顯著性C)無(wú)偏估計(jì)D)擬合優(yōu)度答案:ABD解析:[多選題]75.大數(shù)據(jù)有()特點(diǎn)。A)數(shù)據(jù)量大B)速度快、時(shí)效高C)類(lèi)型多D)價(jià)值密度低、含量大答案:ABCD解析:[多選題]76.在網(wǎng)絡(luò)爬蟲(chóng)的爬行策略中,應(yīng)用最為基礎(chǔ)的是()。A)深度優(yōu)先遍歷策略B)廣度優(yōu)先遍歷策略C)高度優(yōu)先遍歷策略D)反向鏈接策略答案:AB解析:第3部分:判斷題,共24題,請(qǐng)判斷題目是否正確。[判斷題]77.Spark任務(wù)的每個(gè)stage可劃分為job,劃分的標(biāo)記是shuffleA)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]78.Spark任務(wù)的Executor可以執(zhí)行多個(gè)taskA)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]79.Spark使用內(nèi)存來(lái)存儲(chǔ)數(shù)據(jù),Spark計(jì)算結(jié)果在斷電后可以持久保存。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.Resourcemanager采用高可用方案,當(dāng)Activeresourcemanager發(fā)現(xiàn)故障時(shí)只能通過(guò)內(nèi)置的zookeeper來(lái)啟動(dòng)standby的resourcemanager,將其狀態(tài)切換為active。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.在Flask項(xiàng)目中定義路由時(shí),只能使用裝飾器的方法()。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]82.對(duì)高價(jià)值高度聚合的信息和知識(shí)的批次處理是大數(shù)據(jù)行業(yè)主要商業(yè)訴求。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.使用Flask框架時(shí)必須要使用Flask類(lèi)實(shí)例化一個(gè)app對(duì)象()。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.Java.exe是JDK的編譯工具A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]85.Hive是一種數(shù)據(jù)倉(cāng)庫(kù)處理工具,使用類(lèi)sql的HivesqlL語(yǔ)言實(shí)現(xiàn)數(shù)據(jù)查詢(xún)功能所有Hive的數(shù)據(jù)都存儲(chǔ)在HDFS中。A)正確B)錯(cuò)誤答
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河北省安全員-C證考試題庫(kù)
- 2025湖南省安全員《C證》考試題庫(kù)及答案
- 南京審計(jì)大學(xué)《數(shù)學(xué)學(xué)科與教學(xué)指導(dǎo)實(shí)踐》2023-2024學(xué)年第二學(xué)期期末試卷
- 海南醫(yī)學(xué)院《數(shù)字時(shí)代品牌傳播》2023-2024學(xué)年第二學(xué)期期末試卷
- 哈爾濱城市職業(yè)學(xué)院《會(huì)計(jì)電算化實(shí)訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 做賬實(shí)操-保險(xiǎn)行業(yè)的賬務(wù)處理示例
- 2025青海省建筑安全員A證考試題庫(kù)附答案
- 南京城市職業(yè)學(xué)院《主任工作技能》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖北國(guó)土資源職業(yè)學(xué)院《精神分析理論與技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 徐州工業(yè)職業(yè)技術(shù)學(xué)院《三維建模與貼圖》2023-2024學(xué)年第二學(xué)期期末試卷
- 庭院工程暫預(yù)算報(bào)價(jià)單(龍威景觀)
- 2024年南京機(jī)電職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)及答案解析
- 投標(biāo)技術(shù)服務(wù)和質(zhì)保期服務(wù)計(jì)劃
- 2023年全國(guó)高考體育單招考試英語(yǔ)試卷試題真題(精校打印版)
- 音樂(lè)欣賞與實(shí)踐(中職音樂(lè))全套教學(xué)課件
- 粵語(yǔ)活動(dòng)策劃方案模板范文相關(guān)7篇
- 蘇教版三年級(jí)數(shù)學(xué)下冊(cè)教學(xué)計(jì)劃及進(jìn)度表
- 中國(guó)春節(jié)ppt英文版 Chinese New Year
- 高中數(shù)學(xué)《6.2 排列與組合》課件與導(dǎo)學(xué)案
- 腸道健康講座活動(dòng)策劃
- 小學(xué)三年級(jí)下冊(cè)數(shù)學(xué)教案3篇
評(píng)論
0/150
提交評(píng)論