




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷22)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.下列哪項(xiàng)通常是集群的最主要瓶頸()。A)內(nèi)存B)CPUC)網(wǎng)絡(luò)D)磁盤I/O答案:D解析:[單選題]2.下列關(guān)于MapReduce模型的描述,錯(cuò)誤的是哪一項(xiàng)?()A)MapReduce采用?分而治之B)MapReduce設(shè)計(jì)的一個(gè)理念就是?計(jì)算向數(shù)據(jù)靠攏C)MapReduce框架采用了Master/Slave架構(gòu)D)MapReduce應(yīng)用程序只能用Java來寫答案:D解析:[單選題]3.雙邊濾波能夠較好的保留圖像的(__)。A)邊緣信息B)色彩信息C)亮度信息D)高頻信息答案:A解析:[單選題]4.若不針對(duì)MapReduce編程模型中的key和value值進(jìn)行特別設(shè)置,下列哪一項(xiàng)是MapReduce不適宜的運(yùn)算。()A)MaxB)MinC)CountD)Average答案:D解析:[單選題]5.下列關(guān)于批量數(shù)據(jù)遷移系統(tǒng)級(jí)限制和約束的說法錯(cuò)誤的是:()。A)批量數(shù)據(jù)遷移系統(tǒng)不會(huì)自動(dòng)備份用戶的作業(yè)配置,需要用戶通過作業(yè)的導(dǎo)出功能進(jìn)行備份。B)集群創(chuàng)建好以后支持修改規(guī)格。C)文件遷移時(shí),單個(gè)任務(wù)支持千萬數(shù)量的文件,如果待遷移目錄下文件過多,建議拆分到不同目錄并創(chuàng)建多個(gè)任務(wù)。D)不支持集群自動(dòng)升級(jí)到新版本,需要用戶通過作業(yè)的導(dǎo)出和導(dǎo)入功能,實(shí)現(xiàn)升級(jí)到新版本。答案:B解析:[單選題]6.關(guān)于下列for循環(huán),sum=0foriinrange(1,10,2):sum+=i最后輸出的sum=()。A)23B)24C)25D)26答案:C解析:[單選題]7.()是Google的分布式數(shù)據(jù)存儲(chǔ)于管理系統(tǒng)A)GFSB)MapReduceC)ChubbyD)Bigtable答案:D解析:[單選題]8.決策論中,將?期望損失?稱為(__)。A)均值B)方差C)風(fēng)險(xiǎn)D)概率答案:C解析:[單選題]9.我們建立一個(gè)5000個(gè)特征,100萬數(shù)據(jù)的機(jī)器學(xué)習(xí)模型。我們?cè)趺从行У貞?yīng)對(duì)這樣的大數(shù)據(jù)訓(xùn)練()。A)我們隨機(jī)抽取一些樣本,在這些少量樣本之上訓(xùn)練B)我們可以試用在線機(jī)器學(xué)習(xí)算法C)我們應(yīng)用PCA算法降維,減少特征數(shù)D)以上答案都正確答案:D解析:樣本數(shù)過多或者特征數(shù)過多,而不能單機(jī)完成訓(xùn)練,可以用小批量樣本訓(xùn)練,或者在線累計(jì)式訓(xùn)練,或者主成分PCA降維方式減少特征數(shù)量再進(jìn)行訓(xùn)練。[單選題]10.以下選項(xiàng)中,哪種類型間的轉(zhuǎn)換是被Hive查詢語言所支持的()A)Double-NumberB)BigInt-DoubleC)Int-BigIntD)String--Double答案:D解析:[單選題]11.以下哪個(gè)不屬于大數(shù)據(jù)對(duì)外服務(wù)模式:()A)SaaS服務(wù)B)API接口C)專項(xiàng)服務(wù)D)數(shù)據(jù)直供答案:D解析:[單選題]12.數(shù)據(jù)集成的基本類型是()。A)內(nèi)容集成、結(jié)構(gòu)集成B)內(nèi)容集成、規(guī)約集成C)規(guī)約集成、結(jié)構(gòu)集成D)模式集成、結(jié)構(gòu)集成答案:A解析:數(shù)據(jù)集成是指通過應(yīng)用間的數(shù)據(jù)交換從而達(dá)到集成,主要解決數(shù)據(jù)的分布性和異構(gòu)性的問題,其前提是被集成應(yīng)用必須公開數(shù)據(jù)結(jié)構(gòu),即必須公開表間結(jié)構(gòu)、表間關(guān)系、編碼的含義等。[單選題]13.在HBase中,刪除指定行鍵下某字段記錄的語法為()A)delete'表名稱','列名稱'B)deleteall'表名稱','列名稱'C)deleteall'表名稱','rowkey值','列名稱'D)delete'表名稱','rowkey值','列名稱'答案:D解析:[單選題]14.下列關(guān)于組織機(jī)構(gòu)的數(shù)據(jù)管理成熟度等級(jí)劃分中的已執(zhí)行級(jí)的描述錯(cuò)誤的是()。A)在具體項(xiàng)目中,DMM關(guān)鍵過程域(KPA)中給出的關(guān)鍵過程已被執(zhí)行,但隨意性和臨時(shí)性較大B)DMM關(guān)鍵過程的執(zhí)行不僅僅局限于特定業(yè)務(wù)范疇,存在跨越不同業(yè)務(wù)領(lǐng)域的關(guān)鍵過程C)缺少針對(duì)DMM關(guān)鍵過程的反饋與優(yōu)化D)雖然有可能在特定業(yè)務(wù)過程中進(jìn)行了基礎(chǔ)性改進(jìn),但沒有進(jìn)行持續(xù)跟進(jìn),也未拓展到整個(gè)組織機(jī)構(gòu)答案:B解析:DMM的執(zhí)行級(jí)(PerformedLevel):組織機(jī)構(gòu)只在個(gè)別項(xiàng)目的范圍之內(nèi)執(zhí)行了DMM給出的關(guān)鍵過程,但缺乏機(jī)構(gòu)層次的統(tǒng)籌與管理。主要特點(diǎn)如下:①在具體項(xiàng)目中,DMM關(guān)鍵過程域(KPA)中給出的關(guān)鍵過程(KeyProcess)已被執(zhí)行,但隨意性和臨時(shí)性較大。②DMM關(guān)鍵過程(KeyProcess)的執(zhí)行往往僅限于特定業(yè)務(wù)范疇,很少存在跨越不同業(yè)務(wù)領(lǐng)域的關(guān)鍵過程。③缺少針對(duì)DMM關(guān)鍵過程(KeyProcess)的反饋與優(yōu)化。以DMM關(guān)鍵過程(KeyProcess)中的數(shù)據(jù)質(zhì)量為例,其數(shù)據(jù)管理工作可能過于集中在一個(gè)特定業(yè)務(wù),如數(shù)據(jù)修復(fù)活動(dòng),并沒有擴(kuò)散到整個(gè)的業(yè)務(wù)范圍或并沒有開展對(duì)數(shù)據(jù)修復(fù)活動(dòng)本身的反饋與優(yōu)化工作;④雖然有可能在特定業(yè)務(wù)過程中已進(jìn)行了基礎(chǔ)性改進(jìn),但沒有進(jìn)行持續(xù)跟進(jìn),也未拓展到整個(gè)組織機(jī)構(gòu);⑤組織機(jī)構(gòu)沒有統(tǒng)籌其數(shù)據(jù)管理工作,而數(shù)據(jù)管理活動(dòng)局限在具體項(xiàng)目中,主要按照其具體項(xiàng)目的實(shí)施需求進(jìn)行,如果一個(gè)具體項(xiàng)目中需要進(jìn)行數(shù)據(jù)管理,可能會(huì)執(zhí)行DMM中給出的相關(guān)過程,反之亦然。[單選題]15.下面關(guān)于Region的說法,哪個(gè)是錯(cuò)誤的?A)同一個(gè)Region不會(huì)被分拆到多個(gè)Region服務(wù)器B)為了加快訪問速度,.META.表的全部Region都會(huì)被保存在內(nèi)存中C)一個(gè)-ROOT-表可以有多個(gè)RegionD)為了加速尋址,客戶端會(huì)緩存位置信息,同時(shí),需要解決緩存失效問題答案:C解析:[單選題]16.正確導(dǎo)入日期模塊的語句是()。A)importdateB)importdatetimeC)importtimeD)importdate_time答案:B解析:導(dǎo)入日期模塊的語句是importdatetime[單選題]17.對(duì)于OTS表的預(yù)留讀寫吞吐量,以下各項(xiàng)中描述正確的是:()。A)1單位讀能力表示該表每秒可以讀1KB數(shù)據(jù)B)操作數(shù)據(jù)大小不足1KB的部分向上取整C)當(dāng)表上的操作過于頻繁導(dǎo)致預(yù)留讀/寫吞吐量不足以進(jìn)行更多操作時(shí),OTS會(huì)返回OTSQuotaExhausted錯(cuò)誤給應(yīng)用程序D)1單位寫能力表示每秒可以寫1KB數(shù)據(jù)答案:C解析:[單選題]18.二項(xiàng)分布的數(shù)學(xué)期望為()。A)n(1-n)pB)np(1-p)C)npD)n(1-p)答案:C解析:二項(xiàng)分布即重復(fù)n次的伯努利試驗(yàn)。如果事件發(fā)生的概率是p,則不發(fā)生的概率q=1-p.則期望為np,方差為npq。[單選題]19.下面哪個(gè)不屬于matplotlib基本圖表包含的元素A)坐標(biāo)軸B)刻度C)刻度標(biāo)簽D)參考區(qū)域答案:D解析:[單選題]20.下對(duì)GaussDB200雙AZ集群描述不正確是?A)災(zāi)備集群不同步數(shù)據(jù)時(shí),可以提供讀寫服務(wù)B)主集群不可用時(shí),災(zāi)備集群提供正常服務(wù)C)主集群提供正常服務(wù),文備集群只同步數(shù)據(jù)D)周期性數(shù)據(jù)同步答案:A解析:[單選題]21.下面對(duì)字典型數(shù)據(jù)的正確表示為()A)dic=[1:2,3:4,5:5]B)dic={1,3,4,5,6}C)dict={(1,2),(4,5),(2,4)}D)dict={?a?:1,?b?:3,?c?:5}答案:D解析:[單選題]22.以下哪項(xiàng)不屬于數(shù)據(jù)模型()A)關(guān)系模型B)網(wǎng)狀模型C)層次模型D)網(wǎng)絡(luò)模型答案:D解析:[單選題]23.支持向量機(jī)的稀疏性通常是指()。A)相對(duì)少的支持向量B)特征選擇C)特征抽取D)以上都不是答案:A解析:[單選題]24.下列關(guān)于數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)的描述正確的是()。A)數(shù)據(jù)所占的存儲(chǔ)空間量B)存儲(chǔ)在外存中的數(shù)據(jù)C)數(shù)據(jù)在計(jì)算機(jī)中的順序存儲(chǔ)方式D)數(shù)據(jù)的邏輯結(jié)構(gòu)在計(jì)算機(jī)中的表示答案:D解析:數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)是數(shù)據(jù)的邏輯結(jié)構(gòu)在計(jì)算機(jī)中的表示。[單選題]25.交叉驗(yàn)證的目的是(__)。A)提高分類準(zhǔn)確率B)得到更穩(wěn)定的模型C)驗(yàn)證結(jié)果的準(zhǔn)確性D)增大分類的誤差答案:B解析:[單選題]26.python解釋器的提示符為。()A)>B)>>C)>>>D)#答案:C解析:[單選題]27.有數(shù)組n=np.arange(24).reshape(2,-1,2,2),則np.shape的返回結(jié)果是()。A)(2,3,2,2)B)(2,2,2,2)C)(2,4,2,2)D)(2,6,2,2)答案:A解析:reshape()里-1的作用是可以先不計(jì)算,由數(shù)組size和其他的reshape參數(shù)確定這個(gè)數(shù)值,此處用24除以其他不是-1的值得到3。[單選題]28.Python用于異常處理結(jié)構(gòu)中捕獲特定類型的異常的保留字是()。A)exceptB)doC)passD)while答案:A解析:except是Python用于異常處理結(jié)構(gòu)中捕獲特定類型的異常的保留字。[單選題]29.有如下程序:fun=lambdaarg1,arg2:arg1+arg2print(fun(10,15))程序的輸出結(jié)果是()。A)10B)15C)20D)25答案:D解析:[單選題]30.下列不屬于數(shù)組屬性的是()。A)ndimB)shapeC)sizeD)add答案:D解析:[單選題]31.有如下程序:f=lambdax,y,z=2:x*zifx>yelsey/zdefmain():x,y=6,9print(f(x,y))main()程序的輸出結(jié)果是()A)12B)6C)4.5D)4答案:C解析:[單選題]32.假設(shè)precision=TP/(TP+FP),recall=TP/(TP+FN),則在二分類問題中,當(dāng)測(cè)試集的正例和負(fù)例數(shù)量不均衡時(shí),以下評(píng)價(jià)方案中()是相對(duì)不合理的。A)Accuracy:(TP+TN)/allB)F-value:2recallprecision/(recall+precision)C)G-mean:sqrt(precision*recall)D)AUC:曲線下面積答案:A解析:測(cè)試集正例和負(fù)例數(shù)量不均衡,那么假設(shè)正例數(shù)量很少占10%,負(fù)例數(shù)量占大部分90%。而且算法能正確識(shí)別所有負(fù)例,但正例只有一半能正確判別。那么TP=0.05×all,TN=0.9×all,Accuracy=95%。雖然Accuracy很高,precision是100%,但正例recall只有50%。[單選題]33.線性回歸的基本假設(shè)不包括()。A)隨機(jī)誤差項(xiàng)是一個(gè)期望值為0的隨機(jī)變量B)對(duì)于解釋變量的所有觀測(cè)值,隨機(jī)誤差項(xiàng)有相同的方差C)隨機(jī)誤差項(xiàng)彼此相關(guān)D)解釋變量是確定性變量不是隨機(jī)變量,與隨機(jī)誤差項(xiàng)之間相互獨(dú)立答案:C解析:線性回歸的基本假設(shè):(1)線性關(guān)系假設(shè)。(2)正態(tài)性假設(shè),指回歸分析中的Y服從正態(tài)分布。(3)獨(dú)立性假設(shè),包含兩個(gè)意思:①與某一個(gè)X對(duì)應(yīng)的一組Y和與另一個(gè)X對(duì)應(yīng)的一組Y之間沒有關(guān)系,彼此獨(dú)立;②誤差項(xiàng)獨(dú)立,不同的X所產(chǎn)生的誤差之間應(yīng)相互獨(dú)立,無自相關(guān)。(4)誤差等分散性假設(shè):特定X水平的誤差,除了應(yīng)呈隨機(jī)化的常態(tài)分配,其變異量也應(yīng)相等,稱為誤差等分散性。[單選題]34.mkdir()的作用是()。A)刪除指定路徑的目錄B)改變當(dāng)前工作目錄到指定的路徑C)以數(shù)字權(quán)限模式創(chuàng)建目錄D)返回當(dāng)前工作目錄答案:C解析:[單選題]35.下列關(guān)于分類算法描述正確的是()。A)分類算法的標(biāo)簽和回歸算法完全相同B)分類算法和聚類算法-樣都沒有標(biāo)簽C)分類算法的評(píng)價(jià)需要參考真實(shí)標(biāo)簽D)分類算法評(píng)價(jià)可以用均方誤差來判斷答案:C解析:[單選題]36.下列不屬于數(shù)據(jù)預(yù)處理的操作是(__)。A)抽樣B)特征子集選擇C)特征變換D)訓(xùn)練答案:D解析:[單選題]37.如果數(shù)據(jù)有許多異常值,那么便不能使用數(shù)據(jù)的均值與方差去做標(biāo)準(zhǔn)化,在Preprocessing模塊中定義()可以解決這個(gè)問題。A)normalizer()B)robust_scale()C)maxabs_scale()D)scale()答案:B解析:robust_scale()和RobustScaler()這兩個(gè)函數(shù)解決了上述問題,它會(huì)根據(jù)中位數(shù)或者四分位數(shù)去中心化數(shù)據(jù)。[單選題]38.診斷性分析主要采取的分析方法是()。A)關(guān)聯(lián)分析法和因果分析法B)關(guān)聯(lián)分析法和分類分析法C)關(guān)聯(lián)分析法和運(yùn)籌學(xué)D)因果分析法和分類分析法答案:A解析:診斷性分析主要關(guān)注過去,回答為什么發(fā)生,主要采用關(guān)聯(lián)分析法和因果分析法。[單選題]39.公司在我國(guó)境內(nèi)收集和產(chǎn)生的個(gè)人信息和重要數(shù)據(jù),要在境內(nèi)存儲(chǔ),并定期開展檢測(cè)評(píng)估的頻率是()。A)每月一次B)每季度年一次C)每半年一次D)每年一次答案:D解析:[單選題]40.通過HBase創(chuàng)建表的的時(shí)候指定命名空間的語法正確的是()A)namespace:tableB)namespacetableC)namespace-tableD)namespace>table答案:A解析:[單選題]41.下列關(guān)于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的權(quán)重共享現(xiàn)象的描述正確的是()。A)只有全連接神經(jīng)網(wǎng)絡(luò)會(huì)出現(xiàn)B)只有卷積神經(jīng)網(wǎng)絡(luò)(CNN)會(huì)出現(xiàn)C)只有循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)會(huì)出現(xiàn)D)卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)都會(huì)出現(xiàn)答案:D解析:卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)會(huì)產(chǎn)生權(quán)重共享現(xiàn)象。[單選題]42.Flink的Checkpoint機(jī)制繪制的流應(yīng)用快照不能被保存在以下哪個(gè)位置?A)LocalB)HDFSC)TaskManager的內(nèi)存D)Joblanager的內(nèi)存答案:C解析:[單選題]43.支持向量機(jī)優(yōu)化問題的形式是(__)。A)一個(gè)不含約束的二次規(guī)劃問題B)一個(gè)含有等式約束的二次規(guī)劃問題C)一個(gè)含有不等式約束的二次規(guī)劃問題D)一個(gè)含有不等式約束的線性規(guī)劃問題答案:C解析:[單選題]44.a和b為兩個(gè)整數(shù),以下關(guān)系表達(dá)式語法錯(cuò)誤的是?A)a==bB)abC)a>=bD)a!=b答案:B解析:[單選題]45.在支持向量機(jī)中,可利用(__)方法將原問題轉(zhuǎn)化為其對(duì)偶問題。A)拉格朗日乘子法B)留出法C)比較檢驗(yàn)D)劃分選擇答案:A解析:[單選題]46.以下哪一項(xiàng)屬于非結(jié)構(gòu)化數(shù)據(jù)。A)企業(yè)ERP數(shù)據(jù)B)財(cái)務(wù)系統(tǒng)數(shù)據(jù)C)視頻監(jiān)控?cái)?shù)據(jù)D)日志數(shù)據(jù)答案:C解析:[單選題]47.下列關(guān)于模型能力(modelcapacity,指神經(jīng)網(wǎng)絡(luò)模型能擬合復(fù)雜函數(shù)的能力)的描述正確的是()。A)隱藏層層數(shù)增加,模型能力增加B)Dropout的比例增加,模型能力增加C)學(xué)習(xí)率增加,模型能力增加D)以上都不正確答案:A解析:Dropout比例增加,可能會(huì)丟失過多參數(shù)影響模型能力;學(xué)習(xí)率過大,梯度下降可能會(huì)越過最低點(diǎn),無法收斂。[單選題]48.()算法可以較好地避免樣本的不平衡問題。A)KNNB)SVMC)BayesD)神經(jīng)網(wǎng)絡(luò)答案:A解析:KNN只是取了最近的幾個(gè)樣本點(diǎn)做平均,離預(yù)測(cè)數(shù)據(jù)較遠(yuǎn)的訓(xùn)練數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果不會(huì)造成影響,但是SVM、Bayes和KNN的每一個(gè)訓(xùn)練樣本結(jié)果都會(huì)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生影響。[單選題]49.哪個(gè)不是ElasticSearch生態(tài)圈中的技術(shù)?A)beatsB)LoastashC)FlumeD)kiana答案:C解析:[單選題]50.(__)是根據(jù)數(shù)據(jù)采樣來估計(jì)概率分布參數(shù)的經(jīng)典方法。A)貝葉斯判定準(zhǔn)則B)貝葉斯決策論C)貝葉斯分類器D)極大似然估計(jì)答案:D解析:[單選題]51.下列關(guān)于大數(shù)據(jù)預(yù)測(cè)的說法中,錯(cuò)誤的是()A)人類的生活正在被大數(shù)據(jù)預(yù)測(cè)深刻改變B)預(yù)測(cè)性分析是大數(shù)據(jù)最核心的功能C)分析從?面向已經(jīng)發(fā)生的過去?轉(zhuǎn)向?面向即將發(fā)生的未來?是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的最大區(qū)別D)大數(shù)據(jù)預(yù)測(cè)是基本大數(shù)據(jù)集和預(yù)測(cè)模型去預(yù)測(cè)過去某件事情的概率答案:D解析:[單選題]52.下面關(guān)于自定義函數(shù)的說法正確的是()。--A)自定義函數(shù)必須由兩條以上的語句組成B)在函數(shù)體中可以使用SELECT語句C)函數(shù)的返回值不能省略D)自定義函數(shù)的名稱區(qū)分大小寫答案:C解析:[單選題]53.preprocessing.OrdinalEncoder的作用是(__)。A)將分類特征轉(zhuǎn)換為分類數(shù)值B)獨(dú)熱編碼C)分類轉(zhuǎn)換為分類數(shù)值D)對(duì)缺失值進(jìn)行填補(bǔ)答案:A解析:[單選題]54.以下哪個(gè)不是典型的分類方法:()A)決策樹B)樸素貝葉斯C)K-MeansD)人工神經(jīng)網(wǎng)絡(luò)答案:C解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.下列關(guān)于BloomFilter的描述正確的是?A)是一個(gè)很長(zhǎng)的二進(jìn)制向量和一系列隨機(jī)映射函數(shù)B)沒有誤算率C)有一定的誤算率D)可以在BloomFilter中刪除元素答案:AC解析:B項(xiàng)、肯定有誤算率呀。D項(xiàng)、BloomFilter無法從BloomFilter集合中刪除一個(gè)元素。因?yàn)樵撛貙?duì)應(yīng)的位會(huì)牽動(dòng)到其他的元素。[多選題]56.對(duì)文本類型的數(shù)據(jù)進(jìn)行轉(zhuǎn)換加工,以下選項(xiàng)中哪些文本函數(shù)處理的對(duì)象是一個(gè)文本字符串,處理完的輸出結(jié)果也是一個(gè)文本字符串()A)ConcatenatB)LeftC)UpperD)Replace答案:BCD解析:[多選題]57.客戶端使用給get方式讀取HBase用戶數(shù)據(jù)時(shí),需要查詢meta表哪些數(shù)據(jù)?A)Region起始rowkeyB)RegionServer地址C)Region分裂時(shí)間D)Region大小答案:AB解析:[多選題]58.可視分析學(xué)的幾個(gè)特點(diǎn)包含()。A)強(qiáng)調(diào)數(shù)據(jù)到知識(shí)的轉(zhuǎn)換過程中B)強(qiáng)調(diào)可視化分析與自動(dòng)化建模之間的相互作用C)強(qiáng)調(diào)數(shù)據(jù)映射和數(shù)據(jù)挖掘的重要性D)強(qiáng)調(diào)數(shù)據(jù)加工(DataWrangling或DataMunging)工作的必要性E強(qiáng)調(diào)λ交互的重要性答案:ABCD解析:[多選題]59.getPartition()的三個(gè)參數(shù)分別是()。A)keyB)valueC)numReduceTasksD)Mapper答案:ABC解析:[多選題]60.下面屬于序列的是A)列表B)字符串C)元組D)整數(shù)答案:ABC解析:[多選題]61.下列關(guān)于隨機(jī)森林說法正確的是(__)。A)隨機(jī)森林是Bagging的一個(gè)擴(kuò)展變體B)隨機(jī)森林在決策樹的訓(xùn)練過程中引入了隨機(jī)屬性選擇C)隨機(jī)森林簡(jiǎn)單且容易實(shí)現(xiàn)D)隨機(jī)森林計(jì)算開銷大答案:ABC解析:[多選題]62.簇有效性的面向相似性的度量包括()A)精度B)Rand統(tǒng)計(jì)量C)Jaccard系數(shù)D)召回率答案:BC解析:[多選題]63.以下(__)函數(shù)得到的數(shù)組是有序的。A)np.in1d()B)np.setxor1()C)ersect1d()D)np.union1d()答案:CD解析:[多選題]64.某集團(tuán)公司財(cái)務(wù)總監(jiān)在進(jìn)行年度匯報(bào)時(shí),須向公司總經(jīng)理匯報(bào)本年凈利潤(rùn)及最近五年凈利潤(rùn)的趨勢(shì)、A產(chǎn)品凈利潤(rùn)在公司總體凈利潤(rùn)的占比,他可以選擇的圖表類型是:()A)詞云圖B)線形圖C)餅圖D)雷達(dá)圖答案:BC解析:[多選題]65.邏輯回歸的優(yōu)點(diǎn)有哪些?()A)形式簡(jiǎn)單B)模型效果不錯(cuò)C)訓(xùn)練速度快D)方便輸出結(jié)果調(diào)整答案:ABCD解析:[多選題]66.我們可以通過()來查詢HBase表的記錄。A)get'table_name','rowkey'B)get'table_name','rowkey','column_family:column'C)scan'table_name'D)scan'table_name',{COLUMNS=>'column_family:column'}答案:ABCD解析:[多選題]67.如將A、B、C三個(gè)分類器的PR曲線畫在一個(gè)圖中,其中A、B的PR曲線可以完全包含住C的PR曲線,A與B的PR曲線有交點(diǎn),A、B、C的平衡點(diǎn)分別為0.79、0.66、0.58,以下說法中正確的是()。A)學(xué)習(xí)器A的性能優(yōu)于學(xué)習(xí)器CB)學(xué)習(xí)器A的性能優(yōu)于學(xué)習(xí)器BC)學(xué)習(xí)器B的性能優(yōu)于學(xué)習(xí)器CD)學(xué)習(xí)器C的性能優(yōu)于學(xué)習(xí)器B答案:ABC解析:若一個(gè)學(xué)習(xí)器的PR曲線被另一個(gè)學(xué)習(xí)器的曲線完全包住,則可斷言后者的性能優(yōu)于前者,如果兩個(gè)學(xué)習(xí)器的PR曲線發(fā)生了交叉,則可用平衡點(diǎn)度量。[多選題]68.假設(shè)檢驗(yàn)中,首先需要提出零假設(shè)和備擇假設(shè),零假設(shè)是().備擇假設(shè)是()0A)只有出現(xiàn)的概率大于闡值才會(huì)被拒絕的,只有零假設(shè)出現(xiàn)的概率大于闡值才會(huì)被B)只有出現(xiàn)的概率小于閩值才會(huì)被拒絕的,只有零假設(shè)出現(xiàn)的率小于閩值才會(huì)被中承認(rèn)的C)希望推翻的結(jié)論,希望證明的結(jié)論承認(rèn)的D)希望證明的結(jié)論,希望推翻的結(jié)論答案:AB解析:[多選題]69.以下關(guān)于降維方法的敘述,正確的是()。A)主成分分析是一種常用的非線性降維方法B)核化線性降維是一種常用的線性降維方法C)流形學(xué)習(xí)是一種借鑒拓?fù)淞餍胃拍畹慕稻S方法D)度量學(xué)習(xí)繞過降維的過程,將學(xué)習(xí)目標(biāo)轉(zhuǎn)化為對(duì)距離度量計(jì)算的權(quán)重矩陣的學(xué)習(xí)答案:CD解析:本質(zhì)上講,主成分分析是一種線性降維方法,在處理非線性問題時(shí),效果不太理想。核化線性降維是一種非線性降維方法。[多選題]70.YARN容量調(diào)度器的主要特點(diǎn)有哪些?A)容量保證B)靈活性C)多重租憑D)動(dòng)態(tài)更新配置文件答案:ABCD解析:[多選題]71.Spark的程序執(zhí)行過程中,以下說法正確的是()A)Application是由用戶編寫的Spark應(yīng)用程序,其中包括dirverprogram和executorB)SparkContext是Spark運(yùn)行的核心模塊,由DriverProgram創(chuàng)建C)Shuffle操作只有在窄依賴的時(shí)候才會(huì)觸發(fā)D)Stage具體到RDD中每個(gè)分區(qū)的執(zhí)行答案:AB解析:[多選題]72.企業(yè)應(yīng)用包括(__)和人力資本、金融、生產(chǎn)能力、后臺(tái)自動(dòng)化等。A)銷售B)營(yíng)銷C)法律D)客戶服務(wù)答案:ABCD解析:[多選題]73.下列有關(guān)MapReduce計(jì)算框架的描述正確的是()。A)MapReduce可以計(jì)算任務(wù)的劃分和調(diào)度B)MapReduce可完成數(shù)據(jù)的分布存儲(chǔ)和劃分C)MapReduce可以實(shí)現(xiàn)處理系統(tǒng)節(jié)點(diǎn)出錯(cuò)檢測(cè)和失效恢復(fù)D)MapReduce可實(shí)現(xiàn)處理數(shù)據(jù)與計(jì)算任務(wù)的同步答案:ABCD解析:[多選題]74.HBase中會(huì)觸發(fā)F1ush操作的有以下哪幾項(xiàng)?A)Region中MemStore的總大小,達(dá)到了預(yù)設(shè)的FlushSize閾值B)當(dāng)WALs中文件數(shù)量達(dá)到國(guó)值時(shí)。C)HBase定期刷新Memstore,默認(rèn)周期為l小時(shí)。D)MemStore占用內(nèi)存的總量和RegionServer總內(nèi)存比值超出了預(yù)設(shè)的值大小。答案:ABCD解析:[多選題]75.關(guān)于Hive與Hadoop生態(tài)系統(tǒng)中其他組件的關(guān)系,下面描述正確的是:()A)HDFS作為高可靠的底層存儲(chǔ),用來存儲(chǔ)海量數(shù)據(jù)B)MapReduce對(duì)這些海量數(shù)據(jù)進(jìn)行批處理,實(shí)現(xiàn)高性能計(jì)算C)用HiveQL語句編寫的處理邏輯,最終都要轉(zhuǎn)化為MapReduce任務(wù)來運(yùn)行D)Hive的目標(biāo)是取代HBase答案:ABC解析:[多選題]76.以下關(guān)于數(shù)據(jù)科學(xué)描述錯(cuò)誤的包括()。A)數(shù)據(jù)科學(xué)研究數(shù)據(jù)的差異性B)降低計(jì)算量是數(shù)據(jù)科學(xué)關(guān)心的問題C)數(shù)據(jù)科學(xué)不可以研究非結(jié)構(gòu)化數(shù)據(jù)D)數(shù)據(jù)科學(xué)不需要與其他學(xué)科結(jié)合在一起答案:ACD解析:[多選題]77.下列說法正確的是()A)altertableuserdropcolumnsex;B)altertableuseraddsexvarchar(20);C)altertableuserdropsex;D)altertableusermodifyidintprimarykey;答案:ABCD解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.Pandas與Numpy對(duì)象迭代的速度是一樣的。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]79.Channels支持事務(wù),提供較弱的順序保證,可以連接任何數(shù)量的Source和Sink。A)正確B)錯(cuò)誤答案:對(duì)解析:馬鈴薯是是蔬菜。[判斷題]80.安全域是指基于相同安全防護(hù)需求、可采用相似安全策略且不改變維護(hù)界面等原則劃分的區(qū)域。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.Spark應(yīng)用運(yùn)行時(shí),如果某個(gè)tast運(yùn)行失敗則導(dǎo)致整個(gè)app運(yùn)行失敗。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]82.在類定義的外部沒有任何辦法可以訪問對(duì)象的私有成員。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]83.假設(shè)re模塊已導(dǎo)入,那么表達(dá)式reA)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.Solr創(chuàng)建Collection時(shí),推薦選用路由算法為compositldRouter,那么該Collection可以擴(kuò)展shardA)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]85.NameNode負(fù)責(zé)管理元數(shù)據(jù),客戶端每次讀寫請(qǐng)求時(shí),都會(huì)從磁盤中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 三年級(jí)口算題目練習(xí)1000道
- 三年級(jí)口算題目1000道
- 二年級(jí)口算題目匯編100道
- 賣菜水果配送合同范本
- 二年級(jí)口算練習(xí)題100道
- 2025四川省建筑安全員知識(shí)題庫
- 劣質(zhì)勞務(wù)合伙合同范本
- 個(gè)人住宅設(shè)計(jì)合同范本
- 加盟名額出售合同范本
- 企業(yè)訂單培訓(xùn)合同范本
- 急需學(xué)科專業(yè)引導(dǎo)發(fā)展清單
- DB4401-T 71-2020 臭氧-活性炭深度凈水工藝設(shè)計(jì)與運(yùn)行管理技術(shù)規(guī)程
- 會(huì)計(jì)廉政培訓(xùn)課件
- 2024年山東出版集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 熱能動(dòng)力工程專業(yè)英語課件
- 市政道路工程質(zhì)量保證措施
- 牛奶供貨協(xié)議合同
- 綠色工廠評(píng)價(jià)指標(biāo)及評(píng)分標(biāo)準(zhǔn)
- 甲型流感患者的護(hù)理查房
- 禮儀概述和原則
- ISO22000體系文件清單
評(píng)論
0/150
提交評(píng)論