大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷9)_第1頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷9)_第2頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷9)_第3頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷9)_第4頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷9)_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷9)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.Python中定義私有屬性的方法是()。A)使用private關(guān)鍵字B)使用public關(guān)鍵字C)使用__XX__定義屬性名D)使用__XX定義屬性名[單選題]2.關(guān)于公民的隱私權(quán),下面描述錯(cuò)誤的是:()A)修改權(quán)是隱私權(quán)利人具有的依法了解自身信息資料是否被行政主體利用的權(quán)利B)支配權(quán)是隱私權(quán)利人的基本權(quán)利之一,隱私權(quán)利人對(duì)自己的個(gè)人信息的收集、儲(chǔ)存、傳播、使用、開(kāi)放等享有支配權(quán)C)保障權(quán)是指公民有權(quán)要求政府在數(shù)據(jù)開(kāi)放的過(guò)程中保障涉及其個(gè)人隱私的信息資料不被開(kāi)放、不被濫用和不被泄露D)救濟(jì)權(quán)是公民在自身的合法權(quán)益受到侵害時(shí),按照法定程序釆取法律手段維護(hù)自身權(quán)益的權(quán)利[單選題]3.某大數(shù)據(jù)業(yè)務(wù)人員需針對(duì)某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個(gè)數(shù)據(jù)為時(shí)間類型ywyMMdd,那么可以使用以下哪一項(xiàng)作為字段類型?A)IntB)doubleC)stringDD)varcahr[單選題]4.Gremlin中查詢單個(gè)點(diǎn)的信息該用什么命令A(yù))g.V0.hasLabel("test")B)g.VOhasLabel("test").values("age")C)9.V0.hasLabel("test).valueMap("String.list","age")D)gV(13464736).valueMap0自[單選題]5.關(guān)于文檔數(shù)據(jù)庫(kù)的說(shuō)法,下列哪一項(xiàng)是錯(cuò)誤的:()A)性能好(高并發(fā))B)缺乏統(tǒng)一的查詢語(yǔ)法C)復(fù)雜性低D)數(shù)據(jù)是規(guī)則的[單選題]6.以下說(shuō)法錯(cuò)誤的一項(xiàng)是()A)負(fù)梯度方向是使函數(shù)值下降最快的方向B)當(dāng)目標(biāo)函數(shù)是凸函數(shù)時(shí),梯度下降法的解是全局最優(yōu)解C)梯度下降法比牛頓法收斂速度快D)擬牛頓法不需要計(jì)算Hesse矩陣[單選題]7.TaskScheduler負(fù)責(zé)將DAGScheduler發(fā)過(guò)來(lái)的TaskSet按照指定的調(diào)度策略分發(fā)到()上執(zhí)行。A)StageB)DAGC)ExecutorD)Task[單選題]8.正則化是將樣本在向量空間模型上的一個(gè)轉(zhuǎn)換,經(jīng)常被使用在分類與聚類中,正則化在preprocessing模塊的實(shí)現(xiàn)函數(shù)是()。A)preprocessing.MaxAbsScale()B)preprocessing.RobustScaler()C)preprocessing.normalize()D)preprocessing.Binarizer()[單選題]9.大數(shù)據(jù)環(huán)境下的隱私擔(dān)憂,主要表現(xiàn)為()A)人信息的被識(shí)別與暴露B)用戶畫像的生成C)廣告的推送D)病毒入侵[單選題]10.下列關(guān)于LSTM的說(shuō)法,錯(cuò)誤的是()A)LSTM中存在sigmoid函數(shù)B)LSτM中存在飼血函數(shù)C)LSTM又稱長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)D)RNN是LSTM的變種[單選題]11.使用類間最大距離法進(jìn)行圖像分割時(shí),下列步驟正確的是①計(jì)算相對(duì)距離度量值。②給定一個(gè)初始閾值,將圖像分成目標(biāo)和背景兩類。③分別計(jì)算出兩類的灰度均值。④選擇最佳的閾值,使得圖像按照該閾值分成兩類后,相對(duì)距離度量值達(dá)到最大。A)①②③④B)②①③④C)②③①④D)①③②④[單選題]12.Flume的高級(jí)組件不包含以下哪個(gè)?A)SinkProcessorB)ChannelInterceptorC)ChannelSelectorD)SourceInterceptor[單選題]13.執(zhí)行以下代碼段x=5x**=2x%=2*3+1print(x)時(shí),輸出為()。A)0B)1C)4D)10[單選題]14.執(zhí)行下列語(yǔ)句后,變量sum的值是()sum=0i=0while(iA)55B)30C)25D)無(wú)答案[單選題]15.在MaxComputeSQL中,對(duì)兩個(gè)double類型的時(shí)間進(jìn)行比較,正確的做法是:()。A)使用關(guān)系運(yùn)算符B)使用關(guān)系運(yùn)算符"!=?C)使用關(guān)系運(yùn)算符?<>?D)使用兩個(gè)double類型相減,然后取絕對(duì)值的方式進(jìn)行[單選題]16.創(chuàng)建一個(gè)3x3的數(shù)組,下列代碼中錯(cuò)誤的是()。A)np.arange(0,9).reshape(3,3)B)np.eye(3)C)np.random.random([3,3,3])D)np.mat("123;456;789")[單選題]17.()是Google提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運(yùn)算的軟件架構(gòu)。A)GFSB)MapReduceC)ChubbyD)BitTable[單選題]18.請(qǐng)選擇計(jì)算231-1的Python表達(dá)式:A)power(2,31)-1B)2^31-1C)231-1D)2(31)-1[單選題]19.L表示模糊分類器的特征關(guān)鍵詞,由T推導(dǎo)出模糊集F,以下哪個(gè)算法可以計(jì)算不同F(xiàn)之間的關(guān)聯(lián)度?()A)SVMB)EWCC)SRD)EM[單選題]20.數(shù)據(jù)安全技術(shù)保護(hù)與信息系統(tǒng)"三同步"原則不包括以下哪項(xiàng)()。A)同步規(guī)劃B)同步建設(shè)C)同步使用D)同步運(yùn)維[單選題]21.數(shù)據(jù)科學(xué)領(lǐng)域常用的工具之一()語(yǔ)言是統(tǒng)計(jì)學(xué)家發(fā)明的語(yǔ)言。A)PythonB)RC)JAVAD)C[單選題]22.嵌入式選擇是一種(__)算法。A)聚類B)特征選擇C)分類D)回歸[單選題]23.執(zhí)行"abcdef"[-1:]語(yǔ)句時(shí)輸出是()。A)aB)abcdeC)bcdefD)f[單選題]24.如果使用split分割字符串,返回的數(shù)據(jù)類型是A)listB)strC)intD)float[單選題]25.(__)試圖對(duì)多個(gè)變量在給定觀測(cè)值后的條件概率進(jìn)行建模。A)馬爾可夫隨機(jī)場(chǎng)B)隱馬爾可夫模型C)條件隨機(jī)場(chǎng)D)逆誤差傳播[單選題]26.在HDFS中,NameNode的主要功能是什么?A)維護(hù)了blockid到datanode本地文件的映射關(guān)系B)存儲(chǔ)文件內(nèi)容C)文件內(nèi)存保存在磁盤中D)存儲(chǔ)元數(shù)據(jù)[單選題]27.在條件允許的前提下,()對(duì)數(shù)據(jù)安全進(jìn)行審計(jì),()進(jìn)行一次全面審計(jì)。A)1年/3年B)1季度/1年C)1年/2年D)半年/1年[單選題]28.Yarn中設(shè)置隊(duì)里queueA的最大使用資源量,需要配置哪個(gè)參數(shù)A)yarn.scheduler.capacity.root.Queueuser-limit-factorB)yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC)yarn.scheduler.capacity.root.QueueA.stateD)yarn.scheduler.capacity.root.QueueA.maxmum-capacity[單選題]29.用戶Region和RegionServer之間的路由信息,保存在哪個(gè)模塊中?A)MasterB)HDFSC)Meta表D)Zookeeper[單選題]30.以下關(guān)于大數(shù)據(jù)分析說(shuō)法錯(cuò)誤的是A)Python和R雖然都能用于數(shù)據(jù)分析,但它們相互獨(dú)立,不能互相調(diào)用B)云計(jì)算為大數(shù)據(jù)分析提供了便利C)數(shù)據(jù)分析可以用于銷售、營(yíng)銷、客戶服務(wù)等企業(yè)應(yīng)用中D)數(shù)據(jù)分析可以用于廣告、教育、政府等特定行業(yè)應(yīng)用中[單選題]31.彩色圖像增強(qiáng)時(shí),()處理可以采用RGBA)直方圖均衡化B)同態(tài)濾波C)加權(quán)均值濾波D)中值濾波[單選題]32.下列不屬于基于圖像灰度分布的閾值分割方法的是()。A)類間最大距離法B)最大類間方差法C)Otsu方法D)區(qū)域生長(zhǎng)法[單選題]33.HBase為什么適用于海量數(shù)據(jù)存儲(chǔ)?A)支持列存表B)集群規(guī)模小C)HDFS做底層存儲(chǔ)D)多列簇特性[單選題]34.在使用--query參數(shù)指定查詢語(yǔ)句時(shí),需要注意的是()A)在查詢語(yǔ)句中一定要有where條件且在where條件中必須包含$CONDITIONSB)在查詢語(yǔ)句中一定要有select語(yǔ)句且在select語(yǔ)句中必須包含$CONDITIONSC)在查詢語(yǔ)句中一定要有where條件且在where條件中必須包含CONDITIONSD)在查詢語(yǔ)句中一定要有select語(yǔ)句且在select語(yǔ)句中必須包含CONDITIONS[單選題]35.下面這段代碼的作用是什么?try{Rsp=restC1ientlest.performRequest("HEAD","1?+indexparams);Lf(HttpStatus.Sc__OK==rsp.getStatusLine0.getStatusCode(){LOG.info("Checkindexsuccessful,indexisexist:"+index);returntrue:}Lf(Httpstatus.SC_NOT_FOUND==Rsp.getStatusLine(.getStatusCode(){LOG.info(indexisnotexist:"+index);returnfalse;)A)判斷素引分片是否存在B)判斷索引類型C)判斷索引是否可用D)判斷索引是否存在[單選題]36.下列關(guān)于Numpy的簡(jiǎn)單介紹不正確的是()。A)Numpy(NumericalPython)是Python語(yǔ)言的一個(gè)擴(kuò)展程序庫(kù)B)支持大量的維度數(shù)組與矩陣運(yùn)算C)針對(duì)數(shù)組運(yùn)算提供大量的數(shù)學(xué)函數(shù)庫(kù)D)Numpy不開(kāi)放源代碼[單選題]37.下列表達(dá)式的值為True的是()A)5+4j>2-3jB)3>2==2C)e>5and4==fD)(x-6)>5[單選題]38.閱讀下面Python代碼,選擇正確輸出結(jié)果:()deffun():print("AA",end="")return"BB"print("CC"+fun(),end="")A)AABBCCB)AACCBBC)BBCCAAD)CCBBAA[單選題]39.HDFS中Namenode的主備仲裁,是由:()組件控制的。A)HDFSClientB)NodeManagerC)ResourceManagerD)ZooKeeperFailoverController[單選題]40.關(guān)于SecondaryNameNode的說(shuō)法錯(cuò)誤的是()A)main方法是SecondaryNameNode的入口,它啟動(dòng)線程執(zhí)行runB)啟動(dòng)前的構(gòu)造過(guò)程主要是創(chuàng)建和NameNode通信的接口和啟動(dòng)HTTP服務(wù)器C)run方法每隔一段時(shí)間執(zhí)行doCheckpoint()D)main方法從NameNode上取下FSImage和日志,和本地合并再傳回NameNode[單選題]41.詞袋模型主要應(yīng)用于?A)文檔分類B)提取文章主題C)提取文章關(guān)鍵詞D)統(tǒng)計(jì)詞頻[單選題]42.(__)是指在對(duì)數(shù)據(jù)進(jìn)行正式計(jì)算之前,根據(jù)后續(xù)數(shù)據(jù)計(jì)算的需求對(duì)原始數(shù)據(jù)進(jìn)行審計(jì)、清洗、變換、集成等一系列處理活動(dòng)。A)數(shù)據(jù)加工B)數(shù)據(jù)預(yù)處理C)數(shù)據(jù)清洗D)數(shù)據(jù)挖掘[單選題]43.ADS中創(chuàng)建事實(shí)表(普通表)時(shí)會(huì)有一些限制,下列()說(shuō)法是錯(cuò)誤的。A)表的名字不能超過(guò)32個(gè)字符B)一個(gè)事實(shí)表最多不能超過(guò)1024列C)至少有一級(jí)Hash分區(qū)D)二級(jí)分區(qū)只能是Hash或List[單選題]44.HDFS中當(dāng)前block大小為128M,如果當(dāng)前要上傳到HDFS中的文件大小為300M,那么在存儲(chǔ)時(shí)會(huì)分配()個(gè)block進(jìn)行存儲(chǔ)。A)1B)2C)3D)4[單選題]45.下列說(shuō)法錯(cuò)誤的是?A)HadoopMapReduce是MapReduce的開(kāi)源實(shí)現(xiàn),后者比前者使用門檻低很多B)MapReduce采用非共享式架構(gòu),容錯(cuò)性好C)MapReduce主要用于批處理、實(shí)時(shí)、計(jì)算密集型應(yīng)用D)MapReduce采用?分而治之?策略[單選題]46.()的系數(shù)沒(méi)有封閉形式(closed-form)的解A)Ridge回歸B)LassoC)Ridge回歸和LassoD)以上答案都不丘確[單選題]47.構(gòu)建一個(gè)最簡(jiǎn)單的線性回歸模型需要()系數(shù)(只有一個(gè)特征)。A)1個(gè)B)2個(gè)C)3個(gè)D)4個(gè)[單選題]48.Spark中引入RDD概念的目的是()。A)數(shù)據(jù)存儲(chǔ)B)數(shù)據(jù)查重C)提升容錯(cuò)能力D)增強(qiáng)數(shù)據(jù)一致性[單選題]49.Hive交互Shell指執(zhí)行$HIVE_HOME/bin/hive之后,交互式命令行的提示符是()A)help>B)hive>C)user>D)cmd>[單選題]50.下面說(shuō)法錯(cuò)誤的是()A)可以利用統(tǒng)計(jì)量對(duì)缺失值進(jìn)行填補(bǔ)B)可以利用K近鄰值對(duì)缺失值進(jìn)行填補(bǔ)C)只要有缺失值就必須把對(duì)應(yīng)記錄刪除D)對(duì)于缺失值較多的屬性可以考慮刪除[單選題]51.在數(shù)據(jù)管理技術(shù)的發(fā)展過(guò)程中,經(jīng)歷了人工管理階段、文件系統(tǒng)階段和數(shù)據(jù)庫(kù)系統(tǒng)階段。在這幾個(gè)階段,數(shù)據(jù)獨(dú)立性最高的是()階段A)數(shù)據(jù)庫(kù)系統(tǒng)B)文件系統(tǒng)C)人工管理D)數(shù)據(jù)項(xiàng)管理[單選題]52.以下選項(xiàng)對(duì)GES概念描述正確的是()。A)Edge:邊,用于表示關(guān)系度B)EdgeLabel:邊的標(biāo)簽,用于表示現(xiàn)實(shí)世界中的關(guān)系類型C)VertexLabel:節(jié)點(diǎn)的標(biāo)簽,用于表示現(xiàn)實(shí)世界中的實(shí)體類型D)vertex:節(jié)點(diǎn)/頂點(diǎn),用于表示現(xiàn)實(shí)世界中的實(shí)體對(duì)象[單選題]53.某產(chǎn)品由甲乙兩個(gè)工廠提供,甲工廠提供40%,乙工廠提供60%,甲工廠的次品率是1%,乙公司是2%,現(xiàn)在檢測(cè)出一個(gè)次品,是甲工廠生產(chǎn)的概率是()A)0.1B)0.75C)0.45D)0.25[單選題]54.AUC是衡量()模型優(yōu)劣的一種評(píng)價(jià)指標(biāo)。A)回歸B)分類C)二分類D)聚類第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.K-Means優(yōu)點(diǎn)()A)簡(jiǎn)單易于理解B)時(shí)間復(fù)雜度低C)簡(jiǎn)單易于實(shí)現(xiàn)D)以上說(shuō)法都不對(duì)[多選題]56.關(guān)于主鍵下列說(shuō)法正確的是()A)可以是表中的一個(gè)字段,B)是確定數(shù)據(jù)庫(kù)中的表的記錄的唯一標(biāo)識(shí)字段,C)該字段不可為空也不可以重復(fù)D)可以是表中的多個(gè)字段組成的。[多選題]57.下列關(guān)于交叉驗(yàn)證法描述正確的是(__)。A)交叉驗(yàn)證法先將數(shù)據(jù)集劃分為k個(gè)大小相似的互斥子集B)交叉驗(yàn)證法將數(shù)據(jù)集劃分成的k個(gè)子集應(yīng)盡可能保持?jǐn)?shù)據(jù)分布的一致性C)通常把交叉驗(yàn)證法稱為k折交叉驗(yàn)證D)假定數(shù)據(jù)集D中包含m個(gè)樣本,若令交叉驗(yàn)證法中的系數(shù)k=m,則得到了交叉驗(yàn)證法的一個(gè)特例:自助法[多選題]58.關(guān)于Excel數(shù)據(jù)庫(kù)應(yīng)用的描述正確的有()。A)是一個(gè)數(shù)據(jù)清單B)是按一定組織方式存儲(chǔ)在一起的相關(guān)數(shù)據(jù)的集合C)是一個(gè)數(shù)組D)是程序化的電子表格[多選題]59.物聯(lián)網(wǎng)在物流領(lǐng)域的應(yīng)用,催生出了許多智能物流方面的應(yīng)用,以下哪幾項(xiàng)屬于其在智能物流方面的應(yīng)用A)智能海關(guān)B)智能郵政C)智能配送D)智能交通[多選題]60.傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)包括A)數(shù)據(jù)一致性高B)數(shù)據(jù)冗余度低C)簡(jiǎn)單處理的效率高D)產(chǎn)品成熟度高[多選題]61.數(shù)據(jù)科學(xué)項(xiàng)目主要涉及的活動(dòng)包括()。A)模式/模型的應(yīng)用及維護(hù)B)模式/模型的洞見(jiàn)C)結(jié)果的可視化與文檔化D)模式/模型的驗(yàn)證和優(yōu)化[多選題]62.MRv1存在()方面的局限性A)擴(kuò)展性B)可靠性C)資源利用率D)負(fù)載均衡[多選題]63.以下視圖的定義中()可以使用ALTERVIEW修改。--A)視圖名稱B)視圖算法C)定義視圖的用戶D)視圖中各列的名稱[多選題]64.根據(jù)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(國(guó)發(fā)〔2015〕50號(hào)),以下()等信息庫(kù)被列為大力推進(jìn)的基礎(chǔ)數(shù)據(jù)資源。A)人口基礎(chǔ)信息庫(kù)B)法人單位信息資源庫(kù)C)自然資源和空間地理基礎(chǔ)信息庫(kù)D)宏觀經(jīng)濟(jì)數(shù)據(jù)庫(kù)[多選題]65.數(shù)據(jù)共享管理主要包括數(shù)據(jù)目錄、數(shù)據(jù)共享需求清單、數(shù)據(jù)共享負(fù)面清單和數(shù)據(jù)歸集管理。其中數(shù)據(jù)目錄管理主要包括()體系。A)公司整體數(shù)據(jù)目錄B)專業(yè)數(shù)據(jù)庫(kù)表目錄C)共享需求目錄D)負(fù)面清單目錄[多選題]66.關(guān)于表掃描算子的說(shuō)法正確的是()?A)表的數(shù)目比較少的時(shí)候,使用Seqscan效率更高。B)SeqScan是指順序掃描表的所有信息。C)SQL的執(zhí)行計(jì)劃第一步就是從表掃指算子開(kāi)始的。D)對(duì)于點(diǎn)查或者范圍掃描等過(guò)濾大量數(shù)據(jù)的查詢,如果使用Seqscan全表掃描會(huì)比較快。[多選題]67.數(shù)據(jù)科學(xué)以數(shù)據(jù)尤其是大數(shù)據(jù)為研究對(duì)象,主要研究?jī)?nèi)容包括()。A)數(shù)據(jù)加工B)數(shù)據(jù)管理C)數(shù)據(jù)計(jì)算D)數(shù)據(jù)產(chǎn)品開(kāi)發(fā)[多選題]68.Spark容錯(cuò)性的方式有哪些()。A)數(shù)據(jù)檢查點(diǎn)B)存儲(chǔ)原始數(shù)據(jù)C)記錄數(shù)據(jù)的更新D)自建數(shù)據(jù)版本[多選題]69.云管理平臺(tái)的作用包括()。A)將各種接口,工具和流程進(jìn)行組合以提供定義的服務(wù)B)將軟件和硬件進(jìn)行組合C)自動(dòng)化各種工作流程D)提供平臺(tái)的監(jiān)控,運(yùn)維,擴(kuò)展,計(jì)費(fèi)等功能[多選題]70.數(shù)據(jù)管理包含的管理活動(dòng)有()。A)識(shí)別B)度量C)監(jiān)控D)預(yù)警[多選題]71.半結(jié)構(gòu)化數(shù)據(jù)包括()。A)Excel表格B)HTMLC)檢查身體后得到的體檢報(bào)告D)銀行賬戶上的消費(fèi)記錄[多選題]72.EDA(探索性數(shù)據(jù)分析)方法與傳統(tǒng)統(tǒng)討學(xué)的驗(yàn)證性分析方法的區(qū)別有()。A)EDA需要事先提出假設(shè),而驗(yàn)證性分析不需要B)EDA中采用的方法往往比驗(yàn)證性分析簡(jiǎn)單C)在一般數(shù)據(jù)科學(xué)項(xiàng)目中,探索性分析在先,驗(yàn)證性分析在后中D)EDA更為簡(jiǎn)單、易學(xué)和易用[多選題]73.泛在電力物聯(lián)網(wǎng)從結(jié)構(gòu)上看,包括了():A)感知層B)網(wǎng)絡(luò)層C)平臺(tái)層D)應(yīng)用層[多選題]74.CNN相比于全連接的DNN有哪些優(yōu)勢(shì)?()A)參數(shù)更少B)泛化更好C)訓(xùn)練更快D)更容易搭建[多選題]75.在ROC空間中,以(__)為橫軸,以(__)為縱軸。A)TPrateB)FNrateC)FPrateD)TNrate[多選題]76.如何解決mapreduce中的數(shù)據(jù)傾斜問(wèn)題()A)利用combiner提前進(jìn)行reduce,把一個(gè)mapper中的相同key進(jìn)行了聚合,減少shuffle過(guò)程中數(shù)據(jù)量,以及reduce端的計(jì)算量B)reducejoinC)增加reduce個(gè)數(shù)D)局部聚合加全局聚合。即進(jìn)行兩次mapreduce[多選題]77.尋找數(shù)據(jù)集中的關(guān)系是為了尋找精確、方便并且有價(jià)值地總結(jié)出數(shù)據(jù)的某一特征的表示,這個(gè)過(guò)程包括了以下哪些步驟?()A)選擇一個(gè)算法過(guò)程使評(píng)分函數(shù)最優(yōu)B)決定如何量化和比較不同表示擬合數(shù)據(jù)的好壞C)決定要使用的表示的特征和結(jié)構(gòu)D)決定用什么樣的數(shù)據(jù)管理原則以高效地實(shí)現(xiàn)算法第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.不管輸入什么,Python3A)正確B)錯(cuò)誤[判斷題]79.正則表達(dá)式'[^abc]'可以一個(gè)匹配任意除'a'、'b'、'c'之外的字符。A)正確B)錯(cuò)誤[判斷題]80.近24個(gè)月,人行?逾期及違約信息概要?存在呆賬信息匯總筆數(shù)>0且余額>0的客戶,一般情況,可通過(guò)貸記卡辦理審批。A)正確B)錯(cuò)誤[判斷題]81.假設(shè)os模塊已導(dǎo)入,那么列表推導(dǎo)式[filenameforfilenameinosA)正確B)錯(cuò)誤[判斷題]82.在噪聲數(shù)據(jù)中,波動(dòng)數(shù)據(jù)比離群點(diǎn)數(shù)據(jù)偏離整體水平更大。A)正確B)錯(cuò)誤[判斷題]83.HDFS采用的是?一次寫入、多次讀取''的文件訪問(wèn)模型。所以推薦一個(gè)文件經(jīng)過(guò)創(chuàng)建、寫入和關(guān)閉之后,就不要再去修改。A)正確B)錯(cuò)誤[判斷題]84.表達(dá)式'C:\\windows\\notepadA)正確B)錯(cuò)誤[判斷題]85.云計(jì)算平臺(tái)具有創(chuàng)建、運(yùn)行、遷移和刪除運(yùn)行在云平臺(tái)上的虛擬機(jī)的超級(jí)權(quán)限,所以平臺(tái)及管理員的權(quán)限控制是安全運(yùn)行保障的重要內(nèi)容。A)正確B)錯(cuò)誤[判斷題]86.文件對(duì)象的tell()方法用來(lái)返回文件指針的當(dāng)前位置。A)正確B)錯(cuò)誤[判斷題]87.Hive默認(rèn)不支持動(dòng)態(tài)分區(qū)功能,需要手動(dòng)設(shè)置動(dòng)態(tài)分區(qū)參數(shù)開(kāi)啟功能。()A)正確B)錯(cuò)誤[判斷題]88.商品比價(jià)網(wǎng)站可以幫助人們購(gòu)買決策,告訴消費(fèi)者什么時(shí)候買什么產(chǎn)品最便宜,這利用的是大數(shù)據(jù)全樣而非抽樣的思維A)正確B)錯(cuò)誤[判斷題]89.Series和DataFrame是pandas包中的數(shù)據(jù)結(jié)構(gòu),Series像二維數(shù)組,DataFrame像表格A)正確B)錯(cuò)誤[判斷題]90.數(shù)據(jù)科學(xué)家應(yīng)該學(xué)會(huì)數(shù)據(jù)科學(xué)的基礎(chǔ)理論,尤其是其主要理念、原則、理論和方十法。()A)正確B)錯(cuò)誤[判斷題]91.機(jī)器學(xué)習(xí)可自動(dòng)學(xué)習(xí)有用特征,深度學(xué)習(xí)需人工選取特征。A)正確B)錯(cuò)誤[判斷題]92.Hadoop默認(rèn)調(diào)度器策略為FIFO,并支持多個(gè)Pool提交Job。()A)正確B)錯(cuò)誤[判斷題]93.Flume不支持多級(jí)聯(lián)操作。A)正確B)錯(cuò)誤第4部分:?jiǎn)柎痤},共4題,請(qǐng)?jiān)诳瞻滋幪顚懻_答案。[問(wèn)答題]94.停止hdfs的shell腳本為()[問(wèn)答題]95.HDFS聯(lián)邦機(jī)制下,各NameNode間元數(shù)據(jù)是不共享的A)TRUEB)FALSE[問(wèn)答題]96.HFS的出現(xiàn)解決了需要在HDFS中存儲(chǔ)大量的小文件答案:10MB以下。同時(shí)也要存儲(chǔ)一些大文件答案:10MB以上的混合的場(chǎng)景A)TRUEB)FALSE[問(wèn)答題]97.Hadoop-env.sh文件當(dāng)下的位置?[單選題]98.Spark中Job的劃分是依據(jù)()A)依賴B)Action算子C)Transformation算子[單選題]99.從已知事實(shí)出發(fā),通過(guò)規(guī)則庫(kù)求得結(jié)論的產(chǎn)生式系統(tǒng)的推理方式是()A)正向推理B)反向推理C)雙向推理[單選題]100.下列關(guān)于極大似然估計(jì)的描述,錯(cuò)誤的是()A)極大似然估計(jì)先假定其具有某種確定的概率分布形式B)極大似然估計(jì)沒(méi)有確定的概率分布形式巳概率模型的訓(xùn)練過(guò)程就是參數(shù)估計(jì)C)貝葉斯學(xué)派認(rèn)為參數(shù)本身也有分布,是未觀察的隨機(jī)變量1.答案:D解析:2.答案:A解析:3.答案:C解析:4.答案:D解析:5.答案:D解析:6.答案:C解析:7.答案:C解析:8.答案:C解析:preprocessing模塊中函數(shù)normalize()提供了一個(gè)快速又簡(jiǎn)單的在一個(gè)單向量上來(lái)實(shí)現(xiàn)正則化功能的方式。9.答案:A解析:大數(shù)據(jù)環(huán)境下的隱私擔(dān)憂,主要表現(xiàn)為人信息的被識(shí)別與暴露。10.答案:D解析:11.答案:C解析:12.答案:B解析:13.答案:C解析:14.答案:A解析:15.答案:D解析:16.答案:C解析:17.答案:B解析:18.答案:C解析:19.答案:C解析:20.答案:D解析:數(shù)據(jù)安全技術(shù)保護(hù)與信息系統(tǒng)包含同步規(guī)劃、同步建設(shè)、同步使用三項(xiàng)原則。21.答案:B解析:22.答案:B解析:23.答案:D解析:24.答案:A解析:25.答案:C解析:26.答案:D解析:27.答案:A解析:28.答案:D解析:29.答案:C解析:30.答案:A解析:31.答案:C解析:32.答案:D解析:區(qū)域生長(zhǎng)法是基于圖像

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論