大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷36)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷36)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷36)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷36)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷36)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷36)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共57題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.HDFS默認(rèn)的一個塊大小是()。A)64MBB)8KBC)32KBD)16KB答案:A解析:[單選題]2.HDFS的副本放置策略中,同一機(jī)架不同的服務(wù)器之間的距離是A)3B)2C)1D)4答案:B解析:[單選題]3.吸煙有害身體健康的法律訴訟的案例體現(xiàn)的大數(shù)據(jù)思維方式是()A)全樣而非抽樣B)效率而非精確C)相關(guān)而非因果D)以數(shù)據(jù)為中心答案:C解析:[單選題]4.以下關(guān)于異常處理的描述,正確的是:A)Python中允許利用raise語句由程序主動引發(fā)異常B)try語句中有except子句就不能有finally子句C)Python中,可以用異常處理捕獲程序中的所有錯誤D)引發(fā)一個不存在索引的列表元素會引發(fā)NameError錯誤答案:A解析:[單選題]5.下列關(guān)于數(shù)據(jù)轉(zhuǎn)換,正確的是()。A)Json內(nèi)的取值只能有統(tǒng)一格式B)PDF文件在不同平臺上打開顯示不同C)可以通過Python將CSV文件轉(zhuǎn)換成Excel格式D)Excel存儲數(shù)據(jù)的量無限制答案:C解析:Json內(nèi)的取值可以有多種格式,PDF文件在不同平臺上打開顯示相同,Excel存儲數(shù)據(jù)的量在Excel2007及以后版本,一個工作表最多可有1048576行、16384列。[單選題]6.下面不屬于農(nóng)業(yè)的有(__)。A)farmersB)farmlogsC)prosperaD)uber答案:D解析:[單選題]7.使用Pig語句對表中的數(shù)據(jù)進(jìn)行排序,下列語句正確的是()。A)SELECT*FROMtmp_tableORDERBYage;B)tmp_table_order=ORDERtmp_tableBYageASC;DUMPtmp_table_order;C)DUMPtmp_tableORDERBYageASC;D)ORDERtmp_tableBYageASC;答案:B解析:[單選題]8.通常?落伍者?是影響MapReduce總執(zhí)行時間的主要影響因素之一,為此MapReduce采用()機(jī)制來解決。A)分布式計算B)惰性計算C)推測性執(zhí)行的任務(wù)備份D)先進(jìn)先出答案:C解析:[單選題]9.(__)是一門以可視化交互為基礎(chǔ),綜合運(yùn)用圖形學(xué)、數(shù)據(jù)挖掘和人機(jī)交互等多個領(lǐng)域的知識,以實(shí)現(xiàn)人機(jī)協(xié)同完成可視化任務(wù)為主要目的的分析推理性學(xué)科。A)信息可視化B)科學(xué)可視化C)可視分析學(xué)D)數(shù)據(jù)可視化答案:C解析:[單選題]10.通過HDFS的Shel1命令來操作HDFS,表示刪除文件的命令是?A)hdfsdfs-rmB)hdfsdfs-putC)hdfsdfs-mkdirD)hdfsdfs-catCpath>答案:A解析:[單選題]11.下面哪項(xiàng)是Hadoop的作者?()A)MartinFowlerB)DougcuttingC)MarkElliotZuckerbergD)KentBeck答案:B解析:[單選題]12.在HBase的組件中,哪一個負(fù)責(zé)日志記錄()A)HRegionB)HFileC)MemStoreD)WAL答案:D解析:[單選題]13.在網(wǎng)絡(luò)日志數(shù)據(jù)分析場景中,日志服務(wù)器通過1og4將數(shù)據(jù)傳給(),()會對數(shù)據(jù)進(jìn)行簡單的處理過濾,然后將數(shù)據(jù)按照日期存儲到()上。A)Flume.Flume.HDFSB)HDFS、Flume、FlumeC)Spark.Sgoop.FlumeD)Hive、Flume、Loader答案:A解析:[單選題]14.下列選項(xiàng)中,用于關(guān)閉文件的方法是()。參考答案:A)read()B)tell()C)seek()D)close()答案:D解析:[單選題]15.SQL語言的數(shù)據(jù)操縱語句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的,也是使用最頻繁的語句是()。A)UPDATEB)SELECTC)DELETED)INSERT答案:B解析:[單選題]16.()不僅可用于多層前饋神經(jīng)網(wǎng)絡(luò),還可用于其他類型的神經(jīng)網(wǎng)絡(luò)A)感知機(jī)B)神經(jīng)元C)神經(jīng)系統(tǒng)D)誤差逆?zhèn)鞑ゴ鸢?D解析:[單選題]17.假設(shè)你在卷積神經(jīng)網(wǎng)絡(luò)的第一層中有5個卷積核,每個卷積核尺寸為7x7,具有零填充且步幅為1該層的輸入圖片的維度是224x224x3那么該層輸出的維度是()A)217x217x3B)217x217x8C)218x218x5D)220x220x7答案:C解析:[單選題]18.Spark2.3.0集群搭建對jdk版本的要求是(__)。A)jdk1.5以上B)jdk1.6以上C)jdk1.7以上D)jdk1.8以上答案:D解析:[單選題]19.在Hadoop生態(tài)系統(tǒng)中,()可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射成一張數(shù)據(jù)庫表,并提供簡單的查詢語言。A)PigB)HBaseC)HiveD)MapReduce答案:C解析:在Hadoop生態(tài)系統(tǒng)中,Hive可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射成一張數(shù)據(jù)庫表,并提供簡單的查詢語言[單選題]20.以下不是測試方法的是()A)留出法B)交叉驗(yàn)證法C)自助法D)全量法答案:D解析:[單選題]21.scipy中模塊signal的作用是什么?A)信號處理B)程序輸入輸出C)程序輸入輸出D)計算積分答案:A解析:[單選題]22.下面關(guān)于Timetoast的描述,哪個是錯誤的?()A)Timetoast是在線創(chuàng)作基于時間軸事件記載服務(wù)的網(wǎng)站B)提供個性化的時間線服務(wù)C)Timetoast基于flash平臺,并基于flash時間軸上任意加入事件D)Timetoast是一個提供復(fù)雜統(tǒng)計圖表的工具答案:D解析:[單選題]23.一個對象的離群點(diǎn)得分是該對象周圍密度的逆。這是基于()的離群點(diǎn)定義。A)概率B)鄰近度C)密度D)聚類答案:C解析:[單選題]24.()不是神經(jīng)網(wǎng)絡(luò)的代表A)卷積神經(jīng)網(wǎng)絡(luò)B)遞歸神經(jīng)網(wǎng)絡(luò)C)殘差網(wǎng)絡(luò)D)xgboost算法答案:D解析:[單選題]25.Hive查看數(shù)據(jù)庫命令是()A)looktable;B)showtable;C)lookdatabases;D)showdatabases;答案:D解析:[單選題]26.Kafka中數(shù)據(jù)從Producer到Broker和Broker到Consumer分別是哪種傳遞方式?A)push,pushB)push,pullC)pullpullD)pull,push答案:B解析:[單選題]27.()是實(shí)現(xiàn)數(shù)據(jù)戰(zhàn)略的重要保障。A)數(shù)據(jù)管理B)數(shù)據(jù)分析C)數(shù)據(jù)治理D)數(shù)據(jù)規(guī)劃答案:C解析:從DMM模型可以看出,數(shù)據(jù)治理是實(shí)現(xiàn)數(shù)據(jù)戰(zhàn)略的重要保障。數(shù)據(jù)管理指通過管理數(shù)據(jù)實(shí)現(xiàn)組織機(jī)構(gòu)的某種業(yè)務(wù)目的。然而,數(shù)據(jù)治理則指如何確保數(shù)據(jù)管理順利、有效、科學(xué)地完成。[單選題]28.Spark的任務(wù)調(diào)度主要是由()來完成。A)TaskSchedulerB)DAGSchedulerC)SchedulerBackendD)ApplicationMaster答案:B解析:[單選題]29.在HBase的專用過濾器中,TimestampsFilter是()A)時間戳過濾器B)包含結(jié)束的過濾器C)列計數(shù)過濾器D)首次行鍵過濾器答案:A解析:[單選題]30.下列不是hadoop核心組件的是()。A)JobTrackerB)TaskTrackerC)HDFSD)Hbase答案:D解析:[單選題]31.金融界數(shù)據(jù)安全事件頻頻發(fā)生,產(chǎn)生諸多不良后果。金融大數(shù)據(jù)的安全風(fēng)險不包括()。A)金融大數(shù)據(jù)高度集中B)智能終端安全性低C)監(jiān)管不力或缺失D)從業(yè)人員安全意識高答案:D解析:[單選題]32.()算法是分類算法A)DBSCANB)C4.5C)K-MeanD)EM答案:B解析:[單選題]33.以下描述中不正確的是(___)。A)整個數(shù)據(jù)集可以稱作一個樣本B)樣本不可以是單個示例C)一個樣本可以稱為一個?特征向量?D)樣本中反映事件或?qū)ο笤谀撤矫娴谋憩F(xiàn)或性質(zhì)的事項(xiàng),可以稱為?特征?答案:B解析:[單選題]34.如果SVM模型欠擬合,以下方法(___)可以改進(jìn)模型。A)增大懲罰參數(shù)C的值B)減小懲罰參數(shù)C的值C)減小核系數(shù)(gamma參數(shù))D)以上都不行答案:A解析:[單選題]35.下列說法錯誤的是()A)Partitioner負(fù)責(zé)控制map輸出結(jié)果key的分割B)Reporter用于MapReduce應(yīng)用程序報告進(jìn)度C)OutputCollector收集Mapper或Reducer輸出數(shù)據(jù)D)Reduce的數(shù)目不可以是0答案:D解析:reduce的數(shù)目可以是0。有些作業(yè)不需要進(jìn)行歸約進(jìn)行處理,那么就可以設(shè)置reduce的數(shù)量為0來進(jìn)行處理,這種情況下用戶的作業(yè)運(yùn)行速度相對較高,map的輸出會直接寫入到SetOutputPath(path)設(shè)置的輸出目錄,而不是作為中間結(jié)果寫到本地。同時Hadoop框架在寫入文件系統(tǒng)前并不對之進(jìn)行排序。[單選題]36.以下可以在項(xiàng)目開發(fā)中實(shí)現(xiàn)分頁功能的是()。--A)WHEREB)GROUPBYC)LIMITD)以上答案都不正確答案:C解析:[單選題]37.下面關(guān)于回歸分析的描述錯誤的是:()A)是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法B)回歸分析按照涉及的變量的多少,分為一元回歸和多元回歸分析C)按照因變量的多少,可分為線性回歸分析和非線性回歸分析D)在大數(shù)據(jù)分析中,回歸分析是一種預(yù)測性的建模技術(shù)答案:C解析:[單選題]38.關(guān)于Maxcompute中的運(yùn)算符的說法,正確的是:()。A)String類型可以和其他任意類型進(jìn)行隱式轉(zhuǎn)換:Boolean不行B)除boolean外,其他類型不允許參與邏輯運(yùn)算,也不允許其他類型的隱式類型轉(zhuǎn)換C)只有bigint、double才能參與算數(shù)運(yùn)算:只有string、bigint、double和Decimal才能參與算術(shù)運(yùn)算D)特殊的關(guān)系運(yùn)算符rlike表示右側(cè)開始匹配答案:B解析:[單選題]39.CNN神經(jīng)網(wǎng)絡(luò)對圖像特征提取帶來了變革性的變化,使之前的人工特征提取升級到數(shù)據(jù)驅(qū)動的自動特征提取,在αN中,起到特征提取作用的網(wǎng)絡(luò)層是()A)convolution層B)fullconnect層C)maxpooling層D)norm層答案:A解析:[單選題]40.以下哪些選項(xiàng)不屬于大數(shù)據(jù)計算框架?A)tensorFlowB)ClouderaCDHC)ApacheHadoopD)FusionInsight答案:A解析:[單選題]41.numpy默認(rèn)產(chǎn)生的數(shù)據(jù)類型是(__)。A)int16B)float32C)charD)float64答案:D解析:[單選題]42.信息系統(tǒng)安全等級保護(hù)是指()。A)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信息系統(tǒng)分等級實(shí)行安全保護(hù)。B)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信息系統(tǒng)分等級實(shí)行安全保護(hù),對信息系統(tǒng)中使用的信息安全產(chǎn)品實(shí)行按等級管理。C)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信息系統(tǒng)分等級實(shí)行安全保護(hù),對信息系統(tǒng)中使用的信息安全產(chǎn)品實(shí)行按等級管理,對信息系統(tǒng)中發(fā)生的信息安全事件分等級響應(yīng)和處置。D)對國家安全、法人和其他組織及公民的專有信息以及公開信息和存儲、傳輸、處理這些信息的信息系統(tǒng)分等級實(shí)行安全保護(hù),對信息系統(tǒng)中發(fā)生的信息安全事件分等級響應(yīng)和處置。答案:C解析:[單選題]43.以下哪些情景可以使用機(jī)器學(xué)習(xí)技術(shù)?()A)記錄過去一段時間內(nèi)某移動運(yùn)營商客戶轉(zhuǎn)移到競爭對手的案例B)統(tǒng)計電商網(wǎng)站某類別商品在一定時間內(nèi)的銷量均值C)統(tǒng)計某零售超市一個月內(nèi)哪類牛奶的銷量最大D)為攜程在線旅游公司的客戶推薦度假產(chǎn)品答案:D解析:[單選題]44.數(shù)據(jù)科學(xué)基本原則中,"基于數(shù)據(jù)的智能"的主要特點(diǎn)是()。A)數(shù)據(jù)簡單、但算法簡單B)數(shù)據(jù)復(fù)雜、但算法簡單C)數(shù)據(jù)簡單、但算法復(fù)雜D)數(shù)據(jù)復(fù)奈、但算法復(fù)雜答案:B解析:[單選題]45.目前輿情分析產(chǎn)品中不包含以下哪類分析:()A)政務(wù)輿情B)商業(yè)輿情C)維穩(wěn)輿情D)體壇輿情答案:D解析:[單選題]46.分析應(yīng)用計算后的分析主題數(shù)據(jù)存儲在:()。A)貼源層B)共享層C)分析層D)整合明細(xì)層答案:C解析:[單選題]47.np.linalg.svd()函數(shù)可以實(shí)現(xiàn)()功能。A)計算協(xié)方差矩陣B)實(shí)現(xiàn)奇異值分解C)計算方差D)計算均值答案:B解析:svd()實(shí)現(xiàn)奇異值分解。[單選題]48.下面對SecondaryNameNode第二名稱節(jié)點(diǎn)的描述,哪個是錯誤的?A)SecondaryNameNode一般是并行運(yùn)行在多臺機(jī)器上B)它是用來保存名稱節(jié)點(diǎn)中對HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點(diǎn)重啟的時間C)SecondaryNameNode通過HTTPGET方式從NameNode上獲取到FsImage和EditLog文件,并下載到本地的相應(yīng)目錄下D)SecondaryNameNode是HDFS架構(gòu)中的一個組成部分答案:A解析:[單選題]49.若用如下的SQL語句創(chuàng)建一個student表:CREATETABLEstudent(NOC(4)NOTNULL,NAMEC(8)NOTNULL,SEXC(2),AGEN(2))可以插入到student表中的是A)('1031','曾華',男,23)B)('1031','曾華',NULL,NULL)C)(NULL,'曾華','男','23')D)('1031',NULL,'男',23)答案:B解析:[單選題]50.在WebHCat架構(gòu)中,用戶能夠通過安全的HTTPS協(xié)議執(zhí)行以下()操作。A)執(zhí)行HiveDDL操作B)運(yùn)行MapReduce任務(wù)C)運(yùn)行HiveSQL任務(wù)D)以上全部正確答案:D解析:[單選題]51.圖像識別常用softmA、x函數(shù)接在模型的輸出上,其作用為:()。A)、增加不同類別之間的區(qū)分度B)、突出輸出向量中類標(biāo)的對應(yīng)的維度C)、對輸出歸一化,同時以概率的更好解釋輸出向量D)、過濾無用的環(huán)境信息答案:C解析:[單選題]52.自然語言處理、語音識別、股票交易、氣象預(yù)測等應(yīng)用適合采用()處理A)循環(huán)神經(jīng)網(wǎng)絡(luò)B)卷積神經(jīng)網(wǎng)絡(luò)C)多層神經(jīng)網(wǎng)絡(luò)D)單層神經(jīng)網(wǎng)絡(luò)答案:A解析:[單選題]53.以下()組件負(fù)責(zé)生成和維護(hù)全局事務(wù)ID、事務(wù)快照、時間戳等全局唯一信息。A)GTMB)WLMC)CND)DN答案:A解析:[單選題]54.人工智能的目的是讓機(jī)器能夠(),以實(shí)現(xiàn)某些腦力勞動的機(jī)械化。A)具有智能B)與人一樣工作C)完全代替人的大腦D)模擬、延伸與擴(kuò)展人的智能答案:D解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.銀行進(jìn)行信貸分析時,通常采用()兩種數(shù)據(jù)分析方法A)宏觀經(jīng)濟(jì)運(yùn)行分析B)行業(yè)風(fēng)險分析C)非財務(wù)分析D)財務(wù)分析答案:CD解析:[多選題]56.HDFS采用抽象的塊概念可以帶來以下哪幾個明顯的好處?A)支持大規(guī)模文件存儲B)支持小規(guī)模文件存儲C)適合數(shù)據(jù)備份D)簡化系統(tǒng)設(shè)計答案:ACD解析:[多選題]57.信息技術(shù)(IT)主要包括()。A)通信技術(shù)B)計算機(jī)技術(shù)C)傳感技術(shù)D)微電子技術(shù)答案:ABCD解析:[多選題]58.以下對大數(shù)據(jù)4V特性描述正確的是()。A)Value是指價值密度低B)大數(shù)據(jù)中所說的?速度?包括兩種:計算速度和處理速度C)大數(shù)據(jù)時間分布是不均勻的D)在大數(shù)據(jù)中,價值價值與數(shù)據(jù)總量的大小存在線性關(guān)系答案:AC解析:[多選題]59.下面關(guān)于數(shù)據(jù)產(chǎn)品開發(fā)相關(guān)描述正確的有(__)。A)?數(shù)據(jù)產(chǎn)品?在數(shù)據(jù)科學(xué)中是統(tǒng)稱B)數(shù)據(jù)產(chǎn)品開發(fā)是數(shù)據(jù)科學(xué)的重要研究任務(wù)之一C)數(shù)據(jù)產(chǎn)品開發(fā)是數(shù)據(jù)科學(xué)區(qū)別于其他學(xué)科的重要研究任務(wù)D)數(shù)據(jù)科學(xué)的學(xué)習(xí)目的之一是提升自己的數(shù)據(jù)產(chǎn)品開發(fā)能力答案:ABCD解析:[多選題]60.企業(yè)數(shù)據(jù)孤島產(chǎn)生的原因主要包括哪兩個方面:()A)以功能為標(biāo)準(zhǔn)的部門導(dǎo)致數(shù)據(jù)孤島B)不同類型、不同版本的信息化管理系統(tǒng)導(dǎo)致數(shù)據(jù)孤島C)機(jī)構(gòu)設(shè)置不合理D)各個部門責(zé)權(quán)利不清晰答案:AB解析:[多選題]61.數(shù)據(jù)脫敏的主要原則包括:()A)保持原有數(shù)據(jù)特征B)保持?jǐn)?shù)據(jù)之間的一致性C)保持業(yè)務(wù)規(guī)則的關(guān)聯(lián)性D)多次脫敏之間的數(shù)據(jù)一致性答案:ABCD解析:[多選題]62.某政府企業(yè)的數(shù)據(jù)庫工程師使用Loader進(jìn)行數(shù)據(jù)遷移,那么他可以將以下哪些數(shù)據(jù)源遷移至Hadoop?A)自定義數(shù)漏源B)MySQL數(shù)據(jù)庫C)Oracle數(shù)據(jù)車D)SFTPServer答案:ABCD解析:[多選題]63.可以通過Java調(diào)用API對HDFS文件系統(tǒng)操作的內(nèi)容包括?()A)查詢HDFS指走目錄下的文件B)讀取HDFS中指定文件C)在HDFS上創(chuàng)建文件夾D)上傳文件到HDFS上答案:ABCD解析:[多選題]64.大數(shù)據(jù)的來源包括()。A)互聯(lián)網(wǎng)數(shù)據(jù)B)實(shí)時數(shù)據(jù)C)探測數(shù)據(jù)D)傳感器數(shù)據(jù)答案:ABCD解析:[多選題]65.重復(fù)數(shù)據(jù)產(chǎn)生的原因有()A)人為多次提交B)數(shù)據(jù)集成時造成重復(fù)C)系統(tǒng)自身問題導(dǎo)致重復(fù)寫入D)數(shù)據(jù)加工過程中產(chǎn)生數(shù)據(jù)重復(fù)答案:ABCD解析:[多選題]66.Hive業(yè)務(wù)場景中,常常會出現(xiàn)某一張大表連接一張較小的維表,那么為了提高這個JolN操作的效率,可以進(jìn)行如下哪些操作?A)大表在前小表在后B)小表在前大表在后C)設(shè)置參數(shù)hive.auto.convert.join為trueD)設(shè)置參數(shù)hive.groupby.skewindata為true答案:BCD解析:[多選題]67.下列關(guān)于Boosting算法說法正確的是(__)。A)Boosting算法要求基學(xué)習(xí)器能對特定的數(shù)據(jù)分布進(jìn)行學(xué)習(xí)B)Boosting對無法接受帶權(quán)樣本的基學(xué)習(xí)算法,可通過重采樣法進(jìn)行處理C)Boosting算法在訓(xùn)練的每一輪都要檢查當(dāng)前生成的基學(xué)習(xí)器是否滿足基本條件D)一旦當(dāng)前生成的基學(xué)習(xí)器不滿足條件,則當(dāng)前基學(xué)習(xí)器被拋棄,且學(xué)習(xí)過程停止答案:ABCD解析:[多選題]68.下列關(guān)于MapReduce全局計數(shù)器說法正確的是()A)MapReduce計數(shù)器是用來記錄Job的執(zhí)行進(jìn)度和狀態(tài)的,它的作用可以理解為日志。B)MapReduce內(nèi)置計數(shù)器主要用來記錄作業(yè)的運(yùn)行結(jié)果C)自定義計數(shù)器的好處在于整個計數(shù)的過程只需要在map階段就可以完成,而且也可以不做任何輸出D)我們可以自定義枚舉聲明計數(shù)器答案:ACD解析:[多選題]69.下列關(guān)于HLog工作原理的描述,哪些是正確的?A)分布式環(huán)境必須要考慮系統(tǒng)出錯。HBase采用HLog保證B)HBase系統(tǒng)為每個Region服務(wù)器配置了一個HLog文件C)Zookeeper會實(shí)時監(jiān)測每個Region服務(wù)器的狀態(tài)D)Master首先會處理該故障Region服務(wù)器上面遺留的HLog文件答案:ABCD解析:[多選題]70.下列對模型性能提高有幫助的有()。A)數(shù)據(jù)預(yù)處理B)特征工程C)機(jī)器學(xué)習(xí)算法D)模型集成答案:ABCD解析:數(shù)據(jù)預(yù)處理、特征工程、機(jī)器學(xué)習(xí)算法、模型集成均可提高模型性能。[多選題]71.具體由創(chuàng)建世界一流能源互聯(lián)網(wǎng)企業(yè)辦公室統(tǒng)籌組織,下設(shè)()常設(shè)小組A)技術(shù)組B)運(yùn)營組C)商務(wù)組D)管理優(yōu)化組答案:ACD解析:[多選題]72.下面屬于數(shù)據(jù)產(chǎn)品開發(fā)的特征有(__)。A)以數(shù)據(jù)為中心B)多樣性C)層次性D)增值性答案:ABCD解析:[多選題]73.圖像分割中常用的鄰域有()。A)0鄰域B)4鄰域C)8鄰域D)24鄰域答案:BC解析:[多選題]74.在HA模式下,HDFS里包含哪些組件?A)NameNodeB)DataNodeC)TaskManagerD)SecondaryNameNode答案:ABD解析:[多選題]75.哪些數(shù)據(jù)特性是對聚類分析具有很強(qiáng)影響?A)高維性B)規(guī)模C)稀疏性D)噪聲和離群點(diǎn)答案:ABCD解析:[多選題]76.下列與人工智能場景相關(guān)的有()。A)圖像識別B)人臉識別C)語音識別D)語義分析答案:ABCD解析:人工智能的概念很廣義,圖像識別、人臉識別、語音識別、語義分析都屬于人工智能的應(yīng)用場景。[多選題]77.在大數(shù)據(jù)計算服務(wù)SQL中使用distributeby和sortby可以對數(shù)據(jù)進(jìn)行局部排序,以下對distributeby、sortby的用法描述正確的有:()。A)數(shù)據(jù)會按照distributeby指定的列進(jìn)行分片,hash值相同的數(shù)據(jù)會在一個分片中B)使用sortby子句時,必須有distributeby子句C)sortby和orderby的用法沒有區(qū)別D)在一個分片中,數(shù)據(jù)會按照sortby指定的列進(jìn)行局部排序答案:ABD解析:第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.邏輯回歸不能處理三分類問題A)正確B)錯誤答案:錯解析:[判斷題]79.離線批處理通常通過MR作業(yè)、Spark作業(yè)或者HQL作業(yè)實(shí)現(xiàn)。A)正確B)錯誤答案:對解析:[判斷題]80.Python是一種跨平臺、開源、免費(fèi)的高級動態(tài)編程語言。A)正確B)錯誤答案:錯解析:[判斷題]81.以讀模式打開文件時,文件指針指向文件開始處。A)正確B)錯誤答案:對解析:[判斷題]82.大數(shù)據(jù)和AI的方法最終目的是使得整個社會的運(yùn)轉(zhuǎn)效率顯著提高。A)正確B)錯誤答案:對解析:[判斷題]83.數(shù)據(jù)服務(wù)是指針對用戶不太明確的數(shù)據(jù)查詢和處理任務(wù),以高性能和高吞吐量的方式實(shí)現(xiàn)大眾化的服務(wù),是數(shù)據(jù)價值最重要也是最直接的發(fā)現(xiàn)方式。()A)正確B)錯誤答案:錯解析:[判斷題]84.預(yù)測腫瘤細(xì)胞是良性還是惡性屬于回歸問題。A)正確B)錯誤答案:錯解析:[判斷題]85.已知列表x=[1,2,3],那么執(zhí)行語句x=3之后,變量x的地址不變。A)正確B)錯誤答案:錯解析:[判斷題]86.假設(shè)列表對象aList的值為[3,4,5,6,7,9,11,13,15,17],那么切片aList[3:7]得到的值是[6,7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論