大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷47)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷47)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷47)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷47)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷47)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷47)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共54題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.某項(xiàng)目小組接到一個(gè)大數(shù)據(jù)實(shí)時(shí)分析項(xiàng)目,且對實(shí)時(shí)性要求很高,以下哪種大數(shù)據(jù)計(jì)算框架最合適?A)SparkB)FlinkC)HBaseD)MapReduce答案:B解析:[單選題]2.下列哪一個(gè)屬于浮點(diǎn)型數(shù)據(jù)?A)a=1B)a=3.14C)a='3.14'D)a=True答案:B解析:[單選題]3.對于隨機(jī)森林和GBDT,下面說法正確的是()。A)在隨機(jī)森林的單個(gè)樹中,樹和樹之間是有依賴的,而GBDT中的單個(gè)樹之間是沒有依賴的B)這兩個(gè)模型都使用隨機(jī)特征子集,來生成許多單個(gè)的樹C)我們可以并行地生成GBDT單個(gè)樹,因?yàn)樗鼈冎g是沒有依賴的D)GBDT訓(xùn)練模型的表現(xiàn)總是比隨機(jī)森林好答案:B解析:組成隨機(jī)森林的樹可以并行生成;而GBDT只能是串行生成。[單選題]4.關(guān)于hive錯(cuò)誤的是A)數(shù)據(jù)存儲在HDFS中B)通過類SQL語句快速實(shí)現(xiàn)MapReduce統(tǒng)計(jì)C)Hive的設(shè)計(jì)目標(biāo)為適用于OLTP業(yè)務(wù)場景D)不提供行級數(shù)據(jù)更新操作答案:C解析:[單選題]5.閱讀下面的程序:deffunc():print(x)x=100func()執(zhí)行上述語句后,輸出的結(jié)果為()。A)0B)100C)程序出現(xiàn)異常D)程序編譯失敗答案:C解析:[單選題]6.hadoop集群可以用()種模式進(jìn)行。A)四B)三C)五D)二答案:B解析:[單選題]7.()用于將非線性引人神經(jīng)網(wǎng)絡(luò),它會將值縮小到較小的范圍內(nèi)A)損失函數(shù)B)優(yōu)化函數(shù)C)激活函數(shù)D)目標(biāo)函數(shù)答案:C解析:[單選題]8.以下選項(xiàng)中,輸出結(jié)果是False的是A)>>>5isnot4B)>>>5!=4C)>>>False!=0D)>>>5is5答案:C解析:[單選題]9.()算法是一種最有影響的挖掘關(guān)聯(lián)規(guī)則頻繁項(xiàng)日集的算法A)FP-grow也B)EClatC)聚類D)Apdori答案:D解析:[單選題]10.MOS系統(tǒng)的開發(fā)者是()。A)微軟公司B)惠普公司C)蘋果公司D)IBM公司答案:C解析:[單選題]11.下列語句中,()在Pyhon中是非法的。A)x=y=z=1B)x=(y=z+1)C)x,y=y,xD)X+=y答案:B解析:[單選題]12.大數(shù)據(jù)服務(wù)(MaxCompute,原ODPS)中客戶表customer是一張非分區(qū)表,現(xiàn)在想要清空表的內(nèi)容然后重新上傳數(shù)據(jù),可以通過:()。A)insertoverwritetablecustomerselect*fromcustomer;B)deletefromcustomer;C)truncatetablecustomer;D)droptablecustomer;答案:A解析:[單選題]13.下列關(guān)于支持向量機(jī)的說法錯(cuò)誤的是(__)。A)硬間隔支持向量機(jī)易出現(xiàn)過擬合的情況B)軟間隔支持向量機(jī)的目標(biāo)函數(shù)不是一個(gè)二次規(guī)劃問題C)松弛變量可用來解決線性不可分問題D)支持向量機(jī)可用來進(jìn)行數(shù)據(jù)的分類答案:B解析:[單選題]14.下列選項(xiàng)中,關(guān)于HDFS說法錯(cuò)誤的是()A)HDFS是Hadoop的核心之一B)HDFS源于Google的GFS論文C)HDFS用于存儲海量大數(shù)據(jù)D)HDFS是用于計(jì)算海量大數(shù)據(jù)答案:D解析:[單選題]15.完成智慧物聯(lián)體系試點(diǎn)建設(shè),試點(diǎn)建成企業(yè)級物聯(lián)管理中心,實(shí)現(xiàn)輸變電、配用電、客戶側(cè)增量設(shè)備()標(biāo)準(zhǔn)化接入和統(tǒng)一物聯(lián)管理,初步具備能力開放功能A)90%B)100%C)85%D)70%答案:B解析:[單選題]16.下面這段代碼的作用是什么?(VX:HWRZKSTK)A)判斷索引分片是否存在B)判斷索引是否可用C)判斷索引是否存在D)判斷索引類型答案:C解析:[單選題]17.觸發(fā)器不是響應(yīng)以下哪一語句而自動(dòng)執(zhí)行的Mysql語句A)selectB)insertC)deleteD)update答案:A解析:[單選題]18.()不是Hive支持的數(shù)據(jù)類型。A)StructB)IntC)MapD)Long答案:D解析:Hive支持原生數(shù)據(jù)類型(TinyInt、SmallInt、Int、BigInt、Boolean、Float、Double、String),也支持復(fù)雜數(shù)據(jù)類型(Map、Array、Struct、Union),不支持Long。[單選題]19.使用下面哪個(gè)命令可以查看Zookeeper服務(wù)器的環(huán)境信息的是()。A)confB)enviC)srvrD)srst答案:B解析:[單選題]20.以下選項(xiàng)中,不屬于信息時(shí)代的定律的是()A)吉爾德定律B)摩爾定律C)麥特卡爾夫定律D)達(dá)律多定律答案:D解析:[單選題]21.關(guān)于多層前饋神經(jīng)網(wǎng)絡(luò)的描述,錯(cuò)誤的是()A)輸出層與輸入層之間包含隱含層,且隱含層和輸出層都擁有激活函數(shù)的神經(jīng)元B)神經(jīng)元之間存在同層連接以及跨層連接C)輸入層僅僅是接收輸入,不進(jìn)行函數(shù)處理十D)每層神經(jīng)元上一層與下一層全互連答案:B解析:[單選題]22.Python對not、or、and求值的優(yōu)先順序是()。A)andornotB)notandorC)orandnotD)ornotand答案:B解析:詳見對比符優(yōu)先級。[單選題]23.下列關(guān)于類屬性和實(shí)例屬性的說法中,描述正確的是()。A)類屬性既可以顯式定義,又能在方法中定義B)公有類屬性可以通過類和類的實(shí)例訪問C)通過類可以獲取實(shí)例屬性的值D)類的實(shí)例只能獲取實(shí)例屬性的值答案:B解析:[單選題]24.現(xiàn)有如下兩個(gè)Hive表,使用如下哪條語句可以得到以下結(jié)果:()A)selectfromstudentjoinscoreonstudent.id=score.id;B)selectfromstudentleftjoinscoreonstudent.id=score.id;C)selectfromstudentrightjoinscoreonstudent.id=score.id;D)selectfromstudentfulljoinscoreonstudent.id=score.id;答案:B解析:[單選題]25.下列選項(xiàng)中,不能使用下標(biāo)運(yùn)算的是()A)列表(list)B)元組(tuple)C)集合(set)D)字符串(str)答案:C解析:[單選題]26.在全文本搜索的函數(shù)中,用于指定被搜索的列的是()A)MATCH()B)AGAINST()C)FULLTEXT()D)REGEXP()答案:A解析:[單選題]27.以下關(guān)于HBase中HRegionServer的功能描述不正確的是哪一項(xiàng)?A)管理所有的Region,Regiont可以在RegionServer之間遷移。B)HBase的數(shù)據(jù)處理和計(jì)算單元.C)RegionServer是HBase的數(shù)據(jù)服務(wù)進(jìn)程,負(fù)責(zé)處理用戶數(shù)據(jù)的讀寫請求。D)RegionServer-一般與HDFS集群的NameNodei部署在一起,實(shí)現(xiàn)數(shù)據(jù)的存儲功能。答案:B解析:[單選題]28.在使用FileChannel傳輸數(shù)據(jù)時(shí),F(xiàn)lume可以達(dá)到的數(shù)據(jù)傳輸語義是?A)AtmostonceB)AtleastonceC)ExactlyonceD)Notonlyonce答案:B解析:[單選題]29.以下()文件中主要用來配置ResourceManager,NodeManager的通信端口,web監(jiān)控端口等。A)core-site.xmlB)mapred-site.xmlC)hdfs-site.xmlD)yarn-site.xml答案:D解析:[單選題]30.下列操作不屬于Numpy對數(shù)組得操作范疇的是?A)索引和切片B)拼接和分割C)數(shù)組的添加、刪除和去重D)數(shù)組中數(shù)據(jù)的壓縮答案:D解析:[單選題]31.下列語句的輸出結(jié)果為()a=5b=4c=a+bprint("a+b=",c)A)a=5B)b=4C)5+4=9D)a+b=9答案:D解析:[單選題]32.SolrCloud模式是集群模式,在此模式下Solr服務(wù)依賴于以下哪個(gè)服務(wù)A)HBaseB)HDFSC)ZookeeperD)Yarn答案:C解析:[單選題]33.給定詞匯表如下:{"B、oB、","ok","like","footB、A、ll","C、A、r"}。則下面句子?B、otlikesfootB、A、ll"的詞袋模型表示為:A)、[11100]B)、[10110]C)、[10010]D)、[01101]答案:B解析:[單選題]34.對于Maxcompute,下列描述正確的是:().A)在使用多路插入時(shí),可對同一張表同時(shí)執(zhí)行insertinto和insertoverwriteB)使用動(dòng)態(tài)分區(qū)插入時(shí),動(dòng)態(tài)分區(qū)列必須在select列表中C)MaxcomputeSQL支持between子句D)對于分區(qū)表,可指定某個(gè)分區(qū)的lifecycle,其中n為正整數(shù),單位為天答案:B解析:[單選題]35.Python代碼中mpl.rcParams['font.sans-serif']=['SimHei']的作用是()。A)設(shè)置圖表中文顯示的字體B)設(shè)置圖表圖例的位置C)設(shè)置圖表標(biāo)題的顏色D)設(shè)置圖表標(biāo)題的位置答案:A解析:[單選題]36.下列關(guān)于數(shù)據(jù)模型中行的敘述不正確的一項(xiàng)為()。A)表按照行鍵?逐字節(jié)排序?順序?qū)π羞M(jìn)行有序化的處理B)表內(nèi)數(shù)據(jù)非常?緊密?C)不用行的列的數(shù)目完全可以大不相同D)可以只對一行上?鎖?答案:B解析:[單選題]37.如果我使用數(shù)據(jù)集的全部特征并且能夠達(dá)到100%的準(zhǔn)確率,但在測試集上僅能達(dá)到70%左右,這說明().A)欠擬合B)模型很棒C)過擬合D)以上答案都不正確答案:C解析:當(dāng)學(xué)習(xí)器把訓(xùn)練樣本學(xué)得太好了的時(shí)候,很可能已經(jīng)把訓(xùn)練樣本自身的一些特點(diǎn)當(dāng)作了所有潛在樣本都會具有的一般性質(zhì),這樣就會導(dǎo)致泛化性能下降這種現(xiàn)象在機(jī)器學(xué)習(xí)中稱為過擬合。[單選題]38.支撐大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)是()A)數(shù)據(jù)科學(xué)B)數(shù)據(jù)應(yīng)用C)數(shù)據(jù)硬件D)數(shù)據(jù)人才答案:B解析:[單選題]39.()是利用樣本的實(shí)際資料計(jì)算統(tǒng)計(jì)量的取值,并引來以檢驗(yàn)事先對總體某些數(shù)量特征的假設(shè)是否可信作為決策取舍依據(jù)的一種統(tǒng)計(jì)分析方法。A)假設(shè)檢驗(yàn)B)邏輯分析C)方差分析D)回歸分析答案:A解析:假設(shè)檢驗(yàn)又稱統(tǒng)計(jì)假設(shè)檢驗(yàn),是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。其基本原理是先對總體的特征做出某種假設(shè),然后通過抽樣研究的統(tǒng)計(jì)推理,對此假設(shè)應(yīng)該被拒絕還是接受做出推斷。[單選題]40.可以對大數(shù)據(jù)進(jìn)行深度分析的工具是()。A)淺層神經(jīng)網(wǎng)絡(luò)B)ScalaC)深度學(xué)習(xí)D)MapReduce答案:C解析:[單選題]41.以下關(guān)于數(shù)據(jù)科學(xué)描述正確的是()A)數(shù)據(jù)科學(xué)是統(tǒng)計(jì)學(xué)的一部分B)數(shù)據(jù)科學(xué)就是機(jī)器學(xué)習(xí)C)天文學(xué)與數(shù)據(jù)科學(xué)無關(guān)D)數(shù)據(jù)科學(xué)家傾向于用探索數(shù)據(jù)的方式來看待周圍的世界答案:D解析:[單選題]42.(__)不屬于基本分析方法。A)回歸分析B)分類分析C)聚類分析D)元分析答案:D解析:[單選題]43.以下關(guān)于數(shù)據(jù)科學(xué)相關(guān)描述不正確的是()。A)數(shù)據(jù)科學(xué)是數(shù)據(jù),尤其是大數(shù)據(jù)背后的科學(xué)B)?數(shù)據(jù)?是一門科學(xué),答案就在?大數(shù)據(jù)?手中C)在數(shù)據(jù)科學(xué)出現(xiàn)之前,我們關(guān)注的是數(shù)據(jù)主動(dòng)的一面,而在數(shù)據(jù)科學(xué)中我們更加重視的是被動(dòng)作用。D)數(shù)據(jù)科學(xué)的最終研究目標(biāo)是實(shí)現(xiàn)數(shù)據(jù)、物質(zhì)和能量之間的轉(zhuǎn)換。答案:C解析:[單選題]44.Streaming主要通過zookeeper提供以下的()實(shí)現(xiàn)事件偵聽。A)分布式鎖機(jī)制B)WatcherC)CheckpointD)ACK答案:B解析:[單選題]45.()情況下,LDA會失敗。A)如果有辨識性的信息不是平均值,而是數(shù)據(jù)的方差B)如果有辨識性的信息是平均值,而不是數(shù)據(jù)方差C)如果有辨識性的信息是數(shù)據(jù)的均值和方差D)以上答案都不正確答案:A解析:LDA的思想是投影后類內(nèi)方差最小、類間方差最大。[單選題]46.從大量數(shù)據(jù)中提取知識的過程通常稱為()。A)數(shù)據(jù)挖掘B)人工智能C)數(shù)據(jù)清洗D)數(shù)據(jù)倉庫答案:A解析:[單選題]47.Hadoop的哪個(gè)包的功能是根據(jù)DDL(數(shù)據(jù)描述語言)自動(dòng)生成他們的編解碼函數(shù)()A)recordB)metricsC)utilD)tool答案:A解析:A、record【根據(jù)DDL自動(dòng)生成它們的編解碼函數(shù)】B、metrics【信息收集,由于監(jiān)控】C、util【工具類】D、tool【提供命令行工具,如distcp(集群間復(fù)制數(shù)據(jù))、archive(打包歸檔)】/frady-p-2704658.html[單選題]48.(__)又稱情感傾向性分析,是指對給定的文本,識別其中主觀性文本的傾向是肯定還是否定的,或者說是正面還是負(fù)面的,是情感分析領(lǐng)域研究最多的A)情感分類B)情感檢索C)情感抽取D)情感分析答案:A解析:[單選題]49.在訓(xùn)練集上每學(xué)到一條規(guī)則,就將該規(guī)則覆蓋的訓(xùn)練樣例去除,然后以剩下的訓(xùn)練樣例組成訓(xùn)練集重復(fù)上述步驟。這個(gè)過程稱為(__)。A)規(guī)則學(xué)習(xí)B)直推學(xué)習(xí)C)強(qiáng)化學(xué)習(xí)D)序貫覆蓋答案:D解析:[單選題]50.以下聚合函數(shù)求數(shù)據(jù)總和的是()A)MAXB)SUMC)COUNTD)AVG答案:B解析:[單選題]51.()是實(shí)現(xiàn)數(shù)據(jù)戰(zhàn)略的重要保障。A)數(shù)據(jù)管理B)數(shù)據(jù)分析C)數(shù)據(jù)治理D)數(shù)據(jù)規(guī)劃答案:C解析:[單選題]52.假設(shè)每個(gè)用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,QueueA.minimum-user-limit-percent=24。則以下說法錯(cuò)誤的是?A)第3個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得33.33%的資源B)第2個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得50%的資源C)第4個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得25%的資源D)第5個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得20%的資源答案:D解析:[單選題]53.迪士尼MagicBand手環(huán),體現(xiàn)了哪種大數(shù)據(jù)思維方式:()A)我為人人,人人為我B)全樣而非抽樣C)效率而非精確D)相關(guān)而非因果答案:A解析:[單選題]54.根據(jù)《泛在電力物聯(lián)網(wǎng)2019年建設(shè)方案》,各部門、各單位提出的建設(shè)任務(wù)和綜合示范采用()的方式有序安排。A)?集中統(tǒng)籌、分批安排、聯(lián)合試點(diǎn)?B)?分類統(tǒng)籌、分批安排、分別試點(diǎn)?C)?分類統(tǒng)籌、分批安排、聯(lián)合試點(diǎn)?D)?分類統(tǒng)籌、統(tǒng)一安排、聯(lián)合試點(diǎn)?答案:C解析:第2部分:多項(xiàng)選擇題,共26題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.采用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪種Channel類型?A)MemoryChannelB)JDBCChannelC)FileChannelD)HDFSChannel答案:BC解析:[多選題]56.在算術(shù)運(yùn)算符、比較運(yùn)算符、邏輯運(yùn)算符,這三種符號中,它們的優(yōu)先級排列不正確的是()A)算術(shù)/邏輯/比較B)比較/邏輯/算術(shù)C)比較/算術(shù)/邏輯D)算術(shù)/比較/邏輯答案:ABC解析:[多選題]57.多融合發(fā)展重點(diǎn)是深入挖掘變電站資源價(jià)值,建設(shè)()等設(shè)施A)運(yùn)營充電站B)能源中心站C)儲能站D)北斗基站答案:ACD解析:[多選題]58.按標(biāo)注的實(shí)現(xiàn)層次,數(shù)據(jù)標(biāo)注可以分為(__)。A)語義標(biāo)注B)圖像標(biāo)注C)語法標(biāo)注D)文字標(biāo)注答案:AC解析:[多選題]59.以下屬于數(shù)據(jù)分析步驟的是:A)數(shù)據(jù)預(yù)處理B)特征工程C)建模D)模型集成答案:ABCD解析:[多選題]60.序列包括下列哪些()A)字符串B)列表C)元組D)字典答案:ABC解析:[多選題]61.數(shù)據(jù)管理指對數(shù)據(jù)生命周期的每個(gè)階段里可能引|發(fā)的各類數(shù)據(jù)質(zhì)量問題,進(jìn)行()等一系列管理活動(dòng),并通過改善和提高組織的管理水平是的數(shù)據(jù)質(zhì)量獲得進(jìn)一步提高。A)識別B)度量C)監(jiān)控D)預(yù)警答案:ABCD解析:數(shù)據(jù)管理是指對數(shù)據(jù)進(jìn)行識別、度量、監(jiān)控以及預(yù)警的一系列管理活動(dòng)。[多選題]62.在大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)SQL中可以用邏輯運(yùn)算連接多個(gè)條件,以下邏輯運(yùn)算結(jié)果正確的有:()。A)TrueorNULL=TrueB)FalseORFalse=FalseC)TrueANDFalse=FalseD)TrueANDTrue=True答案:ABCD解析:[多選題]63.以下哪些不是常見的時(shí)間序列算法模型?()A)RSIB)MACDC)ARMAD)KDJ答案:ABD解析:[多選題]64.Flink支持的時(shí)間操作類型包括以下哪些選項(xiàng)?A)結(jié)束時(shí)間B)處理時(shí)間C)采集時(shí)間D)事件時(shí)間答案:BD解析:[多選題]65.下列屬于卷積神經(jīng)網(wǎng)絡(luò)組成部分的有()。A)卷積層B)中間層C)池化層D)全連接層答案:ACD解析:卷積神經(jīng)網(wǎng)絡(luò)的組成部分不包括中間層。51[多選題]66.MapReduce2.0將MapReduce1.0中JobTracker的資源管理和作業(yè)調(diào)用兩個(gè)功能分開,分別有()和()進(jìn)程來實(shí)現(xiàn)。A)ResourceMangerB)NodeMangerC)ApplicationMasterD)Container答案:AC解析:[多選題]67.下列關(guān)于PCA說法正確的是()?A)在使用PCA之前,我們必須標(biāo)準(zhǔn)化數(shù)據(jù)B)應(yīng)該選擇具有最大方差的主成分C)應(yīng)該選擇具有最小方差的主成分D)可以使用PCA在低維空間中可視化數(shù)據(jù)答案:ABD解析:[多選題]68.Hadoop組件的核心功能包括()A)分布式數(shù)據(jù)存儲B)分析C)挖掘D)分布式計(jì)算答案:AD解析:[多選題]69.下面屬于范數(shù)規(guī)則化的作用的是()。A)保證模型盡可能的簡單,避免過擬合B)約束模型特征C)最小化問題D)最大化問題答案:AB解析:[多選題]70.大數(shù)據(jù)的處理流程可以概括為以下哪幾步?()A)統(tǒng)計(jì)和分析B)挖掘C)導(dǎo)入和預(yù)處理D)采集答案:ABCD解析:[多選題]71.大數(shù)據(jù)商業(yè)咨詢服務(wù)方案在規(guī)劃環(huán)節(jié)主要考慮以下哪些設(shè)計(jì)?A)大數(shù)據(jù)商業(yè)模式設(shè)計(jì)B)商業(yè)場景全景規(guī)劃C)典型場景需求設(shè)計(jì)D)場景分解和業(yè)務(wù)設(shè)計(jì)答案:ABCD解析:[多選題]72.下列哪些屬于CRF模型對于HMM和MEMM模型的優(yōu)勢()A)特征靈活B)速度快C)可容納較多上下文信息D)全局最優(yōu)答案:ACD解析:[多選題]73.大數(shù)據(jù)處理分析技術(shù)主要包括哪幾種類型:()A)批處理計(jì)算B)流計(jì)算C)圖計(jì)算D)查詢分析計(jì)算答案:ABCD解析:[多選題]74.下列關(guān)于深度學(xué)習(xí)的實(shí)質(zhì)及其與淺層學(xué)習(xí)的說法,正確的是()A)深度學(xué)習(xí)強(qiáng)調(diào)模型深度B)深度學(xué)習(xí)突出特征學(xué)習(xí)的重要性:特征變換+非人工C)沒有區(qū)別D)以上答案都不正確答案:AB解析:[多選題]75.HBase的Filter過濾器有什么作用?A)過濾regionB)過濾列值C)過濾列名D)過濾rowkey答案:BD解析:[多選題]76.下列關(guān)于數(shù)據(jù)流轉(zhuǎn)和應(yīng)用的說法正確的有()。A)數(shù)據(jù)流轉(zhuǎn)和應(yīng)用過程中應(yīng)確保可追溯、可復(fù)查B)前序環(huán)節(jié)應(yīng)保證數(shù)據(jù)的真實(shí)、完整C)前序環(huán)節(jié)應(yīng)及時(shí)傳遞到后序環(huán)節(jié)D)前后環(huán)節(jié)數(shù)據(jù)應(yīng)保持銜接一致答案:ABCD解析:數(shù)據(jù)流轉(zhuǎn)和應(yīng)用主要包括可追溯、可復(fù)查,數(shù)據(jù)真實(shí)、完整,環(huán)節(jié)銜接完整,環(huán)節(jié)銜接數(shù)據(jù)一致。[多選題]77.特征選擇方法有()A)AIC赤池信息準(zhǔn)則B)LARS嵌入式特征選擇方法C)LVW包裹式特征選擇方法D)Relief過濾式特征選擇方法答案:BCD解析:第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.減少神經(jīng)網(wǎng)絡(luò)層數(shù),可能會降低測試集分類錯(cuò)誤率。A)正確B)錯(cuò)誤答案:對解析:[判斷題]79.校對集?utf8_general_cs?中的cs表示不分區(qū)大小寫。--A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.銀行業(yè)金融機(jī)構(gòu)在實(shí)施信息科技外包時(shí),可以將信息科技管理責(zé)任外包。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.GES的Edge都是單向邊,如果需要雙向邊,則通過兩條相反方向的單向邊組成。A)正確B)錯(cuò)誤答案:對解析:[判斷題]82.用值列表生成Series時(shí),Pandas默認(rèn)自動(dòng)生成整數(shù)索。A)正確B)錯(cuò)誤答案:對解析:[判斷題]83.大數(shù)據(jù)技術(shù)的解決方案思路是聚焦在單臺機(jī)器上,思考如何提升單機(jī)的性能,尋找更貴更好的服務(wù)器。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]84.物理集群包含邏輯集群。A)正確B)錯(cuò)誤答案:對解析:[判斷題]85.二級索引為Hbase提供了按照某些列的值進(jìn)行索引的功能,二級索引先查表索引,在定位到數(shù)據(jù)表中的位置,不需要全表掃描。A)正確B)錯(cuò)誤答案:對解析:[判斷題]86.假設(shè)random模塊已導(dǎo)入,那么表達(dá)式random.sample(range(10),7)的作用是生成7個(gè)不重復(fù)的整數(shù)A)正確B)錯(cuò)誤答案:對解析:[判斷題]87.Redis采用Master-Slave架構(gòu),由Master節(jié)點(diǎn)管理Slave工作。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]88.已知g=lambdax,y=3,z=5:x*y*z,則語句print(g(1))的輸出結(jié)果為15。A)正確B)錯(cuò)誤答案:對解析:[判斷題]89.可視化技術(shù)對于分析的數(shù)據(jù)類型通常不是專用性的。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]90.給定由兩次運(yùn)行K均值產(chǎn)生的兩個(gè)不同的簇集,誤差的平方和最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論