大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項選擇題,共57題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.在線遷移同步過程中可能因數(shù)據(jù)沖突、數(shù)據(jù)加工、異構(gòu)類型轉(zhuǎn)化、對象缺失等因素導(dǎo)致數(shù)據(jù)異常,用戶可以通過?異常數(shù)據(jù)?頁簽查看,以幫助異常寫入的排查。下列同步過程中,支持異常診斷的是:()。A)Postgres->GaussDBB)Oracle->RDSforMySQLC)Mysql->GaussDB(forMySQL)D)Postgres->GaussDB答案:B解析:[單選題]2.黨中央、國務(wù)院高度重視網(wǎng)絡(luò)安全工作,出臺了()等一系列法律、法規(guī)和專項文件。A)《中華人民共和國網(wǎng)絡(luò)安全法》B)《中華人民共和國數(shù)據(jù)安全法》C)《中華人民共和國通信安全法》D)《中華人民共和國網(wǎng)絡(luò)信息安全法》答案:A解析:[單選題]3.k近鄰學(xué)習(xí)是一種(__)方法。A)監(jiān)督學(xué)習(xí)方法B)半監(jiān)督學(xué)習(xí)方法C)無監(jiān)督學(xué)習(xí)方法D)測試方法答案:A解析:[單選題]4.如何禁用reduce階段()A)設(shè)置conf.setNumreduceTasks(0)B)設(shè)置job.setNumreduceTasks(0)C)設(shè)置job.setNumreduceTasks()=0D)修改配置文件中NumreduceTasks=0答案:B解析:[單選題]5.在K均值算法中,()可用于獲得全局最小A)嘗試為不同的質(zhì)心(centroid)初始化運行算法B)調(diào)整迭代的次數(shù)C)找到集群的最佳數(shù)量D)以上答案都正確答案:D解析:[單選題]6.根據(jù)泛在電力物聯(lián)網(wǎng)建設(shè)和發(fā)展需要,借鑒()思維,動態(tài)優(yōu)化各層級組織機構(gòu)、職責(zé)范圍和管理權(quán)限,打造柔性組織,推動前端融合。A)能源網(wǎng)B)信息網(wǎng)C)智能網(wǎng)D)互聯(lián)網(wǎng)答案:D解析:[單選題]7.下列函數(shù)中,用于沿著軸方向堆疊Pandas對象的是()。A)concat()B)join()C)merge()D)combine_first()答案:A解析:[單選題]8.下列哪個不是Explain的關(guān)鍵字()?A)TablescanB)HashJoinC)FilterD)Seqscan答案:C解析:[單選題]9.關(guān)于高偏差說法錯誤的是()A)、隨著訓(xùn)練樣本數(shù)增多,訓(xùn)練準確率和交叉驗證準確率趨于收斂,但與理想取值的偏差很大B)、高偏差意味著模型在訓(xùn)練集和交叉驗證集上的準確率都很低,很可能存在?欠擬合?現(xiàn)象。C)、造成欠擬合的主要原因有兩個:一是所訓(xùn)練出的模型過于簡單;二是所選擇的特征32屬性并不提供充分信息,與本模型的功能并不相關(guān)。D)、高偏差表示對應(yīng)模型很可能存在?過擬合?現(xiàn)象。答案:D解析:[單選題]10.下列算法中,不屬于外推法的是()A)移動平均法B)回歸分析法C)指數(shù)平滑法D)季節(jié)指數(shù)法答案:B解析:[單選題]11.下列說法錯誤的是?A)RDD(ResillientDistributedDataset)是運行在工作節(jié)點(WorkerNode)的一個進程,負責(zé)運行TaskB)Application是用戶編寫的Spark應(yīng)用程序C)一個Job包含多個RDD及作用于相應(yīng)RDD上的各種操作D)DirectedAcyclicGraph反映RDD之間的依賴關(guān)系答案:A解析:[單選題]12.關(guān)于HDFS的特征,下列說法錯誤的是()。A)支持超大文件B)基于商用硬件C)流式數(shù)據(jù)訪問D)低吞吐量答案:D解析:HDFS設(shè)計中重視"數(shù)據(jù)的高吞吐量",因此其數(shù)據(jù)吞吐量高,但也造成了其數(shù)據(jù)延遲訪問的特征。[單選題]13.創(chuàng)建DRDS庫的時候,每個掛載的RDS實例默認創(chuàng)建的庫的個數(shù)為:()。A)16B)8C)4D)2答案:B解析:[單選題]14.以下程序的輸出結(jié)果是:ss=list(set("jzzszyj"))ss.sort()print(ss)A)['z','j','s','y']B)['j','s','y','z']C)['j','z','z','s','z','y','j']D)['j','j','s','y','z','z','z']答案:B解析:[單選題]15.下列不屬于模型集成方法的是()。A)直接集成法B)增強法C)堆疊法D)遞歸法答案:D解析:模型集成方法包括直接集成法、自助法、隨機森林、增強法和堆疊法等。[單選題]16.數(shù)據(jù)庫(DB)、數(shù)據(jù)庫系統(tǒng)(DBS)和數(shù)據(jù)庫管理系統(tǒng)(DBMS)三者之間的關(guān)系是A)DBS包括DB和DBMSB)DDMS包括DB和DBSC)DB包括DBS和DBMSD)DBS就是DB,也就是DBMS答案:A解析:[單選題]17.下列哪一項不是大數(shù)據(jù)架構(gòu)中需要考慮的要點?A)業(yè)務(wù)分解B)業(yè)務(wù)聯(lián)動C)持續(xù)發(fā)展D)獨立開發(fā)答案:D解析:[單選題]18.D剛常用的激活函數(shù)有()A)sigmoidB)tanhC)ReLUD)以上答案都正確答案:D解析:[單選題]19.()網(wǎng)絡(luò)是一種競爭學(xué)習(xí)型的無監(jiān)督神經(jīng)網(wǎng)絡(luò),它能將高維輸入數(shù)據(jù)映射到低維空間,同時保持輸入數(shù)據(jù)在高維空間的拓撲結(jié)構(gòu),即將高維空間中相似的樣本點映射到網(wǎng)絡(luò)輸出層中的鄰近神經(jīng)元A)SOMB)RBFC)ARTD)ELman答案:A解析:[單選題]20.從行為目的與思維方式看,下列哪個屬于描述性統(tǒng)計分析()。A)線性回歸B)參數(shù)估計C)相關(guān)分析D)主成分分析答案:C解析:描述性統(tǒng)計是指運用制表和分類、圖形以及計算概括性數(shù)據(jù)來描述數(shù)據(jù)特征的各項活動。描述性統(tǒng)計分析要對調(diào)查總體所有變量的有關(guān)數(shù)據(jù)進行統(tǒng)計性描述,主要包括數(shù)據(jù)的頻數(shù)分析、集中趨勢分析、離散程度分析、分布、相關(guān)分析以及一些基本的統(tǒng)計圖形。[單選題]21.empdet是一個外部表,它包含empno和ename列,哪個涉及empdet表的操作可以執(zhí)行成功A)UPDATEempdetSETename=?Amit?WHEREempno=1234;B)DELETEFROMempdetSETenameWHEREenameLIKE'J%'C)CREATEVIEWempvuASSELECT*FROMempdet;D)CREATEINDEXempdet_idxONempdet(empno)答案:C解析:[單選題]22.(__)是決策樹學(xué)習(xí)算法對付過擬合的主要手段。A)剪枝B)連續(xù)值處理C)信息增益D)數(shù)據(jù)預(yù)處理答案:A解析:[單選題]23.()模式的變化意味著數(shù)據(jù)科學(xué)中所關(guān)注的數(shù)據(jù)計算的常見瓶頸、關(guān)注焦點、主要矛盾和思維模式發(fā)生了根本性變化。A)數(shù)據(jù)計算B)、數(shù)據(jù)管理C)、數(shù)據(jù)分析D)、數(shù)據(jù)獲取答案:A解析:[單選題]24.在Spark中,()是指RDD的每個分區(qū)都只被子RDD的一個分區(qū)所依賴。A)子分區(qū)B)父分區(qū)C)寬依賴D)窄依賴答案:D解析:[單選題]25.Numpy是(__)的簡寫。A)NumericalPythonB)NumericpythonC)NumericalforPythonD)Numericofpython答案:A解析:[單選題]26.ndarry對象的itemsize屬性表示(__)。A)指定元素的大小B)指定維度的大小C)數(shù)組元素占用的字節(jié)數(shù)D)數(shù)組的元素個數(shù)答案:C解析:[單選題]27.下列描述中屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過程域數(shù)據(jù)戰(zhàn)略的是()。A)數(shù)據(jù)戰(zhàn)略制定B)業(yè)務(wù)術(shù)語表C)數(shù)據(jù)質(zhì)量評估D)過程質(zhì)量保障答案:A解析:數(shù)據(jù)戰(zhàn)略制定屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過程域?數(shù)據(jù)戰(zhàn)略?。[單選題]28.當(dāng)客戶端需要讀取HDFS中存儲的文件時,首先向()發(fā)起讀請求。A)DataNodeB)NameNodeC)YarnD)Zookeeper答案:B解析:[單選題]29.Hbase的一個典型應(yīng)用是webtable,它是一個以網(wǎng)頁()為主鍵的表。A)標題B)URLC)內(nèi)容D)類別答案:B解析:[單選題]30.使用似然函數(shù)的目的是()。A)求解目標函數(shù)B)得到最優(yōu)數(shù)據(jù)樣本C)找到最適合數(shù)據(jù)的參數(shù)D)改變目標函數(shù)分布答案:C解析:似然估計是一種確定模型參數(shù)值的方法。確定參數(shù)值的過程,是找到能最大化模型產(chǎn)生真實觀察數(shù)據(jù)可能性的那一組參數(shù)。[單選題]31.shuffle和sort輸出的key實現(xiàn)了下面哪個接口()A)WritableB)WritableComparableC)ConfigurableD)ComparableWritable答案:B解析:[單選題]32.Hive的基本數(shù)據(jù)類型是可以進行隱式轉(zhuǎn)換,類似于Java的類型轉(zhuǎn)換。例如:某表達式使用INT類型,TINYINT會自動轉(zhuǎn)換為INT類型,若是某表達式使用TINYINT類型,INT不會自動轉(zhuǎn)換為TINYINT類型,它會返回錯誤,除非使用()操作進行顯示類型的轉(zhuǎn)換。A)CASTB)CTASC)CATSD)CSAT答案:A解析:[單選題]33.在分類問題中,我們經(jīng)常會遇到正負樣本數(shù)據(jù)量不等的情況,比如正樣本為10w條數(shù)據(jù),負樣本只有1w條數(shù)據(jù),以下最合適的處理方法是()?A)將負樣本重復(fù)10次,生成10w樣本量,打亂順序參與分類B)直接進行分類,可以最大限度利用數(shù)據(jù)C)從10w正樣本中隨機抽取1w參與分類D)將負樣本每個權(quán)重設(shè)置為10,正樣本權(quán)重為1,參與訓(xùn)練過程答案:D解析:[單選題]34.下列選項中適合MapReduce的場景有:()。A)實時交互計算B)迭代計算C)流式計算D)離線計算答案:D解析:[單選題]35.()反映數(shù)據(jù)的精細化程度,越細化的數(shù)據(jù),價值越高。A)規(guī)模B)靈活性C)關(guān)聯(lián)度D)顆粒度答案:D解析:顆粒度反映的是數(shù)據(jù)的精細化程度。[單選題]36.當(dāng)子查詢返回的是多行數(shù)據(jù)時,可以使用()方法來解決。A)聚合函數(shù)B)where語句C)in運算符D)groupby語句答案:C解析:[單選題]37.Redis中適合存儲對象的數(shù)據(jù)類型是?()A)StringB)ListC)HashD)Set答案:C解析:[單選題]38.某企業(yè)的數(shù)據(jù)倉庫運行在大數(shù)據(jù)計算服務(wù)上,開發(fā)人員在加工數(shù)據(jù)時發(fā)現(xiàn)用戶表user中的用戶標識字段user_id有部分臟數(shù)據(jù),正確的格式應(yīng)該是8位的字符串??梢允褂肧QL語句()將臟數(shù)據(jù)過濾出來。A)select*fromuserwherelength(userid)<>8B)select*fromuserwherelength(userid)>8C)select*fromuserwherelength(userid)<8D)select*fromuserwherelength(userid)<>8oruseridisnull答案:D解析:[單選題]39.結(jié)構(gòu)化程序設(shè)計的三種基本語句是?A)函數(shù)結(jié)構(gòu)、分支結(jié)構(gòu)、判斷結(jié)構(gòu)B)函數(shù)結(jié)構(gòu)、嵌套結(jié)構(gòu)、平行結(jié)構(gòu)C)順序結(jié)構(gòu)、分支結(jié)構(gòu)、循環(huán)結(jié)構(gòu)D)分支結(jié)構(gòu)、循環(huán)結(jié)構(gòu)、嵌套結(jié)構(gòu)答案:C解析:[單選題]40.下列關(guān)于BP網(wǎng)絡(luò)的說法,不正確的是()A)標準BP算法每次僅針對一個訓(xùn)練樣倒更新連接權(quán)和閩值B)BP神經(jīng)網(wǎng)絡(luò)經(jīng)常遭遇過擬合十C)平停策略可用來緩解BP網(wǎng)絡(luò)的過擬合問題中D)晚停策略可用來緩解BP網(wǎng)絡(luò)的欠擬合問題答案:D解析:[單選題]41.行業(yè)應(yīng)用解決的是行業(yè)()問題,并為企業(yè)應(yīng)用提供基礎(chǔ)平臺。A)單一B)共性C)基礎(chǔ)D)根本答案:B解析:[單選題]42.以下關(guān)于Zookeeper的Leader節(jié)點在收到數(shù)據(jù)變更請求后的讀寫流程說法正確的是?A)僅寫入內(nèi)存B)同時寫入磁盤和內(nèi)存C)先寫入內(nèi)存再寫入磁盤D)先寫磁盤再寫內(nèi)存答案:D解析:[單選題]43.下列不屬于Transformation操作的是()A)mapB)flterC)sampleD)count答案:D解析:Transformation常用函數(shù)為map、filter、flatMap、sample、union、join等。[單選題]44.規(guī)模巨大且復(fù)雜,用現(xiàn)有的數(shù)據(jù)處理工具難以獲取、整理、管理以及處理的數(shù)據(jù),這指的是()。A)富數(shù)據(jù)B)貧數(shù)據(jù)C)繁數(shù)據(jù)D)大數(shù)據(jù)答案:D解析:[單選題]45.關(guān)于云主機登錄方式描述對的是()A)Windows通過遠程桌面(MSTSC)方式登錄B)Linux通過SSH方式登錄C)通過控制臺方式(VNC)登錄D)以上描述均對答案:D解析:[單選題]46.下列關(guān)于HBase的集群結(jié)構(gòu)描述有誤的是()A)HBase的服務(wù)器體系結(jié)構(gòu)遵從簡單的主/從服務(wù)器架構(gòu),它由HRegionServer群和HBaseMasterServer構(gòu)成。B)當(dāng)表的大小超過設(shè)置的值時,HBase會自動地將表劃分為不同的區(qū)域,每個區(qū)域包含所有行的子集。C)HBase邏輯上的表可能會被劃分成多個HRegion,然后存儲到HRegionServer群中。D)ZooKeeper本身并不存儲HBase中的任何數(shù)據(jù),它存儲的是從數(shù)據(jù)到HRegionServer的映射,告訴每臺HRegionServer它要維護哪些HRegion。答案:D解析:[單選題]47.關(guān)于Hive自定義UDF描述錯誤的是()。A)普通的UDF,用于操作單個數(shù)據(jù)行,且產(chǎn)生一個數(shù)據(jù)行作為輸出。B)永久函數(shù),可以在多個會話中使用,不需要每次創(chuàng)建。C)用戶定義表生成函數(shù)UDTF,用于接受多個輸入數(shù)據(jù)行,并產(chǎn)生一個輸出數(shù)據(jù)行。D)臨時函數(shù),只能在當(dāng)前會話使用,重啟會話后需要重新創(chuàng)建答案:C解析:[單選題]48.規(guī)模巨大且復(fù)雜,用現(xiàn)有的數(shù)據(jù)處理工具難以獲取、整理、管理以及處理的數(shù)據(jù),這指的是()。A)大數(shù)據(jù)B)貧數(shù)據(jù)C)富數(shù)據(jù)D)繁數(shù)據(jù)答案:A解析:[單選題]49.常用的圖像分割方法是把圖像(__)分成不同等級。A)顏色B)灰度C)大小D)亮度信息答案:B解析:[單選題]50.下列哪個不是情感分析的應(yīng)用場景?A)數(shù)據(jù)挖掘B)信息檢索C)文本分詞D)市場營銷答案:C解析:[單選題]51.程序如下:i=0j=0while(iA)1B)0C)2D)4.5答案:B解析:[單選題]52.例如數(shù)據(jù)庫中有A表,包括學(xué)生,學(xué)科,成績?nèi)齻€字段,數(shù)據(jù)庫結(jié)構(gòu)為學(xué)生學(xué)科成績張三語文60張三數(shù)學(xué)100李四語文70李四數(shù)學(xué)80李四英語80如何統(tǒng)計最高分>80的學(xué)科()A)SELECTMAX(成績)FROMAGROUPBY學(xué)科HAVINGMAX(成績)>80;B)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVING成績>80;C)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVINGMAX(成績)>80;D)SELECT學(xué)科FROMAGROUPBY學(xué)科WHEREMAX(成績)>80;答案:C解析:[單選題]53.()的本質(zhì)是將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過程。A)數(shù)據(jù)處理B)數(shù)據(jù)計算C)數(shù)據(jù)加工D)整齊數(shù)據(jù)答案:C解析:數(shù)據(jù)加工(DataWrangling或DataMunging)的本質(zhì)是將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過程。從加工程度看,數(shù)據(jù)可以分為零次、一次、二次、三次數(shù)據(jù)。[單選題]54.如果規(guī)則集R中不存在兩條規(guī)則被同一條記錄觸發(fā),則稱規(guī)則集R中的規(guī)則為()。A)無序規(guī)則B)窮舉規(guī)則C)互斥規(guī)則D)有序規(guī)則答案:C解析:第2部分:多項選擇題,共23題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.JupyterNotebook支持以下哪些語言A)CB)RC)PythonD)Java答案:BC解析:[多選題]56.關(guān)于分析學(xué)習(xí)和歸納學(xué)習(xí)的比較,說法正確的是()。A)歸納學(xué)習(xí)擬合數(shù)據(jù)假設(shè),分析學(xué)習(xí)擬合領(lǐng)域理論的假設(shè)B)歸納學(xué)習(xí)論證方式為統(tǒng)計推理,分析學(xué)習(xí)為演繹推理C)歸納學(xué)習(xí)不需要先驗知識D)訓(xùn)練數(shù)據(jù)不足時歸納學(xué)習(xí)可能會失敗答案:ABCD解析:分析學(xué)習(xí)是相對于歸納學(xué)習(xí)的一種提法,其特點是使用先驗知識來分析或解釋每個訓(xùn)練樣本,以推理出樣本的哪些特征與目標函數(shù)相關(guān)或不相關(guān)。因此,這些解釋能使機器學(xué)習(xí)系統(tǒng)比單獨依靠數(shù)據(jù)進行泛化有更高的精度。分析學(xué)習(xí)使用先驗知識來減小待搜索假設(shè)空間的復(fù)雜度,減小了樣本復(fù)雜度并提高了機器學(xué)習(xí)系統(tǒng)的泛化精度。可見,分析學(xué)習(xí)與歸納學(xué)習(xí)的優(yōu)缺點在一定程度上具有互補性,分析學(xué)習(xí)方法的優(yōu)點在于可用先驗知識從較少的數(shù)據(jù)中更精確地泛化以引導(dǎo)學(xué)習(xí)。但是,當(dāng)先驗知識不正確或不足時,分析學(xué)習(xí)的缺點也會被突顯;歸納學(xué)習(xí)具有的優(yōu)點是不需要顯式的先驗知識,并且主要基于訓(xùn)練數(shù)據(jù)學(xué)習(xí)到規(guī)律。然而,若訓(xùn)練數(shù)據(jù)不足時它能會失敗,并且會被其中隱式的歸納偏置所誤導(dǎo),而歸納偏置是從觀察數(shù)據(jù)中泛化所必需的過程。因此,我們可以考慮如何將二者結(jié)合成一個單獨的算法,以獲得它們各自的優(yōu)點。[多選題]57.卷積神經(jīng)網(wǎng)絡(luò)可以用于()。A)圖像分類B)目標提取C)圖像分割D)中文分詞答案:ABC解析:[多選題]58.下面哪幾項屬于ElasticSearch的RESTful請求方式?A)GetB)DeleteC)UpdateD)Post答案:ABD解析:[多選題]59.關(guān)于HBase二級索引的描述,哪些是正確的?A)核心是倒排表B)二級索引概念是對應(yīng)Rowkey這個?一級?索引C)二級索引使用平衡二叉樹D)二級索引使用LSM結(jié)構(gòu)答案:AB解析:C、D項沒百度到,所以沒使用。[多選題]60.Hadoop架構(gòu)中,核心的存儲、計算架構(gòu)包括A)HDFSB)CephC)SparkD)MapReduce答案:AD解析:[多選題]61.隨著社會數(shù)據(jù)收集手段的不斷豐富及完善,越來越多的行業(yè)數(shù)據(jù)被積累下來,數(shù)據(jù)規(guī)模已經(jīng)增長到了傳統(tǒng)軟件行業(yè)無法承載的海量數(shù)據(jù)級別。大數(shù)據(jù)計算服務(wù)可以很多的利用存儲和計算能力去處理、分析這些海量數(shù)據(jù),發(fā)現(xiàn)價值。以下說法中正確的有:()。A)大數(shù)據(jù)計算服務(wù)提供了高并發(fā)低延遲(毫秒級)的處理能力,對海量數(shù)據(jù)進行靈活分析B)大數(shù)據(jù)計算服務(wù)提供了高并發(fā)吞吐量上傳下載工具,可以將外部數(shù)據(jù)源中的數(shù)據(jù)高效的同步到大數(shù)據(jù)計算服務(wù)中去C)大數(shù)據(jù)計算服務(wù)支持使用SQL或者MapReduce編程對海量數(shù)據(jù)進行處理D)大數(shù)據(jù)計算服務(wù)可以對海量數(shù)據(jù)進行基于復(fù)雜算法的分析,如聚類、分類、回歸、主成分分析等。答案:BCD解析:[多選題]62.?showdatabaseslike?student%??命令可以顯示出以下數(shù)據(jù)庫()A)student_myB)studentyC)mystudentD)student答案:ABD解析:[多選題]63.以下選項對GraphBase概念描述正確的是?A)Vertex:節(jié)點/頂點,用于表示現(xiàn)實世界中的實體對象。B)VertexLabel:節(jié)點的標簽,用于表示現(xiàn)實世界中的實體類型。C)EdgeLabel:邊的標簽,用于表示現(xiàn)實世界中的關(guān)系類型D)Edge:邊,用于表示關(guān)系度答案:ABC解析:[多選題]64.Python中,字符串可以使用哪些格式A)單引號B)雙引號C)三雙引號D)三單引號答案:ABCD解析:[多選題]65.數(shù)據(jù)節(jié)點(DataNode)的主要功能包括哪些?A)負責(zé)數(shù)據(jù)的存儲和讀取B)根據(jù)客戶端或者是名稱節(jié)點的調(diào)度來進行數(shù)據(jù)的存儲和檢索C)向名稱節(jié)點定期發(fā)送自己所存儲的塊的列表D)用來保存名稱節(jié)點中對HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點重啟的時間答案:ABC解析:[多選題]66.ADS的普通表分區(qū),支持()分區(qū)方式。A)ListB)IntervalC)HashD)Range答案:AC解析:[多選題]67.一次BSP計算過程包括一系列全局超步(超步就是指計算中的一次迭代),每個超步主要包括哪幾個組件:()A)局部計算B)中間計算C)通信D)柵欄同步答案:ACD解析:[多選題]68.下列關(guān)于包裹式選擇的描述正確的是(__)。A)包裹式特征選擇方法直接針對給定學(xué)習(xí)器進行優(yōu)化B)從最終學(xué)習(xí)器性能來看,包裹式特征選擇比過濾式特征選擇更好C)包裹式特征選擇的計算開銷通常比過濾式特征選擇大得多D)包裹式特征選擇的典型算法:LVW算法,其特征子集搜索采用了隨機策略答案:ABCD解析:[多選題]69.公司各級業(yè)務(wù)部門負責(zé)()等環(huán)節(jié)的安全審核。A)相關(guān)業(yè)務(wù)系統(tǒng)開通B)數(shù)據(jù)采集C)數(shù)據(jù)使用D)數(shù)據(jù)發(fā)布答案:ABCD解析:[多選題]70.提升企業(yè)經(jīng)營績效方面,2019年重點開展()、()、實物ID推廣應(yīng)用、基建全過程綜合數(shù)字化管理平臺建設(shè)和現(xiàn)代(智慧)供應(yīng)鏈體系構(gòu)建等5項工作。A)數(shù)字化審計B)多維精益管理體系變革C)泛在電力物聯(lián)網(wǎng)營銷服務(wù)系統(tǒng)D)網(wǎng)上電網(wǎng)應(yīng)用構(gòu)建答案:BD解析:[多選題]71.Maxcompute通過eclipseplugin提供了MR的編程框架,開發(fā)時通常需要添加以下()類。A)reducerB)mapreducedriverC)combinerD)mapper答案:ACD解析:[多選題]72.以下()方法可以支持MaxCompute中受保護項目空間的數(shù)據(jù)流出。A)使用owner通過ACL授權(quán)B)使用owner通過policy授權(quán)C)設(shè)置例外(ExceptionPolicy)D)設(shè)置項目互信(TrustedProject)答案:CD解析:[多選題]73.下面屬于數(shù)據(jù)科學(xué)理論基礎(chǔ)的有(__)。A)統(tǒng)計學(xué)B)數(shù)據(jù)可視化C)機器學(xué)習(xí)D)領(lǐng)域知識答案:ABCD解析:[多選題]74.下列關(guān)于文檔數(shù)據(jù)庫的描述,哪些是正確的?()A)性能好(高并發(fā)),靈活性高B)具備統(tǒng)一的査詢語法C)文檔數(shù)據(jù)庫支持文檔間的事務(wù)D)復(fù)雜性低,數(shù)據(jù)結(jié)構(gòu)靈活答案:AD解析:[多選題]75.可作為決策樹選擇劃分屬性的參數(shù)是()A)信息增益B)增益率C)基尼指數(shù)D)密度函數(shù)答案:ABC解析:特征選擇的準則主要有信息增益,信息增益率,基尼指數(shù)三種。[多選題]76.創(chuàng)建世界一流能源互聯(lián)網(wǎng)企業(yè)辦公室,下設(shè)()常設(shè)小組。A)技術(shù)組B)運營組C)商務(wù)組D)管理優(yōu)化組答案:ACD解析:[多選題]77.大數(shù)據(jù)的應(yīng)用能夠?qū)崿F(xiàn)一場新的革命,提高綜合管理水平的原因是()A)從被動反應(yīng)走向主動預(yù)見型管理B)從粗放化管理走向精細化管理C)從單兵作戰(zhàn)走向聯(lián)合共享型管理D)從柜臺式管理走向全天候管理答案:ABCD解析:第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.在Hive中,Driver負責(zé)管理HiveQL執(zhí)行的生命周期,并貫穿Hive任務(wù)整個執(zhí)行期間。A)正確B)錯誤答案:對解析:[判斷題]79.正則表達式元字符?用來表示該符號前面的字符或子模式0次或多次出現(xiàn)。A)正確B)錯誤答案:錯解析:[判斷題]80.函數(shù)在定義完成后會立刻執(zhí)行。()A)正確B)錯誤答案:錯解析:[判斷題]81.密碼過期的用戶可使用ALTERUSER...IDENTIFIED、BY設(shè)置密碼。--A)正確B)錯誤答案:對解析:[判斷題]82.Colocation同分布文件級的同分布實現(xiàn)文件的快速訪問,避免了因數(shù)據(jù)遷移盜來的大量網(wǎng)絡(luò)開銷。A)正確B)錯誤答案:對解析:[判斷題]83.?大數(shù)據(jù)?一詞,最早出現(xiàn)于20世紀90年代,當(dāng)時的數(shù)據(jù)倉庫之父比爾·恩門經(jīng)常提及。A)正確B)錯誤答案:對解析:[判斷題]84.孤立點在數(shù)據(jù)挖掘時總是被視為異常、元用數(shù)據(jù)而丟棄。()A)正確B)錯誤答案:錯解析:[判斷題]85.執(zhí)行語句fromm

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論