大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷28)

上傳人：w*** IP屬地：重慶上傳時(shí)間：2023-11-15 格式：DOCX 頁數(shù)：65 大小：73.95KB 積分：3.6 舉報(bào) 版權(quán)申訴

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷28)_第2頁

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷28)_第3頁

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷28)_第4頁

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷28)_第5頁

已閱讀5頁，還剩60頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

試卷科目：大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷28)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分：單項(xiàng)選擇題，共144題，每題只有一個正確答案,多選或少選均不得分。[單選題]1.HDFS的NameNode負(fù)責(zé)管理文件系統(tǒng)的命名空間，將所有的文件和文件夾的元數(shù)據(jù)保存在一個文件系統(tǒng)樹中，這些信息也會在硬盤上保存成以下文件：A)日志B)命名空間鏡像C)兩者都是[單選題]2.我們在做實(shí)驗(yàn)時(shí),會經(jīng)常用到?日期?轉(zhuǎn)換器,下列不屬于?日期?轉(zhuǎn)換器的一項(xiàng)是()A)ChoiceB)DateFormatC)DatePartD)StringToDateTime[單選題]3.關(guān)于大數(shù)據(jù)在社會綜合治理中的作用，以下理解不正確的是（）。A)大數(shù)據(jù)的應(yīng)用能夠杜絕抗生素的濫用B)大數(shù)據(jù)的應(yīng)用能夠維護(hù)社會治安C)大數(shù)據(jù)的應(yīng)用有利于走群眾路線D)大數(shù)據(jù)的應(yīng)用能夠加強(qiáng)交通管理[單選題]4.關(guān)于OLAP的特性,下面正確的是:①快速性;②可分析性;③多維性;④信息性;⑤共享性()A)①②③B)②③④C)①②③④D)①②③④⑤[單選題]5.以下關(guān)于深度學(xué)習(xí)框架的描述，正確的是()A)Tensorfiow是一款使用c++語言開發(fā)的開源數(shù)學(xué)計(jì)算軟件B)Caffe對于卷積網(wǎng)絡(luò)的支持特別好，同時(shí)提供的C++接口，也提供了mat1ab接口和python接口C)PyTorch的前身便是Torch，其底層和Torch框架一樣，但是使用Python重新寫了很多內(nèi)容D)以上答案都正確[單選題]6.優(yōu)化管理體系，實(shí)現(xiàn)管理模式從（___）向（___）轉(zhuǎn)變，向各級組織和業(yè)務(wù)賦能。A)數(shù)據(jù)化，業(yè)務(wù)化B)平臺化，集約化C)條塊化，共享化D)縱向貫通，橫向貫通[單選題]7.（）肯定是寬依賴操作。A)mapB)?atMapC)reduceByKeyD)sample[單選題]8.AUC是衡量()模型優(yōu)劣的一種評價(jià)指標(biāo)。A)回歸B)分類C)二分類D)聚類[單選題]9.ApacheKudu是通過什么方式來提高OLAP性能的？A)預(yù)計(jì)算B)列式存儲C)內(nèi)存存儲D)硬件加速[單選題]10.為提高計(jì)算性能，Spark中Transformation操作采用的是()計(jì)算模式。A)活性B)惰性C)實(shí)時(shí)D)非實(shí)時(shí)[單選題]11.人工智能研究的一項(xiàng)基本內(nèi)容是機(jī)器感知。以下列舉中的（）不屬于機(jī)器感知的領(lǐng)域。A)使機(jī)器具有視覺、聽覺、觸覺、味覺、嗅覺等感知能力。B)讓機(jī)器具有理解文字的能力。C)使機(jī)器具有能夠獲取新知識、學(xué)習(xí)新技巧的能力。D)使機(jī)器具有聽懂人類語言的能力[單選題]12.在python3中執(zhí)行以下代碼段a=21b=10print(ab)時(shí)，輸出為()。A)TrueB)FalseC)NoneD)Error[單選題]13.當(dāng)往往一本書中其實(shí)通常使用到的詞匯表是非常小的，這就會導(dǎo)致一本書的表示向量中存在大量的0.這樣的向量稱為（）。A)零向量B)滿秩向量C)稀疏向量D)普通向量[單選題]14.處理變量時(shí)，Python是否區(qū)分大小寫？A)區(qū)分B)不區(qū)分C)取決于操作系統(tǒng)D)以上都不對[單選題]15.()的基本想法是適當(dāng)考慮一部分屬性間的相互依賴信息,從而既不需要進(jìn)行完全聯(lián)合概率計(jì)算,又不至于徹底忽略了比較強(qiáng)的屬性依賴關(guān)系。A)貝葉斯判定準(zhǔn)則B)貝葉斯決策論C)樸素貝葉斯分類器D)半樸素貝葉斯分類器[單選題]16.商品的()用于在搜索和瀏覽列表時(shí)更準(zhǔn)確的找到該商品。--A)關(guān)鍵詞B)描述C)提示D)詳情[單選題]17.有關(guān)數(shù)據(jù)倉庫的開發(fā)特點(diǎn),不正確的描述是()。A)數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)B)數(shù)據(jù)倉庫使用的需求在開發(fā)初期就要明確C)數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的過程,是啟發(fā)式的開發(fā)D)在數(shù)據(jù)倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉庫中數(shù)據(jù)分析和處理更靈活,且沒有固定的模式[單選題]18.分類模型評估指標(biāo)不包括（）A)F1-scoreB)平均絕對誤差C)準(zhǔn)確率D)AUC[單選題]19.以下圖像分割方法中，屬于基于圖像灰度分布的閾值方法的是A)區(qū)域合并、分裂法B)最大類間、內(nèi)方差比法C)已知形狀的曲線檢測D)區(qū)域生長法[單選題]20.MySQL是一種()數(shù)據(jù)庫管理系統(tǒng)。A)層次型B)網(wǎng)絡(luò)型C)關(guān)系型D)對象型[單選題]21.若a=np.array([[7,2,3],[8,5,6]])，則print(np.sort(a,1))的結(jié)果為（__)。A)[[723][856]]B)[[237][568]]C)[235678]D)[[235][678]][單選題]22.下面描述錯誤的是：()A)?探針盒子?就是一款自動收集用戶隱私的產(chǎn)品B)許多顧客在使用WiFi之后會收到大量的廣告信息，甚至自己的手機(jī)號碼也會被當(dāng)做信息進(jìn)行多次買賣C)在免費(fèi)上網(wǎng)的背后，其實(shí)也存在著不小的信息安全風(fēng)險(xiǎn)，或許一不小心，就落入了電腦黑客們設(shè)計(jì)的WiFi陷阱之中D)免費(fèi)WIFI都是安全的，可以放心使用[單選題]23.當(dāng)云主機(jī)模板出現(xiàn)通用漏洞，將產(chǎn)生以下哪種風(fēng)險(xiǎn)：（）A)主機(jī)不穩(wěn)定B)網(wǎng)絡(luò)性能下降C)該模板創(chuàng)建的云主機(jī)被批量入侵D)沒有影響[單選題]24.下列選項(xiàng)中，運(yùn)行后會輸出1、2、3的是（）A)foriinrange(3):print(i)B)foriinrange(2):print(i+1)C)nums=[0,1,2]foriinnums:print(i+1)D)i=1whilei<3:print(i)i=i+1[單選題]25.作為分布式消息隊(duì)列，既有非常優(yōu)秀的吞吐量，又有較高的可靠性和擴(kuò)展性，同時(shí)接受SparkStreaming的請求，將流量日志按序發(fā)送給SparkStreaming集群是（）A)FlumeB)ZookeeperC)KafkaD)Sparkstreaming[單選題]26.在HDFS的數(shù)據(jù)讀取過程中，DistributedFileSystem獲取這些信息后，生成一個（）對象實(shí)例返回給客戶端。A)DistributedFileSystemB)FSDataInputStreamC)FSDataOutputStreamD)InputSystem[單選題]27.哪個軟件架構(gòu)是Google提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的A)GFSB)MapReduceC)ChubbyD)Bigtable[單選題]28.np.exp(1)的結(jié)果是多少?A)1B)2C)0D)2.718281828459[單選題]29.下列選項(xiàng)描述錯誤的是？()A)HadoopHA即集群中包含SecondaryNameNode作為備份節(jié)點(diǎn)存在。B)ResourceManager負(fù)責(zé)的是整個Yarn集群資源的監(jiān)控、分配和管理工作C)NodeManager負(fù)責(zé)定時(shí)的向ResourceManager匯報(bào)所在節(jié)點(diǎn)的資源使用情況以及接收并處理來自ApplicationMaster的啟動停止容器（Container）的各種請求。D)初次啟動HadoopHA集群時(shí)，需要將格式化文件系統(tǒng)后的目錄拷貝至另外一臺[單選題]30.大數(shù)據(jù)4V特征不包括A)規(guī)模性（Volume）B)有效地（Valid）C)多樣性（Varity）D)高速性（Velocity）[單選題]31.下列關(guān)于GaussDB200的數(shù)據(jù)類型轉(zhuǎn)換說法正確的是（）A)如果需要保留空字符串時(shí)，需要新建兼容性為Postgres的數(shù)據(jù)庫。B)在查詢中，對常量不需要顯式指定數(shù)據(jù)類型。C)在ORACLE兼容模式下，在導(dǎo)入數(shù)據(jù)時(shí)，空字符串會自動過濾。D)不同數(shù)據(jù)類型比較或轉(zhuǎn)換時(shí)，使用強(qiáng)制類型轉(zhuǎn)換，以防隱式類型轉(zhuǎn)換結(jié)果與預(yù)期不符。[單選題]32.HBase交互模式中,查看當(dāng)前服務(wù)狀態(tài)的命令是（）A)serviceB)servicesC)statusD)statu[單選題]33.HBase依賴（）提供強(qiáng)大的計(jì)算能力A)ZookeeperB)ChubbyC)RPCD)MapReduce[單選題]34.（）是MapReduce的?心臟?，是?奇跡?發(fā)生的地方A)CombineB)ShuffleC)PartitionD)Sort[單選題]35.LSM結(jié)構(gòu)的數(shù)據(jù)首先存儲在（）。A)硬盤上B)內(nèi)存中C)磁盤陣列中D)閃存中[單選題]36.將內(nèi)存引用賦值給另一個變量的操作叫（__)。A)深拷貝B)指針C)參數(shù)實(shí)例化D)淺拷貝[單選題]37.txt=open(filename)返回的是()。A)變量B)常數(shù)C)文件內(nèi)容D)文件對象[單選題]38.以下哪個組件樣式是在所有的可視化圖表中普遍存在的?A)圖例B)軸線C)標(biāo)題D)網(wǎng)格線[單選題]39.使用同態(tài)濾波方法進(jìn)行圖像增強(qiáng)時(shí)，不包含以下哪個過程A)通過對圖像取對數(shù)，將圖像模型中的入射分量與反射分量的乘積項(xiàng)分開B)將對數(shù)圖像通過傅里葉變換變到頻域，在頻域選擇合適的濾波函數(shù)，進(jìn)行減弱低頻和加強(qiáng)高頻的濾波C)計(jì)算圖像中各個灰度值的累計(jì)分布概率D)對濾波結(jié)果進(jìn)行傅里葉逆變換和對數(shù)逆運(yùn)算[單選題]40.上傳當(dāng)前目錄下的本地文件file.txt到分布式文件系統(tǒng)HDFS的?/path?目錄下的Shell命令是（）。A)hdfsdfs-put/pathfile.txtB)hadoopdfs-put/pathfile.txtC)hdfsfs-putfile.txt/pathD)hdfsdfs-putfile.txt/path[單選題]41.社交網(wǎng)絡(luò)產(chǎn)生了海量用戶以及實(shí)時(shí)和完整的數(shù)據(jù)，同時(shí)社交網(wǎng)絡(luò)也記錄了用戶群體的（），通過深入挖掘這些數(shù)據(jù)來了解用戶，然后將這些分析后的數(shù)據(jù)信息推給需要的品牌商家或是微博營銷公司A)地址B)行為C)情緒D)來源[單選題]42.以下屬于FROM子查詢的是()。--A)標(biāo)量子查詢B)列子查詢C)行子查詢D)表子查詢[單選題]43.計(jì)算機(jī)顯示器主要采用哪一種彩色模型（）。A)RGBB)CMY和CMYKC)HISD)HSV[單選題]44.為數(shù)據(jù)表創(chuàng)建索引的目的是()A)提高查詢的檢索性能B)歸類C)創(chuàng)建唯一索引D)創(chuàng)建主鍵[單選題]45.在連接互聯(lián)網(wǎng)的計(jì)算機(jī)上（）處理、存儲涉及國家秘密和企業(yè)秘密信息。A)可以B)只要網(wǎng)絡(luò)環(huán)境是安全的，就可以C)不確定D)嚴(yán)禁[單選題]46.()是交叉驗(yàn)證法的一種特例。A)自助法B)留一法C)交叉驗(yàn)證法D)錯誤率分析[單選題]47.下列關(guān)于構(gòu)造函數(shù)說法錯誤的是（___）。A)python中如果子類有自己的構(gòu)造函數(shù)，不會自動調(diào)用父類的構(gòu)造函數(shù)B)如果需要用到父類的構(gòu)造函數(shù)，則需要在子類的構(gòu)造函數(shù)中顯式的調(diào)用C)如果子類沒有自己的構(gòu)造函數(shù)，則會直接從父類繼承構(gòu)造函數(shù)D)無論子類有沒有構(gòu)造函數(shù)，子類都會自動調(diào)用父類的構(gòu)造函數(shù)[單選題]48.以下哪一項(xiàng)屬于非結(jié)構(gòu)化數(shù)據(jù)。A)企業(yè)ERP數(shù)據(jù)B)財(cái)務(wù)系統(tǒng)數(shù)據(jù)C)視頻監(jiān)控?cái)?shù)據(jù)D)日志數(shù)據(jù)[單選題]49.()是表現(xiàn)數(shù)據(jù)分布對稱性的指標(biāo)。A)斜率B)偏斜度C)偏度D)偏離度[單選題]50.Python中用于釋放類占用資源的方法是（）。A)__init__B)__del__C)_delD)delete[單選題]51.寫入數(shù)據(jù)到HDFS的Sink組件是()。A)HiveB)HBaseC)HDFSD)Hadoop[單選題]52.關(guān)于機(jī)器學(xué)習(xí)中的目標(biāo)函數(shù),說法錯誤的是()A)、目標(biāo)函數(shù)(TA、rgetFunC、tion)又稱為?評價(jià)函數(shù)(EvA、luA、tionFunC、tion)?B)、是機(jī)器學(xué)習(xí)算法中需要最大化或最小化一個函數(shù)C)、可以直接、精確地表示目標(biāo)函數(shù)D)、目標(biāo)函數(shù)包含誤差函數(shù)和正則化項(xiàng)。[單選題]53.以下關(guān)于NoSQL數(shù)據(jù)庫描述錯誤的是：（）A)NoSQL是一種不同于關(guān)系數(shù)據(jù)庫的數(shù)據(jù)庫管理系統(tǒng)設(shè)計(jì)方式，是對非關(guān)系型數(shù)據(jù)庫的統(tǒng)稱B)NoSQL所采用的數(shù)據(jù)模型并非傳統(tǒng)關(guān)系數(shù)據(jù)庫的關(guān)系模型，而是類似鍵/值、列族、文檔等非關(guān)系模型C)NoSQL數(shù)據(jù)庫有固定的表結(jié)構(gòu)，通常存在較多連接操作D)與關(guān)系數(shù)據(jù)庫相比，NoSQL具有靈活的水平可擴(kuò)展性.可以支持海量數(shù)據(jù)存儲[單選題]54.下列哪一項(xiàng)不屬于HDFS采用抽象的塊概念帶來的好處？A)簡化系統(tǒng)設(shè)計(jì)B)支持大規(guī)模文件存儲C)強(qiáng)大的跨平臺兼容性D)適合數(shù)據(jù)備份[單選題]55.Hadoop1.0默認(rèn)的調(diào)度器策略是哪個（）A)先進(jìn)先出調(diào)度器B)計(jì)算能力調(diào)度器C)公平調(diào)度器D)優(yōu)先級調(diào)度器[單選題]56.貝葉斯網(wǎng)結(jié)構(gòu)有效地表達(dá)了屬性的(__)。A)相互制約性B)條件獨(dú)立性C)取值D)含義[單選題]57.下列Python語句執(zhí)行后的結(jié)果是：i=2s=0whileiA)8B)12C)18D)24[單選題]58.若學(xué)習(xí)算法不依賴于環(huán)境建模，則稱為（__)A)免模型學(xué)習(xí)B)機(jī)器學(xué)習(xí)C)深度學(xué)習(xí)D)蒙特卡羅強(qiáng)化學(xué)習(xí)[單選題]59.若arr=np.array([1,2,3])，則arr*arr的輸出為（__)。A)（[1,4,9])B)（[1,2,3])C)（[2,4,6])D)（[3,6,9])[單選題]60.YARN的基于標(biāo)準(zhǔn)調(diào)度，是對下列選項(xiàng)中的（）進(jìn)行標(biāo)簽化。A)AppMasterB)ResourceManagerC)NodeManagerD)Container[單選題]61.我們可以利用--query參數(shù)將表的查詢結(jié)果導(dǎo)入HDFS中，使用該參數(shù)時(shí)需要注意必須要和（）參數(shù)一起使用。A)--tableB)--target-dirC)--fields-terminated-byD)--where[單選題]62.下列關(guān)于大數(shù)據(jù)的說法中正確的是（）A)大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)等特點(diǎn)B)處理大數(shù)據(jù)主要依靠人工進(jìn)行計(jì)算C)大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D)大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析[單選題]63.通過HBase創(chuàng)建表的的時(shí)候指定命名空間的語法正確的是（）A)namespace：tableB)namespacetableC)namespace-tableD)namespace>table[單選題]64.只要具有適當(dāng)?shù)恼咄苿?，大?shù)據(jù)的使用將成為未來提高競爭力、生產(chǎn)力、創(chuàng)新能力以及（）的關(guān)鍵要素。A)提高消費(fèi)B)提高GDPC)提高生活水平D)創(chuàng)造消費(fèi)者盈余[單選題]65.假設(shè)一種基因同時(shí)導(dǎo)致兩件事情：一是使人喜歡抽煙，二是使這個人患肺癌。這句話種基因與抽煙.肺癌之間是（）關(guān)系，而吸煙和肺癌則是（）關(guān)系。A)因果；相關(guān)B)相關(guān)；因果C)并列；相關(guān)D)因果；并列[單選題]66.pythonmy.pyv1v2命令運(yùn)行腳本，通過fromsysimportargv如何獲得v2的參數(shù)值（）。A)argv[0]B)argv[1]C)argv[2]D)argv[3][單選題]67.HBase只有一個針對行健的索引，如果要訪問HBase表中的行，下面哪種方式是不可行的？A)通過單個行健訪問B)通過時(shí)間戳訪問C)通過一個行健的區(qū)間來訪問D)全表掃描[單選題]68.HBase獲得Connection連接正確的是（）A)Connectionconn=ConnectionFactory.createConnection(conf);B)Connectionconn=ConnectionFactory.createConnection();C)Connectionconn=Connection.createConnection(conf);D)Connectionconn=Connection.createConnection();[單選題]69.以下()屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過程域"數(shù)據(jù)戰(zhàn)略"。A)數(shù)據(jù)戰(zhàn)略制定B)業(yè)務(wù)術(shù)語表C)數(shù)據(jù)質(zhì)量評估D)過程質(zhì)量保障[單選題]70.計(jì)算單個特征跟類別變量之間的關(guān)系的方法不包括（）A)Pearson相關(guān)系數(shù)B)方差C)Gini-index(基尼指數(shù))D)IG(信息增益)[單選題]71.按照班級進(jìn)行分組()A)ORDERBYCLASSESB)DORDERCLASSESC)GROUPBYCLASSESD)GROUPCLASSES[單選題]72.Hadoop配置文件中，hadoop-site.xml顯示覆蓋hadoop-default.xml里的內(nèi)容。在版本0.20中，hadoop-site.xml被分離成三個XML文件，不包括A)conf-site.xmlB)mapred-site.xmlC)core-site.xmlD)hdfs-site.xml[單選題]73.用于刪除約束的命令是A)ALTERTABLEMODIFYCONSTRAINTB)DROPCONSTRAINTC)ALTERTABLEDROPCONSTRAINTD)ALTERCONSTRAINTDROP[單選題]74.大數(shù)據(jù)的4V特性不包括A)Volume(大量)B)Velocity(高速)C)Visual(可視)D)Variety(多樣)[單選題]75.可分解為偏差、方差與噪聲之和的是()。A)訓(xùn)練誤差(trainingerror)B)經(jīng)驗(yàn)誤差(empiricalerror)C)均方誤差(meansquarederror)D)泛化誤差(generalizationerror)[單選題]76.下面屬于數(shù)據(jù)權(quán)限的特權(quán)是()。--A)DROPB)ALTERC)DELETED)以上答案全部正確[單選題]77.a="Iwantto"，如想得到I,則需要（）A)a[8:]B)a[0:1]C)a[7:]D)a[9:][單選題]78.()是分類錯誤的樣本數(shù)占樣本總數(shù)的比例。A)精度B)錯誤率C)正確率D)誤差[單選題]79.預(yù)剪枝是指在決策樹生成過程中，對每個結(jié)點(diǎn)在劃分（__）進(jìn)行估計(jì)。A)前B)中C)后D)不估計(jì)[單選題]80.下面關(guān)于數(shù)據(jù)權(quán)的描述，錯誤的是：（）A)數(shù)據(jù)權(quán)的概念發(fā)起于英國，主要將其視為信息社會的一項(xiàng)基木公民權(quán)利B)數(shù)據(jù)權(quán)包括兩個方面：數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)利C)數(shù)據(jù)主權(quán)的主體是國家，是一個國家獨(dú)立自主對本國數(shù)據(jù)進(jìn)行管理和利用的權(quán)力D)數(shù)據(jù)主權(quán)的主體是公民，是相對應(yīng)于公民數(shù)據(jù)采集義務(wù)而形成的對數(shù)據(jù)利用的權(quán)利[單選題]81.Hive查詢語言和SQL的一個不同之處在于()操作A)GroupB)JoinC)PartitionD)Union[單選題]82.()提供針對集群中每個節(jié)點(diǎn)的服務(wù)，從監(jiān)督對一個容器的終身管理到監(jiān)視資源和跟蹤節(jié)點(diǎn)健康A(chǔ))ResourceMangerB)NodeMangerC)ApplicationMasterD)Container[單選題]83.altertabletableNamesettblproperties（'EXTERNAL?='FALSE?）；執(zhí)行該Hive命令能實(shí)現(xiàn)以下哪一個目標(biāo)?A)修改外部表tableName為內(nèi)部表B)刪除tableName表的元數(shù)據(jù)信息C)修改內(nèi)部表tableName為外部表D)移動tableName數(shù)據(jù)到外部存儲系統(tǒng)[單選題]84.與以下代碼段var=100ifvar==200:print("1-Gotatrueexpressionvalue")print(var)elifvar==150:print("2-Gotatrueexpressionvalue")print(var)elifvar==100:print("3-Gotatrueexpressionvalue")print(var)else:print("4-Gotafalseexpressionvalue")print(var)等效的列表描述()。A)1-Gotatrueexpressionvalue100B)2-Gotatrueexpressionvalue100C)3-Gotatrueexpressionvalue100D)4-Gotatrueexpressionvalue100[單選題]85.()一般采用圖表或數(shù)學(xué)方法描述數(shù)據(jù)的統(tǒng)計(jì)特征,如分布狀態(tài)、數(shù)值特征等。A)推斷統(tǒng)計(jì)B)預(yù)測分析C)描述統(tǒng)計(jì)D)診斷分析[單選題]86.作為技術(shù)人員，小王被Maxcompute強(qiáng)大的數(shù)據(jù)處理能力吸引，想去體驗(yàn)一下。他快速注冊了一個阿里云帳號，進(jìn)入官網(wǎng)后試圖創(chuàng)建一個名字為test_project的Maxcomputeproject，結(jié)果沒有成功。分析，小王出錯的最有可能的原因是：（）。A)帳號未充值，余額不足導(dǎo)致出錯B)帳號未開通Maxcompute的使用權(quán)限C)未創(chuàng)建合適的accessID和accessKeyD)項(xiàng)目名字和現(xiàn)有的其他帳戶的名字重復(fù)[單選題]87.通過HBase提創(chuàng)建表的關(guān)鍵字是（）A)insertB)createC)addD)以上都不正確[單選題]88.關(guān)于概率圖模型下列敘述，正確的是：A)貝葉斯網(wǎng)絡(luò)是有向圖模型，馬爾可夫網(wǎng)絡(luò)是無向圖模型B)貝葉斯網(wǎng)絡(luò)是無向圖模型，馬爾可夫網(wǎng)絡(luò)是有向圖模型C)貝葉斯網(wǎng)絡(luò)是有向圖模型，馬爾可夫網(wǎng)絡(luò)是有向圖模型D)貝葉斯網(wǎng)絡(luò)是無向圖模型，馬爾可夫網(wǎng)絡(luò)是無向圖模型[單選題]89.LSM更能保證哪種操作的性能？A)讀B)寫C)隨機(jī)讀D)合并[單選題]90.機(jī)器學(xué)習(xí)訓(xùn)練時(shí)，Mini-Batch的大小優(yōu)選為2的事，如256或512它背后的原因是()A)Mini-Batch為偶數(shù)的時(shí)候，梯度下降算法訓(xùn)練的史決B)Mini-Batch設(shè)為2的罪，是為了符合CPU、GPU的內(nèi)存要求，利于并行化處理C)不使用偶數(shù)時(shí)，損失函數(shù)是不穩(wěn)定的D)以上答案都不正確[單選題]91.下列關(guān)于半監(jiān)督支持向量機(jī)說法錯誤的是（__)。A)半監(jiān)督支持向量機(jī)是針對二分類問題的學(xué)習(xí)算法B)半監(jiān)督支持向量機(jī)尋求一個在所有樣本上間隔最小化的劃分超平面C)半監(jiān)督支持向量機(jī)采用局部搜索來迭代地尋找其優(yōu)化問題的近似解D)半監(jiān)督支持向量機(jī)試圖考慮對未標(biāo)記樣本進(jìn)行各種可能的標(biāo)記指派[單選題]92.np.array()的作用是（__)。A)將輸入數(shù)據(jù)轉(zhuǎn)化為ndarrayB)將輸入數(shù)據(jù)轉(zhuǎn)化為arrayC)將輸入數(shù)據(jù)轉(zhuǎn)化為列表D)數(shù)組轉(zhuǎn)置[單選題]93.網(wǎng)絡(luò)的價(jià)值在于網(wǎng)絡(luò)的互聯(lián)，聯(lián)網(wǎng)的接點(diǎn)數(shù)與其價(jià)值呈現(xiàn)（）的方式，聯(lián)網(wǎng)越多，系統(tǒng)的價(jià)值越大。A)對數(shù)B)指數(shù)C)正比D)反比[單選題]94.下面關(guān)于網(wǎng)絡(luò)爬蟲的描述錯誤的是：()A)網(wǎng)絡(luò)爬蟲是一個自動提取網(wǎng)頁的程序B)為搜索引擎從萬維網(wǎng)上下載網(wǎng)頁，是搜索引擎的重要組成部分C)爬蟲從一個或若干個初始網(wǎng)頁的URL開始，獲得初始網(wǎng)頁上的URL，在抓取網(wǎng)頁的過程中，不斷從當(dāng)前頁面上抽取新的URL放入隊(duì)列，直到滿足系統(tǒng)的一定停止條件D)網(wǎng)絡(luò)爬蟲的行為和人們訪問網(wǎng)站的行為是完全不同的[單選題]95.以下哪些算法,可以用神經(jīng)網(wǎng)絡(luò)去構(gòu)造:1.KNN2.線性回歸3.對數(shù)幾率回歸A)1和2B)2和3C)1,2和3D)以上都不是[單選題]96.sparksql的查詢優(yōu)化器是A)DataFrameB)CatalystC)RddD)DataSet[單選題]97.HBase的一個典型應(yīng)用是webtable,它是一個以網(wǎng)頁()為主鍵的表。A)標(biāo)題B)URLC)內(nèi)容D)類別[單選題]98.下列關(guān)于氣泡圖的說法中,錯誤的是()A)氣泡圖中氣泡的顏色是系統(tǒng)統(tǒng)一設(shè)置的,無法人為調(diào)整B)氣泡大小的不同意味著所代表的的數(shù)值的不同C)氣泡圖中的圖形形狀不一定是圓形D)可以為每個氣泡打上標(biāo)簽使其展示的數(shù)值更加直觀化[單選題]99.以下哪項(xiàng)方法不屬于漢語分詞方法？（）A)雙向掃描法B)正向最大匹配法C)逐詞遍歷法D)詞向量匹配法[單選題]100.（）模式:hadoop安裝時(shí)的默認(rèn)模式，不對配置文件進(jìn)行修改。A)聯(lián)機(jī)B)單機(jī)C)虛擬分布D)完全分布[單選題]101.ythonWeb開發(fā)方向的第三方庫是A)DjangoB)scipyC)pandasD)requests[單選題]102.在選擇神經(jīng)網(wǎng)絡(luò)的深度時(shí)，下面那些參數(shù)需要考慮?（）(1)神經(jīng)網(wǎng)絡(luò)的類型(如MLP,CNN)(2)輸入數(shù)據(jù)(3)計(jì)算能力(硬件和軟件能力決定)(4)學(xué)習(xí)速率(5)映射的輸出函數(shù)A)1,2,4,5B)LeakyRelu是Relu的一個變種，他在xC)都需要考慮D)1,3,4,5[單選題]103.某企業(yè)準(zhǔn)備上線一個項(xiàng)目，去搜集國內(nèi)主要門戶、論壇中和本公司相關(guān)的消息，一旦有符合預(yù)定義類型的消息出現(xiàn)，將第一時(shí)間反饋給公司的公共關(guān)系部，該場景屬于典型的（）。A)流計(jì)算B)在線計(jì)算C)OLTPD)離線計(jì)算[單選題]104.按性別對職工數(shù)據(jù)集進(jìn)行匯總統(tǒng)計(jì)時(shí),需要對性別列進(jìn)行哪個操作才能完成統(tǒng)計(jì)匯總?()A)分組B)聚合C)排列D)統(tǒng)計(jì)[單選題]105.執(zhí)行"abcdef"[2:]語句時(shí)輸出是()。A)abcB)abcdC)cdefD)cde[單選題]106.如果問題存在最優(yōu)解，則下面幾種搜索算法中，（）必然可以得到該最優(yōu)解。A)廣度優(yōu)先搜索B)深度優(yōu)先搜索C)有界深度優(yōu)先搜索D)啟發(fā)式搜索[單選題]107.所有預(yù)測模型在廣義上都可稱為一個或一組()A)公式B)邏輯C)命題D)規(guī)則[單選題]108.一個MapReduce程序中的MapTask的個數(shù)由()決定。A)輸入的總文件數(shù)B)客戶端程序設(shè)置的mapTask的個數(shù)C)Fi1eInputFormat.getSplits(JobContexjob)計(jì)算出的邏輯切片的數(shù)量D)輸入的總文件大小/數(shù)據(jù)塊大小[單選題]109.ETL工具工作過程不包含以下哪項(xiàng)?A)清洗B)傳遞C)加載D)轉(zhuǎn)換[單選題]110.下面關(guān)于MapReduce的描述中正確的是?A)MapReduce程序必須包含Mapper和ReducerB)MapReduce程序的MapTask可以任意指定C)MapReduce程序的ReduceTask可以任意指定D)MapReduce程序的默認(rèn)數(shù)據(jù)讀取組件是TextInputFormat[單選題]111.下列選項(xiàng)中不是hadoop特點(diǎn)的是（）。A)可靠性B)擴(kuò)容能力C)高效率D)成本高[單選題]112.HDFS無法高效存儲大量小文件，想讓它能處理好小文件，比較可行的改進(jìn)策略不包括A)利用SequenceFile、MapFile、Har等方式歸檔小文件B)多Master設(shè)計(jì)C)Block大小適當(dāng)調(diào)小D)調(diào)大namenode內(nèi)存或?qū)⑽募到y(tǒng)元數(shù)據(jù)存到硬盤里[單選題]113.某二叉樹共有12個結(jié)點(diǎn)，其中葉子結(jié)點(diǎn)只有1個。則該二叉樹的深度為（根結(jié)點(diǎn)在第1層）___________。A)8B)12C)6D)3[單選題]114.關(guān)于云數(shù)據(jù)庫描述不對的是（）A)云數(shù)據(jù)可支持關(guān)系型數(shù)據(jù)庫B)數(shù)據(jù)庫支持按量計(jì)費(fèi)C)支持創(chuàng)建只讀實(shí)例D)支持備份與恢復(fù)，可保留歷史2周數(shù)據(jù)[單選題]115.有關(guān)MapReduce的輸入輸出，說法錯誤的是A)鏈接多個MapReduce作業(yè)時(shí)，序列文件是首選格式B)FileInputFormat中實(shí)現(xiàn)的getSplits()可以把輸入數(shù)據(jù)劃分為分片，分片數(shù)目和大小任意定義C)想完全禁止輸出，可以使用NullOutputFormatD)每個reduce需將它的輸出寫入自己的文件中，輸出無需分片[單選題]116.若a=np.abs(-5)，則print(a)輸出為（__)。A)-6B)-4C)-5D)5[單選題]117.以下關(guān)于程序控制結(jié)構(gòu)描述錯誤的是：A)單分支結(jié)構(gòu)是用if保留字判斷滿足一個條件，就執(zhí)行相應(yīng)的處理代碼B)二分支結(jié)構(gòu)是用if-else根據(jù)條件的真假，執(zhí)行兩種處理代碼C)多分支結(jié)構(gòu)是用if-elif-else處理多種可能的情況D)在Python的程序流程圖中可以用處理框表示計(jì)算的輸出結(jié)果[單選題]118.下列關(guān)于核函數(shù)特性的描述，錯誤的是()A)只要一個對稱函數(shù)所對應(yīng)的核矩陣半正定，就能稱為核函數(shù)十B)核函數(shù)選擇作為支持向量機(jī)的最大變數(shù)中C)核函數(shù)將影響支持向量機(jī)的性能D)按函數(shù)是一種降雄模型[單選題]119.RDD中的數(shù)據(jù)被()在集群中,使得任務(wù)可以并行執(zhí)行。A)順序存儲B)連續(xù)存儲C)分塊存儲D)分區(qū)存儲[單選題]120.把詞典中的詞按照由長到短遞減的順序逐字搜索整個待處理的材料，一直到把全部的詞切分出來為止。不論分詞詞典多大，被處理的材料多么小，都得把這個分詞詞典匹配一遍。這種方法叫(__)。A)正向最大匹配法B)逆向最大匹配法C)逐詞遍歷法D)隱馬爾科夫模型[單選題]121.關(guān)于eval函數(shù)，以下選項(xiàng)中描述錯誤的是A)eval函數(shù)的作用是將輸入的字符串轉(zhuǎn)為Python語句，并執(zhí)行該語句B)如果用戶希望輸入一個數(shù)字，并用程序?qū)@個數(shù)字進(jìn)行計(jì)算，可以采用eval(input())組合C)執(zhí)行eval("Hello")和執(zhí)行eval("'Hello'")得到相同的結(jié)果D)eval函數(shù)的定義為：eval(source,globals=None,locals=None,/)[單選題]122.KNN算法中K指的是:A)K個樣本B)相鄰的K個鄰居C)K次迭代D)K次方[單選題]123.在使用--query參數(shù)指定查詢語句時(shí)，需要注意的是（）A)在查詢語句中一定要有where條件且在where條件中必須包含$CONDITIONSB)在查詢語句中一定要有select語句且在select語句中必須包含$CONDITIONSC)在查詢語句中一定要有where條件且在where條件中必須包含CONDITIONSD)在查詢語句中一定要有select語句且在select語句中必須包含CONDITIONS[單選題]124.對GaussDB200描述不正確的是?（）A)并行架構(gòu)B)易運(yùn)維,安全可靠C)行列不能混存D)節(jié)點(diǎn)多,易擴(kuò)展[單選題]125.某電商網(wǎng)站想要實(shí)現(xiàn)熱銷商品的實(shí)時(shí)TopN排名，可以使用哪種技術(shù)實(shí)現(xiàn)?A)Elasticsearch的快速檢索B)HBase的rowkey索引C)Hive的關(guān)聯(lián)查詢分析D)Redis的排序計(jì)算[單選題]126.目前精準(zhǔn)營銷產(chǎn)品提供幾種服務(wù)方式：()A)1種B)2種C)3種D)4種[單選題]127.查看一張表中數(shù)據(jù)的最后修改時(shí)間，正確的方法是：（）。A)找管理員從后臺查B)DESC命令C)SHOWTABLES命令D)SELECTLAST_MODIFY_TIMEFROMTABLE[單選題]128.()是Spark中用于結(jié)構(gòu)化數(shù)據(jù)處理的軟件包。A)SPARKCOREB)SparkSQLC)SparkStreamingD)Mllib[單選題]129.若要對圖片進(jìn)行檢索，-般選擇什么工具較好?A)MysQLB)HDFSC)ElasticSearchD)Hive[單選題]130.HDFS中當(dāng)前block大小為128M，如果當(dāng)前要上傳到HDFS中的文件大小為300M，那么在存儲時(shí)會分配（）個block進(jìn)行存儲。A)1B)2C)3D)4[單選題]131.直方圖均衡化適用于增強(qiáng)直方圖呈（）分布的圖像。A)尖峰B)波形C)隨機(jī)D)高斯[單選題]132.物聯(lián)網(wǎng)(IoT,InternetofThings)即?物物相連的互聯(lián)網(wǎng)?,是()向物理世界的滲透、拓展和延伸。A)物理理論B)信息世界C)互聯(lián)網(wǎng)D)能源互聯(lián)網(wǎng)[單選題]133.企業(yè)數(shù)據(jù)分析平臺在根據(jù)不同的業(yè)務(wù)場景需求，搭建不同的大數(shù)據(jù)分析平臺，如適應(yīng)離線批處理的Hadoop平臺；適應(yīng)實(shí)時(shí)處理的流計(jì)算平臺等，這種架構(gòu)屬于哪種類型的架構(gòu)？A)分離架構(gòu)B)單一架構(gòu)C)融合架構(gòu)D)多維架構(gòu)[單選題]134.Python解釋器的提示符為（）。A)>B)>>C)>>>D)#[單選題]135.Matplotlib設(shè)置好圖表元素后，以下哪個代碼可以使圖表自動調(diào)整格式()A)fig.fit()B)fig.tight()C)fig.fit_layout()D)fig.tight_layout()[單選題]136.下列關(guān)于類屬性和實(shí)例屬性的說法中，描述正確的是（）。A)類屬性既可以顯式定義，又能在方法中定義B)公有類屬性可以通過類和類的實(shí)例訪問C)通過類可以獲取實(shí)例屬性的值D)類的實(shí)例只能獲取實(shí)例屬性的值[單選題]137.下面描述錯誤的是：()A)數(shù)據(jù)分析可以分為廣義的數(shù)據(jù)分析和狹義的數(shù)據(jù)分析B)廣義的數(shù)據(jù)分析就包括狹義的數(shù)據(jù)分析和數(shù)據(jù)挖掘。C)數(shù)據(jù)挖掘就是指狹義的數(shù)據(jù)分析D)數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中挖掘出未知的、且有價(jià)值的信息和知識的過程[單選題]138.以下()文件中主要用來配置ResourceManager，NodeManager的通信端口，web監(jiān)控端口等。A)core-site.xmlB)mapred-site.xmlC)hdfs-site.xmlD)yarn-site.xml[單選題]139.須以正確的順序傳入函數(shù)，調(diào)用時(shí)的數(shù)量必須和聲明時(shí)的一樣的參數(shù)是（）。A)位置參數(shù)B)默認(rèn)值參數(shù)C)可變參數(shù)D)關(guān)鍵字參數(shù)[單選題]140.電商大數(shù)據(jù)存在的安全風(fēng)險(xiǎn)不包括（）。A)數(shù)據(jù)版權(quán)缺乏保護(hù)B)數(shù)據(jù)產(chǎn)權(quán)歸屬不清C)大數(shù)據(jù)?殺熟?現(xiàn)象D)業(yè)務(wù)數(shù)據(jù)跨境傳輸[單選題]141.主成分分析（PCA）是一種重要的降維技術(shù)，以下對于PCA的描述不正確的是：A)主成分分析是一種無監(jiān)督方法B)主成分?jǐn)?shù)量一定小于等于特征的數(shù)量C)各個主成分之間相互正交D)原始數(shù)據(jù)在第一主成分上的投影方差最小[單選題]142.下列方法中，默認(rèn)刪除列表最后一個元素的是（）。A)delB)remove()C)pop()D)extend()[單選題]143.將字符串分隔使用什么函數(shù)（）A)splitB)stripC)encodeD)print[單選題]144.下列關(guān)于回歸算法，不正確的是（）A)回歸算法可以用最小二乘法求解B)最大似然估計(jì)可以得到和最小二乘法相同的結(jié)果C)回歸算法加入絕對值項(xiàng)是嶺回歸D)回歸算法也會產(chǎn)生過擬合問題第2部分：多項(xiàng)選擇題，共63題，每題至少兩個正確答案,多選或少選均不得分。[多選題]145.Client上傳文件的時(shí)候下列哪項(xiàng)正確（）A)數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB)Client端文件以Block為單位，管道方式依次傳到DataNodeC)Client只上傳數(shù)據(jù)到一臺Datanode，然后由NameNode負(fù)責(zé)Block復(fù)制工作D)當(dāng)某個Datanode失敗，客戶端會繼續(xù)傳給其他DataNode[多選題]146.以下關(guān)于Hive的Metastore描述正確的是（）【選兩項(xiàng)】A)Metastore保存了Hive的元數(shù)據(jù)信息B)Metastore的安裝模式不能用內(nèi)嵌模式C)Metastore的安裝模式有本地模式D)Metastore的安裝模式默認(rèn)是遠(yuǎn)程模式[多選題]147.對文本類型的數(shù)據(jù)進(jìn)行轉(zhuǎn)換加工,以下選項(xiàng)中哪些文本函數(shù)處理的對象是一個文本字符串,處理完的輸出結(jié)果也是一個文本字符串()A)ConcatenatB)LeftC)UpperD)Replace[多選題]148.下列是SVM核函數(shù)的是：()A)多項(xiàng)式核函數(shù)B)logistic核函數(shù)C)徑向基核函數(shù)D)Sigmoid核函數(shù)[多選題]149.大數(shù)據(jù)產(chǎn)業(yè)是指一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動的集合。以下哪些屬于大數(shù)據(jù)產(chǎn)業(yè)的某個環(huán)節(jié)（）:A)IT基礎(chǔ)設(shè)施層B)數(shù)據(jù)源層C)數(shù)據(jù)管理層D)數(shù)析層[多選題]150.Spark支持的計(jì)算模型有()。A)批處理B)實(shí)時(shí)計(jì)算C)機(jī)器學(xué)習(xí)模型D)交互式查詢[多選題]151.下列對于客服端的描述，哪些是正確的？A)客戶端是用戶操作HDFS最常用的方式，HDFS在部署時(shí)都提供了客戶端B)HDFS客戶端是一個庫，暴露了HDFS文件系統(tǒng)接口C)嚴(yán)格來說，客戶端并不算是HDFS的一部分D)客戶端可以支持打開、讀取、寫入等常見的操作[多選題]152.Flink計(jì)算時(shí)間不包含以下哪幾種時(shí)間語義?A)DelayTime（延遲時(shí)間）B)StartTime（開始時(shí)間）C)ProcessingTime（處理）D)EventTime（事件時(shí)間）[多選題]153.Flume進(jìn)程級聯(lián)時(shí)，以下哪些sink類型用于接收上一跳Flume發(fā)送過來的數(shù)據(jù)？A)avrosinkB)thriftsinkC)HDFSsinkD)NullSink[多選題]154.電信大數(shù)據(jù)PaaS平臺產(chǎn)品基本包包含以下哪幾類服務(wù)：（）A)數(shù)據(jù)存儲服務(wù)B)離線分析服務(wù)C)應(yīng)用開發(fā)環(huán)境及框架服務(wù)D)數(shù)據(jù)挖掘服務(wù)、MPPDB服務(wù)[多選題]155.在Spark中,彈性分布式數(shù)據(jù)集的特點(diǎn)包括()。A)可分區(qū)B)可序列化C)可直接修改D)可持久化[多選題]156.以下哪些選項(xiàng)屬于離線批處理的特點(diǎn)?A)處理時(shí)間相對較長B)數(shù)據(jù)不落地、存儲量不大C)數(shù)據(jù)吞吐量較大D)處理數(shù)據(jù)量相對較大[多選題]157.下列說法正確的是（___）。A)Python提供了兩個內(nèi)置函數(shù)從標(biāo)準(zhǔn)輸入讀入一行文本B)Python默認(rèn)的標(biāo)準(zhǔn)輸入是鍵盤C)raw_input([prompt])函數(shù)從標(biāo)準(zhǔn)輸入讀取一個行，并返回一個字符串D)raw_input可以接收一個Python表達(dá)式作為輸入，并將運(yùn)算結(jié)果返回[多選題]158.下面屬于維歸約常用的線性代數(shù)技術(shù)的有:()A)主成分分析B)特征提取C)奇異值分解D)特征加權(quán)[多選題]159.()是Spark比MapReduce計(jì)算快的原因。A)基于內(nèi)存的計(jì)算B)基于DAG的調(diào)度框架C)基于Lineage的容錯機(jī)制D)基于分布式計(jì)算的框架[多選題]160.HBase讀數(shù)據(jù)時(shí)需要讀取哪幾部分?jǐn)?shù)據(jù)?A)HlocB)MemStoreC)HfileD)HDFS[多選題]161.黨中央、國務(wù)院高度重視網(wǎng)絡(luò)安全工作，出臺了一系列法律、法規(guī)和專項(xiàng)文件，其中針對（）等，提出了明確法律規(guī)定和要求，必須認(rèn)真貫徹。A)保障數(shù)據(jù)與個人信息安全B)維護(hù)信息內(nèi)容安全C)保護(hù)國家和企業(yè)秘密D)確保網(wǎng)絡(luò)意識形態(tài)安全[多選題]162.以下數(shù)據(jù)加工函數(shù)中屬于對字符串類型數(shù)據(jù)進(jìn)行加工的是()A)trimB)replaceC)calculateD)mod[多選題]163.下列關(guān)于核函數(shù)的說法正確的是(__)。A)任何一個函數(shù)都可以作為核函數(shù)B)只要一個對稱函數(shù)所對應(yīng)的核矩陣半正定,它就能作為核函數(shù)使用C)任何一個核函數(shù)都隱式地定義了一個再生核希爾伯特空間D)核函數(shù)可將低維空間中線性可分的數(shù)據(jù)映射到高維空間，使其線性不可分[多選題]164.（）是大數(shù)據(jù)應(yīng)用的步驟。A)數(shù)據(jù)輸入B)建模分析C)使用決策支持工具輸出結(jié)果D)驗(yàn)證假設(shè)[多選題]165.HBase集群定時(shí)執(zhí)行Compaction的目的是什么A)減少同一個Region,同一個ColumnFamily下的文件數(shù)目B)提升數(shù)據(jù)讀取性能C)減少同一個ColumnFamily的文件數(shù)據(jù)D)減少同一個Region的文件數(shù)目[多選題]166.假設(shè)目標(biāo)遍歷的類別非常不平衡，即主要類別占據(jù)了訓(xùn)練數(shù)據(jù)的99%，現(xiàn)在你的模型在訓(xùn)練集上表現(xiàn)為99%的準(zhǔn)確度，那么下面說法正確的是()A)準(zhǔn)確度并不適合衡量不平衡類別問題B)準(zhǔn)確度適合衡量不平衡類別問題C)精確度和召回率適合于衡量不平衡類別問題D)精確度和召回率不適合衡量不平衡類別問題[多選題]167.a=np.array([1,2,3,4,5,6,7,8])以下（__)命令可以使輸出結(jié)果為([5,6,7])。A)a[4:7]B)a[5:8]C)a[4:-1]D)a[5:][多選題]168.大數(shù)據(jù)處理流程可以概括為以下哪幾步?()A)挖掘B)采集C)統(tǒng)計(jì)和分析D)導(dǎo)入和預(yù)處理[多選題]169.關(guān)于語句limit5,5，說法正確的是A)表示檢索出第5行開始的5條記錄B)表示檢索出行6開始的5條記錄C)表示檢索出第6行開始的5條記錄D)表示檢索出行5開始的5條記錄[多選題]170.定量變量就是通常所說的連續(xù)量,它們是由測量或計(jì)數(shù)、統(tǒng)計(jì)所得到的量,這些變量具有數(shù)值特征,以下屬于定量變量的有()A)性別B)長度C)產(chǎn)量D)職業(yè)[多選題]171.專業(yè)審計(jì)軟件有()A)ACLB)IDEAC)MicrosoftOfficeD)QlikView[多選題]172.在下列關(guān)于關(guān)系的敘述中，正確的是()A)C）行在表中的順序無關(guān)緊要B)A）表中任意兩行的值不能相同C)D）列在表中的順序無關(guān)緊要D)B）表中任意兩列的值不能相同[多選題]173.下列關(guān)于數(shù)據(jù)產(chǎn)品研發(fā)的說法錯誤的有（）。A)從加工程度看，可以將數(shù)據(jù)分為一次數(shù)據(jù)、二次數(shù)據(jù)和三次數(shù)據(jù)B)一次數(shù)據(jù)中往往存在缺失值、噪聲、錯誤或虛假數(shù)據(jù)等質(zhì)量問題C)二次數(shù)據(jù)是對一次數(shù)據(jù)進(jìn)行深度處理或分析后得到的增值數(shù)據(jù)D)三次數(shù)據(jù)是對二次數(shù)據(jù)進(jìn)行洞察與分析后得到的、可以直接用于決策支持的洞見數(shù)據(jù)[多選題]174.數(shù)據(jù)戰(zhàn)略的基本問題有(__)。A)數(shù)據(jù)戰(zhàn)略的定位B)數(shù)據(jù)戰(zhàn)略的目標(biāo)C)數(shù)據(jù)戰(zhàn)略的側(cè)重點(diǎn)D)數(shù)據(jù)戰(zhàn)略的范疇[多選題]175.語句?CREATETABLEmydb.temp()?用于從mydb.user表中復(fù)制已有的表結(jié)構(gòu)。--A)FROMmydb.userB)(FROMmydb.user)C)LIKEmydb.userD)(LIKEmydb.user)[多選題]176.客戶端使用給get方式讀取HBase用戶數(shù)據(jù)時(shí)，需要查詢meta表哪些數(shù)據(jù)?A)Region起始rowkeyB)RegionServer地址C)Region分裂時(shí)間D)Region大小[多選題]177.與傳統(tǒng)的分布式程序設(shè)計(jì)相比，Mapreduce封裝了（）等細(xì)節(jié)，還提供了一個簡單而強(qiáng)大的接口A)并行處理B)容錯處理C)本地化計(jì)算D)負(fù)載均衡[多選題]178.客戶端使用get方式讀取HBase用戶數(shù)據(jù)時(shí)，需要查詢meta表的哪些數(shù)據(jù)?A)RegionServer地址B)Region起始rowkeyC)Region大小D)Region分裂時(shí)間[多選題]179.根據(jù)《大數(shù)據(jù)風(fēng)控平臺項(xiàng)目操作手冊》，擔(dān)保圈鏈模塊，擔(dān)保圈鏈頁面右側(cè)展示（）、（）按鈕。A)擔(dān)保篩選B)關(guān)聯(lián)篩選C)全景風(fēng)險(xiǎn)視圖D)企業(yè)信用智能分析報(bào)告[多選題]180.Hive的系統(tǒng)架構(gòu)主要包括哪幾個模塊：()A)探查模塊B)驅(qū)動模塊C)元數(shù)據(jù)存儲模塊D)用戶接口模塊[多選題]181.Pandas中主要的數(shù)據(jù)結(jié)構(gòu)有（）。A)DataB)DataFrameC)FrameD)Series[多選題]182.下面哪些是循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出模式A)多輸出B)單輸出C)同步多輸出D)異步多輸出[多選題]183.DRDS做平滑擴(kuò)容的時(shí)候，現(xiàn)有的數(shù)據(jù)庫中的表需要滿足（）要求。A)拆分表需要有主鍵B)拆分表需要刪除主鍵C)單表需要做小表廣播D)單表需有主鍵[多選題]184.下列關(guān)于學(xué)習(xí)器的性能度量說法正確的是（__）。A)對于二分類問題，可將樣例根據(jù)其真實(shí)類別與學(xué)習(xí)器預(yù)測類別的組合劃分為：真正例、假正例、真反例、假反例B)查準(zhǔn)率和查全率是一對矛盾的度量C)一般來說，查準(zhǔn)率越高，查全率往往也偏高D)一般來說，查準(zhǔn)率越高，查全率往往偏低[多選題]185.大數(shù)據(jù)計(jì)算框架Flink的支持哪些資源調(diào)度方式?A)DockerB)YARNC)StandaloneD)Mesos[多選題]186.在GaussDB200中，關(guān)于Schema和Database,下面說法正確的是（）?A)Database之間無法直接訪問，但通過權(quán)限授予可以訪問數(shù)據(jù)。B)相比于Database,Schema的隔離更加的徹底。C)Schema和用戶強(qiáng)相關(guān)的，通過權(quán)限控制語法可以實(shí)現(xiàn)不同用戶對各Schema的權(quán)限。D)二者都能實(shí)現(xiàn)資源隔離。[多選題]187.為什么RNN網(wǎng)絡(luò)的激活函數(shù)要選用雙曲正切而不是sigmod呢？A)使用sigmod函數(shù)容易出現(xiàn)梯度消失B)sigmod的導(dǎo)數(shù)形式較為復(fù)雜C)雙曲正切更簡單D)sigmoid函數(shù)實(shí)現(xiàn)較為復(fù)雜[多選題]188.下列說法正確的是？A)MapReduce體系結(jié)構(gòu)主要由四個部分組成，分別是：Client、JobTracker、TaskTracker以及TaskB)Task分為MapTask和ReduceTask兩種，均由TaskTracker啟動C)在MapReduce工作流程中，所有的數(shù)據(jù)交換都是通過MapReduce框架自身去實(shí)現(xiàn)的D)在MapReduce工作流程中，用戶不能顯式地從一臺機(jī)器向另一臺機(jī)器發(fā)送消息[多選題]189.相對于HadoopMapReduce，Spark的特點(diǎn)有()。A)通用性B)易用性C)速度快D)容錯性[多選題]190.數(shù)據(jù)科學(xué)的基本流程主要包括（）A)數(shù)據(jù)化，即獲取零次數(shù)據(jù)B)數(shù)據(jù)加工，且將3C精神融入其中C)驗(yàn)證性分析，且事先提出假設(shè)D)數(shù)據(jù)產(chǎn)品的提供，且僅提供最終產(chǎn)品[多選題]191.遇到以下()情況,視圖數(shù)據(jù)操作可能會失敗。--A)視圖涉及多張數(shù)據(jù)表B)沒有滿足視圖的基本表對字段的約束條件C)創(chuàng)建視圖的SELECT字段含有MAX()函數(shù)D)定義視圖的SELECT語句中使用了GROUPBY[多選題]192.下面提到的編程框架，（）是MaxCompute支持的。A)SQLB)MapReduceC)MPID)Graph[多選題]193.為落實(shí)數(shù)據(jù)安全全過程管控，在發(fā)布環(huán)節(jié)，嚴(yán)格對外發(fā)和傳播數(shù)據(jù)安全審查，落實(shí)信息內(nèi)容合規(guī)性審核，發(fā)現(xiàn)違法違規(guī)信息應(yīng)（）。A)立即停止傳輸和發(fā)布B)采取消除等處置措施，防止信息擴(kuò)散C)對信息進(jìn)行保密D)保存有關(guān)記錄[多選題]194.(__)不屬于推斷統(tǒng)計(jì)的方法。A)區(qū)間估計(jì)B)參數(shù)估計(jì)C)假設(shè)檢驗(yàn)D)相關(guān)分析[多選題]195.圖像識別的一般步驟包括（）。A)預(yù)處理B)特征提取C)超像素生成D)識別分類[多選題]196.在Hive的條件語句中，關(guān)于條件A>B理解正確的有（）【選三項(xiàng)】A)A為null，則返回為trueB)B為null，則返回為nullC)如果A大于B則返回trueD)如果A小于B返回false[多選題]197.一個完整的推薦系統(tǒng)通常包括哪3個組成模塊：（）A)用戶建模模塊B)推薦對象建模模塊C)推薦算法模塊D)可視化模塊[多選題]198.Hive特性包括哪些?A)支持MapReduce,Tez,Spsrk等多種計(jì)算引擎。B)靈活方便的ETL(extract/transform/load.C)易用易編程。D)可直接訪問DFS文件以及HBase[多選題]199.有關(guān)實(shí)時(shí)檢索引擎中各組件的聯(lián)系與定位，以下描述中正確的有哪些項(xiàng)?A)HBaseoElasticSearch的組合滿足了大部分的用戶實(shí)時(shí)檢索訴求B)ElasticSearch存儲數(shù)據(jù)性價(jià)比低,但是其能夠滿足場景中多級索引的實(shí)時(shí)查詢需求,同時(shí)還能夠?qū)ξ臋n分詞建立索引C)與HBase相比,ElasticSearch在海量數(shù)據(jù)的情景下存儲性能不如HBase,故選擇HBase作為海量數(shù)據(jù)存儲的基石D)圖數(shù)據(jù)庫可以完美的解決復(fù)雜多級關(guān)系查詢分析,選用GES來解決圖數(shù)據(jù)的實(shí)時(shí)查詢需求[多選題]200.哪些方式能夠操作HBase的數(shù)據(jù)?A)客戶端命令B)PhoenixSQLC)JavaAPID)HivesQL[多選題]201.從Hadoop實(shí)現(xiàn)角度看，MapReduce1.0的計(jì)算框架主要由哪幾個部分？A)編程模型B)數(shù)據(jù)處理引擎C)運(yùn)行時(shí)環(huán)境D)資源管理[多選題]202.下列哪些是常用分詞方法？A)基于Binarytree的分詞方法B)基于HMM的分詞方法C)基于CRF的分詞方法D)基于Kmeans的分詞方法[多選題]203.下面（）接口或工具是MaxCompute用于導(dǎo)入導(dǎo)出數(shù)據(jù)的。A)TunnelB)DataxC)CDPD)Dship[多選題]204.以下哪些選項(xiàng)是Kafka的特點(diǎn)?A)支持消息隨機(jī)讀取B)高吞吐C)分布式D)消息持久化[多選題]205.客戶端上傳文件的時(shí)候哪項(xiàng)是正確的？（）()A)數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB)客戶端端將文件切分為多個Block，依次上傳C)客戶端只上傳數(shù)據(jù)到一臺DataNode，然后由NameNode負(fù)責(zé)Block復(fù)制工作D)客戶端發(fā)起文件上傳請求，通過RPC與NameNode建立通訊。[多選題]206.假設(shè)一行數(shù)據(jù)內(nèi)容有三列數(shù)據(jù)分別為：ID："1"NAME："張三"AGE："23歲"。請使用hive的函數(shù)生成一個新的字段："1-張三-23歲"。A)concat(ID,'-',NAME,'-',AGE)B)concat_ws('-',ID,NAME,AGE)C)ID+'-'+NAME+'-'+AGED)ID||'-'||NAME||'-'||AGE第3部分：判斷題，共42題，請判斷題目是否正確。[判斷題]207.stack()的逆操作是unstack()，默認(rèn)為拆疊最后一層。A)正確B)錯誤[判斷題]208.在DWS服務(wù)中，通過GDS并行導(dǎo)入數(shù)據(jù)時(shí)，需要明確DWS的集群IP地址。A)正確B)錯誤[判斷題]209.正則表達(dá)式'python|perl'或'p(ython|erl)'都可以匹配'python'或'perl'。A)正確B)錯誤[判斷題]210.Python只能使用內(nèi)置數(shù)據(jù)庫SQLite，無法訪問MSSQLServer、ACCESS或Oracle、MySQL等數(shù)據(jù)庫A)正確B)錯誤[判斷題]211.非結(jié)構(gòu)化數(shù)據(jù)是可以直接用傳統(tǒng)關(guān)系數(shù)據(jù)庫存儲和管理的數(shù)據(jù)。()A)正確B)錯誤[判斷題]212.在面向?qū)ο蟪绦蛟O(shè)計(jì)中，函數(shù)和方法是完全一樣的，都必須為所有參數(shù)進(jìn)行傳值。A)正確B)錯誤[判斷題]213.Zookeeper集群宕機(jī)數(shù)超過集群數(shù)一半，則Zookeeper服務(wù)失效。()A)正確B)錯誤[判斷題]214.云計(jì)算就是軟件在云端無所不在、無限強(qiáng)大的計(jì)算。也叫網(wǎng)絡(luò)化計(jì)算或網(wǎng)格計(jì)算A)正確B)錯誤[判斷題]215.數(shù)據(jù)科學(xué)是根據(jù)"數(shù)據(jù)世界"的分析結(jié)果，對"現(xiàn)實(shí)世界"進(jìn)行預(yù)測、洞見、解釋或決策的新興科學(xué)。()A)正確B)錯誤[判斷題]216.MySQL默認(rèn)查詢會去除重復(fù)記錄,只保留一條。--A)正確B)錯誤[判斷題]217.啤酒與尿布的經(jīng)典案例，充分體現(xiàn)了實(shí)驗(yàn)思維在大據(jù)分析理念中的重要性。A)正確B)錯誤[判斷題]218.屬性可以像數(shù)據(jù)成員一樣進(jìn)行訪問，但賦值時(shí)具有方法的優(yōu)點(diǎn)，可以對新值進(jìn)行檢查A)正確B)錯誤[判斷題]219.阿里云流計(jì)算目前可以支持SQL和MapReduce。A)正確B)錯誤[判斷題]220.大數(shù)據(jù)平臺采集系統(tǒng)的功能為：匯聚不同來源的數(shù)據(jù)，接口數(shù)據(jù)清洗、稽核校驗(yàn)、模型規(guī)范后，將數(shù)據(jù)規(guī)整到相關(guān)域，統(tǒng)一存放在大數(shù)據(jù)平臺指定地方，形成接口層數(shù)據(jù)。A)正確B)錯誤[判斷題]221.語句?SHOWTABLESLIKEnew%?可獲取以new開頭的數(shù)據(jù)表。--A)正確B)錯誤[判斷題]222.線性回歸不是用來預(yù)測數(shù)據(jù)的方法。()A)正確B)錯誤[判斷題]223.Hive定義了一種類似SQL的查詢語言(HQL)，將HQL轉(zhuǎn)化為MapReduce任務(wù)在Hadoop上執(zhí)行，通常用于在線分析。A)正確B)錯誤[判斷題]224.數(shù)據(jù)類型VARCHAR(255)存儲ab占用的字節(jié)數(shù)為2。--A)正確B)錯誤[判斷題]225.只有Python擴(kuò)展庫才需要導(dǎo)入以后才能使用其中的對象，Python標(biāo)準(zhǔn)庫不需要導(dǎo)入即可使用其中的所有對象和方法。A)正確B)錯誤[判斷題]226.2016年9月，國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》，10月，十八屆六中全會將大數(shù)據(jù)上升為國家戰(zhàn)略A)正確B)錯誤[判斷題]227.當(dāng)我們完成Hadoop集群的安裝和配置后，就可以直接啟動集群。A)正確B)錯誤[判斷題]228.關(guān)鍵字___in___用于測試一個對象是否是一個可迭代對象的元素。A)正確B)錯誤[判斷題]229.()createtable語句中有定義主鍵的選項(xiàng)。A)正確B)錯誤[判斷題]230.通過merge()函數(shù)合并數(shù)據(jù)時(shí)可以指定多個鍵。()A)正確B)錯誤[判斷題]231.Python代碼的注釋只有一種方式，那就是使用#符號。A)正確B)錯誤[判斷題]232.風(fēng)險(xiǎn)監(jiān)測管理模型與前臺營銷管理段模型是相互獨(dú)立的A)正確B)錯誤[判斷題]233.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同。()A)正確B)錯誤[判斷題]234.模塊文件的后綴名必定是.py。（）A)正確B)錯誤[判斷題]235.階躍函數(shù)與sigmoid函數(shù)均為典型激活函數(shù)。（）A)正確B)錯誤[判斷題]236.Python標(biāo)準(zhǔn)庫threading中的Lock、RLock、Condition、Event、Semaphore對象都可以用來實(shí)現(xiàn)線程同步A)正確B)錯誤[判斷題]237.集合可以作為字典的值。A)正確B)錯誤[判斷題]238.Flume可以在系統(tǒng)中定制各類數(shù)據(jù)發(fā)送方，用于數(shù)據(jù)收集，同時(shí)提供簡單的數(shù)據(jù)處理，并將簡單處理的數(shù)據(jù)寫入各種數(shù)據(jù)接收方，如文本、HDFS、Kafka和HBase。A)正確B)錯誤[判斷題]239.對于PCA處理后的特征，其樸素貝葉斯特征相互獨(dú)立的假設(shè)一定成立，因?yàn)樗兄鞒煞侄际钦坏模圆幌嚓P(guān)。()A)正確B)錯誤[判斷題]240.《NatureMedicine》上提出面部特征來發(fā)現(xiàn)罕見遺傳病的DeepGestalt，使用的數(shù)萬樣本可以支撐大數(shù)據(jù)分析A)正確B)錯誤[判斷題]241.儀表板視圖下只能查看不能變動數(shù)據(jù)()A)正確B)錯誤[判斷題]242.字符串屬于Python有序序列，和列表、元組一樣都支持雙向索引。A)正確B)錯誤[判斷題]243.如果你有一個序列，里面有很多重復(fù)的值（即，序列中唯一元素的數(shù)量遠(yuǎn)小于序列的長度），將原有序列轉(zhuǎn)換為一種分類類型，然后使用A)正確B)錯誤[判斷題]244.HDFS中提供SecondaryNameNode節(jié)點(diǎn)，是為了取代掉NameNode節(jié)點(diǎn)。A)正確B)錯誤[判斷題]245.儀表板圖恢復(fù)數(shù)據(jù)須手動恢復(fù)是否正確()A)正確B)錯誤[判斷題]246.mapreduce的核心是把復(fù)雜的任務(wù)分成多個子任務(wù)然后在一個超級計(jì)算機(jī)上并發(fā)執(zhí)行。A)正確B)錯誤[判斷題]247.算力的發(fā)展速度已經(jīng)大大超越了算法和數(shù)據(jù)領(lǐng)域的發(fā)展速度A)正確B)錯誤[判斷題]248.Series對象不存在層次化索引。（）A)正確B)錯誤第4部分：問答題，共11題，請?jiān)诳瞻滋幪顚懻_答案。[問答題]249.flink是一個批處理和流處理結(jié)合的統(tǒng)一計(jì)算框架,其核心是一個數(shù)據(jù)分發(fā)以及并行計(jì)算的流數(shù)據(jù)處理引擎A)TrueB)False[問答題]250.Namenode、Jobtracker和tasktracker的端口號是？[問答題]251.擴(kuò)容的方式有兩種，分別是()和()。[問答題]252.read_csv()與read_table()函數(shù)的區(qū)別在于使用的分隔符不同，前者使用【】作為分隔符，而后者使用【】作為分隔符。[問答題]253.Hadoop使用自己的序列化格式為()。[問答題]254.（）（請?zhí)顚懹⑽模┦荈lume數(shù)據(jù)傳輸?shù)幕締卧?。[問答題]255.DAYU實(shí)時(shí)作業(yè)啟動過后不能暫停。A)TRUEB)FALSE[問答題]256.NameNode主要以()的形式對數(shù)據(jù)進(jìn)行管理和存儲。[問答題]257.首先集群的目的是為了節(jié)省成本，用廉價(jià)的pc機(jī)，取代小型機(jī)及大型機(jī)。小型機(jī)和大型機(jī)有什么特點(diǎn)？[問答題]258.Zookeeper可以作為文件存儲系統(tǒng)，因此可以將大規(guī)模數(shù)據(jù)文件存在該系統(tǒng)中。錯誤[問答題]259.利用python語言編寫函數(shù)，判斷用戶輸入的三個數(shù)字是否能構(gòu)成三角形的三條邊。[多選題]260.fusioninsightHD集群包含多種服務(wù),每種服務(wù)又有若干個角色組成,下面那些是角色?A)namenodeB)hbaseC)datanode1.答案:C解析:HDFS對文件系統(tǒng)目錄樹的持久化就是對editlog日志文件與fsimage鏡像文件的操作。2.答案:A解析:3.答案:A解析:4.答案:D解析:OLAP具有快速性、可分析性、多維性、信息性、共享性等特征。5.答案:D解析:6.答案:C解析:7.答案:C解析:Spark中常見的窄依賴操作包括map、?ler、union、sample等，寬依賴操作包括ReduceByKey、groupByKey、join等。8.答案:C解析:9.答案:B解析:10.答案:B解析:11.答案:C解析:12.答案:D解析:13.答案:C解析:14.答案:A解析:15.答案:D解析:16.答案:A解析:17.答案:A解析:數(shù)據(jù)倉庫開發(fā)要從需求出發(fā)。18.答案:B解析:19.答案:B解析:20.答案:C解析:21.答案:B解析:22.答案:D解析:23.答案:C解析:24.答案:C解析:25.答案:C解析:26.答案:B解析:27.答案:B解析:28.答案:D解析:29.答案:A解析:30.答案:B解析:31.答案:D解析:32.答案:C解析:33.答案:D解析:記住即可34.答案:B解析:35.答案:B解析:LSM結(jié)構(gòu)寫數(shù)據(jù)時(shí)，首先將數(shù)據(jù)緩存到內(nèi)存中的一個有序樹結(jié)構(gòu)中（稱為memtable）36.答案:D解析:37.答案:D解析:38.答案:C解析:39.答案:C解析:40.答案:D解析:41.答案:C解析:42.答案:D解析:43.答案:A解析:44.答案:A解析:45.答案:D解析:46.答案:B解析:47.答案:D解析:48.答案:C解析:49.答案:B解析:偏斜度是對統(tǒng)計(jì)數(shù)據(jù)分布偏斜方向及程度的度量。在偏態(tài)分布中,當(dāng)偏斜度為正值時(shí),分布正偏,即眾數(shù)位于算術(shù)平均數(shù)的左側(cè);當(dāng)偏斜度為負(fù)值時(shí),分布負(fù)偏,即眾數(shù)位于算術(shù)平均數(shù)的右側(cè)。50.答案:B解析:51.答案:C解析:52.答案:C解析:53.答案:C解析:54.答案:C解析:55.答案:A解析:56.答案:B解析:57.答案:B解析:58.答案:A解析:59.答案:A解析:60.答案:C解析:61.答案:B解析:62.答案:C解析:63.答案:A解析:64.答案:D解析:65.答案:A解析:66.答案:C解析:67.答案:B解析:68.答案:A解析:69.答案:A解析:數(shù)據(jù)戰(zhàn)略制定屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過程域"數(shù)據(jù)戰(zhàn)略"。70.答案:B解析:71.答案:C解析:72.答案:A解析:hadoop配置Conf沒見過，就不選73.答案:C解析:74.答案:C解析:75.答案:D解析:泛化誤差可分解為偏差、方差與噪聲之和。76.答案:C解析:77.答案:B解析:78.答案:B解析:79.答案:A解析:80.答案:D解析:81.答案:C解析:82.答案:B解析:83.答案:A解析:84.答案:C解析:85.答案:C解析:86.答案:D解析:87.答案:B解析:88.答案:A解析:89.答案:B解析:LSM的思想，在于對數(shù)據(jù)的修改增量保持在內(nèi)存中，達(dá)到指定的限制后將這些修改操作批量寫入到磁盤中，相比較于寫入操作的高性能，讀取需要合并內(nèi)存中最近修改的操作和磁盤中歷史的數(shù)據(jù)，即需要先看是否在內(nèi)存中，若沒有命中，還要訪問磁盤文件。90.答案:B解析:91.答案:B解析:92.答案:A解析:93.答案:B解析:94.答案:D解析:95.答案:B解析:96.答案:B解析:97.答案:B解析:webtable中,以網(wǎng)頁URL為主鍵。98.答案:A解析:99.答案:D解析:100.答案:B解析:101.答案:A解析:102.答案:C解析:103.答案:A解析:104.答案:A解析:105.答案:C解析:106.答案:A解析:107.答案:D解析:108.答案:C解析:109.答案:B解析:110.答案:D解析:111.答案:D解析:112.答案:D解析:HDFS特性sec

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷28)

文檔簡介

溫馨提示

最新文檔

評論

大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷28)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔