大數(shù)據(jù)應(yīng)用基礎(chǔ)知到智慧樹章節(jié)測(cè)試課后答案2024年秋山東建筑大學(xué)_第1頁(yè)
大數(shù)據(jù)應(yīng)用基礎(chǔ)知到智慧樹章節(jié)測(cè)試課后答案2024年秋山東建筑大學(xué)_第2頁(yè)
大數(shù)據(jù)應(yīng)用基礎(chǔ)知到智慧樹章節(jié)測(cè)試課后答案2024年秋山東建筑大學(xué)_第3頁(yè)
大數(shù)據(jù)應(yīng)用基礎(chǔ)知到智慧樹章節(jié)測(cè)試課后答案2024年秋山東建筑大學(xué)_第4頁(yè)
大數(shù)據(jù)應(yīng)用基礎(chǔ)知到智慧樹章節(jié)測(cè)試課后答案2024年秋山東建筑大學(xué)_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余6頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)應(yīng)用基礎(chǔ)知到智慧樹章節(jié)測(cè)試課后答案2024年秋山東建筑大學(xué)第一章單元測(cè)試

數(shù)據(jù)計(jì)量單位中,T是G的()倍。

A:8B:1000C:16D:1024

答案:1024一般來(lái)說(shuō),科學(xué)實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù)體量較小,質(zhì)量不高。()

A:對(duì)B:錯(cuò)

答案:錯(cuò)以下行為正確的是()。

A:及時(shí)刪除不明電子郵件的附件B:使用國(guó)產(chǎn)替換軟件C:使用簡(jiǎn)單的密碼或長(zhǎng)時(shí)間不修改密碼D:使用破解軟件,以節(jié)約成本

答案:及時(shí)刪除不明電子郵件的附件;使用國(guó)產(chǎn)替換軟件一般來(lái)說(shuō),和PaaS模式的云服務(wù)相比,使用SaaS云服務(wù),用戶需要自行管理更多的資源。()

A:錯(cuò)B:對(duì)

答案:錯(cuò)為了快速發(fā)展數(shù)字經(jīng)濟(jì),可以允許一些平臺(tái)收集用戶的隱私信息。()

A:錯(cuò)B:對(duì)

答案:錯(cuò)解決數(shù)據(jù)倫理問(wèn)題,最根本的是企業(yè)或組織堅(jiān)守倫理底線,踐行科技向善的原則。()

A:對(duì)B:錯(cuò)

答案:對(duì)

第二章單元測(cè)試

下列調(diào)查適宜用調(diào)查問(wèn)卷的是()

A:對(duì)你所在班級(jí)的學(xué)生最喜歡的體育活動(dòng)進(jìn)行調(diào)查B:對(duì)上海市常住人口家庭收入情況進(jìn)行調(diào)查C:電商平臺(tái)調(diào)查某商品的用戶使用感受D:檢測(cè)某城市的空氣質(zhì)量

答案:對(duì)你所在班級(jí)的學(xué)生最喜歡的體育活動(dòng)進(jìn)行調(diào)查;對(duì)上海市常住人口家庭收入情況進(jìn)行調(diào)查下列選項(xiàng)中,獲取數(shù)據(jù)的直接來(lái)源的方法有()

A:從《人口普查資料匯編》當(dāng)中獲取的數(shù)據(jù)B:某大學(xué)、科研機(jī)構(gòu)發(fā)布的研究數(shù)據(jù)C:問(wèn)卷調(diào)查D:某企業(yè)發(fā)布的經(jīng)營(yíng)報(bào)表數(shù)據(jù)E:實(shí)驗(yàn)檢測(cè)獲取數(shù)據(jù)

答案:問(wèn)卷調(diào)查;實(shí)驗(yàn)檢測(cè)獲取數(shù)據(jù)網(wǎng)絡(luò)爬蟲能夠爬取互聯(lián)網(wǎng)上的任何數(shù)據(jù)。()

A:錯(cuò)B:對(duì)

答案:錯(cuò)Response類對(duì)象的下列屬性中,用于表示HTML代碼的是()

A:textB:status_codeC:encodingD:content

答案:text運(yùn)行以下程序,結(jié)果是()

A:TrueFalseTrueB:FalseTrueTrueC:TrueTrueFalseD:TrueTrueTrue

答案:TrueTrueTrue利用八爪魚采集器采集數(shù)據(jù)過(guò)程中,如果希望只采集滿足條件的部分?jǐn)?shù)據(jù),可以嘗試通過(guò)判斷條件功能來(lái)完成。()

A:對(duì)B:錯(cuò)

答案:對(duì)

第三章單元測(cè)試

文本文件中的數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)依賴應(yīng)用程序,所以文件不適合管理較大規(guī)模的數(shù)據(jù)。()

A:錯(cuò)B:對(duì)

答案:對(duì)數(shù)據(jù)庫(kù)管理系統(tǒng)的主要功能包括以下幾個(gè)方面()

A:管理計(jì)算機(jī)的硬件資源B:數(shù)據(jù)操作C:數(shù)據(jù)庫(kù)的建立與維護(hù)D:數(shù)據(jù)組織、存儲(chǔ)和管理E:數(shù)據(jù)定義

答案:數(shù)據(jù)操作;數(shù)據(jù)庫(kù)的建立與維護(hù);數(shù)據(jù)組織、存儲(chǔ)和管理;數(shù)據(jù)定義大數(shù)據(jù)時(shí)代,數(shù)據(jù)類型繁多,半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)成為主流數(shù)據(jù)形式,而NoSQL數(shù)據(jù)庫(kù)沒(méi)有固定的表結(jié)構(gòu),數(shù)據(jù)約束也比較寬松,更適合海量的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)。()

A:對(duì)B:錯(cuò)

答案:對(duì)NoSQL是大數(shù)據(jù)時(shí)代的主流存儲(chǔ)方式,可以全面替代傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)。()

A:錯(cuò)B:對(duì)

答案:錯(cuò)列族數(shù)據(jù)庫(kù)的查找速度快、可擴(kuò)展性強(qiáng)、復(fù)雜性低,代表性的軟件有HBase、Cassandra等。()

A:對(duì)B:錯(cuò)

答案:對(duì)

第四章單元測(cè)試

現(xiàn)實(shí)世界中直接采集到的數(shù)據(jù)大多是不完整、結(jié)構(gòu)不一致、含噪聲的數(shù)據(jù),無(wú)法直接用于數(shù)據(jù)分析或挖掘。()

A:錯(cuò)B:對(duì)

答案:對(duì)數(shù)據(jù)預(yù)處理的目的()

A:抽取精準(zhǔn)的數(shù)據(jù)B:盡可能的簡(jiǎn)化數(shù)據(jù)C:調(diào)整數(shù)據(jù)格式D:提高數(shù)據(jù)質(zhì)量E:清理“臟”數(shù)據(jù)

答案:抽取精準(zhǔn)的數(shù)據(jù);盡可能的簡(jiǎn)化數(shù)據(jù);調(diào)整數(shù)據(jù)格式;提高數(shù)據(jù)質(zhì)量;清理“臟”數(shù)據(jù)數(shù)據(jù)集成的過(guò)程中需要處理的問(wèn)題有()

A:其余選項(xiàng)都是B:冗余與相關(guān)性分析。C:數(shù)據(jù)沖突和檢測(cè)D:實(shí)體識(shí)別

答案:其余選項(xiàng)都是數(shù)據(jù)歸約指數(shù)據(jù)降維,是從原有的數(shù)據(jù)中刪除不重要或不相關(guān)的屬性,或者通過(guò)對(duì)屬性進(jìn)行重組來(lái)減少屬性的個(gè)數(shù)。()

A:錯(cuò)B:對(duì)

答案:對(duì)pandas庫(kù)中的DataFrame對(duì)象的replace方法可以替換指定數(shù)據(jù)。()

A:錯(cuò)B:對(duì)

答案:對(duì)

第五章單元測(cè)試

Matplotlib中的()模塊提供了一系列操作和繪圖函數(shù)。

A:plotB:rcparamsC:barD:pyplot

答案:pyplot下列參數(shù)中調(diào)整后顯示中文的是()。

A:lines.linewidthB:lines.linestyleC:axes.unicode_minusD:font.sans-serif

答案:font.sans-serif散點(diǎn)圖無(wú)法反映特征之間的統(tǒng)計(jì)關(guān)系。()

A:對(duì)B:錯(cuò)

答案:錯(cuò)折線圖的主要功能是查看因變量y隨著自變量x改變的趨勢(shì)。()

A:對(duì)B:錯(cuò)

答案:對(duì)在seaborn中要移除圖形中的軸線,使用的方法是despine方法。()

A:對(duì)B:錯(cuò)

答案:對(duì)

第六章單元測(cè)試

下面有關(guān)回歸分析的描述,不正確的是()。

A:回歸分析的預(yù)測(cè)過(guò)程是利用得到的模型對(duì)新樣本進(jìn)行預(yù)測(cè)B:回歸分析包括學(xué)習(xí)過(guò)程和預(yù)測(cè)過(guò)程C:回歸分析屬于無(wú)監(jiān)督學(xué)習(xí)D:回歸分析的學(xué)習(xí)過(guò)程是利用有標(biāo)簽的訓(xùn)練數(shù)據(jù)集學(xué)習(xí)得到一個(gè)模型

答案:回歸分析屬于無(wú)監(jiān)督學(xué)習(xí)關(guān)于下面這段代碼,描述不正確的是()。

A:第7行代碼用于查看所估計(jì)回歸方程的判定系數(shù)R方B:第2行代碼建立了一個(gè)名為regr的線性回歸模型C:第6行代碼用于對(duì)所建立的回歸模型進(jìn)行參數(shù)估計(jì)D:第8行代碼用于查看所估計(jì)回歸方程的回歸參數(shù)

答案:第7行代碼用于查看所估計(jì)回歸方程的判定系數(shù)R方下面有關(guān)分類的描述,正確的是()。

A:分類問(wèn)題的因變量是類別變量B:分類是一種無(wú)監(jiān)督學(xué)習(xí)C:分類包括學(xué)習(xí)過(guò)程和分類過(guò)程D:分類是一種監(jiān)督學(xué)習(xí)

答案:分類問(wèn)題的因變量是類別變量;分類包括學(xué)習(xí)過(guò)程和分類過(guò)程;分類是一種監(jiān)督學(xué)習(xí)利用邏輯回歸模型進(jìn)行類別預(yù)測(cè)的方法是()。

A:LinearRegression.predict()B:LogisticRegression.predict()C:LogisticRegression.fit()D:LogisticRegression.score()

答案:LogisticRegression.predict()以下關(guān)于聚類的描述,正確的是()

A:聚類的數(shù)據(jù)集包含特征變量和類別變量B:決策樹方法是一種聚類方法C:聚類的數(shù)據(jù)集只包含特征變量不包含類別變量D:聚類屬于監(jiān)督學(xué)習(xí)

答案:聚類的數(shù)據(jù)集只包含特征變量不包含類別變量在K-means聚類過(guò)程中,計(jì)算不同K值時(shí)的內(nèi)平方和WWS如下表所示,請(qǐng)問(wèn)最優(yōu)K值是()。

K值WWS值162.8212.339.449.359.269.1

A:3B:2C:4D:1

答案:3有關(guān)K-means聚類命令sklearn.cluster.KMeans(),以下說(shuō)法不正確的是()。

A:可通過(guò)屬性labels_查看聚類之后的樣本點(diǎn)分類B:可通過(guò)屬性cluster_centers_查看聚類之后的質(zhì)心坐標(biāo)C:用于計(jì)算K-means聚類的方法是fit()D:可通過(guò)參數(shù)n_clusters指定初始聚類中心位置

答案:可通過(guò)參數(shù)n_clusters指定初始聚類中心位置關(guān)于下面這段代碼,描述不正確的是()。

A:sklearn.model_selection.train_test_split()方法可用于將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集兩部分B:x_test,y_test分別是指測(cè)試集的自變量和因變量C:訓(xùn)練集和測(cè)試集的比例為0.25:0.75D:x_train,y_train分別是指訓(xùn)練集的自變量和因變量

答案:訓(xùn)練集和測(cè)試集的比例為0.25:0.75有關(guān)文本分析的描述,不正確的是()。

A:詞性標(biāo)注是指為詞語(yǔ)標(biāo)注相應(yīng)詞性的過(guò)程B:去除停用詞是指去除文本中包含信息較多、使用頻率又很高的詞C:一般而言,進(jìn)行文本分析的起始步驟是詞語(yǔ)分詞D:詞干提取可用于英文文本分析

答案:去除停用詞是指去除文本中包含信息較多、使用頻率又很高的詞可用于英文分詞的方法是()。

A:nltk.word_tokenize()B:stopwords.words()C:nltk.FreDist()D:nltk.pos_tag()

答案:nltk.word_tokenize()

第七章單元測(cè)試

更改一個(gè)文件權(quán)限的命令是()。

A:chmodB:catC:attribD:chown

答案:chmodLinux中權(quán)限最大的賬戶是()。

A:adminB:guestC:superD:root

答案:rootLinux的命令由連續(xù)的字符組成,命令和參數(shù)之間可以沒(méi)有空格。()

A:對(duì)B:錯(cuò)

答案:錯(cuò)Linux操作系統(tǒng)的主要特點(diǎn)是()。

A:安全B:多用戶多任務(wù)C:免費(fèi)D:開源

答案:安全;多用戶多任務(wù);免費(fèi);開源從目錄/home/glxy/app切換到目錄/home/glxy/hadoop的相對(duì)路徑是()

A:../hadoopB:hadoopC:./hadoopD:

/home/glxy/hadoop

答案:../hadoop

第八章單元測(cè)試

一種典型的數(shù)據(jù)處理使用模式是:首先使用()工具對(duì)原始海量數(shù)據(jù)進(jìn)行分析,產(chǎn)生較小規(guī)模的數(shù)據(jù)集,再使用()工具對(duì)該數(shù)據(jù)集進(jìn)行快速查詢,獲取最終結(jié)果。

A:批處理、流處理B:流處理、批處理C:批處理、交互式處理D:交互式處理、批處理

答案:批處理、交互式處理大數(shù)據(jù)管理平臺(tái)技術(shù)的發(fā)展歷程為()。

A:流處理階段B:內(nèi)存計(jì)算階段C:初始階段D:開源階段

答案:流處理階段;內(nèi)存計(jì)算階段;初始階段;開源階段常用的流數(shù)據(jù)處理技術(shù)有()。

A:HadoopB:SparkStreamingC:FlinkD:Strom

答案:SparkStreaming;Flink;Strom下述哪些技術(shù)不屬于開源技術(shù)()。

A:SparkB:GFSC:HadoopD:Flink

答案:GFS大數(shù)據(jù)管理平臺(tái)技術(shù)可以應(yīng)用到下述哪些領(lǐng)域場(chǎng)景中()。

A:互聯(lián)網(wǎng)B:醫(yī)療C:電信D:交通

答案:互聯(lián)網(wǎng);醫(yī)療;電信;交通

第九章單元測(cè)試

在HDFS中負(fù)責(zé)保存文件數(shù)據(jù)的節(jié)點(diǎn)被稱為()。

A:NodeManagerB:DataNodeC:SecondaryNameNodeD:NameNode

答案:DataNode下面與HDFS類似的框架是()?

A:FAT32B:EXT3C:GFSD:NTFS

答案:GFS下面哪個(gè)程序負(fù)責(zé)HDFS數(shù)據(jù)存儲(chǔ)()。

A:NameNodeB:DatanodeC:secondaryNameNodeD:Jobtracker

答案:DatanodeHDFS中的NameNode節(jié)點(diǎn)用于存放元數(shù)據(jù),數(shù)據(jù)內(nèi)容包含()。

A:客戶端硬件配置數(shù)據(jù)B:每個(gè)數(shù)據(jù)塊的內(nèi)容C:文件與數(shù)據(jù)塊的映射表D:數(shù)據(jù)塊與數(shù)據(jù)節(jié)點(diǎn)的映射表

答案:文件與數(shù)據(jù)塊的映射表;數(shù)據(jù)塊與數(shù)據(jù)節(jié)點(diǎn)的映射表HDFS系統(tǒng)采用NameNode定期向DataNode發(fā)送心跳消息,用于檢測(cè)系統(tǒng)是否正常運(yùn)行。()

A:對(duì)B:錯(cuò)

答案:錯(cuò)

第十章單元測(cè)試

Spark生態(tài)系統(tǒng)支持批處理、交互式處理和流處理。()

A:錯(cuò)B:對(duì)

答案:對(duì)以下哪個(gè)組件不屬于Spark生態(tài)(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論