數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第1頁
數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第2頁
數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第3頁
免費(fèi)預(yù)覽已結(jié)束,剩余3頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試章節(jié)答案2024年DataFrame對象使用sort_values方法按照某列進(jìn)行排序后,只有該列數(shù)據(jù)按順序調(diào)整位置,其他列保此原順序不變。

答案:錯在數(shù)據(jù)統(tǒng)計(jì)中,均值和中位數(shù)是相同的概念。

答案:錯清洗數(shù)據(jù)有濾除和填充兩種方法,當(dāng)數(shù)據(jù)集比較小時(shí),應(yīng)盡量選擇數(shù)據(jù)____的方式來清洗數(shù)據(jù)。

答案:填充數(shù)據(jù)記錄了我國4個直轄市第一(種植業(yè)、林業(yè)、牧業(yè)和漁業(yè))、第二(采掘業(yè),制造業(yè),電力、煤氣、水的生產(chǎn)和供應(yīng)業(yè)、建筑業(yè))、第三產(chǎn)業(yè)(其他)2017年產(chǎn)值的增加量(單位:億元)。創(chuàng)建了如下數(shù)據(jù)表:frompandasimportDataFramedata=[[98.99,9251.40,20783.47],[120.45,5310.63,22569.27],[218.28,7590.36,10786.74],[1339.62,8596.61,9564.04]]value=DataFrame(data,index=['上海','北京','天津','重慶'],columns=['第一','第二','第三'])現(xiàn)在需要在value中新增一列‘總增量’,記錄每個城市的三類產(chǎn)業(yè)產(chǎn)值增量總和,使用語句:value['____']=value.sum(axis=1)

答案:總增量關(guān)于DataFrame數(shù)據(jù)對象的添加和刪除操作,_______是正確的描述。

答案:DataFrame對象不能直接添加新的行數(shù)據(jù);可以設(shè)置axis的值刪除DataFrame指定行或列的數(shù)據(jù)可以使用DataFrame對象的corr()方法求兩列數(shù)據(jù)的相關(guān)系數(shù),關(guān)于相關(guān)系數(shù)的描述中________是正確的。

答案:相關(guān)系數(shù)為零時(shí)兩列數(shù)據(jù)相關(guān)性最小使用merge方法對DataFrame對象temp1和temp2進(jìn)行列上的合并時(shí),設(shè)置參數(shù)________,實(shí)現(xiàn)按照兩個對象鍵值的交集進(jìn)行合并。

答案:how=inner調(diào)用DataFrame對象temp的fillna方法填充空值時(shí),設(shè)置________參數(shù)可以控制是否直接更新temp對象。

答案:inplace假定DataFrame對象temp中共有12列,語句________刪除空值(NaN)個數(shù)大于3的行。

答案:temp.dropna(threshold=9)統(tǒng)計(jì)DataFrame對象stu中各‘省份’同學(xué)人數(shù)的方法是________。

答案:stu[‘省份’].value_counts()統(tǒng)計(jì)量“方差”描述________。

答案:樣本個體距離均值的離散程度有3張同學(xué)信息表,存儲為DataFrame對象stu1,stu2,stu3,具有相同的列索引,合并的方法是________。

答案:pd.concat([stu1,sut2,sut3])關(guān)于數(shù)據(jù)文件讀寫,_______是錯誤的描述。

答案:文件中第一行必須給出列的索引名(columns),否則pandas無法讀取各列內(nèi)容創(chuàng)建students對象,下面語句篩選出_______大于67公斤同學(xué)的_______。students數(shù)據(jù)如下:

ageheightweight1

19

170

682

20

165

653

18

175

65>>>students.loc[students[‘weight’]>67,

‘height’]

答案:體重、身高創(chuàng)建students對象,_______語句可以選出第二個同學(xué)的身高。students數(shù)據(jù)如下:

ageheightweight1

19

170

682

20

165

653

18

175

65

答案:students.loc[2,'height']創(chuàng)建height對象,_______語句能選出高度為190的數(shù)據(jù)。height=Series({'13':187,'14':190,'7':185,'2':178,'9':185})

答案:height[1]關(guān)于DataFrame和Series對象,下列敘述正確的是_______。

答案:Series對象主要用于處理一維數(shù)據(jù)CSV文件是_______,可以使用_______查看。

答案:純文本文件,文本編輯器DataFrame對象df中基于位置序號選取第2行第3列數(shù)據(jù)的方式是_______。(序號從0開始)

答案:df.iloc[1,2]DataFrame對象的列索引通常表示________。

答案:每列數(shù)據(jù)對應(yīng)的現(xiàn)實(shí)概念觀察樣本多個屬性值兩兩之間的相關(guān)性,可采用pandas提供了散點(diǎn)圖矩陣pd.plotting.____函數(shù)。

答案:scatter_matrix利用Series.plot繪制概率密度圖時(shí),將kind參數(shù)設(shè)置為____。

答案:'kde'/kde/'density'/densityDataFrame對象temp記錄了8個城市4個季度的第三產(chǎn)業(yè)產(chǎn)值,利用DataFrame.plot繪制柱狀圖時(shí),可以設(shè)置參數(shù)____控制畫堆疊或復(fù)式柱狀圖。

答案:stacked觀察男、女同學(xué)對“數(shù)據(jù)科學(xué)”課程的興趣程度與課程成績之間的關(guān)系,應(yīng)使用分組____。

答案:散點(diǎn)圖/scatterdiagram/ScatterDiagram_________可用于展示離散數(shù)據(jù)。

答案:柱狀圖;餅圖關(guān)于餅圖的描述,錯誤的是_________。

答案:描述總體各樣本區(qū)間的樣本數(shù)量下面關(guān)于直方圖的說法中,錯誤的是_________。

答案:分箱的數(shù)量與數(shù)據(jù)集的分布無關(guān)繪制多個子圖的正確方法是_________。

答案:導(dǎo)入matplotlib.pyplot庫,創(chuàng)建figure對象,調(diào)用figure.add_subplot函數(shù)比較3個班級學(xué)生高數(shù)成績的分位數(shù)分布并觀察異常值,可選擇_________。

答案:箱須圖下面關(guān)于使用pyplot和pandas提供的繪圖函數(shù)的說法中,錯誤的是_________。

答案:在同一figure對象中,pyplot和pandas的繪圖函數(shù)不可以混合使用/images/questionbank/icon/default.png

答案:對深度學(xué)習(xí)就是具有很多個隱藏層、每個隱藏層具有很多結(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)。

答案:對神經(jīng)網(wǎng)絡(luò)中每層中不同的結(jié)點(diǎn)通常采用不同的激活函數(shù)。

答案:錯K-means算法迭代過程同時(shí)最小化簇內(nèi)凝聚度和最大化簇間分離度。(判斷1分)

答案:錯同一個數(shù)據(jù)集上,通常使用隨機(jī)森林的方法訓(xùn)練分類模型需要的時(shí)間比C4.5決策樹更長。

答案:對Precision(精確率)指分類問題中真實(shí)正例被正確預(yù)測出的比例。

答案:錯回歸分析中,性能評價(jià)指標(biāo)均方根誤差RMSE與測試集的大小無關(guān)。

答案:錯神經(jīng)網(wǎng)絡(luò)可用于_________等問題的建模分析。(多選1分)

答案:識別垃圾短信;根據(jù)房屋特性預(yù)測房價(jià);識別車牌_________屬于神經(jīng)網(wǎng)絡(luò)常用的激活函數(shù)。(多選1分)

答案:Sigmoid;tanh;ReLU;Softmax關(guān)于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的說法中,不正確的是_________。

答案:神經(jīng)網(wǎng)絡(luò)的隱藏層越少,訓(xùn)練時(shí)間越長K-means算法的核心是_________。

答案:樣本間相似度計(jì)算關(guān)于聚類分析的說法,不正確的是_________。

答案:“簇”越多說明聚類效果越好K-means算法中K表示_________。

答案:聚類得到的類別數(shù)數(shù)據(jù)建模分析,_________方法需要計(jì)算樣本之間的距離。

答案:k-meansF1score可用于衡量分類模型性能,根據(jù)以下混淆矩陣,F1=_________。真實(shí)類預(yù)測類Class=YesClass=NoClass=Yes(正例)abClass=No(反例)cd

答案:2a/(2a+b+c)構(gòu)建決策樹的算法在數(shù)據(jù)集中選擇合適的_________作為樹的結(jié)點(diǎn)。

答案:特征項(xiàng)建模分析時(shí),通常用于訓(xùn)練的樣本數(shù)量_________測試集的樣本數(shù)量。

答案:大于________屬于機(jī)器學(xué)習(xí)中的回歸問題。

答案:根據(jù)房屋特性預(yù)測房價(jià)_________屬于有監(jiān)督學(xué)習(xí)(SupervisedLearning)的任務(wù)。

答案:分類問題(Classification)目前人工智能技術(shù),特別是機(jī)器學(xué)習(xí),主要模擬了人的_________思維過程。

答案:學(xué)習(xí)垃圾郵件分類,訓(xùn)練集中每個郵件的標(biāo)簽:1(垃圾)或0(正常),是由人工標(biāo)注的。

答案:對對文本分類,提取的文本特征個數(shù)越多,特征向量維度越高,則分類準(zhǔn)確度就越高。

答案:錯詞袋模型,將不同長度的文本表示成不同長度的向量。

答案:錯分詞工具庫Jieba支持________分詞模式。

答案:全模式;精確模式;搜索引擎模式文本處理中,____任務(wù)將一種自然語言文本自動翻譯成另一種自然語言文本。

答案:機(jī)器翻譯基于詞袋模型進(jìn)行文本數(shù)據(jù)分類時(shí),從句子中提取的最重要的特征量為________。

答案:詞頻在文本處理常見任務(wù)類中,垃圾郵件自動處理應(yīng)歸類于________。

答案:文本分類詞袋模型的主要缺點(diǎn)是________。

答案:只考慮文本中的詞信息,忽略了詞序、語法以及句法信息中文分詞的作用是________。

答案:將中文句子劃分為以詞為單位的詞序列識別文本中包含的情感通常使用________方法處理。

答案:文本分類Keras為建立CNN模型,提供了_______等常用層(layer)。

答案:Conv2D;MaxPooling2D與全連接前饋神經(jīng)網(wǎng)絡(luò)相比,用于圖像分類的卷積神經(jīng)網(wǎng)絡(luò)CNN主要通過________操作來減少網(wǎng)絡(luò)參數(shù)數(shù)量,提高訓(xùn)練效率。

答案:卷積;池化________都是著名的圖像分類深度學(xué)習(xí)模型,用戶可以下載這些預(yù)訓(xùn)練模型直接使用。

答案:VGG19;ResNet50;InceptionV3卷積神經(jīng)網(wǎng)絡(luò)的核心是通過卷積塊自動提取圖像的____。

答案:局部特征圖片“Robot.jpg”為400*372(寬*高)的彩色圖片,下列Python語句輸出為________。fromskimageimportioprint(io.imread("robot.jpg",1).shape)

答案:(372,400)一個4096*2160的RGB24數(shù)字圖像,需要占用存儲空間約為________。

答案:253MB數(shù)字圖像識別采用________建模分析方法實(shí)現(xiàn)。

答案:分類Python在內(nèi)存中使用________來存儲圖像的數(shù)據(jù)。

答案:多維數(shù)組計(jì)算機(jī)數(shù)字圖像,按照顏色和灰度的多少將圖像分為________。

答案:二值圖像、灰度圖像、RGB彩色圖像時(shí)間序列模型的預(yù)測結(jié)果與真實(shí)數(shù)據(jù)通常存的差距,預(yù)測時(shí)間點(diǎn)與原序列時(shí)間點(diǎn)間隔越遠(yuǎn),差距越小。

答案:錯使用普通話的語音素材作為語音庫訓(xùn)練出的語音識別系統(tǒng)能夠識別上海話。

答案:錯時(shí)序數(shù)據(jù)可以采用深度神經(jīng)網(wǎng)絡(luò)模型來建模實(shí)現(xiàn)預(yù)測分析。

答案:對通常時(shí)序數(shù)據(jù)中鄰近的數(shù)據(jù)點(diǎn)之間具有一定的相關(guān)性,而這種相關(guān)性與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論