機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第1頁
機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第2頁
機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第3頁
機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第4頁
機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

機(jī)器學(xué)習(xí)知到章節(jié)測試答案智慧樹2023年最新同濟(jì)大學(xué)第一章測試

回歸和分類都是有監(jiān)督學(xué)習(xí)問題。()

參考答案:

輸出變量為有限個離散變量的預(yù)測問題是回歸問題;輸出變量為連續(xù)變量的預(yù)測問題是分類問題。()

參考答案:

關(guān)于“回歸(Regression)”和“相關(guān)(Correlation)”,下列說法正確的是?注意:x是自變量,y是因變量。()

參考答案:

回歸在x和y之間是非對稱的,相關(guān)在x和y之間是互為對稱的

如果一個經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型在測試集上達(dá)到100%的準(zhǔn)確率,這就意味著該模型將在另外一個新的測試集上也能得到100%的準(zhǔn)確率。()

參考答案:

機(jī)器學(xué)習(xí)學(xué)得的模型適用于新樣本的能力,稱為"泛化"能力,這是針對分類和回歸等監(jiān)督學(xué)習(xí)任務(wù)而言的,與聚類這樣的無監(jiān)督學(xué)習(xí)任務(wù)無關(guān)。()

參考答案:

機(jī)器學(xué)習(xí)時,我們通常假設(shè)樣本空間中的全體樣本都服從某個未知"分布",并且我們獲得的每個樣本都是獨(dú)立地從這個分布上采樣獲得的。()

參考答案:

從歸納偏好一般性原則的角度看,"奧卡姆剃刀"(Occam'srazor)準(zhǔn)則與“大道至簡”說的是相同的道理。()

參考答案:

以下方法或系統(tǒng)屬于"符號主義"(symbolism)學(xué)習(xí)技術(shù)的是()

參考答案:

"概念學(xué)習(xí)系統(tǒng)"

;"基于邏輯的歸納學(xué)習(xí)系統(tǒng)“

;"結(jié)構(gòu)學(xué)習(xí)系統(tǒng)"

以下方法或技術(shù)屬于統(tǒng)計(jì)學(xué)習(xí)范疇的是()

參考答案:

支持向量機(jī)

;核方法

歸納學(xué)習(xí)相當(dāng)于"從樣例中學(xué)習(xí)",即從訓(xùn)練樣例中歸納出學(xué)習(xí)結(jié)果。()

參考答案:

第二章測試

回歸問題和分類問題都有可能發(fā)生過擬合。()

參考答案:

對于k折交叉驗(yàn)證,以下對k的說法正確的是()

參考答案:

k越大,不一定越好,選擇大的k會加大評估時間

;選擇更大的k,就會有更小的bias(因?yàn)橛?xùn)練集更加接近總數(shù)據(jù)集)

;在選擇k時,要最小化數(shù)據(jù)集之間的方差

小明參加Kaggle某項(xiàng)大數(shù)據(jù)競賽,他的成績在大賽排行榜上原本居于前20,后來他保持特征不變,對原來的模型做了1天的調(diào)參,將自己的模型在自己本地測試集上的準(zhǔn)確率提升了3%,然后他信心滿滿地將新模型的預(yù)測結(jié)果更新到了大賽官網(wǎng)上,結(jié)果懊惱地發(fā)現(xiàn)自己的新模型在大賽官方的測試集上準(zhǔn)確率反而下降了。對此,他的朋友們展開了討論,下列說法正確的是()

參考答案:

小明這個有可能是由于過擬合導(dǎo)致的

;小明可以考慮一下,使用交叉驗(yàn)證來驗(yàn)證一下是否發(fā)生了過擬合

下列哪種方法可以用來減小過擬合?()

參考答案:

更多的訓(xùn)練數(shù)據(jù)

;L2正則化

;減小模型的復(fù)雜度

;L1正則化

下列關(guān)于bootstrap說法正確的是?()

參考答案:

從總的N個樣本中,有放回地抽取n個樣本(n<N)

評估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbias),應(yīng)該如何解決?()

參考答案:

增加模型的特征數(shù)量

第三章測試

如果我們說“線性回歸”模型完美地?cái)M合了訓(xùn)練樣本(訓(xùn)練樣本誤差為零),則下面哪個說法是正確的?()

參考答案:

選項(xiàng)中的答案都不對

下列關(guān)于線性回歸分析中的殘差(Residuals)說法正確的是?()

參考答案:

殘差均值總是為零

下列哪些假設(shè)是我們推導(dǎo)線性回歸參數(shù)時遵循的?()

參考答案:

模型誤差在統(tǒng)計(jì)學(xué)上是獨(dú)立的

;X是非隨機(jī)且測量沒有誤差的

;誤差一般服從0均值和固定標(biāo)準(zhǔn)差的正態(tài)分布

;X與Y有線性關(guān)系(多項(xiàng)式關(guān)系)

一般來說,下列哪種方法常用來預(yù)測連續(xù)獨(dú)立變量?()

參考答案:

線性回歸

上圖中哪一種偏移,是我們在最小二乘直線擬合的情況下使用的?圖中橫坐標(biāo)是輸入X,縱坐標(biāo)是輸出Y。()

參考答案:

垂直偏移(verticaloffsets)

加入使用邏輯回歸對樣本進(jìn)行分類,得到訓(xùn)練樣本的準(zhǔn)確率和測試樣本的準(zhǔn)確率。現(xiàn)在,在數(shù)據(jù)中增加一個新的特征,其它特征保持不變。然后重新訓(xùn)練測試。則下列說法正確的是?()

參考答案:

訓(xùn)練樣本準(zhǔn)確率一定增加或保持不變

點(diǎn)擊率預(yù)測是一個正負(fù)樣本不平衡問題(例如99%的沒有點(diǎn)擊,只有1%點(diǎn)擊)。假如在這個非平衡的數(shù)據(jù)集上建立一個模型,得到訓(xùn)練樣本的正確率是99%,則下列說法正確的是?()

參考答案:

模型正確率并不高,應(yīng)該建立更好的模型

第四章測試

在決策樹分割結(jié)點(diǎn)的時候,下列關(guān)于信息增益說法正確的是()

參考答案:

信息增益可以用”1比特-熵”獲得

;如果選擇一個屬性具有許多特征值,那么這個信息增益是有偏差的

如果自變量X和因變量Y之間存在高度的非線性和復(fù)雜關(guān)系,那么樹模型很可能優(yōu)于經(jīng)典回歸方法。()

參考答案:

在決策樹學(xué)習(xí)過程中,用屬性α對樣本集D進(jìn)行劃分所獲得的"信息增益"越大,則意味著使用屬性α來進(jìn)行劃分所獲得的"純度提升"越大。()

參考答案:

對于劃分屬性選擇,以下說法正確的是()

參考答案:

增益率準(zhǔn)則對可取值數(shù)目較少的屬性有所偏好

;信息增益準(zhǔn)則對可取值數(shù)目較多的屬性有所偏好

;C4.5算法并不是直接選擇增益率最大的候選劃分屬性,而是先從候選劃分屬性中找出信息增益高于平均水平的屬性,再從中選擇增益率最高的。

數(shù)據(jù)集D的純度可用它的基尼值來度量,基尼值越小,則數(shù)據(jù)集D的純度越高。()

參考答案:

第五章測試

假定你在神經(jīng)網(wǎng)絡(luò)中的隱藏層中使用激活函數(shù)X。在特定神經(jīng)元給定任意輸入,你會得到輸出-0.01。X可能是以下哪一個激活函數(shù)?()

參考答案:

tanh

在回歸模型中,下列哪一項(xiàng)在權(quán)衡欠擬合(under-fitting)和過擬合(over-fitting)中影響最大?()

參考答案:

多項(xiàng)式階數(shù)

深度神經(jīng)網(wǎng)絡(luò)中常用Relu函數(shù)作為激活函數(shù),其好處是:()

參考答案:

求梯度簡單

;具有稀疏特性

;收斂快

梯度爆炸問題是指在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的時候,梯度變得過大而損失函數(shù)變?yōu)闊o窮。在RNN中,下面哪種方法可以較好地處理梯度爆炸問題?()

參考答案:

梯度裁剪

Dropout技術(shù)在下列哪種神經(jīng)層中將無法發(fā)揮顯著優(yōu)勢?()

參考答案:

RNN層

第六章測試

如果SVM模型欠擬合,以下方法哪些可以改進(jìn)模型()

參考答案:

增大懲罰參數(shù)C的值

在訓(xùn)練完SVM之后,我們可以只保留支持向量,而舍去所有非支持向量,仍然不會影響模型分類能力。()

參考答案:

關(guān)于SVM與感知機(jī),以下說法正確的是:()

參考答案:

感知機(jī)只用于線性分類,SVM可用于線性和非線性分類

;都是用于分類的監(jiān)督學(xué)習(xí)算法

;損失函數(shù)方面,感知機(jī)采用的是誤分類,易造成過擬合,而SVM采用間隔最大化(合頁損失函數(shù)),一定程度上可避免過擬合

;優(yōu)化方法方面,感知機(jī)采用梯度下降法,而SVM采用不等式約束結(jié)合拉格朗日乘子

支持向量機(jī)SVM是結(jié)構(gòu)風(fēng)險(xiǎn)最小化模型,而邏輯回歸LR是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化模型。()

參考答案:

邏輯回歸LR是參數(shù)模型,支持向量機(jī)SVM是非參數(shù)模型。()

參考答案:

關(guān)于SVM如何選用核函數(shù),下列說法正確的是:()

參考答案:

線性核主要用于線性可分以及樣本數(shù)與特征數(shù)差不多的情況

;非線性核主要用于線性不可分以及特征數(shù)較少樣本量一般的情況

;高斯核和tanh核都屬于非線性核,而且高斯核還可以把原始維度映射到無窮多維

第七章測試

下列關(guān)于極大似然估計(jì)(MaximumLikelihoodEstimate,MLE),說法正確的是()

參考答案:

MLE可能并不存在

;如果MLE存在,那么它的解可能不是唯一的

樸素貝葉斯屬于生成式模型,而SVM和決策樹屬于判別式模型。()

參考答案:

樸素貝葉斯分類器有屬性條件獨(dú)立的假設(shè)前提。()

參考答案:

上面三個貝葉斯模型中,屬性之間存在依賴關(guān)系的是:()

參考答案:

(b)

;(c)

關(guān)于貝葉斯網(wǎng)絡(luò),以下說法正確的是:()

參考答案:

貝葉斯網(wǎng)絡(luò)又稱信念網(wǎng)絡(luò)

;貝葉斯網(wǎng)絡(luò)是一種概率圖模型

;貝葉斯網(wǎng)絡(luò)是有向無環(huán)圖模型

第八章測試

下面關(guān)于RandomForest和GradientBoostingTrees說法正確的是?()

參考答案:

兩者都使用隨機(jī)特征子集來創(chuàng)建中間樹

數(shù)據(jù)科學(xué)家經(jīng)常使用多個算法進(jìn)行預(yù)測,并將多個機(jī)器學(xué)習(xí)算法的輸出(稱為“集成學(xué)習(xí)”)結(jié)合起來,以獲得比所有個體模型都更好的更健壯的輸出。則下列說法正確的是?()

參考答案:

基本模型之間相關(guān)性低

以下方法屬于集成學(xué)習(xí)方法的是()

參考答案:

stacking

;bagging

;boosting

如果用“三個臭皮匠頂個諸葛亮”來比喻集成學(xué)習(xí)的話,那么對三個臭皮匠的要求可能是:()

參考答案:

三個臭皮匠不能太差,每個人考試都能及格

;三個臭皮匠的優(yōu)點(diǎn)各不相同

集成學(xué)習(xí)中個體學(xué)習(xí)器的多樣性不宜高,否則容易顧此失彼,降低系統(tǒng)的總體性能。()

參考答案:

第九章測試

向量x=[1,2,3,4,-9,0]的L1范數(shù)是()

參考答案:

19

如何在監(jiān)督式學(xué)習(xí)中使用聚類算法?()

參考答案:

首先,可以創(chuàng)建聚類,然后分別在不同的集群上應(yīng)用監(jiān)督式學(xué)習(xí)算法

;在應(yīng)用監(jiān)督式學(xué)習(xí)算法之前,可以將其類別ID作為特征空間中的一個額外的特征

下列聚類方法屬于原型聚類的是()

參考答案:

K-Means算法

;學(xué)習(xí)向量量化LVQ

;高斯混合聚類

K-Means聚類的主要缺點(diǎn)有:()

參考答案:

K值很難確定

;對于非凸數(shù)據(jù)集或類別規(guī)模差異太大的數(shù)據(jù)效果不好

;對噪音和異常點(diǎn)敏感

;聚類效果依賴于聚類中心的初始化

k均值算法和"學(xué)習(xí)向量量化"都是原型聚類方法,也都屬于無監(jiān)督學(xué)習(xí)方法。()

參考答案:

第十章測試

使用k=1的kNN算法,下圖二分類問題,“+”和“o”分別代表兩個類,那么,用僅拿出一個測試樣本的交叉驗(yàn)證方法,交叉驗(yàn)證的錯誤率是()

參考答案:

100%

下列說法錯誤的是?()

參考答案:

沿負(fù)梯度的方向一定是最優(yōu)的方向

以下哪些方法不可以直接來對文本分類?()

參考答案:

K-Means

下列哪些算法可以用來夠造神經(jīng)網(wǎng)絡(luò)?()

參考答案:

線性回歸

;邏輯回歸

我們想要訓(xùn)練一個ML模型,樣本數(shù)量有100萬個,特征維度是5000,面對如此大數(shù)據(jù),如何有效地訓(xùn)練模型?()

參考答案:

對訓(xùn)練集隨機(jī)采樣,在隨機(jī)采樣的數(shù)據(jù)上建立模型

;使用PCA算法減少特征維度

;嘗試使用在線機(jī)器學(xué)習(xí)算法

上圖中,主成分的最佳數(shù)目是多少?()

參考答案:

30

第十一章測試

關(guān)于L1正則和L2正則下面的說法正確的是()

參考答案:

L2正則化表示各個參數(shù)的平方和的開方值

;L1范數(shù)會使權(quán)值稀疏

關(guān)于特征選擇,下列對Ridge回歸和Lasso回歸說法正確的是?()

參考答案:

Lasso回歸適用于特征選擇

下列哪一種方法的系數(shù)沒有閉式(closed-form)解?()

參考答案:

Lasso

我們希望減少數(shù)據(jù)集中的特征數(shù)量。你可以采取以下哪一個步驟來減少特征?()

參考答案:

使用正向選擇法(ForwardSelection)

;使用反向消除法(BackwardElimination)

;逐步選擇消除法(Stepw

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論