機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)

上傳人：題*** IP屬地：浙江上傳時間：2023-05-17 格式：DOCX 頁數(shù)：21 大小：175.12KB 積分：7.2 舉報(bào) 版權(quán)申訴

機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第2頁

機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第3頁

機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第4頁

機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)_第5頁

已閱讀5頁，還剩16頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

機(jī)器學(xué)習(xí)知到章節(jié)測試答案智慧樹2023年最新同濟(jì)大學(xué)第一章測試

回歸和分類都是有監(jiān)督學(xué)習(xí)問題。（）

參考答案:

對

輸出變量為有限個離散變量的預(yù)測問題是回歸問題；輸出變量為連續(xù)變量的預(yù)測問題是分類問題。（）

參考答案:

錯

關(guān)于“回歸（Regression）”和“相關(guān)（Correlation）”，下列說法正確的是？注意：x是自變量，y是因變量。（）

參考答案:

回歸在x和y之間是非對稱的，相關(guān)在x和y之間是互為對稱的

如果一個經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型在測試集上達(dá)到100%的準(zhǔn)確率，這就意味著該模型將在另外一個新的測試集上也能得到100%的準(zhǔn)確率。（）

參考答案:

錯

機(jī)器學(xué)習(xí)學(xué)得的模型適用于新樣本的能力，稱為"泛化"能力，這是針對分類和回歸等監(jiān)督學(xué)習(xí)任務(wù)而言的，與聚類這樣的無監(jiān)督學(xué)習(xí)任務(wù)無關(guān)。（）

參考答案:

錯

機(jī)器學(xué)習(xí)時，我們通常假設(shè)樣本空間中的全體樣本都服從某個未知"分布"，并且我們獲得的每個樣本都是獨(dú)立地從這個分布上采樣獲得的。（）

參考答案:

對

從歸納偏好一般性原則的角度看，"奧卡姆剃刀"(Occam'srazor)準(zhǔn)則與“大道至簡”說的是相同的道理。（）

參考答案:

對

以下方法或系統(tǒng)屬于"符號主義"(symbolism)學(xué)習(xí)技術(shù)的是（）

參考答案:

"概念學(xué)習(xí)系統(tǒng)"

;"基于邏輯的歸納學(xué)習(xí)系統(tǒng)“

;"結(jié)構(gòu)學(xué)習(xí)系統(tǒng)"

以下方法或技術(shù)屬于統(tǒng)計(jì)學(xué)習(xí)范疇的是（）

參考答案:

支持向量機(jī)

;核方法

歸納學(xué)習(xí)相當(dāng)于"從樣例中學(xué)習(xí)"，即從訓(xùn)練樣例中歸納出學(xué)習(xí)結(jié)果。（）

參考答案:

對

第二章測試

回歸問題和分類問題都有可能發(fā)生過擬合。（）

參考答案:

對

對于k折交叉驗(yàn)證,以下對k的說法正確的是（）

參考答案:

k越大,不一定越好,選擇大的k會加大評估時間

;選擇更大的k,就會有更小的bias(因?yàn)橛?xùn)練集更加接近總數(shù)據(jù)集)

;在選擇k時,要最小化數(shù)據(jù)集之間的方差

小明參加Kaggle某項(xiàng)大數(shù)據(jù)競賽，他的成績在大賽排行榜上原本居于前20，后來他保持特征不變，對原來的模型做了1天的調(diào)參，將自己的模型在自己本地測試集上的準(zhǔn)確率提升了3%，然后他信心滿滿地將新模型的預(yù)測結(jié)果更新到了大賽官網(wǎng)上，結(jié)果懊惱地發(fā)現(xiàn)自己的新模型在大賽官方的測試集上準(zhǔn)確率反而下降了。對此，他的朋友們展開了討論，下列說法正確的是（）

參考答案:

小明這個有可能是由于過擬合導(dǎo)致的

;小明可以考慮一下，使用交叉驗(yàn)證來驗(yàn)證一下是否發(fā)生了過擬合

下列哪種方法可以用來減小過擬合？（）

參考答案:

更多的訓(xùn)練數(shù)據(jù)

;L2正則化

;減小模型的復(fù)雜度

;L1正則化

下列關(guān)于bootstrap說法正確的是？（）

參考答案:

從總的N個樣本中，有放回地抽取n個樣本（n＜N）

評估完模型之后，發(fā)現(xiàn)模型存在高偏差（highbias），應(yīng)該如何解決？（）

參考答案:

增加模型的特征數(shù)量

第三章測試

如果我們說“線性回歸”模型完美地?cái)M合了訓(xùn)練樣本（訓(xùn)練樣本誤差為零），則下面哪個說法是正確的？（）

參考答案:

選項(xiàng)中的答案都不對

下列關(guān)于線性回歸分析中的殘差（Residuals）說法正確的是？（）

參考答案:

殘差均值總是為零

下列哪些假設(shè)是我們推導(dǎo)線性回歸參數(shù)時遵循的？（）

參考答案:

模型誤差在統(tǒng)計(jì)學(xué)上是獨(dú)立的

;X是非隨機(jī)且測量沒有誤差的

;誤差一般服從0均值和固定標(biāo)準(zhǔn)差的正態(tài)分布

;X與Y有線性關(guān)系（多項(xiàng)式關(guān)系）

一般來說，下列哪種方法常用來預(yù)測連續(xù)獨(dú)立變量？（）

參考答案:

線性回歸

上圖中哪一種偏移，是我們在最小二乘直線擬合的情況下使用的？圖中橫坐標(biāo)是輸入X，縱坐標(biāo)是輸出Y。（）

參考答案:

垂直偏移（verticaloffsets）

加入使用邏輯回歸對樣本進(jìn)行分類，得到訓(xùn)練樣本的準(zhǔn)確率和測試樣本的準(zhǔn)確率。現(xiàn)在，在數(shù)據(jù)中增加一個新的特征，其它特征保持不變。然后重新訓(xùn)練測試。則下列說法正確的是？（）

參考答案:

訓(xùn)練樣本準(zhǔn)確率一定增加或保持不變

點(diǎn)擊率預(yù)測是一個正負(fù)樣本不平衡問題（例如99%的沒有點(diǎn)擊，只有1%點(diǎn)擊）。假如在這個非平衡的數(shù)據(jù)集上建立一個模型，得到訓(xùn)練樣本的正確率是99%，則下列說法正確的是？（）

參考答案:

模型正確率并不高，應(yīng)該建立更好的模型

第四章測試

在決策樹分割結(jié)點(diǎn)的時候，下列關(guān)于信息增益說法正確的是（）

參考答案:

信息增益可以用”1比特-熵”獲得

;如果選擇一個屬性具有許多特征值,那么這個信息增益是有偏差的

如果自變量X和因變量Y之間存在高度的非線性和復(fù)雜關(guān)系，那么樹模型很可能優(yōu)于經(jīng)典回歸方法。（）

參考答案:

對

在決策樹學(xué)習(xí)過程中，用屬性α對樣本集D進(jìn)行劃分所獲得的"信息增益"越大，則意味著使用屬性α來進(jìn)行劃分所獲得的"純度提升"越大。（）

參考答案:

對

對于劃分屬性選擇，以下說法正確的是（）

參考答案:

增益率準(zhǔn)則對可取值數(shù)目較少的屬性有所偏好

;信息增益準(zhǔn)則對可取值數(shù)目較多的屬性有所偏好

;C4.5算法并不是直接選擇增益率最大的候選劃分屬性，而是先從候選劃分屬性中找出信息增益高于平均水平的屬性，再從中選擇增益率最高的。

數(shù)據(jù)集D的純度可用它的基尼值來度量，基尼值越小，則數(shù)據(jù)集D的純度越高。（）

參考答案:

對

第五章測試

假定你在神經(jīng)網(wǎng)絡(luò)中的隱藏層中使用激活函數(shù)X。在特定神經(jīng)元給定任意輸入，你會得到輸出-0.01。X可能是以下哪一個激活函數(shù)？（）

參考答案:

tanh

在回歸模型中，下列哪一項(xiàng)在權(quán)衡欠擬合（under-fitting）和過擬合（over-fitting）中影響最大？（）

參考答案:

多項(xiàng)式階數(shù)

深度神經(jīng)網(wǎng)絡(luò)中常用Relu函數(shù)作為激活函數(shù)，其好處是：（）

參考答案:

求梯度簡單

;具有稀疏特性

;收斂快

梯度爆炸問題是指在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的時候，梯度變得過大而損失函數(shù)變?yōu)闊o窮。在RNN中，下面哪種方法可以較好地處理梯度爆炸問題？（）

參考答案:

梯度裁剪

Dropout技術(shù)在下列哪種神經(jīng)層中將無法發(fā)揮顯著優(yōu)勢？（）

參考答案:

RNN層

第六章測試

如果SVM模型欠擬合,以下方法哪些可以改進(jìn)模型（）

參考答案:

增大懲罰參數(shù)C的值

在訓(xùn)練完SVM之后，我們可以只保留支持向量，而舍去所有非支持向量，仍然不會影響模型分類能力。（）

參考答案:

對

關(guān)于SVM與感知機(jī)，以下說法正確的是：（）

參考答案:

感知機(jī)只用于線性分類，SVM可用于線性和非線性分類

;都是用于分類的監(jiān)督學(xué)習(xí)算法

;損失函數(shù)方面，感知機(jī)采用的是誤分類，易造成過擬合，而SVM采用間隔最大化(合頁損失函數(shù))，一定程度上可避免過擬合

;優(yōu)化方法方面，感知機(jī)采用梯度下降法，而SVM采用不等式約束結(jié)合拉格朗日乘子

支持向量機(jī)SVM是結(jié)構(gòu)風(fēng)險(xiǎn)最小化模型，而邏輯回歸LR是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化模型。（）

參考答案:

對

邏輯回歸LR是參數(shù)模型，支持向量機(jī)SVM是非參數(shù)模型。（）

參考答案:

對

關(guān)于SVM如何選用核函數(shù)，下列說法正確的是：（）

參考答案:

線性核主要用于線性可分以及樣本數(shù)與特征數(shù)差不多的情況

;非線性核主要用于線性不可分以及特征數(shù)較少樣本量一般的情況

;高斯核和tanh核都屬于非線性核，而且高斯核還可以把原始維度映射到無窮多維

第七章測試

下列關(guān)于極大似然估計(jì)（MaximumLikelihoodEstimate，MLE），說法正確的是（）

參考答案:

MLE可能并不存在

;如果MLE存在，那么它的解可能不是唯一的

樸素貝葉斯屬于生成式模型，而SVM和決策樹屬于判別式模型。（）

參考答案:

對

樸素貝葉斯分類器有屬性條件獨(dú)立的假設(shè)前提。（）

參考答案:

對

上面三個貝葉斯模型中，屬性之間存在依賴關(guān)系的是：（）

參考答案:

（b）

;（c）

關(guān)于貝葉斯網(wǎng)絡(luò)，以下說法正確的是：（）

參考答案:

貝葉斯網(wǎng)絡(luò)又稱信念網(wǎng)絡(luò)

;貝葉斯網(wǎng)絡(luò)是一種概率圖模型

;貝葉斯網(wǎng)絡(luò)是有向無環(huán)圖模型

第八章測試

下面關(guān)于RandomForest和GradientBoostingTrees說法正確的是？（）

參考答案:

兩者都使用隨機(jī)特征子集來創(chuàng)建中間樹

數(shù)據(jù)科學(xué)家經(jīng)常使用多個算法進(jìn)行預(yù)測，并將多個機(jī)器學(xué)習(xí)算法的輸出（稱為“集成學(xué)習(xí)”）結(jié)合起來，以獲得比所有個體模型都更好的更健壯的輸出。則下列說法正確的是？（）

參考答案:

基本模型之間相關(guān)性低

以下方法屬于集成學(xué)習(xí)方法的是（）

參考答案:

stacking

;bagging

;boosting

如果用“三個臭皮匠頂個諸葛亮”來比喻集成學(xué)習(xí)的話，那么對三個臭皮匠的要求可能是：（）

參考答案:

三個臭皮匠不能太差，每個人考試都能及格

;三個臭皮匠的優(yōu)點(diǎn)各不相同

集成學(xué)習(xí)中個體學(xué)習(xí)器的多樣性不宜高，否則容易顧此失彼，降低系統(tǒng)的總體性能。（）

參考答案:

錯

第九章測試

向量x=[1,2,3,4,-9,0]的L1范數(shù)是（）

參考答案:

如何在監(jiān)督式學(xué)習(xí)中使用聚類算法？（）

參考答案:

首先，可以創(chuàng)建聚類，然后分別在不同的集群上應(yīng)用監(jiān)督式學(xué)習(xí)算法

;在應(yīng)用監(jiān)督式學(xué)習(xí)算法之前，可以將其類別ID作為特征空間中的一個額外的特征

下列聚類方法屬于原型聚類的是（）

參考答案:

K-Means算法

;學(xué)習(xí)向量量化LVQ

;高斯混合聚類

K-Means聚類的主要缺點(diǎn)有：（）

參考答案:

K值很難確定

;對于非凸數(shù)據(jù)集或類別規(guī)模差異太大的數(shù)據(jù)效果不好

;對噪音和異常點(diǎn)敏感

;聚類效果依賴于聚類中心的初始化

k均值算法和"學(xué)習(xí)向量量化"都是原型聚類方法，也都屬于無監(jiān)督學(xué)習(xí)方法。（）

參考答案:

錯

第十章測試

使用k=1的kNN算法,下圖二分類問題,“+”和“o”分別代表兩個類,那么,用僅拿出一個測試樣本的交叉驗(yàn)證方法,交叉驗(yàn)證的錯誤率是（）

參考答案:

100%

下列說法錯誤的是？（）

參考答案:

沿負(fù)梯度的方向一定是最優(yōu)的方向

以下哪些方法不可以直接來對文本分類？（）

參考答案:

K-Means

下列哪些算法可以用來夠造神經(jīng)網(wǎng)絡(luò)？（）

參考答案:

線性回歸

;邏輯回歸

我們想要訓(xùn)練一個ML模型，樣本數(shù)量有100萬個，特征維度是5000，面對如此大數(shù)據(jù)，如何有效地訓(xùn)練模型？（）

參考答案:

對訓(xùn)練集隨機(jī)采樣，在隨機(jī)采樣的數(shù)據(jù)上建立模型

;使用PCA算法減少特征維度

;嘗試使用在線機(jī)器學(xué)習(xí)算法

上圖中，主成分的最佳數(shù)目是多少？（）

參考答案:

第十一章測試

關(guān)于L1正則和L2正則下面的說法正確的是（）

參考答案:

L2正則化表示各個參數(shù)的平方和的開方值

;L1范數(shù)會使權(quán)值稀疏

關(guān)于特征選擇，下列對Ridge回歸和Lasso回歸說法正確的是？（）

參考答案:

Lasso回歸適用于特征選擇

下列哪一種方法的系數(shù)沒有閉式（closed-form）解？（）

參考答案:

Lasso

我們希望減少數(shù)據(jù)集中的特征數(shù)量。你可以采取以下哪一個步驟來減少特征？（）

參考答案:

使用正向選擇法（ForwardSelection）

;使用反向消除法（BackwardElimination）

;逐步選擇消除法（Stepw

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)

文檔簡介

溫馨提示

最新文檔

評論

機(jī)器學(xué)習(xí)知到章節(jié)答案智慧樹2023年同濟(jì)大學(xué)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔