版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
機(jī)器學(xué)習(xí)知到章節(jié)測試答案智慧樹2023年最新同濟(jì)大學(xué)第一章測試
回歸和分類都是有監(jiān)督學(xué)習(xí)問題。()
參考答案:
對
輸出變量為有限個離散變量的預(yù)測問題是回歸問題;輸出變量為連續(xù)變量的預(yù)測問題是分類問題。()
參考答案:
錯
關(guān)于“回歸(Regression)”和“相關(guān)(Correlation)”,下列說法正確的是?注意:x是自變量,y是因變量。()
參考答案:
回歸在x和y之間是非對稱的,相關(guān)在x和y之間是互為對稱的
如果一個經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型在測試集上達(dá)到100%的準(zhǔn)確率,這就意味著該模型將在另外一個新的測試集上也能得到100%的準(zhǔn)確率。()
參考答案:
錯
機(jī)器學(xué)習(xí)學(xué)得的模型適用于新樣本的能力,稱為"泛化"能力,這是針對分類和回歸等監(jiān)督學(xué)習(xí)任務(wù)而言的,與聚類這樣的無監(jiān)督學(xué)習(xí)任務(wù)無關(guān)。()
參考答案:
錯
機(jī)器學(xué)習(xí)時,我們通常假設(shè)樣本空間中的全體樣本都服從某個未知"分布",并且我們獲得的每個樣本都是獨(dú)立地從這個分布上采樣獲得的。()
參考答案:
對
從歸納偏好一般性原則的角度看,"奧卡姆剃刀"(Occam'srazor)準(zhǔn)則與“大道至簡”說的是相同的道理。()
參考答案:
對
以下方法或系統(tǒng)屬于"符號主義"(symbolism)學(xué)習(xí)技術(shù)的是()
參考答案:
"概念學(xué)習(xí)系統(tǒng)"
;"基于邏輯的歸納學(xué)習(xí)系統(tǒng)“
;"結(jié)構(gòu)學(xué)習(xí)系統(tǒng)"
以下方法或技術(shù)屬于統(tǒng)計(jì)學(xué)習(xí)范疇的是()
參考答案:
支持向量機(jī)
;核方法
歸納學(xué)習(xí)相當(dāng)于"從樣例中學(xué)習(xí)",即從訓(xùn)練樣例中歸納出學(xué)習(xí)結(jié)果。()
參考答案:
對
第二章測試
回歸問題和分類問題都有可能發(fā)生過擬合。()
參考答案:
對
對于k折交叉驗(yàn)證,以下對k的說法正確的是()
參考答案:
k越大,不一定越好,選擇大的k會加大評估時間
;選擇更大的k,就會有更小的bias(因?yàn)橛?xùn)練集更加接近總數(shù)據(jù)集)
;在選擇k時,要最小化數(shù)據(jù)集之間的方差
小明參加Kaggle某項(xiàng)大數(shù)據(jù)競賽,他的成績在大賽排行榜上原本居于前20,后來他保持特征不變,對原來的模型做了1天的調(diào)參,將自己的模型在自己本地測試集上的準(zhǔn)確率提升了3%,然后他信心滿滿地將新模型的預(yù)測結(jié)果更新到了大賽官網(wǎng)上,結(jié)果懊惱地發(fā)現(xiàn)自己的新模型在大賽官方的測試集上準(zhǔn)確率反而下降了。對此,他的朋友們展開了討論,下列說法正確的是()
參考答案:
小明這個有可能是由于過擬合導(dǎo)致的
;小明可以考慮一下,使用交叉驗(yàn)證來驗(yàn)證一下是否發(fā)生了過擬合
下列哪種方法可以用來減小過擬合?()
參考答案:
更多的訓(xùn)練數(shù)據(jù)
;L2正則化
;減小模型的復(fù)雜度
;L1正則化
下列關(guān)于bootstrap說法正確的是?()
參考答案:
從總的N個樣本中,有放回地抽取n個樣本(n<N)
評估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbias),應(yīng)該如何解決?()
參考答案:
增加模型的特征數(shù)量
第三章測試
如果我們說“線性回歸”模型完美地?cái)M合了訓(xùn)練樣本(訓(xùn)練樣本誤差為零),則下面哪個說法是正確的?()
參考答案:
選項(xiàng)中的答案都不對
下列關(guān)于線性回歸分析中的殘差(Residuals)說法正確的是?()
參考答案:
殘差均值總是為零
下列哪些假設(shè)是我們推導(dǎo)線性回歸參數(shù)時遵循的?()
參考答案:
模型誤差在統(tǒng)計(jì)學(xué)上是獨(dú)立的
;X是非隨機(jī)且測量沒有誤差的
;誤差一般服從0均值和固定標(biāo)準(zhǔn)差的正態(tài)分布
;X與Y有線性關(guān)系(多項(xiàng)式關(guān)系)
一般來說,下列哪種方法常用來預(yù)測連續(xù)獨(dú)立變量?()
參考答案:
線性回歸
上圖中哪一種偏移,是我們在最小二乘直線擬合的情況下使用的?圖中橫坐標(biāo)是輸入X,縱坐標(biāo)是輸出Y。()
參考答案:
垂直偏移(verticaloffsets)
加入使用邏輯回歸對樣本進(jìn)行分類,得到訓(xùn)練樣本的準(zhǔn)確率和測試樣本的準(zhǔn)確率。現(xiàn)在,在數(shù)據(jù)中增加一個新的特征,其它特征保持不變。然后重新訓(xùn)練測試。則下列說法正確的是?()
參考答案:
訓(xùn)練樣本準(zhǔn)確率一定增加或保持不變
點(diǎn)擊率預(yù)測是一個正負(fù)樣本不平衡問題(例如99%的沒有點(diǎn)擊,只有1%點(diǎn)擊)。假如在這個非平衡的數(shù)據(jù)集上建立一個模型,得到訓(xùn)練樣本的正確率是99%,則下列說法正確的是?()
參考答案:
模型正確率并不高,應(yīng)該建立更好的模型
第四章測試
在決策樹分割結(jié)點(diǎn)的時候,下列關(guān)于信息增益說法正確的是()
參考答案:
信息增益可以用”1比特-熵”獲得
;如果選擇一個屬性具有許多特征值,那么這個信息增益是有偏差的
如果自變量X和因變量Y之間存在高度的非線性和復(fù)雜關(guān)系,那么樹模型很可能優(yōu)于經(jīng)典回歸方法。()
參考答案:
對
在決策樹學(xué)習(xí)過程中,用屬性α對樣本集D進(jìn)行劃分所獲得的"信息增益"越大,則意味著使用屬性α來進(jìn)行劃分所獲得的"純度提升"越大。()
參考答案:
對
對于劃分屬性選擇,以下說法正確的是()
參考答案:
增益率準(zhǔn)則對可取值數(shù)目較少的屬性有所偏好
;信息增益準(zhǔn)則對可取值數(shù)目較多的屬性有所偏好
;C4.5算法并不是直接選擇增益率最大的候選劃分屬性,而是先從候選劃分屬性中找出信息增益高于平均水平的屬性,再從中選擇增益率最高的。
數(shù)據(jù)集D的純度可用它的基尼值來度量,基尼值越小,則數(shù)據(jù)集D的純度越高。()
參考答案:
對
第五章測試
假定你在神經(jīng)網(wǎng)絡(luò)中的隱藏層中使用激活函數(shù)X。在特定神經(jīng)元給定任意輸入,你會得到輸出-0.01。X可能是以下哪一個激活函數(shù)?()
參考答案:
tanh
在回歸模型中,下列哪一項(xiàng)在權(quán)衡欠擬合(under-fitting)和過擬合(over-fitting)中影響最大?()
參考答案:
多項(xiàng)式階數(shù)
深度神經(jīng)網(wǎng)絡(luò)中常用Relu函數(shù)作為激活函數(shù),其好處是:()
參考答案:
求梯度簡單
;具有稀疏特性
;收斂快
梯度爆炸問題是指在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的時候,梯度變得過大而損失函數(shù)變?yōu)闊o窮。在RNN中,下面哪種方法可以較好地處理梯度爆炸問題?()
參考答案:
梯度裁剪
Dropout技術(shù)在下列哪種神經(jīng)層中將無法發(fā)揮顯著優(yōu)勢?()
參考答案:
RNN層
第六章測試
如果SVM模型欠擬合,以下方法哪些可以改進(jìn)模型()
參考答案:
增大懲罰參數(shù)C的值
在訓(xùn)練完SVM之后,我們可以只保留支持向量,而舍去所有非支持向量,仍然不會影響模型分類能力。()
參考答案:
對
關(guān)于SVM與感知機(jī),以下說法正確的是:()
參考答案:
感知機(jī)只用于線性分類,SVM可用于線性和非線性分類
;都是用于分類的監(jiān)督學(xué)習(xí)算法
;損失函數(shù)方面,感知機(jī)采用的是誤分類,易造成過擬合,而SVM采用間隔最大化(合頁損失函數(shù)),一定程度上可避免過擬合
;優(yōu)化方法方面,感知機(jī)采用梯度下降法,而SVM采用不等式約束結(jié)合拉格朗日乘子
支持向量機(jī)SVM是結(jié)構(gòu)風(fēng)險(xiǎn)最小化模型,而邏輯回歸LR是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化模型。()
參考答案:
對
邏輯回歸LR是參數(shù)模型,支持向量機(jī)SVM是非參數(shù)模型。()
參考答案:
對
關(guān)于SVM如何選用核函數(shù),下列說法正確的是:()
參考答案:
線性核主要用于線性可分以及樣本數(shù)與特征數(shù)差不多的情況
;非線性核主要用于線性不可分以及特征數(shù)較少樣本量一般的情況
;高斯核和tanh核都屬于非線性核,而且高斯核還可以把原始維度映射到無窮多維
第七章測試
下列關(guān)于極大似然估計(jì)(MaximumLikelihoodEstimate,MLE),說法正確的是()
參考答案:
MLE可能并不存在
;如果MLE存在,那么它的解可能不是唯一的
樸素貝葉斯屬于生成式模型,而SVM和決策樹屬于判別式模型。()
參考答案:
對
樸素貝葉斯分類器有屬性條件獨(dú)立的假設(shè)前提。()
參考答案:
對
上面三個貝葉斯模型中,屬性之間存在依賴關(guān)系的是:()
參考答案:
(b)
;(c)
關(guān)于貝葉斯網(wǎng)絡(luò),以下說法正確的是:()
參考答案:
貝葉斯網(wǎng)絡(luò)又稱信念網(wǎng)絡(luò)
;貝葉斯網(wǎng)絡(luò)是一種概率圖模型
;貝葉斯網(wǎng)絡(luò)是有向無環(huán)圖模型
第八章測試
下面關(guān)于RandomForest和GradientBoostingTrees說法正確的是?()
參考答案:
兩者都使用隨機(jī)特征子集來創(chuàng)建中間樹
數(shù)據(jù)科學(xué)家經(jīng)常使用多個算法進(jìn)行預(yù)測,并將多個機(jī)器學(xué)習(xí)算法的輸出(稱為“集成學(xué)習(xí)”)結(jié)合起來,以獲得比所有個體模型都更好的更健壯的輸出。則下列說法正確的是?()
參考答案:
基本模型之間相關(guān)性低
以下方法屬于集成學(xué)習(xí)方法的是()
參考答案:
stacking
;bagging
;boosting
如果用“三個臭皮匠頂個諸葛亮”來比喻集成學(xué)習(xí)的話,那么對三個臭皮匠的要求可能是:()
參考答案:
三個臭皮匠不能太差,每個人考試都能及格
;三個臭皮匠的優(yōu)點(diǎn)各不相同
集成學(xué)習(xí)中個體學(xué)習(xí)器的多樣性不宜高,否則容易顧此失彼,降低系統(tǒng)的總體性能。()
參考答案:
錯
第九章測試
向量x=[1,2,3,4,-9,0]的L1范數(shù)是()
參考答案:
19
如何在監(jiān)督式學(xué)習(xí)中使用聚類算法?()
參考答案:
首先,可以創(chuàng)建聚類,然后分別在不同的集群上應(yīng)用監(jiān)督式學(xué)習(xí)算法
;在應(yīng)用監(jiān)督式學(xué)習(xí)算法之前,可以將其類別ID作為特征空間中的一個額外的特征
下列聚類方法屬于原型聚類的是()
參考答案:
K-Means算法
;學(xué)習(xí)向量量化LVQ
;高斯混合聚類
K-Means聚類的主要缺點(diǎn)有:()
參考答案:
K值很難確定
;對于非凸數(shù)據(jù)集或類別規(guī)模差異太大的數(shù)據(jù)效果不好
;對噪音和異常點(diǎn)敏感
;聚類效果依賴于聚類中心的初始化
k均值算法和"學(xué)習(xí)向量量化"都是原型聚類方法,也都屬于無監(jiān)督學(xué)習(xí)方法。()
參考答案:
錯
第十章測試
使用k=1的kNN算法,下圖二分類問題,“+”和“o”分別代表兩個類,那么,用僅拿出一個測試樣本的交叉驗(yàn)證方法,交叉驗(yàn)證的錯誤率是()
參考答案:
100%
下列說法錯誤的是?()
參考答案:
沿負(fù)梯度的方向一定是最優(yōu)的方向
以下哪些方法不可以直接來對文本分類?()
參考答案:
K-Means
下列哪些算法可以用來夠造神經(jīng)網(wǎng)絡(luò)?()
參考答案:
線性回歸
;邏輯回歸
我們想要訓(xùn)練一個ML模型,樣本數(shù)量有100萬個,特征維度是5000,面對如此大數(shù)據(jù),如何有效地訓(xùn)練模型?()
參考答案:
對訓(xùn)練集隨機(jī)采樣,在隨機(jī)采樣的數(shù)據(jù)上建立模型
;使用PCA算法減少特征維度
;嘗試使用在線機(jī)器學(xué)習(xí)算法
上圖中,主成分的最佳數(shù)目是多少?()
參考答案:
30
第十一章測試
關(guān)于L1正則和L2正則下面的說法正確的是()
參考答案:
L2正則化表示各個參數(shù)的平方和的開方值
;L1范數(shù)會使權(quán)值稀疏
關(guān)于特征選擇,下列對Ridge回歸和Lasso回歸說法正確的是?()
參考答案:
Lasso回歸適用于特征選擇
下列哪一種方法的系數(shù)沒有閉式(closed-form)解?()
參考答案:
Lasso
我們希望減少數(shù)據(jù)集中的特征數(shù)量。你可以采取以下哪一個步驟來減少特征?()
參考答案:
使用正向選擇法(ForwardSelection)
;使用反向消除法(BackwardElimination)
;逐步選擇消除法(Stepw
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年新媒體運(yùn)營兼職內(nèi)容創(chuàng)作者聘用合同3篇
- 二零二五版國際物流運(yùn)輸服務(wù)電子合同風(fēng)險(xiǎn)評估與管理3篇
- 西安歐亞學(xué)院《鉆井液工藝原理》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年度廚師團(tuán)隊(duì)培訓(xùn)與績效評估合同3篇
- 武漢大學(xué)《鋼琴與伴奏》2023-2024學(xué)年第一學(xué)期期末試卷
- 二零二五版人工智能教育合資協(xié)議范本3篇
- 二零二五版建筑行業(yè)工人薪資保障合同范本2篇
- 二零二五年度冷鏈物流車隊(duì)運(yùn)輸合作協(xié)議3篇
- 2024版砌體工程建筑承包合同細(xì)則版B版
- 二零二五年知識產(chǎn)權(quán)侵權(quán)糾紛調(diào)解與法律咨詢協(xié)議3篇
- 人教版小學(xué)英語各冊單詞表(帶英標(biāo))
- 廣東省潮州市潮安區(qū)2023-2024學(xué)年六年級上學(xué)期期末考試數(shù)學(xué)試題
- SONY索尼數(shù)碼照相機(jī)DSC-HX200使用說明書
- 電子電工實(shí)驗(yàn)室項(xiàng)目可行性研究報(bào)告
- 2024中國保險(xiǎn)發(fā)展報(bào)告-中南大風(fēng)險(xiǎn)管理研究中心.燕道數(shù)科
- 醫(yī)院突發(fā)事件應(yīng)急預(yù)案工作總結(jié)
- 《海底電力電纜輸電工程施工及驗(yàn)收規(guī)范》
- (試題)考試護(hù)理應(yīng)急預(yù)案題庫與答案
- 【閱讀提升】部編版語文五年級下冊第一單元閱讀要素解析 類文閱讀課外閱讀過關(guān)(含答案)
- 鄉(xiāng)村治理中正式制度與非正式制度的關(guān)系解析
- 園區(qū)招商引資方案提成方案
評論
0/150
提交評論