下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精品文檔機器學習第一階段練習題一、選擇題1. 以下三階泰勒展開式錯誤的一項是(B)精品文檔A. ex =1 x2 x32!3!C. sin x=xx33!1 213B. In(1 x) = x x x2 3123D.1 x x x1-x1 21 3分析:In(1 x)二 x- x x2 32. 以下不屬于凸函數(shù)一項的是( D)A. y=-log x B. y=x log xaxC. y=|x| p D. y=e分析:a應該限定取值范圍:a> 1或aw 03. 以下說法錯誤的一項是(C)A. 負梯度方向是使函數(shù)值下降最快的方向B. 當目標函數(shù)是凸函數(shù)時,梯度下降法的解是全局最優(yōu)解C. 梯度
2、下降法比牛頓法收斂速度快D. 擬牛頓法不需要計算 Hesse矩陣分析:牛頓法需要二階求導,梯度下降法只需一階,因此牛頓法比梯度下降法更快收斂4. 一般,k-NN最近鄰方法在(B)的情況下效果較好A.樣本較多但典型性不好B.樣本較少但典型性好C.樣本呈團狀分布D. 樣本呈鏈狀分布分析:k近鄰算法對較多且典型不好的,團狀,鏈狀的樣本不具有太大的優(yōu)勢5. 機器學習中L1正則化和L2正則化的區(qū)別是? ( A)A.使用L1可以得到稀疏的權值,使用L2可以得到平滑的權值B.使用L1可以得到平滑的權值,使用L2可以得到平滑的權值C使用L1可以得到平滑的權值,使用L2可以得到稀疏的權值D使用L1可以得到稀疏的
3、權值,使用L2可以得到稀疏的權值分析:L1正則化偏向于稀疏,它會自動進行特征選擇,去掉一些沒用的特征,也就是將這些特征對應的權重置為 0。L2主要功能是為了防止過擬合,當要求參數(shù)越小時,說明模型越簡單,而模型越簡單則,越趨向于平滑,從而防止過擬合。二、公式推理題1. 請寫出通過條件概率公式和全概率公式推出貝葉斯公式的過程分析:條件概率:P( AB )P( AB )P(A|B)=P(B),P(B|A)(a)全概率:P( A)八 P(A| Bi )P( Bi )i貝葉斯公式:j2. 請寫出正態(tài)分布的概率密度函數(shù)、期望、以及方差1_一小2分析:概率密度函數(shù):f(x)=e 2ff2 , e 0;期望:
4、E(x)= 口;方差:D(x)= < v' 2 n(T四、簡答題1.2. 求函數(shù)f(x)=xx,xR的最小值11分析:令t =xx,兩邊取對數(shù):Int =xlnx,兩邊對t求導:-* t =1 n x x* , tx1令 t' =0 : Inx 1 = 0,那么:x = e,則 t = e e 即為 f(x)最小值。3. 欠擬合和過擬合的原因分別有哪些?如何避免?分析:欠擬合的原因:模型復雜度過低,不能很好的擬合所有的數(shù)據(jù),訓練誤差大;避免欠擬合:增加模型復雜度,如采用高階模型(預測)或者引入更多特征(分類)等。過擬合的原因:模型復雜度過高,訓練數(shù)據(jù)過少,訓練誤差小,測試
5、誤差大;避免過擬合:降低模型復雜度,如加上正則懲罰項,如L1, L2,增加訓練數(shù)據(jù)等。4. 列舉聚類算法有哪些相似性度量準則及公式(至少四個)n分析:曼哈頓距離:d(x,y)=(送 |x _y |P)Pd(x,y )| Xi - yi | ;歐氏距離:i#Jaccard 系數(shù):J( A,B ) = 一B1 ;余弦相似度:aTbcos 0|a| |b| Au B|皮爾森系數(shù):Pxy -;相對熵(K-L 距離):D( p | q) 一 E p( X)logox 5q(x)5. 若要對以下圖案進行聚類分析需要采用哪種聚類方法,簡述理由和該方法步驟分析:該圖案為非凸狀的,因此不能使用基于距離的聚類算法
6、(k-means、k-medoids等),可選擇密度聚類(DBSCA等)、網(wǎng)格聚類(STING等非距離的方法。6.7.簡述UserCF和ItemCF算法的相同點與不同點分析:項目UserCFItemCF性能適用于用戶較少的場合,如果用戶 過多,計算用戶相似度矩陣的代價 交大適用于物品數(shù)明顯小于用戶數(shù)的場合,如果物品 很多,計算物品相似度矩陣的代價交大領域實效性要求高,用戶個性化興趣要 求不咼長尾物品豐富,用戶個性化需求強烈實時性用戶有新行為,不一定需要推薦結用戶有新行為,一定會導致推薦結果的實時變化果立即變化冷啟動在新用戶對少的物品產(chǎn)生行為后, 不能立即對他進行個性化推薦,因 為用戶相似度是離線計算的 新物品上線后一段時間,一旦有用 戶對物品產(chǎn)生行為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025【各行各業(yè)合同協(xié)議模板】【各行各業(yè)合同協(xié)議模板】委托合同(供物業(yè)委托管理用)
- 工程車運輸合同
- 2025年專項法律顧問委托合同常用版(4篇)
- 2025勞動合同法對企業(yè)的影響事務所
- 2025年個人代理人保險代理合同范文(2篇)
- 2025年個人包車合同(2篇)
- 2025關于酒吧轉讓合同范本
- 建設工程合同書
- 2025版小額貸款抵押合同資產(chǎn)評估及報告協(xié)議2篇
- 2025年度個人與公司租賃房屋修繕責任合同4篇
- 五年級上冊寒假作業(yè)答案(人教版)
- 2025年山東浪潮集團限公司招聘25人高頻重點提升(共500題)附帶答案詳解
- 2024年財政部會計法律法規(guī)答題活動題目及答案一
- 2025年江西省港口集團招聘筆試參考題庫含答案解析
- (2024年)中國傳統(tǒng)文化介紹課件
- 液化氣安全檢查及整改方案
- 《冠心病》課件(完整版)
- 2024年云網(wǎng)安全應知應會考試題庫
- 公園保潔服務投標方案
- 光伏電站項目合作開發(fā)合同協(xié)議書三方版
- 2024年秋季新滬教版九年級上冊化學課件 第2章 空氣與水資源第1節(jié) 空氣的組成
評論
0/150
提交評論