模式識別基礎復習資料_第1頁
模式識別基礎復習資料_第2頁
模式識別基礎復習資料_第3頁
模式識別基礎復習資料_第4頁
模式識別基礎復習資料_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、模式識別基礎2009秋季模式識別基礎復習資料教師:張學工2009秋季X清華大學 自動化系2009秋季Contents卷一、模式識別機經(jīng)3卷二、20082009秋_模式識別_張學工_期末B4卷三、20072008秋_模式識別_張學工_期末B6卷四、20072008秋_模式識別_張學工_期末A8卷五、20062007秋_模式識別_張學工_期末B9卷六、20052006秋_模式識別_張學工_期末10卷七、20042005秋_模式識別_張學工_期末11卷八、20032004秋_模式識別_張學工_期末12卷九、19992000春_模式識別_張學工_期末13附錄、名詞以及原理

2、15卷一、模式識別機經(jīng) 1.(16分)正態(tài)分布N(0,9)與均勻分布5,10,先驗概率1/2最小錯誤率分類器,并畫圖.最小錯誤率分類器缺點 答:設計最小錯誤率分類器:如果則為反之則為(特別的,當,可以接受為任何一類也可以拒絕。在連續(xù)情況下這種情況幾乎完全不出現(xiàn)。,2畫圖如下,紅色表示(5,10均勻分布的后驗概率),藍色表示(N(0,9)的后驗概率)(注意!圖是錯的作者)(圖是錯的)3最小錯誤分類器有許多局限性。其一,其只考慮到錯誤率的限制,并未考慮到實際情況中不同錯誤的代價等等,為了克服這類局限性,學者們在最小錯誤率之外又設計了最小風險分類器、限定一類錯誤率令另一類錯誤率最小的分類器等;其二,

3、其只能用于監(jiān)督學習,要求已知分類情況,并且要滿足I.I.D條件即樣本與總體分布相符;其三,其要求必須知道先驗概率,許多實際問題的先驗概率是難以得到的。 2.(22分)8個樣品w13個.,w25個.1)最近鄰分類,畫圖2)給兩個點.,問怎么分3)最近鄰分類器線性分類器?4)設計二次曲面分之5)壓縮近鄰法壓縮過程及結果6)壓縮近鄰法分界面并比較1)答:(題目不完整)最近鄰法(k=1),k近鄰(k個最近的點投票),可以考慮加權3.(5分)證明兩個樣品構成得協(xié)方差矩陣一般是奇異的(不可逆的)答:設,從而其第i行j列元素為,表示第m個樣本第n個維度的值。從而這是一個行列式為零的矩陣(第一行除以(),第二

4、行除以之后想減得零,故該協(xié)方差陣是奇異的。 4.(26分)距離不同會有不同結果1)給出兩種你認為重要的距離,如何定義及物理意義2)貝葉斯分類器,近鄰法,fisher投影法,c均值法是否受距離度量影響,不受則說明理由,受,距離說明答:距離可以是任意一種范數(shù),設對點歐幾里得距離(2范數(shù)):每個坐標的絕對值差之和(1范數(shù)):貝葉斯分類器不受、fisher投影法不受:都屬于判別函數(shù)與距離度量無關的,故不受影響,近鄰法,c均值法與受到距離度量的5.(15分)AB玩游戲,A問是非問題,B回答是或非.問1)游戲與模式識別什么內(nèi)容有關系?用模式識別語言描述2)B應如何調(diào)整問題3)如果做成計算機游戲,寫出設計思

5、路,方法,難點,解決方案.游戲受歡迎嗎?為什么?答:?這是一類決策樹問題??梢詫⒚恳粋€是非問題看做一個決策樹節(jié)點,是非答案決定了分支的方向(左或右)。調(diào)整問題應該使得在有效分類的情況下樹深度最淺,就能在單次游戲最壞情況下最快猜出。(我覺得挺2的,應該不會受歡迎。不過可以用作公安局犯罪嫌疑人指認的軟件)6.(6分)自己設計模糊數(shù)學用于模式識別的其他理論方法(除去聚類).寫出思路必要細節(jié).分析可能結果.答:例如k-近鄰法的模糊性質(zhì)。定義隸屬函數(shù)表示屬于類的程度,值域上界為1,表示完全屬于,下界為0,表示完全不屬于,將對任意一個待判定的樣本,選取某個距離度量(如歐幾里得距離)最近的k個已知類別的訓練

6、樣本,從而令得到x對于類的隸屬函數(shù)。7.(10分)專家經(jīng)常根據(jù)特殊筆跡或特殊長相分類.問如何在一個人臉自動識別系統(tǒng)或筆跡自動識別系統(tǒng)中實現(xiàn)人的這一經(jīng)驗.從數(shù)據(jù)預處理,特征提取,選擇分類器設計等角度描述實現(xiàn)這一經(jīng)驗的方法與可能性.優(yōu)點?缺點?答:這是一類特殊的圖像識別問題,可以采用K-L分類卷二、20082009秋_模式識別_張學工_期末B1.(30)簡要介紹下列概念ROC曲線、交叉驗證、似然函數(shù)、特征選擇與提取、推廣能力、隨機森林答:1 ROC曲線(Receiver Operational Characteristic Curve)是以False Positive Rate為橫坐標,True

7、Positive Rate為縱坐標的繪制的曲線,通過改變分點給出對應的FP和TP繪成。曲線的點表示了在敏感度和特殊性之間的平衡,例如越往左,也就是假陽性越小,則真陽性也越小。曲線下方的面積越大,則表示該方法越有利于區(qū)分兩種類別。2 交叉驗證是指交叉驗證(Cross-validation)主要用于建模應用中,在給定的建模樣本中,拿出大部分樣本進行建模型,留小部分樣本用剛建立的模型進行預報,并求這小部分樣本的預報誤差,記錄它們的平方加和。這個過程一直進行,直到所有的樣本都被預報了一次而且僅被預報一次。把每個樣本的預報誤差平方加和,這個數(shù)越小,表示該方法越好3 特征選擇與提?。禾卣魇侵笇κ挛锏挠^測或者某種運算,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論