版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、人臉識別特征臉方法賈東亞 12346046一、 實驗目的1、學會使用PCA主成分分析法。2、初步了解人臉識別的特征法。3、更熟練地掌握matlab的使用。二、 原理介紹1、 PCA(主成分分析法介紹)引用一個網上的例子。假設有一份對遙控直升機操作員的調查,用x1(i)表示飛行員i的飛行技能,x2(i)表示飛行員i喜歡飛行的程度。通常遙控直升飛機是很難操作的,只有那些非常堅持而且真正喜歡駕駛的人才能熟練操作。所以這兩個屬性x1(i)和x2(i)相關性是非常強的。我們可以假設兩者的關系是按正比關系變化的。如下圖里的任意找的向量u1所示,數據散布在u1兩側,有少許噪聲。 現在我們有兩項數據,是二維的
2、。那么如何將這兩項變量轉變?yōu)橐粋€來描述飛行員呢?由圖中的點的分布可知,如果我們找到一個方向的U,所有的數據點在U的方向上的投影之和最大,那么該U就能表示數據的大致走向。而在垂直于U的方向,各個數據點在該方向的投影相對于在U上的投影如果足夠小,那么我們可以忽略掉各數據在該方向的投影,這樣我們就把二維的數據轉化成了在U方向上的一維數據。為了將u選出來,我們先對數據進行預處理。先求出所有數據的平均值,然后用數據與平均值的偏差代替數據本身。然后對數據歸一化以后,再代替數據本身。而我們求最大的投影和,其實就是求各個數據點在U上的投影距離的方差最大。而XTu就是投影的距離。故我們要求下式的最大值:1mi=
3、1m(x(i)Tu)2=uT(1mi=1mx(i)x(i)T)u按照u是單位向量來最大化上式,就是求1mi=1mx(i)x(i)T 的特征向量。而此式是數據集的協方差矩陣。在實際應用中,我們不止面臨二維的數據。因此不能使用幾何的形式呈現,但原理也是一樣。就是找到一組相互正交的單位向量uk,然后根據貢獻率考慮選擇其中的部分作為考量的維數,這也就實現了數據的降維。三、 實驗步驟1、 將庫里的400張照片分成兩組。一組作為訓練,一組作為庫。每個人的前五張照片作為訓練,后五張作為庫。訓練的照片按照順序的數字重命名。庫的照片名字不變。2、 庫照片處理。 將每一張庫的照片轉化成N維的向量。(庫里的照片是1
4、12*92,故將轉化成的矩陣按列或行展開,就是個10304維的向量)我們稍后要對如此多維的向量用PCA進行降維。然后把這些向量存入一個矩陣里。而我是將這200個向量以列的形式存在了矩陣里。即 Z=1,2,3,4200 將這200個向量的每個元素相加起來求出平均值。再用Z里的每一個向量減去這個平均值得到每個的偏差。 平均值=1200k=1200k,每個向量的偏差k=k- 即最后Z=1,2,3,4200 接下來我們就要針對這些預處理后的數據進行降維。我們要求的N個相互正交的向量就是協方差矩陣ZZT的特征向量,而對應的特征值就是各個向量所占的比重。但是Z是個10304*200的矩陣,那么ZZT就是個
5、10304*10304的矩陣。使用matlab直接求其特征值與特征向量不太實際。所以我們考慮一個簡單的運算方法:協方差矩陣的秩受到訓練圖像的限制:如果有 N 個訓練樣本,則最多有 N 1 個對應非零特征值的特征向量,其他的特征向量對應的特征值都是0。如果訓練樣本的數目比圖像的維數低,則可以通過如下方法簡化主成份的計算。設 Z是預處理圖像的矩陣,每一列對應一個減去均值圖像之后的圖像。則,協方差矩陣為S=TTT ,并且對 S 的特征值分解為Si=TTTi=ii然而,TTT 是一個非常大的矩陣。因此
6、,如果轉而使用如下的特征值分解。TTTui=iui此時,我們發(fā)現如果在等式兩邊乘以T,可得到TTTTui=iTui這就意味著,如果ui是TTT的一個特征向量,則 i=Tui是S 的一個特征向量。我們的庫里有200張112 * 92像素的圖像,則 TTT是一個200*200的矩陣,這就比原先的 10304 * 10304 的協方差矩陣要容易處理許多。需要注意的是,上面的特征向量 i 沒有進行歸一化,如果需要,應該在后面在進行處理。 降維處理。上面的步驟已經求到了所有的特征向量與特征值。而特征值就是各數據點在該特征向量
7、上的方差。跟據PCA,我們要選出占主要比重的特征向量即可,而判定標準就是特征值。 先把方差(特征值)降序排列,并把對應的特征向量也排列好。依次選擇方差,使選出的方差和占所有方差和大約95%左右。然后選擇對應的特征向量。其余的特征向量與特征值可以拋棄不用了。這就完成了降維。(中一共有200個不為零的方差(特征值) 歸一化處理。數據歸一化處理是數據挖掘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到數據分析的結果,為了消除指標之間的量綱影響,需要進行數據標準化處理,以解決數據指標之間的可比性。原始數據經過數據標準化處理后,各指標處于同一數量級,適合進行綜合對比評價。 我
8、使用的是Z-score法。經過處理得數據符合標準正態(tài)分布,即均值為0,標準差為1,轉化函數為x*=x-其中為所有數據的均值,為所有樣本數據的標準差。在里求得的特征值就是方差。所以我們要用1k乘上每一個對應的特征向量。本來這個歸一化處理應該放在第一步的數據預處理那里。但由于那里的計算還沒有涉及到協方差矩陣,而我們需要的方差在后面才出現,故把歸一化處理放在這里。即中,i=1iTui這些特征向量都是10304*1的大小,跟我們一開始處理后的照片向量的大小一樣。這些就是特征臉。特征臉可以線性組合成所有庫里的臉。 用特征臉對庫里的臉進行標示,也就是將庫里的每張臉圖數據轉化成各個特征臉所占的比重。即 k=
9、kTi,i=1,2,3200,k=1,2,3n,n是最后選出的方差數量iT=1,2,3,4n 人臉識別。先對訓練的臉圖進行預處理。預處理即中所說的求偏差。求到訓練圖的偏差向量后,如那樣用特征臉對訓練圖進行標示。即求得*T=1,2,3,4n然后求*T與iT的歐式距離,此距離表明兩圖的接近度。即=*T-iT2該距離越小,則這兩張圖越接近,則越有可能是同一個人。四、 編程實現代碼:函數:zz,y,tzl=circ(),對庫圖像的處理,并求出處理訓練圖像需要的特征臉和數據平均值。函數:ws=ld(zz,y,tzl) 這三個自變量都是上面的函數的輸出變量。Ws是200張訓練人臉識別的正確性。運行結果:2
10、00張訓練圖片的識別率為91.5%加了顯示代碼后顯示的圖片結果:五、 實驗總結收獲:這次實驗讓我更加熟練地應用了matlab。對矩陣的運算也理解地更加的透徹。學習了PCA主成分分析法,這個方法在分析較多的數據時是非常有用的。在如今的大數據時代,PCA是個非常實用的分析手段。這次在做實驗的過程中,上網查閱了許多關于人臉識別的資料,發(fā)覺雖然自己完成了初步的人臉識別的功能,但遠遠沒有達到現實生活的需求。我們做實驗的orl庫的像素不僅非常低,而且每張人臉的位置與大小也非常接近,這都大大降低了難度。這個方向還有著許多可學習的東西。實驗中遇到的難題:一開始最難理解的莫過于特征臉法的原理。原理中涉及到許多的線性代數知識,需要花時間去回
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 文學社組社方案及招生簡章范文
- 現代企業(yè)財務管理的全球化視角
- 全鋼爬架施工方案
- 汽車行業(yè)的品牌競爭戰(zhàn)略分析
- 國慶節(jié)小吃店鋪活動方案
- 國慶節(jié)手工干貨活動方案
- 12《富起來到強起來》第一課時說課稿-2023-2024學年道德與法治五年級下冊統編版001
- 2023六年級英語上冊 Unit 3 Winter in canada Lesson 14 Snow!It's Winter說課稿 冀教版(三起)
- 2024-2025學年新教材高中物理 第三章 恒定電流 第3節(jié) 測量金屬絲的電阻率說課稿 粵教版必修3
- 2024秋七年級數學上冊 第3章 一次方程與方程組3.4 二元一次方程組的應用 2列二元一次方程組解實際應用(一)說課稿(新版)滬科版
- 2025-2030年中國電動高爾夫球車市場運行狀況及未來發(fā)展趨勢分析報告
- 河南省濮陽市2024-2025學年高一上學期1月期末考試語文試題(含答案)
- 2024年湖南高速鐵路職業(yè)技術學院單招職業(yè)適應性測試題庫及答案解析
- 安全事故案例圖片(76張)課件
- 預應力錨索施工方案
- 豇豆生產技術規(guī)程
- 奢侈品管理概論完整版教學課件全書電子講義(最新)
- 文藝美學課件
- 中藥炮制學教材
- 常見腫瘤AJCC分期手冊第八版(中文版)
- 電氣第一種第二種工作票講解pptx課件
評論
0/150
提交評論