基于魯棒協(xié)作表示的人臉識別算法_第1頁
基于魯棒協(xié)作表示的人臉識別算法_第2頁
基于魯棒協(xié)作表示的人臉識別算法_第3頁
基于魯棒協(xié)作表示的人臉識別算法_第4頁
基于魯棒協(xié)作表示的人臉識別算法_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于魯棒協(xié)作表示的人臉識別算法

在過去的20年中,人臉識別被廣泛研究為計算機視覺和模式識別領(lǐng)域中最具挑戰(zhàn)的問題之一。許多人臉識別方法如特征臉、費歇爾臉和拉普拉斯臉相繼提出。最近,文獻(xiàn)將稀疏編碼應(yīng)用于人臉識別,提出基于稀疏表示的分類(SRC)方法,表現(xiàn)出較好的魯棒性,能夠在人臉處于遮擋的情況下取得很好的識別效果,然而編碼向量的L1范數(shù)稀疏約束使SRC計算復(fù)雜度很高。文獻(xiàn)[7,8]發(fā)現(xiàn)是協(xié)作表示而不是L1范數(shù)稀疏約束使SRC成功適用于人臉識別,并提出基于協(xié)作表示的分類方法用于人臉識別,獲得了相似于SRC的識別率,但計算復(fù)雜度低很多。文獻(xiàn)[9,10]提出魯棒稀疏編碼(RSC)來尋求稀疏編碼問題的最大似然估計解,對遮擋的人臉識別具有比SRC更強的魯棒性,用迭代重加權(quán)稀疏編碼算法來解決RSC模型。在RSC模型中,用L1范數(shù)來約束編碼向量,而L1范數(shù)約束卻使RSC計算復(fù)雜度很高。受到協(xié)作表示而不是L1范數(shù)稀疏約束使SRC成功適用于人臉識別的啟發(fā),本文提出一種魯棒協(xié)作表示(RCR)的人臉識別算法。與RSC相似,RCR也是尋求稀疏編碼問題的最大似然估計解,用迭代重加權(quán)協(xié)作表示算法來解決RCR模型,擁有RSC相似的識別率,但計算復(fù)雜度低很多。1薄編碼,如魯棒1.1羅馬法中的稀疏編碼模型稀疏編碼模型等價于LASSO問題,可用式(1)表示:其中:σ>0是一個常數(shù);y=[y1;y2;…;yn]∈Rn是一個測試樣本;α是測試樣本y的編碼向量;D=[d1,d2,…,dm]∈Rn×m是包含m個訓(xùn)練樣本的字典,列向量dj表示一個訓(xùn)練樣本,n表示訓(xùn)練樣本的維數(shù)。式(1)中的稀疏編碼問題實質(zhì)是稀疏約束最小二乘估計問題,當(dāng)余項e=y-Dα服從高斯分布時,最小二乘解就是最大似然解。如果余項e服從拉普拉斯分布,那么最大似然解將是然而實際上,余項e的分布可能偏離高斯分布或者拉普拉斯分布,特別是人臉處于遮擋情況下,因此,式(1)和(2)的稀疏編碼模型對人臉表示不太具有魯棒性和有效性。為了構(gòu)建一種魯棒的稀疏編碼模型,尋求編碼系數(shù)的最大似然解。將字典D改寫為D=[t1;t2;…;tn],行向量ti是D的第i行元素。余項e=y-Dα=[e1;e2;…;en],余項e的每個元素ei=yitiα,i=1,2,…,n。假設(shè)e1,e2,…,en獨立同分布,其概率密度函數(shù)設(shè)為fθ(ei),θ是參數(shù)設(shè)置,表征分布的特點。沒有考慮編碼向量α的稀疏約束,余項e的似然函數(shù)表示為在式(3)中,最大似然估計的目標(biāo)是最大化該式的似然函數(shù),或者最小化式(4)的目標(biāo)函數(shù):其中:ρθ(ei)=-lnfθ(ei)。當(dāng)考慮編碼向量α的稀疏約束時,α的最大似然估計,即魯棒稀疏編碼(RSC)可用式(5)表示:從式(5)中可以看出,RSC模型實質(zhì)是稀疏約束最大似然估計問題,是一般的稀疏編碼模型。式(1)和(2)的余項e分別服從高斯分布或者拉普拉斯分布,因此它們的稀疏編碼模型是RSC模型的特殊事例。不直接決定ρθ來解式(5),相反,將式(5)中的最小化問題轉(zhuǎn)換為迭代重加權(quán)稀疏編碼問題,權(quán)值有清晰的物理意義,比如異常的像素被分配較低的權(quán)值。迭代計算權(quán)值,RSC的最大似然估計能被有效地求出。1.2基于角元素的lasso選擇相似于SVM的hingeloss函數(shù)作為加權(quán)函數(shù):其中:μ和δ是正的標(biāo)量,μ控制從1到0的下降率,δ控制劃界點的位置。式(5)的RSC模型可用式(7)表示:其中:W是對角權(quán)值陣,其對角元素是根據(jù)式(6)(8)和令ρθ(0)=0,可以得到式(7)反映的是加權(quán)的LASSO問題,因為Wii是一個非負(fù)的標(biāo)量,所以加權(quán)的LASSO在迭代過程中總是凸的問題,可以用L1LS最小化方法來解決,計算復(fù)雜度比較高。W是對角權(quán)值陣,具有明確的物理意義,其對角元素Wii是分配給測試樣本y每個像素的權(quán)值。人臉識別時,異常的像素如受遮擋的像素,將被分配較低的權(quán)值,以降低它們對稀疏編碼的影響。通過不斷迭代更新權(quán)值矩陣W,直到收斂,實現(xiàn)對測試樣本y的分類:其中:Wfinal是最后的權(quán)值矩陣W;Di是第i類訓(xùn)練樣本構(gòu)成的矩陣;是測試樣本y相對于第i類訓(xùn)練樣本Di的稀疏編碼系數(shù)向量。2求解稀疏系數(shù)向量用迭代重加權(quán)稀疏編碼算法解決RSC模型,然而它需要超過10次迭代才收斂。在每次迭代過程中,求解式(7)計算復(fù)雜度很高,原因是稀疏編碼向量的L1范數(shù)約束。為了降低計算復(fù)雜度和保持相似的識別率,本文提出魯棒協(xié)作表示(RCR)算法用于人臉識別。為了用訓(xùn)練樣本集D協(xié)作表示測試樣本y,使用規(guī)則化的最小二乘方法,即有其中:λ是規(guī)則化參數(shù)。L2范數(shù)規(guī)則化項‖α‖2具有二重性,首先,它使最小二乘解穩(wěn)定,特別是當(dāng)矩陣D欠定時;然后,它使編碼系數(shù)向量具有一定的稀疏性,但是稀疏性要比L1規(guī)則化弱??梢匀菀椎赝茖?dǎo)出式(11)的解,即有令P=(DTD+λ·I)-1DT,P獨立于y,能被預(yù)先計算出作為投影矩陣。當(dāng)測試樣本y到來時,可以簡單地將它投影到P,通過計算Py得到編碼向量,因此計算速度很快。類似地,對于式(7),可用W1/2D協(xié)作表示W(wǎng)1/2y,如式(13)所示。RCR算法步驟如下:輸入:單位L2范數(shù)化的測試樣本y和字典D的每列;,l是訓(xùn)練樣本的個數(shù)。輸出:α。從t=1開始:a)計算余項e(t)=y-Dα(t)。c)加權(quán)協(xié)作表示:,W(t)是估計對角權(quán)值陣,W(iit)=ωθ(ei(t))。如果t>1,則其中0<β(t)<1,β(t)是步長,在[01]范圍內(nèi)通過標(biāo)準(zhǔn)線搜索方法得到,使∑in=1ρθ(e(t))<∑in=1ρθ(e(t-1))。f)轉(zhuǎn)回到步驟a),直到滿足收斂條件式(15)或者達(dá)到最大迭代數(shù)。g)輸出測試樣本y的類別:其中:Wfinal是最后的權(quán)值矩陣W;Di是第i類訓(xùn)練樣本構(gòu)成的矩陣;是測試樣本y相對于第i類訓(xùn)練樣本Di的稀疏編碼系數(shù)向量。當(dāng)相鄰迭代之間的權(quán)值差很小時,認(rèn)為收斂就達(dá)到了。具體地,停止迭代,如果滿足式(15):其中:ε是很小的正數(shù)標(biāo)量。3人臉圖像中異常像素的計算復(fù)雜度SRC具有計算復(fù)雜度O(n2m1.5),其中n是人臉特征維數(shù),m是字典中的元素個數(shù)。而用L1最小化方法,如L1LS去解SRC的經(jīng)驗計算復(fù)雜度是O(n2m1.3)。RSC的計算復(fù)雜度是O(kn2m1.3),k是迭代數(shù),k的大小依賴于人臉圖像中異常像素的多少。當(dāng)人臉圖像中只有一小部分異常像素時,RSC只需兩步迭代就可以收斂。如果人臉圖像中有較大部分異常像素,如受遮擋時,RSC可能需要10步迭代才收斂。另外,在迭代時,可以去除權(quán)值很小的像素yi,因為權(quán)值很小說明該像素是異常的,RSC的計算復(fù)雜度會很快下降。比如在人臉處于遮擋的AR人臉庫實驗時,30%的像素在平均一步迭代中去除。通過交替梯度方法求解式(14),其計算復(fù)雜度是O(k1nm),其中k1是交替梯度方法的迭代數(shù)。RCR的計算復(fù)雜度是O(tk1nm),其中t迭代是用來更新W的。分析可見,RCR的計算復(fù)雜度比SRC和RSC都要低很多。4算法性能比較實驗在本章中,為了檢驗RCR的算法有效性,將它與其他算法在人臉被固定遮擋的AR人臉庫上進(jìn)行算法性能比較實驗,與在人臉被隨機遮擋的ExtendedYaleB人臉庫上進(jìn)行算法性能比較實驗。在實驗中,λ大小設(shè)為0.001。實驗平臺為MAT-LAB2009a,雙核奔騰處理器,主頻是3.0GHz,內(nèi)存是2GB。4.1ar人臉庫測試在本節(jié)中,將測試RCR對固定遮擋的人臉識別的魯棒性,AR人臉庫中的一個子集用于實驗,該子集包含100個人的2599幅圖像,每個人大約26幅圖像,有50個男性和50個女性。實驗前,每幅圖像大小都調(diào)整為42×30。在子集的第1期和第2期中,具有表情變化的799幅圖像,平均每人有8幅圖像作為訓(xùn)練樣本,200幅戴墨鏡而無表情的圖像作為測試樣本,還有另外200幅圍圍巾而無表情的圖像也作為測試樣本。圖1顯示了AR人臉庫的小部分測試樣本。表1顯示了在ε=0.05的情況下不同算法在AR人臉庫上的識別率和平均運行時間比較。平均運行時間是指對每幅測試圖像的平均運行時間。從表1中可以看出,對于戴墨鏡的人臉識別,RCR擁有最高的識別率和最快的運行速度,RCR的識別率比SRC高12.5個百分點,而且運行速度比它快40倍;RCR的識別率比RSC高0.5個百分點,而且運行速度比它快98倍。對于圍圍巾的人臉識別,RCR也擁有最高的識別率和最快的運行速度,RCR的識別率比SRC高38.5個百分點,而且運行速度比它快44倍;RCR的識別率比RSC高1個百分點,而且運行速度比它快88倍。表2顯示了不同ε在戴墨鏡情況下的識別率和平均運行時間比較。從表2中可以看出,ε取不同值,識別率基本保持不變,而運行速度變化較大,如ε=0.3的運行速度比ε=0.05的快4倍多。4.2不同遮遮率下的識別率比較在本節(jié)中,將測試RCR對隨機遮擋的人臉識別的魯棒性。ExtendedYaleB人臉庫包含38個人的2414幅正面人臉圖像。圖像在變化的光照環(huán)境下獲得,經(jīng)過裁剪和標(biāo)準(zhǔn)化后,大小為192×168。該人臉庫的子集1和2作為訓(xùn)練樣本,子集3作為測試樣本,每個測試圖像被一個正方形塊且不相關(guān)的圖像所隨機遮擋。圖2顯示了ExtendedYaleB人臉庫的小部分被隨機遮擋的測試樣本。實驗前,每幅圖像大小都調(diào)整為96×84。表3顯示了不同遮擋率情況下不同算法的識別率比較。從表3中可以看出,當(dāng)遮擋率是20%時,RCR的識別率是100%。RCR的識別率要比SRC高,尤其是遮擋率在40%和50%時,識別率改善更明顯,其識別率比SRC分別高8.6和23.7個百分點。在遮擋率是20%和30%時,RCR的識別率與RSC相同,而在遮擋率是40%和50%時,其識別率比RSC分別高2和5.1個百分點。5rcr人臉識別算法本文提出了一種魯棒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論