版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于摘要稀疏表示的數(shù)學(xué)實質(zhì)就是在超完備字典下對給定信號的線性分解。本文研究了一種基于稀疏表示的正交匹配追蹤(orthogonalmarchingpursuit,簡稱OMP)算法,遞歸的對所選原子集合進(jìn)行正交化,并且利用矩陣cholesky分解簡化迭代過程中矩陣求逆的計算。在人臉識別的實際應(yīng)用中,利用實驗樣本構(gòu)建冗余字典,將待檢測樣本表示成試驗樣本的線性組合。通過在不同人臉庫上的實驗證明了該算法的有效性。關(guān)鍵字稀疏表示稀疏編碼人臉識別正交匹配追蹤1緒論1.1背景及意義隨著科技的迅猛發(fā)展,人類社會已經(jīng)進(jìn)入信息時代,信息安全問題日益得到高度重視。鑰匙、密碼、證件等傳統(tǒng)形式的身份認(rèn)證技術(shù)已經(jīng)遠(yuǎn)遠(yuǎn)不能完
2、全滿足現(xiàn)代社會中對信息安全有高質(zhì)量要求的部門的需要。因此,新一代的身份認(rèn)證技術(shù)應(yīng)運而生。人的生物特征具有唯一性、穩(wěn)定性等多種優(yōu)點,已逐漸成為新一代的身份認(rèn)證技術(shù)的主要依據(jù)。在眾多的基于生物特征的身份識別技術(shù)中,人臉識別技術(shù)因其自然性、友好性等顯著優(yōu)勢而受到廣泛關(guān)注,目前已經(jīng)被應(yīng)用到模式識別、人工智能、計算機視覺、認(rèn)知科學(xué)等多個領(lǐng)域中。然而,由于人臉圖像易受到光照、姿態(tài)、遮擋和表情等多種因素的影響,識別效果也易受圖像數(shù)據(jù)庫大小的干擾1-2,計算機智能識別課題的研究仍然具有較高的挑戰(zhàn)性。1.2發(fā)展?fàn)顩r1888年,Nature上發(fā)表了第一篇利用人臉進(jìn)行身份識別的文章,由此開啟了近代對人臉識別技術(shù)的研
3、究。1965年,Chan和Bledsoe共同創(chuàng)建了世界上第一個自動人臉識別系統(tǒng)3-4。隨著計算機技術(shù)的迅猛發(fā)展和相關(guān)理論的日益成熟,人臉識別技術(shù)的到了快速的發(fā)展與廣泛的應(yīng)用,其發(fā)展過程大致可以劃分為以下三個階段:起步階段早期人臉識別技術(shù)主要利用人臉的幾何結(jié)構(gòu)特性(GeometricFeatureBased)以及它們之間的角度、距離和區(qū)域形狀等參數(shù)作為識別依據(jù)。在這一階段,很多參數(shù)的測定需要人工標(biāo)定,因此只能稱之為半自動人臉識別系統(tǒng),但是這種方法的提出為后續(xù)其他方法的提出提供了理論參考。發(fā)展階段90年代初,研究人員發(fā)現(xiàn)人臉圖像之間存在很強的相關(guān)性,人臉圖像本身只是高維圖像空間中的一個子空間,若直
4、接使用,會因維數(shù)過高而產(chǎn)生“維數(shù)災(zāi)難”等問題。因此,各種降維方法陸續(xù)產(chǎn)生。本階段主要產(chǎn)生了線性判別分析(LinearDisriminantAnalysis,簡稱LDA)算法、主成分分析(principalcomponentanalysis,簡稱PCA)算法以及統(tǒng)計模式識別方法等多種算法。攻堅階段進(jìn)入二十一世紀(jì),人臉識別技術(shù)進(jìn)入攻堅階段。在前兩個階段的發(fā)展過程中,人臉識別技術(shù)已經(jīng)積累了豐富的理論和大量的算法,基本能夠解決可控條件下的身份識別問題。但是,非理想條件、大規(guī)模人臉數(shù)據(jù)庫等問題下的人臉識別仍有待解決。針對這些問題,產(chǎn)生了等距離映射(IsometricalMapping,簡稱ISOMAP)
5、、局部線性嵌入(LocallyLinearEmbedding,簡稱LLE)、最大方差展開(MaximumVarianeeUnfolding,簡稱MVU)等多種方法,基于稀疏表示的人臉識別方法也生在這一階段脫穎而出。2人臉識別2.1人臉識別概念人臉識別就是利用人臉的生物特征對身份進(jìn)行判別,這些生物特征可分為眼、鼻、嘴的幾何形狀或關(guān)系等外部特征以及人臉的結(jié)構(gòu)關(guān)系等內(nèi)部特征兩個方面。2.2影響因素及相應(yīng)解決方法2.2.1光照問題人臉識別系統(tǒng)的性能與人臉識別算法的設(shè)計以及人臉圖像的質(zhì)量等有密切的關(guān)系。在影響人臉圖像質(zhì)量的眾多因素之中,光照問題不容忽視。一般將人臉識別中處理光照問題的方法分為三類:基于圖
6、像處理技術(shù)的方法;基于子空間的方法;基于光照不變特征提取算法?;趫D像處理技術(shù)的方法主要從圖像本身出發(fā),利用對光照變化不敏感或無變化的特征進(jìn)行圖像處理?;谧涌臻g的方法原理是同一物體在不同光照下的圖像屬于一個低維度的線性子空間,通過尋求與輸入圖像最為接近的子空間進(jìn)行識別?;诠庹詹蛔兲卣魈崛》椒ǖ乃惴梢苑譃閭鹘y(tǒng)光照不變特征提取和基于人臉反射系數(shù)的光照不變特征提取兩大類。2.2.2姿態(tài)問題姿態(tài)問題同樣也是人臉識別中亟待解決的一個難點。目前多數(shù)的人臉識別算法僅適用于正面或準(zhǔn)正面的人臉圖像條件下的人臉識別,對于其他姿態(tài)下的人臉圖像,識別率相對較低。針對這一問題,目前已經(jīng)提出了局部線性回歸(Loca
7、llyLinearRegression,簡稱LLR)算法、基于神經(jīng)網(wǎng)絡(luò)的方法和光度立體分析等方法。2.2.3數(shù)據(jù)庫大小問題在人臉識別技術(shù)中,人臉圖像數(shù)據(jù)庫的大小存在兩種極端情況:人臉圖像數(shù)據(jù)庫過大;單樣本或少樣本人臉數(shù)據(jù)庫。如果人臉圖像數(shù)據(jù)庫過大,則對相關(guān)算法的運算速度要求較高,如果人臉圖像數(shù)據(jù)庫樣本過少,則會影響人臉識別的正確率。針對數(shù)據(jù)庫過大問題,目前主要提出了主成分分析、線性辨別分析和隱馬爾可夫模型等方法來提高效率56。針對單樣本問題,主要的解決方法有樣本擴(kuò)張法、圖像增強法和特征子空間擴(kuò)張法等。2.2.4遮擋、年齡、表情等問題喜怒哀樂,生老病死是所有人類都不可避免的人生成長經(jīng)歷。然而,伴
8、隨而來的表情表情年齡、遮擋等問題給自動人臉識別系統(tǒng)的設(shè)計增加了很大的難度。目前,針對表情及年齡問題,已提出了基于多分類融合的3D算法、利用(2)三維數(shù)據(jù)對圖像進(jìn)行重構(gòu)等方法7-8;針對遮擋問題,也已提出了帶遮擋人臉的支持向量機、尺度不變特征變換(ScaleInvariantFeatureTransform,簡稱SIFT)、隨機非均勻局部Gabor二值模式(RandomNonuniformLocalGaborBinaryPattern,簡稱RNLGBP)等算法。3稀疏表示3.1稀疏表示的意義香農(nóng)定理表明,模擬信號可以用一定采樣頻率的周期函數(shù)來表示。然而,這種表示方法對信號的分析帶來了一些不便。對
9、于壓縮問題,希望用較少的系數(shù)表示較多的信息;對于識別問題,希望信號的主要特征突出;對于去噪問題,希望將有用信號與噪聲進(jìn)行有效分離。這些應(yīng)用都有一個共同的特點,就是簡化信號的表示(稀疏化)。3.2稀疏表示的概念研究人員發(fā)現(xiàn),通過使用原子庫(過完備冗余函數(shù)體系)取代傳統(tǒng)完備正交函數(shù)集,可有效從原子庫中找到具有最佳線性組合的n項原子信號來表示一個給定信號,而這些組合的系數(shù)大部分為0或接近于0,即稀疏表示。稀疏表示主要采用稀疏逼近原理即高度非線性逼近原理。對于一個給定集合S=u;ii=1,2,I,其元素u是張成整個Hilert空間H=rm的單位矢量,IM。集合iS稱為原子庫,元素u稱為原子。對于任意給
10、定的信號feH,預(yù)想在S中自適i應(yīng)的選取n個原子對信號做n項逼近:f=工cunrrreKn(1)其中K是u的下標(biāo)集,card(K)=n,則B=span(u,reK)就是由nnrnrn個原子在原子庫S中張成的最佳子集。我們定義逼近誤差為:(f,S)=intf-f由于n遠(yuǎn)小于空間的維數(shù)M,所以這種逼近也被稱作稀疏逼近。由于原子庫存在定的冗余性,知上式存在多組解。稀疏表示的目的就是從中選取解的系數(shù)最為稀疏的或使n取值最小的解。這個問題等同于下述問題:Minimize口csubjecttof=cu0kki=0(3)稀疏表示的最初目的是為了以低于香農(nóng)定理的采樣頻率表示和壓縮信號2,事上,在去噪方面,小波
11、變換和平以不變小波也開發(fā)出許多有效算法4;稀疏表示已成功應(yīng)用與圖像動態(tài)范圍的壓縮9,圖像卡通和紋理成分的分離10等。在這些應(yīng)用中,算法的性能取決于表示的稀疏性是否忠實于原始信號。3基于稀疏表示的人臉識別3.1基于稀疏表示的人臉識別原理訓(xùn)練集圖像圖像預(yù)處理=特征提取稀疏表示分類圖1基于稀疏表示的人臉識別框圖設(shè)給定的訓(xùn)練集A中有i類已標(biāo)記好的樣本,其中第k類中含有n個樣本。k則屬于第k類的樣本集合可以用矩陣A=a,aaeRmxnk來表示,且每kk1k2k“k個樣本對應(yīng)于矩陣的一個列向量,m為人臉圖像的維數(shù)。為了提高效率,現(xiàn)假定每個類別的矩陣對應(yīng)于用于稀疏表示的訓(xùn)練字典。對于任意給定的測試樣本y,若
12、其屬于某一訓(xùn)練集所包含的類別a,那么便可以用a的線性組合來表Z示o為便于理解,現(xiàn)假設(shè)第k類中有足夠多的訓(xùn)練樣本構(gòu)成矩陣A,且待測試樣k本y屬于第k類,則可以用具有相同類別屬性的第k類訓(xùn)練樣本的線性組合近1似表示待測試樣本y,即1y=xa+xa+.+xa其中xgR,j=1,2,jn1k1k1k2k2knkknkkjk(4)然而,一般情況下的待測試樣本所屬類別并不知曉,因此用于實驗的樣本字典是由i類訓(xùn)練樣本集的所有樣本共同構(gòu)成的,即:A=A,A,.,A=a,aaaa12i1112lni1in.因此,任意待測試樣本y就可以用字典線的性表示,即:Y=Ax(6)其中x=0,0,,0,x,xx,0,0,.
13、,0TGRm是-個很稀疏的系數(shù)矢k1k2knk量。由x就可以獲得關(guān)于y的類別信息。顯然,若mn,易知方程組(6)為過定的,解向量x唯一。但是對于人臉識別問題,經(jīng)降維處理后的樣本構(gòu)成的方程組是典型欠定的,故解向量x并不唯一。由壓縮感知理論和稀疏表示可知,如果向量x足夠稀疏,那么稀疏解的個數(shù)L范數(shù)問題可以轉(zhuǎn)化為L范數(shù)問題,即02X=argmin口xsubjecttoy=Ax223.2基于稀疏表示的人臉識別算法3.2.1正交匹配追蹤算法正交匹配追蹤算法是稀疏表示的經(jīng)典算法之一,為求得式(7)提出的問題的最佳逼近解正交匹配追蹤算法在每一步的迭代過程中選擇和當(dāng)前迭代殘差最相關(guān)的原子,將信號正交投影到這些
14、原子張成的空間中,循環(huán)計算殘差直到滿足約束條件(詳細(xì)步驟見算法一)。注意第5行是貪婪算法選擇原子的步驟,第7行是正交投影的步驟。算法1正交匹配追蹤Input:dietionaryA,targetsparsityKOutput:sparserepresentationxInit:SetI=,r=y,x=0while(stoppingcriterionnotmet)dok=argmaxIdTrlk1kI=(I,k)7-x=(A)+yIIr=y-axIIendwhile3.2.2快速正交匹配追蹤快速正交匹配追蹤算法通過在基本的正交匹配追蹤算法中對冗余字典采用Cholesky分解,提高了算法的整體效率
15、。算法2快速正交匹配追蹤Input:dietionaryA,targetsparsityKOutput:sparserepresentationxInit:SetI=,L=1,r=y,x=0,a(o)=aty,m=1while(stoppingcriterionnotmet)dok=argmax|dTr|kkifm1thenw=solveforwLw=atakL0L=WTJl-WTWendifI=(I,k)x=solveforcLLtc=aIIr=y-axIIn=n+1endwhile4實驗結(jié)果與分析我們運用本文所述算法主要在ORL和擴(kuò)展的YaleB兩個人臉數(shù)據(jù)庫進(jìn)行識別精度與時間的測試。我們
16、主要關(guān)心在不同的光照和不同的表情兩種主要因素下的測試結(jié)果。ORL人臉數(shù)據(jù)庫含有40個不同人的臉,每個人臉有10張不同表情的圖像,總共400張圖像。擴(kuò)展的YaleB是一個比較大的人臉數(shù)據(jù)庫,含有16128張人臉圖像,包含了38個不同人臉的64種光照條件下的不同圖像。本實驗僅從中選取了一個小的子集,但已足夠測試本文算法對光照條件的敏感性。4.1有表情變化的實驗本算法隨機從ORL人臉庫每個人臉的圖像中選取不同比重的圖像作為訓(xùn)練集,余下的圖像做為測試樣本,稀疏閾值設(shè)置為訓(xùn)練樣本數(shù)目。表1顯示的是隨著訓(xùn)練樣本比重增大識別率的變化情況??傊?,在訓(xùn)練樣本足夠多的情況下測試樣本都可以用字典中所屬類別的原子的線
17、性組合來表示。圖2ORL數(shù)據(jù)庫不同表情變化表1正交匹配追蹤算法應(yīng)用于ORL數(shù)據(jù)庫訓(xùn)練圖像測試圖像稀疏閾值識別率(%)5556467378284.2不同光照條件的實驗本算法隨機從擴(kuò)展的YaleB數(shù)據(jù)庫的一個子集下每個人臉的圖像中選取不同比例的圖像作為訓(xùn)練集,余下的圖像作為測試樣本,稀疏閾值設(shè)置為訓(xùn)練樣本數(shù)目。表2顯示的是隨著訓(xùn)練樣本比重變大識別率的變化情況。從中可以看出,本算法在不同光照條件下表現(xiàn)出較高的識別率。圖2YaleB數(shù)據(jù)庫種不同光照條件表2正交匹配追蹤算法應(yīng)用于YaleB數(shù)據(jù)庫訓(xùn)練圖像測試圖像稀疏閾值識別率()164816323232481648結(jié)束語本文研究了稀疏表示理論并且應(yīng)用矩陣
18、Cholesky分解實現(xiàn)正交匹配追蹤快速算法,該算法簡化了迭代過程中逆矩陣的計算,提高了識別的速度,并在具有表情變化和光照變化的條件下取得了很好的識別率。人臉識別的困難主要在于遮擋、單樣本、魯棒性等的問題。稀疏表示在這些限制下的識別中仍具有很大的發(fā)展?jié)摿?,有待于進(jìn)一步研究,這也是目前一個比較熱門的研究方向。參考文獻(xiàn)P.JonathonPhillips,W.ToddScruggs,PatrickJ.Flynn,KevinW.Bowyer,etal.FRVT2006andICE2006Large-ScaleExperimentResultsJ.IEEETransactionsonPatternAn
19、alysisandMachineIntelligenee,2010,35(5):830-852.JitaoSang,ZhenLei,andStanZ.LiFaceImageQualityEvaluationforISO/IECStandards19794-5and29794-5C.InThirdInternationalConferencesICB2009,2009:225-340.SubhransuMaji,AlexanderC.Berg,JitendraMalik.Classificationusingintersectionkernelsupportvectormachinesiseff
20、icientC.2008IEEEConfereneeonComputerVisionandPatternRecognition,pp.1-12,2008.Stan乙LiandAnilK.Jain,HandbookofFaceRecognitionM,2011.Z.Stone,T.Zickler,T.Darrell.TowardLarge-ScaleFaceRecognitionUsingSocialNetworkContext卩.ProceedingsoftheIEEE,2010,98(8):10461417.ZhenLei,ShengcaiLiao,M.Pietikainen,S.Z.Li;FaceRecognitionbyExploringInformationJointlyinSpace,ScaleandOrientationJ.IEEETransactionsonImageProcessing,2011,20(1):244-261.H.H.K.Tin,M.M.Sein.RobustMethodofAgeDependentFaceRecognitionC.Intell
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化工消防安全工作總結(jié)(6篇)
- 污染治理產(chǎn)業(yè)政策研究-洞察分析
- 休閑時間分配與生活滿意度-洞察分析
- 無線鼠標(biāo)技術(shù)發(fā)展-洞察分析
- 網(wǎng)絡(luò)安全技術(shù)創(chuàng)新-第5篇-洞察分析
- 游戲版權(quán)保護(hù)策略-洞察分析
- 微種植體支抗的骨整合機制-洞察分析
- 應(yīng)急響應(yīng)與處置能力建設(shè)-洞察分析
- 網(wǎng)絡(luò)安全法律法規(guī)-第16篇-洞察分析
- 《真核生物真菌》課件
- 中班語言《新房子》3--完整版PPT課件(24頁PPT)
- 高電壓技術(shù):5-2絕緣電阻、吸收比、泄漏電流的測量
- 王守仁英國文學(xué)選讀課后答案
- (完整版)20以內(nèi)帶括號加減法口算練習(xí)
- 奧星-計算機化系統(tǒng)驗證要點分析與校準(zhǔn)管理
- 北京九強生物技術(shù)股份有限公司新建研發(fā)中心及參考試驗室項目環(huán)境影響評價報告書簡本
- 新浙美版三年級上冊美術(shù)教案
- 中國國際商會入會申請表
- 裂隙燈顯微鏡的原理
- 心臟彩超電子病例檢查模塊
- 洪水計算(推理公式法)
評論
0/150
提交評論