基于隱馬爾科夫模型的人臉識(shí)別_第1頁(yè)
基于隱馬爾科夫模型的人臉識(shí)別_第2頁(yè)
基于隱馬爾科夫模型的人臉識(shí)別_第3頁(yè)
基于隱馬爾科夫模型的人臉識(shí)別_第4頁(yè)
基于隱馬爾科夫模型的人臉識(shí)別_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

本文格式為Word版,下載可任意編輯——基于隱馬爾科夫模型的人臉識(shí)別基于隱馬爾科夫的人臉識(shí)別

1人臉檢測(cè)及常用算法

人臉檢測(cè),指的是從輸入的圖像(或者視頻)中確定人臉的位置、大小和神態(tài)的過(guò)程,是進(jìn)行人臉識(shí)別的基礎(chǔ),也是實(shí)現(xiàn)人臉識(shí)別功能的一個(gè)關(guān)鍵環(huán)節(jié)。

人臉檢測(cè)是一種計(jì)算機(jī)視覺(jué)中的模式識(shí)別問(wèn)題,就是將所有的人臉作為一個(gè)模式,而非人臉作為另一種模式,人臉檢測(cè)的核心問(wèn)題就是將人臉模式和非人臉模式區(qū)別開(kāi)來(lái)。人臉檢測(cè)的算法主要分為兩大類(lèi),基于先驗(yàn)知識(shí)的和基于后驗(yàn)知識(shí)的學(xué)習(xí)和訓(xùn)練的算法。

常見(jiàn)人臉檢測(cè)的算法有:基于特征子臉人臉檢測(cè)算法:該算法將所有人臉的集合視作一個(gè)人臉子空間,通過(guò)檢測(cè)樣本與子空間之間的投影距離檢測(cè)樣本中是否存在人臉;基于模板匹配的人臉檢測(cè)算法:該算法先設(shè)計(jì)一個(gè)代表標(biāo)準(zhǔn)人臉的模板,將進(jìn)行檢測(cè)的樣本與標(biāo)準(zhǔn)模板進(jìn)行比對(duì),通過(guò)考察樣本與標(biāo)準(zhǔn)模板的匹配程度,設(shè)置合理的閾值來(lái)檢測(cè)樣本中是否存在人臉;神經(jīng)網(wǎng)絡(luò)人臉檢測(cè)算法:該算法是一種學(xué)習(xí)算法,用于學(xué)習(xí)的訓(xùn)練集分為屬于人臉圖像的訓(xùn)練集和非人臉圖像的訓(xùn)練集兩類(lèi),通過(guò)學(xué)習(xí)從而產(chǎn)生分類(lèi)器進(jìn)行人臉檢測(cè);基于紋理模型的算法,對(duì)于人臉圖像的灰度共生矩陣進(jìn)行計(jì)算可以獲得倒數(shù)分差、慣量相關(guān)特征這三個(gè)特征矩陣,然后通過(guò)迭代計(jì)算求得人臉圖像矩陣中的參數(shù)。使用這種方法取得的模型就被稱(chēng)為人臉紋理模型。若人臉神態(tài)有旋轉(zhuǎn),通過(guò)對(duì)眼睛進(jìn)行定位可以計(jì)算出人臉的旋轉(zhuǎn)角度或者使用投影直方圖FFT變換等方法確定人臉旋轉(zhuǎn)的方向,再進(jìn)行人臉檢測(cè)。

1.1Haar特征

Harr特征是一種矩形特征,在特征提取時(shí)由四類(lèi)特征組成特征模板—邊緣特征、圓心環(huán)繞特征、線性特征和特定方向的特征。特征模板包括白色矩形和黑色矩形兩種。白色矩形內(nèi)像素和(Sum白)減去黑色矩形像素和(Sum黑)就是模板的特征值。Haar特征反映的是圖像中相鄰矩形區(qū)域的灰度變化。

Haar特征的每一個(gè)特征值feature可以表示為:

feature???i?rectsum?ri?

i?1N其中?i表示矩形的權(quán)重,PaulViola和rectsum?ri?表示矩形所包圍圖像的灰度值之和。MichaclJoncs提出積分圖算法提高圖像舉行特征的計(jì)算速度。

對(duì)于對(duì)象中的任意一點(diǎn)A?x,y?,其灰度值為i?x,y?,積分圖ii?x,y??經(jīng)過(guò)對(duì)圖片的一次遍歷,就可以得到圖像中每一個(gè)點(diǎn)的積分圖的值。

x??x,y?y??i?x?,y??,

假設(shè)需要計(jì)算矩形D的特征,其頂點(diǎn)為點(diǎn)1、2、3、4。這樣,矩形D的

特征為feature1?。d?ii?4??ii?2??ii?3??ii?1.2AdaBoost

AdaBoost(theAdaptiveBoostingAlgorithm)算法是一種用于分類(lèi)器訓(xùn)練的算法該分類(lèi)器算法,是一種基于統(tǒng)計(jì)模型的迭代算法。核心思想在于將一系列弱分類(lèi)(BasicClassifier)器通過(guò)一定的方式進(jìn)行疊加(Boost)后形成一個(gè)分類(lèi)能力很強(qiáng)的強(qiáng)分類(lèi)器(StrongClassifier)。

首先,獲得用于訓(xùn)練的樣本庫(kù),樣本庫(kù)需包含正負(fù)樣本。就人臉識(shí)別而言,即需獲得人臉圖片與非人臉圖片,選擇人臉圖片時(shí)需考慮樣本的多樣性,選擇非人臉圖片時(shí)需要考慮樣本是否具有代表性。在選取了適合的樣本集合后對(duì)其進(jìn)行循環(huán)處理,每次循環(huán)處理后可以得到一個(gè)假設(shè)。接下來(lái)對(duì)這個(gè)假設(shè)進(jìn)行驗(yàn)證,得到使用該假設(shè)進(jìn)行分類(lèi)的錯(cuò)誤率。在開(kāi)始下一輪循環(huán)之前依據(jù)該錯(cuò)誤率調(diào)整每個(gè)樣本所占的權(quán)重。在實(shí)際訓(xùn)練過(guò)程中,第一次使所有樣本的權(quán)重一致進(jìn)行訓(xùn)練,從而得到一個(gè)弱分類(lèi)器。然后使用這個(gè)得到的弱分類(lèi)器進(jìn)行人臉圖片與非人臉圖片的分類(lèi),得到分類(lèi)結(jié)果。依據(jù)結(jié)果降低可正確分類(lèi)的樣本的權(quán)重,提高被錯(cuò)誤分類(lèi)的樣本所占的權(quán)重再進(jìn)行訓(xùn)練,從而得到一個(gè)新的分類(lèi)器,之后重復(fù)上述步驟進(jìn)行循環(huán)訓(xùn)練。這樣,經(jīng)過(guò)T次循環(huán)訓(xùn)練之后,就得到了T個(gè)弱分類(lèi)器,將這T個(gè)弱分類(lèi)器經(jīng)過(guò)加權(quán)疊加,就得到了強(qiáng)分類(lèi)器,理論上將,無(wú)窮多個(gè)大于50%的弱分類(lèi)器的聯(lián)合,其分辯正確率可以達(dá)到100%。

1.3分類(lèi)器

最初的弱分類(lèi)器可能只是一個(gè)最基本的Haar-like特征,計(jì)算輸入圖像的Haar-like特征值,和最初的弱分類(lèi)器的特征值比較,以此來(lái)判斷輸入圖像是不是人臉。比較輸入圖片的特征值和弱分類(lèi)器中特征,一定需要一個(gè)閾值,當(dāng)輸入圖片的特征值大于該閾值時(shí)才判定其為人臉。訓(xùn)練最優(yōu)弱分類(lèi)器的過(guò)程實(shí)際上就是在尋覓適合的分類(lèi)器閾值,使該分類(lèi)器對(duì)所有樣本的判讀誤差最低。

具體操作過(guò)程:

1、對(duì)于每個(gè)特征f,計(jì)算所有訓(xùn)練樣本的特征值,并將其排序。

2、掃描一遍排好序的特征值,對(duì)排好序的表中的每個(gè)元素,計(jì)算下面四個(gè)值:全部人臉樣本的權(quán)重的和t1;全部非人臉樣本的權(quán)重的和t0;

在此元素之前的人臉樣本的權(quán)重的和s1;在此元素之前的非人臉樣本的權(quán)重的和s0

s1?(t0?s0)),(s0?(t1?s1))),在表中尋覓r3、求出每個(gè)元素的分類(lèi)誤差r?min((值最小的元素,則該元素作為最優(yōu)閾值。有了該閾值,就生成一個(gè)最優(yōu)弱分類(lèi)器。

強(qiáng)分類(lèi)器的誕生需要T輪的迭代,具體操作如下:1、歸一化權(quán)重:

qt,i?wt,i?nj?1wt,i

2、對(duì)每一個(gè)特征f,訓(xùn)練一個(gè)弱分類(lèi)器h,計(jì)算此f特征的加權(quán)錯(cuò)誤率ef:

ef??iqih?xi,f,p,???yi

3、選取具有最小錯(cuò)誤率ef的弱分類(lèi)器h4、調(diào)整權(quán)重

wi?1,j?wi,j?t1?ei,其中ei?0表示x被正確分類(lèi),ei?1表示被錯(cuò)誤分類(lèi),?t?5、級(jí)聯(lián)成強(qiáng)分類(lèi)器

?h?x????t2C?x??1?t0t?1t?1?t1??t??1?else,其中?t?log1?t

將多個(gè)訓(xùn)練出來(lái)的強(qiáng)分類(lèi)器依照一定的規(guī)則串聯(lián)起來(lái),形成最終正確率很高的級(jí)聯(lián)分類(lèi)

器。對(duì)于人臉需要進(jìn)行多尺度檢測(cè),尋常是不斷初始化探尋窗口size為訓(xùn)練時(shí)的圖片大小,不斷擴(kuò)大探尋窗口,進(jìn)行探尋。

級(jí)聯(lián)分類(lèi)器在進(jìn)行串聯(lián)時(shí)的原則是“先重后輕〞,即將重要特征構(gòu)成的結(jié)構(gòu)比較簡(jiǎn)單的分類(lèi)器放在前面,而后一級(jí)的分類(lèi)器都比前一級(jí)使用更為繁雜的矩形特征,由于靠前的分類(lèi)器用于判斷的特征相對(duì)簡(jiǎn)單,例如

只有一兩個(gè)矩形框,這種分類(lèi)器并不能滿(mǎn)足人臉檢測(cè)的需求,但是能夠迅速篩選掉大量不是人臉的子窗口。這樣,雖然后續(xù)分類(lèi)器的矩形特征在增多,但是由于需要進(jìn)行后續(xù)檢測(cè)的子窗口的數(shù)量大為減少,整體計(jì)算量在減少,極大地提升了人臉檢測(cè)的速度,并且保證了最終的得到的人臉檢測(cè)結(jié)果偽正(falsepositive)的可能性十分低。

2人臉識(shí)別算法

人臉識(shí)別是對(duì)對(duì)某張?zhí)囟ㄈ四槇D片進(jìn)行身份確認(rèn),關(guān)鍵在于在人臉共性特征中尋覓不同人物的特性特征并以有效的算法(計(jì)算機(jī)可以理解并加以運(yùn)算)進(jìn)行描述和區(qū)分。常用的識(shí)別算法有:

1、基于幾何特征的識(shí)別算法—1966年,Bledsoe就提出了基于幾何特征的人臉識(shí)別算法,選取的幾何特征是人臉面部特征點(diǎn)之間的距離和比例。

2、基于PCA的識(shí)別算法—輸入的人臉圖像描述為“特征臉〞的線性組合,不同的人臉特性用構(gòu)成該種線性組合的系數(shù)來(lái)進(jìn)行描述,其關(guān)鍵技術(shù)是PCA

3、基于隱馬爾可夫模型的識(shí)別算法—以二維離散余弦變換特征提取獲得觀測(cè)向量,構(gòu)建起人臉的EHMM模型。之后,利用EM(ExpectationMaximization)算法(B-W算法)進(jìn)行訓(xùn)練,訓(xùn)練后得到每個(gè)人對(duì)應(yīng)的EHMM模型。這樣在識(shí)別階段就可以計(jì)算得到人臉圖片觀測(cè)向量屬于每個(gè)人物EHMM模型的概率,用于該概率進(jìn)行比較,選擇概率大者為匹配結(jié)果,從而完成識(shí)別工作。

其他的還有基于神經(jīng)網(wǎng)絡(luò)的識(shí)別算法、基于支持向量機(jī)識(shí)別算法、三維人臉識(shí)別算法等等。

幾種主流識(shí)別算法比較:算法名稱(chēng)基于幾何特征的算法特征臉?biāo)惴ǎ≒CA)特點(diǎn)特征簡(jiǎn)單,但是不易提取到穩(wěn)定的特征,識(shí)別率不高,魯棒性不高簡(jiǎn)單有效,是人臉識(shí)別的基準(zhǔn)算法,但是識(shí)別率不高,對(duì)于表情和神態(tài)的魯棒性不強(qiáng),計(jì)算時(shí)間隨著樣本數(shù)量增多呈指數(shù)增加,新樣本擴(kuò)容時(shí)需要對(duì)多有的樣本進(jìn)行重新訓(xùn)練。識(shí)別率高、對(duì)人臉神態(tài)、表情變化魯棒性強(qiáng),對(duì)于人臉庫(kù)擴(kuò)容適應(yīng)性好,實(shí)現(xiàn)比較繁雜不需要繁雜的特征提取,可使用硬件進(jìn)行加速,但是神經(jīng)元的數(shù)量多,運(yùn)算時(shí)間長(zhǎng),需要較多的人臉進(jìn)行訓(xùn)練,訓(xùn)練過(guò)程需要認(rèn)為控制在小樣本空間識(shí)別率較好,但是識(shí)別過(guò)程中需要對(duì)核心函數(shù)參數(shù)進(jìn)行調(diào)整。特征穩(wěn)定性好,具有選擇、位移等不變性質(zhì),但是識(shí)別率不高。識(shí)別率高,人臉三維模型的構(gòu)造和存儲(chǔ)開(kāi)銷(xiāo)大、需要借助專(zhuān)業(yè)設(shè)備進(jìn)行三維建模。隱馬爾科夫模型(HMM)神經(jīng)網(wǎng)絡(luò)(NN)支持向量機(jī)(SVM)奇異值分解(SVD)三維人臉識(shí)別算法3隱馬爾可夫(HMM)數(shù)學(xué)模型

馬爾可夫模型可視為隨機(jī)有限狀態(tài)自動(dòng)機(jī)。HMM是建立的馬爾科夫模型基礎(chǔ)上,由兩個(gè)隨機(jī)過(guò)程構(gòu)成,一個(gè)是具有狀態(tài)轉(zhuǎn)移的馬爾科夫鏈,另一個(gè)是描述觀測(cè)值和狀態(tài)之間關(guān)系的隨機(jī)過(guò)程。

HMM構(gòu)成:

1、N:HMM中馬爾科夫鏈的狀態(tài)數(shù)。假設(shè)S是狀態(tài)的集合,S??S1,S2,...,SN?,該模型在t時(shí)刻的狀態(tài)為qt。

2、?:初始狀態(tài)矢量,????i?,?i?p?q1?Si?3、A:狀態(tài)轉(zhuǎn)移概率,A?aij,aij?p?qt?Si|qt?1?Si?

4、M:狀態(tài)可能對(duì)應(yīng)觀測(cè)值的數(shù)目,可能的觀測(cè)值為V1,V2t時(shí)刻的觀測(cè)值為OtVm,5、B:觀測(cè)值概率矩陣,B?bjk,其中bjk?p?Ot?Vk|St?qi?HMM的三個(gè)基本問(wèn)題是:

1.給定模型(五元組),求某個(gè)觀測(cè)序列O的概率。

????2.給定模型和觀測(cè)序列O,求可能性最大的隱蔽狀態(tài)序列。

3.對(duì)于給定的觀測(cè)序列O,調(diào)整HMM的參數(shù),使觀測(cè)序列出現(xiàn)的概率最大。

3.1向前算法解決1

P?O|X???P?O,S|X???P?S|X?*P?O|X,S?,但其時(shí)間繁雜度達(dá)到指數(shù)級(jí)

SS別,太慢了,用動(dòng)態(tài)規(guī)劃的思想解決—向前算法:

定義向前變量:?t?i??p?O1O2...Ot,qt?Si|??1、初始化從前變量:?i??ibi?Oi?

2、再將向前變量進(jìn)行遞歸運(yùn)算,其中1?t?T?1,1?j?N:

?N??i?1?j?????t?i?ai,j?bj.k|Oi?1?Vk

?j?1?3、終止:p?O|??????i?

tj?1N向后算法類(lèi)似于向前算法(向后變量為:?t?i??p?Ot?1Ot?2...OT|qt?Si?)

3.2Viterbi算法解決2

將?t?i?定義為時(shí)刻t沿一條路徑q1,q2,q3...qt,并且qt??t,產(chǎn)生出O1,O2,...,Ot的最大約率值:

?t?i??MAXp?q1,q2,...,qt??i,O1,O2...Ot|??

q1,q2,..,qt?1最優(yōu)狀態(tài)序列Q?進(jìn)行求解過(guò)程如下:1、對(duì)?t?i

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論