版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)文 獻(xiàn) 綜 述1 引言在計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域,人臉識(shí)別技術(shù)(Face Recognition Technology,簡(jiǎn)稱FRT)是極具挑戰(zhàn)性的課題之一。近年來,隨著相關(guān)技術(shù)的飛速發(fā)展和實(shí)際需求的日益增長,它已逐漸引起越來越多研究人員的關(guān)注。人臉識(shí)別在許多領(lǐng)域有實(shí)際的和潛在的應(yīng)用,在諸如證件檢驗(yàn)、銀行系統(tǒng)、軍隊(duì)安全、安全檢查等方面都有相當(dāng)廣闊的應(yīng)用前景。人臉識(shí)別技術(shù)用于司法領(lǐng)域,作為輔助手段,進(jìn)行身份驗(yàn)證,罪犯識(shí)別等;用于商業(yè)領(lǐng)域,如銀行信用卡的身份識(shí)別、安全識(shí)別系統(tǒng)
2、等等。正是由于人臉識(shí)別有著廣闊的應(yīng)用前景,它才越來越成為當(dāng)前模式識(shí)別和人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。雖然人類能夠毫不費(fèi)力的識(shí)別出人臉及其表情,但是人臉的機(jī)器自動(dòng)識(shí)別仍然是一個(gè)高難度的課題。它牽涉到模式識(shí)別、圖像處理及生理、心理等方面的諸多知識(shí)。與指紋、視網(wǎng)膜、虹膜、基因、聲音等其他人體生物特征識(shí)別系統(tǒng)相比,人臉識(shí)別系統(tǒng)更加友好、直接,使用者也沒有心理障礙。并且通過人臉的表情/姿態(tài)分析,還能獲得其他識(shí)別系統(tǒng)難以獲得的一些信息。自動(dòng)人臉識(shí)別可以表述為:對(duì)給定場(chǎng)景的靜態(tài)或視頻序列圖像,利用人臉數(shù)據(jù)庫驗(yàn)證、比對(duì)或指認(rèn)校驗(yàn)場(chǎng)景中存在的人像,同時(shí)可以利用其他的間接信息,比如人種、年齡、性別、面部表情、語音等
3、,以減小搜索范圍提高識(shí)別效率。自上世紀(jì)90年代以來,人臉識(shí)別研究得到了長足發(fā)展,國內(nèi)外許多知名的理工大學(xué)及TT公司都成立了專門的人臉識(shí)別研究組,相關(guān)的研究綜述見文獻(xiàn)1-3。本文對(duì)近年來自動(dòng)人臉識(shí)別研究進(jìn)行了綜述,分別從人臉識(shí)別涉及的理論,人臉檢測(cè)與定位相關(guān)算法及人臉識(shí)別核心算法等方面進(jìn)行了分類整理,并對(duì)具有典型意義的方法進(jìn)行了較為詳盡的分析對(duì)比。此外,本文還分析介紹了當(dāng)前人臉識(shí)別的優(yōu)勢(shì)與困難。2 人臉識(shí)別相關(guān)理論圖像是人們出生以來體驗(yàn)最豐富最重要的部分,圖像可以以各種各樣的形式出現(xiàn),我們只有意識(shí)到不同種類圖像的區(qū)別,才能更好的理解圖像。要建立一套完整的人臉識(shí)別系統(tǒng)(Face Recogneti
4、on System,簡(jiǎn)稱FRS),必然要綜合運(yùn)用以下幾大學(xué)科領(lǐng)域的知識(shí):2.1 數(shù)字圖像處理技術(shù)數(shù)字圖像處理又稱為計(jì)算機(jī)圖像處理,它是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過程,數(shù)字圖像處理最早出現(xiàn)于20世紀(jì)50年代,當(dāng)時(shí)的電子計(jì)算機(jī)己經(jīng)發(fā)展到一定水平,人們開始利用計(jì)算機(jī)來處理圖形和圖像信息。數(shù)字圖像處理作為一門學(xué)科大約形成于20世紀(jì)60年代初期。與人類對(duì)視覺機(jī)理研究的歷史相比,數(shù)字圖像處理是一門相對(duì)年輕的學(xué)科,但在其短短的歷史中,它卻以不同程度的成功使用于幾乎所有與成像有關(guān)的領(lǐng)域。目前,數(shù)字圖像處理技術(shù)己被廣泛應(yīng)用于辦公自動(dòng)化、工業(yè)機(jī)器人、地理數(shù)據(jù)處理、醫(yī)學(xué)數(shù)據(jù)處理、地球資源遙
5、感、交互式計(jì)算機(jī)輔助設(shè)計(jì)等領(lǐng)域,尤其在機(jī)器視覺應(yīng)用系統(tǒng)中成為關(guān)鍵技術(shù)之一。一般的圖像都是模擬圖像,對(duì)于模擬圖像只能采用模擬處理方式進(jìn)行處理,計(jì)算機(jī)不能接受和處理模擬信號(hào),只有將連續(xù)的模擬信號(hào)變換為離散的數(shù)字信號(hào),或者說將模擬圖像變換為數(shù)字圖像才能接受。數(shù)字圖像處理就是對(duì)給定的數(shù)字圖像進(jìn)行某些變換的過程。對(duì)含有噪聲的圖像,要除去噪聲、濾去干擾,提高信噪比;對(duì)信息微弱的圖像要進(jìn)行灰度變換等增強(qiáng)處理;對(duì)已經(jīng)退化的模糊圖像要進(jìn)行各種復(fù)原的處理;對(duì)失真的圖像要進(jìn)行幾何校正等變換。除此之外,圖像的合成,圖像的邊緣提取與分割,圖像的編碼、壓縮與傳輸,圖像的分析等技術(shù)也屬于圖像處理的內(nèi)容。由此可見,圖像處理就
6、是為了達(dá)到改善圖像的質(zhì)量,將圖像變換成便于人們觀察和適于機(jī)器識(shí)別的目的4。2.2 神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)是一門以對(duì)大腦的生理研究成果為基礎(chǔ),以用機(jī)器模擬大腦的某些生理與機(jī)制,實(shí)現(xiàn)某方面功能為目的的學(xué)科6。研究神經(jīng)網(wǎng)絡(luò),特別是神經(jīng)學(xué)習(xí)的機(jī)理,對(duì)認(rèn)識(shí)和促進(jìn)人自身發(fā)展有特殊的意義。神經(jīng)網(wǎng)絡(luò)有許多具有非線性映射能力的神經(jīng)元組成,神經(jīng)元之間通過權(quán)系數(shù)連接。網(wǎng)絡(luò)的信息分布式就存在連接系數(shù)中,使網(wǎng)絡(luò)具有很高的容錯(cuò)性和魯棒性。神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)被有效地用到組合優(yōu)化、圖像處理、模式識(shí)別、自動(dòng)控制等方面?;谏窠?jīng)網(wǎng)絡(luò)技術(shù)的人臉識(shí)別方法是人臉識(shí)別研究領(lǐng)域中的一大重要分支。2.3 模式識(shí)別模式識(shí)別7,就是通過計(jì)算機(jī)用數(shù)學(xué)
7、技術(shù)方法來研究模式的自動(dòng)處理和判讀。這門學(xué)科使用計(jì)算機(jī)的方法實(shí)現(xiàn)人的模式識(shí)別能力,即對(duì)各種事物或現(xiàn)象進(jìn)行分析、描述、判別和識(shí)別。在人臉識(shí)別中,如果是個(gè)人識(shí)別,則每一個(gè)人就是一個(gè)模式,預(yù)先存在數(shù)據(jù)庫里的圖像就是樣本;如果是性別識(shí)別、種族識(shí)別或年齡識(shí)別,則不同的性別、種族或年齡就構(gòu)成一個(gè)模式;如果是表情識(shí)別,則不同的表情就是一個(gè)模式。人臉識(shí)別重在討論個(gè)人識(shí)別,人臉識(shí)別的最終目的就是利用人臉圖像確定待識(shí)別的人究竟與數(shù)據(jù)庫里的哪個(gè)人是同一個(gè)人,這是一個(gè)“是誰”的問題;或要判斷這個(gè)人與庫里的某個(gè)人是不是同一個(gè)人,這是一個(gè)“認(rèn)識(shí)或不認(rèn)識(shí)”的問題。圖像識(shí)別是指對(duì)視覺圖像目標(biāo)按其物理特征進(jìn)行分類,屬于模式識(shí)別
8、的范疇。圖像識(shí)別系統(tǒng)的基本結(jié)構(gòu)如圖1所示。圖像預(yù)處理圖像預(yù)處理分類決策結(jié)果圖像特征提取輸入圖像圖1 圖像識(shí)別系統(tǒng)的基本結(jié)構(gòu)2.4 計(jì)算機(jī)視覺在客觀世界中,人類通過視覺識(shí)別文字和周圍環(huán)境,感知外界信息。人們75%的信息量都來自視覺,因此讓計(jì)算機(jī)或機(jī)器人具有視覺,是人工智能的重要環(huán)節(jié),也是人類多年以來的夢(mèng)想。在信號(hào)處理理論與高性能計(jì)算機(jī)出現(xiàn)后,這種希望正在逐步實(shí)現(xiàn)。用計(jì)算機(jī)實(shí)現(xiàn)對(duì)視覺信息的處理形成了一門新興的學(xué)科計(jì)算機(jī)視覺。計(jì)算機(jī)視覺是一門用計(jì)算機(jī)來實(shí)現(xiàn)人的視覺功能,實(shí)現(xiàn)客觀三維世界的識(shí)別的學(xué)科。計(jì)算機(jī)視覺的最終目標(biāo)是模擬人類的視覺能力,理解并解釋周圍的世界,其研究的一個(gè)關(guān)鍵內(nèi)容是圖像的識(shí)別。3
9、人臉檢測(cè)與定位人臉檢測(cè)與定位是自動(dòng)人臉識(shí)別系統(tǒng)首先需要解決的關(guān)鍵問題,也即檢測(cè)圖像中是否有人臉存在,若有,則將其從背景中分割出來并確定其在圖像中的位置。在某些可以控制拍攝條件的場(chǎng)合,如警察拍攝罪犯照片時(shí)將人臉限定在標(biāo)尺內(nèi),此時(shí)的人臉定位由于己經(jīng)具備了人臉位置的先驗(yàn)知識(shí)而相對(duì)比較簡(jiǎn)單;證件照(身份證、護(hù)照等)由于背景相對(duì)簡(jiǎn)單,定位也比較容易。但在通常情況的實(shí)際應(yīng)用中,人臉在圖像中的位置預(yù)先未能得知,人臉檢測(cè)與定位將受到以下因素的制約:(1) 人臉在圖像中的位置、角度和尺度不同以及光照的變化;(2) 發(fā)型、眼鏡、胡須以及人臉的表情變化等;(3) 圖像中的噪聲影響。因此從某種程度上說,人臉檢測(cè)與定位
10、甚至比人臉模式的識(shí)別更為關(guān)鍵。按照人臉檢測(cè)技術(shù)的發(fā)展歷程,本文依據(jù)采用的主要技術(shù)方法將人臉檢測(cè)分為以下四種類型:基于特征檢測(cè)的方法、基于膚色檢測(cè)的方法、基于模板匹配的方法、基于外觀統(tǒng)計(jì)學(xué)習(xí)的方法。3.1 基于特征檢測(cè)的方法基于特征的人臉檢測(cè)方法依據(jù)人臉的面部幾何特征、紋理特征、膚色特征進(jìn)行人臉和非人臉的判別,見下表:表1 基于特征的人臉檢測(cè)與關(guān)鍵特征定位算法人臉特征主要算法主要參考文獻(xiàn)邊緣、輪廓邊緣檢測(cè)算子;橢圓擬合等8,9器官特征形態(tài)學(xué)運(yùn)算;自適應(yīng)域值;局部特征檢測(cè);模板匹配;概率決策等10,11紋理特征(膚色、頭發(fā)、胡須等)灰度共生矩陣(二階紋理統(tǒng)計(jì)特征);神經(jīng)網(wǎng)絡(luò)分類器;自組織映射網(wǎng)絡(luò)等
11、12,133.2 基于膚色檢測(cè)的方法利用人臉膚色信息進(jìn)行人臉檢測(cè)曾經(jīng)一度成為人臉檢測(cè)領(lǐng)域的研究熱點(diǎn),涌現(xiàn)了大量的學(xué)術(shù)文獻(xiàn),Lee等14最早利用人臉膚色信息進(jìn)行人臉定位;Saber15利用膚色、人臉形狀及幾何對(duì)稱信息實(shí)現(xiàn)人臉檢測(cè)和面部特征的抽??;Jones16利用大量的樣本圖像對(duì)膚色檢測(cè)問題進(jìn)行了分析,并建立了人臉膚色的統(tǒng)計(jì)模型用于人臉檢測(cè),收到了較好的檢測(cè)效果;Terrillon17使用高斯模型和混合高斯模型在不同色度空間建立膚色模型進(jìn)行人臉檢測(cè),并進(jìn)行了對(duì)比分析,結(jié)果發(fā)現(xiàn)混合高斯模型比一般高斯模型具有更好的泛化能力;Hadid18基于Skin-Locus建立膚色模型,提取彩色人臉區(qū)域?qū)崿F(xiàn)人臉
12、檢測(cè),但需要在固定成像參數(shù)下才保證有良好的性能,魯棒性有待提高;Martinkauppi19對(duì)Skin-Locus理論進(jìn)行了細(xì)致分析,發(fā)現(xiàn)人臉膚色在各種光照條件下可以用兩個(gè)二次或者多次多項(xiàng)式進(jìn)行擬合;Comanieiu20采用Mean-Shift算法進(jìn)行局部搜索實(shí)現(xiàn)人臉的檢測(cè)與跟蹤,該算法提高了人臉的檢測(cè)速度,對(duì)遮擋和光照的魯棒性較好,但對(duì)于復(fù)雜背景和多個(gè)人臉目標(biāo)的檢測(cè)不夠魯棒;Hsu21采用光照補(bǔ)償?shù)霓k法克服光照問題,從一定程度上解決了偏色、復(fù)雜背景和多人臉目標(biāo)的檢測(cè)問題,對(duì)人臉的位置、尺度、旋轉(zhuǎn)、姿態(tài)和表情等變化具有較好的魯棒性;Sobottka和Pitas22結(jié)合膚色(HSV)和人臉的形
13、狀信息來定位人臉和進(jìn)行面部特征的提取;Terrillon23等利用高斯模型對(duì)膚色象素進(jìn)行聚類,并采用神經(jīng)網(wǎng)絡(luò)對(duì)二值圖像的幾何距進(jìn)行學(xué)習(xí)實(shí)現(xiàn)人臉檢測(cè);Garcia和Tziritas24采用量化膚色區(qū)域合并結(jié)合小波分析實(shí)現(xiàn)人臉檢測(cè)??偟恼f來,基于膚色檢測(cè)的方法魯棒性的提高依賴于膚色模型的質(zhì)量,在背景相對(duì)簡(jiǎn)單的情況下可以獲得良好的檢測(cè)效果;但在復(fù)雜背景中,尤其是背景中存在較多的類膚色區(qū)域時(shí),檢測(cè)質(zhì)量將急劇下降。而且,膚色模型在不同人種之間會(huì)存在較大的差異,因而很難建立一個(gè)通用性很強(qiáng)的人臉膚色統(tǒng)計(jì)模型。因此,基于膚色檢測(cè)的人臉檢測(cè)方法的應(yīng)用受到一定限制。3.3 基于模板匹配的方法基于模板匹配的方法首先
14、需要人工定義一組標(biāo)準(zhǔn)或參數(shù)化的人臉模式(通常為正面),稱之為模板。對(duì)于給定輸入圖像,通過計(jì)算其與標(biāo)準(zhǔn)模板的相關(guān)系數(shù)并根據(jù)相關(guān)系數(shù)判斷是否為人臉,詳見表2。這種人臉檢測(cè)方法實(shí)現(xiàn)簡(jiǎn)單,但是由于人臉尺度、姿態(tài)和形狀的不確定性,基于模板的人臉檢測(cè)方法通常達(dá)不到很高的準(zhǔn)確率。表2 基于模板匹配的人臉檢測(cè)方法模板種類主要算法主要參考文獻(xiàn)固定模板人臉子模板(眼睛、鼻子)梯度圖像;相關(guān)匹配等25,26人臉形狀模板邊緣檢測(cè);相關(guān)匹配等27,28分塊比例模板29重心模板Laplancian邊緣檢測(cè);相關(guān)匹配等30變形模板彈性模型能量函數(shù)度量31Snakes能量函數(shù)度量32PDM模型ASM搜索333.4 基于統(tǒng)計(jì)學(xué)
15、習(xí)的方法與上述方法不同,基于統(tǒng)計(jì)學(xué)習(xí)的方法主要采用大量的人臉與非人臉樣本對(duì)檢測(cè)分類器進(jìn)行訓(xùn)練,將人臉檢測(cè)轉(zhuǎn)化為二類模式分類問題。Propp等人是最早采用神經(jīng)網(wǎng)絡(luò)34進(jìn)行人臉檢測(cè)的學(xué)者之一,他們通過構(gòu)造一個(gè)4層(兩個(gè)隱藏層)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)人臉檢測(cè),但沒有相關(guān)檢測(cè)性能的報(bào)道;后人在他們的基礎(chǔ)上通過優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提出了時(shí)延神經(jīng)網(wǎng)絡(luò)(TDNN),自組織映射神經(jīng)網(wǎng)絡(luò)(SOM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、概率決策神經(jīng)網(wǎng)絡(luò)(PDBNN)。Feraud等人通過構(gòu)造自協(xié)商神經(jīng)網(wǎng)絡(luò)(SNNN)35進(jìn)行非線性主元分析,可以檢測(cè)正面到左右60度旋轉(zhuǎn)的人臉,他們的方法后來被Listen和Multrak采用。Sung、Ro
16、wley、Lin&Kung 等36采用K-mean聚類算法在特征空間建立“人臉”和“非人臉”族,采用自舉(bootstrap)方法首先建立一個(gè)僅使用人臉樣本和少量非人臉樣本訓(xùn)練的初始神經(jīng)網(wǎng)絡(luò)分類器對(duì)一組圖像進(jìn)行訓(xùn)練,將誤檢的非人臉樣本加入非人臉樣本庫;然后訓(xùn)練新的分類器,如此不斷迭代,直到收集到足夠多的非人臉樣本,這種方法后來被許多學(xué)者所采用。Carleson、Yang等37人提出的SNoW(Sparse Network of Winnows)學(xué)習(xí)方法,對(duì)檢測(cè)不同特征、表情、姿態(tài)和光照條件下的人臉收到了較好的效果。其實(shí)質(zhì)就是采用Winnow算法進(jìn)行權(quán)值更新的稀疏神經(jīng)網(wǎng)絡(luò);H.Schneider
17、man38提出的基于后驗(yàn)概率估計(jì)的方法,先對(duì)樣本進(jìn)行小波變換,然后對(duì)這些特征進(jìn)行統(tǒng)計(jì),通過統(tǒng)計(jì)計(jì)算訓(xùn)練樣本的直方圖求得人臉與非人臉的概率分布實(shí)現(xiàn)人臉檢測(cè)。不同于傳統(tǒng)基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的分類器,如貝葉斯分類器、神經(jīng)網(wǎng)絡(luò)分類器等,支持向量機(jī)分類器(SVM)以基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理最小化泛化誤差,通過構(gòu)造最優(yōu)分類超平面實(shí)現(xiàn)模式分類。在這一領(lǐng)域,Osuna等人最早提出采用SVM分類器進(jìn)行人臉檢測(cè),并提出了針對(duì)大規(guī)模數(shù)據(jù)集的SVM訓(xùn)練算法。實(shí)驗(yàn)結(jié)果顯示基于SVM的人臉檢測(cè)速度比早先Sung等人提出的神經(jīng)網(wǎng)絡(luò)人臉檢測(cè)快足足30倍。Nefian39等人采用隱馬爾可夫模型(Hidden Markov Mode
18、ls簡(jiǎn)稱HMM)檢測(cè)人臉。HMM是一種雙重的隨機(jī)過程,采用節(jié)點(diǎn)表示狀態(tài),有向邊表示狀態(tài)之間的轉(zhuǎn)移。因此適合描述信號(hào)統(tǒng)計(jì)特性。Nefian等通過檢測(cè)區(qū)域中的每個(gè)子區(qū)域,采用K-L變換系數(shù)作為觀測(cè)矢量,通過B-W和維特比算法獲得HMM的模型參數(shù),依據(jù)區(qū)域觀測(cè)序列的輸出概率判決是否為人臉。3.5 AdaBoost算法訓(xùn)練器康柏研究院的Viola40在2001國際計(jì)算機(jī)學(xué)術(shù)年會(huì)上發(fā)表的論文標(biāo)志著人臉檢測(cè)技術(shù)開始走向?qū)嵱?。他們通過綜合AdaBoost41,42,43和Cascade算法實(shí)現(xiàn)了實(shí)時(shí)人臉檢測(cè),使得人臉檢測(cè)開始邁向?qū)嵱没牡缆?。而且首次引入了“積分圖像”( Integal Image)的概念,
19、大大加快了檢測(cè)過程中特征的計(jì)算速度。利用Adaboost學(xué)習(xí)算法提高一個(gè)簡(jiǎn)單分類器(弱分類器)的性能,理論上最終形成的強(qiáng)分類器的訓(xùn)練錯(cuò)誤率接近零,而且推廣性好。Viola在他的實(shí)驗(yàn)中定義了種矩形特征,通過實(shí)驗(yàn)選擇一小部分特征形成一個(gè)有效的分類器。繼Viola等提出用于人臉檢測(cè)的AdaBoost算法之后,許多學(xué)者對(duì)他們的算法進(jìn)行了繼承和發(fā)展。首先,Lienlxart等人提出了新的旋轉(zhuǎn)Haar-Like特征,可以用于旋轉(zhuǎn)人臉的快速檢測(cè),同時(shí)提出了一些其他的Boosting法:如Discrete AdaBoost, Real AdaBoost, Gentle AdaBoost等。Froba在AdaB
20、oost算法基礎(chǔ)上提出了基于灰度圖像的正面和平面內(nèi)旋轉(zhuǎn)人臉實(shí)時(shí)檢測(cè)系統(tǒng),在EOM ( Edge Orientation Matching)的基礎(chǔ)上進(jìn)行擴(kuò)展,引入SNoW算法進(jìn)行校驗(yàn),得到一個(gè)更為魯棒的系統(tǒng)。國內(nèi)的李子清在AdaBoost算法基礎(chǔ)上提出了FloatBoost算法,實(shí)現(xiàn)多視角人臉檢測(cè),通過從粗到精、從簡(jiǎn)單到復(fù)雜的金字塔型的人臉檢測(cè);與傳統(tǒng)的Adaboost算法相比,能在提高人臉檢測(cè)速度的同時(shí)提高檢測(cè)精度。Liu提出了基于Kullback-Leibler Boosting ( KLB)算法的分類器,解決了傳統(tǒng)AdaBoost算法存在的弱分類器的最優(yōu)組合以及最優(yōu)分類器和特征的選擇問題。
21、Viola本人也對(duì)AdaBoost算法進(jìn)行了改進(jìn),提出了不對(duì)稱AdaBoost算法,用于快速圖像檢索和人臉檢測(cè)??偟恼f來,基于Boosting和Cascade算法的系統(tǒng)在速度方面具有很大的優(yōu)越性,通過Haar-Like特征訓(xùn)練一些弱分類器,再組合成一個(gè)強(qiáng)分類器。如何在提高檢測(cè)精度的同時(shí)不降低檢測(cè)速度,可以從以下方面綜合考慮:采用更優(yōu)的特征描述方法,綜合AdaBoost和強(qiáng)分類器。3.6 多種方法的結(jié)合人臉檢測(cè)與精確定位是一個(gè)頗具挑戰(zhàn)性的研究課題,一些效果較好的人臉檢測(cè)系統(tǒng)并不只是采用上述的某種方法,而是將多種方法有機(jī)地融合。主流的方法大多是基于統(tǒng)計(jì)學(xué)習(xí)的,因此受學(xué)習(xí)樣本的影響較大,不同樣本集合
22、對(duì)算法的性能也有一定影響。復(fù)雜背景中正面人臉檢測(cè)已經(jīng)有了比較好的結(jié)果,多姿態(tài)人臉檢測(cè)仍然是目前的研究重點(diǎn),雖然取得了一些進(jìn)展,但如何利用人臉的深度信息解決姿態(tài)和光照問題還有待進(jìn)一步研究。4 人臉的識(shí)別方法識(shí)別人臉主要依據(jù)那些在不同個(gè)體之間存在較大差異而對(duì)于同一個(gè)人則比較穩(wěn)定的特征。具體的特征形式隨識(shí)別方法的不同而不同。早期研究較多的靜態(tài)人臉識(shí)別方法有基于幾何特征的人臉識(shí)別方法和基于相關(guān)匹配的人臉識(shí)別方法。目前,靜止圖像的人臉識(shí)別方法主要有三個(gè)研究方向:一是基于統(tǒng)計(jì)的識(shí)別方法,包括特征臉(Eigenface)方法44和隱馬爾科夫模型(Hidden Markov Model)45方法;二是基于連接
23、機(jī)制的識(shí)別方法,包括一般的神經(jīng)網(wǎng)絡(luò)方法46和彈性圖匹配47(Elastic Graph Matching)方法;三是其他一些綜合方法或處理非二維灰度圖像的方法。4.1 基于幾何特征的人臉識(shí)別方法常采用的幾何特征48有人臉的五官如眼睛、鼻子、嘴巴等的局部形狀特征,臉型特征以及五官在臉上分布的幾何特征。提取特征時(shí)往往要用到人臉結(jié)構(gòu)的一些先驗(yàn)知識(shí)。在這種基于幾何特征的識(shí)別中,識(shí)別總歸為特征矢量之間的匹配,基于歐氏距離的判決是最常用的識(shí)別方法。識(shí)別所采用的幾何特征是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量通常包括人臉指定兩點(diǎn)間的歐式距離、曲率、角度等?;趲缀翁卣鞯淖R(shí)別方法具有如下優(yōu)點(diǎn):符合
24、人類識(shí)別人臉的機(jī)理,易于理解;對(duì)每幅圖像只需存儲(chǔ)一個(gè)特征矢量,存儲(chǔ)量小;對(duì)光照變化不太敏感。這種方法同樣存在如下問題:從圖像中抽取穩(wěn)定的特征比較困難,特別是特征受到遮擋時(shí)這種情況更為明顯;對(duì)強(qiáng)烈的表情變化和姿態(tài)變化的魯棒性較差;一般幾何特征只描述了部件的基本形狀與結(jié)構(gòu)關(guān)系,忽略了局部細(xì)微特征,造成部分信息丟失,更適合于粗分類。4.2基于模板匹配的人臉識(shí)別方法模板匹配法4950是一種經(jīng)典的模式識(shí)別方法,這種方法大多是用歸一化互相關(guān)直接計(jì)算兩幅圖像之間的匹配程度。由于這種方法要求兩幅圖像上的目標(biāo)要有相同的尺度取向和光照條件,所以預(yù)處理要做尺度歸一化和灰度歸一化的工作。最簡(jiǎn)單的人臉模板是將人臉看成一
25、個(gè)橢圓,檢測(cè)人臉也就是檢測(cè)圖像中的橢圓。另一種方法是將人臉用一組獨(dú)立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。但這些模板的獲得必須利用各個(gè)特征的輪廓,而傳統(tǒng)的基于邊緣提取的方法很難獲得較高的連續(xù)邊緣。即使獲得了可靠度高的邊緣,也很難從中自動(dòng)提取所需的特征量。為此,用彈性模板方法提取特征顯示出其獨(dú)到的優(yōu)越性。彈性模板由一組根據(jù)特征形狀的先驗(yàn)知識(shí)設(shè)計(jì)的可調(diào)參數(shù)所定義。為了求出這組參數(shù),需要利用圖像的邊緣、峰值、谷值和強(qiáng)度信息及特征形狀的先驗(yàn)知識(shí)設(shè)計(jì)合適的能量函數(shù)。參數(shù)向能量減小方向調(diào)整,當(dāng)能量達(dá)到最小時(shí),這組參數(shù)對(duì)應(yīng)的模板形狀最符合特征形狀。4.3 特征臉方法特征臉(Ei
26、genface)51方法是從主成分分析(Principal Component Analysis ,PCA)53導(dǎo)出的一種人臉識(shí)別和描述技術(shù)。PCA實(shí)質(zhì)上是K-L展開的網(wǎng)絡(luò)遞推實(shí)現(xiàn),K-L變換是圖像壓縮中的一種最優(yōu)正交變換,其生成矩陣一般為訓(xùn)練樣本的總體散布矩陣。特征臉方法就是將包含人臉的圖像區(qū)域看作是一種隨機(jī)向量,因此可以采用K-L變換獲得其正交K-L基底,對(duì)應(yīng)其中較大特征值的基底具有與人臉相似的形狀,因此又稱之為特征臉。利用這些基底的線性組合可以描述、表達(dá)和逼近人臉圖像,因此可以進(jìn)行人臉識(shí)別和合成。識(shí)別過程就是將人臉圖像映射到由特征臉張成的子空間上,比較其與已知人臉在特征臉空間中的位置。近
27、年來,據(jù)此發(fā)展了多種對(duì)特征臉的改進(jìn)方法,如雙子空間法、相形歧義分析方法、Fisher臉方法等。另一方面,Albert等將PCA與人臉拓?fù)潢P(guān)系結(jié)合起來提出TPCA(topological principal component analysis)方法,識(shí)別率較單一的PCA類方法有所提高。此外,與K-L變換的思想比較接近,但不是從統(tǒng)計(jì)角度出發(fā)的。另一種變換是奇異值分解(SVD)的方法,即將圖像矩陣的奇異值作為模式的特征矢量。4.4 隱馬爾科夫模型隱馬爾科夫模型(Hidden Markov Model,HMM)52是用于描述信號(hào)統(tǒng)計(jì)特性的一組統(tǒng)計(jì)模型。HMM使用馬爾科夫鏈來模擬信號(hào)統(tǒng)計(jì)特性的變化,而
28、這種變化又是間接地通過觀察序列來描述的,因此,隱馬爾科夫過程是一個(gè)雙重的隨機(jī)過程。在HMM中,節(jié)點(diǎn)表示狀態(tài),有向邊表示狀態(tài)之間的轉(zhuǎn)移,一個(gè)狀態(tài)可以具有特征空間中的任意特征,對(duì)同一特征,不同狀態(tài)表現(xiàn)出這一特征的概率不同。由于HMM是一個(gè)統(tǒng)計(jì)模型,對(duì)于同一特征序列,可能會(huì)對(duì)應(yīng)于許多狀態(tài)序列,特征序列與狀態(tài)序列之間的對(duì)應(yīng)關(guān)系是非確定的。這種模型對(duì)于狀態(tài)序列來說是隱的,故稱為隱馬爾科夫模型。HMM有三個(gè)主要問題:評(píng)估、估計(jì)及解碼。我們關(guān)心的是前兩個(gè)問題,評(píng)估用于解決識(shí)別問題,一般采取比較有效的“向前-向后”法;估計(jì)用來產(chǎn)生用于識(shí)別的各個(gè)單元的HMM,采取Baum-Welch方法。4.5 基于神經(jīng)網(wǎng)絡(luò)的
29、方法利用神經(jīng)網(wǎng)絡(luò),人們就不需要為人臉識(shí)別清晰地定義特征。Kohonen將自組織映射(self-organizing map ,縮寫SOM)網(wǎng)絡(luò)應(yīng)用于人臉回憶。即使當(dāng)輸入圖像帶有強(qiáng)烈噪聲或有部分丟失,準(zhǔn)確的回憶能力仍然可以獲得。Lawrence etal.53使用了一個(gè)混合的神經(jīng)網(wǎng)絡(luò)系統(tǒng),主要包括了一個(gè)改進(jìn)的五層SOM網(wǎng)絡(luò)和CNN網(wǎng)絡(luò)(Convolutional neural networks),其中CNN具有局部權(quán)值共享的拓?fù)浣Y(jié)構(gòu)。這種結(jié)構(gòu)與基于接收區(qū)域(receptive fields)的生物網(wǎng)絡(luò)有更多的相似點(diǎn),并且提高了對(duì)局部變形的忍耐性。多層感知機(jī)神經(jīng)網(wǎng)絡(luò)(Multi-layer per
30、ceptron neural networks)和徑向基函數(shù)網(wǎng)絡(luò)(radial basis function networks)也已經(jīng)被用于人臉識(shí)別。4.6 彈性匹配方法彈性圖匹配方法5455是一種基于動(dòng)態(tài)鏈接結(jié)構(gòu)(Dynamic Link Architecture ,DLA)的方法。它將人臉用格狀的稀疏圖表示,圖中的節(jié)點(diǎn)用圖像位置的Gabor小波分解得到的特征向量標(biāo)記,圖的邊用連接節(jié)點(diǎn)的距離向量標(biāo)記。匹配時(shí),首先尋找與輸入圖像最相似的模型圖,再對(duì)圖中的每個(gè)節(jié)點(diǎn)位置進(jìn)行最佳匹配,這樣產(chǎn)生一個(gè)變形圖,其節(jié)點(diǎn)逼近模型圖的對(duì)應(yīng)點(diǎn)的位置。Wiskott 等人使用彈性圖匹配方法,以FERET圖像庫做實(shí)驗(yàn)
31、,準(zhǔn)確率達(dá)到97.3%。彈性圖匹配方法對(duì)光照、位移、旋轉(zhuǎn)及尺度變化都不敏感,是一種優(yōu)于特征臉方法的人臉識(shí)別方法。此方法的主要缺點(diǎn)是對(duì)每個(gè)存儲(chǔ)的人臉需計(jì)算其模型圖,計(jì)算量大,存儲(chǔ)量大。為此,Wiskott在原有方法的基礎(chǔ)上提出聚束圖匹配,部分克服了這些缺點(diǎn)。在聚束圖中,所有節(jié)點(diǎn)都已經(jīng)定位在相應(yīng)目標(biāo)上。對(duì)于大量數(shù)據(jù)庫,這樣可以大大減少識(shí)別時(shí)間,另外,利用聚束圖還能夠匹配不同人的最相似特征。因此可以獲得關(guān)于未知人的性別、胡須和眼鏡等相關(guān)信息。Lee等提出了一種基于彈性圖動(dòng)態(tài)鏈接模型的方法,既取得較高的識(shí)別速度,也獲得了較理想的識(shí)別率,在一定程度上克服了以往方法總是在速度與識(shí)別率之間進(jìn)行折中的缺點(diǎn)。4
32、.7 其它人臉識(shí)別方法以上幾種典型的人臉識(shí)別方法,每種方法各有其優(yōu)缺點(diǎn),因此可以把多種方法綜合起來,或同時(shí)利用不同種類的特征。要從大量人臉數(shù)據(jù)庫中進(jìn)行識(shí)別,單靠擴(kuò)展單一種類的特征數(shù)目是不夠的,而要擴(kuò)展與原特征集正交的其它種類特征。Jia等在正面人臉幾何特征的基礎(chǔ)上,將側(cè)面輪廓特征、眼睛形狀特征以及人臉輪廓特征也加入特征矢量,獲得了較采用單一正面人臉幾何特征為特征矢量方法更高的識(shí)別率。Lai等結(jié)合小波變換與傅立葉變換提出與平移、縮放、平面內(nèi)旋轉(zhuǎn)無關(guān)的光譜臉人臉表征方法。目前人臉識(shí)別研究的對(duì)象基本上都是針對(duì)二維灰度圖像,除此之外,還有深度人臉圖像識(shí)別和紅外人臉圖像識(shí)別方法。深度圖像包含了人臉的深度
33、信息,Gordon針對(duì)深度圖像提出了一種基于模板的用圖像數(shù)據(jù)的曲率作描述子的識(shí)別方法。他使用一個(gè)旋轉(zhuǎn)的激光掃描系統(tǒng)獲得人臉深度圖像,獲得的曲面數(shù)據(jù)以柱坐標(biāo)形式存儲(chǔ),然后根據(jù)曲面上各點(diǎn)法向最大和最小曲率的振幅和相位值定位眼睛、鼻子和兩側(cè)臉部區(qū)域紅外人臉圖像(也叫溫譜圖)對(duì)每個(gè)人來說都是唯一的。所以可以利用溫譜圖識(shí)別人臉。另外在黑暗中也能捕捉紅外光,因此用紅外人臉圖像在黑暗中也能進(jìn)行識(shí)別。對(duì)于多CCD攝像機(jī)系統(tǒng),可以得到多視點(diǎn)人臉圖像,從而可以獲得人臉的立體模型,含有三維信息的特征能有效解決人臉在光照偽裝或年齡變化等情況下的識(shí)別問題。5 人臉識(shí)別系統(tǒng)的優(yōu)勢(shì)與關(guān)鍵技術(shù)難題人臉是三維非剛性體,利用人臉
34、生物特征的自動(dòng)人臉識(shí)別系統(tǒng)與基于其他人體生物特征的識(shí)別系統(tǒng)相比,既具有其獨(dú)特的優(yōu)勢(shì),也存在一些困難。5.1 人臉識(shí)別的優(yōu)勢(shì)自動(dòng)人臉識(shí)別的技術(shù)優(yōu)勢(shì)主要表現(xiàn)在:(1) 非接觸式數(shù)據(jù)采集人臉圖像可以通過標(biāo)準(zhǔn)視頻或熱成像技術(shù)非接觸式采集,因而不會(huì)對(duì)用戶造成生理上的傷害,具有非直接侵犯性。(2) 可隱蔽性強(qiáng)用于捕獲人臉圖像的成像設(shè)備可以隱蔽安裝,特別適合解決重大安全問題、罪犯監(jiān)控、過濾敏感人物(間諜、恐怖分子)及實(shí)施抓捕,是其它基于指紋、虹膜、視網(wǎng)膜、掌紋等生物特征的識(shí)別技術(shù)所無法比擬的。(3) 方便、快捷及便于事后追蹤自動(dòng)人臉識(shí)別系統(tǒng)通過非接觸方式捕獲人臉圖像,因而無需用戶過多干預(yù)。且能夠在事件發(fā)生的
35、同時(shí)記錄當(dāng)事人面像,從而確保系統(tǒng)具有良好的事后追蹤能力。(4) 可交互性強(qiáng)人類可以輕而易舉地識(shí)別不同個(gè)體在不同時(shí)期不同狀態(tài)下的人臉,而指紋、虹膜、視網(wǎng)膜等其他生物特征常人很難識(shí)別。因此與授權(quán)用戶的交互和主動(dòng)配合可以從很大程度上提高人臉識(shí)別系統(tǒng)的可靠性和可用性。5.2 人臉識(shí)別系統(tǒng)若干關(guān)鍵技術(shù)問題現(xiàn)所研究的一些人臉識(shí)別系統(tǒng)大多在約束環(huán)境下工作,如果注冊(cè)原型圖像和系統(tǒng)工作條件基本一致并且用戶主動(dòng)配合,尚能夠達(dá)到令人滿意的效果。但真正實(shí)用的人臉識(shí)別系統(tǒng)需要在大規(guī)模人臉庫、工作環(huán)境非可控和用戶不配合(罪犯監(jiān)控與搜捕)等非約束環(huán)境下工作,雖然通過采用圖像預(yù)處理技術(shù)(亮度均衡和姿態(tài)學(xué)習(xí)等)能從一定程度上得
36、以補(bǔ)償,但大的光照和姿態(tài)變化仍然使得系統(tǒng)的穩(wěn)定性急劇下降,即使是目前性能最好的人臉識(shí)別商業(yè)系統(tǒng)識(shí)別率也不到80%而誤識(shí)率卻高達(dá)10%以上,基本無法滿足實(shí)際應(yīng)用的需求。FERET和FRVTS對(duì)人臉識(shí)別核心算法的評(píng)測(cè)至少揭示了面臨的兩個(gè)主要挑戰(zhàn):光照和姿態(tài)變化。此外,人臉局部遮擋、人臉老化、成像設(shè)備差異、化妝、飾物等因素的影響在非約束、非合作(如視頻監(jiān)控)環(huán)境下是不可避免的。現(xiàn)有的許多算法由于種種原因未能應(yīng)用于人臉識(shí)別,至少?zèng)]有在大型人臉庫上進(jìn)行實(shí)際測(cè)試。而且,上述問題往往在實(shí)際應(yīng)用中共同出現(xiàn),這進(jìn)一步增加了人臉識(shí)別的難度。下面就人臉識(shí)別系統(tǒng)所面臨的五個(gè)主要技術(shù)挑戰(zhàn)分別加以分析:(1) 光照變化光
37、照變化,尤其在室外環(huán)境下,是基于2D人臉圖像人臉識(shí)別核心算法遇到的最為棘手的問題。由于光照導(dǎo)致人臉圖像的變化甚至超過不同個(gè)體之間的差異,進(jìn)而改變?nèi)四槇D像在特征子空間的分布,致使基于圖像比對(duì)的識(shí)別算法性能急劇下降。雖然人們提出了一些應(yīng)對(duì)光照變化的解決方案,如啟發(fā)式拋棄主元的方法、基于朗伯光照模型的3D光照子空間、光照錐、人臉3D模型合成虛擬圖像等等。但大多都是基于理想條件和經(jīng)驗(yàn)數(shù)據(jù)獲取的人臉模型,因而很難走向?qū)嵱谩C嫦驅(qū)嶋H應(yīng)用環(huán)境的光照變化問題仍然有待于進(jìn)一步研究。(2) 姿態(tài)變化人臉姿態(tài)變化和光照變化一樣,是實(shí)用人臉識(shí)別系統(tǒng)真正走向應(yīng)用所面臨的巨大障礙。即使能獲取人臉?biāo)胁煌暯恰⒉煌庹蘸捅砬橄碌臉颖緢D像,但這將導(dǎo)致人臉特征數(shù)據(jù)庫的急劇膨脹和人臉識(shí)別核心算法的時(shí)間復(fù)雜度和空間復(fù)雜度急劇上升。目前多數(shù)人臉識(shí)別核心算法在正面人臉情況下的識(shí)別性能尚能接受,但是實(shí)際應(yīng)用中輸入人臉圖像難以保證總是準(zhǔn)正面人臉圖像。因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度茶山茶葉電商平臺(tái)推廣合同范本4篇
- 2025年度茶樓茶葉加工與質(zhì)量控制合同4篇
- 二零二四年度專業(yè)人才聘用合同-副總經(jīng)理職務(wù)合作協(xié)議3篇
- 苯乙烯樹脂課程設(shè)計(jì)
- 二零二五年度旅行社旅游產(chǎn)品研發(fā)與推廣合作協(xié)議4篇
- 紅色文化剪紙課程設(shè)計(jì)
- 二零二五版餐廳外賣配送服務(wù)合同3篇
- 二零二五版旅行社與航空公司機(jī)票代理合同4篇
- 2025年私立學(xué)校新生試讀協(xié)議書(特色課程研發(fā))專用版3篇
- 2025年企業(yè)外包服務(wù)協(xié)議
- 二零二五年度無人駕駛車輛測(cè)試合同免責(zé)協(xié)議書
- 北京市海淀區(qū)2024-2025學(xué)年高一上學(xué)期期末考試歷史試題(含答案)
- 常用口服藥品的正確使用方法
- 2025年湖北華中科技大學(xué)招聘實(shí)驗(yàn)技術(shù)人員52名歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年鉆探工程勞務(wù)協(xié)作協(xié)議樣式版B版
- 《心肺復(fù)蘇機(jī)救治院內(nèi)心搏驟?;颊咦o(hù)理專家共識(shí)》解讀
- 計(jì)算機(jī)二級(jí)WPS考試試題
- 智聯(lián)招聘行測(cè)題庫及答案
- 2023中華護(hù)理學(xué)會(huì)團(tuán)體標(biāo)準(zhǔn)-注射相關(guān)感染預(yù)防與控制
- GB∕T 2099.1-2021 家用和類似用途插頭插座 第1部分:通用要求
- 超潔凈管道(CL-PVC)施工技術(shù)
評(píng)論
0/150
提交評(píng)論