計算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè)論文-圖像處理在人臉檢測中的應(yīng)用_第1頁
計算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè)論文-圖像處理在人臉檢測中的應(yīng)用_第2頁
計算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè)論文-圖像處理在人臉檢測中的應(yīng)用_第3頁
計算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè)論文-圖像處理在人臉檢測中的應(yīng)用_第4頁
計算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè)論文-圖像處理在人臉檢測中的應(yīng)用_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

計算機(jī)科學(xué)與技術(shù)專業(yè)畢業(yè)論文--圖像處理在人臉檢測中的應(yīng)用圖像處理在人臉檢測中的應(yīng)用摘要人臉識別,特指利用分析比較人臉視覺特征信息進(jìn)行身份鑒別的計算機(jī)技術(shù)。人臉識別技術(shù)應(yīng)用廣泛,與利用指紋、虹膜等其他人體生物特征進(jìn)行身份識別的方法相比,人臉識別更加友好、方便和隱蔽,因此人臉識別越來越成為當(dāng)前模式識別和人工智能領(lǐng)域的一個熱點。本文主要利用垂直積分投影和水平積分投影法對人臉進(jìn)行定位,再采用PCA主元分析法進(jìn)行人臉的特征提取,最后做出快速決策判斷。其中PCA主元分析是一種對數(shù)據(jù)進(jìn)行分析的技術(shù),可以有效的找出數(shù)據(jù)中最“主要”的元素和結(jié)構(gòu),去除噪音和冗余,將原有的復(fù)雜數(shù)據(jù)降維,揭示隱藏在復(fù)雜數(shù)據(jù)背后的簡單結(jié)構(gòu)。因此ABSTRACTFacerecognition,inparticulartotheanalysisandcomparisonofvisualfeaturesoffaceauthenticationinformationcomputertechnology.Facerecognitiontechnologyisappliedwidely,andtheuseoffingerprint,irisandotherhumanbiologicalfeatureidentificationmethods,facerecognitionismorefriendly,convenientandconcealed,sofacerecognitionmoreandmorebecomesthecurrentfieldofpatternrecognitionandartificialintelligenceofahot.Thispapermainlyusestheverticalintegralprojectionandhorizontalintegralprojectionmethodtolocatehumanfaces,thenadoptedPCAprincipalcomponentanalysismethodforfacefeatureextraction,andfinallymakeaquickdecisionmaking.ThePCAprincipalcomponentanalysisisakindofdataanalysistechnology,caneffectivelyidentifythedatainthe"main"elementsandstructure,thenoiseandredundancy,theoriginalcomplexdatadimensionreduction,revealshiddencomplexityinthedatabehindthesimplestructure.Therefore,thismethodcaneffectivelyextractthecontourofthehead,andhasadvantagesofsimpleoperation,highefficiency.ThealgorithminMATLABenvironmentforthedifferentfaceimagesareprocessedachievedbetterrecognitionresults.分享到翻譯結(jié)果重試抱歉,系統(tǒng)響應(yīng)超時,請稍后再試支持中英、中日在線互譯支持網(wǎng)頁翻譯,在輸入框輸入網(wǎng)頁地址即可提供一鍵清空、復(fù)制功能、支持雙語對照查看,使您體驗更加流暢KEYWARDS:sharpening,medianfilterphi,PCA,KLtransform,facedetection

目錄摘要 IIABSTRACT III1人臉識別 21.1人臉識別的研究背景 21.2人臉識別系統(tǒng)的組成及本文的主要研究方向 32人臉圖像的預(yù)處理與人臉器官的定位 52.1人臉圖像的預(yù)處理 5圖像的采集 5銳化 5二值化處理 6人臉圖像噪聲去除 82.2人臉器官的定位 9人臉左右兩端邊界的測定 9人臉的水平積分投影 10嘴中心點的確定 11人臉中軸線的求取 12人臉橢圓結(jié)構(gòu)定位 13瞳孔的精確定位 143人臉特征的提取 153.1圖像的幾何規(guī)范化 163.2圖像的灰度規(guī)范化 173.3基于PCA的人臉特征提取 174樣本數(shù)據(jù)庫的建立與人臉識別 224.1樣本庫的建立方法與流程 224.2樣本庫的管理 234.3人臉識別 244.4人臉識別結(jié)果錯誤分析 25結(jié)論 26參考文獻(xiàn) 27致謝 28附錄 291人臉識別1.1人臉識別的研究背景近年來,隨著信息技術(shù)的發(fā)展,其應(yīng)用的普及性不斷提高,以及計算機(jī)的軟硬件性能的飛速提升,更加高效并且也更加友好的人機(jī)交互技術(shù)被不斷地提出并應(yīng)用于我們周圍。這些技術(shù)的應(yīng)用不再依賴于傳統(tǒng)的鍵盤、鼠標(biāo)、顯示器等設(shè)備,開始向著多模態(tài)人機(jī)交互的方向發(fā)展。多模態(tài)人機(jī)交互模擬人類自然交流的方法,包括視覺、聽覺、觸覺和嗅覺,試圖綜合圖像,聲音,文字等手段,達(dá)到與計算機(jī)進(jìn)行交流的目的,其中以視覺交流最為方便和易于接受。同時,圖像處理設(shè)備的性價比也不斷地提高,從而使得基于圖像處理的人機(jī)交互技術(shù)成為當(dāng)前研究領(lǐng)域的熱點。視頻監(jiān)控便是其中一個重要的研究方向,簡單而言,不僅用攝像機(jī)代替人眼,而且用計算機(jī)替代人、協(xié)助人,來完成監(jiān)視或控制任務(wù),從而減輕人的負(fù)擔(dān)。智能視覺監(jiān)控系統(tǒng)能在不需要人干預(yù)的情況下,通過攝像機(jī)拍錄的圖像序列進(jìn)行自動分析來對場景中的變化進(jìn)行定位、跟蹤。早期的人臉信息方面的研究主要集中在人臉識別領(lǐng)域,這一時期的人臉識別算法都是在默認(rèn)已經(jīng)得到了一個正面人臉或者人臉很容易獲得的前提下進(jìn)行的。但是隨著人臉信息利用的研究范圍不斷擴(kuò)大和開發(fā)實際系統(tǒng)需求的不斷提高,研究者們發(fā)現(xiàn),這種假設(shè)下的研究并不能滿足實際需求。于是,人臉檢測算法開始作為獨立的研究內(nèi)容發(fā)展起來,并且發(fā)展出了人臉特征定位,人臉跟蹤等相關(guān)研究。隨著計算機(jī)速度的提高,對彩色信息的處理己經(jīng)不會構(gòu)成比單純處理灰度信息明顯增多的系統(tǒng)負(fù)荷。對計算機(jī)色彩理論的深入研究也使彩色圖像處理逐漸成為數(shù)字圖像處理的核心內(nèi)容。這都使得在計算機(jī)檢測人臉的過程中有效利用膚色信息成為可能。膚色信息的應(yīng)用,將推動人臉檢測這一即具有廣闊的應(yīng)用前景又具有重要的學(xué)術(shù)價值的課題的進(jìn)一步研究,也必將成為一個更為獨立和活躍的研究領(lǐng)域。人臉識別的發(fā)展大致經(jīng)過了三個階段:非自動識別階段、人機(jī)交互階段、自動識別階段。非自動識別階段:主要研究如何提取人臉識別所需要的特征。通過簡單的語句描述人臉數(shù)據(jù)庫或為待識別人臉設(shè)計逼真的摹寫來提高面部識別率,這是一種需要手工干預(yù)的階段。人機(jī)交互階段:這一階段雖然實現(xiàn)了一定的自動化,但還需要操作員的某些先驗知識,仍然不是一種完全自動的識別系統(tǒng)。自動識別階段:在這一階段真正的實現(xiàn)了機(jī)器自動識別,產(chǎn)生了眾多人臉識別方法,出現(xiàn)了多種機(jī)器全自動識別系統(tǒng)。面部識別技術(shù)通過對面部特征和它們之間的關(guān)系來進(jìn)行識別,識別技術(shù)基于這些唯一的特征時是非常復(fù)雜的。人臉識別是計算機(jī)視覺、模式識別中的一個重要內(nèi)容,在電視監(jiān)視,罪犯查詢識別等領(lǐng)域有著廣泛的應(yīng)用價值。作為一種無接觸的利用人的生物特征的進(jìn)個人身份鑒定的方法,人臉識別相比其他人體生物特征識別技術(shù)來講,它具有直接,友好,方便的特點,更易于為用戶所接受。人臉識別是計算機(jī)視覺,模式識別中的一個重要內(nèi)容,人臉識別大概可以分為三步:人臉器官檢測定位,特征提取和分類識別。人臉器官檢測定位是人臉識別系統(tǒng)的。第一步,也是整個人臉識別系統(tǒng)中的一個關(guān)鍵,在研究人臉檢測的問題中,我們碰到的一個非常棘手的問題是如如何從一幅圖像中快速的檢測出人臉。目前國內(nèi)外研究人臉識別的方法比較多,但根據(jù)人臉表征方式的不同,總體上可以分為以下三種:基于幾何特征的識別方法,基于代數(shù)特征的識別方法和基于連接機(jī)制的識別方法。1基于幾何特征的人臉正面圖像識別方法,將人臉用一組幾何特征矢量表示,幾何特征矢量是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,用模式識別中的層次聚類的思想設(shè)計分類器以達(dá)到識別目標(biāo)。由于這種方法對臉部朝向的改變非常敏感,要求有一定的彈性消除時間跨度和光照的影響。基于幾何特征的方法內(nèi)存要求小,識別速度要比基于模板的方法高,它的缺點是這些特征的準(zhǔn)確提取是較難實現(xiàn)的,到目前為止,這種方法在實踐中尚沒有成功的應(yīng)用。2基于代數(shù)特征的人臉正面圖像識別方法,將人臉用代數(shù)特征矢量來表示,代數(shù)特征是通過對圖像灰度進(jìn)行各種代數(shù)變換和矩陣分解提取出來的,這種方法從整體上來捕捉和描述人臉的特征,所用到的主要是一些標(biāo)準(zhǔn)的數(shù)理統(tǒng)計和技巧,運算較復(fù)雜。3基于連接機(jī)制的人臉正面圖像識別方法,將人臉直接用灰度圖二維矩陣表征,利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力及分類能力,這種方法的優(yōu)點在于保存了人臉圖像的材質(zhì)信息和形狀,同時避免了較為復(fù)雜的特征提取工作,但是普遍存在的問題是識別率低,過程復(fù)雜。人臉識別系統(tǒng)主要是由以上幾個功能模塊組成:預(yù)處理模塊,人臉器官定位模塊,特征提取模塊,人臉圖像識別模塊。圖1-1人臉識別系統(tǒng)結(jié)構(gòu)框架為了使計算機(jī)能夠?qū)Ω鞣N現(xiàn)象進(jìn)行分類識別,要用計算機(jī)可以運算的符號來表示研究的對象。從構(gòu)造實際應(yīng)用系統(tǒng)的角度出發(fā),本系統(tǒng)采用的是基于代數(shù)特征的識別方法。本系統(tǒng)的算法首先對樣本圖像做噪聲去除、平滑處理,中值濾波和二值化等預(yù)處理,然后利用二值化的圖像,根據(jù)人臉的結(jié)構(gòu)特征點和數(shù)學(xué)形態(tài)學(xué)的理論對人臉器官進(jìn)行定位。經(jīng)過預(yù)處理后,通過基于PrincipalComponentAnalysisPCA的特征提取產(chǎn)生樣本庫,從而可對輸入的圖像進(jìn)行識別。在獲取了人臉圖像后,就要進(jìn)行預(yù)處理的工作了。預(yù)處理的目的是去除噪聲,加強(qiáng)有用的信息,并對輸入設(shè)備或其他因素造成的退化現(xiàn)象進(jìn)行復(fù)原。人臉識別的整個預(yù)處理階段包含了:人臉圖像的預(yù)處理,二值化,圖像噪聲去除等。人臉器官定位模塊完成從原始圖像中確定出人臉位置,以便后繼處理。其中包括人臉邊緣的檢測,人臉的預(yù)定位和人臉的精確定位。特征提取模塊完成提取人臉特征,抽取穩(wěn)定和有效的特征是系統(tǒng)成敗的關(guān)鍵。由于人臉圖像所獲得的數(shù)據(jù)量是相當(dāng)大的,為了有效的進(jìn)行分類識別,就要對原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類本質(zhì)的特征。這就是特征提取和選擇的過程。人臉圖像訓(xùn)練模塊完成對現(xiàn)有人臉圖像庫的訓(xùn)練,得到參數(shù)以供識別模塊使用。識別模塊根據(jù)訓(xùn)練所得的參數(shù)完成人臉的最后識別工作。識別的過程實際上就是分類決策的過程。分類決策就是在特征空間中把被識別的對象歸為某一類別,基本做法是在樣本訓(xùn)練集中確定某個判決規(guī)則,使按這種判決規(guī)則對被識別對象進(jìn)行分類所造成的錯誤識別率最小或引起的損失最小。2人臉圖像的預(yù)處理與人臉器官的定位2.1人臉圖像的預(yù)處理圖像處理就是用一系列的特定的操作來改變圖像的像素值,以達(dá)到特定的目標(biāo),比如使圖像更清晰,或從圖像中提取某些特定的信息等。外界獲取的人臉圖像,由于會受到各種因素的干擾和影響,因而導(dǎo)致了圖像質(zhì)量的下降,而人臉識別又對圖像有較高的要求,因此我們必須事先對人臉圖像進(jìn)行預(yù)處理,對圖片位置不理想的圖像我們必須對圖像進(jìn)行幾何平移,對于含有噪聲的圖像,必須要除去其噪聲的干擾,同時我們在這個過程還必須對圖像實現(xiàn)灰度化,以方便后續(xù)的檢測和識別步驟。由此可見,圖像的預(yù)處理過程就是為了達(dá)到改善圖像的質(zhì)量,將圖像變換成便于人們觀察、適于機(jī)器識別的目的。所以說決定檢測和識別率高低的另外一個重要因素就是圖像預(yù)處理的好壞,其中包括圖像去噪音等對圖像質(zhì)量的影響,顏色空間的轉(zhuǎn)換,RGB顏色空間到Y(jié)CrCb顏色空間,使亮度分量和色度分量盡可能的獨立,相互不干擾,彩色圖像的灰度化。圖像灰度化流程如圖2-1。預(yù)處理包括銳化,二值化處理,噪聲去除三個步驟。圖2-1圖像灰度化一般流程圖灰度處理前后圖像對比如下圖所示。圖2-2彩色圖像圖2-3灰度圖像圖像的采集通常人臉信息的來源有以下幾種方式:1通過掃描儀對照片的掃描2通過數(shù)碼相機(jī)對人臉的拍攝3Internet上各種免費提供的數(shù)據(jù)庫。人臉圖像的采集需要在弱光源環(huán)境并且人臉部無明顯遮蓋物,人臉部表情不能太夸張,下面是一些標(biāo)準(zhǔn)的人臉圖像模版。圖2-4人臉數(shù)據(jù)庫模版銳化如果直接對輸入的人臉圖像進(jìn)行二值處理的話,產(chǎn)生的二值圖像的輪廓可能不夠清楚,因此在圖像識別的過程中非常需要突出邊緣或輪廓,圖像銳化就是增強(qiáng)圖像的邊緣或輪廓,使圖像邊緣更加清晰。在本文中采用的是常用的梯度銳化法,對于圖像gx,y在x,y處的梯度定義為:(2-1)梯度是一個矢量,其大小和方向為:(2-2)(2-3)為簡化梯度的計算,使用。對于一幅圖像中的突出的邊緣區(qū),其梯度值較大;對于平滑區(qū),梯度值較小;對于灰度級為常數(shù)的區(qū)域,梯度為零。圖2-5和圖2-6是人臉原圖像和經(jīng)過銳化處理后的圖像。圖2-5原灰度圖像圖圖2-6銳化后的圖像二值化處理人臉圖像輸入后的操作是二值化處理,通過二值化處理是把灰度圖轉(zhuǎn)化為單色黑,白圖像,二值化的關(guān)鍵是找出一個合理的閡值,在人臉識別中二值化用來把人的頭發(fā)、眼睛、臉的輪廓及背景以及人臉的亮域分開。(1)二值化的數(shù)學(xué)表示圖像的二值化一般按下述公式進(jìn)行:(2-4)公式中g(shù)x,y是原圖像中位于x,y處像素的灰度,是二值化后該處的像素值,它只能取1白或0黑,在人臉圖像二值化過程中,圖像數(shù)值為0的部分為背景,數(shù)值為1的部分表示人臉,T是二值化處理過程的閩值。二值化的關(guān)鍵在于閾值的選擇,通常用一個三元函數(shù)的閾值算子來表示閩值(2-5)式中x,y是圖像象素坐標(biāo),是x,y的灰度電平,是x,y周圍局部灰度特性。(2)直方圖在數(shù)字圖像處理中,一個最簡單和最有用的工具是圖像的灰度直方圖,該函數(shù)概括了一幅圖像的灰度級內(nèi)容和圖像可觀的信息?;叶戎狈綀D反映了一幅圖像中各灰度的像素出現(xiàn)的頻率。以灰度級為橫坐標(biāo),灰度級的頻率為縱坐標(biāo),繪制的頻率和灰度級的關(guān)系圖就是灰度直方圖。它是圖像的重要特征,反映了圖像灰度的分布情況。灰度直方圖可以用來幫助確定圖像二值化的閾值,在灰度直方圖上,對象物和背景部分的灰度級上集中著許多像素,從而形成了兩個山峰,可以說很多圖像的灰度直方圖上峰形都有這樣的兩個山峰形的分布。這樣的灰度直方圖具有雙峰性,山峰和山峰之間存在谷底。如果圖像的灰度存在雙峰性,那么分割對象物和背景的閾值一般選在谷底。(3)二值化閾值的確定二值化閾值將人臉圖像的像素分為兩組集合,一組的灰度低于該閾值,另一組的灰度高于該閾值,二值化問題的關(guān)鍵就在于如何精確的找出閾值,也就是兩組灰度集合的最佳分離值。我們采用的是類間方差分析法對圖像進(jìn)行二值化處理的。類間方差分析法是基于對邊緣處理后的圖像邊緣灰度值較高,可通過閾值前后的類間方差和類內(nèi)方差的比較,最大值處就是可選的閾值。算法假設(shè)圖像有1,2,3.....L級灰度,設(shè)閾值為k,把給定區(qū)域的像素分為具有k以上灰度值的像素和小于k的像素兩類。分別計算像素數(shù)目、平均灰度值、方差,然后用類間方差與類內(nèi)方差之比,求出類間方差最大時對應(yīng)的K值,作為圖像的閾值。程序中算法具體實現(xiàn)步驟描述如下:對于類1,將像素數(shù)、平均灰度值、方差定義為,,對于類2,將像素數(shù)、平均灰度值、方差定義為,,1計算出邊緣增強(qiáng)后的灰度直方圖Histi2根據(jù)定義分別計算出類1與類2的像素數(shù)、灰度平均值和方差類1像素數(shù)(2-6)平均灰度值(2-7)方差(2-8)同理可以計算出類2的像素數(shù)、灰度平均值和方差。3計算相應(yīng)的類間方差類內(nèi)方差(2-9)類間方差(2-10)求得使為最大值的K,即為所選擇的閾值。人臉圖像噪聲去除經(jīng)過處理的圖像中,可能有許多孤立的黑點(又稱為噪聲,而這些噪聲對于人臉的定位以及特征提取都有一定的影響,所以必須對它們進(jìn)行噪聲處理,盡可能減少噪聲的影響。本文中采用了“梯度倒數(shù)加權(quán)平滑法”和“中值濾波”兩種方法相結(jié)合,以去除噪聲。(1)梯度倒數(shù)加權(quán)平滑法根據(jù)觀察,圖像在一個區(qū)域內(nèi)的灰度變化要比在區(qū)域之間小,在邊緣處的梯度的絕對值要比區(qū)域內(nèi)部的絕對值高,在一個n*n的窗口內(nèi),若把中心像素點與各鄰點之間梯度絕對值的倒數(shù)定義為各鄰點的加權(quán)值,則在區(qū)域內(nèi)部的鄰點加權(quán)值大,而在一條邊緣旁的和位于區(qū)域外的那些鄰點的加權(quán)值小。這樣對加權(quán)后的n*n鄰域內(nèi)進(jìn)行局部平均,可使圖像得到平滑,又不至使邊緣和細(xì)節(jié)有明顯模糊,為使平滑后的像素的灰度值在原圖灰度范圍內(nèi),可以采用歸一化的梯度倒數(shù)作為加權(quán)值,具體算法如下:設(shè)點x,y的灰度值為fx,y,在它的3*3鄰域內(nèi),定義梯度倒數(shù)為(2-11)這里i,j-1,0,1但i和j不能同時為0,計算x,y同8個鄰點的gx,y,i,j值,若fx+i,y+jfx,y,梯度為0,則定義gx,y,i,j2,因此gx,y,i,j的范圍在[0,2]之間,定義一個歸一化的權(quán)重矩陣W作為平滑后的掩模,W為:(2-12)用模板中心點逐一對準(zhǔn)圖像每一像素x,y,在每一像素處將模板元素和它所“壓上”的圖像像素值對應(yīng)相乘,再求和,即求內(nèi)積,就是該象素平滑后的輸出gx,y。在實際處理時,因為圖像邊框像素3*3鄰域內(nèi)會超出像幅,無法確定輸出結(jié)果。因此采取邊框像素結(jié)果強(qiáng)迫置0的方法進(jìn)行處理。(2)中值濾波經(jīng)過平滑處理后,人臉中的大多數(shù)噪聲被去除掉了,但仍可能存在少許孤立的噪聲,為了進(jìn)一步去除這些噪聲,我們可以進(jìn)一步采用中值濾波進(jìn)行處理。中值濾波和其他的平滑處理技術(shù)相比較,有以下優(yōu)點:1降低噪聲的效果比較明顯。2在灰度值變化比較小的情況下,可以得到比較好的平滑效果。3降低了圖像邊界的模糊程度。一組按大小順序排列的數(shù)組,中間位置上的數(shù)據(jù)稱為中值,將模板內(nèi)一般是3*3像素內(nèi)的9個像素的灰度值由小到大排列,按其排列順序選取第5個位置上的灰度值中值作為濾波后該像素點上的灰度值。圖2-7經(jīng)二值化及平滑處理后的圖像2.2人臉器官的定位人臉左右兩端邊界的測定設(shè)所處理的圖像為Ix,y,其大小為M*N,則該圖像的垂直積分投影函數(shù)為:(2-13)PVx稱為垂直積分投影函數(shù),觀察不同單人圖像的垂直積分投影曲線,可以發(fā)現(xiàn)人臉?biāo)趨^(qū)域使垂直積分投影曲線形成一個具有一定寬度的凸峰。這個凸峰的左右邊界大致代表了人臉的左右邊界,這是因為與背景相比,人臉區(qū)域往往具有較高的亮度,在經(jīng)過二值化后的圖像中,人臉區(qū)域灰度值為1――白與背景灰度值為0――黑分離開來。在人臉左右邊界處,垂直方向上亮度值的總和迅速減小,形成一個明顯的凸峰。因此只要確定垂直積分投影曲線中主要凸峰的左右邊界,就能得到人臉的左右邊界。在算法實現(xiàn)上,假設(shè)人臉的左邊界不超出[0,a]a,1,實驗中取a0.7,求出曲線x在[0,a]段上具有最大梯度值的點記為,即是人臉的左邊界;再求曲線在[x,a]段的最小梯度值的點記為,即是人臉的右邊界。人臉的水平積分投影人臉的眉、眼、鼻孔、嘴區(qū),從灰度分布上來看,比周圍區(qū)域暗,因此如對人臉作水一平積分投影:(2-14)則在眉、眼、鼻孔、嘴區(qū)的水平位置分別會出現(xiàn)一個極小值,這是因為人臉圖像中眉毛,眼睛,鼻子,嘴巴這些主要特征點的像素灰度值比較小,二值化以后有明顯的黑區(qū),因此在水平投影圖上的峰谷變化中便可以確定各主要特征點的大致分布位置。如圖2-8所示,跟據(jù)各谷點之間的位置關(guān)系,可確定眉、眼、鼻孔、嘴區(qū)等器官的水平位置。1如果,,,分別對應(yīng)眉、眼、鼻孔、嘴巴區(qū)的水平位置,則2如果第一個谷點與第二個谷點之間的距離大于第二個谷點與第三個谷點之間的距離,則第一個谷點被認(rèn)為是眼睛的水平位置。3如果第一個谷點與第二個谷點之間的距離小于第二個谷點與第三個谷點之間的距離,則第三個谷點被認(rèn)為是嘴的水平位置。圖2-8眉、眼、鼻孔、嘴區(qū)等器官的水平位置確定一旦眼、嘴水平位置確定后,便可獲得這兩者之間的垂直距離h,令w0.8*h,便可確定臉區(qū)h和w分別對應(yīng)臉區(qū)的高和寬,其中臉區(qū)的上,下邊分別落在眼,嘴之上。圖2-9臉區(qū)的確定嘴中心點的確定欲確定嘴中心點,必須首先要確定嘴所在的區(qū)域,即嘴區(qū)。嘴區(qū)可由臉區(qū)來確定。本文中把臉區(qū)下邊中心點作為嘴區(qū)中心點,嘴區(qū)的高由鼻與嘴之間的垂直距離來確定,寬則由臉區(qū)的寬來確定。數(shù)學(xué)形態(tài)學(xué)是基于形狀集合理論而提出的,用數(shù)學(xué)形態(tài)學(xué)算子對圖像進(jìn)行處理,不需要計算每個點的局部特征,方法簡單,所以速度快且抗噪聲能力比較強(qiáng)。下面將數(shù)學(xué)形態(tài)學(xué)理論和人臉圖像的水平、垂直積分投影相結(jié)合,用來定位人臉的各主要器官。在數(shù)學(xué)形態(tài)學(xué)中有四個常用的基本算子:腐蝕、膨脹、開和閉。運算過程中,僅有被分析的圖像X和結(jié)構(gòu)元素B參與,其中B的形狀是影響運算結(jié)果的關(guān)鍵因素。腐蝕、膨脹設(shè)X和B為二維歐氏空間中的兩個集合,對于二值圖像,設(shè):(2-15)上世表示X平移b而得到的圖像。則腐蝕和膨脹的定義分別為:(2-16)(2-17)對于灰度圖像,情況大致類似,腐蝕和膨脹的定義分別為:腐蝕:(2-18)膨脹:(2-19)其中為結(jié)構(gòu)元素B的支撐集。由此可看出,二值圖像的腐蝕和膨脹實際上分別對應(yīng)于求“與”運算和“或”運算,而灰度圖像的腐蝕和膨脹分別對應(yīng)在運算集內(nèi)求最小值和最大值。開和閉開和閉運算是基于腐蝕和膨脹運算的基礎(chǔ)上的,開定義為先腐蝕后膨脹,而閉定義為先膨脹后腐蝕,即開:XBXBB(2-20)閉:XBXBB(2-21)二值圖像和灰度圖像的開和閉運算相同,一般來說,開運算將會濾除圖像中的孤立噪聲點和磨平目標(biāo)表面的尖峰,而閉運算則會填平目標(biāo)表面的凹陷。人臉檢測是一個復(fù)雜而具有挑戰(zhàn)性的問題,Yang等將人臉檢測定義為:任意給定一個圖像,人臉檢測的目的就在于判定該圖像中是否存在人臉。如果存在,就返回其位置和空間分布。人臉器官的定位是人臉識別中很重要的一個環(huán)節(jié),其目的是將背景、頭發(fā)、服裝等對人臉識別無用或造成干擾的冗余信息去除,人臉器官定位的準(zhǔn)確性將直接影響到后續(xù)的特征抽取與人臉識別。本文采用的是通過對二值化人臉圖像的垂直積分投影,跟據(jù)曲線的凸峰寬度確定人臉的左右邊界;然后利用二值化人臉圖像的水平積分投影和基于數(shù)學(xué)形態(tài)學(xué)的理論,進(jìn)一步確定眉毛,眼睛,鼻孔,嘴巴等器官的位置。這種方法快速簡單,可滿足弱實時應(yīng)用。輸入圖像經(jīng)過人臉檢測后,獲得了人臉在圖像中的大致位置,下面我們根據(jù)人臉的結(jié)構(gòu)特點和數(shù)學(xué)形態(tài)學(xué)來描述人臉結(jié)構(gòu)定位的方法。如圖2-10所示,用數(shù)學(xué)形態(tài)學(xué)運算對嘴區(qū)進(jìn)行分割處理,便可確定嘴中心點。設(shè)嘴區(qū)原始圖像為I:1對I進(jìn)行腐蝕運算,得IeIB;2用I減去Ie,取反,得圖像Ie'255-I-Ie,并對之進(jìn)行二值化得圖像Ib;3對Ib進(jìn)行結(jié)構(gòu)閉運算,得IcIe'*B;4對Ic進(jìn)行區(qū)域標(biāo)識,保留最大區(qū),并求出該最大區(qū)的最左端點,和最右端點,,則嘴巴的中心點可確定為x,y,其中:x1/2+y1/2+圖2-10嘴中心點的確定人臉中軸線的求取盡管人臉形狀各不相同,如圓臉,長臉,方臉等,但一般來講都具有良好的對稱性,其對稱軸為通過雙眼中心點和嘴中心點的連線。設(shè)Fx,y,θ表示一個與臉區(qū)同樣尺寸的矩形區(qū),它的下邊中心點為x,y,其中心軸fθ與垂直方向的夾角為。,且fθ將Fx,y,θ平分為A,B兩個區(qū),如果x,y點為嘴的中心點,則一旦θ角確定,人臉中軸線便可確定下來。設(shè)Pi∈A,Pi’∈B,且Pi,Pi’關(guān)于f(θ)對稱,則A,B兩個區(qū)所有對應(yīng)點的誤差絕對值之和(2-22)如果人臉的中軸線傾斜角為θ,則ASE(x,y,θ)將達(dá)到極小,即當(dāng)時,θθf由于用數(shù)學(xué)形態(tài)學(xué)運算求得的初始嘴中心點可能與真實嘴中心點存在幾個像素的距離的誤差,因此需要對初始嘴中心點進(jìn)行調(diào)整才能獲得較為準(zhǔn)確的人臉中軸線,調(diào)整的具體方法是:將初始嘴中心點向左,右各平移若干像素,在每平移一次時,求出一個極小的ASEx,y,θ,最后在這些極小的ASEx,y,θ中求出最小值,此時θ即為最終的人臉中軸線的傾斜角,且中軸線經(jīng)過調(diào)整后的嘴中心點。人臉橢圓結(jié)構(gòu)定位當(dāng)人臉中軸線,嘴中心點及眼與嘴之間的垂直距離被確定后,便可用一橢圓標(biāo)示出該人臉結(jié)構(gòu)的位置,該橢圓的長軸與人臉中軸線重合,設(shè)嘴中心點的坐標(biāo)為x,y中軸線的傾斜角為θ,眼到嘴的垂直距離為h,則兩眼之間的中心點坐標(biāo)x’,y’為:x’x-h*tanθy’y-h我們?nèi)↑c(x’,y’)為人臉橢圓的中心,則橢圓的半長軸,半短軸分別為:a1.5*h/cosθbh/cosθ這樣就可以定位出人臉橢圓,如圖2-11:圖2-11人臉橢圓結(jié)構(gòu)定位瞳孔的精確定位前面我們通過人臉圖像的水平方向投影,確定了眼睛等主要特征點的位置,由于瞳孔是人臉識別中最重要的特征,因此瞳孔定位的準(zhǔn)確性是決定了系統(tǒng)識別率高低的關(guān)鍵。傳統(tǒng)的瞳孔定位方法是采用投影法確定瞳孔的位置,下面我們用圓形模版匹配法對瞳孔進(jìn)行進(jìn)一步的精確定位。算法如下:考慮到眼球所在的位置是具有較低灰度值像素最集中的區(qū)域,而且近似于圓形,跟據(jù)這一特性,采用半徑為5的圓形模板,在眼部區(qū)域內(nèi)的小窗口內(nèi)自左向右,自上而下動態(tài)搜索瞳孔的位置。以左眼為例,其數(shù)學(xué)表達(dá)式如下:(2-23)式中,m,n為圓上的點,lpbufferx,y為圖像在(x,y)處的像素灰度值,Dx,y為在(x,y)點處圓形模板下的所有像素灰度值之和。通過公式求出最小值的模板數(shù)值所對應(yīng)的x,y坐標(biāo),即為左眼瞳孔的精確位置。同樣可以求出右眼瞳孔的精確位置。3人臉特征的提取特征的選擇和提取是模式識別的一個關(guān)鍵問題,由于在很多情況下常常不容易找到那些最重要的特征,這就使特征的選擇和特征的提取的任務(wù)復(fù)雜化而成為構(gòu)造模式識別系統(tǒng)的最困難的任務(wù)之一。特征的選擇和提取的基本任務(wù)是如何從許多特征中找出那些最有效的特征,人們通常用物理和結(jié)構(gòu)特征來識別對象,因為這樣的特征容易被視覺、觸覺和其他感覺器官所發(fā)現(xiàn)。但在使用計算機(jī)去構(gòu)造識別系統(tǒng)時應(yīng)用這些特征是比較復(fù)雜,而機(jī)器在抽取數(shù)學(xué)特征的能力方面則又比人強(qiáng)的多。因此我們討論的重點是根據(jù)學(xué)習(xí)樣本來選擇并提取數(shù)學(xué)特征。特征的選擇和提取一般分成三個步驟:特征的形成,特征的提取,特征的選擇。根據(jù)被識別的對象產(chǎn)生出一組基本特征,當(dāng)識別對象是人臉數(shù)字圖像時,原始測量就是各點灰度值,但很少有人用各點灰度值作為特征,而是經(jīng)過計算產(chǎn)生一組原始特征。原始特征的數(shù)量可能很大,或者說樣本是處于一個高維空間中,通過映射或變的方法可以用低維空間表示樣本,這個過程叫特征提取。提取后的特征叫二次特它們是原始特征的某種組合通常是線性組合。所謂特征提取在廣義上講就是一種變換。若Y是測量空間,X是特征空間,則變換A:Y→X就叫做特征提取器。從一組特征中挑選出一些最有效的特征以達(dá)到降低維數(shù)的目的,這個過程叫特征選擇。特征選擇的標(biāo)準(zhǔn)為:(1)可區(qū)別性(2)可靠性(3)獨立性(4)數(shù)量少。目前常用的人臉特征的選擇和提取的方法有以下幾種:1基于幾何特征的方法這類方法一般是通過提取人眼、口、鼻等重要特征點的幾何形狀作為分類特征,將人臉用一個幾何特征矢量表示,然后用模式識別中層次聚類的思想設(shè)計分類器達(dá)到識別目的。幾何特征矢量是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量通常包含人臉兩點間的歐氏距離、曲率、角度等。這種提取方法有好多優(yōu)點,例如,在一個好的定位算法的支持下,計算機(jī)可以很快的對這些幾何特征進(jìn)行計算,而且得到的這些特征占用也不會占有很多內(nèi)存。但是,為了能夠計算出各幾何特征的準(zhǔn)確值,必須要求輸入圖像的質(zhì)量很好。當(dāng)人臉圖像被腐蝕,或者人臉區(qū)域被遮擋(即含有一些噪聲)時,提出的幾何特征不再準(zhǔn)確,也就不再適合作為識別的依據(jù)了。盡管我們可以對該圖像進(jìn)行相關(guān)的預(yù)處理(如圖像恢復(fù)、均衡化等),來保證提出特征的效果。但是預(yù)處理過程會相當(dāng)復(fù)雜。早在20十幾八十年代,人們就開始采用盲源分離(Blindsourceseparation,即BSS)的方法來對信號進(jìn)行分離,這種方法算得上是ICA方法的雛形。在1994年,P.Comon第一次正式提出了ICA方法。該方法的核心思想是從消除信息相關(guān)性的角度來對數(shù)據(jù)進(jìn)行分析處理,使得變換以后的得到的新數(shù)據(jù)之間相互獨立。從那以后,人們搜索出了很多不同的ICA實現(xiàn)方法,其中比較成功的有:Bell和Sejnowski根據(jù)信息最大化原則的提出的Info算法;Hyvarinen根據(jù)負(fù)熵最大的原則提出了一個固定點算法。總的來說,從最初ICA的思想被成功地應(yīng)用在盲信號分離上之后,ICA方法已經(jīng)得到廣泛的應(yīng)用。2基于代數(shù)特征的方法人臉的代數(shù)特征是人臉圖像的代數(shù)特征矢量表示,即人臉圖像在“特征臉”張成的低維空間中的投影。人臉的代數(shù)特征就是人臉的統(tǒng)計特征。最早人們把主成分析中的子空間思想引入到人臉識別中,并取得了很大的成功,隨后,子空間分析方法受到人們的廣泛關(guān)注,成為當(dāng)前人臉識別的主流方法之一。子空間方法的思想就是根據(jù)一定的性能目標(biāo)來尋找線性或非線性的空間變換,并把原始信號數(shù)據(jù)壓縮到低維子空間,使數(shù)據(jù)分布更加緊湊,為數(shù)據(jù)的更好描述提供了支持,另外,通過降維,使得后續(xù)的計算處理工作的復(fù)雜度大大降低。子空間方法亦可分為線性子空間方法和非線性子空間方法。線性子空間方法就是利用線性的空間變換,將原始的人臉圖像數(shù)據(jù)壓縮到一個低維的子空間中。常見的線性子空間方法有:主成分分析(PCA)、線性判別分析(LDA)和獨立成分分析(ICA)。其中,PCA是本文重點討論的。這里對LDA和ICA方法進(jìn)行簡要說明。LDA方法是以樣本可分性為目標(biāo)的,其思想是從高維特征空間里提取出最有判別能力的低維特征,這些低維特征使得每類類內(nèi)離散度最?。ㄊ沟猛粋€類別的所有樣本聚集在一起),同時使得類間的離散度達(dá)到最大(使得不同類別的樣本盡量分開)。經(jīng)典的LDA方法是使用Fisher準(zhǔn)則函數(shù),所以又稱LDA分析又稱FisherLDA(FLDA)方法。但是,由于FLDA方法往往需要大量的樣本,這使得該方法的計算復(fù)雜度大大增加。目前,有很多研究在嘗試使用FLDA來進(jìn)行小樣本的識別?;诰€性子空間分析人臉特征提取,實際上只是把人臉圖像中存在的表情、姿態(tài)以及光照等復(fù)雜的變化進(jìn)行了線性簡化,因此很難對人臉進(jìn)行充分的描述。3基于神經(jīng)網(wǎng)絡(luò)的方法這類方法將人臉直接用灰度圖二維矩陣表征,并且利用了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和分類能力。它的優(yōu)點在于保存了人臉圖像的材質(zhì)信息和形狀,而且神經(jīng)網(wǎng)絡(luò)可以通過學(xué)習(xí)的過程獲得人臉的規(guī)律的隱性表達(dá),同時避免了較為復(fù)雜的特征提取工作,但是普遍存在的問題是識別識別率低,過程復(fù)雜。本文采用的是基于PCA的特征提取方法,本方法首先對定位圖像進(jìn)行規(guī)范化處理,接著采用PCA技術(shù)將高維的輸入模式空間變換到另一個低維空間,保留了人臉特征的主要信息。人臉識別主要依據(jù)人臉上的特征,而且不同的個體之間存在較大差異,因此在人臉圖像進(jìn)行特征的選擇和抽取之前一般需要做圖像的規(guī)范化處理,也就是根據(jù)人臉定位結(jié)果把圖像中人臉變換到同一位置和同樣大小,以達(dá)到位置校正的目的。假定已根據(jù)分割定位算法得到了人臉正面圖像左、右兩眼的位置,并分別記為E1和Er,則可通過以下步驟達(dá)到圖像位置校正的目的。1根據(jù)前面所講的方法,進(jìn)行圖像的旋轉(zhuǎn),以使E1和Er的連線保持水平。2根據(jù)圖3-1所示的比例關(guān)系,進(jìn)行圖像的裁剪。設(shè)O點為ErE1的中點。且d|ErE1|,經(jīng)過裁剪可以保證O點位于0.5d,d處,這保證了人臉位置的一致性。3進(jìn)行圖像縮小和放大變換,得到統(tǒng)一大小的校準(zhǔn)圖像。規(guī)定圖像大小為128*128像素點,則縮放倍數(shù)為2d/128,這使得d|ErE1|為定長64個像素,這保證了人臉大小的一致性。經(jīng)過以上步驟,不僅在一定程度上獲得了人臉表示的幾何不變性,還基本上消除了頭發(fā)和背景的干擾。圖3-1人臉圖像裁剪比例在對人臉圖像進(jìn)行幾何規(guī)范化以后,需要對圖像進(jìn)行灰度拉伸,以改善圖像的對比度,灰度規(guī)范化是指對圖像進(jìn)行光照補(bǔ)償?shù)忍幚?,光照補(bǔ)償能夠在一定程度上克服光照變化的影響而提高識別率。在灰度規(guī)范化中,我們采用三次內(nèi)插法,該方法利用三次多項式Sx來逼近理論上的最佳插值函數(shù)sinx/x.其數(shù)學(xué)表達(dá)式為:(3-1)上式x是周圍像素沿坐標(biāo)方向的距離,待求像素Xy的灰度值由其周圍十六個點的灰度值加權(quán)內(nèi)插得到,可推導(dǎo)出待求像素的灰度計算式如下:(3-2)圖3-2規(guī)范化后的人臉圖像這種算法計算量比較大,但內(nèi)插效果比較好,精度最高。圖3-2為經(jīng)過幾何規(guī)范化和灰度規(guī)范化處理后的人臉圖像。3.3基于PCA的人臉特征提取通常由圖像直接獲得的數(shù)據(jù)量是很大的,為了有效地進(jìn)行分類識別,就要對原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類本質(zhì)的特征,這就是特征的提取和選擇的過程。我們把原始數(shù)據(jù)組成的空間叫測量空間,把分類識別賴以進(jìn)行的空間叫特征空間。通過變換,可以把維數(shù)較高的測量空間中表示模式變?yōu)樵诰S數(shù)較低的特征空間的表示模式。在特征空間中的一個表示模式也叫做一個樣本,它往往表示成一個向量,即特征空間中的一個點。人臉圖像可以看作是一個矢量,如圖3-3所示,如果圖像的高度和寬度分別為h和w,則對應(yīng)的矢量維數(shù)為w*h,人臉矢量屬于一個空間,稱為是圖像空間。圖3-3人臉矢量示意圖由于每個人臉都非常類似,在相同的位置都有兩只眼睛,一個嘴巴,一個鼻子等等,所以在圖像空間里所有的人臉矢量都聚集在一個狹窄的區(qū)域內(nèi)如圖3-4所示,所以整個圖像空間不是人臉描述的一個優(yōu)化空間,PCA主元分析法的任務(wù)就是構(gòu)造一個能更好描述人臉的人臉空間,降低空間維數(shù),使新的人臉空間的基向量又叫主元能更好地描述典型的人臉模式。圖3-4人臉空間示意圖PCA主元分析法又稱Karhunen-LoeceKL變換,它的目的是降維,人臉空間是典型的高維空間,一個128*128像素的人臉若視為向量,就有16384維,運算極不方便。若將人臉看作是平穩(wěn)的高斯過程,就可以利用KL變換提取主兀,達(dá)到降維的目的。KL變換是圖像壓縮的一種最優(yōu)化變換,高維的圖像空間經(jīng)過KL變換后得到一組新的正交基主元,保留其中最重要的正交基,由這些正交基可以組成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,那么就可以把這些投影用作識別的特征向量。這就是PCA的主要思想。PCA最早是由統(tǒng)計學(xué)發(fā)展過來的,然后就被用在人工神經(jīng)網(wǎng)絡(luò)理論中,所以對PCA的理論描述可以從兩方面進(jìn)行,一種是從人工神經(jīng)網(wǎng)絡(luò)理論這個角度來理解,這樣相對來講比較直觀。另一種就是從統(tǒng)計學(xué)角度來理解,這就比較嚴(yán)格,比較難懂,因為這是嚴(yán)格的按照數(shù)學(xué)的理論來推導(dǎo)出來的。主元分析神經(jīng)網(wǎng)絡(luò)從人工神經(jīng)網(wǎng)絡(luò)理論來看,線性自相關(guān)矩陣存儲器LAMM可以看作是一種主元分析神經(jīng)網(wǎng)絡(luò),它的目的是產(chǎn)生一個最接近于輸入鍵的已存儲鍵的反應(yīng),在這里鍵可看作是一張人臉。LAMM由一個神經(jīng)網(wǎng)絡(luò)層構(gòu)成,每個神經(jīng)元與人臉矢量中的一個元素相對應(yīng),每層包含w*h個神經(jīng)元,且每個神經(jīng)元與所有其它神經(jīng)元相連。如圖3-5所示:圖3-5線性自相關(guān)記憶的結(jié)構(gòu)示意圖LAMM在訓(xùn)練過程中采用windrow-Hoff規(guī)則不斷改變權(quán)值使誤差達(dá)到最小,在LAMM中windrow-Hoff'規(guī)則可以用下式描述:(3-3)式中為輸入人臉向量的第i個元素;為第j個神經(jīng)元的輸出;為第i個神經(jīng)元和第j個神經(jīng)元之間的權(quán)值;η為學(xué)習(xí)因子;t為反復(fù)訓(xùn)練次數(shù)的編號。在LAMM中是輸入的期望輸出,上式說明了如果權(quán)值產(chǎn)生的結(jié)果和預(yù)期不同的話,,那么權(quán)值將要改變,整個學(xué)習(xí)的過程是一個反復(fù)進(jìn)行的過程。設(shè)Iw*h為人臉像素個數(shù),也為人臉矢量維數(shù),K是訓(xùn)練集中人臉總數(shù),X是維數(shù)為I*K的訓(xùn)練集矩陣,其中第K列向量對應(yīng)訓(xùn)練集中第k個人臉且被歸一化,W為維數(shù)I*I的權(quán)值矩陣,那么上面的學(xué)習(xí)規(guī)則又可寫為:(3-4)上式說明此規(guī)則的收斂性。矩陣X可寫成XP*Δ*,其中P為矩陣X*的特征向量矩陣,Q為矩陣*X的特征向量矩陣,,A是包含矩陣X*特征值的對角特征,定義:P*I,Q*I,I為單位矩陣,則由上式可得到:所以上面規(guī)則又可寫為:(3-5)若取,為矩陣的最大值,則輸出又可看成由和兩部分組成,其中x為一人臉矢量,o為輸出人臉重構(gòu)臉,y是中間形式,即矩陣P把人臉矢量x從圖像空間轉(zhuǎn)換到人臉空間中的矢量y,矩陣P的列矢量就是人臉空間的基稱為主元,表示中間形式的神經(jīng)網(wǎng)絡(luò)如圖3-6所示,其中,通常K小于w*h,所以新構(gòu)成的人臉空間的維數(shù)比圖像空間減少了。圖3-6表示中間形式的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(2)K-L變換的數(shù)學(xué)理論一幅大小的人臉圖像按列相連而構(gòu)成一個維的矢量,即:,它可被看作是維空間中的一個點。由于人臉結(jié)構(gòu)的相似性,當(dāng)把很多這樣的人臉圖像歸一化之后,這些圖像在這一超高維空間中不是隨機(jī)散亂分布的,而是存在某種規(guī)律。因此可以通過K-L變換用一個低維子空間來描述人臉圖像,同時又能保存所需的信息。我們以歸一化后的標(biāo)準(zhǔn)圖像作為訓(xùn)練樣本集,以該樣本的總體散步矩陣為產(chǎn)生矩陣,即:(3-6)或(3-7)式中為第i個訓(xùn)練樣本的圖像向量,u為訓(xùn)練樣本集的平均圖向量,M為訓(xùn)練樣本的總數(shù)。為了求維矩陣的特征值和正交歸一的特征向量,直接計算是很困難的,為此我們利用了數(shù)學(xué)上的SVD(奇異值分解)定理。(SVD)定理:設(shè)A是一秩為r的n*r維矩陣,則存在兩個正交矩陣:(3-8)(3-9)以及對角矩陣且。容易求出其特征值及相應(yīng)的正交歸一特征向量i0,1,2......M-1。上述推論可知,的正交歸一特征向量為:i0,1,2,......M-1(3-10)這就是圖像的特征向量,它是通過計算較低維矩陣R的特征值與特征向量而間接求出的。(3)特征臉在PCA主元分析法中是將整個圖像作為一體,從中提取代數(shù)特征。它可以用于模式識別的多個領(lǐng)域,如指紋識別,文字識別,人臉識別等。它的依據(jù)就是從一個矩陣中提取的特征值能夠反映該矩陣的主要特征,而且事實也證明了這種方法的有效性。PCA具體實現(xiàn)時,首先從樣本圖像中提取一個能夠反映整體樣本的協(xié)方差矩陣,然后計算該矩陣的特征值,根據(jù)這些特征值對應(yīng)的特征向量,構(gòu)造一個特征矩陣,在樣本固定的情況下,這個特征矩陣也是固定的,而一旦樣本庫發(fā)生變化,就要重新構(gòu)造這個特征矩陣。特征矩陣中的特征向量張成一個特征空間,該空間中的任一點都對應(yīng)著一幅圖像,由于與這些特征向量所對應(yīng)的圖像很象人臉,所以這些特征向量又被稱為特征臉。這樣任何一幅圖像向該特征空間投影都會得到一組坐標(biāo)系數(shù),這組坐標(biāo)系數(shù)表明了該圖像在特征空間中的位置,也稱為特征系數(shù),在識別過程中將主要針對這組特征系數(shù)進(jìn)行。PCA進(jìn)行人臉特征提取的目標(biāo)就是從人臉樣本庫中提取出一個特征矩陣,該特征矩陣的每一列都表示庫中圖像的一個特征。所以Cigenface是把一批人臉圖像轉(zhuǎn)換成一個小的特征向量集,它們是最初訓(xùn)練圖像集的基本組件,識別的過程就是把一幅新的圖像投影到Eigenface所定義的子空間。這樣,每一幅人臉圖像都可以投影到由特征向量Uo,Ut,Ur-1張成的子空間中,因此每一幅人臉圖像對應(yīng)于子空間的一個點,同樣子空間的任一點也對應(yīng)于一幅圖像。這里Uo,Ut,Ur-1,構(gòu)成了特征空間的基,即特征臉如圖3-7所示。圖3-7特征臉通過KL變換進(jìn)行人臉識別的方法叫“特征臉”方法,有了這樣一個由“特征臉”形成的降維子空間,任何一幅人臉圖像都可以向其做投影并獲得一組坐標(biāo)系數(shù),這組系數(shù)表明了該圖像在子空間中的位置,從而可以作為人臉識別的依據(jù)。換句話說,任何一幅人臉圖像都可以表示為這組“特征臉”的線性組合,其加權(quán)系數(shù)即是KL變換的展開系數(shù),也可稱為該圖像的代數(shù)特征。綜上所述,通過KL變換,我們可以有效的提取出人臉的特征。PCA法仍然將人臉用特征向量表示,只不過用的是代數(shù)特征向量,即人臉圖像在“特征臉”張成的子空間上的投影。因此PCA法的實質(zhì)就是根據(jù)一組人臉訓(xùn)練圖像構(gòu)造主元子空間,識別時將測試圖像投影到主元子空間上,得到一組投影坐標(biāo)系數(shù),再和各個己知人的人臉圖像進(jìn)行比較識別。對于任一待識別樣本f,也可通過向“特征臉”子空間透影求出其系數(shù)向量:,其重建圖像,考慮重建圖像的信噪比:(3-11)如果其小于閾值θ,則可判斷出f不是人臉圖像。3主元個數(shù)的選取綜上所述,我們得到了M個特征向量M為訓(xùn)練樣本的總數(shù),雖然M比Nz小很多,但通常情況下,M仍然會太大。通常我們可以選取最大的前K個特征向量,使得:(3-12)在上式中,可以選取a99%,這說明樣本集在前K個軸上的能量占整個能量的99%以上。當(dāng)子圖像提取的主元數(shù)分別為2,4,6,8時,所提取的主元特征皆能很好的重構(gòu)圖像,我們可根據(jù)應(yīng)用要求提取能量較大的主元,而忽略能量較小的主元,能量較大的主元即被認(rèn)為是主要特征。在本文中我們對主元個數(shù)的選取按經(jīng)驗值取8。4特征臉的程序?qū)崿F(xiàn)(見附錄)4樣本數(shù)據(jù)庫的建立與人臉識別模式識別的分類問題是根據(jù)識別對象特征的觀察值將其分到某個類別中去,統(tǒng)計決策理論和基于句法決策理論是分類識別中兩種常用的方法。在本文中我們采用的是基于統(tǒng)計決策的識別方法。用計算機(jī)識別人臉圖像,首先要對圖像進(jìn)行數(shù)字化,再作預(yù)處理,去除干擾、噪聲及差異等,然后再抽取特征,進(jìn)行分類。為了進(jìn)行分類,還必須有圖像樣本,進(jìn)行特征選擇。并且為了得到最佳分類,還必須學(xué)習(xí)。圖像識別統(tǒng)計方法的框圖如圖4-1所示,它由識別及分析兩大部分組成,圖的上半部分表示識別部分,由數(shù)字化,預(yù)處理,特征抽取及分類組成;圖的下半部分表示分析部分,它是由特征選擇及學(xué)習(xí)兩部分組成,它是為分類的需要而設(shè)置的,最后輸出就是人們所需要識別的類別。特征向量為X。圖4-1人臉識別與分析示意圖4.1樣本庫的建立方法與流程人臉樣本庫包含人臉圖像與人臉特征兩部分,其中人臉圖像為人臉樣本的原始圖像,人臉特征部分為經(jīng)提取出的人臉特征向量。樣本庫的建立步驟為:1對原始人臉圖像做銳化,二值化,邊緣檢測處理。2進(jìn)行人臉器官的定位。3對定位后的圖像進(jìn)行特征提取和選擇處理。4.2樣本庫的管理對于樣本庫的操作有三種,分別為添加、插入、刪除。添加:添加操作是將得到的樣本點陣和人臉特征分別加入樣本庫中,在本文中我們采用自動添加,也就是無須用戶指定要添加的位置,而由系統(tǒng)自動完成。系統(tǒng)將按照幾何距離和類似度判斷該圖像屬于庫中已有的哪一類,并缺省的加入到該類的最后位置。其程序流程如圖4-2所示。2插入插入操作指講用戶指定的樣本加入到指定的位置,如果要添加的位置已存在樣本將詢問是否將其覆蓋掉,否則將指定位置及此位置之后的樣本均后移一位,其程序流程如圖4-3所示。3刪除刪除是較簡單的操作,只需將當(dāng)前位置之后的樣本往前移一位。圖4-2添加流程圖圖4-3插入流程圖4.3人臉識別最近鄰法是模式識別中最重要的方法之一,它主要是利用樣本間的距離進(jìn)行分類決策。在本文中我們同時采用了樣本間的距離和類似度用于分類決策。(1)距離在數(shù)學(xué)中,兩個向量X,G間的距離DX,G應(yīng)具有以下性質(zhì)。①DX,G0②DX,G0,當(dāng)且僅當(dāng)XG時③DX,GDG,X④DX,K+DK,GDX,G模式識別中使用的距離的概念不要求全部滿足以上性質(zhì),設(shè)X表示輸入待識別的人臉特征向量,X,.....Xr,.,;G為字典中某一個標(biāo)準(zhǔn)樣本的特征向量G,則在模式識別中常用到的距離有:①明考夫斯基距離Minkowskydistance(4-1)當(dāng)q1時,為常用的絕對值距離Absolutedistance(4-2)當(dāng)q2時,為歐氏距離Euclideandistance4-3②馬氏距離Mahalanbisdistance當(dāng)X,G兩個m維向量是正態(tài)分布的,且具有相同的協(xié)方差矩陣S時,其馬氏距離為:4-4利用距離準(zhǔn)則來判斷時,當(dāng)輸入的人臉特征向量X和字典中某一樣本的特征向量G;相同時,則DX,G0。所以分別計算輸入的人臉特征向量X和字典中所有樣本的特征向量G1,Gz......Gm之間的距離DX,G,DX,Gz......DX,Gn,,求出最小值DX,G;,且DX,G;dd0,是預(yù)定的常數(shù),就可判斷出輸入人臉屬于w類。(2)類似度兩個特征向量X,G的類似度定義為:4-5從幾何上來看,類似度RX,G為X,G兩向量在m維空間的夾角的COS值,顯然當(dāng)兩向量完全相同時,夾角為0,RX,G1。通常根據(jù)RX,Gee為預(yù)定的常數(shù),0-a-1,就可以判斷出輸入人臉屬于哪一類。4.4人臉識別結(jié)果錯誤分析一個理想情況下的人臉識別系統(tǒng)的目的就是要對輸入的每一個人臉都能正確分類,但在實際的實驗環(huán)境下有很多因素會影響的識別率。通常評價一個人臉識別系統(tǒng)常用的統(tǒng)計指標(biāo)有:1正確率正確率(正確識別出的人臉數(shù)目/測試集中包含的人臉數(shù)目錯誤率錯誤率(錯誤識別的人臉數(shù)目/測試集中包含的人臉數(shù)目本文的測試實驗是建立在一個人臉數(shù)據(jù)庫FaceDB之上的,F(xiàn)aceDB共有120個人,每人有10張正面圖像照片,每個圖像中只有一個人臉,圖像背景單一。實驗是在人物表情較平和,光線較均勻的理想情況下進(jìn)行的。在實驗時,我們用的硬件環(huán)境是奔四1.4G的微機(jī),內(nèi)存128M,硬盤40G,從輸入圖像到完成識別的平均時間在1秒左右。實驗的正確識別率在78%左右,錯誤率在22%左右。另外,識別錯誤情況主要有以下幾種:1光線條件直接影響到識別率2復(fù)雜背景情況下人臉的識別如以黃土為背景3夸張表情下人臉的識別4留大胡子,帶眼鏡的人臉識別以上這些難題也正是困擾著人臉識別領(lǐng)域尚待解決的問題,我們只能從預(yù)處理這個環(huán)節(jié)入手,選用好的算法,盡可能的減少外界干擾,提高識別率。結(jié)論在人臉圖像識別中,主成分分析PrincipalComponentAnalysis,PCAPCA主元分析法進(jìn)行人臉的特征提取,最后做出快速決策判斷。人臉識別具有無可比擬的優(yōu)越性,近幾十年來得到飛速發(fā)展,比如近年來出現(xiàn)了基于近紅外圖像的人臉識別,許多有效實用的人臉識別系統(tǒng)也脫穎而出,并且被廣泛應(yīng)用于海關(guān)、機(jī)場、金融機(jī)構(gòu)等安全性要求較高的重要場所但人臉識別技術(shù)也存在一些難點:如人臉識別中的光照問題,姿態(tài)問題,表情問題等這也是需要進(jìn)一步研究的重點,人臉識別是模式識別領(lǐng)域的一個熱點也是一個難點,本文采用積分投影法和數(shù)學(xué)形態(tài)學(xué)運算確定人臉器官的位置,采用KL變換取得人臉特征向量并進(jìn)行人臉識別。但由于時間和條件的限制,還存在著相當(dāng)?shù)牟蛔阒?。?yōu)秀的人臉跟蹤算法以及人臉識別技術(shù)的開發(fā)是研究的熱點。近年來,隨著算法的不斷成熟以及計算機(jī)性能的提高,針對人臉跟蹤識別的研究已接近實時實現(xiàn),近期提出的一些算法均具有較好的性能。但是,這些算法是建立在人臉檢測正確結(jié)果基礎(chǔ)上的,算法性能的提高,還有賴于檢測算法的進(jìn)一步成熟。因此,在檢測算法成熟的基礎(chǔ)之上,開展人臉跟蹤和識別算法的研究,可以最終組成實用化的實時人臉識別系統(tǒng),這一系統(tǒng)將會在軍事、金融、保安、偵探等眾多領(lǐng)域中得到有效地利用,創(chuàng)造巨大的價值。今后我們將在下列幾方面作進(jìn)一步的工作和探索:1建立更多的樣本,通過大量的樣本學(xué)習(xí),進(jìn)一步提高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論