版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第2章 人臉檢測與識別算法綜述1.1 人臉檢測與識別系統(tǒng)人臉檢測與識別系統(tǒng)大致可以分為:人臉檢測模塊、人臉校正模塊以及人臉識別模塊,如圖1.1所示。圖1.1人臉檢測與識別系統(tǒng)人臉檢測的目標是從一副圖片或者一幀視頻中確定是否包含人臉,如果有則標定出所有人臉的位置、大小和姿勢。這一部分已經(jīng)在前面章節(jié)中講過,這里不再贅述。簡言之,其基本思想是運用知識或者統(tǒng)計的方法對人臉建立模型,比較所有的待檢測區(qū)域與人臉模型的匹配度,從而確定圖像中人臉的區(qū)域。人臉識別系統(tǒng)通常要求識別的圖像只包含人臉信息,而沒有其余的干擾信息。所以在進行識別之前,需要由人臉檢測子系統(tǒng)在輸入圖像中檢測出其中包含的所有人臉的位置、大小、
2、偏轉(zhuǎn)角度等,從而提取出人臉信息,進行一些預處理后,提交給人臉識別子系統(tǒng)識別。人臉校正致力于將檢測到的各種姿態(tài)的輸入人臉轉(zhuǎn)成正臉模式,以利于后面人臉識別更加容易,進而提高識別效率,這也是多姿態(tài)人臉識別重點研究的問題。本章只介紹人臉檢測與識別部分,人臉校正部分我們將在后續(xù)章節(jié)中介紹。1.2人臉檢測算法目前人臉檢測方法很多,大致可以分為兩大類:基于先驗知識的人臉檢測方法和基于后驗學習和訓練的方法。1.2.1基于先驗知識的人臉檢測方法基于先驗知識的人臉檢測方法一般是先提取人臉的各種特征,然后根據(jù)一些知識規(guī)則來檢驗它們是否符合人臉的先驗知識,以此來確認圖像中是否包含人臉。該方法所使用的人臉特征大致可分為
3、:基本特征和膚色特征。其中基本特征包括灰度特征、輪廓和形狀特征、結(jié)構(gòu)特征、紋理特征。 Yuille等7提出用可變形模板來描述人臉的形狀信息,通過和輸入圖像的邊緣、峰、谷和可變形模板中參數(shù)進行動態(tài)性交互、修正,采用優(yōu)化算法,在參數(shù)空間內(nèi)進行能量函數(shù)極小化來判定人臉。Yang3等首先提出基于鑲嵌圖(又稱為馬賽克圖)的人臉檢測方法,即采用由粗到細的二級結(jié)構(gòu)的方法檢測人臉。通過平均和下采樣方法得到多個不同分辨率的圖像,這些低分辨率圖像被稱為鑲嵌。在最低兩級分辨率的鑲嵌圖中,采用一系列規(guī)則快速地獲得人臉候選區(qū)域。然后在高分辨率圖像中,提取人臉特征的輪廓線,符合眼、嘴特征的候選區(qū)域被最終確認為人臉圖像。H
4、.Martin11設計了膚色模型表征人臉膚色,利用一個感光模型對輸入圖像修正和補償并建立人臉顏色分類器,其輸出作為神經(jīng)網(wǎng)絡的輸入進行檢測。此外,Tony等采用高斯混合模型表示人臉膚色RGB中各個分量的統(tǒng)計分布,通過閾值比較判斷像素是否為人臉像素。模板匹配方法也可以認為是基于先驗知識的人臉檢測方法,一般是先假設一個標準的人臉模板,然后計算輸入人臉圖像與標準人臉的匹配度,并確定一個閾值,當匹配度超過這個閾值時,即可認為輸入圖像包含人臉;沒有超過這個閾值,就認為不包含人臉。模板匹配又分為固定模板匹配和可變模板匹配兩種。Govindaraju6等使用變形模板匹配頭頂輪廓線和左右兩條面頰輪廓線實現(xiàn)人臉定
5、位。Miao8等基于人臉特征輪廓線的重心定義了重心模板。先用重心模板粗匹配,再將候選人臉區(qū)域劃分為9個子區(qū)域,根據(jù)各子區(qū)域內(nèi)灰度特征和輪廓線象素數(shù)的比例關(guān)系進一步驗證。Shen9等提出采用人臉橫紋特征檢測可能的眼睛對,獲得候選區(qū)域后再采用灰度投影、紋理檢測等規(guī)則進行驗證的人臉檢測方法。后來,Wu和Shen10等人聯(lián)合提出特征和模板結(jié)合的人臉檢測算法。為了能夠較好地區(qū)分兩眼的橫紋,該方法同時采用方形和矩形單元鑲嵌圖,并用預定義的具有人臉水平垂直方向峰谷特征的四個模板進一步確認人臉區(qū)域。該算法被接受進入MPEG-7標準。基于先驗知識的人臉檢測方法適用于較強約束條件下(如簡單背景、頭部圖像等)的人臉
6、檢測。由于使用的特征較少,此類算法可以達到較高的檢測速度,實現(xiàn)實時檢測與跟蹤。但是 基于先驗知識模型方法的檢測效果太依賴于特征的提取和預先定義的規(guī)則,有其明顯的局限性。其局限性表現(xiàn)在: 由于灰度受光照影響較大,強的光照變化會產(chǎn)生一些偽邊沿; 人臉結(jié)構(gòu)的對稱性是一個重要的特征,對姿態(tài)變化比較敏感; 為了驗證人臉區(qū)域,常常需要結(jié)合各人臉器官的特征及其之間的結(jié)構(gòu)關(guān)系。當圖像質(zhì)量較差時,特征不容易檢測; 人臉樣本是開放集合,獲取先驗知識比較困難。 總之,該類方法對質(zhì)量較好的圖像具有好的檢測性能,對于復雜的圖像檢測效果一般不夠好。1.2.2基于后驗學習和訓練的方法目前,用的更多的是基于后驗學習和訓練的方
7、法,這一類方法是將人臉區(qū)域看作一類模板特征。使用大量的“人臉”與“非人臉”樣本訓練、構(gòu)造分類器,通過判別圖像中所有可能區(qū)域?qū)儆谀念惸J降姆椒▽崿F(xiàn)人臉的檢測。因此,在這一類方法中人臉檢測問題實際上被轉(zhuǎn)化為統(tǒng)計模式識別的二分類問題。這類的人臉檢測主要有下面幾種方法:基于特征空間的方法、基于人工神經(jīng)網(wǎng)的方法、基于支持向量機的方法、基于概率模型的方法、基于Adaboost學習算法的方法。 基于特征空間的方法基于特征空間的方法是將人臉區(qū)域圖像變換到某一特征空間,根據(jù)其在特征空間中的分布規(guī)律劃分“人臉”與“非人臉”兩類模式。這類方法里比較有代表性的就是Turk和Pentland提出使用PCA12(Prin
8、cipal Component Analysis,主成分分析)方法進行人臉檢測和識別。主成分分析方法是對圖像進行KL變換,以消除原來各個分量之間的相關(guān)性,取變換后所得到的最大的若干個特征向量來表示原來的圖像,保留了原始圖像的最大差異性信息,這若干個分量就稱為主成分。將PCA用于人臉檢測,對訓練集中的人臉圖像進行主成分分析,轉(zhuǎn)換成一個小的特征向量集,叫“本征臉,它們是最初訓練圖像集的基本組件,同樣地處理非人臉訓練集。然后根據(jù)人臉圖像在這一過程中改變較小而非人臉圖像改變較大的特點,遍歷測試圖像中所有候選人臉位置,計算候選位置對應的圖像塊與人臉空間之間的距離,其中,距離最小的位置就認為是測試圖像中的
9、人臉所在位置。此外,還有Sung13等提出了基于示例學習的方法,同時使用了19×19像素分辨率的“人臉”與“非人臉”樣本。即把“人臉”和“非人臉”數(shù)據(jù)庫里的每一個示例圖像標準化,然后再用它們?nèi)ズ铣伞叭四槨焙?非人臉”的模式聚類。Garcia14將小波變換理論應用到了人臉檢測,也達到了較好的效果。 基于人工神經(jīng)網(wǎng)的方法人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)的方法是把模式的統(tǒng)計特性隱含在ANN的結(jié)構(gòu)和參數(shù)之中,通過訓練一個網(wǎng)絡結(jié)構(gòu)把模式的統(tǒng)計特性隱含在神經(jīng)網(wǎng)絡的結(jié)構(gòu)和參數(shù)之中。人工神經(jīng)網(wǎng)絡避免了復雜的特征提取工作,它能根據(jù)樣本的自我學習生成分類器,對于
10、檢測人臉這類復雜的,難以顯式描述的模式表現(xiàn)出良好的魯棒性和自適應性,具有獨特的優(yōu)勢。缺點是需要大量調(diào)整人工神經(jīng)網(wǎng)絡結(jié)構(gòu)(如:神經(jīng)元節(jié)點數(shù)、層數(shù)、學習率)以便得到較好的檢測結(jié)果。最早使用人工神經(jīng)網(wǎng)絡進行人臉檢測的是Propp和samal,最早使用人工神經(jīng)網(wǎng)絡進行人臉檢測的是Propp和Samal15,他們的網(wǎng)絡包含四層,共有1024個輸入單元,第一隱含層共有256個單元,第二隱含層共有8個單元和2個輸出單元。在此之后,許多研究人員開始運用人工神經(jīng)網(wǎng)絡來進行人臉檢測,取得了一系列的成果。另外Agui等提出使用多級神經(jīng)網(wǎng)絡解決人臉檢測問題,在他們的方法中,第一步由兩個平行的人工神經(jīng)網(wǎng)組成,第二步的人
11、工神經(jīng)網(wǎng)的輸入值是第一步兩個子網(wǎng)的輸出值,然后通過隱層提取特征,輸出層的輸出值決定所檢測的圖像塊是否包含人臉。Soulie等16提出用具有時間延遲的神經(jīng)元網(wǎng)絡(具有25 x 25象素的感受域)掃描圖像進行人臉檢測。輸入圖像利用小波變換進行分解,他們在120幅測試圖像上進行實驗,獲得的2.7%錯誤拒絕率和的0.5%錯誤接受率。Rowley等17用多層神經(jīng)元網(wǎng)絡從人臉非人臉圖像中學習人臉和非人臉模式,其方法的局限性是只能檢測垂直的正面人臉。后來,Rowley等18將這種方法擴展用于旋轉(zhuǎn)的人臉檢測,先用一個神經(jīng)網(wǎng)絡確定人臉的旋轉(zhuǎn)角度,然后再用另外的神經(jīng)網(wǎng)絡對人臉進行驗證,取得了較好的效果。 基于支持
12、向量機的方法支持向量機(SupportVeetorMaehine,SVM)是Vapnik等提出的基于結(jié)構(gòu)風險最小化原理(Structural Risk Minimization Principle,SRM)的統(tǒng)計學習理論,用于分類與回歸問題。其基本思想是:首先通過非線性變換,將輸入空間變換到一個高維空間,然后在這個高維空間中求取最優(yōu)線性分類面。所謂最優(yōu)分類面則是使分類間隔最大,從而達到結(jié)構(gòu)風險最小化。支持向量機是一種二次規(guī)劃方法,它在處理大批量的人臉正反例時,只選取那些位于分界面附近的數(shù)據(jù)來完成學習過程。梁路宏等l9提出了基于模板匹配與支持向量機的人臉檢測算法。算法使用一組雙眼一人臉模板對來搜
13、索候選人臉,并在搜索過程中使用多層感知器進行確認,以減少錯誤報警。實驗結(jié)果的對比數(shù)據(jù)表明,該算法是十分有效的。Osuna20等將SVM方法用于人臉檢測并取得了較好的實驗結(jié)果。該方法的基本思路是對每一個19×19像素的檢測窗口使用SVM進行分類,以區(qū)分“人臉”與“非人臉”窗口。SVM的訓練使用了大量人臉樣本和自舉方法收集的“非人臉”樣本,并且使用逼近優(yōu)化的方法減少支持矢量的數(shù)量。Platt21提出的序貫最小優(yōu)化(SMO:Sequential Minimal Optimization)算法是對Osuna等提出的方法的改進,該方法很好地解決了長期以來SVM的訓練需要求解計算復雜度極高的二次
14、規(guī)劃的問題。 基于概率模型的方法基于概率模型方法的一種思路是計算輸入圖像區(qū)域?qū)儆谌四樐J降暮篁灨怕?,?jù)此對所有可能的圖像窗口進行判斷;Schneiderman等22提出一種基于后驗概率估計的人臉檢測方法,該方法利用貝葉斯原理將后驗概率估計轉(zhuǎn)化為一個似然度求解問題。還將概率估計的方法用于檢測正面旋轉(zhuǎn)人臉和側(cè)面人臉,同時使用多分辨率信息復用和由粗到精搜索的策略提高檢測的速度。另一種概率模型是用于描述信號統(tǒng)計特性的隱馬爾可夫模型(HMM) ,目前也被應用于人臉檢測與識別。HMM使用馬爾可夫鏈來模擬信號統(tǒng)計特征的變化,而這種變化又是間接地通過觀察序列來描述的,因此,隱馬爾科夫過程是一個雙重的隨機過程。
15、在HMM中,節(jié)點表示狀態(tài),有向邊表示狀態(tài)之間的轉(zhuǎn)移,一個狀態(tài)可以具有特征空間中的任意特征,對同一特征,不同狀態(tài)表現(xiàn)出這一特征的概率不同。由于HMM是一個統(tǒng)計模型,對于同一特征序列,可能會對應于許多狀態(tài)序列,特征序列與狀態(tài)序列之間的對應關(guān)系是非確定的。這種模型對于狀態(tài)序列來說是隱的,故稱為隱馬爾可夫模型。Nefian等23根據(jù)正面人臉由上到下各個區(qū)域(頭發(fā)、額頭、雙眼、鼻子、嘴)具有自然不變的順序這一事實,使用一個包含五個狀態(tài)的一維連續(xù)HMM表示。將頭部圖像按照這五個區(qū)域劃分為互有重疊的條塊,對各塊進行K-L變換,選取前若干個變換系數(shù)作為觀測向量訓練HMM。Nefian等24還提出了基于嵌入式H
16、MM的人臉檢測方法。該方法同時考慮到人臉由左到右各個特征的自然順序,使用了二維HMM,并且采用二維DCT變換的系數(shù)作為觀察向量。 基于Adaboost學習算法的方法基于Adaboost學習算法快速人臉檢測方法由Paul Viola23等人于2001年提出,該方法采用一種稱為“積分圖”的圖像表示方法,可以快速容易地計算出大量的簡單特征,再用Adaboost學習算法從一個較大的特征集中選擇少量關(guān)鍵的視覺特征,并構(gòu)造一系列的弱分類器,多個弱分類通過線性組合可構(gòu)造出一個強分類器,再用級聯(lián)的方式將單個的分類器合成為一個更加復雜的分類器。使圖像的背景區(qū)域快速地丟棄,而在有可能存在人臉的區(qū)域花費更多的計算。
17、同時大大提高了檢測速度,可達15幀/秒。該方法的突出地位和貢獻在于,它給出了一個穩(wěn)定的實時的目標檢測框架,是第一個現(xiàn)實可行的實時的人臉檢測算法。此外,Li和Zhang等25改進了基于前向序列特征選擇的Adaboost學習算法,采用帶回溯過程的F1oatboost的特征選擇算法。采用簡單的塊特征以及一個金字塔的分級結(jié)構(gòu),該系統(tǒng)可以檢測多視角人臉圖像。Keren等26提出Antifaces多檢測器級聯(lián)的快速人臉檢測方法,只需少數(shù)幾個檢測器級聯(lián)就可以準確檢測人臉圖像。 基于后驗學習和訓練的方法是目前比較流行的方法,是解決復雜人臉檢測問題的有效途徑,它具有以下優(yōu)點:(1) 不依賴于人臉的先驗知識和參數(shù)
18、模型,可以避免不精確或不完整的知識造成的錯誤;(2) 采用了事例學習方法獲取模型的參數(shù),統(tǒng)計意義上更為可靠;(3) 通過增加學習的事例可以擴充檢測模式的范圍、提高檢測系統(tǒng)的魯棒性。該方法大多適用于復雜背景圖像中的人臉檢測。目前基于統(tǒng)計模型的方法主要針對正面端正人臉的檢測。1.3 人臉識別算法人臉識別方法很多,大致可以分為六種方法:基于幾何特征的識別方法、基于模板匹配的方法、特征子空間分析方法、隱馬爾科夫方法、基于神經(jīng)網(wǎng)絡和彈性圖匹配方法。 基于幾何特征的人臉識別方法人臉的幾何特征是指人臉的五官特征、臉型特征和五官在臉上分布的位置特征?;趲缀翁卣鞯姆椒ㄊ亲钤纭⒆顐鹘y(tǒng)的方法,這類方法將人臉用幾何
19、特征矢量表示,用模式識別中層次聚類的思想設計分類器以達到識別目的。它要求選取的幾何特征矢量具有一定的獨特性,能夠反映不同人臉之間的差別,同時又具有一定的彈性,以消除時間跨度、光照等的影響。幾何特征矢量是以人臉器官的幾何關(guān)系和形狀為基礎(chǔ)的特征矢量,它的分量通常是指人臉指定兩點間的歐氏距離、角度、曲率等。隱馬爾可夫法首先在語音處理領(lǐng)域取得了較大的成功,然后有不少學者將其應用到人臉識別領(lǐng)域。Samarea最早建議了關(guān)于人臉的隱馬爾可夫模型39,40,他將人臉圖像分成相互有一定重疊區(qū)域的小塊,將小塊內(nèi)的二維圖像矩陣轉(zhuǎn)換為一個一維的灰度值向量,然后將這個向量作為隱馬爾可夫模型中的觀察向量,用以訓練模型參
20、數(shù)。這種方法的優(yōu)點在于:一個訓練好的HMM模型的序列既含有人臉圖像不同部位的信息,又考慮了他們的相互關(guān)系,比起孤立的利用各個器官的數(shù)值特征有概念上的進步。Nefian發(fā)展了Samaria的方法41,主要是解決直接用灰度值作為觀察向量需要大量存儲的缺陷,提出的基于39個二維離散余弦變換特征系數(shù)作為觀察序列,不僅減少了計算量,還可以保持Samaria原始方法所具有的識別率。這類方法在近年里沒有得到更進一步的發(fā)展。應當指出,幾何特征之間的距離和結(jié)構(gòu)關(guān)系在人臉識別的分類問題中仍然有潛在價值。例如,在一個大數(shù)據(jù)庫中進行人臉檢索時,可以利用面部幾何特征進行粗分類以縮小匹配范圍?;谀0迤ヅ涞娜四樧R別方法
21、模板匹配本質(zhì)上是一種統(tǒng)計識別方法。其中,模板可以理解為一個供模仿、完美無缺的標本。因為一個模板與未知樣品匹配的好壞,取決于模板上各單元與樣本上各相應單元的匹配與否。若處于模板與樣品上的絕大多數(shù)單元均相匹配,則稱該模板與樣品“匹配得好”;反之則稱“匹配不好”。最簡單的例子就是直接計算兩幅人臉圖像之間的匹配程度。由于這種方法要求兩幅圖像上的目標要有相同的尺度、取向和光照條件,所以在進行匹配之前,預處理要做尺度歸一化和灰度歸一化的工作。最簡單的人臉模板是將人臉看成一個橢圓,檢測人臉也就是檢測圖像中的橢圓。另一種方法是將人臉用一組獨立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。
22、但這些模板的獲得必須利用各個特征的輪廓,而傳統(tǒng)的基于邊緣提取的方法很難獲得較高的連續(xù)邊緣。即使獲得了可靠度高的邊緣,也很難從中自動提取所需的特征量。為此,用彈性模板方法提取特征顯示出其獨到的優(yōu)越性。彈性模板由一組根據(jù)特征形狀的先驗知識設計的可調(diào)參數(shù)所定義,為了求出這組參數(shù),需要利用圖像的邊緣、峰值、谷值和強度信息及特征形狀的先驗知識設計合適的能量函數(shù)。參數(shù)向能量減小方向調(diào)整,當能量達到最小時,這組參數(shù)對應的模板形狀最符合特征形狀。 基于神經(jīng)網(wǎng)絡的方法由Lin等人提出的基于神經(jīng)網(wǎng)絡人臉識別方法38是基于概率決策理論,將人臉直接用灰度表征,利用神經(jīng)網(wǎng)絡的自組織自學習的能力來達到模式分類的目的的。作
23、為一種經(jīng)典的模式分類方法,神經(jīng)網(wǎng)絡進行人臉識別的優(yōu)點在于:它可以避免繁瑣的特征提取工作,只要訓練樣本具有足夠的代表性,可以展現(xiàn)良好的自適應性和魯棒性,即使有部分人臉區(qū)域被遮擋甚至在噪聲干擾較大的情況下依然可以很好的完成任務。缺點在于神經(jīng)網(wǎng)絡的計算量較大,訓練速度比較慢。 特征子空間分析方法特征子空間分析方法是當前人臉識別的主流方法之一,特征子空間分析的思想就是根據(jù)一定的性能目標來尋找線性或非線性的空間變換,把原始信號數(shù)據(jù)壓縮到一個低維子空間,使數(shù)據(jù)在子空間中的分布更加緊湊,為數(shù)據(jù)的更好描述提供手段,另外計算的復雜度也得到大大降低。子空間分析除了有線性和非線性空間變換之外,根據(jù)不同的性能目標要求
24、,得到的子空間也是不一樣的。Turk和Penland提出的特征臉方法36是基于KL變換技術(shù)的人臉低維重構(gòu)思想。它認為自然原始的人臉圖像對于識別來說存在著明顯的統(tǒng)計冗余信息,通過KL變換可以將高維人臉圖像降低到一個由一組新的正交基所構(gòu)成的低維子空間中,而且不同的人臉圖像在這個新的低維子空間中具有可分性,這組新的正交基就是特征臉向量。待識別的人臉圖像投影到這個新的低維空間中,可以得到以一個投影系數(shù)向量作為權(quán)值對特征臉向量的線性求和來表示的方式。Turk和Penland用最簡單的最近鄰分類器對這個投影系數(shù)向量進行分類,從而得到待識別人臉圖像的所屬模式。到目前為止,特征臉方法這種降維的思想已經(jīng)廣泛貫串
25、應用到自動人臉識別技術(shù)的人臉檢測、特征提取及識別等環(huán)節(jié)中。特征臉方法的缺點在于計算特征臉空間時用到的總離散度矩陣方差,不僅來源于不同人臉模式的類間差異,而且來源于同一人臉中由于光照、姿態(tài)視角、發(fā)型、或是其他一些因素造成的類內(nèi)差異。而后者這些差異對總離散度矩陣方差造成的貢獻是不利于識別結(jié)果的,特別是由于光照、角度等因素的影響,特征臉方法產(chǎn)生的識別率會有明顯的下降。2.3 人臉庫的選擇目前人臉識別領(lǐng)域常用的人臉數(shù)據(jù)庫主要有: FERET人臉數(shù)據(jù)庫由FERET項目(美國軍方)創(chuàng)建,包含14,051張不同表情,光照,姿態(tài)和年齡的人臉圖像,是人臉識別領(lǐng)域應用最廣泛的人臉數(shù)據(jù)庫之一。其中的多數(shù)人是西方人,
26、每個人所包含的人臉圖像的變化比較單一. MIT人臉數(shù)據(jù)庫由美國麻省理工大學媒體實驗室創(chuàng)建,包含16位志愿者的2,592張不同姿態(tài)、不同光照、不的27 張面部圖像. Yale人臉數(shù)據(jù)庫 由美國耶魯大學計算視覺與控制中心創(chuàng)建,包含15位志愿者,每人 11 張照片,一共165張圖片,包含不同光照,不同表情和不同姿態(tài)變化的人臉圖像. Yale人臉數(shù)據(jù)庫B 包含了10個人的5,850幅多姿態(tài),多光照的圖像.其中的姿態(tài)和光照變化的圖像都是在嚴格控制的條件下采集的,主要用于光照和姿態(tài)問題的建模與分析.由于采集人數(shù)較少,該數(shù)據(jù)庫的進一步應用受到了比較大的限制. ORL人臉數(shù)據(jù)庫由英國劍橋大學AT&T實
27、驗室創(chuàng)建,包含40人,每人 10 張照片,共400張面部圖像,部分志愿者的圖像包括了姿態(tài),表情和面部飾物的變化。該人臉庫在人臉識別研究的早期經(jīng)常被人們采用,但由于變化模式較少,多數(shù)系統(tǒng)的識別率均可以達到90%以上,因此進一步利用的價值已經(jīng)不大。 UMIST 圖像集英國曼切斯特大學創(chuàng)建,包含20 個人,共 564 幅圖像,每個人具有不同角度、不同姿態(tài)的多幅圖像。 CMU PIE人臉數(shù)據(jù)庫 CMU PIE人臉庫建立于 2000年 11 月,由美國卡耐基梅隆大學創(chuàng)建,所謂 PIE 就是姿態(tài)(Pose),光照(Illumination)和表情(Expression)的縮寫。它包含68位志愿者的41,3
28、68張多姿態(tài),其中包括了每個人的 13 種姿態(tài)條件,43 種光照條件和 4 種表情下的照片,現(xiàn)有的多姿態(tài)人臉識別的文獻基本上都是在 CMU PIE 人臉庫上測試的。其中的姿態(tài)和光照變化圖像也是在嚴格控制的條件下采集的,目前已經(jīng)逐漸成為人臉識別領(lǐng)域的一個重要的測試集合。因此,我們也選擇的是CMU PIE人臉庫作為訓練人臉庫,以及作為后面章節(jié)即將介紹到的多姿態(tài)人臉識別所需要的人臉庫。1.4 人臉檢測與識別效果評價標準人臉檢測與識別效果的性能評價標準主要有:檢測率、誤檢率、漏檢率、檢測速度、識別錯誤接受率FAR、識別錯誤拒絕率、魯棒性等。 檢測率檢測率指的是被正確檢測到的人臉數(shù)與原圖像中包含的人臉數(shù)
29、的比值。檢測率越高,說明檢測系統(tǒng)對人臉的接受能力越強。 誤檢率誤檢率是指被誤檢為人臉的非人臉子窗口數(shù)與原圖像中被檢測的所有非人臉子窗口數(shù)的比值。檢測率無法反映系統(tǒng)對非人臉的排除能力,有可能出現(xiàn)這種情況:所有人臉都被檢測到,同時很多非人臉區(qū)域也被誤認為是人臉。因此,有必要引入誤檢率來衡量系統(tǒng)對非人臉樣本的排除能力,誤檢率越低,說明檢測系統(tǒng)對非人臉的排除能力越強。 檢測速度由于大部分應用領(lǐng)域需要現(xiàn)場實時的檢測人臉,所以,在檢測率和誤檢率達到滿意的前提下,檢測速度是越快越好的。 識別錯誤接受率識別錯誤接受率FAR(False Acceptance Rate)表示兩個不是同一類別的人臉被錯誤認為是同一
30、人臉數(shù)目占總?cè)四様?shù)的的比率。 識別錯誤拒絕率識別錯誤拒絕率FRR(False Rejection Rate)表示代表同一人臉的兩個序列被錯誤認為是不同人臉數(shù)目占總?cè)四様?shù)的比率。 魯棒性魯棒性指的是在各種條件下,人臉檢測與識別系統(tǒng)的適應能力。比如基于膚色模型的方法無法檢測灰度圖像;大部分人臉檢測與識別系統(tǒng)無法檢測或識別到大角度旋轉(zhuǎn)的人臉,需要把旋轉(zhuǎn)角度限制在一定范圍之內(nèi);大部分人臉檢測與識別方法容易受復雜背景的干擾,在背景簡單的條件下效果好,背景復雜的條件下效果變差明顯。這些標準中有些是相互制約的,比如檢測率和誤檢率就經(jīng)常需要權(quán)衡,檢測率提高,誤檢率提高;檢測率降低,誤檢率也會降低。模板匹配方法
31、的檢測速度雖然很快,但其距離函數(shù)在不同環(huán)境下產(chǎn)生的效果差異很大,如背景簡單時檢測效果好,背景復雜時檢測效果很差,這就是其魯棒性不好的表現(xiàn)。1.5 本章小結(jié)本章簡單介紹了人臉檢測與識別系統(tǒng),并對人臉檢測與人臉識別兩個方面的比較主流的算法進行了綜述,最后介紹了人臉檢測與識別的評價標準。參考文獻:3 Yang G, Huang T S. Human face detection in complex backgroundJ. Pattern Recognition, 1994, 27(1): 53-636Govindaraju V, Srihari S N, Sher D B. A computat
32、ional model for face locationC.Proc IEEE Conference on Computer Vision, Osaka,Japan,1990:718-721.7 Yuille A, Hallinan P, Cohen D.Eeature Extraction from Faces Using Deformable TemplatesJ. International Journal of Computer Vision. 1992, 8.2: 99-1118Miao J, Yin B, Wang K, et al. A Hierarchical Multisc
33、ale and Multiangle System for Human Face Detection in a Complex Background Using Gravity-Center TemplateJ.PatternRecognition, 1999, 32 (7):1237-1218.9 Shen Lansun, Wang Kongqiao, Xing Xin. Automatic Human Face Detection and Tracking in a Complex BackgroundS.ISO/IEC JTC1/SC29/WG11 MPEG99/M4422, Seoul
34、, Korea, 1999-03.10 Lifang Wu, Lansun Shen, Kebin Jia, et al. Improvement of Automatic Human Face DetectionS. ISO/IEC JTC1/SC29/WG11 MPEG2000/m6536, La Baule, M.Picering, A. Whichello, M. Frater, etc. A proposal for an Automatic face Extraction AlgorithmS. ISO/IEC JTC1/SC29/WG11 MPEG2000/m6536,La Ba
35、ule,France(The two Algorithms are combined in m6536),2000.11Martin A,Hunke H.Locating and Tracking of Human Faces with Neural NetworksC. Technical Report of CMU,CMU-Cs-94-155,1994.12Turk M, Pentland A. Eigen faces for recognition.J.Cog.Neurosci.3,71-86,1991C. Neurosci: Publisher ominous,1991.13Sung
36、K.Poggio T.Example-based learning for view based human face detectionJ. IEEE Trans.on PAMI,1998,20(1):39-51.14Garcia C,Zikos G,Tziritas G.Face detection in color images using wavelet packet analysisG /Multimedia Computing and Systems.Centro Affair,Florence,Italy,1999,VOL. 1:703-708.15 Propp M, Samal
37、 A. Artificial neural network architecture for human face detectionJ, Intelligent Eng. Systems Artificial Neural Networks 2, 1992 535-540.16 Soulie F, Viennet E, Lamy B. Multi-Modular Neural Network Architectures: Pattern Recognition applications in Optical Character Recognition and Human Face Recog
38、nitionC. Int'1 J. Pattern Recognition and Artificial Intelligence, 1993, 7(4):721-75517 Rowley H A, Baluja S, Kanade T. Neural Network Based Face DetectionJ. IEEE Trans Pattern Analysis and Machine Intelligence, 1998, 20(1):23-38.18 Rowley H A, Baluja S, Kanade T. Rotation Invariant Neural Netwo
39、rk-Based Face Detection. Proc匯C. IEEE Conf. Computer Vision and Pattern Recognition, 1998, 38-4419梁路宏,艾海舟,何克忠等.基于多模板匹配的單人臉檢測J1.中國圖象圖形學報.1999,4A(10):823一8320Osuna E,Freund R,Girosi R.Training support vector machinesC.An application to face detection,in IEEE Proc.of Int.Conf.on Computer Vision and Pat
40、tern Recognition, 6,1997.21Platt J C.Fast Training of SVMs Using Sequential Minimal OptimizationM. Scholkopf B,Burges C J C, Smola A J eds,Advances in Kernel Methods-Support Vector Learning, Cambridge, MA: MIT Press, 1998:185-208.22Schneiderman H,Kanade T.Probabilistic modeling of local appearance and spatial relationships
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人工智能醫(yī)療診斷服務合同
- 二零二五年度擔保公司商品房買賣全程保障協(xié)議6篇
- 2025版新能源項目安全評價與監(jiān)理合同3篇
- 智能機器人研發(fā)及生產(chǎn)合作協(xié)議書
- 教育項目合作開發(fā)協(xié)議
- 2025版公共場合欄桿制作與安裝安全協(xié)議3篇
- 二零二五年度房屋抵押貸款業(yè)務辦理代理及風險評估合同
- 2024年股權(quán)轉(zhuǎn)讓合同:股份與資本
- 2024年項目聯(lián)絡與中介服務協(xié)議
- 二零二五年度房地產(chǎn)項目藝術(shù)地產(chǎn)開發(fā)委托協(xié)議3篇
- 中學美育工作制度
- 2023年保安公司副總經(jīng)理年終總結(jié) 保安公司分公司經(jīng)理年終總結(jié)(5篇)
- 2023中?!督馄蕦W基礎(chǔ)》題庫202311593753185
- 化妝品生產(chǎn)許可申請表樣板
- 教科版三年級上冊科學教案(全冊)
- 勞動力安排計劃及勞動力計劃表(樣板)
- 利潤表4(通用模板)
- 教育評價學全套ppt課件完整版教學教程
- 注塑領(lǐng)班作業(yè)指導書
- ASTM B330-20 Standard Test Methods for Estimating Average Particle Size of Metal Powders and Related Compounds Using%2
- 血氣分析及臨床應用
評論
0/150
提交評論