基于PCA的人臉識(shí)別研究.doc_第1頁(yè)
基于PCA的人臉識(shí)別研究.doc_第2頁(yè)
基于PCA的人臉識(shí)別研究.doc_第3頁(yè)
基于PCA的人臉識(shí)別研究.doc_第4頁(yè)
基于PCA的人臉識(shí)別研究.doc_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

內(nèi) 容 摘 要生物特征識(shí)別是利用人類特有的生理或行為特征來(lái)識(shí)別個(gè)人身份的技術(shù),它提供了一種高可靠性、高穩(wěn)定性的身份鑒別途徑。人臉檢測(cè)和識(shí)別是目前生物特征識(shí)別中最受人們關(guān)注的一個(gè)分支,是當(dāng)前圖像處理、模式識(shí)別和計(jì)算機(jī)視覺(jué)領(lǐng)域內(nèi)的一個(gè)熱門研究課題,在公安部門罪犯搜索、安全部門動(dòng)態(tài)監(jiān)視識(shí)別、銀行密碼系統(tǒng)等許多領(lǐng)域有廣泛的研究,本文對(duì)此進(jìn)行了較為深入的研究。首先描述了人臉識(shí)別技術(shù)的研究?jī)?nèi)容、方法、應(yīng)用前景,對(duì)人臉自動(dòng)檢測(cè)與識(shí)別技術(shù)進(jìn)行了綜述。并且詳細(xì)介紹了人臉識(shí)別很重要的一個(gè)步驟“人臉預(yù)處理”,文中提到的人臉預(yù)處理方法都是從圖像處理的角度著手的,主要目的是使人臉圖像標(biāo)準(zhǔn)化,并在一定程度上消除光照的影響。本文介紹了幾種主要的預(yù)處理方法,如幾何歸一化,灰度歸一化。其次,本文重點(diǎn)描述了人臉識(shí)別的經(jīng)典方法,PCA方法。主成分分析方法(Principal Component Analysis ,PCA),即離散K-L變換,是圖像壓縮中的一種最優(yōu)正交變換。它用一個(gè)低維子空間來(lái)描述人臉圖像,同時(shí)又能在一定程度上保存所需要的識(shí)別信息。其基本原理為:由高維圖像空間經(jīng)K-L變換后得到一組新的正交基,對(duì)這些正交基作一定的取舍,保留其中的一部分生成低維的人臉空間,即人臉的特征子空間,識(shí)別時(shí)將測(cè)試圖像投影到此空間,得到一組投影系數(shù),通過(guò)與各個(gè)人臉圖像比較進(jìn)行識(shí)別。這種方法使得壓縮前后的均方誤差最小,且變換后的低維空間有很好的分辨能力。但在這種人臉識(shí)別技術(shù)中,二維的人臉圖像矩陣必須先轉(zhuǎn)化為一維的圖像向量,才能進(jìn)行PCA分析,而在這種轉(zhuǎn)化后,造成圖像向量的維數(shù)一般較高,使整個(gè)特征抽取過(guò)程所耗費(fèi)的計(jì)算量相當(dāng)可觀。關(guān)鍵詞人臉識(shí)別;人臉預(yù)處理;主成分分析Research on Face Recognition Based on Principal Component AnalysisAbstract Biometrics is a kind of science and technology using individual physiological or behavioral characteristics to verify identity. It provides a highly reliable and robust approach to the identity recognition. Automatic face detection and recognition is one of the most attention branches of biometrics and it is also the one of the most active and challenging tasks for image processing, pattern recognition and computer vision. It is widely applied in commercial and law area, such as mug shots retrieval, real-tine video surveillance in security system and cryptography in bank and so on. The main research works and contributions are as the following. First, the research content, approach and development are emphasized. The research status is introduced. The technology of the face detection and recognition are summarized. And the paper describes face preprocessing in detail which is and important step in the face recognition. The face preprocessing methods we adopt are based on image processing techniques. The main purpose is to get the standardized facial images, and to eliminate the impact of illumination to some extent. In this paper, several key preprocessing methods are introduced, such as geometry normalization, gray-scale normalization and images binary-conversion. Principal Component Analysis (PCA) face recognition methods as the foundation of the K-L transformation is the most superior in the image compression .By using PCA, the dimension of the input is reduced while the main components are maintained. The major idea of PCA is to decompose a data space into a linear combination of a small collection of bases.In the face-recognition literature, the eigenvectors can be referred to as eigenfaces. The probe is identified by first projection to all gallery images. We denote a probe .A probe is comparing the projection to all gallery images, and it causes around the compression the mean error to be youngest. But in the PCA-based face recognition technique, the 2D face image matrices must be previously transformed into 1 D image vectors. The resulting image vectors of faces usually lead to a high dimensional image vector space, where it is difficult to evaluate the covariance matrix accurately due to its large size and the relatively small number of training samples. Key wordsFace recognition ;Face pretreatment;PCA目 錄第一章 緒 論11.1人臉識(shí)別研究的目的意義11.2人臉識(shí)別的定義及主要研究?jī)?nèi)容31.3人臉識(shí)別方法綜述61.3.1人臉識(shí)別方法分類61.3.2常用的人臉識(shí)別方法61.3.3基于幾何特征的人臉識(shí)別方法71.3.4基于K-L變換的特征臉?lè)椒?1.3.5神經(jīng)網(wǎng)絡(luò)方法101.3.6彈性匹配圖臉部識(shí)別方法121.3.7隱馬爾可夫模型的識(shí)別方法131.3.8基于FISHER線性判別式的方法131.3.9基于小波包的識(shí)別方法141.4人臉識(shí)別的應(yīng)用141.5人臉識(shí)別問(wèn)題中的難點(diǎn)及發(fā)展方向151.5.1人臉識(shí)別問(wèn)題中的難點(diǎn)151.5.2人臉識(shí)別的發(fā)展方向17第二章人臉圖像預(yù)處理182.1引言182.2人臉圖像庫(kù)簡(jiǎn)介182.3人臉圖像的預(yù)處理算法192.3.1圖像的幾何歸一化192.3.2圖像的直方圖均衡化202.4本章小結(jié)23第三章 基于PCA的人臉識(shí)別方法233.1引言233.2 PCA人臉識(shí)別方法原理233.2.1特征提取的概念243.2.2離散K-L變換的原理243.2.3特征值的選擇263.2.4距離函數(shù)的選取與分類判別273.3經(jīng)典的PCA人臉識(shí)別283.3.1特征臉?biāo)惴?83.3.2經(jīng)典PCA人臉識(shí)別方法的實(shí)現(xiàn)過(guò)程293.3.3訓(xùn)練過(guò)程303.3.4識(shí)別過(guò)程32第四章 實(shí)驗(yàn)過(guò)程顯示及分析334.1 引言334.2 實(shí)驗(yàn)過(guò)程33致 謝37參考文獻(xiàn)38附錄3942第一章 緒 論1.1人臉識(shí)別研究的目的意義隨著信息技術(shù)及網(wǎng)絡(luò)的高速發(fā)展,人們的生活及身份日益數(shù)字化,信息的安全性和隱蔽性越來(lái)越受到人們的重視,身份識(shí)別與認(rèn)證技術(shù)也因此得到了較快的發(fā)展。而人臉識(shí)別作為圖像處理在這些領(lǐng)域最成功的應(yīng)用之一,最近幾年來(lái)成為廣大學(xué)者的研究熱點(diǎn),越來(lái)越受到關(guān)注。人類社會(huì)的發(fā)展進(jìn)入到21世紀(jì)的今天,社會(huì)的發(fā)展促進(jìn)了人的流動(dòng),進(jìn)而也增加了社會(huì)的不穩(wěn)定性,這就使得安全方面的需求成為當(dāng)今社會(huì)尤為重要的問(wèn)題。不論是享受各項(xiàng)服務(wù)如網(wǎng)上沖浪、還是居家、辦公等都涉及到安全,以往這些行為基本上是通過(guò)符號(hào)密碼來(lái)進(jìn)行安全保護(hù),但是隨著服務(wù)數(shù)量的不斷增加,密碼越來(lái)越多以致無(wú)法全部記住,而且密碼有時(shí)也會(huì)被他人所竊取,各種密碼被破解的概率越來(lái)越高??梢?jiàn)在現(xiàn)代社會(huì)中,身份識(shí)別己經(jīng)成為人們?nèi)粘I钪薪?jīng)常遇到的一個(gè)基本問(wèn)題。人們幾乎時(shí)時(shí)刻刻都需要鑒別別人的身份和證明自己的身份,以獲得對(duì)特定資源的使用權(quán)或者制權(quán),同時(shí)防止這些權(quán)限被他人隨意的取得。傳統(tǒng)的身份識(shí)別方法主要基于身份標(biāo)識(shí)物(如證件、卡片)和身份標(biāo)識(shí)知識(shí)(如用戶名、密碼)來(lái)識(shí)別身份,這在很長(zhǎng)一段時(shí)期是非常可靠和方便的識(shí)別方法,得到了廣泛的應(yīng)用。但是,隨著網(wǎng)絡(luò)、通信、交通等技的飛速發(fā)展,人們活動(dòng)的現(xiàn)實(shí)空間和虛擬空間不斷擴(kuò)大,需要身份認(rèn)證的場(chǎng)合也變得無(wú)不在。密碼遺失、資料被盜的時(shí)間不斷發(fā)生,傳統(tǒng)的安全技術(shù)已暴露出重大的缺陷,就會(huì)給個(gè)人乃至整個(gè)社會(huì)帶來(lái)重大的甚至難以彌補(bǔ)的損失。面臨這樣的情況,人們對(duì)身份識(shí)別的安全性、可靠性、準(zhǔn)確和實(shí)用性提出了更高的要求,必須尋求身份識(shí)別的新途徑。于是,近年來(lái)人類生物特征越來(lái)越廣泛地應(yīng)用于身份識(shí)別,而且生物特征可以更好的進(jìn)行安全控制,世界各國(guó)政府都在大力推進(jìn)生物識(shí)別技術(shù)的發(fā)展及應(yīng)用。所謂生物特征認(rèn)證就是利用人的生理或行為特征對(duì)個(gè)人身份進(jìn)行識(shí)別或是認(rèn)證的技術(shù),與傳統(tǒng)的身份認(rèn)證技術(shù)不同,基于生物特征的身份認(rèn)證技術(shù),以人體本身所固有的生理特征或行為特征作為識(shí)別媒介,運(yùn)用圖像處理和模式識(shí)別等技術(shù),實(shí)現(xiàn)身份鑒別或驗(yàn)證。相對(duì)傳統(tǒng)的身份認(rèn)證方法而言,生物特征認(rèn)證技術(shù)具有不會(huì)因當(dāng)事人遺忘或他人竊取和偽造而進(jìn)行錯(cuò)誤判定,比傳統(tǒng)的身份認(rèn)證方法更加安全方便、特征唯一、不易偽造、不可竊取。生物特征可分為生理特征和行為特征兩大類,人臉、指紋、掌紋、虹膜、視網(wǎng)膜等屬于生理特征,語(yǔ)音、步態(tài)、筆跡等屬于行為特征,生理特征相對(duì)行為特征而言更為穩(wěn)定。人臉識(shí)別技術(shù)基于生理特征進(jìn)行識(shí)別,是最主要的生物特征身份認(rèn)證技術(shù)之一。在各種生物特征認(rèn)證技術(shù)中,人臉識(shí)別技術(shù)的市場(chǎng)份額僅次于指紋識(shí)別技術(shù)。人臉識(shí)別技術(shù)和其他的生物識(shí)別比起來(lái)有以下幾個(gè)優(yōu)點(diǎn): (1)人臉識(shí)別可以在隱蔽的條件下進(jìn)行,適用于安全監(jiān)控; (2)數(shù)據(jù)采集方便,采集設(shè)備成本低廉。目前,普通數(shù)碼相機(jī)、數(shù)碼攝像機(jī)和照掃描儀等攝像設(shè)備在普通家庭的日益普及進(jìn)一步增加了其可用性;(3)人臉識(shí)別具有快捷、非接觸的特點(diǎn),對(duì)用戶友好。人臉是人們?cè)谌粘I钪斜嬲J(rèn)他人的最常用的特征。利用人臉特征進(jìn)行身份驗(yàn)證最易被人們接受; (4)存在豐富的現(xiàn)有數(shù)據(jù)。社會(huì)上具有各種大型的人臉數(shù)據(jù)庫(kù),如公安部門的身份證照片數(shù)據(jù)庫(kù),學(xué)校里的學(xué)生學(xué)籍?dāng)?shù)據(jù)庫(kù)等等。在各種身份證明材料中,一般也會(huì)含有標(biāo)準(zhǔn)的正面人臉照片;(5)具有方便、快捷、強(qiáng)大的事后追蹤能力。普通人可以對(duì)人臉認(rèn)證系統(tǒng)的結(jié)果進(jìn)行判定,而上述其他生物特征一般只能通過(guò)專家認(rèn)定。人臉識(shí)別技術(shù)作為生物識(shí)別技術(shù)的一種,以其特有的穩(wěn)足性、方便性、唯一性等特點(diǎn)被愈來(lái)愈多地應(yīng)用于除安全問(wèn)題外的各種身份識(shí)別領(lǐng)域。因?yàn)槠渚薮蟮纳虡I(yè)應(yīng)用前景,受到越來(lái)越多的重視。近幾十年以來(lái)人臉識(shí)別技術(shù)有了長(zhǎng)足的發(fā)展,并且逐步走向?qū)嶋H應(yīng)用階段??梢灶A(yù)言,在今后的幾十年內(nèi),隨著人臉識(shí)別技術(shù)進(jìn)一步發(fā)展,人臉識(shí)別技術(shù)將應(yīng)用到更多的領(lǐng)域,例如視覺(jué)監(jiān)控、娛樂(lè)應(yīng)用、智能卡、自動(dòng)身份驗(yàn)證、銀行安全、公安系統(tǒng)刑偵破案的罪犯身份識(shí)別、身份證及駕駛執(zhí)照等證件驗(yàn)證、銀行及海關(guān)的監(jiān)控、自動(dòng)門衛(wèi)系統(tǒng)、視頻會(huì)議等。目前,各國(guó)都加大力度研究生物識(shí)別技術(shù),人臉識(shí)別這一最類似人類身份鑒別的方式得到了很多人的關(guān)注,很多重要的出入場(chǎng)合都在安裝人臉識(shí)別系統(tǒng)。這些己有的以及潛在的應(yīng)用領(lǐng)域?qū)⑼苿?dòng)人臉識(shí)別技術(shù)不斷發(fā)展。根據(jù)預(yù)計(jì),生物特征識(shí)別技術(shù)在2009-2012年的增長(zhǎng)率將保持30%左右,在國(guó)內(nèi)這一數(shù)字會(huì)更高。整個(gè)生物識(shí)別技術(shù)市場(chǎng)的規(guī)模2010年將達(dá)到40億美元左右,國(guó)內(nèi)市場(chǎng)有可能達(dá)到40億人民幣。人臉識(shí)別作為一種新興的生物識(shí)別技術(shù)將占據(jù)整個(gè)生物特征識(shí)別技術(shù)15%-20%左右的份額。就算以15%計(jì)算,人臉識(shí)別的市場(chǎng)規(guī)模也將在2010年達(dá)到6億美元,國(guó)內(nèi)達(dá)到40億人民幣左右。作為一種最直接、最自然、最容易被人接受的生物特征識(shí)別技術(shù),人臉識(shí)別致力于探索如何使機(jī)器能夠自動(dòng)地根據(jù)用戶的人臉圖像來(lái)鑒別用戶的身份。 人臉識(shí)別的研究涉及模式識(shí)別、計(jì)算機(jī)視覺(jué)、人工智能、圖像處理、心理學(xué)、機(jī)器人的智能化研究、醫(yī)學(xué)、生理學(xué)和認(rèn)知科學(xué)等,與計(jì)算機(jī)人機(jī)交互領(lǐng)域和基于其它生物特征的身份識(shí)別方法都有密切聯(lián)系。雖然人們可以毫不費(fèi)力地通過(guò)臉部圖像來(lái)鑒別互相的身份,然而由于成像過(guò)程中各種影響因素的變化常常導(dǎo)致同一個(gè)人的人臉圖像發(fā)生非常大的變化,因此建立自動(dòng)系統(tǒng)完成識(shí)別任務(wù)是非常具有挑戰(zhàn)性的。雖然目前國(guó)內(nèi)外己經(jīng)有許多實(shí)用系統(tǒng)問(wèn)世,但是只有在非??量痰某上駰l件下,才能得到比較令人滿意的識(shí)別效果。因此,人臉識(shí)別研究仍然遠(yuǎn)遠(yuǎn)沒(méi)有到達(dá)完善的境地,還有非常大的發(fā)展空間。1.2人臉識(shí)別的定義及主要研究?jī)?nèi)容 人臉識(shí)別(Face Recognition)是指基于己知的人臉樣本庫(kù),利用圖像處理和模式識(shí)別技術(shù)從靜態(tài)或動(dòng)態(tài)場(chǎng)景中,識(shí)別或驗(yàn)證一個(gè)或多個(gè)人臉。從廣義上來(lái)說(shuō),人臉識(shí)別主要包括人臉檢測(cè)、人臉表征、人臉鑒別、表情分析和物理分類五個(gè)方面。 (1)人臉檢測(cè)(Face Detection):即從各種不同的場(chǎng)景中檢測(cè)出人臉的存在并確定其位置、尺度和姿勢(shì)。這一任務(wù)主要受光照、噪聲、頭部?jī)A斜度以及各種遮擋的影響;(2)人臉表征(Face Representation):即確定表示檢測(cè)出的人臉和數(shù)據(jù)庫(kù)中的已知人臉的描述方式。通常的表示方法有幾何特征(如歐氏距離、曲率、角度等)、代數(shù)特征(如矩陣特征矢量)、固定特征模板、特征臉等;(3)人臉鑒別(Face Identification):即通常所說(shuō)的人臉識(shí)別,就是將待識(shí)別的人臉與數(shù)據(jù)庫(kù)中的己知人臉比較,得出相關(guān)信息。這一過(guò)程的核心是選擇適當(dāng)?shù)娜四槺硎痉绞脚c匹配策略;(4)表情分析(Facial Expression Analysis):即對(duì)待識(shí)別人臉的表情進(jìn)行分析,并對(duì)其分類;(5)物理分類(Physical Classification)即對(duì)待識(shí)別人臉的物理特征進(jìn)行分類,得出其年齡、性別、種族等相關(guān)信息。狹義的人臉識(shí)別就是根據(jù)系統(tǒng)新輸入的人臉,與己有的人臉數(shù)據(jù)庫(kù)進(jìn)行比對(duì),來(lái)判斷該人臉是否在人臉庫(kù)中;如果在該人臉數(shù)據(jù)庫(kù)中,則給出所對(duì)應(yīng)的具體的個(gè)體信息。一般來(lái)說(shuō),我們所提的人臉識(shí)別指的是狹義的人臉識(shí)別。一個(gè)典型的自動(dòng)人臉識(shí)別系統(tǒng)如圖1.1所示,分為訓(xùn)練和識(shí)別兩個(gè)步驟,兩個(gè)步驟都需要檢測(cè)和定位人臉、人臉圖像的預(yù)處理和特征提取和選擇。其中訓(xùn)練一般是離線運(yùn)算的,而識(shí)別是在線操作的。 圖1.1人臉識(shí)別系統(tǒng)的基本框圖(1)人臉的檢測(cè)和定位,人臉檢測(cè)與人臉定位是相互聯(lián)系但又有所區(qū)別的兩個(gè)概念。人臉檢測(cè)的目的是檢測(cè)輸入的圖像中是否含有人臉,而人臉定位是確定輸入的圖像中人臉位置以及大小,并將人臉從背景中分割出來(lái)。檢測(cè)人臉對(duì)于簡(jiǎn)單背景的同一人的人臉圖片是比較容易實(shí)現(xiàn)的,但當(dāng)人臉的背景變得復(fù)雜,或者圖片中的人臉屬于多個(gè)人時(shí),檢測(cè)就會(huì)變得相對(duì)困難。人臉檢測(cè)與定位是一項(xiàng)很復(fù)雜的工作,這是由于光線、視角、表情、墨鏡、遮擋物等各種因素,以及可能出現(xiàn)的圖像噪聲或干擾,即使是同一人的人臉圖像也可能會(huì)產(chǎn)生很大的差別,這使得人臉檢測(cè)與定位工作變得相當(dāng)困難。作為人臉識(shí)別的基礎(chǔ),人臉的檢測(cè)與定位是人臉識(shí)別研究的另一個(gè)重要方面。(2)人臉圖像的預(yù)處理,人臉檢測(cè)得到的人臉圖像,如有設(shè)備條件的差異,可能存在光照、噪聲、角度不好等缺陷,一般需要對(duì)圖像進(jìn)行幾何歸一化、灰度歸一化及邊緣檢測(cè)等處理。幾何歸一化主要是指將人臉圖像進(jìn)行一定的處理變?yōu)橄袼卮笮〗y(tǒng)一且人臉關(guān)鍵位置一致的圖片?;叶葰w一化則就是對(duì)人臉圖像進(jìn)行光照補(bǔ)償,消除光照對(duì)圖像的影響,進(jìn)而提高識(shí)別率。(3)特征提取和選擇,對(duì)人臉進(jìn)行識(shí)別主要依據(jù)人臉的特征,也就是說(shuō)依據(jù)不同個(gè)體之間有較大差異而對(duì)同一個(gè)體則比較穩(wěn)定的度量。在實(shí)際操作中,我們主要是通過(guò)各種變換來(lái)達(dá)到對(duì)圖像進(jìn)行降維的效果,如特征臉?lè)椒ㄖ蠯-L變換就是特征提取,而主元選取就是特征選擇。除此之外還有DCT, Gabor變換、分?jǐn)?shù)階傅里葉變換等都是基于人臉的整體特征提取,還有基于人臉局部特征的提取方法,如利用顯著器官(眼鏡、眉毛、耳朵、嘴巴等)之間的距離關(guān)系,以及通過(guò)訓(xùn)練學(xué)習(xí)求得的局部特征。(4)人臉識(shí)別,在識(shí)別前對(duì)人臉圖像庫(kù)進(jìn)行處理,得到每個(gè)個(gè)體的特征信息,單獨(dú)建立一個(gè)新的人臉圖像數(shù)據(jù)庫(kù),在識(shí)別過(guò)程中,采用同樣的方法得到測(cè)試人臉圖片的特征信息,并與庫(kù)中的每個(gè)個(gè)體信息進(jìn)行比較。在比較之前需確定相似性尺度,常用的是歐氏距離函數(shù)和基于貝葉斯準(zhǔn)則的概率尺度。一般情況下,識(shí)別可以分為兩種:一種是人臉辨認(rèn),即需要確認(rèn)被識(shí)別者的具體信息;另一種是身份證實(shí),只需要判斷識(shí)別對(duì)象是否是數(shù)據(jù)庫(kù)中個(gè)體的一員。整個(gè)人臉識(shí)別的研究工作主要是圍繞特征向量的提取和特征選擇展開(kāi)的。因?yàn)橹暗念A(yù)處理步驟與圖像處理的工作是相通的,而之后的識(shí)別步驟與一般的模式識(shí)別問(wèn)題是一致的。1.3人臉識(shí)別方法綜述1.3.1人臉識(shí)別方法分類根據(jù)研究角度的不同,我們對(duì)人臉識(shí)別方法可以進(jìn)行不同的分類方法。根據(jù)圖像來(lái)源途徑的不同,可以分為動(dòng)態(tài)和靜態(tài)的人臉識(shí)別;根據(jù)輸入人臉圖像的角度,可以分為基于正面、側(cè)面和傾斜人臉圖像識(shí)別;根據(jù)圖像的顏色特點(diǎn),可以分為彩色圖像和灰度圖像的人臉識(shí)別。本文的人臉識(shí)別研究是基于靜態(tài)、正面的灰度圖像的。根據(jù)對(duì)人臉圖像不同的特征提取方式,我們大致可以人臉識(shí)別方法分成兩種:一是基于局部特征分析的研究方法;二是基于整體的研究方法,它考慮到模式的整體屬性,主要有特征臉?lè)椒ā椥詧D匹配方法、神經(jīng)網(wǎng)絡(luò)方法及隱馬爾可夫模型方法等等?;诰植刻卣鞣治龅姆椒ㄗR(shí)別結(jié)果取決于特征定位算法的準(zhǔn)確性,而且要求圖像的像素較高,因此要近距離拍攝圖片。基于整體的識(shí)別方法也各自有自己的缺陷,所以近年來(lái)的研究趨勢(shì)是將人臉的局部特征分析和整體識(shí)別結(jié)合起來(lái)。1.3.2常用的人臉識(shí)別方法對(duì)人臉識(shí)別方法的研究主要有兩大方向:一是基于人臉圖像局部特征的識(shí)別方法;二是基于人臉圖像整體特征的識(shí)別方法。基于人臉圖像局部特征的識(shí)別通常抽取人臉器官如眼睛、眉毛、鼻子和嘴等器官的位置,尺度以及彼此間的比率作為特征。進(jìn)一步地可以用幾何形狀擬合人臉器官,從而以幾何參數(shù)作為描述人臉的特征。由于此類方法通常要精確地抽取出位置、尺度、比率或幾何參數(shù)作為描述人臉的特征,因此對(duì)人臉圖像的表情變化比較敏感。同時(shí),人臉器官分割的精確度也對(duì)人臉特征的提取有一定的影響。另外,該類方法并沒(méi)有充分利用到人臉圖像本身具有的獲度信息,該方向已經(jīng)不是人臉識(shí)別技術(shù)發(fā)展的主流方向?;谌四槇D像整體特征的人臉識(shí)別方法由于不需要精確提取人臉圖像中部件的具體信息,而且可以充分利用到人臉圖像本身具有的灰度信息,因此可獲得更好的識(shí)別性能。目前,絕大部分關(guān)于人臉識(shí)別方法的文章都是基于人臉圖像整體特征的,主要有特征臉?lè)?、最佳鑒別向量集法,貝葉斯法,基于傅立葉不變特征法,彈性圖匹配法,其他相關(guān)方法有線性子空間法,可變形模型法和神經(jīng)網(wǎng)絡(luò)法。這些方法中有的側(cè)重于表述人臉圖像的特征提取,如彈性圖匹配法和傅立葉不變特征法;有的則側(cè)重于分類,如最佳鑒別向量集法、貝葉斯法和神經(jīng)網(wǎng)絡(luò)法;而有的則側(cè)重于人臉圖像重構(gòu),如特征臉?lè)ê途€性子空間法。所有這些基于人臉圖像整體特征的人臉識(shí)別方法均取得了一定的識(shí)別性能。1.3.3基于幾何特征的人臉識(shí)別方法基于幾何特征的人臉識(shí)別方法主要源于人臉識(shí)別的初期研究階段。這種方法是以人臉各個(gè)器官和幾何關(guān)系為基礎(chǔ)進(jìn)行算法設(shè)計(jì)。對(duì)于不同人來(lái)說(shuō),臉上的各個(gè)器官,如眼睛、鼻子、嘴巴以及整個(gè)臉部的輪廓具有不同的形狀、大小、相對(duì)位置和分布情況。在基于幾何特征的人臉識(shí)別方法中,可以用一個(gè)矢量來(lái)表示提取出來(lái)的幾何參數(shù)。如果要獲得一個(gè)準(zhǔn)確、穩(wěn)定和可靠的識(shí)別結(jié)果,就要求這些被選出的幾何特征參數(shù)包含足夠豐富的辨識(shí)人臉的信息,且能反映不同人臉之間的差別。也就是說(shuō)對(duì)這些矢量要求具有較高的模式分類能力,同時(shí)還要有一定的穩(wěn)健性,能夠消除由于時(shí)間變遷、光照變化等其他干擾因素所帶來(lái)的影響。具體來(lái)說(shuō),這些幾何參數(shù)一般包括人臉上兩個(gè)指定特征點(diǎn)之間的歐式距離、邊緣曲率、角度等等。在Brunelli和Poggio的文獻(xiàn)中給出了一組典型的人臉幾何特征參數(shù):(1)眉毛的厚度(2)眉毛與眼睛中心的垂直距離;(3)描述左眼眉毛弧度的12個(gè)數(shù)據(jù);(4)鼻子的寬度;(5)鼻子在面部上的位置;(6)嘴巴的垂直位置、嘴巴的寬度和上下嘴唇的亮度;(7)描述下顎形狀的11個(gè)半徑數(shù)據(jù);(8)以鼻子位置為準(zhǔn)的臉部寬度;(9)顴骨寬度(半臉寬)。當(dāng)這些幾何特征參數(shù)提取出來(lái)后,就可以采用最小距離(歐式距離)分類器,將待識(shí)別人臉特征向量與數(shù)據(jù)庫(kù)中人臉特征矢量進(jìn)行比較,取距離最近者作為識(shí)別結(jié)果。在實(shí)際應(yīng)用過(guò)程中,基于幾何特征的人臉識(shí)別方法存在著兩個(gè)方面的問(wèn)題:(1)如何快速、準(zhǔn)確地檢測(cè)出人臉的重要標(biāo)志點(diǎn)依然是一個(gè)沒(méi)有很好解決的問(wèn)題。(2)臉部幾何特征在人臉辨識(shí)中的有效性問(wèn)題,即臉部幾何特征能夠提供多少可供識(shí)別的信息量。雖然各人臉的器官在形狀、大小及分布上各不相同,但是這種器官上的差異性更多是體現(xiàn)在某些細(xì)微的感覺(jué)意義上。例如眼睛顯得比較小、鼻子顯得比較寬,以及皮膚的紋理、顏色上的差異等等。顯然,這些特征中的一部分是難以精確測(cè)量出來(lái)或者是不能用幾何參數(shù)準(zhǔn)確描述的。所以僅靠增加臉上幾何參數(shù)的數(shù)目來(lái)提高人臉識(shí)別率是不太現(xiàn)實(shí)的。由于進(jìn)一步改善測(cè)量精度是十分困難的,因而通過(guò)增加臉部幾何參數(shù)的數(shù)量來(lái)改善識(shí)別率結(jié)果,其影響是極小的。因此,基于少量人臉幾何特征進(jìn)行大規(guī)模人臉辨識(shí)的可靠性是不容樂(lè)觀的。1.3.4基于K-L變換的特征臉?lè)椒ɑ谔卣髂樀娜四樧R(shí)別方法的基礎(chǔ)是KL變換。KL變換是圖像壓縮中的一種最優(yōu) 正交變換。通過(guò)KL變換,可以把圖像在高維空間表示轉(zhuǎn)換到低維空間表示,而由低維空間恢復(fù)的圖像和原圖像具有最小的均方誤差,從而可以以圖像在低維空間的變換系數(shù)作為人臉圖像的描述特征。KL變換用于人臉識(shí)別的前提是人臉圖像處于低維空間,并且不同人臉是線性可分的。通常情況下,KL變換的變換矩陣由訓(xùn)練樣本類間散布矩陣的特征矢量生成。人臉圖像在前面的特征矢量上的投影有較大的能量,稱為主分量;在后面的特征矢量上的投影具有較小的能量。稱為次分量。當(dāng)舍棄部分次分量時(shí),KL變換也稱為主成分分析法(PCA)。由于人臉圖像具有相似的形狀和結(jié)構(gòu),人臉圖像在主分量上的投影過(guò)多地反映了光照變化,因此有人提出舍棄人臉圖像在前3個(gè)特征矢量上的投影,而用人臉圖像在其余特征矢量上的投影作為描述人臉圖像的特征。 KL變換是數(shù)字圖像壓縮領(lǐng)域里的一種最優(yōu)變換,它使從低維空間恢復(fù)的人臉圖像和原圖像的均方誤差最小。但KL變換只是從壓縮角度來(lái)看是最優(yōu)的,從分類角度來(lái)看卻不是最優(yōu)的。雖然它考慮了人臉圖像的所有差異(從壓縮角度),但沒(méi)有考慮這些差異是類內(nèi)差異(如光照變化,頭飾變化或幾何變化)還是類間差異(從分類角度)。K-L變換是圖像壓縮的一種最優(yōu)正交變換,人們將它應(yīng)用于特征提取,形成了子空間法模式識(shí)別的基礎(chǔ)。將K-L變換用于人臉識(shí)別,需要假設(shè)人臉處于低維的線性空間,不同人臉具有可分性。高維的圖像空間經(jīng)過(guò)K-L變換后得到一組新的正交基,保留其中重要的正交基從而形成了低維的人臉空間。若將所有子空間的正交基排列成圖像陣列,則正交基呈現(xiàn)人臉的形狀,因此這些正交基也被稱為特征臉。選擇那些正交基形成的子空間則有不同的考慮,與較大特征值對(duì)應(yīng)的一些正交基(也稱主分量)能夠表達(dá)人臉的大體形狀,而具體細(xì)節(jié)需要那些小特征值對(duì)應(yīng)的特征向量(也稱次分量)來(lái)加以補(bǔ)充描述,因此低頻成分用主分量表示,高頻分量用次分量表示。采用主分量作為新的正交空間的正交基的方法稱為主分量_(Principal Component Analysis,簡(jiǎn)稱PCA)方法。 K-L變換在90年代初受到了很大的重視,實(shí)際用于人臉識(shí)別取得了很好的效果,一般庫(kù)德大小為100幅左右,識(shí)別率在70-100之間不等,這主要取決于人臉庫(kù)圖像的質(zhì)量。從壓縮能量的角度來(lái)看,K-L變換是最優(yōu)的,變換后的低維空間對(duì)于人臉有很好的表達(dá)能力,較好的判別能力。選擇訓(xùn)練樣本的散布矩陣作為K-L變換的生成矩陣,其最大特征向量反映了該樣本集合的最大分布的方向,但這是圖像統(tǒng)計(jì)方法,而不是人臉統(tǒng)計(jì)方法。它查找的是圖像之間所有的差異,并根據(jù)這些差異來(lái)確定不同人臉間的距離,而不管這些差異是由于光線、發(fā)型或背景的改變引起的,還是屬于人臉本身的內(nèi)在差異,因此特征臉的方法用于人臉識(shí)別存在理論的缺陷。研究表明,特征連的方法隨著光線、角度以及人臉的尺寸的引入而識(shí)別率急劇下降。主分量的方法使得變換后的表達(dá)能力最佳,次分量的方法考慮了高頻的人臉區(qū)分能力,但是由于外在因素帶來(lái)圖像差異和人臉本身帶來(lái)的差異對(duì)K-L變換而言是不加任何區(qū)分的,因此,如何選擇正交基并不根本解決問(wèn)題。改進(jìn)的一個(gè)思路是針對(duì)干擾所在,對(duì)輸入圖像作規(guī)范化處理,包括輸入圖像的均值方差歸一化,人臉尺寸歸一化。另一種改進(jìn)是考慮到局部人臉圖像受到外在干擾相對(duì)較小的情況,除了計(jì)算特征臉之外,還利用K-L變換計(jì)算出特征眼、特征嘴等。將局部特征向量加權(quán)進(jìn)行匹配得到一些好的效果??傊卣髂?lè)椒ㄊ且环N簡(jiǎn)單、快速、使用的基于變換系數(shù)的算法,但由于它在本質(zhì)上依賴于訓(xùn)練集合測(cè)試集圖像的灰度相關(guān)性,而且要求測(cè)試圖像與訓(xùn)練集比較接近,所以存在著很大局限。1.3.5神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)是一種以大量的處理單元(神經(jīng)元)為節(jié)點(diǎn),處理單元之間實(shí)現(xiàn)加權(quán)值互連的拓?fù)浣Y(jié)構(gòu)。人工神經(jīng)網(wǎng)絡(luò)中的處理單元是人類大腦神經(jīng)單元的簡(jiǎn)化。處理單元之間的互連則是軸突、樹(shù)突這些信息傳遞路徑的簡(jiǎn)化。根據(jù)不同的應(yīng)用場(chǎng)合,現(xiàn)已研究出較多的神經(jīng)元網(wǎng)絡(luò)模型及其動(dòng)態(tài)過(guò)程的算法。人工神經(jīng)元通常采用非線性的作用函數(shù),當(dāng)大量神經(jīng)元連接成一個(gè)網(wǎng)絡(luò)并動(dòng)態(tài)運(yùn)行時(shí),則構(gòu)成了一個(gè)非線性動(dòng)力學(xué)系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)具有自組織性、高維性、模糊性、分布性和冗余性等等特點(diǎn),較馮-諾依曼體系的計(jì)算機(jī)更適合模擬人類大腦的思維機(jī)理。但總的來(lái)說(shuō),由于人類對(duì)自身思維機(jī)理認(rèn)識(shí)的不足,所以對(duì)人工神經(jīng)元作了極度的簡(jiǎn)化,這種模擬表現(xiàn)為極其膚淺和簡(jiǎn)單。很多臉部識(shí)別系統(tǒng)都采用了多層感知機(jī)(MultiLayer Perceptor)作為人工神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)。多層感知機(jī)由幾層全互連的非線性神經(jīng)組成。神經(jīng)元之間有權(quán)值連接,權(quán)值包含了訓(xùn)練模式空間的特征。訓(xùn)練過(guò)程就是調(diào)整權(quán)值的過(guò)程,最常用的算法就是BP法則。采用多層感知機(jī)進(jìn)行面部識(shí)別的目的就是建立一個(gè)關(guān)于臉部的緊湊表示,這相當(dāng)于面部特征的抽取。因?yàn)殡[層節(jié)點(diǎn)的數(shù)目L通常要遠(yuǎn)遠(yuǎn)小于輸入層和輸出層的節(jié)點(diǎn)數(shù)目,從而多層感知機(jī)將高維德輸入數(shù)據(jù)變換到一個(gè)低維子空間中,同時(shí)保留了原始數(shù)據(jù)中最重要的信息。如果隱層神經(jīng)元采用線性作用函數(shù),則多層感知機(jī)張成的降維子空間將與主元分析法張成的子空間一樣。主元分析法的方差是由大到小排列的,而多層感知機(jī)的方差是均勻分布到每個(gè)隱層神經(jīng)元上。多層感知機(jī)的輸入形式有很多種,最簡(jiǎn)單的就是將整個(gè)人臉圖像作為輸入層,也可以對(duì)人臉圖像進(jìn)行采樣,然后用低分辨率圖像作為輸入層。還有的文獻(xiàn)采用了二進(jìn)制圖像的等密度區(qū)域或多個(gè)局部面部特征作為不同多層感知機(jī)的輸入層。直接使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識(shí)別的問(wèn)題在于網(wǎng)絡(luò)過(guò)于龐大和復(fù)雜,例如對(duì)于一幅128128的人臉圖像,輸入層和輸出層的節(jié)點(diǎn)數(shù)目將達(dá)16438。顯然,訓(xùn)練這樣大的一個(gè)網(wǎng)絡(luò)將花費(fèi)很長(zhǎng)時(shí)間,需要的存儲(chǔ)量也會(huì)很高。由此可以看出,人工神經(jīng)網(wǎng)絡(luò)有著與Eigenface方法非常相似的表達(dá)方法。一般來(lái)說(shuō),BP算法的收斂速度非常緩慢,學(xué)習(xí)過(guò)程可能需要對(duì)整個(gè)訓(xùn)練集進(jìn)行上千次反復(fù)迭代運(yùn)算,這是神經(jīng)網(wǎng)絡(luò)實(shí)際應(yīng)用的一個(gè)問(wèn)題。此外,BP算法以誤差梯度下降的方式達(dá)到極小值,但在實(shí)際應(yīng)用中,容易陷入到局部極小中,無(wú)法得到全局最優(yōu)解,這也是有待解決的一個(gè)問(wèn)題。1.3.6彈性匹配圖臉部識(shí)別方法在利用圖匹配進(jìn)行識(shí)別的方法中,一個(gè)目標(biāo)(如一個(gè)人臉圖像)可以采用一張圖(Graph)來(lái)表示。根據(jù)局部化空間頻率得到的一系列多分辨率秒數(shù)值可以用來(lái)表示圖中的節(jié)點(diǎn)數(shù)值。物體內(nèi)部的空間關(guān)系則可以用節(jié)點(diǎn)之間的幾何距離表示。Gabor變換是進(jìn)行時(shí)頻分析的有效工具,該函數(shù)在時(shí)間域和頻率域上都是局部化的,通常將Gabor特征用到針對(duì)臉部識(shí)別的彈性圖匹配中。Gabor特征在網(wǎng)格節(jié)點(diǎn)上提供了一個(gè)多尺度邊緣強(qiáng)度。一般來(lái)說(shuō),圖像中的關(guān)鍵部位會(huì)有較大的Gabor系數(shù)。同樣的,對(duì)于一個(gè)待識(shí)別的人臉圖像也可以定義一個(gè)網(wǎng)格G及網(wǎng)格上的特征矢量。在彈性圖匹配(Elastic Graph Matching)方法中,兩幅圖的距離是通過(guò)尋找G與M之間的最優(yōu)匹配來(lái)得到。在彈性圖匹配方法中,將人臉圖像庫(kù)中的圖像和待識(shí)別圖像都用特征矢量圖表示。通過(guò)對(duì)突遇圖之間的拓?fù)浣Y(jié)構(gòu)的匹配以及節(jié)點(diǎn)與節(jié)點(diǎn)之間的特征矢量值的比較,可以進(jìn)行人臉識(shí)別,這就將模板的圖像匹配轉(zhuǎn)化成了模板的圖匹配。在尋找最佳匹配方法時(shí),希望能夠同時(shí)維持特征數(shù)值接近和局部幾何關(guān)系。彈性圖匹配方法的最大優(yōu)點(diǎn)在于對(duì)光和表情變化的相對(duì)不敏感性。這主要?dú)w功于兩個(gè)原因:(1)用Gabor變換可提取圖像的局部多分辨率特征;(2)在計(jì)算距離或者能量函數(shù)時(shí),使用了變形匹配方法。彈性匹配圖方法的主要缺點(diǎn)在于計(jì)算量大。1.3.7隱馬爾可夫模型的識(shí)別方法隱馬爾可夫模型(Hidden Markov Model)一般應(yīng)用于非平穩(wěn)時(shí)間序列矢量的統(tǒng)計(jì)建模,在語(yǔ)音處理,特別是語(yǔ)音識(shí)別中得到廣泛的應(yīng)用。隱馬爾可夫模型為一個(gè)觀測(cè)序列提供了一個(gè)統(tǒng)計(jì)模型n引,該模型由兩個(gè)互相關(guān)聯(lián)的過(guò)程組成:(1)一個(gè)是底層不可觀測(cè)的馬爾可夫鏈,它由有限個(gè)狀態(tài)、一個(gè)概率轉(zhuǎn)移矩陣和一個(gè)初始狀態(tài)概率分布函數(shù)組成。(2)另外是一組聯(lián)系每一個(gè)狀態(tài)的概率密度函數(shù)。在使用隱馬爾可夫模型的面部識(shí)別方法中,首先將一個(gè)人臉圖像采集成一系列的條狀圖,將一幅二維圖像變成一個(gè)一維矢量序列,這個(gè)序列構(gòu)成了隱馬爾可夫模型的觀測(cè)矢量。由于人臉的特定構(gòu)造,在這種抽樣方式下,臉部特征帶的出現(xiàn)將服從于一定的順序,所以該模型可以用一個(gè)從左到右的隱馬爾可夫模型表示,其中狀態(tài)的轉(zhuǎn)移只能按照從左到右的方式進(jìn)行。接著是訓(xùn)練該隱馬爾夫模型,由以下幾個(gè)步驟組成:(1)建立一個(gè)隱馬爾可夫模型;(2)用訓(xùn)練數(shù)據(jù)迭代計(jì)算初始參數(shù)值;(3)用BaumWelch方法重新估計(jì)參數(shù)值。識(shí)別通過(guò)一個(gè)Viterbi識(shí)別器完成,用代表不同人的隱馬爾可夫模型與待識(shí)別圖像匹配,最高匹配者被選出來(lái)。1.3.8基于FISHER線性判別式的方法P.Belhumeur提出了一種基于Fisher線性判別式的人臉識(shí)別方法,與Eigenface方法相對(duì)應(yīng),Belhumeur稱其為Fisherface,這種方法對(duì)面部表情和光照方向不敏感。類似于Eigenface方法,F(xiàn)isherface方法也是采用線性投影技術(shù)將人臉圖像從高維圖像空間轉(zhuǎn)化到低維特征子空間。在這個(gè)低維子空間中,如果特征和投影方向選擇合適的話,人臉特征可以做到對(duì)光照方向和表情變化不敏感。與Eigenface方法不同的是,F(xiàn)isherface采用的投影方向幾乎與類內(nèi)散布方向垂直,而Eigenface方法采用的投影方向是使所有類散布最大化。Belhumeur認(rèn)為這種使所有類散布最大化的PCA方法會(huì)保留那些對(duì)分類不利的光照方向和表情信息。因此可認(rèn)為:對(duì)以均方誤差為準(zhǔn)則的臉部重建來(lái)說(shuō),PCA方法是一種最優(yōu)的方法:但從模式分類和辨識(shí)的觀點(diǎn)來(lái)看,PCA方法則不一定能夠取得最優(yōu)的結(jié)果。1.3.9基于小波包的識(shí)別方法基于小波包的面部識(shí)別方法首先對(duì)一幅人臉圖像進(jìn)行小波包分解。因?yàn)樾〔ò纸獾玫降牟煌l帶包含有不同的人臉信息,所以從每一個(gè)小波包中可以提取出不同的面部特征。對(duì)于小波包分解得到的離散逼近稀疏,Garcai進(jìn)一步將它分解成三個(gè)部分,分別是邊界區(qū)、上半部分和下半部分,然后就可以分別計(jì)算這三個(gè)區(qū)域的均值和方差,加上另外15個(gè)離散細(xì)節(jié)區(qū)域的方差,組成一個(gè)包含有21個(gè)分量的特征向量。小波包分解是一種多分辨率分析方法,能夠提供良好的面部紋理描述,所以有利于提取面部特征。1.4人臉識(shí)別的應(yīng)用任何一種技術(shù)的發(fā)展都是由于受到了實(shí)際應(yīng)用需要的激勵(lì),人臉識(shí)別技術(shù)也不例外,它最初就是公安部門要把它用于罪犯照片的存檔管理和刑偵破案。而現(xiàn)在逐步擴(kuò)大到社會(huì)生活的各個(gè)領(lǐng)域,例如在海關(guān)邊檢、物業(yè)管理、網(wǎng)絡(luò)安全、視頻會(huì)議、計(jì)算機(jī)訪問(wèn)控制等方面都有著廣泛的應(yīng)用。我們從一下幾個(gè)方面具體介紹人臉識(shí)別技術(shù)的應(yīng)用:(1)在公安系統(tǒng)的罪犯識(shí)別方面,當(dāng)公安部門獲得案犯的照片后,可以利用人臉識(shí)別技術(shù),在存儲(chǔ)罪犯照片的數(shù)據(jù)庫(kù)里找出最相像的嫌疑犯。由于罪犯數(shù)據(jù)庫(kù)往往很大,如果這項(xiàng)搜索工作由人工完成,不僅效率低,而且容易出錯(cuò),因?yàn)槿嗽诳戳松习俜四槇D像后,記憶力會(huì)下降,而由計(jì)算機(jī)來(lái)完成則不會(huì)出現(xiàn)此問(wèn)題;(2)身份證、駕駛證以及其他很多證件上都有照片,現(xiàn)在的證件驗(yàn)證一般都是由人進(jìn)行驗(yàn)證,如果利用人臉識(shí)別技術(shù),這項(xiàng)工作就可以交給機(jī)器完成,從而實(shí)現(xiàn)自動(dòng)化智能管理。當(dāng)前普遍使用的驗(yàn)證方法有符號(hào)或條形碼標(biāo)記,比如信用卡、自動(dòng)提款機(jī)等此類驗(yàn)證的安全性比較低。如果運(yùn)用人臉識(shí)別技術(shù),則安全性將大大改善;(3)可以進(jìn)行入口控制。入口控制的范圍很廣,它可以是樓宇、單位或私人住宅入口處的安全檢查,也可以是計(jì)算機(jī)系統(tǒng)或情報(bào)系統(tǒng)的入口控制。目前比較常用的手段是檢查證件。人員頻繁出入時(shí),保安人員再三檢查證件是比較麻煩的,而且安全系數(shù)也不高。在保密要求非常嚴(yán)格的部門除了證件,還可以加上另外一些生物識(shí)別手段,如指紋識(shí)別、手掌識(shí)別、語(yǔ)音識(shí)別等。人臉識(shí)別與之相比,具有直接、方便和界面友好的特點(diǎn)。當(dāng)前計(jì)算機(jī)系統(tǒng)的安全管理,通常使用字符和數(shù)字組成的密碼口令管理,此口令容易被遺忘或破解,如果使用人臉作為口令則既方便又安全;(4)在視頻監(jiān)控方面,目前,許多銀行、公司、公共場(chǎng)合等處都設(shè)有24小時(shí)的視頻監(jiān)控。另外偵察員在破案時(shí)也要用攝像機(jī)對(duì)人進(jìn)行跟蹤。在對(duì)圖像進(jìn)行分析時(shí),都要用到人臉的檢測(cè),跟蹤和識(shí)別技術(shù)。對(duì)于以上提到的人臉識(shí)別技術(shù)的諸多應(yīng)用,我們可以把這些應(yīng)用分成兩類:一類是有限制條件照片的靜態(tài)匹配,譬如說(shuō)護(hù)照、信用卡、駕駛證上的照片匹配。另一類是視頻圖像的實(shí)時(shí)匹配,如銀行、海關(guān)、公共場(chǎng)合的視頻監(jiān)控、公安系統(tǒng)中罪犯的跟蹤識(shí)別等。這些應(yīng)用在圖像的質(zhì)量、背景,還有是否存在定義好的匹配策略等等方面都存在著很大的不同。1.5人臉識(shí)別問(wèn)題中的難點(diǎn)及發(fā)展方向1.5.1人臉識(shí)別問(wèn)題中的難點(diǎn)人類具有很強(qiáng)的人臉識(shí)別能力,嬰兒可以很快學(xué)會(huì)辨認(rèn)其父母的臉。但對(duì)計(jì)算機(jī)來(lái)說(shuō),進(jìn)行人臉識(shí)別卻困難很多。這些困難一方面源于計(jì)算機(jī)本身學(xué)習(xí)能力的局限性,另一方面是源于人臉識(shí)別技術(shù)所具有的復(fù)雜性。人臉具有相對(duì)穩(wěn)定的特征和結(jié)構(gòu),這為人臉識(shí)別技術(shù)帶來(lái)了實(shí)現(xiàn)的可能。但人臉具體形態(tài)的多樣性和所處環(huán)境的復(fù)雜性又造成了識(shí)別的巨大困難。具體的說(shuō),它的困難表現(xiàn)在:(1)圖像獲取的不確定性目前對(duì)于人臉識(shí)別問(wèn)題的研究大都基于已經(jīng)裁剪好的人臉區(qū)域圖像進(jìn)行的,在此基礎(chǔ)上再提出解決光照、姿態(tài)、遮擋等問(wèn)題的識(shí)別算法。而就目前的研究現(xiàn)狀而言,光照、姿態(tài)、遮擋等干擾因素對(duì)檢測(cè)算法的影響要遠(yuǎn)大于對(duì)識(shí)別算法的影響。光照:光照的方向及強(qiáng)度變化會(huì)嚴(yán)重影響人臉圖像的灰度分布,因而影響大多數(shù)基于圖像灰度統(tǒng)計(jì)特性的識(shí)別方法的效果。即使是目前最好的人臉識(shí)別系統(tǒng)在室外光照條件下,其識(shí)別性能也會(huì)急劇下降。這就說(shuō)明,復(fù)雜多變的光照問(wèn)題仍是人臉識(shí)別中的難點(diǎn);姿態(tài):姿態(tài)的變化分為二維平面上的姿態(tài)變化和三維空間上的姿態(tài)變化。盡管采用3D人臉模型可以解決人臉識(shí)別問(wèn)題中的姿態(tài)變化問(wèn)題,但是由于3D人臉數(shù)據(jù)獲取有很多的局限性,所以當(dāng)前仍需依賴對(duì)姿態(tài)變化魯棒的 2D人臉識(shí)別算法。故如何提高2D人臉數(shù)據(jù)的識(shí)別算法對(duì)姿態(tài)的魯棒性是一項(xiàng)既有現(xiàn)實(shí)意義又有挑戰(zhàn)性的課題;表情:人臉識(shí)別相對(duì)于其他物體識(shí)別問(wèn)題的一個(gè)困難就是人臉的非剛體性,主要體現(xiàn)為人臉豐富的表情變化,遮擋。對(duì)于人臉識(shí)別而言,造成遮擋的原因多種多樣,有可能的原因包括:外界景物的遮擋、眼鏡帽子等飾物的遮擋、人臉圖像部分缺失等。這些因素所導(dǎo)致的直接結(jié)果就是人臉區(qū)域部分的數(shù)據(jù)不完整,進(jìn)而影響后續(xù)處理的效果,甚至直接導(dǎo)致處于人臉識(shí)別系統(tǒng)第一階段的人臉檢測(cè)失效。(2)計(jì)算的復(fù)雜性很多經(jīng)典的識(shí)別問(wèn)題譬如文字識(shí)別只需要處理相對(duì)較少的類,而且每個(gè)類有大量的訓(xùn)練樣本,但在人臉識(shí)別問(wèn)題中,通常需處理相當(dāng)多的類,并且每個(gè)類存在很少的訓(xùn)練樣本,識(shí)別算法必須在很少的樣本中提取特征,通過(guò)訓(xùn)練進(jìn)行人臉圖像的匹配。盡管目前出現(xiàn)的一些商用的人臉識(shí)別系統(tǒng)在理想情況下已經(jīng)能夠可以接受的識(shí)別性能,但是整個(gè)人臉識(shí)別技術(shù)還遠(yuǎn)未成熟,還有大量的實(shí)際問(wèn)題需要得到解決。(3)識(shí)別算法的普適性問(wèn)題目前人臉識(shí)別中最成功的算法當(dāng)屬基于統(tǒng)計(jì)學(xué)習(xí)理論的算法。這類算法往往要求訓(xùn)練集合中的樣本能夠覆蓋所有情形下的人臉樣本,以便從中學(xué)習(xí)相關(guān)知識(shí)或規(guī)則,但這在實(shí)際中是無(wú)法滿足的,因?yàn)槟軌颢@得的訓(xùn)練樣本往往是有限的,因而便造成目前的識(shí)別算法普適性較差,即在由訓(xùn)練集中樣本擴(kuò)展到非訓(xùn)練集中樣本時(shí),識(shí)別性能會(huì)明顯下降。(4)人臉識(shí)別系統(tǒng)的長(zhǎng)期適應(yīng)問(wèn)題帶來(lái)這一問(wèn)題的主要原因是隨著年齡的變化人臉會(huì)發(fā)生較大的變化,特別是對(duì)于青少年,年齡對(duì)容貌的影響更大。另外,不同年齡段樣本的收集也比較困難,因?yàn)檫@需要很長(zhǎng)的時(shí)間跨度,目前所收集到的有年齡變化的人臉庫(kù)最長(zhǎng)也只有1年左右的時(shí)間跨度,這給相關(guān)算法的研究帶來(lái)了一定困難。因此如何解決年齡變化對(duì)識(shí)別算法的影響并提出具有中長(zhǎng)期適應(yīng)性的人臉識(shí)別算法是人臉識(shí)別系統(tǒng)必須解決的問(wèn)題。除此之外,人臉識(shí)別還有低質(zhì)量照片問(wèn)題,大規(guī)模人臉識(shí)別問(wèn)題,海量數(shù)據(jù)的學(xué)習(xí)問(wèn)題等等。1.5.2人臉識(shí)別的發(fā)展方向由于人臉識(shí)別領(lǐng)域仍存在上述很多問(wèn)題未徹底解決,因此未來(lái)人臉識(shí)別必然圍繞著現(xiàn)有難點(diǎn)的解決而繼續(xù)發(fā)展。簡(jiǎn)單概括一下,其發(fā)展方向大體包括:(1)準(zhǔn)確魯棒的人臉檢測(cè)與定位算法,保證后續(xù)識(shí)別算法具有穩(wěn)定可靠的樣本輸入;(2)高精度特殊圖像傳感器或快速三維掃描設(shè)備的研制,保證輸入原始人臉數(shù)據(jù)的質(zhì)量,克服圖像質(zhì)量低,光照和姿態(tài)等影響;(3)大規(guī)模全面公共人臉數(shù)據(jù)庫(kù)的建立,涵蓋所有人臉識(shí)別中所要面對(duì)的樣本,為全球研究者建立一個(gè)統(tǒng)一的研究和測(cè)試平臺(tái);(4)多生物特征的融合,采用特征融合技術(shù),與目前其它生物特征識(shí)別技術(shù)進(jìn)行融合,克服遮擋、化妝和活體檢測(cè)等難點(diǎn);(5)普適特征提取技術(shù)和普適分類器的提出,解決現(xiàn)有算法無(wú)法同時(shí)解決普適性差,泛化能力低和中長(zhǎng)期適應(yīng)性差等問(wèn)題;(6)其它解決方案,包括大規(guī)模計(jì)算機(jī)的發(fā)展,數(shù)據(jù)庫(kù)管理及檢索技術(shù)的發(fā)展,適合生物特征存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu)的發(fā)展等。第二章人臉圖像預(yù)處理2.1引言 圖像的預(yù)處理是模式識(shí)別過(guò)程的一個(gè)重要步驟。輸入圖像從實(shí)物轉(zhuǎn)換成數(shù)字圖像時(shí),由于設(shè)備條件的差異,往往存在噪聲、對(duì)比度太低等缺陷。另外,人臉在整幅圖像中的位置和大小又會(huì)因?yàn)榫嚯x遠(yuǎn)近、焦距大小等問(wèn)題變得不確定。為了確保較高的識(shí)別率,我們必須在提取人臉特征之前對(duì)圖像作一定的預(yù)處理工作。 本節(jié)的預(yù)處理工作是在原始ORL人臉庫(kù)上進(jìn)行的。主要的預(yù)處理工作包括:圖像的幾何歸一化,圖像的灰度歸一化,直方圖均衡化幾個(gè)部分。2.2人臉圖像庫(kù)簡(jiǎn)介建立一個(gè)包含人臉圖像的數(shù)據(jù)庫(kù)是做任何人臉識(shí)別系統(tǒng)的開(kāi)發(fā)的前提。人臉數(shù)據(jù)庫(kù)的設(shè)計(jì)對(duì)系統(tǒng)的識(shí)別率有至關(guān)重要的影響,數(shù)據(jù)庫(kù)中不同光照、姿態(tài)和表情的變化甚至背景變化都會(huì)影響識(shí)別的結(jié)果,所以需要針對(duì)人臉識(shí)別問(wèn)題建立適應(yīng)不同需要的人臉數(shù)據(jù)庫(kù)。下面介紹一些常用的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)。 目前使用最廣泛的人臉庫(kù)是英國(guó)ORL人臉數(shù)據(jù)庫(kù)。ORL人臉數(shù)據(jù)庫(kù)包含了英國(guó)劍橋大學(xué)從1992到1994年間在實(shí)驗(yàn)室采集到的人臉圖像數(shù)據(jù),由40人、每人10幅、共400幅圖像組成。每幅圖像的分辨率為92*112,灰度級(jí)為256。其中,35人為男性,5人為女性。這些圖像是在不同時(shí)間、不同光照、面部表情和面部遮掩物變化的情況下獲得的,如笑或不笑、眼睛或睜或閉、戴或不戴眼鏡;人臉姿態(tài)也有相當(dāng)程度的變化,深度旋轉(zhuǎn)和平面旋轉(zhuǎn)可達(dá)200,人臉的尺度也有多達(dá)10%的變化。 FERET人臉庫(kù)是目前最大的人臉數(shù)據(jù)庫(kù),由美國(guó)國(guó)防部發(fā)起建立,其初衷是想開(kāi)發(fā)一個(gè)自動(dòng)人臉識(shí)別系統(tǒng),以應(yīng)用于各種安全檢測(cè)目的。其最新的人臉庫(kù)包括14051幅灰度圖像,其中每人8張圖像,兩張正臉,3張從右到

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論