論文-PCA人臉特征提取技術(shù)研究.doc_第1頁(yè)
論文-PCA人臉特征提取技術(shù)研究.doc_第2頁(yè)
論文-PCA人臉特征提取技術(shù)研究.doc_第3頁(yè)
論文-PCA人臉特征提取技術(shù)研究.doc_第4頁(yè)
論文-PCA人臉特征提取技術(shù)研究.doc_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

摘要摘 要人臉識(shí)別是生物特征識(shí)別中一個(gè)活躍的研究領(lǐng)域,與利用指紋、虹膜等其他生物特征識(shí)別相比,人臉識(shí)別具有直接、友好、方便的特點(diǎn),是進(jìn)行身份確認(rèn)的最自然直接的手段。因此,人臉識(shí)別在信息安全、刑事偵破、出入口控制等領(lǐng)域具有廣泛的應(yīng)用前景。人臉識(shí)別的一般步驟是圖像預(yù)處理,特征提取,分類(lèi)識(shí)別。其中特征提取直接決定分類(lèi)結(jié)果的好壞,在人臉識(shí)別中占有重要地位。一個(gè)好的特征提取方法具有算法簡(jiǎn)單和速度快等特點(diǎn),本文主要研究一種經(jīng)典的特征提取方法主成分分析法(pca),其基本思想是降維。主要的工作如下:挑選人臉庫(kù),建立訓(xùn)練集和測(cè)試集;對(duì)訓(xùn)練集和測(cè)試集中的圖像進(jìn)行pca處理,即進(jìn)行特征提取,求出人臉圖像在特征臉空間中的坐標(biāo)系數(shù),以此來(lái)作為人臉圖像的特征;選用最近鄰分類(lèi)器實(shí)現(xiàn)人臉識(shí)別和分類(lèi),從識(shí)別效果來(lái)說(shuō)明pca的優(yōu)缺點(diǎn)。關(guān)鍵詞: 人臉識(shí)別 特征提取 主成分分析法 abstractabstractface recognition is an active research area of biometric identification. compared to the use of fingerprints, iris and other biometric identification ,face recognition is more direct, friendly and convenient.it is the most natural and direct means for identification.therefore, face recognition has a wide range of applications in the information security ,criminal detection and access control area.face recognition generally has three steps:image pre-processing, feature extraction, classification and identification. feathure extraction is important,which directly determines the quality of classification results. a good method for feature extraction should has simple and fast algorithms. this paper mainly researches on a classical method for feature extraction principal component analysis(pca)with the basic idea of dimensionality reduction.the main work is as follows:select a face database,create the training set and test set;feature extraction for the images of the training set and test set,which are the coordinates coefficients in the eigenface space;classification and identification using minimum distance classifier,describe the advantages and disadvantages of pca.keywords: face recognition feature extraction pca 目錄目 錄第一章 緒論11.1 特征提取的研究背景和意義11.1.1 研究背景和意義11.2 人臉特征提取的研究現(xiàn)狀及存在問(wèn)題31.2.1 人臉圖像可以提取的特征31.2.2 人臉特征提取方法31.2.3 特征提取時(shí)存在的問(wèn)題61.3 本文主要研究?jī)?nèi)容及各章安排81.3.1 本文主要研究?jī)?nèi)容81.3.2 本文各章安排8第二章 人臉特征提取主成分分析法92.1 概述92.2 k-l變換102.2.1 k-l變換基本原理102.2.2 特征壓縮122.3 基于pca算法的人臉特征提取122.3.1 總體散布矩陣的形成132.3.2 維數(shù)問(wèn)題142.3.3 變換矩陣的求解及變換的實(shí)現(xiàn)142.3.4 特征臉152.3.5 pca算法162.4 人臉識(shí)別的分類(lèi)準(zhǔn)則182.4.1 相似性測(cè)度182.4.2 分類(lèi)器182.5 pca的特點(diǎn)及存在問(wèn)題202.5.1 特點(diǎn)202.5.2 存在問(wèn)題20第三章 本文方法的實(shí)現(xiàn)及結(jié)果233.1 人臉庫(kù)的選取233.2 識(shí)別過(guò)程233.3結(jié)果分析243.3.1 基于pca的人臉識(shí)別243.3.2 低通濾波處理和邊緣提取25第四章 總結(jié)與展望294.1 全文工作總結(jié)294.2 未來(lái)工作展望29致 謝31參考文獻(xiàn)33第一章 緒論7第一章 緒論1.1 特征提取的研究背景和意義1.1.1 研究背景和意義在科學(xué)研究的眾多應(yīng)用領(lǐng)域中,一個(gè)普遍存在的問(wèn)題是如何從采集的數(shù)據(jù)中獲取有用的信息。隨著科技的高速發(fā)展,大量數(shù)據(jù)的測(cè)量及存儲(chǔ)己經(jīng)不再成為問(wèn)題,但是獲取數(shù)據(jù)本身顯然是不夠的,提取產(chǎn)生這些數(shù)據(jù)的系統(tǒng)本身信息才是根本目的所在。而且,通常所獲得的原始數(shù)據(jù)的數(shù)據(jù)量相當(dāng)大,且樣本常處于一個(gè)高維空間中,如果直接用原始數(shù)據(jù)進(jìn)行分類(lèi)器設(shè)計(jì)的話,無(wú)論從計(jì)算的復(fù)雜程度還是分類(lèi)器性能來(lái)看都是不適宜的。為了有效地實(shí)現(xiàn)分類(lèi)識(shí)別,就要把原始數(shù)據(jù)映射(或變換)到低維空間,得到最能反映應(yīng)樣本內(nèi)在本質(zhì)的特征,以便能更有效的進(jìn)行分類(lèi),這個(gè)過(guò)程就叫做特征提取或者數(shù)據(jù)降維1。映射后的特征叫做二次特征,它們是原始特征的某種組合(線性組合或非線性組合)。特征提取或者數(shù)據(jù)降維的基本任務(wù)是如何從許多特征中找出那些最有效的特征,特征的提取強(qiáng)烈影響到分類(lèi)器的設(shè)計(jì)及性能,因此,特征提取是模式識(shí)別中的一個(gè)關(guān)鍵問(wèn)題,在數(shù)據(jù)聚類(lèi),模式識(shí)別等領(lǐng)域有著廣泛的應(yīng)用。從廣義上說(shuō),特征提取就是指一種變換。若x是測(cè)量空間,y是特征空間,則變換a:xy就叫做特征提取器。為了使問(wèn)題盡可能的簡(jiǎn)單化以及考慮計(jì)算的復(fù)雜性,通常對(duì)原始數(shù)據(jù)進(jìn)行線性變換,因?yàn)檫@會(huì)給特征提取的后繼分析帶來(lái)極大的方便。為了便于研究,通常把采集得到的數(shù)據(jù)看成多維隨機(jī)變量的一系列樣本值,以便于將隨機(jī)變量的數(shù)值統(tǒng)計(jì)方法應(yīng)用到源數(shù)據(jù)。對(duì)于多維信號(hào)在時(shí)刻t的采樣,可看作是m維隨機(jī)變量的某一觀測(cè)樣本矢量,其中xi(t),i=1,2,m為各個(gè)分量。按照某種準(zhǔn)則對(duì)其施加一個(gè)線性變換,記為f(rmrn): (1-1)為變換的結(jié)果,假設(shè)這個(gè)的f是一個(gè)線性變換,于是有y(t)中的每個(gè)分量都是原始所有分量的線性組合: (1-2)其中,。對(duì)于每個(gè)的一組系數(shù),稱為一個(gè)基向量。式(1-2) 可以簡(jiǎn)單的寫(xiě)作矩陣形式: (1-3)其實(shí),多維數(shù)據(jù)的線性變換及降維過(guò)程簡(jiǎn)單地說(shuō)就是按照一定的準(zhǔn)則去找一系列的加權(quán)系數(shù)組成線性變換矩陣中的每個(gè)基向量,而這n個(gè)基向量就是一個(gè)新的坐標(biāo)系。將原數(shù)據(jù)在這樣一個(gè)坐標(biāo)系上展開(kāi),得到的每個(gè)分量便是變換的結(jié)果。要求變換后的數(shù)據(jù)y在最大程度上體現(xiàn)原始數(shù)據(jù)間的實(shí)質(zhì)結(jié)構(gòu)。并且y的各個(gè)分量能夠盡可能地代表產(chǎn)生源數(shù)據(jù)的系統(tǒng)本身的物理機(jī)制?;诙嗑S隨機(jī)變量統(tǒng)計(jì)分析的框架,變換矩陣的尋找方法通常是建立在一個(gè)體現(xiàn)輸出結(jié)果y的統(tǒng)計(jì)特性的目標(biāo)函數(shù)g(y)。而這種統(tǒng)計(jì)特性因算法的基本準(zhǔn)準(zhǔn)則不同而不同,可能是一,二階的,如相關(guān)系數(shù),協(xié)方差等,也可能是高階的,如互信息,非高斯性等。如主成分分析方法的基本準(zhǔn)則是當(dāng)用新分量對(duì)原始數(shù)據(jù)進(jìn)行重構(gòu)時(shí),在最小均方差意義下逼近效果最佳,而線性判別方法的基本準(zhǔn)則是使不同類(lèi)別的樣本盡量分開(kāi),即選擇使得樣本類(lèi)間離散度和樣本類(lèi)內(nèi)離散度的比值最大。線性變換是歷史悠久的重要降維方法,目前在各個(gè)領(lǐng)域都得到了廣泛應(yīng)用,也相對(duì)比較成熟。該方法利用如上提到的類(lèi)似線性變換將原數(shù)據(jù)向量從高維空間映射到低維空間中,通過(guò)保留最重要的或者最能體現(xiàn)個(gè)體差異性的成分,使得降維后的數(shù)據(jù)能夠最大程度的保留原高維向量的特征或某一個(gè)方面的特性。依據(jù)線性降維所采用的具體方式不同,又可以分為:主成分分析 (principalcomponent analysis,pca)2,奇異值分解(singular value decomposition,svd)3,線性判別分析4,獨(dú)立成分分析5,局部特征分析6,多維尺度分析7等數(shù)十種主要算法。非線性降維是近年來(lái)逐漸發(fā)展起來(lái)的方法,還比較年輕,各種新的算法也在不斷涌現(xiàn)和發(fā)展。它與前面所述方法的主要不同在于降維過(guò)程中運(yùn)用的是非線性變換。目前提出的非線性變換方法大體上有兩大類(lèi):基于核函數(shù)的算法8(包括kemelpca,kemellda,kemelica等)以及基于流形學(xué)習(xí)的方法(包括isom9,局部線性嵌入10,拉普拉斯映射方法11等)。上述各種降維方法已經(jīng)廣泛的應(yīng)用于信號(hào)處理的各個(gè)領(lǐng)域:機(jī)器學(xué)習(xí),數(shù)據(jù)壓縮,可視化,模式識(shí)別等。1.2 人臉特征提取的研究現(xiàn)狀及存在問(wèn)題1.2.1 人臉圖像可以提取的特征特征提取是模式識(shí)別研究的基本問(wèn)題之一。對(duì)于人臉圖像識(shí)別而言,抽取有效的圖像特征是完成圖像識(shí)別的關(guān)鍵任務(wù)。目前用于圖像識(shí)別的特征可分為如下幾種:1、直觀性特征。如圖像的邊緣,輪廓,紋理或區(qū)域等。在人臉識(shí)別中用得最多的直觀性特征是幾何特征,即人臉的五官尺寸及相對(duì)位置。這類(lèi)特征雖然具有維數(shù)低的特點(diǎn),但對(duì)于同一個(gè)人因表情及光照條件變化往往會(huì)導(dǎo)致其尺寸及相對(duì)位置發(fā)生較大的變化,因此識(shí)別效果并不令人滿意。2、灰度的統(tǒng)計(jì)特征。如直方圖特征,將圖像看作一個(gè)二維隨機(jī)過(guò)程,可以引入統(tǒng)計(jì)上的各階矩作為特征來(lái)描述和分析圖像,他們能夠在保留主要分類(lèi)信息的基礎(chǔ)上大大降低特征的維數(shù)。3、變換系數(shù)特征。對(duì)圖像作各種數(shù)學(xué)變換,可以將變換的系數(shù)作為圖像的一種特征,例如fisher變換,hough變換和小波變換等在圖像特征抽取方面均有廣泛應(yīng)用。這類(lèi)方法的優(yōu)點(diǎn)是計(jì)算比較方便,但是去相關(guān)能力不強(qiáng)。系數(shù)特征的維數(shù)仍然比較大。4、代數(shù)特征。它反映圖像的一種內(nèi)在屬性。將圖像看作矩陣對(duì)待,可對(duì)其進(jìn)行各種代數(shù)變換,或進(jìn)行各種矩陣分解。由于矩陣的特征向量反映了矩陣的一種代數(shù)屬性,并具有不變性,因此可用來(lái)作為圖像特征。在人臉識(shí)別中,用來(lái)抽取圖像的代數(shù)特征的典型方法是pca變換和矩陣的奇異值分解。1.2.2 人特征提取方法人臉識(shí)別本質(zhì)上是三維塑性物體二維投影圖像的匹配問(wèn)題,它的困難體現(xiàn)在:人臉?biāo)苄宰冃?如表情等)的不確定性;人臉模式的多樣性(如胡須,發(fā)型,眼鏡,化妝等);圖像獲取過(guò)程中的不確定性(如光照的強(qiáng)度,光源方向等)。在對(duì)人臉圖像進(jìn)行特征提取之前一般需要做幾何歸一化和灰度歸一化。幾何歸一化是指根據(jù)人臉定位結(jié)果將圖像中人臉變換到同一位置和同樣大小,灰度歸一化是指對(duì)圖像進(jìn)行光照補(bǔ)償?shù)忍幚?,光照補(bǔ)償能夠一定程度地克服光照變換的影響而提高識(shí)別率12。特征提取是人臉識(shí)別的基礎(chǔ),對(duì)訓(xùn)練集和待識(shí)別的人臉圖像采用相同的特征提取方法,然后對(duì)待識(shí)別的人臉圖像進(jìn)行分類(lèi)。所以,特征提取作為人臉識(shí)別的重要組成部分,對(duì)人臉識(shí)別進(jìn)行研究,也就要對(duì)特征提取方法進(jìn)行不斷研究探索和實(shí)驗(yàn)。隨著人臉識(shí)別的發(fā)展,各種各樣的特征提取方法也開(kāi)始被應(yīng)用起來(lái)?;趲缀翁卣鞯姆椒ǎ喝四樣裳劬?、鼻子、嘴、下巴等部件構(gòu)成,對(duì)這些部件和結(jié)構(gòu)關(guān)系的幾何描述,可作為識(shí)別人臉的重要特征。kanade用幾何量作為人臉的特征,這些幾何量包括眼角、嘴角、鼻孔、下巴這些點(diǎn)之間的距離以及所成的角。buhr用圖表示法和描述樹(shù)法給出了人臉的33個(gè)主要特征與12個(gè)次要特征,其主要特征包括了24個(gè)基于眼睛、人臉中心、嘴的量測(cè)。yuille提出了包括頭發(fā)、鼻子、嘴并用彈簧連接邊緣的全局人臉模板以抽取出眼睛與嘴。craw提出了更復(fù)雜的人臉模板,包含了頭發(fā)線條、眼睛、眉毛、鼻子、嘴和面頰。最近,lee等抽取人臉的5個(gè)距離量度作為人臉識(shí)別特征口側(cè)。人臉的幾何特征比較穩(wěn)定,受人臉的姿態(tài)變化與光照條件等因素的影響小,但弱點(diǎn)是不容易抽取,而且量測(cè)精度不高?;谔卣髂樀姆椒ǎ壕€性判別分析(linear discriminant analysis)是統(tǒng)計(jì)模式識(shí)別的基本方法之一。應(yīng)用統(tǒng)計(jì)方法解決人臉識(shí)別問(wèn)題時(shí),經(jīng)常碰到的問(wèn)題之一就是被稱之為“維數(shù)災(zāi)難”的問(wèn)題。在低維空間里解析上或計(jì)算上可行的辦法,在高維空間里可能變得毫無(wú)實(shí)際意義。因此,降低維數(shù)就成為處理實(shí)際問(wèn)題的關(guān)鍵并發(fā)展了許多壓縮特征空間維數(shù)的方法。我們希望通過(guò)尋求一種線性變換,可以使人臉圖像從高維的圖像空間映射到低維的特征空間,而不降低人臉的識(shí)別能力。特征臉?lè)椒ㄊ腔诰€性映射,使人臉圖像從圖像空間投影到特征空間的方法。采用pca進(jìn)行降維,尋求使所有的圖像樣本的總體散布最大的投影方向。turk和pentland提出特征臉的方法,它根據(jù)一組人臉訓(xùn)練圖像構(gòu)造主元子空間,由于主元具有臉的形狀,也稱為特征臉。識(shí)別時(shí)將測(cè)試圖像投影到主元子空間上,得到一組投影系數(shù),和各個(gè)己知人的人臉圖像進(jìn)行比較進(jìn)行識(shí)別。在12,13中pentland等報(bào)告了相當(dāng)好的結(jié)果,在200個(gè)人的3000幅圖像中得到95%的正確識(shí)別率,在feret數(shù)據(jù)庫(kù)上對(duì)150幅正面人臉像只有一個(gè)誤識(shí)別。但系統(tǒng)在進(jìn)行特征臉?lè)椒ㄖ靶枰鞔罅款A(yù)處理工作如歸一化等。在傳統(tǒng)特征臉的基礎(chǔ)上,研究者注意到特征值大的特征向量(即特征臉) 并不一定是分類(lèi)性能好的方向,據(jù)此發(fā)展了多種特征(子空間)選擇方法,如peng的雙子空間方法,weng的線性歧義分析方法15,belhumeur的fisherface方法等。事實(shí)上,特征臉?lè)椒ㄊ且环N顯示主元分析人臉建模,一些線性自聯(lián)想,線性壓縮型bp網(wǎng)絡(luò)則為隱式的主元分析方法,它們都是把人臉表示為一些向量的加權(quán)和,這些向量是訓(xùn)練集叉積陣的主特征向量,valentin對(duì)此作了詳細(xì)討論??傊?,特征臉?lè)椒ㄊ且环N簡(jiǎn)單,快速,實(shí)用的基于變換系數(shù)特征的算法,但由于它本質(zhì)上依賴于訓(xùn)練集和測(cè)試集圖像的灰度相關(guān)性,而且要求測(cè)試圖像與訓(xùn)練集比較像。神經(jīng)網(wǎng)絡(luò)方法:前神經(jīng)網(wǎng)絡(luò)方法在人臉識(shí)別中的研究方興未艾valentin提出一種方法,首先提取人臉的50個(gè)主元,然后用相關(guān)神經(jīng)網(wǎng)絡(luò)將它映射到5維空間中,再用一個(gè)普通的多層感知器進(jìn)行判別,對(duì)一些簡(jiǎn)單的測(cè)試圖像效果較好16;intrator等提出了一種混合型神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行人臉識(shí)別,其中非監(jiān)督神經(jīng)網(wǎng)絡(luò)用于特征提取,而監(jiān)督神經(jīng)網(wǎng)絡(luò)用于分類(lèi)。lee等將人臉的特點(diǎn)用六條規(guī)則描述,然后根據(jù)這六條規(guī)則進(jìn)行五官的定位,將五官之間的幾何距離輸入模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,效果較一般的基于歐氏距離的方法有較大改善。laurence等利用卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行人臉識(shí)別,由于卷積神經(jīng)網(wǎng)絡(luò)中集成了相鄰象素之間的相關(guān)性知識(shí),從而在一定程度上獲得了對(duì)圖像平移,旋轉(zhuǎn)和局部變形的不變性,因此得到了非常理想的識(shí)別效果。lin等提出了基于概率決策的神經(jīng)網(wǎng)絡(luò)方法(pdbnn),其主要思想是采用虛擬(正反例)樣本進(jìn)行強(qiáng)化和反強(qiáng)化學(xué)習(xí),從而得到較為理想的概率估計(jì)結(jié)果,并采用模塊化的網(wǎng)絡(luò)結(jié)構(gòu)(ocon)加快網(wǎng)絡(luò)的學(xué)習(xí)。這種方法在人臉檢測(cè),人臉定位和人臉識(shí)別的各個(gè)步驟上都得到了較好的應(yīng)用17;其它研究還有:dai等提出用hopfield網(wǎng)絡(luò)進(jìn)行低分辨率人臉聯(lián)想與識(shí)別;gutta等提出將rbf與樹(shù)型分類(lèi)器結(jié)合起來(lái)進(jìn)行人臉識(shí)別的混合分類(lèi)器模型;philips等人將matching pursuit濾波器用于人臉識(shí)別;還有則采用統(tǒng)計(jì)學(xué)習(xí)理論中的支持向量機(jī)進(jìn)行人臉?lè)诸?lèi)。神經(jīng)網(wǎng)絡(luò)方法在人臉識(shí)別上的應(yīng)用比起前述幾類(lèi)方法來(lái)有一定的優(yōu)勢(shì),因?yàn)閷?duì)人臉識(shí)別的許多規(guī)律或規(guī)則進(jìn)行顯性的描述還是相當(dāng)困難的,而神經(jīng)網(wǎng)絡(luò)方法則可以通過(guò)學(xué)習(xí)的過(guò)程獲得對(duì)這些規(guī)律和規(guī)則的隱性表達(dá),它的適應(yīng)性更強(qiáng),一般也比較容易實(shí)現(xiàn)。形變模型方法:lanitis等通過(guò)在人臉特征邊沿,選擇一些稀疏的基準(zhǔn)點(diǎn)描述人臉的形狀特征,然后將形狀變形到所有人臉圖像的平均形狀,再根據(jù)變形后的形狀進(jìn)行紋理灰度變形,形成形狀無(wú)關(guān)的人臉圖像。類(lèi)似地,romdh等采用激光掃描儀獲得人臉的3d數(shù)據(jù),分別對(duì)一些基準(zhǔn)點(diǎn)構(gòu)成的形狀和基準(zhǔn)點(diǎn)的灰度或彩色完成pca得到3d人臉形狀和灰度彩色基圖像。通過(guò)變化參數(shù)就可獲得不同的3d人臉模型,通過(guò)施加一些先驗(yàn)約束可以避免合成不真實(shí)的人臉圖像,利用線性形狀和紋理誤差,通過(guò)3d模型向2d輸入圖像的自動(dòng)匹配實(shí)現(xiàn)人臉識(shí)別。其他方法:brunelli等對(duì)模板匹配方法作了大量實(shí)驗(yàn),結(jié)果表明在尺度,光照,旋轉(zhuǎn)角度等各種條件穩(wěn)定的情況下,模板匹配的效果優(yōu)于其他方法18,但它對(duì)光照,旋轉(zhuǎn)和表情變化比較敏感,影響了它的直接使用。goudail等人采用局部自相關(guān)性作為人臉識(shí)別的判斷依據(jù),它具有平移不變性,在臉部表情變化一時(shí)比較穩(wěn)定??傮w說(shuō)來(lái),基于線性投影的代數(shù)特征方法依然是人臉識(shí)別的最具影響力的主流方法。到目前為止,在大樣本人臉庫(kù)上通過(guò)測(cè)試的三種識(shí)別率最高的方法,分別為usc(university of southern california)的方法,umd(university of maryland)的方法,以及massachusetts institute of technology(mit)media lab給出的方法。除了usc的方法外,umd和mit的方法都是先進(jìn)行主分量分析,再作鑒別分析。不同的是,umd采用的是線性鑒別,而mit采用二次鑒別(quadratic discriminant)。1.2.3 特征提取時(shí)存在的問(wèn)題識(shí)別人臉主要依據(jù)人臉上的特征,也就是說(shuō)依據(jù)那些在不同個(gè)體之間存在較大差異而對(duì)于同一個(gè)人則比較穩(wěn)定的度量。目前對(duì)人臉圖像進(jìn)行特征提取時(shí)基本是對(duì)人臉的正面的靜態(tài)圖像進(jìn)行提取的。但是對(duì)于用戶不配合,采集條件不理想(如光照惡劣,有遮擋,圖像分辨率低等)的情況下,由于人臉變化復(fù)雜,因此特征表述和特征提取十分困難。1、光照變化問(wèn)題光照問(wèn)題是機(jī)器視覺(jué)的老問(wèn)題,在人臉識(shí)別中的表現(xiàn)尤為明顯。目前即使最好的人臉識(shí)別系統(tǒng)在室外光照環(huán)境下,其識(shí)別率也會(huì)陡然下降。盡管研究人員針對(duì)光照問(wèn)題提出了一些解決方案,但目前的光照處理方法還需要進(jìn)一步地研究解決。2、姿態(tài)、表情變化問(wèn)題與光照問(wèn)題類(lèi)似,姿態(tài)、表情變化問(wèn)題也是目前人臉識(shí)別研究中需要解決的一個(gè)技術(shù)難點(diǎn)。針對(duì)姿態(tài)、表情變化的研究相對(duì)比較的少,目前多數(shù)的人臉識(shí)別算法主要針對(duì)正面準(zhǔn)正面人臉圖像,當(dāng)發(fā)生深度或水平變化的情況下,或是表情發(fā)生明顯改變的情況下,人臉識(shí)別算法的識(shí)別率也將會(huì)急劇下降。因此,如何提高系統(tǒng)對(duì)姿態(tài)和表情變化的魯棒性也是人臉識(shí)別研究中一個(gè)極具挑戰(zhàn)性的問(wèn)題。3、遮擋問(wèn)題對(duì)于非配合情況下的人臉圖像采集,遮擋是一個(gè)非常嚴(yán)重的問(wèn)題。特別是在監(jiān)控環(huán)境下,往往被監(jiān)控對(duì)象都會(huì)帶眼鏡,帽子等飾物,使得被采集的人臉圖像有可能不完整,從而影響了后面的特征提取。如何有效地去除遮擋物的影響是一個(gè)非常重要的研究課題。4、低質(zhì)量照片問(wèn)題目前的多數(shù)人臉識(shí)別系統(tǒng)在算法設(shè)計(jì)和模型訓(xùn)練方面往往只針對(duì)圖像清晰的情況,但對(duì)智能監(jiān)控、公安系統(tǒng)犯罪嫌疑人照片比對(duì)等應(yīng)用而言,由于其來(lái)源不一,有的照片的質(zhì)量非常差,比如模糊、高噪聲、分辨率低等。如何提高系統(tǒng)對(duì)這些低質(zhì)量照片的識(shí)別能力也是人臉識(shí)別亟待解決的關(guān)鍵問(wèn)題之一。5、大規(guī)模人臉識(shí)別問(wèn)題隨著人臉數(shù)據(jù)庫(kù)規(guī)模的增長(zhǎng),數(shù)據(jù)計(jì)算量也就變的很大,對(duì)數(shù)據(jù)降維效果也就要求比較高,也就需要應(yīng)用相應(yīng)的特征提取方法。6、人臉信息采集設(shè)備帶來(lái)的問(wèn)題攝像頭是目前主流的人臉信息采集設(shè)備,它們的種類(lèi)、型號(hào)、傳感方式(比如ccd或者cmos)、采樣和量化精度等各不相同,采集時(shí)刻的焦距、光圈、增益、白平衡等參數(shù)設(shè)置區(qū)別也很大。這些變化因素使得獲取的人臉圖像數(shù)據(jù)的變化更大。如何解決這些問(wèn)題也是值得關(guān)注的。1.3 本文主要研究?jī)?nèi)容及各章安排1.3.1 本文主要研究?jī)?nèi)容本文主要研究人臉特征提取的一種經(jīng)典方法主成分分析法,詳細(xì)介紹了其基本原理和在人臉識(shí)別中的具體應(yīng)用,并結(jié)合了一種簡(jiǎn)單的分類(lèi)器,完成了小規(guī)模人臉的識(shí)別。1.3.2 本文各章安排第一章:緒論。介紹課題的背景和意義、人臉特征提取的方法和困難,最后簡(jiǎn)要說(shuō)明了本文所做的主要研究工作以及本文的結(jié)構(gòu)安排;第二章:人臉特征提取的主成分分析(pca)方法。詳細(xì)地討論了pca的基本理論和在人臉特征提取方面的應(yīng)用。這是一種典型的線性特征子空間方法,分析了此方法的優(yōu)缺點(diǎn);第三章:實(shí)驗(yàn)過(guò)程與結(jié)果分析。對(duì)基于pca的人臉識(shí)別給出了相應(yīng)的實(shí)驗(yàn)步驟,過(guò)程,通過(guò)matlab實(shí)現(xiàn)了對(duì)算法的仿真。并且對(duì)人臉圖像先分別進(jìn)行低通濾波和邊緣檢測(cè)后再進(jìn)行pca處理,最后對(duì)結(jié)果進(jìn)行了分析,討論; 第四章:總結(jié)與展望。對(duì)本文的工作進(jìn)行了總結(jié),對(duì)進(jìn)一步的研究進(jìn)行了展望。第二章 人臉特征提取主成分分析法23第二章 人臉特征提取主成分分析法2.1 概述在統(tǒng)計(jì)特征分析用于人臉識(shí)別以前,人臉自動(dòng)識(shí)別系統(tǒng)中忽視了到底是哪一類(lèi)的人臉特征在人臉識(shí)別中起到最主要的作用,而只是假定一些預(yù)先設(shè)定的一些人臉部位的測(cè)量與部位之間關(guān)系的測(cè)量是有效的,足以體現(xiàn)出不同人臉之間的差異。這種假定顯然是不合理的。但是給我們一個(gè)重要的啟示:可以從信息論的角度來(lái)對(duì)人臉進(jìn)行編碼和解碼,從而達(dá)到著重強(qiáng)調(diào)一些重要的全局特征和局部特征。用這類(lèi)方法提取的特征可能與通常直覺(jué)觀念上的特征有所不同。主成分分析用于人臉識(shí)別主要從兩方面考慮:一是從信息論的角度,我們要從人臉圖像中盡可能的提取人臉圖像的相關(guān)信息,然后把這些信息同人臉庫(kù)中的人臉的信息相比較,從而完成了人臉的識(shí)別;二是從數(shù)學(xué)的角度,我們希望找到人臉?lè)植嫉闹饕卣?,也就是一組人臉圖像矩陣相關(guān)矩陣的特征向量,這組特征向量可以看成抓住了人臉圖像變化的特征。在這種方法中,每張人臉圖像可以通過(guò)特征向量的線性運(yùn)算精確的表示。特征向量的數(shù)目等于參加訓(xùn)練的人臉圖像的數(shù)目。也可以選擇一些具有最大特征值的特征向量來(lái)近似的表示。用統(tǒng)計(jì)特征如二階矩、高階矩,建立人臉空間中的一個(gè)新的坐標(biāo)系。人臉圖像在這個(gè)坐標(biāo)系下的投影即為該圖像的特征。對(duì)于一張待識(shí)別的人臉圖像,求出該圖像在這個(gè)坐標(biāo)系中的坐標(biāo)也就是求出了這個(gè)圖像的特征,然后通過(guò)與人臉庫(kù)中的圖像在該坐標(biāo)系下的坐標(biāo)相比較,就可以完成對(duì)這一幅人臉圖像的識(shí)別。 把一幅人臉圖像視為一個(gè)矢量,稱為“人臉矢量”。如果圖像寬為w個(gè)象素,高為h個(gè)象素,則矢量的維數(shù)為w*h,矢量的每一個(gè)元素的值為所對(duì)應(yīng)象素的灰度值。顯然這是在w*h的高維空間里描述矢量,我們把這個(gè)空間定義為“原始圖像空間” 。然而由于人臉固有的相似性(人臉都是由眼睛、鼻子、嘴、眉等構(gòu)成),所以在“原始圖像空間”中,人臉矢量?jī)H分布在一個(gè)很小的范圍內(nèi)(圖2.1),所以“原始圖像空間”對(duì)人臉矢量來(lái)說(shuō)不是最優(yōu)的空間。為了有效的抽取人臉圖像特征,有必要建立一個(gè)優(yōu)化的子空間來(lái)更好的描述人臉矢量。我們把優(yōu)化子空間稱為“人臉空間”,優(yōu)化子空間的基矢量稱為主元。雖然“原始圖像空間”的維數(shù)是w*h,但由于人臉圖像象素的不完全獨(dú)立性,每個(gè)象素的灰度值都依賴于與它相鄰的象素,所以盡管我們不能精確地確定人臉空間的維數(shù),但它肯定大大低于原始圖像空間的維數(shù)。我們使用主元分析的方法來(lái)構(gòu)造優(yōu)化子空間“人臉空間”(圖2.2是一組二維隨機(jī)數(shù)據(jù)進(jìn)行主元分析的示意圖)。 圖2.1在原始圖像空間中人臉矢量的分布 圖2.2一組二維數(shù)據(jù)的主元分析構(gòu)造優(yōu)化子空間可以采用k-l19變換,假設(shè)人臉處于低維線性空間,由高維圖像空間k-l變換后,可得到一組新的正交基,由此可以通過(guò)保留部分正交基獲得正交k-l基底,該方法將人臉圖像按行(列)展開(kāi)所形成的一個(gè)高維向量看作是一種隨機(jī)向量,因此可以采用k-l變換獲得其正交k-l基底。將k-l變換用于人臉識(shí)別的研究,最早見(jiàn)于kirby20等人的工作,他們首先采用k-l變換對(duì)人臉圖像進(jìn)行表示,即將人臉圖像分解為若干特征分量的加權(quán)和,并且能夠從部分特征分量中重構(gòu)原人臉圖像。k-l (karhunen-loeve)變換是實(shí)現(xiàn)pca的手段。下面就先介紹一下k-l變換基本原理。2.2 k-l變換2.2.1 k-l變換基本原理k-l變換(karhunen-loeve transform)的目的是通過(guò)線性變換尋找一組最優(yōu)的單位正交向量基(即主元),并用其中部分向量的線性組合來(lái)重建樣本,使重建后的樣本和原樣本在最小均方意義下的誤差最小,以達(dá)到最佳的數(shù)據(jù)壓縮效果。給定一個(gè)維隨機(jī)向量,可將其展開(kāi)成個(gè)維基向量的線性組合 (2-1)式中,為隨機(jī)系數(shù)向量。為維的矩陣,即 (2-2)這里,實(shí)際上定義了一個(gè)從到的線性變換。k-t變換要求,變換后的隨機(jī)系數(shù)向量中的各個(gè)分量是相互正交的,由此可以確定的具體形式。按照以上要求,應(yīng)有 (2-3)即 (2-4)于是,若的自相關(guān)矩陣為已知的,則有 (2-5)若進(jìn)一步要求為歸一正交矩陣,即 (2-6)式中為單位陣,可以得到 (2-7)此即的特征方程,有 (2-8)其中,是的一個(gè)特征值,是對(duì)應(yīng)的特征向量。因此,變換矩陣可由的自相關(guān)矩陣的特征向量構(gòu)成。由于是實(shí)對(duì)稱且非負(fù)定的矩陣,所以能夠滿足以上對(duì)的要求,且其所有的特征值都是非負(fù)的。由的歸一正交性容易得到以下k-l變換式 (2-9)在k-l變換中,用來(lái)產(chǎn)生特征向量集合的自相關(guān)矩陣稱為生成矩陣,而確定變換性質(zhì)的矩陣稱為變換矩陣。2.2.2 特征壓縮以上關(guān)于基本變換的討論中,從到的變換過(guò)程中,向量的維數(shù)并沒(méi)有發(fā)生變化,下面考慮從的部分分量中重建的問(wèn)題。將式(2-1)重寫(xiě)為 (2-10)當(dāng)只取的前個(gè)分量,忽略后個(gè)分量時(shí),的估計(jì)值為 (2-11)此時(shí)的誤差向量為 (2-12)均方誤差為 (2-13)可見(jiàn),使均方誤差最小的選擇應(yīng)該是使忽略掉的分量對(duì)應(yīng)的特征值之和為最小。于是,可以選擇前個(gè)最大的特征值對(duì)應(yīng)的特征向量構(gòu)成的變換矩陣 (2-14)利用代替,按照式(2-9)進(jìn)行變換,則有 (2-15)得到的變換域維向量就是向量經(jīng)過(guò)壓縮之后的主成分。理論分析指出,為使均方誤差最小,應(yīng)該使變換前的隨機(jī)向量均值為零向量。2.3 基于pca算法的人臉特征提取對(duì)于計(jì)算機(jī)中的一幅圖像,用f(x,y)表示。這里x和y指空間的坐標(biāo),點(diǎn)(x,y)上的f值正比于該點(diǎn)的亮度。一幅圖像被讀入計(jì)算機(jī)以后是用矩陣形式存放的,用b(i,j)表示。其行和列標(biāo)出了圖像上的一個(gè)點(diǎn),而矩陣中的相應(yīng)元素的值則表示該點(diǎn)的灰度等級(jí)。這樣的數(shù)字陣列中的元素就叫做象素。一幅wh大小的人臉圖像按列相連而構(gòu)成一個(gè)x=w*h維矢量,它可被視為w*h維空間的一個(gè)點(diǎn)。由于人臉結(jié)構(gòu)的相似性,當(dāng)把很多這樣的人臉圖像歸一化(預(yù)處理)之后,這些圖像在這一超高維空間中不是隨機(jī)或散亂地分布,而是存在某種規(guī)律。因此,可以通過(guò)k-l變換用一個(gè)低維子空間描述人臉圖像,同時(shí)又能保存所需要的識(shí)別信息。在人臉識(shí)別的實(shí)踐中,系統(tǒng)給定的是一系列的訓(xùn)練樣本,即人臉圖像集合。因此,在將k-l變換的基本理論用于人臉識(shí)別時(shí),還有一些具體問(wèn)題需要解決?;趐ca的人臉特征提取可以以訓(xùn)練樣本集的總體散度矩陣作為k一l變換的產(chǎn)生矩陣,也可以是訓(xùn)練樣本集的類(lèi)間散布矩陣,即可以采用同一人的數(shù)張圖像的平均來(lái)進(jìn)行訓(xùn)練,這樣可在一定程度上消除光線等的干擾,且計(jì)算量可以減少,同時(shí)識(shí)別率不會(huì)下降。2.3.1 總體散布矩陣的形成對(duì)于的幅人臉圖像集,根據(jù)圖像在成像過(guò)程中的具體情況,通常需要首先進(jìn)行一定的預(yù)處理,這可能包括圖像平滑和灰度增強(qiáng)等圖像處理步驟。然后,一個(gè)必要的過(guò)程是將矩陣形式的圖像按照行或列展開(kāi)為維的向量,即 (2-16)為了使其均值為零,需要減去其均值向量,即 (2-17)式中叫做訓(xùn)練樣本矩陣。為的統(tǒng)計(jì)均值估計(jì),即 (2-18)這時(shí),k-l變換中的自相關(guān)矩陣變成了協(xié)方差矩陣,可按下式求其最大似然估計(jì)(忽略了常數(shù)) (2-19)該估計(jì)又稱為總體散布矩陣,這也就是k-l變換的生成矩陣。2.3.2 維數(shù)問(wèn)題當(dāng)將的人臉圖像表示為向量時(shí),其維數(shù)為,由此得到總體散布矩陣的維數(shù)為。例如,若,則總體散布矩陣就是維的,而人臉數(shù)據(jù)庫(kù)中樣本的數(shù)目通常要小得多,例如幾千個(gè)左右,這就導(dǎo)致總體散布矩陣的秩是由決定的。從式(2-19)可以看出,在和式的項(xiàng)中,只有項(xiàng)是獨(dú)立的,因此,總體散布矩陣的秩通常為,這也是其非零特征值的個(gè)數(shù),而零特征值對(duì)應(yīng)的特征向量在人臉圖像的表示中是沒(méi)有意義的,這一點(diǎn)可以從節(jié)2.2.2關(guān)于特征壓縮的討論中得到。綜上所述,在人臉的pca方法中,所選擇特征向量的數(shù)目的上限應(yīng)為。2.3.3 變換矩陣的求解及變換的實(shí)現(xiàn)求解變換矩陣就是求生成矩陣的特征值和特征向量。按照(2-7)和(2-8)式,有 (2-20)或 (2-21)通常,該特征方程的求解有以下三種方式:1、直接求解方式直接求解(2-20)或(2-21)式中的代數(shù)方程。由于總體散布矩陣的維數(shù)通常非常高,所以這種求解方式耗時(shí)比較大。在matlab中可利用以下函數(shù) (2-22)以上matlab函數(shù)對(duì)得到的特征值不進(jìn)行排序。2、間接求解方式之一不同于直接求解方式,這里不是對(duì)直接求特征值和特征向量,而是通過(guò)求的特征值和特征向量得到所求。具體地,對(duì)求解特征值和特征向量,有如下特征方程 (2-23)上式兩邊左乘后,有 (2-24)比較(2-20)式可見(jiàn),。顯然,通過(guò)2.3.2小節(jié)的討論可知,的維數(shù)是,通常比的維數(shù)要低得多。3、間接求解方式之二通過(guò)對(duì)訓(xùn)練樣本矩陣進(jìn)行奇異值分解(svd),也可間接求解特征方程。的svd可以表示為 (2-25)式中和都為正交矩陣,而為奇異值矩陣,于是,總體散布矩陣可寫(xiě)為 (2-26)進(jìn)一步整理后得到 (2-27)對(duì)比式(2-20),有,。在matlab中可利用以下函數(shù)進(jìn)行奇異值分解 (2-28)以上matlab函數(shù)對(duì)得到的奇異值將進(jìn)行排序。一旦求得了特征值和特征向量,就可以按照式(2-14)的方法,選取前個(gè)最大的非零特征值所對(duì)應(yīng)的特征向量構(gòu)成變換矩陣,并按照下式對(duì)所有人臉樣本進(jìn)行k-l變換。 (2-29)2.3.4 特征臉我們將特征值從大到小排序:,其對(duì)應(yīng)的特征向量為0, 1,. m.這樣,每一幅人臉都可以投影到由0, 1,. m張成的子空間中,因此每一幅人臉圖像對(duì)應(yīng)于子空間中的一個(gè)點(diǎn)。同樣,子空間中的一點(diǎn)也對(duì)應(yīng)于一幅圖像。當(dāng)特征向量0, 1,. m顯示為圖像時(shí),這些圖像很像人臉,所以它們被稱為“特征臉”。有了這樣一個(gè)由“特征臉”張成的特征子空間,任何一幅人臉圖像都可以向其作投影并獲得一組坐標(biāo)系數(shù),這組系數(shù)表明了該圖像在子空間中的位置,從而可以作為人臉識(shí)別的依據(jù)。換句話說(shuō),任何一幅人臉圖像都可以表示為這組“特征臉”的線性組合,其加權(quán)系數(shù)即是k-l的展開(kāi)系數(shù),也可以稱為該圖像的代數(shù)特征。圖2.3顯示了選取的orl人臉庫(kù)的8個(gè)人的圖像,圖2.4顯示了前五幅特征臉。 圖2.3 orl人臉庫(kù)的8個(gè)人的圖像 圖2.4 特征臉的顯示2.3.5 pca算法圖2.5給出了整個(gè)pca算法的詳細(xì)步驟流程。pca算法(principal component analysis algorithm)描述:基于pca方法,求出圖像在特征空間的展開(kāi)系數(shù)(坐標(biāo))輸入:1、人臉圖像訓(xùn)練集2、人臉圖像測(cè)試集輸出:訓(xùn)練集圖像,測(cè)試集圖像在特征空間的展開(kāi)系數(shù)步驟:1、聯(lián)立以下四式求出,2、求出的特征值和特征向量3、根據(jù)求出的特征值和特征向量4、對(duì)進(jìn)行排序5、取前個(gè)最大的特征值所對(duì)應(yīng)的特征向量6、對(duì)于圖像屬于訓(xùn)練集,已求出,由和 求得;若屬于測(cè)試集,由和求出7、返回、圖2.5 pca算法的詳細(xì)步驟流程2.4 人臉識(shí)別的分類(lèi)準(zhǔn)則2.4.1 相似性測(cè)度人臉樣本經(jīng)過(guò)特征提取過(guò)程,最終成為特征空間中的點(diǎn)。因此,樣本之間的相似性,通??梢酝ㄟ^(guò)計(jì)算距離或角度實(shí)現(xiàn)。給定向量和,常用的相似性測(cè)度有1、歐氏距離 (2-30)2、街區(qū)距離 (2-31)3、馬氏距離(mahalanobis) (2-32)式中為模式的協(xié)方差矩陣。有時(shí)也可采用以下簡(jiǎn)化形式 (2-33)其中是第個(gè)分量的方差。4、夾角余弦 (2-34)此外,也有人采用明氏距離(minkowski distance,歐氏距離和街區(qū)距離的一般化形式)、歐氏距離平方、均方誤差、相關(guān)系數(shù)以及加權(quán)的街區(qū)距離、加權(quán)的均方誤差和加權(quán)的夾角余弦等。2.4.2 分類(lèi)器按照距離的分類(lèi)準(zhǔn)則主要有:1、最近鄰分類(lèi)器最近鄰(minimum distance)分類(lèi)器是最常用的距離分類(lèi)器之一,首先需要求己知樣本的類(lèi)中心(類(lèi)平均),把待識(shí)別樣本歸為與之距離最近的類(lèi)中心所在的類(lèi)。2、最近鄰分類(lèi)器最近鄰(nearest neighbor)分類(lèi)器也是最常用的距離分類(lèi)器之一,即把待識(shí)別樣本歸為與之距離最近的已知樣本所在的類(lèi)。3、k近鄰分類(lèi)器k近鄰(k nearest neighbor)分類(lèi)器,取待識(shí)別樣本的k個(gè)近鄰,這k個(gè)近鄰中屬于哪一類(lèi)的己知樣本多,則把待識(shí)別樣本歸為哪一類(lèi)。按照其他相似性測(cè)度分類(lèi)的規(guī)則與以上分類(lèi)規(guī)則相似。此外,利用樣本分布的統(tǒng)計(jì)特性的分類(lèi)器主要有:1、bayes分類(lèi)器基于bayes決策理論的分類(lèi)方法是統(tǒng)計(jì)模式識(shí)別中的一個(gè)基本方法,考慮到樣本特定概率分布的情況,利用這個(gè)方法進(jìn)行分類(lèi)時(shí)對(duì)模式類(lèi)別有兩個(gè)基本要求:一是各類(lèi)別總體的概率分布是己知的,二是待分類(lèi)的類(lèi)別數(shù)是一定的。采用最大后驗(yàn)概率的bayes判決準(zhǔn)則為最小錯(cuò)誤概率準(zhǔn)則,考慮實(shí)際中判決錯(cuò)誤導(dǎo)致的結(jié)果后,該準(zhǔn)則可以改變?yōu)樽钚∑骄鶙l件風(fēng)險(xiǎn)判別準(zhǔn)則。2、隱馬爾可夫模型隱馬爾可夫模型(hmm)已經(jīng)成功地應(yīng)用于對(duì)語(yǔ)音、圖像和視頻中的時(shí)域信息進(jìn)行建模,因此,也在人臉識(shí)別中得到了應(yīng)用。將傳統(tǒng)的一維隱馬爾可夫鏈用于兩維的圖像信號(hào)時(shí),需要首先將圖像變換為一維的觀察序列。高復(fù)雜度的兩維hmm包括偽兩維hmm、嵌入式hmm和嵌入式bayes網(wǎng)絡(luò)。3、支持向量機(jī)分類(lèi)器支持向量機(jī)(svm)是在結(jié)構(gòu)風(fēng)險(xiǎn)最小化基礎(chǔ)上,對(duì)兩種不同類(lèi)別的樣本數(shù)據(jù)找到一個(gè)最優(yōu)分類(lèi)界面的方法。在人臉識(shí)別中,svm技術(shù)通常包括兩個(gè)方面:第一是采用核方法將樣本映射到高維空間,并在此空間中找到具有最大保護(hù)余量的分類(lèi)界面(超平面);第二是由于svm本來(lái)是解決兩類(lèi)模式的分類(lèi)問(wèn)題,因此需要推廣到多類(lèi)模式的分類(lèi)。4、神經(jīng)網(wǎng)絡(luò)分類(lèi)器神經(jīng)網(wǎng)絡(luò)在能夠?qū)崿F(xiàn)分類(lèi)的同時(shí),還具有特征提取的能力。其中,人臉識(shí)別中最常用的神經(jīng)網(wǎng)絡(luò)是采用反向傳播(bp)算法的前饋網(wǎng)絡(luò)。2.5 pca的特點(diǎn)及存在問(wèn)題2.5.1 特點(diǎn)pca是人臉識(shí)別研究歷史上第一種基于人臉全局視覺(jué)特征或圖像特征的方法,其全新的研究思路使人臉識(shí)別的研究進(jìn)入了柳岸花明的境地。在成像條件受控的情況下,其識(shí)別性能良好,識(shí)別率可達(dá)到80%以上。該方法有堅(jiān)實(shí)的數(shù)學(xué)理論基礎(chǔ),有很高的可操作性。因此,已經(jīng)成為繼續(xù)探索新的人臉識(shí)別方法的一個(gè)基石。在訓(xùn)練樣本的數(shù)目和多樣性足夠的情況下,其對(duì)光照和姿態(tài)等變化具有一定的魯棒性。pca主要具有以下特點(diǎn):1、屬于測(cè)量空間的任一模式都有唯一的特征矢量與之對(duì)應(yīng),這一特性說(shuō)明模式的變換沒(méi)有丟失分類(lèi)的主要信息。2、主元具有穩(wěn)定性。即當(dāng)輸入矢量有微小變化時(shí),其對(duì)應(yīng)的主元變化將小于輸入模式的變化。這一特性說(shuō)明對(duì)圖像噪聲等因素引起的圖像灰度變化有不敏感性,所以.可以放寬對(duì)輸入圖像的要求。3、經(jīng)過(guò)映射隨著空間維數(shù)的降低,模式之間的距離也得到減小,從而避免了在多維空間上進(jìn)行分類(lèi)的復(fù)雜性。4、最小化所有樣本的重構(gòu)誤差,具有重建圖像的能力,其重建圖像的質(zhì)量與所用的主分量的多少有關(guān)。5、去除了模式之間的相關(guān)性。2.5.2 存在問(wèn)題1、從該方法所依據(jù)的數(shù)學(xué)基礎(chǔ)k-l變換來(lái)看,其進(jìn)行特征提取和壓縮的準(zhǔn)則是均方誤差最小,這就決定了pca是一種具有最佳表示性(most expressive)的特征提取方法,而對(duì)人臉識(shí)別而言,好的特征提取方法應(yīng)該是具有最佳判別性(most descriminant)的。應(yīng)該注意到,在該方法中,類(lèi)別信息在特征提取的過(guò)程中并沒(méi)有用到,或者說(shuō),這里所采用的特征提取方法是無(wú)監(jiān)督的。2、該方法的核心是基于整幅圖像的線性變換,從上述討論可知,其生成矩陣的規(guī)模通常是非常大的,盡管可采用間接求解特征方程的方法減小計(jì)算量,但在訓(xùn)練和識(shí)別過(guò)程中,仍然難以避免高維的向量和矩陣運(yùn)算,使該方法在實(shí)際系統(tǒng)中的應(yīng)用受到一定的限制。3、作為兩維分布的人臉圖像,像素間相關(guān)性的強(qiáng)弱與像素間的距離密切相關(guān),而將圖像轉(zhuǎn)換為向量后,這種距離信息不復(fù)存在,這就降低了這種方法的表示能力。4、作為一種圖像的統(tǒng)計(jì)方法,圖像中所有的像素都被賦予了同等的地位,可是角度、光照、表情等干擾會(huì)使識(shí)別率下降;其次人臉在人臉空間的分布近似高斯分布,且普通人臉位于均值附近,而特殊人臉則位于邊緣分布,可見(jiàn),越普通的人臉越難分別,該方法的本質(zhì)是抓住了人群的統(tǒng)計(jì)特征,反映了特定人臉庫(kù)的統(tǒng)計(jì)特征。在該方法的使用中,訓(xùn)練樣本的數(shù)目和代表性對(duì)系統(tǒng)的性能有極大的影響,在某些無(wú)法得到足夠多訓(xùn)練樣本的場(chǎng)合,其應(yīng)用也受到嚴(yán)格的限制。5、作為一種線性特征子空間方法,該方法的前提是假定樣本在線性特征子空間中是線性可分的,對(duì)于樣本的非線性分布,該方法將無(wú)能為力。6、傳統(tǒng)特征臉?lè)椒?,特征值大的特征向量(即特征臉)不一定是分?lèi)性能最好的方向。第三章 本文方法的實(shí)現(xiàn)及結(jié)果31第三章 本文方法的實(shí)現(xiàn)及結(jié)果本文采用主成分分析法對(duì)人臉庫(kù)中的人臉圖像進(jìn)行特征提取,并且進(jìn)行識(shí)別。3.1 人臉庫(kù)的選取本文選擇的是orl人臉數(shù)據(jù)庫(kù)。orl人臉數(shù)據(jù)庫(kù)是由劍橋大學(xué)at&t實(shí)驗(yàn)室創(chuàng)建,包含40個(gè)人400張面部灰度圖像,分辨率為11292。人臉的面部表情和細(xì)節(jié)均有很大的變化。 現(xiàn)在選擇其中8個(gè)人的圖像作為研究對(duì)象,每個(gè)人有10幅圖像,挑選每個(gè)人的4幅圖像作為訓(xùn)練圖像。這樣,訓(xùn)練集就有32張圖像。其余的48張圖像作為測(cè)試圖像。3.2 識(shí)別過(guò)程采用pca方法的人臉識(shí)別系統(tǒng),其組成如下圖3.1所示。圖中,實(shí)線框中的部分實(shí)現(xiàn)系統(tǒng)的訓(xùn)練任務(wù),也是特征提取部分,為離線工作方式。其他部分實(shí)現(xiàn)識(shí)別任務(wù),為在線工作方式。本文模式分類(lèi)器采用最近鄰分類(lèi)器。圖3.1 人臉識(shí)別系統(tǒng)框圖識(shí)別過(guò)程包括以下兩大部分。1、訓(xùn)練過(guò)程對(duì)訓(xùn)練樣本集的圖像進(jìn)行pca處理,形成特征子空間一個(gè)新的坐標(biāo)系,即由前m個(gè)最大特征值對(duì)應(yīng)的特征向量張成的空間,訓(xùn)練集的每幅人臉圖像在特征子空間中投影,產(chǎn)生一個(gè)坐標(biāo),即從原始圖像空間到特征子空間的變換系數(shù),以此作為該圖像的特征。2、測(cè)試過(guò)程對(duì)于一張待識(shí)別的人臉圖像,求出該圖像在上述坐標(biāo)系中的坐標(biāo)也就是求出了這個(gè)圖像的特征,然后通過(guò)與訓(xùn)練集中的圖像的特征相比較,本文選擇最近鄰分類(lèi)器,這樣就可以完成對(duì)這一幅人臉圖像的識(shí)別。3.3 結(jié)果分析3.3.1 基于pca的人臉識(shí)別本文的工作是基于1m內(nèi)存,120g硬盤(pán)的dell筆記本上進(jìn)行的,采用matlab r2008a23軟件。本文用pca來(lái)進(jìn)行特征提取,在生成特征子空間時(shí),挑選的是前m個(gè)最大特征值對(duì)應(yīng)的特征向量張成的空間,m值不同,識(shí)別率也會(huì)有所不同。圖3.2顯示了所得結(jié)果。圖3.2 pca方法的識(shí)別結(jié)果從上圖可以

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論