版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、畢業(yè)設(shè)計(jì)(論文) 外文文獻(xiàn)翻譯文獻(xiàn)、資料中文題目:基于自然人臉和gabor人臉結(jié) 合的改進(jìn)人臉識(shí)別算法文獻(xiàn)、資料英文題目:文獻(xiàn)、資料來源: 文獻(xiàn)、資料發(fā)表(出版)日期:院(部):專 業(yè):班 級(jí):姓 名:學(xué) 號(hào):指導(dǎo)教師: 翻譯日期:2017. 02. 14基于自然人臉和gabor人臉結(jié)合的改進(jìn)人臉識(shí)別算法摘要過去的幾年里,在人臉識(shí)別領(lǐng)域提出了很多基于人臉整體性信息的識(shí)別算 法。其屮一些方法包括顏色處理、人臉的不同描述以及圖像處理技術(shù)。這些方法 的出發(fā)點(diǎn)是用來提高光照變化的魯棒性。在眾多的方法之中,gabor人臉的使用 已經(jīng)被證明是最成功的方法之一。在不同人臉識(shí)別方法的結(jié)合方面也有不少研 究,無
2、論是特征方面還是在得分方面。木文提出了一種有效地結(jié)合方案,這種方 案通過結(jié)合自然人臉和對(duì)應(yīng)的gabor人臉的識(shí)別得分來達(dá)到改善單一整體性方 法的效果。本文利用最知名的幾種整體性方法在frgc數(shù)裾庫上評(píng)價(jià)了這種方法 的有效性。結(jié)果顯示,在各種情況下,識(shí)別率至少達(dá)到了 10%的改善。更重要的 是,當(dāng)識(shí)別得分來自兩種不同的方法,其中一種方法使用自然人臉,另外一種方 法使用gabor人臉,這種方案仍然有效。這些結(jié)果表明,兩種人臉描述具有互補(bǔ) 性,并ii在得分水平能夠很好地被融合。關(guān)鍵詞:人臉識(shí)別gabor圖像描述frgc人臉庫核gabor變換主成分分析(pca)引言在過去的幾年里,信息安全領(lǐng)域關(guān)注度的
3、不斷提高促進(jìn)了人臉身份鑒別的各種生物技 術(shù)的研究。在這些技術(shù)中,人臉識(shí)別技術(shù)由于它的非侵入性吸引了公有機(jī)構(gòu)和私營機(jī)構(gòu)共 同的興趣,成為了*個(gè)非常活躍地研究課題(chellappa et al.,1995;zhao et al.,2003).例如, 人臉自動(dòng)識(shí)別系統(tǒng)目前己經(jīng)用來幫助人類掌權(quán)者用于邊界的控制。這些系統(tǒng)能用于完成兩 種不同的任務(wù):人臉識(shí)別和人臉驗(yàn)證。前者主要用于判斷一個(gè)相關(guān)人臉是否在一個(gè)具有n 個(gè)人臉的列表之中。后者主要用于鑒別兩幅人臉圖像是否屬于同一個(gè)人。本文所討論的系 統(tǒng)主要用于識(shí)別和驗(yàn)證,所使用的圖像是正而靜止的二維人臉。大多數(shù)人臉識(shí)別和驗(yàn)證算法被設(shè)汁成分類器。分類器在從人臉庫
4、取得的一部分人臉圖 像上進(jìn)行訓(xùn)練,以用于尋找一些描述這些人臉的差異性特征。這個(gè)訓(xùn)練過程通常是在離線 狀態(tài)下進(jìn)行的。一經(jīng)訓(xùn)練后,分類器4以被用來從新的人臉圖像中提取差異性特征呈現(xiàn)給 系統(tǒng)。這樣,就可通過比較兩個(gè)特征的差異來比較兩個(gè)人臉的差異了。人臉特征提取的算法可以粗略的劃分為整體性和局部性的方法(zhaoetal.,2003)。整 體性方法使用整個(gè)人臉區(qū)域作為原始輸入呈遞給系統(tǒng)。一般而言,這些系統(tǒng)把人臉投影到 一個(gè)便于識(shí)別的低維系統(tǒng)。眾所周知的整體性技術(shù)有特征臉法(turk and pentland 1991) 和fisher臉法(belhumeur et al.,1997)。相反,局部方法試
5、圖聚集一豎能夠很好定義的位置 信息來識(shí)別人臉。其屮一些局部方法有彈性閣匹配算法(wiskottetal.,1997)和隱馬爾科 夫模型(nefian and hayes,1998)。目前,無論是整體性方法還是局部性方法的研究都很活 躍(zhao et al.,2003;tolba et al.,2005)。自從daugman(1980),daugman et al.(1985)捉出gabor變換能夠很好地模擬皮質(zhì)層單細(xì) 胞的感受域剖面圖后,這個(gè)變換一直被應(yīng)用到各種計(jì)算機(jī)視覺算法之中。確實(shí),這種變換 是彈性圖匹配算法(wiskott et al.,1997 )和許多著名的整體性算法(liu an
6、d wechsler,200l,2002;liu,2004,2006)的核心。gabor變換分析了不同尺度、位賈和方向上紋 理的空間頻率分布。當(dāng)結(jié)合整體性分類器吋,提取的特征不同于那些從自然人臉提取的特 征,通常呈現(xiàn)出更好的精確性。然而,當(dāng)使川gabor臉時(shí),一些與鑒定相關(guān)的信息也有可 能會(huì)丟失。本文研宂了通過結(jié)合兩種分類器獲得的得分能否改善有代表性的整體性方法的識(shí)別 精度。這兩種分類器分別在自然人臉和gabor人臉上得到訓(xùn)練。所提出的結(jié)合方案在frgc (phillips et al.,2005)人臉庫上進(jìn)行了評(píng)價(jià)。frgc是和人臉識(shí)別s相關(guān)的二維靜止圖像 人臉庫。我們的結(jié)果表明,所提出的得
7、分融合方案改善了本文所研宄的所有整體性方法的 精確度。本文剩下的部分是按這樣的方式進(jìn)行組織的:第2和第3部分分別討論了相關(guān)的工作 和gabor人臉描述的一些背景。第4和第5部分簡明的介紹了本文所需的整體性驗(yàn)證算法 和結(jié)合不同得分的方法。s后,第6和第7部分評(píng)價(jià)、總結(jié)了我們的發(fā)現(xiàn)并提出了一些未 來的研究工作。2相關(guān)工作gabor變換曾經(jīng)被用來改善整體性方法的識(shí)別精度。liu和wechsler在2001和2002 年提出了一種將gabor臉輸入到特征臉(pca)和fisher臉(lda)中,從而得到了改進(jìn)的統(tǒng) 計(jì)識(shí)別方法,該方法在feret人臉庫上進(jìn)行試驗(yàn),識(shí)別率提高了 30%左右。后來,liu
8、在2004和2006年提出的將上述gabor臉輸入到獨(dú)立核版本巾,也表明得到了最好的效果 之一。xie et al在2005年提出了一種不同的整體性方法kcfa.這種方法計(jì)算了訓(xùn)練樣本集 巾每一個(gè)人的二維相關(guān)系數(shù)濾波器。在識(shí)別的時(shí)候,新圖像與每一個(gè)濾波器相關(guān),相關(guān)系 數(shù)平面的中心被認(rèn)為是該圖像的特征向量。使用xie et al在2005年提出的核技巧能夠使 得相關(guān)系數(shù)變成非線性的。本文,我們通過對(duì)輸入閣像做gabor小波變換的手段,稍微修 改了一下原始方法。在生物研宄領(lǐng)域,不同識(shí)別系統(tǒng)的結(jié)合受到了越來越多的重視。一般來講,結(jié)合可以 在兩種不同的水平:特征融合和得分融合。前者涉及到大多數(shù)判別特征
9、的選擇性問題,這 需要一個(gè)額外的訓(xùn)練階段。例如,zhao et al.在2004年提出了一種基于下相同輸入的不同 特征提取方法的結(jié)合,最終的得分足巾neural network committee分類器判定的。tan和 triggs在2007年提出了另一種有趣的結(jié)合方案,這種結(jié)合方案將gabor和lbp圖像的pca 特征向量結(jié)合在一起。然而,大多數(shù)判別特征向量的提取使用的方法是kdcv。另一方面,2005年,jain et al.在不同生物識(shí)別系統(tǒng)的得分水平結(jié)合的選擇性方面做 了更進(jìn)一步的研究。對(duì)于每一個(gè)識(shí)別個(gè)體,一個(gè)全局的匹配得分是通過結(jié)合(加法、乘法、 取最大或最小)不同生物系統(tǒng)的得分而獲
10、得的。我們應(yīng)該注意到這種結(jié)合方案并不需要任 何額外的訓(xùn)練階段,并且比特征水平的融合副本更容易一般化。當(dāng)不同系統(tǒng)的信息能夠得 到互補(bǔ)(至少是部分的)的吋候,就能夠獲得好的結(jié)果。本文,我們分析了兩種得分結(jié)合的效果。這兩種得分使用相同的人臉識(shí)別方法,只是 輸入系統(tǒng)的圖像不同而己,其中一種是自然人臉,另一種是gabor人臉。使用的策略是jain et al.在2005年提出的混合模型系統(tǒng)。值得注意的是,我們并不是研究來自特征結(jié)合的最 具有判別性的特征,而是u算以個(gè)體得分結(jié)合為基礎(chǔ)的最終得分。在frg數(shù)據(jù)集上的實(shí) 驗(yàn)表明,這種簡單的融合方案提高了本文介紹的所有整體性方法的識(shí)別率。3 gabor人臉描述g
11、abor人臉閣像是通過計(jì)算原始閣像和兒個(gè)gabor小波函數(shù)的卷積得到的。gaboi小 波是由leej996;lades et alj993提出來的。定義如下:2 2a2, (1)其中a.i,二久,(cos么,sin么),r二(x,y) .lades et al在1993年指出,當(dāng)在頻率域選擇合 適的小波函數(shù)時(shí),gabor人臉能夠非常有效。基于這個(gè)目的,我們可以很方便的定義 k、,二,(/)=叩其巾胃是最大頻率,/是在頻率域核空間間的因子。這些參數(shù)的選擇不僅依賴于需要進(jìn)行處理的閣像的數(shù)目和我們想要考慮的離散頻率。表一是lades etal在1993年列出了針對(duì)128x128圖像的一個(gè)有效的參數(shù)組
12、合。table 1gabor小波變換的參數(shù)選擇(圖像大小為128x128)maxf<7av疋/22tt0,,70”",4設(shè)是一個(gè)灰度分布圖像,圖像/和和gabor小波核函數(shù)的卷積定義如下:= (2)其中,®代表卷積運(yùn)算,(x,y)是與gabor核函數(shù)在方向/和尺度v相關(guān)的運(yùn)算結(jié)果。盡管式(2)的運(yùn)算結(jié)果是復(fù)數(shù)伉,但我們使用的是該復(fù)數(shù)的模值,這種模值表示被證明在邊 緣方面描述得效果很好(lades etal.,1993)。此外,我們對(duì)得到的y)按因子p=64進(jìn) 行下抽樣(即8行8列)以保證最終維數(shù)不超過原圖像的維數(shù)。設(shè)of八表示按因子p下抽樣后由每一行串在一塊得到的列向
13、量,該 列向量進(jìn)行了均值為0方差為丨的標(biāo)準(zhǔn)化處理。這樣,圖像/的最終gab01描述如下:其中t是轉(zhuǎn)置運(yùn)算。這樣,增加的gabor特征向量包含了所有的gabor小波描述的集合, 作為重要的鑒別信息。例如,對(duì)于 128x128像素的圖像而言,這個(gè)響亮的尺寸為10240 (40x16x16)。4驗(yàn)證算法fig.l呈現(xiàn)了一個(gè)典型的整體識(shí)別或驗(yàn)證系統(tǒng)的塊狀圖。對(duì)于經(jīng)過預(yù)處理的圖像,一個(gè)訓(xùn) 練樣本數(shù)據(jù)庫被用來設(shè)計(jì)一個(gè)作為特征提取用的分類器。這個(gè)過程是在離線狀態(tài)下進(jìn)行的。 那么,當(dāng)兩幅新的圖像被輸入系統(tǒng)后(上線),他們各自的特征向量會(huì)被提取,并t特征向 量之間的距離會(huì)被計(jì)算。驗(yàn)證結(jié)果可以通過與所設(shè)定距離閾值
14、進(jìn)行比較得到,該閾值的由來 依據(jù)系統(tǒng)的期望錯(cuò)誤接受率。通常使用的向量間距離的衡a包拈曼哈坦距離(/,)、歐式 距離(l2)、余弦值(4。)和明考斯基距離氏w。在本文中,我們考慮了四種特征提取方法:?0人丄0八,1<0八和1<八,在下 文中會(huì)有更加詳細(xì)的介紹。在每種情況下,我們考慮的都是一幅具有yv個(gè)灰度 值的二維向量。為了方便起見,圖像被表示成一個(gè)yv維的行向量',該行向量 是通過將圖像矩陣各行數(shù)據(jù)組合在一塊得到的。設(shè)給定一個(gè)訓(xùn)練樣本集 =能夠被分成 a = l,.,£類(即來自l個(gè)不同的個(gè)體)。我們用表示類別包含的樣本數(shù)。enlinofeatureextract
15、orvttoxoujaulknlvujjttoxouaiftjkrtlviijjofflinetrainfeatureextractor.userdesiredf.a>r.testverificationresultgraphsfig. 1. block diagram of a typical holistic face verifier system.4.1主成分分析法主成分分析法是利用協(xié)方差矩陣的特征向量作為投影方向進(jìn)行特征提取的。 協(xié)方差矩陣從給定的樣木集中進(jìn)行估計(jì)的:1 m/=11 m其中,一藝令是矩陣x的前r個(gè)最大特征值對(duì)應(yīng)的特征列向量組成的矩陣。主成分分析法就是將上述r個(gè)特
16、征向量作為基向量,將 原始空間的樣本向量r投影到上述特征向量所張成空間屮。不妨設(shè)r在上述特征 空間中的投影向量為f則f = uty.(5)4.2線性鑒別分析上述pca特征提取方法是針對(duì)所有給定樣本而言的,樣本的所屬類別信 息并沒有納入到算法中去。線性鑒別分析法,是從fisher判別理論發(fā)展而來的, 因而乂叫做fisher線性判別法。ldap8j方法采用了使得樣木能夠正確分類識(shí)另ij 的先驗(yàn)知識(shí),即尋找最優(yōu)投影方向,使得投影后向量的類間離散度矩陣和類內(nèi)離 散度矩陣的比率最人化,這有助于識(shí)別率的提高。這些投影方向被用來對(duì)給定的 樣本向量進(jìn)行特征提取。給定樣本向量的類間離散矩陣定義為:t. (6)
17、a=1類內(nèi)離散度矩陣定義為:l心(7)k=i xg w女k nk.其中,/=1義是所有樣本向量的均值向量,a =_l z x/是第個(gè)類別 m tzrm,的均值向量。線性判別分析試圖尋找£-1個(gè)方向向量v使得如下關(guān)系式最大化(8)由rayleigh商的知識(shí)可知使得等式(1)中j最大化的向量v是如下常見的特征 問題:(9)設(shè).,v£ 2;|是由式(2)的最大特征值對(duì)應(yīng)的特征列向量組成的矩陣,同樣,設(shè)r在上述特征空間中的投影向量為f則 f = ury.(10)4.3核判別分析上述介紹的方法屬于線性分類,當(dāng)數(shù)據(jù)是線性相關(guān)的吋候是非常有效的。然而,人臉 之間的關(guān)系可能是非線性的。核判
18、別分析利用核技術(shù)獲得了 lda的非線性表示。設(shè)外4 f是一個(gè)從輸入圖像空間到另一個(gè)高維空間f的變換。kda方法使 用f空間中的投影向量作為式(9)的解,這樣類間離散矩陣和類內(nèi)離散矩陣重定義為:(11)=1)-讀(x,x)(12)k=l xr 11 m其中,二一 y (x.), ;/=是廠空間巾每一個(gè)類的均值和全局 mk x%km /=1均值。為了簡化等式,暫時(shí)假設(shè)在f空間中的數(shù)據(jù)是中心化的(/?=0),并且 定義矩陣如下:d = xx2.xm).(13)這樣,使用矩陣z)可以對(duì)式(11)和(12)表達(dá)如下(heatal.,2005):sb= -d(i - w)z/ + ddt(14)svv =
19、d(i-w)dy(15)其屮i是一個(gè)mxm維的單位矩陣,we rmxm是一個(gè)塊對(duì)角矩陣 w = diagw,w2.,wl , vva.e尺卽是一個(gè)所有元素都等于的axma.維 矩陣。把式(14)和(15)帶入式(9)我們得到:d(-w)dtv = xddtv(16)其中義=% + .由復(fù)數(shù)核理論的知識(shí)可知,式(16)的解必須依賴于圖像在f中 的取值范圍:mv = ci(/)(xi) = da(17)/=1其中漢='2,.,;|7、,.用這個(gè)表達(dá)式替換式(16)中的v,然后等式兩邊同 時(shí)乘以/,我們得到:k-wka = xkka(18)其中k = z)d是訓(xùn)練樣本的核矩陣:=外)沢
20、9;).(19)注意到,使用核技術(shù),我們無法準(zhǔn)確的描述映射因?yàn)樗鼉H僅以點(diǎn)乘的形式出現(xiàn)在等式中,因而可以使用關(guān)系核函數(shù)進(jìn)行計(jì)算:kkxxj)如果原始圖像數(shù)據(jù)在f中沒有進(jìn)行中心化,經(jīng)過如下數(shù)據(jù)變換,上述等式仍 然有效:萬二)-,外心)-/?(20)由式(17)和(18)可以變換得到:mv = cixi)-/j0) = da = d(-m)a '=1(21)k(-m)kta = xkk a(22)其中元是原始圖像在f空間中心化后的核矩陣,是 所有元素都等于的矩陣。最終,等式(22)也可以寫成如下形式:kwk a = xkk a(23)其中/=1-x=a/(1 + a)。與最大值2對(duì)應(yīng)的等式(
21、23)的解和最大值a對(duì)應(yīng)的 等式(9)的解相關(guān)。令a = a,6z2,.,6e/?mx"表示等式(23)的解中最大的個(gè)特征 值對(duì)應(yīng)的特征向量組成的矩陣,其屮所有的特征向量都進(jìn)行了標(biāo)準(zhǔn)化,例如 |v|2 = 1。為了提取給定測試圖像集/7 = 0,.,-1的特征向量,我們必須將它們投影到空間f的特征向量v上去:=sv/(yp-)(24)/=1定義me, =外k),叭r2),沢q,特征矩陣為f = f;,f2,.,f;,利用等式(24) 我們得到f = at(ktest-imktest-klm +lmklm) = atk咖'其中,是測試核矩陣,其中每個(gè)元素計(jì)算為 隊(duì)wxp, 么,
22、是/中心化后得到的。_在ajt識(shí)別的過程中,等式(23)經(jīng)常會(huì)遇到一個(gè)問題。這是因?yàn)榫仃?萬(i-w)萬的秩至多只有7v-l (heetal.,2005),而閣像的數(shù)目m遠(yuǎn)遠(yuǎn)低于閣像的像素?cái)?shù)2v,導(dǎo)致矩陣萬(1-w)萬是一個(gè)奇異矩陣。目前,這個(gè)問題有兩種解決 方法:增加上述因子p (liu,2006)或者使用pca對(duì)原始閣像進(jìn)行降維(belhumeur etal.,1997).本文采用了前一種方法。4.4核相關(guān)特征分析本文考慮的最后一種整體性方法是核相關(guān)特征分析(xie et al.,2005).這個(gè) 方法試圖為訓(xùn)練樣本的每一個(gè)類設(shè)計(jì)一個(gè)最優(yōu)折中濾波器(otf) (refregier,1990
23、)o當(dāng)一個(gè)新的圖像輸入到系統(tǒng)時(shí),它和所有的濾波器相關(guān)。并 把輸出相關(guān)系數(shù)t而的中心值作為新圖像的特征。在kcfa中,相關(guān)值是利用核 技術(shù)在高維待征空間f中計(jì)算得到的。otf的設(shè)計(jì)是在頻率域進(jìn)行的。這個(gè)濾波器在最小化相關(guān)輸出噪聲和最小a/-1化均值和關(guān)能量之間取折中(refregier,1990).定義d二其中是一個(gè)對(duì) !=()對(duì)角矩陣,其中元素£>,.(/:,幻含義在頻域處的能量譜。c作為對(duì)角矩陣,其 中的元素幻包含了在頻率處的噪聲能量譜密度。t = adf3c<ayp< 對(duì)于一個(gè)給定的類別,otf是這樣獲得的(xieetal.2005,refregier, 199
24、0): h0tr=t-lx(x+tlxrlc(26)其中,是一個(gè);vxm維的矩陣,每一個(gè)人是一個(gè)7v維向量,該向量是將第f個(gè)訓(xùn)練樣本經(jīng)二維傅立葉變換后按行拼接在一塊得到的。是一 個(gè)mxl維的列向量,如果圖像f在這個(gè)類別的話,q等于1,否則的話等于0。假設(shè)圖像都經(jīng)過屮心化和標(biāo)準(zhǔn)化,對(duì)于給定的測試圖像經(jīng)傅立葉變換y 以及與等式(26)的濾波器相關(guān)后,其相關(guān)平面的中心可以用下面的內(nèi)積表示: c(0,0) = y+h0tf = y+t-lx(x+t-xylc(27)因?yàn)閞是一個(gè)對(duì)角矩陣,它可以被分解為7=7%廠,那么式(27)可以寫成 下面形式:c(0,0) = (tyy (t2x )(7'
25、x)+x)_,c?(28)等式(28)表明我們可以將7%當(dāng)作圖像的一個(gè)前置濾波器。記我 們可以將式(28)寫成如下形式:c(0,0)二了 x(x + x廠1 z(29)正如kda的例子一樣,令扒x) . cn 4 f是一個(gè)從輸入空間的頻率域到一個(gè)高維 特征空間f的映射。等式(29)變換后的表達(dá)式為:c(0,0) = kleslkx(30)其中,/s7是一個(gè)lxm維的測試核矩陣,尺是一個(gè)mxm維的訓(xùn)練核矩陣,其中_(戸(咬(31)(z,7)= (x;)(32)定義c = «,.,則測試閣像/的全部持征向量可以計(jì)算如下:f = kh,stk'c(33)5得分結(jié)合在木文中,我們分析
26、了結(jié)合驗(yàn)證系統(tǒng)的效果,這個(gè)系統(tǒng)將自然圖像和他們的 gabor圖像分別作為輸入,然后在得分水平進(jìn)行結(jié)合。這種思想在圖2中進(jìn)行了 說明。白然圖像和他們的gabor變換經(jīng)歷丫相同的特征提取過程。當(dāng)兩個(gè)圖像進(jìn) 行比較的時(shí)候,這兩個(gè)系統(tǒng)分別用來獲取一組標(biāo)準(zhǔn)化的得分。然后,這兩個(gè)結(jié)果 被結(jié)合產(chǎn)生最終的得分,這個(gè)得分可以用來決定這兩張閣像是否來自同一個(gè)人。不同的標(biāo)準(zhǔn)化方法是可能的(jain et al.,2005)。在本文中,我們使用的是 z-score標(biāo)準(zhǔn)化方法,這種方法在frgc文木中是默認(rèn)用來畫roc曲線的。毫 無疑問,另一個(gè)標(biāo)準(zhǔn)化后的結(jié)果是類似的。此外,對(duì)于得分融合有幾種選擇方法。 木文中我們使用的
27、方法是得分相加。下文中的結(jié)果解釋了為什么這種方案是最合適的。fig. 2. block diagram for the score-fusion mechanism.6實(shí)驗(yàn)結(jié)果當(dāng)前的工作在frgc人臉庫上進(jìn)行了試驗(yàn),frgc是一個(gè)和評(píng)價(jià)人臉識(shí)別算 法最相關(guān)的數(shù)據(jù)庫之一。本文中,我們做了實(shí)驗(yàn)4,用來評(píng)價(jià)識(shí)別算法的結(jié)果, 這實(shí)驗(yàn)4是在強(qiáng)烈的光照變化條件下正面靜止人臉圖像上進(jìn)行的。frgc數(shù)據(jù)庫包括12776個(gè)訓(xùn)練圖像,16028個(gè)被控目標(biāo)圖像,8014個(gè)測試 圖像。實(shí)驗(yàn)4包含每一張測試圖像與訓(xùn)練樣木中所有圖像的兩個(gè)得分。將這些得 分進(jìn)行標(biāo)準(zhǔn)化,使用z-score方案,一條roc曲線就形成了,這條曲
28、線繪制的是 正確識(shí)別率與錯(cuò)誤接受率之間的關(guān)系。在frgc實(shí)驗(yàn)中,計(jì)算了三條不同的roc 曲線:/?oc-i, roc-w, 7?oc-m,分別對(duì)應(yīng)半年內(nèi)收集的圖像、一年內(nèi)收集 的圖像以及半年之間收集到的圖像。我們選擇了最具有挑戰(zhàn)性的/?oc-ni曲線 來展示結(jié)果,在其他的實(shí)驗(yàn)中,也有相同的做法。為了使得不同方法之間的比較更加容易,對(duì)于每種方法都是用了相同的預(yù)處理過程。具體的,每一張圖像首先進(jìn)行中心化,把眼睛放在固定的位置,歸一 化圖像大小為128x128。接下來,每一張閣像都轉(zhuǎn)化為灰度閣像并進(jìn)行直方閣均 衡化以使得圖像矩陣對(duì)光照條件具有獸棒性。最后,最終的圖像被標(biāo)準(zhǔn)化為零均 值和單位方差。另一
29、方面,對(duì)于kda和kcfa,我們使用了兩種不同的核函數(shù)重復(fù)了同樣 的實(shí)驗(yàn)過程。這兩種和函數(shù)分別為多項(xiàng)式和高斯核函數(shù):z:(x,y) = (x. ),)"(34)y) = exp2<r(35)其屮,denf并且70.然而,兩種情況都是用了相同的方法,因此,在這部 分我們僅僅展示了最好核函數(shù)的結(jié)果,rbf核函數(shù)。此外,我們評(píng)價(jià)丫幾個(gè)不 同的得分計(jì)算方法:ii, l2, co sin e, mahalan - obis ,和 mahalanobis cosine。這部分的結(jié)果表明了每一種方法對(duì)應(yīng)的最好的度量手段:pca對(duì)應(yīng)的是 mahalanobis co sin e , lda,k
30、cfa 和 kda 對(duì)應(yīng)的都是 cosine 距離。fig.3比較了 frgc實(shí)驗(yàn)4中的曲線和本文所研究的所有方法,使 用了自然圖像和gabor圖像?;趃abor的方法做了一個(gè)前置處理g。得分融合 的曲線也被繪制丫。從這些實(shí)驗(yàn)屮,容易看出,當(dāng)使用gabor人臉替換b然人臉 的時(shí)候,所有方法的效果都得到了改善。注意到,這一點(diǎn)對(duì)于gkcfa同樣適合, 這種方法使用了 gabor人臉作為一維信號(hào)并且應(yīng)用了 kcfa方法。就本人目前所 知,之前還沒有人將gabor變換應(yīng)用到kcfa中。然而,從fig.3中提取的最重要的結(jié)論是經(jīng)過自然人臉和gabor人臉的得分 融合后木文研究的所有方法的效果都得到了改
31、善。從數(shù)量上講,這種改善是10% 左右,相比基于gabor的方法,far減小了 0.001 (相比pca而言,增加到了 50%)。為了說明為什么這種方法能提高識(shí)別率,本文在fig4中繪制了 gkda-kda系數(shù)空間曲線。我們看到,使用gkda能夠更好的匹配一些點(diǎn),其 他點(diǎn)通過kda能更好地被驗(yàn)證。使用兩個(gè)距離相加暗示著沿單位斜率的曲線選 擇了閾值,得到的改善,我們可以在fig3中看出。另一方面,fig.5畢竟熬了幾種方法之間的結(jié)合。有趣的是fisher判別的線 性和非線性版本,b|lda和kda,在識(shí)別效果方面的差別很小。如果考慮到一 個(gè)線性方法的無記憶或者過度匹配功能,當(dāng)使用木文提出的得分融
32、合策略時(shí), lda方法相比kda方法而言或許是一個(gè)更好的選擇。另一個(gè)有趣的結(jié)論是,在 識(shí)別結(jié)果方面,kcfa與lda和kda非常相近。(gkda.kda) score space1 -0.8 -0.6 -0.4 -0.2 0 0 2 0.4 0.6 gkdamethods comparisonfig. 5. comparison of the different methods when scores from natural and cabor images are combined.kda gkdafarfarfarfig. 3. effect of combining natural a
33、nd gabor image representations for (a) ka. (b) lda.(c) kda and (d) kcfa on frcc expenment 4 roc-111 curves. preceding g indicates (lui cborrepresenutions where used instead of ncurl inures.最后,得分融合技術(shù)也可以應(yīng)用到方法之間的結(jié)合中去。fig.6是在frgc 數(shù)據(jù)庫的實(shí)驗(yàn)4上進(jìn)行的,該試驗(yàn)結(jié)果展示了 lda和kda之間的得分融合的 結(jié)果。這兩種方法的所有可能結(jié)合都已經(jīng)被考慮了。當(dāng)輸入和同的人臉圖像時(shí),方法
34、的結(jié)合(kda+lda和gkda+glda)并沒有帶來任何的好處,然而,使 用不同人臉輸入時(shí),方法的結(jié)合(gkda+lda和glda+kda)在一定意義上 改善了識(shí)別結(jié)果。更重要的是,在我們的實(shí)驗(yàn)中,自然人臉和gabor人臉的結(jié)合 在得分的差別上是非常小的。在其余的幾種方法屮也得到丫類似的結(jié)果。從所繪制的fig.6屮可以得到的 主要結(jié)論是當(dāng)將系統(tǒng)中其中一個(gè)在自然人臉中訓(xùn)練的得分和另一個(gè)在gabcx人 臉中得到的得分進(jìn)行融合時(shí),識(shí)別的效果會(huì)更好。這些結(jié)果表明,在自然人臉中訓(xùn)練的整體性方法比在gabor人臉中訓(xùn)練得到 了不同的鑒別信息,并且通過單個(gè)系統(tǒng)的得分融合,我們可以充分利用所有的這 些信息。
35、far7結(jié)論在木文中,我們得出了在得分水平進(jìn)行融合時(shí)不同整體性人臉識(shí)別方法間的 結(jié)合在識(shí)別效果上帶來了好處。更精確的說,我們用相同方法訓(xùn)練了兩個(gè)例子, 其中一個(gè)自然人臉上進(jìn)行,另一個(gè)在gabor人臉上進(jìn)行。理論分析己經(jīng)在frgc 數(shù)據(jù)庫上對(duì)四個(gè)整體性方法(pca,lda,kda和kcfa)進(jìn)行了試驗(yàn)。在所有的 例子屮,當(dāng)錯(cuò)誤接受率為0.001時(shí),得分融合方法的結(jié)果帶來了 10%左右的改善。 在gabor人臉閣像上使用kcfa也是第一次嘗試,這種方法是在原有方法的基礎(chǔ) 上進(jìn)行修改得到的。此外,我們表明當(dāng)使用不同整體性方法結(jié)合時(shí),所提出的得 分融合方案仍然有效(會(huì)帶來識(shí)別率的提高)。這些結(jié)果表明當(dāng)
36、使用gabor變換 時(shí),自然人臉中的部分判別信息不能通過整體性方法提取岀來,但如果結(jié)合在原 始圖像上的整體性方法的得分,至少在那部分隱藏的信息上是一個(gè)非常方便的特 征提取方法。未來,我們將在局部方法和不同整體性方法的結(jié)合方面做一定的擴(kuò)展工作, 不僅在得分水平,也在特征提取水平。然而,在特征水平的結(jié)合可能暗示著兩 個(gè)訓(xùn)練階段,其中一個(gè)在特征提取上訓(xùn)練,另一個(gè)在融合方面訓(xùn)練,這樣增加 了找出一般結(jié)合策略用來改善識(shí)別效果的困難性。如果更多復(fù)雜的得分融合方 案被應(yīng)用的話,上述困難同樣會(huì)出現(xiàn)。例如,一個(gè)神經(jīng)網(wǎng)絡(luò)如果能在得分空間 進(jìn)行訓(xùn)練的話,需要一個(gè)額外的訓(xùn)練集。木文所提岀的得分融合方案的簡單性 使得我
37、們的結(jié)果更加引人注0。參考文獻(xiàn)ijbelhiimeur, r, hespanha,j.,kriegman,d.,1997. eigenfaces vs. fisherfaces:recognition using class specific linear projection. ieee trans. pattern anal.machine intell. 19 (7), 711-720. issn: 0162-8828.f2chellappa, r.,wilson, c.,sirohey,s.,1995. human and machine recognition of faces:a
38、survey. proceedings of the ieee 83 (5), 705-741. issn: 0018-9219.3daugman,j” 1980. two-dimensional spectral analysis of cortical receptive fieldprofiles. vision res. 20 (10),847-856. issn: 00426989.4jdaugman,j.g” space,uncertainty relation for resolution in,frequency, spatial,1985.and orientation op
39、timized by two-dimensional visual cortical filters. j. opt. soc.amer. a 2 (7), 1160-1169.5he,x.,yan,s.,hu,y” niyogi,p” zhang,h.-j.,2005 face recognition using laplacian faces. ieee trans. pattern anal. machine intell. 27 (3),328-340.6jjain,a.,nandakumar,k.,ross,a.,2005. score normalization in multim
40、odal biometric systems. pattern recognition 38 (12),2270-2285. issn: 0031-3203.f71lades,m.,vorbriiggen, j.c.,buhmann,j.,lange, j.,von der malsburg, c.,wlirlz, r.p.,konen,w” 1993. distortion invariant object recognition in the dynamic link architecture. ieee trans. comput. 42, 300-311.8lee, t.s.,1996
41、. image representation using 2d gabor wavelets. ieee trans. pattern anal. machine intell. 18(10),959971.9liu,c.,2004. gabor-based kernel pca with fractional power polynomial models for face recognition. ieee trans. pattern anal. machine intell. 26 (5), 572-581. issn:0162-8828.uojliu,c.,2006. capital
42、ize on dimensionality increasing techniques for improving face recognition grand challenge performance. ieee trans. pattern anal. machine intell. 28 (5), 725-737. issn: 0162-8828.1 lliu, c., wechsler, h., 2001. a gabor feature classifier for face recognition. in: iccv 2001. proceedings eighth ieee i
43、nternational conference on computer vision,vol. 2, pp. 270-275-12jliu, c.,wechsler, h.,2002. gabor feature based classification using the enhanced fisher linear discriminant model for face recognition. ieee trans. image process. 11,467-476.13 nefian,a.v.,hayes, m.h.,iii,1998. hidden markov models fo
44、r face recognition. in:proc. internal conf. acoustics, speech and signal processing,1998, pp. 2721-2724.14 phillips,p” flynn,p” scruggs,t” bowyer,k” chang,j” hoffman,k.,marques,j” min,j” worek, w., 2005. overview of the face recognition grand challenge. in: cvpr 2005. ieee computer society conf, on computer vision and pattern recognition,2005, vol. 1,pp. 947-954, issn: 1063-6919.15 refregier,p” 1990. filter design for
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023二年級(jí)語文上冊 第六單元 15 八角樓上配套說課稿 新人教版
- 勞動(dòng)合同范例簡略
- 產(chǎn)品加盟合同范例
- 個(gè)人林木轉(zhuǎn)讓合同范例
- 隨機(jī)化方法提高搜索引擎結(jié)果質(zhì)量
- 二手車位采購合同范本
- 保潔簽訂勞務(wù)合同范例
- 共同出資購房合同范例
- 買賣犬只合同范例
- ktv消防工程合同范例
- 碳納米管應(yīng)用研究
- 投標(biāo)聲明書模板
- 運(yùn)動(dòng)技能學(xué)習(xí)與控制課件第十一章運(yùn)動(dòng)技能的練習(xí)
- 蟲洞書簡全套8本
- 2023年《反電信網(wǎng)絡(luò)詐騙法》專題普法宣傳
- 小學(xué)數(shù)學(xué)五年級(jí)上、下冊口算題大全
- 和平精英電競賽事
- 熱應(yīng)激的防與控
- 高標(biāo)準(zhǔn)農(nóng)田施工組織設(shè)計(jì)(全)
- 職業(yè)安全健康工作總結(jié)(2篇)
- 14S501-1 球墨鑄鐵單層井蓋及踏步施工
評(píng)論
0/150
提交評(píng)論