面向人臉識(shí)別的WPD_第1頁(yè)
面向人臉識(shí)別的WPD_第2頁(yè)
面向人臉識(shí)別的WPD_第3頁(yè)
面向人臉識(shí)別的WPD_第4頁(yè)
面向人臉識(shí)別的WPD_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

面向人臉識(shí)別的WPD-HOG金字塔特征提取方法劉文培;李鳳蓮;張雪英;田玉楚【摘要】人臉識(shí)別技術(shù)可應(yīng)用于各監(jiān)控和安保領(lǐng)域,它涉及特征提取、識(shí)別模型等關(guān)鍵技術(shù).其中特征提取方法直接影響識(shí)別效果,目前所用的特征提取方法存在特征表達(dá)不全面、計(jì)算復(fù)雜度高等問(wèn)題.據(jù)此,提出一種基于WPD-HOG金字塔的人臉特征提取方法,該方法結(jié)合小波包分解(WaveletPacketDecomposition,WPD)、圖像金字塔以及方向梯度直方圖(HistogramsofOrientedGradients,HOG)對(duì)人臉圖像特征進(jìn)行有效表征,最終將WPD-HOG金字塔特征通過(guò)SVM分類(lèi)器進(jìn)行分類(lèi).通過(guò)在ORL人臉庫(kù)上進(jìn)行實(shí)驗(yàn),與四種對(duì)比方法HOG、HOG金字塔、FWPD-HOG以及FWPD-HOG金字塔進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明,WPD-HOG金字塔特征提取方法的識(shí)別率要高于對(duì)比方法,且在噪聲方面具有較好的魯棒性.【期刊名稱(chēng)】《計(jì)算機(jī)工程與應(yīng)用》【年(卷),期】2018(054)022【總頁(yè)數(shù)】6頁(yè)(P150-155)【關(guān)鍵詞】人臉識(shí)別特征提取;小波包分解;圖像金字塔;方向梯度直方圖【作者】劉文培;李鳳蓮;張雪英;田玉楚【作者單位】太原理工大學(xué)信息工程學(xué)院仙西晉中030600;太原理工大學(xué)信息工程學(xué)院仙西晉中030600;太原理工大學(xué)信息工程學(xué)院仙西晉中030600;太原理工大學(xué)信息工程學(xué)院仙西晉中030600;昆士蘭科技大學(xué)電機(jī)工程及計(jì)算機(jī)科學(xué)學(xué)院,澳大利亞昆士蘭【正文語(yǔ)種】中文【中圖分類(lèi)】TP391.411引言人臉識(shí)別技術(shù)作為生物識(shí)別技術(shù)的一種,以其特有的穩(wěn)定性、方便性、唯一性等特點(diǎn)被愈來(lái)愈多地應(yīng)用于各種身份識(shí)別領(lǐng)域。人臉識(shí)別技術(shù)是基于人的臉部特征進(jìn)行身份識(shí)別的,因此特征提取方法性能優(yōu)劣直接決定識(shí)別效果。目前,常用的特征提取方法大體可以分為兩種:一種是基于全局特征的特征提取方法,能有效地表達(dá)人臉的輪廓特征,如主成分分析(PrincipalComponentAnalysis,PCA)[1]、線(xiàn)性判別分析(LinearDiscriminantAnalysis,LDA)[2]、特征臉[3]等方法;另一種是基于局部特征的特征提取方法,反映的是人臉的細(xì)節(jié)特征,如局部二值模式(LocalBinaryPattern,LBP)[4]、Gabor[5]、方向梯度直方圖(HistogramsofOrientedGradients,HOG)[6]等方法。由于全局特征較局部特征更容易受光照、姿態(tài)和表情等因素的影響,一般不單獨(dú)研究,僅針對(duì)局部特征進(jìn)行研究,會(huì)存在對(duì)整體信息表征能力不夠的缺陷,從而影響識(shí)別效果。近年來(lái),研究發(fā)現(xiàn)將全局和局部特征相結(jié)合,能有效利用二者的優(yōu)點(diǎn),提高人臉特征的表征能力[7],因此越來(lái)越多的研究人員開(kāi)始關(guān)注結(jié)合全局和局部特征的方法,并提出了很多新穎的算法。文獻(xiàn)[8]將人臉的兩種局部特征一一HOG和LBP進(jìn)行融合,利用分層的思想,實(shí)現(xiàn)局部和整體特征融合的特征提取方法,但該方法特征維數(shù)高至5萬(wàn),計(jì)算復(fù)雜;文獻(xiàn)[9]將HOG和奇異值分解(SingularValueDecomposition,SVD)結(jié)合,提出了一種基于HOG-SVD的人臉識(shí)別方法,分別提取人臉圖像的整體HOG-SVD特征和各子塊的HOG-SVD特征,組合形成最終分類(lèi)特征,但該方法容易造成大量分類(lèi)特征信息丟失的問(wèn)題;文獻(xiàn)[10]通過(guò)研究全局特征PCA、2DPCA與局部特征LBP、Gabor,將全局特征與局部特征采用決策級(jí)融合,實(shí)驗(yàn)結(jié)果表明識(shí)別率優(yōu)于單一特征的識(shí)別率,但是該融合方法也保留了PCA方法的缺點(diǎn),算法的可擴(kuò)展性受到一定影響;文獻(xiàn)[11]通過(guò)圖像金字塔、HOG特征譜構(gòu)建人臉圖像的HOG金字塔來(lái)實(shí)現(xiàn)整個(gè)人臉的特征表達(dá),該方法利用圖像金字塔的多尺度表達(dá)實(shí)現(xiàn)了全局與局部特征的結(jié)合,但是特征維數(shù)上萬(wàn),計(jì)算復(fù)雜度高且運(yùn)算時(shí)間長(zhǎng)。針對(duì)上述問(wèn)題,考慮到HOG特征對(duì)光照、尺度及方向有很強(qiáng)的適應(yīng)性,能夠很好地提取圖像的局部特征的特點(diǎn);小波包分解(WaveletPacketDecomposition,WPD)[12]在去除冗余、縮小圖像尺寸、降維方面的優(yōu)勢(shì);圖像金字塔可對(duì)人臉圖像進(jìn)行多尺度表達(dá)的特性,本文將HOG特征、WPD、圖像金字塔相結(jié)合,提出一種基于WPDHOG金字塔的人臉特征提取方法。該方法首先將圖像進(jìn)行WPD,選取低頻子圖像,進(jìn)而對(duì)該子圖像構(gòu)建圖像金字塔,然后對(duì)金字塔中的每層圖像提取HOG特征,將各層HOG特征順序級(jí)聯(lián)得到WPD-HOG金字塔特征。為驗(yàn)證所提出的WPD-HOG金字塔特征提取方法的有效性,將提取的WPD-HOG金字塔特征通過(guò)支持向量機(jī)(SupportVectorMachine,SVM)[13]分類(lèi)器進(jìn)行人臉識(shí)別,在ORL人臉庫(kù)上的實(shí)驗(yàn)結(jié)果表明,本文方法優(yōu)于對(duì)比方法,提取到的人臉特征信息完備,計(jì)算復(fù)雜度低,具有較高的識(shí)別率和對(duì)噪聲的魯棒性。2基本方法2.1HOG特征HOG特征最早被Dalal等人提出并應(yīng)用于行人檢測(cè)[14],因HOG特征能夠?qū)D像的幾何和光學(xué)變化保持很好的不變性而被廣泛應(yīng)用到人臉識(shí)別領(lǐng)域。HOG特征是一種在計(jì)算機(jī)視覺(jué)和圖像處理中用來(lái)進(jìn)行物體檢測(cè)的特征描述子。該方法最重要的思想是,在一幅圖像中,局部目標(biāo)的表象和形狀能夠被梯度或邊緣的方向密度分布很好地描述。本文HOG特征的提取過(guò)程如下:Gamma校正Gamma校正的主要目的是把圖像整體亮度提高,以改善圖像灰度較暗的情況。計(jì)算圖像每個(gè)像素位置的梯度采用中心對(duì)稱(chēng)梯度算子[-1,0,1],按下列公式求圖像中像素點(diǎn)(x,y)的橫向和縱向梯度,分別設(shè)為Gx(x,y)和Gy(x,y)。式中,H(x,y)為像素點(diǎn)(x,y)的像素值。計(jì)算圖像每個(gè)像素位置的梯度幅值和方向按下列公式求圖像中像素點(diǎn)(x,y)的梯度幅值和方向,分別設(shè)為G(x,y)和0(x,y)o局部方向梯度直方圖將圖像分成小的細(xì)胞單元(cell),在每個(gè)cell中獨(dú)立做梯度方向統(tǒng)計(jì),形成局部方向梯度直方圖。直方圖以梯度方向?yàn)闄M軸,將0°~180°的梯度方向劃分為k個(gè)均勻的區(qū)間(bin),每個(gè)方向角度范圍都會(huì)對(duì)應(yīng)一個(gè)直方柱。每個(gè)cell內(nèi)相同梯度方向的頻數(shù)按照梯度幅值加權(quán),本文運(yùn)用了高斯核函數(shù)來(lái)調(diào)整cell內(nèi)梯度大小的權(quán)重,用像素鄰域的加權(quán)均值來(lái)代替該點(diǎn)的像素值,距離越近的點(diǎn)權(quán)重越大,距離越遠(yuǎn)的點(diǎn)權(quán)重越小。高斯核函數(shù)的計(jì)算公式如下所示:其中,xc為核函數(shù)中心;x為xc像素鄰域中的其他像素點(diǎn);8為核函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍。block內(nèi)歸一化局部直方圖為了提高精確度,把這些局部直方圖在圖像的更大區(qū)間(block)中進(jìn)行歸一化,歸一化函數(shù)采用L2范數(shù)。HOG特征的形成將圖片中所有block進(jìn)行HOG特征的收集,并將各個(gè)block的直方圖首尾相連形成最終的特征向量。2.2小波包分解小波包是在小波多分辨率分析的基礎(chǔ)上建立起來(lái)的。小波包分解可根據(jù)被分析信號(hào)的特征,自適應(yīng)地選擇相應(yīng)頻帶,使之與信號(hào)頻譜相匹配,以提高被分析信號(hào)的時(shí)頻分辨率,是一種比小波分解更為精細(xì)的分解方法[15]。對(duì)圖1所示的原圖(用W表示)進(jìn)行一級(jí)WPD,得到圖2的子圖像,包含近似細(xì)節(jié)部分、水平細(xì)節(jié)部分、垂直細(xì)節(jié)部分和對(duì)角細(xì)節(jié)部分,分別用A、H、V、D來(lái)表示,對(duì)W進(jìn)行一級(jí)WPD的分解過(guò)程用四叉樹(shù)結(jié)構(gòu)圖表示,如圖3所示。其中,A為低頻子圖像,它反映了人臉的輪廓信息,包含人臉的大部分特征,與原圖最為相似;H、V、D為高頻子圖像,包含了人臉的各種紋理細(xì)節(jié)信息,但是容易受到噪聲、表情和光照的影響。WPD不僅在去噪方面可以取得不錯(cuò)的效果,而且分解后得到的子圖像大小也縮減為原圖像的1/4,大大降低了后續(xù)對(duì)圖片進(jìn)行特征提取的計(jì)算復(fù)雜度。圖1原圖像圖2子圖像圖3小波包第一層分解的四叉樹(shù)結(jié)構(gòu)圖2.3圖像金字塔圖像金字塔是以多分辨率來(lái)解釋圖像的一種有效但概念簡(jiǎn)單的結(jié)構(gòu)。一幅圖像的金字塔是一系列以金字塔形排列的分辨率逐步降低的圖像集合。圖4所示為三層的圖像金字塔,金字塔的底層是待處理圖像的高分辨率表示,而頂層是低分辨率的近似,圖中虛線(xiàn)將各層圖片相對(duì)應(yīng)的四個(gè)頂點(diǎn)分別相連,相交于一點(diǎn),此相交點(diǎn)并無(wú)實(shí)質(zhì)意義,不含任何圖像信息,只是使三層圖像外觀(guān)看上去更像金字塔的形狀,故稱(chēng)為圖像金字塔。當(dāng)向金字塔的上層移動(dòng)時(shí),尺寸和分辨率隨之降低。圖4圖像金字塔對(duì)于一幅NxM的圖像,在行和列兩個(gè)方向上對(duì)其進(jìn)行1:2的亞采樣,可構(gòu)成原圖像的一幅(N/2)x(M/2)的縮略圖。將亞采樣重復(fù)進(jìn)行,隨著層數(shù)的增加,每一層的圖像是下面一層圖像的寬和高的一半,就得到構(gòu)成金字塔的各層圖像[16]。亞采樣金字塔包括了最底層原始圖像的高分辨率的信息,第二層經(jīng)過(guò)亞采樣處理的較低分辨率信息,以及第三層低分辨率的信息,這三部分信息不僅反映出人臉圖像的很多概貌信息,也描述了人臉圖像的細(xì)節(jié)特征。這些高分辨率、較低分辨率以及低分辨率的信息就構(gòu)成了圖像的多尺度表達(dá),多尺度表達(dá)為全局特征與局部特征的結(jié)合提供了一個(gè)很好的途徑。3WPD-HOG金字塔特征及其在人臉識(shí)別中的應(yīng)用對(duì)人臉圖像進(jìn)行一級(jí)小波包分解得到低頻和高頻子圖像,本文將棄除高頻子圖像,選取低頻子圖像進(jìn)行后續(xù)處理,既能去除魯棒性差的高頻信息,又能降低計(jì)算復(fù)雜度。HOG特征提取方法描述的是圖像的局部特征,而金字塔模型可以對(duì)圖像的全局形狀特征進(jìn)行多尺度表達(dá)。因此,本文將WPD和HOG特征以及金字塔模型相結(jié)合,提出一種基于WPD-HOG金字塔的特征提取方法。該方法既可以提取圖像的全局特征和局部特征,實(shí)現(xiàn)圖像的多尺度表達(dá),又可達(dá)到去除冗余和降低計(jì)算復(fù)雜度的效果。3.1WPD-HOG金字土塔特征提取本文提出的WPD-HOG金字塔特征提取步驟如圖5所示。例如,對(duì)一張尺寸為64x80的人臉圖片提取WPD-HOG金字塔特征,bin的個(gè)數(shù)k取9,cell為4x4,每2x2個(gè)cell組成一個(gè)block,因?yàn)槊總€(gè)cell有9個(gè)特征,所以每個(gè)block內(nèi)有4x9=36個(gè)特征,相鄰的block之間重疊一個(gè)cell的寬度,即步長(zhǎng)為4像素。圖5WPD-HOG金字塔特征提取的流程圖本文提出的WPD-HOG金字塔特征提取示例如下:首先對(duì)該圖像進(jìn)行小波包分解后得到尺寸為32x40的四幅子圖像,棄除三幅高頻子圖像,然后對(duì)低頻子圖像進(jìn)行二級(jí)金字塔分解,得到尺寸分別為32x40、16x20、8x10的三層金字塔圖像,接著對(duì)每層圖像進(jìn)行HOG特征提取。對(duì)于尺寸為32x40的圖像,水平方向?qū)⒂?32/4)-1=7個(gè)掃描窗口,垂直方向?qū)⒂?40/4)-1=9個(gè)掃描窗口,即一幅圖像有7x9個(gè)block,一共得到36x7x9維的特征。同理,三層金字塔圖像得到維數(shù)分別為36x7x9、36x3x4、36x1x1的特征,最后將三層圖片的特征串聯(lián)得到維數(shù)為36x7x9+36x3x4+36x1x1=2736的WPD-HOG金字塔特征。傳統(tǒng)的HOG特征提取方法,遍歷整張人臉圖片提取局部特征信息,實(shí)現(xiàn)的是圖像的單尺度表達(dá)。此外,其中包含了很多不利于識(shí)別人臉的冗余信息,如果不對(duì)人臉信息進(jìn)行篩選,大量的特征信息對(duì)識(shí)別率造成影響的同時(shí),也大大增加了計(jì)算復(fù)雜度。例如,同樣對(duì)一張64x80的人臉圖片提取HOG特征,則總共有36x15x19=10260維的特征。可見(jiàn),僅僅單尺度地描述一張圖片的局部特征就需要上萬(wàn)的特征維數(shù),大大增加了計(jì)算復(fù)雜度,同時(shí)提取到的特征也不能完整地表達(dá)整個(gè)人臉的信息。對(duì)比可知,本文提取的WPD-HOG金字塔特征維數(shù)遠(yuǎn)遠(yuǎn)低于傳統(tǒng)的HOG特征,計(jì)算量大大減少;而且本文提取的人臉特征相比較傳統(tǒng)的HOG特征,不僅包含局部特征,還包含全局特征,多尺度地表達(dá)了人臉信息,使得人臉信息更全面。3.2基于WPD-HOG金字塔特征的人臉識(shí)別本文提出的WPD-HOG金字塔特征用于人臉識(shí)別的實(shí)現(xiàn)步驟如下:(1)對(duì)人臉圖像進(jìn)行預(yù)處理,將圖像尺寸統(tǒng)一縮小為64x80。采取db1小波基對(duì)人臉圖像進(jìn)行小波包分解。對(duì)小波包分解得到的低頻子圖像A進(jìn)行金字塔分解。金字塔層數(shù)的選取:低頻子圖像A尺寸為32x40,對(duì)其進(jìn)行第三級(jí)分解即為A圖像尺寸的1/64,尺寸過(guò)小無(wú)實(shí)際意義,故本文選取二級(jí)分解,從而構(gòu)成三層金字塔,包括A圖、1/4A圖、1/16A圖。(4)對(duì)金字塔中的A圖、1/4A圖、1/16A圖這三層圖像分別提取HOG特征。提取HOG特征的參數(shù)選?。篶ell為4x4;當(dāng)block過(guò)大時(shí),對(duì)局部圖像的適應(yīng)性變差;當(dāng)block過(guò)小時(shí),有價(jià)值的空間信息減少,本文令一個(gè)block內(nèi)包含2x2個(gè)cell;相鄰的block和block之間重疊4個(gè)像素的長(zhǎng)度,各個(gè)block之間有重疊,可以避免將一個(gè)連續(xù)的特征切割開(kāi),從而能更有效地表示HOG特征;方向角選取的是unsigned的0。~180。;bin的個(gè)數(shù)k取9;高斯核函數(shù)參數(shù)(5)將A圖、1/4A圖、1/16A圖提取到的特征首尾串聯(lián),形成WPD-HOG金字塔特征。(6)對(duì)所有人臉圖片樣本提取WPD-HOG金字塔特征,把提取到的特征分為訓(xùn)練集和測(cè)試集。然后,將訓(xùn)練集通過(guò)SVM訓(xùn)練得到分類(lèi)器模型,再將測(cè)試集通過(guò)分類(lèi)器模型得到最終的人臉?lè)诸?lèi)結(jié)果。4實(shí)驗(yàn)與結(jié)果分析4.1實(shí)驗(yàn)環(huán)境與人臉庫(kù)介紹為了驗(yàn)證本文提出的人臉特征識(shí)別方法的可行性,采用ORL人臉庫(kù)進(jìn)行仿真實(shí)驗(yàn),仿真實(shí)驗(yàn)環(huán)境為Intel?CoreTMi5-2520MCPU,6GB內(nèi)存,Win7操作系統(tǒng),MatlabR2015b軟件。ORL人臉庫(kù)包括40個(gè)不同年齡、不同性別和不同種族的對(duì)象。每人10幅圖像,共計(jì)400幅灰度圖像,圖像灰度級(jí)為256,圖像尺寸為92x112。ORL人臉庫(kù)包括表情、面部飾物、光照、姿態(tài)的差別,而且人臉尺寸也有20%以?xún)?nèi)的變化,部分樣本圖像如圖6所示。該庫(kù)是目前使用最廣泛的標(biāo)準(zhǔn)人臉數(shù)據(jù)庫(kù)。本文實(shí)驗(yàn)選取ORL人臉庫(kù)中的每人6張圖片作為訓(xùn)練集,其余4張圖片作為測(cè)試集,因此訓(xùn)練集共含240個(gè)樣本,測(cè)試集共含160個(gè)樣本。4.2實(shí)驗(yàn)設(shè)計(jì)將本文方法分別與下述四種方法做對(duì)比實(shí)驗(yàn),進(jìn)行人臉特征提取方法有效性實(shí)驗(yàn)以及噪聲魯棒性實(shí)驗(yàn)。(1) HOG:對(duì)人臉圖像進(jìn)行文獻(xiàn)[6]提出的傳統(tǒng)的HOG特征提取。圖6ORL人臉庫(kù)部分樣本圖(2) HOG金字塔:將文獻(xiàn)[11]提出的HOG+圖像金字塔的人臉識(shí)別方法作為對(duì)比實(shí)驗(yàn),首先對(duì)圖像構(gòu)建圖像金字塔,然后對(duì)金字塔中每層圖像提取HOG特征,將各層特征首尾串聯(lián)形成HOG金字塔。(3) FWPD-HOG:為驗(yàn)證所提出方法有效性,本文進(jìn)一步提出了一種WPD與HOG特征相結(jié)合的FWPDHOG的人臉特征提取方法,作為對(duì)比實(shí)驗(yàn)。該方法首先對(duì)人臉圖像進(jìn)行小波包分解,得到四幅子圖像,然后按照式(6)對(duì)四幅子圖像進(jìn)行加權(quán)融合,最后對(duì)融合(fusion)后得到的圖片Img進(jìn)行HOG特征的提取,最終形成FWPD-HOG特征。(4) FWPD-HOG金字塔:由于本文對(duì)圖像進(jìn)行WPD后,棄除了高頻子圖像,為進(jìn)一步對(duì)比驗(yàn)證僅利用低頻子圖像就可以獲得較好的識(shí)別效果,本文同樣按照式(6)將低頻和高頻子圖像加權(quán)融合,對(duì)融合后的圖片Img構(gòu)建圖像金字塔,然后對(duì)金字塔的每層圖像提取HOG特征,形成FWPD-HOG金字塔特征。其中,HOG和FWPD-HOG是對(duì)圖像的單尺度表達(dá);HOG金字塔、FWPD-HOG金字塔和本文提出的WPDHOG金字塔特征提取方法都采用一系列分辨率不同的表達(dá)來(lái)實(shí)現(xiàn)圖像的多尺度表達(dá)。多尺度表達(dá)使全局特征和局部特征相結(jié)合,比單尺度表達(dá)的特征更完備。4.3實(shí)驗(yàn)結(jié)果分析此處評(píng)價(jià)指標(biāo)選用特征維數(shù)、特征提取時(shí)間、分類(lèi)時(shí)間以及識(shí)別率,來(lái)驗(yàn)證本文人臉特征提取方法的有效性以及噪聲魯棒性。識(shí)別率的計(jì)算公式如式(7)所示:其中,r表示人臉識(shí)別的識(shí)別率;m表示人臉測(cè)試集中所有的樣本圖像個(gè)數(shù),本實(shí)驗(yàn)中m=160;n表示對(duì)測(cè)試集中圖像進(jìn)行人臉特征提取后,進(jìn)一步采用SVM分類(lèi)器分類(lèi)后,分類(lèi)正確的樣本個(gè)數(shù)。4.3.1人臉特征提取方法有效性實(shí)驗(yàn)本文方法與其他四種人臉識(shí)別方法的實(shí)驗(yàn)結(jié)果對(duì)比如表1所示。表1本文人臉特征提取方法與對(duì)比方法性能比較方法HOGHOG金字塔FWPD-HOGFWPD-HOG金字塔本文方法特征維數(shù)1026012960226827362736特征提取時(shí)間/s36.9345.7811.9312.5512.17分類(lèi)時(shí)間/s8.429.771.732.031.99r/%77.50080.00084.37588.12588.125從表1可以看出,本文方法得到的識(shí)別率是88.125%,較對(duì)比方法超出4%~11%。由此可知,本文方法的識(shí)別準(zhǔn)確率要優(yōu)于其他三種人臉識(shí)別方法,并與FWPDHOG金字塔的識(shí)別率持平。其識(shí)別率得到提高的理論機(jī)理如下:(1)單尺度的HOG和FWPD-HOG都只是提取圖像的局部特征,而本文方法構(gòu)建的WPD-HOG金字塔特征,對(duì)圖片進(jìn)行了多尺度的表達(dá),將全局特征和局部特征相結(jié)合,具有較強(qiáng)的人臉圖像描述能力,能夠提取到更加豐富的特征信息;(2)與HOG金字塔方法相比,本文方法首先用WPD對(duì)圖片進(jìn)行了預(yù)處理,去除了容易受噪聲、光照、表情影響的圖像信息,使得特征表達(dá)更為緊湊。此外,本文方法與FWPD-HOG金字塔方法識(shí)別率相同,說(shuō)明FWPD-HOG金字塔保留的高頻細(xì)節(jié)信息對(duì)識(shí)別率并沒(méi)有起到提高的作用。因此,本文方法在特征表達(dá)和識(shí)別效果方面要優(yōu)于對(duì)比方法。進(jìn)一步分析實(shí)驗(yàn)結(jié)果可知:(1)本文方法的特征維數(shù)是2736,遠(yuǎn)遠(yuǎn)少于HOG方法的10260維以及HOG金字塔的12960維;特征維數(shù)的減少,使得本文方法所用特征提取時(shí)間和分類(lèi)時(shí)間僅僅是HOG方法的1/3,HOG金字塔方法的1/4。這是因?yàn)楸疚姆椒ú捎肳PD,使得圖像大小縮小為原來(lái)的1/4,在特征提取時(shí)起到降維的作用,大大降低了計(jì)算復(fù)雜度。(2)由于本文方法使用圖像金字塔對(duì)圖像進(jìn)行了多尺度表達(dá),故特征維數(shù)要略大于單尺度的FWPD-HOG,以致特征提取時(shí)間和分類(lèi)時(shí)間都相對(duì)增加,但相差不大。(3)與FWPD-HOG金字塔相比,特征維數(shù)相同,本文方法特征提取時(shí)間和分類(lèi)時(shí)間略少一點(diǎn),說(shuō)明FWPD-HOG金字塔保留的高頻細(xì)節(jié)信息不僅對(duì)識(shí)別率沒(méi)有提高,在計(jì)算復(fù)雜度上也沒(méi)有改善。綜合上述結(jié)果表明,與對(duì)比方法相比,驗(yàn)證了本文方法的合理性與有效性。本文方法不僅保證了特征完備,提高了識(shí)別效果,而且特征維數(shù)大大減少,從而降低了計(jì)算復(fù)雜度,進(jìn)一步節(jié)省了特征提取時(shí)間和分類(lèi)時(shí)間。4.3.2噪聲魯棒性實(shí)驗(yàn)為驗(yàn)證幾種人臉識(shí)別方法在噪聲方面的魯棒性,本實(shí)驗(yàn)在ORL人臉圖像上分別加入強(qiáng)度d為0.1的椒鹽噪聲,以及均值為0、方差。2為0.01和0.1的高斯白噪聲,然后再進(jìn)行后續(xù)人臉識(shí)別。噪聲攻擊圖像如圖7所示。圖7噪聲攻擊圖像針對(duì)四種人臉識(shí)別方法在椒鹽噪聲的攻擊下,分別進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表2所示。在高斯噪聲的攻擊下進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖8所示。從表2可以很直觀(guān)地看出,本文提出的面向人臉識(shí)別的WPD-HOG金字塔特征提取方法在椒鹽噪聲攻擊下識(shí)別率要高出其他四種方法2%~10%。根據(jù)圖8的實(shí)驗(yàn)結(jié)果可知,當(dāng)高斯噪聲方差。2為0.01時(shí),本文方法得到的識(shí)別率高出對(duì)比方法1%~13%;當(dāng)方差。2為0.1時(shí),本文方法得到的識(shí)別率高出對(duì)比方法6%~44%。原因分析如下:(1)與HOG方法和HOG金字塔方法相比,本文方法采用了有去噪作用的WPD對(duì)人臉圖像進(jìn)行處理,大大提高了特征的抗噪性能;(2)將FWPD-HOG方法與FWPD-HOG金字塔方法相比,后者的識(shí)別率要更高一些,說(shuō)明圖像金字塔的多尺度表達(dá)特性增強(qiáng)了特征對(duì)噪聲的抗干擾能力;(3)相比較于FWPD-HOG金字土苔方法,本文方法對(duì)圖像進(jìn)行WPD后,棄除了易受噪聲影響的高頻子圖像,因此在噪聲攻擊情況下依然有較高的識(shí)別率。由此可知,本文方法的噪聲魯棒性要強(qiáng)于對(duì)比方法,且當(dāng)噪聲的隨機(jī)性增大時(shí),本文方法的抗噪效果更加顯著。表2椒鹽噪聲攻擊下本文方法與對(duì)比方法識(shí)別率比較強(qiáng)度0.1方法HOGHOG金字塔FWPD-HOGFWPD-HOG金字塔本文方法r/%73.37581.75075.00081.25083.125圖8高斯噪聲攻擊下本文方法與對(duì)比方法的識(shí)別率比較5結(jié)束語(yǔ)本文提出了一種結(jié)合WPD、圖像金字塔和HOG特征的WPD-HOG金字塔特征提取方法,以對(duì)人臉圖像進(jìn)行有效表示。在ORL人臉庫(kù)上的實(shí)驗(yàn)表明,本文人臉特征提取方法將局部特征和全局特征相結(jié)合,實(shí)現(xiàn)了圖像的多尺度表達(dá),有效增強(qiáng)了圖像特征的表達(dá)能力,從而使識(shí)別率得到了有效提高,且降低了特征提取的計(jì)算復(fù)雜度。同時(shí),所提出的特征提取方法,在不同噪聲攻擊環(huán)境下,較其他對(duì)比方法都具有較高的識(shí)別效果,體現(xiàn)了較強(qiáng)的噪聲魯棒性。近年來(lái),隨著網(wǎng)絡(luò)的發(fā)展,網(wǎng)絡(luò)圖像數(shù)據(jù)量劇增,面對(duì)海量的人臉數(shù)據(jù)庫(kù),如何高效地進(jìn)行人臉特征提取及識(shí)別將是進(jìn)一步的研究方向?!鞠嚓P(guān)文獻(xiàn)】楊浩,張二喜,蔣卓蕓.基于距離測(cè)度的PCA人臉識(shí)別研究[J].陜西理工學(xué)院學(xué)報(bào)(自科版),2016,32(4):45-50.GhassabehYA,RudziczF,MoghaddamHA.FastincrementalLDAfeatureextraction[J].PatternRecognition,2015,48(6):1999-2012.DeA,SahaA,PalMC.Ahumanfacialexpressionrecognitionmodelbasedoneigenfaceapproach[J].ProcediaComputerScience,2015,45:282-289.JiaM,ZhangZ,SongP,etal.ResearchofimprovedalgorithmbasedonLBPforfacerecognition[J].LectureNotesinComputerScience,2014,8833:111-119.KarthikaR,ParameswaranL.StudyofGaborwaveletforfacerecognitioninvaria

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論