下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 廣義主分量分析及其在人臉識(shí)別中的應(yīng)用 郭 娟1,戚文芽1,岳 峰2 時(shí)間:2008年05月06日 字 體: 大 中 小 關(guān)鍵詞: 摘要:關(guān)鍵詞: 廣義主分量分析 主分量分析 特征抽取 人臉識(shí)別近年來,數(shù)字視頻監(jiān)控在各行各業(yè)
2、得到了廣泛應(yīng)用,如軍事上、小區(qū)和樓宇安全監(jiān)控、銀行證券系統(tǒng)、林業(yè)部門火情監(jiān)控、交通違章和流量監(jiān)控等。視頻監(jiān)控系統(tǒng)對被監(jiān)控目標(biāo)的自動(dòng)識(shí)別,給監(jiān)控部門提供了更多的信息保障,降低了犯罪率,并節(jié)省了人力和物力。人臉識(shí)別技術(shù)就是通過計(jì)算機(jī)分析人臉圖像,從中提取有效的識(shí)別信息,從而辨認(rèn)身份的一種技術(shù)。它是一種非侵犯式的主動(dòng)識(shí)別,易為廣大人群所接受。人臉識(shí)別不僅在視頻監(jiān)控方面,在其他諸如安全驗(yàn)證系統(tǒng)、信用卡驗(yàn)證、視頻會(huì)議、人機(jī)交互等方面都具有十分廣闊的應(yīng)用前景。人臉識(shí)別的方法很多,主分量分析PCA(也稱K-L變換)是特征抽取最為經(jīng)典的方法之一,目前仍被廣泛地應(yīng)用在人臉等圖像識(shí)別領(lǐng)域123代數(shù)特征抽取的新思路
3、,直接利用圖像矩陣構(gòu)造圖像散布矩陣,實(shí)現(xiàn)了基于兩種圖像矩陣的廣義主分量分析方法。該方法簡單易行,不僅在識(shí)別性能上優(yōu)于Eigenfaces4和Fisherfaces5方法,其突出特點(diǎn)是特征抽取的速度大大加快,從根本上克服了傳統(tǒng)PCA耗時(shí)過多的弱點(diǎn),滿足了視頻監(jiān)控系統(tǒng)中自動(dòng)人臉識(shí)別實(shí)時(shí)性的需求。1 經(jīng)典的主分量分析PCA技術(shù)最早由Sirovich和Kirby引入人臉識(shí)別領(lǐng)域,其主要思想是降維,以Turk和Pentland的Eigenfaces方法最具代表性6,該方法的具體過程如下:設(shè)人臉灰度圖像的分辨率為m×n,則該圖像構(gòu)成一個(gè)m×n的圖像矩陣A。首先將圖像矩陣A轉(zhuǎn)化為N=m&
4、#215;n維的圖像向量x,根據(jù)訓(xùn)練樣本集構(gòu)造N×N的總體散布矩陣St:St=E(x-Ex)(x-Ex)T(1)選取一組標(biāo)準(zhǔn)正交且使得準(zhǔn)則函數(shù)式(2)達(dá)到極值的向量1,dt()=TSt (T=1)? (2)由于準(zhǔn)則函數(shù)式(2)等價(jià)于式(3)即為矩陣St的Rayleigh商。由Rayleigh商的極值性質(zhì)7,最優(yōu)投影軸1,d可取為St的d個(gè)最大特征值所對應(yīng)的標(biāo)準(zhǔn)正交的特征向量。2 廣義主分量分析2.1 基于圖像總體散布矩陣的主分量分析設(shè)X表示n維列向量,基于圖像矩陣的PCA就是將m×n的圖像矩陣A通過線性變換Y=AX直接投影到X上,得到一個(gè)m維列向量Y,稱為圖像A的投影特征向
5、量。決定最優(yōu)投影軸X最直觀的辦法是通過投影特征向量Y的散布情況來決定投影方向X。通常采用以下準(zhǔn)則:Jt(X)=tr(MTx)(4)其中,MTx表示投影特征Y的總體散布矩陣,tr表示取矩陣的跡。最大化準(zhǔn)則(4)式的直觀意義是:尋找這樣的投影方向X,使投影后所得特征向量的總體散布量最大。稱(9)式為廣義總體散布量準(zhǔn)則。最大化該準(zhǔn)則的單位向量X稱為最優(yōu)投影軸,其物理意義是,圖像矩陣在X軸上投影后所得的特征向量的總體分散程度最大。事實(shí)上,最優(yōu)投影軸即為圖像總體散布矩陣Mt的最大特征值所對應(yīng)的單位特征向量。在樣本類別數(shù)較多的情況下,單一的最優(yōu)投影方向是不夠的,需要尋找一組滿足標(biāo)準(zhǔn)正交條件且最大化準(zhǔn)則函數(shù)
6、(9)式的最優(yōu)投影軸X1,Xd。因此,準(zhǔn)則函數(shù)(9)式等價(jià)于:2.2 基于圖像類間散布矩陣的主分量分析上節(jié)的分析中,采用的是廣義總體散布量準(zhǔn)則,考慮到以樣本的可分性最好為目標(biāo),還可以在(4)式中采用另一準(zhǔn)則:Jb(X)=tr(MBx)(11)其中,MBx表示投影特征向量Y的類間散布矩陣,其物理意義是,圖像矩陣在X方向上投影后所得特征向量的類間分散程度最大。同前面的分析,首先給出MBx的估計(jì):相應(yīng)地,最優(yōu)投影軸為矩陣Mb的最大特征值所對應(yīng)的單位特征向量。同樣,考慮到需要抽取多個(gè)投影軸,準(zhǔn)則函數(shù)(14)式等價(jià)于下式:最優(yōu)投影軸X1,Xd即可取為Mb的d個(gè)最大特征值所對應(yīng)的標(biāo)準(zhǔn)正交的特征向量。2.3
7、 特征抽取設(shè)最優(yōu)圖像投影軸為X1,Xd,由Yk=AXk,k=1,2,d(17)得到一組投影特征向量Y1,Yd,稱為圖像A的主成分,可將其合并為一個(gè)m×d維的圖像A的整體投影特征向量B用于后面的分類識(shí)別。B=Y1,YdT=AX1,XdT=AP(18)其中,P=X1,XdT。2.4 分類3 試驗(yàn)與分析ORL人臉庫由40人、每人10幅112×92的圖像組成,其中有些圖像拍攝于不同的時(shí)期;人臉表情與臉部細(xì)節(jié)有著不同程度的變化,如笑或不笑、眼睛睜或閉、戴或不戴眼鏡;人臉姿態(tài)也有相當(dāng)程度的變化,深度旋轉(zhuǎn)與平面旋轉(zhuǎn)可達(dá)20°;人臉的尺度也有多達(dá)10%的變化。圖1是ORL人臉庫中
8、某一人的5幅圖像。本試驗(yàn)中,以每人的前5幅圖像作為訓(xùn)練樣本,后5幅作為測試樣本,這樣訓(xùn)練樣本和測試樣本的總數(shù)均為200,屬于典型的高維小樣本識(shí)別問題。分別構(gòu)造圖像總體散布矩陣Mt和圖像類間散布矩陣Mb,并分別計(jì)算其前10個(gè)最大特征值所對應(yīng)的標(biāo)準(zhǔn)正交特征向量X1,X10,選取其中的1到10作為投影軸進(jìn)行(18)式的特征抽取。在此,人臉灰度圖像是112×92矩陣,若取k個(gè)投影軸,則所得整體投影特征向量的維數(shù)是112×k。試驗(yàn)1:在每個(gè)投影空間內(nèi),對兩種基于圖像矩陣(圖像總體散布矩陣Mt和圖像類間散布矩陣Mb)的主分量分析分別采用最小距離分類器和最近鄰分類器進(jìn)行分類,識(shí)別率見表1
9、。試驗(yàn)2:比較了本文兩種基于圖像矩陣的主分量分析方法與經(jīng)典的Eigenfaces、Fisherfaces方法在最近鄰分類器下的識(shí)別率,結(jié)果見表2。試驗(yàn)3:比較了上面四種方法在取得最佳識(shí)別率時(shí)的特征抽取和識(shí)別時(shí)間,結(jié)果見表3。由表1、表2可見,兩種基于圖像矩陣的主分量分析方法在兩類分類器下的識(shí)別率相差不大,其性能都優(yōu)于Eigenfaces和Fisherfaces方法。由表3可見,在時(shí)間方面,基于圖像類間散布矩陣Mb的主分量分析的特征抽取速度最快,是Eigenfaces、Fisherfaces方法的近26倍。這是因?yàn)樵诨贛b的主分量分析中,Mb是92階的,而在Eigenfaces和Fisherf
10、aces方法中需處理112×9210 304階的總體散布矩陣,盡管利用奇異值定理可加速總體散布矩陣的特征向量的求解速度,但計(jì)算量仍很大,因此耗時(shí)過多。本文結(jié)合視頻監(jiān)控系統(tǒng)中人臉識(shí)別實(shí)時(shí)性的需求,實(shí)現(xiàn)了兩種基于圖像矩陣的廣義主分量分析的人臉識(shí)別方法。與傳統(tǒng)主分量分析處理圖像識(shí)別問題不同,該方法不需要事先將圖像矩陣轉(zhuǎn)化為圖像向量,而是直接利用圖像矩陣本身構(gòu)造形如(8)式和(15)式所示的圖像散布矩陣,然后取它的d個(gè)最大特征值所對應(yīng)的標(biāo)準(zhǔn)正交的特征向量作為投影軸即可。實(shí)驗(yàn)結(jié)果表明,該方法不僅在識(shí)別性能上優(yōu)于經(jīng)典的Eigenfaces和Fisherfaces方法,最突出的優(yōu)點(diǎn)是大幅度地降低了
11、計(jì)算量,使特征抽取的速度提高了一個(gè)數(shù)量級,且方法簡單易行,適于實(shí)時(shí)視頻監(jiān)控系統(tǒng)的應(yīng)用。參考文獻(xiàn)1 Pentland A.Looking at people:Sensing for ubiquitous and wearable computingJ.IEEE Transactions on Pattern Analysis And Machine Intelligence,2000;22(1):1071092 Grudin M A.On internal representations in face recognition systemsJ.Pattern Recognition,2000;
12、33(7):116111773 Liu K,Cheng Y Q,Yang J Y.Algebraic feature extraction for image recognition based on an optimal discriminant criterionJ.Pattern Recognition,1993;26(6):9039114 Turk M,Pentland A.Face recognition using eigenfacesA.In: Proceedings IEEE conference on computer vision and pattern recognitionC,Hawaii,1991:5865915 Belhumeur P N,Hespanha J P,Kriengmam D J.Eigenfaces vs.Fisherfaces:Recognition using class specific linear projec
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度米面產(chǎn)品冷鏈物流配送服務(wù)合同4篇
- 2025年度模特影視廣告模特聘用合同協(xié)議
- 二零二五年度奶牛養(yǎng)殖信息化管理系統(tǒng)采購合同4篇
- 2025年度藝術(shù)品抵押貸款服務(wù)合同
- 杯間乾坤酒中情懷中國傳統(tǒng)文化之酒文化講解
- 2025年度個(gè)人房產(chǎn)托管服務(wù)合同范本2篇
- 上海國資國企創(chuàng)新基地2024年度區(qū)塊鏈創(chuàng)新應(yīng)用白皮書
- 二零二五年度環(huán)保污染治理設(shè)施運(yùn)營合同4篇
- 二零二五年度房地產(chǎn)項(xiàng)目營銷策劃合同
- 課題申報(bào)參考:農(nóng)村婦女土地權(quán)益特殊保障制度研究-基于浙江、四川、貴州12區(qū)縣的實(shí)證分析
- GB/T 16895.3-2024低壓電氣裝置第5-54部分:電氣設(shè)備的選擇和安裝接地配置和保護(hù)導(dǎo)體
- 安徽省合肥市2025年高三第一次教學(xué)質(zhì)量檢測地理試題(含答案)
- 計(jì)劃合同部部長述職報(bào)告范文
- 風(fēng)光儲(chǔ)儲(chǔ)能項(xiàng)目PCS艙、電池艙吊裝方案
- 人教版高一地理必修一期末試卷
- GJB9001C質(zhì)量管理體系要求-培訓(xùn)專題培訓(xùn)課件
- 二手車車主寄售協(xié)議書范文范本
- 窗簾采購?fù)稑?biāo)方案(技術(shù)方案)
- 基于學(xué)習(xí)任務(wù)群的小學(xué)語文單元整體教學(xué)設(shè)計(jì)策略的探究
- 高中英語原版小說整書閱讀指導(dǎo)《奇跡男孩》(wonder)-Part one 講義
- GB/T 9755-2001合成樹脂乳液外墻涂料
評論
0/150
提交評論