




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上計(jì)算機(jī)視覺基礎(chǔ)期末大作業(yè) 題目:基于matlab的人臉識(shí)別系統(tǒng)設(shè)計(jì) 物聯(lián)網(wǎng)工程 學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù) 專業(yè)學(xué) 號(hào) 學(xué)生姓名 任課教師 二一六年六月專心-專注-專業(yè)目錄 摘要 人臉識(shí)別系統(tǒng)以人臉識(shí)別技術(shù)為核心,是一項(xiàng)新興的生物識(shí)別技術(shù),是當(dāng)今國(guó)際科技領(lǐng)域攻關(guān)的高精尖技術(shù)。這次設(shè)計(jì)主要是完成了基于主成分分析(PCA)方法的人臉識(shí)別,PCA方法的基本原理是:利用離散K-L變換提取人臉的主要成分,構(gòu)成特征臉空間,識(shí)別時(shí)把測(cè)試樣本投影到該空間,構(gòu)成一組投影系數(shù),通過與特征臉的距離比較,距離最小的特征臉對(duì)應(yīng)的即是識(shí)別結(jié)果。基于PCA的人臉識(shí)別其實(shí)一種統(tǒng)計(jì)性的模板比配方法,原理簡(jiǎn)
2、單,易于實(shí)現(xiàn),但也有不足,它的識(shí)別率會(huì)隨著關(guān)照,人臉角度,訓(xùn)練樣本集的數(shù)量而變換,但仍不失為一種比較好的方法。關(guān)鍵詞:人臉識(shí)別、PCA、特征提取1.概述1.1 人臉識(shí)別技術(shù) 人臉識(shí)別技術(shù)是采用某種技術(shù)和手段對(duì)人的身份進(jìn)行標(biāo)識(shí),從而依據(jù)該標(biāo)識(shí)對(duì)人進(jìn)行身份識(shí)別,以達(dá)到監(jiān)督、管理和識(shí)別目的的一種技術(shù)。近年來由于在公安罪犯識(shí)別、安全驗(yàn)證、安全驗(yàn)證系統(tǒng)、信用卡驗(yàn)證等方面的巨大應(yīng)用前景而越來越成為當(dāng)前模式識(shí)別和人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。 人臉識(shí)別基本上可分為兩個(gè)方面:一是給定一幅待識(shí)別人臉圖像,判別它是否是某人,即通常所說的身份驗(yàn)證,這是個(gè)“一對(duì)一”的兩分類問題;另一個(gè)是給定一幅待識(shí)別人臉圖像,判斷它是
3、誰,即通常所說的身份識(shí)別,這是一個(gè)一對(duì)多的問題 基于人臉圖像整體特征的人臉識(shí)別方法由于不需要提取人臉圖像中器官的具體信息,而且充分利用到人臉圖像本身具有的灰度信息,因此可獲得更高的識(shí)別性能。基于人臉圖像整體特征的人臉識(shí)別方法主要有特征臉法,最佳鑒別矢量集法,貝葉斯法,基于傅立葉變換特征法,彈性圖匹配法,相關(guān)方法,線性子空間法,可變形模型法和基于人工神經(jīng)網(wǎng)絡(luò)的方法等等。其中彈性圖匹配法和傅里葉不變特征法側(cè)重于表述人臉圖像;最佳鑒別矢量集法,貝葉斯法,基于人工神經(jīng)網(wǎng)絡(luò)的方法側(cè)重于分類;特征臉法和線性子空間法等側(cè)重于人臉圖像的重構(gòu)。1.2人臉識(shí)別基本方法1.2.1幾何特征的人臉識(shí)別幾何特征可以是眼、
4、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識(shí)別速度快,需要的內(nèi)存小,但識(shí)別率較低。 1.2.2基于特征臉(PCA)的人臉識(shí)別特征臉方法是基于KL變換的人臉識(shí)別方法,KL變換是圖像壓縮的一種最優(yōu)正交變換。的圖像空間經(jīng)過KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識(shí)別的特征矢量,這就是特征臉方法的基本思想。這些方法需要較多的訓(xùn)練樣本,而且完全是基于圖像灰度的統(tǒng)計(jì)特性的。目前有一些改進(jìn)型的特征臉方法,也是本文所要講述的的方法。1.2.3神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別神經(jīng)網(wǎng)絡(luò)的輸入可以是降低
5、分辨率的人臉圖像、局部區(qū)域的自相關(guān)函數(shù)、局部紋理的二階矩等。這類方法同樣需要較多的樣本進(jìn)行訓(xùn)練,而在許多應(yīng)用中,樣本數(shù)量是很有限的。 1.3人臉識(shí)別新技術(shù) 傳統(tǒng)的主要是基于可見光圖像的人臉識(shí)別,這也是人們最熟悉的識(shí)別方式,已有30多年的研發(fā)歷史。但這種方式有著難以克服的缺陷,尤其在環(huán)境光照發(fā)生變化時(shí),識(shí)別效果會(huì)急劇下降,無法滿足實(shí)際系統(tǒng)的需要。解決光照問題的方案有三維圖像人臉識(shí)別,和熱成像人臉識(shí)別。但目前這兩種技術(shù)還遠(yuǎn)不成熟,識(shí)別效果不盡人意。 最近迅速發(fā)展起來的一種解決方案是基于主動(dòng)近紅外圖像的多光源人臉識(shí)別技術(shù)。它可以克服光線變化的影響,已經(jīng)取得了卓越的識(shí)別性能,在精度、穩(wěn)定性和速度方面的
6、整體系統(tǒng)性能超過三維圖像人臉識(shí)別。這項(xiàng)技術(shù)在近兩三年發(fā)展迅速,使人臉識(shí)別技術(shù)逐漸走向?qū)嵱没?2.人臉識(shí)別功能的實(shí)現(xiàn)2.1 PCA方法基本原理設(shè)人臉圖像為二維灰度圖像,用維列向量表示。人臉圖像訓(xùn)練集為,其中為訓(xùn)練集中圖像總數(shù)。根據(jù)訓(xùn)練集構(gòu)造總體散布矩陣:其中為所有訓(xùn)練樣本的平均向量:選取一組標(biāo)準(zhǔn)正交且使得準(zhǔn)則函數(shù)式(3.3)達(dá)到極值的向量作為投影軸,其物理意義是使投影后所得特征的總體散布量(類間散布量與類內(nèi)散布量之和)最大。 其等價(jià)于:上式即為矩陣的Rayleig熵,由Rayleigh熵7的極值性質(zhì),最優(yōu)投影軸可取為的個(gè)最大的特征值所對(duì)應(yīng)的標(biāo)準(zhǔn)正交的特征向量。對(duì)于人臉圖像,總體散布矩陣的大小為
7、,對(duì)它求解特征值和特征向量是很困難的,由奇異值定理,一種取而代之的方法是解個(gè)較小的矩陣。首先計(jì)算矩陣的特征向量:、矩陣的特征向量:由差值圖像與線性組合得到取的前個(gè)最大特征值的特征向量計(jì)算特征臉,由門限值確定:2.2 基于主成分分析法的人臉識(shí)別完整的PCA人臉識(shí)別的應(yīng)用包括四個(gè)步驟:人臉圖像的預(yù)處理;讀入人臉庫(kù),訓(xùn)練形成特征臉空間;把訓(xùn)練樣本和測(cè)試樣本投影到特征臉空間中;選擇一個(gè)距離函數(shù)按照某種規(guī)則進(jìn)行識(shí)別。下面看一下詳細(xì)的過程:2.2.1 讀入人臉庫(kù) 這次設(shè)計(jì)中選用英國(guó)劍橋大學(xué)人臉庫(kù)即ORL人臉庫(kù),此人臉數(shù)據(jù)庫(kù)有40人,每人有10幅圖像。這些圖像具有以下特點(diǎn):有些圖像拍攝于不同的時(shí)期;人的臉部
8、表情和臉部細(xì)節(jié)有著不同程度的變化,比如,笑或不笑,眼睛或睜或閉,戴或不戴眼鏡;人臉姿態(tài)也有相當(dāng)程度的變化,深度旋轉(zhuǎn)和平面旋轉(zhuǎn)可達(dá)20。;人臉的尺度也有多達(dá)10%的變化;圖像的分辨率是 112x92。在ORL人臉庫(kù)中選出每個(gè)人的前5幅圖像作為訓(xùn)練圖像,構(gòu)成一個(gè)200幅圖像的訓(xùn)練集,剩下的200幅圖像構(gòu)成測(cè)試集。每幅圖像按列相連構(gòu)成10304維列向量,讀入的訓(xùn)練樣本集就構(gòu)成10304×200的矩陣。2.2.2 計(jì)算K-L變換的生成矩陣以訓(xùn)練樣本集的總體散布矩陣為生成矩陣,即:其中為第幅訓(xùn)練樣本的圖像向量,為訓(xùn)練樣本集的均值向量,訓(xùn)練樣本的總數(shù)為200。為了求的生成矩陣的特征值和正交歸一化
9、特征向量,由于矩陣維數(shù)過高,計(jì)算量太大,可以引進(jìn)奇異值分解定理(SVD定理)。圖2.1 平均臉2.2.3 求解特征值和特征向量 SVD定理的定義:若矩陣,則存在正交矩陣,使得,即,則稱為奇異值分解。其中,為的奇異值,是或的特征值的平方根,即。 奇異值向量具有良好的穩(wěn)定性,所以它對(duì)圖像噪音、圖像光照條件引起的灰度變化具有不敏感的特性。計(jì)算特征值和特征向量的基本步驟是:(1)創(chuàng)建協(xié)方差矩陣;(2)計(jì)算協(xié)方差矩陣的特征值和 特征向量;(3)按特征值由小到大順序排列特征值和特征向量。 這些特征向量對(duì)應(yīng)的圖像很像人臉,所以被稱為“特征臉”。有了這樣一個(gè)由“特征臉”組成的降維子空間,任何一幅圖像都可以向其
10、投影并獲得一組坐標(biāo)系數(shù),這組坐標(biāo)系數(shù)表明了該圖像在“特征臉”子空間的位置,從而可以作為人臉識(shí)別的依據(jù)。 選擇了其中30個(gè)特征臉如下圖所示圖2.2 特征臉2.2.4 樣本投影與識(shí)別得到特征臉子空間以后,就要把訓(xùn)練樣本和測(cè)試樣本都投影到特征臉子空間,每幅圖像得到一組坐標(biāo)系數(shù),對(duì)應(yīng)子空間中的一個(gè)點(diǎn)。任何一幅圖像都可以有這組特征臉線性組合,加權(quán)系數(shù)就是K-L變換的系數(shù)。2.3 基于PCA算法人臉識(shí)別的matlab實(shí)現(xiàn)用matlab語(yǔ)言仿真PCA算法的人臉識(shí)別,分為以下幾個(gè)步驟:2.3.1 讀取人臉庫(kù)allsamples=; % allsample用于存儲(chǔ)讀取的人臉圖像矩陣for i=1:40 for
11、j=1:5 a=imread (strcat ('e: ORLs', num2str (i),'', num2str (j),'.pgm'); b=a (1:112*92); b=double (b); allsamples= allsamples; b; endEnd2.3.2 利用生成矩陣求特征值和特征向量samplemean=mean (allsamples);for i=1:200 xmean (i, :) =allsamples (i, :)-samplemean;endsigma=xmean*xmean'v d=eig (si
12、gma);2.3.3 選取閾值提取訓(xùn)練樣本特征 上面得到的200個(gè)特征向量,雖然已經(jīng)比較小了,但計(jì)算量還是比較大。其實(shí)不必要保留所有的特征向量,較大特征值對(duì)應(yīng)的特征向量已經(jīng)能夠提供足夠多的用于識(shí)別的特征。一般是通過計(jì)算閾值進(jìn)一步降低維數(shù),這種方法的具體做法是把特征向量和特征值從大到小排列,選取特征值占總特征值之和的比值大于一定值所對(duì)應(yīng)的特征向量。閾值一般是取0.9。計(jì)算公式是。但發(fā)現(xiàn)在這里取0.91更好,識(shí)別率更高一點(diǎn)。通過程序運(yùn)行可以發(fā)現(xiàn),閾值選擇為0.91時(shí)特征值個(gè)數(shù)減少為75個(gè),就是說很多特征值是很小的,數(shù)值小的特征值對(duì)應(yīng)的特征向量對(duì)識(shí)別只能提供很少的信息。所以通過閾值選擇,計(jì)算量減少了
13、很多。d1=diag (d);dsort=flipud (d1);vsort=fliplr (v);dsum=sum (dsort);dsum_extract=0;p=0;while (dsum_extract/dsum<0.91) p=p+1; dsum_extract=sum (dsort (1: p);endbase = xmean' * vsort(:,1:p) * diag(dsort(1:p).(-1/2);allcoor=allsamples*base;2.3.4 選取測(cè)試樣本進(jìn)行識(shí)別 測(cè)試樣本識(shí)別的過程就是把測(cè)試圖像投影到特征臉子空間,得到一組特征系數(shù),然后按照歐
14、式距離的最小近鄰法與訓(xùn)練樣本集投影得到的系數(shù)匹配,找到距離最小的樣本就是識(shí)別的結(jié)果。但為了克服單個(gè)樣本的偶然性,這里選擇最近的3個(gè)樣本,然后把待識(shí)別人臉判別為這3個(gè)樣本中同類樣本最多的那個(gè)類別。a=imread (strcat ('e: ORLs', num2str (i),'', num2str (j),'.pgm');b=a (1:10304);b=double (b);tcoor=b*base; for k=1:200 mdist (k)=norm(tcoor-allcoor(k,:);end;dist, index2=sort (mdis
15、t);class1=floor (index2 (1)-1)/5) +1;class2=floor (index2 (2)-1)/5) +1;class3=floor (index2 (3)-1)/5) +1;if class1=class2 && class2=class3 class=class1;elseif class1=class2 class=class1;elseif class2=class3 class=class2;end;2.4 人臉識(shí)別代碼clear allclcallsamples=; % the array allsamples is used to
16、 restore all picturesfor i=1:40 for j=1:7 a=imread(strcat('e:ORLs',num2str(i),'',num2str(j),'.pgm'); b=a(1:112*92); b=double(b); allsamples=allsamples;b; endendsamplemean=mean(allsamples); %average the picturesfor i=1:280 xmean(i,:)=allsamples(i,:)-samplemean;endsigma=xmean*x
17、mean' %obtain the M*M arrayv d=eig(sigma);%vproduces a diagonal matrix D of eigenvalues and a % full matrix V whose columns are the corresponding eigenvectors so %that X*V = V*D.d1=diag(d);%obtain the diagonal of the sigmadsort=flipud(d1);vsort=fliplr(v);dsum=sum(dsort);dsum_extract=0;p=0;while(
18、dsum_extract/dsum<0.90) p=p+1; dsum_extract=sum(dsort(1:p);endbase = xmean' * vsort(:,1:p) * diag(dsort(1:p).(-1/2);allcoor=allsamples*base;accu = 0; for i=1:40 for j=8:10 a=imread(strcat('e:ORLs',num2str(i),'',num2str(j),'.pgm'); b=a(1:10304); b=double(b); tcoor=b*bas
19、e; for k=1:280 mdist(k)=norm(tcoor-allcoor(k,:); end;dist,index2=sort(mdist); class1=floor( (index2(1)-1)/7)+1; class2=floor(index2(2)-1)/7)+1; class3=floor(index2(3)-1)/7)+1; if class1=class2 && class2=class3 class=class1; elseif class1=class2 class=class1; elseif class2=class3 class=class2
20、; end; if class=i accu=accu+1; end; end;end;accuracy=accu/120 2.5 實(shí)驗(yàn)結(jié)果及分析 對(duì)于ORL人臉庫(kù),選用每人前5幅圖像作為訓(xùn)練樣本,后5幅圖像作為測(cè)試樣本,訓(xùn)練樣本和測(cè)試樣本總數(shù)均為200,閾值選為0.91。程序運(yùn)行可得識(shí)別率為0.885。選取的特征空間的維數(shù)是88。PCA算法是基于人臉圖像整體特征的人臉識(shí)別方法,影響識(shí)別率的因素主要有很多,如人臉庫(kù)的差異,算法的差異,參數(shù)的選擇,都會(huì)產(chǎn)生很大的影響。但現(xiàn)在主要考慮兩點(diǎn)因素:(1)閾值的選擇,即特征空間的維數(shù);(2)訓(xùn)練樣本的數(shù)量。下面就看一下選擇不同的參數(shù)時(shí)候他們各自對(duì)識(shí)別率的
21、影響如表2.1所示。 表2.1 閾值及樣本數(shù)量對(duì)識(shí)別率的影響每人7幅每人6幅每人5幅每人4幅每人3幅每人2幅每人1幅0.200.35830.36880.32000.35000.36070.34690.32220.400.65000.63120.61500.56670.57140.53750.42500.600.86670.83130.76500.71670.70360.66560.60830.800.93330.89380.86000.80830.76430.73440.64440.850.94170.88750.86000.83330.78570.73750.66390.880.94170.
22、90630.87000.84170.78930.75000.66390.900.94170.90630.88000.84580.78930.75000.67780.920.93330.89380.88000.83330.79640.76250.68060.940.93330.90000.87500.82920.79640.75310.69720.960.93330.89380.88000.82500.78570.74690.6944從上表可以看出當(dāng)閾值一定時(shí),訓(xùn)練樣本數(shù)的增加會(huì)使識(shí)別率提高,大概每人每增加一幅圖像,識(shí)別率提高4個(gè)百分點(diǎn)。在訓(xùn)練樣本數(shù)一定時(shí),閾值的改變也相應(yīng)的影響識(shí)別率,閾值太小
23、的時(shí)候識(shí)別率顯然很低,大概閾值到0.8以上時(shí),識(shí)別率變化不大,這就說明,降低特征矩陣維數(shù)不但可以減少計(jì)算量,而且基本上不會(huì)影響識(shí)別率太多。 3.實(shí)驗(yàn)結(jié)果及實(shí)現(xiàn)功能MATLAB提供了專門的GUI設(shè)計(jì)工具圖形用戶界面開發(fā)環(huán)境(GUIDE),為了便于操作及演示的需要,利用GUIDE設(shè)計(jì)了可視化界面。3.1 文件部分 “文件”菜單中有“打開”、“保存”、“退出”二級(jí)子菜單,分別用于打開,保存處理后的圖像和退出界面操作。3.2 圖像預(yù)處理部分 “圖像處理”菜單主要是完成一些基本的圖像處理功能主要有兩個(gè)作用:一個(gè)是消除或減少噪聲,改善圖像質(zhì)量;另一個(gè)是模糊圖像,使圖像看起來柔和自然。3.3 訓(xùn)練部分3.4識(shí)別部分 4.總結(jié)4.1人臉識(shí)別的困難性 人臉識(shí)別被認(rèn)為是領(lǐng)域甚至領(lǐng)域最困難的研究課題之一。人臉識(shí)別的困難主要是人臉作為生物特征的特點(diǎn)所帶來的。 4.1.1相似性 不同個(gè)體之間的區(qū)別不大,所有的人臉的結(jié)構(gòu)都相似,甚至人臉器官的結(jié)構(gòu)外形都很相似。這樣的特點(diǎn)對(duì)于利用人臉進(jìn)行定位是有利
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年云計(jì)算服務(wù)模式創(chuàng)新案例分析報(bào)告:市場(chǎng)競(jìng)爭(zhēng)格局與機(jī)遇
- 2025年醫(yī)院信息化建設(shè)醫(yī)院物資管理系統(tǒng)初步設(shè)計(jì)評(píng)估報(bào)告
- 九大文化娛樂產(chǎn)業(yè)人才培養(yǎng)與職業(yè)發(fā)展規(guī)劃研究報(bào)告
- 特色小鎮(zhèn)產(chǎn)業(yè)培育資金申請(qǐng)政策導(dǎo)向與產(chǎn)業(yè)集聚效應(yīng)報(bào)告
- 2025年房地產(chǎn)行業(yè)房地產(chǎn)企業(yè)數(shù)字化轉(zhuǎn)型戰(zhàn)略研究報(bào)告
- 2025新能源汽車制造產(chǎn)業(yè)布局下的汽車產(chǎn)業(yè)鏈整合報(bào)告
- 2025年數(shù)字貨幣對(duì)金融行業(yè)數(shù)字貨幣金融監(jiān)管的監(jiān)管政策與監(jiān)管實(shí)踐分析報(bào)告
- 2025年醫(yī)藥流通供應(yīng)鏈優(yōu)化與成本控制技術(shù)創(chuàng)新趨勢(shì)報(bào)告
- 2025年K2教育STEM課程實(shí)施與教育信息化融合研究報(bào)告
- 2025年廣播媒體融合發(fā)展中的跨界合作與生態(tài)構(gòu)建報(bào)告
- 近岸海域生態(tài)環(huán)境問題分析
- 2025重慶水務(wù)環(huán)境集團(tuán)招聘8人筆試參考題庫(kù)附帶答案詳解
- 2025至2030中國(guó)大型啤酒廠產(chǎn)業(yè)運(yùn)行態(tài)勢(shì)與競(jìng)爭(zhēng)格局研究報(bào)告
- 陜投(贛州)信豐能源發(fā)展集團(tuán)有限公司招聘筆試題庫(kù)2025
- 頸部淋巴結(jié)清掃術(shù)后護(hù)理
- 河南大學(xué)語(yǔ)文試題及答案
- 雷達(dá)原理與系統(tǒng)教學(xué)省公開課一等獎(jiǎng)全國(guó)示范課微課金獎(jiǎng)?wù)n件
- 毛石混凝土換填施工方案
- 2025-2026年摩托車制造電動(dòng)化發(fā)展趨勢(shì)
- eDNA技術(shù)監(jiān)測(cè)陸地生物多樣性:技術(shù)要點(diǎn)、難點(diǎn)與進(jìn)展
- 海外項(xiàng)目廉潔風(fēng)險(xiǎn)的防控
評(píng)論
0/150
提交評(píng)論