人臉識(shí)別技術(shù)是模式識(shí)別與人工智能的研究熱點(diǎn)之一在生65_第1頁(yè)
人臉識(shí)別技術(shù)是模式識(shí)別與人工智能的研究熱點(diǎn)之一在生65_第2頁(yè)
人臉識(shí)別技術(shù)是模式識(shí)別與人工智能的研究熱點(diǎn)之一在生65_第3頁(yè)
人臉識(shí)別技術(shù)是模式識(shí)別與人工智能的研究熱點(diǎn)之一在生65_第4頁(yè)
人臉識(shí)別技術(shù)是模式識(shí)別與人工智能的研究熱點(diǎn)之一在生65_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、摘 要人臉識(shí)別技術(shù)是模式識(shí)別與人工智能的研究熱點(diǎn)之一。在生物特征識(shí)別中,人臉識(shí)別占有極為重要的地位。它在訪問(wèn)控制、司法應(yīng)用、電子商務(wù)和視頻監(jiān)控等領(lǐng)域都有廣泛的應(yīng)用。人臉特征提取是人臉識(shí)別過(guò)程的核心,特征提取的有效性直接影響到分類的速度和識(shí)別的性能。本文的主要研究?jī)?nèi)容包括以下方面:(1) 基于Gabor變換的人臉特征提取算法。通過(guò)對(duì)人臉傅里葉變換和Gabor變換的實(shí)驗(yàn)比較,證明了Gabor變換在提取人臉特征方面具有很大的優(yōu)越性。接著,介紹了Gabor小波變換的快速算法。(2) 從基于圖像整體代數(shù)特征PCA算法著手,主要介紹了“特征臉”算法的原理和實(shí)現(xiàn)過(guò)程,對(duì)組成特征投影空間的特征值選擇問(wèn)題,距離

2、度量方法問(wèn)題及訓(xùn)練樣本的選擇等進(jìn)行了一定的研究。(3) 研究了基于Gabor小波變換的人臉識(shí)別算法。本文研究的算法首先對(duì)人臉進(jìn)行Gabor小波變換,然后應(yīng)用PCA方法降低Gabor特征向量的維數(shù),來(lái)實(shí)現(xiàn)對(duì)人臉的識(shí)別。實(shí)驗(yàn)表明,采用該方法得到的識(shí)別率要遠(yuǎn)優(yōu)于單純采用PCA方法的結(jié)果。關(guān)鍵詞 人臉識(shí)別;Gabor小波變換;PCA AbstractFace Recognition Technology(FRT)is emerging as an active research area in the field of pattern recognition and artificial intell

3、igence.As a biometric technology,FRT has numerous applications such as access control,law enforcement,e-commerce,video surveillance and so on. Face feature extraction is the core of recognition task,which directly impact on classification velocity and face recognition ability.The main contributions

4、of this work are listed as follows:(1) Face feature extraction algorithm based on Gabor transform is introduced.Compared with Fourier transform,Gabor transform is proved to be better in face feature extraction.And then,A fast algorithm of Gabor Transform is introduced.(2) Based on algebraic features

5、 of the images,this paper first introduced the PCA-Based face recognition algorithm.Some research has done on the selection of the eigenvector which used to create the eigen-space,the distance measure methods and the selection of the training set.(3) A face recognition algorithm base on Gabor wavele

6、t transform is studied The algorithm studied in this paper consists of three steps:Gabor wavelet is first applied to face images,and then reduce the dimensionality of Gabor eigenvector via PCA. The improved performance of this new algorithm over pure PCA algorithm is demonstrated by the experiments.

7、Key words face recognition Gabor wavelet transform PCA目 錄摘要IAbstractII第1章 緒論11.1研究的背景和意義11.2 人臉識(shí)別的研究現(xiàn)狀21.3如何進(jìn)行人臉識(shí)別-人臉識(shí)別的步驟及方法31.3.1人臉的圖像表示31.3.2人臉的檢測(cè)與定位31.3.3圖像預(yù)處理31.3.4特征提取31.3.5分類器41.4 本文研究的主要內(nèi)容4第2章 Gabor小波變換62.1引言62.2 Gabor小波變換的定義72.3 Gabor變換在人臉識(shí)別中的應(yīng)用82.4 Gabor濾波器92.4.1 Gabor濾波器參數(shù)的選擇112.4.2 Gabor

8、濾波器的性質(zhì)和計(jì)算方法122.4.3 Gabor變換的人臉特征提取122.5 Gabor快速算法圖132.5.1快速傅里葉變換(FFT)152.5.2Gabor變換的快速算法162.6 本章小結(jié)17第3章 主成分分析(PCA)183.1引言183.2 PCA的基本概念183.2.1 PCA原理183.2.2 主成分分析的具體算法193.3 用PCA進(jìn)行特征提取的經(jīng)典算法Eigenface算法203.3.1 特征臉空間203.3.2通過(guò)特征臉空間來(lái)識(shí)別人臉203.3.3 特征向量的選取223.3.4 距離測(cè)量223.4 程序的調(diào)試233.5 本章小結(jié)25第4章 基于Gabor+PCA的人臉識(shí)別2

9、64.1 引言264.2 使用PCA降維的方法264.3 ORL人臉庫(kù)實(shí)驗(yàn)分析274.3.1實(shí)驗(yàn)1:算法的比較274.3.2 實(shí)驗(yàn)2:樣本數(shù)目的選擇284.3.3 實(shí)驗(yàn)3:采樣因子的確定294.4 YALE人臉庫(kù)實(shí)驗(yàn)304.5本章小結(jié)31結(jié)論32參考文獻(xiàn)33致謝34第1章 緒論1.1研究的背景和意義現(xiàn)代社會(huì)中,身份鑒定技術(shù)具有非常重要的應(yīng)用價(jià)值,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,信息安全也顯示出前所未有的重要性。在金融、保安、司法、網(wǎng)絡(luò)傳輸?shù)雀鱾€(gè)應(yīng)用領(lǐng)域,都需要精確的身份鑒定1。但是現(xiàn)今的身份鑒別主要依靠ID卡(如身份證、工作證、智能卡、存儲(chǔ)卡等)和密碼手段。但這些手段攜帶不方便、容易遺失,或者由于使用過(guò)多

10、或不當(dāng)而損壞、不可讀和密碼易被破解等。尤其是近年來(lái)電子商務(wù)的飛速發(fā)展,制假偽造的手段也越來(lái)越高明,傳統(tǒng)的身份確認(rèn)方法面臨著嚴(yán)峻的挑戰(zhàn),并顯得越來(lái)越不適應(yīng)科技的發(fā)展和社會(huì)的進(jìn)步。作為模式識(shí)別中的熱門技術(shù),生物特征識(shí)別(Biometrics)由于提供了對(duì)唯一的,高可靠性和穩(wěn)定性的人體生物特征的鑒別方法,成為身份鑒別的一個(gè)熱門發(fā)展方向1。所謂生物特征識(shí)別1,就是根據(jù)不同人之間的身體(physical)的或者行為(behavioral)的特征的獨(dú)特性,來(lái)唯一地把未知身份識(shí)別出來(lái)。身體特征包括:指紋、視網(wǎng)膜、虹膜、人臉等;行為特征包括簽名、聲音、步態(tài)等。有的識(shí)別是幾種特征的結(jié)合,如身份識(shí)別可以結(jié)合人臉和

11、指紋兩個(gè)特征。日常生活中,人類每時(shí)每刻都通過(guò)感官自然而然地從外界獲取想要的信息。這些信息中有大約80%是通過(guò)視覺(jué)得到的,因此,視覺(jué)信息處理在現(xiàn)代人工智能技術(shù)中占有極為重要的地位。而人臉數(shù)據(jù)的提取方式多種多樣,既可取靜態(tài)圖像,也可取視頻序列,背景還可以變化。人臉數(shù)據(jù)的提取對(duì)設(shè)備也沒(méi)有特殊要求,既可對(duì)真人拍照或攝像,也可從照片掃描。更為重要的是人臉識(shí)別和人類通常的識(shí)別相一致,更易被接受。因此,人臉識(shí)別及其相關(guān)技術(shù)的應(yīng)用前景是生物特征識(shí)別諸多技術(shù)中最被看好的。生物特征識(shí)別在國(guó)外發(fā)展很快2,我國(guó)截止2002年也已舉行了三屆生物特征識(shí)別研討會(huì)3。1992年,Samal總結(jié)了早期的人臉識(shí)別方法。后來(lái),Va

12、lentin討論了人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)模型。Chellappa主要從工程應(yīng)用方面對(duì)人臉識(shí)別進(jìn)行了評(píng)述。而從不同角度出發(fā)的綜述文章還有。兩個(gè)有關(guān)人臉識(shí)別的國(guó)際會(huì)議AFGR和AVBPA的出現(xiàn),充分說(shuō)明了人臉識(shí)別的重要性。IEEE模式分析與機(jī)器智能(PAMI)協(xié)會(huì)在1997年7月出版了有關(guān)人臉和手勢(shì)識(shí)別的???,Daugman這樣寫(xiě)道“在未來(lái)的機(jī)器智能領(lǐng)域,我們將發(fā)現(xiàn)一個(gè)有趣的現(xiàn)象,即為建立具有類似人類外貌、表情、手勢(shì)等特征的人機(jī)界面所做出的努力,將最終導(dǎo)致我們可以和機(jī)器隨心所欲地交流”4。人臉識(shí)別在模式識(shí)別領(lǐng)域的發(fā)展和應(yīng)用方面都有著重要意義:一是可以推進(jìn)對(duì)人類視覺(jué)系統(tǒng)本身的認(rèn)識(shí);二是可以滿足人工智能應(yīng)

13、用的需要。采用人臉識(shí)別技術(shù),建立自動(dòng)人臉識(shí)別系統(tǒng),用計(jì)算機(jī)實(shí)現(xiàn)對(duì)人臉圖像的自動(dòng)識(shí)別有著廣闊的應(yīng)用領(lǐng)域和誘人的應(yīng)用前景。人臉識(shí)別在社會(huì)交往中扮演著十分重要的角色,是人類在確定一個(gè)人身份時(shí)所采用的最普通的生物特征。相對(duì)于其它的生物特征識(shí)別技術(shù)來(lái)說(shuō),人臉識(shí)別具有以下技術(shù)優(yōu)勢(shì):(1)直觀、友好、方便。人臉識(shí)別不會(huì)對(duì)使用者造成心理上的障礙,并且比較符合人們的習(xí)慣,很容易被大多數(shù)用戶所接受;(2)對(duì)用戶的非干擾性。人臉識(shí)別不需要和設(shè)備直接接觸,不需要被測(cè)試者的配合,在這一點(diǎn)上是其它識(shí)別方式難以取代的;(3)對(duì)硬件無(wú)特殊要求,可以借助于現(xiàn)有的硬件進(jìn)行識(shí)別。數(shù)碼攝像頭、數(shù)碼相機(jī)、數(shù)碼攝像機(jī)等已經(jīng)走進(jìn)人們的日常

14、生活,這為人臉識(shí)別的應(yīng)用提供了有力的保障;(4)通過(guò)對(duì)人臉表情的識(shí)別,可以獲得其它的生物特征識(shí)別技術(shù)難以得到的信息。1.2 人臉識(shí)別的研究現(xiàn)狀 人臉識(shí)別的輸入圖像通常有3種情況:正面、傾斜、側(cè)面。由于實(shí)際情況的要求,對(duì)人臉正面圖像識(shí)別的研究最多,它的發(fā)展大致可分為3個(gè)階段5:第一階段以Bertillon、Allen和Parke為代表,主要研究人臉識(shí)別所需要的面部特征。1893年,Bertillon用一個(gè)簡(jiǎn)單的語(yǔ)句與數(shù)據(jù)庫(kù)中某一張臉相聯(lián)系,同時(shí)與指紋分析相結(jié)合,提供了一個(gè)較強(qiáng)的識(shí)別系統(tǒng)。為了提高臉部識(shí)別率,Allen為待識(shí)別人臉設(shè)計(jì)了一種有效和逼真的摹寫(xiě),Parke則用計(jì)算機(jī)實(shí)現(xiàn)了這一想法,并產(chǎn)

15、生了較高質(zhì)量的人臉灰度圖模型。這一階段的工作特點(diǎn)是識(shí)別過(guò)程完全依賴于操作人員。顯然這不是一種可以完成自動(dòng)識(shí)別的系統(tǒng)。第二階段是人機(jī)交互式識(shí)別階段。20世紀(jì)70年代,美、英等發(fā)達(dá)國(guó)家開(kāi)始重視人臉識(shí)別的研究工作并取得一定進(jìn)展。1972年,Goldstion,Harmon和Lesk用幾何特征來(lái)表示人臉正面圖像。他們采用21維的特征矢量表示人臉面部特征,并設(shè)計(jì)了基于這一特征表示法的識(shí)別系統(tǒng)。Kaya和Kobayashi則采用了統(tǒng)計(jì)識(shí)別方法,用歐氏距離來(lái)表征人臉的特征,如嘴唇與鼻子之間的距離,嘴唇的高度等。更進(jìn)一步地,T.Kanad(M.Nagao)設(shè)計(jì)了一個(gè)高速且有一定知識(shí)導(dǎo)引的半自動(dòng)回溯識(shí)別系統(tǒng),創(chuàng)

16、造性地運(yùn)用積分投影法從單幅圖像上計(jì)算出一組臉部特征參數(shù),再利用模式分類技術(shù)與標(biāo)準(zhǔn)人臉相匹配。Kanad的系統(tǒng)實(shí)現(xiàn)了快速、實(shí)時(shí)的處理,是一個(gè)很大的進(jìn)步。相比之下,Baron所做的工作較少為人所知:他先將圖像灰度歸一化,再用4個(gè)掩模(眼、鼻、嘴及眉毛以下的整個(gè)臉部)表示人臉,然后分別計(jì)算這4個(gè)掩模與數(shù)據(jù)庫(kù)中每幅標(biāo)準(zhǔn)圖像的相應(yīng)掩模之間的互相關(guān)系數(shù),第一章緒論以此作為判別依據(jù)。總的來(lái)說(shuō),這類方法需要利用操作員的某些先驗(yàn)知識(shí),仍然擺脫不了人的干預(yù)。第三階段是真正的機(jī)器自動(dòng)識(shí)別階段。從1990年代起,由于計(jì)算機(jī)、數(shù)字圖像處理、模式識(shí)別等技術(shù)的發(fā)展,加上人們對(duì)人臉圖像自動(dòng)識(shí)別的迫切需求,人臉模式識(shí)別方法有了

17、較大的突破,提出了多種機(jī)器全自動(dòng)識(shí)別系統(tǒng)。1996年美國(guó)軍方組織了人臉自動(dòng)識(shí)別系統(tǒng)大賽,勒克菲勒大學(xué)的Face1t系統(tǒng)獲得冠軍。最近,美國(guó)的LAU公司研制的人臉圖像自動(dòng)識(shí)別系統(tǒng),是以人眼辨別人臉的原理,基于生物測(cè)量學(xué)、人像復(fù)原技術(shù)開(kāi)發(fā)的裝置。用人臉1242個(gè)特征點(diǎn),對(duì)人群中尋找的人進(jìn)行定量定性識(shí)別,已經(jīng)用在機(jī)場(chǎng)、火車站、公共場(chǎng)所、重點(diǎn)控制地區(qū)6。在人臉識(shí)別技術(shù)誕生至今的二三十年中,人們已提出了很多成熟、高效的識(shí)別算法,為工程應(yīng)用提供了強(qiáng)有力的后盾。自從“911”事件以來(lái),世界上對(duì)人臉識(shí)別系統(tǒng)的需求有了明顯增長(zhǎng)。對(duì)人臉識(shí)別的研究也是理論界的一個(gè)熱點(diǎn)。目前世界上最有名的識(shí)別系統(tǒng)為Visionics

18、公司的“FaceIt”系統(tǒng),在活動(dòng)場(chǎng)景(人和照相機(jī)都是活動(dòng)的)下,該系統(tǒng)的識(shí)別率僅為50%;而可控條件下,識(shí)別率可達(dá)80%以上。在中國(guó),中科院計(jì)算所高文教授主持的863項(xiàng)目“面像檢測(cè)與識(shí)別核心技術(shù)”通過(guò)鑒定。該系統(tǒng)會(huì)自動(dòng)在人臉上選取103個(gè)點(diǎn),然后通過(guò)分析面部皮膚反射屬性、三維結(jié)構(gòu)等特征進(jìn)行識(shí)別,靜態(tài)場(chǎng)景下識(shí)別準(zhǔn)確率達(dá)到96.5。中科院自動(dòng)化所和微軟亞洲研究院也在進(jìn)行這方面的研究。1.3人臉識(shí)別的步驟及方法Chellappa給出的人臉識(shí)別定義是,給出靜態(tài)或者視頻圖像,將其中的一個(gè)或多個(gè)人臉和存儲(chǔ)于數(shù)據(jù)庫(kù)中的人臉相比較,確定出圖像或視頻中各個(gè)臉的身份。一般要在輸入之前對(duì)圖像進(jìn)行預(yù)處理,若有人臉存

19、在,則將其從背景中分割出來(lái)。一般來(lái)說(shuō),一個(gè)完整的人臉識(shí)別系統(tǒng)包括。圖像輸入、人臉檢測(cè)/定位、預(yù)處理、特征提取、分類器5部分。1.3.1人臉的圖像表示計(jì)算機(jī)處理的圖像是以數(shù)字形式表示的。如果僅從識(shí)別的角度出發(fā),我們希望數(shù)字圖像能夠盡可能地保留原圖像的信息,但在實(shí)踐中,由于場(chǎng)合的不同,輸入圖像保留的信息是不一樣的?;叶葓D像失去了顏色信息;二維圖像則失去了深度等三維信息;紅外圖像僅和熱輻射有關(guān),分辨率太低;Sketch圖像則失去了紋理信息;上述幾種圖像都沒(méi)有運(yùn)動(dòng)信息。除了圖像形態(tài),輸入設(shè)備也不盡相同,有的圖像是由CCD攝像頭拍攝的,有的則是照片掃描或報(bào)紙掃描,還有可能是在web上下載的壓縮圖像,等等

20、。由于應(yīng)用環(huán)境的不同,所得圖像的性質(zhì)也是不同的,這實(shí)際上會(huì)影響到以后提取的特征也有所不同。本論文主要是在二維灰度(2D intensity)靜態(tài)圖像上進(jìn)行人臉識(shí)別的研究。1.3.2人臉的檢測(cè)與定位檢測(cè)圖像中是否有人臉,若有,將其從背景中分割出來(lái),并確定其在圖像中的位置。在某些可以控制拍攝條件的場(chǎng)合,如警察拍罪犯照片時(shí)將人臉限定在標(biāo)尺內(nèi),此時(shí)人臉的定位很簡(jiǎn)單。證件照背景簡(jiǎn)單,定位也比較容易。在另一些情況下,人臉在圖像中的位置是未知的,比如在復(fù)雜背景下拍攝的照片,這時(shí)人臉的檢測(cè)與定位將受以下因素的影響:(1)人臉在圖像中的位置、角度和不固定尺度以及光照的影響;(2)發(fā)型、眼鏡、胡須以及人臉的表情變

21、化等;(3)圖像中的噪聲。人臉檢測(cè)的基本思想是用統(tǒng)計(jì)或知識(shí)的方法對(duì)人臉建模,比較所有可能的待檢測(cè)區(qū)域與人臉模型的匹配程度,從而得到可能存在人臉的區(qū)域。其方法大致可分為基于統(tǒng)計(jì)和基于知識(shí)兩類。前者將圖像看作一個(gè)高維向量,從而將人臉檢測(cè)問(wèn)題轉(zhuǎn)化為高維空間中分布信號(hào)的檢測(cè)問(wèn)題;后者則利用對(duì)人臉的認(rèn)知知識(shí)建立若干規(guī)則,從而將人臉檢測(cè)問(wèn)題轉(zhuǎn)化為假設(shè)/驗(yàn)證問(wèn)題。1.3.3圖像預(yù)處理圖像特征提取之前一般需要做預(yù)處理。一般改善的方法有直方圖均衡、圖像銳化等。如果需要提取不同的頻帶信息,則進(jìn)行相應(yīng)的低通、帶通或高通濾波。圖像的邊緣、梯度信息的提取,消除照相機(jī)位置、方向的影響和相機(jī)抖動(dòng),某些背景的去除等也屬于預(yù)處

22、理操作。背景的去除是必要的,否則人臉識(shí)別將不是“pure”人臉識(shí)別。還有幾何歸一化和灰度歸一化。前者是指根據(jù)人臉定位結(jié)果將圖像中的人臉轉(zhuǎn)換到同一位置和大小;后者是指對(duì)圖像進(jìn)行補(bǔ)償?shù)忍幚?,以克服光照變化的影響?.3.4特征提取特征提取就是采用某種表示方法表示檢測(cè)出的人臉與數(shù)據(jù)庫(kù)中的人臉,表示方法不同,代表了人臉不同方面的信息。在特征提取之前,一個(gè)重要的問(wèn)題是消除姿態(tài)、光照變化的影響。通常采用的人臉表示方法包括幾何特征(如歐式距離、曲率、角度)、代數(shù)特征(如矩陣特征向量)和固定模板特征。識(shí)別人臉主要依據(jù)那些在不同個(gè)體之間存在較大差異而對(duì)于同一個(gè)人則比較穩(wěn)定的特征,具體的特征形式隨識(shí)別方法的不同而

23、不同。常用的人臉表征方法有:幾何特征,主分量分析,線性判別分析,獨(dú)立分量分析,Gabor小波變換、離散余弦變換等;早期研究較多的靜態(tài)人臉識(shí)別方法有基于幾何特征的人臉識(shí)別方法和基于相關(guān)匹配的人臉識(shí)別方法。目前,靜止圖像的人臉識(shí)別方法主要有3個(gè)研究方向:基于統(tǒng)計(jì)的識(shí)別,包括特征臉(Eigenface)方法和隱馬爾科夫模型(Hidden Markov Model)方法;基于連接機(jī)制的識(shí)別,包括一般的神經(jīng)網(wǎng)絡(luò)方法和彈性圖匹配(Elastic Graph Matching)方法;其它一些綜合方法或處理非二維灰度圖像的方法。1.3.5分類器分類器的設(shè)計(jì)是模式識(shí)別的難點(diǎn)。在人臉識(shí)別中,常用的分類器有以下幾種

24、:最小距離分類器(NC)相似度量是以檢測(cè)樣本到類中心的距離大小為判據(jù)。最近鄰分類器(1-NN,K-NN)相似度量以檢測(cè)樣本到模板的距離為判據(jù)。當(dāng)模板庫(kù)中每類只有一個(gè)模板時(shí),NN就退化為NC。距離的測(cè)度主要有L1范數(shù)、L2范數(shù),馬氏距離,Hausdorff距離等。貝葉斯分類器如果知道各類的先驗(yàn)分布和條件分布,就可以采用最大后驗(yàn)估計(jì)(MAP)的方法進(jìn)行分類。在人臉識(shí)別中,有時(shí)假定人臉?lè)母咚狗植迹軌虻玫讲诲e(cuò)的結(jié)果7。支撐向量機(jī)(SVM)是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化得出的。尤其在小樣本情況下,既降低了訓(xùn)練集的錯(cuò)分風(fēng)險(xiǎn),又降低了未知人臉(如檢測(cè)集)的錯(cuò)分風(fēng)險(xiǎn)。在人臉識(shí)別中已逐漸得到應(yīng)用。神經(jīng)網(wǎng)絡(luò)分類器(NN

25、C)。采用神經(jīng)網(wǎng)絡(luò)作為分類器是很自然的。一般一個(gè)3層網(wǎng)絡(luò)對(duì)應(yīng)模式識(shí)別中圖像輸入、特征提取、分類3部分。通常的NNC有多層感知機(jī)(MLP)模型、BP網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)等。SVM也借鑒了神經(jīng)網(wǎng)絡(luò)的思想。1.4 本文研究的主要內(nèi)容基于人臉識(shí)別技術(shù)在當(dāng)今社會(huì)的重大意義,本文主要研究了Gabor小波變換和PCA算法在人臉識(shí)別的應(yīng)用。人臉識(shí)別的核心問(wèn)題,就是如何將人臉的特征抽取出來(lái),并得到對(duì)應(yīng)于不同分類方法進(jìn)行分類。因此算法的好壞就直接影響了最終的正確識(shí)別結(jié)果。算法的好壞主要體現(xiàn)在提取特征的效率和準(zhǔn)確率。本論文主要探討Gabor小波變換和PCA算法的優(yōu)點(diǎn)。其中,仿真實(shí)驗(yàn)是基于ORL人臉庫(kù)和yale人臉庫(kù)

26、上進(jìn)行測(cè)試的。首先,本文將研究Gabor小波變換的性質(zhì)及其在圖像處理上的優(yōu)點(diǎn)。用Gabor小波變換研究人臉識(shí)別,事實(shí)上就是Gabor濾波器的設(shè)計(jì),Gabor濾波器在圖像處理中的特征提取、紋理分析和立體視差估計(jì)等方面有許多應(yīng)用。Gabor濾波能夠體現(xiàn)出不同的方向性和尺度性。Gabor函數(shù)從實(shí)質(zhì)上來(lái)說(shuō)是一個(gè)Gauss函數(shù)窗所限制的濾波函數(shù)。通過(guò)定義不同的Gabor函數(shù)核,就可以得到一組Gabor濾波器。通常將灰度人臉圖像記為I(x,y),再分別各個(gè)Gabor濾波器進(jìn)行卷積,即可得到人臉圖像的Gabor小波表示。然后,再探討PCA算法的原理,PCA算法是一種經(jīng)典的算法,由于PCA變換基函數(shù)的個(gè)數(shù)往往

27、遠(yuǎn)小于信號(hào)的維數(shù),因此PCA變換能夠大大降低數(shù)據(jù)的表示維數(shù)。這對(duì)圖像識(shí)別中的特征提取非常有利。PCA算法是根據(jù)樣本點(diǎn)在多模式空間的位置分布,以樣本點(diǎn)在空間中變化最大方向,即方差最大的方向,作為判別變量來(lái)實(shí)現(xiàn)特征的提取。因此比較適合用于gabor變換后的降維。最后分別在ORL和YALE兩個(gè)人臉庫(kù)進(jìn)行實(shí)驗(yàn),不斷改進(jìn)算法模型,不斷向識(shí)別率高,識(shí)別效率高改進(jìn)。第2章 Gabor小波變換2.1引言Gabor展開(kāi)是一種同時(shí)用時(shí)間和頻率表示一個(gè)時(shí)間函數(shù)的方法,而求解Gabor展開(kāi)系數(shù)的公式被稱為Gabor變換。傳統(tǒng)的Gabor變換的缺點(diǎn)是窗口尺寸一經(jīng)確定就無(wú)法更改,因此不具有變焦特性,無(wú)法對(duì)信號(hào)進(jìn)行多分辨率

28、分析。為解決這一問(wèn)題人們將Gabor理論同小波理論相結(jié)合,提出了Gabor小波。Gabor小波具有小波變換的多分辨率特性,同時(shí)具有Gabor函數(shù)本身所具有的局域性和方向性。 標(biāo)準(zhǔn)傅立葉變換是數(shù)字信號(hào)處理的有利工具,然而它只能反映信號(hào)在整個(gè)實(shí)軸的整體性質(zhì),而不能反映信號(hào)在局部時(shí)間范圍中的特征。對(duì)于圖像,我們關(guān)心的往往是局部的特征,如圖像邊緣,由于標(biāo)準(zhǔn)傅立葉變換不能同時(shí)在時(shí)域和頻域具有對(duì)信號(hào)的局部分析能力,Dennis Gabor于1946年在他的論文中,為了提取信號(hào)傅立葉變換的局部信息,引入了一個(gè)時(shí)間局部化“窗函數(shù)”,其中參數(shù)用于平移動(dòng)窗以便覆蓋整個(gè)時(shí)域。實(shí)際上,Gabor使用了一個(gè)Gaussi

29、an函數(shù)作為窗函數(shù)。因?yàn)橐粋€(gè)Gaussian函數(shù)的傅立葉變換還是一個(gè)Gaussian函數(shù),所以傅立葉逆變換也是局部的。Gabor變換是唯一能夠達(dá)到時(shí)頻測(cè)不準(zhǔn)的下界的函數(shù),是圖像表示中一種較好的模式,它的最大優(yōu)點(diǎn)在于它能夠達(dá)到交叉熵的最低邊緣,能夠最好地兼顧信號(hào)在時(shí)域和頻域的分辨率,而且人類的視覺(jué)系統(tǒng)對(duì)于這種函數(shù)有非常好的匹配特性。Gabor函數(shù)的這些特性,使得它在信號(hào)處理中獲得廣泛的應(yīng)用,特別應(yīng)用于低級(jí)視覺(jué)如紋理分割、光流估計(jì)、數(shù)據(jù)壓縮和邊緣檢測(cè)等。Gabor變換雖然在一定程度上克服了標(biāo)準(zhǔn)傅立葉變換不具有局部分析能力的缺陷,且能最好地兼顧信號(hào)在時(shí)城和頻域地分辨率,但它同時(shí)也存在著自身不可克服的

30、局限,即當(dāng)窗函數(shù)確定后,窗口的形狀就確定了,因此Gabor變換是一種單一分辨率的分析8。 目前Gabor變換和Gabor展開(kāi)已被公認(rèn)是信號(hào)與圖像表示的最好的方法之一。Gabor變換中要解決的最基本問(wèn)題是:在給定綜合窗下如何求解分析窗及Gabor變換系數(shù)。Gabor變換廣泛應(yīng)用的困難也就是在于找不到一種簡(jiǎn)單的計(jì)算變換系數(shù)的方法,因?yàn)镚abor基本函數(shù)彼此之間互不正交。近十幾年來(lái),圍繞這一問(wèn)題國(guó)內(nèi)外相繼提出了很多解決方法,最主要的有以Bastiaans、Wexler和Qian等人為代表的解析法,Daugman等人提出的神經(jīng)網(wǎng)絡(luò)方法以及Ibrahim等人提出的自適應(yīng)學(xué)習(xí)算法等等。但不論上述哪一種方法

31、,均為復(fù)數(shù)形式的Gabor變換。Gabor基本函數(shù)、Gabor展開(kāi)系數(shù)、雙正分析窗函數(shù)求解的約束條件式及Gabor展開(kāi)式都是復(fù)數(shù)形式,計(jì)算量很大。為了簡(jiǎn)化Gabor變換的計(jì)算,提出了一種實(shí)數(shù)形式的離散Gabor變換(RDGT)方法,這種方法類似于復(fù)數(shù)形式的離散Gabor變換的解析理論體系,并可采用快速的離散Hartley變換算法計(jì)算Gabor變換系數(shù),尤其是實(shí)數(shù)形式的離散Gabor變換系數(shù)與復(fù)數(shù)形式的離散Gabor變換系數(shù)的實(shí)部和虛部有著非常簡(jiǎn)單的加減關(guān)系,因此前者的計(jì)算完全可以替代后者的計(jì)算,從而達(dá)到大大減小Gabor復(fù)變換系數(shù)計(jì)算量的目的;同樣,在信號(hào)的重建方面,實(shí)數(shù)形式的離散Gabor逆

32、變換也比復(fù)數(shù)形式的離散Gabor逆變換快得多,并且在實(shí)際應(yīng)用中,實(shí)值Gabor變換更方便于軟件和硬件的實(shí)現(xiàn)910。2.2 Gabor小波變換的定義由于Fourier變換存在著不能同時(shí)進(jìn)行時(shí)間和頻率局部分析的缺點(diǎn),1946年Gabor提出了一種加窗的Fourier變換方法,它在非平穩(wěn)信號(hào)分析中起到了很好的作用。在Fourier變換中,把非平穩(wěn)信號(hào)過(guò)程看作是一系列短時(shí)平穩(wěn)信號(hào)的疊加,而短時(shí)性是通過(guò)時(shí)間上加窗來(lái)實(shí)現(xiàn)的。整個(gè)時(shí)域的覆蓋是由參數(shù)的平移達(dá)到的。換句話說(shuō),該變換是用一個(gè)窗函數(shù)與信號(hào)相乘實(shí)現(xiàn)在附近開(kāi)窗和平移,然后施以Fourier變換,這就是Gabor變換也稱短時(shí)Fourier變換或加窗Fou

33、rier變換。Gabor變換的定義由下式給出:對(duì)于, (2-1) 其中是積分核。該變換在點(diǎn)附近局部測(cè)量了頻率為的正弦分量的幅度。通常選擇能量集中在低頻處的實(shí)偶函數(shù);Gabor采用高斯(Gauss)函數(shù)作窗的函數(shù),相應(yīng)的Fourier變換以后仍舊是Gauss函數(shù),從而保證窗口Fourier變換在時(shí)域和頻域內(nèi)均有局部化功能。令窗口函數(shù)為,則有 (2-2)式中a決定了窗口的寬度,的Fourier變換用表示,則有 (2-3)由以上可以得到 (2-4)顯然,信號(hào)經(jīng)過(guò)Gabor變換按窗口寬度分解了的頻譜,提取出它的局部信息。當(dāng)在整個(gè)時(shí)間軸上平移時(shí),就給出了Fourier的完整變換。相應(yīng)的重構(gòu)公式為: (2

34、-5)窗口Fourier變換是能量守恒變換,即 (2-6) 這里應(yīng)注意,積分核對(duì)所有和都有相同的支撐區(qū),但周期數(shù)隨而變化。支撐區(qū)是指一個(gè)函數(shù)或信號(hào)的自變量的定義域,當(dāng)在定義域內(nèi)取值時(shí)的值域不為零,在支撐區(qū)之外信號(hào)或過(guò)程下降為零。 為了研究窗口Fourier變換的時(shí)頻局部化特性就要研究和的特性。這里是的Fourier變換。由于Fourier變換是能量守恒的,所以有Parseval定理存在。即: (2-7)這里的和分別是和的復(fù)共軛函數(shù),當(dāng)為實(shí)數(shù)時(shí),兩種表示是相等的。如果把上述函數(shù)乘積的積分運(yùn)算用內(nèi)積符號(hào)表示,則有 (2-8)其中和都是在實(shí)數(shù)域的平方可積函數(shù)。由此: (2-9)當(dāng)時(shí)有: 其中叫做的范

35、數(shù)。這一表達(dá)式的物理意義是Fourier變換的時(shí)域和頻域的一對(duì)共扼變量具有對(duì)易關(guān)系,從而使Fourier變換與加窗口的Fourier變換具有對(duì)稱性。如果用角頻率變量代替時(shí)間變量,用頻域窗口函數(shù)代替時(shí)域窗口函數(shù)則可得到: (2-10) 這里是時(shí)域窗口函數(shù)的Fourier變換。該式的意義在于頻域中的信號(hào)通過(guò)窗口函數(shù)的加窗作用獲得了在頻域附近的局部信息即: (2-11)如果選用窗口函數(shù)在時(shí)域和頻域均有良好的局部性質(zhì),那么可以說(shuō)Fourier變換給出了信號(hào)的局部時(shí)一頻分析。這樣就有利于同時(shí)在頻域和時(shí)域提取信號(hào)的精確信息。2.3 Gabor變換在人臉識(shí)別中的應(yīng)用 Campben和Robson提出并在心理

36、學(xué)實(shí)驗(yàn)中證實(shí),人類的視覺(jué)具有多通道和多分辨率的特征,因此,近年來(lái)基于多通道、多分辨率分析的算法受到廣泛重視11。在諸如信號(hào)檢測(cè)、圖象壓縮、紋理分析、圖象分割和識(shí)別等領(lǐng)域,Gabor小波得到了非常廣泛的應(yīng)用。大量基于簡(jiǎn)單細(xì)胞接受場(chǎng)的實(shí)驗(yàn)表明,圖像在視覺(jué)皮層的表示存在空域和空頻域分量,并且可以將一幅圖像分解為局部對(duì)稱和反對(duì)稱的基函數(shù)表示,Gabor函數(shù)正是這種基信號(hào)的良好近似。Lee.T.S用ZD一Gabor小波來(lái)表征圖像,將Daubeehies的一維框架理論拓展到二維,并證明在一定條件下,ZD一Gabor小波是緊框架,原圖像能從小波系數(shù)重建,因此用小波變換的系數(shù)幅值作為特征來(lái)匹配有著良好的視覺(jué)特

37、性和生物學(xué)背景,Gabor小波的這些特性使得其對(duì)于亮度和人臉表情的變化不敏感,在人臉識(shí)別和圖像處理中有著廣泛的應(yīng)用。Lades等首先提出用基于Gabor變換的彈性圖匹配算法進(jìn)行人臉識(shí)別。節(jié)點(diǎn)上的Gabor濾波響應(yīng)作為人臉特征,通過(guò)特征匹配和節(jié)點(diǎn)幾何位置的匹配實(shí)現(xiàn)人臉識(shí)別。2.4 Gabor濾波器 在實(shí)驗(yàn)室中我們用的最多的是Gabor濾波器。根據(jù)Gabor變換的原理和實(shí)際需要,可構(gòu)造不同的Gabor濾波器。Gabor濾波器在圖像處理中的特征提取、紋理分析和立體視差估計(jì)等方面有許多應(yīng)用。有研究表明神經(jīng)細(xì)胞的感受也可以用Gabor函數(shù)來(lái)表示。Gabor濾波能夠體現(xiàn)出不同的方向性和尺度性。Gabor函

38、數(shù)從實(shí)質(zhì)上來(lái)說(shuō)是一個(gè)Gauss函數(shù)窗所限制的濾波函數(shù)。通過(guò)定義不同的Gabor函數(shù)核,就可以得到一組Gabor濾波器。Gabor核函數(shù)的定義: (2-12)Gabor濾波可以定義為: (2-13)下面我們對(duì)式(4-12)中的各項(xiàng)參數(shù)作一個(gè)說(shuō)明:是一個(gè)振蕩函數(shù),實(shí)部為余弦函數(shù),虛部為正弦函數(shù)。是Gauss函數(shù),這實(shí)際上是通過(guò)加窗限制了函數(shù)的范圍,使其在局部有效。由Gauss函數(shù)的局部性可知,這個(gè)濾波器實(shí)際上抽取x附近的特征,因此可以看作是一種Gabor小波。是直流分量,這樣濾波器就可以不受直流分量大小的影響。 向量描述了濾波器對(duì)不同方向和不同尺度的響應(yīng),通過(guò)選取一系列的,就得到了一族Gabor濾

39、波器,是一個(gè)常量,和一起刻畫(huà)了Gauss窗的波長(zhǎng)。這里取=/2,可以表示為: 這里 (2-14)選取不同的下標(biāo)可以描述不同的Gauss窗波長(zhǎng),從而控制采樣的尺度。選取不同的下標(biāo)可以描述振蕩函數(shù)不同的振蕩方向,從而控制采樣的方向。我們這里選取=0 ,.,4這樣可以在5個(gè)不同的尺度上采樣。選取=0 ,.,7這樣就可以在8個(gè)不同的方向上采樣13。各個(gè)濾波器窗口的大小為32×32,確定濾波器的所有參數(shù)(可自己決定)后,當(dāng)采取上述的參數(shù)后,可得如下圖2-1的40個(gè)濾波器。圖2-1 Gabor 5個(gè)尺度8個(gè)方向的濾波器族的實(shí)部2.4.1 Gabor濾波器參數(shù)的選擇 由于不同,u代表了不同的采樣方

40、式,因此需要保證在不同的尺度和不同方向上的采樣盡量均勻。一些研究表明0, 區(qū)間可以描述所有的方向,因此只需對(duì)區(qū)間0, 進(jìn)行采樣。也就是說(shuō):+方向上的濾波完全可以由?方向的結(jié)果確定。由于的變化是連續(xù)的,不可能取無(wú)窮多個(gè),必須對(duì)其進(jìn)行離散均勻采樣。因此這里我們選取作為采樣間隔,反映了空間尺度上采樣。由于尺度的大小實(shí)際上決定于Gauss窗的大小,而其窗長(zhǎng)正比于,由于是在二維上的采樣,因此其面積正比于。為了反映尺度上的合理采樣,實(shí)驗(yàn)表明每次采樣的面積成倍的方式遞減比較合理,是一個(gè)常量,這就要求。Gabor濾波器利用公式定義的卷積,就可以在圖像每個(gè)不同的處得到個(gè)不同復(fù)值的濾波結(jié)果12。2.4.2 Gab

41、or濾波器的性質(zhì)和計(jì)算方法 (1)Gabor濾波器的性質(zhì)1 Gabor濾波器具有生物學(xué)的意義。Gabor核函數(shù)與脊椎動(dòng)物大腦視覺(jué)區(qū)域皮層細(xì)胞的感受行狀十分類似。2 Gabor濾波器能充分描述圖像的紋理信息。Gabor濾波特性說(shuō)明了Gabor濾波結(jié)果是描述圖像局部灰度分布的有力工具。因此,圖像的紋理信息可以用Gabor濾波作為特征抽取的方法。3 對(duì)二維Gabor濾波的研究表明,通過(guò)恰當(dāng)選擇若干個(gè)Gabor核函數(shù)可以重構(gòu)出原圖像。4 Gabor核函數(shù)由于去掉了直流分量,對(duì)局部光照影響不敏感。這和直接將圖像的灰度特征作為模板相比,優(yōu)勢(shì)是很明顯的。5 Gabor濾波結(jié)果可以描述不同方向上灰度的分布信息

42、。6 Gabor濾波結(jié)果可以描述不同尺度上灰度的分布信息。一般來(lái)說(shuō),大尺度濾波可以描述全局性較強(qiáng)的信息,同時(shí)可以掩蓋掉圖像中噪聲的影響,而小尺度濾波可以描述比較精細(xì)的局部結(jié)構(gòu),受噪聲影響也大。7 核函數(shù)有良好的頻域特性。Gabor核函數(shù)在頻域內(nèi)的形狀和空域內(nèi)的形狀完全相同。8 Gabor濾波可以容忍圖像有一定的平移、旋轉(zhuǎn)、深度上的轉(zhuǎn)動(dòng)、尺度變化等情況。 (2)Gabor核函數(shù)的計(jì)算方法由于輸入的圖像為灰度圖像,這就是直接的離散化表示。從Gabor核函數(shù)的定義公式可以看出,由于Gauss窗函數(shù)的限制,Gabor核函數(shù)只在一個(gè)局部非零,因此我們只需要對(duì)其局部進(jìn)行離散抽樣即可。抽樣范圍的大小由Gau

43、ss窗的大小所確定,這里我們?nèi)∽鳛槌闃影霃健?.4.3 Gabor變換的人臉特征提取 根據(jù)以上分析,我們知道Gabor變換在人臉特征提取方面具有很多優(yōu)點(diǎn),前面定義的Gabor小波是一組帶通濾波器,通過(guò)參數(shù)的選擇,每一組濾波器具有各自的頻率選擇性和方向選擇性,這樣不同方向和尺度的濾波器覆蓋整個(gè)頻域,從而一幅人臉圖像的Gabor特征表示就是該圖像和一族Gabor小波卷積的結(jié)果。 假設(shè)表示一幅圖像的灰度分布,則其Gabor特征表示為: (2-15) 其中,是Gabor核函數(shù),是尺度,方向的Gabor小波卷積結(jié)果。在這里,我們選用5個(gè)尺度8個(gè)方向的Gabor小波,即0 ,.,4,0,.,7,其于參數(shù)設(shè)

44、為以及為了包含不同的空間尺度和方向的Gabor濾波特征,一般將一幅圖像的所有尺度方向Gabor濾波變換表示成一個(gè)級(jí)聯(lián)的特征矢量。由于一般圖像的維數(shù)比較高,直接將所有尺度、方向的Gabor小波變換特征級(jí)聯(lián)會(huì)導(dǎo)致維數(shù)大而難于處理,因此有必要對(duì)圖像的各個(gè)Gabor小波表示進(jìn)行下采樣處理,假設(shè)下采樣因子為,則一幅圖像的特征矢量為: (2-16) 從特征提取的角度出發(fā),對(duì)人臉圖像的不同尺度不同方向的Gabor濾波可以認(rèn)為是提取了人臉圖像具有不同性質(zhì)的特征,因此對(duì)于一般所采用的5尺度8方向的Gabor小波,可以認(rèn)為其對(duì)人臉圖像的濾波得到了40組具有不同性質(zhì)的特征矢量,一般都將這40組特征矢量簡(jiǎn)單級(jí)聯(lián)成一個(gè)

45、長(zhǎng)特征矢量,然后在對(duì)該特征矢量進(jìn)行學(xué)習(xí)和識(shí)別分類,而不考慮各組特征矢量的有效性問(wèn)題,即哪些尺度和方向的Gabor濾波特征更能反應(yīng)人臉之間互相區(qū)別的本質(zhì)特征。以下是Gabor變換人臉提取特征的流程圖: 下采樣特征提取FFT變換Gabor核函數(shù)乘法器FFT變換圖像輸入 圖2-2 Gabor變換人臉提取特征流程圖 從以上流程圖可以得出一幅人臉圖像(如圖2-3)經(jīng)Gabor小波變換后的結(jié)果,如圖2-4所示:圖2-3原始圖像截取圖2.5 Gabor快速算法圖 前面我們通過(guò)實(shí)驗(yàn)分析了Gabor變換在人臉特征提取中的重要作用,在這一章中,我們就著重介紹Gabor的快速算法。由于我們所說(shuō)的Gabor變換的快速

46、算法是基于傅里葉快速算法而來(lái)的,所以我們先介紹傅里葉快速算法。離散傅里葉變換(DFT)在信號(hào)的頻譜分圖2-4 Gabor小波變換后的圖像析、系統(tǒng)的分析、設(shè)計(jì)和實(shí)現(xiàn)中得到了廣泛的應(yīng)用,原因之一就是計(jì)算DFT有很多的快速算法,快速傅里葉變換(FFT)算法就是其中之一。在使用數(shù)字信號(hào)處理技術(shù)的各種各樣的應(yīng)用領(lǐng)域里,F(xiàn)FT算法都起著極為重要的作用。設(shè)為N點(diǎn)的有限長(zhǎng)序列,則其正變換DFT為: (2-17) 逆變換OFT為: (2-18) 通常我們用算法所需的乘法和加法運(yùn)算次數(shù),來(lái)衡量各種算法的復(fù)雜性和效率。這里的通常都是復(fù)數(shù),于是整個(gè)DFT運(yùn)算就需要N2次復(fù)數(shù)乘法和N(N-1)次復(fù)數(shù)加法。因此,直接計(jì)算

47、DFT,乘法和加法的次數(shù)都與N2成正比。 當(dāng)N較大時(shí),計(jì)算量太大,無(wú)法得到實(shí)際的應(yīng)用。2.5.1快速傅里葉變換(FFT) 自從1965年圖基(J.W.Tuky)和庫(kù)利(T.W.Coody)在計(jì)算機(jī)數(shù)學(xué)(Math.Computer,Vol.19,1965)雜志上發(fā)表了著名的機(jī)器計(jì)算傅里葉級(jí)數(shù)的一種算法論文之后桑德(G.Sand)、圖基等快速算法相繼出現(xiàn),又經(jīng)人們進(jìn)行改進(jìn),很快的形成一套高效運(yùn)算方法,這就是現(xiàn)在的快速傅立葉變換,簡(jiǎn)稱FFT,這種算法使DFT運(yùn)算效率提高1-2個(gè)數(shù)量級(jí),為數(shù)字信號(hào)處理技術(shù)應(yīng)用于各種信號(hào)的實(shí)時(shí)處理創(chuàng)造了良好的條件,大大推動(dòng)了數(shù)字信號(hào)處理技術(shù)的發(fā)展。 快速傅里葉變換的算法

48、有很多,主要的算法有: 時(shí)間抽取(DIT)基-2FFT算法。這種算法是將輸入序列在時(shí)域上的次序按偶數(shù)和奇數(shù)來(lái)抽取,對(duì)于任意一個(gè)N =2M點(diǎn)長(zhǎng)序列的DFT運(yùn)算,可以采用M次分解,最后分解成2點(diǎn)的DFT運(yùn)算的組合,從而降低了運(yùn)算量。DIT的運(yùn)算量為: 復(fù)數(shù)乘法次數(shù):Mp=(N/2)M=(N/2)log2N 復(fù)數(shù)加法次數(shù):ap=Nlog2N (1)頻域抽取(DIF)基2FFT算法。與DIT算法相對(duì)應(yīng),DIF算法是把頻域輸出X(k)按k是偶數(shù)或是奇數(shù),逐級(jí)分解成2點(diǎn)的DFT運(yùn)算,其原理與DIT算法相對(duì)偶,運(yùn)算量也與DIT算法的相同,這里不再贅述。 (2)N為復(fù)合數(shù)的FFT算法。這是統(tǒng)一的FFT算法,而

49、前面的DIT算法、DIF算法不過(guò)是在輸入序列的列長(zhǎng)為N=2的統(tǒng)一FFT算法的特例而已。這種算法是把DFT的運(yùn)算通過(guò)分解成很多短長(zhǎng)度的DFT來(lái)完成的.如果能分解成4點(diǎn)或2點(diǎn)的DFT,因不需要乘法,可減少旋轉(zhuǎn)因子的數(shù)量,運(yùn)算量更少。N為復(fù)合數(shù)時(shí)的FFT算法,采用下標(biāo)映射是個(gè)關(guān)鍵,然后再分別對(duì)列(或行)和行(或列)求小點(diǎn)數(shù)長(zhǎng)度的DFT,并用旋轉(zhuǎn)因子做各小點(diǎn)數(shù)DFT間運(yùn)算的媒介,但這同時(shí)也帶來(lái)了運(yùn)算量的增加。 若復(fù)合數(shù)N=LM,則其FFT的運(yùn)算量大致為: 復(fù)數(shù)乘法次數(shù):N(M+L+1) 復(fù)數(shù)加法次數(shù):N(M+L-2) 分裂基FFT算法(SRFFT)。這是一種利用將基-2和基-4于變換的不同部位,進(jìn)一步

50、改善固定一基和混合一基的算法,其基本思路是對(duì)偶序號(hào)輸出使用基-2算法,對(duì)奇序列輸出使用基-4算法,將大點(diǎn)數(shù)的DFT逐級(jí)分解成小點(diǎn)數(shù)的DFT運(yùn)算。由于分解的不對(duì)稱性,算法結(jié)構(gòu)比固定-基算法稍微復(fù)雜一些,是目前針對(duì)N =2M的算法中具有最少乘法和加法次數(shù)的,又允許以同址計(jì)算和蝶形方式實(shí)現(xiàn),所以被認(rèn)為是最好的快速傅里葉變換算法。其運(yùn)算量為: 實(shí)數(shù)乘法次數(shù):Nlog2N-3N+4 實(shí)數(shù)加法次數(shù):Nlog2N-3N+4(3)素因子算法(PFA)。當(dāng)復(fù)合數(shù)N可以按照Good映射分解為幾個(gè)互素因子的乘積時(shí),其FFT變換就可以避免旋轉(zhuǎn)因子的影響。PFA算法就是采用了Good映射,將長(zhǎng)度為N=N1*N2的一維D

51、FT轉(zhuǎn)換成尺寸為N=N1×N2的二維DFT,然后以行列方式沿每一維采用最有效的算法計(jì)算這個(gè)二維的DFT。該算法的運(yùn)算量為:乘法次數(shù):m(N)=N2m(N1)+N+N1*m(N2)其中m(N)表示計(jì)算N點(diǎn)DFT需要的總乘法次數(shù)。 (4)Winograd傅里葉變換算法(WFTA)。該算法利用了Good映射將長(zhǎng)度為“大N”因子的DFT分解成若干“小N”因子的連乘,再利用“小N”因子的DFT,就可以得到“大N”因子的DFT?!靶”因子的DFT是指2,3,4,5,7,8,9和16點(diǎn)的DFT。WFTA算法結(jié)構(gòu)比FFT復(fù)雜的多,程序編譯的時(shí)間也長(zhǎng),但運(yùn)算速度比較快。WFTA算法被證實(shí)為具有最少的

52、乘法和加法次數(shù)的算法,該算法除了用到下標(biāo)映射外,還涉及到數(shù)論和近代數(shù)的知識(shí)。 (5)實(shí)序列的FFT。對(duì)于輸入為實(shí)數(shù)序列的FFT沒(méi)有必要專門編寫(xiě)實(shí)數(shù)據(jù)的FFT,而是直接利用復(fù)數(shù)據(jù)FFT進(jìn)行計(jì)算。利用DFT奇偶對(duì)稱性質(zhì),可以用一個(gè)N點(diǎn)的FFT同時(shí)運(yùn)算兩個(gè)N點(diǎn)實(shí)序列,或者是用一個(gè)N點(diǎn)的FFT運(yùn)算一個(gè)2N點(diǎn)的實(shí)序列。前者是把一個(gè)實(shí)序列作為實(shí)部,同時(shí)另一個(gè)實(shí)序列作為虛部,計(jì)算FFT后再把輸出按奇、偶、虛、實(shí)特性加以分離,后者是將2N長(zhǎng)的實(shí)序列的偶序號(hào)置為實(shí)部,奇序號(hào)置為奇部,同樣在計(jì)算FFT后再加以分離。用一個(gè)N點(diǎn)的FFT運(yùn)算一個(gè)2N點(diǎn)的實(shí)序列的運(yùn)算量為: 乘法次數(shù):m2f=N/2(4+log2N) 加

53、法次數(shù):a2f=N(4+log2N)主要有4類計(jì)算二維FFT的方法。即行一列算法、矢量一基算法(VR)、嵌套算法、多項(xiàng)式變換算法。行一列算法實(shí)現(xiàn)最容易,僅要求有效的一維FFT算法即可。而多項(xiàng)式變換因?yàn)榫哂凶畹偷乃阈g(shù)復(fù)雜性,同址計(jì)算的可能性和實(shí)現(xiàn)工作量不大的優(yōu)點(diǎn),受到人們的普遍重視。二維FFT的一個(gè)重要參數(shù)是考慮存儲(chǔ)器的存取次數(shù)。更高維的FFT變換可以類似得到,但在實(shí)際應(yīng)用中采用的不多。2.5.2Gabor變換的快速算法 我們只要把Gabor變換轉(zhuǎn)換成傅立葉形式,根據(jù)FFT快速算法將乘法轉(zhuǎn)換成加法就可以了。下面我們對(duì)其做具體的介紹。DFT的卷積公式定義如下: 若,DFT=X(),DFT=H(),

54、則 =IDFTX()H(),但是,我們需要注意的是:進(jìn)行的是循環(huán)卷積,循環(huán)卷積的定義如下:其中: 表示的圓周移位序列, 其實(shí)質(zhì)上與的含義類似。從直觀上說(shuō),就是對(duì)兩個(gè)卷積的函數(shù)重疊部分以外都用周期延拓的方式填充。 線性卷積的定義如下:從直觀上說(shuō),就是當(dāng)兩個(gè)卷積的函數(shù)重疊部分以外都用零填充。在實(shí)際中我們提取特征需要的是線卷積的結(jié)果。如果將序列和都適當(dāng)?shù)难a(bǔ)零,設(shè)長(zhǎng)度為I,長(zhǎng)度為M,則當(dāng)我們將和都補(bǔ)零到長(zhǎng)度為時(shí),圓卷積和線卷積結(jié)果相同。在實(shí)際實(shí)驗(yàn)中,我們將濾波器組和圖像都補(bǔ)零到256,這樣可以滿足上面的補(bǔ)零要求。在這種情況下,對(duì)于一幅圖像,如果我們的濾波器組是事先計(jì)算好的,則只需要進(jìn)行1個(gè)FFT(對(duì)圖像),40個(gè)乘法(圖像FFT的結(jié)果與濾波器相乘),40個(gè)工FFT(對(duì)相乘結(jié)果進(jìn)行)。同時(shí)256是2的8次冪,2D-FFT的計(jì)算復(fù)雜度為N2log2N。由此,復(fù)雜度大大減少。2.6 本章小結(jié) 本章主要介紹了Gabor小波變換的具體原理和實(shí)際應(yīng)用,及用于人臉識(shí)別的具體算法,事實(shí)上,Gabor小波變換最主要就是一個(gè)濾波器設(shè)計(jì)的問(wèn)題,通過(guò)采取不同的方向和尺度,不同的波長(zhǎng)和頻率,就可以得到不同的濾波器,本文是采用了一般所采用的5尺度,8方向的Gabor小波,同時(shí)取,可以認(rèn)為其對(duì)人臉圖像的濾波得到了40組具有不同性質(zhì)的特征矢量,一般都將這40組特征

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論