



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、基于子圖分割的人臉特征提取算法性能比較研究 摘 要 人臉識別技術(shù)是國內(nèi)外共同關(guān)注的一個前沿課題,在現(xiàn)代經(jīng)濟和社會的發(fā)展中有著十分廣泛的應用領域和應用前景,如安全系統(tǒng)、罪犯識別、電視會議等,人臉識別技術(shù)也是當前模式識別和人工智能領域的研究熱點之一。 本文分析了人臉識別技術(shù)的研究現(xiàn)狀,結(jié)合已有的研究基礎提出了基于變異系數(shù)的人臉特征提取算法和基于奇異值分解的人臉特征提取算法,并結(jié)合子圖分割思想和神經(jīng)網(wǎng)絡技術(shù)對算法進行了評價。在基于變異系數(shù)的算法中,選擇合適的變異系數(shù)代表原圖的特征減少了圖像信息的冗余。進一步研究表明去除包含信息量少
2、的子圖能在一定程度上提高識別率并節(jié)約計算資源。在基于奇異值分解的算法中,將圖像變換后的奇異值作為特征,這具有一些良好的性質(zhì),如穩(wěn)定性、比例不變性和旋轉(zhuǎn)不變性。和一些人臉識別方法相比,本文提出的兩種人臉識別算法具有較好的性能,基于ORL人臉庫的性能模擬實驗表明,算法具有較高識別率。此外,本文在VC+ 6.0環(huán)境下,作者依據(jù)前期研究成果并結(jié)合圖像處理和模式識別的基本原理開發(fā)了一個靜態(tài)人臉圖像識別演示系統(tǒng)。該系統(tǒng)能有效快捷的進行人臉識別。 關(guān)鍵詞:人臉識別,子圖分割,變異系數(shù),奇異值分解,反向傳播神經(jīng)網(wǎng)絡 1. 緒論 11 課題研究背景
3、人臉識別技術(shù)作為多學科領域的、具有挑戰(zhàn)性的難題,它覆蓋了數(shù)字圖像處理、模式識別、計算機視覺、神經(jīng)網(wǎng)絡、心理學、生理學、數(shù)學等諸多學科的內(nèi)容。同時人臉識別也具有十分廣泛的應用意義。在國家安全方面,人臉識別技術(shù)可以應用于對罪犯、恐怖分子的追蹤識別,對犯罪高發(fā)地區(qū)的監(jiān)視或重大嫌疑犯重點地區(qū)的布控系統(tǒng),機場安檢口身份證檢查及結(jié)合犯罪嫌疑人識別系統(tǒng)的安檢口控制系統(tǒng);在軍事方面,人臉識別技術(shù)可以應用于數(shù)字化士兵的交互通訊,從而進行敵我識別,信息提取等;在公眾安全方面,人臉識別技術(shù)應用于智能視頻監(jiān)控、電腦網(wǎng)絡安全、訪問控制、司機駕照驗證、自動門衛(wèi)系統(tǒng),也可以應用于各類銀行卡、金融卡、信用卡的持卡人的身份驗證
4、;在人機交互方面,計算機可以通過人臉識別確定目前是誰在它的視野當中,根據(jù)不同人的身份提供不同的服務;在家庭娛樂等方面,通過人臉識別,可以實現(xiàn)能夠識別主人身份的智能玩具和機器人,具有真實人臉的虛擬游戲玩家等1,2。 在六十年代初期,人臉識別就引起了研究者的強烈興趣。最近幾年來,人臉識別研究越來越受到學術(shù)和商業(yè)界的關(guān)注,人臉識別的輸入圖像通常有三類情況:正面、側(cè)面、傾斜。目前,對正面人臉識別最多,它的發(fā)展主要分為三個階段: 第一階段以Bertillon,Allen和Parke為代表,主要研究人臉識別所需要的面部特征。在Bertillon系統(tǒng)中,采用一個簡單語句與數(shù)據(jù)庫中的一張人臉建立聯(lián)系,取得了較
5、好的識別效果。Allen為待識別的人臉設計了一個有效特征,從而提高了人臉的識別率。Parke把它用計算機實現(xiàn),并產(chǎn)生了較高質(zhì)量的人臉灰度圖模型。這一階段的特點是識別過程幾乎完全依賴于操作人員3,4,5。 第二階段是人機交互識別階段。Goldstion等人用幾何特征參數(shù)來表示人臉正面圖像,采用21維特征矢量表示人臉面部特征,并設計了基于這一特征表示法的識別系統(tǒng)。Kaya和Kobayashi采用統(tǒng)計識別的方法,用歐氏距離來表征人臉特征??偟膩碚f,這類方法需要利用操作員的某些先驗知識,還是擺脫不了人的干預。 第三階段可以說是真正的人臉識別階段,近幾年來,隨著高性能計算機的發(fā)展,人臉識別的方法有了較大
6、的突破,目前已經(jīng)提出了多種機器全自動識別系統(tǒng)。國內(nèi)關(guān)于人臉自動識別的研究始于80年代,我國許多高校、研究機構(gòu)在圖像處理和模式識別領域有很好的研究基礎,積極開展了對包括人臉識別在內(nèi)的基于人體生物特征識別技術(shù)的基礎研究和應用開發(fā)工作。本文相信在不久的將來,這一研究領域的研究和產(chǎn)品開發(fā)工作將處于世界的前列??傊?,人臉識別技術(shù)有著非常廣闊的應用前景,自動的人臉識別系統(tǒng)在各種不同的領域中的應用必將對人們的生活產(chǎn)生深遠的影響6,7。 12 課題研究內(nèi)容 人臉識別技術(shù)就是利用計算機分析人臉圖像,進而從中提取出有效的識別信息,用來“辨認”身份的一門技術(shù)。從廣義上來講,人臉識別大致包括以下五個方面的內(nèi)容3: (
7、1)人臉的定位與檢測:即從靜態(tài)圖片或者視頻序列中是否檢測出人臉的存在并且確定其位置,最后分離出來。然而,人臉是一個極為復雜的、多維的、典型的非剛性模式,其中蘊含的信息也遠遠多于人身體的其他部位。因此,要對人臉做出準確的檢測與定位,將是一個非常具有挑戰(zhàn)性的任務。首先,人臉具有相當復雜的細節(jié)變化,不同的外貌如臉形、膚色等,不同的喜怒哀樂表情,以及局部特征如眼睛、嘴的開和閉等。其次,人臉還受到光照和復雜的背景的影響。人臉定位檢測是人臉識別的前期工作,所以人臉檢測與定位是人臉識別過程的一個重要環(huán)節(jié)。 (2)人臉的表征:確定表示檢測出的人臉和數(shù)據(jù)庫中的已知人臉的描述方式。通常表示的方法包括幾何特征(如歐
8、式距離、曲率、角度)、代數(shù)特征(矩陣特征向量)、固定特征模板、特征臉等。人臉圖像信息數(shù)據(jù)量巨大,為了提高檢測和識別的運算速度,提高圖像傳輸和匹配檢索速度,必須對圖像進行數(shù)據(jù)壓縮,降低向量維數(shù),即用盡可能少的數(shù)據(jù)表示盡可能多的信息。人臉表征在提取人臉特征的同時,也實現(xiàn)了對原始圖像的數(shù)據(jù)降維。 (3)人臉識別:就是將待識別的人臉與數(shù)據(jù)庫中的己知人臉進行比較,得出相關(guān)信息。這一過程的核心是選擇適當?shù)娜四槺硎痉绞胶推ヅ洳呗?。目前國?nèi)外研究人臉識別的方法層出不窮,根據(jù)人臉表征方式的不同常用的方法總體可以分為:基于幾何特征的識別方法、基于統(tǒng)計特征的識別方法和基于連接機制的識別方法。基于幾何特征的方法是通過
9、人臉面部拓撲結(jié)構(gòu)幾何關(guān)系的先驗知識,利用基于結(jié)構(gòu)的方法提取人臉面部主要器官特征,將人臉用一組幾何特征矢量表示。統(tǒng)計特征的識別方法將人臉用代數(shù)特征矢量來表示。代數(shù)特征有圖像本身的灰度分布決定,它描述了圖像的內(nèi)在信息。這種識別方法通過對圖像灰度進行各種代數(shù)變換和矩陣分解,從整體上捕捉和描述人臉的特征。連接機制的識別方法主要有彈性圖匹配方法,這類方法采用屬性拓撲圖代表人臉,它對光線、尺寸、角度具有一定的不變性,并能在一定程度上容忍表情和視角的變化。 (4)表情/姿態(tài)分析:即對待識別人臉的表情或姿態(tài)信息進行分析,并對其加以歸類。 (5)生理分類:即對待識別人臉的生理特征進行分析,得出其年齡、性別等相關(guān)
10、信息,或者從幾幅相關(guān)的圖像推導出希望得到的人臉圖像,如從父母圖像推導出孩子的臉部圖像、基于年齡增長的人臉圖像估算等。 13 論文組織結(jié)構(gòu) 本文的組織安排如下: 第一章 緒論 討論課題研究的背景歷史和研究內(nèi)容。 第二章 人臉識別綜述 主要介紹目前常用的人臉識別方法,按照識別特征的不同進行了分類綜述,討論各種方法的關(guān)鍵技術(shù)和優(yōu)缺點。 第三章 神經(jīng)網(wǎng)絡概述 闡述神經(jīng)網(wǎng)絡的基本理論和BP算法,討論將反向傳播神經(jīng)網(wǎng)絡應用于模式識別的理論。 第四章 基于子圖分割的人臉識別系統(tǒng) 詳細介紹子圖分割思想和本文提出的基于變異系數(shù)和奇異值分解的人臉識別方法,并介紹了人臉識別系統(tǒng)的整體結(jié)構(gòu)和程序的運行流程。 第五章
11、性能分析 融合子圖分割思想和人工神經(jīng)網(wǎng)技術(shù)分別對兩個算法進行了模擬實驗,給出實驗結(jié)果及針對實驗結(jié)果展開分析,根據(jù)分析結(jié)果對兩種算法的性能進行評價, 第六章 靜態(tài)人臉圖像識別演示系統(tǒng) 簡要介紹了作者基于VC+開發(fā)的靜態(tài)人臉圖像識別系統(tǒng)的設計與實現(xiàn)。 2. 人臉識別綜述 21 特征提取算法 211 基于幾何特征的方法 基于幾何特征的方法是早期的人臉識別方法之一8。常采用的幾何特征有人臉的五官如眼睛、鼻子、嘴巴等的局部形狀特征。臉型特征以及五官在臉上分布的幾何特征。提取特征時往往要用到人臉結(jié)構(gòu)的幾
12、何關(guān)系。識別所采用的幾何特征是以人臉器官的形狀和幾何關(guān)系為基礎的特征矢量,本質(zhì)上是特征矢量之間的匹配,其分量通常包括人臉指定兩點間的歐式距離、曲率、角度等。 文獻中記載最早的人臉識別方法就是Bledsoe提出的基于幾何特征的方法,該方法以面部特征點之間的距離和比率作為特征,通過最近鄰方法來識別人臉。以該方法建立的人臉識別系統(tǒng)是一個半自動系統(tǒng),面部特征點必須由人手工定位。也正是由于人工的參與,該系統(tǒng)對光照變化和姿態(tài)變化不敏感。 Kanade首先計算眼角、鼻子、嘴巴、下巴等面部特征之間的距離和它們之間的角度以及其它幾何關(guān)系,然后通過這些幾何關(guān)系進行人臉的識別工作。在一個20人的數(shù)據(jù)庫上識別率為45
13、%-75%。Brunelli和Poggio9通過計算鼻子的寬度和長度、嘴巴位置和下巴形狀等進行識別,在一個47人的人臉庫上的識別率為90%。然而,簡單模板匹配方法在同一人臉庫上的識別率為100。側(cè)影(Profile)識別10也是早期基于幾何特征人臉識別的一個重要方法,其基本原理是從人臉的側(cè)影輪廓線上提取特征點,將側(cè)影轉(zhuǎn)化為輪廓曲線,從中提取基準點。根據(jù)這些點之間的幾何特征來進行識別。由于側(cè)影識別相對較簡單且應用面小,對側(cè)影識別的研究較少。 基于幾何特征的方法非常直觀。識別速度快,內(nèi)存要求較少,提取的特征在一定程度上對光照變化不太敏感。但是,當人臉具有一定的表情或者姿態(tài)變化時,特征提取不精確,而
14、且由于忽略了整個圖像的很多細節(jié)信息,識別率較低,所以近年來已經(jīng)很少有新的發(fā)展。 目 錄 摘 要.I ABSTRACT.II 1. 緒論 1 11 課題研究背景 1 12 課題研究內(nèi)容 2 13 論文組織結(jié)構(gòu) 3 2. 人臉識別綜述 4 21 特征提取算法 4 211 基于幾何特征的方法 4 212 基于模型的方法 5 213 基于統(tǒng)計的方法 5 214 彈性圖匹配方法 6 22 基于三維數(shù)據(jù)的人臉識別的方法 7 221 基于曲率的方法
15、0;7 222 基于模型合成的方法 7 23 分類算法 7 231 基于神經(jīng)網(wǎng)絡的方法 7 232 多分類器集成方法 8 24 總結(jié) 8 3. 神經(jīng)網(wǎng)絡概述 10 31 人工神經(jīng)網(wǎng)絡概述 10 32 神經(jīng)元模型 10 33 BP神經(jīng)網(wǎng)絡分類器 11 331 BP神經(jīng)網(wǎng)絡模型 11 332 BP網(wǎng)絡學習算法 12 4. 基于子圖分割的人臉特征提取算法與人臉識別系統(tǒng) 15 41 子圖分割思想 15 42子圖分割與變異系數(shù)相結(jié)合的人臉特征提取算法
16、60;15 421變異系數(shù)的傳統(tǒng)意義及其在圖像處理中的應用 15 422變異系數(shù)的幾何意義及其在圖像處理中的應用 16 423變異系數(shù)的選取 18 43 子圖分割與奇異值分解相結(jié)合的人臉特征提取算法 20 431 奇異值的代數(shù)特性及其在圖像處理中的應用 20 432 奇異值的降維壓縮 21 433 奇異值的選取 22 44 系統(tǒng)框架 23 441 圖像預處理 23 442 特征提取算法中系數(shù)選取的方案 24 443 BP神經(jīng)網(wǎng)絡的結(jié)構(gòu)設計 25 5. 性能分析 27 51 人臉數(shù)據(jù)庫 27 52 實驗結(jié)果 28 6. 靜態(tài)人
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年基礎設施策劃實施合同樣本
- 2025年公路建設項目外包合同
- 跨邊緣消息同步機制-深度研究
- 法律援助服務與法律援助機構(gòu)-深度研究
- 2025年修理廠技術(shù)與服務人員聘用合同
- 2025年會員權(quán)益銷售與訂購合同樣本
- 2025年中等教育貸款合同樣式
- 2025年光伏組件購買與安裝合同模板
- 技術(shù)創(chuàng)新驅(qū)動發(fā)展-深度研究
- 2025年農(nóng)村信用社企業(yè)貸款合同范文
- 靜脈藥物配置中心課件
- DB11T 852-2019 有限空間作業(yè)安全技術(shù)規(guī)范
- 材料化學合成與制備技術(shù)
- 金屬工藝學(鑄造)課件
- DB23∕T 343-2003 國有林區(qū)更新造林技術(shù)規(guī)程
- 醫(yī)療廢物管理組織機構(gòu)架構(gòu)圖
- cjj/t135-2009《透水水泥混凝土路面技術(shù)規(guī)程》
- 短時耐受電流
- 社保人事專員績效考核表
- 上海世博會對上海城市競爭力影響的評估模型
- 河南書法家協(xié)會入會申請表
評論
0/150
提交評論