




已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
姓 名 吉林大學(xué) 分 類 號: * 單位代碼: 1 0 1 8 3 研究生學(xué)號: 密 級: 公 開 吉 林 大 學(xué) 碩士學(xué)位論文 基于 換與 P 者姓名: 專 業(yè): 研究方向: 指導(dǎo)教師: 培養(yǎng)單位: 2012 年 3 月 基于 換與 P 者姓名: 專業(yè)名稱: 指導(dǎo)教師: 學(xué)位類別: 工程 碩士 答辯日期: 2012 年 3 月 日 未經(jīng)本論文作者的書面授權(quán),依法收存和保管本論文書面版本、電子版本的任何單位和個人,均不得對本論文的全部或部分內(nèi)容進行任何形式的復(fù)制、修改、發(fā)行、出租、改編等有礙作者著作權(quán)的商業(yè)性使用(但純學(xué)術(shù)性使用不在此限)。否則,應(yīng)承擔(dān)侵權(quán)的法律責(zé)任。 吉林大學(xué)博士 (或碩士 )學(xué)位論文原創(chuàng)性聲明 本人鄭重聲明:所呈交學(xué)位論文,是本人在指導(dǎo)教師的指導(dǎo)下,獨立進行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的作品成果。對本文的研究做出重要貢獻的 個人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。 學(xué)位論文作者簽名: 日期: 年 月 日 中國優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫投稿聲明 研究生院: 本人同意中國優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫出版章程的內(nèi)容,愿意將本人的學(xué)位論文委托研究生院向中國學(xué)術(shù)期刊(光盤版)電子雜志社的中國優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫投稿,希望中國優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫給 予出版,并同意在中國博碩士學(xué)位論文評價數(shù)據(jù)庫和 列數(shù)據(jù)庫中使用,同意按章程規(guī)定享受相關(guān)權(quán)益。 論文級別:碩士 博士 學(xué)科專業(yè): 論文題目: 作者簽名: 指導(dǎo)教師簽名: 2012年 3 月 日 作者聯(lián)系地址(郵編):吉林大學(xué)計算機科學(xué)與技術(shù)學(xué)院 130012 作者聯(lián)系電話: 摘 要 基于 換與 隨著社會不斷的發(fā)展,各種身份認證的方法層出不窮, 給人們的生活帶來了極大的便利。 傳 統(tǒng)的身份認證手段 ,例如 ,口令,鑰匙等,本身存在著很多的不足,已經(jīng)不能滿足人們更高的需求。 而以人臉為代表的生物特征識別,由于使用方便且具有一定的穩(wěn)定性,越來越受到人們的歡迎。 本文對人臉識別做了比較深入的研究, 人臉識別的 具有很多重要的環(huán)節(jié),包括 人臉定位,圖像預(yù)處理和特征提取等,每一個環(huán)節(jié)都關(guān)系到最終的識別率。針對這些重要的環(huán)節(jié), 本文做了比較詳細的研究。 首先 ,針對人臉定位,本文對現(xiàn)有的人臉定位算法進行了 比較詳細的介紹,比較了他們的不足和各自的優(yōu)點,然后提出了一種基于 點 特征 的人臉定位算法,檢測人 臉的時候,先根據(jù)特征信息進行初定位,然后在定位好的區(qū)域進行精確定位,去除沒有人臉輪廓特征的區(qū)域 。實驗結(jié)果表明,該定位算法即使背景比較復(fù)雜,也能定位出比較 精確 的人臉區(qū)域。 然后, 我們將定位好的人臉區(qū)域進行圖像預(yù)處理,將人臉從空域變換到頻域, 頻域中高頻部分代表的是噪聲,低頻部分代表的圖像的基本信息,過濾掉高頻部分,保留低頻部分。我們采用 換進行 頻域變換,然后利用小波 分析 進行 降維。 最后,我們對 經(jīng)網(wǎng)絡(luò)的原理和學(xué)習(xí)規(guī)則做了詳細的介紹,提出了利用 臉庫上的實驗表 明,該方法的識別率達到了 96%,且結(jié)合 均能夠提高 2 個百分點。 關(guān)鍵詞: 人臉識別,人臉 定位, 經(jīng)網(wǎng)絡(luò) , 小波 分析 I P s of s of to s of D of of s it is to a of a on on We a on of of we of of on we a We by by is we do on is to of is on of so we to we a on P BP to on RL 6%. P P %. 錄 第 1 章 緒 論 . 1 研究背景及意義 . 1 研究現(xiàn)狀 . 3 本文的主要工作和內(nèi)容安排 . 4 本文的主要工作 . 4 本文的內(nèi)容安排 . 4 第 2 章 人臉檢測 . 6 引言 . 6 人臉檢測方法概述 . 6 基于模板匹配的算法 . 7 基于知識的算法 . 9 基于學(xué)習(xí)的算法 . 11 基 于 點特征的人臉檢測 . 14 基于 視頻編程 . 14 基于 點特征進行人臉檢測 . 15 人臉歸一化處理 . 19 本章小結(jié) . 20 第 3 章 人臉預(yù)處理 . 21 引言 . 21 波器 . 21 波器對人臉進行變換 . 23 小波分解降維 . 24 小波變換定義 . 25 小波分解降維 . 26 本章小結(jié) . 27 第 4 章 人臉識別 . 28 引言 . 28 神經(jīng)網(wǎng)絡(luò)簡介 . 28 經(jīng)網(wǎng)絡(luò)的發(fā)展史 . 29 經(jīng)網(wǎng)絡(luò)的應(yīng)用領(lǐng)域 . 30 經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和類型 . 30 . 32 P 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) . 32 P 神經(jīng)網(wǎng)絡(luò)的工作原理 . 33 絡(luò)的學(xué)習(xí)規(guī)則 . 35 經(jīng)網(wǎng)絡(luò)算法設(shè)計 . 36 法的流程及主要代碼實現(xiàn) . 37 實驗 . 39 本章小結(jié) . 40 5 章 總結(jié)與展望 . 41 總結(jié) . 41 展望 . 42 參考文獻 . 43 致 謝 . 45 第 1 章 緒 論 1 第 1 章 緒 論 研究背景及意義 進入新世紀 , 科學(xué)技術(shù)有了非常大 的發(fā)展, 各行各業(yè)都有了 新的面貌 。 現(xiàn)在,人們的 日常生活越來越離不開 互聯(lián)網(wǎng)了 , 在互聯(lián)網(wǎng)如此發(fā)達的今天,人們最關(guān)注的就是自己的信息安全, 信息 安全是一個 研究 非常廣泛的領(lǐng)域, 包括數(shù)據(jù)加密、解密, 各種安全協(xié)議和機制,其中任何一個安全漏洞的發(fā)生,都有可能 造成極大地損失。特別在身份 識別 ( 和 認證 ( 領(lǐng)域, 身份認證失誤可能 導(dǎo)致冒領(lǐng)巨額資產(chǎn), 對社會經(jīng)濟秩序和安全造成了嚴重的 影響 。 身份識別和 認 證是信息安全領(lǐng)域中一個重要 的分支,有很多學(xué)者 在這個領(lǐng)域進行研究 1 傳統(tǒng)的身份 識別手段主要借助 磁卡、 用戶名與密碼、 鑰匙 等 。 我們知道, 磁卡在現(xiàn)實生活中很常見 , 例如 款機取錢時,用的銀行卡 , 只認磁卡和密碼,磁卡 容易遺失,密碼容易暴露或者被暴力破解 。 我國的相關(guān)統(tǒng)計表明,在 2011 年下半年,全國各級公安機關(guān) 立案 銀行卡案件達到了 9200 余起,涉案的金額達到了 72 億元人民幣 , 由此可見,傳統(tǒng)的銀行卡身份認證手段的缺陷,導(dǎo)致國內(nèi)外蒙受了很大的經(jīng)濟 損失 3; 用戶名與密碼是很常見的身份認證手段,各大門戶網(wǎng)站或者社交軟件都提供在線 用戶 功能,通過登錄就能享受到各種網(wǎng)絡(luò)服務(wù) ; 鑰匙是最傳統(tǒng)的 身份認證手段, 但是它很容易遺失 ,給用戶造成了很多不便 生物特征識別的 研究目的 就是要解決這些問題 。 生物特征識別系統(tǒng)能夠通過人的 生理 特征 或行為特征 進行身份自動識別 , 生理特征包括 人臉、虹膜、指紋、掌握、視網(wǎng)膜以及聲音等等, 行為特征包括步態(tài)、 擊鍵習(xí)慣、個性簽名等等,如圖 示 。 這些特征在不同人之間,具有獨一無二的特點,因此可以用來 鑒別人的身份 。 第 1 章 緒 論 2 圖 物特征 相對傳統(tǒng)的身份認證手段, 生物 特征 識別 技術(shù) 進行人份認證 的優(yōu)勢有 7 (1) 方便 快捷 。生物特征隨身攜帶,用戶不再擔(dān)心遺失磁卡和鑰匙,只需要用相應(yīng)的傳感器采集生物特征即可 ; ( 2) 可靠性高 。 生物識別系統(tǒng)不存冒名頂替現(xiàn)象, 能夠 保證 所有的身份認證行為都是本人 真實意愿在執(zhí)行,具有 很 高的精確度和 很高的可靠性 ; 生物特征還具有相對較高的穩(wěn)定性; ( 3) 具有唯一性 。 生物特征不容易偽造,特別是活體檢測技術(shù)的興起,更加 保證了 的生物 特征的唯一性 ,人與生物特征真正做到一一對應(yīng) ,而傳統(tǒng)的身份認證手段很容易偽造 。因此, 生物識別技術(shù)越來越受到人們的歡迎 和市場的認可 ,各種生物識別系統(tǒng)應(yīng)運而生 。 2008 年北京奧運會期間,在 鳥巢和水立方的所有入口處,都安置了中科院 自動化所研制的人臉識別系統(tǒng),運動員入場時,必須通過該系統(tǒng)的檢測; 公安部門的指紋識別系統(tǒng)已經(jīng)非常成熟,在刑偵破案過程中發(fā)揮著極大地作用 ; 下的 列手提電腦,均添加了 指紋登錄功能 ;美國北卡羅來納州的夏洛特道格拉斯機場與 2000 年 5 月率先啟用了虹膜識別系統(tǒng), 對機組人員和機場職工進行身份驗證,隨后在英國、香港、迪拜都普遍使用 。 生物識別系統(tǒng)首先采集一組特征樣本,例如 拍攝一張人臉照片 進行人臉識別 ,或者 記錄聲音信號 進行 語音識別 ,這些樣本經(jīng)過一系列的數(shù)學(xué) 函數(shù)進行轉(zhuǎn)換,包括去除噪音、信息預(yù)處理、特征提取等等,其中比較關(guān)鍵的步驟是特征提取,特征提取就是將 經(jīng)過預(yù)處理的原始樣本進行降維 , 提取最能夠顯著區(qū)別于其他樣本的 特征信息 。然后將這些特征信息與數(shù)據(jù)庫中已經(jīng)保存著的信息進行匹配,決策出該樣本從屬于哪一個 分類,該分類即為 最終的識別身份 。 大多數(shù)的 生物識別系統(tǒng)具有兩個分系統(tǒng),即登記系統(tǒng)和識別系統(tǒng) 。登記系統(tǒng)用來 在數(shù)據(jù)庫中 添加身份 信息 ,識別系統(tǒng)采集人相應(yīng)的生物特征,與數(shù)據(jù)庫中信息對比,進行身份識別 。 一種 理想的生物特征 歸結(jié)起來應(yīng)該有 4 大 特點 9; (1)普遍性:每個人都有這 一特第 1 章 緒 論 3 征 ,先天畸形或后天受到傷害的除外 ; ( 2)高度的唯一性:這樣就能保證兩個人擁有一樣的特征的幾率 微乎其微;( 3)穩(wěn)定性 : 這樣,隨著時間的推移,特征不會改變 ;( 4) 容易采集 :這樣用戶使用起來就方便,也不會造成采集 不完整 的現(xiàn)象 。 基于以上原因,本文選擇使用了 人臉作為生物特征進行識別。 研究現(xiàn)狀 在過去的幾十年 ,有很多專家學(xué)者 在人臉識別領(lǐng)域進行了深入的研究, 他們對人臉識別做了大量的基礎(chǔ)性的研究工作, 使得人臉識別有了很大的進展, 人臉 識別 系統(tǒng)的 各項 性能有了很大 幅度 的提高, 這些提高的指標(biāo)包括 精度 、速率、 存儲代 價以及魯棒性 等等 。 國內(nèi)外對人臉識別的研究都取得了很高的成就 , 本小節(jié) 主要介紹了人臉識別的研究現(xiàn)狀。 人臉識別的研究主要分為三個階段。 第一個階段主要研究人臉的面部特征,具有代表性的人物有 。0提出用簡單的語句與數(shù)據(jù)庫中的人臉 相 關(guān)聯(lián), 該系統(tǒng)中, 同時 還 擁有 指紋信息, 整個系統(tǒng)用人臉和指紋進行雙重認證。 1給人臉做了一個非常逼真的描寫 ,對人臉上 各個器官進行模擬 和定位, 提取這些部位的特征, 并用計算機實現(xiàn)了這一個算法, 有了比較好的識別效果。 這一個 階段還不 是自動的識別階段,而是一個 人工階段。 第二個階段的人臉識別是人機交互的識別階段, 這期間, 2和 3提出用幾何特征描述人臉的特征, 他們在實驗過程中用到的是人臉的正面照片, 用 21維的向量 表示人臉的特征,用歐式距離將這些 特征向量進行匹配, 決策出最終的識別結(jié)果。 該系統(tǒng)實現(xiàn)了自動化的識別,是一個 非常有意義的系統(tǒng)。 4等用積分投影法對人臉進行特征提取 ,然后與數(shù)據(jù)庫中的特征進行匹配。 u15等對 法以及 法進行了詳細的推導(dǎo),指出了他們的不 足,提出了一種改進的 法進行人臉識別,取得了很高的識別率。 第三階段有了很大的 進步,實現(xiàn)了完全的自動化識別 16首先人臉圖像能夠?qū)崟r的從攝像機中提取出來, 實現(xiàn)多個機器自動識別。 這一階段相關(guān)的人臉識別算法可以分為如下幾類:基于特征臉的識別算法,基于 人臉低頻帶的識別算法,基于神經(jīng)網(wǎng)絡(luò)的人臉識別算法,基于支持向量機的人臉識別算法,基于幾何特征與 模板匹配的算法等。其中,基于特征臉的算法主要用了傳統(tǒng)的 法,用 取特征臉或者用 法提取 ;基于人臉低頻帶的識別算法將 人臉從空域變換到頻域, 然后過濾掉高頻部分,因為高頻部分代表的是人臉的噪聲信息,保留低頻部分,第 1 章 緒 論 4 在低頻部分進行人臉識別 ;基于神經(jīng)網(wǎng)絡(luò)的人臉識別算法一直處在研究的過程中,由于神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)非線性可分,因此也能識別不同類別的人臉; 基于支持向量機的人臉識別算法 利用了支持向量機對高緯度的人臉空間進行劃分,劃分到各個類別;基于幾何特征與模板匹配的算法 就是在傳統(tǒng)幾何特征算法的基礎(chǔ)上進行了改進,引入了模板機制,在模板范圍內(nèi)進行特征提取及后續(xù)的人臉識別。 本文的主要工作和內(nèi)容安排 本文的主要工作 在 人 臉識 別的研究過程中, 如果提高 人臉 識別 系統(tǒng)的速率和精度,仍然是大多數(shù)研究人員 一直以來非常關(guān)注的問題 。 本文在 前人的研究成果基礎(chǔ)上,做了大量的工作,主要 如下 : 1、 人臉定位 。 人臉定位是人臉識別的重要環(huán)節(jié),本文首先對人臉定位的現(xiàn)有算法做了詳細的介紹,指出了這些算法的不足之處,然后提出了一種基于 點特征的人臉定位算法, 該算法在定位時間和精度方面,比以前的算法有了很大的提高和進步。 2、人臉預(yù)處理。本文提出將定位好的人臉進行預(yù)處理,預(yù)處理主要包括將人臉從空域變換到 頻域范圍, 經(jīng)過濾波處理,就能保留頻域中大量的低頻 部分,去掉高頻部分, 這樣就能去掉 噪聲部分。 保留下來的低頻部分轉(zhuǎn)換到空域,這樣一來, 維度顯著增大,本文提出了 用小波分析的算法進行降維處理,最后將所有的人臉處理到歸一化的尺度。 3、利用 經(jīng)網(wǎng)絡(luò)進行人臉識別。本文首先介紹了神經(jīng)網(wǎng)絡(luò)的原理和學(xué)習(xí)方法,然后提出將 臉庫分為測試集合與訓(xùn)練集合,訓(xùn)練 集合用來 訓(xùn)練 經(jīng)網(wǎng)絡(luò),在訓(xùn)練好的 經(jīng)網(wǎng)絡(luò)基礎(chǔ)上, 用測試集合進行測試。 通過大量的實驗來評估算法的有效性。 本文的內(nèi)容安排 本文 各章內(nèi)容安排如下: 第一章, 緒論:主要介紹人臉識別的研究現(xiàn)狀及意義 。 第二章, 人臉定位 : 人臉定位是人臉識別的重要環(huán)節(jié),首先介紹了現(xiàn)有的人臉定位算法,然后提出了一種基于 點特征的人臉定位算法,利用 現(xiàn),然后在人臉定位時做了大量的定位實驗。 5 第三章, 人臉預(yù)處理 : 本文提出了利用 后 用小波變換進行人臉降維 ,達到合適的尺寸后, 就能在保留 人臉的基本信息的同時,達到減少后續(xù)神經(jīng)網(wǎng)絡(luò)計算量的目的。 第四章, 人臉 識別 : 在人臉識別階段,本文對神經(jīng)網(wǎng)絡(luò)的原理和學(xué)習(xí)方法進行了 詳細的介紹,由此而引出 經(jīng)網(wǎng)絡(luò) 的學(xué)習(xí)和訓(xùn)練算 法, 經(jīng)網(wǎng)絡(luò)用來識別人臉。本章在末尾部分做了大量的實驗,實驗進行在 臉庫上, 比較了不進行 換和進行 換的識別率差別。 第五章, 總結(jié)及展望: 對本文工作 的主要貢獻做了總結(jié),并提出了下一步的研究方向和展望 。 第 2 章 人臉檢測 6 第 2 章 人臉 檢測 引言 人臉檢測是 人臉識別系統(tǒng)的重要組成部分, 人臉檢測就是要在人臉圖像中確定出來 人臉的大小 和位置 ,從而去除圖像的無效區(qū)域,給后續(xù)的識別過程帶來了很大的好處 。 近幾年來,國家對信息安全、電子商務(wù)、身份認證領(lǐng)域的投入大大增加, 各種生物識別系統(tǒng)都在緊密的研制 , 而以人臉為特征的生物識別系統(tǒng) 在所有單 生物 識別系統(tǒng)中占有的比重最大, 得到了更多的關(guān)注,這是因為 相對其它生物特征而言, 人臉具有采集方便、非接觸和強大的事后追蹤能力等優(yōu)點, 因此, 人臉識別系統(tǒng)是最優(yōu)潛力的生物識別系統(tǒng)。 凡是做人臉識別系統(tǒng) 的 研究,必然離不開 人臉檢測的研究, 人臉檢測要求對環(huán)境有比較高的魯棒性,不同背景 和光照條件下,也能夠 檢測出人臉的位置和大小。 人臉檢測作為一個獨立的課題開始于上世界 90 年代, 隨著研究的深入,人臉檢測 已經(jīng)有了極大的發(fā)展,已經(jīng)不再局限于只為識別而檢測,檢測的應(yīng)用 已經(jīng)滲入到了很多具有實際意義的應(yīng)用領(lǐng)域 ,例如智能監(jiān)控系統(tǒng),能夠鎖定 嫌疑目標(biāo)然后進行跟蹤,給安全部門帶來了很大的幫助;再例如基于內(nèi)容的檢索, 傳統(tǒng)的圖像檢測是基于標(biāo)簽的, 檢索得合理與否完全在于標(biāo)簽與 圖像所表達的內(nèi)容是否吻合 , 而基于內(nèi)容的檢索,是實實在在的 根據(jù)圖像內(nèi)容進行檢索的, 得到的結(jié)果 具有更高的可信度;同時,基于視頻內(nèi)容的檢索也在大力的研究過程中。 本章的主要工作是,首先對已有的人臉檢測算法做了描述, 比較了它們各自的優(yōu)點和不足, 然后提出了 一種改進的人臉檢測 算法,最后在該算法上做了大量的檢測實驗,驗證了算法的 有效性 。 人臉檢測方法概述 人臉 有比較復(fù)雜的模式, 準確定位人臉不是一件 簡單的事 ,但是人臉 有很多可以利用的信息 ,我們可以從這些信息找突破口, 利用好這些信息,就可以定位人臉。經(jīng)過閱讀大量的文獻,本文將人臉檢測 算法分為三個類別, 分別是:基于模板匹配的算法, 基于知識的算法和基于學(xué)習(xí)的算法 。 下面我們予以詳細介紹 。 第 2 章 人臉檢測 7 基于模板匹配的算法 這類算法 首先要 確立一個 人臉 模板 ,如圖 示, 模板中包含了 人臉的部分或全部結(jié)構(gòu)信息, 然后 將此模板與輸入的圖像進行匹配操作, 將人臉模板不斷在圖像中搜尋可能的 人 臉 區(qū)域,進行度量計算 ,以度量值最小的作為候選人臉區(qū)域,然后用矩形 標(biāo)志出來。一般而言,這類算法 由于要全局的搜索,速度要慢些,但是精度相對比較高。 圖 人臉模板 示意圖 由以上分析我們可以 知道, 基于模板匹配的算法本質(zhì)是 計算 人臉模板 與 圖像 候選區(qū)域 的差異值, 將差異值比較小的作為 人臉候選區(qū)域, 保持下來, 隨后,對保存下來的 候選區(qū)域進行閾值篩選, 在閾值范圍內(nèi)的 ,即可認為是 人臉區(qū)域。 這種算法比較簡單,也很直觀,如果人臉模式很復(fù)雜,或者人臉的背景很復(fù)雜,可能就不能用單一模板 確定人臉的位置了,我們需要用多個人臉 模板 相互 作用, 以定位出相對比較穩(wěn)定的人臉位置。 文獻 21采用了 一種多關(guān)聯(lián)的人臉檢測模板, 用到了 不同長寬比例的人臉膜拜和一個眼睛模板, 在人臉定位的時候,首先用眼睛模板定位出 眼睛的候選區(qū)域,確定出人臉的眼睛所在處,然后借助 人眼和人臉的比例關(guān)系和結(jié)構(gòu)特征,在人眼附近搜尋可能的人臉區(qū)域, 借助 第二個人臉模板進行匹配計算 ,確定出 有效的人臉區(qū)域,最后,將這些 人臉區(qū)域進行邊緣提出操作,根據(jù)二值化輪廓確定最后的人臉位置。 該算法由于用到了不同長寬比例的人臉模板,所以解決了 不同尺度或者分辨率情況下的 人臉檢測問題 。 文獻 22利 用 模板算法, 首先 將圖像變換到低分辨率上面,在此 圖像上定位出頭部區(qū)域 , 將頭部區(qū)域的邊緣連接起來,然后將圖像變換到高分辨率上,這樣就能夠定位出 更加清晰的頭部區(qū)域, 再次將頭部輪廓勾勒出來,接著利用人臉的 結(jié)構(gòu)信息第 2 章 人臉檢測 8 進一步定位出人眼區(qū)域、鼻子區(qū)域和嘴巴區(qū)域,這樣最后就能夠定位 整個人臉區(qū)域。文獻 23采用了一種結(jié)合 模板匹配和 法的方法定位人臉, 該文獻將人臉看 作橢圓 ,首先得到邊緣的人臉區(qū)域 ,然后將這些邊緣人臉區(qū)域與 橢圓進行匹配, 最相似的 即為人臉區(qū)域。 文獻 13提出了一種稱為可變形的模板算法, 這種算法 定位非 常精準,能夠?qū)⑷四樕虾芏嗥鞴僖簿_的定位出來 。它的思想是,對人臉上 的嘴巴、鼻子和眼睛賦予合適的參數(shù)值 ,用一些簡單的曲線進行描繪出來。如圖 眼睛和 嘴巴的模板。 圖 睛和嘴巴的模板 眼睛可以用兩條拋物線和一個圓進行描繪,嘴巴可以用 連個拋物線進行描繪, 這些簡單幾何曲線的 參數(shù)可以很容易的獲取。 與此同時, 該算法還定義了一些能量函數(shù) ,這些能量函數(shù) 與圖像中的邊緣信息、峰值和谷值信息相關(guān)聯(lián) 。在定位人臉圖像時,操作步驟為:首先將模板 在圖像中進行移動,以搜索出可能的 人臉區(qū)域,邊搜索邊計算能量函數(shù), 同時也 對 能量函數(shù)進行修改,知道達到函數(shù)值最小, 即為 變形模板 在 圖像中找到了最佳的 匹配 人臉區(qū)域。 變形模板算法利用了人臉的全局信息, 因此在定位時具有比較好的精度,但是另一方面,變形模板由于利用了多個 局部 模板, 局部模板在初始化時候,比較難以確定初始位置,這可能在定位時陷入了局部極小值的情況 。 同時,該方法也會面臨 計算量過大的問題。 針對該問題, 文獻 11對 可變形模板進行了 改進,改進的方式依賴于一下幾個方面: 1) 增加可變形模板。原來的可變形模板主要有眼睛,鼻子和嘴巴,現(xiàn)在可以增加額頭,面部輪廓以及下巴等,以期進一步提高定位精 度。 2) 對能量函數(shù)進行修正,在定位時,可以提高計算 效率 。 3) 匹配的方式進行必要的修正。例如可以利用 基于區(qū)域的策略進行 修正,或者利用 自適應(yīng)傅里葉變換的策略進行修正。 4) 改進模板初始的位置的計算的方法和策略。我們在前面的 分析中知道, 初始位置很重要,它可以避免陷入局部極小值問題, 因此,可以考慮使用數(shù)學(xué)形態(tài)濾波器的算法進行改進,角點檢測也是一個很理想的方法,后續(xù)的兩種方法均可以 避免陷入局部極小值。 第 2 章 人臉檢測 9 基于知識的算法 基于知識的算法是一種非常直接的算法,所謂的知識 22,即是人臉的先驗信息,我們知道, 盡管人 臉非常復(fù)雜,但是 這些復(fù)雜組成部分有非常嚴格的 約束性,也即是,人臉 的器官 在空間分布上有一定的約束 。人臉, 從上到下,擁有三庭五眼, 對人臉進行正面拍照的時候, 人臉是橢圓形的, 并且左右對稱, 面部皮膚平坦,有嚴格按照規(guī)則分布的器官,最上面是眉毛,隨后是眼睛,隨后是鼻子,隨后是嘴巴, 最后是下巴。其中,這些器官的顏色比較暗,而皮膚的顏色比較 亮 , 這些都是基于人臉的知識,可以利用這些知識來對人臉進行定位 。 雖然這種定位思想比較簡單,符合人們?nèi)粘I钪姓J識的規(guī)律, 但是要用這些知識規(guī)則去設(shè)計一種定位所有人臉的算法,不是一件很簡 單的事情, 非常困難,甚至是不可能達到的事情, 例如,現(xiàn)在定義了一個知識規(guī)則 檢測 人臉, 如果這個規(guī)則足夠嚴格,那么能夠保證定位的區(qū)域是人臉的可能性很大,但是,人臉稍微有點微笑或者變化,就會 定位不出來該人臉;如果該規(guī)則很 寬松, 那么 會有很多不是人臉的區(qū)域被認為是人臉區(qū)域了,出現(xiàn)誤檢測現(xiàn)象很嚴重。 下面分別對三種常用的方法予以 介紹。 1) 基于人臉器官分布檢測人臉。 從上面的分析我們知道,人臉的器官雖然復(fù)雜,但是 分布 卻很規(guī)律 , 可用積分投影的算法和 五官分布的先驗知識 相互結(jié)合的方式進行定位。積分投影即對可能存在人臉的圖像 進行邊緣提取操作,然后 在該邊緣提取的 圖像上進行 水平和垂直方向的 積分投影。文獻 1819給出了比較詳細的操作步驟, 眼睛部分由于有豐富的特點,特別是在水平部分, 所以可以首先定位出眼睛的位置,然后依據(jù)眼睛的位置,定位出其它的部位 。也有相關(guān)文獻提出了依據(jù)人臉是軸對稱的 知識,首先用 積分投影定位出人眼左半部分 的 人眼、 鼻子和嘴巴, 然后根據(jù)對稱的性質(zhì)可以 定位出 整張人臉。也有文獻用廣義的對稱變換理論定位人臉, 首先檢查圓形區(qū)域的對稱性, 如果該圓形區(qū)域是對稱的,那么 可以在該圓形區(qū)域繼續(xù)尋找其他的器官, 從而確定是否是真正的人 臉區(qū)域,這樣就能得出檢查結(jié)果。 2)基于 人臉圖像空間分布的人臉 檢測 所有的人臉都有獨特 而又相似 的 空間分布 , 這種空間分布又稱為圖像不變性 。同時,人臉的亮度分布也有一定的規(guī)律性, 所以不管 圖像 背景如何復(fù)雜,人臉部分的灰度分布是不變化的 。文獻 17利用圖像的彩色空間信息對人臉中的嘴巴、眼睛等器官進行定位, 這種定位和一般的顏色坐標(biāo)是不同的,他們將 圖像轉(zhuǎn)換到 標(biāo)系和標(biāo)系, 進行定位。 我們知道,人臉圖像中,灰度值有一定的分布規(guī)律, 其中 嘴巴的唇部比其他部分有 更高的 Q 值分布,而人眼中的皮膚區(qū)域, 相對其他部分 而言,在 I 和 H 上的分量 顯示在直方圖顯示過程中,有非常理想和清晰的波峰值,這些都給利用人臉的空間分布的檢測帶來了基礎(chǔ)知識,我們可以利用這些特點進行很好的人臉第 2 章 人臉檢測 10 檢測 和定位 。同時,將這些信息與眼睛部分和嘴巴部分在一張人臉上的分布位置的相對關(guān)系進行結(jié)合,就能夠很順利的檢測到這些器官了,這樣也能很順利的定位出人臉。文獻 18采用了一種灰度級相關(guān)矩陣的算法,用這種算法能夠在即是背景非常復(fù)雜的圖像中也能定位 出 人臉來 。也有一些文獻對不同人群和種族的人進行了 研究和統(tǒng)計,他們認為同一個種族的人能在復(fù)雜背景中分辨出來,而不同種族 的人相對比較困難,為了解決這一問題,他們提出了利用膚色模型來表示人臉的顏色, 以此進行復(fù)雜的人臉的定位。 3)基于馬賽克的算法檢測人臉 馬賽克就是將圖像進行不同 分辨率的變換, 這樣圖像 就有從低到高的分辨率,首先在 低 分辨率上定位出候選的人臉區(qū)域,然后在高分辨率上 對人臉進行更精確的定位 。文獻 23采用了三層的檢測系統(tǒng) 對人臉進行定位 , 第一層 用分辨率為 4*4 的馬賽克進行檢測,第二層用 8*8 分辨率的馬賽克定位,第三層在前兩層的基礎(chǔ)上 進一步進行精確的定位, 過程示意圖為 示 , 另外, 檢測人臉大致位置的流程圖如圖 。 圖 賽克算法檢測人臉流程 第 2 章 人臉檢測 11 圖 馬賽克算法 定位人臉 基于學(xué)習(xí)的算法 基于學(xué)習(xí)的算法主要有兩種算法,一種是特征臉?biāo)惴ǎ硪环N是人工神經(jīng)網(wǎng)絡(luò)算法。 下面我們予以分辨的介紹。 1)基于特征臉的人臉定位算法 第 2 章 人臉檢測 12 特征臉?biāo)惴ㄊ怯擅绹?究員提出來的 15, 最初,該算法是用來進行人臉識別 的, 后來由于它的優(yōu)良性能,在人臉檢測領(lǐng)域中也能得到良好的應(yīng)用。 該算法將人臉圖像看做一個比較大的矩陣,然后將該矩陣 展開成為 一維 的 向量 , 所有的 圖像經(jīng)過這種轉(zhuǎn)換,合并一維向量后,得到一個新 的更大 矩陣, 對該矩陣求取特征值,將特征值從大到小的順序進行排列,取前 M 個 特征值對應(yīng)的特征向量,這樣將這些特征向量合并就得到了一個稱之為 映射矩陣 。 將所有的 可能存在 人臉的區(qū)域 經(jīng)過 該映射矩陣轉(zhuǎn)換后, 得到一個新的特征向量, 將該 特征向量與數(shù)據(jù)庫中可能存在的特征向量進行比較, 如果比較結(jié)果 在閾值范圍內(nèi),就認為該區(qū)域是人臉區(qū)域,否則不認為是人臉的區(qū)域。 2) 基于 神經(jīng)網(wǎng)絡(luò) 的人臉定位算法 我們知道, 神經(jīng)網(wǎng)絡(luò)具有比較強的記憶功能, 能夠 對 非常復(fù)雜的問題進行分類,達到識別或者 檢測的效果, 特別是訓(xùn)練樣本比較全面的時候,能處理更多的 更復(fù)雜的問題, 人臉檢測也能夠在這個時候得到很好的檢測效果 ,所以 神經(jīng)網(wǎng)絡(luò)不但能夠檢測人臉,還能 夠 檢測出更多的更為復(fù)雜的模式 。 例如,人臉模式,眼睛模式和嘴巴模式等等,這些模式有比較明顯的模式,因此, 能夠 利用神經(jīng)網(wǎng)絡(luò)進行檢測 。 神經(jīng)網(wǎng)絡(luò)分為好幾種方法, 有多層的神經(jīng)網(wǎng)絡(luò),也有單層的神經(jīng)網(wǎng)絡(luò),有前
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 并購交易結(jié)構(gòu)設(shè)計-洞察及研究
- 廈門疏散人群管理辦法
- 數(shù)字化領(lǐng)導(dǎo)力研究述評與未來發(fā)展趨勢探討
- 人工智能發(fā)展路徑中的自主研發(fā)機器人技術(shù)突破
- 內(nèi)控文件歸類管理辦法
- 新時期文學(xué)作品中的父子關(guān)系探析
- 制定管理辦法技巧包括
- 《宏觀經(jīng)濟分析:貨幣供應(yīng)、價格與匯率的實證研究》
- 全面質(zhì)量控制流程與程序手冊
- 信息經(jīng)濟學(xué)理論框架及其在數(shù)字經(jīng)濟中的應(yīng)用研究
- T/DZJN 03-2019即熱式飲水電加熱器具能效限定值及能效等級
- 2025年調(diào)解員職業(yè)技能考試試卷及答案
- 噴粉技術(shù)質(zhì)量協(xié)議書
- 2025年自考有效溝通技巧試題及答案
- 商場物業(yè)外包合同協(xié)議
- 2025民宿租賃合同標(biāo)準范本
- 云倉公司規(guī)章管理制度
- 2025年小學(xué)數(shù)學(xué)新教材培訓(xùn)
- 某單位推行6S管理細則
- 學(xué)校物業(yè)管理與師生滿意度分析總結(jié)
- 《基于Arduino UNO R3平臺的具備自主循跡和自主避障功能的智能小車設(shè)計》11000字(論文)
評論
0/150
提交評論