基于圖像特征的人眼定位畢業(yè)論文_第1頁(yè)
基于圖像特征的人眼定位畢業(yè)論文_第2頁(yè)
基于圖像特征的人眼定位畢業(yè)論文_第3頁(yè)
基于圖像特征的人眼定位畢業(yè)論文_第4頁(yè)
基于圖像特征的人眼定位畢業(yè)論文_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 PAGE34 / NUMPAGES34容摘要人臉識(shí)別是人類視覺(jué)最杰出的能力之一,它的研究涉與模式識(shí)別、圖像處理、生理,心理學(xué)、認(rèn)知科學(xué),和基于其它生物特征的身份鑒別方法以與計(jì)算機(jī)人機(jī)感知學(xué)交互領(lǐng)域都有密切聯(lián)系其中人眼的識(shí)別是計(jì)算機(jī)人臉識(shí)別和智能監(jiān)控中的重要部分。本文所研究的人眼識(shí)別對(duì)象都是針對(duì)單人正面或半側(cè)面圖像。該文提出了一種基于最大類間方差閾值分割和灰度積分投影技術(shù)的眼睛定位方法。首先通過(guò)圖像預(yù)處理技術(shù)中的中值濾波方法去除圖像噪聲,并通過(guò)非線性變換消除人臉圖像因?yàn)槠毓鈼l件不同而造成的模糊,得到灰度分配較為均勻的圖像,然后利用最大類間方差閾值法對(duì)圖像進(jìn)行二值化處理,將特征點(diǎn)從人臉圖像分割出

2、來(lái),并分別利用水平和垂直灰度積分投影曲線結(jié)合人臉的結(jié)構(gòu)特征找到眼睛的位置坐標(biāo),實(shí)現(xiàn)了準(zhǔn)確的眼睛定位,從而為進(jìn)一步提取其它特征點(diǎn)打好了基礎(chǔ)。關(guān)鍵詞: 特征提??;眼睛定位;積分投影;閾值分割A(yù)bstractComputer face recognition is a very active area of research inrecent years.Its applications range is very wide,such as identityauthentication in safety system,video surveillance,target identification

3、and tracking,as well as facial expression analysis,age analysis,lipreading and so on. compared with mouth and nose,Eyes are the mostsignificant features of the face. which can provide more reliable,moreimportant message,so eye detection is often necessary to dispose in facerecognition.An algorithm f

4、or eyes location ispresented in thispaper based onmaximum variance between two classes and gray- level integration projection. First, median filter is used to eliminate the noise, then the image blurcaused by deficient exposal is cleared up using non - linear transform. Maximum variance between two

5、classes isprovided to get the binary image, and then the features are extracted from the image. Finally, by thewayof gray-levelintegration projection and human face configuration, we caneasily find that the location of eyes is determined by thecoordinate of theminimum in the diagram. Further feature

6、 detection can be done based on this result.KEYWORDS:Feature extraction; Eye location; Integration projection; Threshold segment目 錄 TOC o 1-3 h z u HYPERLINK l _Toc199678772目錄 PAGEREF _Toc199678772 h 3HYPERLINK l _Toc199678773第一章緒論 PAGEREF _Toc199678773 h 4HYPERLINK l _Toc1996787741.1 課題的背景和意義 PAGER

7、EF _Toc199678774 h 4HYPERLINK l _Toc1996787751.2 論文的主要容 PAGEREF _Toc199678775 h 7HYPERLINK l _Toc199678776第二章圖像預(yù)處理基本知識(shí) PAGEREF _Toc199678776 h 9HYPERLINK l _Toc1996787772.1 圖像灰度變換 PAGEREF _Toc199678777 h 9HYPERLINK l _Toc1996787782.1.1 圖像的灰度化 PAGEREF _Toc199678778 h 10HYPERLINK l _Toc1996787792.1.2

8、圖像灰度求反 PAGEREF _Toc199678779 h 11HYPERLINK l _Toc1996787802.1.3 圖像灰度拉伸 PAGEREF _Toc199678780 h 12HYPERLINK l _Toc1996787812.2 圖像平滑去噪 PAGEREF _Toc199678781 h 13HYPERLINK l _Toc1996787822.2.1 概述 PAGEREF _Toc199678782 h 13HYPERLINK l _Toc1996787832.2.2 圖像噪聲分類 PAGEREF _Toc199678783 h 13HYPERLINK l _Toc1

9、996787842.2.3 圖像系統(tǒng)噪聲的特點(diǎn) PAGEREF _Toc199678784 h 14HYPERLINK l _Toc1996787852.2.4 均值濾波 PAGEREF _Toc199678785 h 15HYPERLINK l _Toc1996787862.2.5 中值濾波 PAGEREF _Toc199678786 h 16HYPERLINK l _Toc1996787872.3 直方圖均衡化 PAGEREF _Toc199678787 h 17HYPERLINK l _Toc1996787882.4 圖像二值化 PAGEREF _Toc199678788 h 19HYP

10、ERLINK l _Toc199678789第三章人眼定位算法 PAGEREF _Toc199678789 h 22HYPERLINK l _Toc1996787903.1 算法流程 PAGEREF _Toc199678790 h 22HYPERLINK l _Toc1996787913.2 人臉識(shí)別的常用方法 PAGEREF _Toc199678791 h 24HYPERLINK l _Toc1996787923.3 投影法原理 PAGEREF _Toc199678792 h 24HYPERLINK l _Toc1996787933.4 人眼左右邊界的判定 PAGEREF _Toc19967

11、8793 h 25HYPERLINK l _Toc1996787943.5 眉眼區(qū)域的判定 PAGEREF _Toc199678794 h 26HYPERLINK l _Toc1996787953.6 眉眼區(qū)域的處理 PAGEREF _Toc199678795 h 27HYPERLINK l _Toc1996787963.7眼睛的精確定位 PAGEREF _Toc199678796 h 28HYPERLINK l _Toc199678797第四章檢測(cè)結(jié)果與分析 PAGEREF _Toc199678797 h 29HYPERLINK l _Toc199678798第五章總結(jié)與展望 PAGEREF

12、 _Toc199678798 h 30HYPERLINK l _Toc1996787995.1 總結(jié) PAGEREF _Toc199678799 h 30HYPERLINK l _Toc1996788005.2 算法的改進(jìn)與前景 PAGEREF _Toc199678800 h 31HYPERLINK l _Toc199678801參考文獻(xiàn) PAGEREF _Toc199678801 h 32HYPERLINK l _Toc199678802致 PAGEREF _Toc199678802 h 33第一章 緒論本章主要介紹了本文的研究背景和研究的意義,以與對(duì)本文的研究容和各個(gè)章節(jié)的安排進(jìn)行了介紹。

13、1.1 課題的背景和意義人臉檢測(cè)(Face Detection)是指在輸入圖像中確定所有人臉(如果存在)位置與大小。人臉檢測(cè)系統(tǒng)的輸入是可能包含人臉的圖像,輸出是關(guān)于圖像中是否存在人臉以與人臉的數(shù)目、位置、尺度、姿態(tài)等信息的參數(shù)化描述。檢測(cè)任務(wù)的完成涉與從復(fù)雜的背景中分割、抽取、驗(yàn)證人臉區(qū)域和可能要用到的人臉特征(如眼角、嘴角等),成功的人臉檢測(cè)系統(tǒng)應(yīng)能處理實(shí)際存在的光線、人臉?lè)较蚝碗x照相機(jī)距離變化等各種不同情況。人臉檢測(cè)作為人臉信息處理中的一項(xiàng)關(guān)鍵技術(shù),近年來(lái)成為模式識(shí)別與計(jì)算機(jī)視覺(jué)領(lǐng)域一項(xiàng)受到普遍重視、研究十分活躍的課題。人臉檢測(cè)問(wèn)題的提出最早可以追溯到早期的人臉識(shí)別研究中對(duì)人臉定位的需求

14、。一個(gè)完整的人臉自動(dòng)識(shí)別系統(tǒng)至少要包含兩個(gè)主要的技術(shù)環(huán)節(jié):人臉的檢測(cè)和人臉的特征提取與識(shí)別。人臉檢測(cè)是自動(dòng)人臉識(shí)別系統(tǒng)中的一個(gè)關(guān)鍵環(huán)節(jié),但是早期的人臉識(shí)別研究主要針對(duì)具有較強(qiáng)約束條件的人臉圖像(如無(wú)背景人臉圖像等),往往假設(shè)人臉位置己知或很容易獲得,因此人臉檢測(cè)問(wèn)題未引起研究者的充分重視。近幾年來(lái),電子商務(wù)等網(wǎng)絡(luò)資源的利用使得人臉識(shí)別成為最有潛力的生物身份驗(yàn)證手段,在這種應(yīng)用背景下,要求人臉自動(dòng)識(shí)別系統(tǒng)能夠?qū)σ话悱h(huán)境圖像具有一定的適應(yīng)能力,由此所面臨的一系列問(wèn)題使得人臉檢測(cè)作為一個(gè)獨(dú)立的課題受到研究者的重視。今天,人臉檢測(cè)的應(yīng)用背景己經(jīng)遠(yuǎn)遠(yuǎn)超出了人臉識(shí)別系統(tǒng)的疇。隨著網(wǎng)絡(luò)技術(shù)和桌上視頻的廣泛采

15、用,圖像捕捉設(shè)備正在成為個(gè)人計(jì)算機(jī)的標(biāo)準(zhǔn)外設(shè),為視頻會(huì)議等服務(wù)所急需的技術(shù) 基于容的壓縮與檢索成為一個(gè)研究熱點(diǎn)。人臉的檢測(cè)是進(jìn)行人臉壓縮的前提條件,同時(shí)人臉也是基于容檢索的重要對(duì)象,因而人臉檢測(cè)在這個(gè)領(lǐng)域中占有重要的地位。此外,人臉檢測(cè)在智能化人機(jī)界面、視覺(jué)監(jiān)測(cè)、數(shù)字視頻處理等方面也有著重要的應(yīng)用價(jià)值,這使得人臉檢測(cè)的研究倍受關(guān)注。下面對(duì)人臉檢測(cè)的一些應(yīng)用領(lǐng)域做些簡(jiǎn)要的介紹:基于容的視頻檢索隨著因特網(wǎng)上應(yīng)用的迅速增長(zhǎng),圖像、視頻、語(yǔ)音等多媒體信息的使用日益廣泛,其數(shù)量也迅速膨脹起來(lái)。尤其是視頻這種媒體,集成了影像、聲音和文字,是一種綜合媒體。它的非結(jié)構(gòu)化的本質(zhì)決定了傳統(tǒng)的瀏覽和檢索手段不適用于

16、這種媒體。基于容的多媒體信息檢索就是在這樣的背景下提出的,并成為多媒體研究領(lǐng)域的一個(gè)熱點(diǎn)。視頻結(jié)構(gòu)單元通常可以看作兩層:鏡頭和場(chǎng)景。鏡頭是由相互關(guān)聯(lián)的連續(xù)的視頻組成。它描繪同一個(gè)場(chǎng)景,對(duì)應(yīng)攝像機(jī)一次記錄的起停動(dòng)作,代表一個(gè)場(chǎng)景中時(shí)間和空間上連續(xù)的動(dòng)作。在高層的容分析、索引和分類中,鏡頭是基本的單元。場(chǎng)景包含有多個(gè)鏡頭,針對(duì)同一批對(duì)象,但拍攝的角度不同,傳達(dá)的含義不同。經(jīng)過(guò)分析視頻結(jié)構(gòu)單元間的關(guān)系建立視頻容語(yǔ)義進(jìn)而形成有效的視頻容索引,這是支持有效的基于容的視頻檢索的關(guān)鍵。顯然,只有實(shí)現(xiàn)基于語(yǔ)義層次上的檢索,結(jié)果才能接近用戶所要檢索容的要求,所得的結(jié)果才能和用戶對(duì)視頻容的表述一致,比如要檢索“有

17、喬丹參加的籃球比賽”的電視節(jié)目。而對(duì)視頻圖像中的特定對(duì)象(如人或轎車(chē)等)的分析是形成語(yǔ)義結(jié)果的基礎(chǔ)。(2)有關(guān)MPEG-7標(biāo)準(zhǔn)為解決對(duì)多媒體信息描述的標(biāo)準(zhǔn)問(wèn)題,國(guó)際運(yùn)動(dòng)圖像專家組于2001年,發(fā)表了國(guó)際標(biāo)準(zhǔn)MPEG-7,其全稱為“多媒體容描述接口”,其目標(biāo)就是制定一組標(biāo)準(zhǔn)的描述子與其描述模式(定義描述子的結(jié)構(gòu)和相互關(guān)系),容描述與媒體容結(jié)合,使用戶能夠快速準(zhǔn)確地進(jìn)行檢索。它不是針對(duì)特定應(yīng)用的,而是提供了靈活且可擴(kuò)展的視聽(tīng)容描述框架以實(shí)現(xiàn)各種傳輸媒體的共享訪問(wèn)和交換、強(qiáng)調(diào)基于容的交互性、可重用性、可伸縮性。除此之外,人的面部表情、性格特征也是NPEG-7的數(shù)據(jù)類型之一。另外,MPEG-7標(biāo)準(zhǔn)組織

18、已經(jīng)建立了人臉識(shí)別草案小組,人臉檢測(cè)算法也是一項(xiàng)征集的容。(3)基于容的圖像檢索現(xiàn)在許多應(yīng)用都集成了大規(guī)模的圖像庫(kù),而且是其中的重要部分。基于容的圖像檢索本質(zhì)上是基于相似性的檢索,最好是利用圖像本身的特征,從所有的圖像中找出與查詢者要求最接近的一批圖像?,F(xiàn)在可資利用的相似性有全局顏色的相似性,形狀的相似性,紋理的相似性等。而基于目標(biāo)的相似性應(yīng)該說(shuō)是很有效的方法。比如,原本要檢索一個(gè)有關(guān)小女孩方面的圖像,檢索的結(jié)果卻給出一些風(fēng)景或建筑方面的圖像,就說(shuō)明系統(tǒng)的檢索能力和效率還急需提高。(4)視頻監(jiān)視在一些安全監(jiān)控部門(mén),需要攝像機(jī)把周?chē)沫h(huán)境與其變化記錄下來(lái)。如果有人在活動(dòng),這時(shí)更關(guān)心目標(biāo)的人臉的方

19、向和位置,而不是服飾等次要因素,以便辨認(rèn)和事后檢查。這就需要為攝像機(jī)提供視野進(jìn)行自動(dòng)跟蹤的能力。人臉的檢測(cè)和跟蹤是這類應(yīng)用的關(guān)鍵部分。(5)媒體壓縮的需要為了節(jié)約存儲(chǔ)空間和傳輸帶寬,應(yīng)保證人們最為注意和敏感的目標(biāo)有盡可能小的失真,而對(duì)背景進(jìn)行盡可能大的壓縮。多數(shù)情況下,人的活動(dòng)和面部表情成了關(guān)注的焦點(diǎn)。這是人臉檢測(cè)和分割成為研究熱點(diǎn)的原團(tuán)之一。(6)虛擬現(xiàn)實(shí)和電子娛樂(lè)如果讓電子游戲中的角色能感知游戲參與者的頭部的動(dòng)作和面部表情的變化,將大大增強(qiáng)參與者的參與感和真實(shí)感。(7)人臉識(shí)別由于人臉識(shí)別不干擾使用者,不侵犯使用者的隱私,屬于非侵犯性的主動(dòng)識(shí)別,易于為用戶所接受,而且成本也不高,因此人臉識(shí)

20、別成為最有潛力的生物身份驗(yàn)證手段。人臉識(shí)別有兩種主要的應(yīng)用:1.身份鑒定(一對(duì)多的搜索):在鑒定模式下,確定一個(gè)人的身份,識(shí)別技術(shù)可以快速地計(jì)算出實(shí)時(shí)采集到的人臉數(shù)據(jù)與人臉數(shù)據(jù)庫(kù)中所有己知人員的人臉特征數(shù)據(jù)之間的相似度,給出一個(gè)按相似度遞減排列的可能的人員列表,或簡(jiǎn)單地返回鑒定結(jié)果(相似度最高的)和相對(duì)應(yīng)的可信度。身份確認(rèn)(一對(duì)一的比對(duì)):即所聲明的身份是否與證件上所存的持證人的人臉特征數(shù)字編碼相符。在確認(rèn)模式下,人臉特征面紋數(shù)據(jù)5可以存儲(chǔ)在智能卡中或數(shù)碼記錄中,這種應(yīng)用只需要簡(jiǎn)單地將實(shí)時(shí)采集的人臉數(shù)據(jù)與存儲(chǔ)的相比對(duì),如果可信度超過(guò)一個(gè)指定的閾值,則比對(duì)成功,身份得到確認(rèn)。其應(yīng)用領(lǐng)域還包括很多

21、方面,比如銀行業(yè)務(wù)、智能卡、訪問(wèn)控制、人機(jī)交互界面等等。如果人臉檢測(cè)作為能適應(yīng)多種環(huán)境圖像的技術(shù),精度和效率都有了較大的提高,那么在此基礎(chǔ)上再分析人臉的形狀等特征,且能消除非相關(guān)因素的干擾,結(jié)果人臉識(shí)別的可靠性和正確率會(huì)相應(yīng)的得到提高。就是說(shuō),人臉檢測(cè)技術(shù)的難度和重要意義是不能忽視的。人臉檢測(cè)的研究受到重視,不僅因?yàn)樗诨谌四樀纳矸蒡?yàn)證、視覺(jué)監(jiān)視以與叢于容的檢索等方面有著重要的應(yīng)用,人臉檢測(cè)研究還具有重要的學(xué)術(shù)價(jià)值。人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的自然結(jié)構(gòu)目標(biāo),此類目標(biāo)的檢測(cè)問(wèn)題的挑戰(zhàn)性在于:(1)人臉由于外貌、表情、膚色等不同,具有模式的可變性;(2)一般意義下的人臉上,可能存在眼鏡、胡

22、須等附屬物;(3)作為三維物體的人臉的影像不可避免地受由光照產(chǎn)生的陰影的影響。因此,如果能夠找到解決這些問(wèn)題的方法,成功構(gòu)造出人臉檢測(cè)與跟蹤系統(tǒng),將為解其它類似的復(fù)雜模式檢測(cè)問(wèn)題提供重要的啟示.目前,國(guó)外對(duì)人臉檢測(cè)問(wèn)題的研究很多,比較著名的有MIT,CMU等;國(guó)的清華大學(xué)、工業(yè)大學(xué)、中國(guó)科學(xué)院計(jì)算技術(shù)研究所和中國(guó)科學(xué)院自動(dòng)化研究所等都有人員從事人臉檢測(cè)相關(guān)的研究.而且,MPEG7標(biāo)準(zhǔn)組織已經(jīng)建立了人臉識(shí)別草案小組,人臉檢測(cè)算法也是一項(xiàng)征集的容.隨著人臉檢測(cè)研究的深入,國(guó)際上發(fā)表的有關(guān)論文數(shù)量也大幅度增長(zhǎng),重要國(guó)際會(huì)議上每年都有大量關(guān)于人臉檢測(cè)的論文,占有關(guān)人臉研究論文的近1/3之多.有關(guān)人臉檢

23、測(cè)的容在人臉識(shí)別研究的綜述中有所涉與,但僅僅側(cè)重于人臉識(shí)別系統(tǒng)的輸入環(huán)節(jié),目前較為詳盡的人臉檢測(cè)與跟蹤綜述為文獻(xiàn),著重于介紹各種方法所使用的特征和模型。1.2 論文的主要容人臉由眼睛、鼻子、嘴巴、下巴等器官構(gòu)成,正因?yàn)檫@些部件的形狀、大小和結(jié)構(gòu)上各種差異才使得世界上每個(gè)人臉千差萬(wàn)別,因此,對(duì)這些器官的形狀和結(jié)構(gòu)關(guān)系的幾何描述,可以作為人臉識(shí)別的重要特征。幾何特征提取即是用適當(dāng)?shù)姆椒▽?duì)眼睛、鼻子、嘴巴、下巴等器官的形狀、大小和結(jié)構(gòu)關(guān)系進(jìn)行幾何描述,例如眼睛、鼻子和嘴的位置和寬度,眉毛的厚度和彎曲程度等,以與這些特征器官之間的關(guān)系。其中眼睛這一器官有著舉足輕重的作用,對(duì)眼睛進(jìn)行幾何描述勢(shì)必先要找到

24、眼睛的位置,即要先進(jìn)行眼睛定位。而且只要眼睛被精確定位,則臉部其他器官,如眉、鼻、嘴等,可由潛在的分布關(guān)系比較準(zhǔn)確地定位。在人臉正面圖像識(shí)別過(guò)程,不管是利用人臉的全局特征還是局部特征,是采用圖像的幾何特征,還是圖像的代數(shù)特征,人臉?lè)轿坏淖兓瘜?duì)識(shí)別的結(jié)果都有顯著的影響,所以在特征提取前必須先對(duì)人臉圖像進(jìn)行預(yù)處理,如對(duì)人臉?lè)轿贿M(jìn)行調(diào)整使其規(guī)化;對(duì)人臉圖片的拍攝距離進(jìn)行歸一化。在人臉?lè)轿徽{(diào)整中對(duì)眼睛的準(zhǔn)確定位是必不可少的步驟,這是因?yàn)閮裳壑行拈g距受光照或表情變化的影響最小,雙眼中心連線的方向隨人像的偏轉(zhuǎn),可以作為圖像旋轉(zhuǎn)的依據(jù)。而且若以兩眼之間的距離對(duì)抽取的各個(gè)特征值進(jìn)行歸一化,則這些特征值具有平移

25、、旋轉(zhuǎn)和尺度上的不變性。計(jì)算機(jī)人臉識(shí)別是近年來(lái)非?;钴S的研究領(lǐng)域。它的應(yīng)用圍很廣,如安全系統(tǒng)中的身份認(rèn)證、視頻監(jiān)控中目標(biāo)的識(shí)別與跟蹤,以與表情分析、年齡分析、唇讀、智能計(jì)算機(jī)中的人機(jī)交互等。可以從不同的角度對(duì)人臉檢測(cè)問(wèn)題進(jìn)行分類。從人臉姿態(tài)的角度,可以分為正面人臉檢測(cè)、多姿態(tài)人臉檢測(cè)。從人臉個(gè)數(shù)是否己知的角度,可以分為已知人臉個(gè)數(shù)的人臉檢測(cè)、未知人臉個(gè)數(shù)的人臉檢測(cè)。從圖像背景復(fù)雜程度的角度,可以分為簡(jiǎn)單背景(指無(wú)背景或背景的特征被嚴(yán)格約束,在該條件下只利用人臉的輪廓、顏色、運(yùn)動(dòng)等少量特征,就能夠進(jìn)行準(zhǔn)確檢測(cè))、復(fù)雜背景(指背景的類型和特征不受約束,某些區(qū)域可能在色彩、紋理等特征上與人臉相似,必

26、須利用較多的人臉特征才能做到人臉的準(zhǔn)確檢測(cè))。從圖片是否包含彩色信息的角度,可以分為彩色圖片的人臉檢測(cè)、灰度圖片的人臉檢測(cè)。從圖片是否是動(dòng)態(tài)的角度,可以分為在靜止圖象中檢測(cè)人臉、在視頻圖像序列中檢測(cè)跟蹤人臉。人眼作為人臉最顯著的特征,與嘴、鼻相比較,能夠提供更可靠、更重要的信息,因此往往是人臉識(shí)別中必要的處理對(duì)象。本文主要討論在靜止灰度單人圖像中人眼檢測(cè)的問(wèn)題。要進(jìn)行人眼的識(shí)別,首先要進(jìn)行人臉的識(shí)別與定位。人臉識(shí)別方法大致有如下幾類:一是通過(guò)主分量分析法訓(xùn)練和檢測(cè)人臉,即特征人臉?lè)椒?。這類方法定位準(zhǔn)確,但算法復(fù)雜,計(jì)算量大。二是通過(guò)顏色分析進(jìn)行膚色檢測(cè)來(lái)定位人臉。此類方法針對(duì)彩色圖像,利用面部

27、皮膚的顏色特性建立一個(gè)新的顏色坐標(biāo)系,通過(guò)從圖像中分離出膚色來(lái)實(shí)現(xiàn)對(duì)臉部的定位。此類方法對(duì)光照敏感,且無(wú)法適用于灰度圖像。三是變形模板類方法。該類方法用橢圓近似地表示頭部輪廓,通過(guò)迭代求精。其缺點(diǎn)是收斂速度慢,運(yùn)算時(shí)間長(zhǎng)。另外,還有人使用神經(jīng)網(wǎng)絡(luò)方法檢測(cè)人臉,其缺點(diǎn)同樣是計(jì)算量太大,無(wú)法達(dá)到弱實(shí)時(shí)的要求。有的快速人臉檢測(cè)方法是灰度投影方法,其中是對(duì)圖像做水平灰度投影,因?yàn)楸尘芭c人著裝的干擾,給人臉定位造成困難;對(duì)彩色圖像的紅色分量做垂直灰度投影,但直接使用最大和最小梯度值作為界定人臉左右邊界的條件,在復(fù)雜背景下往往會(huì)造成誤判。確定人臉之后,再進(jìn)行人眼的識(shí)別。人眼的識(shí)別有邊緣特征分析法、Houg

28、h變換法和變形模板法等。變形模板法能夠準(zhǔn)確地確定人眼形狀與大小,但存在收斂速度的題;Hough變換法檢測(cè)瞳孔的圓形特征或眼瞼形成的橢圓特征,所需計(jì)算量大。本文所采用的方法是一種新的人眼定位方法。使用中值濾波和直方圖均衡方法去除噪聲和光照對(duì)圖像的影響后,將圖像做積分投影以縮小到人臉的眼部區(qū)域,在得到的眉眼區(qū)域中再做一次水平積分投影,找到兩眼的垂直位置。最后利用人眼模板沿著該垂直方向進(jìn)行匹配程度最高的部分即為要定位的人眼位置。第二章 圖像預(yù)處理基本知識(shí)本章主要介紹了數(shù)字圖像處理的相關(guān)知識(shí),為下一章進(jìn)行人眼檢測(cè)算法提供了理論基礎(chǔ)。2.1 圖像灰度變換當(dāng)圖像受到CCD 攝像系統(tǒng)的影響,受到攝像機(jī)周?chē)h(huán)

29、境的影響,受到成像時(shí)曝光不足或過(guò)度的影響,以與受到成像設(shè)備的非線性,或圖像記錄設(shè)備動(dòng)態(tài)圍太窄的影響,都會(huì)出現(xiàn)對(duì)比度不足,使圖像中的細(xì)節(jié)分辨不清。另外,自然圖像由于其灰度通常分布在較窄的區(qū)間,也會(huì)引起圖像細(xì)節(jié)不清楚。對(duì)CCD 攝像系統(tǒng)獲取的圖像,進(jìn)行直方圖變換,可使圖像的灰度間距拉開(kāi)或者使圖像的灰度分布圖像的灰度變換處理是圖像增強(qiáng)處理技術(shù)中一種非常基礎(chǔ)、直接的空間域圖像處理方法,也是圖像數(shù)字化軟件和圖像顯示軟件的一個(gè)重要組成部分。灰度變換是指根據(jù)某種目標(biāo)條件按一定變換關(guān)系逐點(diǎn)改變?cè)瓐D像中每一個(gè)像素灰度值的方法。目的是為了改善畫(huà)質(zhì),使圖像的顯示效果更加清晰?;叶茸儞Q有時(shí)又被稱為圖像的對(duì)比度增強(qiáng)或?qū)?/p>

30、比度拉伸。從圖像輸入裝置得到的圖像數(shù)據(jù),以濃淡表示,每個(gè)像素與某一灰度值相對(duì)應(yīng)。設(shè)原圖像的灰度值,處理后圖像像素的灰度值,則灰度增強(qiáng)可表示為:(2.1)或要求和D 都在圖像的灰度圍之。函數(shù)T(D) 稱為灰度變換函數(shù),它描述了輸入灰度值和輸出灰度值之間的轉(zhuǎn)換關(guān)系。一旦灰度變換函數(shù)確定,則確定了一個(gè)具體的灰度增強(qiáng)方法。圖像中每一點(diǎn)的運(yùn)算就被完全確定下來(lái)?;叶茸儞Q函數(shù)不同,即使是同一圖像也會(huì)得到不同的結(jié)果。選擇灰度變換函數(shù)應(yīng)該根據(jù)圖像的性質(zhì)和處理目的來(lái)決定。選擇的標(biāo)準(zhǔn)是:經(jīng)過(guò)灰度變換后,像素動(dòng)態(tài)圍增加,圖像的對(duì)比度擴(kuò)展,使圖像變得更加清晰、細(xì)膩,容易識(shí)別?;叶茸儞Q主要針對(duì)獨(dú)立的像素點(diǎn)進(jìn)行處理,通過(guò)改

31、變?cè)紙D像數(shù)據(jù)所占據(jù)的灰度圍而使圖像在視覺(jué)上得到良好的改觀,沒(méi)有利用像素點(diǎn)之間的相互空間關(guān)系。因此,灰度變換處理方法也叫做點(diǎn)運(yùn)算法。點(diǎn)運(yùn)算是一種既簡(jiǎn)單又重要的技術(shù),一幅輸入圖像經(jīng)過(guò)點(diǎn)運(yùn)算后將產(chǎn)生一幅新的輸出圖像,由輸入像素點(diǎn)的灰度值決定相應(yīng)的輸出像素點(diǎn)的灰度值。點(diǎn)運(yùn)算與局部運(yùn)算的差別在于:后者每個(gè)輸出像素的灰度值,由對(duì)應(yīng)輸入像素的一個(gè)臨域幾個(gè)像素的灰度值決定。因此,點(diǎn)運(yùn)算不可能改變圖像的像素的空間關(guān)系。2.1.1 圖像的灰度化圖像灰度化就是使彩色的分量值相等的過(guò)程. 由于的取值圍是0255 ,所以灰度的級(jí)別只有256 級(jí),即灰度圖像僅能表現(xiàn)256 種顏色(灰度)。灰度化處理的方法主要有三種:1

32、 ) 最大值法:使的值等于三值中最大的一個(gè),即: (2.2)最大值法會(huì)形成亮度很高的灰度圖像。2 ) 平均值法:使的值求出平均值,即:(2.3)平均值法會(huì)形成較柔和的灰度圖像。3 ) 加權(quán)平均值法:根據(jù)重要性或其他指標(biāo)給賦予不同的權(quán)值,并使R 、G、B 它們的值加權(quán)平均,即: (2.4)其中分別為的權(quán)值.取不同的值,加權(quán)平均值法就將形成不同的灰度圖像.由于人眼對(duì)綠色的敏感度最高,對(duì)紅色的敏感度次之,對(duì)藍(lán)色的敏感度最低,因此使將得到較合理的灰度圖像。試驗(yàn)和理論推導(dǎo)證明,當(dāng)時(shí),即當(dāng)(2.5) (2.6)時(shí),能得到最合理的灰度圖像。 用MATLAB實(shí)現(xiàn)程序如下:I=imread(F:01.JPG);

33、figure(1),imshow(I);I=rgb2gray(I);figure(2),imshow(I)(a) 原始圖像 (b) 灰度化圖像圖2.1 彩色圖像的灰度化2.1.2 圖像灰度求反對(duì)圖像求反是將原圖灰度值翻轉(zhuǎn),簡(jiǎn)單說(shuō)來(lái)就是使黑變白,使白變黑。當(dāng)被顯示圖像在低灰度區(qū)間呈現(xiàn)高度非線性時(shí),此變換能使原圖像低灰度區(qū)間的細(xì)節(jié)轉(zhuǎn)換到高灰度區(qū)間。即假設(shè)對(duì)灰度圍是的圖像求反,就是通過(guò)變換將 變換到,變換公式如下: (2.7) (a)原始圖像 (b)求反處理的結(jié)果圖圖2.2 圖像灰度求反結(jié)果圖 用MATLAB實(shí)現(xiàn)程序如下: I=imread(F:01.JPG);figure(1),imshow(I)

34、;I=rgb2gray(I);figure(2),imshow(I)I=double(I);I=256-1-I;figure,imshow(uint(I);2.1.3 圖像灰度拉伸一般,圖像看不清楚,多數(shù)是由于圖像相鄰像元的灰度級(jí)太接近,稱為灰度壓縮,即相互之間灰度差遠(yuǎn)小于人的視覺(jué)對(duì)灰度分辨能力的限制。這種圖像視覺(jué)效果差,人會(huì)感覺(jué)模糊。我們可以用映射的方法,把原來(lái)壓縮的直方圖分開(kāi)一些,也就是灰度拉伸,得到的圖像自然會(huì)清晰的多。(a)原始圖像 (b)灰度拉伸結(jié)果圖2.3 圖像灰度拉伸結(jié)果圖 用MATLAB實(shí)現(xiàn)程序如下:I=imread(F:01.JPG);figure,imshow(I);I=r

35、gb2gray(I);figure,imshow(I);I=double(I);m,n=size(I);for i=1:m for j=1:nif I(i,j)=30 I(i,j)=I(i,j);elseif I(i,j)=150I(i,j)=(200-30)/(150-30)*(I(i,j)-30)+30;else I(i,j)=(255-200)/(255-150)*(I(i,j)-150)+200;endendendfigure,imshow(uint8(I);2.2 圖像平滑去噪圖像在生成和傳輸過(guò)程中常受到各種噪聲的干擾和影響,使圖像質(zhì)量下降。為了達(dá)到系統(tǒng)的要求,就要抑制噪聲,改善圖像

36、質(zhì)量,也就是對(duì)圖像進(jìn)行平滑去噪處理。對(duì)于濾除圖像中的噪聲,人們已經(jīng)提出了很多的方法。通常,將數(shù)字圖像的平滑技術(shù)劃分為兩類。一類是全局處理,即對(duì)噪聲圖像的整體或大的塊進(jìn)行校正以得到平滑的圖像。例如在變換域中使用wiener 濾波、最小二乘法濾波等。使用這些技術(shù)需要知道信號(hào)和噪聲的統(tǒng)計(jì)模型。但對(duì)大多數(shù)圖像而言,人們不知道或不可能用簡(jiǎn)單的隨機(jī)過(guò)程精確地描述統(tǒng)計(jì)模型,而且,這些技術(shù)的計(jì)算量也相當(dāng)大。另一類平滑技術(shù)是對(duì)噪聲圖像使用局部算子。當(dāng)對(duì)某一像素進(jìn)行平滑處理時(shí),僅對(duì)它的局部小鄰域的一些像素加以運(yùn)算,其優(yōu)點(diǎn)是計(jì)算效率高,而且可以多個(gè)像素并行處理。因此可實(shí)現(xiàn)實(shí)時(shí)或者準(zhǔn)實(shí)時(shí)處理。2.2.1 概述一般,噪

37、聲是不可預(yù)測(cè)的隨機(jī)信號(hào),通常是通過(guò)概率統(tǒng)計(jì)的方法對(duì)其進(jìn)行分析,噪聲對(duì)圖像處理十分重要,它影響圖像處理的輸入,采集,處理的各個(gè)環(huán)節(jié)以與輸出結(jié)果的全過(guò)程,特別是圖像的輸入,采集噪聲的抑制是十分關(guān)鍵的問(wèn)題,若輸入伴有較大的噪聲,必然影響處理全過(guò)程與輸出的結(jié)果,因此,一個(gè)良好的圖像處理系統(tǒng),不論是模擬處理還是用計(jì)算機(jī)進(jìn)行的數(shù)字處理,并不把減少最前一級(jí)的噪聲作為主攻目標(biāo)。2.2.2 圖像噪聲分類 根據(jù)噪聲產(chǎn)生的來(lái)源,大致可以分為外部噪聲和部噪聲兩大類。 外部噪聲指從處理系統(tǒng)外來(lái)的影響,如天線干擾或電磁波從電源線竄入系統(tǒng)的噪聲。部噪聲則有以下四種最常見(jiàn)的形式。(1)由光和電的基本性質(zhì)引起的噪聲,例如電流可

38、看作電子或空穴運(yùn)動(dòng),這些粒子運(yùn)動(dòng)產(chǎn)生隨機(jī)散粒噪聲,導(dǎo)體中電子流動(dòng)的熱噪聲,光量子運(yùn)動(dòng)的光量子。(2)有機(jī)械運(yùn)動(dòng)引起的噪聲,例如,接頭振動(dòng)使電流不穩(wěn),磁頭或磁帶,磁盤(pán)抖動(dòng)等。(3)元器件的噪聲,如光學(xué)底片的顆粒噪聲,磁帶,磁盤(pán)缺陷噪聲,光盤(pán)點(diǎn)噪聲等。(4)系統(tǒng)部電路噪聲。從噪聲的分類方法來(lái)看是多種多樣的,但綜合來(lái)說(shuō),噪聲是隨機(jī)產(chǎn)生的量,所以又可以從統(tǒng)計(jì)數(shù)學(xué)的觀點(diǎn)來(lái)定義噪聲。凡是統(tǒng)計(jì)特性不隨時(shí)間變化的噪聲稱為平穩(wěn)噪聲,而統(tǒng)計(jì)特性隨時(shí)間變化的噪聲稱為非平穩(wěn)噪聲。2.2.3 圖像系統(tǒng)噪聲的特點(diǎn)對(duì)灰度圖像來(lái)說(shuō),可看作是二維亮度分析,則噪聲可看作是對(duì)亮度的干擾,用 來(lái)表示。噪聲是 隨機(jī)性的,因而需用隨機(jī)過(guò)

39、程來(lái)描述,即要求知道其分布函數(shù)或密度函數(shù)。但在許多情況下著些函數(shù)很難測(cè)出或描述,甚至不可能看到,所以常用統(tǒng)計(jì)特征來(lái)描述噪聲,如均值,方差,總功率等。 設(shè)為理想圖像,為噪聲,實(shí)際輸出圖像為。 對(duì)于加性噪聲而言,其特點(diǎn)是和圖像光強(qiáng)大小無(wú)關(guān)。即有=+ (2.8) 對(duì)于乘性噪聲而言,其特點(diǎn)是和圖像光強(qiáng)度相關(guān),隨亮度的大小變化而變化。即有=1+=+ (2.9) 乘性噪聲模型和它的分析計(jì)算都比較復(fù)雜。通??偸羌俣ㄐ盘?hào)和噪聲互相獨(dú)立的,通常對(duì)數(shù)變換后當(dāng)作加性噪聲的模型來(lái)處理。按噪聲對(duì)圖像的影2.2.4 均值濾波均值濾波的方法是對(duì)待處理的當(dāng)前像素選擇一個(gè)模板,該模板為其近鄰的若干像素組成,用模板中的像素的均值

40、代替原像素值的方法。 考慮到數(shù)據(jù)分析的平衡性,模板一般選擇為33,55,待處理像素放在模板的中心,為了使輸出像素值保持在原來(lái)的灰度值圍之,模板的餓權(quán)值總和應(yīng)維持為1,因此模板與模板像素的乘積要處以一個(gè)系數(shù),通常是模板系數(shù)之和,這個(gè)過(guò)程被稱為歸一化。均值濾波處理之后,噪聲部分被弱化到周?chē)袼攸c(diǎn)上,所以得到的結(jié)果是噪聲值減少,但是總的顆粒面積變大。另外,均值濾波有一個(gè)非常致命的缺點(diǎn),就是在求均值的計(jì)算中,會(huì)同時(shí)將景物的邊緣點(diǎn)同時(shí)進(jìn)行均值處理,這樣就使景物的清晰度降低,畫(huà)面變得模糊。設(shè)為給定的含有噪聲的圖像,經(jīng)過(guò)簡(jiǎn)單領(lǐng)域平均處理為,在數(shù)學(xué)上可表現(xiàn)為:其中 (2.10)式中是所取鄰域中的各鄰近像素的坐

41、標(biāo),是領(lǐng)域中包含的鄰近像素的個(gè)數(shù)。可以這樣說(shuō)明, 在上按行(或列)對(duì)每個(gè)像素選取一定尺寸的鄰域,并用鄰域中鄰近像素的平均灰度來(lái)置換這一像素值,對(duì)全部像素處理后可獲得。對(duì)于鄰域可以有不同的選取方式。為了保持平滑處理后的圖像的平均值不變,模板各元素之和為1。有時(shí),為了突出原點(diǎn)本身的重要性,以便盡量抑制圖像中的模糊效應(yīng),在模板中心和較近的元素,可以賦以大的加權(quán)值。 用MATLAB實(shí)現(xiàn)程序如下:I=imread(F:01.JPG);figure(1),imshow(I);I=rgb2gray(I);figure(2),imshow(I)K=filter2(fspecial(average,3),I);

42、 figure,imshow(uint8(K);(a)原始圖像 (b)均值濾波圖像圖2.4 均值濾波處理結(jié)果可見(jiàn),均值濾波處理時(shí)是以圖像模糊為代價(jià)來(lái)?yè)Q取噪聲的減小的,且面積(即模板大?。┰酱螅肼暅p少越明顯。如果處理點(diǎn)是噪聲點(diǎn),其鄰近像素灰度與之相差很大,一旦用簡(jiǎn)單鄰域平均法,即鄰近像素的平均值來(lái)置換它,能明顯地將噪聲點(diǎn)壓制下去,使鄰域中灰度接近均勻,起到平滑灰度的作用。因此,領(lǐng)域平均法具有顯著地平滑噪聲的效果,鄰域平均法是一種有效的平滑技術(shù)。2.2.5 中值濾波中值濾波法也是一種局部平均平滑技術(shù)。它對(duì)脈沖干擾和椒鹽噪聲的抑制效果較好,在抑制隨機(jī)噪聲的同時(shí)能使邊緣減少模糊。中值濾波法是一種非線

43、性的圖像平滑方法,它對(duì)一個(gè)滑動(dòng)窗口的諸像素灰度排序,用其中值代替窗口中心像素原來(lái)的灰度(若窗口中有偶數(shù)個(gè)像素,則取兩個(gè)中間值的平均)。(a)原始圖像 (b)中值濾波圖2.5中值濾波處理結(jié)果 用MATLAB實(shí)現(xiàn)程序如下:I=imread(F:/01.JPG);figure(1);imshow(I);J=rgb2gray(I);figure(2),imshow(J);K=medfilt2(J,3 3);應(yīng)用中值濾波,就能很好地保持原來(lái)邊界。所以說(shuō),中值濾波的特點(diǎn)是保護(hù)圖像邊緣的同時(shí)去除噪聲。另外,中值濾波對(duì)脈沖噪聲也非常有效。雖然,中值濾波容易去除孤立點(diǎn)、線性的噪聲,同時(shí)保持圖像的邊緣,并能很好地

44、去除二值噪聲,但對(duì)高斯噪聲無(wú)能為力。要注意的是,當(dāng)窗口噪聲點(diǎn)的個(gè)數(shù)大于窗口寬度一半時(shí),中值濾波的效果不好。因此,正確選擇窗口尺寸的大小是用好中值濾波的重要環(huán)節(jié)。一般很難事先確定最佳的窗口尺寸,需要通過(guò)從小窗口到大窗口的試驗(yàn),再?gòu)闹羞x取最好的結(jié)果。2.3 直方圖均衡化在信息論中有這樣一個(gè)結(jié)論,當(dāng)數(shù)據(jù)的分布接近均勻分布的時(shí)候,數(shù)據(jù)所承載的信息量為最大,圖像的灰度直方圖表示數(shù)字圖像中每一個(gè)灰度與其出現(xiàn)頻度間的統(tǒng)計(jì)關(guān)系。直方圖能給出該圖像的概貌性描述,例如圖像的灰度圍、每個(gè)灰度級(jí)的頻度和灰度的分布、整幅圖像的平均明暗和對(duì)比度等,由此可得出進(jìn)一步處理的重要依據(jù)。自然圖像由于其灰度通常分布在較窄的區(qū)間,引

45、起圖像細(xì)節(jié)不清楚。采用直方圖修整后可使圖像的灰度間距拉開(kāi)或者使灰度分布均勻,從而增大反差,使圖像細(xì)節(jié)清晰,達(dá)到圖像增強(qiáng)的目的。另外 ,因?yàn)槠毓鈼l件的不同 ,圖像灰度可能會(huì)局限在一個(gè)很小的圍 ,造成圖像的模糊不清?,F(xiàn)采用直方圖均衡的方法來(lái)進(jìn)行處理,圖像的低灰度區(qū)域有了較大擴(kuò)展 ,而高灰度區(qū)域得到了壓縮。 直觀的看,直方圖均衡化將導(dǎo)致信號(hào)值所占區(qū)域的對(duì)比度增加。要進(jìn)行直方圖均衡化均衡化圖像的直方圖只是近似均勻的直方圖分布。均衡化后的圖像動(dòng)態(tài)圍擴(kuò)大了,但其本質(zhì)是擴(kuò)大了量化層間隔,而非量化層的數(shù)目,相反,均衡化后級(jí)數(shù)分布減少,因而可能會(huì)出現(xiàn)偽輪廓。設(shè)分別為原圖像和處理后的圖像,圖像的灰度化圍為0,25

46、5,則直方圖均衡化方法具體步驟如下:(1)求原圖的灰度直方圖,設(shè)用256維的向量表示;(2) 由求原圖的灰度分布概率,記作,則有 (2.11)其中,分別為圖像的長(zhǎng)和寬)為圖像的總像素個(gè)數(shù);(3)計(jì)算圖像各個(gè)灰度值的累計(jì)分布概率,記作,則有 (2.12)其中,令。(4) 進(jìn)行直方圖均衡化計(jì)算,的到處理后圖像的像素值為: (2.13)(a)中值濾波后圖像 (b) 灰度均衡化結(jié)果圖(c)原始圖像直方圖 (d)直方圖均衡化直方圖圖2.5 圖像均衡化結(jié)果圖 用MATLAB實(shí)現(xiàn)程序如下:I=imread(F:/01.JPG);figure(1);imshow(I);J=rgb2gray(I);figure

47、(2);imshow(J);K=medfilt2(J,3 3);H=histeq (K);figure(3);imshow (H);figure(4),imhist(K);figure(5),imhist(H);直方圖均衡化的方法是直方圖修整法的一個(gè)特例,即直方圖均衡化的優(yōu)點(diǎn)是能自動(dòng)的增強(qiáng)整個(gè)圖像的對(duì)比度,但它的具體增強(qiáng)效果不易控制,處理的結(jié)果總是得到全局均衡化的直方圖。實(shí)際中有時(shí)需要變換直方圖使之成為某個(gè)特定的形狀,從而有選擇地增強(qiáng)某個(gè)灰度值圍的對(duì)比度。從畫(huà)面的效果來(lái)看,可以非常逼真的再觀燈光的效果,圖像畫(huà)面的參差敢加強(qiáng),細(xì)節(jié)也比較清晰,從直方圖可知,基本上均勻占據(jù)了整個(gè)圖像灰度值允許的圍,

48、并且直方圖的大致輪廓與直方圖相似,這就表示了處理后的圖像不僅表現(xiàn)效果得到改善,并且使原始圖像的特征在處理后的圖像中得到了保持。 2.4 圖像二值化要將特征點(diǎn)從人臉圖像分割出來(lái),二值化閾值的選取是關(guān)鍵,為此,國(guó)外學(xué)者進(jìn)行了廣泛深入的研究和大量實(shí)驗(yàn),提出了多種閾值選取方法, 如雙峰直方圖閾值分割法、最大熵閾值分割法、模糊聚類分析法等。這里采用的是最大類間方差閾值分割法,又叫大津法。其基本思路是將直方圖在某一閾值處分割成兩組, 當(dāng)被分成的兩組的方差為最大時(shí),決定閾值。設(shè)一幅圖像的灰度值為級(jí),灰度值為的象素?cái)?shù)為,此時(shí)得到總像素?cái)?shù): (2.14)各值的概率為: (2.15)然后將像素用k將其分成兩組和,

49、則各組的概率為:的概率: (2.16)的概率: (2.17)的平均值: (2.18)的平均值: (2.19)其中:是圖像的整體灰度平均值, 是閾值為時(shí)灰度的平均值,定義、兩組間的方差如(3.8) 式所示: (2.20)尋找 間使得上式取最大值的,即可得到閾值。 用MATLAB實(shí)現(xiàn)程序如下:I=imread(F:/01.JPG);figure(1);imshow(I);J=rgb2gray(I);figure(2);imshow(J);K=medfilt2(J,3 3);H=histeq (K);figure(3);imshow (H);figure(4),imhist(K);figure(5)

50、,imhist(H);Z=im2bw(H,0.2);figure,imshow(Z);(a) 均衡化圖像 (b) 二值化結(jié)果圖圖2.6 圖像二值化結(jié)果圖第三章 人眼定位算法本章節(jié)是本文的重點(diǎn),主要介紹了靜止灰度單人圖像中人眼檢測(cè)的問(wèn)題,提出了快速有效的檢測(cè)算法。自動(dòng)人臉識(shí)別技術(shù)的研究始于20世紀(jì)60年代末期,近些年來(lái)吸引了來(lái)自模式識(shí)別、圖像處理、計(jì)算機(jī)視覺(jué)、人工智能等諸多領(lǐng)域的眾多研究者,是一個(gè)既有吸引力又充滿挑戰(zhàn)的研究熱點(diǎn)。人臉識(shí)別系統(tǒng)與傳統(tǒng)的身份識(shí)別系統(tǒng)相比,具有不易偽裝、非接觸性、無(wú)需被識(shí)別者刻意配合,工作方式自然友好等優(yōu)點(diǎn)。因此在公安系統(tǒng)、銀行系統(tǒng)、網(wǎng)絡(luò)安全等諸多領(lǐng)域有著廣闊的應(yīng)用前景

51、.人臉識(shí)別作為目標(biāo)識(shí)別的特例 ,它涉與到圖像處理、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)以與神經(jīng)科學(xué)等學(xué)科 ,受到研究人員的重視。一般的人臉識(shí)別系統(tǒng)主要包括預(yù)處理、特征提取、樣本學(xué)習(xí)和識(shí)別過(guò)程四個(gè)部分 ,其中特征提取的好壞將直接影響到識(shí)別效果。而眼睛是人臉中的一個(gè)重要的器官 ,它含有的信息量非常重要在大部分特征提取方法中非常關(guān)鍵的一步就是眼睛定位提出一種將灰度積分投影和模板匹配結(jié)合使用來(lái)精確定的方法。在灰度積分投影的基礎(chǔ)上 ,通過(guò)使用模板匹配 ,減少了匹配的運(yùn)算量 ,同時(shí)也增加了匹配的準(zhǔn)確率。3.1 算法流程20 世紀(jì) 90 年代以來(lái), 隨著需要的劇增, 人面識(shí)別技術(shù)成為一個(gè)熱門(mén)的話題. 作為生物識(shí)別中的一種,

52、人面識(shí)別具有更直接、友好, 使用者無(wú)任何心理障礙的特點(diǎn). 雖然在這方面的研究已經(jīng)取得了一些可的成果, 但在實(shí)際應(yīng)用中仍面臨著許多嚴(yán)峻的問(wèn)題. 在絕大部分人面識(shí)別技術(shù)中, 都需要進(jìn)行人臉的定位, 特別是眼睛的準(zhǔn)確定位, 這是由于兩眼間距受光照或表情變化的影響最小, 所以常被用作幾何特或圖像尺寸的歸一化標(biāo)準(zhǔn). 人眼定位的方法已有很多, 有區(qū)域分割法、邊緣提取法、灰度投影法模板匹配 等方法。本文所采用的方法一種基于最大類間方差閾值分割和灰度積分投影技術(shù)的眼睛定位方法。首先通過(guò)圖像預(yù)處理技術(shù)中的中值濾波方法去除圖像噪聲,并通過(guò)非線性變換消除人臉圖像因?yàn)槠毓鈼l件不同而造成的模糊,得到灰度分配較為均勻的圖

53、像,然后利用最大類間方差閾值法對(duì)圖像進(jìn)行二值化處理,將特征點(diǎn)從人臉圖像分割出來(lái),并分別利用水平和垂直灰度積分投影曲線結(jié)合人臉的結(jié)構(gòu)特征找到眼睛的位置坐標(biāo),實(shí)現(xiàn)了準(zhǔn)確的眼睛定位,從而為進(jìn)一步提取其它特征點(diǎn)打好了基礎(chǔ)。整個(gè)過(guò)程如圖 1所示:圖像直方圖均衡化圖像二值化處理根據(jù)積分投影定位眼睛的大概位置眼睛精確定位的圖像找到眼睛的精確位置圖像中值濾波輸入圖像圖像灰度化用積分投影將圖像縮到眉眼區(qū)域 圖3-1 眼睛精確定位步驟流程圖3.2 人臉識(shí)別的常用方法根據(jù)表征方式的不同,人臉識(shí)別常用的方法大致分為基于幾何特征的識(shí)別、基于代數(shù)特征的識(shí)別和基于神經(jīng)網(wǎng)絡(luò)的識(shí)別方法?;趲缀翁卣鞯淖R(shí)別方法主要是利用人臉的特

54、征點(diǎn)在圖像中明顯區(qū)別與其他區(qū)域的特點(diǎn)(如灰度偏低)進(jìn)行特征提取和定位,通過(guò)構(gòu)造幾何特征向量來(lái)達(dá)到識(shí)別人臉的目的。人臉的主要特征包括眼睛,鼻子,嘴巴,下巴等,對(duì)于這些特征點(diǎn)的提取是否準(zhǔn)確將直接關(guān)系到整個(gè)識(shí)別系統(tǒng)的性能。本文主要研究眼睛的定位,通過(guò)眼睛的定位可求得人臉中心對(duì)稱軸,以眼睛之間的距離為基準(zhǔn)對(duì)所提取的面部特征向量進(jìn)行歸一化,可以使得這些特征向量具有旋轉(zhuǎn)不變性,因此準(zhǔn)確的定位眼球位置是基于幾何特征的人臉識(shí)別系統(tǒng)中非常重要的一個(gè)環(huán)節(jié)。基于灰度投影的人臉特征提取是一種非常重要的方法,國(guó)外很多學(xué)者在這方面進(jìn)行了研究,如Dieckmann和KarinSobottka曾提出的直接對(duì)原圖做灰度投影的方

55、法,這種方法的缺點(diǎn)是投影圖像中干擾噪聲太大,曲線不規(guī)則,很難在此基礎(chǔ)上直接找到特征點(diǎn)。后來(lái)又有人提出了改進(jìn)的利用灰度方差投影圖找特征點(diǎn)的方法,但計(jì)算復(fù)雜度也相應(yīng)的加大了。目前的眼睛定位方法較多 ,但各有其優(yōu)缺點(diǎn)。邊緣提取法是首先進(jìn)行對(duì)人臉圖像進(jìn)行邊緣提取 ,然后用霍夫變換 檢測(cè)眼球 ,構(gòu)造一個(gè)包括眼睛、眼瞼的眼部模板 ,用一系列函數(shù)從能量角度找出眼瞼 ,該方法需要做大量預(yù)處理 ,參數(shù)過(guò)多的眼部模板不適用于個(gè)體差異太大的人臉;灰度投影法 對(duì)人臉圖像進(jìn)行水平和垂直方向的投影 ,根據(jù)波峰波谷的分布信息來(lái)定位眼睛 ,這種方法定位速度較快 ,但波峰波谷的分布對(duì)不同的人臉和姿態(tài)的變化非常敏感 ,定位精度較

56、差;模板匹配 是一種有效的模式識(shí)別技術(shù) ,它能利用圖像信息和有關(guān)識(shí)別模式的先驗(yàn)知識(shí) ,更加直接地反映圖像之間的相似度 ,傳統(tǒng)的模板匹配方法首先要分別得到左眼和右眼模板 ,然后分別用左右眼模板在圖像中進(jìn)行匹配 ,得到兩個(gè)相似度最大的點(diǎn)作為定位的眼睛 ,這種方法比較簡(jiǎn)單 , 但計(jì)算量較大 ,定位準(zhǔn)確率較低。此外還有使用分形維數(shù)的方法 ,這種方法定位準(zhǔn)確率較高 ,但由于需要多次計(jì)算,運(yùn)算復(fù)雜。3.3 投影法原理投影法是根據(jù)圖像在一些方向上的投影的分布特征來(lái)進(jìn)行檢測(cè),這種方法在 本質(zhì)上是一種統(tǒng)計(jì)方法。圖像中,長(zhǎng)方形的垂直投影和水平投影分別定義為:(3.1)(3.2)投影就是統(tǒng)計(jì)出圖像中每列與每行某區(qū)間

57、中非零像素點(diǎn)的數(shù)目。設(shè)二值圖像為,大小為,非零像素值為,設(shè)第列的非零像素點(diǎn)的數(shù)目為,設(shè)第行非零像素點(diǎn)的數(shù)目為,則:(3.3)(3.4)因此,行投影,就是對(duì)軸投影,得到的值最大的那一點(diǎn)。列投影,就是對(duì)軸投影,得到的值最大的那一點(diǎn)。3.4 人眼左右邊界的判定人眼的自動(dòng)定位算法所處理的圖像為單人灰度圖像。下面以圖為例說(shuō)明算法過(guò)程。這些圖像為256級(jí)灰度圖像,像素值0代表黑色,255代表白色。由于人眼區(qū)域的灰度特征與人臉部其它部位有明顯的不同 ,采用積分投影很容易得到眼睛的大致位置。設(shè)所處理的圖像為,其大小為,則該圖像的水平灰度投影函數(shù)為: (3.5) 其中為垂直灰度投影曲線。觀察不同單人圖像的垂直灰

58、度投影曲線,如圖所示,可以發(fā)現(xiàn)人臉?biāo)趨^(qū)域?qū)⑹勾怪被叶韧队扒€形成一個(gè)具有一定寬度的凹谷。這個(gè)凹谷的左右邊界大致代表了人臉的左右邊界,這是因?yàn)榕c背景相比,人臉區(qū)域往往具有較高的亮度。在人臉左右邊界處,垂直方向上亮度值的總和迅速減小,形成一個(gè)明顯的凹谷。因此,只須確定垂直灰度投影曲線中主要凹谷的左右邊界,即可得到人臉的左右邊界。為了除去噪聲的影響,對(duì)垂直灰度投影曲線進(jìn)行平滑處理,平滑處理后的曲線稱為: (3.6)的取值跟人臉在圖像中的大小有關(guān),實(shí)驗(yàn)中取=16。平滑后的垂直灰度投影曲線如圖所示。將凹谷的下降沿梯度值最大的點(diǎn)作為人臉的左邊界,凹谷的下降沿梯度值最小的點(diǎn)作為人臉的右邊界。算法實(shí)現(xiàn)上,假

59、設(shè)人臉的左邊界點(diǎn)不超出,實(shí)驗(yàn)中取=0.7,求出曲線在段上具有最大梯度值的點(diǎn),記為x1,x1即為人臉的左邊界;再求曲線xx1,N段的最小梯度值點(diǎn),記為x2,x2即為人臉的右邊界。圖為從圖像中檢測(cè)出來(lái)的人臉區(qū)域??梢钥闯?人臉的左右邊界定位準(zhǔn)確,滿足后續(xù)步驟檢測(cè)人眼的需要。圖 3-2垂直灰度投影曲線圖3-3 定位左右邊界的人臉3.5 眉眼區(qū)域的判定當(dāng)?shù)玫阶笥疫吔缰?,再對(duì)圖像進(jìn)行垂直投影 ,這樣就可以減少人臉兩側(cè)頭發(fā)背景等因素的干擾 ,使得下一步的投影波峰和波谷更明顯,從而更容易判斷眼睛區(qū)域。人眼水平位置的預(yù)估當(dāng)人臉的左右邊界確定之后,取左右邊界之間的人臉區(qū)域作為研究對(duì)象。設(shè)此時(shí)的圖像區(qū)域大小為,該圖像區(qū)域的水平灰度投影函數(shù)為:(3.7)稱為水平灰度投影曲線。為了去除噪聲的影響,采用一樣的方法對(duì)進(jìn)行平滑得: (3.8)的取值跟人臉在圖像中的大小有關(guān),實(shí)驗(yàn)中取=6。平滑后的水平灰度投影曲線如圖所示。 圖3-4垂直灰度投影曲線圖3-5定位上下邊界的人臉得到的灰度投影曲線的前段谷區(qū)域?qū)?yīng)于人的頭頂部分 ,因?yàn)轭^發(fā)的低灰度產(chǎn)生了水平投影曲線的低谷;而曲線的最大值點(diǎn)和次最大值點(diǎn)分別對(duì)應(yīng)人的額頭部位和人的鼻中部。那么曲線中的最大值點(diǎn)和次最大值點(diǎn)之間的低谷對(duì)應(yīng)人眼 ,因此原人臉圖像中對(duì)應(yīng)最大值點(diǎn)和次最大值點(diǎn)之間的那部分圖像即對(duì)應(yīng)人眼所處的大致水平位置,這樣就將原來(lái)的人臉圖像縮小到大致只有眉毛和

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論