



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、computer engineering and applications 計算機工程與應用2012,48(30)193結(jié)合分塊 dct 系數(shù)及其統(tǒng)計特征的人臉識別劉凡秀,蔡茂國,陳章樂liu fanxiu, cai maoguo, chen zhangle深圳大學 計算機與軟件學院,廣東 深圳 518060college of computer and software, shenzhen university, shenzhen, guangdong 518060, chinaliu fanxiu, cai maoguo, chen zhangle. combination of coef
2、ficient and statistical features of block dctfor face recognition. computer engineering and applications, 2012, 48(30):193-196.abstract:a face recognition algorithm based on coefficient and statistical features of block dct is proposed. theimage is partitioned into a set of blocks, choosing the dct
3、coefficient of the low frequency part as its features. at the same time the dct transform is performed on each block in order to decompose it into a low-pass filtered image and a reversed l-shape blocks containing the high frequency coefficients of the dct; the statistical measures such as mean, var
4、iance, and entropy rate are then computed on the low-pass filtered image and a reversed l-shape blocks; svm and the nearest neighbor classifier are selected to perform face classification. the experimental results on orl and yale face databases show that the algorithm based on statistical features o
5、f block dct achieves high recognition rate.key words:discrete cosine transform(dct); support vector machine(svm); nearest neighbor classifier; statis-tical features; face recognition摘 要:提出了一種基于分塊 dct 系數(shù)及其統(tǒng)計特征的人臉識別算法。對圖像進行分塊,對每一塊進行 dct變換,選擇低頻部分的系數(shù)作為識別的特征,將每一塊分解為一幅低通濾波圖和一個包含 dct 高頻系數(shù)的反 l 型塊;分別對這兩塊求其均值
6、、方差和熵這三個統(tǒng)計特征;利用支持向量機(svm)和最近鄰分類器對這些特 征進行分類識別。在 orl、yale 人臉數(shù)據(jù)庫上的仿真實驗表明,使用基于分塊 dct 系數(shù)及其統(tǒng)計特征可達到 較高的識別率。關鍵詞:離散余弦變換(dct);支持向量機;最近鄰分類器;統(tǒng)計特征;人臉識別文章編號:1002-8331(2012)30-0193-04文獻標識碼:a中圖分類號:tp3911引言當今社會,隨著信息化進程的深入和互聯(lián)網(wǎng)的 迅速發(fā)展,信息的安全性、隱蔽性越來越受到人們的 重視。人臉識別技術也因其所具有的方便、友好、直 接、易于為用戶所接受等特點在近幾十年來倍受研 究人員的青睞,相關的方法也相繼被提出。
7、根據(jù)對 國內(nèi)外大量文獻的統(tǒng)計,主要可以分為基于整體的 方法,典型的有 pca 特征臉和 fisher 臉方法等;基于 局部的方法,如純幾何方法、彈性匹配方法等;基于融合的方法,即同時使用整體和局部信息來識別人臉。在文獻1中,通過利用圖像的積分投影方法,對 圖像進行裁剪并縮放到 30 30 的標準大小,然后再利用 pca 的方法進行識別,由于人臉識別易受光照、姿勢、遮擋、表情等影響,所以在利用積分投影方法對圖像進行裁剪時,很難準確得到標準圖像,且 pca 法的一個不足是需要求解高維矩陣的特征分解問 題,計算量較大,其次,當有新圖像加入時,必須重新 計算新圖像與原庫中的所有圖像的協(xié)方差矩陣,不作者
8、簡介:劉凡秀(1987),女,碩士,主要研究方向:多媒體信息處理、人臉識別;蔡茂國(1965),男,教授,碩士生導師,主要研究方向:多媒體信息處理、計算機網(wǎng)絡;陳章樂(1987),男,碩士,主要研究方向:多媒體信息處理、人臉檢測。e-mail:收稿日期:2011-06-15修回日期:2011-08-15cnki 出版日期:2011-10-24doi:10.3778/j.issn.1002-8331.2012.30.040/kcms/detail/11.2127.tp.20111024.1015.085.htm
9、lc(u v) 是dct 系數(shù)。 a(u) ,a(v) 的定義為:利于新圖像的加入。離散余弦變換(dct)是由 n.ahmed 等人在 1974 年提出的正交變換方法,且被廣泛用于語音和圖像 信號壓縮,信號經(jīng)過正交變換后,能量會集中在少數(shù) 變換系數(shù)上,一般是集中在變換后的低頻部分,刪除 對信號貢獻較小的系數(shù),只利用余留下來的系數(shù)便 可恢復大致的信號,且不會引起明顯的失真,dct 的 數(shù)據(jù)壓縮能力在一定條件下近似于 pca,dct 可對 圖像進行單獨的處理,且 dct 有快速的算法2。近些 年來,許多研究者將 dct 方法運用到人臉識別中,并 取得了不錯的效果。如在文獻3提出了基于 dct 與
10、svm 的人臉識別方法,并獲得了不錯的識別率。在 文獻4 中,randa 等受小波分解思想的啟發(fā),提出 dct 金字塔式的多分辨率的特征提取方法,其采用 多分塊 dct 金字塔方法進行人臉識別時,也取得了 較不錯的效果。因為圖像經(jīng) dct 變換之后,用較少 的低頻系數(shù)便可恢復大致的圖像,而統(tǒng)計特征均值 能很好地表現(xiàn)圖像的平均灰度信息,方差能很好地 表現(xiàn)圖像內(nèi)灰度波動的情況,熵5可以很好地表現(xiàn)圖 像的紋理信息。且在文獻4中,對圖像進行多級dct 分解比較麻煩,且文中忽略了能代表圖像整體信息 的 dct 系數(shù)。受此啟發(fā),本文提出了利用分塊 dct 系數(shù)及其統(tǒng)計特征進行人臉識別的方法,該方法首 先對
11、圖像進行分塊,并對每一塊進行 dct 變換,選擇 低頻部分的系數(shù)作為識別的特征,同時將其分解為 一幅低通濾波圖和一個包含 dct 高頻系數(shù)的反 l 型 塊;然后分別對這兩塊求其均值、方差和熵這三個統(tǒng) 計特征;最后利用支持向量機(svm)和最近鄰分類 器對這些特征進行分類識別。在 orl、yale 人臉數(shù) 據(jù)庫上的實驗結(jié)果表明,該方法優(yōu)于文獻3和文獻4 的方法。1u = 0m a(u) = 2 u = 1 2 3 m - 1m1n v = 0a(v) = 2v = 1 2 3 m - 1n dct 反變換公式為:i (x y) =m - 1 n - 1 (2x + 1)u (2y + 1)v c
12、(u, v)a(u)a(v)cos(2)cos 2m2nu = 0 v = 0其中,x = 0 1 2 m - 1 ,y = 0 1 2 n - 1 。圖 1 所表示的是對一幅圖像進行 dct 變換后,取左上角四分之一大小的低頻系數(shù)經(jīng) dct 反變換后得到的低通濾波圖像,和剩余類似于反 l 型 dct 高 頻系數(shù)。(a)原圖片(b)低通濾波圖(c)反 l 型 dct高頻系數(shù)圖 1 人臉的 dct 及 idct 變換2.2結(jié)合分塊 dct 系數(shù)及其統(tǒng)計特征提取特征提取是人臉識別中最基本的問題之一,由 于人臉圖像數(shù)據(jù)的高維性和數(shù)據(jù)之間冗余性。因此 特征提取時不但要提取出最有利用人臉分類的特 征,而
13、且要極大地降低人臉樣本的維數(shù)?;谛〔?分解,小波包分解以及 dct 分解的方法,能很好地降 低圖像的維數(shù)。另外一種有效的降維方法就是計算 圖像的一系列統(tǒng)計特征,如均值、方差、熵等??紤]到圖像經(jīng) dct 變換之后,用較少的低頻系 數(shù)便可恢復大致的圖像,而統(tǒng)計特征均值能很好地 表現(xiàn)圖像的平均灰度信息,方差能很好地表現(xiàn)圖像 內(nèi)灰度波動的情況,熵可以很好地表現(xiàn)圖像的紋理 信息。所以在本文中將同時使用 dct 分解和計算圖2結(jié)合分塊 dct 系數(shù)及其統(tǒng)計特征的人臉識別算法和關鍵技術2.1離散余弦變換dct 是一種常用的正交變換,圖像經(jīng) dct 變換 后,圖像的主要信息集中在低頻部分,可以通過提取 低頻
14、部分的少量系數(shù)進行 dct 反變換,得到原圖像 的近似圖。對 一 幅 大 小 為 m n 圖 像 i (x y) ,其 二 維 的dct 變換的定義如下:c(u v) =像的統(tǒng)計特征的方法來提取特征。對于一幅圖像,先將其分成大小一樣的 k 塊,然后對每塊進行 dct變換,提取低頻部分中的少量系數(shù)作為特征,同時利 用圖 1 所示的方法,將每塊分解成一幅低通濾波圖和 一個反 l 型 dct 高頻系數(shù)塊,然后計算這兩部分中 的均值、方差和熵這三個統(tǒng)計特征。對于每一部分a(u)a(v) i (x y)cos (2x + 1)u cos (2y + 1)v m - 1 n - 1(1) 2m 2nx =
15、 0 y = 0其 中 ,u = 0 1 2 m - 1 ,v = 0 1 2 n - 1 。劉凡秀,蔡茂國,陳章樂:結(jié)合分塊dct 系數(shù)及其統(tǒng)計特征的人臉識別2012,48(30)1952的統(tǒng)計特征向量可以表示為 vi =i i hi ,其中,中,一般有“一對一”、“一對多”、“dag”等方法。2對 于有 n 類樣本,“一對一”方法的問題是需要構(gòu)n (n - 1)/2 個兩類分類器,最后采用投票方式進行分 類?!耙粚Χ唷狈椒ㄖ恍枰獦?gòu)造 n 個 svm 分類器,它的問題是會出現(xiàn)“數(shù)據(jù)集偏斜”。而對于“dag”方法i i 分別表示均值、方差和熵,分別被定義為:m n1i = m n (si (
16、y x)(3)y = 1 x = 1m n 2 1 i = m n (s ( y x) - )(4)ii會出現(xiàn)錯誤累積,如果第一次分類器不能正確判別,y = 1 x = 1hi = - ( p lb( p)(5)則會出現(xiàn)一直錯誤判別下去,這樣會導致分類率的下降。chih-wei hsu 等人對上述的三種方法進行了比 較,表明一一區(qū)分法的分類性能最優(yōu)6。本文對所提 取的統(tǒng)計特征采用“一對一”進行判別。2.4 算法實現(xiàn)步驟(1)將圖像縮放成大小為 80 80 ,然后將圖像分 成 8 8 大小的100 塊。(2)對于每一塊進行 dct 變換,并利用 zig-zag 之 字形7 方法提取低頻部分中的少
17、量系數(shù)組成系數(shù)特征向量 c n ,其中 n 為所提取的 dct 系數(shù)的個數(shù)(本 文中 n = 3)。同時取左上角四分之一大小的低頻系 數(shù)經(jīng) dct 反變換后得到的低通濾波圖像,剩余四分 之三的 dct 高頻系數(shù)組成一個類似于反 l 型 dct 高 頻系數(shù)塊。然后分別對低通濾波圖像求其均值 (il)其中,m 和 n 分別是每一分塊的大小,它的值為si ( y x) ,p 是直方圖統(tǒng)計。因為反 l 型塊表示的是 圖像經(jīng) dct 變換后的高頻交流系數(shù),它們的值通常 都比較小,它們的均值相對來說也非常小,一般可以忽略,且反 l 型塊的紋理不明顯,所以它的熵重要性 不高。所以對于反 l 型塊,只計算其方
18、差這一特征, 而對于低通濾波圖,由于是先對圖像進行分塊,然后 再對分塊進行 dct 變換和反變換,所以每塊內(nèi)像素 間的差異不會很大,也就是說,它的方差將會很小, 所以也可以忽略不計。因為,對于每一個低通濾波 圖像,只計算其均值和熵特征。所以每一塊的統(tǒng)計2特征向量可表示為:vi =il hil ih ,其中 il hil 2ih 分別表示每塊內(nèi)的低通濾波圖像的均值、熵以及反 l 型 塊 的 方 差 。 每 塊 的 特 征 向 量 可 以 表 示 為nnvi c ,其中 c 表示所選取的 dct 系數(shù)向量,n 表示的是所選取的 dct 系數(shù)的個數(shù)。則每一幅圖像的k和熵 (h ),對反 l 型 dc
19、t 高頻系數(shù)塊求其方差 ( 2ih ) ,il組成一個統(tǒng)計特征向量 v = h 2ih 。則每塊的iililn特征向量可以表示為 v = vi c ,其中 k 表示圖像n特征向量可以表示為vi c 。每幅圖像的特征向量ki = 1總共被分成了 k 塊,如圖2 所示。n表示為 v = vi c ,其中 k = 100 。i = 1(3)對訓練圖像和測試圖像進行如(2)的操作,得 到訓練圖像和測試圖像的特征庫。再分別利用 svm 和最近鄰分類器進行識別。在使用 svm 進行分類之 h8il il44 idct82vi =il hil ih 2i88 dctc n前,先分別對訓練特征和測試特征進行規(guī)
20、一化操作,k使其具有零均值和單位方差。v = vi c ni = 1圖 2 人臉的特征向量提取2.3支持向量機支持向量機(svm)是一種基于結(jié)構(gòu)風險最小化 原則的通用學習算法,它的基本思想是在樣本輸入 空間或特征空間構(gòu)造出一個最優(yōu)超平面,使得超平 面到兩類樣本集之間的距離達到最大,從而得到最 好的泛化能力,在解決小樣本、非線性及高維模式識 別中表現(xiàn)出許多特有的優(yōu)勢(http:/www.blogjava. net/zhenandaci/archive/2009/02/13/254519.html)。 支 持向量機算法是專門針對性小樣本的二分類問題提 出的。對于多分類的問題,可以通過建立多個 sv
21、m 分類器的方式方法加以解決。在現(xiàn)有的解決方法3實驗結(jié)果及分析本文的實驗平臺是 windows 7,采用 matlabtmr2010a 編 程 實 現(xiàn) ,在 配 置 為 intel core i5 cpu2.53 ghz 2.0 gb ram 的 asus 筆記本上進行了仿 真 。 實 驗 中 支 持 向 量 機 采 用 林 智 仁 的 libsvm(http:/.tw/cjlin/libsvm/libsvm-3.1. zip)。因為人臉識別容易受姿態(tài)、表情、光照等因素 的影響,為了驗證所提出算法在不同條件下的識別 能力,同時在orl 和yale 人臉庫上進行了
22、實驗。3.1 orl 人臉庫實驗該人臉庫由 40 人、每人 10 幅(見圖 3),共 400 幅圖像組成,主要包括了姿態(tài)、表情和面部飾物的變化,所用圖像的大小為 112 92 。隨機選擇每個人的 5 幅 圖像作為訓練樣本,剩余的另外 5 幅圖像作為測試圖 像。首先將圖像縮放成大小為 80 80 ,然后將圖像 分成 8 8 大小的100 塊。進行了兩組實驗,分別是利 用 dct 系數(shù)與統(tǒng)計特征進行人臉識別,和只用 dct 系數(shù)進行人臉識別,在 dct 系數(shù)的選擇上,采用了 zig-zag 之字形的方法。最后分別利用最近鄰分類器 和svm 對特征進行分類。(a)正確識別(b)錯誤識別圖 4 利用
23、dct 系數(shù)與統(tǒng)計特征作為特征,利用歐式距離進行判別的結(jié)果3.2yale 人臉庫實驗該人臉庫由 15 人,每人 11 幅的 165 幅圖像組成,主要包含光照、表情和姿態(tài)的變化。所用圖像的大小為 100 100 。隨機選擇每個人的 5 幅圖像作為訓 練樣本,剩余的另外 6 幅圖像作為測試圖像。因為該 人臉庫的圖像光照變化較大,所以在對圖像進行分 塊提取特征前,先利用直方圖均衡化對圖像進行處理,然后再與orl 人臉庫中實驗一樣,做一樣的處理。總共重復進行了10 次實驗,實驗結(jié)果如表2 所示。從表 2 中可以看出,雖然兩種方法都可以達到比 較高的識別率,但是本文中所提出的方法在 yale 人 臉庫上
24、識別率并不是特別理想,主要原因可能是因 為 yale 人臉庫中圖像的光照變化較大,圖像經(jīng)過直 方圖預處理之后,使得類間差異性變小了。所提取 到的統(tǒng)計特征類間差異性變小,從而不利于圖像的 分類。圖 3 orl 人臉數(shù)據(jù)庫中的 10 幅人臉在利用 dct 系數(shù)與統(tǒng)計特征進行人臉識別時,每塊提取了 6 個特征,即 3 個 dct 系數(shù)特征和 3 個統(tǒng) 計特征。在只用 dct 系數(shù)進行人臉識別,每塊提取 了 6 個 dct 系數(shù)特征。最近鄰分類器中所采用的是 歐式距離進行判別,svm 中所選用的核函數(shù)是線性 核函數(shù),其參數(shù)是默認的參數(shù)。總共重復進行了 10 次實驗,實驗結(jié)果如表1 所示。從表 1 中可
25、以看出,利用 dct 系數(shù)和統(tǒng)計特征 的方法能得到比較高的識別率,其中 dct 系數(shù)和統(tǒng) 計特征+svm 的方法所獲得的識別率是最高的,平均 識別率達到了96.7%。在文獻4中,利用多分塊dct 金字塔方法所獲得的最高識別率是 95.9% ,相對來 說,本文所提出的方法要優(yōu)于文獻4的方法。圖 4 顯 示的是利用 dct 系數(shù)與統(tǒng)計特征作為特征,利用歐 式距離進行判別的結(jié)果。4結(jié)論提出了一種結(jié)合分塊 dct 系數(shù)及其統(tǒng)計特征 的人臉識別方法,充分利用了統(tǒng)計特征和 dct 在降 低特征維數(shù)和保留對表情、姿態(tài)等不敏感的類別信息方面的優(yōu)點。從實驗結(jié)果來看,該方法對于姿態(tài)、表情變換具有一定的魯棒性,在
26、orl 人臉庫上得到了較高的識別率。但是對于光照變換有點敏感。本 文對于每個分塊內(nèi)的 dct 系數(shù)的個數(shù)的選取,是根表 1 orl 數(shù)據(jù)庫中算法識別結(jié)果比較(%)svm(線性核函數(shù))最近鄰分類器(歐式距離)方法最高識別率最低識別率平均識別率最高識別率最低識別率平均識別率dct 系數(shù)和統(tǒng)計特征dct 系數(shù)999494.084.596.791.196.596.0919193.7593.80表 2 yale 數(shù)據(jù)庫中算法識別結(jié)果比較(%)svm(線性核函數(shù))最近鄰分類器(歐式距離)方法最高識別率最低識別率平均識別率最高識別率最低識別率平均識別率dct 系數(shù)和統(tǒng)計特征dct 系數(shù)97.7897.789
27、0.0092.2293.5695.7898.89100.0091.1194.4494.2296.11(下轉(zhuǎn)228 頁)2282012,48(30)computer engineering and applications 計算機工程與應用理不確定信息時具有更強的表現(xiàn)能力。結(jié)合 petri 網(wǎng)直觀的知識表示優(yōu)點,提出了模糊推理算法。算法 全部采用矩陣形式運算,便于在計算機上實現(xiàn)。選 取最小決策信息集的元素為模糊控制變量,使推理 過程快速、有效??諔?zhàn)戰(zhàn)術決策主要指飛行員根據(jù)對抗態(tài)勢信息 選取合適的機動,使飛機占據(jù)并保持有利的相對位 置,目的是形成武器攻擊條件,并最終發(fā)射導彈毀傷 目標。影響空戰(zhàn)決策
28、的不確定性因素多,如雷達實 際探測距離、對抗空域氣象條件等,直覺模糊集隸屬 度函數(shù)和非隸屬度函數(shù)可以描述“非此非彼”的“模 糊概念”,具備強大的模糊描述能力,能有效解決不 確定性因素的問題。文中仿真實例的態(tài)勢信息是從 一次真實對抗訓練中采集的,經(jīng)過推理得出的結(jié)論 與戰(zhàn)術專家?guī)斓念A測結(jié)果相符。由于空戰(zhàn)對抗稍縱 即逝,態(tài)勢變化迅速,如果要在實時對抗中應用該模 型輔助飛行員決策,必須考慮算法的時間問題。決 策模型的模糊推理算法時間復雜度為 o(mk nk ) ,其中 n 為庫所數(shù),m 為變遷數(shù),k 為迭代次數(shù),時間復雜度 與 mn 的 k 次冪呈正比,當 k 值較小時,算法時間復 雜度主要由 n 和
29、 m 的乘積決定,當 k 值較大時,算法時間復雜度主要與 k 值有關,與 n 、m 值關系不大。 對于不同的庫所初始值,k 值也不同。與此同時,在 實際應用中還必須考慮機動無效的情況,即無論飛 行員選取何種機動方式,采取何種機動動作,都無法規(guī)避導彈攻擊。出現(xiàn)該情況的可能原因是目標機飛行員的威脅意識不強,攻擊機發(fā)射的導彈已進入末 端制導,彈目距離較近,目標機無法機動規(guī)避導彈攻 擊。通過研究態(tài)勢信息和導彈攻擊包絡線確定機動 無效的時刻,從而進一步完善決策模型。參考文獻:1 周創(chuàng)明,申曉勇,雷英杰.基于直覺模糊 petri 網(wǎng)的敵意圖識 別方法研究j.計算機應用,2009,29(9):2464-2467.2 史志富,張安,劉海燕,等.基于模糊 petri 網(wǎng)的空戰(zhàn)戰(zhàn)術決 策研究j.系統(tǒng)仿真學報,2007,19(1):63-66.3 陳軍,高曉光,符小衛(wèi).基于粗超集理論與貝葉斯網(wǎng)絡的超 視距空戰(zhàn)戰(zhàn)術決策j. 系統(tǒng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建省廈門市集美區(qū)杏東中學2025屆八年級英語第二學期期中監(jiān)測試題含答案
- 關于化肥買賣合同
- 企業(yè)倉庫管理制度
- 高效電壓矢量重構(gòu)在送出線路保護中的應用研究
- 小學生概念課件視頻
- 中醫(yī)養(yǎng)生方法技術學課件
- 小學生植物寫生美術課件
- 人教版機械效率說課課件
- 小學生桂花知識課件視頻
- 質(zhì)量數(shù)據(jù)統(tǒng)計與分析方法
- GB/T 39016-2020定制家具通用設計規(guī)范
- GA/T 998-2012鄉(xiāng)鎮(zhèn)消防隊標準
- FZ/T 52004-2007充填用中空滌綸短纖維
- (完整word版)《西方心理學史》題庫
- 2023年東部機場集團有限公司校園招聘筆試模擬試題及答案解析
- 鋼結(jié)構(gòu)網(wǎng)架施工方案
- 《真菌》精品課件
- BRC第8版FSSC22000:過敏原風險評估及控制措施
- 義務教育均衡發(fā)展督導評估課件
- 小學語文閱讀教學有效性的研究課題方案
- 北京萬集DCS30KⅡ計重收費系統(tǒng)技術方案
評論
0/150
提交評論