




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上HUNAN UNIVERSITY課程模式識(shí)別題目基于知識(shí)庫(kù)的手寫體數(shù)字識(shí)別學(xué)生姓名學(xué)生學(xué)號(hào)專業(yè)班級(jí)學(xué)院名稱2016 年6 月 25 日專心-專注-專業(yè)基于知識(shí)庫(kù)的手寫體數(shù)字識(shí)別1案例背景:手寫體數(shù)字識(shí)別是圖像識(shí)別學(xué)科下的一個(gè)分支,是圖像處理和模式識(shí)別研究領(lǐng)域的重要應(yīng)用之一,并且具有很強(qiáng)的通用性。由于手寫數(shù)字的隨意性很大,如筆畫粗細(xì)、字體大小、傾斜角度等因素都有可能直接影響到字符的識(shí)別準(zhǔn)確率,所以手寫體數(shù)字識(shí)別是一個(gè)很有挑戰(zhàn)性的課題。在過(guò)去的數(shù)十年中,研究者們提出了許多識(shí)別方法,并取得了一定的成果。在大規(guī)模數(shù)據(jù)統(tǒng)計(jì)如例行年檢、人口普查、財(cái)務(wù)、稅務(wù)、郵件分揀等應(yīng)用領(lǐng)域都有
2、廣闊的應(yīng)用前景。本案例實(shí)現(xiàn)了手寫阿拉伯?dāng)?shù)字的識(shí)別過(guò)程,并對(duì)手寫數(shù)字識(shí)別的基于統(tǒng)計(jì)的方法進(jìn)行了簡(jiǎn)要介紹和分析。本文實(shí)現(xiàn)的手寫字體識(shí)別程序具有手寫數(shù)字圖像讀取、特征提取、數(shù)字模板特征庫(kù)以及識(shí)別功能。2 理論基礎(chǔ):2-1手寫字體識(shí)別方法:手寫體數(shù)字識(shí)別是一個(gè)跨學(xué)科的復(fù)雜問(wèn)題,綜合了圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識(shí),其識(shí)別過(guò)程一般包含圖像預(yù)處理、特征提取、分類器的設(shè)定及其后處理等組成。處理流程如圖2-1所示。圖2-1 手寫體數(shù)子識(shí)別流程圖2-2 圖像預(yù)處理手寫體數(shù)字識(shí)別的首要工作是圖像預(yù)處理。在圖像預(yù)處理過(guò)程中需要解決的主要問(wèn)題有:定位、圖像二值化、平滑化(去噪)H J、字符切分、規(guī)范化等
3、。圖像二值化是指將整個(gè)圖像呈現(xiàn)出明顯的黑白效果。待識(shí)別的手寫體數(shù)字圖像在掃描過(guò)程中,常會(huì)帶來(lái)一些噪聲,用不同的掃描分辨率得到的數(shù)字圖像,其質(zhì)量也各不相同,故而要先將這些干擾因素排除掉。另外,還需要正確分割整幅文檔圖像中的手寫體數(shù)字,而分割后的數(shù)字大小、字體常各不相同,故還需進(jìn)行歸一化處理。2-3 特征提取特征提取的目的是從經(jīng)過(guò)預(yù)處理后的數(shù)字圖像中,提取出用以區(qū)分與其它數(shù)字類別的本質(zhì)屬性并數(shù)值化,形成特征矢量的過(guò)程。常見(jiàn)的手寫體數(shù)字特征有:模板特征、統(tǒng)計(jì)特征、結(jié)構(gòu)特征和變換特征。2-4 分類器不同的分類方式對(duì)應(yīng)不同的分類器,可選的分類器有神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等。利用訓(xùn)練出的分類器,對(duì)特征提取后的
4、手寫體數(shù)字進(jìn)行分類識(shí)別。分類器的識(shí)別原理是通過(guò)其拓?fù)浣Y(jié)構(gòu)和內(nèi)置參數(shù)定義了特征空間上的一組曲面或超曲面,利用這組曲面或超曲面將特征空間劃分為不同的區(qū)域,從而達(dá)到分類識(shí)別的目的。2-5算法流程首先,讀入手寫數(shù)字圖片進(jìn)行歸一化處理,統(tǒng)一尺寸。默認(rèn)為2424圖形塊,并通過(guò)ostu算法進(jìn)行二值化;其次,對(duì)二值化圖像進(jìn)行圖像細(xì)化等形態(tài)學(xué)操作,并按照算法要求進(jìn)行特征提??;最后,載入模板矩陣進(jìn)行對(duì)比,選用歐式距離測(cè)度,得到識(shí)別結(jié)果。其算法流程如圖1所示。特征提取根據(jù)手寫數(shù)字圖像本身的結(jié)構(gòu)特征,通過(guò)計(jì)算端點(diǎn)、指定方向直線的交叉點(diǎn)個(gè)數(shù)來(lái)作為特征向量。其主要步驟如下:1 . 垂直交點(diǎn)。對(duì)細(xì)化后的手寫數(shù)字圖像分別在其
5、列寬的5/12、1/2、7/12處生成垂直的三條直線,提取這三條垂直直線與數(shù)字筆畫的角點(diǎn)數(shù)并存儲(chǔ)。2 . 水平交點(diǎn)。對(duì)細(xì)化后的手寫數(shù)字圖像分別在其列寬的1/3、1/2、2/3處生成水平的三條直線,提取這三條垂直直線與數(shù)字筆畫的角點(diǎn)數(shù)并存儲(chǔ)。3 . 對(duì)角交點(diǎn)。對(duì)細(xì)化后的手寫數(shù)字圖像分別提取兩條對(duì)角直線,提取這兩條對(duì)角直線與數(shù)字筆畫的交點(diǎn)數(shù)并存儲(chǔ)。由于以上步驟均作用于細(xì)化后的數(shù)字圖像,其筆畫簡(jiǎn)單且特征穩(wěn)定,因此對(duì)其提取的基本交點(diǎn)及結(jié)構(gòu)端點(diǎn)能反映數(shù)字的本質(zhì)特征,可快速、有效地識(shí)別數(shù)字字符,并達(dá)到較好的識(shí)別正確率。其中,提取筆畫結(jié)構(gòu)端點(diǎn)特征的算法如下。1 . 目標(biāo)定位。對(duì)細(xì)化后的手寫數(shù)字圖像按行從上到
6、下、按列從左到右進(jìn)行順序掃描,定位選擇黑像素點(diǎn)P作為手寫筆畫目標(biāo)。2 . 鄰域統(tǒng)計(jì)。計(jì)算黑色像素P的8領(lǐng)域之和N,若N=1,則像素P為端點(diǎn),端點(diǎn)計(jì)數(shù)器加1;否則舍棄該點(diǎn)。3 . 遍歷圖像。遍歷整個(gè)圖像,重復(fù)進(jìn)行目標(biāo)定位、領(lǐng)域統(tǒng)計(jì)的操作流程,提取端點(diǎn)特征。依據(jù)上述對(duì)手寫數(shù)字圖像的交點(diǎn)、端點(diǎn)特征提取方法,本案例中的特征向量VEC由9個(gè)分類組成,其排列如下:VEC=垂直5/12處交點(diǎn)數(shù),垂直中線交點(diǎn)數(shù),垂直7/12處交點(diǎn)數(shù),水平1/3處交點(diǎn)數(shù),水平中線交點(diǎn)數(shù),水平2/3處交點(diǎn)數(shù),左對(duì)角線交點(diǎn)數(shù),右對(duì)角線交點(diǎn)數(shù),端點(diǎn)數(shù)3模式識(shí)別本案例采用的是基于模式知識(shí)庫(kù)的識(shí)別方法,所以系統(tǒng)調(diào)研的關(guān)鍵步驟就是對(duì)數(shù)字字
7、符的結(jié)構(gòu)特征的分析及其模型的構(gòu)造。因此,本案例首先對(duì)0-9這10個(gè)數(shù)字進(jìn)行結(jié)構(gòu)分析并建模,然后提取相關(guān)特征,最后構(gòu)造模板庫(kù)。在實(shí)驗(yàn)過(guò)程中,我們選擇規(guī)范手寫和自由手寫兩組樣本對(duì)知識(shí)庫(kù)進(jìn)行參數(shù)調(diào)整,這些訓(xùn)練樣本由200個(gè)規(guī)范手寫樣本和200個(gè)自由手寫樣本組成,通過(guò)計(jì)算樣本對(duì)應(yīng)分量的算術(shù)平均值獲得知識(shí)庫(kù)中特征向量的每個(gè)分量。通過(guò)上述步驟得到的知識(shí)庫(kù)由兩套模板組成,在本次實(shí)驗(yàn)過(guò)程中,我們選擇基于模板匹配的識(shí)別方法,通過(guò)技術(shù)歐式距離來(lái)衡量匹配程度。識(shí)別系統(tǒng)中的特征向量包含9個(gè)分量,且計(jì)算距離公式是歐式距離。因此,在識(shí)別過(guò)程中分別計(jì)算待識(shí)別圖像與知識(shí)庫(kù)中各個(gè)模板特征向量之間的歐式距離,即與0-9這10個(gè)數(shù)
8、字逐個(gè)比較,選擇最小距離對(duì)應(yīng)的數(shù)字作為最后的識(shí)別結(jié)果。4程序?qū)崿F(xiàn)手寫體數(shù)字識(shí)別有著廣泛的應(yīng)用前景,目前被廣泛應(yīng)用于財(cái)務(wù)報(bào)表、銀行票據(jù)、戶籍登記、稅務(wù)信息、統(tǒng)計(jì)信息等方面,是模式識(shí)別和圖像處理領(lǐng)域的一個(gè)研究熱點(diǎn)。4-1 圖像預(yù)處理該步驟主要是對(duì)輸入的圖像進(jìn)行灰度化、歸一化、濾波、二值化。鑒于數(shù)字的識(shí)別與色彩無(wú)關(guān),并且考慮到噪聲影響,這里采用中值濾波去噪,將圖像進(jìn)行預(yù)處理,最終可得到二值化圖像。 圖4-1 待識(shí)別手寫數(shù)字 圖4-2 二值化圖像 圖4-3 歸一化圖像 圖4-4 中值濾波4-2 特征提取該步驟主要是對(duì)預(yù)處理得到的二值圖像進(jìn)行圖像細(xì)化操作,并按照算法要求提取交點(diǎn)、端點(diǎn)特征,組成特征向量。
9、本節(jié)根據(jù)上一節(jié)中的特征提取方法,對(duì)基于24x24點(diǎn)陣的細(xì)化圖像進(jìn)特征提取,提取的特征矢量維度為32。對(duì)于矩特征,提取特征變量M,M為7個(gè)Hu平面不變矩的第一個(gè),再除以1000,將特征變量的取值范圍規(guī)范化,這是為了防止特征變量的取值較大時(shí)發(fā)生 浮點(diǎn)數(shù)溢出。M1000是特征矢量的第1個(gè)矢量。綜合端點(diǎn)特征提取方法和分區(qū)域特征提取方法產(chǎn)生了6個(gè)特征矢量:點(diǎn)陣上半?yún)^(qū)域端點(diǎn)數(shù)、點(diǎn)陣下半?yún)^(qū)域端點(diǎn)數(shù)、點(diǎn)陣左半?yún)^(qū)域端點(diǎn)數(shù)、點(diǎn)陣右半?yún)^(qū)域端點(diǎn)數(shù)、三結(jié)點(diǎn)數(shù)和四結(jié)點(diǎn)數(shù) 圖4-5 圖像特征預(yù)處理結(jié)果4-3 模式識(shí)別該步驟主要是對(duì)載入的模板矩陣及輸入圖像計(jì)算出特征向量選用歐式距離測(cè)度,進(jìn)而得到識(shí)別結(jié)果。載入模式庫(kù)。我們選擇
10、規(guī)范手寫和自由手寫兩組樣本對(duì)知識(shí)庫(kù)進(jìn)行參數(shù)調(diào)整,這些訓(xùn)練樣本由200個(gè)規(guī)范手寫樣本和200個(gè)自由手寫樣本組成,通過(guò)計(jì)算樣本對(duì)應(yīng)分量的算術(shù)平均值獲得知識(shí)庫(kù)中特征向量的每個(gè)分量。該知識(shí)庫(kù)也稱為判別標(biāo)準(zhǔn)向量矩陣,本文把該矩陣命名為Data.mat。匹配識(shí)別。在本文所提出的方法中,選擇基于模板匹配的識(shí)別方法,通過(guò)計(jì)算歐式距離來(lái)衡量匹配的程度。識(shí)別系統(tǒng)中的特征向量包含9個(gè)分量,且計(jì)算距離公式是歐式距離。5 實(shí)驗(yàn)結(jié)果6 不足與展望手寫體數(shù)字的樣本類別只有10類,與其他大字符集的識(shí)別相比要容易得多。本案例采用的模板匹配分類器節(jié)省時(shí)間,簡(jiǎn)單卻也可以達(dá)到較高的識(shí)別效果。但是在系統(tǒng)的設(shè)計(jì)上由于實(shí)驗(yàn)條件限制,只采用
11、了200組樣本圖像進(jìn)行特征提取,得到模板庫(kù)。特征訓(xùn)練不夠?qū)е伦R(shí)別率不高,可以考慮增加訓(xùn)練樣本,采用神經(jīng)網(wǎng)絡(luò)等識(shí)別器進(jìn)行處理,提高識(shí)別率。參考文獻(xiàn)1錢謖. 基于圖像處理的字符識(shí)別系統(tǒng)研究M. 河北農(nóng)業(yè)大學(xué),2007.2范艷峰,肖樂(lè),甄彤.自由手寫體數(shù)字識(shí)別技術(shù)研究J. 計(jì)算機(jī)工程,2005.3阮秋琦. 數(shù)字圖像處理M. 北京:電子工業(yè)出版社,2001.4楊丹,趙海濱,龍哲. MATLAB圖像處理實(shí)例詳解. 北京:清華大學(xué)出版社,2012.5 Sahel Ba-Karait NO,ShamsuddinS MHandwriRendigits recognition using particleswa
12、rmoptimizationCModeling&Simulation,2008AICMS08Second AsiaInternational Conference onIEEE,2008:6 1 56 1 9源代碼本程序采用模塊化編程的思想進(jìn)行設(shè)計(jì),不同的函數(shù)模塊實(shí)現(xiàn)各自的一個(gè)功能,然后由功能模塊對(duì)各函數(shù)模塊進(jìn)行整合與調(diào)用。最后,再在主函數(shù)模塊中調(diào)用功能模塊,實(shí)現(xiàn)程序的最終功能。二值化模塊:function bw = Bw_Img(I)if ndims(I) = 3I = rgb2gray(I);endbw = im2bw(I, graythresh(I);bw = bw;歸一化模塊funct
13、ion I1 = Normalize_Img(I)if ndims(I) = 3 I = rgb2gray(I);endI1 = imresize(I, 24 24, bicubic);特征提取模塊function num= Main_Process(I, flag)if nargin 1 & v(i, 2)1 & v(i, 1)2 & i2 & jsize(bw,2)-2 . & bw(i, j)=1 . & sum(sum(bw(i-1:i+1, j-1:j+1)=1 num = num + 1; end endend匹配識(shí)別模塊:function result = MaskRecon(Data, v)for i = 1 : size(Data, 1) dis(i) = norm(v-Data(i, :);en
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 組網(wǎng)技術(shù)應(yīng)用知到課后答案智慧樹(shù)章節(jié)測(cè)試答案2025年春成都工業(yè)職業(yè)技術(shù)學(xué)院
- 吉林省“五地六?!焙献黧w2025年高三語(yǔ)文試題5月統(tǒng)一考試試題含解析
- 工程竣工驗(yàn)收?qǐng)?bào)告土壤污染治理效果評(píng)估
- 第13課 遼宋夏金元時(shí)期的對(duì)外交流 教案2024-2025學(xué)年七年級(jí)歷史下冊(cè)新課標(biāo)
- 2025年全球半導(dǎo)體產(chǎn)業(yè)新動(dòng)態(tài):關(guān)鍵數(shù)據(jù)與未來(lái)趨勢(shì)解析
- 2025年白酒行業(yè)資訊:A股市場(chǎng)動(dòng)態(tài)與頭部企業(yè)表現(xiàn)(附關(guān)鍵數(shù)據(jù))
- 山東省德州市第二中學(xué)2024-2025學(xué)年高三上學(xué)期第四次學(xué)情檢測(cè)數(shù)學(xué)試題(解析版)
- 長(zhǎng)沙屋面改造施工方案
- 6年級(jí)上冊(cè)25課筆記
- 2025年?duì)I銷資格考試試題及答案
- 陜西省2024年高中學(xué)業(yè)水平合格考化學(xué)試卷試題(含答案解析)
- 內(nèi)燃機(jī)車司機(jī)技師考試題(強(qiáng)化練習(xí))
- 電化學(xué)儲(chǔ)能電站并網(wǎng)運(yùn)行與控制技術(shù)規(guī)范 第3 部分:并網(wǎng)運(yùn)行驗(yàn)收
- 鄂爾多斯市騰遠(yuǎn)煤炭有限責(zé)任公司礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 氨重大危險(xiǎn)源危險(xiǎn)化學(xué)品安全告知牌安全告知牌
- 工人屋面貼磚合同
- 高考作文評(píng)分標(biāo)準(zhǔn)及評(píng)分細(xì)則
- 企業(yè)培訓(xùn)課件開(kāi)發(fā)獎(jiǎng)勵(lì)
- 第三單元名著導(dǎo)讀《經(jīng)典常談》知識(shí)點(diǎn)整理(解析)
- 八年級(jí)下科學(xué)教學(xué)計(jì)劃+教學(xué)進(jìn)度表(2020浙教版)
- 餐飲行業(yè)燃?xì)獍踩嘤?xùn)
評(píng)論
0/150
提交評(píng)論