基于模式識(shí)別的手寫漢字識(shí)別畢業(yè)設(shè)計(jì)論文_第1頁(yè)
基于模式識(shí)別的手寫漢字識(shí)別畢業(yè)設(shè)計(jì)論文_第2頁(yè)
基于模式識(shí)別的手寫漢字識(shí)別畢業(yè)設(shè)計(jì)論文_第3頁(yè)
基于模式識(shí)別的手寫漢字識(shí)別畢業(yè)設(shè)計(jì)論文_第4頁(yè)
基于模式識(shí)別的手寫漢字識(shí)別畢業(yè)設(shè)計(jì)論文_第5頁(yè)
已閱讀5頁(yè),還剩30頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、摘要模式識(shí)別就是通過(guò)計(jì)算機(jī)用數(shù)學(xué)技術(shù)方法來(lái)研究模式的自動(dòng)處理和識(shí)別。隨著計(jì)算機(jī)技術(shù)的開(kāi)展,人類對(duì)模式識(shí)別技術(shù)提出了更高的要求。在我國(guó)如何將漢字方便、快速地輸入到計(jì)算機(jī)中已成為關(guān)系到計(jì)算機(jī)技術(shù)普及的關(guān)鍵問(wèn)題。特別是對(duì)于大量己有的印刷資料和手稿,計(jì)算機(jī)自動(dòng)識(shí)別輸入己成為必須研究的課題,所以漢字識(shí)別在文獻(xiàn)檢索、辦公自動(dòng)化、郵政系統(tǒng)、銀行票據(jù)處理等方面有著廣闊的應(yīng)用前景。對(duì)手寫漢字進(jìn)行識(shí)別,首先將漢字圖像進(jìn)行處理,抽取主要表達(dá)特征并將特征與漢字的代碼存儲(chǔ)在計(jì)算機(jī)中,這一過(guò)程叫做“訓(xùn)練。識(shí)別過(guò)程就是將輸入的漢字圖像經(jīng)處理后與計(jì)算機(jī)中的所有字進(jìn)行比擬,找出最相近的字就是識(shí)別結(jié)果,這一過(guò)程叫做“匹配。本文主

2、要介紹了模式識(shí)別的根本原理和手寫的10個(gè)漢字字符的識(shí)別系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)過(guò)程。第一章介紹了與模式識(shí)別有關(guān)的概念、描述方法、有關(guān)的數(shù)學(xué)運(yùn)算和此學(xué)科的開(kāi)展?fàn)顩r。第二章分析了模式識(shí)別的過(guò)程、圖像文件的格式,并詳細(xì)介紹了BMP格式圖像的結(jié)構(gòu);由于本文設(shè)計(jì)的識(shí)別系統(tǒng)是在VC+環(huán)境下開(kāi)發(fā)的,所以給出了CDib類的定義和功能介紹。第三章主要討論了分類器設(shè)計(jì)過(guò)程中的特征空間優(yōu)化設(shè)計(jì)問(wèn)題、分類器設(shè)計(jì)準(zhǔn)那么、根本方法和判別函數(shù)的知識(shí)。第四章在前三章知識(shí)的根底上,給出了模板匹配法識(shí)別圖像的原理,類GetFeature的功能及定義,識(shí)別系統(tǒng)設(shè)計(jì)的開(kāi)發(fā)流程及實(shí)現(xiàn)過(guò)程,并對(duì)實(shí)驗(yàn)結(jié)果做出簡(jiǎn)單的分析。關(guān)鍵詞:模式識(shí)別 BMP位圖

3、 分類器 手寫漢字識(shí)別 模板匹配 = 1 * ROMAN IABSTRACTThe pattern recognition researches how to treat with and recognize pattern automatically through computer with math arithmetic. Along with the development of computer technology, human need more advanced pattern recognition technology. In our country it is a key

4、 problem for computer technologys popularization that how to input Chinese characters into computer fleetly and conveniently. Especially for large numbers of printed data and manuscript, the automatic recognition and input of Chinese characters becomes a stringent task, therefore the Chinese charact

5、er recognition will have a broad application prospect on literature retrieval, office automation, postal service system, bank bill processing.In order to recognize Chinese characters, the first task we have to do is feature extraction of a map, after that we have to store the feature in the computer

6、. This process is called the training. The second process is called “match, This process compares the hand-written Chinese characters feature and the stored features in the computer.This paper mainly introduces the basic principles of pattern recognition and the design、 realization process of ten ha

7、nd-written Chinese characters recognition system. The first chapter mainly introduces the concepts related to the pattern recognition, the description method, the mathematics operation and this disciplines development condition. The second chapter introduces the pattern recognitions process, the pic

8、ture format, especially the BMP form which is used in this paper. This article designs the recognition system under the VC IDE, therefore we introduce a CDib classs definition and the functions. The third chapter mainly introduces characteristic space optimization design, the classifications design

9、criterion, the essential method and the knowledge about knowledge function. The fourth chapter produces the principle of template match recognition arithmetic, the class GetFeatures definition and the functions, the recognition systems design flow and the realizations process, finally we produce the

10、 experimental result and the simple analysis. Kewords: Pattern Rocognition BMP Classification Template Match Hand-written Chinese Characters Recognition = 2 * ROMAN II目 錄 TOC o 1-3 h z u HYPERLINK l _Toc136964223 第1章 緒 論 PAGEREF _Toc136964223 h 1 HYPERLINK l _Toc136964224 1.1模式識(shí)別中的一些根本概念 PAGEREF _To

11、c136964224 h 1 HYPERLINK l _Toc136964225 1.2模式的描述方法 PAGEREF _Toc136964225 h 1 HYPERLINK l _Toc136964226 1.3模式識(shí)別學(xué)科介紹及現(xiàn)狀 PAGEREF _Toc136964226 h 3 HYPERLINK l _Toc136964227 1.4論文的主要研究工作 PAGEREF _Toc136964227 h 3 HYPERLINK l _Toc136964228 第2章 模式識(shí)別系統(tǒng)及位圖根底 PAGEREF _Toc136964228 h 4 HYPERLINK l _Toc136964

12、229 2.1模式識(shí)別系統(tǒng)結(jié)構(gòu) PAGEREF _Toc136964229 h 4 HYPERLINK l _Toc136964230 2.2圖像識(shí)別 PAGEREF _Toc136964230 h 5 HYPERLINK l _Toc136964231 圖像識(shí)別簡(jiǎn)介 PAGEREF _Toc136964231 h 5 HYPERLINK l _Toc136964232 圖像識(shí)別過(guò)程 PAGEREF _Toc136964232 h 5 HYPERLINK l _Toc136964233 2.3位圖根底知識(shí) PAGEREF _Toc136964233 h 6 HYPERLINK l _Toc13

13、6964234 圖像文件格式介紹 PAGEREF _Toc136964234 h 6 HYPERLINK l _Toc136964235 2.3.2 BMP文件結(jié)構(gòu) PAGEREF _Toc136964235 h 8 HYPERLINK l _Toc136964236 2.3.3 CDib類的建立 PAGEREF _Toc136964236 h 10 HYPERLINK l _Toc136964237 第3章 分類器設(shè)計(jì) PAGEREF _Toc136964237 h 12 HYPERLINK l _Toc136964238 3.1 特征空間優(yōu)化設(shè)計(jì)問(wèn)題 PAGEREF _Toc1369642

14、38 h 12 HYPERLINK l _Toc136964239 3.2分類器設(shè)計(jì)準(zhǔn)那么 PAGEREF _Toc136964239 h 13 HYPERLINK l _Toc136964240 3.3類器設(shè)計(jì)根本方法 PAGEREF _Toc136964240 h 14 HYPERLINK l _Toc136964241 3.4 判別函數(shù) PAGEREF _Toc136964241 h 14 HYPERLINK l _Toc136964242 3.5訓(xùn)練與學(xué)習(xí) PAGEREF _Toc136964242 h 16 HYPERLINK l _Toc136964243 第4章 模板匹配分類器識(shí)

15、別漢字系統(tǒng)的實(shí)現(xiàn) PAGEREF _Toc136964243 h 17 HYPERLINK l _Toc136964244 4.1系統(tǒng)的功能描述 PAGEREF _Toc136964244 h 17 HYPERLINK l _Toc136964245 4.2模板匹配法的理論根底 PAGEREF _Toc136964245 h 17 HYPERLINK l _Toc136964246 4.3特征類的設(shè)計(jì) PAGEREF _Toc136964246 h 18 HYPERLINK l _Toc136964247 4.4系統(tǒng)的設(shè)計(jì)流程及功能的具體實(shí)現(xiàn) PAGEREF _Toc136964247 h 1

16、9 HYPERLINK l _Toc136964248 4.5實(shí)驗(yàn)結(jié)果和分析 PAGEREF _Toc136964248 h 22 HYPERLINK l _Toc136964249 結(jié)束語(yǔ) PAGEREF _Toc136964249 h 24 HYPERLINK l _Toc136964250 致謝詞 PAGEREF _Toc136964250 h 25 HYPERLINK l _Toc136964251 參考文獻(xiàn) PAGEREF _Toc136964251 h 26 HYPERLINK l _Toc136964252 附錄 PAGEREF _Toc136964252 h 27 = 3 *

17、ROMAN III第1章 緒論1.1模式識(shí)別中的一些根本概念模式識(shí)別Pattern Recognition就是機(jī)器識(shí)別、計(jì)算機(jī)識(shí)別或機(jī)器自動(dòng)識(shí)別,目的在于讓機(jī)器自動(dòng)識(shí)別事物。如本文所研究的手寫漢字識(shí)別就是將手寫的漢字分到具體的漢字類別中。模式識(shí)別研究的內(nèi)容是利用計(jì)算機(jī)對(duì)客觀物體進(jìn)行分類,在錯(cuò)誤概率最小的條件下,使識(shí)別的結(jié)果盡量與客觀物體相符合。模式識(shí)別中的一個(gè)根本概念是相似度similarity,這和的其它一些學(xué)科方法都不相關(guān)。一般認(rèn)為兩個(gè)對(duì)象相似是因?yàn)樗麄兙哂邢嗨频奶卣?,相似度?jīng)常被描述成更加抽象的概念,它并不是在幾個(gè)對(duì)象之間衡量,而是在一個(gè)對(duì)象和一個(gè)目標(biāo)概念concept之間進(jìn)行衡量。讓機(jī)

18、器區(qū)分事物的最根本的方法是計(jì)算待識(shí)別事物與標(biāo)準(zhǔn)模板之間的相似度。在模式識(shí)別學(xué)科中,就“模式與“模式類而言,“模式類是一類事物的代表,而“模式那么是某一事物的具體表達(dá)。例如每一個(gè)漢字及標(biāo)準(zhǔn)符號(hào)是模式類,而用戶任意手寫的漢字那么是“模式,識(shí)別系統(tǒng)要識(shí)別的就是這樣一個(gè)個(gè)“模式。1.2模式的描述方法在模式識(shí)別技術(shù)中,被觀測(cè)的每個(gè)對(duì)象稱為樣品,例如本文中的每個(gè)手寫漢字可以作為一個(gè)樣品,共寫了10個(gè)漢字,所以就有10個(gè)樣品X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,一共有10個(gè)不同的類別。對(duì)于一個(gè)樣品來(lái)說(shuō),必須確定一些與識(shí)別有關(guān)的因素作為研究的根據(jù),每一個(gè)因素稱為一個(gè)特征。模式就是樣品所

19、具有的特征描述。模式的特征集由處于同一個(gè)特征空間的特征向量表示,特征向量的每個(gè)元素稱為特征,該向量也因此稱為特征向量。一般用小寫字母x, y, z來(lái)表示特征。如果一個(gè)樣品X有n 個(gè)特征,那么可把X看成一個(gè)n維列向量,該向量稱為特征向量X,記作:X=T 1.1抽取圖像特征的目的是為了進(jìn)行分類,識(shí)別圖像。也就是把圖像變成n維空間的一個(gè)向量,實(shí)際上就是看成n維空間中的一個(gè)點(diǎn),這樣有利于從幾何上考慮問(wèn)題,計(jì)算上比擬方便。 如果一個(gè)對(duì)象的特征觀察值為x1,x2,,xn,它可構(gòu)成一個(gè)n維的特征向量值X,即X=x1,x2,,xnT,式中x1,x2,,xn為特征向量X的各個(gè)分量。在模式識(shí)別的過(guò)程中,要對(duì)許多具

20、體對(duì)象進(jìn)行測(cè)量,以獲得許多觀測(cè)值,其中有均值、方差、協(xié)方差與協(xié)方差矩陣。1.均值 N 個(gè)樣品的均值可表示為: 1.2 其中是第i 個(gè)特征的平均值, 1.32.方差 方差用來(lái)描述一批數(shù)的分散程度,第i 個(gè)特征的N個(gè)數(shù)的方差公式是: 1.4 3.協(xié)方差與協(xié)方差矩陣:在N個(gè)樣品中,第i個(gè)特征和第j個(gè)特征之間的協(xié)方差定義為: 1.5對(duì)于同一批樣品來(lái)說(shuō),很明顯有: 如果一批樣品有n個(gè)特征x1,x2,,xn。求出沒(méi)兩個(gè)特征的協(xié)方差,總共得到n2個(gè)值,將這n2個(gè)值排列成以下的n維方陣,稱為協(xié)方差矩陣: ,協(xié)方差矩陣是對(duì)稱矩陣,而且主對(duì)角線元素sij就是特征xi的方差si2,i=1,2,3,n。1.3模式識(shí)別

21、學(xué)科介紹及現(xiàn)狀分類識(shí)別是人類最重要的根本活動(dòng)之一,在人類的日常生活、社會(huì)活動(dòng)、科研生產(chǎn)以及學(xué)習(xí)、工作中無(wú)時(shí)無(wú)處不在進(jìn)行著分類識(shí)別。模式識(shí)別是研究分類識(shí)別理論和方法的科學(xué),是一門綜合性、交叉性學(xué)科。在理論上它涉及代數(shù)學(xué)、矩陣論、概率論、圖論、模糊數(shù)學(xué)、最優(yōu)化理論等等眾多學(xué)科的知識(shí),在應(yīng)用上又與其他許多領(lǐng)域的工程技術(shù)密切相關(guān),其內(nèi)涵可以概括為信息處理、分析與決策,它既是人工智能研究領(lǐng)域的重要分支,又是實(shí)現(xiàn)機(jī)器智能必不可少的技術(shù)手段。該學(xué)科的理論任務(wù)是運(yùn)用一切相關(guān)科技研發(fā)分類識(shí)別的理論和方法,而其應(yīng)用目標(biāo)是創(chuàng)造能進(jìn)行分類識(shí)別決策的智能機(jī)器系統(tǒng)以代替人類的分類識(shí)別工作。文字識(shí)別始于20世紀(jì)50年代初期

22、的歐美。最早從事漢字識(shí)別研究的是美國(guó)IBM公司的R. Casey和G. Nagys。手寫體漢字識(shí)別的研究最早始于70年代中期的日本,我國(guó)那么在80年代初期開(kāi)始進(jìn)行手寫體漢字識(shí)別的研究。目前進(jìn)行手寫體漢字識(shí)別研究的國(guó)家和地區(qū)主要集中在中國(guó)、日本、中國(guó)臺(tái)灣、美國(guó)和加拿大。我國(guó)手寫體漢字識(shí)別研究一直處于平穩(wěn)上升階段,并逐步向?qū)嵱没繕?biāo)邁進(jìn),印刷體漢字識(shí)別系統(tǒng)、聯(lián)機(jī)手寫體漢字識(shí)別已經(jīng)走出實(shí)驗(yàn)室。目前國(guó)內(nèi)手寫體漢字識(shí)別主要是進(jìn)行識(shí)別方法的研究,而且把研究重點(diǎn)集中在方法實(shí)驗(yàn)和軟件研制上,而幾乎沒(méi)有硬件專用設(shè)備的研制。1.4論文的主要研究工作 本論文主要介紹了模式識(shí)別的一些根本知識(shí)和開(kāi)展概況,然后介紹了模式

23、識(shí)別系統(tǒng)的組成結(jié)構(gòu)和實(shí)際中圖形的文件格式,詳細(xì)介紹了BMP格式的結(jié)構(gòu)和在VC+環(huán)境中CDib類和GetFeature類的實(shí)現(xiàn)方法,然后討論了模板匹配分類器的設(shè)計(jì)原理,最后本文表達(dá)了利用最小距離算法識(shí)別漢字的開(kāi)發(fā)過(guò)程。第2章 模式識(shí)別系統(tǒng)及位圖根底2.1模式識(shí)別系統(tǒng)結(jié)構(gòu)一個(gè)典型的模式識(shí)別系統(tǒng)如圖2-1所示,由數(shù)據(jù)獲取、預(yù)處理、特征提取、分類決策及分類器設(shè)計(jì)五局部組成,一般分為上下兩局部。上半局部完成未知類別模式的分類;下半局部屬于設(shè)計(jì)分類器的訓(xùn)練過(guò)程,利用樣品進(jìn)行訓(xùn)練,確定分類器的具體參數(shù),完成分類器的設(shè)計(jì)。而分類決策在識(shí)別過(guò)程中起作用,對(duì)待識(shí)別的樣品進(jìn)行分類決策。未知類別模式的分類獲取數(shù)據(jù)預(yù)處

24、理特征提取分類決策分類結(jié)果訓(xùn)練樣本輸入預(yù)處理特征選擇確定判別函數(shù)改良判別函數(shù)誤差檢驗(yàn)分類器設(shè)計(jì) 圖2-1 模式識(shí)別系統(tǒng)結(jié)構(gòu)模式識(shí)別組成單元功能介紹如下。1.數(shù)據(jù)獲取。用計(jì)算機(jī)可以運(yùn)算的符號(hào)來(lái)表示所研究的對(duì)象,一般 獲取的數(shù)據(jù)類型有以下幾種。二維圖像:文字、指紋、臉譜照片等。一維波形:腦電圖、心電圖、季節(jié)震動(dòng)波形等。物理參量和邏輯值:體溫、化驗(yàn)數(shù)據(jù)、參量正確與否的描述。2.預(yù)處理。對(duì)輸入測(cè)量?jī)x器或其他因素所造成的退化現(xiàn)象進(jìn)行復(fù)原、去噪聲、提取有用信息。3.特征提取。對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類本質(zhì)的特征。將維數(shù)較高的測(cè)量空間轉(zhuǎn)變?yōu)榫S數(shù)較低的特征空間。4.分類決策。在特征空間中用模式識(shí)別方

25、法把被識(shí)別的對(duì)象歸為某一類。5.分類器設(shè)計(jì)。根本做法是收集樣品訓(xùn)練集,在此根底上確定判別函數(shù),改良判別函數(shù)和誤差檢驗(yàn)。2.2圖像識(shí)別圖像識(shí)別簡(jiǎn)介模式識(shí)別是人工智能領(lǐng)域的根底,它利用計(jì)算機(jī)和光學(xué)系統(tǒng)來(lái)識(shí)別計(jì)算機(jī)看到的圖像信息,模擬人的視覺(jué);用計(jì)算機(jī)和聲音傳感器來(lái)識(shí)別計(jì)算機(jī)接收到的聲波信息,模擬人的聽(tīng)覺(jué);用計(jì)算機(jī)通過(guò)壓力、溫度、氣體、液體等傳感器來(lái)識(shí)別計(jì)算機(jī)獲得的各種特征信息,模擬人的觸覺(jué)和嗅覺(jué)等功能。在視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)的識(shí)別中,基于視覺(jué)圖象識(shí)別具有特別重大的意義。從信息論的角度來(lái)看,“圖像所包含的信息量最大,內(nèi)容極為廣泛。圖像識(shí)別目的在于用計(jì)算機(jī)自動(dòng)處理某些信息系統(tǒng),以代替人去完成圖像分類及辨識(shí)

26、的任務(wù)。對(duì)圖像識(shí)別來(lái)說(shuō),系統(tǒng)針對(duì)某一物體除掉它與其他物體的相同的內(nèi)容,考慮對(duì)它進(jìn)行分類這一共性來(lái)研究的,針對(duì)這一共性,以統(tǒng)一的觀點(diǎn)把同一共性歸為一類,另一種共性歸為另一類。圖像識(shí)別過(guò)程圖像識(shí)別過(guò)程分為四步:1.圖像預(yù)處理為了研究圖像內(nèi)容的識(shí)別,首先要對(duì)獲得的圖像信息進(jìn)行預(yù)處理,濾去干擾、噪聲,當(dāng)信息微弱無(wú)法辨識(shí)時(shí),還須對(duì)圖像進(jìn)行增強(qiáng)處理,幾何調(diào)整,顏色校正等,以便人、機(jī)分析。2.圖像分割為了從圖像中找到需要識(shí)別的物體,還要對(duì)圖像進(jìn)行分割,也就是定位和別離出不同的待識(shí)別的物體。這一過(guò)程輸入是一幅圖象,輸出是像元圖像。3.圖像特征抽取在需要識(shí)別的物體被分割出來(lái)的根底上,提取需要的特征,并對(duì)某些參數(shù)

27、進(jìn)行計(jì)算、測(cè)量,根據(jù)測(cè)量結(jié)果進(jìn)行分類。這一過(guò)程輸入是龐大的信息圖像,輸出那么是少量的特征信息,而且這些特征信息僅僅代表物體,無(wú)法復(fù)原回原物體。4.圖像分類根據(jù)提取的特征值,利用模式識(shí)別的方法進(jìn)行分類,確定類別名稱,以便對(duì)圖像的重要信息得到一種理解和解釋。這一過(guò)程輸入的是特征信息,輸出是類別名稱。圖像識(shí)別過(guò)程如圖2-2所示。圖像輸入圖像預(yù)處理圖像分割圖像特征抽取圖像分類圖像處理圖像識(shí)別像元圖像圖2-2圖像識(shí)別的主要步驟2.3位圖根底知識(shí)圖像文件格式介紹要利用計(jì)算機(jī)對(duì)數(shù)字化圖像進(jìn)行處理,首先要對(duì)圖像的文件格式要有清楚的認(rèn)識(shí),自然界的圖像以模擬信號(hào)的形式存在,在用計(jì)算機(jī)進(jìn)行處理以前,首先要數(shù)字化,比

28、方攝像頭CCD攝取的信號(hào)在送往計(jì)算機(jī)處理前,一般情況下要經(jīng)過(guò)模數(shù)轉(zhuǎn)換,這個(gè)任務(wù)常常由圖像采集卡完成,它的輸出一般為裸圖的形式;如果用戶想要生成目標(biāo)圖像文件,必須根據(jù)文件的格式做相應(yīng)的處理。隨著科技的開(kāi)展,我們可以利用數(shù)碼像機(jī)、數(shù)碼攝像機(jī)作為圖像處理系統(tǒng)的輸入設(shè)備來(lái)為后續(xù)的圖像處理提供信息源。無(wú)論是什么設(shè)備,它總是提供按一定的圖像文件格式來(lái)提供信息,比擬常用的有BMP 格式、JPEG格式、GIF格式等等。除了最簡(jiǎn)單的圖像外,所有的圖像都有顏色,按顏色的不同可以將圖像分為以下幾種:1.單色圖像單色圖像是帶有顏色的圖像中比擬簡(jiǎn)單的格式,它一般由黑色區(qū)域和白色區(qū)域組成,可以用一個(gè)比特表示一個(gè)像素,1表

29、示黑色,0表示白色,當(dāng)然也可以倒過(guò)來(lái)表示,這種圖像稱之為二值圖像。2.灰度圖像灰度圖像的存儲(chǔ)文件帶有圖像顏色表,此顏色表共有256項(xiàng),圖像顏色表中每一表項(xiàng)由紅、綠、藍(lán)顏色分量組成,并且紅、綠、藍(lán)顏色分量值都相等。我們也可以用8個(gè)比特一個(gè)字節(jié)表示一個(gè)像素,相當(dāng)于把黑和白等分為256個(gè)級(jí)別,0表示為黑,255表示為白,該字節(jié)的數(shù)值表示相應(yīng)像素值的灰度值或亮度值,數(shù)值越接近0,對(duì)應(yīng)像素點(diǎn)越黑,相反,那么對(duì)應(yīng)像素點(diǎn)越白。3.彩色圖像這種圖像要復(fù)雜一些,表示圖像時(shí),常用的圖像彩色模式有RGB模式、CMYK模式和HIS模式,一般情況下我們只使用RGB模式,R 對(duì)應(yīng)紅色,G對(duì)應(yīng)綠色,B對(duì)應(yīng)藍(lán)色,它們統(tǒng)稱為三

30、基色,這三中色彩的不同搭配,就可以搭配成各種現(xiàn)實(shí)中的色彩,此時(shí)彩色圖像的每一個(gè)像素都需要3個(gè)樣本組成的一組數(shù)據(jù)表示,其中每個(gè)樣本用于表示該像素的一個(gè)根本顏色。下面簡(jiǎn)要介紹一下幾種常用的圖像文件格式。1.JPEG格式 JPEG也是常見(jiàn)的一種圖像格式,它由聯(lián)合照片專家組Joint Photographic Experts Group開(kāi)發(fā)并以命名為ISO 10918-1,JPEG僅僅是一種俗稱而已。JPEG文件的擴(kuò)展名為.jpg或.jpeg,其壓縮技術(shù)十分先進(jìn),它用有損壓縮方式去除冗余的圖像和彩色數(shù)據(jù),獲取得極高的壓縮率的同時(shí)能展現(xiàn)十分豐富生動(dòng)的圖像,換句話說(shuō),就是可以用最少的磁盤空間得到較好的圖像

31、質(zhì)量。同時(shí)JPEG還是一種很靈活的格式,具有調(diào)節(jié)圖像質(zhì)量的功能,允許你用不同的壓縮比例對(duì)這種文件壓縮,比方我們最高可以把1.37MB的BMP位圖文件壓縮至20.3KB。當(dāng)然我們完全可以在圖像質(zhì)量和文件尺寸之間找到平衡點(diǎn)。由于JPEG優(yōu)異的品質(zhì)和杰出的表現(xiàn),它的應(yīng)用也非常廣泛,特別是在網(wǎng)絡(luò)和光盤讀物上,肯定都能找到它的影子。目前各類瀏覽器均支持JPEG這種圖像格式,因?yàn)镴PEG格式的文件尺寸較小,下載速度快,使得Web頁(yè)有可能以較短的下載時(shí)間提供大量美觀的圖像,JPEG同時(shí)也就順理成章地成為網(wǎng)絡(luò)上最受歡送的圖像格式。 2、SWF格式 利用Flash我們可以制作出一種后綴名為SWFShockwav

32、e Format的動(dòng)畫,這種格式的動(dòng)畫圖像能夠用比擬小的體積來(lái)表現(xiàn)豐富的多媒體形式。在圖像的傳輸方面,不必等到文件全部下載才能觀看,而是可以邊下載邊看,因此特別適合網(wǎng)絡(luò)傳輸,特別是在傳輸速率不佳的情況下,也能取得較好的效果。事實(shí)也證明了這一點(diǎn),SWF如今已被大量應(yīng)用于WEB網(wǎng)頁(yè)進(jìn)行多媒體演示與交互性設(shè)計(jì)。此外,SWF動(dòng)畫是其于矢量技術(shù)制作的,因此不管將畫面放大多少倍,畫面不會(huì)因此而有任何損害。綜上,SWF格式作品以其高清晰度的畫質(zhì)和小巧的體積,受到了越來(lái)越多網(wǎng)頁(yè)設(shè)計(jì)者的青睞,也越來(lái)越成為網(wǎng)頁(yè)動(dòng)畫和網(wǎng)頁(yè)圖片設(shè)計(jì)制作的主流,目前已成為網(wǎng)上動(dòng)畫的事實(shí)標(biāo)準(zhǔn)。3、BMP格式BMP是英文Bitmap位圖的

33、簡(jiǎn)寫,它是Windows操作系統(tǒng)中的標(biāo)準(zhǔn)圖像文件格式,能夠被多種Windows應(yīng)用程序所支持。隨著Windows操作系統(tǒng)的流行與豐富的Windows應(yīng)用程序的開(kāi)發(fā),BMP位圖格式理所當(dāng)然地被廣泛應(yīng)用。這種格式的特點(diǎn)是包含的圖像信息較豐富,幾乎不進(jìn)行壓縮,但由此導(dǎo)致了它與生俱生來(lái)的缺點(diǎn)-占用磁盤空間過(guò)大。在本文中主要用到的就是這種文件格式,下面對(duì)它做詳細(xì)介紹。 BMP文件結(jié)構(gòu) 1、 BMP文件組成 BMP文件由文件頭、位圖信息頭、顏色信息和圖形數(shù)據(jù)四局部組成。文件頭主要包含文件的大小、文件類型、圖像數(shù)據(jù)偏離文件頭的長(zhǎng)度等信息;位圖信息頭包含圖像的尺寸信息、圖像用幾個(gè)比特?cái)?shù)值來(lái)表示一個(gè)像素、圖像是

34、否壓縮、圖像所用的顏色數(shù)等信息。顏色信息包含圖像所用到的顏色表,顯示圖像時(shí)需用到這個(gè)顏色表來(lái)生成調(diào)色板,但如果圖像為真彩色,既圖像的每個(gè)像素用24個(gè)比特來(lái)表示,文件中就沒(méi)有這一塊信息,也就不需要操作調(diào)色板。文件中的數(shù)據(jù)塊表示圖像的相應(yīng)的像素值,需要注意的是:圖像的像素值在文件中的存放順序?yàn)閺淖蟮接遥瑥南碌缴?,也就是說(shuō),在BMP文件中首先存放的是圖像的最后一行像素,最后才存儲(chǔ)圖像的第一行像素,但對(duì)與同一行的像素,那么是按照先左邊后右邊的的順序存儲(chǔ)的;另外一個(gè)需要關(guān)注的細(xì)節(jié)是:文件存儲(chǔ)圖像的每一行像素值時(shí),如果存儲(chǔ)該行像素值所占的字節(jié)數(shù)為4的倍數(shù),那么正常存儲(chǔ),否那么,需要在后端補(bǔ)0,湊足4的倍數(shù)

35、。 2、 BMP文件頭 BMP文件頭數(shù)據(jù)結(jié)構(gòu)含有BMP文件的類型、文件大小和位圖起始位置等信息。其結(jié)構(gòu)定義如下: typedef struct tagBITMAPFILEHEADER WORD bfType; / 位圖文件的類型,必須為BM DWORD bfSize; / 位圖文件的大小,以字節(jié)為單位 WORD bfReserved1; / 位圖文件保存字,必須為0 WORD bfReserved2; / 位圖文件保存字,必須為0 DWORD bfOffBits; / 位圖數(shù)據(jù)的起始位置,以相對(duì)于位圖文件頭的偏移量 /表示,以字節(jié)為單位 BITMAPFILEHEADER;該結(jié)構(gòu)占據(jù)14個(gè)字節(jié)。

36、 3、位圖信息頭 BMP位圖信息頭數(shù)據(jù)用于說(shuō)明位圖的尺寸等信息。其結(jié)構(gòu)如下: typedef struct tagBITMAPINFOHEADER DWORD biSize; / 本結(jié)構(gòu)所占用字節(jié)數(shù) LONG biWidth; / 位圖的寬度,以像素為單位 LONG biHeight; / 位圖的高度,以像素為單位 WORD biPlanes; / 目標(biāo)設(shè)備的平面數(shù)不清,必須為1 WORD biBitCount / 每個(gè)像素所需的位數(shù),必須是1(雙色), 4(16色),/8(256色)或24(真彩色)之一DWORD biCompression; / 位圖壓縮類型,必須是 0(不壓縮),1(BI

37、_RLE8 /壓縮類型)或2(BI_RLE4壓縮類型)之一 DWORD biSizeImage; / 位圖的大小,以字節(jié)為單位 LONG biXPelsPerMeter; / 位圖水平分辨率,每米像素?cái)?shù) LONG biYPelsPerMeter; / 位圖垂直分辨率,每米像素?cái)?shù) DWORD biClrUsed;/ 位圖實(shí)際使用的顏色表中的顏色數(shù) DWORD biClrImportant;/ 位圖顯示過(guò)程中重要的顏色數(shù) BITMAPINFOHEADER;該結(jié)構(gòu)占據(jù)40個(gè)字節(jié)。4、 顏色表 顏色表用于說(shuō)明位圖中的顏色,它有假設(shè)干個(gè)表項(xiàng),每一個(gè)表項(xiàng)是一個(gè)RGBQUAD類型的結(jié)構(gòu),定義一種顏色。RGB

38、QUAD結(jié)構(gòu)的定義如下: typedef struct tagRGBQUAD BYTErgbBlue;/ 藍(lán)色的亮度(值范圍為0-255) BYTErgbGreen; / 綠色的亮度(值范圍為0-255) BYTErgbRed; / 紅色的亮度(值范圍為0-255) BYTErgbReserved;/ 保存,必須為0 RGBQUAD; 顏色表中RGBQUAD結(jié)構(gòu)數(shù)據(jù)的個(gè)數(shù)由BITMAPINFOHEADER 中的biBitCount項(xiàng)來(lái)確定,當(dāng)biBitCount=1,4,8時(shí),分別有2,16,256個(gè)顏色表項(xiàng),當(dāng)biBitCount=24時(shí),圖像為真彩色,圖像中每個(gè)像素的顏色用三個(gè)字節(jié)表示,分

39、別對(duì)應(yīng)R、G、B值,圖像文件沒(méi)有顏色表項(xiàng)。位圖信息頭和顏色表組成位圖信息,BITMAPINFO結(jié)構(gòu)定義如下: typedef struct tagBITMAPINFO BITMAPINFOHEADER bmiHeader; / 位圖信息頭 RGBQUAD bmiColors1; / 顏色表 BITMAPINFO; RGBQUAD數(shù)據(jù)結(jié)構(gòu)中,增加了一個(gè)保存字段rgbReserved,它不代表任何顏色,必須取確定值0,同時(shí), RGBQUAD結(jié)構(gòu)中定義的顏色值中,紅色、綠色和藍(lán)色的排列順序與一般真彩色圖像文件的顏色數(shù)據(jù)排列順序恰好相反,即:假設(shè)某個(gè)位圖中的一個(gè)像素點(diǎn)的顏色的描述為00,00,ff,0

40、0,那么表示該點(diǎn)為紅色,而不是藍(lán)色。5、 位圖數(shù)據(jù) 位圖數(shù)據(jù)記錄了位圖的每一個(gè)像素值或該對(duì)應(yīng)像素的顏色表的索引值,圖像記錄順序在掃描行內(nèi)是從左到右,掃描行之間是從下到上。這種格式我們又稱為Bottom_Up位圖,當(dāng)然與之相對(duì)的還有Up_Down形式的位圖,它的記錄順序是從上到下的,對(duì)于這種形式的位圖,也不存在壓縮形式。位圖的一個(gè)像素值所占的字節(jié)數(shù):當(dāng)biBitCount=1時(shí),8個(gè)像素占1個(gè)字節(jié);當(dāng)biBitCount=4時(shí),2個(gè)像素占1個(gè)字節(jié);當(dāng) biBitCount=8時(shí),1個(gè)像素占1個(gè)字節(jié);當(dāng)biBitCount=24時(shí),1個(gè)像素占3個(gè)字節(jié),此時(shí)圖像為真彩色圖像。當(dāng)圖像不是為真彩色時(shí),圖

41、像文件中包含顏色表,位圖的數(shù)據(jù)表示對(duì)應(yīng)像素點(diǎn)在顏色表中相應(yīng)的索引值,當(dāng)為真彩色時(shí),每一個(gè)像素用三個(gè)字節(jié)表示圖像相應(yīng)像素點(diǎn)彩色值,每個(gè)字節(jié)分別對(duì)應(yīng)R、G、B分量的值,這時(shí)候圖像文件中沒(méi)有顏色表。 CDib類的建立1、CDib類的功能 CDib類的根本操作功能包括以下內(nèi)容: = 1 * GB3 8位位圖文件的讀、寫操作。 = 2 * GB3 提供位圖寬度、高度、顏色數(shù)目等位圖相關(guān)信息。 = 3 * GB3 提供有關(guān)位圖占據(jù)內(nèi)存空間的信息,包括圖像數(shù)據(jù)區(qū)首地址、顏色表首地址、位圖信息結(jié)構(gòu)首地址等信息。2、CDib類的定義 本論文所研究的手寫漢字識(shí)別系統(tǒng),都以CDib類作為基類,由CDib類派生出有用

42、的子類。在MFC中已有一個(gè)支持設(shè)備有關(guān)位圖DDB操作的CBitmap類,由于我們用到的CDib是設(shè)備無(wú)關(guān)位圖DIB,所以不能直接從CBitmap類派生出。DIB主要是一種“外部位圖,它主要以文件形式進(jìn)行存儲(chǔ)和交換,所以CDib類應(yīng)該能很好的處理文件操作。MFC中的CObject類是MFC中其他大多數(shù)類的根類和基類,他不但提供許多有用的特征,還包括對(duì)文件串行化的支持,運(yùn)行時(shí)的類信息和對(duì)象診斷的輸出等;另外,CObject類具有最低限度的成員函數(shù)和數(shù)據(jù),從CObject類派生類所花的代價(jià)是最低的。因此,我們選用CObject類作為CDib類的父類。它的定義如下:class CDib : publi

43、c CObjectpublic: RGBQUAD* m_pRGB; BYTE* m_pData; UINT m_numberOfColors;BOOL m_valid; BITMAPFILEHEADER bitmapFileHeader;BITMAPINFOHEADER* m_pBitmapInfoHeader; BITMAPINFO* m_pBitmapInfo; BYTE* pDib;DWORD size;public: CDib();CDib();char m_fileName256; char* GetFileName();BOOL IsValid(); DWORD GetSize()

44、;UINT GetWidth();UINT GetHeight(); UINT GetNumberOfColors(); RGBQUAD* GetRGB(); BYTE* GetData(); BITMAPINFO* GetInfo();WORD PaletteSize(LPBYTE lpDIB);WORD DIBNumColors(LPBYTE lpDIB); void SaveFile(const CString filename);public: void LoadFile(const char* dibFileName);void SetHeight(UINT height);void

45、 SetWidth(UINT width); 第3章 分類器設(shè)計(jì)3.1 特征空間優(yōu)化設(shè)計(jì)問(wèn)題確定適宜的特征空間是設(shè)計(jì)模式識(shí)別系統(tǒng)一個(gè)十分重要,甚至最為關(guān)鍵的問(wèn)題。如果所選用的特征空間能使同類物體分布具有緊致性,不同類別物體彼此分開(kāi),即各類樣品能分布在該特征空間中彼此分割開(kāi)的區(qū)域內(nèi),這就為分類器設(shè)計(jì)提供良好的根底。反之,如果不同類別的樣品在該特征空間中混雜在一起,再好的設(shè)計(jì)方法也無(wú)法提高分類器的準(zhǔn)確性。特征空間的設(shè)計(jì)往往是一個(gè)逐步優(yōu)化的過(guò)程,設(shè)計(jì)的初期階段,選擇的特征空間維數(shù)較高,需要對(duì)它進(jìn)行改造,改造的目的在于提高某方面的性能,因此又稱為特征的優(yōu)化問(wèn)題。一般說(shuō)要對(duì)初始的特征空間進(jìn)行優(yōu)化就是為了

46、降維,即將初始的高維特征向量改成一個(gè)維數(shù)較低的空間。優(yōu)化后的特征空間應(yīng)該更有利于后續(xù)的分類計(jì)算。對(duì)特征空間進(jìn)行優(yōu)化有兩種根本方法,一是特征選擇,另一種是特征的優(yōu)化組合。1、特征選擇在模式識(shí)別中特征提取是首先要解決的問(wèn)題。為了對(duì)樣品進(jìn)行準(zhǔn)確的識(shí)別,需要進(jìn)行特征選擇或特征壓縮。特征選擇指對(duì)原始數(shù)據(jù)進(jìn)行抽取,抽取那些對(duì)區(qū)別不同類別最為重要的特征,而舍去那些對(duì)分類并無(wú)多大奉獻(xiàn)的特征,能得到反映分類本質(zhì)的特征。如果區(qū)別不同類別的特征都能從輸入數(shù)據(jù)中找到,這時(shí)自動(dòng)模式識(shí)別問(wèn)題就簡(jiǎn)化為匹配和查表,模式識(shí)別就不困難了。2、特征提取假設(shè)已有D維特征向量空間,Y=y1,y2,yD,特征的組合優(yōu)化問(wèn)題涉及特征選擇和

47、特征提取兩局部。特征選擇是指從原有的D維特征空間中刪去一些特征描述量,從而得到精簡(jiǎn)后的特征空間。在這個(gè)特征空間中,樣品由d維空間的特征向量描述:X=x1,x2,xd, dD。由于X只是Y的一個(gè)子集,因此每個(gè)分量xi必然能在原特征集中找到其對(duì)應(yīng)的描述量xi=yj。特征提取那么是找到一個(gè)映射關(guān)系: A:Y X 3.1使新樣品特征描述維數(shù)比原維數(shù)低。其中每個(gè)分量xi是原特征向量各分量的函數(shù),即 xi=xiy1,y2,yD 3.2因此這兩種降維的根本方法是不同的。在實(shí)際應(yīng)用中可將兩者結(jié)合起來(lái)使用,比方先進(jìn)行特征選擇,即從原有的D維特征空間,刪去一些特征描述量,從而得到精簡(jiǎn)后的特征空間,然后再進(jìn)一步特征

48、提取,或反過(guò)來(lái)。總之,特征選擇與特征提取的任務(wù)是求出一組對(duì)分類最有效的特征,有效是在特征維數(shù)減少到同等水平時(shí),其分類性能最正確。3.2分類器設(shè)計(jì)準(zhǔn)那么模式識(shí)別分類問(wèn)題是指根據(jù)待識(shí)別對(duì)象所呈現(xiàn)的觀察值,將其分到某個(gè)類別中去。具體步驟如下:第一步:建立特征空間中的訓(xùn)練集,訓(xùn)練集里每個(gè)點(diǎn)所屬類別。第二步:從這些條件出發(fā),尋求某種判別函數(shù)或判別準(zhǔn)那么,設(shè)計(jì)判決函數(shù)模型。第三步:根據(jù)訓(xùn)練集中的樣品確定模型中的參數(shù)。第四步:將這一模型用于判決,利用判決函數(shù)或判別準(zhǔn)那么去判別每個(gè)未知類別的點(diǎn)應(yīng)該屬于哪一類。模式識(shí)別的根本框架制定準(zhǔn)那么函數(shù),實(shí)現(xiàn)準(zhǔn)那么函數(shù)極值化。常用的準(zhǔn)那么有以下幾種。1、最小錯(cuò)分率準(zhǔn)那么完

49、全以減少分類錯(cuò)誤為原那么,這是一個(gè)通用原那么,它使錯(cuò)分類的樣品數(shù)量最小。2、最小風(fēng)險(xiǎn)準(zhǔn)那么當(dāng)接觸到實(shí)際問(wèn)題時(shí),可以發(fā)現(xiàn)使錯(cuò)誤率最小不一定是一個(gè)普遍適用的最正確選擇。有的分類系統(tǒng)對(duì)錯(cuò)誤率大小并不看重,而是要考慮錯(cuò)分類的不同后果,為使總的損失最小,有時(shí)寧肯將錯(cuò)分率加大。因此引入風(fēng)險(xiǎn)、損失這些概念,以便在決策時(shí)兼顧不同后果的影響。在實(shí)際中計(jì)算損失與風(fēng)險(xiǎn)是復(fù)雜的,在使用數(shù)學(xué)公式計(jì)算時(shí),往往用賦予不同權(quán)值來(lái)表示。在做出決策時(shí),要考慮所承當(dāng)?shù)娘L(fēng)險(xiǎn)?;谧钚★L(fēng)險(xiǎn)的貝葉斯決策規(guī)那么是為了表達(dá)這一點(diǎn)而產(chǎn)生的。3、近鄰準(zhǔn)那么近鄰準(zhǔn)那么是分段線形判別函數(shù)的一種典型方法。這種方法主要依據(jù)同類物體在特征空間具有聚類特性

50、的原理。同類物體由于其性質(zhì)相近,它們?cè)谔卣骺臻g中應(yīng)具有聚類的現(xiàn)象,因此可以利用這種性質(zhì)產(chǎn)生分類決策的規(guī)那么。例如有兩類樣品,可以求出某一類的平均值,對(duì)于任何一個(gè)未知樣品,先求出它到各個(gè)類的平均值距離,判斷距離哪個(gè)類近就屬于哪個(gè)類。4、Fisher準(zhǔn)那么根據(jù)兩類樣品一般類內(nèi)密集,類間別離的特點(diǎn),尋找線性分類器最正確的法線向量,使兩類樣品在該方向上的投影滿足類內(nèi)盡可能密集,類間盡可能分開(kāi)。相反如果把它們投影到任意一根直線上,有可能不同類別的樣品就混在一起了,無(wú)法區(qū)分。如果把投影直線旋轉(zhuǎn)一定的角度,就有可能找到一個(gè)方向,樣品投影到這個(gè)方向直線上,各類樣品就能很好的分開(kāi)。如何找到一個(gè)最好方向及如何實(shí)現(xiàn)

51、向最好方向投影的變換,這正是Fisher算法要解決的根本問(wèn)題。5、感知準(zhǔn)那么感知準(zhǔn)那么函數(shù)以使錯(cuò)分類樣品到分界面距離之和最小為原那么。采用錯(cuò)誤提供信息實(shí)現(xiàn)迭代修正的學(xué)習(xí)原理。用錯(cuò)分類提供的信息修正錯(cuò)誤,這種思想對(duì)機(jī)器學(xué)習(xí)的開(kāi)展以及人工神經(jīng)元網(wǎng)絡(luò)的發(fā)生開(kāi)展產(chǎn)生深遠(yuǎn)影響。其優(yōu)點(diǎn)是通過(guò)錯(cuò)分類樣品提供的信息對(duì)分類器函數(shù)進(jìn)行修正,這種準(zhǔn)那么是人工神經(jīng)元網(wǎng)絡(luò)多層感知器的根底。3.3類器設(shè)計(jì)根本方法在d維特征空間已經(jīng)確定的前提下,討論的分類器設(shè)計(jì)問(wèn)題是一個(gè)選擇什么準(zhǔn)那么,使用什么方法,將已確定的d 維特征空間劃分為決策域的問(wèn)題。分類器設(shè)計(jì)有兩種根本方法:模板匹配法和判別函數(shù)法。1、模板匹配法將待分類樣品與標(biāo)

52、準(zhǔn)模板進(jìn)行比擬,看與哪個(gè)模板匹配程度更相似,從而確定待測(cè)試樣品的分類。而近鄰準(zhǔn)那么在原理上屬于模板匹配。它將訓(xùn)練樣品集中的每個(gè)樣品都作為模板,用測(cè)試樣品與每個(gè)模板做比擬,看與哪個(gè)模板最相似即為近鄰,就按最近似的模板的類別作為自己的類別。2、判別函數(shù)法設(shè)計(jì)基于判別函數(shù)法的分類方法有兩種:基于概率統(tǒng)計(jì)的分類法和幾何分類法。 = 1 * GB3 直接使用Bayes決策需要首先得到有關(guān)樣品總體分布的知識(shí),包括各類先驗(yàn)概率Pw1及類條件概率密度函數(shù),計(jì)算出樣品的后驗(yàn)概率Pw1|X,并以此作為產(chǎn)生判別函數(shù)的必要數(shù)據(jù),設(shè)計(jì)出相應(yīng)的判別函數(shù)與決策面。當(dāng)各類樣品近似于正態(tài)分布時(shí),可以算出使錯(cuò)誤率最小或風(fēng)險(xiǎn)最小的

53、分界面及相應(yīng)的分界面方程。因此如果訓(xùn)練樣品處于近似的正態(tài)分布,可以用Bayes決策方法對(duì)分類器進(jìn)行設(shè)計(jì)。 = 2 * GB3 幾何分類法由于一個(gè)模式通過(guò)某種變換映射為一個(gè)特征向量后,該特征向量可以理解為特征空間的一個(gè)點(diǎn),在特征空間中,屬于一個(gè)類的點(diǎn)集,總是在某種程度上與屬于另一個(gè)類的點(diǎn)集相別離,各個(gè)類之間是確定可分的。因此如果能夠找到一個(gè)別離函數(shù)線性或非性形函數(shù),把不同類的點(diǎn)集分開(kāi),那么分類任務(wù)就解決了。幾何分類器不依賴于條件概率密度的知識(shí),可以理解為通過(guò)幾何的方法,把特征空間分解為相應(yīng)與不同類別的子空間。而且呈線形的別離函數(shù),將使計(jì)算簡(jiǎn)化。別離函數(shù)又分為線性判別函數(shù)和非線性判別函數(shù)。3.4

54、判別函數(shù)無(wú)論是設(shè)計(jì)一個(gè)基于概率統(tǒng)計(jì)的分類器,還是設(shè)計(jì)一個(gè)幾何分類器,最終都轉(zhuǎn)化為判別函數(shù)的形式。1、二類情況對(duì)于只有簡(jiǎn)單的兩類情況,判別函數(shù)形式如圖2-1所示,根據(jù)計(jì)算結(jié)果的符號(hào)將X分類。 dX1X2Xn+1W1-1W2決策判別計(jì)算閥值單元圖2-1 兩類分類器形式假定判別函數(shù)dX是X的線性函數(shù),dX=WTX+W0,用矢量X=T來(lái)表示模式,一般的線性判別函數(shù)形式為: 3.3式中W0=稱為權(quán)矢量或參數(shù)矢量。2、多類情況對(duì)于多類別問(wèn)題,假設(shè)有M類模式,它們對(duì)應(yīng)于M類圖像。對(duì)于M個(gè)類別,就要給出M個(gè)判別函數(shù):,各個(gè)判別函數(shù)構(gòu)成分類器,根本形式如圖3-1所示:d1d2dMMAX/MINX1X2Xn最值選

55、擇器決策圖3-2 判別函數(shù)構(gòu)成的多類分類器對(duì)于線性情況,判別函數(shù)形式為 3.4其中,。3.5訓(xùn)練與學(xué)習(xí)所謂模式識(shí)別的學(xué)習(xí)與訓(xùn)練是從訓(xùn)練樣品提供的數(shù)據(jù)中找出某種數(shù)學(xué)式子的最優(yōu)解,這個(gè)最優(yōu)解使分類器得到一組參數(shù),按這組參數(shù)設(shè)計(jì)的分類器使人們?cè)O(shè)計(jì)的某種準(zhǔn)那么到達(dá)極值。確定分類決策的具體數(shù)學(xué)公式是通過(guò)分類器設(shè)計(jì)這個(gè)過(guò)程確定的。這個(gè)過(guò)程稱為訓(xùn)練與學(xué)習(xí)的過(guò)程。訓(xùn)練與學(xué)習(xí)的過(guò)程中的訓(xùn)練集是指一個(gè)的樣品集,在監(jiān)督學(xué)習(xí)方法中用它來(lái)開(kāi)發(fā)模式分類器。在本系統(tǒng)中,自己手寫的50個(gè)漢字字符,從這50個(gè)字符中提取信息組成特征庫(kù),這50個(gè)字符就是訓(xùn)練集。訓(xùn)練與學(xué)習(xí)的過(guò)程中的測(cè)試集就是識(shí)別時(shí)隨機(jī)用手寫的漢字。第4章 模板匹配

56、分類器識(shí)別漢字系統(tǒng)的實(shí)現(xiàn)4.1系統(tǒng)的功能描述 本系統(tǒng)能夠識(shí)別“中、“華、“人、“民、“共、“和、“國(guó)、“萬(wàn)、“歲、“!共10個(gè)字符。 系統(tǒng)的功能有:1.一幅240*240的手寫漢字的輸入和瀏覽。2.手寫漢字的保存和特征提取及特征的保存。3.每個(gè)漢字樣品數(shù)查看,手寫漢字的識(shí)別。4.2模板匹配法的理論根底在圖象識(shí)別技術(shù)中,模板匹配是比擬簡(jiǎn)單的方法。模板匹配就是把未知圖像和一個(gè)標(biāo)準(zhǔn)的圖像比擬,看它們是否相同或相似。下面討論兩類別和多類別的情況。1、兩類別設(shè)有兩個(gè)標(biāo)準(zhǔn)手寫漢字A、B,其特征向量為d維向量:,。任何一個(gè)待識(shí)別的手寫漢字X,它的特征向量為,當(dāng)我們判別X是A還是B時(shí)可以計(jì)算X與A、B之間的距

57、離,X與哪個(gè)樣板距離近,就屬于哪個(gè)類,這就是最小距離算法。任意兩點(diǎn)x,y之間的距離定義為: 4.1假設(shè)d(X,XA)d(X,XB),那么X屬于A類,反之屬于B類。2、多類別設(shè)有M個(gè)類別:,每類有wi個(gè)向量表示,那么有: 4.2對(duì)于任意手寫漢字X, 4.3計(jì)算距離d(Xi,X),假設(shè)存在某一個(gè)i,使 那么X屬于wi類。4.3特征類的設(shè)計(jì)在VC+中,對(duì)圖像進(jìn)行操作,在第二章中,我們介紹了CDib類,它能提供圖像翻開(kāi)、保存等功能,能提供圖像數(shù)據(jù)區(qū)指針、圖像長(zhǎng)度、寬度等信息。為了識(shí)別物體,還需要對(duì)圖像中的進(jìn)行分割,特征提取,提供各種算法。為此,可以從CDib類派生出GetFeature類,它可以找到手

58、寫漢字位置,獲得手寫的特征;將手寫漢字保存到樣品庫(kù)中。在GetFeature類中定義了pattern結(jié)構(gòu)體,保存某個(gè)漢字的所有樣品特征。pattern結(jié)構(gòu)如下:struct pattern/pattern結(jié)構(gòu)體,保存某個(gè)漢字的所有樣品特征int number;/該手寫漢字樣品個(gè)數(shù)double feature20025; ;GetFeature類定義如下:class GetFeature : public CDib public:double pipei(double s1,double s2);int LeastDistance();pattern pattern10;/手寫漢字樣品特征庫(kù)do

59、uble testsample25;/待測(cè)的手寫漢字int width;/手寫漢字的寬int height;/手寫漢字的高int LineBytes;void Save(int cls);/將手寫的漢字保存到cls(09)類別中double Cal(int row, int col);/計(jì)算分割好的55小區(qū)域中,黑像素所占/的比例void SetFeature();/計(jì)算手寫漢字的特征,賦值給testsamplevoid GetPosition();/獲得手寫漢字的位置GetFeature();virtual GetFeature();protected:int bottom;/手寫漢字的底部

60、int top;/手寫漢字的頂部int left;/手寫漢字的左邊int right;/手寫漢字的右邊;函數(shù)的具體實(shí)現(xiàn)見(jiàn)附件。4.4系統(tǒng)的設(shè)計(jì)流程及功能的具體實(shí)現(xiàn)系統(tǒng)設(shè)計(jì)的第一局部為標(biāo)準(zhǔn)樣品輸入、特征提取、樣品庫(kù)建立和保存,這一局部是有監(jiān)督的訓(xùn)練學(xué)習(xí)過(guò)程;第二局部為用戶手寫輸入一個(gè)漢字及識(shí)別功能。設(shè)計(jì)流程如圖4-1設(shè)計(jì)流程圖所示:手寫漢字輸入漢字保存漢字特征提取漢字歸類到樣品庫(kù)手寫漢字輸入待識(shí)別漢字特征提取與樣品庫(kù)匹配識(shí)別結(jié)果輸出第一局部第二局部圖4-1設(shè)計(jì)流程圖具體功能實(shí)現(xiàn)方法如下:1手寫漢字輸入:系統(tǒng)中畫筆的直徑設(shè)置為8個(gè)像素,畫圖的區(qū)域被限制在視圖客戶區(qū)0,0,240,240矩形內(nèi),畫筆

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論