模式識別及其在數(shù)字圖像處理中的應(yīng)用_第1頁
模式識別及其在數(shù)字圖像處理中的應(yīng)用_第2頁
模式識別及其在數(shù)字圖像處理中的應(yīng)用_第3頁
模式識別及其在數(shù)字圖像處理中的應(yīng)用_第4頁
模式識別及其在數(shù)字圖像處理中的應(yīng)用_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

模式識別及其在數(shù)字圖像處理中的應(yīng)用摘要:模式識別是人工智能領(lǐng)域的基礎(chǔ),隨著計算機和人工智能技術(shù)的發(fā)展,模式識別在圖像處理中的應(yīng)用日益廣泛。近年來,模式識別也去的了很多讓人矚目的成就,有很多不可忽視的進展。數(shù)字圖像處理又稱為計算機圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理的過程。圖像是人類獲取和交換信息的主要來源,圖像處理的應(yīng)用領(lǐng)域必然涉及到人類生活和工作的方方面面。隨著人類活動范圍的不斷擴大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴大?;谀J阶R別的圖像處理隨著當(dāng)今計算機和人工智能技術(shù)的發(fā)展,已經(jīng)成為了圖像識別領(lǐng)域的蹤影研究方向。本文首先介紹了圖像模式識別的基本理論和基本方法,然后闡述了模式識別在圖像處理中應(yīng)用理論,最后舉例說明了模式識別在圖像處理中的具體應(yīng)用。關(guān)鍵字:模式識別;人工智能;圖像處理;特征提??;識別方法1模式識別技術(shù)的基本理論1.1模式識別的基本框架模式識別是通過計算機對信息進行處理、判別的一種分類過程,是信號處理與人工智能的一個重要分支。人工智能是專門研究用機器人模仿人的動作、感覺和思維過程與規(guī)律的一門學(xué)科,而模式識別就是通過計算機用數(shù)學(xué)技術(shù)方法來研究模式的自動處理和判讀。我們把環(huán)境與客體統(tǒng)稱為“模式”。隨著計算機技術(shù)和人工智能的發(fā)展,人類有可能研究復(fù)雜的信息處理過程。信息處理過程的一個重要形式是生命體對環(huán)境及客體的識別。對人類來說,特別重要的是對光學(xué)信息(通過視覺器官來獲得)和聲學(xué)信息(通過聽覺器官來獲得)的識別。這是模式識別的兩個重要方面。在圖像處理中,識別場景中的對象或區(qū)域是一個重要課題。圖像模式識別的任務(wù)是從策略對象集的場景中識別對象。每個對象都是一種模式,并且策略值是模式的特征,同特征的相似對象集屬于具體的模式類,測量特征的技術(shù)稱為特征提取。模式識別的基本框架如圖1所示:圖1模式識別的基本框架1.2模式識別的方法1.2.1決策理論法在模式識別中,已經(jīng)使用了一些模式分類技術(shù)。這些技術(shù)中的一些技術(shù)被稱為決策理論技術(shù),在這種技術(shù)中,未知的模式分類是由一些確定的、統(tǒng)計的或者模糊理論的基本原理進行決策。決策理論的模塊圖如圖2所示:圖2決策理論模式分類器模塊圖決策理論模式識別技術(shù)主要分為基于有監(jiān)督學(xué)習(xí)的分類方法和使用無監(jiān)督技術(shù)的分類方法。有監(jiān)督的分類方法又可分為有參數(shù)分類器和非參數(shù)分類器。在有參數(shù)監(jiān)督的分類中,用大量標(biāo)注訓(xùn)練樣本模式集訓(xùn)練分類器,并估計每類模式的統(tǒng)計參數(shù)。其中,最小距離分類器和最大似然分類器是頻繁使用的有監(jiān)督算法。無監(jiān)督分類技術(shù)不考慮參數(shù),常使用一些非參數(shù)的技術(shù),例如K近鄰技術(shù)、Parzen窗技術(shù)等。在無監(jiān)督的情況下,根據(jù)一些相似標(biāo)準(zhǔn)機器分割整個數(shù)據(jù)集,結(jié)構(gòu)產(chǎn)生了聚類集,模式中的每個聚類集都屬于具體類。1.2.2句法方法在句法模式識別中,關(guān)鍵問題是使用屬于不同模式類的樣本集推斷適當(dāng)?shù)奈姆?。文法推斷問題是一個首要問題。這種方法是基于基本假設(shè),每個模式至少存在一個文法描述。每個模式類文法描述的識別和提取形成了設(shè)計綜合模式分類器的核心問題。文法推斷問題包括使用在研究中的樣本模式集獲得文法的算法開發(fā)。因此這可以視為使用有限的并且增長的訓(xùn)練模式集進行學(xué)習(xí)的方法。在文法模式分類中,屬于特殊模式類的字符串可以作為形成屬于語言的句子,這些句子對應(yīng)于模式類。如果每個字符串都屬于該模式類,機器就可以識別這個模式類,對于不在該模式類中的任何字符串,機器決策它是否是語言的成員,要么拒絕,要么永久接受。對于自動機的自動化造句而言,接受字符串屬于特殊模式類,已經(jīng)有了一些成熟的技術(shù)。1.2.3人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)已經(jīng)廣泛使用于圖像分割和對象分類問題。這些網(wǎng)絡(luò)本質(zhì)上是學(xué)習(xí)網(wǎng)絡(luò),用于場景中像素或?qū)ο蟮姆诸?。它們是大量互?lián)的神經(jīng)元集,并行地執(zhí)行學(xué)習(xí)任務(wù)。神經(jīng)元由生物神經(jīng)元建模,因此它們被命名為神經(jīng)網(wǎng)絡(luò)。根據(jù)學(xué)習(xí)過程的類型,這些網(wǎng)絡(luò)可以分為有監(jiān)督或無監(jiān)督網(wǎng)絡(luò)。1.2.4小結(jié)人臉的側(cè)視圖選擇的標(biāo)志點是:鼻子點、頜下點、前額點、鼻梁點、眉間點和嘴角點。將側(cè)面臉的數(shù)字圖像變化為側(cè)面外形輪廓,然后提取標(biāo)志點。側(cè)面面孔圖像是一幅二進制圖像,從每個側(cè)面輪廓獲得的標(biāo)志點提取7個距離測量和一個區(qū)域測量。3.4.2距離和區(qū)域測量計算距離測量的提取標(biāo)志點如圖4所示,正視圖和側(cè)視圖的特征集合形成組合特征向量,這些特征向量陣列表示面部圖片,所以我們希望對于不同的臉部,這些向量陣列是不同的。我們將這些特征陣列存儲在文件中,并且具有主索引號。為了消除尺度作用,將鼻子點和鼻梁點間的距離,側(cè)視圖的距離測量和面積測量值,兩眼間的距離和正面臉的測量值進行歸一化處理。圖4側(cè)面面部點3.5人臉識別從人臉的正視圖和側(cè)視圖提取最佳特征集,并且將這些特征值存儲在獨立的文件中,主要臉數(shù)據(jù)文件中的向量稱為M向量,對于未知的樣本,測試數(shù)據(jù)文件包含15維特征向量。為了減少匹配特征向量值計算的復(fù)雜性,將這些特征向量與它們的主索引一起升序存儲。將測試特征值插到每個特征向量(列)的排序特征列表的適當(dāng)位置。測試樣本模式的兩個最近鄰居在每列中進行識別,并且評估它們的相似性。下面就K-近鄰算法給出人臉識別的步驟:步驟1在每一列,將特征值與它們的主索引一起升序排列。步驟2在每列的適當(dāng)位置插入測試樣本的每個特征向量。步驟3在每列中去掉兩個最近鄰居,并對兩個最近的鄰居計算測試模式的相似性,每個都有主索引。步驟4對所有主索引計算測試模式的所有相似性。步驟5給測試人臉分配具有最大相似性值的主索引。如果在測試文件中的人臉不屬于任何存儲在主要數(shù)據(jù)文件的人臉,對于這個測試臉,將給出與其最相似的分類索引。4結(jié)語隨著計算機和人工智能技術(shù)的發(fā)展,人們對模式識別技術(shù)在圖像處理中的應(yīng)用越來越重視。同時,模式識別涉及并利用到數(shù)學(xué)、計算機科學(xué)等多學(xué)科的理論知識,而將這些學(xué)科的新技術(shù)和成就綜合運用到模式識別中,提出更符合需求的模式識別技術(shù)是今后值得研究的重要課題。5參考文獻[1]邊肇祺,張學(xué)工,等.模式識別(第二版)[M].北京:清華大學(xué)出版社2000-01.[2]沈清,湯森.模式識別導(dǎo)論[M].長沙:國防科技大學(xué)出版社,1991.[3]KarayiannisNB,PaiPI.Afuzzyvectorquantizationalgorithmsandtheirapplicationinimagecompression[J].IEEETransactiononImageProcessing,1995,4(9):1193-1201.[4]ChenLi,YapKim-Hui.AfuzzyK-nearest-neighbouralgorithmtoblindimagedeconvolution[A].IEEEInternationalConferenceonSystems,Ma

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論