基于MATLAB的圖像銳化算法研究與仿真設(shè)計_第1頁
基于MATLAB的圖像銳化算法研究與仿真設(shè)計_第2頁
基于MATLAB的圖像銳化算法研究與仿真設(shè)計_第3頁
基于MATLAB的圖像銳化算法研究與仿真設(shè)計_第4頁
基于MATLAB的圖像銳化算法研究與仿真設(shè)計_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、摘摘 要要在獲取圖像的過程中,由于多種因素的影響,導(dǎo)致圖像質(zhì)量會有所退化。圖像增強的目的在于通過處理有選擇地突出便于人或機器分析某些感興趣的信息,抑制一些無用的信息,以提高圖像的使用價值。圖像銳化正是圖像增強中空間域局部運算方法中的一種,其目的是增強和判斷圖像的邊緣和輪廓信息。而圖像銳化的具體方法就是通過微分而使圖像邊緣突出、清晰。 圖像銳化最常用的方法是梯度銳化法,但除梯度算法外,圖像銳化的方法還有Roberts、Prewitt、Sobel 和 Laplacian 等多種算法,本文對這些方法進(jìn)行了介紹、比較和分析。最后對 MATLAB 做了介紹,并運用 MATLAB 語言對圖像銳化的部分算法

2、進(jìn)行了實現(xiàn)并記錄結(jié)果。 通過對各種算法仿真和比較,每種算法都有各自的優(yōu)缺點。在分析了本論文采用的圖像特點后,有針對性的對 Laplacian 算法進(jìn)行了改進(jìn),即采用高提升濾波來提高圖像的亮度。實驗結(jié)果表明,此方法可行,達(dá)到了預(yù)期的銳化效果。關(guān)鍵詞:圖像增強;邊緣;MATLAB;圖像銳化AbstractAbstractIn the process of image acquisiting, the image quality will be degraded due to a variety of factors. Image enhanceing is aimed at highlightin

3、g some interested information that is easy to analyze for people and machine and inhibiting some useless information to enhance the image value. Image sharpening is a partion operation method of image enhancing in spatial domain, and its purpose is to enhance and judge the edge of the image and prof

4、ile information and the specific method of the image sharpening uses differential to make the edge so prominent and clear. The most commonly used method of image sharpening is gradient sharpening. But apart from the gradient algorithm, image sharpening methods also have Roberts, Prewitt, Sobel, Lapl

5、acian and etc. These methods were introduced, compared and analyzed. Finally, MATLAB is introduced. And a part of the image sharpening algorithm is achievd and the results afe recorded. Through the simulation and comparison of the various algorithms, each algorithm has its own advantages and disadva

6、ntages. After the features of the image using in this paper are analyzed, it improves the Laplacian algorithm contrapositively, namely using high-elevating filtering to improve the brightness of the image. Experimental results show that the method is feasible and achieves the desired sharpening effe

7、ct.Key words: Image enhancing; Edge;MATLAB; Image Sharpening III / 36畢業(yè)論文(設(shè)計)原創(chuàng)性聲明畢業(yè)論文(設(shè)計)原創(chuàng)性聲明本人所呈交的畢業(yè)論文(設(shè)計)是我在導(dǎo)師的指導(dǎo)下進(jìn)行的研究工作本人所呈交的畢業(yè)論文(設(shè)計)是我在導(dǎo)師的指導(dǎo)下進(jìn)行的研究工作與取得的研究成果。據(jù)我所知,除文中已經(jīng)注明引用的容外,本論文(設(shè)計)與取得的研究成果。據(jù)我所知,除文中已經(jīng)注明引用的容外,本論文(設(shè)計)不包含其他個人已經(jīng)發(fā)表或撰寫過的研究成果。對本論文(設(shè)計)的研究做不包含其他個人已經(jīng)發(fā)表或撰寫過的研究成果。對本論文(設(shè)計)的研究做出重要貢獻(xiàn)的個人和集體

8、,均已在文中作了明確說明并表示意。出重要貢獻(xiàn)的個人和集體,均已在文中作了明確說明并表示意。 作者簽名:作者簽名: 日期:日期:畢業(yè)論文(設(shè)計)授權(quán)使用說明畢業(yè)論文(設(shè)計)授權(quán)使用說明本論文(設(shè)計)作者完全了解本論文(設(shè)計)作者完全了解*學(xué)院有關(guān)保留、使用畢業(yè)論文(設(shè)計)學(xué)院有關(guān)保留、使用畢業(yè)論文(設(shè)計)的規(guī)定,學(xué)校有權(quán)保留論文(設(shè)計)并向相關(guān)部門送交論文(設(shè)計)的電子的規(guī)定,學(xué)校有權(quán)保留論文(設(shè)計)并向相關(guān)部門送交論文(設(shè)計)的電子版和紙質(zhì)版。有權(quán)將論文(設(shè)計)用于非贏利目的的少量復(fù)制并允許論文版和紙質(zhì)版。有權(quán)將論文(設(shè)計)用于非贏利目的的少量復(fù)制并允許論文(設(shè)計)進(jìn)入學(xué)校圖書館被查閱。學(xué)校可

9、以公布論文(設(shè)計)的全部或部分(設(shè)計)進(jìn)入學(xué)校圖書館被查閱。學(xué)??梢怨颊撐模ㄔO(shè)計)的全部或部分容。的論文(設(shè)計)在解密后適用本規(guī)定。容。的論文(設(shè)計)在解密后適用本規(guī)定。 作者簽名:作者簽名: 指導(dǎo)教師簽名:指導(dǎo)教師簽名:日期:日期: 日期:日期:注意事項1.設(shè)計(論文)的容包括:1)封面(按教務(wù)處制定的標(biāo)準(zhǔn)封面格式制作)2)原創(chuàng)性聲明3)中文摘要(300 字左右) 、關(guān)鍵詞4)外文摘要、關(guān)鍵詞5)目次頁(附件不統(tǒng)一編入)6)論文主體部分:引言(或緒論) 、正文、結(jié)論7)參考文獻(xiàn)8)致9)附錄(對論文支持必要時)2.論文字?jǐn)?shù)要求:理工類設(shè)計(論文)正文字?jǐn)?shù)不少于 1 萬字(不包括圖紙、程序清

10、單等) ,文科類論文正文字?jǐn)?shù)不少于 1.2 萬字。3.附件包括:任務(wù)書、開題報告、外文譯文、譯文原文(復(fù)印件) 。4.文字、圖表要求:1)文字通順,語言流暢,書寫字跡工整,打印字體與大小符合要求,無錯別字,不準(zhǔn)請他人代寫2)工程設(shè)計類題目的圖紙,要求部分用尺規(guī)繪制,部分用計算機繪制,所有圖紙應(yīng)符合國家技術(shù)標(biāo)準(zhǔn)規(guī)。圖表整潔,布局合理,文字注釋必須使用工程字書寫,不準(zhǔn)用徒手畫3)畢業(yè)論文須用 A4 單面打印,論文 50 頁以上的雙面打印4)圖表應(yīng)繪制于無格子的頁面上5)軟件工程類課題應(yīng)有程序清單,并提供電子文檔5.裝訂順序1)設(shè)計(論文)2)附件:按照任務(wù)書、開題報告、外文譯文、譯文原文(復(fù)印件)

11、次序裝訂3)其它V / 36目 錄1 引 言 .11.1 圖像與其特點.11.2 圖像的文件格式.11.3 數(shù)字圖像處理 .51.3.1 數(shù)字圖像處理概述 .51.3.2 數(shù)字圖像處理發(fā)展概況 .51.3.3 數(shù)字圖像處理主要研究容.61.3.4 數(shù)字圖像處理的基本特點 .71.3.5 數(shù)字圖像處理的優(yōu)點.81.3.6 數(shù)字圖像處理的應(yīng)用 .81.4 圖像銳化的研究背景 .101.5 研究圖像銳化的目的和注意事項.101.6 本文容的安排.102 圖像銳化 .112.1 微分法 .112.1.1 梯度法(Gradieut) .112.1.2 Sobel 算法.132.1.3 LOG 算子.14

12、2.2 拉普拉斯算子 .142.3 高通濾波法 .152.3.1 空間域高通濾波 .152.3.2 頻率域高通濾波 .162.3.3 統(tǒng)計差值法(用于勾邊處理) .172.4 MATLAB 中如何實現(xiàn)圖像銳化.172.5 總結(jié) .183 銳化的邊緣檢測法與銳化算子 .193.1 邊緣檢測法.193.1.1 梯度算子 .193.1.2 梯度算子在 MATLAB 中的實現(xiàn) .203.2 拉普拉斯算子.213.3 邊緣連接方法 .213.4 邊緣檢測的 MATLAB 實現(xiàn)方法 .223.5 MATLAB 的實現(xiàn)程序如下.233.6 結(jié)論 .234 MATLAB 簡介與 GUI 設(shè)計 244.1 MA

13、TLAB 簡介 244.2 圖形用戶界面 GUI .244.3 GUI 設(shè)計原理與簡介 254.4 設(shè)計方法 254.4.1 圖形用戶界面設(shè)計工具 254.4.2 菜單設(shè)計 264.4.3 對話框設(shè)計 264.4.4 句柄圖形 274.4.5 圖形對象句柄命令 274.5 總結(jié) 275 結(jié)論與展望 285.1 結(jié)論 285.2 展望 28致 29參考文獻(xiàn) 301 1 引引 言言據(jù)研究,在人類所接受到的全部信息中,約有 75%80%是通過視覺系統(tǒng)得到的,和語言或文字信息相比,圖像包含的信息量更大、更直觀、更確切,因而具有更高的使用效率和更廣泛的適應(yīng)性。當(dāng)圖像以數(shù)字形式進(jìn)行處理和傳輸時,由于具有質(zhì)

14、量好、成本低和易于實現(xiàn)等優(yōu)點,這種存儲和傳輸格式已經(jīng)成為該領(lǐng)域當(dāng)前和未來的主要發(fā)展趨勢。1.11.1 圖像與其特點圖像與其特點客觀世界在空間上是三維(3-D)的,但一般從客觀景物得到的圖像是二維(2-D)的。一幅圖像可以定義為一個二維函數(shù),這里 x 和 y 表示 2-D 空間中一個坐標(biāo)點的位置,)y, x(f而幅值 f 則代表圖像在坐標(biāo)上的某種性質(zhì)的數(shù)值。例如常用的圖像一般是灰度圖,)y, x(這時 f 表示灰度值,它常對應(yīng)客觀景物被觀察到的亮度1。數(shù)字圖像常用矩陣來描述。一幅 MN 個像素的數(shù)字圖像,其像素灰度值可以用 M 行、N 列的矩陣G表示: MN2M1MN22221N11211g g

15、 g g g gg g gG在存儲圖像時,一幅 M 行、N 列的數(shù)字圖像(MN 個像素),可以用一個 MN 的二維數(shù)組 T 來表示。圖像的各個像素灰度值可按一定的順序存放在數(shù)組 T 中。習(xí)慣上把數(shù)字圖像左上角的像素定義為第(1,1),右下角的像素定義為第(M,N)個像素。數(shù)字圖像處理,就是把數(shù)字圖像經(jīng)過一些特定數(shù)理模式的加工處理,以達(dá)到有利于人眼視覺或某種接收系統(tǒng)所需要的圖像的過程。如對被噪聲污染的圖像除去噪聲,對信息微弱的圖像進(jìn)行增強,對失真的圖像進(jìn)行幾何校正等。隨著計算機軟硬件技術(shù)的突飛猛進(jìn),以與數(shù)字處理技術(shù)的不斷發(fā)展,數(shù)字圖像處理在科學(xué)研究、工業(yè)生產(chǎn)、國防以與現(xiàn)代管理決策等各行各業(yè)都得到

16、越來越多的應(yīng)用。1.21.2 圖像的文件格式圖像的文件格式(1) BMP 圖像文件格式BMP 是一種與硬件設(shè)備無關(guān)的圖像文件格式,使用非常廣。它采用位映射存儲格式,除了圖像深度可選以外,不采用其他任何壓縮,因此,BblP 文件所占用的空間很大。BMP 文件的圖像深度可選 lbit、4bit、8bit 與 24bit。BMP 文件存儲數(shù)據(jù)時,圖像的掃描方式是按從左到右、從下到上的順序。由于 BMP 文件格式是 Windows 環(huán)境換與圖有關(guān)的數(shù)據(jù)的一種標(biāo)準(zhǔn),因此在 Windows環(huán)境中運行的圖形圖像軟件都支持 BMP 圖像格式。典型的 BMP 圖像文件由三部分組成:位圖文件頭數(shù)據(jù)結(jié)構(gòu),它包含 B

17、MP 圖像文件的類型、顯示容等信息;位圖信息數(shù)據(jù)結(jié)構(gòu),它包含有 BMP 圖像的寬、高、壓縮方法,以與定義顏色等信息。BMP 是(Windows 位圖)Windows 位圖可以用任何顏色深度(從黑白到 24 位顏色)存儲單個光柵圖像。Windows 位圖文件格式與其他 Microsoft Windows 程序兼容。它不支持文件壓縮,也不適用于 Web 頁從總體上看,Windows 位圖文件格式的缺點超過了它的優(yōu)點。為了保證照片圖像的質(zhì)量,請使用 PNG 、JPEG、TIFF 文件。BMP 文件適用于 Windows 中的墻紙。優(yōu)點:BMP 支持 1 位到 24 位顏色深度。BMP 格式與現(xiàn)有 W

18、indows 程序(尤其是較舊的程序)廣泛兼容。缺點: BMP 不支持壓縮,這會造成文件非常大。 BMP 文件不受 Web 瀏覽器支持。(2)PCX 圖像文件格式PCX 這種圖像文件的形成是有一個發(fā)展過程的。最先的 PCX 雛形是出現(xiàn)在 ZSOFT 公司推出的名叫 PC PAINBRUSH 的用于繪畫的商業(yè)軟件包中。以后,微軟公司將其移植到 Windows 環(huán)境中,成為 Windows 系統(tǒng)中一個子功能。先在微軟的 Windows31 中廣泛應(yīng)用,隨著 Windows 的流行、升級,加之其強大的圖像處理能力,使 PCX 同 GIF、TIFF、BMP 圖像文件格式一起,被越來越多的圖形圖像軟件工

19、具所支持,也越來越得到人們的重視。PCX 是最早支持彩色圖像的一種文件格式,現(xiàn)在最高可以支持 256 種彩色,如圖 4-25 所示,顯示 256 色的彩色圖像。PCX 設(shè)計者很有眼光地超前引入了彩色圖像文件格式,使之成為現(xiàn)在非常流行的圖像文件格式。PCX 圖像文件由文件頭和實際圖像數(shù)據(jù)構(gòu)成。文件頭由 128 字節(jié)組成,描述版本信息和圖像顯示設(shè)備的橫向、縱向分辨率,以與調(diào)色板等信息:在實際圖像數(shù)據(jù)中,表示圖像數(shù)據(jù)類型和彩色類型。PCX 圖像文件中的數(shù)據(jù)都是用 PCXREL 技術(shù)壓縮后的圖像數(shù)據(jù)。PCX 是 PC 機畫筆的圖像文件格式。PCX 的圖像深度可選為 l、4、8bit。由于這種文件格式出

20、現(xiàn)較早,它不支持真彩色。PCX 文件采用 RLE 行程編碼,文件體中存放的是壓縮后的圖像數(shù)據(jù)。因此,將采集到的圖像數(shù)據(jù)寫成 PCX 文件格式時,要對其進(jìn)行 RLE 編碼:而讀取一個 PCX 文件時首先要對其進(jìn)行 RLE 解碼,才能進(jìn)一步顯示和處理。(3) TIFF 圖像文件格式TIFF (TaglmageFileFormat)圖像文件是由 Aldus 和 Microsoft 公司為桌上出版系統(tǒng)研制開發(fā)的一種較為通用的圖像文件格式。TIFF 格式靈活易變,它又定義了四類不同的格式:TIFF-B 適用于二值圖像:TIFF-G 適用于黑白灰度圖像;TIFF-P 適用于帶調(diào)色板的彩色圖像:TIFF-R

21、 適用于 RGB 真彩圖像。TIFF 支持多種編碼方法,其中包括 RGB 無壓縮、RLE 壓縮與 JPEG 壓縮等。TIFF 是現(xiàn)存圖像文件格式中最復(fù)雜的一種,它具有擴(kuò)展性、方便性、可改性,可以提供給 IBMPC 等環(huán)境中運行、圖像編輯程序。TIFF 圖像文件由三個數(shù)據(jù)結(jié)構(gòu)組成,分別為文件頭、一個或多個稱為 IFD 的包含標(biāo)記指針的目錄以與數(shù)據(jù)本身。TIFF 圖像文件中的第一個數(shù)據(jù)結(jié)構(gòu)稱為圖像文件頭或 IFH。這個結(jié)構(gòu)是一個 TIFF 文件中唯一的、有固定位置的部分;IFD 圖像文件目錄是一個字節(jié)長度可變的信息塊,Tag3 / 36標(biāo)記是 TIFF 文件的核心部分,在圖像文件目錄中定義了要用的

22、所有圖像參數(shù),目錄中的每一目錄條目就包含圖像的一個參數(shù)。(4) GIF 文件格式GIF(Graphics Interchange Format)的原義是圖像互換格式,是 CompuServe 公司在 1987 年開發(fā)的圖像文件格式。GIF 文件的數(shù)據(jù),是一種基于 LZW 算法的連續(xù)色調(diào)的無損壓縮格式。其壓縮率一般在 50左右,它不屬于任何應(yīng)用程序。目前幾乎所有相關(guān)軟件都支持它,公共領(lǐng)域有大量的軟件在使用 GIF 圖像文件。GIF 圖像文件的數(shù)據(jù)是經(jīng)過壓縮的,而且是采用了可變長度等壓縮算法。所以 GIF 的圖像深度從 lbit 到 8bit,也即 GIF 最多支持 256 種色彩的圖像。GIF

23、格式的另一個特點是其在一個 GIF 文件中可以存多幅彩色圖像,如果把存于一個文件中的多幅圖像數(shù)據(jù)逐幅讀出并顯示到屏幕上,就可構(gòu)成一種最簡單的動畫。GIF 解碼較快,因為采用隔行存放的 GIF 圖像,在邊解碼邊顯示的時候可分成四遍掃描。第一遍掃描雖然只顯示了整個圖像的八分之一,第二遍的掃描后也只顯示了 1/4,已經(jīng)把整幅圖像的概貌顯示出來了。在顯示 GIF 圖像時,隔行存放的圖像會給您感覺到它的顯示速度似乎要比其他圖像快一些,這是隔行存放的優(yōu)點。(5) JPEG 文件格式 JPEG 是 joint Photographic Experts Group(聯(lián)合圖像專家組)的縮寫,文件后輟名為jpg或

24、jpeg,是最常用的圖像文件格式,由一個軟件開發(fā)聯(lián)合會組織制定,是一種有損壓縮格式,能夠?qū)D像壓縮在很小的儲存空間,圖像中重復(fù)或不重要的資料會被丟失,因此容易造成圖像數(shù)據(jù)的損傷。尤其是使用過高的壓縮比例,將使最終解壓縮后恢復(fù)的圖像質(zhì)量明顯降低,如果追求高品質(zhì)圖像,不宜采用過高壓縮比例。但是 JPEG 壓縮技術(shù)十分先進(jìn),它用有損壓縮方式去除冗余的圖像數(shù)據(jù),在獲得極高的壓縮率的同時能展現(xiàn)十分豐富生動的圖像,換句話說,就是可以用最少的磁盤空間得到較好的圖像品質(zhì)。而且 JPEG 是一種很靈活的格式,具有調(diào)節(jié)圖像質(zhì)量的功能,允許用不同的壓縮比例對文件進(jìn)行壓縮,支持多種壓縮級別,壓縮比率通常在 10:1

25、到 40:1 之間,壓縮比越大,品質(zhì)就越低;相反地,壓縮比越小,品質(zhì)就越好。比如可以把 137Mb 的 BMP 位圖文件壓縮至 203KB。當(dāng)然也可以在圖像質(zhì)量和文件尺寸之間找到平衡點。JPEG 格式壓縮的主要是高頻信息,對色彩的信息保留較好,適合應(yīng)用于互聯(lián)網(wǎng),可減少圖像的傳輸時間,可以支持 24bit 真彩色,也普遍應(yīng)用于需要連續(xù)色調(diào)的圖像。JPEG 格式是目前網(wǎng)絡(luò)上最流行的圖像格式,是可以把文件壓縮到最小的格式,在 Photoshop 軟件中以 JPEG 格式儲存時,提供 11 級壓縮級別,以 010 級表示。其中 0 級壓縮比最高,圖像品質(zhì)最差。即使采用細(xì)節(jié)幾乎無損的 10 級質(zhì)量保存時

26、,壓縮比也可達(dá) 5:1。以 BMP 格式保存時得到 428MB 圖像文件,在采用 JPG 格式保存時,其文件僅為178KB,壓縮比達(dá)到 24:1。經(jīng)過多次比較,采用第 8 級壓縮為存儲空間與圖像質(zhì)量兼得的最佳比例。JPEG 格式的應(yīng)用非常廣泛,特別是在網(wǎng)絡(luò)和光盤讀物上,都能找到它的身影。目前各類瀏覽器均支持 JPEG 這種圖像格式,因為 JPEG 格式的文件尺寸較小,下載速度快。JPEG2000 作為 JPEG 的升級版,其壓縮率比 JPEG 高約 30左右,同時支持有損和無損壓縮。JPEG2000 格式有一個極其重要的特征在于它能實現(xiàn)漸進(jìn)傳輸,即先傳輸圖像的輪廓,然后逐步傳輸數(shù)據(jù),不斷提高圖

27、像質(zhì)量,讓圖像由朦朧到清晰顯示。此外,JPEG2000 還支持所謂的感興趣區(qū)域 特性,可以任意指定影像上感興趣區(qū)域的壓縮質(zhì)量,還可以選擇指定的部分先解壓縮。JPEG2000 和 JPEG 相比優(yōu)勢明顯,且向下兼容,因此可取代傳統(tǒng)的 JPEG 格式。JPEG2000 即可應(yīng)用于傳統(tǒng)的 JPEG 市場,如掃描儀、數(shù)碼相機等,又可應(yīng)用于新興領(lǐng)域,如網(wǎng)路傳輸、無線通訊等等。(6) TGA 格式TGA 格式(Tagged Graphics)是由美國 Truevision 公司為其顯示卡開發(fā)的一種圖像文件格式,文件后綴為tga,已被國際上的圖形、圖像工業(yè)所接受。TGA 的結(jié)構(gòu)比較簡單,屬于一種圖形、圖像數(shù)

28、據(jù)的通用格式,在多媒體領(lǐng)域有很大影響,是計算機生成圖像向電視轉(zhuǎn)換的一種首選格式。TGA 圖像格式最大的特點是可以做出不規(guī)則形狀的圖形、圖像文件,一般圖形、圖像文件都為四方形,若需要有圓形、菱形甚至是縷空的圖像文件時,TGA 可就派上用場了。TGA 格式支持壓縮,使用不失真的壓縮算法。(7) EXIF 格式EXIF 的格式是 1994 年富士公司提倡的數(shù)碼相機圖像文件格式,其實與 JPEG 格式一樣,區(qū)別是除保存圖像數(shù)據(jù)外,還能夠存儲攝影日期、使用光圈、快門、閃光燈數(shù)據(jù)等曝光資料和附帶信息以與小尺寸圖像。(8) FPX 圖像文件格式FPX 圖像文件格式(擴(kuò)展名為 fpx)是由柯達(dá)、微軟、HP 與

29、 Live PictureInc 聯(lián)合研制,并于 1996 年 6 月正式發(fā)表,F(xiàn)PX 是一個擁有多重分辨率的影像格式,即影像被儲存成一系列高低不同的分辨率,這種格式的好處是當(dāng)影像被放大時仍可維持影像的質(zhì)素,另外,當(dāng)修飾 FPX 影像時,只會處理被修飾的部分,不會把整幅影像一并處理,從而減小處理器與記憶體的負(fù)擔(dān),使影像處理時間減少。(9) PNG 圖像文件格式PNG(Portable Network Graphics)的原名稱為可移植性網(wǎng)絡(luò)圖像,是網(wǎng)上接受的最新圖像文件格式。PNG 能夠提供長度比 GIF 小 30的無損壓縮圖像文件。它同時提供 24 位和 48 位真彩色圖像支持以與其他諸多技

30、術(shù)性支持。由于 PNG 非常新,所以目前并不是所有的程序都可以用它來存儲圖像文件,但 Photoshop 可以處理 PNG 圖像文件,也可以用 PNG 圖像文件格式存儲。還有如 SVG、PSD、CDR、PCD、DXF、UFO、EPS 等一些不常見的圖像文件格式在這就不做一一介紹了。 5 / 361.31.3 數(shù)字圖像處理數(shù)字圖像處理1.3.11.3.1 數(shù)字圖像處理概述數(shù)字圖像處理概述數(shù)字圖像處理(digital image processing)是用計算機對圖像信息進(jìn)行處理的一門技術(shù),使利用計算機對圖像進(jìn)行各種處理的技術(shù)和方法。20 世紀(jì) 20 年代,圖像處理首次得到應(yīng)用。20 世紀(jì) 60

31、年代中期,隨電子計算機的發(fā)展得到普遍應(yīng)用。60 年代末,圖像處理技術(shù)不斷完善,逐漸成為一個新興的學(xué)科。利用數(shù)字圖像處理主要是為了修改圖形,改善圖像質(zhì)量,或是從圖像中提起有效信息,還有利用數(shù)字圖像處理可以對圖像進(jìn)行體積壓縮,便于傳輸和保存。數(shù)字圖像處理主要研究以下容:傅立葉變換、小波變換等各種圖像變換;對圖像進(jìn)行編碼和壓縮;采用各種方法對圖像進(jìn)行復(fù)原和增強;對圖像進(jìn)行分割、描述和識別等。隨著技術(shù)的發(fā)展,數(shù)字圖像處理主要應(yīng)用于通訊技術(shù)、宇宙探索遙感技術(shù)和生物工程等領(lǐng)域。 數(shù)字圖像處理因易于實現(xiàn)非線性處理,處理程序和處理參數(shù)可變,故是一項通用性強,精度高,處理方法靈活,信息保存、傳送可靠的圖像處理技

32、術(shù)。主要用于圖像變換、量測、模式識別、模擬以與圖像產(chǎn)生。廣泛應(yīng)用在遙感、宇宙觀測、影像醫(yī)學(xué)、通信、刑偵與多種工業(yè)領(lǐng)域。遙感影像數(shù)字圖像處理的容主要有: 圖像恢復(fù)。即校正在成像、記錄、傳輸或回放過程中引入的數(shù)據(jù)錯誤、噪聲與畸變。包括輻射校正、幾何校正等; 數(shù)據(jù)壓縮。以改進(jìn)傳輸、存儲和處理數(shù)據(jù)效率; 影像增強。突出數(shù)據(jù)的某些特征,以提高影像目視質(zhì)量。包括彩色增強、反差增強、邊緣增強、密度分割、比值運算、去模糊等; 信息提取。從經(jīng)過增強處理的影像中提取有用的遙感信息。包括采用各種統(tǒng)計分析、集群分析、頻譜分析等自動識別與分類。通常利用專用數(shù)字圖像處理系統(tǒng)來實現(xiàn),且依據(jù)目的不同采用不同算法和技術(shù)。1.3

33、.21.3.2 數(shù)字圖像處理發(fā)展概況數(shù)字圖像處理發(fā)展概況數(shù)字圖像處理(Digital Image Processing)又稱為計算機圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進(jìn)行處理的過程。數(shù)字圖像處理最早出現(xiàn)于 20 世紀(jì) 50 年代,當(dāng)時的電子計算機已經(jīng)發(fā)展到一定水平,人們開始利用計算機來處理圖形和圖像信息。數(shù)字圖像處理作為一門學(xué)科大約形成于 20 世紀(jì) 60 年代初期。早期的圖像處理的目的是改善圖像的質(zhì)量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像,常用的圖像處理方法有圖像增強、復(fù)原、編碼、壓縮等。首次獲得實際成功應(yīng)用

34、的是美國噴氣推進(jìn)實驗室(JPL)。他們對航天探測器徘徊者 7號在 1964 年發(fā)回的幾千月球照片使用了圖像處理技術(shù),如幾何校正、灰度變換、去除噪聲等方法進(jìn)行處理,并考慮了太陽位置和月球環(huán)境的影響,由計算機成功地繪制出月球表面地圖,獲得了巨大的成功。隨后又對探測飛船發(fā)回的近十萬照片進(jìn)行更為復(fù)雜的圖像處理,以致獲得了月球的地形圖、彩色圖與全景鑲嵌圖,獲得了非凡的成果,為人類登月創(chuàng)舉奠定了堅實的基礎(chǔ),也推動了數(shù)字圖像處理這門學(xué)科的誕生。在以后的宇航空間技術(shù),如對火星、土星等星球的探測研究中,數(shù)字圖像處理技術(shù)都發(fā)揮了巨大的作用。數(shù)字圖像處理取得的另一個巨大成就是在醫(yī)學(xué)上獲得的成果。1972 年英國 E

35、MI 公司工程師 Housfield 發(fā)明了用于頭顱診斷的 X 射線計算機斷層攝影裝置,也就是我們通常所說的 CT(Computer Tomograph)。CT 的基本方法是根據(jù)人的頭部截面的投影,經(jīng)計算機處理來重建截面圖像,稱為圖像重建。1975 年 EMI 公司又成功研制出全身用的 CT 裝置,獲得了人體各個部位鮮明清晰的斷層圖像。1979 年,這項無損傷診斷技術(shù)獲得了諾貝爾獎,說明它對人類作出了劃時代的貢獻(xiàn)。與此同時,圖像處理技術(shù)在許多應(yīng)用領(lǐng)域受到廣泛重視并取得了重大的開拓性成就,屬于這些領(lǐng)域的有航空航天、生物醫(yī)學(xué)工程、工業(yè)檢測、機器人視覺、公安司法、軍事制導(dǎo)、文化藝術(shù)等,使圖像處理成為

36、一門引人注目、前景遠(yuǎn)大的新型學(xué)科。隨著圖像處理技術(shù)的深入發(fā)展,從 70 年代中期開始,隨著計算機技術(shù)和人工智能、思維科學(xué)研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展。人們已開始研究如何用計算機系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)理解外部世界,這被稱為圖像理解或計算機視覺。很多國家,特別是發(fā)達(dá)國家投入更多的人力、物力到這項研究,取得了不少重要的研究成果。其中代表性的成果是 70 年代末 MIT 的 Marr 提出的視覺計算理論,這個理論成為計算機視覺領(lǐng)域其后十多年的主導(dǎo)思想。圖像理解雖然在理論方法研究上已取得不小的進(jìn)展,但它本身是一個比較難的研究領(lǐng)域,存在不少困難,因人類本身對自己的視覺過程還

37、了解甚少,因此計算機視覺是一個有待人們進(jìn)一步探索的新領(lǐng)域。1.3.31.3.3 數(shù)字圖像處理主要研究容數(shù)字圖像處理主要研究容數(shù)字圖像處理主要研究容有以下幾個方面: 1) 圖像變換由于圖像陣列很大,直接在空間域中進(jìn)行處理,涉與計算量很大。因此,往往采用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進(jìn)行數(shù)字濾波處理)。目前新興研究的小波變換在時域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應(yīng)用。2) 圖像編碼壓縮圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量(即比

38、特數(shù)),以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進(jìn)行。編碼是壓縮技術(shù)中最重要的方法,它在圖像處理技術(shù)中是發(fā)展最早且比較成熟的技術(shù)。 3) 圖像增強和復(fù)原圖像增強和復(fù)原的目的是為了提高圖像的質(zhì)量,如去除噪聲,提7 / 36高圖像的清晰度等。圖像增強不考慮圖像降質(zhì)的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細(xì)節(jié)明顯;如強化低頻分量可減少圖像中噪聲影響。圖像復(fù)原要求對圖像降質(zhì)的原因有一定的了解,一般講應(yīng)根據(jù)降質(zhì)過程建立降質(zhì)模型,再采用某種濾波方法,恢復(fù)或重建原來的圖像。 4) 圖像分割圖像分割是數(shù)字圖

39、像處理中的關(guān)鍵技術(shù)之一。圖像分割是將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區(qū)域等,這是進(jìn)一步進(jìn)行圖像識別、分析和理解的基礎(chǔ)。雖然目前已研究出不少邊緣提取、區(qū)域分割的方法,但還沒有一種普遍適用于各種圖像的有效方法。因此,對圖像分割的研究還在不斷深入之中,是目前圖像處理中研究的熱點之一。 5) 圖像描述是圖像識別和理解的必要前提。作為最簡單的二值圖像可采用其幾何特性描述物體的特性,一般圖像的描述方法采用二維形狀描述,它有邊界描述和區(qū)域描述兩類方法。對于特殊的紋理圖像可采用二維紋理特征描述。隨著圖像處理研究的深入發(fā)展,已經(jīng)開始進(jìn)行三維物體描述的研究,提出了體積描述、表面描述、

40、廣義圓柱體描述等方法。 6) 圖像分類(識別)圖像分類(識別)屬于模式識別的疇,其主要容是圖像經(jīng)過某些預(yù)處理(增強、復(fù)原、壓縮)后,進(jìn)行圖像分割和特征提取,從而進(jìn)行判決分類。圖像分類常采用經(jīng)典的模式識別方法,有統(tǒng)計模式分類和句法(結(jié)構(gòu))模式分類,近年來新發(fā)展起來的模糊模式識別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識別中也越來越受到重視。1.3.41.3.4 數(shù)字圖像處理的基本特點數(shù)字圖像處理的基本特點(1) 目前,數(shù)字圖像處理的信息大多是二維信息,處理信息量很大。如一幅 256256低分辨率黑白圖像,要求約 64kbit 的數(shù)據(jù)量;對高分辨率彩色 512512 圖像,則要求768kbit 數(shù)據(jù)量;如果要

41、處理 30 幀/秒的電視圖像序列,則每秒要求 500kbit22.5Mbit數(shù)據(jù)量。因此對計算機的計算速度、存儲容量等要求較高2。(2) 數(shù)字圖像處理占用的頻帶較寬。與語言信息相比,占用的頻帶要大幾個數(shù)量級。如電視圖像的帶寬約 5.6MHz,而語音帶寬僅為 4kHz 左右。所以在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本亦高,這就對頻帶壓縮技術(shù)提出了更高的要求。(3) 數(shù)字圖像中各個像素是不獨立的,其相關(guān)性大。在圖像畫面上,經(jīng)常有很多像素有一樣或接近的灰度。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達(dá) 0.9 以上,而相鄰兩幀之間的相關(guān)性比幀相

42、關(guān)性一般說還要大些。因此,圖像處理息壓縮的潛力很大。(4) 由于圖像是三維景物的二維投影,一幅圖象本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來的。因此,要分析和理解三維景物必須作合適的假定或附加新的測量,例如雙目圖像或多視點圖像。在理解三維景物時需要知識導(dǎo)引,這也是人工智能中正在致力解決的知識工程問題。(5) 數(shù)字圖像處理后的圖像一般是給人觀察和評價的,因此受人的因素影響較大。由于人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、人的情緒愛好以與知識狀況影響很大,作為圖像質(zhì)量的評價還有待進(jìn)一步深入的研究。另一方面,計算機視覺是模仿人的視覺,人的感知

43、機理必然影響著計算機視覺的研究。例如,什么是感知的初始基元,基元是如何組成的,局部與全局感知的關(guān)系,優(yōu)先敏感的結(jié)構(gòu)、屬性和時間特征等,這些都是心理學(xué)和神經(jīng)心理學(xué)正在著力研究的課題。1.3.51.3.5 數(shù)字圖像處理的優(yōu)點數(shù)字圖像處理的優(yōu)點 現(xiàn)性好。數(shù)字圖像處理與模擬圖像處理的根本不同在于,它不會因圖像的存儲、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化。只要圖像在數(shù)字化時準(zhǔn)確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)。 處理精度高。按目前的技術(shù),幾乎可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,這主要取決于圖像數(shù)字化設(shè)備的能力?,F(xiàn)代掃描儀可以把每個像素的灰度等級量化為 16 位甚至更

44、高,這意味著圖像的數(shù)字化精度可以達(dá)到滿足任一應(yīng)用需求。對計算機而言,不論數(shù)組大小,也不論每個像素的位數(shù)多少,其處理程序幾乎是一樣的。換言之,從原理上講不論圖像的精度有多高,處理總是能實現(xiàn)的,只要在處理時改變程序中的數(shù)組參數(shù)就可以了?;叵胍幌聢D像的模擬處理,為了要把處理精度提高一個數(shù)量級,就要大幅度地改進(jìn)處理裝置,這在經(jīng)濟(jì)上是極不合算的。 適用面寬。圖像可以來自多種信息源,它們可以是可見光圖像,也可以是不可見的波譜圖像(例如 X 射線圖像、射線圖像、超聲波圖像或紅外圖像等)。從圖像反映的客觀實體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠(yuǎn)鏡圖像。這些來自不同信息源的圖像只要

45、被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像(彩色圖像也是由灰度圖像組合成的,例如 RGB 圖像由紅、綠、藍(lán)三個灰度圖像組合而成)組合而成,因而均可用計算機來處理。即只要針對不同的圖像信息源,采取相應(yīng)的圖像信息采集措施,圖像的數(shù)字處理方法適用于任何一種圖像。 靈活性高。圖像處理大體上可分為圖像的像質(zhì)改善、圖像分析和圖像重建三大部分,每一部分均包含豐富的容。由于圖像的光學(xué)處理從原理上講只能進(jìn)行線性運算,這極限制了光學(xué)圖像處理能實現(xiàn)的目標(biāo)。而數(shù)字圖像處理不僅能完成線性運算,而且能實現(xiàn)非線性處理,即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來表達(dá)的一切運算均可用數(shù)字圖像處理實。1.3.61.3.6 數(shù)字圖

46、像處理的應(yīng)用數(shù)字圖像處理的應(yīng)用圖像是人類獲取和交換信息的主要來源,因此,圖像處理的應(yīng)用領(lǐng)域必然涉與到人類生活和工作的方方面面。隨著人類活動圍的不斷擴(kuò)大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴(kuò)大。 1) 航天和航空技術(shù)方面的應(yīng)用數(shù)字圖像處理技術(shù)在航天和航空技術(shù)方面的應(yīng)用,除了上面介紹的 JPL 對月球、火星照片的處理之外,另一方面的應(yīng)用是在飛機遙感和衛(wèi)星遙感技術(shù)中。許多國家每天派出很多偵察飛機對地球上有興趣的地區(qū)進(jìn)行大量的空中攝9 / 36影。對由此得來的照片進(jìn)行處理分析,以前需要雇用幾千人,而現(xiàn)在改用配備有高級計算機的圖像處理系統(tǒng)來判讀分析,既節(jié)省人力,又加快了速度,還可以從照片中提取人工所不能發(fā)現(xiàn)

47、的大量有用情報。從 60 年代末以來,美國與一些國際組織發(fā)射了資源遙感衛(wèi)星(如 LANDSAT 系列)和天空實驗室(如 SKYLAB),由于成像條件受飛行器位置、姿態(tài)、環(huán)境條件等影響,圖像質(zhì)量總不是很高。因此,以如此昂貴的代價進(jìn)行簡單直觀的判讀來獲取圖像是不合算的,而必須采用數(shù)字圖像處理技術(shù)。如 LANDSAT 系列陸地衛(wèi)星,采用多波段掃描器(MSS),在 900km 高空對地球每一個地區(qū)以 18 天為一周期進(jìn)行掃描成像,其圖像分辨率大致相當(dāng)于地面上十幾米或 100 米左右(如 1983 年發(fā)射的 LANDSAT-4,分辨率為 30m)。這些圖像在空中先處理(數(shù)字化,編碼)成數(shù)字信號存入磁帶中

48、,在衛(wèi)星經(jīng)過地面站上空時,再高速傳送下來,然后由處理中心分析判讀。這些圖像無論是在成像、存儲、傳輸過程中,還是在判讀分析中,都必須采用很多數(shù)字圖像處理方法?,F(xiàn)在世界各國都在利用陸地衛(wèi)星所獲取的圖像進(jìn)行資源調(diào)查(如森林調(diào)查、海洋泥沙和漁業(yè)調(diào)查、水資源調(diào)查等),災(zāi)害檢測(如病蟲害檢測、水火檢測、環(huán)境污染檢測等),資源勘察(如石油勘查、礦產(chǎn)量探測、大型工程地理位置勘探分析等),農(nóng)業(yè)規(guī)劃(如土壤營養(yǎng)、水份和農(nóng)作物生長、產(chǎn)量的估算等),城市規(guī)劃(如地質(zhì)結(jié)構(gòu)、水源與環(huán)境分析等)。我國也陸續(xù)開展了以上諸方面的一些實際應(yīng)用,并獲得了良好的效果。在氣象預(yù)報和對太空其它星球研究方面,數(shù)字圖像處理技術(shù)也發(fā)揮了相當(dāng)大

49、的作用。2) 生物醫(yī)學(xué)工程方面的應(yīng)用數(shù)字圖像處理在生物醫(yī)學(xué)工程方面的應(yīng)用十分廣泛,而且很有成效。除了上面介紹的 CT 技術(shù)之外,還有一類是對醫(yī)用顯微圖像的處理分析,如紅細(xì)胞、白細(xì)胞分類,染色體分析,癌細(xì)胞識別等。此外,在 X 光肺部圖像增晰、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學(xué)診斷方面都廣泛地應(yīng)用圖像處理技術(shù)。 3) 通信工程方面的應(yīng)用當(dāng)前通信的主要發(fā)展方向是聲音、文字、圖像和數(shù)據(jù)結(jié)合的多媒體通信。具體地講是將、電視和計算機以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸。其中以圖像通信最為復(fù)雜和困難,因圖像的數(shù)據(jù)量十分巨大,如傳送彩色電視信號的速率達(dá) 100Mbit/s 以上。要將這樣高速率

50、的數(shù)據(jù)實時傳送出去,必須采用編碼技術(shù)來壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術(shù)成敗的關(guān)鍵。除了已應(yīng)用較廣泛的熵編碼、DPCM 編碼、變換編碼外,目前國外正在大力開發(fā)研究新的編碼方法,如分行編碼、自適應(yīng)網(wǎng)絡(luò)編碼、小波變換圖像壓縮編碼等。 4) 工業(yè)和工程方面的應(yīng)用在工業(yè)和工程領(lǐng)域中圖像處理技術(shù)有著廣泛的應(yīng)用,如自動裝配線中檢測零件的質(zhì)量、并對零件進(jìn)行分類,印刷電路板疵病檢查,彈性力學(xué)照片的應(yīng)力分析,流體力學(xué)圖片的阻力和升力分析,郵政信件的自動分揀,在一些有毒、放射性環(huán)境識別工件與物體的形狀和排列狀態(tài),先進(jìn)的設(shè)計和制造技術(shù)中采用工業(yè)視覺等等。其中值得一提的是研制具備視覺、聽覺和觸覺功能

51、的智能機器人,將會給工農(nóng)業(yè)生產(chǎn)帶來新的激勵,目前已在工業(yè)生產(chǎn)中的噴漆、焊接、裝配中得到有效的利用。 5) 軍事公安方面的應(yīng)用在軍事方面圖像處理和識別主要用于導(dǎo)彈的精確末制導(dǎo),各種偵察照片的判讀,具有圖像傳輸、存儲和顯示的軍事自動化指揮系統(tǒng),飛機、坦克和軍艦?zāi)M訓(xùn)練系統(tǒng)等;公安業(yè)務(wù)圖片的判讀分析,指紋識別,人臉鑒別,不完整圖片的復(fù)原,以與交通監(jiān)控、事故分析等。目前已投入運行的高速公路不停車自動收費系統(tǒng)中的車輛和車牌的自動識別都是圖像處理技術(shù)成功應(yīng)用的例子。 6) 文化藝術(shù)方面的應(yīng)用目前這類應(yīng)用有電視畫面的數(shù)字編輯,動畫的制作,電子圖像游戲,紡織工藝品設(shè)計,服裝設(shè)計與制作,發(fā)型設(shè)計,文物資料照片的

52、復(fù)制和修復(fù),運動員動作分析和評分等等,現(xiàn)在已逐漸形成一門新的藝術(shù)-計算機美術(shù)。1.41.4 圖像銳化的研究背景圖像銳化的研究背景隨著計算機技術(shù)的迅速發(fā)展,數(shù)字圖像處理技術(shù)逐漸成熟,如圖像平滑、圖像銳化等等,本文將主要從圖像銳化的各種方法與其實踐應(yīng)用進(jìn)行闡述。由于人們常常無法事先確定輪廓的取向,因而在選擇輪廓增強的微分算子時,必須選擇那些不具備空間方向性的和具有周旋不變的線性微分算子,使圖象的邊緣或線條變得清晰,實現(xiàn)圖象的銳化。因此,從圖象增強的目的看,它是與圖象平滑相反的一類處理。圖象的平滑主要是為了消除噪聲,噪聲并不限于人眼所能看見的失真和變形,有些噪聲只有在進(jìn)行圖象處理時才可以發(fā)現(xiàn)。圖象的

53、常見噪聲主要有加性噪比、乘性噪聲和量化噪聲等。因此對圖象的處理是有很有必要的,我們可以很方便的運用一些函數(shù)完成數(shù)字濾波工作,從而改善圖象的質(zhì)量。1.51.5 研究圖像銳化的目的和注意事項研究圖像銳化的目的和注意事項圖像銳化的目的是使模糊的圖像變清晰,增強圖像的邊緣等細(xì)節(jié)。圖像銳化在增強邊緣的同時會增強噪聲,因此一般先去除或減輕噪聲,再進(jìn)行銳化處理。圖像銳化可以在空間域和頻率域通過高通濾波來實現(xiàn),即減弱或消除低頻分量而不影響高頻分量??臻g域高通濾波主要用模板卷積來實現(xiàn)。需要注意的是,能夠進(jìn)行銳化處理的圖像必須具有較高的信噪比,否則銳化之后,信噪比會進(jìn)一步降低。因此,在對圖像銳化處理之前,一般要先

54、去除或者減輕干擾噪聲。1.61.6 本文容的安排本文容的安排本文主要對空間域和頻率域的一些圖像銳化方法作了相關(guān)研究。本文的章節(jié)安排如下:第 2 章介紹了幾種圖像銳化的方法,包括微分法、拉普拉斯算子、高通濾波法等一些常用的方法。以與它們的基本原理和適用圍,并用 MATLAB 程序進(jìn)行仿真。第 3 章介紹了幾種圖像邊緣檢測的方法,包括微分算子法、LOG 算子法、Canny 算子法等,并用 MATLAB 程序進(jìn)行仿真。11 / 36第 4 章介紹了 MATLAB 與 GUI 設(shè)計,包括 GUI 設(shè)計的一些基本原理。第 5 章本文整體工作地一個總結(jié)。同時,還對整個研究工作中的不足和對未來的工作做了分析

55、和展望。2 2 圖像銳化圖像銳化2.12.1 微分法微分法圖像模糊的實質(zhì)就是圖像受到平均或積分運算,因而用它的逆運算“微分” ,求出信號的變化率,有加強高頻分量的作用,可以使圖像輪廓清晰。在數(shù)字圖像處理中,微分運算由差分運算來近似實現(xiàn)。一階微分定義如下: (2.1)y, x(f)y, 1x(fxf (2.2)y, x(f) 1y, x(fyf二階微分定義如下: (2.3)y, x(f2)y, 1x(f)y, 1x(fxf22 (2.4)y, x(f2) 1y, x(f) 1y, x(fyf22為了能增強任何方向的邊緣,希望微分運算使各向同性的(旋轉(zhuǎn)不變性)??梢宰C明,偏導(dǎo)數(shù)的平方和運算具有各向

56、同性,梯度幅度和拉普拉斯運算符合上述條件。2.1.12.1.1 梯度法(梯度法(GradieutGradieut)在點處的梯度為)y, x(f)y, x(2.5)yfxf)y, x(fGT梯度幅度定義為(用差分代替微分)22)xf()xf()y, x(f G(2.6)yfxf梯度方向角為 (2.7)GGarctan()y, x(xy(1) 水平垂直差分法水平垂直),(jif), 1(jif) 1,(jif) 1, 1(jif圖 2.1 水平垂直差分法示意圖公式 (2.8) j , 1i (f) j , i (f) 1j , i (f) j , i (f)y, x(fG(2) 交叉差分法(Rob

57、ert 梯度法),(jif) 1,(jif), 1(jif) 1, 1(jif圖 2.2 交叉差分法示意圖公式 (2.9) j , 1i (f) 1j , i (f) 1j , 1i (f) j , i (f)y, x(fG該方法中存在的問題:無法處理最后一行和最后一列。解決方法:用前一行或前一列梯度值來代替。 (2.10)y, x(f G)y, x(g上面的兩種梯度計算方法都是 2 2 鄰域進(jìn)行的,領(lǐng)域中心不好確定。為此,通常在 33 鄰域計算像素的梯度,使用中心差分來計算兩個偏導(dǎo)數(shù),即 (2.11)2) 1j , i (f) 1j , i (fG2) j , 1i (f) j , 1i (

58、fGyx13 / 36由于圖像可能含有噪聲,且邊緣可能以任意角度通過像素陣列3,因此 Prewitt 算子通過計算 3 3 鄰域三行的中心差分的均值來估計水平梯度,以三列的中心差分的均值來估計垂直梯度。由于引入了平均因素,使得它對噪聲有一定的抑制作用。常用的梯度算子見表 2.1,它們都是用差分方法對微分的近似處理,兩個模板 H1 和H2 分別對應(yīng)和。將兩個模板與圖像的卷積結(jié)果組合起來可得到一幅梯度圖,根據(jù)xGyG需要可生成不同的梯度增強圖像。第一種是使各點的灰度等于該點的梯度幅值;第二種是設(shè)置一個梯度閾值,使高于閾值的像素顯示其梯度值或用一種灰度來來顯示,低于閾值的像素顯示其原來的灰度或用另一

59、種灰度來顯示,以便研究圖像邊緣。邊緣檢測將在第 3 章中討論。表 2.1 常用的梯度算子算子名稱模板 H1模板 H2特 點Roberts01101001各向同性;對噪聲敏感;模板尺寸為偶數(shù),中心位置不明顯Prewitt101101101111000111引入了平均因素,對噪聲有抑制作用;操作簡便Sobel101202101121000121引入了平均因素,增強了最近像素的影響,噪聲抑制效果比Prewitt 要好Krisch533503533555303333噪聲抑制作用較好;需求出 8個方向的響應(yīng)(這里只給出 2 個方向的模板)Isotropic Sobel101202101121000121

60、權(quán)值反比于鄰點與中心點的距離,檢測沿不同方向邊緣時梯度幅度一致,即具有各向同性2.1.22.1.2 SobelSobel 算法算法),(jif), 1(jif) 1, 1(jif) 1,(jif) 1, 1(jif) 1,(jif) 1, 1(jif), 1(jif2) 1, 1(jif1122211圖 2.3 Sobel 算法示意圖公式(2.12)yxss)y, x(g其中:) 1j , 1i (f) j , 1i (f2) 1j , 1i (f) 1j , 1i (f) j , 1i (f2) 1j , 1i (fsx) 1j , 1i (f) 1j , i (f2) 1j , 1i (f

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論