數(shù)字圖像處理基礎(chǔ)課件_第1頁(yè)
數(shù)字圖像處理基礎(chǔ)課件_第2頁(yè)
數(shù)字圖像處理基礎(chǔ)課件_第3頁(yè)
數(shù)字圖像處理基礎(chǔ)課件_第4頁(yè)
數(shù)字圖像處理基礎(chǔ)課件_第5頁(yè)
已閱讀5頁(yè),還剩93頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 數(shù)字圖像處理基礎(chǔ) 2.1 圖像數(shù)字化技術(shù) 2.2 數(shù)字圖像類型 2.3 圖像文件格式 2.4 色度學(xué)基礎(chǔ)與顏色模型 2.1 圖像數(shù)字化技術(shù) 圖像處理的方法有模擬式和數(shù)字式兩種。由于數(shù)字計(jì)算技術(shù)的迅猛發(fā)展,數(shù)字圖像處理技術(shù)得到了廣泛的應(yīng)用。我們?nèi)粘I钪幸?jiàn)到的圖像一般是連續(xù)形式的模擬圖像,所以數(shù)字圖像處理的一個(gè)先決條件就是將連續(xù)圖像離散化,轉(zhuǎn)換為數(shù)字圖像。 圖像的數(shù)字化包括采樣和量化兩個(gè)過(guò)程。 設(shè)連續(xù)圖像f(x, y)經(jīng)數(shù)字化后,可以用一個(gè)離散量組成的矩陣g (i, j)(即二維數(shù)組)來(lái)表示。 (2-1) 矩陣中的每一個(gè)元素稱為像元、像素或圖像元素。而g (i, j)代表(i, j)點(diǎn)的

2、灰度值,即亮度值。以上數(shù)字化有以下幾點(diǎn)說(shuō)明: (1) 由于g (i, j)代表該點(diǎn)圖像的光強(qiáng)度,而光是能量的一種形式,故g (i, j)必須大于零,且為有限值,即: 0g (i, j)。 (2) 數(shù)字化采樣一般是按正方形點(diǎn)陣取樣的, 除此之外還有三角形點(diǎn)陣、正六角形點(diǎn)陣取樣。如圖2-1所示。 (3) 以上是用g (i, j)的數(shù)值來(lái)表示(i, j)位置點(diǎn)上灰度級(jí)值的大小,即只反映了黑白灰度的關(guān)系, 如果是一幅彩色圖像, 各點(diǎn)的數(shù)值還應(yīng)當(dāng)反映色彩的變化,可用g (i, j, )表示,其中是波長(zhǎng)。如果圖像是運(yùn)動(dòng)的,還應(yīng)是時(shí)間t的函數(shù),即可表示為g (i, j, , t)。 圖2-1 采樣網(wǎng)格 (a

3、) 正方形網(wǎng)格; (b) 正六角形網(wǎng)格 2.1.1 采樣 圖像在空間上的離散化稱為采樣。也就是用空間上部分點(diǎn)的灰度值代表圖像,這些點(diǎn)稱為采樣點(diǎn)。由于圖像是一種二維分布的信息,為了對(duì)它進(jìn)行采樣操作,需要先將二維信號(hào)變?yōu)橐痪S信號(hào),再對(duì)一維信號(hào)完成采樣。具體做法是,先沿垂直方向按一定間隔從上到下順序地沿水平方向直線掃描,取出各水平線上灰度值的一維掃描。而后再對(duì)一維掃描線信號(hào)按一定間隔采樣得到離散信號(hào),即先沿垂直方向采樣, 再沿水平方向采樣這兩個(gè)步驟完成采樣操作。對(duì)于運(yùn)動(dòng)圖像(即時(shí)間域上的連續(xù)圖像),需先在時(shí)間軸上采樣,再沿垂直方向采樣,最后沿水平方向采樣由這三個(gè)步驟完成。 對(duì)一幅圖像采樣時(shí),若每行(

4、即橫向)像素為M個(gè),每列(即縱向)像素為N個(gè),則圖像大小為MN個(gè)像素。 在進(jìn)行采樣時(shí),采樣點(diǎn)間隔的選取是一個(gè)非常重要的問(wèn)題, 它決定了采樣后圖像的質(zhì)量,即忠實(shí)于原圖像的程度。采樣間隔的大小選取要依據(jù)原圖像中包含的細(xì)微濃淡變化來(lái)決定。一般, 圖像中細(xì)節(jié)越多,采樣間隔應(yīng)越小。根據(jù)一維采樣定理,若一維信號(hào)g(t)的最大頻率為, 以T1/2為間隔進(jìn)行采樣,則能夠根據(jù)采樣結(jié)果g(iT) (i=, -1, 0, 1, )完全恢復(fù)g(t), 即 式中 圖2-2 采樣示意圖 2.1.2 量化 模擬圖像經(jīng)過(guò)采樣后,在時(shí)間和空間上離散化為像素。但采樣所得的像素值(即灰度值)仍是連續(xù)量。把采樣后所得的各像素的灰度值

5、從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化。圖2-3(a)說(shuō)明了量化過(guò)程。若連續(xù)灰度值用z來(lái)表示,對(duì)于滿足zizzi+1的z值,都量化為整數(shù)qi。qi稱為像素的灰度值,z與qi的差稱為量化誤差。一般,像素值量化后用一個(gè)字節(jié)8 bit來(lái)表示。如圖2-3(b)所示,把由黑灰白的連續(xù)變化的灰度值, 量化為0255共256級(jí)灰度值,灰度值的范圍為0255,表示亮度從深到淺, 對(duì)應(yīng)圖像中的顏色為從黑到白。 圖2-3 量化示意圖(a) 量化; (b) 量化為8 bit 連續(xù)灰度值量化為灰度級(jí)的方法有兩種,一種是等間隔量化, 另一種是非等間隔量化。等間隔量化就是簡(jiǎn)單地把采樣值的灰度范圍等間隔地分割并進(jìn)行量化。

6、對(duì)于像素灰度值在黑白范圍較均勻分布的圖像,這種量化方法可以得到較小的量化誤差。該方法也稱為均勻量化或線性量化。為了減小量化誤差,引入了非均勻量化的方法。非均勻量化是依據(jù)一幅圖像具體的灰度值分布的概率密度函數(shù),按總的量化誤差最小的原則來(lái)進(jìn)行量化。具體做法是對(duì)圖像中像素灰度值頻繁出現(xiàn)的灰度值范圍,量化間隔取小一些,而對(duì)那些像素灰度值極少出現(xiàn)的范圍,則量化間隔取大一些。由于圖像灰度值的概率分布密度函數(shù)因圖像不同而異, 所以不可能找到一個(gè)適用于各種不同圖像的最佳非等間隔量化方案。因此, 實(shí)用上一般都采用等間隔量化。 2.1.3 采樣與量化參數(shù)的選擇 一幅圖像在采樣時(shí),行、列的采樣點(diǎn)與量化時(shí)每個(gè)像素量化

7、的級(jí)數(shù),既影響數(shù)字圖像的質(zhì)量,也影響到該數(shù)字圖像數(shù)據(jù)量的大小。假定圖像取MN個(gè)樣點(diǎn),每個(gè)像素量化后的灰度二進(jìn)制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k, 則存儲(chǔ)一幅數(shù)字圖像所需的二進(jìn)制位數(shù)b為 (2-2)字節(jié)數(shù)B為 (2-3) 對(duì)一幅圖像,當(dāng)量化級(jí)數(shù)Q一定時(shí),采樣點(diǎn)數(shù)MN對(duì)圖像質(zhì)量有著顯著的影響。如圖2-4所示,采樣點(diǎn)數(shù)越多,圖像質(zhì)量越好; 當(dāng)采樣點(diǎn)數(shù)減少時(shí),圖上的塊狀效應(yīng)就逐漸明顯。同理, 當(dāng)圖像的采樣點(diǎn)數(shù)一定時(shí),采用不同量化級(jí)數(shù)的圖像質(zhì)量也不一樣。如圖2-5所示,量化級(jí)數(shù)越多,圖像質(zhì)量越好,當(dāng)量化級(jí)數(shù)越少時(shí),圖像質(zhì)量越差,量化級(jí)數(shù)最小的極端情況就是二值圖像, 圖像出現(xiàn)假輪廓。 圖2-

8、4 不同采樣點(diǎn)數(shù)對(duì)圖像質(zhì)量的影響(a)原始圖像(256256);(b)采樣圖像1(128128);(c) 采樣圖像2(6464); (d)采樣圖像3(3232); (e)采樣圖像4(1616);(f) 采樣圖像5(88) 圖2-5 不同量化級(jí)別對(duì)圖像質(zhì)量的影響(a) 原始圖像(256色); (b) 量化圖像1(64色); (c) 量化圖像2(32色); (d) 量化圖像3(16色); (e) 量化圖像4(4色); (f) 量化圖像5(2色) 一般,當(dāng)限定數(shù)字圖像的大小時(shí), 為了得到質(zhì)量較好的圖像可采用如下原則: (1) 對(duì)緩變的圖像, 應(yīng)該細(xì)量化, 粗采樣, 以避免假輪廓。 (2) 對(duì)細(xì)節(jié)豐富

9、的圖像, 應(yīng)細(xì)采樣, 粗量化, 以避免模糊(混疊)。 對(duì)于彩色圖像,是按照顏色成分紅(R)、綠(G)、藍(lán)(B)分別采樣和量化的。若各種顏色成分均按8 bit量化,即每種顏色量級(jí)別是256, 則可以處理256256256=16 777 216種顏色。 2.1.4 圖像數(shù)字化設(shè)備 將模擬圖像數(shù)字化成為數(shù)字圖像,需要某種圖像數(shù)字化設(shè)備。常見(jiàn)的數(shù)字化設(shè)備有數(shù)字相機(jī)、掃描儀、數(shù)字化儀等。 1. 圖像數(shù)字化設(shè)備的組成 如前所述,采樣和量化是數(shù)字化一幅圖像的兩個(gè)基本過(guò)程。即把圖像劃分為若干圖像元素(像素)并給出它們的地址(采樣); 度量每一像素的灰度, 并把連續(xù)的度量結(jié)果量化為整數(shù)(量化);最后將這些整數(shù)結(jié)

10、果寫入存儲(chǔ)設(shè)備。為完成這些功能, 圖像數(shù)字化設(shè)備必須包含以下五個(gè)部分: (1) 采樣孔(Sampling aperture): 使數(shù)字化設(shè)備能夠單獨(dú)地觀測(cè)特定的圖像元素而不受圖像其他部分的影響。 (2) 圖像掃描機(jī)構(gòu): 使采樣孔按照預(yù)先確定的方式在圖像上移動(dòng),從而按順序觀測(cè)每一個(gè)像素。 (3) 光傳感器: 通過(guò)采樣檢測(cè)圖像的每一像素的亮度, 通常采用CCD陣列。 (4) 量化器:將傳感器輸出的連續(xù)量轉(zhuǎn)化為整數(shù)值。典型的量化器是A/D轉(zhuǎn)換電路,它產(chǎn)生一個(gè)與輸入電壓或電流成比例的數(shù)值。 (5) 輸出存儲(chǔ)裝置:將量化器產(chǎn)生的灰度值按適當(dāng)格式存儲(chǔ)起來(lái),以用于計(jì)算機(jī)后續(xù)處理。 2. 圖像數(shù)字化設(shè)備的性能

11、 雖然各種數(shù)字化設(shè)備的組成不相同,但可從如下幾個(gè)方面對(duì)其性能進(jìn)行比較。 1) 像素大小 采樣孔的大小和相鄰像素的間距是兩個(gè)重要的性能指標(biāo)。如果數(shù)字化設(shè)備是在一個(gè)放大率可變的光學(xué)系統(tǒng)上,那么對(duì)應(yīng)于輸入圖像平面上的采樣點(diǎn)大小和采樣間距也是可變的。 2) 圖像大小 圖像大小即數(shù)字化設(shè)備所允許的最大輸入圖像的尺寸。 3) 線性度 對(duì)光強(qiáng)進(jìn)行數(shù)字化時(shí),灰度正比于圖像亮度的實(shí)際精確程度是一個(gè)重要的指標(biāo)。非線性的數(shù)字化設(shè)備會(huì)影響后續(xù)過(guò)程的有效性。能將圖像量化為多少級(jí)灰度也是非常重要的參數(shù)。圖像的量化精度經(jīng)歷了早期的黑白二值圖像、灰度圖像及現(xiàn)在的彩色及真彩色圖像。當(dāng)然,量化精度越高,存儲(chǔ)像素信息需要的字節(jié)數(shù)也

12、越大。 4) 噪聲 數(shù)字化設(shè)備的噪聲水平也是一個(gè)重要的性能參數(shù)。例如, 數(shù)字化一幅灰度值恒定的圖像,雖然輸入亮度是一個(gè)常量,但是數(shù)字化設(shè)備中固有的噪聲卻會(huì)使圖像的灰度發(fā)生變化。因此數(shù)字化設(shè)備所產(chǎn)生的噪聲是圖像質(zhì)量下降的根源之一,應(yīng)當(dāng)使噪聲小于圖像內(nèi)的反差點(diǎn)(即對(duì)比度)。 2.2 數(shù)字圖像類型 為了方便地處理數(shù)字圖像,根據(jù)數(shù)字圖像的特性將其分成不同的類型。靜態(tài)圖像可分為矢量圖(Vector) 和位圖(Bitmap), 位圖也稱為柵格圖像。 矢量圖是用一系列繪圖指令來(lái)表示一幅圖,如AutoCAD中的繪圖語(yǔ)句。這種方法的本質(zhì)是用數(shù)學(xué)(更準(zhǔn)確地說(shuō)是幾何學(xué))公式描述一幅圖像。圖像中每一個(gè)形狀都是一個(gè)完整

13、的公式,稱為一個(gè)對(duì)象。對(duì)象是一個(gè)封閉的整體,所以定義圖像上對(duì)象的變化和對(duì)象與其他對(duì)象的關(guān)系對(duì)計(jì)算機(jī)來(lái)說(shuō)是簡(jiǎn)單的, 所有這些變化都不會(huì)影響到圖像中的其他對(duì)象。 公式化表示圖像使得矢量圖具有兩個(gè)優(yōu)點(diǎn):一是它的文件數(shù)據(jù)量很?。欢菆D像質(zhì)量與分辨率無(wú)關(guān),這意味著無(wú)論將圖像放大或縮小了多少次,圖像總是以顯示設(shè)備允許的最大清晰度顯示。在計(jì)算機(jī)計(jì)算與顯示一幅圖像時(shí),也往往能看到畫圖的過(guò)程。但是,矢量圖有一個(gè)明顯的缺點(diǎn),就是不易制作色調(diào)豐富或色彩變化太多的圖像,而且繪出來(lái)的圖像不是很逼真,同時(shí)也不易在不同的軟件間交換文件。在Corel Draw和Adobe Illustrator中生成的圖像均為矢量圖 位圖是

14、通過(guò)許多像素點(diǎn)表示一幅圖像,每個(gè)像素具有顏色屬性和位置屬性。位圖可以從傳統(tǒng)的相片、幻燈片上制作出來(lái)或使用數(shù)字相機(jī)得到, 也可以利用Windows的畫筆(Painbrush)用顏色點(diǎn)填充網(wǎng)格單元來(lái)創(chuàng)建位圖。位圖又可以分成如下四種: 線畫稿LineArt)、灰度圖像(GrayScale)、索引顏色圖像(Index Color)和真彩色圖像(True Color)。 2.2.1 位圖 1. 線畫稿 線畫稿只有黑白兩種顏色,這種形式通常也稱為“黑白藝術(shù)”、 “位圖藝術(shù)”、 “一位元藝術(shù)”。用掃描儀掃描圖像,當(dāng)設(shè)置成LineArt格式時(shí), 掃描儀以一位顏色模式來(lái)看待圖像。若樣點(diǎn)顏色為黑,則掃描儀將相應(yīng)的

15、像素位元置為0, 否則置為1。線畫稿適合于由黑白兩色構(gòu)成而沒(méi)有灰度陰影的圖像。圖2-6所示是一幅線畫稿圖。 圖2-6 線畫稿圖 2. 灰度圖像 在灰度圖像中,像素灰度級(jí)用8 bit表示,所以每個(gè)像素都是介于黑色和白色之間的256(28=256)種灰度中的一種。灰度圖像只有灰度顏色而沒(méi)有彩色。我們通常所說(shuō)的黑白照片,其實(shí)包含了黑白之間的所有灰度色調(diào)。從技術(shù)上來(lái)說(shuō),就是具有從黑到白的256種灰度色域(Gamut)的單色圖像。 3 . 索引圖像 在介紹索引圖像之前,我們首先了解PC機(jī)是如何處理顏色的。大多數(shù)掃描儀都是以24位模式對(duì)圖像進(jìn)行采樣,即可以從圖像中采樣出1670萬(wàn)種不同的顏色。用這種方式獲

16、得的顏色通常稱為RGB顏色。顏色深度為每像素24位的數(shù)字圖像是目前所能獲取、瀏覽和保存的顏色信息最豐富的彩色圖像,由于它所表達(dá)的顏色遠(yuǎn)遠(yuǎn)超出了人眼所能辨別的范圍,故將其稱為“真彩色”。在真彩色出現(xiàn)之前, 由于技術(shù)上的原因,計(jì)算機(jī)在處理時(shí)并沒(méi)有達(dá)到每像素24位的真彩色水平,為此人們創(chuàng)造了索引顏色。索引顏色通常也稱為映射顏色, 在這種模式下,顏色都是預(yù)先定義的,并且可供選用的一組顏色也很有限, 索引顏色的圖像最多只能顯示256種顏色。一幅索引顏色圖像在圖像文件里定義,當(dāng)打開(kāi)該文件時(shí),構(gòu)成該圖像具體顏色的索引值就被讀入程序里,然后根據(jù)索引值找到最終的顏色。 4. 真彩色圖像 真彩色圖像將像素的色彩能

17、力推向了頂峰。“真彩色”是RGB顏色的另一種流行的叫法。從技術(shù)角度考慮, 真彩色是指寫到磁盤上的圖像類型, 而RGB顏色是指顯示器的顯示模式。RGB圖像的顏色是非映射的,它可以從系統(tǒng)的“顏色表”里自由獲取所需的顏色,這種圖像文件里的顏色直接與PC機(jī)上的顯示顏色相對(duì)應(yīng)。在真彩色圖像中,每一個(gè)像素由紅、綠和藍(lán)三個(gè)字節(jié)組成, 每個(gè)字節(jié)為8 bit,表示0到255之間的不同的亮度值,這三個(gè)字節(jié)組合可以產(chǎn)生1670萬(wàn)種不同的顏色。 顏色紅色成分綠色成分藍(lán)色成分黑000白255255255紅 25500綠02550藍(lán)00255青0255255紫2550255黃2552550灰128128128橄欖1281

18、280深青0128128銀192192192常用顏色的RGB組合2.2.2 位圖的有關(guān)術(shù)語(yǔ) 1. 像素(Pixel)、點(diǎn)(Dot)和樣點(diǎn)(Sample) 在計(jì)算機(jī)中,圖像是由顯示器上許多光點(diǎn)組成的, 將顯示在顯示器上的這些點(diǎn)(光的單元)稱為像素。像素的分割有不同的方法, 實(shí)際常用正方形網(wǎng)格點(diǎn)陣分割方案,這是因?yàn)槠湎袼鼐W(wǎng)格點(diǎn)陣規(guī)范,易于在圖像輸入、輸出設(shè)備上實(shí)現(xiàn)。在計(jì)算機(jī)圖像處理中,還常用到點(diǎn)和樣點(diǎn)這些術(shù)語(yǔ)。像素、 點(diǎn)和樣點(diǎn)是在計(jì)算機(jī)上對(duì)不同階段的圖像進(jìn)行度量的稱謂,這幾個(gè)術(shù)語(yǔ)很容易混淆, 故特一一做介紹。 首先說(shuō)明樣點(diǎn)和點(diǎn)的概念。掃描一幅圖像時(shí),需設(shè)置掃描儀的分辨率(Resolution),

19、分辨率決定了掃描儀從源圖像里每英寸取多少個(gè)樣點(diǎn)。掃描儀將源圖像看成由大量的網(wǎng)格組成,然后在每一個(gè)網(wǎng)格里取出一點(diǎn),用該點(diǎn)的顏色值來(lái)代表這一網(wǎng)格里所有點(diǎn)的顏色值,這些被選中的點(diǎn)就是樣點(diǎn)。掃描儀的分辨率單位為dpi(每英寸點(diǎn)數(shù)),但激光打印機(jī)的dpi與掃描儀的dpi(樣點(diǎn))是不同的。實(shí)際上,以150 dpi分辨率掃描的圖像,它的效果相當(dāng)于激光打印機(jī)的1200 dpi的效果。 像素并不像“克”和“厘米”那樣是絕對(duì)的度量單位,而是可大可小的。如果獲取圖像時(shí)的分辨率較低(如50 dpi),則顯示該圖像時(shí),每英寸所顯示的像素個(gè)數(shù)也很少,這樣就會(huì)使像素變得較大。 2. 分辨率 1) 圖像分辨率 圖像分辨率是指

20、每英寸圖像含有多少個(gè)點(diǎn)或像素, 分辨率的單位為dpi。例如,250 dpi表示的就是該圖像每英寸含有250個(gè)點(diǎn)或像素。在數(shù)字圖像中,分辨率的大小直接影響到圖像的質(zhì)量。分辨率越高,圖像細(xì)節(jié)越清晰,但產(chǎn)生的文件尺寸大,同時(shí)處理的時(shí)間也就越長(zhǎng),對(duì)設(shè)備的要求也就越高。所以在制作圖像時(shí)要根據(jù)需要來(lái)選擇分辨率。另外,圖像的尺寸、圖像的分辨率和圖像文件的大小三者之間有著密切的聯(lián)系。圖像的尺寸越大,圖像的分辨率越高,圖像文件也就越大。所以, 調(diào)整圖像的大小和分辨率即可改變圖像文件的大小。 2) 屏幕分辨率 顯示器上每單位長(zhǎng)度顯示的像素或點(diǎn)的數(shù)量稱為屏幕分辨率。通常以每英寸點(diǎn)數(shù)(dpi)來(lái)表示。屏幕分辨率取決于

21、顯示器的大小及其像素設(shè)置。屏幕分辨率由計(jì)算機(jī)的顯示卡決定,標(biāo)準(zhǔn)的VGA顯示卡的分辨率是640480,即水平方向640點(diǎn)(像素), 垂直方向480點(diǎn)(像素)。現(xiàn)在高性能的顯示卡已支持12801024點(diǎn)以上的分辨率。 3) 打印機(jī)分辨率 打印機(jī)分辨率又稱輸出分辨率,是指打印機(jī)輸出圖像時(shí)每英寸的點(diǎn)數(shù)(dpi)。打印機(jī)分辨率也決定了輸出圖像的質(zhì)量,打印機(jī)分辨率越高, 可以減少打印的鋸齒邊緣,在灰度的半色調(diào)表現(xiàn)上也會(huì)較為平滑。打印機(jī)的分辨率可達(dá)300 dpi,甚至720 dpi(需用特殊紙張);而較老機(jī)型的激光打印機(jī)分辨率通常在300360 dpi之間,由于超微細(xì)碳粉技術(shù)的成熟,新的激光打印機(jī)的分辨率可

22、達(dá)6001200 dpi,作為專業(yè)排版輸出已經(jīng)綽綽有余了。 4) 掃描儀分辨率 掃描儀分辨率的表示方法與打印機(jī)相類似,一般也用dpi表示, 不過(guò)這里的點(diǎn)是樣點(diǎn),與打印機(jī)的輸出點(diǎn)是不同的。一般掃描儀提供的方式是水平分辨率要比垂直分辨率高。臺(tái)式掃描儀的分辨率可以分為光學(xué)分辨率和輸出分辨率。光學(xué)分辨率是指掃描儀硬件所真正掃描到的圖像分辨率,目前市場(chǎng)上的產(chǎn)品,其光學(xué)分辨率可達(dá)8001200 dpi以上。輸出分辨率是通過(guò)軟件強(qiáng)化以及內(nèi)插補(bǔ)點(diǎn)之后產(chǎn)生的分辨率,大約為光學(xué)分辨率的34倍。所以當(dāng)你見(jiàn)到號(hào)稱分辨率高達(dá)4800 dpi或6400 dpi的掃描儀時(shí), 這一定指的是輸出分辨率。 2.3 圖像文件格式

23、數(shù)字圖像有多種存儲(chǔ)格式,每種格式一般由不同的開(kāi)發(fā)商支持。隨著信息技術(shù)的發(fā)展和圖像應(yīng)用領(lǐng)域的不斷拓寬,還會(huì)出現(xiàn)新的圖像格式。因此,要進(jìn)行圖像處理,必須了解圖像文件的格式, 即圖像文件的數(shù)據(jù)構(gòu)成。每一種圖像文件均有一個(gè)文件頭, 在文件頭之后才是圖像數(shù)據(jù)。文件頭的內(nèi)容由制作該圖像文件的公司決定,一般包括文件類型、文件制作者、制作時(shí)間、版本號(hào)、 文件大小等內(nèi)容。各種圖像文件的制作還涉及到圖像文件的壓縮方式和存儲(chǔ)效率等。下面介紹幾種常見(jiàn)的圖像文件格式。 2.3.1 BMP圖像文件格式 BMP文件格式是Windows操作系統(tǒng)的標(biāo)準(zhǔn)文件格式 第一部分為位圖文件頭BITMAPFILEHEADER, 它是一個(gè)結(jié)

24、構(gòu)體,其定義如下: typedef struct tagBITMAPFILEHEADER WORD bfType; DWORDbfSize; WORDbfReserved1; WORDbfReserved2; DWORDbfOffBits; BITMAPFILEHEADER; 這個(gè)結(jié)構(gòu)的長(zhǎng)度是固定的,為14個(gè)字節(jié)(WORD為無(wú)符號(hào)16位二進(jìn)制整數(shù),DWORD為無(wú)符號(hào)32位二進(jìn)制整數(shù))。 第二部分為位圖信息頭BITMAPINFOHEADER,也是一個(gè)結(jié)構(gòu),其定義如下:typedef struct tagBITMAPINFOHEADER DWORD biSize; LONGbiWidth; LON

25、GbiHeight; WORDbiPlanes; WORDbiBitCount; DWORDbiCompression; DWORDbiSizeImage; LONGbiXPelsPerMeter; LONGbiYPelsPerMeter; DWORDbiClrUsed; DWORDbiClrImportant; BITMAPINFOHEADER; 這個(gè)結(jié)構(gòu)的長(zhǎng)度是固定的,為40個(gè)字節(jié)(LONG為32位二進(jìn)制整數(shù))。其中,biCompression的有效值為BI_RGB、 BI_RLE8、 BI_RLE4、BI_BITFIELDS,這都是一些Windows定義好的常量。由于RLE4和RLE8的

26、壓縮格式用的不多,今后僅討論biCompression的有效值為BI_RGB,即不壓縮的情況。 第三部分為調(diào)色板(Palette),當(dāng)然,這里是對(duì)那些需要調(diào)色板的位圖文件而言的。真彩色圖像是不需要調(diào)色板的, BITMAPINFOHEADER后直接是位圖數(shù)據(jù)。調(diào)色板實(shí)際上是一個(gè)數(shù)組, 共有biClrUsed個(gè)元素(如果該值為零,則有2的biBitCount次方個(gè)元素)。數(shù)組中每個(gè)元素的類型是一個(gè)RGBQUAD結(jié)構(gòu), 占4個(gè)字節(jié),其定義如下: typedef struct tagRGBQUAD BYTE rgbBlue; /該顏色的藍(lán)色分量 BYTE rgbGreen;/該顏色的綠色分量 BYTE

27、 rgbRed;/該顏色的紅色分量 BYTE rgbReserved;/保留值 RGBQUAD; 第四部分就是實(shí)際的圖像數(shù)據(jù)。對(duì)于用到調(diào)色板的位圖, 圖像數(shù)據(jù)就是該像素顏色在調(diào)色板中的索引值,對(duì)于真彩色圖像, 圖像數(shù)據(jù)就是實(shí)際的R、 G、 B值。下面就2色、 16色、256色和真彩色位圖分別介紹。 對(duì)于2色位圖,用1位就可以表示該像素的顏色(一般0表示黑, 1表示白),所以一個(gè)字節(jié)可以表示8個(gè)像素。 對(duì)于16色位圖,用4位可以表示一個(gè)像素的顏色,所以一個(gè)字節(jié)可以表示2個(gè)像素。 對(duì)于256色位圖,一個(gè)字節(jié)剛好可以表示1個(gè)像素。 下面兩點(diǎn)注意: (1) 每一行的字節(jié)數(shù)必須是4的整數(shù)倍,如果不是,則

28、需要補(bǔ)齊。這在前面介紹biSizeImage時(shí)已經(jīng)提到過(guò)。 (2) BMP文件的數(shù)據(jù)存放是從下到上,從左到右的。也就是說(shuō), 從文件中最先讀到的是圖像最下面一行的左邊第一個(gè)像素, 然后是左邊第二個(gè)像素, 接下來(lái)是倒數(shù)第二行左邊第一個(gè)像素, 左邊第二個(gè)像素。依次類推, 最后得到的是最上面一行的最右邊的一個(gè)像素。 DIB(Device Independent Bitmap)圖像格式是設(shè)備無(wú)關(guān)位圖文件,描述圖像的能力基本與BMP相同,并且能運(yùn)行于多種硬件平臺(tái),只是文件較大。 一、WINDOWS BMP文件規(guī)定每行像素字節(jié)數(shù)必須是4的倍數(shù),否則在像素?cái)?shù)據(jù)后加若干字節(jié)(0),湊足4的倍數(shù)。二、24位文件的

29、圖像數(shù)據(jù)中也是按BLUE、GREEN、RED的順序來(lái)排的。三、BMP文件的原點(diǎn)在左下角。四、24位色圖像中沒(méi)有調(diào)色板數(shù)據(jù)部分。城市麗景2.25M BMP格式 24位位圖 2002.1.30.0:002.3.2 JPEG圖像格式 JPEG(Joint Photographers Experts Group)格式即聯(lián)合圖像專家組, 是由ISO和CCITT為靜態(tài)圖像所建立的第一個(gè)國(guó)際數(shù)字圖像壓縮標(biāo)準(zhǔn),主要是為了解決專業(yè)攝影師所遇到的圖像信息過(guò)于龐大的問(wèn)題。由于JPEG的高壓縮比和良好的圖像質(zhì)量, 使得它廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中。JPEG和GIF成為HTML語(yǔ)法選用的圖像格式。 JPEG 格式支持

30、 24 位顏色,并保留照片和其他連續(xù)色調(diào)圖像中存在的亮度和色相的顯著和細(xì)微的變化。JPEG一般基于DCT變換的順序型模式壓縮圖像。JPEG 通過(guò)有選擇地減少數(shù)據(jù)來(lái)壓縮文件大小,因?yàn)樗鼤?huì)棄用數(shù)據(jù),故 JPEG 壓縮為有損壓縮。較高品質(zhì)設(shè)置導(dǎo)致棄用的數(shù)據(jù)較少,但是 JPEG 壓縮方法會(huì)降低圖像中細(xì)節(jié)的清晰度, 尤其是包含文字或矢量圖形的圖像。 靜止圖像壓縮采用有損編碼方式是一種變換編碼對(duì)高頻、低頻信號(hào)區(qū)別對(duì)待JPEG文件格式的特點(diǎn)JPEG文件的標(biāo)記用以區(qū)分和識(shí)別圖像數(shù)據(jù)及其相關(guān)信息 每個(gè)標(biāo)記都是由2個(gè)字節(jié)組成,其前一個(gè)字節(jié)是固定值0 xFF JPEG文件的組織( 8個(gè)部分)圖像開(kāi)始SOI(Star

31、t of Image)標(biāo)記 APP0標(biāo)記(Marker) JPEG文件的組織(2)(3) APPn標(biāo)記(Markers),其中n=115(任選) APPn長(zhǎng)度詳細(xì)信息(4) 一個(gè)或者多個(gè)量化表DQT量化表長(zhǎng)度(quantization table length)量化表數(shù)目(quantization table number)量化表(quantization table) JPEG文件的組織(3)(5) 幀圖像開(kāi)始SOF0(Start of Frame) JPEG文件的組織(4)(6) 一個(gè)或者多個(gè)霍夫曼表DHT霍夫曼表的長(zhǎng)度(Huffman table length)類型、AC或者DC(Typ

32、e, AC or DC)索引(Index)位表(bits table)值表(value table)JPEG文件的組織(5)(7) 掃描開(kāi)始SOS(Start of Scan) 掃描開(kāi)始長(zhǎng)度(start of scan length)顏色分量數(shù)(number of color components)每個(gè)顏色分量ID交流系數(shù)表號(hào) (AC table #)直流系數(shù)表號(hào) (DC table #)壓縮圖像數(shù)據(jù) (Compress image data) (8) 圖像結(jié)束EOI(End of Image) JPEG文件結(jié)構(gòu)JPG比BMP小但不丟信息2305K300K1.239K2305KTIFF 標(biāo)記圖

33、像文件格式TIFF (Tag Image File Format), 它是現(xiàn)存圖像文件格式中最復(fù)雜的一種,它提供存儲(chǔ)各種信息的完備的手段, 可以存儲(chǔ)專門的信息而不違反格式宗旨,是目前流行的圖像文件交換標(biāo)準(zhǔn)之一。TIF格式文件的設(shè)計(jì)考慮了擴(kuò)展性、 方便性和可修改性,因此非常復(fù)雜,要求用更多的代碼來(lái)控制它,結(jié)果導(dǎo)致文件讀寫速度慢, TIF代碼也很長(zhǎng)。TIF文件由文件頭、參數(shù)指針表與參數(shù)域、參數(shù)數(shù)據(jù)表和圖像數(shù)據(jù)4部分組成。如表2-2表2-4所示。 2.3.3 TIFF文件格式 (TIF)1) 文件頭 表2-2 TIF文件文件頭結(jié)構(gòu) 2) 參數(shù)指針 表2-3 TIF文件參數(shù)指針表 由一個(gè)2字節(jié)的整數(shù)和

34、其后的一系列12字節(jié)參數(shù)域構(gòu)成,最后以一個(gè)長(zhǎng)整型數(shù)結(jié)束。若最后的長(zhǎng)整型數(shù)為0,表示文件的參數(shù)指針表到此為至,否則該長(zhǎng)整數(shù)為指向下一個(gè)參數(shù)指針表的偏移。 3) 參數(shù)塊結(jié)構(gòu) 表2-4 TIF文件參數(shù)塊結(jié)構(gòu) 2.34. GIF圖像文件格式 CompuServe開(kāi)發(fā)的圖形交換文件格式GIF(Graphics Interchange Format),目的是在不同的系統(tǒng)平臺(tái)上交流和傳輸圖像。它是在Web及其他聯(lián)機(jī)服務(wù)上常用的一種文件格式,用于超文本標(biāo)記語(yǔ)言(HTML)文檔中的索引顏色圖像, 但圖像最大不能超過(guò)64 M,顏色最多為256色。GIF圖像文件采取LZW壓縮算法, 存儲(chǔ)效率高,支持多幅圖像定序或覆

35、蓋,交錯(cuò)多屏幕繪圖以及文本覆蓋。GIF主要是為數(shù)據(jù)流而設(shè)計(jì)的一種傳輸格式,而不是作為文件的存儲(chǔ)格式。換句話說(shuō),它具有順序的組織形式。GIF有五個(gè)主要部分以固定順序出現(xiàn), 所有部分均由一個(gè)或多個(gè)塊(block)組成。每個(gè)塊第一個(gè)字節(jié)中存放標(biāo)識(shí)碼或特征碼標(biāo)識(shí)。這些部分的順序?yàn)椋何募?biāo)志塊、邏輯屏幕描述塊、 可選的“全局”色彩表塊(調(diào)色板)、 各圖像數(shù)據(jù)塊(或?qū)S玫膲K)以及尾塊(結(jié)束碼)。GIF圖像文件格式如表2-5所示。 2.35. PCX文件 PCX文件格式由ZSoft公司設(shè)計(jì), 最早使用的圖像文件格式之一, 由各種掃描儀掃描得到的圖像幾乎都能保存成PCX格式。PCX支持256種顏色,不如TAR

36、GA或TIF等格式功能強(qiáng),但結(jié)構(gòu)較簡(jiǎn)單,存取速度快,壓縮比適中,適合于一般軟件的使用。 PCX 格式常用于 IBM PC 兼容計(jì)算機(jī)。大多數(shù) PC 軟件支持 PCX 格式的第 5 版。第 3 版文件使用標(biāo)準(zhǔn)的 VGA調(diào)色板,不支持自定義調(diào)色板。 PCX 格式支持RGB、索引顏色、灰度和位圖顏色模式,但不支持 alpha 通道。PCX 支持 RLE 壓縮方法, 圖像顏色的位數(shù)可以是 1、 4、8 或 24。 PCX圖像文件由三個(gè)部分組成: 文件頭、 圖像數(shù)據(jù)和256色調(diào)色板。PCX的文件頭有128個(gè)字節(jié),它包括版本號(hào), 被打印或掃描的圖像的分辨率(dpi)及大小(單位為像素), 每掃描行的字節(jié)數(shù)

37、,每像素包含的位數(shù)據(jù)和彩色平面數(shù)。位圖數(shù)據(jù)用行程長(zhǎng)度壓縮算法記錄數(shù)據(jù)。 2.4 色度學(xué)基礎(chǔ)與顏色模型2.4.1 色度學(xué)基礎(chǔ) 在前面學(xué)習(xí)灰度圖像時(shí),圖像的像素值是光強(qiáng), 即二維空間變量的函數(shù)f(x, y)。如果把灰度值看成是二維空間變量和光譜變量的函數(shù)f(x, y, ),即多光譜圖像,也就是通常所說(shuō)的彩色圖像。在計(jì)算機(jī)上顯示一幅彩色圖像時(shí),每一個(gè)像素的顏色是通過(guò)三種基本顏色(即紅、綠、藍(lán))合成的,即最常見(jiàn)的RGB顏色模型。要理解顏色模型, 首先應(yīng)了解人的視覺(jué)系統(tǒng)。 眼球和視網(wǎng)膜結(jié)構(gòu)人類視覺(jué)系統(tǒng) 1 三色原理 在人的視覺(jué)系統(tǒng)中存在著桿狀細(xì)胞和錐狀細(xì)胞兩種感光細(xì)胞。桿狀細(xì)胞為暗視器官,錐狀細(xì)胞是明視

38、器官,在照度足夠高時(shí)起作用, 并能分別辨顏色。錐狀細(xì)胞將電磁光譜的可見(jiàn)部分分為三個(gè)波段:紅、綠、藍(lán)。由于這個(gè)原因,這三種顏色被稱為三基色, 圖2-7表示了人類視覺(jué)系統(tǒng)三類錐狀細(xì)胞的光譜敏感曲線。 圖2-7 人類感光細(xì)胞的敏感曲線 根據(jù)人眼的結(jié)構(gòu),所有顏色都可看作是三種基本顏色R表示紅(Red)、 G表示綠(Green)和B表示藍(lán)(Blue)按照不同的比例組合而成。為了建立標(biāo)準(zhǔn),國(guó)際照度委員會(huì)(CIE)早在1931年就規(guī)定三種基本色的波長(zhǎng)分別為R:700 nm,G:546.1 nm,B: 435.8 nm。 前面已講過(guò),一幅彩色圖像的像素值可看作是光強(qiáng)和波長(zhǎng)的函數(shù)值f(x, y, ),但實(shí)際使用

39、時(shí),將其看作是一幅普通二維圖像, 且每個(gè)像素有紅、綠、藍(lán)三個(gè)灰度值會(huì)更直觀些。 2 顏色的三個(gè)屬性 顏色是外界光刺激作用于人的視覺(jué)器官而產(chǎn)生的主觀感覺(jué)。顏色分兩大類:非彩色和彩色。非彩色是指黑色、白色和介于這兩者之間深淺不同的灰色, 也稱為無(wú)色系列。彩色是指除了非彩色以外的各種顏色。顏色有三個(gè)基本屬性, 分別是色調(diào)、 飽和度和亮度。基于這三個(gè)基本屬性,提出了一種重要的顏色模型HSI(Hue、 Saturation、 Intensity)。在HSI顏色模型部分中, 我們將詳細(xì)介紹這三個(gè)基本屬性。 2.4.2 顏色模型 為了科學(xué)地定量描述和使用顏色,人們提出了各種顏色模型。目前常用的顏色模型按用途

40、可分為兩類,一類面向諸如視頻監(jiān)視器、 彩色攝像機(jī)或打印機(jī)之類的硬件設(shè)備。另一類面向以彩色處理為目的的應(yīng)用,如動(dòng)畫中的彩色圖形。面向硬件設(shè)備的最常用彩色模型是RGB模型,而面向彩色處理的最常用模型是HSI模型。另外,在印刷工業(yè)上和電視信號(hào)傳輸中,經(jīng)常使用CMYK和YUV色彩系統(tǒng)。 1. RGB模型 RGB模型用三維空間中的一個(gè)點(diǎn)來(lái)表示一種顏色,如圖2-8所示。每個(gè)點(diǎn)有三個(gè)分量,分別代表該點(diǎn)顏色的紅、綠、藍(lán)亮度值, 亮度值限定在0, 1。 在RGB模型立方體中,原點(diǎn)所對(duì)應(yīng)的顏色為黑色,它的三個(gè)分量值都為零。距離原點(diǎn)最遠(yuǎn)的頂點(diǎn)對(duì)應(yīng)的顏色為白色,它的三個(gè)分量值都為1。從黑到白的灰度值分布在這兩個(gè)點(diǎn)的連

41、線上, 該線稱為灰色線。立方體內(nèi)其余各點(diǎn)對(duì)應(yīng)不同的顏色。彩色立方體中有三個(gè)角對(duì)應(yīng)于三基色紅、綠、藍(lán)。剩下的三個(gè)角對(duì)應(yīng)于三基色的三個(gè)補(bǔ)色黃色、 青色(藍(lán)綠色)、品紅(紫色)。 圖2-8 RGB模型單位立方體 2. HSI模型 HSI模型是Munseu提出的, 它反映了人的視覺(jué)系統(tǒng)觀察彩色的方式,在藝術(shù)上經(jīng)常使用HSI模型。HSI模型中,H表示色調(diào)(Hue),S表示飽和度(Saturation), I表示亮度(Intensity,對(duì)應(yīng)成像亮度和圖像灰度)。這個(gè)模型的建立基于兩個(gè)重要的事實(shí): I分量與圖像的彩色信息無(wú)關(guān); H和S分量與人感受顏色的方式是緊密相聯(lián)的。這些特點(diǎn)使得HSI模型非常適合借助人的視覺(jué)系統(tǒng)來(lái)感知彩色特性的圖像處理算法。 圖2-9中的色相環(huán)描述了色相和飽和度兩個(gè)參數(shù)。色相由角度表示,它反映了該彩色最接近什么樣的光譜波長(zhǎng)。一般假定0表示的顏色為紅色, 120的為綠色, 240的為藍(lán)色

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論