版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第2章數(shù)字圖像處理的基本概念
2.1人眼的視覺原理
2.2連續(xù)圖像的描述
2.3圖像數(shù)字化
2.4圖像灰度直方圖
2.5數(shù)字圖像處理算法的形式
2.6圖像的數(shù)據(jù)結(jié)構(gòu)與圖像文件格式第2章數(shù)字圖像處理的基本概念2.7圖像的特征與噪聲
2.8上機實驗習題
本章主要介紹圖像信息的基本知識和專業(yè)術(shù)語、圖像與視覺之間的關(guān)系等,以便于從感性和直觀的角度來了解圖像。
由于計算機圖像處理的目的之一是幫助人更好地觀察和理解圖像中的信息,也就是說,最終要通過人眼來判斷所處理的結(jié)果,因此有必要首先研究人類視覺系統(tǒng)的特點。2.1人眼的視覺原理2.1.1人眼的構(gòu)造
人眼的主要構(gòu)造如圖2.1.1所示。視覺信號從眼睛的視網(wǎng)膜傳入大腦需要通過大約150萬個視覺神經(jīng)的神經(jīng)元。
人眼是一個平均半徑為20mm的球狀器官。它由三層薄膜包圍著,如圖2.1.1所示。
最外層是堅硬的蛋白質(zhì)膜,其中,位于前方的大約1/6部分為有彈性的透明組織,稱為角膜,光線從這里進入眼內(nèi)。其余5/6為白色不透明組織,稱為鞏膜,它的作用是鞏固和保護整個眼球。
圖2.1.1人眼的結(jié)構(gòu)示意圖
中間一層由虹膜和脈絡膜組成。虹膜的中間有一個圓孔,稱為瞳孔。它的大小可以由連接虹膜的環(huán)狀肌肉組織(睫狀肌)來調(diào)節(jié)(直徑大多為2~8mm),以控制進入眼睛內(nèi)部的光通量大小,其作用和照相機的光圈一樣。隨著種族的不同,虹膜也具有不同的顏色,如黑色、藍色、褐色等。最內(nèi)一層為視網(wǎng)膜,它的表面分布有大量光敏細胞。這些光敏細胞按照形狀可以分為錐狀細胞和桿狀細胞兩類。錐狀細胞集中分布在視軸和視網(wǎng)膜相交點附近的黃斑區(qū)內(nèi)。每個錐狀細胞都連接一個神經(jīng)末梢,因此,黃斑區(qū)對光有較高的分辨力,能充分識別圖像的細節(jié)。錐狀細胞既可以分辨光的強弱,也可以辨別色彩,白天的視覺過程主要靠錐體細胞來完成,所以錐狀視覺又稱白晝視覺。桿狀細胞數(shù)目更多,然而,由于它廣泛分布在整個視網(wǎng)膜表面上,并且有若干個桿狀細胞同時連接在一根神經(jīng)上,因此,這條神經(jīng)只能感受多個桿狀細胞的平均光刺激,使得在這些區(qū)域的視覺分辨力顯著下降,所以無法辨別圖像中的細微差別,而只能感知視野中景物的總的形象。桿狀細胞不能感覺彩色,但它對低照明度的景物往往比較敏感,所以夜晚所觀察到的景物只有黑白、濃淡之分,而看不清它們的顏色差別。由于夜晚的視覺過程主要由桿狀細胞完成,所以桿狀視覺又稱夜視覺。
除了三層薄膜以外,在瞳孔后面還有一個扁球形的透明體,稱為晶體(或稱水晶體)。它由許多同心的纖維細胞層組成,由叫做睫狀小帶的肌肉支撐著。晶體如同一個可變焦距的透鏡,它的曲率可以由睫狀肌的收縮進行調(diào)節(jié),而睫狀肌根據(jù)錐狀細胞感受到景物的聚焦情況改變其張力,從而使景像始終能聚焦于黃斑區(qū)。
角膜和晶體包圍的空間稱為前室,前室內(nèi)是對可見光透明的水狀液體,它能吸收一部分紫外線。晶體后面是后室,后室內(nèi)充滿的膠質(zhì)透明體稱為玻璃體,它起著保護眼睛的濾光作用。2.1.2圖像的形成
人眼在觀察景物時,光線通過角膜、前室水狀液、水晶體、后室玻璃體,成像在視網(wǎng)膜的黃斑區(qū)周圍。視網(wǎng)膜上的光敏細胞感受到強弱不同的光刺激,產(chǎn)生強度不同的電脈沖,并經(jīng)神經(jīng)纖維傳送到視神經(jīng)小樞,由于不同位置的光敏細胞產(chǎn)生了和該處光的強弱成比例的電脈沖,所以,大腦中閾緯閃艘環(huán)拔锏母芯。2.1.3視覺范圍和分辨力
視覺范圍是指人眼所能感覺到的亮度范圍。這一范圍非常寬,從百分之幾坎每平方米到幾百萬坎每平方米(坎[德拉],發(fā)光強度的單位,符號為cd)。但是,人眼并不能同時感受這樣寬的亮度范圍。事實上,在人眼適應了某一個平均的亮度環(huán)境以后,它所能感受的亮度范圍要小很多。當平均亮度適中時,能分辨的亮度上、下限之比為1000∶1;而當平均亮度較低時,該比值只有10∶1。即使是客觀上相同的亮度,當平均亮度不同時,主觀感覺的亮度也不相同。人眼的明暗感覺是相對的,但由于人眼能適應的平均亮度范圍很寬,所以總的視覺范圍很寬。
人眼的分辨力是指人眼在一定距離上能區(qū)分開相鄰兩點的能力,如圖2.1.2所示,可以用能區(qū)分開的最小視角q的倒數(shù)來描述,
(2.1.1)
式中,d表示能區(qū)分的兩點間的最小距離,l為眼睛和這兩點連線的垂直距離。人眼的分辨力和環(huán)境照度有關(guān)。當照度太低時,只有桿狀細胞起作用,則分辨力下降;但照度太高也無助于分辨力的提高,因為可能引起“眩目”現(xiàn)象。
人眼分辨力還和被觀察對象的相對對比度相關(guān)。當相對對比度小時,對象和背景亮度很接近,因此分辨力下降。圖2.1.2人眼分辨力的計算2.1.4視覺適應性和對比靈敏度
當我們從明亮的陽光下走入正在放映電影的影院時,會感到一片漆黑,但過一會兒后,視覺便會逐漸恢復。人眼這種適應暗環(huán)境的能力稱為暗適應性,通常這個適應過程約需30s。人眼之所以有暗適應性,一方面是由于瞳孔放大的緣故,更重要的是因為完成視覺過程的視敏細胞發(fā)生了變換,由桿狀細胞代替錐狀細胞工作。由于前者的視敏度約為后者的10000倍,所以,對于微弱的光刺激又恢復了感覺。
和暗適應性相比,亮適應性過程要快得多,通常只需幾秒鐘。例如,當在黑暗中突然打開電燈時,人的視覺幾乎馬上就可以恢復。這是因為錐狀細胞恢復工作所需的時間要比桿狀細胞少得多。
為了針對圖像的總體來描述亮度的差異,引入對比度和相對對比度的概念。圖像對比度是圖像中最大亮度Bmax與最小亮度Bmin之比,即
(2.1.2)
它表示圖像最大亮度對最小亮度的倍數(shù)。
相對對比度是圖像中最大亮度Bmax與最小亮度Bmin之差與Bmin之比,即
(2.1.3)2.1.5亮度感覺
人眼對亮度差別的感覺取決于相對亮度的變化,于是,亮度感覺的變化DS可用相對亮度來描述,即
(2.1.4)
經(jīng)積分后得到的亮度感覺為
S=K'lnB+K0 (2.1.5)
式中,K'為常數(shù)。該式表明亮度感覺與亮度B的自然對數(shù)成線性關(guān)系。
圖2.1.3表示主觀亮度感覺與亮度的關(guān)系曲線,實線表示人眼能感覺的亮度范圍,為10-4~106cd/m2。但當眼睛已適應某一平均亮度時,其可感覺的亮度范圍很窄,如圖2.1.3中虛線所示。
圖2.1.3人眼的主觀亮度感覺與亮度的關(guān)系由此可見,人眼在適應某一平均亮度時,黑、白感覺對應的亮度范圍較小,隨著平均亮度的降低,黑白感覺的亮度范圍變窄。黑、白亮度感覺的相對性為圖像傳輸與重現(xiàn)帶來了方便,這體現(xiàn)在以下兩個方面:
(1)重現(xiàn)圖像的亮度不必等于實際圖像的亮度,只要保持兩者的對比度不變,就能給人以真實的感覺;
(2)人眼不能感覺出來的亮度差別在重現(xiàn)圖像時不必精確地復制出來。2.1.6人眼的色覺
正常人的眼睛不僅能夠感受光線的強弱,而且還能辨別不同的顏色。通過理論研究和實驗結(jié)果,人們現(xiàn)在對顏色的物理本質(zhì)已有了相當?shù)恼莆蘸屠斫?。顏色的本質(zhì)是牛頓最早系統(tǒng)研究并發(fā)現(xiàn)的。早在17世紀,牛頓通過用三棱鏡研究對白光的折射就已發(fā)現(xiàn)白光可被分解成一系列從紫到紅的連續(xù)光譜,從而證明白光是由不同顏色(而且這些顏色并不能再進一步被分解)的光線混合而成的。這些不同的顏色的光線實際上是不同頻率的電磁波。人的腦和眼將不同頻率的電磁波感知為不同的顏色。
人辨別顏色的能力叫色覺,它是指視網(wǎng)膜對不同波長光的感受特性,即在一般自然光線下分辨各種不同顏色的能力。這主要是黃斑區(qū)中的錐體感光細胞的功勞,它非常靈敏,只要可見光波長相差3~5nm,人眼即可分辨。
顏色和彩色嚴格來說并不等同。顏色可分為無彩色和有彩色兩大類。無彩色是指白色、黑色和各種深淺程度不同的灰色。以白色為一端,通過一系列從淺到深排列的各種灰色,到達另一端的黑色,這些可以組成一個黑白系列。彩色則指除去上述黑白系列以外的各種顏色。我們通常所說的顏色一般指彩色。
區(qū)分顏色常用3種基本特性量:色調(diào)(色別)、輝度(亮度)和飽和度(色彩度)。色調(diào)是與混合光譜中主要光波長相聯(lián)系的。輝度與物體的反射率成正比,如果無彩色,輝度就只有1個維量的變化。對彩色光來說,顏色中摻入白色越多就越明亮,摻入黑色越多輝度就越小。飽和度與一定色調(diào)的純度有關(guān),純光譜色是完全飽和的。隨著白光的加入,飽和度逐漸減少。
色調(diào)和飽和度合起來稱為色度。顏色可用亮度和色度共同表示。設組成某種顏色C所需的3個刺激量分別用X、Y、Z表示,而每種刺激量的比例系數(shù)為x、y、z,則有
C=xX+yY+zZ
比例系數(shù)x、y、z也稱為色系數(shù):
(2.1.6)
(2.1.7)
(2.1.8)
由這些式子可以看出:
x+y+z=1 (2.1.9)
1931年CIE制定了一個色度圖(見圖2.1.4,圖中波長單位是nm),用組成某種顏色的三原色的比例來規(guī)定這種顏色。圖中橫軸對應紅色色系數(shù),縱軸對應綠色色系數(shù),藍色色系數(shù)可由z=1-(x+y)求得。圖中各點給出光譜中各顏色的色度坐標,藍紫色在圖的左下部,綠色在圖的左上部,紅色在圖的右下部。連接400nm和700nm的直線是光譜上所沒有的由紫到紅的系列。通過對該圖的觀察分析可知:
(1)在色度圖中每點都對應一種可見的顏色,任何可見的顏色都在色度圖中占據(jù)確定的位置。在以(0,0),(0,1),(1,0)為頂點的三角形內(nèi)且色度圖外的點對應不可見的顏色。
(2)在色度圖中邊界上的點代表純顏色,移向中心代表混合的白光增加而純度減少。到中心點C處,各種光譜能量相等而顯為白色,此處純度為0。某種顏色的純度一般稱為該顏色的飽和度。
(3)在色度圖中連接任2端點的直線上的各點表示將這2端點所代表的顏色相加可組成的一種顏色。根據(jù)這個方法,如果要確定由3個給定顏色所組合成的顏色范圍,只需將這3種顏色對應的3個點連成三角形,見圖2.1.4。在該三角形中的任意顏色都可由這3種顏色組成,而在該三角形外的顏色則不能由這3色組成。由于給定3個固定顏色而得到的三角形并不能包含色度圖中所有的顏色,所以只用(單波長)三基色并不能組合得到所有顏色。
圖2.1.4色度圖圖2.1.4所示為色度圖中一些點的顏色。中心的C點對應白色,由三原色各1/3組合產(chǎn)生。圖2.1.4中P點的色度坐標x=0.48,y=0.40。由C通過P畫一條直線至邊界上的Q點(約590nm),P點顏色的主波長即為590nm,此處光譜的顏色即為Q點的色調(diào)(橙色)。圖2.1.4中P點位于從C到純橙色點的66%的地方,所以它的色純度(飽和度)是66%。
正常人色覺光譜的范圍為400nm(紫色)~760nm(紅色),其間大約可以區(qū)別出16個色調(diào)。紅、綠、藍三種光以不同比例混合,就可形成不同的顏色,從而產(chǎn)生各種色覺。
色覺正常的人在明亮條件下能看到可見光譜的各種顏色,它們從長波一端向短波一端的順序是:紅色、橙色、黃色、綠色、藍色、紫色。此外,人眼還能在上述任兩個相鄰顏色范圍的過渡區(qū)域看到各種中間顏色。
物體的顏色是人的視覺器官受光后在大腦的一種反映。物體的顏色取決于物體對各種波長光線的吸收、反射和透射能力。因此,物體分消色物體和有色物體。
1)消色物體的色
消色物體指黑、白、灰色物體,它對照明光線具有非選擇性吸收的特性,即光線照射到消色物體上時,被吸收的各種波長的入射光是等量的;被反射或透射的光線,其光譜成分也與入射光的光譜成分相同。當白光照射到消色物體上時,反射率在75%以上,即呈白色;反射率在10%以下,即呈黑色;反射率介于兩者之間,就呈深淺不同的灰色。
2)有色物體的色
有色物體對照明光線具有選擇性吸收的特性,即光線照射到有色物體上時,入射光中各種波長的色光是不等量地被吸收的,有的被吸收得多,有的被吸收得少。白光照射到有色物體上,其反射或透射的光線與入射光線相比,不僅亮度有所減弱,光譜成分也改變了,因而呈現(xiàn)出各種不同的顏色。
3)光源的光譜成分對物體顏色的影響
當有色光照射到消色物體時,物體反射光顏色與入射光顏色相同。當兩種以上有色光同時照射到消色物體上時,物體顏色呈加色法效應,如紅光和綠光同時照射白色物體,該物體就呈黃色。加色法原理如圖2.1.5(a)所示,它是利用原色(紅、綠、藍)相加獲得彩色影像的方法。
當有色光照射到有色物體上時,物體的顏色呈減色法效應。如黃色物體在品紅光照射下呈現(xiàn)紅色,在青色光照射下呈現(xiàn)綠色,在藍色光照射下呈現(xiàn)灰色或黑色。減色法原理如圖2.1.5(b)所示,它是利用白光中減去補色(黃、品、青)以獲取彩色影像的方法。
圖2.1.5色混合原理2.1.7顏色模型
為了正確地使用顏色,需要建立顏色模型。上面提到,一種顏色可用3個基本量來描述,所以建立顏色模型就是建立一個3D坐標系統(tǒng),其中每個空間點都代表某一種顏色。
目前常用的顏色模型可分為兩類,一類面向諸如彩色顯示器或打印機之類的硬件設備,另一類面向以彩色處理為目的的應用,如動畫中的彩色圖形。面向硬件設備的最常用彩色模型是RGB模型,而面向彩色處理的最常用模型是HSI模型,其中H表示色調(diào)(hue),S表示飽和度(saturation)
,I表示密度(intensity,對應成像亮度和圖像灰度)。這兩種顏色模型也是圖像技術(shù)中最常見的模型。下面分別討論。
1.RGB模型
RGB模型基于笛卡爾坐標系統(tǒng),3個軸分別為R,G,B,見圖2.1.6。我們感興趣的部分是個正方體。原點對應黑色,離原點最近的頂點對應白色。在這個模型中,從黑到白的灰度值分布在原點到離原點最遠頂點的連線上,而立方體內(nèi)其余各點對應不同的顏色,可用從原點到該點的矢量表示。為方便起見,我們將立方體歸一化為單位立方體,這樣所有的R,G,B的值都在區(qū)間[0,1]中。
圖2.1.6RGB模型
根據(jù)這個模型,每幅彩圖包括3個獨立的基色平面,或者說可分解到3個平面上。反過來,如果1幅圖像可被表示為3個平面,則使用這個模型比較方便。例如在處理多頻譜的衛(wèi)星遙感圖像時常用RGB模型。
2.HSI模型
HSI模型有兩個特點,或者說基于兩個重要的事實:其一,I分量與圖像的彩色信息無關(guān);其二,H和S分量與人感受顏色的方式是緊密相連的。這些特點使得HSI模型非常適合借助人的視覺系統(tǒng)來感知彩色特性的圖像處理算法。順便指出,還有一種與HSI模型概念上相近但定義不完全相同的HVC模型,其中H仍表示色度,V(value)對應亮度,而C(chroma)表示色品,它也是比較適合于借助人的視覺系統(tǒng)來感知彩色特性的圖像處理算法。
前面討論色度圖時已經(jīng)提到過,由三種顏色組合成的新顏色處在以這3種顏色為頂點的三角形中。HSI模型中顏色分量也可定義在如圖2.1.7(a)所示的三角形中。對其中的任意1個色點P,其H的值對應指向給點的矢量與R軸的夾角。這個點的S值與指向該點的矢量長成正比,越長越飽和。在這個模型中,I的值是沿1根通過三角形中心并垂直于三角形平面的直線來測量的。從紙面出來越多越白,進入紙面越多越黑。
如果我們把3種顏色結(jié)合到3D顏色空間,則得到如圖2.1.7(b)所示的雙棱錐結(jié)構(gòu)。該結(jié)構(gòu)外表面上的點代表純的飽和色。任一點的顏色的H均由三角形中點到該點的連線與R軸的夾角決定。該點的I可用與最下方黑點的距離來表示。該結(jié)構(gòu)內(nèi)部的點也可借助對圖2.1.7(a)的解釋,所不同的只是其S值隨該點與縱軸距離的減少而減少。
在HSI模型中,也可通過向其中1個軸投影而得到一系列2D彩圖。
圖2.1.7HSI模型
3.從RGB轉(zhuǎn)換到HSI
對任何3個在[0,1]范圍內(nèi)的R,G,B值,其對應HSI模型中的I,S,H分量可由下面的公式計算:
(2.1.10)
(2.1.11)
(2.1.12)
由式(2.1.12)直接算出的H值在[0°,180°]區(qū)間內(nèi),對應G≥B的情況。當G<B時,H的值應該大于180°
。此時可令H=360°-H,把H轉(zhuǎn)到[180°,360°]區(qū)間內(nèi)。若將兩種情況都考慮上,則由式(2.3.7)算得的是H在[0°,360°]區(qū)間內(nèi)。為把在[0°,360°]之間的H變換到[0,1]之間,可再令H'=H/360°,然后進行轉(zhuǎn)換。當S=0時對應的是無色的中心點,這時H就沒有意義了,此時定義H為0。當I=0時,S也就沒有意義了。
4.從HSI轉(zhuǎn)換到RGB
若設S,I的值在[0,1]之間,R,G,B的值也在[0,1]之間,則從HSI到RGB的轉(zhuǎn)換公式如下(分成3段以利用對稱性):
(1)當H在[0°,120°]之間時:
B=I(1-S) (2.1.13)
(2.1.14)
G=3I-(B+R) (2.1.15)
(2)當H在[120°,240°]之間時:
R=I(1-S) (2.1.16)
(2.1.17)
B=3I-(R+G) (2.1.18)
(3)當H在[240°,360°]之間時:
G=I(1-S) (2.1.19)
(2.1.20)
R=3I-(G+B) (2.1.21)
一幅“真”彩色RGB數(shù)字圖像一般用24bit,即R,G,B3個分量各用8bit表示。這樣用24bit可表示的顏色總數(shù)為16777216種。如果將其轉(zhuǎn)換到其他色彩空間,也常保持總比特數(shù)不變。2.1.8馬赫帶
當亮度為階躍變化時,圖像中顯示出豎條灰度梯級圖像,如圖2.1.8所示。已知從每一豎條寬度內(nèi)反射出來的光強是均勻的,相鄰豎條之間的強度差是常數(shù),但看起來卻發(fā)現(xiàn)每一豎條內(nèi)左邊要比右邊稍亮一些,這種現(xiàn)象稱為馬赫帶效應。
馬赫帶上的亮度過沖是眼睛對不同空間頻率產(chǎn)生不同視覺響應的結(jié)果。視覺系統(tǒng)對空間高頻和空間低頻的敏感性較差,而對空間中頻則有較高的敏感性,因而在亮度突變處產(chǎn)生亮度過沖現(xiàn)象,這種過沖對人眼所見的景物有增強其輪廓的作用。
圖2.1.8馬赫帶效應
一幅圖像可以被看做是空間上各點光強度的集合。它隨圖像空間坐標(x,y,z)、光線的波長l和時間t的變化而變化。其數(shù)學表達式為
g=f(x,y,z,l,t) (2.2.1)
對于二維平面圖像而言,其表示為
g=f(x,y,l,t) (2.2.2)2.2連續(xù)圖像的描述1.灰度圖像
若只考慮光的能量而不考慮其波長,則圖像在視覺上表現(xiàn)為灰色影像,稱之為灰度圖像或單色圖像,其圖像函數(shù)為
(2.2.3)
式中Vs(l)為相對視敏函數(shù)。
2.彩色圖像
若考慮不同波長光的彩色效應,則圖像在視覺上表現(xiàn)為彩色圖像,其圖像函數(shù)為
g={fr(x,y,t),fg(x,y,t),fb(x,y,t)}
(2.2.4)
式中,
Rs(l)、Gs(l)、Bs(l)分別為紅、綠、藍三原色的視敏函數(shù)。
3.靜止圖像
圖像內(nèi)容隨時間變化的圖像稱為運動圖像,而圖像內(nèi)容不隨時間變化的圖像則稱為靜止圖像。靜止圖像是本書重點研究的對象,一般用f(x,y)表示。因為光是能量的一種形式,故f(x,y)大于零,即0<f(x,y)<∞。
在每天的視覺活動中,人眼看到的圖像一般都是由物體反射的光組成的。f(x,y)可被看成由兩個分量組成:一個分量是所見場景的入射光量,另一個分量是場景中物體反射光量的能力,即反射率。這兩個分量被稱為照射分量和反射分量,分別用i(x,y)和r(x,y)表示,則i(x,y)和r(x,y)之積形成f(x,y),即
f(x,y)=i(x,y)·r(x,y) (2.2.5)
式中,0<i(x,y)<∞,0<r(x,y)<1。
反射分量在極限0(全吸收)和1(全反射)之間。i(x,y)的性質(zhì)由光源確定,而r(x,y)則由場景中物體的特性而定。
圖像f(x,y)在(x,y)處的強度稱為該點的灰度(l),l的范圍為
Lmin≤l≤Lmax
(2.2.6)
在理論上,對Lmin的唯一要求是它必須為正,對Lmax的要求是它必須有限。[Lmin,Lmax]叫做灰度范圍。通常把這一范圍在數(shù)軸上平移到[0,L],其中L=Lmax-Lmin,l=0表示黑,l=L表示白,所有中間值都是由黑連續(xù)變?yōu)榘讜r的灰度值。
圖像數(shù)字化是將一幅畫面轉(zhuǎn)化成計算機能處理的形式(數(shù)字圖像)的過程。具體來說,就是在成像過程中把一幅圖畫分割成如圖2.3.1所示的一個個小區(qū)域(像元或像素),并將各小區(qū)域的灰度用整數(shù)來表示,這樣便形成一幅數(shù)字圖像。小區(qū)域的位置和灰度稱為像素的屬性。2.3圖像數(shù)字化
圖2.3.1圖像數(shù)字化從計算機科學的角度來看,所謂數(shù)字圖像可以理解為對二維函數(shù)f(x,y)進行采樣和量化(即離散處理)后得到的圖像,因此,通常用二維矩陣來表示一幅數(shù)字圖像。數(shù)字圖像可以由以下三種途徑得到:
(1)將傳統(tǒng)的可見光圖像經(jīng)過數(shù)字化處理轉(zhuǎn)換為數(shù)字圖像,例如將一幅照片通過掃描儀輸入到計算機中,掃描的過程實質(zhì)上就是一個數(shù)字化的過程。
(2)應用各種光電轉(zhuǎn)換設備直接得到數(shù)字圖像,例如衛(wèi)星上搭載的推帚式掃描儀和光機掃描儀可以直接獲取地表甚至地下物體的圖像并實時存入存儲器中。此外,側(cè)視雷達也可以直接獲取數(shù)字圖像。
(3)直接由二維離散數(shù)學函數(shù)生成數(shù)字圖像。
數(shù)字圖像處理是指對一個物體的數(shù)字表示,即對一個二維矩陣施加一系列操作,以得到所期望的結(jié)果。2.3.1采樣
將空間上連續(xù)的圖像變換成離散點的操作稱為采樣。采樣間隔和采樣孔徑的大小是兩個很重要的參數(shù)。
圖像包含何種程度的細微的濃淡變化,取決于希望真實反映圖像的程度。當進行實際的抽樣時,怎樣選擇各抽樣點的間隔是個非常重要的問題。關(guān)于這一點,嚴格地說,是一個根據(jù)抽樣定理加以討論的問題。如果把包含于一維信號g(s)中的頻率限制在v以下,那么根據(jù)下式,用間距T=1/(2v)進行采樣的抽樣值g(iT)就能夠完全恢復g(t):
(2.3.1)
式中,
在抽樣時,若橫向的像素數(shù)(列數(shù))為M,縱向的像素數(shù)(行數(shù))為N,則圖像的總像素數(shù)為M×N。
采樣孔徑的形狀和大小與采樣方式有關(guān)。采樣孔徑通常有圓形、正方形、長方形和橢圓形四種,如圖2.3.2所示。在實際使用時,由于受到光學系統(tǒng)特性的影響,采樣孔徑會在一定程度上產(chǎn)生畸變,使其邊緣出現(xiàn)模糊,降低了輸入圖像信噪比。
采樣方式是指采樣間隔確定后,相鄰像素間的位置關(guān)系。通常有有縫、無縫和重疊采樣三種情況,如圖2.3.3所示。
圖2.3.2采樣孔徑圖2.3.3采樣方式2.3.2量化
經(jīng)采樣后圖像被分割成空間上離散的像素,但其灰度是連續(xù)的,還不能用計算機進行處理。將像素灰度轉(zhuǎn)換成離散的整數(shù)值的過程叫量化。一幅數(shù)字圖像中不同灰度值的個數(shù)稱為灰度級數(shù),用G表示。若一幅數(shù)字圖像的量化灰度級數(shù)G=256=28級,則像素灰度取值范圍一般是0~255的整數(shù),由于用8bit就能表示灰度圖像像素的灰度值,因此常稱8bit量化。
數(shù)字化前需要決定影像大小(行數(shù)M、列數(shù)N)和灰度級數(shù)G的取值。一般數(shù)字圖像的灰度級數(shù)G為2的整數(shù)冪,即G=2g。一幅大小為M×N、灰度級數(shù)為G的圖像所需的存儲空間M×N×g(bit)稱為圖像的數(shù)據(jù)量。2.3.3采樣、量化參數(shù)與數(shù)字化圖像間的關(guān)系
數(shù)字化方式可分為均勻采樣、量化和非均勻采樣、量化。所謂“均勻”,指的是采樣和量化為等間隔的。圖像數(shù)字化一般采用均勻采樣和均勻量化方式。采用非均勻采樣與量化會使問題復雜化,因此很少采用。
一般來說,采樣間隔越大,所得圖像像素數(shù)越少,圖像空間分辨率越低,質(zhì)量越差,嚴重時會出現(xiàn)像素呈塊狀的國際棋盤效應;采樣間隔越小,所得圖像像素數(shù)越多,圖像空間分辨率越高,質(zhì)量越好,但數(shù)據(jù)量越大,如圖2.3.4所示。圖2.3.4(a)~(f)是采樣間距時遞增獲得的圖像,其中圖2.3.4(a)為512×512,256級灰度的圖像,其余各圖的空間分辨率依次為256×256,128×128,64×64,32×32,16×16。
圖2.3.4隨像素數(shù)減少產(chǎn)生的數(shù)字圖像效果量化等級越多,所得圖像層次越豐富,灰度分辨率越高,質(zhì)量越好,但數(shù)據(jù)量越大;而量化等級少,圖像層次欠豐富,灰度分辨率低,質(zhì)量變差,會出現(xiàn)假輪廓現(xiàn)象,但數(shù)據(jù)量較小,如圖2.3.5所示。圖2.3.5(a)~(f)是在采樣間距相同時灰度級數(shù)從256逐次減少為64、16、8、2所得到的圖像。在極少數(shù)情況下,當圖像大小固定時,減少灰度級能改善質(zhì)量,產(chǎn)生這種情況的最可能原因是減少灰度級一般會提高圖像的對比度。例如對于細節(jié)比較豐富的復雜圖像。
圖2.3.5隨量化級數(shù)減少產(chǎn)生的數(shù)字圖像效果
在數(shù)字圖像處理中,一個最簡單的和有用的工具是灰度直方圖,它概括了一幅圖像的灰度級內(nèi)容和圖像可觀的信息。
2.4.1直方圖的定義與性質(zhì)
1.直方圖的定義
灰度直方圖(histogram)是灰度級的函數(shù),描述的是圖像中具有該灰度級的像素的個數(shù),其橫坐標是灰度級,縱坐標是該灰度出現(xiàn)的頻率(像素的個數(shù))。2.4圖像灰度直方圖
圖像的灰度統(tǒng)計直方圖是1個一維的離散函數(shù):
(2.4.1)
式中,fk為圖像f(x,y)的第k級灰度值,nk是圖像f(x,y)中具有灰度值fk的像素的個數(shù),n是圖像的像素總數(shù)。
2.直方圖的計算
依據(jù)定義,若圖像具有L(通常L=256,即8位灰度級)級灰度,則大小為M×N的灰度圖像f(x,y)的灰度直方圖hist[0,…,L-1]可用如下計算獲得:
(1)初始化:
hist[k]=0k=0,…,L-1
(2)統(tǒng)計:
hist[f(x,y)]++x=0,…,M-1;y=0,…,N-1
(3)標準化:
圖2.4.1所示為一架落在雪地里的飛機圖像和它對應的灰度直方圖實例。
圖2.4.1圖像及其灰度直方圖
圖2.4.2不同類型的直方圖示例圖2.4.2給出由相同場景獲得不同圖像所對應的直方圖,圖2.4.2(a)對應正常的圖像;圖2.4.2(b)對應動態(tài)范圍偏小的圖像;圖2.4.2(c)對應動態(tài)范圍比較大,但其直方圖與圖2.4.2(a)的直方圖相比整體向左移動的圖像,對應偏暗的圖像;圖2.4.2(d)對應動態(tài)范圍比較大,但其直方圖與圖2.4.2(a)的直方圖相比整體向右移動的圖像,對應偏亮的圖像。2.4.2直方圖的性質(zhì)
根據(jù)前面直方圖的定義,可以得出其性質(zhì)主要有以下幾點:
(1)直方圖是一幅圖像各像素灰度值出現(xiàn)次數(shù)或頻數(shù)的統(tǒng)計結(jié)果,它只反映該圖像中不同灰度值出現(xiàn)的頻率,而未反映某一灰度值像素所在的位置。也就是說,它只包含了該圖像中某一灰度值的像素出現(xiàn)的概率,而丟失了其所在位置的信息。
(2)任一幅圖像,都能唯一地算出一幅與它對應的直方圖。但不同的圖像可能有相同的直方圖。也就是說,圖像與直方圖之間是一種多對一的映射關(guān)系。例如,圖2.4.3(a)和圖2.4.3(b)所示為兩幅不同的圖像,但它們對應的直方圖卻相同。
圖2.4.3兩幅具有相同直方圖的不同圖像
(3)由于直方圖是對共有相同灰度值的像素統(tǒng)計計數(shù)得到的,因此,一幅圖像各子區(qū)的直方圖之和就等于該圖全圖的直方圖。
例如一幅圖像如圖2.4.4(a)所示,它由兩個不相交的區(qū)域構(gòu)成,則整幅圖像的直方圖是這兩個區(qū)域直方圖之和,即
圖像的直方圖H(i)
=區(qū)域Ⅰ的直方圖HⅠ(i)+區(qū)域Ⅱ的直方圖HⅡ(i)
圖2.4.4直方圖的分解
(4)若一幅圖像包含的灰度均勻一致,且背景與物體對比度很強,假設物體的邊界為由灰度級D1定義的輪廓線,則 就等于物體的面積。
一幅500×546像素的圖像如圖2.4.5所示。直方圖左側(cè)峰值的灰度級為33,從灰度54級到255級的
約占圖像總面積500×546=273000的60%。
圖2.4.5背景與物體對比度很強的圖像2.4.3直方圖的應用
直方圖常應用于以下幾個方面。
1.檢查數(shù)字化參數(shù)
直方圖給出了一個簡單可見的指示,用來判斷一幅圖像是否合理地利用了全部被允許的灰度級范圍。如果圖像具有超出數(shù)字化器所能處理的范圍的亮度,則這些灰度級將被簡單地置為0或255,由此將在直方圖的一端或兩端產(chǎn)生尖峰。對直方圖的快速檢查可以使數(shù)字化中產(chǎn)生的問題及早暴露出來,以便糾正。
2.選擇邊界閾值
假定一幅圖像背景是淺色的,其中有一個深色的物體。物體中的深色像素產(chǎn)生了直方圖上的左峰,而背景中大量的灰度級產(chǎn)生了直方圖上的右峰。物體邊界附近具有兩個峰值之間灰度級的像素數(shù)目相對較少,從而產(chǎn)生了兩峰之間的谷。選擇谷作為灰度閾值將得到合理的物體的邊界。
從某種意義上講,用對應于兩峰之間的最低點的灰度級作為閾值來確定邊界是最適宜的。例如,想知道圖2.4.6(a)所示蕨葉圖像的面積占總畫面面積的情況,就可以利用直方圖計算獲得。顯然,如果閾值對應于直方圖的谷,則閾值從T增加到T+DT,只會導致面積略微變化。因此可以把閾值的選擇誤差對面積測量的影響降到最低。當灰度級從115變化到144時,像素為1850,占圖像總面積的1%。因此把閾值選取為130,此時樹葉的面積約占總面積的28.87%。
圖2.4.6圖像直方圖邊界閾值的應用
3.計算綜合光密度
綜合光密度是圖像質(zhì)量一個很有用的度量,利用直方圖可直接算出綜合光密度值。若用IOD表示綜合光密度,用D(x,y)表示圖像的灰度分布,則綜合光密度為
(2.4.2)
其中,a和b是所劃定的圖像區(qū)域的邊界。
對于數(shù)字圖像,有
(2.4.3)
其中,NL和NS分別是圖像行和列的數(shù)目。令Nk代表灰度級為k時所對應的像素的個數(shù),則上式可改寫為
(2.4.4)
觀察發(fā)現(xiàn),Nk正好等于直方圖中的H(k),因此有
(2.4.5)
即綜合光密度是用廣度級加權(quán)的直方圖之和。
4.計算圖像信息量H(熵)
假設一幅數(shù)字圖像的灰度范圍為[0,L-1],各灰度級像素出現(xiàn)的概率為P0,P1,P2,…,PL-1,根據(jù)信息論可知,各灰度級像素具有的信息量分別為-lbP0,-lbP1,-lbP2,…,-lbPL-1,則該幅圖像的平均信息量(熵)為
(2.4.6)
熵反映了圖像信息的豐富程度,它在圖像編碼處理中有重要意義。
2.5.1基本功能形式
按圖像處理的輸出形式,圖像處理的基本功能可分為三種形式:
(1)單幅圖像→單幅圖像,如圖2.5.1(a)所示;
(2)多幅圖像→單幅圖像,如圖2.5.1(b)所示;
(3)單(或多)幅圖像→數(shù)字或符號等,如圖2.5.1(c)所示。2.5數(shù)字圖像處理算法的形式
圖2.5.1圖像處理的基本功能2.5.2圖像處理的幾種具體算法
1.局部處理
對于任一像素(i,j),把其周圍像素構(gòu)成的集合{(i+p,j+q),p、q取適當?shù)恼麛?shù)}叫做像素(i,j)的鄰域,如圖2.5.2(a)所示。常用的去心鄰域如圖2.5.2(b)和(c)所示,分別表示中心像素的4-鄰域、8-鄰域。
在對輸入圖像進行處理時,計算某一輸出像素JP(i,j)值由輸入圖像像素IP(i,j)小鄰域的像素值確定,這種處理稱為局部處理。
圖2.5.2像素的鄰域
圖像的移動平均平滑法和空間域銳化等屬于局部處理。
在局部處理中,當輸出值JP(i,j)僅與IP(i,j)像素灰度有關(guān)的處理稱為點處理。圖像對比度增強、圖像二值化等屬于點處理。
在局部處理中,輸出像素JP(i,j)的值取決于輸入圖像較大范圍或整幅圖像像素的值,這種處理稱為大局部處理。圖像的傅立葉變換就屬于大局部處理的例子。
2.迭代處理
反復對圖像進行某種運算直至滿足給定的條件,從而得到輸出圖像的處理形式稱為迭代處理。如圖像的細化處理常常就是一種迭代處理。
3.窗口處理和模板處理
對圖像的處理,一般采用對整個畫面進行處理,但也有只對畫面中特定的部分進行處理的情況。這種處理方式包括窗口處理和模板處理。
單獨對圖像中選定的矩形區(qū)域內(nèi)的像素進行處理的方式叫做窗口處理,如圖2.5.3所示。矩形區(qū)域稱為窗口,一般由矩形左上角的位置和行、列方向的像素數(shù)來確定。窗口處理用于從圖像中單獨取出對象物所在窗口而進行處理的場合。
圖2.5.3窗口處理希望單獨處理任意形狀的區(qū)域時,可采用模板處理,如圖2.5.4所示。為了表示區(qū)域形狀,可預先準備一個和處理圖像相同大小的二維數(shù)組,使用與處理圖像畫面1對1的形式存儲該區(qū)域的信息,并進行處理。把這個任意形狀的區(qū)域稱為模板,例如可將根據(jù)閾值處理得到的物體形狀作為模板。另外,把存儲著模板信息的二維數(shù)組叫模板平面。模板平面具有模板位置上的信息,而且一般用二值圖像的形式表示。若模板為矩形區(qū)域,則與窗口處理具有相同的效果,但窗口處理與模板處理的不同之處是后者必須設置一個模板平面。
圖2.5.4模板處理示意圖
4.串行處理和并行處理
后一像素輸出結(jié)果依賴于前面像素處理的結(jié)果,并且只能依次處理各像素而不能同時對各像素進行相同處理的一種處理形式稱為串行處理。串行處理的特點是:
(1)用輸入圖像(i,j)鄰域的像素值和輸出圖像(i,j)以前像素的處理結(jié)果計算輸出圖像(i,j)像素的值;
(2)處理算法要按一定順序進行。
因此,串行處理不能同時計算各像素的輸出值,且處理的順序會影響處理結(jié)果。
對圖像內(nèi)的各像素同時進行相同形式運算的一種處理形式稱為并行處理。并行處理的特點是:
(1)輸出圖像的(i,j)值只用輸入圖像的(i,j)像素的鄰域像素進行計算;
(2)相對于不同(i,j)的輸出值可以獨立進行計算。
2.6.1圖像的數(shù)據(jù)結(jié)構(gòu)
在數(shù)字圖像處理中,圖像數(shù)據(jù)在處理系統(tǒng)中采用何種存儲方式是很重要的。最常用的方式是將圖像各像素灰度值用一維或二維數(shù)組相應的各元素加以存儲。除此之外,還有下列幾種方式。2.6圖像的數(shù)據(jù)結(jié)構(gòu)與圖像文件格式
1.組合方式
組合方式是用一個字長存放多個像素灰度值的方式,它能起到節(jié)省內(nèi)存的作用,但會導致計算量增加,使處理程序變得復雜。圖2.6.1和圖2.6.2分別表示圖像數(shù)據(jù)的組合方式及其處理過程。
圖2.6.1組合方式
圖2.6.2組合方式的圖像處理
2.比特面方式
比特面方式是將像素以一種方式按比特位存取,即將所有像素的相同比特位用一個二維數(shù)組表示,形成比特面。n個比特位的灰度圖像采用比特面方式存取時就有n個比特面,如圖2.6.3所示。
這種結(jié)構(gòu)能充分利用內(nèi)存空間,但對灰度圖像處理耗時多。
圖2.6.3比特面方式
3.分層結(jié)構(gòu)
由原始圖像開始依次構(gòu)成像素數(shù)愈來愈少的系列圖像,就能使圖像數(shù)據(jù)表示具有分層性,其代表有錐形(金字塔)結(jié)構(gòu)。
與對原始圖像進行處理的場合相比,這種先對粗分辨率圖像進行處理,然后限定應該仔細進行處理的范圍,再對較高分辨率圖像進行處理的方法,可使處理的效率得到提高。
4.樹結(jié)構(gòu)
對一幅圖像的行、列都接連不斷地二等分,如果圖像被分割部分中的全體像素都變成具有相同的特征時,則這一部分不再分割。樹結(jié)構(gòu)采用以原圖像為樹根的叉樹表示,主要用在特征提取和信息壓縮等方面。
5.多重圖像數(shù)據(jù)存儲
在彩色圖像(紅、綠、藍)或多波段圖像中,每個像素包含著多個波段的信息。以多光譜圖像為例,其圖像數(shù)據(jù)的存儲有下列三種方式:
(1)逐波段存儲BSQ(BandSequential),分波段處理時采用;
(2)逐行存儲BIL(BandInterleavedbyLine),逐行掃描記錄設備采用;
(3)逐像素存儲BIP(BandInterleavedbyPix),用于分類。2.6.2圖像文件格式
一幅現(xiàn)實世界的圖像經(jīng)由掃描儀、攝像機等設備進行采集,需要以文件的形式存儲于計算機的磁盤中,然后被計算機處理。早期各種圖像的存儲都由其采集者自行定義格式。隨著數(shù)字圖像技術(shù)的發(fā)展,逐漸出現(xiàn)了流行的圖像格式標準,如BMP、PCX、GIF、TIFF等。
不論一幅圖像以何種格式存儲,圖像格式都大致包含下列特征:
(1)描述圖像的高度、寬度以及各種物理特征的數(shù)據(jù)。
(2)彩色定義:每點bit數(shù)(決定顏色的數(shù)量即色深度)和彩色平面數(shù),非真彩色圖像還要提供一個調(diào)色板。
(3)描述圖像的位圖數(shù)據(jù)體:將該圖像由一個矩陣描述出來,該矩陣的結(jié)構(gòu)由圖像的高、寬及每點bit數(shù)決定。如果圖像采用了壓縮,則每行都是用特定壓縮算法壓縮過的數(shù)據(jù)。
這就是各種圖像格式的本質(zhì)。造成每種格式不同的原因是因為每種格式對上述三種數(shù)據(jù)的存放位置、存放格式定義不同,而且大多數(shù)圖像格式都定義了自己獨有的數(shù)據(jù)。
常見圖像文件格式有BMP文件、PCX文件、GIF文件和TIFF文件等。
1.BMP文件
隨著Windows應用的逐漸普及,BMP(Bitmap的縮寫)圖像越來越多地被各種應用軟件所支持。這主要是因為Windows把BMP作為其圖像的標準格式,并且內(nèi)含了一套支持BMP圖像處理的API函數(shù)。BMP文件格式可分為文件頭、位圖信息和位圖數(shù)據(jù)三部分。
1)文件頭
BMP文件頭含有BMP文件的類型、大小和打印格式等信息。在windows.h中對其定義如下:
typedefstructtagBITMAPFILEHEADER{
WORDbfType;/*位圖文件的類型*/
DWORDbfSize;/*位圖文件的大小*/
WORDbfReserved1;/*位圖文件保留字,必須為0*/
WORDbfReserved2;/*位圖文件保留字,必須為0*/
DWORDbfOffBits;/*位圖數(shù)據(jù)相對于位圖文件頭的偏移量表示*/
}BITMAPFILEHEADER;
2)位圖信息
位圖信息含有位圖文件的尺寸和顏色等信息。在windows.h中對其定義如下:
typedefstructtagBITMAPINFO
{
BITMAPINFOHEADERbmiHeader:
RGBQUADbmiColor[];
}BITMAPINFO;
(1)bmiHeader是一個位圖信息頭(BITMAPINFOHEADER)類型的數(shù)據(jù)結(jié)構(gòu),用于說明位圖的尺寸。BITMAPINFOHEADER的定義如下:
typedefstructtagBITMAPINFOHEADER
{DWORDbiSize;/*bmiHeader結(jié)構(gòu)的長度*/
DWORDbiWidth;/*位圖的寬度,以像素為單位*/
DWORDbiHeight;/*位圖的高度,以像素為單位*/
WORDbiPlanes;/*目標設備的位平面數(shù),必須為1*/
WORDbiBitCount;/*每個像素的位數(shù),必須是1(單色)、4(16色)、8(256色)或24(真彩色)*/
DWORDbiCompression;/*位圖的壓縮類型,必須是0(不壓縮)、1(BI-RLE8壓縮類型)或2(BI-RLE4壓縮類型)*/
DWORDbiSiZelmage;/*位圖的大小,以字節(jié)為單位*/
DWORDbiXPelsPerMeter;/*位圖的目標設備水平分辨率,以每米像素數(shù)為單位*/
DWORDbiYPelsPerMeter;/*位圖的目標設備垂直分辨率,以每米像素數(shù)為單位*/
DWORDbiClrUsed;/*位圖實際使用的顏色表中的顏色變址數(shù)*/
DWORDbiClrImportant;/*位圖顯示過程中被認為是重要顏色的變址數(shù)*/
}BITMAPINFOHEADER;
(2)bmiColor[]是一個顏色表,用于說明位圖中的顏色。它有若干個表項,每一個表項是一個RGBQUAD類型的結(jié)構(gòu),定義一種顏色。RGBQUAD的定義如下:
typedeftagRGBQUAD
{
BYTErgbBlue;
BYTErgbGreen;
BYTErgbRed;
BYTErgbReserved;
}RGBQUAD;
注意:RGBQUAD數(shù)據(jù)結(jié)構(gòu)中增加了一個保留字段rgbReserved,它不代表任何意義,必須取固定值00,同時RGBQUAD結(jié)構(gòu)定義的顏色值中,紅色、綠色與藍色的排列順序與一般圖像文件的顏色數(shù)據(jù)排列順序恰好相反,即藍色的亮度由rgbBlue字段定義、綠色的亮度由rgbGreen字段定義,紅色的亮度由rgbRed字段定義。若位圖中某個像素點的顏色描述為“00,00,F(xiàn)F,00”,則表示該點的顏色為純紅色,而不是純藍色。
3)位圖數(shù)據(jù)
位圖陣列記錄了位圖的每一個像素值。在生成位圖文件時,Windows從位圖的左下角開始(即從左到右、從下到上)逐行掃描位圖,將位圖的像素值一一記錄下來。這些像素值的字節(jié)組成了位圖陣列。位圖陣列有壓縮和非壓縮兩種存儲格式。
歸納起來,BMP圖像文件有下列4個特點:
(1)只能存放一幅圖像。
(2)只能存儲單色、16色、256色或真彩色4種圖像數(shù)據(jù)之一。
(3)圖像數(shù)據(jù)有壓縮或不壓縮兩種處理方式,壓縮方式為RLE_4和RLE_8。RLE_4能處理16色圖像數(shù)據(jù);而RLE_8能壓縮256色圖像數(shù)據(jù)。
(4)調(diào)色板的數(shù)據(jù)存儲結(jié)構(gòu)較為特殊。
2.PCX文件
PCX文件是由Zsoft公司在20世紀80年代初期設計的,專用于存儲該公司開發(fā)的PCPaintbrush繪圖軟件所生成的圖像數(shù)據(jù)。在授權(quán)給微軟與其產(chǎn)品(MicrosoftPaintbrush)捆綁發(fā)行后,成為Windows的一部分。它是使用時間最長的一種位圖格式,雖然目前使用這種格式的人減少了,但這種帶有.PCX擴展名的文件在今天仍是十分常見的。
PCX文件由3個部分組成,即文件頭、位圖數(shù)據(jù)和一個多達256種色彩的調(diào)色板。文件頭長達128字節(jié),分為幾個區(qū)域,包括圖像的尺寸和每個像素顏色的編碼位數(shù)。位圖數(shù)據(jù)可以用簡單的RLE(行程長度編碼)算法壓縮,像素值通常是單字節(jié)的索引值。調(diào)色板最多有256個RGB值。PCX文件的最新版本可以支持真彩色圖像,圖像最大可達4GB。現(xiàn)在的PCX圖像可以用1、4、8或24bpp來對顏色數(shù)據(jù)進行編碼,文件末尾處還有一個單獨的位平面和一個RGB值的256色調(diào)色板。下面是PCX圖像文件的幾個特點:
(1)只能存放一張圖像。
(2)使用RLE壓縮方法進行壓縮。
(3)文件有多個版本,能處理多種不同模式下的圖像數(shù)據(jù)。
(4)4色和16色PCX圖像文件有設定或不設定調(diào)色板數(shù)據(jù)兩種選項。
(5)16色圖像數(shù)據(jù)可分為1個或4個bitPlane來處理。
3.GIF文件
GIF(GraphicsInterchangeFormat)是由CompuServer公司開發(fā)的圖像格式。GIF圖像文件現(xiàn)已成為網(wǎng)絡和BBS上圖像傳輸?shù)耐ㄓ酶袷?,?jīng)常用于動畫、透明等特技制作。
GIF圖像文件結(jié)構(gòu)一般是由7個數(shù)據(jù)區(qū)組成的,它們是文件頭、通用調(diào)色板、位圖數(shù)據(jù)區(qū)以及4個補充區(qū)。其中文件頭和位圖數(shù)據(jù)區(qū)是文件不可缺少的項,通用調(diào)色板和其余的4個補充區(qū)則不一定會出現(xiàn)在文件內(nèi)。GIF圖像文件內(nèi)可以有多個位圖數(shù)據(jù)區(qū),每個位圖數(shù)據(jù)區(qū)由三部分組成:一個10字節(jié)長的圖像描述,一個可選的局部色表和位圖數(shù)據(jù)。每個位圖數(shù)據(jù)區(qū)存儲一幅圖像,位圖數(shù)據(jù)用LZW算法壓縮。4個補充區(qū)如下:圖像控制補充區(qū)用來描述圖像怎樣被顯示;簡單文本補充區(qū)包含顯示在圖像中的文本;注釋補充區(qū)以ASCII文本形式存放注釋;應用補充區(qū)存放生成該文件的應用程序的私有數(shù)據(jù)。通過軟件處理和控制使得這些分離的圖像能夠形成一個連續(xù)有動感的畫面,即動畫圖像。所以,GIF圖像文件常用于制作Web網(wǎng)頁和多媒體系統(tǒng)的特技效果。GIF文件有下面6個特點:
(1)文件具有多元化結(jié)構(gòu),能夠存儲多幅圖像,這是制作動畫的基礎。
(2)調(diào)色板數(shù)據(jù)有通用調(diào)色板和局部調(diào)色板之分。
(3)采用改進版LZW壓縮法,優(yōu)于RLE壓縮法。
(4)最多只能存儲256色圖像,GIF圖像中每一像素的存儲數(shù)據(jù)是該顏色列表的索引值。
(5)根據(jù)標識符尋找數(shù)據(jù)區(qū)。GIF圖像文件內(nèi)的各種圖像數(shù)據(jù)區(qū)和補充區(qū)多數(shù)沒有固定的數(shù)據(jù)長度和存放位置,為了方便程序?qū)ふ覕?shù)據(jù)區(qū),就以數(shù)據(jù)區(qū)的第一個字節(jié)作為標識符,讓程序能夠判斷所讀到的是哪種數(shù)據(jù)區(qū)。
(6)圖像數(shù)據(jù)有兩種排列方式:順序排列和交叉排列。
4.TIFF文件
TIFF是“TagImageFileFormat”的縮寫,是由Aldus公司與微軟公司共同開發(fā)設計的圖像文件格式。
TIFF圖像文件主要由三部分組成:文件頭、標識信息區(qū)和圖像數(shù)據(jù)區(qū)。文件規(guī)定只有一個文件頭,且一定要位于文件前端。文件頭有一個標志參數(shù)指出標識信息區(qū)在文件中的存儲地址,標識信息區(qū)內(nèi)有多組標識信息,每組標識信息長度固定為12字節(jié)。前8字節(jié)分別為標識信息的代號(2字節(jié))、數(shù)據(jù)類型(2字節(jié))和數(shù)據(jù)量(4字節(jié)),后4字節(jié)則存儲數(shù)據(jù)值或標志參數(shù)。文件有時還存放一些標識信息區(qū)容納不下的數(shù)據(jù),例如調(diào)色板數(shù)據(jù)就是其中的一項。
由于應用了標志的功能,TIFF圖像文件能夠?qū)崿F(xiàn)多幅圖像的存儲。若文件內(nèi)只存儲一幅圖像,則將標識信息區(qū)內(nèi)容置0,表示文件內(nèi)無其他標識信息區(qū)。若文件內(nèi)存放多幅圖像,則第一個標識信息區(qū)末端的標志參數(shù)將是一個非0的長整數(shù),表示下一個標識信息區(qū)在文件中的地址,只有最后一個標識信息區(qū)的末端才會出現(xiàn)值為0的長整數(shù),表示圖像文件內(nèi)不再有其他的標識信息區(qū)和圖像數(shù)據(jù)區(qū)。
TIFF文件有如下特點:
(1)應用指針的功能,可以存儲多幅圖像。
(2)文件內(nèi)數(shù)據(jù)區(qū)沒有固定的排列順序,只規(guī)定文件頭必須在文件前端。對于標識信息區(qū)和圖像數(shù)據(jù)區(qū),在文件中可以隨意存放。
(3)可制定私人用的標識信息。
(4)除了一般圖像處理常用的RGB模式之外,還能夠接受CMYK等多種圖像模式。
(5)可存儲多份調(diào)色板數(shù)據(jù)。
(6)調(diào)色板的數(shù)據(jù)類型和排列順序較為特殊。
(7)能提供多種不同的壓縮數(shù)據(jù)的方法,便于使用者選擇。
(8)圖像數(shù)據(jù)可分割成幾個部分分別存檔。
2.7.1圖像的特征類別
圖像特征是圖像分析的重要依據(jù),它可以是視覺能分辨的自然特征,也可以是人為定義的某些特性或參數(shù),即人工特征。數(shù)字圖像的像素亮度、邊緣輪廓等屬自然特征;圖像經(jīng)過變換得到的頻譜和灰度直方圖等屬人工特征。2.7圖像的特征與噪聲
1.自然特征
圖像是空間景物反射或輻射的光譜能量的記錄,具有光譜特征、幾何特征和時相特征。
(1)光譜特征:同一景物對不同波長的電磁波具有不同的反射率,不同景物對同一波長也可能具有不同的反射率。因而不同類型的景物在各個波段的數(shù)字成像就構(gòu)成了數(shù)字圖像的光譜特征。
數(shù)字圖像的光譜特征可用于多波段遙感,從中獲得關(guān)于地理、地質(zhì)、地貌等豐富的信息。
(2)幾何特征:幾何特征主要表現(xiàn)為圖像的空間分辨率、圖像紋理結(jié)構(gòu)及圖像變形等幾個方面。
空間分辨率反映所采用的設備性能。如SPOT衛(wèi)星全色圖像分辨率設計為10m×10m。
紋理結(jié)構(gòu)是指影像細部的形狀、大小、位置、方向以及分布特征,是圖像目視判讀的主要依據(jù),也是模式識別的主要依據(jù)。
圖像變形導致所得圖像中的幾何形狀與實物平面投影不相似。
(3)時相特征:時相特征主要反映在不同時間獲得的同一地區(qū)各圖像之間存在的差異,它是對動體進行監(jiān)測、跟蹤的主要依據(jù)。
2.人工特征
圖像的人工特征很多,主要有以下幾種:
(1)直方圖特征。
(2)灰度邊緣特征:圖像灰度在某個方向上的局部范圍內(nèi)表現(xiàn)出不連續(xù)性,這種灰度明顯變化點的集合稱為邊緣?;叶冗吘壧卣鞣从沉藞D像中目標或?qū)ο笏嫉拿娣e大小和形狀。
(3)線和角點特征:城市區(qū)劃圖中有建筑群、街道、公路、鐵路、橋梁等,這些地物可用線線相交的角點來表示。從圖中提出這些特征,不僅可壓縮圖像,也可用于識別圖像。角點代表的局部結(jié)構(gòu)關(guān)系不因視角而改變,在圖像匹配中很有用。
(4)紋理特征:紋理區(qū)域是指某種結(jié)構(gòu)在比它更大的范圍內(nèi)大致呈現(xiàn)重復排列,這種結(jié)構(gòu)稱為紋理基元,如草地、大面積農(nóng)作物構(gòu)成的自然紋理和如磚墻、建筑群等構(gòu)成的人工紋理。
圖像的特征有很多,但在實際的特征提取中,重視何種特征主要取決于對象和處理的目的。按提取特征的范圍大小,圖像的特征又可分為點特征、局部特征、區(qū)域特征和整體特征。
(1)點特征:僅由各個像素就能決定的性質(zhì)。如單色圖像中的灰度值藍(B)成分的值。
(2)局部特征:在小鄰域內(nèi)所具有的性質(zhì),如線和邊緣的強度、方向、密度和統(tǒng)計量(平均值、方差等)等。
(3)區(qū)域特征:在圖像內(nèi)的對象物(一般是指與該區(qū)域外部有區(qū)別的具有一定性質(zhì)的區(qū)域)內(nèi)的點或者局部的特征分布,或者統(tǒng)計量以及區(qū)域的幾何特征(面積、形狀)等。
(4)整體特征:整個圖像作為一個區(qū)域看待時的統(tǒng)計性質(zhì)和結(jié)構(gòu)特征等。2.7.2特征提取與特征空間
獲取圖像特征信息的操作稱為特征提取。它作為模式識別、圖像理解或信息量壓縮的基礎是很重要的。如圖2.7.1所示,通過特征提取,可以獲得特征構(gòu)成的圖像(稱為特征圖像)和特征參數(shù)。
圖2.7.1圖像的特征提取對于由圖像中提取出的特征量,利用特征空間這一定義,可應用于模式分類等方面。把從圖像中提取的m個特征量y1,y2,…,ym,用m維的向量Y=[y1,y2,…,ym]T表示,稱該向量為特征向量。另外,對應于各特征量的m維空間叫做特征空間,那么特征向量Y就可作為這個特征空間的點來表示。具有類似特征量的點(一般是對象物)在特征空間上形成群(稱為聚類),把特征空間按照聚類的分布依靠某種標準進行分割,就可判斷各個點屬于哪一類。也可用鑒別函數(shù)對特征空間進行分割。2.7.3圖像噪聲
所謂噪聲,就是妨礙人的視覺器官或系統(tǒng)傳感器對所接收的圖像信息進行理解或分析的各種因素。一般噪聲是不可預測的隨機信號,它只能用概率統(tǒng)計的方法去認識。由于噪聲影響圖像的輸入、采集、處理的各個環(huán)節(jié)以及輸出的全過程,尤其是圖像輸入、采集中的噪聲必然影響處理全過程以至最終結(jié)果,因此抑制噪聲已成為圖像處理中極重要的步驟。
1.圖像噪聲種類
圖像噪聲按其產(chǎn)生的原因可分為外部噪聲和內(nèi)部噪聲。外部噪聲是指圖像處理系統(tǒng)外部產(chǎn)生的噪聲,如天體放電干擾、電磁波從電源線竄入系統(tǒng)等產(chǎn)生的噪聲。內(nèi)部噪聲是指系統(tǒng)內(nèi)部產(chǎn)生的,一般分為以下四種形式:
(1)由光和電的基本性質(zhì)引起的,如電流可看做電子或空穴運動,這些粒子運動產(chǎn)生隨機散粒噪聲;導體中電子流動產(chǎn)生熱噪聲;光量子運
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年物業(yè)綠化管理外包合同
- 起床了小班主題教案
- 廣告招商合同范本
- 寄宿制工作計劃3篇
- 世說新語讀書筆記范文800字左右
- 勵志題目演講稿300字10篇
- 創(chuàng)新網(wǎng)站建設方案5篇
- 《冬天》中班教案
- 2024年度工作總結(jié)
- 2025年系列活性精脫硫劑合作協(xié)議書
- 2024年金融理財-金融理財師(AFP)考試近5年真題附答案
- 數(shù)字資產(chǎn)管理與優(yōu)化考核試卷
- 教案-“枚舉法”信息技術(shù)(信息科技)
- 2024年內(nèi)部審計年度工作計劃范文(六篇)
- 四川省成都市2021-2022學年物理高一下期末學業(yè)質(zhì)量監(jiān)測模擬試題含解析
- 新教科版六年級上冊科學全冊知識點(期末總復習資料)
- 綠色建筑工程監(jiān)理實施細則
- 10kv電力施工方案
- 某港口碼頭工程施工組織設計
- 2024年安全員b證繼續(xù)教育考試
- 譯林版(三起)(2024)三年級上冊英語期末復習:Unit 1-Unit 8共8套單元測試卷匯編
評論
0/150
提交評論