版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
PAGE第PAGE第7頁XXXXXXXX學(xué)院畢
業(yè)
論
文題目:圖像壓縮技術(shù)的研究與實(shí)現(xiàn)學(xué)生姓名:XXX學(xué) 號:XXXXXXX專
業(yè)
:軟件技術(shù)
班級:XXXXXXXX指導(dǎo)教師:XXX二0一七年四月
目錄摘要 3Abstract 4前言 5第一章緒論 61.1圖像壓縮技術(shù)的發(fā)展現(xiàn)狀 61.2研究內(nèi)容和目的 71.3論文結(jié)構(gòu)安排 7第二章圖像壓縮的理論分析 82.1圖像壓縮的可能性 82.2圖像壓縮原理 82.3圖像壓縮的理論基礎(chǔ) 9第三章常見無損壓縮方法基本原理 113.1圖像壓縮編碼的分類 113.2預(yù)測編碼 113.2.1系統(tǒng)框圖 123.2.2調(diào)制 133.3常見壓縮方法 163.3.1JPEG2000與JPEG的區(qū)別 163.3.2JPEG2000與JPEG的實(shí)驗(yàn)比較 18將彩色圖像轉(zhuǎn)化為灰度圖像 18基于離散余弦變換(DCT)實(shí)現(xiàn)圖像壓縮 203.3.3小波變換的分析: 23利用小波變換實(shí)現(xiàn)圖像壓縮 23二維小波分析壓縮圖像Matlab實(shí)現(xiàn) 263.3.4DCT和小波變換的圖像壓縮的比較 29第四章結(jié)論 32第五章總結(jié)與體會 33致謝 34參考文獻(xiàn) 35附錄1外文原文 37附錄2外文翻譯 47摘要圖像壓縮技術(shù)對于數(shù)字圖像信息在網(wǎng)絡(luò)上實(shí)現(xiàn)快速傳輸和實(shí)時處理具有重要的意義。本文介紹了當(dāng)前幾種最為重要的圖像壓縮算法:JPEG2000、分形圖像壓縮和小波變換圖像壓縮。其中主要研究了離散余弦變換壓縮和小波變換壓縮,并對兩種壓縮的前后數(shù)據(jù)進(jìn)行了對比,同時還分析了離散余弦變換壓縮和小波變換壓縮之間的差異。關(guān)鍵詞:圖像壓縮;JPEG2000;小波變換圖像壓縮;
AbstractImagecompressiontechniquesfordigitalimageinformationinInternetrapidtransmissionandreal-timeprocessinghasimportantsignificance.Thispaperintroducesseveralmostimportantimagecompressionalgorithm:JPEG2000,fractalimagecompressionandwaveletimagecompression.Onemajorresearchonthediscretecosinetransformcompressionandwaveletcompression,andtwokindsofdatacompressionandcomparison,thispaperalsoanalyzesthediscretecosinetransformcompressionandwaveletcompresseddifferences.Keyword:Imagecompression;JPEG2000;wavelettransformationimagecompression
前言近二十年來,科學(xué)技術(shù)取得了飛速的發(fā)展。由計算機(jī)技術(shù)所帶來的信息革命使人類由工業(yè)化的社會進(jìn)入到了信息化的社會。多媒體技術(shù)和Internet互連網(wǎng)技術(shù)的廣泛應(yīng)用加速了全球高速公路的建設(shè),基于網(wǎng)絡(luò)的多媒體數(shù)據(jù)傳輸正改變著人類的生活方式。科學(xué)實(shí)驗(yàn)表明,人類從外界獲取的知識之中,有80%以上都是通過視覺感知獲取的。眼睛獲取的是圖象信息,一幅圖勝過千言萬語,圖象信息是人類認(rèn)識世界及人類自身的重要源泉。圖象壓縮就是在沒有明顯失真的前提下,將圖象的位圖信息轉(zhuǎn)變成另外一種能將數(shù)據(jù)量縮減的表達(dá)形式。首先,盡管圖象中數(shù)據(jù)量很大,但數(shù)據(jù)之間不是完全獨(dú)立的,圖象中存在著各種各樣的相關(guān)性或冗余信息。即一部分?jǐn)?shù)據(jù)可以由另一部分?jǐn)?shù)據(jù)完全推算出來。其次,大部分圖象視頻信號的最終接收者都是人眼,而人類的視覺系統(tǒng)是一種高度復(fù)雜的系統(tǒng),它能從極為雜亂的圖象中抽象出有意義的信息,并以非常精練的形式反映給大腦。人眼對圖象中的不同部分的敏感程度是不同的,如果去除圖象中對人眼不敏感或意義不大的部分,對圖象的主觀質(zhì)量是不會有很大影響的。本文主要是利用離散余弦變換壓縮和小波變換壓縮對圖像進(jìn)行壓縮,并對比了圖像壓縮前后的數(shù)據(jù),同時也對比了離散余弦變換壓縮和小波變換壓縮之間的差異。并得出了自己對兩種不同壓縮的看法。第一章緒論1.1圖像壓縮技術(shù)的發(fā)展現(xiàn)狀基于分形的方法是近幾年來引起關(guān)注和爭議的一種圖像壓縮方法。對圖像壓縮而言,分形主要是利用自相似的特點(diǎn),通過迭代函數(shù)系統(tǒng)來實(shí)現(xiàn)壓縮。利用分形特征對圖像進(jìn)行描述和處理是很自然的。分形能取得更好的圖像質(zhì)量,當(dāng)然在較低壓縮比的情況下,JPEG是更好的選擇。分形壓縮方法計算量比較大,時間開銷長,因此加快分形壓縮方法的速度是當(dāng)前研究的熱點(diǎn)之一。小波變換(WaveletTransform)在頻率精度方面稍差一些,但在時間的分析能力上更好一些,而且可以對時間和頻率同時進(jìn)行分解,這是傳統(tǒng)傅立葉變換所做不到的。小波變換已經(jīng)開始應(yīng)用到圖像數(shù)據(jù)壓縮等領(lǐng)域,主要是采用離散小波變換。在某些情況下,小波變換更優(yōu)于DCT等其他正交變換。利用人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)進(jìn)行圖像壓縮是這個領(lǐng)域近幾年的又一研究熱點(diǎn),并且取得了積極的進(jìn)展。這是一種與視覺系統(tǒng)知識緊密相關(guān)的壓縮方法。ANN并分布的聯(lián)結(jié)機(jī)制與人的視覺系統(tǒng)有某些相似之處,利用此原理及其改進(jìn)的方法進(jìn)行圖像壓縮可獲得較好的效果。視頻壓縮標(biāo)準(zhǔn),從最初的H.261發(fā)展到現(xiàn)在盛行的MPEG-4,一直在不斷發(fā)展,而1997年7月誕生了MPEG.7,其標(biāo)題為“多媒體內(nèi)容描述接口”,編號為ISO/IECl5938。嚴(yán)格地說,MPEG.7不是一個壓縮標(biāo)準(zhǔn),它的主要目標(biāo)是對多媒體的信息內(nèi)容采用各種標(biāo)準(zhǔn)化的描述,以便進(jìn)行有效的查詢和檢索。它可獨(dú)立于其它MPEG標(biāo)準(zhǔn)使用,也可用來增強(qiáng)其它MPEG標(biāo)準(zhǔn)的功能。MPEG-7的應(yīng)用范圍很廣泛,既可應(yīng)用于存儲(在線或離線),也可用于流式應(yīng)用(如廣播、將模型加入等)。它將在數(shù)字圖書館(如圖像目錄、音樂字典)、多媒體名錄服務(wù)(如網(wǎng)頁)、廣播媒體選擇(如無線電信道、TV信道)、多媒體編輯(個人電子新聞業(yè)務(wù),媒體寫作)等領(lǐng)域發(fā)揮重要作用。MPEG-21于2000年5月開始,其標(biāo)題為“多媒體框架”(MultimediaFramework),主要目標(biāo)是提供多媒體所需的不同技術(shù)之綜合。它將為網(wǎng)絡(luò)環(huán)境下的多媒體資源提供以下功能:內(nèi)容的創(chuàng)建、復(fù)制、分發(fā)、使用、表述,知識產(chǎn)權(quán)的管理與保護(hù),內(nèi)容的標(biāo)識與描述,金融管理,用戶秘密,終端與網(wǎng)絡(luò)資源提取,事件報告等。由于視頻壓縮標(biāo)準(zhǔn)在多媒體技術(shù)和產(chǎn)業(yè)中的特殊地位,世界各地眾多的公司、科研機(jī)構(gòu)和院校都投入了大量的人力、物力進(jìn)行標(biāo)準(zhǔn)的研究,試圖占領(lǐng)技術(shù)和產(chǎn)業(yè)的制高點(diǎn)。目前,在各種視頻壓縮編碼標(biāo)準(zhǔn)中,己注冊的專利多以千計,而我國由于在數(shù)字圖像壓縮領(lǐng)域起步較晚,在標(biāo)準(zhǔn)的競爭中處于不利地位。所以我們現(xiàn)今研究的重點(diǎn)是標(biāo)準(zhǔn)的研究。1.2研究內(nèi)容和目的本文通過DCT和小波變換為基礎(chǔ)的壓縮方法,最大限度地減小圖像的冗余度,同時分析DCT和小波變換壓縮的實(shí)驗(yàn)結(jié)果,最后比較DCT和小波變換之間的差異。最后并得出了自己對兩種不同壓縮方法的看法和今后發(fā)展的前景。1.3論文結(jié)構(gòu)安排全文安排具體如下:第一章介紹圖像壓縮技術(shù)的發(fā)展現(xiàn)狀,第二章圖像壓縮的理論分析,第三章介紹離散余弦變換和小波變換壓縮的算法和壓縮前后數(shù)據(jù)的分析,第四章介紹了本次論文的結(jié)果分析和比較,第五章總結(jié)了整個畢業(yè)論文期間的感受和體會。
第二章圖像壓縮的理論分析由于圖像數(shù)據(jù)之間存在著一定的冗余,所以使得數(shù)據(jù)的壓縮成為可能。信息論的創(chuàng)始人香農(nóng)提出把數(shù)據(jù)看作是信息和冗余度的組合。所謂冗余度,是由于一副圖像的各像素之間存在著很大的相關(guān)性,可利用一些編碼的方法刪去它們,從而達(dá)到減少冗余、壓縮數(shù)據(jù)的目的。為了去掉數(shù)據(jù)中的冗余,常常要考慮信號源的統(tǒng)計特性,或建立信號源的統(tǒng)計模型。2.1圖像壓縮的可能性圖像可以壓縮,是因?yàn)閳D像中存在大量的冗余信息,圖像的冗余包括以下幾種【1】:(1)空間冗余:像素點(diǎn)之間的相關(guān)性。(2)時間冗余:活動圖像的兩個連續(xù)幀之間的冗余。(3)信息熵冗余:單位信息量大于其熵。(4)結(jié)構(gòu)冗余;圖像的區(qū)域上存在非常強(qiáng)的紋理結(jié)構(gòu)。(5)知識冗余:有固定的結(jié)構(gòu),如人的頭像。(6)視覺冗余:某些圖像的失真是人眼不易覺察的。 2.2圖像壓縮原理去除多余數(shù)據(jù)。以數(shù)學(xué)的觀點(diǎn)來看,這一過程實(shí)際上就是將二維像素陣列變換為一個在統(tǒng)計上無關(guān)聯(lián)的數(shù)據(jù)集合圖像壓縮是指以較少的比特有損或無損地表示原來的像素矩陣的技術(shù),也稱圖像編碼。圖像數(shù)據(jù)之所以能被壓縮,就是因?yàn)閿?shù)據(jù)中存在著冗余。圖像數(shù)據(jù)的冗余主要表現(xiàn)為:圖像中相鄰像素間的相關(guān)性引起的空間冗余;圖像序列中不同幀之間存在相關(guān)性引起的時間冗余;不同彩色平面或頻譜帶的相關(guān)性引起的頻譜冗余。數(shù)據(jù)壓縮的目的就是通過去除這些數(shù)據(jù)冗余來減少表示數(shù)據(jù)所需的比特數(shù)。由于圖像數(shù)據(jù)量的龐大,在存儲、傳輸、處理時非常困難,因此圖像數(shù)據(jù)的壓縮就顯得非常重要。信息時代帶來了“信息爆炸”,使數(shù)據(jù)量大增,因此,無論傳輸或存儲都需要對數(shù)據(jù)進(jìn)行有效的壓縮。在遙感技術(shù)中,各種航天探測器采用壓縮編碼技術(shù),將獲取的巨大信息送回地面。圖像壓縮是數(shù)據(jù)壓縮技術(shù)在數(shù)字圖像上的應(yīng)用,它的目的是減少圖像數(shù)據(jù)中的冗余信息從而用更加高效的格式存儲和傳輸數(shù)據(jù)。2.3圖像壓縮的理論基礎(chǔ)圖像壓縮的理論基礎(chǔ)是信息論。從信息論的角度來看,壓縮就是去掉信息中的冗余,即保留不確定的信息,去掉確定的信息(可推知的),也就是用一種更接近信息本質(zhì)的描述來代替原有冗余的描述。這個本質(zhì)的東西就是信息量(即不確定因素)【2】。信息論之父C.E.Shannon第一次用數(shù)學(xué)語言闡明了概率與信息冗余度的關(guān)系。在1948年發(fā)表的論文“通信的數(shù)學(xué)理論(AMathematicalTheoryofCommunication)”中,香農(nóng)指出,任何信息都存在冗余,冗余大小與信息中每個符號(數(shù)字、字母或單詞)的出現(xiàn)概率或者說不確定性有關(guān)。依據(jù)信息論,設(shè)有一個無記憶的信源A,它產(chǎn)生消息托{a1},i=l,2,?,N的概率是已知的,記為P(a1),i=l,2,?,N,則信息量為:(2.1)可見越是不可能出現(xiàn)的消息,它的出現(xiàn)對信息的貢獻(xiàn)量越大。一個消息出現(xiàn)的可能性越小,其信息量就越多;而消息出現(xiàn)的可能性越大,其信息量就越少。信源的平均信息量稱為“熵”(entropy),即:上式取以2為底的對數(shù)時,單位為比特(bit):熵達(dá)到最大的情況出現(xiàn)在信源各符號的出現(xiàn)概率相等時,而信源此時提供最大可能的信源符號平均信息量。香農(nóng)信息論可以證明:信源熵是進(jìn)行無失真編碼的理論極限。低于此極限的無失真編碼方法是不存在的。而且可以證明,利用像素間的相關(guān)性,使用高階熵一定可以獲得更高的壓縮比。設(shè)βK為數(shù)字圖像第k個碼字CK的長度(二進(jìn)制代碼的位數(shù))。其相應(yīng)出現(xiàn)的概率為PK,則該數(shù)字圖像所賦于的碼字平均長度R為:在一般情況下,編碼效率往往用下列簡單公式表示:式中H為信源熵,R為平均碼字長度。根據(jù)信息論中的信源編碼理論,可以證明在R≥H條件下,總可以設(shè)計出某種無失真編碼方法。當(dāng)然如果編碼結(jié)果使R遠(yuǎn)大于H,表明這種編碼方法效率很低,占用比特數(shù)太多。
第三章常見無損壓縮方法基本原理圖像編碼與壓縮從本質(zhì)上來說是對要處理的圖像源數(shù)據(jù)按一定的規(guī)則進(jìn)行變換和組合,從而達(dá)到以盡可能少的代碼(符號)來表示盡可能多的數(shù)據(jù)信息。壓縮通過編碼來實(shí)現(xiàn),或者說編碼帶來壓縮的效果。所以,一般把此項(xiàng)處理稱之為壓縮編碼。3.1圖像壓縮編碼的分類圖像壓縮編碼的方法目前已有多種,其分類方法視出發(fā)點(diǎn)不同而有差異。據(jù)統(tǒng)計,圖像壓縮編碼方法已多達(dá)30一40種。按壓縮技術(shù)所依據(jù)和使用的數(shù)學(xué)理論和計算方法進(jìn)行分類,可分為統(tǒng)計編碼(StatisticalCoding)、預(yù)測編碼(PredictiveCoding)和變換編碼(TransformCoding)大類;按壓縮過程的可逆性分為有損壓縮(熵壓縮EntropyCompression)和無損壓縮(冗余度壓縮RedundancyReduction)兩類【6】。按可逆性可分為兩大類:第一類壓縮過程是可逆的,也就是說,從壓縮后的圖像能夠完全恢復(fù)出原來的圖像,信息沒有任何丟失,稱為無損壓縮;第二類壓縮過程是不可逆的,無法完全恢復(fù)出原圖像,信息有一定的丟失,稱為有損壓縮。選擇哪一類壓縮,要折衷考慮,盡管我們希望能夠無損壓縮,但是通常有損壓縮的壓縮比比無損壓縮的高。3.2預(yù)測編碼預(yù)測編碼(predictivecoding)主要是減少了數(shù)據(jù)在時間和空間上的相關(guān)性,因而對于時間序列據(jù)有著廣泛的應(yīng)用價值。在數(shù)字通信系統(tǒng)中,例如語音的分析與合成、圖像的編碼與解碼,預(yù)測編碼已經(jīng)得到了廣泛的實(shí)際應(yīng)用。預(yù)測編碼是一種簡單而且十分有效的數(shù)據(jù)壓縮方法,廣泛應(yīng)用于聲音,圖像等數(shù)據(jù)的壓縮。所謂預(yù)測,就是根據(jù)已經(jīng)出現(xiàn)的數(shù)據(jù)樣本對將要出現(xiàn)的下一個數(shù)據(jù)的大小做出估計。由于聲音、圖像等數(shù)據(jù)具有嚴(yán)格平滑連續(xù)性,相鄰采樣點(diǎn)間數(shù)值變化往往不大,因此借助前面的若干個數(shù)據(jù)樣本往往可以較準(zhǔn)確地預(yù)測出當(dāng)前樣本的數(shù)值,預(yù)測的誤差一般都很小,如果我們不是直接對原始數(shù)據(jù)進(jìn)行編碼,而是先做預(yù)測,然后僅對較小的預(yù)測誤差進(jìn)行編碼,這樣就可以減少碼長,達(dá)到壓縮效果,這就是預(yù)測編碼的基本思想[7]。3.2.1系統(tǒng)框圖一個基本的預(yù)測編碼系統(tǒng)示于圖3-1【8】。原始數(shù)據(jù)送入編碼單元,與預(yù)測器輸出的估值相減,得到預(yù)測誤差值,經(jīng)編碼器編碼(如啥夫曼編碼)后形成碼流進(jìn)行傳輸和存儲。解碼是首先恢復(fù)出預(yù)測誤差值,再和用與編碼器相同的預(yù)測器計算出的預(yù)測值相加,從而恢復(fù)出原始數(shù)據(jù)。圖3-1基本預(yù)測編碼/解碼系統(tǒng)
例如有一組數(shù)200,201,203,202,204,204,假設(shè)我們用前一個數(shù)據(jù)來預(yù)測后一個數(shù)據(jù),預(yù)測編碼的工作過程示于圖3-2。預(yù)測誤差,即原始數(shù)據(jù)真值與預(yù)測值之差分別為l,2,.1,2,O,?。圖3-2預(yù)測編碼原理示意圖如果采用二進(jìn)制對原始數(shù)據(jù)編碼,每個數(shù)據(jù)都需要8比特。預(yù)測編碼不是對原始數(shù)據(jù)編碼,而是對預(yù)測誤差編碼。由于預(yù)測誤差動態(tài)范圍大大縮小,因此只用3比特就可以了,這就減少了碼長,達(dá)到了壓縮的目的。預(yù)測編碼系統(tǒng)圖像按行掃描進(jìn)行編碼。在掃到某一像素前,可以用此像素前面的一些像素值對其進(jìn)行預(yù)測估計,然后與實(shí)際像素值進(jìn)行比較。即用實(shí)際值減去預(yù)測估計值得到差值信號,再將此差值信號量化、編碼和傳輸。在接收端則用量化的差值信號重建圖像信號。預(yù)測編碼最簡單的形式是△M調(diào)制系統(tǒng)。3.2.2調(diào)制增量調(diào)制也稱△調(diào)制【9】(deltamodulation,DM),它是一種預(yù)測編碼技術(shù),是PCM編碼的一種變形。PCM是對每個采樣信號的整個幅度進(jìn)行量化編碼,因此它具有對任意波形進(jìn)行編碼的能力。DM是對實(shí)際的采樣信號與預(yù)測的采樣信號之差的極性進(jìn)行編碼,將極性變成“O”和“1”這兩種可能的取值之一。如果實(shí)際的采樣信號與預(yù)測的采樣信號之差的極性為“正”,則用“1”表示;相反則用“O”表示,或者相反。由于DM編碼只需用l位碼對信號進(jìn)行編碼,所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。DM編碼基本原理框圖如圖3-3所示,其中上圖為編碼原理框圖,下圖為譯碼原理框圖。DM編碼器包括比較器、本地譯碼器和脈沖形成器三個部分。接收端譯碼器比較簡單,它只有一個與編碼器中的本地譯碼一樣的譯碼器及一個視頻帶寬的低通濾波器。圖3-3DM編碼、譯碼原理圖DM編碼器實(shí)際上就是1bit編碼的預(yù)測編碼器。它用一位碼子來表示e(t),(3.1)式中f(t)為輸入視頻信號,f(t)是f(t)的預(yù)測值。當(dāng)差值P(f)為一個正的增量時用“1”碼來表示,當(dāng)差值P(r)為一個負(fù)的增量時用“0”碼來表示。在收端,當(dāng)譯碼器收到“1”時,信號則產(chǎn)生一個正跳變,收到“O”時,則信號電壓產(chǎn)生一個負(fù)的跳變,由此即可實(shí)現(xiàn)譯碼。DM波形編碼的原理如圖3.4所示??v坐標(biāo)表示“模擬信號輸入幅度”,橫坐標(biāo)表示“編碼輸出”。用i表示采樣點(diǎn)的位置,x[i]表示在i點(diǎn)的編碼輸出。輸入信號的實(shí)際值用y[i]表示,輸入信號的預(yù)測值用y[i+1]=y[i]±△表示。假設(shè)采用均勻量化,量階的大小為△,在開始位置的輸入信號y[0]=0,預(yù)測值y[0]=0,編碼輸出x[0]=l。現(xiàn)在讓我們看幾個采樣點(diǎn)的輸出。在采樣點(diǎn)i=l處,預(yù)測值y[1]=△,由于實(shí)際輸入信號大于預(yù)測值,因此x[1]=l;在采樣點(diǎn)i=4處,預(yù)測值y[4]=4△,同樣由于實(shí)際輸入信號大于預(yù)測值,因此x[4]=1;其他情況依此類推。從圖3-4中可以看到,在開始階段增量調(diào)制器的輸出不能保持跟蹤輸入信號的快速變化,這種現(xiàn)象就稱為增量調(diào)制器的“斜率過載”(slopeoverload)。一般來說,當(dāng)輸入信號的變化速度超過反饋回路輸出信號的最大變化速度時,就會出現(xiàn)斜率過載。之所以會出現(xiàn)這種現(xiàn)象,主要是反饋回路輸出信號的最大變化速率受到量化階大小的限制,因?yàn)榱炕A的大小是固定的。從圖3-4中還可以看到,在輸入信號緩慢變化部分,即輸入信號與預(yù)測信號的差值接近零的區(qū)域,增量調(diào)制器的輸出出現(xiàn)隨機(jī)交變的“0”和“l(fā)”。這種現(xiàn)象稱為增量調(diào)制器的粒狀噪聲(granularnoise),這種噪聲是不可能消除的。圖3-4DM波形編碼示意圖在輸入信號變化快的區(qū)域,斜率過載是關(guān)心的焦點(diǎn),而在輸入信號變化慢的區(qū)域,關(guān)心的焦點(diǎn)是粒狀噪聲。為了盡可能避免出現(xiàn)斜率過載,就要加大量化階△,但這樣做又會加大粒狀噪聲;相反,如果要減小粒狀噪聲,就要減小量化階△,這又會使斜率過載更加嚴(yán)重。DM最普通的譯碼器就是一個RC積分電路。利用RC的充、放電即可實(shí)現(xiàn)譯碼。3.3常見壓縮方法香農(nóng)的率失真理論奠定了信源編碼的理論基礎(chǔ)。以此理論為依據(jù)可以得到數(shù)據(jù)壓縮的兩種基本途徑:一是改變了信源的概率分布,使其盡可能地非均勻,再用最佳編碼方法使平均碼長逼近信源熵;二是信源的冗余度寓于信源符號間的相關(guān)性之中,去除它們之間的相關(guān)性,使之成為或近似成為不相干信源。圖像壓縮編碼有幾十種之多,并且涉及到很深的數(shù)學(xué)理論和推導(dǎo),在此只介紹幾種方法。3.3.1JPEG2000與JPEG的區(qū)別JPEG是JointPhotographicExpertsGroup的縮寫?!埃甹pg”、“.jpeg”是其最常用的圖像文件格式。聯(lián)合圖像專家組成立于l986年,1992年發(fā)布了JPEG的標(biāo)準(zhǔn)而在1994年獲得IS()109918—1的認(rèn)定。規(guī)定對靜止圖像進(jìn)行壓縮的建議性標(biāo)準(zhǔn),其目的是為了提供一個適用于連續(xù)色度圖像的壓縮標(biāo)準(zhǔn)。在編碼和解碼時,JPEG使用離散余弦變換(DCT),并對圖像的分量從左到右,從上到下進(jìn)行掃描編碼。這種編碼方式在中、高比特率時,可以得到質(zhì)量滿意的壓縮圖像,并且實(shí)現(xiàn)累進(jìn)傳輸。JPEG是一種有損壓縮格式,能夠?qū)D像壓縮在很小的儲存空間,圖像中重復(fù)或不重要的資料會被丟失,因此容易造成圖像數(shù)據(jù)的丟失。尤其是使用過高的壓縮比例,將使最終解壓縮后恢復(fù)的圖像質(zhì)量明顯降低。JPEG也是一種很靈活的格式,具有調(diào)節(jié)圖像質(zhì)量的功能,允許用不同壓縮比例對文件進(jìn)行壓縮,支持多種壓縮級別,壓縮比率通常在10:1到40:1之間,壓縮比越大,品質(zhì)就越低;相反地,壓縮比越小,品質(zhì)就越好。JPEG格式壓縮的主要是高頻信息,對色彩的信息保留較好,適合應(yīng)用于互聯(lián)網(wǎng),可減少圖像的傳輸時間,可以支持24bit真彩色,也普遍應(yīng)用于需要連續(xù)色調(diào)的圖像。JPEG2000是國際化標(biāo)準(zhǔn)組織(ISO)和國際電子技術(shù)聯(lián)盟(IEC)聯(lián)合推出的新一代靜止圖像壓縮標(biāo)準(zhǔn),自1997年開始起草,2000年12月國際標(biāo)準(zhǔn)(IS)正式發(fā)布,文檔代碼為ISO/IEC15444—1。JPEG2000是取代JPEG的下一代圖像壓縮標(biāo)準(zhǔn)。提供了許多新的特性,其中包括:①低碼率下的超級壓縮特性;②連續(xù)色調(diào)和二值圖像壓縮;③支持無損和有損壓縮④漸進(jìn)性傳輸;⑤感興趣區(qū)域編碼;⑥碼流的隨機(jī)訪問和處理;⑦良好的容錯性等等。JPEG2000與傳統(tǒng)JPEG最大的不同,在于放棄了JPEG所采用的以離散余弦轉(zhuǎn)換(DiscreteCosineTransform)為主的區(qū)塊編碼方式,而采用以小波轉(zhuǎn)換(Wavelettransform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將影像的頻率成分抽取出來JPEG2000的編碼、解碼過程圖3-5編解碼過程JPEG2000與JPEG的區(qū)別JPEG2000與JPEG最大的不同,在于它放棄了JPEG所采用的以離散余弦轉(zhuǎn)換(DiscreteCosineTransform)為主的區(qū)塊編碼方式,而改用以小波轉(zhuǎn)換(Wavelettransform)為主的多解析編碼方式。JPEG2000與JPEG的比較如圖3-6圖3-63.3.2JPEG2000與JPEG的實(shí)驗(yàn)比較將彩色圖像轉(zhuǎn)化為灰度圖像先讀取一張彩色的圖片22,然后用rgb2gray轉(zhuǎn)化灰度,最后顯示轉(zhuǎn)化過的灰度圖像,程序如下:I=imread('d:\我的文檔\桌面\22.jpg');J=rgb2gray(I);imshow(J)圖3-7彩色圖像圖3-8轉(zhuǎn)化后的灰度圖像如圖3-7和圖3-8所示,是將彩色圖像轉(zhuǎn)化為灰度圖像基于離散余弦變換(DCT)實(shí)現(xiàn)圖像壓縮程序:I=imread('cameraman.tif');imshow(I);title('原始圖像')disp('原始圖像大?。?)whos('I')I=im2double(I);%圖像類型存儲轉(zhuǎn)換,將圖像矩陣轉(zhuǎn)換成雙精度類型T=dctmtx(8);%離散余弦變換矩陣B=blkproc(I,[88],'P1*x*P2',T,T');mask=[1111000011100000110000001000000000000000000000000000000000000000];B2=blkproc(B,[88],'P1.*x',mask);I2=blkproc(B2,[88],'P1*x*P2',T',T);figure,imshow(I2);title('壓縮后的圖像')disp('壓縮圖像的大?。?)whos('I2')程序運(yùn)行結(jié)果:圖3-9離散余弦變換壓縮前后的數(shù)據(jù)對比圖3-10離散余弦變換壓縮的原圖圖3-11離散余弦變換壓縮后的圖像程序的運(yùn)行結(jié)果如圖3-10和圖3-11所示。從運(yùn)行結(jié)果可以看出,DCT變換雖然可以得到良好的圖像質(zhì)量,但壓縮率并不大。3.3.3小波變換的分析:小波分解方法是一種窗口大小(即窗口面積)固定,但其形狀可改變,時間窗和頻率窗都可改變的時頻局域化分析方法,即在低頻部分具有較高的頻率分辨率和較低的時間分辨率,在高頻部分具有較高的時間分辨率和較低的頻率分辨率,所以被稱為“數(shù)學(xué)顯微鏡”。正是這種特性,使小波變換具有對信號的自適應(yīng)性。小波變換可以同時在時域和頻域上分析信號的局部特性。平方可積函數(shù)f(t)∈L2(R)的連續(xù)小波變換定義為其中,小波變換的核函數(shù)是母小波的時間平移b和尺度伸縮a的結(jié)果,<,>表示內(nèi)積運(yùn)算。小波變換的基本思想是用一族函數(shù)去表示或逼近一信號,該族函數(shù)稱為小波函數(shù)系。它是通過一個小波母函數(shù)的伸縮和平移,產(chǎn)生其“子波”來構(gòu)成。圖像可以看做是二維矩陣。一般假設(shè)圖像矩陣的大小為MXN,那么每次小波變換后,圖像便分解為4個大小為原來尺寸1/4的子塊頻帶區(qū)域:LL頻帶,HL頻帶,LH頻帶和HH頻帶。分別包含了相應(yīng)頻帶的小波系數(shù),相當(dāng)于在水平方向和豎直方向上進(jìn)行隔點(diǎn)采樣。LL頻帶保持了原始圖像的內(nèi)容信息,圖像的能量集中于此頻帶。HL頻帶保持了圖像水平方向上的高頻邊緣信息。LH頻帶保持了圖像豎直方向上的高頻邊緣信息。HH頻帶保持了圖像在對角線方向上的高頻信息。進(jìn)行下一層小波變換時,變換數(shù)據(jù)集中在LL頻帶上。利用小波變換實(shí)現(xiàn)圖像壓縮程序:clearallI=imread('cameraman.tif');imshow(I);%顯示圖像title('原始圖像')disp('原始圖像I的大小:');whos('I')I=im2double(I);[c,s]=wavedec2(I,2,'bior3.7');%對圖像用小波進(jìn)行層分解cal=appcoef2(c,s,'bior3.7',1);%提取小波分解結(jié)構(gòu)中的一層的低頻系數(shù)和高頻系數(shù)ch1=detcoef2('h',c,s,1);%提取二維水平方向細(xì)節(jié)系數(shù)cv1=detcoef2('v',c,s,1);%提取二維垂直方向細(xì)節(jié)系數(shù)cd1=detcoef2('d',c,s,1);%提取二維對角線方向細(xì)節(jié)系數(shù)ca1=appcoef2(c,s,'bior3.7',1);%保留小波分解第一層低頻信息ca1=wcodemat(ca1,440,'mat',0);%首先對第一層信息進(jìn)行量化編碼ca1=0.5*ca1;%改變圖像高度figure,image(ca1);%顯示壓縮后的圖象title('第一次壓縮后的圖像')disp('第一次壓縮圖像的大小為:')whos('ca1')ca2=appcoef2(c,s,'bior3.7',2);%保留小波分解第二層低頻信息進(jìn)行壓縮ca2=wcodemat(ca2,440,'mat',0);%首先對第二層信息進(jìn)行量化編碼ca2=0.25*ca2;%改變圖像高度figure,image(ca2);%顯示壓縮后的圖象title('第二次壓縮后的圖像')disp('第二次壓縮圖像的大小為:')whos('ca2')運(yùn)行結(jié)果:圖3-12小波變換壓縮前后數(shù)據(jù)圖3-13小波變換壓縮原圖圖3-14小波變換第一次壓縮后的圖像圖3-15小波變換第二次壓縮后的圖像將上述語句執(zhí)行后結(jié)果如圖3-12所示,實(shí)際上壓縮前圖像的大小為256X256個像素,所占空間65536字節(jié),第一次壓縮后的大小為135×135個像素,所占空間為145800字節(jié);而第二次壓縮后的大小為75X75個像素,所占空間為45000字節(jié)。其壓效效果顯而易見。可以看出,第一次壓縮是提取原始圖像中小波分解第一層的低頻信息,此時壓縮效果較好,壓縮比較小;第二次壓縮是提取第一層分解低頻部分的低頻部分(即第二層的低頻部分),其壓縮比較大,壓縮效果在視覺上也基本可以。二維小波分析壓縮圖像Matlab實(shí)現(xiàn)在本實(shí)驗(yàn)中采用的是較為經(jīng)典的實(shí)驗(yàn)圖像11頭像,該文件格式是“.jpg”的位圖文件,文件存放在D盤根目錄。我們運(yùn)用Matlab工具箱中的函數(shù)及相關(guān)語法得到如下程序:clearallI=imread('d:\我的文檔\桌面\11.jpg');imshow(I);%顯示圖像title('原始圖像')disp('原始圖像I的大小:');whos('I')I=im2double(I);[c,s]=wavedec2(I,2,'bior3.7');%對圖像用小波進(jìn)行層分解cal=appcoef2(c,s,'bior3.7',1);%提取小波分解結(jié)構(gòu)中的一層的低頻系數(shù)和高頻系數(shù)ch1=detcoef2('h',c,s,1);%提取二維水平方向細(xì)節(jié)系數(shù)cv1=detcoef2('v',c,s,1);%提取二維垂直方向細(xì)節(jié)系數(shù)cd1=detcoef2('d',c,s,1);%提取二維對角線方向細(xì)節(jié)系數(shù)ca1=appcoef2(c,s,'bior3.7',1);%保留小波分解第一層低頻信息ca1=wcodemat(ca1,440,'mat',0);%首先對第一層信息進(jìn)行量化編碼ca1=0.5*ca1;%改變圖像高度figure,image(ca1);%顯示壓縮后的圖象title('第一次壓縮后的圖像')disp('第一次壓縮圖像的大小為:')whos('ca1')ca2=appcoef2(c,s,'bior3.7',2);%保留小波分解第二層低頻信息進(jìn)行壓縮ca2=wcodemat(ca2,440,'mat',0);%首先對第二層信息進(jìn)行量化編碼ca2=0.25*ca2;%改變圖像高度figure,image(ca2);%顯示壓縮后的圖象title('第二次壓縮后的圖像')disp('第二次壓縮圖像的大小為:')whos('ca2')運(yùn)行結(jié)果:圖3-16小波變換壓縮前后的數(shù)據(jù)圖3-17小波變換壓縮的原圖圖3-18小波變換第一次壓縮的圖像圖3-19小波變換第二次壓縮后的圖像如圖3-16實(shí)際上壓縮前圖像的大小為240×240個像素,所占空間為57600字節(jié),第一次壓縮后的大小為127×127個像素,所占空間為129032字節(jié);而第二次壓縮后的大小為71X71個像素,所占空間為40328字節(jié)。其壓效效果顯而易見。可以看出,第一次壓縮是提取原始圖像中小波分解第一層的低頻信息,此時壓縮效果較好,壓縮比較小;第二次壓縮是提取第一層分解低頻部分的低頻部分(即第二層的低頻部分),其壓縮比較大,壓縮效果在視覺上也基本可以。3.3.4DCT和小波變換的圖像壓縮的比較長期以來,人們對靜止圖像(包括活動圖像一視頻)的壓縮編碼都是基于DCT變換編碼,這些基DCT變換的編碼算法也已成熟地應(yīng)用于各個方面的圖像壓縮。作為一種多分辨率分析方法,小波變換具有很好的時一頻或空一頻局部特性,特別適合按照人類視覺系統(tǒng)特性設(shè)計圖像壓縮編碼方案,也非常有利于圖像的分層傳輸。本文通過對圖像DCT和小波變換性能差別的研究。分析圖像壓縮算法應(yīng)當(dāng)從全面、系統(tǒng)觀點(diǎn)考慮,經(jīng)過靜止圖像的基于DCT和小波的編碼比較后,可知在圖像編碼中的主要因素是量化器和熵編碼器,而不是小波變換和DCT的差別。對于靜止的圖像來說,小波變換和DCT之間的差別很小,還不到1dB。相對于DCT域下的圖像壓縮,小波壓縮具有很大優(yōu)勢。小波變換能夠有效地應(yīng)用于圖像數(shù)據(jù)壓縮,從根本上說,其壓縮機(jī)理正是體現(xiàn)在小波變換對圖像的多頻段分解恰與人類覺系統(tǒng)的多頻率通道特性相吻合,從而使我們能夠從人類視覺的多通道處理特性上對圖像進(jìn)行相應(yīng)的壓縮處理。從形式上講,小波變換提供了一種有效的多層次結(jié)構(gòu)的圖像描述形式,能夠從整體上把握圖像的結(jié)構(gòu),可以利用圖像中更大范圍內(nèi)的相關(guān)性,并使得圖像的統(tǒng)計特性變得相對簡單化。而且對于一般的圖像,經(jīng)過小波壓縮后能夠得到很大的壓縮比,而且壓縮后的圖像畫面沒有大的失真。如果要改變壓縮比,只需要調(diào)整程序中子矩陣的大小即可。最后,小波壓縮的程序既簡單又實(shí)用,更加方便于被廣泛利用。如圖3-20,離散余弦變換和小波變化壓縮前后數(shù)據(jù)對比,通過此圖可以很清楚看出兩種不同的變換壓縮前后的數(shù)據(jù)對比。離散余弦變換壓縮尺寸大小/字節(jié)程序運(yùn)行時間壓縮前圖像256x25665536壓縮后圖像256x2565242880.9060小波變換壓縮尺寸大小/字節(jié)程序運(yùn)行時間壓縮前圖像240x24057600第一次壓縮后圖像127x1271290320.4530第二次壓縮后圖像71x71403280.10903-20離散余弦變換和小波變化壓縮前后數(shù)據(jù)對比
第四章結(jié)論在許多應(yīng)用領(lǐng)域,都會用到數(shù)字圖像。由于數(shù)字圖像數(shù)據(jù)量大.因此就會面臨數(shù)字圖像信息進(jìn)行傳輸或存儲的問題。想要在有限的存儲空間盡可能的存儲更多的圖像或者在有限的時間內(nèi)傳輸更多的圖像,這就涉及數(shù)字圖像的壓縮技術(shù)。圖像壓縮技術(shù)是圖像處理技術(shù)的重要分支之一,圖像壓縮技術(shù)的研究幾十年來取得了很多的成就。目前存在的圖像壓縮技術(shù)都各自有各自的優(yōu)點(diǎn)但也存在不足。本文在介紹了現(xiàn)有的幾種圖像壓縮技術(shù)的基礎(chǔ)上,詳細(xì)分析了DCT和小波變換壓縮,并對壓縮前后的數(shù)據(jù)和圖像進(jìn)行了對比,并得出了從全面、系統(tǒng)觀點(diǎn)考慮,經(jīng)過靜止圖像的基于DCT和小波的編碼比較后,可知在圖像編碼中的主要因素是量化器和熵編碼器,而不是小波變換和DCT的差別。從本文實(shí)驗(yàn)可以看出相對于DCT域下的圖像壓縮,小波壓縮具有很大優(yōu)勢。從根本上說,小波壓縮機(jī)理正是體現(xiàn)在小波變換對圖像的多頻段分解恰與人類覺系統(tǒng)的多頻率通道特性相吻合,從而使我們能夠從人類視覺的多通道處理特性上對圖像進(jìn)行相應(yīng)的壓縮處理。從形式上講,小波變換提供了一種有效的多層次結(jié)構(gòu)的圖像描述形式,能夠從整體上把握圖像的結(jié)構(gòu),可以利用圖像中更大范圍內(nèi)的相關(guān)性,并使得圖像的統(tǒng)計特性變得相對簡單化。而且對于一般的圖像,經(jīng)過小波壓縮后能夠得到很大的壓縮比,而且壓縮后的圖像畫面沒有大的失真。如果要改變壓縮比,只需要調(diào)整程序中子矩陣的大小即可。最后,小波壓縮的程序既簡單又實(shí)用,更加方便于被廣泛利用。第五章總結(jié)與體會隨著畢業(yè)日子的到來,畢業(yè)設(shè)計也接近了尾聲。經(jīng)過幾周的奮戰(zhàn)我的畢業(yè)設(shè)計終于完成了。在沒有做畢業(yè)設(shè)計以前覺得畢業(yè)設(shè)計只是對這幾年來所學(xué)知識的單純總結(jié),但是通過這次做畢業(yè)設(shè)計發(fā)現(xiàn)自己的看法有點(diǎn)太片面。畢業(yè)設(shè)計不僅是對前面所學(xué)知識的一種檢驗(yàn),而且也是對自己能力的一種提高。通過這次畢業(yè)設(shè)計使我明白了自己原來知識還比較欠缺。自己要學(xué)習(xí)的東西還太多,以前老是覺得自己什么東西都會,什么東西都懂,有點(diǎn)眼高手低。通過這次畢業(yè)設(shè)計,我才明白學(xué)習(xí)是一個長期積累的過程,在以后的工作、生活中都應(yīng)該不斷的學(xué)習(xí),努力提高自己知識和綜合素質(zhì)。在這次畢業(yè)設(shè)計中也使我們的同學(xué)關(guān)系更進(jìn)一步了,同學(xué)之間互相幫助,有什么不懂的大家在一起商量,聽聽不同的看法對我們更好的理解知識,所以在這里非常感謝幫助我的同學(xué)。我的心得也就這么多了,總之,不管學(xué)會的還是學(xué)不會的的確覺得困難比較多,真是萬事開頭難,不知道如何入手。最后終于做完了有種如釋重負(fù)的感覺。此外,還得出一個結(jié)論:知識必須通過應(yīng)用才能實(shí)現(xiàn)其價值!有些東西以為學(xué)會了,但真正到用的時候才發(fā)現(xiàn)是兩回事,所以我認(rèn)為只有到真正會用的時候才是真的學(xué)會了。在此要感謝我的指導(dǎo)老師X軍對我悉心的指導(dǎo),感謝老師給我的幫助。在設(shè)計過程中,我通過查閱大量有關(guān)資料,與同學(xué)交流經(jīng)驗(yàn)和自學(xué),并向老師請教等方式,使自己學(xué)到了不少知識,也經(jīng)歷了不少艱辛,但收獲同樣巨大。在整個設(shè)計中我懂得了許多東西,也培養(yǎng)了我獨(dú)立工作的能力,樹立了對自己工作能力的信心,相信會對今后的學(xué)習(xí)工作生活有非常重要的影響。而且大大提高了動手的能力,使我充分體會到了在創(chuàng)造過程中探索的艱難和成功時的喜悅。雖然這個設(shè)計做的也不太好,但是在設(shè)計過程中所學(xué)到的東西是這次畢業(yè)設(shè)計的最大收獲和財富,使我終身受益。致謝本論文是在我的導(dǎo)師——XXX。在本文的工作期間X老師嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、求實(shí)的治學(xué)作風(fēng)、對科學(xué)的執(zhí)著追求和大膽創(chuàng)新精神,令我深受感染并從中獲益匪淺:X老師對我的嚴(yán)格要求和熱誠關(guān)懷使我無論在知識上還是實(shí)踐上都收獲頗多。在讀大學(xué)的四年時間里,在與X老師的每次座談與交流中,X老師強(qiáng)烈的事業(yè)心、循循善誘的教誨和對生活的真誠感悟令我終生難以忘懷,成為我生命中永遠(yuǎn)的財富,激勵著我時刻奮發(fā)向上。在此,向我的導(dǎo)師一X老師,致以最崇的敬意和最衷心的感謝!此外,還要感謝我的室友,感謝我的大學(xué)生全班同學(xué),在這三年的共同生活中,是你們給了我太多的關(guān)心和支持。在此,請?jiān)试S我向每一位在我求學(xué)過程中遇到的老師、同學(xué)和朋友表示衷心的祝福和誠摯的謝意!最后,我要把這篇論文獻(xiàn)給養(yǎng)育我的父母,感謝他們用博大的胸懷與深深的愛包容了我的一切優(yōu)點(diǎn)與缺點(diǎn),慷慨地送給我一個屬于我自己的空間,讓我伸展開雙臂,擁抱我想要的生活!三年的大學(xué)生生活即將過去,這段記載著激情、艱辛、歡笑與友誼的青春歲月將成為我永遠(yuǎn)的記憶。未來的日子里,我將更加奮發(fā)圖強(qiáng),決不辜負(fù)這么多曾給予我真誠幫助的人們!
參考文獻(xiàn)[1]孫學(xué)巖,葉海建,韓玉坤.?dāng)?shù)字圖像壓縮原理及常用壓縮編碼方法.農(nóng)機(jī)化研究.2005.(3),128~130[2]張旭東.盧國棟,馮?。畧D像編碼基礎(chǔ)和小波壓縮技術(shù).清華大學(xué)出版杜.2004.3[3]張汗靈.MATLAB在圖像處理中的應(yīng)用.清華大學(xué)出版社.2006[4]王愛玲等.MATLABR2007圖像處理技術(shù)與應(yīng)用/MATLAB應(yīng)用技術(shù).電子工業(yè)出版社.2006[5]賀興華.MATLAB7.X圖像處理.人民郵電出版社.2006[6]彭天強(qiáng),郭志剛.基于DPCM與S+P變換的圖像無損壓縮.計算機(jī)工程與應(yīng)用.2005.(16);42~44[7]葉輕舟,林挺釗.基于FPGA的JPEG靜態(tài)圖像壓縮實(shí)現(xiàn).福建工程學(xué)院學(xué)報.2005.3(3):216~219 [8]岡薩雷斯.?dāng)?shù)字圖像處理(第二版).電子工業(yè)出版社.2004.1[9]姚慶棟,畢厚杰,王兆華等.圖像編碼基礎(chǔ).2006.08[10]萬永革.數(shù)字信號處理的MATLAB實(shí)現(xiàn).科學(xué)出版社.2007[11](美)恩格爾.數(shù)字信號處理.西安交通大學(xué)出版社.2002[12]樓順天等.MATLAB7.X程序設(shè)計語言(第二版).西安電子科技大學(xué)出版社.2007[13]高傳善等.數(shù)據(jù)通信與計算機(jī)網(wǎng)絡(luò).西安電子科技大學(xué)出版社.2001[14]叢玉良等.數(shù)字信號處理原理及其MATLAB實(shí)現(xiàn)(第2版).電子工業(yè)出版社.2009[15]高西全等.數(shù)字信號處理(第三版).西安電子科技大學(xué)出版社.2008[16]馮英俊等.小波和小波包算法和圖像壓縮.數(shù)理統(tǒng)計與管理.1999[17]姚慶棟,畢厚杰,王兆華等.圖像編碼基礎(chǔ).2006.08[18]TharnvichaiR.BoseT.RadenkovicM.MultiplierlesspredictorforDPCMofimages.Circuitsandsystems,2003.2[19]MielikainenJ.ToivanenP.ClusteredDPCMforthelosslesscompressionofhyperspectralimages.GeoscienceandRemoteSensing,2003.4[20]/view/893310.htm?fr=ala0_1_1附錄1外文原文Source:"the21stcenturyliteraturetheappliedundergraduateelectroniccommunicationseriesofpracticalteachingplanTheinformationandcommunicationengineeringspecialtyinEnglishch02_1.PDF120-124Ed:HanDingZhaoJuMin,etcTextA:AnIntroductiontoDigitalImageProcessing1.IntroductionDigitalimageprocessingremainsachallengingdomainofprogrammingforseveralreasons.Firsttheissueofdigitalimageprocessingappearedrelativelylateincomputerhistory.Ithadtowaitforthearrivalofthefirstgraphicaloperatingsystemstobecomeatruematter.Secondly,digitalimageprocessingrequiresthemostcarefuloptimizationsespeciallyforrealtimeapplications.Comparingimageprocessingandaudioprocessingisagoodwaytofixideas.Letusconsiderthenecessarymemorybandwidthforexaminingthepixelsofa320x240,32bitsbitmap,30timesasecond:10Mo/sec.Nowwiththesamequalitystandard,anaudiostereowaverealtimeprocessingneeds44100(samplespersecond)x2(bytespersampleperchannel)x2(channels)=176Ko/sec,whichis50timesless.Obviouslywewillnotbeabletousethesametechniquesforbothaudioandimagesignalprocessing.Finally,digitalimageprocessingisbydefinitionatwodimensionsdomain;thissomehowcomplicatesthingswhenelaboratingdigitalfilters.Wewillexploresomeoftheexistingmethodsusedtodealwithdigitalimagesstartingbyaverybasicapproachofcolorinterpretation.Asamoreadvancedlevelofinterpretationcomesthematrixconvolutionanddigitalfilters.Finally,wewillhaveanoverviewofsomeapplicationsofimageprocessing.Theaimofthisdocumentistogivethereaderalittleoverviewoftheexistingtechniquesindigitalimageprocessing.Wewillneitherpenetratedeepintotheory,norwillweinthecodingitself;wewillmoreconcentrateonthealgorithmsthemselves,themethods.Anyway,thisdocumentshouldbeusedasasourceofideasonly,andnotasasourceofcode.2.Asimpleapproachtoimageprocessing(1)Thecolordata:Vectorrepresentation①BitmapsTheoriginalandbasicwayofrepresentingadigitalcoloredimageinacomputer'smemoryisobviouslyabitmap.Abitmapisconstitutedofrowsofpixels,contractionofthewors“PictureElement”.Eachpixelhasaparticularvaluewhichdeterminesitsappearingcolor.ThisvalueisqualifiedbythreenumbersgivingthedecompositionofthecolorinthethreeprimarycolorsRed,GreenandBlue.Anycolorvisibletohumaneyecanberepresentedthisway.Thedecompositionofacolorinthethreeprimarycolorsisquantifiedbyanumberbetween0and255.Forexample,whitewillbecodedasR=255,G=255,B=255;blackwillbeknownas(R,G,B)=(0,0,0);andsay,brightpinkwillbe:(255,0,255).Inotherwords,animageisanenormoustwo-dimensionalarrayofcolorvalues,pixels,eachofthemcodedon3bytes,representingthethreeprimarycolors.Thisallowstheimagetocontainatotalof256×256×256=16.8milliondifferentcolors.ThistechniqueisalsoknownasRGBencoding,andisspecificallyadaptedtohumanvision.Withcamerasorothermeasureinstrumentswearecapableof“seeing”thousandsofother“colors”,inwhichcasestheRGBencodingisinappropriate.Therangeof0-255wasagreedfortwogoodreasons:Thefirstisthatthehumaneyeisnotsensibleenoughtomakethedifferencebetweenmorethan256levelsofintensity(1/256=0.39%)foracolor.Thatistosay,animagepresentedtoahumanobserverwillnotbeimprovedbyusingmorethan256levelsofgray(256shadesofgraybetweenblackandwhite).Therefore256seemsenoughquality.Thesecondreasonforthevalueof255isobviouslythatitisconvenientforcomputerstorage.Indeedonabyte,whichisthecomputer'smemoryunit,canbecodedupto256values.Asopposedtotheaudiosignalwhichiscodedinthetimedomain,theimagesignaliscodedinatwodimensionalspatialdomain.Therawimagedataismuchmorestraightforwardandeasytoanalyzethanthetemporaldomaindataoftheaudiosignal.Thisiswhywewillbeabletodolotsofstuffandfiltersforimageswithouttransformingthesourcedata,whilethiswouldhavebeentotallyimpossibleforaudiosignal.Thisfirstpartdealswiththesimpleeffectsandfiltersyoucancomputewithouttransformingthesourcedata,justbyanalyzingtherawimagesignalasitis.Thestandarddimensions,alsocalledresolution,forabitmapareabout500rowsby500columns.Thisistheresolutionencounteredinstandardanalogicaltelevisionandstandardcomputerapplications.Youcaneasilycalculatethememoryspaceabitmapofthissizewillrequire.Wehave500×500pixels,eachcodedonthreebytes,thismakes750Ko.Itmightnotseemenormouscomparedtothesizeofharddrives,butifyoumustdealwithanimageinrealtimethenprocessingthingsgettougher.Indeedrenderingimagesfluidlydemandsaminimumof30imagespersecond,therequiredbandwidthof10Mo/secisenormous.WewillseelaterthatthelimitationofdataaccessandtransferinRAMhasacrucialimportanceinimageprocessing,andsometimesithappenstobemuchmoreimportantthanlimitationofCPUcomputing,whichmayseemquitedifferentfromwhatonecanbeusedtoinoptimizationissues.Noticethat,withmoderncompressiontechniquessuchasJPEG2000,thetotalsizeoftheimagecanbeeasilyreducedby50timeswithoutlosingalotofquality,butthisisanothertopic.②Vectorrepresentationofcolorssee,na,sednesgrdecompositioonthethreeprimarycolors.Itsoundsobvioustoamathematiciantoimmediatelyinterpretcolorsasvectorsinathree-dimensionspacewhereeachaxisstandsforoneoftheprimarycolors.Thereforewewillbenefitofmostofthegeometricmathematicalconceptstodealwithourcolors,suchasnorms,scalarproduct,projection,rotationordistance.Thiswillbereallyinterestingforsomekindoffilterswewillseesoon.Figure1illustratesthisnewinterpretation:Figure1(2)Immediateapplicationtofilters①EdgeDetectionFromwhatwehavesaidbeforewecanquantifythebetweentwocolorsbycomputingthegeometricdistancebetweenthevectorsrepresentingthosetwocolors.LetsconsidertwocolorsC1=(R1,G1,B1)andC2=(R2,2,G2),thedistancebetweenthetwocolorsisgivenbytheformula:D,C2)(1R2)21+G2)2(1+B2)2 Thisleadsustoourfirstfilter:edgedetection.Theaimofedgedetectionistodeterminetheedgeofshapesinapictureandtobeabletodrawaresultbitmapwhereedgesareinwhiteonblackbackground(forexample).Theideaisverysimple;wegothroughtheimagepixelbypixelandcomparethecolorofeachpixeltoitsrightneighbor,andtoitsbottomneighbor.Ifoneofthesecomparisonresultsinatoobigdifferencethepixelstudiedispartofanedgeandshouldbeturnedtowhite,otherwiseitiskeptinblack.Thefactthatwecompareeachpixelwithitsbottomandrightneighborcomesfromthefactthatimagesareintwodimensions.Indeedifyouimagineanimagewithonlyalternativehorizontalstripesofredandblue,thealgorithmswouldn'tseetheedgesofthosestripesifitonlycomparedapixeltoitsrightneighbor.Thusthetwocomparisonsforeachpixelarenecessary.Thisalgorithmwastestedonseveralsourceimagesofdifferenttypesanditgivesfairlygoodresults.Itismainlylimitedinspeedbecauseoffrequentmemoryaccess.Thetwosquarerootscanberemovedeasilybysquaringthecomparison;however,thecolorextractionscannotbeimprovedveryeasily.Ifweconsiderthatthelongestoperationsarethegetpixelfunctionandputpixelfunctions,weobtainapolynomialcomplexityof4*N*M,whereNisthenumberofrowsandMthenumberofcolumns.Thisisnotreasonablyfastenoughtobecomputedinrealtime.Fora300×300×32imageIgetabout26transformspersecondonanAthlonXP1600+.Quiteslowindeed.Herearetheresultsofthealgorithmonanexampleimage:Afewwordsabouttheresultsofthisalgorithm:Noticethatthequalityoftheresultsdependsonthesharpnessofthesourceimage.Ifthesourceimageisverysharpedged,theresultwillreachperfection.Howeverifyouhaveaveryblurrysourceyoumightwanttomakeitpassthroughasharpnessfilterfirst,whichwewillstudylater.Anotherremark,youcanalsocompareeachpixelwithitssecondorthirdnearestneighborsontherightandonthebottominsteadofthenearestneighbors.Theedgeswillbethickerbutasomoreexactdependingonthesourceimage'ssharpness.Finallywewillseelateronthatthereisanotherwaytomakeedgedetectionwithmatrixconvolution.②ColorextractionTheotherimmediateapplicationofpixelcomparisoniscolorextraction.Insteadofcomparingeachpixelwithitsneighbors,wearegoingtocompareitwithagivencolorC1.ThisalgorithmwilltrytodetectalltheobjectsintheimagethatarecoloredwithC1.Thiswasquiteusefulforroboticsforexample.Itenablesyoutosearchonstreamingimagesforaparticularcolor.Youcanthenmakeyourobotgogetaredballforexample.Wewillcallthereferencecolor,theonewearelookingforintheimageC0=(R0,G0,B0).Onceagain,evenifthesquarerootcanbeeasilyremoveditdoesn'treallyimprovethespeedofthealgorithm.WhatreallyslowsdownthewholeloopistheNxMgetpixelaccessestomemoryandputpixel.Thisdeterminesthecomplexityofthisalgorithm:2xNxM,whereNandMarerespectivelythenumbersofrowsandcolumnsinthebitmap.Theeffectivespeedmeasuredonmycomputerisabout40transformspersecondona300x300x32sourcebitmap.JPEGimagecompressiontheory(一)JPEGcompressionisdividedintofourstepstoachieve:(1)ColormodeconversionandsamplingRGBcolorsystemisthemostcommonwaysthatcolor.JPEGusesaYCbCrcolorsystem.WanttouseJPEGcompressionmethoddealingwiththebasicfull-colorimages,RGBcolormodetofirstimagedataisconvertedtoYCbCrcolormodeldata.Yrepresentativeofbrightness,CbandCrrepresentsthehue,saturat
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)生系統(tǒng)平安建設(shè)活動方案(3篇)
- 質(zhì)控小組職責(zé)模版(2篇)
- 施工人員管理制度(3篇)
- 二零二五年度建筑工程施工服務(wù)外包合同2篇
- 課題申報書:大語言模型驅(qū)動三語教學(xué)的能動性分析和應(yīng)用路徑研究
- 裝飾圖案課程設(shè)計理念
- 二零二五年度新能源設(shè)備技術(shù)出口服務(wù)協(xié)議3篇
- 2024年規(guī)范化勞務(wù)輸出協(xié)議模板
- 材料員崗位的具體職責(zé)說明范文(2篇)
- 課題申報書:大學(xué)生數(shù)字化生存境況及優(yōu)化路向研究
- JCT587-2012 玻璃纖維纏繞增強(qiáng)熱固性樹脂耐腐蝕立式貯罐
- 大足石刻十八講
- 小學(xué)音樂-鈴兒響叮當(dāng)教學(xué)設(shè)計學(xué)情分析教材分析課后反思
- 055風(fēng)險管理計劃表
- 邊境貿(mào)易與經(jīng)濟(jì)發(fā)展
- 公司供應(yīng)商大會策劃方案
- 2022事業(yè)單位財務(wù)規(guī)則解讀PPT
- “簡約與繁復(fù)”二元思辨【 審題立意+范文精評 】 語文高分寫作 多元思辨
- 計算物理課件
- 公路水泥穩(wěn)定碎石基層振動成型法施工技術(shù)規(guī)范
- 配電箱柜進(jìn)場驗(yàn)收表
評論
0/150
提交評論