




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、1 1壓縮編碼技術(shù)壓縮編碼技術(shù) 28.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn) 8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)8.3 視頻壓縮國際標(biāo)準(zhǔn)視頻壓縮國際標(biāo)準(zhǔn)第八章第八章 音視頻壓縮國際標(biāo)準(zhǔn)音視頻壓縮國際標(biāo)準(zhǔn)3 音頻信號壓縮編碼的主要依據(jù)是人耳的聽覺特性,音頻信號壓縮編碼的主要依據(jù)是人耳的聽覺特性,主要有兩點:主要有兩點: 1.1.人的聽覺系統(tǒng)中存在一個人的聽覺系統(tǒng)中存在一個聽覺閾值電平聽覺閾值電平,低于這,低于這個電平的聲音信號人耳聽不到個電平的聲音信號人耳聽不到 . . 2. 2.人的聽覺存在人的聽覺存在屏蔽效應(yīng)屏蔽效應(yīng)。當(dāng)幾個強弱不同的聲音。當(dāng)幾個強弱不同的聲音同時存在時,強聲使弱聲難以聽
2、到,并且兩者之間的同時存在時,強聲使弱聲難以聽到,并且兩者之間的關(guān)系與其相對頻率的大小有關(guān)關(guān)系與其相對頻率的大小有關(guān) . . 聲音編碼算法就是通過這些特性來聲音編碼算法就是通過這些特性來去掉更多的冗去掉更多的冗余數(shù)據(jù)余數(shù)據(jù),來達到壓縮數(shù)據(jù)的目的。,來達到壓縮數(shù)據(jù)的目的。 8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)u音頻信號壓縮編碼依據(jù)音頻信號壓縮編碼依據(jù)456 熵編碼熵編碼 波形編碼:在信號采樣和量化過程中考慮人的特性,波形編碼:在信號采樣和量化過程中考慮人的特性,適應(yīng)人的應(yīng)用要求,適應(yīng)人的應(yīng)用要求,PCM、DPCM、ADPCM等等 參數(shù)編碼:將音頻信號以某種模型表示,壓縮倍數(shù)很參數(shù)編碼:將音頻
3、信號以某種模型表示,壓縮倍數(shù)很高,計算量大,保真度不高,適合對語音信號編碼高,計算量大,保真度不高,適合對語音信號編碼 混合編碼:吸取波形和參數(shù)編碼的優(yōu)點,綜合編碼混合編碼:吸取波形和參數(shù)編碼的優(yōu)點,綜合編碼8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)u音頻信號壓縮編碼方法音頻信號壓縮編碼方法7 8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)u音頻信號壓縮編碼方法音頻信號壓縮編碼方法8 聲音信號的基本參數(shù):聲音信號的基本參數(shù): 頻率頻率:信號每秒鐘變化的次數(shù)。次聲、可聽聲和超聲:信號每秒鐘變化的次數(shù)。次聲、可聽聲和超聲 振幅振幅:聲波波形的最大位移。:聲波波形的最大位移。 音頻壓縮標(biāo)準(zhǔn):音頻壓縮標(biāo)準(zhǔn):
4、電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)電話質(zhì)量的語音壓縮標(biāo)準(zhǔn):300Hz3.4KHz。當(dāng)采樣頻。當(dāng)采樣頻率為率為8KHz,量化位數(shù)為,量化位數(shù)為8bit時所對應(yīng)的速率為時所對應(yīng)的速率為64kbit/s。 調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn):50Hz7KHz。當(dāng)使用。當(dāng)使用16KHz的抽樣頻率和的抽樣頻率和14bit的量化位數(shù)時,信號速率為的量化位數(shù)時,信號速率為224kbit/s。符合。符合1988年年ITU制定的制定的G.722標(biāo)準(zhǔn)。標(biāo)準(zhǔn)。 高保真立體聲音頻壓縮標(biāo)準(zhǔn)高保真立體聲音頻壓縮標(biāo)準(zhǔn):50Hz20KHz。在。在44.1KHz抽樣頻率下用抽樣頻率下用16bit量化,信號速率為每聲道量化
5、,信號速率為每聲道705kbit/s。目前比較成熟的標(biāo)準(zhǔn)為目前比較成熟的標(biāo)準(zhǔn)為“MPEG音頻音頻”。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)9 G.711標(biāo)準(zhǔn):標(biāo)準(zhǔn):1972年,人們最熟知的標(biāo)準(zhǔn),非線性量化年,人們最熟知的標(biāo)準(zhǔn),非線性量化PCM 編碼,編碼,64kbps G.721標(biāo)準(zhǔn):標(biāo)準(zhǔn):1984年,年,ADPCM,6bit編碼,編碼,32kbps,能夠得到比能夠得到比3階階DPCM好的信號質(zhì)量。語音質(zhì)量高于電好的信號質(zhì)量。語音質(zhì)量高于電話質(zhì)量,可達調(diào)幅廣播質(zhì)量。話質(zhì)量,可達調(diào)幅廣播質(zhì)量。 G.722標(biāo)準(zhǔn):采用子帶編碼,將輸入語音信號劃分為兩標(biāo)準(zhǔn):采用子帶編碼,將輸入語音信號劃分為兩個子帶
6、(個子帶(50Hz-3.5kHz, 3.5kHz-7kHz),再分別對兩個),再分別對兩個子帶進行子帶進行ADPCM編碼。每個子帶可以使用不同的速率編碼。每個子帶可以使用不同的速率(64kbps,56kbps,48kbps),適合于電話會議系統(tǒng)。),適合于電話會議系統(tǒng)。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)u電話質(zhì)量的音頻壓縮技術(shù)標(biāo)準(zhǔn)電話質(zhì)量的音頻壓縮技術(shù)標(biāo)準(zhǔn)108.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uPCM編碼框圖編碼框圖11 G.726標(biāo)準(zhǔn):用子帶編碼將輸入信號劃分為兩個子帶,然標(biāo)準(zhǔn):用子帶編碼將輸入信號劃分為兩個子帶,然后對兩個子帶分別獨立進行取樣和后對兩個子帶分別獨立進行取樣和AD
7、PCM編碼。輸入語編碼。輸入語音帶寬音帶寬300Hz-3.4kHz,其速率可以為,其速率可以為40kbps, 32kpbs, 24kbps, 16kbps。 G.723標(biāo)準(zhǔn):采用碼激勵線性預(yù)測編碼(標(biāo)準(zhǔn):采用碼激勵線性預(yù)測編碼(CELP)方法,)方法,5.3/6.3kpbs,適用于實時多媒體通信。,適用于實時多媒體通信。 G.728標(biāo)準(zhǔn):基于短時延碼本激勵線性預(yù)測編碼標(biāo)準(zhǔn):基于短時延碼本激勵線性預(yù)測編碼LD-CELP ,16kbps, 用于低數(shù)據(jù)速率電話。用于低數(shù)據(jù)速率電話。 G.729標(biāo)準(zhǔn):基于共軛結(jié)構(gòu)代數(shù)碼本激勵線性預(yù)測編碼標(biāo)準(zhǔn):基于共軛結(jié)構(gòu)代數(shù)碼本激勵線性預(yù)測編碼CS-ACELP ,8k
8、bps,適用于個人移動通信。,適用于個人移動通信。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)u電話質(zhì)量的音頻壓縮技術(shù)標(biāo)準(zhǔn)電話質(zhì)量的音頻壓縮技術(shù)標(biāo)準(zhǔn)12 GSM標(biāo)準(zhǔn):標(biāo)準(zhǔn):1992年,德國,長時延線性預(yù)測規(guī)則碼本年,德國,長時延線性預(yù)測規(guī)則碼本激勵激勵RPE-LTP 編碼,編碼,13kbps CTIA標(biāo)準(zhǔn):標(biāo)準(zhǔn):1989年,美國,矢量和激勵線性預(yù)測技術(shù)年,美國,矢量和激勵線性預(yù)測技術(shù)VSELP ,8kbps 美國國家安全局美國國家安全局1982年采用年采用LPC算法,算法,2.4kbps 美國國家安全局美國國家安全局1989年采用年采用CELPC算法,算法,4.8kbps8.1 音頻壓縮國際標(biāo)準(zhǔn)音
9、頻壓縮國際標(biāo)準(zhǔn)u 電話質(zhì)量的音頻壓縮技術(shù)標(biāo)準(zhǔn)電話質(zhì)量的音頻壓縮技術(shù)標(biāo)準(zhǔn)13 G.722標(biāo)準(zhǔn):標(biāo)準(zhǔn):1988年,年,64kbps,從采樣頻率為,從采樣頻率為16kHZ,量化為量化為14bit的的224kbps中壓縮而來,可以在窄帶中壓縮而來,可以在窄帶ISDN中中傳送調(diào)幅廣播質(zhì)量的音頻信號傳送調(diào)幅廣播質(zhì)量的音頻信號.8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)u廣播廣播質(zhì)量的音頻壓縮技術(shù)標(biāo)準(zhǔn)質(zhì)量的音頻壓縮技術(shù)標(biāo)準(zhǔn)u高保真度立體聲音頻壓縮技術(shù)標(biāo)準(zhǔn)高保真度立體聲音頻壓縮技術(shù)標(biāo)準(zhǔn) MPEG標(biāo)準(zhǔn):標(biāo)準(zhǔn):MP3 AC-3標(biāo)準(zhǔn)標(biāo)準(zhǔn) 5.1聲道聲道(6聲道聲道):左、中、右、左環(huán)繞、右環(huán)繞、低頻:左、中、右、左環(huán)
10、繞、右環(huán)繞、低頻增強增強(頻率在頻率在20120HZ,0.1聲道聲道) 采樣頻率采樣頻率48kHZ,量化,量化1622bit。14 MP3 MP3的全名是的全名是MPEG Audio Layer-3MPEG Audio Layer-3,簡單地說就是,簡單地說就是一種聲音文件的壓縮格式。是目前最普及的音頻壓縮一種聲音文件的壓縮格式。是目前最普及的音頻壓縮格式,是典型的有損壓縮。格式,是典型的有損壓縮。 MPEG-1MPEG-1音頻壓縮標(biāo)準(zhǔn)里包括了三個使用高性能音頻音頻壓縮標(biāo)準(zhǔn)里包括了三個使用高性能音頻數(shù)據(jù)壓縮方法的感知編碼方案數(shù)據(jù)壓縮方法的感知編碼方案 ,按照壓縮質(zhì)量,按照壓縮質(zhì)量( (每每Bi
11、tBit的聲音效果的聲音效果) )和編碼方案的復(fù)雜程度分別是和編碼方案的復(fù)雜程度分別是Layer1Layer1、Layer2Layer2、Layer3Layer3。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)15MPEG-1MPEG-1音頻的層次與壓縮比率音頻的層次與壓縮比率 Layer1(相當(dāng)于相當(dāng)于384kbps立體聲信號立體聲信號)4:1Layer2(相當(dāng)于相當(dāng)于192256kbps立體聲信號立體聲信號)6:18:1Layer3 (相當(dāng)于相當(dāng)于112154kbps立體聲信號立體聲信號)10:112:18.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)16 層
12、層1的編碼器最為簡單,編碼器的輸出數(shù)據(jù)率為的編碼器最為簡單,編碼器的輸出數(shù)據(jù)率為384 kb/s,主要用于小型數(shù)字盒式磁帶主要用于小型數(shù)字盒式磁帶(digital compact cassette,DCC)。 層層2的編碼器的復(fù)雜程度屬中等,編碼器的輸出數(shù)據(jù)率為的編碼器的復(fù)雜程度屬中等,編碼器的輸出數(shù)據(jù)率為256 kb/s192 kb/s,其應(yīng)用包括數(shù)字廣播聲音,其應(yīng)用包括數(shù)字廣播聲音(digital broadcast audio,DBA)、數(shù)字音樂、數(shù)字音樂、CD-I(compact disc-interactive)和和VCD(video compact disc)等。等。 層層3的編碼
13、器最為復(fù)雜,編碼器的輸出數(shù)據(jù)率為的編碼器最為復(fù)雜,編碼器的輸出數(shù)據(jù)率為64 kb/s,廣泛用于廣泛用于INTERNET傳播。傳播。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)17lMPEG的聲音數(shù)據(jù)分成幀的聲音數(shù)據(jù)分成幀(frame),層,層1每幀包含每幀包含384個個樣本的數(shù)據(jù),每幀由樣本的數(shù)據(jù),每幀由32個子帶分別輸出的個子帶分別輸出的12個樣本組成。個樣本組成。l層層即稱掩蔽模式通用子帶集成編碼與多路復(fù)用,層即稱掩蔽模式通用子帶集成編碼與多路復(fù)用,層2對層對層1作了一些直觀的改進,相當(dāng)于作了一些直觀的改進,相當(dāng)于3個層個層1的幀,每幀的幀,每幀有有1152個樣本。它使用
14、的心理聲學(xué)模型除了使用頻域掩個樣本。它使用的心理聲學(xué)模型除了使用頻域掩蔽特性之外還利用了時間掩蔽特性,并且在低、中和高蔽特性之外還利用了時間掩蔽特性,并且在低、中和高頻段對位分配作了一些限制,對位分配、比例因子和量頻段對位分配作了一些限制,對位分配、比例因子和量化樣本值的編碼也更緊湊?;瘶颖局档木幋a也更緊湊。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)18l由于層由于層2采用了上述措施,因此所需的位數(shù)減少了,采用了上述措施,因此所需的位數(shù)減少了,這樣就可以有更多的位用來表示聲音數(shù)據(jù),音質(zhì)也這樣就可以有更多的位用來表示聲音數(shù)據(jù),音質(zhì)也比層比層1更高。更高。 l典型的碼流為每通道
15、典型的碼流為每通道128 Kbit/S,廣泛應(yīng)用于數(shù)字音,廣泛應(yīng)用于數(shù)字音頻廣播、數(shù)字演播室等數(shù)字音頻專業(yè)的制作、交流、頻廣播、數(shù)字演播室等數(shù)字音頻專業(yè)的制作、交流、存儲和傳送。存儲和傳送。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)192021lMUX(多路復(fù)合器多路復(fù)合器)相當(dāng)相當(dāng)“數(shù)據(jù)流幀包裝數(shù)據(jù)流幀包裝”,它按規(guī)定的幀,它按規(guī)定的幀格式對聲音樣本和編碼信息格式對聲音樣本和編碼信息(包括比特分配合比例因子等包括比特分配合比例因子等)進行包裝。進行包裝。l每幀都包含:每幀都包含:用于同步和記錄該幀信息的同步頭,長度用于同步和記錄該幀信息的同步頭,長度為為32位位用于檢查是
16、否有錯誤的循環(huán)冗余碼用于檢查是否有錯誤的循環(huán)冗余碼(cyclic redundancy code,CRC),長度為,長度為16位,位,用于描述位分用于描述位分配的位分配域,長度為配的位分配域,長度為4位,位,比例因子域,長度為比例因子域,長度為6位,位,子帶樣本域,子帶樣本域,有可能添加的附加數(shù)據(jù)域,長度未規(guī)定。有可能添加的附加數(shù)據(jù)域,長度未規(guī)定。 8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)2223l層層3 3使用比較好的臨界頻帶濾波器,把聲音頻帶分成非等使用比較好的臨界頻帶濾波器,把聲音頻帶分成非等帶寬的子帶,心理聲學(xué)模型除了使用頻域掩蔽特性和時帶寬的子帶,心理聲學(xué)模型除
17、了使用頻域掩蔽特性和時間掩蔽特性之外,還考慮了立體聲數(shù)據(jù)的冗余,并且使間掩蔽特性之外,還考慮了立體聲數(shù)據(jù)的冗余,并且使用了用了赫夫曼赫夫曼(Huffman)(Huffman)編碼器。編碼器。 l雖然層雖然層3 3所用的濾波器組與層所用的濾波器組與層1 1和層和層2 2所用的濾波器組的結(jié)所用的濾波器組的結(jié)構(gòu)相同,但是層構(gòu)相同,但是層3 3還使用了還使用了改進離散余弦變換改進離散余弦變換(modified (modified discrete cosine transformdiscrete cosine transform,MDCT)MDCT),對層,對層1 1和層和層2 2的濾的濾波器組的不足
18、作了一些補償波器組的不足作了一些補償 8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)24l除了使用除了使用MDCTMDCT外,層外,層3 3還采用了其他許多改進措施來提高壓還采用了其他許多改進措施來提高壓縮比而不降低音質(zhì)。雖然層縮比而不降低音質(zhì)。雖然層3 3引入了許多復(fù)雜的概念,但是引入了許多復(fù)雜的概念,但是它的計算量并沒有比層它的計算量并沒有比層2 2增加很多。增加的主要是編碼器的增加很多。增加的主要是編碼器的復(fù)雜度和解碼器所需要的存儲容量復(fù)雜度和解碼器所需要的存儲容量l層層是綜合于層是綜合于層和和ASPECASPEC(自適應(yīng)譜分析聽覺熵編碼)的(自適應(yīng)譜分析聽覺熵編碼)的優(yōu)
19、點提出的混合壓縮技術(shù),優(yōu)點提出的混合壓縮技術(shù),MP3MP3的復(fù)雜度相對較高,典型碼的復(fù)雜度相對較高,典型碼流為流為64 Kbit/S64 Kbit/S,在低碼率下有高品質(zhì)的音質(zhì)。,在低碼率下有高品質(zhì)的音質(zhì)。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMPEG-1標(biāo)準(zhǔn)標(biāo)準(zhǔn)25 MP3MP3是利用是利用 MPEG Audio Layer 3 MPEG Audio Layer 3 的技術(shù),將音樂以的技術(shù),將音樂以1:10 1:10 甚甚至至 1:12 1:12 的壓縮率,壓縮成容量較小的文件,換句話說,能夠的壓縮率,壓縮成容量較小的文件,換句話說,能夠在音質(zhì)丟失很小的情況下把文件壓縮到更小的程度。而且
20、還非在音質(zhì)丟失很小的情況下把文件壓縮到更小的程度。而且還非常好的保持了原來的音質(zhì)。正是因為常好的保持了原來的音質(zhì)。正是因為MP3MP3體積小,音質(zhì)高的特點體積小,音質(zhì)高的特點使得使得MP3MP3格式幾乎成為網(wǎng)上音樂的代名詞。每分鐘音樂的格式幾乎成為網(wǎng)上音樂的代名詞。每分鐘音樂的MP3MP3格格式只有式只有1MB1MB左右大小,這樣每首歌的大小只有左右大小,這樣每首歌的大小只有3-43-4兆字節(jié)。使用兆字節(jié)。使用MP3MP3播放器對播放器對MP3MP3文件進行實時的解壓縮文件進行實時的解壓縮( (解碼解碼) ),這樣,高品質(zhì),這樣,高品質(zhì)的的MP3MP3音樂就播放出來了。音樂就播放出來了。8.1
21、 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMP3音頻音頻26lMP4MP4并不是并不是MPEG-4MPEG-4或者或者MPEG-1Layer4MPEG-1Layer4,它的出現(xiàn),它的出現(xiàn)是針對是針對MP3MP3的大眾化、無版權(quán)的一種保護格式。的大眾化、無版權(quán)的一種保護格式。lMP4MP4使用的是使用的是MPEG-2 AACMPEG-2 AAC技術(shù)技術(shù)也就是俗稱的也就是俗稱的a2ba2b或或AACAAC。其中,。其中,MPEG-2MPEG-2是是MPEGMPEG于于19941994年年1111月針對數(shù)月針對數(shù)碼電視碼電視( (數(shù)碼影像數(shù)碼影像) )提出的。它的提出的。它的特點特點就是,音質(zhì)就是,音質(zhì)更
22、加完美而壓縮比更加大更加完美而壓縮比更加大(1:15)(1:15)。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMP427lMPEG-2 AAC(ISO/IEC 13818-7)MPEG-2 AAC(ISO/IEC 13818-7)在采樣率為在采樣率為8 896KHz96KHz下提供了下提供了1 14848個聲道可選范圍的高質(zhì)量音個聲道可選范圍的高質(zhì)量音頻編碼。頻編碼。AACAAC就是就是Advanced Audio Coding(Advanced Audio Coding(先進先進音頻編碼音頻編碼) )的意思,適用于從比特率在的意思,適用于從比特率在8kbit/s8kbit/s單單聲道的電話音
23、質(zhì)到聲道的電話音質(zhì)到160kbit/s160kbit/s多聲道的超高質(zhì)量音多聲道的超高質(zhì)量音頻范圍內(nèi)的編碼,并且允許對多媒體進行編碼頻范圍內(nèi)的編碼,并且允許對多媒體進行編碼/ /解解碼。碼。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMP428lAACAAC與與MP3MP3相比,增加了諸如對立體聲的完美再現(xiàn)、相比,增加了諸如對立體聲的完美再現(xiàn)、比特流效果音掃描、多媒體控制、降噪優(yōu)異等比特流效果音掃描、多媒體控制、降噪優(yōu)異等MP3MP3沒有的特性,使得在音頻壓縮后仍能完美的再現(xiàn)沒有的特性,使得在音頻壓縮后仍能完美的再現(xiàn)CDCD音質(zhì)。音質(zhì)。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)uMP429lAAC
24、AAC技術(shù)主要由以下三個部分組成技術(shù)主要由以下三個部分組成。1.AT&TAT&T的音頻壓縮技術(shù)專利的音頻壓縮技術(shù)專利。它可以將它可以將AACAAC壓縮比提高到壓縮比提高到20:120:1而而不損失音質(zhì)。這樣,一首不損失音質(zhì)。這樣,一首3 3分鐘的歌僅僅需要分鐘的歌僅僅需要2.25MB2.25MB,這在,這在互聯(lián)網(wǎng)上的下載速度是很驚人的?;ヂ?lián)網(wǎng)上的下載速度是很驚人的。2.2.安全數(shù)據(jù)庫安全數(shù)據(jù)庫。它可以為你的它可以為你的AAC MusicAAC Music創(chuàng)建一個特定的密鑰,創(chuàng)建一個特定的密鑰,將此密鑰存于其數(shù)據(jù)庫中。同時,只有將此密鑰存于其數(shù)據(jù)庫中。同時,只有AACAAC的播放
25、器才能播的播放器才能播放含有這種密鑰的文件。放含有這種密鑰的文件。3.3.協(xié)議認(rèn)證協(xié)議認(rèn)證。這個認(rèn)證包含了復(fù)制許可、允許復(fù)制副本數(shù)目、這個認(rèn)證包含了復(fù)制許可、允許復(fù)制副本數(shù)目、歌曲總時間、歌曲可以播放時間以及售賣許可等信息。歌曲總時間、歌曲可以播放時間以及售賣許可等信息。8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)u MP430lMP4MP4技術(shù)的優(yōu)越性要遠遠高于技術(shù)的優(yōu)越性要遠遠高于MP3MP3,因為它更適合多媒體技術(shù),因為它更適合多媒體技術(shù)的發(fā)展以及視聽欣賞的需求。但是,的發(fā)展以及視聽欣賞的需求。但是,MP4MP4是一種商品,它利是一種商品,它利用改良后的用改良后的MPEG-2 AACMPEG
26、-2 AAC技術(shù)并強加上由出版公司直接授權(quán)的技術(shù)并強加上由出版公司直接授權(quán)的知識產(chǎn)權(quán)協(xié)議作為新的標(biāo)準(zhǔn);而知識產(chǎn)權(quán)協(xié)議作為新的標(biāo)準(zhǔn);而MP3MP3是一種自由音樂格式,是一種自由音樂格式,任何人都可以自由使用。任何人都可以自由使用。lMP4MP4實際上是由音樂出版界聯(lián)合授意的官方標(biāo)準(zhǔn);實際上是由音樂出版界聯(lián)合授意的官方標(biāo)準(zhǔn);MP3MP3則是廣則是廣為流傳的民間標(biāo)準(zhǔn)。相比之下,為流傳的民間標(biāo)準(zhǔn)。相比之下,MP3MP3的靈活和自由度要遠遠的靈活和自由度要遠遠大于大于MP4MP4,這使得音樂發(fā)燒友們更傾向于使用,這使得音樂發(fā)燒友們更傾向于使用MP3MP3。lMP3MP3是目前最為流行的一種音樂格式,它占
27、據(jù)著大量的網(wǎng)絡(luò)是目前最為流行的一種音樂格式,它占據(jù)著大量的網(wǎng)絡(luò)資源,這使得資源,這使得MP4MP4的推廣普及難上加難。的推廣普及難上加難。 8.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn)u MP3 與與 MP4318.1 音頻壓縮國際標(biāo)準(zhǔn)音頻壓縮國際標(biāo)準(zhǔn) 8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)8.3 視頻壓縮國際標(biāo)準(zhǔn)視頻壓縮國際標(biāo)準(zhǔn)第八章第八章 音視頻壓縮國際標(biāo)準(zhǔn)音視頻壓縮國際標(biāo)準(zhǔn)32 JPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn):用于灰度或彩色圖像的壓縮標(biāo)準(zhǔn)。適用于不太:用于灰度或彩色圖像的壓縮標(biāo)準(zhǔn)。適用于不太復(fù)雜或一般取自真實景象的圖像壓縮。壓縮比率可達復(fù)雜或一般取自真實景象的圖像壓縮。壓縮比率可達20:1或或25:1。
28、無損模式通常采用。無損模式通常采用2:1壓縮壓縮 JPEG2000:高壓縮率、無損壓縮、漸進傳輸、興趣區(qū)域壓:高壓縮率、無損壓縮、漸進傳輸、興趣區(qū)域壓縮、色彩模式、圖像處理簡單??s、色彩模式、圖像處理簡單。 靜態(tài)圖像壓縮技術(shù)主要是對空間信息進行壓縮,目的是在靜態(tài)圖像壓縮技術(shù)主要是對空間信息進行壓縮,目的是在滿足一定圖像質(zhì)量的條件下,縮小圖像文件所占用的存儲空滿足一定圖像質(zhì)量的條件下,縮小圖像文件所占用的存儲空間,從而減小存儲容量和占用盡量小的網(wǎng)絡(luò)帶寬。間,從而減小存儲容量和占用盡量小的網(wǎng)絡(luò)帶寬。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u 靜態(tài)圖像數(shù)據(jù)壓縮靜態(tài)圖像數(shù)據(jù)壓縮33l 國際標(biāo)準(zhǔn)化組織國
29、際標(biāo)準(zhǔn)化組織(ISO)(ISO)和國際電報電話咨詢委員會和國際電報電話咨詢委員會(CCITT)(CCITT)聯(lián)合成立的聯(lián)合成立的“聯(lián)合圖像專家組聯(lián)合圖像專家組”JPEGJPEG(Joint(Joint Photograph coding Experts Group)Photograph coding Experts Group)于于19911991年提出的年提出的“多灰度靜止圖像的數(shù)字壓縮編碼多灰度靜止圖像的數(shù)字壓縮編碼”( (簡稱簡稱JPEGJPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn)) )。l 這是一個適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止這是一個適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn),是最常用的圖像文
30、件格式,是數(shù)字圖像的壓縮標(biāo)準(zhǔn),是最常用的圖像文件格式,是一種有損壓縮,壓縮比很大。一種有損壓縮,壓縮比很大。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn)34 隨著多媒體應(yīng)用領(lǐng)域的快速增長,傳統(tǒng)隨著多媒體應(yīng)用領(lǐng)域的快速增長,傳統(tǒng)JPEGJPEG壓縮技術(shù)已無法滿足人們對數(shù)字化多媒體圖像資壓縮技術(shù)已無法滿足人們對數(shù)字化多媒體圖像資料的要求。針對這些問題,專家們開始了下一代料的要求。針對這些問題,專家們開始了下一代JPEG 2000JPEG 2000標(biāo)準(zhǔn)的制定,最終標(biāo)準(zhǔn)于標(biāo)準(zhǔn)的制定,最終標(biāo)準(zhǔn)于20002000年年1212月出月出臺。臺。 JPEG 2000JPEG 2000的特點的特點
31、: : 高壓縮率高壓縮率 有損有損/無損壓縮無損壓縮 漸進傳輸漸進傳輸 感興趣區(qū)域壓縮感興趣區(qū)域壓縮 色彩模式色彩模式 圖像處理簡單圖像處理簡單 8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG-2000 標(biāo)準(zhǔn)標(biāo)準(zhǔn)35標(biāo)準(zhǔn)標(biāo)準(zhǔn)JPEGJPEG 2000主要編碼主要編碼技術(shù)技術(shù)離散余弦變換(離散余弦變換(DCT)知覺量化知覺量化Zigzag掃描掃描霍夫曼編碼霍夫曼編碼算術(shù)編碼算術(shù)編碼離散小波變化(離散小波變化(DWT)EBCOT核心算法核心算法ROI編碼編碼空間可擴展編碼空間可擴展編碼質(zhì)量可擴展編碼質(zhì)量可擴展編碼面向?qū)ο缶幋a面向?qū)ο缶幋a位圖形狀編碼位圖形狀編碼容錯編碼、容錯編碼、TCQ、零數(shù)
32、掃描、零數(shù)掃描壓縮比壓縮比230250算法效率算法效率30:1以上急劇下降以上急劇下降100:1以上急劇衰減以上急劇衰減速率失真速率失真特性特性比比JPEG提高提高30%應(yīng)用場合應(yīng)用場合Internet數(shù)字照相數(shù)字照相圖像視頻編輯圖像視頻編輯Internet數(shù)字照相數(shù)字照相數(shù)字圖書館數(shù)字圖書館電子商務(wù)電子商務(wù)打印、掃描、傳真、遙感打印、掃描、傳真、遙感JPEG與與JPEG 2000的性能比較的性能比較36JPEG與與JPEG 2000的性能比較的性能比較JPEG2000(1:137) JPEG(1:137)37lISO聯(lián)合圖像專家組為單幀彩色圖像的壓縮制訂,可以由用戶聯(lián)合圖像專家組為單幀彩色圖
33、像的壓縮制訂,可以由用戶自行設(shè)定壓縮比例自行設(shè)定壓縮比例8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn)38 與彩色空間無關(guān),因此與彩色空間無關(guān),因此RGBYUV,YUVRGB的的變換不包含在變換不包含在JPEG算法中算法中; JPEG算法處理彩色圖像是單獨的彩色分量圖像,可算法處理彩色圖像是單獨的彩色分量圖像,可壓縮不同彩色空間的數(shù)據(jù)壓縮不同彩色空間的數(shù)據(jù); 采用混合編碼方法采用混合編碼方法; 采用采用DPCM的無失真壓縮算法的無失真壓縮算法; 采用采用DCT加行程編碼的有失真壓縮算法加行程編碼的有失真壓縮算法;8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)編碼方法標(biāo)準(zhǔn)
34、編碼方法39 基本系統(tǒng):是一種基于基本系統(tǒng):是一種基于DCT的簡化編碼方法,該系統(tǒng)保的簡化編碼方法,該系統(tǒng)保證必須的功能,可滿足大多數(shù)應(yīng)用的要求。所有證必須的功能,可滿足大多數(shù)應(yīng)用的要求。所有JPEG編解碼器都必須支持基本系統(tǒng)。輸入圖像精度為編解碼器都必須支持基本系統(tǒng)。輸入圖像精度為8bits/像素像素/色,支持順序模式,采用色,支持順序模式,采用Huffman編碼編碼 擴展系統(tǒng):是為了滿足更為廣闊的應(yīng)用要求而設(shè)置的。擴展系統(tǒng):是為了滿足更為廣闊的應(yīng)用要求而設(shè)置的。增強了數(shù)據(jù)壓縮能力,輸入圖像精度可達增強了數(shù)據(jù)壓縮能力,輸入圖像精度可達12bits/像素像素/色,支持漸進模式,可采用哈夫曼編碼
35、和算術(shù)編碼色,支持漸進模式,可采用哈夫曼編碼和算術(shù)編碼8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的兩種系統(tǒng)標(biāo)準(zhǔn)的兩種系統(tǒng)40 DCT順序模式:其基本算法是將圖像分成順序模式:其基本算法是將圖像分成88的塊,然后的塊,然后進行進行DCT變換、量化和熵編碼(哈夫曼編碼)。這種模式變換、量化和熵編碼(哈夫曼編碼)。這種模式每個圖像分量的編碼一次掃描完成的。每個圖像分量的編碼一次掃描完成的。 DCT漸進模式:所采用的算法與漸進模式:所采用的算法與DCT順序模式相類似,不順序模式相類似,不同的是需要對圖像進行多次掃描同的是需要對圖像進行多次掃描, 先傳送部分先傳送部分DCT系數(shù)信系數(shù)信息息
36、(如低頻帶的系數(shù)或所有系數(shù)的近似值)如低頻帶的系數(shù)或所有系數(shù)的近似值),使接收端盡快使接收端盡快獲得一個獲得一個“初略初略”的圖像,然后再將剩余頻帶的系數(shù)漸次的圖像,然后再將剩余頻帶的系數(shù)漸次傳送,最終形成清晰的圖像。傳送,最終形成清晰的圖像。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的四種編碼模式標(biāo)準(zhǔn)的四種編碼模式418.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的四種編碼模式標(biāo)準(zhǔn)的四種編碼模式42 無失真編碼模式:采用一維或二維的空間域無失真編碼模式:采用一維或二維的空間域DPCM和熵編和熵編碼。由于輸入圖像已經(jīng)是數(shù)字化的,經(jīng)過空間域的碼。由于輸入圖像已經(jīng)是數(shù)字化的
37、,經(jīng)過空間域的DPCM之后,預(yù)測誤差值也是一個離散量,因此可以不再量化而之后,預(yù)測誤差值也是一個離散量,因此可以不再量化而實現(xiàn)無失真編碼。實現(xiàn)無失真編碼。 分層編碼模式分層編碼模式 這是對一幅原始圖像的空間分辨率,分成這是對一幅原始圖像的空間分辨率,分成多個分辨率進行多個分辨率進行“錐形錐形”的編碼方法,水平的編碼方法,水平(垂直垂直)方向分方向分辨率的下降以辨率的下降以2的倍數(shù)因子改變的倍數(shù)因子改變,先對分辨率最低的一層圖先對分辨率最低的一層圖像進行編碼,然后將經(jīng)過內(nèi)插的該層圖像作為下一層圖像像進行編碼,然后將經(jīng)過內(nèi)插的該層圖像作為下一層圖像的預(yù)測值,再對預(yù)測誤差進行編碼,以次類推,直到底層
38、。的預(yù)測值,再對預(yù)測誤差進行編碼,以次類推,直到底層。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的四種編碼模式標(biāo)準(zhǔn)的四種編碼模式43原圖象數(shù)據(jù)原圖象數(shù)據(jù)預(yù)測器預(yù)測器熵編碼器熵編碼器壓縮圖象數(shù)據(jù)壓縮圖象數(shù)據(jù)碼表說明碼表說明8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的無失真預(yù)測編碼標(biāo)準(zhǔn)的無失真預(yù)測編碼44l無失真編碼器采用三鄰域采樣值法,由無失真編碼器采用三鄰域采樣值法,由a,b,c預(yù)測預(yù)測x,得,得xl對對xx的差進行無失真的編碼(可采用哈夫曼編碼)的差進行無失真的編碼(可采用哈夫曼編碼)l壓縮比低:壓縮比低:2:1序號序號X值值序號序號X值值0非預(yù)測非預(yù)測4a+b+
39、c1a5a+(b-c)/2)2b6b+(a-c)/2)3c7(a+b)/28.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的四種編碼模式標(biāo)準(zhǔn)的四種編碼模式45DCT正變換正變換量化器量化器熵編碼器熵編碼器碼表說明碼表說明碼表說明碼表說明編碼器編碼器8*8塊塊源圖像源圖像數(shù)據(jù)數(shù)據(jù)基于基于DCT編碼的簡化框圖編碼的簡化框圖壓縮后的壓縮后的圖像數(shù)據(jù)圖像數(shù)據(jù)8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼l先進行先進行DCT正變換,然后再對正變換,然后再對DCT系數(shù)進行量化,并對量化后的系數(shù)進行量化,并對量化后的直流(直流(DC)系
40、數(shù)和交流()系數(shù)和交流(AC)系數(shù)分別進行差分編碼和行程編)系數(shù)分別進行差分編碼和行程編碼,最后再進行熵編碼。碼,最后再進行熵編碼。46DCT逆變換逆變換量化器量化器碼表說明碼表說明碼表說明碼表說明恢復(fù)的圖像恢復(fù)的圖像數(shù)據(jù)數(shù)據(jù)解碼器解碼器熵解碼器熵解碼器壓縮的圖壓縮的圖像數(shù)據(jù)像數(shù)據(jù)基于基于DCT解碼器的簡明框圖解碼器的簡明框圖8*8塊塊8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼v說明:以上給出的是單個彩色分量的編碼、解碼過程,對于說明:以上給出的是單個彩色分量的編碼、解碼過程,對于彩色圖像,可將多個分量分別處理彩色圖像,可將多
41、個分量分別處理47 數(shù)據(jù)單元數(shù)據(jù)單元 無損模式:一個像素為一個數(shù)據(jù)單元無損模式:一個像素為一個數(shù)據(jù)單元 有損模式:采用有損模式:采用88像素塊作為一個數(shù)據(jù)單元像素塊作為一個數(shù)據(jù)單元8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼48 數(shù)據(jù)單元的處理數(shù)據(jù)單元的處理 逐行排序:每個分量數(shù)據(jù)單元的處理從左向右、從上向逐行排序:每個分量數(shù)據(jù)單元的處理從左向右、從上向下,一個分量接一個分量,對于圖像的解碼需要全部完下,一個分量接一個分量,對于圖像的解碼需要全部完成才能正確顯示圖像。成才能正確顯示圖像。 交叉排序:不同分量的交叉數(shù)據(jù)交叉排序:不
42、同分量的交叉數(shù)據(jù) 單元組合成最小編碼單元單元組合成最小編碼單元MCU, 編碼時可以按編碼時可以按MCU進行,解碼時進行,解碼時 可以一個可以一個MCU一個一個MCU地顯示地顯示 圖像,甚至允許對圖像部分解碼。圖像,甚至允許對圖像部分解碼。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼49|編碼步驟編碼步驟切割分塊切割分塊 JPEG采用采用8X8像素的二維像素的二維DCT變換,在編碼器輸入變換,在編碼器輸入端把原始圖像順序分割成端把原始圖像順序分割成8X8的子塊,分割可采用逐的子塊,分割可采用逐行排序或交叉排序方法。如果原始圖像的采
43、樣精度為行排序或交叉排序方法。如果原始圖像的采樣精度為P位,是無符號整數(shù),則將位,是無符號整數(shù),則將0,2P-1轉(zhuǎn)換為轉(zhuǎn)換為-2P-1,2P-1-1的有符號整數(shù),作為的有符號整數(shù),作為DCT的輸入。的輸入。 解碼時,經(jīng)解碼時,經(jīng)DCT逆變換后得到逆變換后得到8X8的圖像數(shù)據(jù)塊,在的圖像數(shù)據(jù)塊,在將將-2P-1,2P-1-1變回變回0,2P-1,獲得重構(gòu)的圖像。,獲得重構(gòu)的圖像。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼50|編碼步驟編碼步驟DCT變換變換 對原始圖像的所有數(shù)據(jù)塊進行對原始圖像的所有數(shù)據(jù)塊進行DCT變換,每個數(shù)據(jù)
44、塊變換,每個數(shù)據(jù)塊經(jīng)過經(jīng)過DCT變換后,輸出變換后,輸出64個個DCT變換系數(shù),形成一個變換系數(shù),形成一個8X8矩陣,其中包含一個代表直流分量的矩陣,其中包含一個代表直流分量的DC系數(shù)(矩系數(shù)(矩陣的左上角,代表此塊的彩色分量的平均值)和陣的左上角,代表此塊的彩色分量的平均值)和63個個代表交流分量的代表交流分量的AC系數(shù)(代表該塊的彩色分量的起伏系數(shù)(代表該塊的彩色分量的起伏變化的劇烈程度)變化的劇烈程度)8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼51|編碼步驟編碼步驟 DCT變換變換 將將88像素塊映射到頻域上,即選用像素
45、塊映射到頻域上,即選用64個因子代個因子代表各個不同的水平和垂直亮度,將其描述為表各個不同的水平和垂直亮度,將其描述為DCT基本函數(shù)的組合。基本函數(shù)的組合。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼528.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼53|編碼步驟編碼步驟 DCT變換變換 DCT逆變換通過這逆變換通過這64個個DCT變換系數(shù)重建這變換系數(shù)重建這8X8圖像,由于計算過程中的精度損失和量化,不可圖像,由于計算過程中的精度損失和量化,不可能完全恢復(fù)原始圖像
46、能完全恢復(fù)原始圖像有損壓縮。有損壓縮。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼54|編碼步驟編碼步驟 量化量化 為達到壓縮數(shù)據(jù)的目的,對為達到壓縮數(shù)據(jù)的目的,對DCT變換系數(shù)變換系數(shù)F(u,v)進進行量化處理。量化是造成圖像質(zhì)量下降的最主要原行量化處理。量化是造成圖像質(zhì)量下降的最主要原因。利用人的視覺特性,經(jīng)過大量實驗,獲得了量因。利用人的視覺特性,經(jīng)過大量實驗,獲得了量化表化表Q(u,v)。量化公式為。量化公式為 FQ(u,v)=Integer ( Round(F(u,v)/Q(u,v) 解壓縮時反量化公式為:解壓縮時反量
47、化公式為: FQ(u,v)=FQ (u,v)*Q(u,v)8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼551611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399171824479999999918212666999999992426569999999999476699999999999999999999999
48、99999999999999999999999999999999999999999999999999999亮度量化表亮度量化表色度量化表色度量化表56|編碼步驟編碼步驟 DCT系數(shù)的處理系數(shù)的處理 DC系數(shù):系數(shù):DCT變換系數(shù)經(jīng)過量化后,直流分量變換系數(shù)經(jīng)過量化后,直流分量DC數(shù)值數(shù)值比大,而且相鄰的兩個比大,而且相鄰的兩個8X8塊的塊的DC系數(shù)有很強的相關(guān)系數(shù)有很強的相關(guān)性,變化不大,性,變化不大, 因此采用因此采用DPCM對相鄰兩塊的對相鄰兩塊的DC的差的差值值Delta進行編碼進行編碼DeltaDCiDCi-18.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DC
49、T的有失真壓縮編碼的有失真壓縮編碼57|編碼步驟編碼步驟 DCT系數(shù)的處理系數(shù)的處理 AC系數(shù):系數(shù):DCT變換系數(shù)經(jīng)過量化之后,有大量變換系數(shù)經(jīng)過量化之后,有大量AC會會變成變成0,可采用游程編碼進一步進行數(shù)據(jù)壓縮。為增,可采用游程編碼進一步進行數(shù)據(jù)壓縮。為增加編碼效率,采用加編碼效率,采用“Z”字形的次序來進行游程編碼,字形的次序來進行游程編碼,可以增加連續(xù)可以增加連續(xù)0的個數(shù)。的個數(shù)。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼58|編碼步驟編碼步驟哈夫曼編碼哈夫曼編碼 DC和和AC系數(shù)進行系數(shù)進行DPCM和行程編碼后,對
50、其編碼后和行程編碼后,對其編碼后的數(shù)據(jù)再次進行哈夫曼編碼,以提高壓縮效率。的數(shù)據(jù)再次進行哈夫曼編碼,以提高壓縮效率。|編碼步驟編碼步驟組成位數(shù)據(jù)流組成位數(shù)據(jù)流 這是這是JPEG編碼的最后一個步驟,即把各種標(biāo)記代碼編碼的最后一個步驟,即把各種標(biāo)記代碼和圖像編碼后的圖像數(shù)據(jù)組成一幀一幀的數(shù)據(jù),以便于傳和圖像編碼后的圖像數(shù)據(jù)組成一幀一幀的數(shù)據(jù),以便于傳輸、存儲和譯碼器譯碼。輸、存儲和譯碼器譯碼。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼59示例示例:8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)608.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)
51、示例示例:61塊效應(yīng)塊效應(yīng)8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼62AC components are divided by 2DC2222222222222222222222444444444444444444444AC components are divided by 4Low High Low High 自適應(yīng)量化例自適應(yīng)量化例Sensitive for human eyesLess sensitive for human eyes8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失
52、真壓縮編碼的有失真壓縮編碼63231-74-12-2-3-5-20-102-5312011-13141-110-10-90-1-211110-2-2101000-222011000-110011000110-10231-74-12-1-1-2-10-102-5101000-137000000-400-100000-1-1000000-11100000000000000000000自適應(yīng)量化結(jié)果自適應(yīng)量化結(jié)果Adaptive Quantization8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼64v EOB (End Of Blo
53、ck) is transmitted instead of zerosEOB231-74-12-1-1-2-10-102-5101000-137000000-400-100000-1-1000000-110000000000000000000008.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn)u JPEG標(biāo)準(zhǔn)的基于標(biāo)準(zhǔn)的基于DCT的有失真壓縮編碼的有失真壓縮編碼65JPEG 2000u JPEG 2000概述概述u JPEG2000的核心編碼系統(tǒng)的核心編碼系統(tǒng)u ROI 編碼編碼66uJPEG 2000是是ISO與與CCITT/ITU共同成立的聯(lián)合圖共同成立的聯(lián)合圖像專家組(像專家組(JPEG),于)
54、,于2000年底開始推出的一種年底開始推出的一種基于小波變換的靜態(tài)圖像壓縮標(biāo)準(zhǔn)基于小波變換的靜態(tài)圖像壓縮標(biāo)準(zhǔn)(ISO/IEC 15444-112,ITU T.800808)。u統(tǒng)一了統(tǒng)一了2值圖像編碼標(biāo)準(zhǔn)值圖像編碼標(biāo)準(zhǔn)JBIG、無損壓縮編碼標(biāo)準(zhǔn)、無損壓縮編碼標(biāo)準(zhǔn)JPEG-LS以及原來的以及原來的JPEG編碼標(biāo)準(zhǔn),編碼標(biāo)準(zhǔn),u支持更多的顏色分量和更大的顏色深度,具有多分支持更多的顏色分量和更大的顏色深度,具有多分辨率表示和漸進傳輸功能,辨率表示和漸進傳輸功能,u同時支持有損和無損壓縮,比同時支持有損和無損壓縮,比JPEG標(biāo)準(zhǔn)的壓縮率標(biāo)準(zhǔn)的壓縮率更高、性能更優(yōu)秀。更高、性能更優(yōu)秀。8.2 圖像壓縮
55、國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn) - JPEG200067uJPEG2000 是新的圖像壓縮標(biāo)準(zhǔn)是新的圖像壓縮標(biāo)準(zhǔn), 其目標(biāo)是:其目標(biāo)是: 在一個統(tǒng)一的集成系統(tǒng)中在一個統(tǒng)一的集成系統(tǒng)中, 允許使用不同的圖像模型允許使用不同的圖像模型(如如客戶客戶/ 服務(wù)器、實時傳輸、圖像庫驅(qū)動、有限緩沖和帶服務(wù)器、實時傳輸、圖像庫驅(qū)動、有限緩沖和帶寬資源等寬資源等) 對具有不同特征對具有不同特征(如自然圖像、醫(yī)療圖像、遙感圖像等如自然圖像、醫(yī)療圖像、遙感圖像等) 的不同類型的不同類型(如二值、灰度、彩色或者多分量圖像如二值、灰度、彩色或者多分量圖像) 的靜的靜止圖像進行壓縮止圖像進行壓縮 在低比特率的情況下在低比特率
56、的情況下,獲得比目前標(biāo)準(zhǔn)更好的率失真性獲得比目前標(biāo)準(zhǔn)更好的率失真性能和主觀圖像質(zhì)量。能和主觀圖像質(zhì)量。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn) - JPEG200068u JPEG2000的主要特點的主要特點 (1) 良好的低比特率壓縮性能良好的低比特率壓縮性能 這是這是J PEG2000 最主要的特征。目前的最主要的特征。目前的J PEG標(biāo)準(zhǔn)標(biāo)準(zhǔn), 對于細節(jié)分量多的灰度圖像對于細節(jié)分量多的灰度圖像, 當(dāng)編碼壓縮當(dāng)編碼壓縮率低于每像素率低于每像素0. 25bit 時時,視覺失真大。為了克視覺失真大。為了克服這一點服這一點,要求要求J PEG2000 在低比特率下在低比特率下, 具有具有良好的率
57、失真性能良好的率失真性能, 以適應(yīng)網(wǎng)絡(luò)、移動通信等以適應(yīng)網(wǎng)絡(luò)、移動通信等有限帶寬的應(yīng)用需要。有限帶寬的應(yīng)用需要。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn) - JPEG200069u JPEG2000的主要特點的主要特點 (2) 連續(xù)色調(diào)和二值圖像壓縮連續(xù)色調(diào)和二值圖像壓縮 目前的目前的J PEG標(biāo)準(zhǔn)對于自然圖像具有較好的壓標(biāo)準(zhǔn)對于自然圖像具有較好的壓縮性能縮性能, 但是當(dāng)用于計算機圖形和二值文本的但是當(dāng)用于計算機圖形和二值文本的壓縮時壓縮時, 性能變差性能變差, 不適用于復(fù)合文本壓縮。為不適用于復(fù)合文本壓縮。為了改進這一點了改進這一點,J PEG2000 在同一系統(tǒng)中采用在同一系統(tǒng)中采用相似的
58、方法相似的方法, 能夠?qū)ψ匀粓D像、復(fù)合文本、醫(yī)能夠?qū)ψ匀粓D像、復(fù)合文本、醫(yī)學(xué)圖像、計算機圖形等具有不同特征、不同類學(xué)圖像、計算機圖形等具有不同特征、不同類型的圖像進行壓縮。型的圖像進行壓縮。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn) - JPEG200070u JPEG2000的主要特點的主要特點 (3) 有損和無損壓縮有損和無損壓縮: 對于目前的對于目前的J PEG標(biāo)準(zhǔn)標(biāo)準(zhǔn), 在同一個壓縮碼流中不在同一個壓縮碼流中不能同時提供有損和無損兩種壓縮能同時提供有損和無損兩種壓縮,而在而在JPEG2000 系統(tǒng)中系統(tǒng)中, 通過選擇參數(shù)通過選擇參數(shù), 能夠?qū)D像進行有損和無能夠?qū)D像進行有損和無損兩種壓
59、縮損兩種壓縮, 可滿足圖像質(zhì)量要求很高的醫(yī)學(xué)圖可滿足圖像質(zhì)量要求很高的醫(yī)學(xué)圖像、圖像庫等方面的處理需要。像、圖像庫等方面的處理需要。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn) - JPEG200071u JPEG2000的主要特點的主要特點 (4) 按像素精度或分辨率進行漸進式傳輸按像素精度或分辨率進行漸進式傳輸: 漸進式圖像傳輸允許圖像按照所需的分辨率或漸進式圖像傳輸允許圖像按照所需的分辨率或象素精度進行重構(gòu)象素精度進行重構(gòu), 用戶根據(jù)需要用戶根據(jù)需要,對圖像傳輸對圖像傳輸進行控制進行控制,在獲得所需的圖像分辨率或質(zhì)量要在獲得所需的圖像分辨率或質(zhì)量要求后求后,便可終止解碼便可終止解碼,而不必接
60、收整個圖像壓縮而不必接收整個圖像壓縮碼流。碼流。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn) - JPEG200072uJPEG2000的主要特點的主要特點 (5) 隨機獲取和處理碼流隨機獲取和處理碼流: 由于由于JPEG2000 采用小波技術(shù)采用小波技術(shù),利用其局部分利用其局部分辨特性辨特性,在不解壓的情況下在不解壓的情況下,可隨機獲取某些感可隨機獲取某些感興趣的圖像區(qū)域興趣的圖像區(qū)域(ROI) 的壓縮碼流的壓縮碼流, 對壓縮的圖對壓縮的圖像數(shù)據(jù)進行傳輸、濾波等操作。像數(shù)據(jù)進行傳輸、濾波等操作。8.2 圖像壓縮國際標(biāo)準(zhǔn)圖像壓縮國際標(biāo)準(zhǔn) - JPEG200073uJPEG2000的主要特點的主要特點 (6) 強的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 叉車轉(zhuǎn)讓回收合同范本
- 仿古門窗加工合同范本
- 午托員工合同范本
- 教學(xué)提質(zhì)增效課題申報書
- 農(nóng)村合作社有些合同范例
- 克拉瑪依勞動合同范本
- 員工離職接觸合同范本
- 廠房拆除門窗合同范本
- 中介融資合同范本
- 叫做招標(biāo)性質(zhì)合同范本
- 2024屆北京市各城區(qū)高三語文一模分類匯編:語言基礎(chǔ)試題及答案
- 臨床醫(yī)學(xué)檢驗:臨床醫(yī)學(xué)檢驗試題及答案
- 2024年四川省港航投資集團有限責(zé)任公司招聘筆試參考題庫含答案解析
- 文房四寶課件
- 2022年10月自考00018計算機應(yīng)用基礎(chǔ)真題及答案含解析
- 藍曬創(chuàng)作方案
- 醫(yī)院隔離技術(shù)標(biāo)準(zhǔn)2023
- 探討630MW超臨界機組深度調(diào)峰安全技術(shù)措施
- 紅色旅游線路
- 柔性印刷技術(shù)課件
- 膝骨關(guān)節(jié)炎中醫(yī)診療指南
評論
0/150
提交評論