《多媒體技術(shù)教程》-ch3_第1頁
《多媒體技術(shù)教程》-ch3_第2頁
《多媒體技術(shù)教程》-ch3_第3頁
《多媒體技術(shù)教程》-ch3_第4頁
《多媒體技術(shù)教程》-ch3_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章

多媒體數(shù)據(jù)壓縮

3.1數(shù)據(jù)壓縮的

基本原理和方法3.1數(shù)據(jù)壓縮的基本原理和方法

壓縮的必要性音頻、視頻的數(shù)據(jù)量很大,如果不進(jìn)行處理,計(jì)算機(jī)系統(tǒng)幾乎將無法對(duì)它進(jìn)行存取和交換。文本:屏幕分辨率為1024×768,字符大小為8×8點(diǎn)陣,每個(gè)字符用兩個(gè)字節(jié)表示滿屏字符的數(shù)量為:(1024/8)×(768/8)=12288(個(gè))存儲(chǔ)空間(字節(jié))為:12288×(2×8)=196688bit=24KB3.1數(shù)據(jù)壓縮的基本原理和方法矢量圖形:一幅由500條直線組成的矢量圖形,每條線的信息由起點(diǎn)X1,起點(diǎn)Y1,終點(diǎn)X2,終點(diǎn)Y2,屬性(線的顏色和寬度等性質(zhì))等五個(gè)項(xiàng)目表示。設(shè)屏幕大小為768×512,屬性位用1字節(jié)表示。每條線的存儲(chǔ)空間為:19×2+8=46bit一幅圖形需要的存儲(chǔ)空間為:500×46=2.8KB3.1數(shù)據(jù)壓縮的基本原理和方法點(diǎn)陣圖:一個(gè)簡(jiǎn)單的全屏點(diǎn)陣圖,設(shè)屏幕大小為768×512,每點(diǎn)是256色(位深為8位)一屏點(diǎn)陣圖需要的存儲(chǔ)空間為:768×512×8/8→384KB將一張11英寸×8.5英寸的彩色照片掃描輸入計(jì)算機(jī),掃描儀的分辨率設(shè)定為300dpi(點(diǎn)/英寸),每個(gè)像素的R、G、B分量分別為8位,掃描產(chǎn)生24位的真彩圖。存儲(chǔ)空間為:11×300×8.5×300×8×3/8→24.08MB3.1數(shù)據(jù)壓縮的基本原理和方法數(shù)字化聲音(語音):聲音的模擬帶寬為4KHz,采樣位數(shù):8bit,采樣頻率:8kHz1s聲音的存儲(chǔ)空間為:8k×8=64kbit=8KB

數(shù)字化高質(zhì)量音頻:聲音的模擬帶寬為22KHz,采樣位數(shù):32bit,采樣頻率:44KHz1s音頻的存儲(chǔ)空間為:44×32=1408kbit=176KB3.1數(shù)據(jù)壓縮的基本原理和方法數(shù)字化視頻(PAL制式):視頻帶寬為5MHz,幀速率為25幀/s,樣本寬是24bit,采樣頻率為10MHz,因而存儲(chǔ)一幀數(shù)字化的PAL制式視頻圖像需要的空間為:10÷25×24=9.6Mbit=1.2MB一秒種PAL制式的視頻圖像需要的存儲(chǔ)空間為:1.2×25=30MB3.1.2數(shù)據(jù)冗余的類型1.數(shù)據(jù)冗余的類型(1)空間冗余(2)時(shí)間冗余(3)信息墑冗余(4)視覺冗余(5)聽覺冗余(6)其他冗余——結(jié)構(gòu)冗余、知識(shí)冗余3.1.3數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)節(jié)省圖象或視頻的存儲(chǔ)容量,增加訪問速度,使數(shù)字視頻能在PC機(jī)上實(shí)現(xiàn),需要進(jìn)行視頻和圖象的壓縮。評(píng)價(jià)一個(gè)壓縮系統(tǒng)的三個(gè)關(guān)鍵參數(shù)壓縮比圖象質(zhì)量壓縮和解壓的速度另外也必須考慮每個(gè)壓縮算法所需的硬件和軟件。3.1.3數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)

1.壓縮比壓縮性能常常用壓縮比定義(輸入數(shù)據(jù)和輸出數(shù)據(jù)比)例:512×480,24bit/pixel輸入=737280byte輸出15000byte

壓縮比=737280/15000=493.1.3數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)2.圖象質(zhì)量壓縮方法:無損壓縮(圖象質(zhì)量不變)有損壓縮有損壓縮:失真情況很難量化,只能對(duì)測(cè)試的圖象進(jìn)行估計(jì)。模擬圖象質(zhì)量的指標(biāo):信噪比、分辨率、顏色錯(cuò),但必須在觀察了實(shí)際圖象以后。3.1.3數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)3.解壓縮速度在許多應(yīng)用中,壓縮和解壓可能不同時(shí)用,在不同的位置不同的系統(tǒng)中。所以壓縮、解壓速度分別估計(jì)。靜態(tài)圖象中,壓縮速度沒有解壓速度嚴(yán)格;動(dòng)態(tài)圖象中,壓縮、解壓速度都有要求,因?yàn)樾鑼?shí)時(shí)地從攝像機(jī)或錄像機(jī)中抓取動(dòng)態(tài)視頻。3.1.3數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)4.硬軟件系統(tǒng)有些壓縮解壓工作可用軟件實(shí)現(xiàn)。設(shè)計(jì)系統(tǒng)時(shí)必須充分考慮:算法復(fù)雜-壓縮解壓過程長算法簡(jiǎn)單-壓縮效果差目前有些特殊硬件可用于加速壓縮/解壓。硬接線系統(tǒng)速度快,但各種選擇在初始設(shè)計(jì)時(shí)已確定,一般不能更改。因此在設(shè)計(jì)硬接線壓縮/解壓系統(tǒng)時(shí)必須先將算法標(biāo)準(zhǔn)化。數(shù)據(jù)冗余的例子你的妻子,Helen,將于明天晚上6點(diǎn)零5分在上海的虹橋機(jī)場(chǎng)接你。

(23*2+10=56個(gè)半角字符)你的妻子將于明天晚上6點(diǎn)零5分在虹橋機(jī)場(chǎng)接你。

(20*2+3=43個(gè)半角字符)Helen將于明晚6點(diǎn)在虹橋機(jī)場(chǎng)接你。

(10*2+7=27個(gè)半角字符)描述語言

1.

“這是一幅2×2的圖像,圖像的第一個(gè)像素是紅的,第二個(gè)像素是紅的,第三個(gè)像素是紅的,第四個(gè)像素是紅的”。

2.“這是一幅2×2的圖像,整幅圖都是紅色的”整理圖像的描述方法可以達(dá)到壓縮的目的圖像壓縮編碼的可能性圖像無損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來的16×3×8bit=284bit壓縮為:(1+3)×8bit=32bit圖像有損壓縮的原理36353434343434323434333730343434343434343435343431343434343434343434343434343434343434343434343434342534實(shí)際圖像中冗余信息的表現(xiàn)(灰度圖)數(shù)據(jù)冗余信息分析結(jié)論由于一幅圖像存在數(shù)據(jù)冗余和主觀視覺冗余,壓縮方式從這兩方面著手來開展1)數(shù)據(jù)冗余:將圖像信息的描述方式改變之后,壓縮掉這些冗余。如統(tǒng)計(jì)冗余度、空域冗余度、時(shí)域冗余度等2)主觀視覺冗余:忽略一些視覺不太明顯的微小差異,可以進(jìn)行所謂的“有損”壓縮3.1.4數(shù)據(jù)壓縮方法分類2.數(shù)據(jù)壓縮技術(shù)分類根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致可以分為兩大類:熵編碼(冗余壓縮法),也稱無損壓縮法、無失真壓縮法。由于不會(huì)失真,多用于文本、數(shù)據(jù)的壓縮,但也有例外,非線性編輯系統(tǒng)為了保證視頻質(zhì)量,有些高檔系統(tǒng)采用的是無失真壓縮方法。熵壓縮法,也稱有損壓縮法、有失真壓縮法。大多數(shù)圖像、聲音、動(dòng)態(tài)視頻等數(shù)據(jù)的壓縮是采用有失真壓縮。3.1.4數(shù)據(jù)壓縮方法分類從信息語義角度分為“熵(平均信息量)編碼”和“源編碼”兩種:熵(平均信息量)編碼(EntropyCoding)

熵編碼是一種泛指那些不考慮被壓縮信息的性質(zhì)的編碼和壓縮技術(shù)。它是基于平均信息量的技術(shù)把所有的數(shù)據(jù)當(dāng)作比特序列,而不根據(jù)壓縮信息的類型優(yōu)化壓縮。熵編碼分為:重復(fù)序列消除編碼(含:消零、行程編碼)統(tǒng)計(jì)編碼3.1.4數(shù)據(jù)壓縮方法分類源編碼(SourceCoding)

源編碼的冗余壓縮取決于初始信號(hào)的類型、前后的相關(guān)性、信號(hào)的語義內(nèi)容等。源編碼比嚴(yán)格的平均信息量編碼的壓縮率更高。

源編碼主要分為:預(yù)測(cè)編碼變換編碼向量量化3.1.5常用數(shù)據(jù)壓縮方法的基本原理1.統(tǒng)計(jì)編碼

其方法是識(shí)別一個(gè)給定的流中出現(xiàn)頻率最高的比特或字節(jié)模式,并用比原始比特更少的比特?cái)?shù)來對(duì)其編碼。若碼流中所有模式出現(xiàn)的概率相等,則平均信息量最大,信源就沒有冗余。(1)行程編碼(RunLengthCoding)(2)LZW編碼(3)哈夫曼編碼(4)算術(shù)編碼(1)行程編碼(RunLengthCoding)

行程編碼(RLE,Run-lengthencoding)是一種非常簡(jiǎn)單的數(shù)據(jù)壓縮編碼形式。它基于簡(jiǎn)單的編碼數(shù)據(jù)原則,這個(gè)原則就是,重復(fù)的數(shù)據(jù)值序列(或稱為“流”)用一個(gè)重復(fù)次數(shù)和單個(gè)數(shù)據(jù)值來代替。這里,重復(fù)的值稱為一個(gè)“連續(xù)”(run)。

Huffman編碼Huffman編碼的步驟:(1)概率統(tǒng)計(jì),得到n個(gè)不同概率的信息符號(hào);(2)將n個(gè)信源信息符號(hào)的n個(gè)概率,按概率大小排序;(3)將n個(gè)概率中,最后兩個(gè)小概率相加,這時(shí)概率個(gè)數(shù)減為n-1個(gè);(4)將n-1個(gè)概率,按大小重新排序;(5)重復(fù)(3),將新排序后的最后兩個(gè)小概率相加,相加和與其余概率再排序;(6)如此反復(fù)重復(fù)n-2次,得到只剩兩個(gè)概率序列;(7)以二進(jìn)制碼元(0,1)賦值,構(gòu)成哈夫曼碼字,編碼結(jié)束。3.1.5常用數(shù)據(jù)壓縮方法的基本原理霍夫曼編碼舉例現(xiàn)在有7個(gè)待編碼的符號(hào),它們的概率如下表所示,使用霍夫曼編碼算法求出7個(gè)符號(hào)所分配的代碼。(寫出編碼樹)待編碼的符號(hào)X1X2X3X4X5X6X7概率0.350.200.150.100.100.060.043.1.3常用數(shù)據(jù)壓縮方法的基本原理2.預(yù)測(cè)編碼(PredictionCoding)

預(yù)測(cè)編碼是指利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差進(jìn)行編碼。典型的預(yù)測(cè)編碼有兩種:(1)差分脈碼調(diào)制(DPCM)(2)自適應(yīng)差分脈碼調(diào)制(ADPCM)差分脈碼調(diào)制(DPCM)

在PCM系統(tǒng)中,原始的模擬信號(hào)經(jīng)過采樣后得到的每一個(gè)樣值都被量化成為數(shù)字信號(hào)。為了壓縮數(shù)據(jù),可以不對(duì)每一樣值都進(jìn)行量化,而是預(yù)測(cè)下一樣值,并量化實(shí)際值與預(yù)測(cè)值之間的差值,這就是DPCM(DifferentialPulseCodeModulation,差分脈沖編碼調(diào)制)。1952年貝爾(Bell)實(shí)驗(yàn)室的C.C.Cutler取得了差分脈沖編碼調(diào)制系統(tǒng)的專利,奠定了真正實(shí)用的預(yù)測(cè)編碼系統(tǒng)的基礎(chǔ)。

預(yù)測(cè)編碼的基本原理鄰近的M個(gè)值預(yù)測(cè)當(dāng)前值,當(dāng)前值與預(yù)測(cè)值之差量化編碼3.1.3常用數(shù)據(jù)壓縮方法的基本原理3.變換編碼(TransformationCoding)

在變換編碼時(shí),初始數(shù)據(jù)要從初始空間或時(shí)間域進(jìn)行數(shù)學(xué)變換,變換為一個(gè)更適于壓縮的抽象域。該過程是可逆的;即使用反變換可恢復(fù)原始數(shù)據(jù)。如將時(shí)域信號(hào)變換到頻域,因?yàn)槁曇?、圖像大部分信號(hào)都是低頻信號(hào),在頻域中信號(hào)的能量較集中,再進(jìn)行采樣、編碼就可以壓縮數(shù)據(jù)(1)最佳變換(K-L變換)(2)離散余弦變換(DCT變換)DCT的原理

離散余弦變換(DiscreteCosineTransform,DCT)是一種實(shí)數(shù)域變換,其變換核為實(shí)數(shù)余弦函數(shù)。對(duì)一幅圖像進(jìn)行離散余弦變換后,許多有關(guān)圖像的重要可視信息都集中在DCT變換的一小部分系數(shù)中。因此,離散余弦變換(DCT)是有損圖像壓縮JPEG的核心,同時(shí)也是所謂“變換域信息隱藏算法”的主要“變換域(DCT域)”之一。因?yàn)閳D像處理運(yùn)用二維離散余弦變換,所以直接介紹二維DCT變換。

分析DCT系數(shù)的性質(zhì)下面以lenna圖像為例,利用DCT變換函數(shù)得到的DCT系數(shù)的性質(zhì)。我們只取R層的DCT系數(shù)矩陣進(jìn)行分析。下圖顯示了變化的結(jié)果,其中DCT系數(shù)用光譜的形式給出,直觀的表明了低頻和高頻系數(shù)的分布規(guī)律。

分析DCT系數(shù)的性質(zhì)

3.1.3常用數(shù)據(jù)壓縮方法的基本原理典型的變換編碼系統(tǒng)框圖:信源序列變換變換域采樣量化編碼存儲(chǔ)或傳輸譯碼填零反變換再現(xiàn)序列變換編碼系統(tǒng)壓縮數(shù)據(jù)的三個(gè)步驟3.1.3常用數(shù)據(jù)壓縮方法的基本原理4.分析合成編碼通過對(duì)原始數(shù)據(jù)分析,將其分解為一系列更適合于表示的基元或從中提取出更有本質(zhì)意義的參數(shù),僅對(duì)這些基本單元或者特征參數(shù)進(jìn)行編碼,而解碼時(shí)則借助于一定的規(guī)則或者模型,按照一定的算法將這些基元或者參數(shù)再綜合成逼近原始數(shù)據(jù)的結(jié)果。矢量量化小波變換編碼分形編碼子帶編碼

3.2音頻的壓縮3.2音頻的壓縮音頻頻率范圍

低頻聲音(Infra-sound):0Hz-20Hz

人類聽覺頻率范圍的聲音:20Hz-20kHz

高頻(Ultrasound):20kHz-1GHz

超聲波(Hypersound):1GHz-10THz不同音頻的帶寬

電話語音:

200Hz-3.4kHz

調(diào)幅廣播:50Hz-7kHz

調(diào)頻廣播:20Hz-15kHz

寬帶音響:20Hz-20kHz3.2.1音頻壓縮編碼的基本方法無失真壓縮音頻壓縮方法有失真壓縮Huffman編碼行程編碼波形編碼參數(shù)編碼混合編碼全頻帶編碼PCMDPCMADPCM子帶編碼自適應(yīng)變換編碼ATC

心理學(xué)模型矢量量化線性預(yù)測(cè)LPC矢量和激勵(lì)線性預(yù)測(cè)VSELP多脈沖線性預(yù)測(cè)MP-LPC碼本激勵(lì)線性預(yù)測(cè)CELP調(diào)幅廣播與調(diào)頻廣播介紹隨著生活水平的提高,人們對(duì)只能收聽中波調(diào)幅廣播的收音機(jī)已經(jīng)不滿足了,在選購收音機(jī)時(shí),要求具備調(diào)頻、調(diào)幅兩種功能的產(chǎn)品。那么電臺(tái)為什么要用調(diào)頻、調(diào)幅兩種不同的方式進(jìn)行廣播?調(diào)頻廣播與調(diào)幅廣播各有什么特點(diǎn),又有什么區(qū)別?無線電廣播是依靠空間的高頻電磁波來傳播節(jié)目的。高頻電磁波并不含有任何信息,只起了“運(yùn)載工具”的作用。因此,又稱它為載波。平時(shí)講的中央人民廣播電臺(tái)的頻率為540千赫、上海人民廣播電臺(tái)的頻率為990千赫,就是載波的頻率。要傳送的廣播節(jié)目的頻率要比載波的頻率低得多,在30赫~15000赫之間,稱為音頻信號(hào)或低頻信號(hào)。低頻信號(hào)是傳不遠(yuǎn)的。必須設(shè)法把它與高頻載波疊加起來,才能達(dá)到遠(yuǎn)傳的目的。這種疊加的過程,稱它為調(diào)制。

常用的調(diào)制方式有兩種:當(dāng)高頻振蕩的幅度隨著音頻信號(hào)的大小變化而變化,這種調(diào)制方式稱為調(diào)幅。如果被高頻振蕩的頻率隨著音頻信號(hào)的大小變化而變化,這種調(diào)制方式稱為調(diào)頻。

調(diào)幅的特點(diǎn)是載波的頻率始終不變,而載波幅度變化的形狀與音頻信號(hào)變化的形態(tài)一樣。我們把幅度變化的軌跡稱作包絡(luò)線。從圖1中可以看出,包絡(luò)線的形狀與音頻信號(hào)是相同的。被音頻信號(hào)調(diào)制后的載波,稱已調(diào)波。我國中波調(diào)幅廣播的頻率范圍為535~1605千赫。為了在有限的廣播頻率段中,既要防止臨近頻率電臺(tái)相互干擾,又要設(shè)置更多的電臺(tái)數(shù)目,只能壓縮每個(gè)電臺(tái)的頻帶寬度。國際上規(guī)定中波廣播的頻道間隔為9千赫。即每一電臺(tái)的頻帶寬度限制于9千赫之內(nèi)。調(diào)幅廣播的不足是抗干擾能力差.調(diào)頻的特點(diǎn)是載波的幅度始終不變,而它的頻率則隨著音頻信號(hào)大小在變化。如圖

所示:當(dāng)音頻信號(hào)增強(qiáng)的時(shí)候,頻率變高,波形就密;當(dāng)音頻信號(hào)減弱的時(shí)候,頻率變低,波形就疏。調(diào)頻波的頻譜要比調(diào)幅波復(fù)雜得多。每個(gè)電臺(tái)所占頻帶寬寬為200千赫所以調(diào)頻電臺(tái)的節(jié)目聽起來要比調(diào)幅廣播高音豐富、清晰、逼真。特別是在聆聽立體聲高保真音樂節(jié)目。

調(diào)頻廣播的另一個(gè)特點(diǎn)是抗干擾能力強(qiáng)。因?yàn)楦蓴_主要是影響載波的幅度,對(duì)載波的頻率幾乎沒有影響。因此在接收機(jī)中用限幅器很容易將干擾消除掉。參見圖

。3.2.2電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)ITU-TS建議的語音壓縮的標(biāo)準(zhǔn)G.711:采用PCM(脈沖)編碼,采樣速率為8kHz,量化位數(shù)為8bit,對(duì)應(yīng)的比特流速率為64kbit/sG.721:

將64Kbps的比特流轉(zhuǎn)換為32Kbps的流,它是基于ADPCM(自適應(yīng)音頻脈沖編碼)技術(shù)。每個(gè)數(shù)值差分用4位編碼,其采樣率為8kHzG.723:以24Kbps運(yùn)行的基于ADPCM的有損耗壓縮標(biāo)準(zhǔn)。其音質(zhì)不如非壓縮的G.711PCM標(biāo)準(zhǔn)以及基于SB-ADPCM的G.722標(biāo)準(zhǔn)3.2.2電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)G.728:采用低延遲代碼激勵(lì)線性預(yù)測(cè)(LD-CELP)的向量量化技術(shù)。其比特率為16Kbps,帶寬限于3.4kHz。其音質(zhì)比G.711或G.722差得多CELP是一種常用的語音壓縮技術(shù)。它用于美國聯(lián)邦標(biāo)準(zhǔn)1016,可將語音壓縮至4.8Kbps。美國聯(lián)邦標(biāo)準(zhǔn)1015使用CELP的一個(gè)簡(jiǎn)本,稱為線性預(yù)測(cè)編碼(LPC)。LPC-10E標(biāo)準(zhǔn)可以運(yùn)行于2.4Kbps。采用了一種向量量化方法。聲音聽起來有點(diǎn)象機(jī)器在說話,但4.8Kbps與電話差不多3.2.3調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)調(diào)幅廣播質(zhì)量:50Hz-7kHz,稱“7kHz音頻信號(hào)”G.722:基于子帶ADPCM技術(shù)(SB-ADPCM),是將現(xiàn)有的帶寬分成兩個(gè)獨(dú)立的子帶信道分別采用差分脈碼調(diào)制算法G.722壓縮信號(hào)的帶寬范圍為50Hz到7kHz,而G.711僅限于3.4kHz。其比特率為48、56、64Kbps,在標(biāo)準(zhǔn)模式下,采樣速率是16KHz,幅度深度為14比特3.2.4高保真立體聲音頻壓縮標(biāo)準(zhǔn)高質(zhì)量的聲音信號(hào)頻率范圍:50Hz-20kHz目前國際上比較成熟的高質(zhì)量聲音壓縮標(biāo)準(zhǔn)為MPEG音頻MPEG-1的音頻信號(hào)在ISO11172-3文檔中的描述。MPEG音頻不是單個(gè)一種壓縮算法,而是3種音頻編碼和壓縮方案的一個(gè)系列

MPEG聲音編碼分為:層-1、層-2、層-3。隨著層數(shù)的增加算法的復(fù)雜度也增大3.2.4高保真立體聲音頻壓縮標(biāo)準(zhǔn)所有3層都分級(jí)兼容。最復(fù)雜的譯碼器(即在層-3工作的譯碼器)也可對(duì)層-2或?qū)?l的碼流進(jìn)行譯碼所有3層均運(yùn)用變換編碼和子帶編碼頻譜被分為32個(gè)子帶應(yīng)用快速博里葉變換來表示高頻域中的信號(hào)應(yīng)用心理聲學(xué)模式來變換信號(hào)以估計(jì)剛能引起注意的噪音級(jí)層1、2和3主要在最后一個(gè)階段——即量化階段的方式上有所區(qū)別,但不是唯一的差別。3.3圖像和視頻的壓縮圖像和動(dòng)畫的存儲(chǔ)方式是一個(gè)很重要的問題。幸好我們有了數(shù)據(jù)壓縮,有了JPEG等多種壓縮存儲(chǔ)圖像的文件格式,我們今天才能夠拿著小小的一個(gè)存儲(chǔ)器,卻存上許多張色彩鮮艷的圖片。如果沒有圖像壓縮算法,也許我們的多媒體時(shí)代就會(huì)晚到來許多年。3.3.1圖像和視頻壓縮編碼的基本方法圖像和視頻壓縮方法無失真壓縮有失真壓縮Huffman編碼行程編碼算術(shù)編碼LZW編碼預(yù)測(cè)編碼運(yùn)動(dòng)補(bǔ)償變換編碼DCT變換小波變換子帶編碼模型編碼分形編碼基于重要性濾波子采樣矢量量化混合編碼JPEGMPEGH.2613.3.2靜止圖像壓縮標(biāo)準(zhǔn)靜止圖像壓縮的國際標(biāo)準(zhǔn):ISO制訂的JPEG標(biāo)準(zhǔn)、JBIG標(biāo)準(zhǔn)ITU-T的G3標(biāo)準(zhǔn)、G4標(biāo)準(zhǔn)JPEG標(biāo)準(zhǔn)適用于黑白及彩色照片、彩色傳真和印刷圖片,可以支持很高的圖像分辨率和量化精度3.3.2靜止圖像壓縮標(biāo)準(zhǔn)1.JPEG壓縮標(biāo)準(zhǔn)壓縮比高,圖像質(zhì)量保真程度好適應(yīng)不同的數(shù)字圖像參數(shù)、大小、圖像內(nèi)容、彩色空間、統(tǒng)計(jì)特性等,但不包括二值圖像用戶可以對(duì)壓縮比、質(zhì)量效果進(jìn)行選擇應(yīng)該滿足硬軟件實(shí)現(xiàn)的計(jì)算需求支持多種操作方式JPEG圖像存儲(chǔ)格式一個(gè)比較成熟的圖像壓縮格式,雖然一個(gè)圖片經(jīng)過轉(zhuǎn)化為JPEG圖像后,一些數(shù)據(jù)會(huì)丟失,但是,人眼是很不容易分辨出來這種差別的。也就是說,JPEG圖像存儲(chǔ)格式既滿足了人眼對(duì)色彩和分辨率的要求,又適當(dāng)?shù)娜コ藞D像中很難被人眼所分辨出的色彩,在圖像的清晰與大小中JPEG找到了一個(gè)很好的平衡點(diǎn)。JPEG文件的格式是分為一個(gè)一個(gè)的段來存儲(chǔ)的,段的多少和長度并不是一定的。只要包含了足夠的信息,該JPEG文件就能夠被打開,呈現(xiàn)給人們。JPEG文件的每個(gè)段都一定包含兩部分一個(gè)是段的標(biāo)識(shí),它由兩個(gè)字節(jié)構(gòu)成:第一個(gè)字節(jié)是十六進(jìn)制0xFF,第二個(gè)字節(jié)對(duì)于不同的段,這個(gè)值是不同的。3.3.2靜止圖像壓縮標(biāo)準(zhǔn)(1)JPEG的無損預(yù)測(cè)編碼算法無損壓縮中采用一個(gè)簡(jiǎn)單的預(yù)測(cè)器。預(yù)測(cè)器可以采用不同的預(yù)測(cè)方法,不同的預(yù)測(cè)方法將決定有哪些相鄰的象素將被用于預(yù)測(cè)下一個(gè)象素。常用的預(yù)測(cè)方法如三鄰域預(yù)測(cè)法。源圖像數(shù)據(jù)預(yù)測(cè)器熵編碼器壓縮的圖像數(shù)據(jù)表說明3.3.2靜止圖像壓縮標(biāo)準(zhǔn)(2)JPEG基于DCT的有損編碼算法8*8DCT正變換量化器熵編碼器壓縮后的圖像數(shù)據(jù)JPEG編碼器表說明表說明塊準(zhǔn)備源圖像數(shù)據(jù)3.3.2靜止圖像壓縮標(biāo)準(zhǔn)塊準(zhǔn)備:塊準(zhǔn)備將一幀幀圖像分成8×8的數(shù)據(jù)塊DCT變換:原始的圖像數(shù)據(jù)塊經(jīng)過DCT變換后,將每個(gè)數(shù)據(jù)塊的數(shù)據(jù)從空間域變換到頻率域,輸出64個(gè)DCT變換系數(shù)

量化:JPEG的量化采用線性均勻量化器DCT系數(shù)的編碼:JPEG中對(duì)DC系數(shù)采用DPCM編碼,64個(gè)AC系數(shù)在JPEG算法中采用行程編碼熵編碼:經(jīng)過DPCM編碼的直流項(xiàng)和經(jīng)過行程編碼的交流項(xiàng)再進(jìn)行霍夫曼編碼或自適應(yīng)二進(jìn)制算術(shù)編碼3.3.2靜止圖像壓縮標(biāo)準(zhǔn)壓縮比和圖像質(zhì)量基于DCT(離散余弦變換)的JPEG標(biāo)準(zhǔn)的壓縮是有失真的,DCT變換后系數(shù)的量化是引起失真的主要原因壓縮效果與圖像內(nèi)容本身有較大的關(guān)系,對(duì)于中等復(fù)雜程度的彩色圖像,其壓縮比與恢復(fù)圖像的質(zhì)量大致如下表所示3.3.2靜止圖像壓縮標(biāo)準(zhǔn)壓縮效果(比特/象素)質(zhì)量0.25~0.50中~好,滿足某些應(yīng)用0.50~0.75好~很好,滿足多數(shù)應(yīng)用0.75~1.5極好,滿足大多數(shù)應(yīng)用1.5~2.0與原始圖像幾乎分不出3.3.2靜止圖像壓縮標(biāo)準(zhǔn)2.JPEG2000簡(jiǎn)介

JPEG2000的原理JPEG2000與傳統(tǒng)JPEG最大的不同,在于它放棄了JPEG所采用的以離散余弦轉(zhuǎn)換(DiscreteCosineTransform)為主的區(qū)塊編碼方式,而采用以小波轉(zhuǎn)換(Wavelettransform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將圖像的頻率成分抽取出來3.3.2靜止圖像壓縮標(biāo)準(zhǔn)

JPEG2000的優(yōu)點(diǎn)1、壓縮率比JPEG約高30%

左右2、同時(shí)支持有損和無損壓縮,適合保存重要圖片3、能實(shí)現(xiàn)漸進(jìn)傳輸,這是其一個(gè)極其重要的特征。即GIF格式圖像的“漸現(xiàn)”特性。它先傳輸圖像的輪廓,然后逐步傳輸數(shù)據(jù),不斷提高圖像質(zhì)量,讓圖像由朦朧到清晰顯示,而不必是像現(xiàn)在的JPEG一樣,由上到下慢慢顯示4、支持所謂的“感興趣區(qū)域”特性,可以任意指定圖像上感興趣區(qū)域的壓縮質(zhì)量,還可以選擇指定的部份先解壓縮,可以很方便的突出重點(diǎn)3.3.2靜止圖像壓縮標(biāo)準(zhǔn)

JPEG2000的應(yīng)用JPEG2000的應(yīng)用領(lǐng)域可概略分成兩部分,一為傳統(tǒng)JPEG的市場(chǎng),如打印機(jī),掃描儀,數(shù)碼相機(jī)等;一為新興應(yīng)用領(lǐng)域,如網(wǎng)絡(luò)傳輸,無線通訊,醫(yī)療圖像等

JPEG2000和JPEG相比優(yōu)勢(shì)明顯,且可向下兼容,取代傳統(tǒng)的JPEG格式目前對(duì)JPEG2000熱情最大的是那些數(shù)字照相機(jī)廠商

3.3.3視頻壓縮標(biāo)準(zhǔn)視頻壓縮的一個(gè)重要標(biāo)準(zhǔn)是MPEG(MotionPictureExpertsGroup),已推出了MPEG(或MPEG-Ⅰ)、MPEG-Ⅱ、MPEG-4等系列標(biāo)準(zhǔn),新的標(biāo)準(zhǔn)MPEG-7、MPEG-21等標(biāo)準(zhǔn)也在醞釀之中另一個(gè)重要標(biāo)準(zhǔn)是H系列,包括H.261、H.263等標(biāo)準(zhǔn),此外還有運(yùn)動(dòng)JPEG等壓縮標(biāo)準(zhǔn)3.3.3視頻壓縮標(biāo)準(zhǔn)1.MPEG-1壓縮標(biāo)準(zhǔn)能夠傳輸用戶可以接受的視頻能夠支持對(duì)稱或者非對(duì)稱的壓縮解壓應(yīng)用根據(jù)需要可以支持隨機(jī)存取根據(jù)需要支持快進(jìn)、快倒、快放等多種工作方式能夠支持視頻和音頻的同步工作能夠避免出現(xiàn)大的障礙可以控制壓縮解壓的延遲可以具有編輯能力能夠以靈活的格式支持窗口視頻演示不排斥使用價(jià)格低廉又能夠?qū)崟r(shí)編碼的芯片3.3.3視頻壓縮標(biāo)準(zhǔn)MPEG-Ⅰ標(biāo)準(zhǔn)的目標(biāo)是以約1.5Mbps的速率傳輸電視質(zhì)量的視頻信號(hào),亮度信號(hào)的分辨率為360×240,色度信號(hào)的分辨率為180×120,每秒30幀MPEG-Ⅰ標(biāo)準(zhǔn)包括:MPEG系統(tǒng)(ISO/IEC11172-1)MPEG視頻(ISO/IEC11172-2)MPEG音頻(ISO/IEC11172-3)測(cè)試驗(yàn)證(ISO/IEC11172-4)MPEG涉及的問題是視頻壓縮、音頻壓縮及多種壓縮數(shù)據(jù)流的復(fù)合和同步問題MPEG-Ⅰ視頻壓縮技術(shù)以兩個(gè)基本技術(shù)為基礎(chǔ)的.一個(gè)是基于子塊的運(yùn)動(dòng)補(bǔ)償,可減少幀序列的時(shí)域冗余度。二是基于DCT的壓縮技術(shù),減少空域冗余度。運(yùn)動(dòng)補(bǔ)償一個(gè)視頻序列包含一定數(shù)量的圖片--通常稱為幀相鄰的圖片通常很相似,包含了很多冗余。使用運(yùn)動(dòng)補(bǔ)償?shù)哪康氖峭ㄟ^消除這種冗余,來提高壓縮比。運(yùn)動(dòng)補(bǔ)償是一種描述相鄰幀差別的方法,具體來說是描述前面一幀的每個(gè)小塊怎樣移動(dòng)到當(dāng)前幀中的某個(gè)位置去。

運(yùn)動(dòng)補(bǔ)償最早的運(yùn)動(dòng)補(bǔ)償?shù)脑O(shè)計(jì)只是簡(jiǎn)單的從當(dāng)前幀中減去參考幀,從而得到通常含有較少能量(或者稱為信息)的“殘差”,從而可以用較低的碼率進(jìn)行編碼。解碼器可以通過簡(jiǎn)單的加法完全恢復(fù)編碼幀。運(yùn)動(dòng)補(bǔ)償有兩種算法:運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)法

畫面上的運(yùn)動(dòng)部分在幀與幀之間必然有連續(xù)性,預(yù)測(cè)法根據(jù)這一特性,將當(dāng)前的圖像畫面看作是前面某時(shí)刻圖像的位移,位移的幅度和方向在圖像畫面的各處可有不同。

運(yùn)動(dòng)補(bǔ)償插補(bǔ)法

用插補(bǔ)的方法進(jìn)行運(yùn)動(dòng)的補(bǔ)償,可以大幅度地壓縮運(yùn)動(dòng)圖像的信息。

3.3.3視頻壓縮標(biāo)準(zhǔn)2.MPEG-Ⅱ壓縮標(biāo)準(zhǔn)MPEG-Ⅱ標(biāo)準(zhǔn)包括MPEG系統(tǒng)、MPEG視頻、MPEG音頻和一致性四大部分內(nèi)容,是運(yùn)動(dòng)圖像及其伴音的通用編碼國際標(biāo)準(zhǔn)MPEG-Ⅱ壓縮標(biāo)準(zhǔn)克服并解決了MPEG-Ⅰ標(biāo)準(zhǔn)不能滿足的日益增長的多媒體技術(shù)、數(shù)字電視技術(shù)、多媒體分辨率和傳輸率等方面的技術(shù)要求的缺陷3.3.3視頻壓縮標(biāo)準(zhǔn)MPEG-Ⅱ系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論