多媒體復(fù)習(xí)資料_第1頁(yè)
多媒體復(fù)習(xí)資料_第2頁(yè)
多媒體復(fù)習(xí)資料_第3頁(yè)
多媒體復(fù)習(xí)資料_第4頁(yè)
多媒體復(fù)習(xí)資料_第5頁(yè)
已閱讀5頁(yè),還剩100頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多媒體通信技術(shù)復(fù)習(xí)趙哲峰第一章 多媒體基礎(chǔ)1、媒體聲音媒體圖像媒體2、數(shù)據(jù)壓縮理論數(shù)據(jù)冗余數(shù)據(jù)壓縮分類(lèi)1.1 媒體媒體是信息表示和傳輸?shù)妮d體,是一個(gè)重要的概念。多媒體(multimedia)是融合兩種以上媒體的人機(jī)交互式信息交流和傳播媒體。ITU-T I .374建議將媒體劃分為感覺(jué)媒體、表示媒體、顯示媒體、存儲(chǔ)媒體和傳輸媒體5類(lèi)。 通常認(rèn)為多媒體中的連續(xù)媒體(聲音和電視圖像)是人與機(jī)器交互的最自然的媒體。 多媒體技術(shù)是將計(jì)算機(jī)技術(shù)、通信技術(shù)和電視技術(shù)三種技術(shù)融合在一起的新技術(shù),俗稱(chēng)“3C合一” 。聲音信號(hào)的頻率 1)小于20 Hz的信號(hào)稱(chēng)為亞音信號(hào)或次音信號(hào) 2)20 Hz20 kHz的信號(hào)

2、稱(chēng)為音頻信號(hào) 3)高于20 kHz的信號(hào)稱(chēng)為超音頻信號(hào)或稱(chēng)超聲波信號(hào) 4)3003400 Hz稱(chēng)為話(huà)音信號(hào) 人的聽(tīng)覺(jué)器官能感知的聲音頻率大約在2020000 Hz之間。在這種頻率范圍里感知的聲音幅度大約在0120 dB之間聲音媒體聲音的質(zhì)量主要體現(xiàn)在音調(diào) 與聲音的頻率有關(guān) 音強(qiáng) 與波形震動(dòng)的幅度(聲波壓力 )有關(guān) 音色 與基音和諧音的組合有關(guān)等響曲線(xiàn)人類(lèi)的聽(tīng)覺(jué)特性曲線(xiàn),是反映人們對(duì)聲音振幅范圍心理因素的曲線(xiàn),每條曲線(xiàn)上對(duì)應(yīng)于不同頻率的聲壓級(jí)是不相同的,但人耳感覺(jué)到的響應(yīng)卻是一樣,因此稱(chēng)為等響曲線(xiàn),每條曲線(xiàn)上注有一個(gè)數(shù)字,為響度單位。又稱(chēng)為Fletcher-Munson(弗萊徹芒森曲線(xiàn))曲線(xiàn)。等

3、響曲線(xiàn)掩蔽效應(yīng)掩蔽效應(yīng)一種頻率的聲音阻礙聽(tīng)覺(jué)系統(tǒng)感受另一種頻率的聲音的現(xiàn)象稱(chēng)為掩蔽效應(yīng)。掩蔽可分成:時(shí)域掩蔽頻域掩蔽圖像的顏色模型 常見(jiàn)模型: RGB彩色模型 CMY彩色模型 YUV彩色模型 YIQ彩色模型 HSI彩色模型RGB彩色空間顏色R(紅色百分比)G(綠色百分比)B(藍(lán)色百分比)一幅彩色圖像可以看成是由許多點(diǎn)組成的圖像中的每個(gè)點(diǎn)稱(chēng)為像素點(diǎn)(pixel)每個(gè)像素點(diǎn)都有一個(gè)像素值,表示特定的顏色強(qiáng)度像素值往往用R、G、B三個(gè)分量表示CMY彩色空間Cyan(青色), Magenta(品紅), Yellow(黃)- CMY任何一種顏色都可以用三種基本顏料按一定的比例混合得到。用這種方法產(chǎn)生的顏

4、色稱(chēng)為相減色CMY主要用于印刷和打印系統(tǒng)圖1-2YUV彩色空間由廣播電視需求的推動(dòng)而開(kāi)發(fā)的彩色空間,主要目的是為了壓縮色度信息以便有效的播送彩色電視圖像。Y為亮度信號(hào),U、V是色差信號(hào)(B-Y,R-Y)U和V構(gòu)成彩色的兩個(gè)分量。PAL模擬彩色電視采用的彩色空間。優(yōu)點(diǎn)是亮度和色差信號(hào)分離,容易使彩色電視系統(tǒng)與黑白電視信號(hào)兼容。YIQ彩色空間NTSC制式的模擬彩色電視采用的彩色空間Y是亮度,I和Q是兩個(gè)彩色分量,共同描述圖象的色調(diào)和飽和度。亮度與色差分離,可以更有效的壓縮圖像的數(shù)據(jù)量HSI彩色空間用H(Hue,色調(diào))、S(Saturation,飽和度)、I(Intensity,光強(qiáng)度)表示一種顏色

5、一種直觀(guān)的顏色模型,更適合人的視覺(jué)特性。HSL(Hue, Saturation, Lightness)HSI(HSL) RGB1.2 數(shù)據(jù)壓縮理論數(shù)據(jù)能夠進(jìn)行壓縮的兩個(gè)原因: 1) 數(shù)據(jù)中存在大量的冗余(相關(guān)性),如空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余及紋理統(tǒng)計(jì)冗余。 2)對(duì)于圖像、音頻和視頻等,人的感知可容忍某些細(xì)節(jié)信息的丟失(失真)。(感知冗余 )1) 空間冗余這是圖像數(shù)據(jù)中經(jīng)常存在的一種冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性,這些相關(guān)性的光成像結(jié)構(gòu)在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。2) 結(jié)構(gòu)冗余在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。我們稱(chēng)此為結(jié)構(gòu)

6、冗余;已知分布模式,可以通過(guò)某一過(guò)程生成圖像;例如布紋圖像和草席圖像;3) 時(shí)間冗余這是序列圖像和語(yǔ)音數(shù)據(jù)中所經(jīng)常包含的冗余;圖像序列中的兩幅相鄰的圖像之間有較大的相關(guān)性,這反映為時(shí)間冗余;在語(yǔ)言中,由于人在說(shuō)話(huà)時(shí)發(fā)音的音頻是一連續(xù)的漸變過(guò)程,而不是一個(gè)完全時(shí)間上獨(dú)立的過(guò)程,因而存在時(shí)間冗余。4) 視覺(jué)冗余人類(lèi)視覺(jué)系統(tǒng)并不是對(duì)任何圖像的變化都很敏感,人眼對(duì)于圖像的注意是非均勻的;事實(shí)上人類(lèi)視覺(jué)系統(tǒng)一般分辨能力約為26灰度等級(jí),而一般圖像量化采用28灰度等級(jí),這類(lèi)冗余我們稱(chēng)為視覺(jué)冗余;例如,人的視覺(jué)對(duì)于邊緣的急劇變化不敏感,且人眼對(duì)圖像的亮度信息敏感,對(duì)顏色的分辨率弱等 。5) 知識(shí)冗余有許多圖

7、像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性。例如,人臉的圖像有固定的結(jié)構(gòu)。比如說(shuō)嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于正臉圖像的中線(xiàn)上等等。這類(lèi)規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱(chēng)此類(lèi)冗余為知識(shí)冗余。除了以上冗余外,還有一些其他方面的冗余??臻g冗余和時(shí)間冗余反應(yīng)了信號(hào)的統(tǒng)計(jì)特性,有時(shí)把這兩種冗余稱(chēng)為統(tǒng)計(jì)冗余。它們也是多媒體數(shù)據(jù)處理中兩種最主要的數(shù)據(jù)冗余。數(shù)據(jù)壓縮分類(lèi) 按照其作用域在空間域或頻率域上分為空間方法、變換方法和混合方法;根據(jù)是否自適應(yīng)分為自適應(yīng)性編碼和非自適應(yīng)性編碼。根據(jù)質(zhì)量有無(wú)損失可分為有損失編碼和無(wú)損失編碼 ,如圖1-3圖1-3常用編碼子帶編碼,首先將語(yǔ)音信號(hào)劃分為

8、多個(gè)頻帶,然后對(duì)每個(gè)頻帶的參數(shù)進(jìn)行編碼。變換編碼,不是直接對(duì)空域圖像信號(hào)進(jìn)行編碼,而是首先將空域圖像信號(hào)映射變換到另一個(gè)正交矢量空間(變換域或頻域),產(chǎn)生一批變換系數(shù),然后對(duì)這些變換系數(shù)進(jìn)行編碼處理。 預(yù)測(cè)編碼,是根據(jù)離散信號(hào)之間存在著一定關(guān)聯(lián)性的特點(diǎn),利用前面一個(gè)或多個(gè)信號(hào)預(yù)測(cè)下一個(gè)信號(hào)進(jìn)行,然后對(duì)實(shí)際值和預(yù)測(cè)值的差(預(yù)測(cè)誤差)進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確,誤差就會(huì)很小。在同等精度要求的條件下,就可以用比較少的比特進(jìn)行編碼,達(dá)到壓縮數(shù)據(jù)的目的。靜態(tài)圖像編碼標(biāo)準(zhǔn) JPEG(Joint Photographic Experts Group)運(yùn)動(dòng)圖像編碼標(biāo)準(zhǔn)H.261,H.263MPEG1,MPEG

9、2, MPEG4第二章 多媒體數(shù)字編碼技術(shù)2. 1 采樣和量化2. 2 無(wú)損編碼2. 3 有損編碼2. 1 采樣和量化數(shù)字化的好處A)數(shù)字化后處理更方便B)易于存儲(chǔ)和遠(yuǎn)距離傳輸C)沒(méi)有累積失真模擬世界數(shù)字世界模擬世界A/DD/A數(shù)字化過(guò)程包括三步驟采樣量化編碼采 樣采樣(sampling)通過(guò)某種頻率的采樣脈沖將模擬信息的值取出,變連續(xù)的模擬信號(hào)為離散信號(hào)。采樣定理:采樣頻率原始信號(hào)頻率的2倍時(shí),采樣信號(hào)才可以保真地恢復(fù)為原始信號(hào)。量 化將采樣樣本的幅度按照量化級(jí)別決定其取值的過(guò)程,如圖2-1所示 。目的是將采樣樣本的幅度值離散化。量化之前需要規(guī)定量化級(jí),比如8級(jí),16級(jí)等。量化處理是一個(gè)多對(duì)

10、一的處理過(guò)程,不可逆。量化處理中有信息丟失,或者說(shuō),會(huì)引起量化誤差(量化噪聲)。 圖2-1量化的分類(lèi)量化標(biāo)量量化矢量量化均勻量化非均勻量化均勻量化圖2-2非均勻量化 圖2-3非線(xiàn)性量化的原理圖 概率密度大的區(qū)域細(xì)量化,概率密度小的區(qū)域粗量化 向量量化原理如下: 1)比特流被劃分為向量 2)各向量可參考碼本選擇最佳匹配模式 3)一旦找到最佳匹配模式就將碼本中的對(duì)應(yīng)條目進(jìn)行傳送 4)在接收端,根據(jù)傳送的索引在接收端碼本查出對(duì)應(yīng)的向量。 圖2-4是向量量化的原理圖 圖2-4圖2-5 向量量化的編碼解碼框圖 如果出現(xiàn)實(shí)際值與模式根本不匹配,那在接收端就會(huì)出現(xiàn)失真。為了對(duì)此進(jìn)行補(bǔ)救,該技術(shù)要計(jì)算一下實(shí)際

11、值和模式的差分。然后將該差分與模式的參數(shù)一起傳送。參數(shù)編碼可用自身進(jìn)行量化。因此,根據(jù)傳送是否有差分以及差分大小,向量量化可能是無(wú)損的或是有損的壓縮模式。 2. 2 無(wú)損編碼 根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致,數(shù)據(jù)壓縮方法劃分為兩類(lèi):無(wú)損編碼(無(wú)失真編碼,無(wú)損壓縮無(wú)損編碼(無(wú)失真編碼,無(wú)損壓縮)又稱(chēng)冗余壓縮又稱(chēng)冗余壓縮法或熵編碼。法或熵編碼。 如:Huffman編碼、算術(shù)編碼、行程長(zhǎng)度編碼等;有損編碼有損編碼( (有失真編碼,有損壓縮有失真編碼,有損壓縮) )如:變換編碼和預(yù)測(cè)編碼;無(wú)損失壓縮主要用于文本和數(shù)據(jù)壓縮。 可唯一譯碼性 具有可唯一譯碼性的編碼方法產(chǎn)生的編碼,在解碼的時(shí)候,只會(huì)產(chǎn)

12、生唯一的譯碼結(jié)果。譯碼出來(lái)的結(jié)果與編碼是一一對(duì)應(yīng)的關(guān)系 。哈夫曼編碼哈夫曼(Huffman)編碼的理論基礎(chǔ)是哈夫曼定理;哈 夫 曼 定 理 (定 理 ( 1 9 5 2 年 H u f f m a n 提 出 的 )在變長(zhǎng)編碼中,對(duì)出現(xiàn)概率大的信源符號(hào)賦于短碼字,而對(duì)于出現(xiàn)概率小的信源符號(hào)賦于長(zhǎng)碼字。如果碼字長(zhǎng)度嚴(yán)格按照所對(duì)應(yīng)符號(hào)出現(xiàn)概率大小逆序排列,則編碼結(jié)果平均碼字長(zhǎng)度一定小于任何其它排列方式。也稱(chēng)為最佳編碼,平均碼長(zhǎng)最短。哈夫曼編碼示例 圖2-6 EFGDCAB已知AG的霍夫曼編碼如上圖所示,求:(1)字符串ADBFEGEFCE的編碼;(2)計(jì)算平均碼長(zhǎng);(3) 對(duì)01111001000

13、100000101011010011進(jìn)行解碼。算術(shù)編碼算術(shù)編碼是一種無(wú)損數(shù)據(jù)壓縮方法,也是一種熵編碼的方法。和其它熵編碼方法不同的地方在于,其他的熵編碼方法通常是把輸入的消息分割為符號(hào),然后對(duì)每個(gè)符號(hào)進(jìn)行編碼,而算術(shù)編碼是直接把整個(gè)輸入的消息編碼為一個(gè)數(shù),一個(gè)滿(mǎn)足(0.0 n 1.0)的小數(shù)n。 算術(shù)編碼示例假設(shè)信源符號(hào)為00,01,10,11,符號(hào)概率分別為0.1,0.4,0.2,0.3,根據(jù)這些概率可把間隔0,1分成4 個(gè)子間隔:0,0.1),0.1,0.5),0.5,0.7), 0.7,1),其中x,y)表示半開(kāi)放間隔,即包含x 不包含y。上面的信息可綜合在下表中。如果二進(jìn)制消息序列的輸

14、入為:00 01 11 10 10符號(hào)00011011概率0.40.20.30.1初始編碼間隔0,0.4)0.4,0.6)0.6,0.9)0.9,1)輸入 00 01 11 10 10得到區(qū)間0.23824,0.23896);讓我們?cè)谶@個(gè)區(qū)間內(nèi)隨便選擇一個(gè)容易變成二進(jìn)制的數(shù),例如0.23828125,將它變成二進(jìn)制 0.00111101,去掉前面沒(méi)有太多意義的 0 和小數(shù)點(diǎn),我們可以輸出 00111101,這就是信息被壓縮后的結(jié)果,我們完成了一次最簡(jiǎn)單的算術(shù)壓縮過(guò)程。算術(shù)編碼的特點(diǎn)1)不必預(yù)先定義概率模型,自適應(yīng)模式具有獨(dú)特的優(yōu)點(diǎn);2)信源符號(hào)概率接近時(shí),此時(shí)算術(shù)編碼效率高于其他編碼方法。3)

15、算術(shù)編碼繞過(guò)了用一個(gè)特定的代碼替代一個(gè)輸入符號(hào)的想法,用一個(gè)浮點(diǎn)輸出數(shù)值代替一個(gè)符號(hào)流的輸入。注意下面幾個(gè)問(wèn)題1)由于實(shí)際的計(jì)算機(jī)的精度不可能無(wú)限長(zhǎng),運(yùn)算中出現(xiàn)溢出是一個(gè)明顯的問(wèn)題,但多數(shù)機(jī)器都有16位、32位或者64位的精度,因此這個(gè)問(wèn)題可使用比例縮放方法解決。2)算術(shù)編碼器對(duì)整個(gè)消息只產(chǎn)生一個(gè)碼字,這個(gè)碼字是在間隔0, 1)中的一個(gè)實(shí)數(shù),因此譯碼器在接受到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。3)算術(shù)編碼也是一種對(duì)錯(cuò)誤很敏感的編碼方法,如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。LZW壓縮算法LZW壓縮算法是一種無(wú)損壓縮方法,由Lemple-Ziv-Welch三人共同創(chuàng)造,用他們的名字命名。它

16、將每個(gè)第一次出現(xiàn)的串放在一個(gè)串表中,用一個(gè)數(shù)字來(lái)表示串,壓縮文件只存貯數(shù)字,則不存貯串,從而使圖象文件的壓縮效率得到較大的提高。奇妙的是,不管是在壓縮還是在解壓縮的過(guò)程中都能正確的建立這個(gè)串表,壓縮或解壓縮完成后,這個(gè)串表又被丟棄。1.基本原理首先建立一個(gè)字符串表,把每一個(gè)第一次出現(xiàn)的字符串放入串表中,并用一個(gè)數(shù)字來(lái)表示,這個(gè)數(shù)字與此字符串在串表中的位置有關(guān),并將這個(gè)數(shù)字存入壓縮文件中,如果這個(gè)字符串再次出現(xiàn)時(shí),即可用表示它的數(shù)字來(lái)代替,并將這個(gè)數(shù)字存入文件中。壓縮完成后將串表丟棄。如print 字符串,如果在壓縮時(shí)用266表示,只要再次出現(xiàn),均用266表示,并將print字符串存入串表中,在

17、圖象解碼時(shí)遇到數(shù)字266,即可從串表中查出 266所代表的字符串print,在解壓縮時(shí),串表可以根據(jù)壓縮數(shù)據(jù)重新生成。2.實(shí)現(xiàn)方法A.初始化串表 在壓縮圖象信息時(shí),首先要建立一個(gè)字符串表,用以記錄每個(gè)第一次出現(xiàn)的字符串。一個(gè)字符串表最少由兩個(gè)字符數(shù)組構(gòu)成,一個(gè)稱(chēng)為當(dāng)前數(shù)組,一個(gè)稱(chēng)為前綴數(shù)組,一個(gè)基本字符串由當(dāng)前字符和它前面的字符(也稱(chēng)前綴)構(gòu)成。前綴數(shù)組中存入字符串中的首字符,當(dāng)前數(shù)組存放字符串中的尾字符,其存入位置相同,因此只要確定一個(gè)下標(biāo),就可確定它所存貯的基本字符串,所以在數(shù)據(jù)壓縮時(shí),用下標(biāo)代替基本字符串。一般串表大小為4096個(gè)字節(jié)(即212),這意味著一個(gè)串表中最多能存貯4096個(gè)基

18、本字符串,在初始化時(shí)根據(jù)圖象中色彩數(shù)目多少,將串表中起始位置的字節(jié)均賦以數(shù)字,通常當(dāng)前數(shù)組中的內(nèi)容為該元素的序號(hào)(即下標(biāo)),如第一個(gè)元素為0,第二個(gè)元素為1,第15個(gè)元素為14 ,直到下標(biāo)為色彩數(shù)目加2的元素為止。如果色彩數(shù)為256,則要初始化到第258個(gè)字節(jié),該字節(jié)中的數(shù)值為257。其中數(shù)字256表示清除碼,數(shù)字257為圖象結(jié)束碼。后面的字節(jié)存放文件中每一個(gè)第一次出現(xiàn)的串。同樣也要音樂(lè)會(huì) 前綴數(shù)組初始化,其中各元素的值為任意數(shù),但一般均將其各位置1,即將開(kāi)始位置的各元素初始化為0XFF,初始化的元素?cái)?shù)目與當(dāng)前數(shù)組相同,其后的元素則 要存入每一個(gè)第一次出現(xiàn)的字符串了。如果加大串表的長(zhǎng)度可進(jìn)一步

19、提高壓縮效率,但會(huì)降低解碼速度。用lzw算法壓縮原始數(shù)據(jù)的示例分析 輸 入 流 , 也 就 是 原 始 的 數(shù) 據(jù) 為 : 255,24,54,255,24,255,255,24,5,123,45,255,24,5,24,54第幾步前綴后綴 Entry認(rèn)識(shí)(Y/N)輸出標(biāo)號(hào)1255(,255)225524(255,24) N25525832454(24,54) N24259454255(54,255) N54260525524(255,24) Y6258255(258,255) N2582617255255(255,255) N255另一個(gè)例子 原輸入數(shù)據(jù)為:A B A B A B A B B

20、 B A B A B A A C D A C D A D C A B A A A B A B 注 意 原 數(shù) 據(jù) 中 只 包 含 4 個(gè) c h a r a c t e r , A , B , C , D用2 bit即可表述,根據(jù)lzw算法,首先擴(kuò)展一位變?yōu)? bit, Clear=2的2次方+1=4; End=4+1=5;初始標(biāo)號(hào)集應(yīng)該為:012345ABCDClearEnd而壓縮過(guò)程為:第幾步第幾步前綴前綴后綴后綴Entry認(rèn)識(shí)認(rèn)識(shí)(Y/N)輸出輸出標(biāo)號(hào)標(biāo)號(hào)1A(,A)2AB(A,B) NA63BA(B,A) NB74AB(A,B) Y56A(6,A) N686AB(A,B) Y76A(6

21、,A) Y88B(8,B) N899BB(B,B) NB1010BB(B,B) Y1110A(10,A) N101112AB(A,B) Y當(dāng)進(jìn)行到第12步的時(shí)候,標(biāo)號(hào)集應(yīng)該為01234567891011ABCDClearEndABBA6A8BBB10A行程長(zhǎng)度編碼 (RLE)具有相同顏色,并且是連續(xù)的像素?cái)?shù)目稱(chēng)為行程長(zhǎng)度,簡(jiǎn)稱(chēng)長(zhǎng)度 。行程編碼的基本原理是建筑在圖像的統(tǒng)計(jì)特性基礎(chǔ)之上的,彩色值與其行程長(zhǎng)度組合一起作為編碼輸入的碼元進(jìn)行編碼,如下圖所示。適用于在同一行或相鄰行的像素之間具有強(qiáng)相關(guān)性的圖像。2. 3 有損編碼 壓縮過(guò)程中減少了數(shù)據(jù)中包含的數(shù)據(jù)量 解壓縮后恢復(fù)的數(shù)據(jù)與原先的不完全一致

22、能獲得較高的壓縮比 又稱(chēng)熵壓縮法 前綴編碼 預(yù)測(cè)編碼 編碼和傳輸?shù)牟⒉皇窍笏夭蓸又当旧?,而是這個(gè)采樣值的預(yù)測(cè)值與其實(shí)際值之間的差值相鄰樣本之間存在較強(qiáng)的相關(guān)性差值具有更小的動(dòng)態(tài)范圍根據(jù)編碼器的實(shí)現(xiàn)機(jī)理,語(yǔ)音編碼方法可以分成三大類(lèi),分別是波形編碼、變換編碼和混合編碼。第三章 視 頻3. 1 JPEG3. 2 MPEG視頻3. 1 JPEG JPEG(Joint Photographic Experts Group) 一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn),既可用于灰度圖像又可用于彩色圖像。JPEG算法與彩色空間無(wú)關(guān),處理的彩色圖像是單獨(dú)的彩色分量圖像?;陔x散余弦變換(DCT)的編碼方法。DCT

23、變換:將信號(hào)從一種表達(dá)形式(空間域,即圖像的變換:將信號(hào)從一種表達(dá)形式(空間域,即圖像的像素值)變成另一種等同的表達(dá)形式(頻率域,即頻率像素值)變成另一種等同的表達(dá)形式(頻率域,即頻率系數(shù)),并且這種變換過(guò)程是不可逆的。系數(shù)),并且這種變換過(guò)程是不可逆的。DCT變換的作變換的作用是使空間域的能量重新分布,降低圖像的相關(guān)性。用是使空間域的能量重新分布,降低圖像的相關(guān)性。DCT變換主要用來(lái)減少空間冗余。變換主要用來(lái)減少空間冗余。JPEG編碼框圖JPEG20002001年頒布,是JPEG的改進(jìn)版原理:JPEG 2000與傳統(tǒng)JPEG最大的不同,在于它放棄了JPEG 所采用的以離散余弦轉(zhuǎn)換(DCT,D

24、iscrete Cosine Transform) 為主的區(qū)塊編碼方式,而改采以小波轉(zhuǎn)換(Wavelet transform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將圖像的頻率成分抽取出來(lái)。 JPEG2000編解碼器原理框圖3. 2 MPEG視頻 MPEG是在1988年由國(guó)際標(biāo)準(zhǔn)化組織(International Organization for Standardization,ISO)和國(guó)際電工委員會(huì)(International Electrotechnical Commission,IEC)聯(lián)合成立的專(zhuān)家組。開(kāi)發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)。他們開(kāi)發(fā)的標(biāo)準(zhǔn)稱(chēng)為

25、MPEG標(biāo)準(zhǔn)。MPEG-1和MPEG-2典型的編碼參數(shù)減少時(shí)間冗余度1. MPEG 1視頻算法為了追求更高的壓縮效率,注重去除圖像序列的時(shí)間冗余度,同時(shí)滿(mǎn)足多媒體等應(yīng)用所必須的隨機(jī)存取要求。為此,MPEG 1標(biāo)準(zhǔn)將視頻圖像序列劃分為: 幀內(nèi)圖(I幀) 預(yù)測(cè)圖(P幀) 雙向圖(B幀) 直流分量圖(D圖)再根據(jù)不同的圖像類(lèi)型而區(qū)別對(duì)待。 1 幀內(nèi)圖(I幀)可由它來(lái)構(gòu)造出其它的幀但不能由其它幀構(gòu)造的幀對(duì)于幀內(nèi)圖只使用類(lèi)似于JPEG標(biāo)準(zhǔn)的幀內(nèi)編碼2 預(yù)測(cè)圖(P幀)僅由前趨幀構(gòu)造所得,如下圖8所示 3 雙向圖(B幀)由前趨和后繼幀差值所得,4 直流分量圖是變換系數(shù)的直流分量(DC系數(shù)),代表能量分布的圖

26、。僅使用其自身的信息運(yùn)動(dòng)補(bǔ)償 主要用于消除P圖象和B圖象在時(shí)間上的冗余性提高壓縮效率。運(yùn)動(dòng)補(bǔ)償是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一。包括運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償插值兩部分。運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)是指視頻的相鄰幀間的運(yùn)動(dòng)部分具有連續(xù)性,即當(dāng)前畫(huà)面上的圖像可以看成是前畫(huà)某時(shí)刻畫(huà)面上圖像的位移,位移的幅度值和方向在畫(huà)面各處可以不同。利用運(yùn)動(dòng)位移信息與前面某時(shí)刻的圖像對(duì)當(dāng)前畫(huà)面圖像進(jìn)行預(yù)測(cè)的方法,稱(chēng)為前向預(yù)測(cè)。反之,根據(jù)某時(shí)刻的圖與位移信息預(yù)測(cè)該時(shí)刻之前的圖像,稱(chēng)為后向預(yù)測(cè)。 運(yùn)動(dòng)補(bǔ)償插值是指以插補(bǔ)方法補(bǔ)償運(yùn)動(dòng)信息,是提高視頻壓縮比的最有效措施之一。在時(shí)域中插補(bǔ)運(yùn)動(dòng)補(bǔ)償是一種多分辨率壓縮技術(shù)。例如1/15

27、秒或1/10秒時(shí)間隔選取參考子圖,對(duì)時(shí)域較低分辨率子圖進(jìn)行編碼,通過(guò)低分辨子圖反映運(yùn)動(dòng)趨勢(shì)的附加校正信息(運(yùn)動(dòng)夭量)進(jìn)行插值,可得到滿(mǎn)分辨率(幀率1/30秒)的視頻信號(hào)。插值運(yùn)動(dòng)補(bǔ)償也稱(chēng)為雙向預(yù)測(cè),因?yàn)樗壤昧饲懊鎺男畔⒂掷昧撕竺鎺男畔?。在MPEG方案中,運(yùn)動(dòng)補(bǔ)償技術(shù)工作在宏塊一級(jí)。 宏塊分類(lèi)如下:B圖象宏塊有4種類(lèi)型幀內(nèi)宏塊,簡(jiǎn)稱(chēng)I塊;前向預(yù)測(cè)宏塊, 簡(jiǎn)稱(chēng)F塊;后向預(yù)測(cè)宏塊, 簡(jiǎn)稱(chēng)B塊;平均宏塊,簡(jiǎn)稱(chēng)A塊。對(duì)于P圖象,其宏塊只有I塊和F塊兩種運(yùn)動(dòng)估計(jì)就是運(yùn)動(dòng)向量的求取過(guò)程。運(yùn)動(dòng)向量的選擇范圍是基于幀間圖像的時(shí)間分辯率和塊內(nèi)圖像的時(shí)間分辯率,以及幀序列圖像的性質(zhì)而選定。MPEG 1數(shù)據(jù)

28、流結(jié)構(gòu)數(shù)據(jù)流結(jié)構(gòu)GSM編譯碼器簡(jiǎn)介編譯碼器簡(jiǎn)介 1988年頒布GSM標(biāo)準(zhǔn),也稱(chēng)泛歐數(shù)字蜂窩通信標(biāo)準(zhǔn) GSM壓縮后的數(shù)據(jù)率為:13.2 kb/s GSM的壓縮比:12813.2 = 9.7,近似于101第五章 多媒體網(wǎng)絡(luò)通信5.1 基本術(shù)語(yǔ)與概念5.2 局域網(wǎng)(LAN)技術(shù)5.1 基本術(shù)語(yǔ)與概念基本概念1. TCP/IP T C P / I P 是 英 文是 英 文 Tr a s m i s s i o n C o n t r o l Protocol/Internet Protocol的縮寫(xiě),也稱(chēng)為傳輸控的縮寫(xiě),也稱(chēng)為傳輸控制協(xié)議制協(xié)議/國(guó)際互連協(xié)議。其目的是將各種異構(gòu)計(jì)算國(guó)際互連協(xié)議。其目的

29、是將各種異構(gòu)計(jì)算機(jī)網(wǎng)絡(luò)或主機(jī)通過(guò)機(jī)網(wǎng)絡(luò)或主機(jī)通過(guò)TCP/IP實(shí)現(xiàn)互連互通。實(shí)現(xiàn)互連互通。網(wǎng)絡(luò)地址網(wǎng)絡(luò)地址 MAC地址:MAC地址由數(shù)據(jù)鏈路層地址子集組成。對(duì)于某個(gè)局域網(wǎng)接口來(lái)說(shuō),MAC地址是唯一的。其地址長(zhǎng)度為48位。網(wǎng)絡(luò)層地址IP地址:IP地址是網(wǎng)上主機(jī)地址的數(shù)字形式,與主機(jī)的域名一一對(duì)應(yīng)。IP v4地址是一個(gè)32位的二進(jìn)制數(shù)。常用的IP地址有以下幾種:A類(lèi)地址空間:1.0.0.0126.255.255.255;B類(lèi)地址空間:128.0.0.0191.255.255.255;C類(lèi)地址空間:192.0.0.0223.255.255.255。IPv6地址類(lèi)型:/128:1/128回環(huán)地址2001

30、:/16 全球可聚合地址2002:/16 6to4自動(dòng)構(gòu)造隧道地址3ffe:/16 早期IPv6 試驗(yàn)網(wǎng)地址fe80:/10 本地鏈路地址ff00:/8 組播地址:A.B.C.D兼容IPv4的IPv6地址:FFFF:A.B.C.DIPv4映射的IPv6地址5.2 局域網(wǎng)(LAN)技術(shù)IEEE 802標(biāo)準(zhǔn)1. 局域網(wǎng)分類(lèi)(1) 以太網(wǎng)(Ethernet)帶有檢測(cè)沖突的載波偵聽(tīng)多路存取(CSMA/CD)(2) 令牌網(wǎng)(Ring Token)(3) 光纖分布式數(shù)據(jù)接口(FDDI)100Base-T快速以太網(wǎng) 網(wǎng)絡(luò)最大直徑為205 m; 傳輸介質(zhì)采用5類(lèi)UTP或光纜。 100Base-T:100Bas

31、e-TX100Base-FX100Base-T4 千兆位快速以太網(wǎng): 1000Base-SX1000Base-LX1000Base-CX1000Base-TFDMA是把分配給無(wú)線(xiàn)蜂窩電話(huà)通訊的頻段分為若干個(gè)信道,每一個(gè)信道都能夠是把分配給無(wú)線(xiàn)蜂窩電話(huà)通訊的頻段分為若干個(gè)信道,每一個(gè)信道都能夠傳輸語(yǔ)音通話(huà)、數(shù)字服務(wù)和數(shù)字?jǐn)?shù)據(jù)。傳輸語(yǔ)音通話(huà)、數(shù)字服務(wù)和數(shù)字?jǐn)?shù)據(jù)。CDMA指通信中的一種多路復(fù)用技術(shù),在指通信中的一種多路復(fù)用技術(shù),在CDMA方式中,用戶(hù)共享時(shí)間和頻率分方式中,用戶(hù)共享時(shí)間和頻率分配并由唯一指配碼指配。在接收端通過(guò)使用只接收來(lái)自所需電路信號(hào)能量配并由唯一指配碼指配。在接收端通過(guò)使用只接收

32、來(lái)自所需電路信號(hào)能量的相關(guān)器把信號(hào)分開(kāi)。不需要的信號(hào)被做為噪音忽略掉。的相關(guān)器把信號(hào)分開(kāi)。不需要的信號(hào)被做為噪音忽略掉。 TDMA如果物理信道所能達(dá)到的傳輸率超過(guò)傳單一信源要求的數(shù)據(jù)傳輸率,則可如果物理信道所能達(dá)到的傳輸率超過(guò)傳單一信源要求的數(shù)據(jù)傳輸率,則可將物理信道按時(shí)間分成時(shí)間片,輪流地分配給每個(gè)用戶(hù),每個(gè)時(shí)間片由復(fù)將物理信道按時(shí)間分成時(shí)間片,輪流地分配給每個(gè)用戶(hù),每個(gè)時(shí)間片由復(fù)用的一個(gè)用戶(hù)占用。用的一個(gè)用戶(hù)占用。 多路復(fù)用技術(shù)多路復(fù)用技術(shù)是把多個(gè)低信道組合成一個(gè)高速信道的技術(shù)是把多個(gè)低信道組合成一個(gè)高速信道的技術(shù),它可以有效的提高數(shù)據(jù)鏈路的它可以有效的提高數(shù)據(jù)鏈路的利用率利用率,從而使得

33、一條高速的主干鏈路同時(shí)為多條低速的接入鏈路提供服務(wù)從而使得一條高速的主干鏈路同時(shí)為多條低速的接入鏈路提供服務(wù),也就是使得網(wǎng)絡(luò)干線(xiàn)可以同時(shí)運(yùn)載大量的語(yǔ)音和數(shù)據(jù)傳輸。也就是使得網(wǎng)絡(luò)干線(xiàn)可以同時(shí)運(yùn)載大量的語(yǔ)音和數(shù)據(jù)傳輸。 ATM技術(shù)1. ATM的產(chǎn)生 隨著多媒體技術(shù)的出現(xiàn),人們對(duì)對(duì)帶寬的需求也越來(lái)越高。針對(duì)這種情況,CCITT研究制定了B-ISDN(寬帶綜合業(yè)務(wù)數(shù)字網(wǎng))標(biāo)準(zhǔn)。ATM就是支持B-ISDN服務(wù)的一種交換技術(shù)。2. ATM信元結(jié)構(gòu) ATM信息傳輸采用固定長(zhǎng)格式,一律為53字節(jié),稱(chēng)為ATM數(shù)據(jù)信元。其中包括48個(gè)字節(jié)的數(shù)據(jù)和5個(gè)字節(jié)的信元頭。ATM信元結(jié)構(gòu)如圖5-21所示。ATM信元結(jié)構(gòu)如圖

34、5-21所示。 圖5-21信元結(jié)構(gòu)3. ATM的傳輸模式ATM采用面向連接的傳輸方式,將數(shù)據(jù)分割成固定長(zhǎng)度的信元,通過(guò)虛連接進(jìn)行交換。一個(gè)ATM的傳輸過(guò)程可以包括三個(gè)階段:連接建立、數(shù)據(jù)傳輸和連接終止 ATM與IP的比較:1、ATM是面向連接的,但I(xiàn)P是無(wú)連接的。當(dāng)在一個(gè)面向連接的ATM網(wǎng)絡(luò)上傳送無(wú)連接的IP分組時(shí),還可以有兩種選擇。第一種方法是每傳送一個(gè)分組就根據(jù)需要建立一條ATM連接,而第二種方法是在事先配置好的連接上傳送。2、ATM的一個(gè)突出優(yōu)點(diǎn)就是有服務(wù)質(zhì)量QoS的保證。但I(xiàn)P(目前是IPv4)則沒(méi)有服務(wù)質(zhì)量的概念,每一個(gè)分組按照“盡最大努力”的原則由路由器轉(zhuǎn)發(fā)。 接入網(wǎng)基礎(chǔ)1、概念

35、接入網(wǎng)AN(Access Network),也稱(chēng)為用戶(hù)接入網(wǎng),是由業(yè)務(wù)節(jié)點(diǎn)接口(SNI)和相關(guān)用戶(hù)網(wǎng)絡(luò)接口(UNI)之間的一系列傳送實(shí)體(例如線(xiàn)路設(shè)施和傳輸設(shè)備)組成的。2、接入網(wǎng)的功能結(jié)構(gòu) 它位于交換局端和用戶(hù)終端之間,可以支持各種交換型和非交換型業(yè)務(wù),并將這些業(yè)務(wù)流組合后沿著公共的傳輸通道送往業(yè)務(wù)節(jié)點(diǎn)。3、分類(lèi)接入網(wǎng)可以分為有線(xiàn)接入網(wǎng)和無(wú)線(xiàn)接入網(wǎng): 有線(xiàn)接入網(wǎng)包括銅線(xiàn)接入網(wǎng)、光纖接入網(wǎng)和混合光纖/同軸電纜接入網(wǎng);無(wú)線(xiàn)接入網(wǎng)包括固定無(wú)線(xiàn)接入網(wǎng)和移動(dòng)接入網(wǎng)目前3G存在四種標(biāo)準(zhǔn)CDMA2000WCDMATD-SCDMAWiMAXLTELTE(Long Term Evolution,長(zhǎng)期演進(jìn))項(xiàng)目是3G的演進(jìn),LTE并非人們普遍誤解的4G技術(shù),而是3G與4G技術(shù)之間的一個(gè)過(guò)渡,是3.9G的全球標(biāo)準(zhǔn)。HSPA高速分組接入技術(shù)HSPA (High Speed Packet

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論