數(shù)字視頻處理6章課件_第1頁
數(shù)字視頻處理6章課件_第2頁
數(shù)字視頻處理6章課件_第3頁
數(shù)字視頻處理6章課件_第4頁
數(shù)字視頻處理6章課件_第5頁
已閱讀5頁,還剩79頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第六章視頻壓縮編碼基本原理6.1視頻壓縮編碼概述第六章視頻壓縮編碼基本原理6.1視頻壓縮編碼概述6.1.1視頻壓縮編碼的必要性未經(jīng)過壓縮的原始視頻的碼率:720p高清電視(30fps,4:2:0):1280×720×30×8×1.5=316.41Mbps1080p高清電視(60fps,4:2:2):1920×1080×60×8×2=1.85Gbps100分鐘的720p高清電視節(jié)目(30fps,4:2:0)大小可達(dá)約231.74GB6.1.1視頻壓縮編碼的必要性未經(jīng)過壓縮的原始視頻的碼率:視頻壓縮編碼的必要性同樣,傳輸中也存在同樣的困難,網(wǎng)絡(luò)帶寬受限視頻壓縮編碼的必要性同樣,傳輸中也存在同樣的困難,網(wǎng)絡(luò)帶寬受6.1.2視頻壓縮編碼的可能性信息之所以能進(jìn)行壓縮,是因為信息本身通常存在冗余量在數(shù)據(jù)存儲或傳輸時,通過選擇優(yōu)化的信源編碼方案,消除了冗余,也就達(dá)到了數(shù)據(jù)壓縮目的6.1.2視頻壓縮編碼的可能性信息之所以能進(jìn)行壓縮,是因為信源/信道信源就是信息的來源,可以是人、機(jī)器、自然界的物體等等。信源發(fā)出信息的時候,一般以某種訊息的方式表現(xiàn)出來,可以是符號,如文字、語言等,也可以是信號,如圖像、聲響等等信道就是信息傳遞的通道,是將信號進(jìn)行傳輸、存儲和處理的媒介。信道的關(guān)鍵問題是它的容量大小,要求以最大的速率傳送最大的信息量信源/信道信源就是信息的來源,可以是人、機(jī)器、自然界的物體等信源編碼/信道編碼為了減少信源輸出符號序列中的冗余度、提高符號的平均信息量,對信源輸出的符號序列所施行的變換稱為信源編碼對輸入信息進(jìn)行編碼,優(yōu)化信息和壓縮信息并且打成符合標(biāo)準(zhǔn)的數(shù)據(jù)包信道編碼是為了對抗信道中的噪音和衰減,通過增加冗余,如校驗碼等,來提高抗干擾能力以及糾錯能力信源編碼/信道編碼為了減少信源輸出符號序列中的冗余度、提高符信息熵信息是個很抽象的概念,我們常常說信息很多,或者信息較少,但卻很難說清楚信息到底有多少,直到1948年,香農(nóng)提出了“信息熵”(Entropy)的概念,才解決了對信息的量化度量問題信息熵是用于度量信息量的一個概念。一個系統(tǒng)越是有序,信息熵就越低;反之,一個系統(tǒng)越是混亂,信息熵就越高。所以,信息熵也可以說是系統(tǒng)有序化程度的一個度量信息熵信息是個很抽象的概念,我們常常說信息很多,或者信息較少時間冗余在視頻序列中,前后兩幀圖像(時間間隔很短)之間具有較大的相關(guān)性,表現(xiàn)出幀與幀之間的重復(fù),因而存在時間冗余這是視頻信號中所經(jīng)常包含的冗余時間冗余在視頻序列中,前后兩幀圖像(時間間隔很短)之間具有較空間冗余在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面顏色分布是有序的、而不是完全雜亂無章的)的表面物理特征具有相關(guān)性,這些相關(guān)性的光成像結(jié)構(gòu)在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余同一幀圖像中相鄰的像素之間具有很強(qiáng)的相關(guān)性空間冗余在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面知識冗余有許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(先驗或背景知識)有相當(dāng)大的相關(guān)性,從這種知識出發(fā)可以歸納出圖像的某種規(guī)律性變化,這類冗余稱為知識冗余。知識冗余的一個典型例子是對人像的理解,比如,鼻子上方有眼睛,鼻子又在嘴的上方等知識冗余有許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(先驗或背結(jié)構(gòu)冗余有些圖像從大面積上或整體上看存在著重復(fù)出現(xiàn)的相同或相近的紋理結(jié)構(gòu),例如布紋圖像和草席圖像,被稱為結(jié)構(gòu)冗余結(jié)構(gòu)冗余有些圖像從大面積上或整體上看存在著重復(fù)出現(xiàn)的相同或相其它冗余信息熵冗余(統(tǒng)計冗余、編碼冗余):調(diào)整編碼(coding)方式可以減少碼字的數(shù)據(jù)量,即編碼的效率視覺冗余:人類的視覺系統(tǒng)實際上只在一定程度上對圖像的變化產(chǎn)生敏感,即圖像數(shù)據(jù)中存在著大量人類視覺覺察不到的細(xì)節(jié)……其它冗余信息熵冗余(統(tǒng)計冗余、編碼冗余):調(diào)整編碼(codi6.1.3無損壓縮與有損壓縮無損壓縮可完全恢復(fù)數(shù)據(jù)而不引入失真。由于整個編解碼過程中,信源信息的熵始終保持不變,因此無損壓縮又被稱為熵保持編碼,無損壓縮的編碼效率受信息的熵限制,壓縮率通常在2至5倍。無損編碼包括:變換編碼、游程編碼、算術(shù)編碼等6.1.3無損壓縮與有損壓縮無損壓縮可完全恢復(fù)數(shù)據(jù)而不引入無損壓縮與有損壓縮有損壓縮則是利用人眼視覺特性(HVS:HumanVisionSystem),對人眼不敏感的某些圖像細(xì)節(jié)信息進(jìn)行壓縮甚至忽略不編碼,因此在解碼恢復(fù)的過程時,不能完全恢復(fù)數(shù)據(jù)的全部信息,引入了失真,但是對于圖像的最終接收者(人眼)而言,獲得的信息的變化不大(即無大的視覺失真),同時獲得較大的壓縮率(10到200倍)無損壓縮與有損壓縮有損壓縮則是利用人眼視覺特性(HVS:H無損壓縮與有損壓縮在常用的視頻編碼應(yīng)用中,有損編碼是與無損編碼進(jìn)行混合編碼無損壓縮與有損壓縮在常用的視頻編碼應(yīng)用中,有損編碼是與無損編6.1.4視頻壓縮編碼的目標(biāo)視頻信號由于信息量巨大,存儲空間要求高、傳輸網(wǎng)絡(luò)帶寬要求高,需要將視頻信號在傳送前先進(jìn)行壓縮編碼,即進(jìn)行視頻源壓縮編碼,然后在網(wǎng)絡(luò)上進(jìn)行傳送或者存儲,以便節(jié)省傳送帶寬和存儲空間視頻壓縮編碼的基本目標(biāo)要求:1)必須壓縮在一定的帶寬內(nèi),即視頻編碼器應(yīng)具有足夠的壓縮比6.1.4視頻壓縮編碼的目標(biāo)視頻信號由于信息量巨大,存儲空視頻壓縮編碼的目標(biāo)2)視頻信號壓縮之后,應(yīng)保持一定的視頻質(zhì)量如果不問質(zhì)量,一味地壓縮,雖然壓縮比很高,但壓縮后嚴(yán)重失真,顯然達(dá)不到要求;反之,如只講質(zhì)量,壓縮比太小,也不符合要求3)在以上兩個要求下,視頻編碼器的實現(xiàn)應(yīng)力求簡單、易實現(xiàn)、成本低、可靠性高,這也是基本的要求視頻壓縮編碼的目標(biāo)2)視頻信號壓縮之后,應(yīng)保持一定的視頻質(zhì)量6.1.5視頻壓縮編碼技術(shù)概述

從上世紀(jì)80年代開始逐漸形成了混合視頻編碼(Hybridvideocoding/encoding)技術(shù),并成為之后一系列視頻編碼標(biāo)準(zhǔn)的基礎(chǔ)框架6.1.5視頻壓縮編碼技術(shù)概述從上世紀(jì)80年代開始逐漸形視頻壓縮編碼技術(shù)概述

視頻編碼方法與采用的信源模型有關(guān)如果采用“一幅圖像由許多像素構(gòu)成”的信源模型,這種信源模型的參數(shù)就是每個像素的亮度和色度的幅度值。對這些參數(shù)進(jìn)行壓縮編碼技術(shù)稱為基于波形的編碼如果采用一個分量有幾個物體構(gòu)成的信源模型,這種信源模型的參數(shù)就是各個物體的形狀、紋理和運(yùn)動。對這些參數(shù)進(jìn)行壓縮編碼的技術(shù)被稱為基于內(nèi)容的編碼視頻壓縮編碼技術(shù)概述視頻編碼方法與采用的信源模型有關(guān)視頻壓縮編碼技術(shù)概述

由此可見,根據(jù)采用信源模型,視頻編碼可以分為兩大類,基于波形的編碼和基于內(nèi)容的編碼它們利用不同的壓縮編碼(Encoding)方法,得到相應(yīng)的量化前的參數(shù);再對這些參數(shù)進(jìn)行量化;最后,進(jìn)行無損熵編碼進(jìn)一步提高效率解碼(Decoding)則為編碼的逆過程視頻壓縮編碼技術(shù)概述由此可見,根據(jù)采用信源模型,視頻編碼可視頻編碼分塊為減少編碼的復(fù)雜性,使視頻編碼操作易于執(zhí)行,首先把一幅圖像分成固定大小的宏塊(Macroblock,MB),以亮度為基準(zhǔn),通常為16×16塊(每塊16行,每行16個像素)在宏塊中可以進(jìn)一步分塊,例如8×8塊(每塊8行,每行8個像素)、16×8塊、4×4塊等等,然后對塊進(jìn)行壓縮編碼處理色度按照采樣或子采樣格式對應(yīng)計算視頻編碼分塊為減少編碼的復(fù)雜性,使視頻編碼操作易于執(zhí)行,首先視頻編碼分塊一個宏塊通常由6個塊組成(4:2:0子采樣)8x8blocksmacroblockYCbCr視頻編碼分塊一個宏塊通常由6個塊組成(4:2:0子采樣)8x基于內(nèi)容的編碼基于塊的編碼易于操作,但由于人為地把一幅圖像劃分成許多固定大小的塊,當(dāng)包含邊界的塊屬于不同物體時,它們分別具有不同的運(yùn)動,便不能用同一個運(yùn)動矢量表示該邊界塊的運(yùn)動狀態(tài)。如果強(qiáng)制劃分成固定大小的塊,這種邊界塊必然會產(chǎn)生高的預(yù)測誤差和失真,嚴(yán)重影響了壓縮編碼信號的質(zhì)量基于內(nèi)容的編碼基于塊的編碼易于操作,但由于人為地把一幅圖像劃基于內(nèi)容的編碼于是產(chǎn)生了基于內(nèi)容的編碼技術(shù)。這時先把視頻幀分成對應(yīng)于不同物體的區(qū)域,然后對其編碼即對不同物體的形狀、運(yùn)動和紋理進(jìn)行編碼。在最簡單情況下,利用二維輪廓描述物體的形狀;利用運(yùn)動矢量描述其運(yùn)動狀態(tài);而紋理則用顏色的波形進(jìn)行描述基于內(nèi)容的編碼于是產(chǎn)生了基于內(nèi)容的編碼技術(shù)。這時先把視頻幀分視頻冗余的壓縮手段空間冗余:幀內(nèi)編碼時間冗余:幀間編碼視覺冗余:變換編碼、量化信息熵冗余:熵編碼視頻冗余的壓縮手段空間冗余:幀內(nèi)編碼6.1.6視頻質(zhì)量對壓縮后的視頻質(zhì)量估計是一件困難的工作大體上,可分為主觀視頻質(zhì)量評定和客觀視頻質(zhì)量評定兩種估計方法6.1.6視頻質(zhì)量對壓縮后的視頻質(zhì)量估計是一件困難的工作主觀質(zhì)量由于個人的視覺系統(tǒng)(HVS)不盡相同,對視頻內(nèi)容的熟悉程度也不一樣為了減少主觀隨意性,在對視頻進(jìn)行主觀評定前,選若干名專家和“非專家”作為評分委員,共同利用五項或七項評分法對同一種視頻進(jìn)行質(zhì)量評定最后按加權(quán)平均法則對該壓縮后的視頻質(zhì)量進(jìn)行主觀評定主觀質(zhì)量由于個人的視覺系統(tǒng)(HVS)不盡相同,對視頻內(nèi)容的熟主觀評價分?jǐn)?shù)標(biāo)準(zhǔn)主觀評價分?jǐn)?shù)標(biāo)準(zhǔn)主觀質(zhì)量測試系統(tǒng)測試方法可用隨機(jī)次序請評委觀察比較原始圖像和壓縮編碼的圖像,國際上稱為DSCOS的測試系統(tǒng)其中A為原始圖像,B為編碼解碼后的圖像,以任意的A、B次序讓評委打分評定主觀質(zhì)量測試系統(tǒng)測試方法可用隨機(jī)次序請評委觀察比較原始圖像和客觀質(zhì)量主觀的視頻質(zhì)量評分更接近人的真實視覺感受,但需耗費(fèi)人力和時間,成本較高客觀質(zhì)量的測定方法速度快、易實行,但往往不會太符合人眼的視覺感受,只能說大體上的質(zhì)量??陀^質(zhì)量測定方法應(yīng)致力于改進(jìn)其測試標(biāo)準(zhǔn)和測試方法,使其符合人的視覺感受客觀質(zhì)量主觀的視頻質(zhì)量評分更接近人的真實視覺感受,但需耗費(fèi)人客觀質(zhì)量最常用的測試標(biāo)準(zhǔn)是峰值信號與噪聲之比(PSNR):PSNR(dB)=10log10[(2n-1)2/MSE)其中MSE(meansquareerror)為原始和編解碼后圖像之間的均方誤差,(2n-1)2為圖像中最大可能信號值的平方,n表示每個像素的比特數(shù)客觀質(zhì)量最常用的測試標(biāo)準(zhǔn)是峰值信號與噪聲之比(PSNR):客觀質(zhì)量客觀質(zhì)量客觀質(zhì)量一般講,PSNR愈高視頻質(zhì)量愈高;反之亦然但實際上有時并非如此圖(4)的PSNR為27.7dB,其主觀評定可能比圖(2)、(3)的高,但客觀質(zhì)量PSNR卻低于圖(2)、(3)的30.6dB和28.3dB這是因為圖(4)中的臉部更清晰,只是背景模糊,而人眼對臉部往往更敏感更重視客觀質(zhì)量一般講,PSNR愈高視頻質(zhì)量愈高;反之亦然第六章視頻壓縮編碼基本原理6.1視頻壓縮編碼概述6.2熵編碼(即編碼過程中按信息熵原理不丟失任何信息的編碼)第六章視頻壓縮編碼基本原理6.1視頻壓縮編碼概述變長編碼(哈夫曼編碼)1952年,哈夫曼(霍夫曼)提出變長編碼方法:對出現(xiàn)概率大的符號分配短字長的二進(jìn)制碼,對出現(xiàn)概率小的符號分配長字長二進(jìn)制碼,得到符號平均碼長最短的碼Avariable-lengthencodermapsinputsymbolstoaseriesofcodewords(variablelengthcodesorVLCs).變長編碼器將輸入符號映射到一系列的碼字(變長碼,或稱VLC)。變長編碼(哈夫曼編碼)1952年,哈夫曼(霍夫曼)提出變長編變長編碼(哈夫曼編碼)Eachsymbolmapstoacodewordandcodewordsmayhavevaryinglengthbutmusteachcontainanintegralnumberofbits.每一個符號被映射到一個碼字,碼字具有可變的長度,但是一定是整數(shù)比特數(shù)的。變長編碼(哈夫曼編碼)Eachsymbolmapsto變長編碼(哈夫曼編碼)Frequently-occurringsymbolsarerepresentedwithshortVLCswhilstlesscommonsymbolsarerepresentedwithlongVLCs.頻繁出現(xiàn)的符號將通過短的VLC(可變長碼)表示,而那些較少出現(xiàn)的符號將通過長的VLC表示。由此實現(xiàn)字符數(shù)量的壓縮變長編碼(哈夫曼編碼)Frequently-occurrin變長編碼(哈夫曼編碼)HuffmancodingassignsaVLCtoeachsymbolbasedontheprobabilityofoccurrenceofdifferentsymbols.Itisnecessarytocalculatetheprobabilityofoccurrenceofeachsymbolandtoconstructasetofvariablelengthcodewords.

哈夫曼編碼為每個符號確定VLC時是依據(jù)不同符號的出現(xiàn)概率。因此有必要計算每個符號的出現(xiàn)概率來構(gòu)建一個可變長碼集合。變長編碼(哈夫曼編碼)Huffmancodingassi哈夫曼碼表(Huffmancodetable)哈夫曼編碼步驟如下:第1步,將信息符號按其出現(xiàn)概率從大到小排列第2步,將兩個最小概率組成一組,劃成2個分支域,并標(biāo)以0和1;再把2個分支域合并成1個支域,標(biāo)以兩個概率之和哈夫曼碼表(Huffmancodetable)哈夫曼編哈夫曼碼表第3步,依此類推,直到概率之和等于1.0第4步,找出概率和1.0到各信息符號的路徑,記下各路徑從右到左各分支域的0和1,即得到信息符號相應(yīng)的碼字哈夫曼碼表第3步,依此類推,直到概率之和等于1.0哈夫曼碼表哈夫曼碼表變長編碼(哈夫曼編碼)平均碼字長度的計算(平均每個符號用幾個比特表示):p和l分別為一個符號的出現(xiàn)概率和碼字長度(比特數(shù)),N為符號總數(shù)變長編碼(哈夫曼編碼)平均碼字長度的計算(平均每個符號用幾個第六章視頻壓縮編碼基本原理6.1視頻壓縮編碼概述第六章視頻壓縮編碼基本原理6.1視頻壓縮編碼概述6.1.1視頻壓縮編碼的必要性未經(jīng)過壓縮的原始視頻的碼率:720p高清電視(30fps,4:2:0):1280×720×30×8×1.5=316.41Mbps1080p高清電視(60fps,4:2:2):1920×1080×60×8×2=1.85Gbps100分鐘的720p高清電視節(jié)目(30fps,4:2:0)大小可達(dá)約231.74GB6.1.1視頻壓縮編碼的必要性未經(jīng)過壓縮的原始視頻的碼率:視頻壓縮編碼的必要性同樣,傳輸中也存在同樣的困難,網(wǎng)絡(luò)帶寬受限視頻壓縮編碼的必要性同樣,傳輸中也存在同樣的困難,網(wǎng)絡(luò)帶寬受6.1.2視頻壓縮編碼的可能性信息之所以能進(jìn)行壓縮,是因為信息本身通常存在冗余量在數(shù)據(jù)存儲或傳輸時,通過選擇優(yōu)化的信源編碼方案,消除了冗余,也就達(dá)到了數(shù)據(jù)壓縮目的6.1.2視頻壓縮編碼的可能性信息之所以能進(jìn)行壓縮,是因為信源/信道信源就是信息的來源,可以是人、機(jī)器、自然界的物體等等。信源發(fā)出信息的時候,一般以某種訊息的方式表現(xiàn)出來,可以是符號,如文字、語言等,也可以是信號,如圖像、聲響等等信道就是信息傳遞的通道,是將信號進(jìn)行傳輸、存儲和處理的媒介。信道的關(guān)鍵問題是它的容量大小,要求以最大的速率傳送最大的信息量信源/信道信源就是信息的來源,可以是人、機(jī)器、自然界的物體等信源編碼/信道編碼為了減少信源輸出符號序列中的冗余度、提高符號的平均信息量,對信源輸出的符號序列所施行的變換稱為信源編碼對輸入信息進(jìn)行編碼,優(yōu)化信息和壓縮信息并且打成符合標(biāo)準(zhǔn)的數(shù)據(jù)包信道編碼是為了對抗信道中的噪音和衰減,通過增加冗余,如校驗碼等,來提高抗干擾能力以及糾錯能力信源編碼/信道編碼為了減少信源輸出符號序列中的冗余度、提高符信息熵信息是個很抽象的概念,我們常常說信息很多,或者信息較少,但卻很難說清楚信息到底有多少,直到1948年,香農(nóng)提出了“信息熵”(Entropy)的概念,才解決了對信息的量化度量問題信息熵是用于度量信息量的一個概念。一個系統(tǒng)越是有序,信息熵就越低;反之,一個系統(tǒng)越是混亂,信息熵就越高。所以,信息熵也可以說是系統(tǒng)有序化程度的一個度量信息熵信息是個很抽象的概念,我們常常說信息很多,或者信息較少時間冗余在視頻序列中,前后兩幀圖像(時間間隔很短)之間具有較大的相關(guān)性,表現(xiàn)出幀與幀之間的重復(fù),因而存在時間冗余這是視頻信號中所經(jīng)常包含的冗余時間冗余在視頻序列中,前后兩幀圖像(時間間隔很短)之間具有較空間冗余在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面顏色分布是有序的、而不是完全雜亂無章的)的表面物理特征具有相關(guān)性,這些相關(guān)性的光成像結(jié)構(gòu)在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余同一幀圖像中相鄰的像素之間具有很強(qiáng)的相關(guān)性空間冗余在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面知識冗余有許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(先驗或背景知識)有相當(dāng)大的相關(guān)性,從這種知識出發(fā)可以歸納出圖像的某種規(guī)律性變化,這類冗余稱為知識冗余。知識冗余的一個典型例子是對人像的理解,比如,鼻子上方有眼睛,鼻子又在嘴的上方等知識冗余有許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(先驗或背結(jié)構(gòu)冗余有些圖像從大面積上或整體上看存在著重復(fù)出現(xiàn)的相同或相近的紋理結(jié)構(gòu),例如布紋圖像和草席圖像,被稱為結(jié)構(gòu)冗余結(jié)構(gòu)冗余有些圖像從大面積上或整體上看存在著重復(fù)出現(xiàn)的相同或相其它冗余信息熵冗余(統(tǒng)計冗余、編碼冗余):調(diào)整編碼(coding)方式可以減少碼字的數(shù)據(jù)量,即編碼的效率視覺冗余:人類的視覺系統(tǒng)實際上只在一定程度上對圖像的變化產(chǎn)生敏感,即圖像數(shù)據(jù)中存在著大量人類視覺覺察不到的細(xì)節(jié)……其它冗余信息熵冗余(統(tǒng)計冗余、編碼冗余):調(diào)整編碼(codi6.1.3無損壓縮與有損壓縮無損壓縮可完全恢復(fù)數(shù)據(jù)而不引入失真。由于整個編解碼過程中,信源信息的熵始終保持不變,因此無損壓縮又被稱為熵保持編碼,無損壓縮的編碼效率受信息的熵限制,壓縮率通常在2至5倍。無損編碼包括:變換編碼、游程編碼、算術(shù)編碼等6.1.3無損壓縮與有損壓縮無損壓縮可完全恢復(fù)數(shù)據(jù)而不引入無損壓縮與有損壓縮有損壓縮則是利用人眼視覺特性(HVS:HumanVisionSystem),對人眼不敏感的某些圖像細(xì)節(jié)信息進(jìn)行壓縮甚至忽略不編碼,因此在解碼恢復(fù)的過程時,不能完全恢復(fù)數(shù)據(jù)的全部信息,引入了失真,但是對于圖像的最終接收者(人眼)而言,獲得的信息的變化不大(即無大的視覺失真),同時獲得較大的壓縮率(10到200倍)無損壓縮與有損壓縮有損壓縮則是利用人眼視覺特性(HVS:H無損壓縮與有損壓縮在常用的視頻編碼應(yīng)用中,有損編碼是與無損編碼進(jìn)行混合編碼無損壓縮與有損壓縮在常用的視頻編碼應(yīng)用中,有損編碼是與無損編6.1.4視頻壓縮編碼的目標(biāo)視頻信號由于信息量巨大,存儲空間要求高、傳輸網(wǎng)絡(luò)帶寬要求高,需要將視頻信號在傳送前先進(jìn)行壓縮編碼,即進(jìn)行視頻源壓縮編碼,然后在網(wǎng)絡(luò)上進(jìn)行傳送或者存儲,以便節(jié)省傳送帶寬和存儲空間視頻壓縮編碼的基本目標(biāo)要求:1)必須壓縮在一定的帶寬內(nèi),即視頻編碼器應(yīng)具有足夠的壓縮比6.1.4視頻壓縮編碼的目標(biāo)視頻信號由于信息量巨大,存儲空視頻壓縮編碼的目標(biāo)2)視頻信號壓縮之后,應(yīng)保持一定的視頻質(zhì)量如果不問質(zhì)量,一味地壓縮,雖然壓縮比很高,但壓縮后嚴(yán)重失真,顯然達(dá)不到要求;反之,如只講質(zhì)量,壓縮比太小,也不符合要求3)在以上兩個要求下,視頻編碼器的實現(xiàn)應(yīng)力求簡單、易實現(xiàn)、成本低、可靠性高,這也是基本的要求視頻壓縮編碼的目標(biāo)2)視頻信號壓縮之后,應(yīng)保持一定的視頻質(zhì)量6.1.5視頻壓縮編碼技術(shù)概述

從上世紀(jì)80年代開始逐漸形成了混合視頻編碼(Hybridvideocoding/encoding)技術(shù),并成為之后一系列視頻編碼標(biāo)準(zhǔn)的基礎(chǔ)框架6.1.5視頻壓縮編碼技術(shù)概述從上世紀(jì)80年代開始逐漸形視頻壓縮編碼技術(shù)概述

視頻編碼方法與采用的信源模型有關(guān)如果采用“一幅圖像由許多像素構(gòu)成”的信源模型,這種信源模型的參數(shù)就是每個像素的亮度和色度的幅度值。對這些參數(shù)進(jìn)行壓縮編碼技術(shù)稱為基于波形的編碼如果采用一個分量有幾個物體構(gòu)成的信源模型,這種信源模型的參數(shù)就是各個物體的形狀、紋理和運(yùn)動。對這些參數(shù)進(jìn)行壓縮編碼的技術(shù)被稱為基于內(nèi)容的編碼視頻壓縮編碼技術(shù)概述視頻編碼方法與采用的信源模型有關(guān)視頻壓縮編碼技術(shù)概述

由此可見,根據(jù)采用信源模型,視頻編碼可以分為兩大類,基于波形的編碼和基于內(nèi)容的編碼它們利用不同的壓縮編碼(Encoding)方法,得到相應(yīng)的量化前的參數(shù);再對這些參數(shù)進(jìn)行量化;最后,進(jìn)行無損熵編碼進(jìn)一步提高效率解碼(Decoding)則為編碼的逆過程視頻壓縮編碼技術(shù)概述由此可見,根據(jù)采用信源模型,視頻編碼可視頻編碼分塊為減少編碼的復(fù)雜性,使視頻編碼操作易于執(zhí)行,首先把一幅圖像分成固定大小的宏塊(Macroblock,MB),以亮度為基準(zhǔn),通常為16×16塊(每塊16行,每行16個像素)在宏塊中可以進(jìn)一步分塊,例如8×8塊(每塊8行,每行8個像素)、16×8塊、4×4塊等等,然后對塊進(jìn)行壓縮編碼處理色度按照采樣或子采樣格式對應(yīng)計算視頻編碼分塊為減少編碼的復(fù)雜性,使視頻編碼操作易于執(zhí)行,首先視頻編碼分塊一個宏塊通常由6個塊組成(4:2:0子采樣)8x8blocksmacroblockYCbCr視頻編碼分塊一個宏塊通常由6個塊組成(4:2:0子采樣)8x基于內(nèi)容的編碼基于塊的編碼易于操作,但由于人為地把一幅圖像劃分成許多固定大小的塊,當(dāng)包含邊界的塊屬于不同物體時,它們分別具有不同的運(yùn)動,便不能用同一個運(yùn)動矢量表示該邊界塊的運(yùn)動狀態(tài)。如果強(qiáng)制劃分成固定大小的塊,這種邊界塊必然會產(chǎn)生高的預(yù)測誤差和失真,嚴(yán)重影響了壓縮編碼信號的質(zhì)量基于內(nèi)容的編碼基于塊的編碼易于操作,但由于人為地把一幅圖像劃基于內(nèi)容的編碼于是產(chǎn)生了基于內(nèi)容的編碼技術(shù)。這時先把視頻幀分成對應(yīng)于不同物體的區(qū)域,然后對其編碼即對不同物體的形狀、運(yùn)動和紋理進(jìn)行編碼。在最簡單情況下,利用二維輪廓描述物體的形狀;利用運(yùn)動矢量描述其運(yùn)動狀態(tài);而紋理則用顏色的波形進(jìn)行描述基于內(nèi)容的編碼于是產(chǎn)生了基于內(nèi)容的編碼技術(shù)。這時先把視頻幀分視頻冗余的壓縮手段空間冗余:幀內(nèi)編碼時間冗余:幀間編碼視覺冗余:變換編碼、量化信息熵冗余:熵編碼視頻冗余的壓縮手段空間冗余:幀內(nèi)編碼6.1.6視頻質(zhì)量對壓縮后的視頻質(zhì)量估計是一件困難的工作大體上,可分為主觀視頻質(zhì)量評定和客觀視頻質(zhì)量評定兩種估計方法6.1.6視頻質(zhì)量對壓縮后的視頻質(zhì)量估計是一件困難的工作主觀質(zhì)量由于個人的視覺系統(tǒng)(HVS)不盡相同,對視頻內(nèi)容的熟悉程度也不一樣為了減少主觀隨意性,在對視頻進(jìn)行主觀評定前,選若干名專家和“非專家”作為評分委員,共同利用五項或七項評分法對同一種視頻進(jìn)行質(zhì)量評定最后按加權(quán)平均法則對該壓縮后的視頻質(zhì)量進(jìn)行主觀評定主觀質(zhì)量由于個人的視覺系統(tǒng)(HVS)不盡相同,對視頻內(nèi)容的熟主觀評價分?jǐn)?shù)標(biāo)準(zhǔn)主觀評價分?jǐn)?shù)標(biāo)準(zhǔn)主觀質(zhì)量測試系統(tǒng)測試方法可用隨機(jī)次序請評委觀察比較原始圖像和壓縮編碼的圖像,國際上稱為DSCOS的測試系統(tǒng)其中A為原始圖像,B為編碼解碼后的圖像,以任意的A、B次序讓評委打分評定主觀質(zhì)量測試系統(tǒng)測試方法可用隨機(jī)次序請評委觀察比較原始圖像和客觀質(zhì)量主觀的視頻質(zhì)量評分更接近人的真實視覺感受,但需耗費(fèi)人力和時間,成本較高客觀質(zhì)量的測定方法速度快、易實行,但往往不會太符合人眼的視覺感受,只能說大體上的質(zhì)量??陀^質(zhì)量測定方法應(yīng)致力于改進(jìn)其測試標(biāo)準(zhǔn)和測試方法,使其符合人的視覺感受客觀質(zhì)量主觀的視頻質(zhì)量評分更接近人的真實視覺感受,但需耗費(fèi)人客觀質(zhì)量最常用的測試標(biāo)準(zhǔn)是峰值信號與噪聲之比(PSNR):PSNR(dB)=10log10[(2n-1)2/MSE)其中MSE(meansquareerror)為原始和編解碼后圖像之間的均方誤差,(2n-1)2為圖像中最大可能信號值的平方,n表示每個像素的比特數(shù)客觀質(zhì)量最常用的測試標(biāo)準(zhǔn)是峰值信號與噪聲之比(PSNR):客觀質(zhì)量客觀質(zhì)量客觀質(zhì)量一般講,PSNR愈高視頻質(zhì)量愈高;反之亦然但實際上有時并非如此圖(4)的PSNR為27.7dB,其主觀評定可能比圖(2)、(3)的高,但客觀質(zhì)量PSNR卻低于圖(2)、(3)的30.6dB和28.3dB這是因為圖(4)中的臉部更清晰,只是背景模糊,而人眼對臉部往往更敏感更重視客觀質(zhì)量一般講,PSNR愈高視頻質(zhì)量愈高;反之亦然第六章視頻壓縮編碼基本原理6.1視頻壓縮編碼概述6.2熵編碼(即編碼過程中按信息熵原理不丟失任何信息的編碼)第六章視頻壓縮編碼基本原理6.1視頻壓縮編碼概述變長編碼(哈夫曼編碼)1952年,哈夫曼(霍夫曼)提出變長編碼方法:對出現(xiàn)概率大的符號分配短字長的二進(jìn)制碼,對出現(xiàn)概率小的符號分配長字長二進(jìn)制碼,得到符號平均碼長最短的碼Avariable-lengthencodermapsinputsymbolstoaseriesofcodewords(variablelengthcodesorV

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論