已閱讀5頁,還剩58頁未讀, 繼續(xù)免費(fèi)閱讀
(計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)論文)基于avsm的幀間預(yù)測算法研究.pdf.pdf 免費(fèi)下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于a v s - m 的幀間預(yù)測算法研究摘要當(dāng)前我國在音視頻產(chǎn)業(yè)領(lǐng)域已經(jīng)具備較強(qiáng)的產(chǎn)業(yè)基礎(chǔ),但由于沒有掌握核心技術(shù)標(biāo)準(zhǔn),相關(guān)企業(yè)長期受制于國外持有標(biāo)準(zhǔn)化專利與技術(shù)的企業(yè)和組織。為了在音視頻產(chǎn)業(yè)領(lǐng)域擁有更多的自主知識(shí)產(chǎn)權(quán),2 0 0 2 年6 月2 1 日“數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組( a v s ) 在北京正式成立。a v s 工作小組制定了信息技術(shù)先進(jìn)音視頻編碼系列標(biāo)準(zhǔn),簡稱a y s 標(biāo)準(zhǔn)。a v s 標(biāo)準(zhǔn)是第一個(gè)我國自主提出的數(shù)字音視頻編解碼標(biāo)準(zhǔn)。a v s m 是a v s 標(biāo)準(zhǔn)的第七部分:移動(dòng)視頻。它面向移動(dòng)多媒體應(yīng)用,對(duì)新一代移動(dòng)多媒體通信、數(shù)字多媒體廣播、便攜式視聽消費(fèi)電子產(chǎn)品等產(chǎn)業(yè)的發(fā)展具有重要意義。a v s m 標(biāo)準(zhǔn)采用了基于塊運(yùn)動(dòng)補(bǔ)償混合編碼方案,為了實(shí)現(xiàn)更高的編碼效率,引入了許多新的編碼技術(shù),如新型幀內(nèi)預(yù)測、多宏塊劃分、多參考幀、高精度運(yùn)動(dòng)估計(jì)、整數(shù)變換、環(huán)路濾波器等。這些新技術(shù)使a v s m 標(biāo)準(zhǔn)能夠提供與最新的國際視頻編碼標(biāo)準(zhǔn)h 2 6 4 a v c 相當(dāng)?shù)木幋a效率,但是,這些新技術(shù)的采用也極大地增加了a v s m 編碼器的計(jì)算復(fù)雜度,因此需要尋找高效的優(yōu)化算法,以減少巨大的計(jì)算量,提高編碼速度。本文對(duì)a v s m 編碼過程中復(fù)雜度最高的幀間預(yù)測進(jìn)行了研究和算法優(yōu)化,具體內(nèi)容包括:針對(duì)幀間編碼模式選擇的復(fù)雜性,本文提出一種快速模式選擇算法。該算法基于對(duì)最佳模式選擇結(jié)果的統(tǒng)計(jì)分析,將全部編碼模式分成不同的模式集,根據(jù)序列的時(shí)域相關(guān)性設(shè)定自適應(yīng)閾值,來判斷搜索不同的模式集以及模式搜索提前終止判定,并有選擇性的進(jìn)行幀內(nèi)模式預(yù)測,有效的降低了模式選擇的復(fù)雜度,提高了編碼速度。運(yùn)動(dòng)估計(jì)是a v s m 編碼器幀間預(yù)測中計(jì)算量最大的模塊,本文針對(duì)分?jǐn)?shù)像素運(yùn)動(dòng)估計(jì)的復(fù)雜性,提出了自適應(yīng)分?jǐn)?shù)像素運(yùn)動(dòng)估計(jì)快速算法。該算法采用多種運(yùn)動(dòng)矢量預(yù)測提高分?jǐn)?shù)像素預(yù)測矢量的準(zhǔn)確性,并且利用分?jǐn)?shù)像素搜索窗口內(nèi)匹配誤差曲面的單峰特性,來預(yù)測匹配失真的下降方向,省略可能性小的分?jǐn)?shù)像素點(diǎn),利用自適應(yīng)閾值的判斷跳過不必要分?jǐn)?shù)像素搜索過程,大幅度地減少了搜索點(diǎn)數(shù)量。關(guān)鍵詞:視頻編碼;a v $ 一m 標(biāo)準(zhǔn);模式選擇;分?jǐn)?shù)像素運(yùn)動(dòng)估計(jì);r e s e a r c ho nin t e rp r e dic tio nina v s - ma b s t r a c to u rc o u n t r yh a sg o o di n d u s t r i a lf o u n d a t i o ni na u d i o a n dv i d e od o m a i n h o w e v e r ,b e c a u s eo ft h el a c ko fm a s t e r yo ft h ei m p o r t a n tt e c h n i q u e sa n ds t a n d a r d s ,r e l a t e dc o 印o m t i o mh a v el o n gb e e ne n s l a v e dt of o r e i g nc o r p o m t i o u so ro r g a n i z a t i o n s t oc h a n g et h i sd i s a d v a n t a g e o u ss i t u a t i o n , d i g i t a la u d i oa n dv i d e oc o d e et e c h n o l o g ys t a n d a r dw o r kg r o u p ”( a v s ) w a se s t a b l i s h e di nb e i ji n go nj u n e21 ,2 0 0 2 a v se s t a b l i s ho u rc o u n t r y sv i d e oa n da u d i oc o d i n gs t a n d a r d s ,c a l l e di n f o r m a t i o nt e c h n o l o g ya d v a n c e da u d i oa n dv i d e oc o d i n gs t a n d a r d s a v s ( a u d i ov i d e oc o d i n gs t a n d a r d ) i st h ef i r s ts t a n d a r dw h i c hi sp u tf o r w a r db yo u rc o u n t r yi n d e p e n d e n t l y a v s m ( m o b i l ev i d e o ) i st h es e v e n t hp a r to fa v s i ta i m sa tn e x tg e n e r a t i o nm u l t i m e d i aa p p l i c a t i o n s a n di th a ss i g n i f i c a n c ei nm u l t i m e d i ac o m m u n i c a t i o n , ( 1 i g 砒m u l t i m e d i ab r o a d c a s ta n dp o r t a b l ec o n s u m e re l e c t r o n i c se t c t h e & s i g no fa v s - mi sb a s e do nc o n v e n t i o n a lb l o c k - b a s e dm o t i o n - c o m p e n s a t i o nh y b r i dv i d e oc o d i n gc o n c e p t s f o rt h ee n h a n c e m e n to ft h ec o d i n ge f f i c i e n c y , a v s - ma d o p t sn e wt o o l sa sf o l l o w e d :n e wi n t r af r a m ep r e d i c t i o n , v a r i a b l eb l o c k s i z ew i t hs e v e nb l o c ks i z e si nm o t i o np r e d i c t i o n , m u l t i p l er e f e r e n c ep i c t u r e ,f r a c t i o n a l p i x e la c c u r a c yf o rm o t i o ne s t i m a t i o n , i n t e g e rt r a n s f o r ma n dl o o pf i l t e r w i t ht h e s ef e a t u r e s ,a v s mc a np r o v i d ei r n p r o v e dp e r f o r m a n c ec l o s et ot h en e w e s ti n t e r n a t i o n a lv i d e oc o d i n gs t a n d a r dh 2 6 4 a v c a tt h es a m et i m e ,t h ec o m p l e x i t yo ft h ea v s - mc o d e ci si n c r e a s e dr e m a r k a b l y a c c o r d i n g l y , t h er e a l t i m ev i d e oc o d e cd e m a n d sh i g h e r - p o w e r e dp r o c e s s o ra n df a s t e r - s p e e da l g o r i t h m s s ot h em a i ne n d e a v o ro ft h i sp a p e ri st oa c h i e v em a x i m a lp r o c e s s i n gs p e e da n db e t t e rv i d e oc o m p r e s s i o nq u a l i t yt h r o u g ho p t i m i z a t i o nf o ri n t e rp r e d i c t i o n , i nt h ea v s me n c o d i n gp r o c e s s t h em a j o rw o r k so ft h et h e s i sa l e 硒f o l l o w s t or e d u c et h ec o m p l e x i t yo fi n t e rp r e d i c t i o n , af a s ti n t e rp r e d i c t i o nm o d ed e c i s i o na l g o r i t h mi sp r o p o s e d i tc l a s s i f i e sa l lm o d e sb yb o t hh o m o g e n e i t ya n dt e m p o r a lc o r r e l a t i o no fm a c r o b l o c kb a s e do nt h es t a t i s t i ca n a l y s i so ft h er e s u l t so ft h eo p t i m a lm o d e s aa d a p t i v et h r e s h o l di sc o n t a i n e db yu s i n gt h eh i g hc o r r e l a t i o ni nt e m p o r a ld o m a i n so fv i d e os e q u e n c e i ias e l e c t i v eb l o c k - s i z ec l a s s e ss e a r c h i n ga l g o r i t h ma n das e l e c t i v ei n t r a - c o d i n gm o d es e a r c h i n ga l g o r i t h ma r ep r o p o s e d ,b a s e do nt h ea d a p t i v et h r e s h o l d s ot h ec o m p u t a t i o no fi n t e rm o d ed e c i s i o nc a nb ed e c r e a s e de f f i c i e n c ya n dt h ec o d i n gs p e e dc a nb ee n h a n c e d m o t i o ne s t i m a t i o ni st h em o s ti m p o r t a n tm o d u l ei nt h ea v s - me n c o d e r af a s tf r a c t i o n a lp i x e lm o t i o ne s t i m a t i o n ( m e ) a l g o r i t h mi sp r o p o s e di no r d e rt or e d u c et h ec o m p u t a t i o no ff r a c t i o n a lp i x e lm e m o r em o t i o nv e c t o rp r e d i c t i o n sa r eu t i l i z e dt oe n h a n c et h ea c c u r a c y b a s e do nt h es i n g l ep e a kc h a r a c t e r i s t i co ff r a c t i o n a lp i x e le r r o rm a t c h i n gf u n c t i o n ,t h em a t c h i n gd i s t o r t i o nd i r e c t i o ni sp r e d i c t e dt oe x c l u d et h el i t t l ep o s s i b l ep o i n t s i ta l s oa d o p t sa d a p t i v et h r e s h o l dd e c i s i o nt os t r i d eo v e ru n n e c e s s a r ys e a r c h i tc a ne f f i c i e n t l yd e c r e a s et h en u m b e ro fs e a r c hp o i n t sa n dc o m et oag o o dm a t c h i n g k e y w o r d s :v i d e oc o d i n g ;a v s - ms t a n d a r d ;i n t e rp r e d i c t i o nm o d ed e c i s i o n ;f r a c t i o n a lp i x e lm o t i o ne s t i m a t i o n ;i i i獨(dú)創(chuàng)聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含未獲得l 洼! 麴遺直墓絲置塞掛型壹咽數(shù):奎攔亙窒l 或其他教育機(jī)構(gòu)的學(xué)位或證書使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示謝意。學(xué)位論文作者簽名:李科簽字日期:如蠅年斗月i 。日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤,允許論文被查閱和借閱。本人授權(quán)學(xué)??梢詫W(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。同時(shí)授權(quán)中國科學(xué)技術(shù)信息研究所將本學(xué)位論文收錄到中國學(xué)位論文全文數(shù)據(jù)庫,并通過網(wǎng)絡(luò)向社會(huì)公眾提供信息服務(wù)。( 保密的學(xué)位論文在解密后適用本授權(quán)書)學(xué)位論文作者簽名:毒秤導(dǎo)師簽字:簽字日期:劭弼年q 月f o 日簽字日期:年月基于a v sm 的幀間預(yù)測算法研究1 緒論1 1 數(shù)字視頻編碼原理信息時(shí)代的重要特征是信息的數(shù)字化,數(shù)字化的視頻信號(hào)的數(shù)據(jù)量非常大,這對(duì)存儲(chǔ)器、通信信道以及處理器等都提出了相當(dāng)高的要求。例如,對(duì)于c i f ,4 :2 :0 格式的視頻圖像而言,其每幀圖像的分辨率為3 5 6 x 2 8 8 ,如果每個(gè)取樣值采用8 b i t 表示,幀率為每秒3 0 幀,那么數(shù)據(jù)量為每秒3 6 m b i t ,6 0 分鐘視頻的數(shù)據(jù)量高達(dá)1 3 1 g 。如果不加以壓縮,以現(xiàn)有網(wǎng)絡(luò)的帶寬以及存儲(chǔ)介質(zhì),傳輸和存儲(chǔ)這些龐大的數(shù)據(jù)幾乎是不可能的。因此數(shù)字視頻數(shù)據(jù)的高效壓縮意義重大,是降低存儲(chǔ)成本,緩解網(wǎng)絡(luò)帶寬,突破存儲(chǔ)空間和處理器主頻限制的關(guān)鍵技術(shù)。雖然數(shù)字視頻的信息數(shù)據(jù)很大,但這些數(shù)據(jù)往往是高度相關(guān)的,這些相關(guān)性會(huì)引起信息的冗余,描述信源的數(shù)據(jù)是信息量( 信源熵) 和信息冗余量之和,因此可以通過去除冗余信息來實(shí)現(xiàn)對(duì)數(shù)字視頻數(shù)據(jù)的壓縮。針對(duì)不同的冗余信息,人們研究了各種不同的壓縮方法【1 】【2 】【3 】來去除冗余。1 1 1 視覺冗余對(duì)人眼的視覺模型的研究表明,人類的視覺系統(tǒng)對(duì)圖像場的敏感性是非均勻、非線性的【3 】。然而,在記錄原始的圖像數(shù)據(jù)時(shí),通常假定視覺系統(tǒng)是線性的、均勻的,對(duì)視覺敏感和不敏感的部分同等對(duì)待,從而產(chǎn)生了比理想編碼( 即把視覺敏感和不敏感的部分區(qū)分開來編碼) 更多的數(shù)據(jù),這就是視覺冗余。人類的視覺系統(tǒng)對(duì)圖像的亮度比彩色更敏感,因此可以把亮度信息從彩色信息中分離出來,并使之具有更高的清晰度,彩色信息的清晰度較低些,可實(shí)現(xiàn)壓縮其帶寬,實(shí)現(xiàn)視頻壓縮的一部分。這樣人的感覺并沒有不同。隨著亮度的增加,視覺系統(tǒng)對(duì)量化誤差的敏感度降低,因?yàn)槿搜鄣谋鎰e能力與物體周圍的背景亮度成反比,所以在高亮區(qū),灰度值的量化可以更粗糙些。對(duì)于去除視覺冗余,變換編碼技術(shù)是最常用的方法。變換編碼是把圖像變換到一組新的基上,使得能量集中到幾個(gè)變換系數(shù)上,將高頻分量和低頻分量分離。在量化取整時(shí),根據(jù)人眼的視覺特性,對(duì)圖像低頻分量設(shè)置較細(xì)的量化,而對(duì)其余部分即高頻分量設(shè)置較粗的量化。1 1 2 時(shí)間冗余時(shí)間冗余是序列圖像( 運(yùn)動(dòng)圖像) 經(jīng)常包含的冗余。序列圖像一般為位于一時(shí)間軸基于a v s m 的幀間預(yù)測算法研究區(qū)間內(nèi)的一組連續(xù)的畫面,其中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同,因此只要知道物體移動(dòng)的距離和方位,就可以在前一幀找到相應(yīng)的圖像內(nèi)容,因而這部分圖像塊的信息就不需要再進(jìn)行傳送。通過運(yùn)動(dòng)估計(jì)得到物體的運(yùn)動(dòng)矢量表示物體移動(dòng)的距離和方向,利用運(yùn)動(dòng)補(bǔ)償?shù)玫疆?dāng)前一幀和前一幀相應(yīng)的運(yùn)動(dòng)部分的殘差,對(duì)運(yùn)動(dòng)矢量,殘差信息進(jìn)行編碼傳輸,即可去除時(shí)間冗余。1 1 3 空間冗余同一景物圖像各采樣點(diǎn)之間往往存在著空間連貫性,但是基于離散像素采樣來表示物體的方式通常沒有利用這種空間連貫性,從而產(chǎn)生了空間冗余。通常用差值脈沖編碼和幀內(nèi)預(yù)測編碼來消除空間冗余。差值脈沖編碼時(shí),所傳送的數(shù)據(jù)并不是每一樣點(diǎn)的取樣值,而是按照掃描的順序?qū)?dāng)前采樣點(diǎn)和前一采樣點(diǎn)的差值來進(jìn)行傳輸。由于相鄰取樣點(diǎn)之間的相關(guān)性,更多的時(shí)候所傳送的差值為零或者很小。幀內(nèi)預(yù)測編碼是利用周圍相鄰已編碼采樣點(diǎn)來預(yù)測當(dāng)前點(diǎn),為了讓預(yù)測的值和實(shí)際出現(xiàn)的樣值更接近,它在預(yù)測某一樣點(diǎn)的數(shù)值時(shí),不僅用到當(dāng)前行前一樣點(diǎn)的取樣值,還用到上一行相鄰樣點(diǎn)的取樣值,有時(shí)還用到上一行取樣點(diǎn)的前一樣點(diǎn)的取樣值。1 1 4 統(tǒng)計(jì)冗余統(tǒng)計(jì)冗余是指碼流中各符號(hào)間的相關(guān)性。對(duì)于編碼符號(hào),其平均碼長長于所表示信息的信息熵的差值就是統(tǒng)計(jì)冗余。在一串?dāng)?shù)值組成的信號(hào)中,通過統(tǒng)計(jì)學(xué)規(guī)律必然會(huì)有某些數(shù)值經(jīng)常出現(xiàn),相反一些數(shù)值會(huì)很少出現(xiàn)??梢愿鶕?jù)這種概率相異性分配不同長度的碼字,事件發(fā)生的概率越大,其熵值越小,分配較小的碼字;事件發(fā)生的概率越小,其熵值越大,可以分配較長的碼字。相對(duì)統(tǒng)一用定長的碼字表示來說,這樣就可以達(dá)到數(shù)據(jù)壓縮的目的。1 2 數(shù)字視頻編碼標(biāo)準(zhǔn)目前從事視頻壓縮標(biāo)準(zhǔn)制定的國際組織主要有國際電信聯(lián)盟i t u - t 的視頻編碼專家組v c e g 和國際標(biāo)準(zhǔn)化組織i s o i e c 的運(yùn)動(dòng)圖像專家組m p e g 。兩個(gè)組織基于不同的應(yīng)用需求,分別制定了h 2 6 x 和m p e g x 系列視頻壓縮標(biāo)準(zhǔn)。其中兩大視頻標(biāo)準(zhǔn)化組織于1 9 9 2 年聯(lián)合提出的m p e g 2 是現(xiàn)有最成功的國際視頻壓縮標(biāo)準(zhǔn),2 0 0 3 年又再次聯(lián)2基于a v s _ m 的幀間預(yù)測算法研究手提出了h 2 6 4 a v c ,即m p e g - - 4 第1 0 部分。國內(nèi)組織主要有a v s 工作組,制定了a v s 系列標(biāo)準(zhǔn)。1 2 1h 2 6 1 標(biāo)準(zhǔn)i t u t 的前身c c i t t 針對(duì)可視電話、會(huì)議電視和窄帶i s d n 等要求實(shí)時(shí)編解碼和低延時(shí)的應(yīng)用提出了h 2 6 1 1 4 標(biāo)準(zhǔn)。h 2 6 1 是第一個(gè)成功用于實(shí)際的數(shù)字視頻標(biāo)準(zhǔn)。h 2 6 1的基于塊的運(yùn)動(dòng)補(bǔ)償與d c t 變換相結(jié)合的混合視頻編碼方法對(duì)以后基于波形的一系列視頻編碼標(biāo)準(zhǔn)產(chǎn)生了深遠(yuǎn)影響。h 2 6 1 支持c i f 和q c m 格式的圖像,采用整數(shù)像素精度的運(yùn)動(dòng)補(bǔ)償。通過當(dāng)前幀與參考幀的對(duì)應(yīng)像素的均方值來表示幀間相關(guān)性判斷當(dāng)前宏塊用幀間還是幀內(nèi)模式編碼。如果采用幀間編碼則進(jìn)行運(yùn)動(dòng)補(bǔ)償,d c t 變換、量化,如果采用幀內(nèi)模式則直接進(jìn)行d c t 變換,量化。1 2 2h 2 6 3 標(biāo)準(zhǔn)為了改善h 2 6 1 的壓縮性能,r r u - u 工作組制定了h 2 6 3 5 1 。它是為低碼率視頻壓縮提供的新標(biāo)準(zhǔn),目的是支持碼率小于6 4 k b p s 的應(yīng)用。為了適應(yīng)低碼率傳輸要求,并進(jìn)一步提高圖像質(zhì)量,h 2 6 3 進(jìn)行了重要改進(jìn),采用了半像素預(yù)測,二維預(yù)測,基于語法的算術(shù)編碼,高級(jí)預(yù)測模式和p b 幀編碼等多個(gè)高級(jí)選項(xiàng)1 6 ,從而達(dá)到了進(jìn)一步降低碼率和提高編碼質(zhì)量的目的。h 2 6 3 + 1 7 1 和h 2 6 3 + + 【8 1 擴(kuò)充了h 2 6 3 的編碼可選項(xiàng),提高了編碼效率,適用范圍更大。h 2 6 3 在增加編碼效率的同時(shí),增強(qiáng)了抗誤碼的差錯(cuò)隱藏性能,將信道傳輸性能問題在信源編碼中加以綜合考慮。1 2 3m p e g _ l 標(biāo)準(zhǔn)m p e g 1 1 9 1 標(biāo)準(zhǔn)制訂的目標(biāo)碼率是1 5 m b p s ,對(duì)于c i f ( 3 5 2 x 2 8 8 ) 格- 式圖像可以達(dá)到實(shí)時(shí)播放,是為只讀c d r o m 光盤的視頻存儲(chǔ)和播放所制訂的。類似于h 2 6 1 標(biāo)準(zhǔn),m p e g 1 也采用運(yùn)動(dòng)補(bǔ)償和二維d c t 變換,量化后的d c t 系數(shù)進(jìn)行變長編碼,同時(shí)每個(gè)數(shù)據(jù)塊的直流分量d c 進(jìn)行預(yù)測差分編碼。m p e g 1 標(biāo)準(zhǔn)定義了三種圖像類:i 、p 、b 圖像。i 圖像采用幀內(nèi)預(yù)測,p 圖像采用幀間預(yù)測,以前一幀已編碼i 或p 圖像為參考圖像進(jìn)行運(yùn)動(dòng)補(bǔ)償。b 圖像采用雙向幀間預(yù)測,以前后兩個(gè)方向的圖像為參考幀進(jìn)行運(yùn)動(dòng)補(bǔ)償。基于a v s _ m 的幀問預(yù)測算法研究1 2 4m p e g - 2 標(biāo)準(zhǔn)m p e g 2 【1 0 l 標(biāo)準(zhǔn)包括系統(tǒng)、視頻、音頻及符合性4 個(gè)部分,其視頻編碼部分就是h 2 6 2 。m p e g 2 按不同的壓縮比分成五個(gè)檔次,并按視頻清晰度分為四個(gè)級(jí)別,共有2 0 種組合,其中應(yīng)用比較多的有1 1 種,分別用于標(biāo)準(zhǔn)數(shù)字電視、高清晰度數(shù)字電視,碼率從4 m b p s 一- 1 0 0 m b p s 。m p e g 2 支持逐行掃描和隔行掃描圖像,引入了“幀 和“場 的編碼方法,根據(jù)幀的行間和場的行間相關(guān)系數(shù),來判定用場編碼還是幀編碼。為了適應(yīng)信道變換和終端設(shè)備的不同,m p e g 2 采用了三種分級(jí)編碼,包括空間域分級(jí)、時(shí)間域分級(jí)和信噪比分級(jí)。1 2 5m p e g - 4 標(biāo)準(zhǔn)m p e g 4 【l l 】標(biāo)準(zhǔn)于1 9 9 9 年正式成為國際標(biāo)準(zhǔn),目標(biāo)是支持多種多媒體應(yīng)用,可根據(jù)應(yīng)用要求配置解碼器。m p e g - 4 標(biāo)準(zhǔn)為了支持高效壓縮、基于內(nèi)容交互和基于內(nèi)容分級(jí)擴(kuò)展,以基于內(nèi)容的方式表示視頻數(shù)據(jù),引入了視聽對(duì)象a v o ( a u d i o v i d e oo b j e c t )的概念。這種編碼模式能有效提高視頻通信的交互能力和編碼效率。m p e g - 4 具有很好的擴(kuò)展性,可進(jìn)行時(shí)域和空域的擴(kuò)展。這在m p e g 2 中也有所體現(xiàn)但是不突出。m p e g _ 4可根據(jù)帶寬和誤碼率的客觀條件,在時(shí)域或空域進(jìn)行擴(kuò)展。但是由于“基于對(duì)象的編碼尚有技術(shù)障礙,在技術(shù)專利保護(hù)問題上也遲遲難以找到有效的收費(fèi)形式,因此該標(biāo)準(zhǔn)目前仍然沒有得到普遍應(yīng)用。1 2 6h 2 6 4 m p e g - 4a r c 標(biāo)準(zhǔn)h 2 6 4 a v c 1 2 】是n u t 和i s o i e c 共同成立的聯(lián)合視頻組j v t ( j o i n tv i d e ot e a m ) 制訂的新標(biāo)準(zhǔn)。2 0 0 1 年6 月通過i s o f i e cm p e g 測試,被確認(rèn)為是當(dāng)前最先進(jìn)的視頻壓縮編碼方法。在2 0 0 3 年3 月,通過了最終視頻編碼標(biāo)準(zhǔn)草案,正式定為h 2 6 4 兒、,c 。其高效的編碼效率和網(wǎng)絡(luò)友好性使它成為新一代的國際視頻編碼標(biāo)準(zhǔn)。相對(duì)于以前的視頻編碼標(biāo)準(zhǔn),h 2 6 4 a v c 的突出特點(diǎn)有【1 3 1 :分為視頻編碼層( v c l ) 和網(wǎng)絡(luò)提取層( n a l ) 、1 4 ( 1 8 ) 像素精度的運(yùn)動(dòng)估計(jì)、7 種不同尺寸塊的運(yùn)動(dòng)矢量估計(jì)、多種模式的幀內(nèi)空間預(yù)測編碼、4 x 4 的整數(shù)類d c t 變換、基于上下文的自適應(yīng)變長編碼( c a v l c ) 和基于上下文的算術(shù)編碼( c a b a c ) 、多參考幀,b 幀可作為其它幀的參考幀、環(huán)路濾波、f m o ( f l e x i b l em a e r o b l o c ko r d e r i n g ) 、a s o ( a r b i t r a r ys l i c eo r d e r i n g ) 、s p s i 幀4基于a v s _ m 的幀間預(yù)測算法研究( s y n c h r o n i z a t i o n s w i t c h i n gp i c t u r e s ) 等。1 2 7a v s 標(biāo)準(zhǔn)為了擺脫我國多媒體產(chǎn)品開發(fā)和生產(chǎn)企業(yè)受制于國外編碼標(biāo)準(zhǔn)的現(xiàn)狀,在信息產(chǎn)業(yè)部科學(xué)技術(shù)司的領(lǐng)導(dǎo)下,我國“數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組【1 4 1 于2 0 0 2 年6月2 1 日正式宣布成立。其英文名稱為“a u d i ov i d e oc o d i n gs t a n d a r dw o r k g r o u po f c h i n a ,簡稱a v s 工作組。a v s 工作組提出的數(shù)字音視頻編解碼標(biāo)準(zhǔn)a v s ( a u d i ov i d e oc o d i n gs t a n d a r d ) 系列包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理等四個(gè)主要技術(shù)標(biāo)準(zhǔn)和一致性測試等支撐標(biāo)準(zhǔn)。2 0 0 6 年2 月2 2 日,國家標(biāo)準(zhǔn)化管理委員會(huì)頒布通知:信息技術(shù)先進(jìn)音視頻編碼第二部分視頻于2 0 0 6 年3 月1 日起開始實(shí)施,a v s 視頻部分正式成為國家標(biāo)準(zhǔn)。a v s技術(shù)先進(jìn),知識(shí)產(chǎn)權(quán)政策合理。a v s 1 5 】與h 2 6 4 a v c 編碼效率相當(dāng),但是其復(fù)雜度低,取消了在標(biāo)清和高清應(yīng)用中不需要的編碼工具,其解碼器復(fù)雜度是h 2 6 4 的7 0 ,編碼器復(fù)雜度僅及h 2 6 4 的3 0 。a v s 在自身復(fù)雜度低、對(duì)數(shù)據(jù)壓縮率高的情況下仍保持了極好的視覺效果,與目前存在的其它先進(jìn)標(biāo)準(zhǔn)相比毫不遜色。同時(shí)a v s 系統(tǒng)兼容現(xiàn)有m p e g - 2 系統(tǒng),現(xiàn)有基于m p e g 2 編輯和傳輸系統(tǒng)不需改變。所以,從技術(shù)角度來說,a v s 作為國內(nèi)運(yùn)營商和內(nèi)容提供商的換代標(biāo)準(zhǔn)的確是優(yōu)選?!癮 v s 專利池 由符合a v s 標(biāo)準(zhǔn)的產(chǎn)品所必須采用的專利技術(shù)構(gòu)成,是a v s 相關(guān)專利權(quán)人唯一的收費(fèi)渠道?!癮 v s 專利池只對(duì)a v s 編解碼產(chǎn)品收費(fèi),采用最優(yōu)惠收費(fèi)政策,額度為1 元人民幣左右。a v s 不對(duì)電視臺(tái)等運(yùn)營商收費(fèi),也不按編解碼時(shí)間收費(fèi)。a v s 的專利池管理是更符合需要的先進(jìn)的管理方式。因此,a v s 通過簡潔的一站式許可政策,解決了h 2 訓(xùn)a v c 專利許可問題死結(jié)。1 3 課題研究背景及意義a v s m 全稱為信息技術(shù)先進(jìn)音視頻編碼第七部分:移動(dòng)視頻 1 6 1 ,2 0 0 4 年第一季度啟動(dòng)制定。它是面向新一代移動(dòng)通信,滿足數(shù)字存儲(chǔ)媒體、網(wǎng)絡(luò)流媒體、多媒體通信等應(yīng)用中對(duì)運(yùn)動(dòng)圖像壓縮技術(shù)的需要的視頻編碼標(biāo)準(zhǔn),在2 0 0 4 年1 2 月北京舉行的第十一次a v s 工作組會(huì)議上完成了a v s m 的草案稿,目前已完成送審稿。目前,a v s m已經(jīng)上報(bào)信產(chǎn)部待批,近期有望成為國家標(biāo)準(zhǔn)。本文的研究正是依托于a v sm 標(biāo)準(zhǔn)而基于a v sm 的幀間預(yù)測算法研究做的工作。a v s m 視頻壓縮標(biāo)準(zhǔn)的提出,改變了第一代信源編碼技術(shù)m p e g - 2 已經(jīng)落后的局面,同時(shí)也使中國擁有了自己的核心技術(shù)標(biāo)準(zhǔn),滿足了我國數(shù)字音視頻產(chǎn)業(yè)發(fā)展的急需。但是由于a v s m 是中國自己提出的視頻壓縮標(biāo)準(zhǔn),而且在時(shí)間上相對(duì)于h 2 6 4 a v c 和m p e g - 4 等其它標(biāo)準(zhǔn)要晚,還不成熟、不完善。一個(gè)標(biāo)準(zhǔn)是否具有生命力,除了取決予它本身的性能優(yōu)劣以外,還取決于它的推廣力度。對(duì)于我國牽頭制定的a v s m 標(biāo)準(zhǔn)兩畜,如果a v s m 標(biāo)準(zhǔn)成功應(yīng)用于3 g 多媒體業(yè)務(wù),一方面可以為企業(yè)節(jié)省大量的專利費(fèi)用,另一方面也可以使我國自主制定的標(biāo)準(zhǔn)具有了生命力,鼓舞廣大國家標(biāo)準(zhǔn)制定者的士氣。4目前a v s 標(biāo)準(zhǔn)工作組提供的a v s m 參考編碼器軟件編碼質(zhì)量高,易讀性好,但復(fù)雜度高、編碼速度慢( q c i f 編碼速率約0 5 幀眇,c i f 編碼速率約0 2 幀,秒) ,這樣的編碼速度無法用予實(shí)時(shí)編碼、實(shí)時(shí)視頻采集等。因此,研究a v sm 編碼復(fù)雜較高的模塊并對(duì)其進(jìn)行算法優(yōu)化,提高編碼速度對(duì)a v s m 的推廣和應(yīng)用至關(guān)重要。1 4 本文研究內(nèi)容及結(jié)構(gòu)本文從a v s m 實(shí)時(shí)視頻應(yīng)用的角度,針對(duì)編碼過程中復(fù)雜度最高的幀間預(yù)測模塊進(jìn)行了深入研究與分析,提出了相應(yīng)的快速算法,可以有效的減少編碼器的計(jì)算復(fù)雜度。論文蛉內(nèi)容組織如下:第一章緒論,簡述了數(shù)字視頻編碼的原理,針對(duì)不同冗余的視頻編碼方法。簡要介紹了國內(nèi)外視頻編碼標(biāo)準(zhǔn)的發(fā)展。闡述了本文的研究背景、意義,本文的研究內(nèi)容及其結(jié)構(gòu)。第二章介紹了a v s - m 編碼的框架,分析了a v s m 編碼的流程,對(duì)編碼過程中的主要模塊進(jìn)行了復(fù)雜度分析,詳細(xì)介紹了a v s _ m 編碼中采用的關(guān)鍵技術(shù)并與最新國際視頻編碼標(biāo)準(zhǔn)進(jìn)行了比較。第三章幀聞?lì)A(yù)測模式選擇快速算法。分析了不同塊大小的運(yùn)動(dòng)補(bǔ)償,并對(duì)不同塊大小運(yùn)動(dòng)補(bǔ)償?shù)木幋a性能進(jìn)行了比較。提出一種幀聞模式快速選擇算法。該算法根據(jù)對(duì)序列最佳編碼模式的比例分析將全部模式進(jìn)行分類,分成不同的候選模式集,根據(jù)序列的時(shí)域相關(guān)性確定自適應(yīng)閾值,有選擇性的搜索候選模式集及模式搜索提前退出,可有效6基于a v s _ m 的幀問預(yù)測算法研究減少模式選擇的復(fù)雜度,提高編碼速度。第四章快速分?jǐn)?shù)像素運(yùn)動(dòng)估計(jì)算法。針對(duì)a v s m 分?jǐn)?shù)像素運(yùn)動(dòng)估計(jì)的復(fù)雜性,提出了一種自適應(yīng)分?jǐn)?shù)像素運(yùn)動(dòng)估計(jì)快速算法代替全搜索算法,根據(jù)分?jǐn)?shù)像素匹配失真曲面的單峰性特點(diǎn)有選擇的搜索候選點(diǎn),利用序列的時(shí)空相關(guān)性確定閾值,跳過不必要的搜索以及提前終止搜索,可大幅度地減少搜索點(diǎn)數(shù)量并達(dá)到較好的匹配效果。第五章對(duì)全文進(jìn)行了總結(jié),并展望了未來的工作。7基于a v sm 的幀間預(yù)測算法研究2a v s m 編碼流程及關(guān)鍵技術(shù)分析2 1 引言a v s m 視頻的主要特點(diǎn)是應(yīng)用目標(biāo)明確,技術(shù)有針對(duì)性。目前定義的a v sm 的基本檔次就是為3 g 移動(dòng)通信中的多媒體消息服務(wù)和流媒體服務(wù)量身定制的標(biāo)準(zhǔn)。針對(duì)移動(dòng)設(shè)備要求信源標(biāo)準(zhǔn)復(fù)雜度低、能耗低的特點(diǎn),a v s m 移動(dòng)視頻標(biāo)準(zhǔn)所設(shè)計(jì)的技術(shù)方案簡潔,主要內(nèi)容先進(jìn)、合理,在實(shí)現(xiàn)復(fù)雜性有明顯降低的情況下,編碼性能與國際最新標(biāo)準(zhǔn)基本相當(dāng),在技術(shù)細(xì)節(jié)方面做了一定的改動(dòng)。例如,幀內(nèi)預(yù)測、幀間預(yù)測、整數(shù)變換等編碼過程中處理單元均為4 x 4 大??;由于手持設(shè)備的處理能力有限,延遲時(shí)間必須要小等原因,為了降低復(fù)雜度,編碼時(shí)沒有采用b 幀,只有i 幀和p 幀;熵編碼采用了較為簡單的指數(shù)哥倫布編碼:考慮到手持設(shè)備的分辨率一般較小,a v sm 基本檔次支持的視頻分辨率為:s q c i f ( 1 2 8 x 9 6 ) 、q c i f ( 1 7 6 x1 4 4 ) 、c i f ( 3 5 2 x 2 8 8 ) 和q v g a ( 3 2 0 4 8 0 ) ,除此以外,a v s m 還支持自定義的分辨率。這些特點(diǎn)使a v s m 成為了高壓縮比、低復(fù)雜度的視頻編碼器。2 2a v s m 編碼框架a v sm 標(biāo)準(zhǔn)采用了基于塊匹配的混合編碼框架,如圖2 1 所示。圖2 - 1a v s m 編碼框架a v s m 編碼器對(duì)編碼幀s n 以宏塊( 包括一個(gè)1 6 x 1 6 亮度像素塊和相應(yīng)的色度像素塊) 為單位進(jìn)行處理。對(duì)宏塊中的當(dāng)前編碼塊編碼,首先要找到對(duì)應(yīng)的預(yù)測塊,如果采用的是幀內(nèi)編碼模式,則預(yù)測塊由當(dāng)前幀當(dāng)前片中已經(jīng)編碼的重建塊像素來獲得。如果8基于a v s _ m 的幀間預(yù)測算法研究采用的是幀間編碼模式,則需要對(duì)前向參考幀s n 1 進(jìn)行運(yùn)動(dòng)估計(jì)搜索,得到對(duì)應(yīng)的預(yù)測塊信息,即運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償。得到預(yù)測塊后,將當(dāng)前編碼塊和預(yù)測塊相減得到殘差塊,對(duì)殘差塊進(jìn)行變換和量化。再對(duì)量化后的系數(shù)進(jìn)行重排序,最后對(duì)這些系數(shù)進(jìn)行熵編碼與幀內(nèi)、幀間預(yù)測模式,運(yùn)動(dòng)矢量等信息一起組成一個(gè)壓縮后的碼流。在進(jìn)行幀間預(yù)測的過程中,需要把重建圖像作為參考幀。為了去除編解碼環(huán)路中產(chǎn)生的噪聲,提高參考幀的圖像質(zhì)量,進(jìn)而提高編碼性能,系統(tǒng)需要對(duì)用于參考的重建圖像進(jìn)行去塊效應(yīng)濾波。濾波器對(duì)重建圖像的塊邊界進(jìn)行平滑,降低圖像的塊效應(yīng),而對(duì)圖像邊界不進(jìn)行濾波,得到最后的重建圖像s n 。2 3a v s m 編碼算法流程及關(guān)鍵技術(shù)a v sm 編碼器中包含的重要的函數(shù)模塊有:e n c o d ei):對(duì)一幀i幀圖像進(jìn)行編碼。frame(e n c o d epy r a m e ( ) :對(duì)一幀p 幀圖像進(jìn)行編碼。t r a n s f o r m1 3 4 ( ) :以4 x 4 塊為單位進(jìn)行整數(shù)變換。q u a n t _ b 4 ( ) :以4 x 4 塊為單位進(jìn)行量化。w r i t e l u m a c o e f f a v s b 4 一u v l c ( ) :亮度系數(shù)熵編碼。w f i t e c h r o m a c o e f fb 4u v l c ( ) :色度系數(shù)熵編碼。以上模塊為a v sm 編碼的主要模塊,下面將分別介紹。2 3 1i 幀編碼i 幀編碼圖像為只使用幀內(nèi)預(yù)測編碼的圖像。i 幀編碼利用了圖像的空間相關(guān)性,消除了視頻圖像中的空間冗余。它的編碼效率不如p 編碼幀高,但是編碼質(zhì)量高于p 幀。i 幀圖像編碼不需要參考其它已編碼圖像,因此i 幀圖像可以作為圖像序列的隨機(jī)訪問點(diǎn),對(duì)于解碼端的差錯(cuò)恢復(fù)也有極其重要的作用。i 幀編碼流程如圖2 2 所示。9基予a v s _ m 的幀間預(yù)測算法研究一 l n 槲t r a 4 塊x 4 黻_ l u m 懶a _ m o 測d e _ :|溆洶l(fā)l 一一廣一一| 二二去聶磊|l 粕c o s 價(jià)t 馥ll 孟赫l 孟ll重建蜮濾皴lld c b l o c k f r a m el_ o -圖2 - 2e n c o d e i f r a m e 流程鎏i 幀編碼的主要模塊是幀內(nèi)預(yù)測:幀內(nèi)亮度塊預(yù)測( i n t r al u m ap r e d i c t i o n ) 和幀內(nèi)色度塊預(yù)測( i n t r a _ c h r o m a _ p r c d i c t i o n ) 。a v s m 中采用了基于空域的幀內(nèi)預(yù)測,運(yùn)用了多種不同的幀內(nèi)預(yù)測方法,最大程度地減少圖像的空間冗余信息。當(dāng)宏塊是幀內(nèi)方式編碼時(shí),編碼的宏塊根據(jù)重建宏塊預(yù)測像素值,然后對(duì)預(yù)測值和原始值的差值進(jìn)行整數(shù)變換。a v s m 標(biāo)準(zhǔn)采用了基于4 x 4 塊的預(yù)測( i n t r a 4 x 4 ) 和直接預(yù)測( i n t r a - d i r e c t ) 兩種方式。i n t r a 4 x 4 方式基于4 x 4 塊進(jìn)行獨(dú)立預(yù)測,能很好地反映圖像的細(xì)節(jié)特征;相對(duì)應(yīng)的i n t r a - d i r e c t 方式適合予鎏像平坦區(qū)域編碼,維持視頻質(zhì)量的同時(shí)大幅度降低編碼比特?cái)?shù)。1 ) 4 x 4 亮度幀內(nèi)預(yù)測4 x 4 幀內(nèi)預(yù)測方法的基本思路是從不同的方向計(jì)算、比較塊中各個(gè)像素之間的亮度差值,即梯度值。從9 種預(yù)測模式中選擇具有最小預(yù)測誤差的模式作為最佳的預(yù)測模式。1 6 個(gè)當(dāng)前4 x 4 塊像素值由臨近編碼重建塊像素和最佳預(yù)測模式預(yù)測得到,如圖2 。3 ( a )所示,其中模式8 是d c 預(yù)測。i o基于a v s _ m 的幀間預(yù)測算法研究r 呻0l2 3 4 5678l234j5n678r _0l2 345 6 7 8l2345678( a ) 4 x 4 亮度塊幀內(nèi)預(yù)測模式( b ) 4 4 色度塊幀內(nèi)預(yù)測模式圖2 - 3 幀內(nèi)預(yù)測模式( 2 ) i n t r a - d i r e c t 模式i n t r a - d i r e c t 方式對(duì)于視頻平坦的區(qū)域以及量化參數(shù)較大的情況下十分有效,因?yàn)樵诖饲闆r下,編碼殘差較小,編碼幀內(nèi)預(yù)測模式所需的比特開銷相對(duì)較大。( 3 ) 4 x 4 色度幀內(nèi)預(yù)測:宏塊的色度幀內(nèi)預(yù)測基于4 x 4 塊獨(dú)立進(jìn)行,a v s m 中色度幀內(nèi)預(yù)測有3 種預(yù)測模式,分別為d c 預(yù)測、水平預(yù)測和垂直預(yù)測,如圖2 3 ( b ) 所示。與i n t r a - 4 x 4 亮度預(yù)測一致,色度預(yù)測采用減少臨近參考像素點(diǎn)方法降低了算法實(shí)現(xiàn)復(fù)雜度。( 4 ) 復(fù)雜度分析應(yīng)用i n t e l 4 t u n e t mp e r f o r m a n c ea n a l y z e r ( v t u n e 性能可視化分析器) 測試了參考模型w m 3 3 a ,對(duì)i 幀編碼復(fù)雜度進(jìn)行了分析。測試序列為q c i f 序列f o r e m a n ,設(shè)置的參考幀數(shù)為2 ,編碼幀結(jié)構(gòu)為p p p ,使用哈達(dá)碼變換和率失真優(yōu)化,m v 搜索精度為1 4像素精度,搜索范圍為1 6 像素。p c 機(jī)器參數(shù)為i n t e l c e l e r o n c p u1 7 0 g h z ,5 1 2 m bo f r a m ,w r i n ( 重0 w s 。通過v t t m e 分析,幀內(nèi)亮度預(yù)測為e n c o d 山t a m e 中運(yùn)算量最高的模塊,占e n c o d e i f r a m e 模塊總運(yùn)算量的7 2 o ,幀內(nèi)色度預(yù)測的計(jì)算量占1 3 2 。幀內(nèi)亮度預(yù)測模塊主要包含了兩個(gè)模塊:4 x 4 亮度模式預(yù)測( i n t m 4 x 4和l u m am o d ed e c i s i o n )i n :昀= d n c t 模式率失真代價(jià)( r d _ c o s tf o r4 x 4d i ri n t r a b l o c k sl u m a ) ,其中4 x 4 亮度模式預(yù)測為i n t r a l u m a p r e d i c t i o n 模塊總運(yùn)算量的9 8 3 ??梢? x 4 亮度模式預(yù)測為i 幀編碼復(fù)雜度最高的模塊。2 3 2p 幀編碼p 幀利用前向已編碼幀來預(yù)測當(dāng)前幀,通過運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)睪卜償,殘差幀能量大幄度減小,p 幀具有很高的壓縮效率。p 幀編碼流程如圖2 4 所示,分為使用率失真優(yōu)化和不使用率失真優(yōu)化兩種情況。在不使用率失真優(yōu)化情況下,進(jìn)行幀間預(yù)測,選擇最優(yōu)塊模式,再進(jìn)行幀內(nèi)預(yù)測,比較幀間和幀內(nèi)預(yù)測的代價(jià),選擇代價(jià)小者為最終預(yù)測模式進(jìn)行編碼;使用率失真優(yōu)化時(shí),先進(jìn)行幀間預(yù)測,然后計(jì)算所有塊模式的率失真代價(jià)( r d 。c o s t ) ,選出最小者,與幀肉預(yù)測的率失真代價(jià)進(jìn)行比較選擇小者為最終預(yù)測模式。隧2 - 4e n c o d e _ p _ f r a m e 流程圖,p 幀編碼過程中的主要模塊有幀聞塊模式搜索( i n t e r _ m o d e s _ d e c i s i o n ) 和模式率失真代價(jià)計(jì)算( r d _ c o s t _ i n t c r _ m a c r o b l o c k ) 。i n t e r _ m o d e s _ d e c i s i o n 模塊主要實(shí)現(xiàn)了宏塊在各種塊模式下的運(yùn)動(dòng)估計(jì)過程,得到各塊的最佳運(yùn)動(dòng)矢量,對(duì)于予宏塊模式計(jì)算各子宏塊1 2基于a v sm 的幀問預(yù)測算法研究模式的r d - c o s t 進(jìn)行比較,選擇最佳子宏塊模式。r d c o s t i n t e r m a c r o b l o c k 中,計(jì)算各宏塊模式下的r d c o s t 選擇最小者為最佳宏塊模式。然后選擇最佳幀內(nèi)預(yù)測模式并計(jì)算最佳幀內(nèi)預(yù)測模式的r d c o s t ,若小于最佳宏塊模式的r d c o s t 則當(dāng)前宏塊的最終編碼模式為幀內(nèi)模式,否則當(dāng)前宏塊的最終編碼模式為最佳幀間宏塊模式。( 1 ) 宏塊劃分模式與先前的視頻編碼標(biāo)準(zhǔn)類似,a v sm 也使用了塊匹配的幀間預(yù)測以消除視頻序列的時(shí)域冗余。在過去的標(biāo)準(zhǔn)中定義了兩種塊大小,以像素為單位,分別是1 6 x 1 6 和8 x 8的正方形塊。但由于視頻圖像的復(fù)雜性,在較大的塊中可能包含多個(gè)具有不同運(yùn)動(dòng)狀態(tài)和不同形狀的對(duì)象。特別是在運(yùn)動(dòng)劇烈的局部區(qū)域中,用1 個(gè)1 6 1 6 或4 個(gè)8 x 8 運(yùn)動(dòng)矢量并不能準(zhǔn)確的描述一個(gè)宏塊全部的運(yùn)動(dòng)細(xì)節(jié)。a v s m 中,為了得到更為精確的預(yù)測效果,采用了多種宏塊劃分模式用于運(yùn)動(dòng)預(yù)測時(shí)的搜索匹配單元。每個(gè)宏塊可以按4種方式進(jìn)行劃分1 個(gè)1 6 x 1 6 ,或2 個(gè)1 6 x 8 ,或2 個(gè)8 x 1 6 ,或4 個(gè)8 x 8 ;而8 x 8 模式的每個(gè)子宏塊還可以進(jìn)一步以4 種方式進(jìn)行劃分:1 個(gè)8 x 8 ,2 個(gè)8 x 4 或2 個(gè)4 x 8 及4 個(gè)4 x 4 ,如圖2 5 所示。除了上面所講的運(yùn)動(dòng)補(bǔ)償宏塊模式,p 宏塊還可以按所謂的s k i p 類型進(jìn)行編碼。對(duì)這種編碼類型,既不傳輸量化后的預(yù)測誤差信號(hào),也不傳送運(yùn)動(dòng)矢量以及參考索引參數(shù)。s k i p 編碼類型適用于沒有變化或連續(xù)運(yùn)動(dòng)的較大區(qū)域,比如緩慢的鏡頭移動(dòng)用很少的比特就可以表示。1 6 x 1 61 6 x 88 x 1 68 x 8宏塊劃分8 x 8 塊翅1 分口目田田4 x 4口目田田圖2 5 宏塊及子宏塊分割宏塊的色度塊則為亮度塊的一半( 水平和垂直各一半) 。色度塊采用和亮度塊相同的劃分模式,只是尺寸減半( 水平和垂直方向都減半) 。色度塊的運(yùn)動(dòng)矢量也是通過相基于a v s m 的幀間預(yù)測算法研究應(yīng)的亮度運(yùn)動(dòng)矢量的水平和垂直分量減半而得。( 2 ) 運(yùn)動(dòng)矢量精度由于自然物體運(yùn)動(dòng)具有連續(xù)性,相鄰兩幀之間的運(yùn)動(dòng)矢量不是以整數(shù)像素為基本單位的。可能真正的運(yùn)動(dòng)矢量是以1 4 像素或者甚至以1 8 像素等分?jǐn)?shù)像素作為單位的。這樣可以精確地描述運(yùn)動(dòng),得到更小的預(yù)測誤差,從而獲得更好的視覺質(zhì)量。分?jǐn)?shù)像素并不存在于參考圖像中,需利用鄰近已編碼點(diǎn)進(jìn)行內(nèi)插得到。插值的精度越高,運(yùn)動(dòng)估計(jì)時(shí)找到匹配塊也就越準(zhǔn)確,運(yùn)動(dòng)補(bǔ)償時(shí)得到的殘差能量也就越小。但同時(shí)精度提高會(huì)帶來編碼器
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鐵路軌道工程課程設(shè)計(jì)
- 2025年度個(gè)人車輛購置擔(dān)保合同4篇
- 2025年度個(gè)人藝術(shù)品買賣合同示范文本4篇
- 二零二五年度高端別墅租賃合同樣本匯編4篇
- 2025年度環(huán)保材料采購與資源循環(huán)利用合同3篇
- 2025年度珠寶首飾代銷合同范本8篇
- 2025年度原創(chuàng)劇本征集與獎(jiǎng)金激勵(lì)合同3篇
- 二零二五年度美食城公共區(qū)域保潔服務(wù)合同4篇
- 二零二五模具設(shè)計(jì)研發(fā)團(tuán)隊(duì)勞動(dòng)合同模板4篇
- 2024離婚財(cái)產(chǎn)分割協(xié)議范本
- MT/T 199-1996煤礦用液壓鉆車通用技術(shù)條件
- GB/T 6144-1985合成切削液
- GB/T 10357.1-2013家具力學(xué)性能試驗(yàn)第1部分:桌類強(qiáng)度和耐久性
- 第三方在線糾紛解決機(jī)制(ODR)述評(píng),國際商法論文
- 第5章-群體-團(tuán)隊(duì)溝通-管理溝通
- 腎臟病飲食依從行為量表(RABQ)附有答案
- 深基坑-安全教育課件
- 園林施工管理大型園林集團(tuán)南部區(qū)域養(yǎng)護(hù)標(biāo)準(zhǔn)圖例
- 排水許可申請(qǐng)表
- 低血糖的觀察和護(hù)理課件
- 計(jì)量檢定校準(zhǔn)技術(shù)服務(wù)合同協(xié)議書
評(píng)論
0/150
提交評(píng)論