![視頻技術(shù)原理_第1頁](http://file4.renrendoc.com/view/a01c852b26dfdab36c8948594eacd7d4/a01c852b26dfdab36c8948594eacd7d41.gif)
![視頻技術(shù)原理_第2頁](http://file4.renrendoc.com/view/a01c852b26dfdab36c8948594eacd7d4/a01c852b26dfdab36c8948594eacd7d42.gif)
![視頻技術(shù)原理_第3頁](http://file4.renrendoc.com/view/a01c852b26dfdab36c8948594eacd7d4/a01c852b26dfdab36c8948594eacd7d43.gif)
![視頻技術(shù)原理_第4頁](http://file4.renrendoc.com/view/a01c852b26dfdab36c8948594eacd7d4/a01c852b26dfdab36c8948594eacd7d44.gif)
![視頻技術(shù)原理_第5頁](http://file4.renrendoc.com/view/a01c852b26dfdab36c8948594eacd7d4/a01c852b26dfdab36c8948594eacd7d45.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
視頻技術(shù)原理第1頁,課件共40頁,創(chuàng)作于2023年2月2主要內(nèi)容數(shù)字音頻基礎(chǔ)知識數(shù)字視頻基礎(chǔ)知識音頻編碼技術(shù)視頻編碼技術(shù)第2頁,課件共40頁,創(chuàng)作于2023年2月3一、數(shù)字音頻基礎(chǔ)知識第3頁,課件共40頁,創(chuàng)作于2023年2月4音頻基本特性音頻特性 音頻信號由許多頻率不同的聲波組成。音頻信號的兩個基本參數(shù)是頻率和幅度。人發(fā)音器官聲音頻頻率范圍:80~3400Hz。人耳感知音頻頻率范圍:20~20000Hz。
第4頁,課件共40頁,創(chuàng)作于2023年2月5音頻信號數(shù)字化模擬信號與數(shù)字信號處理對比
時間上離散-采樣幅度上離散-量化語音質(zhì)量與采樣頻率
Nyquist原理語音質(zhì)量與采樣精度量化噪聲與量化比特數(shù)語音質(zhì)量與數(shù)據(jù)率第5頁,課件共40頁,創(chuàng)作于2023年2月6音頻信號數(shù)字化
采樣頻率(Khz)采樣精度(bps)數(shù)據(jù)率(未壓縮KBps)頻率范圍(hz)
普通電話888200~3400AM11.02581120~15000FM22.0501688.250~7000CD44.116176.420~20000DAT4816192.020~20000
第6頁,課件共40頁,創(chuàng)作于2023年2月7二、數(shù)字視頻基礎(chǔ)知識第7頁,課件共40頁,創(chuàng)作于2023年2月8彩色電視制式NTSC制式PAL制式SECAM制式HDTV制式第8頁,課件共40頁,創(chuàng)作于2023年2月9彩色視頻信號類型復(fù)合視頻分量視頻
RGBYIQYUVS-Video第9頁,課件共40頁,創(chuàng)作于2023年2月10電視掃描與同步逐行掃描與隔行掃描場與幀PAL制式的掃描特性
625行/幀,25幀/秒寬高比4∶3
隔行掃描第10頁,課件共40頁,創(chuàng)作于2023年2月11視頻數(shù)字化兩種方式1、模擬全彩色信號-----〉分量信號
------〉三個A/D2、模擬全彩色信號-----〉A(chǔ)/D轉(zhuǎn)換
------〉數(shù)字域進(jìn)行分量分離第11頁,課件共40頁,創(chuàng)作于2023年2月12行同步與場同步色度載波黑電平圖像行第12頁,課件共40頁,創(chuàng)作于2023年2月13HDTV簡介高清晰度電視(HDTV)顯示器:16∶9
幀頻:>=100Hz
圖像格式:1280x720p,1920x1080i
碼率:>=20Mbps
主要制式:8VSB(北美),COFDM(歐洲)第13頁,課件共40頁,創(chuàng)作于2023年2月14多媒體數(shù)據(jù)壓縮技術(shù)空間冗余時間冗余信息熵冗余結(jié)構(gòu)冗余知識冗余視覺冗余其他冗余第14頁,課件共40頁,創(chuàng)作于2023年2月15三、音頻編碼技術(shù)
第15頁,課件共40頁,創(chuàng)作于2023年2月16編碼器類型波形編碼器脈沖編碼調(diào)制(PCM)差分脈沖編碼調(diào)制(DPCM)子帶編碼(Sub-BandCoding)音源編碼器混合編碼器碼激勵線性預(yù)測(CodeExcitedLinearPredictive)第16頁,課件共40頁,創(chuàng)作于2023年2月17音頻編碼標(biāo)準(zhǔn)G.711G.721G.722G.728G.729G.723.1MPEG-1layer1/2/3MPEG-2AAC第17頁,課件共40頁,創(chuàng)作于2023年2月18聲音的遮蔽現(xiàn)象806040200-20SoundLevel(dB)20 50 100 200 500kHz1 2 5 10 20kHz FrequencyDominantSignalComponentsMaskingThresholds第18頁,課件共40頁,創(chuàng)作于2023年2月19音頻MUSICAM編碼分析濾波器組量化和編碼比特流的編碼數(shù)字音頻信號量化樣值已編碼的比特流知覺模型第19頁,課件共40頁,創(chuàng)作于2023年2月20四、視頻編碼技術(shù)第20頁,課件共40頁,創(chuàng)作于2023年2月21一、視頻編碼基礎(chǔ)
1、數(shù)字電視系統(tǒng)
在電視信號的獲取、產(chǎn)生、處理、傳輸、接收和存儲的全過程中使用數(shù)字電視信號,稱為數(shù)字電視系統(tǒng)。數(shù)字電視系統(tǒng)可分為三大類:
(l)衛(wèi)星數(shù)字電視廣播系統(tǒng);
(2)有線數(shù)字電視廣播系統(tǒng);
(3)地面數(shù)字電視廣播系統(tǒng)。
第21頁,課件共40頁,創(chuàng)作于2023年2月222、視頻信號的數(shù)字化及表示取樣——空間的離散化把時間、幅度連續(xù)的模擬信號轉(zhuǎn)變?yōu)闀r間離散、幅度連續(xù)的信號,即時間離散化;
量化——幅度的離散化把幅度連續(xù)信號轉(zhuǎn)換為幅度離散信號,即幅度離散化;
三基色原理:任何顏色均由紅(R)、綠(G)、蘭(B)三種顏色分量組成;在電視原理里,用亮度(Y)、藍(lán)色差(U)、紅色差(V)三個分量表示。兩種方法相互之間的轉(zhuǎn)換:Y=0.3R+0.59G+0.11BU=B–YV=R–YR=Y+VG=Y–0.19U–0.51VB=Y+U第22頁,課件共40頁,創(chuàng)作于2023年2月233、視頻壓縮的必要性
數(shù)據(jù)量太大,占用帶寬太寬
例:1秒鐘PAL圖像數(shù)據(jù)
720x576x25x8x3=248,832,000bps
4、視頻壓縮的可能性空間冗余性相鄰像素之間具有很強(qiáng)的相關(guān)性時間冗余性相鄰幀之間具有很強(qiáng)的相關(guān)性視覺冗余性對亮度敏感,對色度不敏感對低頻敏感,對高頻不敏感第23頁,課件共40頁,創(chuàng)作于2023年2月24圖像信號中存在的冗余
空間冗余Time時間冗余1sec2sec3sec4sec5sec6sec7sec第24頁,課件共40頁,創(chuàng)作于2023年2月255、視頻壓縮的基本方法及關(guān)鍵技術(shù)
正交變換去掉空間冗余性,主要采用DCT
運(yùn)動估計/補(bǔ)償去掉時間冗余性色度下采樣去掉視覺冗余性第25頁,課件共40頁,創(chuàng)作于2023年2月26關(guān)鍵技術(shù)環(huán)節(jié):
1、離散余弦變換DCTDCT是一種空間變換,在MPEG-2中DCT以8x8的像塊為單位進(jìn)行,生成的是8x8的DCT系數(shù)數(shù)據(jù)塊。DCT變換的最大特點是對于一般的圖像都能夠?qū)⑾駢K的能量集中于少數(shù)低頻DCT系數(shù)上,即生成8x8DCT系數(shù)塊中,僅左上角的少量低頻系數(shù)數(shù)值較大,其余系數(shù)的數(shù)值很小,這樣就可能只編碼和傳輸少數(shù)系數(shù)而不嚴(yán)重影響圖像質(zhì)量。變換傾向于把能量集中到低頻系數(shù)上,而很多其它系數(shù)則接近于零。比特率的降低是依靠不傳送接近零值的系數(shù),而像后面所說的那樣對剩下的系數(shù)進(jìn)行量化和編碼。不均勻的系數(shù)分布是由于原圖像塊中存在的空間冗余度。
DCT不能直接對圖像產(chǎn)生壓縮作用,但對圖像的能量具有很好的集中效果,為壓縮打下了基礎(chǔ)。第26頁,課件共40頁,創(chuàng)作于2023年2月27離散余弦變換DCT1TVline(64us)720pixels“Luminance”700mV0mVfrequency1TVline(64us)720pixels“Luminance”700mV0mVfrequency第27頁,課件共40頁,創(chuàng)作于2023年2月282、量化器
量化是針對DCT變換系數(shù)進(jìn)行的,量化過程就是以某個量化步長去除DCT系數(shù)。量化步長的大小稱為量化精度,量化步長越小,量化精度就越細(xì),包含的信息越多,但所需的傳輸頻帶越高。不同的DCT變換系數(shù)對人類視覺感應(yīng)的重要性是不同的,因此編碼器根據(jù)視覺感應(yīng)準(zhǔn)則,對一個8x8的DCT變換塊中的64個DCT變換系數(shù)采用不同的量化精度,以保證盡可能多地包含特定的DCT空間頻率信息,又使量化精度不超過需要。DCT變換系數(shù)中,低頻系數(shù)對視覺感應(yīng)的重要性較高,因此分配的量化精度較細(xì);高頻系數(shù)對視覺感應(yīng)的重要性較低,分配的量化精度較粗,通常情況下,一個DCT變換塊中的大多數(shù)高頻系數(shù)量化后都會變?yōu)榱恪R⒁饩幋a器所產(chǎn)生的量化噪波是不能在解碼器中逆轉(zhuǎn)的,這就使編碼和解碼過程“有損”。第28頁,課件共40頁,創(chuàng)作于2023年2月293.游程編碼與Z掃描Z掃描
主要目的是將2維信號轉(zhuǎn)換成1維信號,便于游程編碼游程編碼
一對碼字(N,L),第一個字節(jié)為非零值的電平前面的零的個數(shù)非零值的電平,第二個為非零值的電平,為熵編碼做好進(jìn)一步的準(zhǔn)備。第29頁,課件共40頁,創(chuàng)作于2023年2月30Z字型掃描與游程編碼第30頁,課件共40頁,創(chuàng)作于2023年2月31
4、熵編碼
量化僅生成了DCT系數(shù)的一種有效的離散表示,實際傳輸前,還須對其進(jìn)行比特流編碼,產(chǎn)生用于傳輸?shù)臄?shù)字比特流。簡單的編碼方法是采用定長碼,即每個量化值以同樣數(shù)目的比特表示,但這種方法的效率較低。而采用熵編碼可以提高編碼效率。熵編碼是基于編碼信號的統(tǒng)計特性,使得平均比特率下降。游程和非零系數(shù)既可獨立的,也可聯(lián)合的作熵編碼。熵編碼中使用較多的一種是霍夫曼編碼,MPEG-2視頻壓縮系統(tǒng)中采用的就是霍夫曼編碼?;舴蚵幋a中,在確定了所有編碼信號的概率后生產(chǎn)一個碼表,對經(jīng)常發(fā)生的大概率信號分配較少的比特表示,對不常發(fā)生的小概率信號分配較多的比特表示,使得整個碼流的平均長度趨于最短。為使解碼器能分辨在什么地方一個碼終止和下一個碼開始,VLC有這樣一個特性:沒有一個完整的碼是任何其它的碼的前頭部分。第31頁,課件共40頁,創(chuàng)作于2023年2月325、信道緩存
由于采用了熵編碼,產(chǎn)生的比特流的速率是變化的,隨著視頻圖像的統(tǒng)計特性變化。但大多數(shù)情況下傳輸系統(tǒng)分配的頻帶都是恒定的,因此在編碼比特流進(jìn)入信道前需設(shè)置信道緩存。信道緩存是一緩存器,以變比特率從熵編碼器向里寫入數(shù)據(jù),以傳輸系統(tǒng)標(biāo)稱的恒定比特率向外讀出,送入信道。緩存器的大小,或稱容量是設(shè)定好的,但編碼器的瞬時輸出比特率常明顯高于或低于傳輸系統(tǒng)的頻帶,這就有可能造成緩存器的上溢出或下溢出。因此緩存器須帶有控制機(jī)制,通過反饋控制壓縮算法,調(diào)整編碼器的比特率,使得緩存器的寫入數(shù)據(jù)速率與讀出數(shù)據(jù)速率趨于平衡。緩存器對壓縮算法的控制
第32頁,課件共40頁,創(chuàng)作于2023年2月33
是通過控制量化器的量化步長實現(xiàn)的,當(dāng)編碼器的瞬時輸出速率過高,緩存器將要上溢時,就使量化步長增大以降低編碼數(shù)據(jù)速率,當(dāng)然也相應(yīng)增大了圖像的損失;當(dāng)編碼器的瞬時輸出速率過低,緩存器將要下溢出時,就使量化步長減小以提高編碼數(shù)據(jù)速率。第33頁,課件共40頁,創(chuàng)作于2023年2月34
6、運(yùn)動估計
運(yùn)動估計使用于幀間編碼方式時,通過參考幀圖像產(chǎn)生對被壓縮圖像的估計。運(yùn)動估計的準(zhǔn)確程度對幀間編碼的壓縮效果非常重要。如果估計作的好,那么被壓縮圖像與估計圖像相減后只留下很小的值用于傳輸。運(yùn)動估計以宏塊為單位進(jìn)行,計算被壓縮圖像與參考圖像的對應(yīng)位置上的宏塊間的位置偏移。這種位置偏移是以運(yùn)動矢量來描述的,一個運(yùn)動矢量代表水平和垂直兩個方向上的位移。運(yùn)動估計時,P幀和B幀圖像所使用的參考幀圖像是不同的。P幀圖像使用前面最近解碼的I幀或P幀作參考圖像,稱為前向預(yù)測;而B幀圖像使用兩幀圖像作為預(yù)測參考,稱為雙向預(yù)測,其中一個參考幀在顯示順序上先于編碼幀(前向預(yù)測),另一幀在顯示順序上晚于編碼幀(后向預(yù)測),B幀的參考幀在任何情況下都是I幀或P幀。
第34頁,課件共40頁,創(chuàng)作于2023年2月35
此技術(shù)利用了時間冗余度,它試圖從前面的“參考”幀來預(yù)測要編碼的幀。預(yù)測不能以源圖像為基礎(chǔ),因為這個預(yù)測要在解碼器中重復(fù),而在解碼器中是沒有源圖像可用的(解碼圖像與源圖像不盡相同,因為碼率壓縮過程在解碼圖像中引入了少量失真)。因此,編碼器含有一個本地解碼器,它能重建與解碼器中將重建的圖像完全相同的圖像,由此可進(jìn)行預(yù)測。一種確定待編碼塊與參考幀之間所發(fā)生的運(yùn)動的方法是“塊匹配”搜索,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2022-2023學(xué)年貴州省六盤水市鐘山區(qū)四年級(上)期末數(shù)學(xué)試卷
- Unit-4-My-home-Part-A-教案設(shè)計-小學(xué)英語四年級上冊-人教PEP版
- 2025年產(chǎn)品營銷協(xié)議(2篇)
- 2025年個人果園承包合同(4篇)
- 2025年產(chǎn)品供應(yīng)與銷售代合同(三篇)
- 2025年買房書面合同協(xié)議范文(2篇)
- 2025年個人租房的合同常用版(4篇)
- 2025年產(chǎn)品委托銷售合同經(jīng)典版(三篇)
- 2025年個人工程合作協(xié)議范文(2篇)
- 農(nóng)業(yè)項目股權(quán)投資居間合同
- 2025年初中語文:春晚觀后感三篇
- Unit 7 第3課時 Section A (Grammar Focus -4c)(導(dǎo)學(xué)案)-【上好課】2022-2023學(xué)年八年級英語下冊同步備課系列(人教新目標(biāo)Go For It!)
- 2025年上半年長沙市公安局招考警務(wù)輔助人員(500名)易考易錯模擬試題(共500題)試卷后附參考答案
- 《教育強(qiáng)國建設(shè)規(guī)劃綱要(2024-2035年)》解讀講座
- 2025河北邯鄲世紀(jì)建設(shè)投資集團(tuán)招聘專業(yè)技術(shù)人才30人高頻重點提升(共500題)附帶答案詳解
- 慈溪高一期末數(shù)學(xué)試卷
- 《基于新課程標(biāo)準(zhǔn)的初中數(shù)學(xué)課堂教學(xué)評價研究》
- 省級產(chǎn)業(yè)園區(qū)基礎(chǔ)設(shè)施項目可行性研究報告
- 2025年中國東方航空招聘筆試參考題庫含答案解析
- 預(yù)算績效評價管理機(jī)構(gòu)入圍投標(biāo)文件(技術(shù)方案)
- 重大事故隱患判定標(biāo)準(zhǔn)與相關(guān)事故案例培訓(xùn)課件
評論
0/150
提交評論