信源編碼和信源解碼_第1頁
信源編碼和信源解碼_第2頁
信源編碼和信源解碼_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、信源編碼和信源解碼字、符號、圖形、圖像、音頻、視頻、動畫等各種數(shù)據(jù)本身的編碼通常稱為信源編碼,信源 編碼標準是信息領(lǐng)域的基礎(chǔ)性標準。無論是數(shù)字電視、激光視盤機,還是多媒體通信和各種 視聽消費電子產(chǎn)品,都需要音視頻信源編碼這個基礎(chǔ)性標準。大家用電腦打字一定很熟悉,當你用WORD編輯軟件把文章(DOC文件)寫完,存好盤 后,再用PCTOOLS工具軟件把你的DOC文件打開,你一定能看到你想象不到的東西,內(nèi)容全 是一些16進制的數(shù)字,這些數(shù)字叫代碼,它與文章中的字符一一對應(yīng)?,F(xiàn)在我們換一種方 法,用小畫板軟件來寫同樣內(nèi)容的文章。你又會發(fā)現(xiàn),用小畫板軟件寫出來的BMP文件,占 的內(nèi)存(文件容量)是DOC

2、文件的好幾十倍,你知道這是為什么?原來WORD編輯軟件使用 的是字庫和代碼技術(shù),而小畫板軟件使用的是點陣技術(shù),即文字是由一些與坐標位置決定的 點來組成,沒有使用字庫,因此,兩者在工作效率上相差幾十倍。信源-:信源編碼-:信 道編碼-:信道傳輸+噪聲-:信道解碼-:信源解碼-:信宿目前模擬信號電視機圖像信號處理技術(shù)就很類似小畫板軟件使用的點陣技術(shù),而全數(shù)字 電視機的圖像信號處理技術(shù)就很類似WORD編輯軟件使用的字庫和代碼技術(shù)。實際上這種代 碼傳輸技術(shù)在圖文電視中很早就已用過,在圖文電視機中一般都安裝有一個帶有圖文字庫的 譯碼器,對方發(fā)送圖文信號的時候只需發(fā)送圖文代碼信息,這樣可以大大地提高數(shù)據(jù)傳

3、輸效對于電視機,顯示內(nèi)容是活動圖像信息,它哪來的“字庫”或“圖庫”呢?這個就是電 視圖像特有的“相關(guān)性”技術(shù)問題。原來在電視圖像信號中,90%以上的圖像信息是互相相 關(guān)的,我們在模擬電視機中使用的Y/C(亮度信號/彩色信號)分離技術(shù),就是利用兩行圖 像信號的相關(guān)性,來進行Y/C分離。如果它們之間內(nèi)容不相關(guān),Y/C信號則無法進行分離。 全數(shù)字信號電視也一樣,如果圖像內(nèi)容不相關(guān),則圖像信號壓縮也就要免談。如果圖像內(nèi)容 有相關(guān)性,那么上一幅圖像的內(nèi)容就相當于下一幅圖像的“圖形庫”,或一幅圖像中的某部 分就是另一部分的“圖形庫”,因此,下一幅圖像或圖像中某一個與另一個相關(guān)的部分,在 發(fā)送信號時,只需發(fā)

4、送一個“代碼”,而傳送一個“代碼”要比送一個“圖形庫”效率高很 多,顯示時也只需把內(nèi)容從“圖形庫”中取出即可,這就是MPEG圖像壓縮的原理。利用電視信號的相關(guān)性,可以進行圖像信號壓縮,這個原理大家已經(jīng)明白,但要找出圖 像相關(guān)性的內(nèi)容來,那就不是一件很容易的事情,這個技術(shù)真的是太復(fù)雜了。為了容易理解 電視圖像的相關(guān)性,我們不妨設(shè)想做一些試驗,把圖像平均分成幾大塊,然后每一塊,每一 塊的進行比較,如果有相同的,我們就定義它們有相關(guān)性;如果沒有相同的,我們繼續(xù)細分 下去,把每大塊又分成幾小塊,一直比較下去,最后會發(fā)現(xiàn),塊分得越細,相同塊的數(shù)目就 越多,但分得太細需要的代碼也增多,所以并不是分得越細越

5、好。我們在看VCD的時候經(jīng)常 發(fā)現(xiàn),如果VCD讀光盤數(shù)據(jù)出錯,就會在圖像中看到“馬賽克”,這些“馬賽克”就是圖像 分區(qū)時的最小單位,或把數(shù)碼相片進行放大,也可以看到類似“馬賽克”的小區(qū),這就是數(shù) 碼圖像的最小“圖形庫”,每個小“圖形庫”都要對應(yīng)一個“代碼”。在單幅圖像中找出相關(guān)性的幾率并不是很大的,所以對單幅圖像的壓縮率并不很大,這 個通過觀察數(shù)碼相片的容量就很容易明白,如果把尋找相關(guān)性的范圍擴大到兩幅圖像,你就 會發(fā)現(xiàn),具有相關(guān)性的內(nèi)容太多了,這是因為運動物體對于人的眼睛感覺器官來說,是很慢 的,如果很快,人的眼睛就看不清楚,看不清楚的東西就不能算成圖像。電視機每秒鐘向人 們演示圖像是50次

6、或以上(PAL為50次,NTSC為60次),如果你的眼睛是個攝影機,你 也無法感覺到圖像的微小變化,這就表明相鄰兩幅圖像的相關(guān)性非常大,而圖像之間相隔距 離較遠時,其圖像的相關(guān)性才逐步減小,并且這種相關(guān)性很強的圖像變化時,一般都是有規(guī) 律的,也就是說每一幅圖像的變化是可以預(yù)測的。實際上在上一幅圖像的基礎(chǔ)上乘以一個帶 有方向的系數(shù),即左、右、上、下移動,就可以得到一幅運動圖像的新圖像。這里順便指出, 上面說到的一幅圖像,并不是特指人們從電視機顯示屏上看到的整幅畫面,而是可大可小的 一部分。利用圖像的可預(yù)測性,可以大大的提高“圖形庫”的利用律,即很多幅圖像都可以公用 一個“圖形庫”。MPEG在傳送

7、圖像時就是這樣,對于高速變化的圖像,如果時間來得及(即 碼率不是很高時),就傳送新的內(nèi)容來顯示,如果來不及(即碼率很高時)就用“圖形庫” 中的內(nèi)容來頂替(即預(yù)測),反正高速運動的圖像人們也看不清。例如:MPEG在傳送5幅 圖像時,可能只傳其中的3幅(時間來得及時),也可能只傳兩幅(時間來不及時),具體 過程是,先傳第1和第5幅,然后時間來得及就傳第3幅,時間來不及就插第3幅(根據(jù)1 和5預(yù)測3),最后再插第2幅(根據(jù)1和3預(yù)測2),和第4幅(根據(jù)3和5預(yù)測4)。上面我們只是從感性上和很膚淺的對圖像壓縮的原理進行了分析,如果我們把上面的分 析內(nèi)容移到數(shù)學(xué)領(lǐng)域,那么我們將要面對非常多的西格瑪“”(

8、求和)和矩陣符號。順便 介紹一下,對數(shù)字電視圖像壓縮處理最出名的理論是:DCT (Discrete Cosine Transform) 離散余弦變換(付立葉變換),和DPCM差動脈沖編碼調(diào)制,還有哈夫曼編碼(Huffmancoging)。圖像信號的壓縮過程也是數(shù)字電路(或計算機)對數(shù)字信號的處理過程,計算機雖然很 聰明,但它只會做加法運算。其它的減法、乘法、除法還有函數(shù)運算,計算機都是把它們轉(zhuǎn) 換成加法進行運算。付立葉先生60年前可能就預(yù)見到了我們要對數(shù)字信號進行處理,所以 他發(fā)明了付立葉變換。其原理是:一個周期函數(shù)可以展開成無數(shù)個正弦或余弦函數(shù)之和,函 數(shù)的周期越短其(級數(shù))收斂就越快,周期

9、越長其收斂就越慢。對于上面我們分析的圖像信 號,全部都可以看成是周期函數(shù)信號。相關(guān)性很強的圖像信號可看成是短周期信號,相關(guān)性 很弱的圖像信號可看成是長周期信號。因此,經(jīng)過付立葉變換后的信號,只需對展開成級數(shù) 的各項系數(shù)(一般只取前幾項)進行處理和傳送。DPCM差動脈沖編碼調(diào)制也有人叫預(yù)測編碼,它的定義是:在線性預(yù)測編碼中,首先用 過去的若干像素值對當前像素值進行線性預(yù)測,然后將其差值進行PCM編碼傳送,接收端將 此差值積分而再生圖像;哈夫曼編碼也叫可變長編碼,它對出現(xiàn)概率大的差值信號編以短碼, 對概率小的差值信號編以長碼,哈夫曼編碼可獲得最小的平均碼長。在數(shù)字電視技術(shù)中,除了圖像需要壓縮以外,

10、聲音也要壓縮,但聲音壓縮要比圖像壓縮 簡單很多,因為聲音的信息量比起圖像的信息量來,少得可憐。人的耳朵能聽到聲音的頻率 范圍是20Hz到20kHz,如果我們把20Hz到20kHz按照一定的頻帶寬度分成很多個頻率通道, 用來對聲音進行過濾和處理,就能對聲音信號進行壓縮。這個頻率通道就相當于,歌曲中的 諧音:多、來、米、發(fā)、梭、拉、妻、多(12345671)。聲音壓縮的原理也是利用“字庫”的概念,在信號的譯碼端,安裝有很多個與信號發(fā)送 編碼端對應(yīng)的頻率發(fā)生器(如12345671諧音器)。另外聲音還有一個屏蔽效應(yīng),就是,人 的耳朵對某個頻率范圍的聲音靈敏度特別高(600Hz附近),對一些頻率卻很低(

11、低頻和高 頻);還有,如果有幾種聲音同時存在,聲音大的內(nèi)容很容易聽到,而聲音很小的東西要非 常注意才能聽到(對數(shù)特性)。利用這些特點,在編碼的時候就可以分長碼和短碼來對不同 的內(nèi)容進行編碼,對主要聲音內(nèi)容用長碼,對次要內(nèi)容用短碼一一這叫有所為和有所不為。 經(jīng)過多種方法對聲音信號壓縮處理后,聲音信號傳送的碼率可變得非常低,即壓縮比非常大。聲音信號壓縮的原理可以比喻成,某人想聽某鋼琴家彈鋼琴,一種方法是把鋼琴家連同 鋼琴都請到家來;另一種方法是,只請鋼琴家而用自己的鋼琴進行演奏;再有一種方法是, 只需對方把曲譜寄過來,而用自己的鋼琴和家人來演奏,顯然是最后一種方法最簡便。在全數(shù)字信號電視系統(tǒng)中,圖

12、像信號和音頻號之所以能壓縮,并不完全是信源編碼端的 功勞,接收端譯碼器的功勞也非常大,沒有譯碼器強大的數(shù)據(jù)處理功能,圖像信號和音頻信 號的壓縮是不可能的。其實從信源端發(fā)送給接收端,真正屬于圖像內(nèi)容的信息并不多,大部 分都是“補丁”(差值),和“指令”(代碼),譯碼器通過對這些數(shù)據(jù)進行加工,不斷地 更新自己的“數(shù)據(jù)庫”(圖形庫),然后重新編碼輸出,最后進行D/A轉(zhuǎn)換,輸出音視頻。目前圖像壓縮標準有MPEG1、MPEG2、MPEG4、MPEG7,根據(jù)用途的不同壓縮方法和碼率 也不一樣。MPEG1用于VCD,清晰度很低,但碼率也很低;MPEG2用于SDTV或HDTV,清晰度 很高,但碼率也很高;MPEG4本來準備用于可視電話,它壓縮比很高,碼率也很低,活動圖 像質(zhì)量比MPEG2差,但它可以在電腦上進行標清節(jié)目顯示,所以有人準備把它進行升級來替 代MPEG2或更高版本(JVT); MPEG7用于圖書館檔案查詢,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論