版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第三章信源編碼(一)
離散信源無失真編碼第三章信源編碼(一)
離散信源無失真編碼13.1信源及其分類3.2離散無記憶信源的等長編碼3.3離散無記憶信源的不等長編碼3.4最佳不等長編碼3.1信源及其分類23.1信源及其分類3.1信源及其分類3信源及其分類離散信源…U-2,U-1,U0,U1,U2,…,Ul取自字母表A無記憶信源:Ul彼此獨(dú)立有記憶信源:Ul彼此相關(guān)簡單信源:Ul獨(dú)立同分布平穩(wěn)信源,各態(tài)歷經(jīng)源M階記憶源(有限狀態(tài)馬爾可夫鏈)連續(xù)信源時(shí)間離散連續(xù)源隨機(jī)波形源信源及其分類離散信源…U-2,U-1,U0,U1,U2,43.2離散無記憶源的等長編碼3.2離散無記憶源的等長編碼5離散無記憶源字母表A={a1,…,aK},概率p1,…,pK,長為L的源輸出序列uL={u1,…,uL},共有KL種序列碼符號字母表B={b1,…,bD},以碼符號表示源輸出序列,D元碼等長D元碼,不等長D元碼單義可譯碼,每個(gè)消息都至少有一個(gè)碼字與之對應(yīng)。單義可譯碼存在充要條件DN≥KL
N≥LlogK/logD離散無記憶源字母表A={a1,…,aK},概率p1,…,pK6DMS的等長編碼NlogD≥LH(U)H(U)是統(tǒng)計(jì)平均值,L達(dá)到無限時(shí),一個(gè)具體的源輸出序列的平均每符號的信息量才等于H(U)選L足夠長,使NlogD≥L[H(U)+eL]DMS的等長編碼NlogD≥LH(U)7DMS序列的自信息量DMS序列的自信息量8弱、強(qiáng)e典型序列集弱、強(qiáng)e典型序列集9信源劃分定理典型序列集非典型序列集序列集合信源劃分定理典型序列集非典型序列集序列集合10典型序列的比例典型序列的比例11編碼速率和等長編碼定理R=(1/L)logM=(N/L)logD,M為碼字總數(shù)定義:對于給定信源和編碼速率R以及任意e>0,若有L0,以及編譯碼方法,使得L>L0,錯(cuò)誤概率小于e,R是可達(dá)的等長編碼定理R>H(U),R是可達(dá)的,R<H(U)是不可達(dá)的編碼效率=H(U)/R
編碼速率和等長編碼定理R=(1/L)logM=(N/L)lo123.3DMS的不等長編碼3.3DMS的不等長編碼13平均碼長平均碼長14幾個(gè)定義唯一可譯碼逗點(diǎn)碼,無逗點(diǎn)碼字頭或前綴異字頭碼或異前綴碼樹碼,滿樹,非滿樹,全樹樹碼構(gòu)造異字頭碼幾個(gè)定義唯一可譯碼15例子信源字母集概率碼A碼B碼C碼Da1a2a3a40.50.250.1250.125001100100110101101110010110111例子信源字母集概率碼A碼B碼C碼Da10.5000016Shannon-Fano編碼D元碼每次信源符號化為概率近似相等的D個(gè)子集這樣可以保證D個(gè)碼元近似等概,每個(gè)碼字承載的信息量近似最大,碼就近似最短。理想情況I(ak)=nklogD,p(ak)=D-nkShannon-Fano編碼D元碼17Kraft不等式長度為n1,n2,…,nK的D-元異字頭碼存在的充分必要條件是二元異字頭碼Kraft不等式等號成立定理:任意唯一可譯碼必滿足Kraft不等式Kraft不等式長度為n1,n2,…,nK的D-元異字頭碼存18不等長編碼定理編碼速率不等長編碼定理編碼速率193.4最佳不等長編碼3.4最佳不等長編碼20Huffman編碼的最佳性所謂最佳:是指在所有可能的編碼方法中,其編碼得到的平均碼長最短。定理3.4.1:對于給定信源,存在有最佳惟一可譯二元碼,其最小概率的兩個(gè)碼字CK-1和CK的長度最長且相等,它們之間僅最后一位碼元取值不同(一個(gè)為0,另一個(gè)為1)。Huffman編碼的最佳性所謂最佳:是指在所有可能的編碼方法21Huffman編碼的最佳性對信源可對aK-1和aK的碼字的最后一位分別指定為1和0,然后作一輔助集Huffman編碼的最佳性對信源22Huffman編碼的最佳性定理3.4.2對輔助集U
’為最佳的碼,對原始消息集U也是最佳的。若C’1,C’2,…,C’K-1是對輔助集U'的最佳碼,相應(yīng)碼長為n’1,n’2,…,n’K-1,則對U的碼字C1,C2,…,CK的碼長為nk=n’k
k≤K–2nk=n’K-1+1k=K,K–1Huffman編碼的最佳性定理3.4.2對輔助集U’為23Huffman編碼的最佳性
Huffman編碼的最佳性24例:Huffman編碼過程例:Huffman編碼過程25例:Huffman編碼過程例:Huffman編碼過程26Shannon-Fano編碼例子cabcedeacacdeddaaabaababaaabbacdebaceada共40個(gè)字母頻度a-16,b-7,c-6,d-6,e-51)將給定符號按照其頻率從大到小排序。a-16b-7c-6d-6e–52)將序列分成左右兩部分,使得左部頻率總和盡可能接近右部頻率總和。有:(a,b),(c,d,e)Shannon-Fano編碼例子cabcedeacacded27Shannon-Fano編碼例子3)我們把第二步中劃分出的上部作為二叉樹的左子樹,記0,下部作為二叉樹的右子樹,記1。4)分別對左右子樹重復(fù)23兩步,直到所有的符號都成為二叉樹的樹葉為止。bacde00101011a00b01c10d110e111Shannon-Fano編碼例子3)我們把第二步中劃分出的28Shannon-Fano編碼例子編碼結(jié)果Cabcedeacacdeddaaabaababaaabbacdebaceada1000011011111011100100010......長91bit采用3bit等長編碼需120bit采用ASCII碼需要320bitShannon-Fano編碼例子編碼結(jié)果29采用Huffman編碼a16b7c6d6e511132401010101a0b100c101d110e111總比特?cái)?shù)88,信源熵為86.601bit采用Huffman編碼a16b7c6d6e30Huffman編碼Shannon-Fano編碼構(gòu)造二叉樹是自樹根到樹葉,很難保證最佳性。Huffman編碼則是從樹葉到樹根,是最佳的Huffman編碼Shannon-Fano編碼構(gòu)造二叉樹是自31總結(jié)Huffman需要知道信源的概率分布,這在實(shí)際中有時(shí)是比較困難的。采用半靜態(tài)模型、自適應(yīng)模型、markov模型,部分匹配預(yù)測模型等等解決這一問題。總結(jié)Huffman需要知道信源的概率分布,這在實(shí)際中有時(shí)是比32D元Huffman編碼共有K個(gè)符號,概率最小的R個(gè)符號碼長最長K+B=D+m(D-1)注意B<D-1K-2=m(D-1)+D-2-BB個(gè)R個(gè)B=D-2-((K-2)mod(D-1))R=2+((K-2)mod(D-1))D元Huffman編碼共有K個(gè)符號,概率最小的R個(gè)符號碼長最33Shannon-Fano-Elias編碼累計(jì)分布函數(shù)修正累計(jì)分布函數(shù)Shannon-Fano-Elias編碼累計(jì)分布函數(shù)修正累計(jì)34Shannon-Fano-Elias編碼采用的數(shù)值作為ak的碼字碼長Shannon-Fano-Elias編碼采用35Shannon-Fano-Elias編碼Shannon-Fano-Elias編碼36Shannon-Fano-Elias編碼信源符號P(ak)F(ak)修正值二進(jìn)制碼長碼字a10.250.250.1250.0013001a20.50.750.50.10210a30.1250.8750.81250.110141101a40.1251.00.93750.111141111Shannon-Fano-Elias編碼信源符號P(ak)F37算術(shù)碼應(yīng)用于JPEG2000,H.263等圖像壓縮標(biāo)準(zhǔn)算術(shù)碼應(yīng)用于JPEG2000,H.263等圖像壓縮標(biāo)準(zhǔn)38算術(shù)碼信源序列(u1u2…un)的累計(jì)分布算術(shù)編碼是計(jì)算序列的累計(jì)分布,用累計(jì)分布值表示序列,所以稱為算術(shù)編碼以二元信源輸出序列的編碼為例01110P(0)P(1)F(0)F(1)01算術(shù)碼信源序列(u1u2…un)的累計(jì)分布P(0)P(1)F39算術(shù)碼P(00)P(01)F(0)F(01)F(1)P(010)P(011)F(011)P(0110)P(0111)F(0111)P(01110)P(01111)F(01111)算術(shù)碼P(00)P(01)F(0)F(01)F(1)P(0140算術(shù)碼信源符號序列u對應(yīng)區(qū)間的寬度等于符號序列的概率算術(shù)碼信源符號序列u對應(yīng)區(qū)間的寬度等于符號序列的概率41算術(shù)編碼F(u)將[0,1)分割成許多小區(qū)間,取小區(qū)間內(nèi)的一個(gè)點(diǎn)代表該序列,以該點(diǎn)數(shù)值的二進(jìn)制小數(shù)表示該序列,碼字長度為算術(shù)編碼F(u)將[0,1)分割成許多小區(qū)間,取小區(qū)間內(nèi)的一42算術(shù)編碼算術(shù)編碼43例:P(0)=0.25,P(1)=0.75,u=11111100P(u=11111100)=0.7560.252L=7F(s)=0.110100100111C=1101010編碼效率92.7%例:P(0)=0.25,P(1)=0.75,u=1111144LZ編碼利用字典編碼方法信源符號A=(a1…aK)將序列分為不同的段取最短長度的連續(xù)符號構(gòu)成段,保證互不相同。先取一個(gè)符號分段,若與前面段相同,就再取一個(gè)符號,直至序列結(jié)束得到字典表,碼字由段號加后一個(gè)符號組成。單符號的碼字,段號為0LZ編碼利用字典編碼方法45LZ編碼符號碼字a0a1a2a300011011LZ編碼符號碼字a00046LZ編碼00000001100001100001100000010001110
1234567LZ編碼000000011000011000011047LZ編碼設(shè)長為L的信源序列u分為M(u)個(gè)碼段,每段短語的二元碼符號長度為總碼長平均+LZ編碼設(shè)長為L的信源序列u分為M(u)個(gè)碼段,每段短語的二48LZ編碼設(shè)長度為l段有Kl種。若把長為L的信源序列u分為M(u)個(gè)碼段后,設(shè)最長的段長為lmax,而且所有小于等于lmax的段型全部都有,則LZ編碼設(shè)長度為l段有Kl種。若把長為L的信源序列u分為M(49LZ編碼典型段,ak出現(xiàn)的次數(shù)為lmaxp(ak)LZ編碼典型段,ak出現(xiàn)的次數(shù)為lmaxp(ak)50LZ編碼設(shè)較短的段型忽略不計(jì)LZ編碼設(shè)較短的段型忽略不計(jì)51第三章信源編碼(一)
離散信源無失真編碼第三章信源編碼(一)
離散信源無失真編碼523.1信源及其分類3.2離散無記憶信源的等長編碼3.3離散無記憶信源的不等長編碼3.4最佳不等長編碼3.1信源及其分類533.1信源及其分類3.1信源及其分類54信源及其分類離散信源…U-2,U-1,U0,U1,U2,…,Ul取自字母表A無記憶信源:Ul彼此獨(dú)立有記憶信源:Ul彼此相關(guān)簡單信源:Ul獨(dú)立同分布平穩(wěn)信源,各態(tài)歷經(jīng)源M階記憶源(有限狀態(tài)馬爾可夫鏈)連續(xù)信源時(shí)間離散連續(xù)源隨機(jī)波形源信源及其分類離散信源…U-2,U-1,U0,U1,U2,553.2離散無記憶源的等長編碼3.2離散無記憶源的等長編碼56離散無記憶源字母表A={a1,…,aK},概率p1,…,pK,長為L的源輸出序列uL={u1,…,uL},共有KL種序列碼符號字母表B={b1,…,bD},以碼符號表示源輸出序列,D元碼等長D元碼,不等長D元碼單義可譯碼,每個(gè)消息都至少有一個(gè)碼字與之對應(yīng)。單義可譯碼存在充要條件DN≥KL
N≥LlogK/logD離散無記憶源字母表A={a1,…,aK},概率p1,…,pK57DMS的等長編碼NlogD≥LH(U)H(U)是統(tǒng)計(jì)平均值,L達(dá)到無限時(shí),一個(gè)具體的源輸出序列的平均每符號的信息量才等于H(U)選L足夠長,使NlogD≥L[H(U)+eL]DMS的等長編碼NlogD≥LH(U)58DMS序列的自信息量DMS序列的自信息量59弱、強(qiáng)e典型序列集弱、強(qiáng)e典型序列集60信源劃分定理典型序列集非典型序列集序列集合信源劃分定理典型序列集非典型序列集序列集合61典型序列的比例典型序列的比例62編碼速率和等長編碼定理R=(1/L)logM=(N/L)logD,M為碼字總數(shù)定義:對于給定信源和編碼速率R以及任意e>0,若有L0,以及編譯碼方法,使得L>L0,錯(cuò)誤概率小于e,R是可達(dá)的等長編碼定理R>H(U),R是可達(dá)的,R<H(U)是不可達(dá)的編碼效率=H(U)/R
編碼速率和等長編碼定理R=(1/L)logM=(N/L)lo633.3DMS的不等長編碼3.3DMS的不等長編碼64平均碼長平均碼長65幾個(gè)定義唯一可譯碼逗點(diǎn)碼,無逗點(diǎn)碼字頭或前綴異字頭碼或異前綴碼樹碼,滿樹,非滿樹,全樹樹碼構(gòu)造異字頭碼幾個(gè)定義唯一可譯碼66例子信源字母集概率碼A碼B碼C碼Da1a2a3a40.50.250.1250.125001100100110101101110010110111例子信源字母集概率碼A碼B碼C碼Da10.5000067Shannon-Fano編碼D元碼每次信源符號化為概率近似相等的D個(gè)子集這樣可以保證D個(gè)碼元近似等概,每個(gè)碼字承載的信息量近似最大,碼就近似最短。理想情況I(ak)=nklogD,p(ak)=D-nkShannon-Fano編碼D元碼68Kraft不等式長度為n1,n2,…,nK的D-元異字頭碼存在的充分必要條件是二元異字頭碼Kraft不等式等號成立定理:任意唯一可譯碼必滿足Kraft不等式Kraft不等式長度為n1,n2,…,nK的D-元異字頭碼存69不等長編碼定理編碼速率不等長編碼定理編碼速率703.4最佳不等長編碼3.4最佳不等長編碼71Huffman編碼的最佳性所謂最佳:是指在所有可能的編碼方法中,其編碼得到的平均碼長最短。定理3.4.1:對于給定信源,存在有最佳惟一可譯二元碼,其最小概率的兩個(gè)碼字CK-1和CK的長度最長且相等,它們之間僅最后一位碼元取值不同(一個(gè)為0,另一個(gè)為1)。Huffman編碼的最佳性所謂最佳:是指在所有可能的編碼方法72Huffman編碼的最佳性對信源可對aK-1和aK的碼字的最后一位分別指定為1和0,然后作一輔助集Huffman編碼的最佳性對信源73Huffman編碼的最佳性定理3.4.2對輔助集U
’為最佳的碼,對原始消息集U也是最佳的。若C’1,C’2,…,C’K-1是對輔助集U'的最佳碼,相應(yīng)碼長為n’1,n’2,…,n’K-1,則對U的碼字C1,C2,…,CK的碼長為nk=n’k
k≤K–2nk=n’K-1+1k=K,K–1Huffman編碼的最佳性定理3.4.2對輔助集U’為74Huffman編碼的最佳性
Huffman編碼的最佳性75例:Huffman編碼過程例:Huffman編碼過程76例:Huffman編碼過程例:Huffman編碼過程77Shannon-Fano編碼例子cabcedeacacdeddaaabaababaaabbacdebaceada共40個(gè)字母頻度a-16,b-7,c-6,d-6,e-51)將給定符號按照其頻率從大到小排序。a-16b-7c-6d-6e–52)將序列分成左右兩部分,使得左部頻率總和盡可能接近右部頻率總和。有:(a,b),(c,d,e)Shannon-Fano編碼例子cabcedeacacded78Shannon-Fano編碼例子3)我們把第二步中劃分出的上部作為二叉樹的左子樹,記0,下部作為二叉樹的右子樹,記1。4)分別對左右子樹重復(fù)23兩步,直到所有的符號都成為二叉樹的樹葉為止。bacde00101011a00b01c10d110e111Shannon-Fano編碼例子3)我們把第二步中劃分出的79Shannon-Fano編碼例子編碼結(jié)果Cabcedeacacdeddaaabaababaaabbacdebaceada1000011011111011100100010......長91bit采用3bit等長編碼需120bit采用ASCII碼需要320bitShannon-Fano編碼例子編碼結(jié)果80采用Huffman編碼a16b7c6d6e511132401010101a0b100c101d110e111總比特?cái)?shù)88,信源熵為86.601bit采用Huffman編碼a16b7c6d6e81Huffman編碼Shannon-Fano編碼構(gòu)造二叉樹是自樹根到樹葉,很難保證最佳性。Huffman編碼則是從樹葉到樹根,是最佳的Huffman編碼Shannon-Fano編碼構(gòu)造二叉樹是自82總結(jié)Huffman需要知道信源的概率分布,這在實(shí)際中有時(shí)是比較困難的。采用半靜態(tài)模型、自適應(yīng)模型、markov模型,部分匹配預(yù)測模型等等解決這一問題??偨Y(jié)Huffman需要知道信源的概率分布,這在實(shí)際中有時(shí)是比83D元Huffman編碼共有K個(gè)符號,概率最小的R個(gè)符號碼長最長K+B=D+m(D-1)注意B<D-1K-2=m(D-1)+D-2-BB個(gè)R個(gè)B=D-2-((K-2)mod(D-1))R=2+((K-2)mod(D-1))D元Huffman編碼共有K個(gè)符號,概率最小的R個(gè)符號碼長最84Shannon-Fano-Elias編碼累計(jì)分布函數(shù)修正累計(jì)分布函數(shù)Shannon-Fano-Elias編碼累計(jì)分布函數(shù)修正累計(jì)85Shannon-Fano-Elias編碼采用的數(shù)值作為ak的碼字碼長Shannon-Fano-Elias編碼采用86Shannon-Fano-Elias編碼Shannon-Fano-Elias編碼87Shannon-Fano-Elias編碼信源符號P(ak)F(ak)修正值二進(jìn)制碼長碼字a10.250.250.1250.0013001a20.50.750.50.10210a30.1250.8750.81250.110141101a40.1251.00.93750.111141111Shannon-Fano-Elias編碼信源符號P(ak)F88算術(shù)碼應(yīng)用于JPEG2000,H.263等圖像壓縮標(biāo)準(zhǔn)算術(shù)碼應(yīng)用于JPEG2000,H.263等圖像壓縮標(biāo)準(zhǔn)89算術(shù)碼信源序列(u1u2…un)的累計(jì)分布算術(shù)編碼是計(jì)算序列的累計(jì)分布,用累計(jì)分布值表示序列,所以稱為算術(shù)編碼以二元信源輸出序列的編碼為例01110P(0)P(1)F(0)F(1)01算術(shù)碼信源序列(u1u2…un)的累計(jì)分布P(0)P(1)F90算術(shù)碼P(00)P(01)F(0)F(01)F(1)P(010)P(011)F(011)P(0110)P(0111)F(0111)P(01110)P(01111)F(01111)算
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 12417.1-2024無源外科植入物骨接合與關(guān)節(jié)置換植入器械第1部分:骨接合植入器械特殊要求
- 二零二五年度鋼材水泥市場調(diào)研與風(fēng)險(xiǎn)評估合同2篇
- 二零二五年度變壓器節(jié)能補(bǔ)貼申請與使用合同范本3篇
- 二零二五版加工承攬合同全文詳盡規(guī)定承攬物、報(bào)酬及質(zhì)量標(biāo)準(zhǔn)3篇
- 二零二五版合伙人業(yè)務(wù)拓展合同范本3篇
- 二零二五年度貨物包裝合同范本3篇
- 2025年度森林防火物資儲備與供應(yīng)標(biāo)準(zhǔn)植樹承包合同示范文本3篇
- 2024版權(quán)轉(zhuǎn)讓合同轉(zhuǎn)讓價(jià)格及支付方式
- 2024版環(huán)保設(shè)備生產(chǎn)與安裝合同
- 二零二五年房產(chǎn)分割公證合同書3篇
- 河南省鄭州外國語高中-【高二】【上期中】【把握現(xiàn)在 蓄力高三】家長會【課件】
- 天津市武清區(qū)2024-2025學(xué)年八年級(上)期末物理試卷(含解析)
- 2025年中煤電力有限公司招聘筆試參考題庫含答案解析
- 企業(yè)內(nèi)部控制與財(cái)務(wù)風(fēng)險(xiǎn)防范
- 高端民用航空復(fù)材智能制造交付中心項(xiàng)目環(huán)評資料環(huán)境影響
- 建設(shè)項(xiàng)目施工現(xiàn)場春節(jié)放假期間的安全管理方案
- 胃潴留護(hù)理查房
- 植物細(xì)胞中氨基酸轉(zhuǎn)運(yùn)蛋白的一些已知或未知的功能
- 山東省高等學(xué)校精品課程
- 三菱張力控制器LE-40MTA-E說明書
- 生活垃圾填埋場污染控制標(biāo)準(zhǔn)
評論
0/150
提交評論