信息論第三章離散信源無失真編碼_第1頁
信息論第三章離散信源無失真編碼_第2頁
信息論第三章離散信源無失真編碼_第3頁
信息論第三章離散信源無失真編碼_第4頁
信息論第三章離散信源無失真編碼_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第3章

離散信源無失真編碼第3章離散信源無失真編碼

內(nèi)容提要用盡可能少的符號來傳輸信源消息,目的是提高傳輸效率,這是信源編碼應(yīng)考慮的問題,這章討論在不允許失真情況下的信源編碼。等長編碼定理給出了等長編碼條件下,其碼長的下限值,變長編碼定理(香農(nóng)第一定理)給出了信源無失真變長編碼時其碼長的上、下限值。本章還介紹了三種通用信源編碼方法:香農(nóng)編碼法、Fano編碼法和霍夫曼編碼法。3.1緒論為了實現(xiàn)高質(zhì)量、高效率的通信,引入了信源編碼和信道編碼。信源編碼和信道編碼主要需要解決以下兩個問題。提高傳輸效率

增強通信的可靠性

(1)提高傳輸效率,用盡可能少的信道傳輸符號來傳遞信源消息,目的是提高傳輸效率,這是信源編碼主要應(yīng)考慮的問題。這里又分兩種情況討論,即允許接收信號有一定的失真或不允許失真。綜上所述,提高抗干擾能力往往是以降低信息傳輸效率為代價的,而為了提高傳輸效率又往往削弱了其抗干擾能力。這樣,設(shè)計者在取舍之間就要作均衡考慮。

(2)

增強通信的可靠性如何增加信號的抗干擾能力,提高傳輸?shù)目煽啃?,這是信道編碼主要考慮的問題。解決這一問題,一般是采用冗余編碼法,賦予信碼自身一定的糾錯和檢錯能力,只要采取適當(dāng)?shù)男诺谰幋a和譯碼措施,就可使信道傳輸?shù)牟铄e概率降到允許的范圍之內(nèi)。信源編碼包括兩個功能:(1)

將信源符號變換成適合信道傳輸?shù)姆?;?)

壓縮信源冗余度,提高傳輸效率。{a1,a2,…,aK}為信源符號集,序列中每一個符號uml都取自信源符號集。{b1

,b2

,…,bD}是適合信道傳輸?shù)腄個符號,用作信源編碼器的編碼符號。編碼輸出碼字cm=cm1cm2…cmn,cmk∈{b1

,b2

,…,bD}k=1,2,

…,n,n表示碼字長度,簡稱碼長

信源符號{a1,a2,…,aK}

信道符號(碼符號){b1,b2,…,bD}

圖3-1信源編碼器模型

信源

信源編碼器

一般來說,信源編碼可歸納為如圖3-1所示的模型。

消息

ui=ui1ui2…uiL

碼字ci=ci1ci2…cin

信源編碼可看成是從信源符號集到碼符號集的一種映射,即將信源符號集中的每個元素(可以是單符號,也可以是符號序列)映射成一個長度為n的碼字。對于同一個信源,編碼方法是多種的?!纠?.3】用{u1

,u2

,u3,u4}表示信源的四個消息,碼符號集為{0,1},表3-1列出了該信源的幾種不同編碼。表3-1同一信源的幾種不同編碼信源消息各消息概率碼1碼2碼3碼4u1q(u1)000001u2q(u2)1101110u3q(u3)101000100u4q(u4)11111110003.1.1碼的分類3.變長碼若碼字集合C中的所有碼字cm(m=1,2,…,M),其碼長不都相同,稱碼C為變長碼。2.等長碼在一組碼字集合C中的所有碼字cm(m=1,2,…,M),其碼長都相同,則稱這組碼C為等長碼。一般,可以將碼簡單的分成如下幾類:1.二元碼若碼符號集為{0,1},則碼字就是二元序列,稱為二元碼,二元碼通過二進制信道傳輸,這是數(shù)字通信和計算機通信中最常見的一種碼。4.奇異碼對奇異碼來說,從信源消息到碼字的影射不是一一對應(yīng)的。奇異碼不具備惟一可譯性。

信源消息各消息概率碼1碼2碼3碼4u1q(u1)000001u2q(u2)1101110u3q(u3)101000100u4q(u4)1111111000表3-1同一信源的幾種不同編碼5.非奇異碼從信源消息到碼字的影射是一一對應(yīng)的,每一個不同的信源消息都用不同的碼字對其編碼。信源消息各消息概率碼1碼2碼3碼4u1q(u1)000001u2q(u2)1101110u3q(u3)101000100u4q(u4)1111111000表3-1同一信源的幾種不同編碼擴展信源

信源編碼器

信源符號{a1,a2,…,aK}

信道符號(碼符號){b1,b2,…,bD}

消息

u1

…uN=(u11u12…u1L)…(uN1uN2…uNL)N次擴展碼字

c1

…cN=(c11c12…c1n)…(cN1cN2…cNn)圖3-2N次擴展信源編碼器模型

原碼的N次擴展碼是將信源作N次擴展得到的新信源符號序列u(N)=u1

…uN=(u11u12…u1L)…(uN1uN2…uNL),對應(yīng)碼符號序列c(N)=c1

…cN=(c11c12…c1n)…(cN1cN2…cNn),記集合C(N)={c1(N),c2(N),…},C

(N)即原碼C的N次擴展碼。6.原碼C的N次擴展碼原碼C的N次擴展碼中的每個元素是N次擴展信源中的序列所對應(yīng)的N個碼字組成的序列。對于定長碼,若原碼是惟一可譯碼,則它的N次擴展碼也是惟一可譯的,而對于變長碼則不盡然,見表3-2。7.惟一可譯碼定義3.1如果碼的任意N次擴展碼都是非奇異碼,則稱該碼為惟一可譯碼。信源消息各消息概率碼1碼2碼3碼4u1q(u1)000001u2q(u2)1101110u3q(u3)101000100u4q(u4)1111111000表3-1同一信源的幾種不同編碼對于定長碼,若原碼是惟一可譯碼,則它的N次擴展碼也是惟一可譯的,而對于變長碼則不盡然,見表3-2。信源消息各消息概率碼1碼2碼3u1q(u1)011u2q(u2)11001u3q(u3)00100001u4q(u4)1110000001表3-2同一信源的幾種不同變長編碼7.惟一可譯碼8.即時碼對于變長碼,又有如下定義定義3.2

對于碼字c

=c1c2…cn,稱c、

=c1c2…ci(i<n)為碼字c的字頭(前綴)。定義3.3若碼中任一碼字都不是另一碼字的字頭,稱該碼為異字頭碼(無前綴碼)。表3-2中碼3,收到“1”后就知道一個碼字已經(jīng)完結(jié),無須等待下一個符號抵達(dá),所以無前綴碼能夠即時譯碼,稱之為即時可譯碼,簡稱即時碼。而對于碼2,收到“1”后,并不能立即做出判決,就是收到“10”也不能立即做出判決,則還要收到下面的碼元才能做出判決。所以非異字頭碼不能即時譯碼,稱為非即時碼,由于非異字頭碼的其中一些碼字是另一些碼字的延長,故也稱延長碼。顯然,即時碼是惟一可譯碼,而惟一可譯碼不一定是即時碼。

即時碼可用樹圖法來構(gòu)造。圖3-3用樹圖法編碼樹根編碼深度u1:1u2:01u3:001u4:00011

0u1u2u3u41

1

1

00【例3.4】用樹圖法表示表3-2中的碼3,如圖3-3所示(D=2)。

碼奇異碼非奇異碼非惟一可譯碼惟一可譯碼變長碼等長碼即時碼延長碼

圖3-5碼的分類結(jié)構(gòu)圖

圖3-5是碼的分類結(jié)構(gòu)圖

由上面的結(jié)構(gòu)圖可看出,將碼分為奇異碼和非奇異碼兩大類,我們只討論非奇異碼。非奇異碼又分為惟一可譯碼和非惟一可譯碼兩大類,我們只討論惟一可譯碼。

3.1.2平均碼長的計算對于變長碼,碼集C的平均碼長,用符號表示,定義為碼C中每個碼字cm(m=1,2,…,M)其碼長的概率加權(quán)平均值為 (3-1)式中nm是碼字cm所對應(yīng)的碼字的長度,p(cm

)是碼字cm出現(xiàn)的概率。對于等長碼,由于碼集C中的每個碼字的碼長都相同,平均碼長就等于每個碼字的碼長N次擴展碼的平均碼長等于擴展碼中碼字長度的概率加權(quán)平均值。對于2次擴展碼,有:

(3-2)設(shè)nm,

ns分別是原信源消息um,

us所對應(yīng)的碼長,

cm,

cs是um,

us所對應(yīng)的碼字,則式(3-2)中的nm+ns是擴展后新的信源序列nmns所對應(yīng)的碼字cmcs的長度;q(um)q(us)是cmcs出現(xiàn)的概率。3.1.3信息傳輸速率信道的信息傳輸速率為信道單位時間內(nèi)所傳輸?shù)膶嶋H信息量。若信息量以比特為單位,時間以秒為單位,則信息傳輸率定義為: (比特/秒)(3-3)若信息量以比特為單位,時間以碼元時間(傳輸一個碼符號的時間)為單位,則信息傳輸率記為

(比特/碼元時間) (3-4)

為編碼后的平均碼長;H(X)為信源熵;式中:t為傳輸一個碼符號的時間?!纠?.8】給定信源,為提高傳輸效率,使平均碼長盡可能短,遵照概率大取碼長短,概率小取碼長長的原則對上述信源進行二進制不等長編碼,得到,求編碼后的信息傳輸率RD。

(比特/符號)

(碼元/符號)

(比特/碼元時間)3.2等長碼及等長編碼定理對一簡單信源S進行等長編碼,信源符號集有K個符號,碼符號集含D個符號,碼字長度記為n。要得到惟一可譯碼,必須滿足K≤Dn信源消息各消息概率碼1碼2碼3碼4u1q(u1)000001u2q(u2)1101110u3q(u3)101000100u4q(u4)1111111000表3-1同一信源的幾種不同編碼3.2等長碼及等長編碼定理對單符號信源S的L次擴展信源S(L)進行等長編碼,要得到長為n的惟一可譯碼,必須滿足KL

≤Dn(3-5)對式(3-5)兩邊取對數(shù),得(3-6)

對于那些出現(xiàn)概率極小的字符序列不予編碼,這樣可以減小平均碼長,當(dāng)然這樣會帶來一定的失真。定理3.1

等長編碼定理

設(shè)離散無記憶信源S={x1

,x2

,…,xk}的熵為H(X),S的L維擴展信源為,對信源輸出的L長序列si,i=1,2,…,KL進行等長編碼,碼字是長度為n的D進制符號串,當(dāng)滿足條件,則L→∞時,可使譯碼差錯率pe<δ(ε、δ為無窮小量),反之,當(dāng)時,則不可能實現(xiàn)無差錯編碼。編碼效率定理3.1要求,即,可看出比值是一個小于1的無量綱純數(shù),定義它為等長編碼的編碼效率,記為(3-7)

3.3變長碼及變長編碼定理

3.3.1變長碼對于變長碼,往往在L不是很大的情況下就可編出高效且無失真的碼。變長碼也要求原碼的任意L次擴展碼也是惟一可譯的。變長碼分為即時碼和延長碼,為保證即時譯碼,要求變長惟一可譯碼采用即時碼。對于變長碼,要求整個碼集的平均碼長力求最小,此時編碼效率最高。對于給定信源,使平均碼長達(dá)到最小的編碼方法,稱為最佳編碼,得到的碼集稱為最佳碼。3.3.2克拉夫特不等式定理3.2

D進制碼字集合C={c1,c2,…,cM},碼集中每一cm(m=1,2,…,M)都是一個D進制符號串,設(shè)c1,c2,…,cM對應(yīng)的碼長分別是n1,n2,…,nM

,則存在唯一可譯碼的充要條件是

(3-10)

式(3-10)也稱克拉夫特不等式

定理3.2只是說是存在惟一可譯碼的充要條件,這里強調(diào)的是“存在”,但它并不是唯一可譯碼的充要條件,換言之,惟一可譯碼一定滿足克拉夫特不等式,反之,滿足克拉夫特不等式的碼不一定是惟一可譯碼。

3.3.3變長編碼定理定理3.3給定熵為H(X)的離散無記憶信源,及有D個元素的碼符號集,則總可找到一種無失真編碼方法,構(gòu)成惟一可譯碼,其平均碼長滿足: (3-19)3.3.3變長編碼定理定理3.4

變長編碼定理(Shannon第一定理)

給定熵為H(X)的離散無記憶信源,其L次擴展信源的熵記為H(X),給定有D個元素的碼符號集,對擴展信源進行編碼,總可以找到一種惟一可譯碼,使碼長滿足(3-23)

記為信源每個符號所對應(yīng)的平均碼字?jǐn)?shù),則式(3-23)為

(3-24)

Shannon第一定理的物理意義在于:對信源進行編碼,使編碼后的碼集中各碼字盡可能等概分布,如果將這碼集看成為一個新的信源,這時新信源所含信息量最大。定義編碼效率(3-26)η是一個無量綱的數(shù),一般情況下η<1,在極限情況下η=1。對于同一種信源,三種編碼法中以香農(nóng)編碼法的編碼效率最低,費諾編碼法也不是一種最佳編碼法,但用這種方法有時候也能找到緊致碼。一般情況下,霍夫曼編碼法得到的平均碼長最短,即編碼效率最高。

編碼效率定義為:3.4變長碼的編碼方法香農(nóng)(Shannon)編碼法費諾(Fano)編碼法霍夫曼(Huffman)編碼法變長編碼法:3.4.1香農(nóng)編碼法

二進制香農(nóng)編碼法其碼長的取值范圍:-logq(xm)

nm<-logq(xm)+1

(3-30)記離散信源,給定有D個元素的碼符號集,對信源進行變長編碼,將各消息概率q(xm)(m=1,2,…,M)寫成如下的形式:

取碼長nm(m=1,2,…,M)

滿足:tm

nm<

tm

+1(3-28)

香農(nóng)編碼法具體步驟如下,(4)計算出第m個消息的累加概率,再將pi變換成二進制小數(shù),取小數(shù)點后面nm位作為第m個消息的代碼組(3)根據(jù)式(3-30):-logq(xm)

nm<-logq(xm)+1(-logq(xm)為整數(shù)時取等號),計算出每個消息的二進制代碼的長度nm。(2)計算出各消息的-logq(xm)值,m=1,2,…,M;

(1)將信源發(fā)出的M個消息,按其概率遞減順序進行排列【例3.14】對給定信源

進行D=2進制香農(nóng)編碼。消息符號ai消息概率qi-log2qi碼長ni累加概率碼字cia10.22.3430000a20.192.4130.2001a30.182.4830.39011a40.172.5630.57100a50.152.7430.74101a60.103.3440.891110a70.016.6670.991111110

表3-8香農(nóng)編碼

以消息x5為例,對其進行編碼:計算出-logq(x5)=-log0.15=2.74,取整數(shù)n5=3作為x5的碼字的碼長,計算出消息x1,x2,x3,x4累加概率將0.74變換成二進制小數(shù)(0.74)10=(0.1011110)2,取小數(shù)點后面三位101作為x5的代碼。

計算該編碼的編碼效率

先算出信源熵=2.61(比特/符號)平均碼長=3.14(比特/符號)則編碼效率

3.4.2費諾編碼法費諾編碼法的具體步驟如下:

(1)信源發(fā)出的M個消息,按其概率遞減順序進行排列,把消息集{

x1,x2,x3,…,xM

}按其概率大小分解成兩個子集,使兩個子集的概率之和盡可能接近相等,把第一個子集編碼為“0”,第二個子集編碼為“1”,作為代碼組的第一個碼元;(2)對子集做第二次分解,同樣分解成兩個子集,并使兩個子集的概率盡可能接近相等,再把第一個子集編碼為“0”,第二個子集編碼為“1”,作為代碼組的第二個碼元;

(3)如此一直進行下去,直到各子集僅含一個消息為止

(4)將逐次分解過程當(dāng)中得到的碼元排列起來就是各消息的代碼。

【例3.15】對[例3.14]給出的信源進行費諾編碼

(1)將信源消息分成兩個子集{

x1,x2,x3}和{

x4,x5,x6,x7},兩個子集的和概率分別為0.2+0.19+0.18=0.57與0.17+0.15+0.10+0.01=0.43,賦予第一個子集碼元“0”,賦予第二個子集碼元“1”;

(2)又將子集分成和概率盡可能接近相等的兩個子集,分別賦予第一個子集碼元“0”,賦予第二個子集碼元“1”;

(3)一直進行下去,直到每個子集僅含一個消息為止。

該編碼的編碼效率:[例3.14]中已算出信源熵H(X)=2.61(比特/符號)

平均碼長=2.74則編碼效率:

消息符號xi消息概率q(xm)第一次分解所得碼元第二次分解所得碼元第三次分解所得碼元第四次分解所得碼元碼字cm碼長nix10.2

0

0

002x20.19

10

0103x30.181

0113x40.17

10

102x50.15

10

1103x60.10

1011104x70.01111114表3-9費諾編碼

3.4.3霍夫曼編碼法設(shè)信源消息數(shù)M

2,記概率分布為,存在D進制惟一可譯碼C

={c1,c2,…,cM},對應(yīng)的碼長分別為{n1,n2,…,nM},不失一般性,設(shè)q(x1)

q(x2)

…q(xM

),則C

={c1,c2,…,cM}是最佳碼必須具備如下兩條性質(zhì):1.

n1

n2

nM;2.最后(最長)的D*個碼字,它們具有相同的前綴c,惟一的區(qū)別是最后一位碼符號不同,可將這D*個最長的碼字分別表示為c·0,c·1,…,c·(D*-1)其中D*∈{2,3,…,D}(3-31)且D*=M[mod(D-1)](3-32)

定理3.5假定C

*

={c1,c2,…,cM-D’,c

}

為最佳碼,對應(yīng)概率Q*={q(x1)

,q(x2)

,…,q(xM-D*),q*

}

其中q*可記為q*=q(xM-D*+1)+q

(xM-D*+2)+…+q(xM)且概率分布滿足q(x1)

q(x2)

…q(xM-D*)q

(xM-D*+1)…q(xM

)則對應(yīng)概率分布為

Q={q(x1)

,q(x2)

,…,q(xM-D*),

q(xM-D*+1),…,q(xM)

}的最佳碼是C={c1,c2,…,cM-D*,c·0,

c·1,

…,c·(D*-1)}(3)將上述概率之和作為一新消息的概率,與余下的消息一起組成一新的信源,再按概率遞減順序重新排列,如果概率之和與原信源的某個概率相等,則把概率之和排在上面,這樣可使合并消息重復(fù)編碼的次數(shù)減少,使短碼得到充分利用。(4)如此一直進行下去,直到兩個合并消息的概率之和為1;

(5)從最后一步驟開始,沿編碼逆程取下各步驟得到的碼符號,如此構(gòu)成的碼符號序列即為對應(yīng)消息的碼字。

(2)將概率最小的二個消息分別編碼為“1”和“0”,(一般,將概率大的編碼為“1”,概率小的編碼為“0”),再對這兩個消息求概率之和

可以按照如下步驟編碼(先考慮D=2的情況),參見圖3-7

。(1)將信源發(fā)出的M個消息,按其概率遞減順序進行排列,得:q(x1)

q(x2)

q(x3)

q(xM

)計算該編碼的編碼效率:[例3.14]中已算出信源熵H(X)=2.61(比特/符號)計算平均碼長

=2×0.39+3×0.5+4×0.11=2.72則編碼效率

【例3.17】對[例3.14]給出的信源進行D=2進制霍夫曼編碼,編碼結(jié)果如圖3-7所示。

a70.01a60.10a50.15a40.17a30.18a20.19a10.200.260.350.390.6110.11010101010101編碼010011111010110011000圖3-7二元霍夫曼編碼例

設(shè)有離散無記憶信源用兩種不同的方法對其編二進制huffman碼信源符號xi概率p(xi)碼字Wi1碼長Ki1碼字Wi2碼長K’i2x10.411002x20.2012102x30.20003112x40.1001040103x50.1001140113兩種不同的編碼方法得到的碼字和碼長的對比兩種不同的編碼方法的平均碼長相等,所以具有相同的編碼效率。但第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論