版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2.5信源冗余度如果信源不是平穩(wěn)的,極限熵就不一定 存在,于是只好先容忍誤差,假設(shè)它是平穩(wěn) 的,并計(jì)算足夠大時(shí)的條件概率:P(Xn /X1X2.X n“)再計(jì)算出來近似地代替極限熵。如果信源符合馬爾可夫信源的條件, 就可以進(jìn)一步用階 馬爾可夫信源的熵來代替,要比小得多,顯 然記憶長度決定相對的誤差。最簡單的情 況是m=1,即以何種概率發(fā)符號僅與前一個 符號有關(guān),這是一階馬爾可夫信源,其熵為:H 2 = H, H (X 2/ X1)當(dāng)m=0時(shí),由于信源符號間的相關(guān)性為零, 故信源變成離散無記憶信源,如果進(jìn)一步假 定信源是符號等概率分布的,則信源變成理 想的離散無記憶等概信源。但是一般信源既 不是
2、無記憶的,也不是等概率的,故信源熵 沒有達(dá)到可能的最大值,也就是說信源有冗 余度。例2.5.1以二元信源為例,該信源有兩個符 號 0,1 ,如果信源符號等概率分布,且符號 之間無相關(guān)性,則其信源熵達(dá)最大值,即: Hmax (X)=1 比特 /符號。原本發(fā)送 12個比特的信息量只要 12 個 符號就夠了,其中 3 個符號是多用的,這就 是 冗余或剩余 ,從某種意義上講是一個浪 費(fèi)。2.5.1 冗余度的定義從上面的分析可知, 信源實(shí)際熵與理論上可 達(dá)到的最大熵之間有差距, 而山農(nóng)將此定義 為冗余度。1.相對熵2 冗余度3 .信息變差 顯然這三種定義均代表了信源的冗余程度。例 2.5.2求 例 2.
3、5.1的相對熵、冗余度和信再來看英文的例子 (獨(dú)立,且等概率分布 )信 源熵:Hmax=4.75 比特 /符號表 2.5.1 英語字母出現(xiàn)概率統(tǒng)計(jì)表英語字母出現(xiàn)概率英語字母出現(xiàn)概率英語字母出現(xiàn)概率A0.064J0.001S0.051B0.013K0.005T0.08C0.022L0.032U0.023D0.032M0.020V0.008E0.103N0.057W0.018F0.021O0.063X0.001G0.015P0.015Y0.016H0.047Q0.001Z0.001I0.058R0.048空格 0.1以此表計(jì)算得到的信源熵為:H1(X)=4.03 比特 /符號 如果把英文字母信源近
4、似看成一階、 二階以 及無窮階馬爾可夫信源, 則可得到相應(yīng)的信 源熵。2.5.2冗余的利用消息的冗余,特別是大量的冗余,為我們提 高通信效率,壓縮信號容量提供了基礎(chǔ)。 冗余是一種浪費(fèi),但任何事情都有兩面性, 適當(dāng)?shù)娜哂嗍潜匾?,否則系統(tǒng)不能有一點(diǎn) 差錯。它表征信源信息率的多余程度,是描述信源客觀 統(tǒng)計(jì)特性的一個物理量。由廣義Shannon不等式有:L 1log n 二 H °(U ) H ,U ) H (U 2 /U J lim H (U L /U二 H(U ) 0I _可見對于有記憶信源,最小單個消息熵應(yīng)為 H:(U),即 從理論上看,對有記憶信源只需傳送H /U )即可。 但是這
5、必需要掌握信源全部概率統(tǒng)計(jì)特性。這顯然是 不現(xiàn)實(shí)的。實(shí)際上,往往只能掌握有限的L維,這時(shí)只需傳送H|(U),那么與理論值 H相比,就多傳送了 H l(U ) - H :(U )。為了定量描述信源有效性,可定義: 信源效率:fH:/Ho信源熵的相對率 信源冗余度:R=1 -可-仁/治二也0 H(相對剩余)正由于信源存在看冗余度,即存在看不必要傳送的信 息,因此信源也就存在進(jìn)一步壓縮信息率的可能性。 冗余度越大,壓縮潛力也就越大??梢娝切旁淳幋a, 數(shù)據(jù)壓縮的前提與理論基礎(chǔ)。下面,以英文為例,計(jì)算文字信源的冗余度: 首先給出英文字母(含空檔)出現(xiàn)概率如下:字母p字母p字母p空檔0.2S0.0502
6、Y.W0.012E0.105H0.047G0.011T0.072D0.035B0.0105O0.0654L0.029V0.008A0.063C0.023K0.003N0.059F.U0.0225X0.002I0.055M0.021J.Q0.001R0.054P0.0175Z0.001卜面,首先求得獨(dú)立等概率情況Ho,即H o= log 2 27 = 4.76b i t其次,計(jì)算獨(dú)立不等概率情況Hi,27H -' pi log p 4.03b i t再次,若僅考慮字母有一維相關(guān)性,求H 2,H = 3.32b i t2 ?還可進(jìn)一步求出:H 2二3.1bit ,最后,利用統(tǒng)計(jì)推斷方法求出H-,由于采用的逼近的方法和所取的樣本的不同,推算值也有不同,這里采 用Shannon的推斷值。H 二三 1.4bit這樣,可以計(jì)算出 =0.29 ,R = 0.71。這一結(jié)論說明,英文信源,從理論上看 71%是多余成 分。直觀地說100頁英文書,理論上看僅有29頁是有 效的,其余71頁是多余的。正是由于這一多余量的存 在,才有可能對英文信源進(jìn)行壓縮編碼。對于其它文字,也有不少人作了大量的統(tǒng)計(jì)工作, 現(xiàn)簡述如下:H。H2Hs英文4.7法文4.74.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年分銷商分潤協(xié)議范例
- 2025年分銷合同的法律適用
- 2025版幼兒托管班信息化管理及數(shù)據(jù)共享協(xié)議3篇
- 二零二五年度林地征用補(bǔ)償協(xié)議6篇
- 2025年度個人創(chuàng)業(yè)項(xiàng)目投資融資協(xié)議4篇
- 臨時(shí)雇傭勞務(wù)合作合同(2024年版)版B版
- 2025年信息技術(shù)服務(wù)承諾合同范本2篇
- 二零二五年度簡易版起重機(jī)租賃及設(shè)備租賃合同解除協(xié)議
- 二零二五年度2025年食堂廚師食品安全知識與聘用協(xié)議
- 二零二五年度診所掛證負(fù)責(zé)人免責(zé)及醫(yī)療責(zé)任承擔(dān)合同
- 2024年國家工作人員學(xué)法用法考試題庫及參考答案
- 國家公務(wù)員考試(面試)試題及解答參考(2024年)
- 《阻燃材料與技術(shù)》課件 第6講 阻燃纖維及織物
- 人教版五年級上冊遞等式計(jì)算100道及答案
- 2024年新課標(biāo)全國Ⅰ卷語文高考真題試卷(含答案)
- 湖南省退休人員節(jié)日慰問政策
- 中國的世界遺產(chǎn)知到章節(jié)答案智慧樹2023年遼寧科技大學(xué)
- 道路通行能力手冊第4章-高速公路基本路段
- 傳感器與測試技術(shù)試卷及答案
- 2020年普通高等學(xué)校招生全國統(tǒng)一數(shù)學(xué)考試大綱
- GB/T 679-2002化學(xué)試劑乙醇(95%)
評論
0/150
提交評論