現(xiàn)代通信理論第二章_第1頁
現(xiàn)代通信理論第二章_第2頁
現(xiàn)代通信理論第二章_第3頁
現(xiàn)代通信理論第二章_第4頁
現(xiàn)代通信理論第二章_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

現(xiàn)代通信理論第二章第一頁,共一百零三頁,編輯于2023年,星期三

§2.1引言-關于信源編碼數字通信系統(tǒng)因具有許多優(yōu)點而成為當今通信的發(fā)展方向。在數字通信系統(tǒng)中,信道傳輸的是數字信號。但是在自然界中,很多信源輸出的是模擬量,如話音、圖像等。因此在利用數字通信系統(tǒng)進行信息傳輸時,首先需先對信號(模擬的)數字化,即A/D。模擬信號的數字化屬于信源編碼的范疇。第二頁,共一百零三頁,編輯于2023年,星期三數字通信中的編碼概念編碼和譯碼是數字通信發(fā)送與接收設備的重要組成部分。第三頁,共一百零三頁,編輯于2023年,星期三數字通信中的編碼概念(續(xù))數字通信系統(tǒng)中包含編碼和譯碼,編碼的逆過程是譯碼。數字通信中的編碼涉及兩部分,含義完全不同:信源編碼信道編碼第四頁,共一百零三頁,編輯于2023年,星期三信源編碼的作用作用之一是設法減少碼元數目和降低碼元速率,即通常所說的數據壓縮。碼元速率將直接影響傳輸所占的帶寬,而傳輸帶寬又直接反映了通信的有效性。我們所熟悉的典型的壓縮:音頻壓縮MP3

圖像壓縮JPEG、MPEG等

作用之二是當信息源給出的是模擬信號時,信源編碼器將其轉換成數字信號,以實現(xiàn)模擬信號的數字化傳輸。模擬信號數字化傳輸的方式有脈沖編碼調制(PCM)和增量調制(ΔM)、ADPCM等。作用之三是加密第五頁,共一百零三頁,編輯于2023年,星期三信道編碼信道編碼是為了降低誤碼率,提高數字通信的可靠性而采取的編碼。信道編碼技術的基本思想是通過對信息序列作某種變換,使原來彼此獨立,相關性極小的信息碼元產生某種相關性,從而在接收端利用這種規(guī)律檢查或糾正信息碼元在信道傳輸中所造成的差錯。具體做法是信道編碼器對傳輸的信息碼元按一定的規(guī)則加入保護成分(監(jiān)督元),組成所謂“抗干擾編碼”。接收端的信道譯碼器按一定規(guī)則進行解碼,從解碼過程中發(fā)現(xiàn)錯誤或糾正錯誤,從而提高通信系統(tǒng)抗干擾能力,實現(xiàn)可靠通信。與信源編碼相反,信道編碼提高了可靠性。第六頁,共一百零三頁,編輯于2023年,星期三本章涉及內容語音信號的編碼問題-重點討論語音編碼的基本方法,包括波形編碼(脈沖編碼調制(PCM),對增量調制(ΔM)、自適應差分脈碼調制(ADPCM)、參數編碼(線性預測LP)、混合編碼(碼激勵線性預測CELP等。圖像信號的編碼問題-壓縮編碼,如靜態(tài)圖像壓縮方法JPEG、動態(tài)圖像壓縮方法MPEG等。第七頁,共一百零三頁,編輯于2023年,星期三§2.2音頻信號編碼語音編碼概述時域波形編碼變換域編碼參數編碼混合編碼各種音頻信號編碼方法的比較現(xiàn)代語音處理技術及應用第八頁,共一百零三頁,編輯于2023年,星期三語音編碼概述

語音是人類進行交流的重要手段,通信系統(tǒng)中最常見的數據形式就是語音。語音通信是人類通信最基本、最重要的方式之一。隨著移動通信與互聯(lián)網的飛速發(fā)展,語音通信技術也在不斷地進行更新并與之相融合。語音信號的數字化傳輸和存儲,在可靠性、抗干擾語音信號的數字化傳輸和存儲,在可靠性、抗干擾能力、快速交換等方面遠勝于模擬化,且靈活方便,易于保密,價格低廉,所以從20世紀50年代以來,數字化語音在通信系統(tǒng)中所占的比重越來越大。語音編碼是數字語音通信中的一項重要技術。為了壓縮數字語音傳輸的比特率,以使同樣的信道容量能傳輸更多路的語音信號,節(jié)省存儲空間,語音壓縮編碼也有了很大的發(fā)展,并在有線/無線電話的話帶語音信號、會議電視的寬帶語音信號、HDTV和高保真音樂等的音頻信號等領域有廣泛的應用。第九頁,共一百零三頁,編輯于2023年,星期三語音編碼算法語音編碼大致分為四種方式:時域波形編碼-不基于聲學模型.只針對語音波形進行編碼變換域編碼-不基于聲學模型的編碼方法參數編碼-參數編碼是基于聲學模型的編碼方法混合編碼-結合上述幾種編碼方式的優(yōu)點有時也將時域的波形編碼和變換域編碼統(tǒng)稱波形編碼,因此也可以稱語音編解碼算法分為波形編碼、參數編碼(聲碼器)和混合編碼三類。第十頁,共一百零三頁,編輯于2023年,星期三§2.2.1時域波形編碼時域波形編碼不基于聲學模型.只針對語音波形進行編碼。這種方法在降低量化每個語音樣本比特數的同時,又保持了相對良好的語音質量。波形編碼主要有脈沖編碼調制(PCM)、增量調制(ΔM)、自適應增量調制(ADM)、自適應差分脈碼調制(ADPCM)等。第十一頁,共一百零三頁,編輯于2023年,星期三一、采用PCM的模擬信號數字傳輸系統(tǒng)m(t)模擬隨機信號mo(t)模擬隨機信號{ak}數字隨機序列{a’k}數字隨機序列模擬信息源受信者數字傳輸系統(tǒng)抽樣、量化和編碼譯碼和低通濾波第十二頁,共一百零三頁,編輯于2023年,星期三PCM數字化的過程一般分三步:抽樣量化編碼m(t){ak}“抽樣”指抽取樣值,或抽取樣點,抽樣的多少對通信的性能指標有決定影響。抽樣的多少即快慢由抽樣定理規(guī)定。復習或回憶抽樣定理-低通抽樣定理頻率受限于(0,fH)的時間連續(xù)信號m(t),其抽樣頻率fs≥2fH、抽樣間隔Ts≤1/2fH第十三頁,共一百零三頁,編輯于2023年,星期三抽樣應用實例:1)對于電話質量的語音信號2)聲卡8kHz為電話質量11kHz為AM廣播質量22kHz為FM廣播質量44kHz為激光視盤(CD)質量第十四頁,共一百零三頁,編輯于2023年,星期三帶通抽樣定理頻率受限于(fL,fH)的時間連續(xù)信號m(t),其最小抽樣頻率滿足:第十五頁,共一百零三頁,編輯于2023年,星期三抽樣小結抽樣以后連續(xù)時間信號m(t)變成了時間離散的脈沖,脈沖幅度隨m(t)連續(xù)變化,本質上仍為模擬信號。要完成數字化,需要進一步的處理。第十六頁,共一百零三頁,編輯于2023年,星期三第二步:模擬信號的量化(一)、概念:

1.量化定義:用預先規(guī)定的有限個電平來表示模擬抽樣值的過程,如后圖。*注意這里的量化指標量量化-數與后面要講的矢量量化不同。第十七頁,共一百零三頁,編輯于2023年,星期三量化過程示意圖信號的實際值信號的量化值量化誤差q7m6q6m5q5m4q4m3q3m2q2m1q1Ts2Ts3Ts4Ts5Ts6Ts7Tsmq(t)m(t)mq(6Ts)m(6Ts)t量化器{m(kTs)}{mq(kTs)}第十八頁,共一百零三頁,編輯于2023年,星期三3.量化電平

q1,q2………qM為量化電平指量化器可能的輸出電平,M為量化電平數,4.量化間隔V=mi-mi-1m(kTs)——為抽樣值2.量化信號mq(t),為m

(t)的近似值第十九頁,共一百零三頁,編輯于2023年,星期三5.量化誤差只能減?。炕娖絺€數多一點),無法消除,也稱量化噪聲,大小由量化電平個數及量化方法決定。6.量化信噪比量化信噪比是量化器的主要性能指標之一。第二十頁,共一百零三頁,編輯于2023年,星期三量化方法:均勻量化有不足之處A律13折線近似方法:先對x軸上的輸入信號歸一化取值范圍,按1/2遞減規(guī)律分為8段,分段點依次為1/2、1/4、1/8、1/16、1/32、1/64、1/128,再把y軸上輸出的歸一化取值范圍均勻地分成8段,即每段長為1/8,然后把x軸和y軸的相應分段線的交點連接起來,共得到8段斜線。負向8段斜線按同樣方法得到。每一段再均勻分為16個量化級采用非均勻量化-折線近似法第二十一頁,共一百零三頁,編輯于2023年,星期三A律13折線

第二十二頁,共一百零三頁,編輯于2023年,星期三第三步:編碼量化完成了幅度的離散,但直接傳輸時,電平數多,判決困難,故需要將量化電平用代碼表示。(一)、概念:1.編碼:把量化后的信號變換成代碼的過程。2.譯碼:由代碼重建量化信號的過程。第二十三頁,共一百零三頁,編輯于2023年,星期三(二)編碼實現(xiàn):

1、碼型選擇:自然二進制碼折疊二進制碼小信號時折疊二進制碼誤差小自然碼誤差大大信號時自然碼誤差小折疊二進制碼誤差大樣值脈沖極性格雷二進制自然二進碼折疊二進碼量化級序號正極性部分10001001101110101110111111011100111111101101110010111010100110001111111011011100101110101001100015141312111098負極性部分01000101011101100010001100010000011101100101010000110010000100000000000100100011010001010110011176543210第二十四頁,共一百零三頁,編輯于2023年,星期三2.碼位安排極性碼段落碼段內碼C1C2C3C4C5C6C7C8>0,“1”<0,“0”段落序號段落碼C2c3c4876543211

11110101100011010001000電平序號段內碼電平序號段內碼c5c6c7c8c5c6c7c815141312111098111111101101110010111010100110007654321001110110011001010011001000010000第二十五頁,共一百零三頁,編輯于2023年,星期三(三)編碼方法——逐次比較法原理圖:第二十六頁,共一百零三頁,編輯于2023年,星期三PCM碼流速率計算:第二十七頁,共一百零三頁,編輯于2023年,星期三PCM系統(tǒng)的抗噪性能第二十八頁,共一百零三頁,編輯于2023年,星期三3)總信噪比:第二十九頁,共一百零三頁,編輯于2023年,星期三二、自適應差分脈沖編碼調制(ADPCM)64kb/s的A律或μ律的對數壓擴PCM編碼已經在大容量的光纖通信系統(tǒng)和數字微波系統(tǒng)中得到了廣泛的應用。但PCM信號占用頻帶要比模擬通信系統(tǒng)中的一個標準話路帶寬(3.1kHz)寬很多倍,這樣,對于大容量的長途傳輸系統(tǒng),采用PCM的經濟性能很難與模擬通信相比。

以較低的速率獲得高質量編碼,一直是語音編碼追求的目標。通常,人們把話路速率低于64kb/s的語音編碼方法,稱為語音壓縮編碼技術。第三十頁,共一百零三頁,編輯于2023年,星期三語音壓縮編碼方法很多,其中,自適應差分脈沖編碼調制是語音壓縮中復雜度較低的一種編碼方法,它可在32kb/s的比特率上達到64kb/s的PCM數字電話質量。近年來,ADPCM已成為長途傳輸中一種新型的國際通用的語音編碼方法(G.721)。ADPCMADPCM是在差分脈沖編碼調制(DPCM)的基礎上發(fā)展起來的,為此,下面先介紹DPCM的編碼原理與系統(tǒng)框圖。第三十一頁,共一百零三頁,編輯于2023年,星期三由于相鄰樣值的差值比樣值本身小,可以用較少的比特數表示差值。這樣,用樣點之間差值的編碼來代替樣值本身的編碼,可以在量化臺階不變的情況下(即量化噪聲不變),編碼位數顯著減少,信號帶寬大大壓縮。這種利用差值的PCM編碼稱為差分PCM(DPCM)。在PCM中,每個波形樣值都獨立編碼,與其他樣值無關,這樣,樣值的整個幅值編碼需要較多位數,比特率較高,造成數字化的信號帶寬大大增加。然而,大多數以奈奎斯特或更高速率抽樣的信源信號在相鄰抽樣間表現(xiàn)出很強的相關性,有很大的冗余度。利用信源的這種相關性,一種比較簡單的解決方法是對相鄰樣值的差值而不是樣值本身進行編碼。1、DPCM如果將樣值之差仍用N位編碼傳送,則DPCM的量化信噪比顯然優(yōu)于PCM系統(tǒng)。實現(xiàn)差分編碼的一個好辦法是根據前面的k個樣值預測當前時刻的樣值。編碼信號只是當前樣值與預測值之間的差值的量化編碼。第三十二頁,共一百零三頁,編輯于2023年,星期三DPCM系統(tǒng)原理框圖第三十三頁,共一百零三頁,編輯于2023年,星期三式中,(S/N)q是把差值序列作為信號時量化器的量化信噪比,與PCM系統(tǒng)考慮量化誤差時所計算的信噪比相當。Gp可理解為DPCM系統(tǒng)相對于PCM系統(tǒng)而言的信噪比增益,稱為預測增益。如果能夠選擇合理的預測規(guī)律,差值功率E[e2n]就能遠小于信號功率E[x2n],Gp就會大于1,該系統(tǒng)就能獲得增益。對DPCM系統(tǒng)的研究就是圍繞著如何使Gp和(S/N)q這兩個參數取最大值而逐步完善起來的。通常Gp約為6~11dB。因此DPCM系統(tǒng)總的量化信噪比可表示為第三十四頁,共一百零三頁,編輯于2023年,星期三可見,DPCM系統(tǒng)總的量化信噪比遠大于量化器的信噪比。因此,要求DPCM系統(tǒng)達到與PCM系統(tǒng)相同的信噪比,則可降低對量化器信噪比的要求,即可減小量化級數,從而減少碼位數,降低比特率。第三十五頁,共一百零三頁,編輯于2023年,星期三2、ADPCM值得注意的是,DPCM系統(tǒng)性能的改善是以最佳的預測和量化為前提的。但對語音信號進行預測和量化是復雜的技術問題,這是因為語音信號在較大的動態(tài)范圍內變化。為了能在相當寬的變化范圍內獲得最佳的性能,只有在DPCM基礎上引入自適應系統(tǒng)。有自適應系統(tǒng)的DPCM稱為自適應差分脈沖編碼調制,簡稱ADPCM。第三十六頁,共一百零三頁,編輯于2023年,星期三

ADPCM的主要特點是用自適應量化取代固定量化,用自適應預測取代固定預測。自適應量化指量化臺階隨信號的變化而變化,使量化誤差減??;自適應預測指預測器系數可以隨信號的統(tǒng)計特性而自適應調整,提高了預測信號的精度,從而得到高預測增益。通過這兩點改進,可大大提高輸出信噪比和編碼動態(tài)范圍。如果DPCM的預測增益為6~11dB,自適應預測可使信噪比改善4dB;自適應量化可使信噪比改善4~7dB,則ADPCM比PCM可改善14~22dB,相當于編碼位數可以減小3位到4位。因此,在維持相同的語音質量下,ADPCM允許用32kb/s比特率編碼,這是標準64kb/sPCM的一半。因此,在長途傳輸系統(tǒng)中,ADPCM有著遠大的前景。相應地,CCITT也形成了關于ADPCM系統(tǒng)的規(guī)范建議G.721、G.726等。ADPCM(續(xù))第三十七頁,共一百零三頁,編輯于2023年,星期三三、增量調制(ΔM或DM)1、與PCM區(qū)別

PCM碼表示樣值大小,N位碼,ΔM代碼表示相鄰樣值的關系,一位碼,是DPCM的特例。2、ΔM基本原理(1).編碼第三十八頁,共一百零三頁,編輯于2023年,星期三ΔM波形示意e(ti)=m(ti-)-m’(ti-)>0e(ti)=m(ti-)-m’(ti-)<0輸出1,上升一個臺階s輸出0,下降一個臺階s

第三十九頁,共一百零三頁,編輯于2023年,星期三波形編碼小結PCM、ΔM、ADPCM是基于時域的波形編碼技術,不基于聲學模型。波形編碼器作用于所有輸入信號,因此會產生高質量的樣值。然而,波形編碼器工作在高比特率。例如:ITU-G.711規(guī)范(PCM)用的比特率為64kbps。**引出其它編碼,目的是降低比特率,提高有效性。第四十頁,共一百零三頁,編輯于2023年,星期三§2.2.2

變換域編碼-頻域編碼變換域編碼方式也是不基于聲學模型的編碼方法,但對信號進行頻域處理,再編碼。典型的變換域編碼有子帶編碼(SBC)第四十一頁,共一百零三頁,編輯于2023年,星期三子帶編碼(sub—bandcoding,SBC)SBC利用帶通濾波器將語音頻帶分成若干子帶,并且分別進行采樣、編碼,編碼方式可以用ADPCM或ADM,SBC速率可以達到9.6kb/s。可變SBC可使子帶的設計不固定,而是隨共振峰變化,使編碼效率進一步提高,這種方式在碼率為4.8kb/s時可具有相當于7.2kb/s的固定SBC的語音質量。第四十二頁,共一百零三頁,編輯于2023年,星期三SBC原理框圖(a)編碼器

(b)解碼器

第四十三頁,共一百零三頁,編輯于2023年,星期三子帶編碼應用1976年子帶編碼技術首次被美國貝爾實驗室的R.E.Crochiere等人應用于語音編碼。子帶編碼器SBC愈來愈受到重視。在中等速率的編碼系統(tǒng)中,SBC的動態(tài)范圍寬、音質高、成本低。使用子帶編碼技術的編譯碼器已開始用于話音存儲轉發(fā)(voicestore-and-forward)和話音郵件,采用2個子帶和ADPCM的編碼系統(tǒng)也已由CCITT作為G.722標準向全世界推薦使用。1986年Woods等將子帶編碼又引入到圖像編碼,此后子帶編碼在視頻信號壓縮領域得到了很大發(fā)展。目前,已經研制出采用子帶編碼技術的具有演播室質量的140MbpsHDTV硬件編解碼系統(tǒng)。第四十四頁,共一百零三頁,編輯于2023年,星期三§2.2.3

參數編碼(參量編碼)

與波形編碼不同,參量編碼又稱為聲源編碼(聲碼器),是將信源信號提取特征參量,并將其變換成數字代碼進行傳輸。解碼為其反過程,將收到的數字序列經變換恢復特征參量,再根據特征參量重建語音信號。具體說,參量編碼是通過對語音信號特征參數的提取和編碼,力圖使重建語音信號具有盡可能高的可靠性,即保持原語音的語意,但重建信號的波形同原語音信號的波形可能會有相當大的差別。這種編碼技術可實現(xiàn)低速率語音編碼,比特率可壓縮到2Kbit/s-4.8Kbit/s,甚至更低,但語音質量只能達到中等,特別是自然度較低,連熟人都不一定能聽出講話人是誰。線性預測編碼(LPC)及其它各種改進型都屬于參量編碼。

第四十五頁,共一百零三頁,編輯于2023年,星期三聲碼器聲碼器(vocoder)不會再生原始波形。這組編碼器會提取一組參數,這組參數被送到接收端,用來導出語音產生模形。第四十六頁,共一百零三頁,編輯于2023年,星期三聲碼器質量在電話系統(tǒng)中使用聲碼器,語音質量不夠好。

第四十七頁,共一百零三頁,編輯于2023年,星期三對于語音數據,人們已經找到了較合理的聲道模型,聲音數據的參數編碼方法就是基于聲音參數的分析與合成來實現(xiàn)的。聲道模型在聲音合成等領域也有成功應用。統(tǒng)計表明,語音過程是一個近似的短時隨機過程。所謂短時,是指在10-30ms的范圍。由于這一性質,使一幀一幀地處理語音信號成為可能,每一幀的信號近似滿足同一模型,提取模型參數即可再現(xiàn)信號。這是方法假設的基本前提。實際應用中,每幀取20ms。語音參數編碼原理

第四十八頁,共一百零三頁,編輯于2023年,星期三語音生成機構模型:①聲源。聲源分三類:元音:由聲帶的自激振動所產生;摩擦音:靠聲道變窄時氣流所產生的喘流噪聲產生;爆破音:由閉合的聲道急速打開時形成的脈沖波所產生的喘流噪聲所產生。模型中用基音周期參數描述聲源。②共鳴機構,也稱聲道。由鼻腔、口腔與舌頭組成。模型中用共振峰參數描述。③放射機構:由嘴唇和鼻孔組成,其功能是發(fā)出聲音并傳播出去。模型中用語音譜和聲強參數描述。常用語音參數

-基音周期、共振峰、語音譜、聲強等。第四十九頁,共一百零三頁,編輯于2023年,星期三①分幀:聲音變?yōu)閹蛄衒1,f2,…。②計算每一幀fi的參數向量(基音周期,共振峰,語音譜,聲強)i。

③直接傳送參數向量或對參數向量進行矢量量化。語音參數編碼過程:

第五十頁,共一百零三頁,編輯于2023年,星期三LPC線性預測編碼(LPC)用來獲取一時變數字濾波器的參數。這個濾波器用來模擬說話人的聲道輸出。

由圖一中所示,聲音的產生被模擬成聲源和聲道兩個部分構成。聲源為噪聲和脈沖兩種,聲道相當于一個濾波器,氣管口腔形狀不同相當于聲道濾波器的參數不同,最后就生成不同聲音。

第五十一頁,共一百零三頁,編輯于2023年,星期三參數編碼小結參數編碼數據量小,但計算量很大。由于聲音從發(fā)聲模型出發(fā),不是從波形出發(fā)仿真,保真難度大,目前的保真度還很差。例如,某人說了一句話,分析出參數再由參數合成的聲音,能聽出這段話的字句就合格了,聽起來不是機器語言,即自然度好一些已相當不錯了,要能聽出誰在說話就不容易。由于壓縮比高,成本低,很多低檔的學習機就是采用了這種語音壓縮方式,出來的聲音生硬、含混不清、毫無語感,對英語的語音學習不但毫無幫助,而且會誤導正確的語音學習。第五十二頁,共一百零三頁,編輯于2023年,星期三§2.2.4混合型編碼

混合編碼則是在波形編碼和參數編碼的基礎上,以相對較低的比特率上獲得較高的語音質量,所以其數據率和音質介于二者之間。

當波形編碼的比特率每聲道低于16kbps后,音質下降很快。而參數法由于機理本身就是一種模擬,比特率上升到10kbps以上后再上升音質也沒有多少改善。所以,兩者結合的混合編碼法就被消費類電子公司開發(fā)出來。

第五十三頁,共一百零三頁,編輯于2023年,星期三發(fā)展與應用計算機的發(fā)展為語音編碼技術的研究提供了強有力的工具,大規(guī)模、超大規(guī)模集成電路的出現(xiàn),則為語音編碼的實現(xiàn)提供了基礎。80年代以來,語音編碼技術有了實質性的進展,產生了新一代的編碼算法,這就是混合編碼。它將波形編碼的高質量和參量編碼的低數據速率組合起來,克服了原有波形編碼和參量編碼的弱點,結合各自的長處,力圖保持波形編碼的高質量和參量編碼的低速率,在4-16Kbit/s速率上能夠得到高質量的合成語音。目前較為成功的混合型編碼方案有多脈沖激勵線性預測編碼(MPLPC)和碼激勵線性預測編碼(CELP)。很顯然,混合編碼是適合于數字移動通信的語音編碼技術。

第五十四頁,共一百零三頁,編輯于2023年,星期三LDCELP低時延碼激勵線性預測編碼是LowDelay-CodeExcitedLinearPrediction的縮寫。16kbit/sLDCELP是CCITTG.728語音編碼標準算法,這種法在CELP算法的基礎上,采用后向自適應線性預測、50階合成濾波、短激勵矢量(5個樣值)等改進方法,從而達到高質量和低時延的目的,總的編碼時延小于2ms。第五十五頁,共一百零三頁,編輯于2023年,星期三RPE/LTP規(guī)則脈沖激勵—長時預測—線性預測編碼是RegularPulseExcited-LongTermPredition-LinearPredictiveCoding的縮寫。這種算法是MPE-LPC的改進算法,除了增加長時預測功能外,激勵脈沖的位置具有一定的規(guī)律。這種算法是歐洲900MHz數字蜂窩移動電話的語音編碼標準(GSM),也為數字蜂窩系統(tǒng)DCS1800所采用。

MPE-LPC(多脈沖線性預測編碼)

多脈沖線性預測編碼是Multi-PulseExcitedLPC的縮寫。這種算法在一幀語音中選擇幾十個典型脈沖作為激勵信號。INMARSAT的9.6kbit/s語音編碼航空標準采用這種算法。第五十六頁,共一百零三頁,編輯于2023年,星期三VSELPVSELP(矢量和激勵線性預測編碼)

矢量和激勵線性預測編碼是VectorSumExcitedLinearPrediction的縮寫。這種算法采用三個碼本作為激勵信號,其中兩個是隨機碼本,一個是自適應碼本,最終的激勵信號是三個激勵矢量的和。美國電信工業(yè)協(xié)會(TIA)選擇8kbit/sVSELP算法作為北美第一代數字蜂窩移動電話的編碼標準(IS54)。日本的全速率數字移動電話也采用VSELP算法作為語音編碼標準(JDC),速率為6.7kbit/s。第五十七頁,共一百零三頁,編輯于2023年,星期三§2.2.5各種音頻信號編碼方法的比較編碼方法傳輸速率(kb/s)最小基帶帶寬(kHz)質量PCMADPCMSBC+ADPCM△MSBC(子帶)RPE/LTP(規(guī)則脈沖激勵)LD-CELP(低延遲碼激勵)MPE/LPC(多脈沖)CELP(碼本激勵)LPC(線性預測)LPC+VQ(矢量量化)6432643216161684.82.41.23216321688842.41.20.6長途電話質量長途電話質量廣播質量通信質量通信質量通信質量接近長途質量通信質量通信質量合成質量合成質量第五十八頁,共一百零三頁,編輯于2023年,星期三電話質量的音頻(0.3--3.4K

kHz

)G728,LD-CELP16kb/s,GSM,RPE/LTP,13kb/s,(歐洲移動)GTIA,VSELP,8kb/s(美國移動)NSA,CELP,4.8kb/sNSA,LPC,2.4kb/s第五十九頁,共一百零三頁,編輯于2023年,星期三調幅廣播質量的音頻50Hz-7kHz

采樣率16KHz

,14bit量化,PCM碼率224Kb/s,采用G.722(子帶)標準可壓縮到64Kb/s,適于ISDN的B信道,傳輸高質量語音。第六十頁,共一百零三頁,編輯于2023年,星期三高保真立體聲音頻壓縮標準即CD音質音頻20Hz--20KHz采樣率44.1kHz,,16位量化,立體聲數據量為

44.1*16b*2=1411.2kb/s=176.4KB/s1小時為

176.4KB/s*3600s=635MB

目前,采用MPEG音頻標準,有三層(第三層MP3),采用子帶及熵編碼技術,可壓縮到每聲道32kb/s-448kb/s第六十一頁,共一百零三頁,編輯于2023年,星期三MP3及其基本原理

MP3就是采用國際標準MPEG中的第三層音頻壓縮模式,對聲音信號進行壓縮的一種格式,中文也稱"電腦網絡音樂"。MPEG中的第三層音頻壓縮模式比第一層和第二層編碼要復雜得多,但音質最高,可與CD音質相比。第六十二頁,共一百零三頁,編輯于2023年,星期三多媒體視聽業(yè)務音頻

ITU關于電視電話系統(tǒng)和終端設備的技術標準針H.320用于ISDN網,不適合窄帶電話網,而H.324既適合高速數字網,也適合在普通電話之類的窄帶網上使用,H.323標準用于質量不能保證的局域網LAN在H.320中,語音編碼標準為G.711(64kb/s

)、G.722(64kb/s

)、G.728(16kb/s

),H.324分配給語音帶寬6.5kb/s

(高——采用MP-MLQCELP)和5.3K(低——采用ACELP),采用的語音壓縮標準為G.723H.323系統(tǒng)語音壓縮方法有6種,即G.711(64kb/s

)、G.722(64kb/s

)、G.728(16kb/s

)、G.723、G.729、MPEGAUDIO

第六十三頁,共一百零三頁,編輯于2023年,星期三§2.2.6現(xiàn)代語音處理技術及應用第六十四頁,共一百零三頁,編輯于2023年,星期三§2.3圖像信號的壓縮圖像信號壓縮的必要性圖像信號壓縮基礎圖像壓縮編碼方法圖像壓縮編碼標準第六十五頁,共一百零三頁,編輯于2023年,星期三§2.3.1圖像信號壓縮的必要性與文字信息不同,圖像信息占據大量的存儲容量,而且傳輸的帶寬有限例1:一張A4(210mm×297mm)大小的照片,若用中等分辨率(300dpi)的掃描儀按真彩色掃描,其數據量為多少?(注:dpi表示每英寸像素,1英寸=25.4mm)若按每像素3個字節(jié)計算,上述結果為約26M例2:目前的WWW互聯(lián)網包含大量的圖像信息,如果圖像信息的數據量太大,會使本來就已經非常緊張的網絡帶寬變得更加不堪重負(WorldWideWeb變成了WorldWideWait)第六十六頁,共一百零三頁,編輯于2023年,星期三圖像信號壓縮的必要性(續(xù))視頻數據量:對于電視畫面的分辨率640*480的彩色圖像,每秒30幀,則一秒鐘的數據量為:640*480*24*30=221.12Mbit/s=28MB/s實時傳輸:在10M帶寬網上實時傳輸的話,需要壓縮到原來數據量的0.045存儲:1張CD可存640MB,如果不進行壓縮,1張CD則僅可以存放20幾秒的數據可見,單純依靠增加存儲器容量和改善信道帶寬無法滿足需求,必須進行壓縮第六十七頁,共一百零三頁,編輯于2023年,星期三§2.3.2圖像壓縮編碼基礎 圖像數據的壓縮機理來自兩個方面:一是利用圖像中存在大量冗余度可供壓縮;二是利用人眼的視覺特性。第六十八頁,共一百零三頁,編輯于2023年,星期三(1)空間冗余

在一幅圖像中規(guī)則的物體和規(guī)則的背景具有很強的相關性。

(2)時間冗余

電視圖像序列中相鄰兩幅圖像之間有較大的相關性。(3)結構冗余和知識冗余

圖像從大面積上看常存在有紋理結構,稱之為結構冗余。(4)視覺冗余

人眼的視覺系統(tǒng)對于圖像的感知是非均勻和非線性的,對圖像的變化并不都能察覺出來。1.圖像數據的冗余度第六十九頁,共一百零三頁,編輯于2023年,星期三(1)亮度辨別閾值

當景物的亮度在背景亮度基礎上增加很少時,人眼是辨別不出的,只有當亮度增加到某一數值時,人眼才能感覺其亮度有變化。人眼剛剛能察覺的亮度變化值稱為亮度辨別閾值。2.人眼的視覺特性第七十頁,共一百零三頁,編輯于2023年,星期三(2)視覺閾值 視覺閾值是指干擾或失真剛好可以被察覺的門限值,低于它就察覺不出來,高于它才看得出來,這是一個統(tǒng)計值。(3)空間分辨力 空間分辨力是指對一幅圖像相鄰像素的灰度和細節(jié)的分辨力,視覺對于不同圖像內容的分辨力不同。(4)掩蓋效應

“掩蓋效應”是指人眼對圖像中量化誤差的敏感程度,與圖像信號變化的劇烈程度有關。第七十一頁,共一百零三頁,編輯于2023年,星期三圖像壓縮的可能性與基本思想各種冗余和視覺特性就是壓縮圖象數據的出發(fā)點和依據。圖象編碼的目的就在于采用各種方法去除冗余和不太重要的部分內容,以盡量少的數據量來表示個重建圖象。壓縮編碼技術能夠很好地解決在將模擬信號轉換為數字信號后所產生的帶寬需求增加的問題,

它是使數字信號走上實用化的關鍵技術之一。第七十二頁,共一百零三頁,編輯于2023年,星期三§2.3.3圖像壓縮的方法圖像壓縮方法有很多種,而且很多方法還在不斷地發(fā)展和完善。從不同的角度出發(fā)有不同的分類方法。1.根據解壓重建后的圖像與原始圖像是否有誤差,可分為無損壓縮與有損壓縮兩大類;第七十三頁,共一百零三頁,編輯于2023年,星期三圖像壓縮的方法(續(xù))2.根據實施編碼所在的數據域可分為空間域和變換域編碼第七十四頁,共一百零三頁,編輯于2023年,星期三(1)基于圖像信源統(tǒng)計特性的壓縮方法,有預測編碼、變換編碼、矢量量化編碼、子帶-小波編碼和神經網絡編碼法等。(2)基于人眼視覺特性的壓縮方法,有基于方向濾波的圖像編碼法和基于圖像輪廓-紋理的編碼法等。(3)基于圖像景物特征的壓縮方法,有分形編碼法和基于模型的編碼方法等。3.根據壓縮機理的不同,數據壓縮編碼方法大致可以分成三類第七十五頁,共一百零三頁,編輯于2023年,星期三圖像壓縮的方法圖像壓縮有損壓縮無損壓縮行程編碼LZW編碼哈夫曼編碼算術編碼無損預測編碼位平面編碼有損預測編碼分形編碼模型編碼子帶編碼神經網絡編碼變換編碼K-L變換Haar變換Walsh.Hadamard變換離散余弦變換離散傅立葉變換斜變換小波變換第七十六頁,共一百零三頁,編輯于2023年,星期三衡量一個壓縮編碼方法優(yōu)劣的重要指標

(1)壓縮比要高,有幾倍、幾十倍,也有幾百乃至幾千倍;

(2)壓縮與解壓縮要快,算法要簡單,硬件實現(xiàn)容易;

(3)解壓縮的圖像質量要好。

需要說明的是選用編碼方法時一定要考慮圖像信源本身的統(tǒng)計特征;多媒體系統(tǒng)(硬件和軟件產品)的適應能力;應用環(huán)境以及技術標準。第七十七頁,共一百零三頁,編輯于2023年,星期三幾種典型的圖像壓縮方法原理霍夫曼(Huffman)編碼游程編碼預測編碼變換編碼混合編碼第七十八頁,共一百零三頁,編輯于2023年,星期三

1.霍夫曼(Huffman)編碼霍夫曼(Huffman)編碼是一種可變長編碼,編碼方法如下圖所示。

(1)將輸入信號符號以出現(xiàn)概率由大至小為序排成一列。

(2)將兩處最小概率的符號相加合成為一個新概率,再按出現(xiàn)概率的大小排序。

(3)重復步驟(2),直至最終只剩兩個概率。

(4)編碼從最后一步出發(fā)逐步向前進行,概率大的符號賦予“0”碼,另一個概率賦予“1”碼,直至到達最初的概率排列為止。第七十九頁,共一百零三頁,編輯于2023年,星期三霍夫曼(Huffman)編碼將最常出現(xiàn)(概率大的)的符號用最短的編碼,最少出現(xiàn)的符號用最長的編碼。第八十頁,共一百零三頁,編輯于2023年,星期三游程編碼(RLC,RunLengthCoding)是一種十分簡單的壓縮方法,它將數據流中連續(xù)出現(xiàn)的字符用單一的記號來表示。例如,字符串5310000000000110000000012000000000000可以壓縮為5310-10110-08120-12,其中,“-”后面兩個數字是“-”前面數字的連續(xù)個數。游程編碼的壓縮率不高,但編碼、解碼的速度快,仍被得到廣泛的應用,特別是在變換編碼后再進行游程編碼,有很好的效果。

2.游程編碼第八十一頁,共一百零三頁,編輯于2023年,星期三3.預測編碼(1)預測編碼基本原理 預測編碼是根據某一模型利用過去的樣值對當前樣值進行預測,然后將當前樣值的實際值與預測值相減得到一個誤差值,只對這一預測誤差值進行編碼。

-DPCM第八十二頁,共一百零三頁,編輯于2023年,星期三(2)預測方法1).幀內預測 幀內預測利用圖像信號的空間相關性來壓縮圖像的空間冗余,根據前面已經傳送的同一幀內的像素來預測當前像素。2).幀間預測 電視圖像在相鄰幀之間存在很強的相關性。3.預測編碼(續(xù))第八十三頁,共一百零三頁,編輯于2023年,星期三圖像變換編碼是將空間域里描述的圖像,經過某種變換(如傅立葉變換、離散余弦變換、沃爾什變換等)在變換域中進行描述。這樣可以將圖像能量在空間域的分散分布變?yōu)樵谧儞Q域的相對集中分布,便于用“Z”(zig-zag)字形掃描、自適應量化、變長編碼等進一步處理,完成對圖像信息的有效壓縮。4.變換編碼第八十四頁,共一百零三頁,編輯于2023年,星期三變換編碼將被處理數據按照某種變換規(guī)則映射到另一個域中去處理,圖像編碼采用二維正交變換的方式,若將整個圖像作為一個二維矩陣,變換編碼的計算量太大。所以將一幅圖像分成一個個小圖像塊,通常是8×8或16×16小方塊,每個圖像塊可以看成為一個二維數據矩陣,變換編碼以這些小圖像塊為單位進行,變換編碼把統(tǒng)計上密切相關的像素構成的矩陣通過線性正交變換,變成統(tǒng)計上較為相互獨立,甚至完全獨立的變換系數所構成的矩陣。第八十五頁,共一百零三頁,編輯于2023年,星期三在常用的正交變換中,DCT(DiscreteCosineTransform)變換的性能接近最佳,是一種準最佳變換。DCT變換矩陣與圖像內容無關,是因為它構造成對稱的數據序列,避免了子圖像輪廓處的跳躍和不連續(xù)現(xiàn)象。DCT變換也有快速算法(FDCT),在圖像編碼的應用中,大都采用二維DCT變換。典型的變換編碼方法-離散余弦變換(DCT)

第八十六頁,共一百零三頁,編輯于2023年,星期三圖像塊的DCT變換(a)背景部分圖像塊的DCT;(b)細節(jié)部分圖像塊的DCT第八十七頁,共一百零三頁,編輯于2023年,星期三Z字形掃描第八十八頁,共一百零三頁,編輯于2023年,星期三混合編碼是近年來廣泛采用的方法,這種方法充分利用各種單一壓縮方法的長處,以期在壓縮比和效率之間取得最佳的平衡。如廣泛流行的JPEG和MPEG壓縮方法都是典型的混合編碼方案。

5.混合編碼第八十九頁,共一百零三頁,編輯于2023年,星期三§2.3.4圖像壓縮編碼標準制定圖像標準的國際組織是ISO(國際標準化組織)和CCITT(國際電報電話咨詢委員會)靜止圖像:JPEG(JointPhotographicExpertGroup,聯(lián)合圖像專家組)通常為有損壓縮(采用DCT變換編碼),JPEG是目前靜態(tài)圖像壓縮比最高的,但失真的程度非常小也支持無損壓縮(采用預測編碼),但壓縮比降低(無損壓縮的壓縮比總有個極限)運動圖像:MPEG(MovingPictureExpertGroup,運動圖像專家組)第九十頁,共一百零三頁,編輯于2023年,星期三1.JPEG壓縮流程編碼流程:解碼流程:量化器DCT變換構造8x8的子圖輸入圖像符號編碼器壓縮數據量化表碼表壓縮數據符號解碼器DCT逆變換反量化器量化表輸出圖像碼表(從壓縮數據中得到)第九十一頁,共一百零三頁,編輯于2023年,星期三顏色空間轉換JPEG使用的顏色空間不是RGB空間,而是YCbCr空間,在進行DCT變換之前完成,這是因為人眼對亮度信息更敏感,相互之間的轉換為:R=Y+1.40200(Cr–128)G=Y–0.34414(Cb–128)–0.71414(Cr–128)B=Y+1.77200(Cb–128)Y=0.299R+0.5870G+0.1140BCb=–0.1787R–0.3313G+0.5000B+128Cr=0.5000R–0.4187G–0.0813B+128第九十二頁,共一百零三頁,編輯于2023年,星期三量化Y為亮度分量,需要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論