第二章 PCM編碼詳解_第1頁(yè)
第二章 PCM編碼詳解_第2頁(yè)
第二章 PCM編碼詳解_第3頁(yè)
第二章 PCM編碼詳解_第4頁(yè)
第二章 PCM編碼詳解_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PCM與音頻編碼第3章話音編碼重點(diǎn):脈沖編碼調(diào)制(PCM)增量調(diào)制與自適應(yīng)增量調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)難點(diǎn):非均勻量化增量調(diào)制子帶編碼波形聲音的數(shù)據(jù)壓縮波形聲音的碼率

=取樣頻率

×

量化位數(shù)

×

聲道數(shù)

全頻帶聲音的壓縮編碼:第1代壓縮編碼:PCM編碼第2代壓縮編碼:感知聲音編碼數(shù)字語(yǔ)音的壓縮編碼:波形編碼參數(shù)編碼(模型編碼)混合編碼語(yǔ)音壓縮編碼的3類方法波形編碼

(Perceptionmodel-basedcompression)benefits:genericdrawbacks:highestcompressionratesaredifficulttoachieve>16kb/sExamples:PCM,ADPCM,Subband參數(shù)編碼,源編碼

(Productionmodel-basedcompression)benefits:highestpossiblecompression2.4Kb/sdrawbacks:signalsource(s)mustbeknowExamples:vocoder混合編碼(Hybridcompression)Examples:CELP4.8kb/s——16kb/s極低低中碼率(kb/s)1248163264優(yōu)良中差壞語(yǔ)音質(zhì)量模型編碼(源編碼)混合編碼波形編碼脈沖編碼調(diào)制(PCM)“防失真濾波器”是一個(gè)低通濾波器,用來(lái)濾除聲音頻帶以外的信號(hào);“波形編碼器”可暫時(shí)理解為“采樣器”;“量化器”可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器。PCM編碼框圖聲音數(shù)字化有兩個(gè)步驟:第一步是采樣,就是每隔一段時(shí)間間隔讀一次聲音的幅度;第二步是量化,就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換成數(shù)字值。但那時(shí)并沒(méi)有涉及如何進(jìn)行量化。量化有好幾種方法,但可歸納成兩類:一類稱為均勻量化,另一類稱為非均勻量化。采用的量化方法不同,量化后的數(shù)據(jù)量也就不同。因此,可以說(shuō)量化也是一種壓縮數(shù)據(jù)的方法。均勻量化采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來(lái)度量采樣得到的幅度,也稱為線性量化量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲非均勻量化非線性量化:對(duì)輸入信號(hào)進(jìn)行量化時(shí),大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來(lái)表示。聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則。在非線性量化中,采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系,一種稱為m

律壓擴(kuò)(companding)算法,另一種稱為A律壓擴(kuò)算法。采樣頻率為8kHz,樣本精度為13位、14位或者16位的輸入信號(hào),使用m

律壓擴(kuò)編碼或者使用A律壓擴(kuò)編碼,經(jīng)過(guò)PCM編碼器之后每個(gè)樣本的精度為8位,輸出的數(shù)據(jù)率為64kb/s。這就是CCITT推薦的G.711標(biāo)準(zhǔn)。m

律壓擴(kuò)和A律壓擴(kuò)m

律壓擴(kuò):北美和日本等地區(qū)13位PCM編碼轉(zhuǎn)換城8位。A律壓擴(kuò)歐洲和中國(guó)大陸等地區(qū),14位PCM編碼轉(zhuǎn)換城8位輸出信號(hào)均為64Kb/sPCM在通信中的應(yīng)用提高線路利用率通常用下面兩種方法頻分多路復(fù)用

:把傳輸信道的頻帶分成好幾個(gè)窄帶,每個(gè)窄帶傳送一路信號(hào)。例如,一個(gè)信道的頻帶為1400Hz,把這個(gè)信道分成4個(gè)子信道(subchannels):820~990Hz,1230~1400Hz,1640~1810Hz和2050~2220Hz,相鄰子信道間相距240Hz,用于確保子信道之間不相互干擾。每對(duì)用戶僅占用其中的一個(gè)子信道。這是模擬載波通信的主要手段。時(shí)分多路復(fù)用:把傳輸信道按時(shí)間來(lái)分割,為每個(gè)用戶指定一個(gè)時(shí)間間隔,每個(gè)間隔里傳輸信號(hào)的一部分,這樣就可以使許多用戶同時(shí)使用一條傳輸線路。這是數(shù)字通信的主要手段。例如,話音信號(hào)的采樣頻率f=8000Hz,它的采樣周期=125ms,這個(gè)時(shí)間稱為1幀(frame)。在這個(gè)時(shí)間里可容納的話路數(shù)有兩種規(guī)格:24路制和30路制。PCM在通信中的應(yīng)用PCM在通信中的應(yīng)用24路制的重要參數(shù)如下:每秒鐘傳送8000幀,每幀125ms。12幀組成1復(fù)幀(用于同步)。每幀由24個(gè)時(shí)間片(信道)和1位同步位組成。每個(gè)信道每次傳送8位代碼,1幀有24×8+1=193位(位)。數(shù)據(jù)傳輸率R=8000×193=1544kb/s。每一個(gè)話路的數(shù)據(jù)傳輸率=8000×8=64kb/s。30路制的重要參數(shù)如下:每秒鐘傳送8000幀,每幀125ms。16幀組成1復(fù)幀(用于同步)。每幀由32個(gè)時(shí)間片(信道)組成。每個(gè)信道每次傳送8位代碼。數(shù)據(jù)傳輸率:R=8000×32×8=2048kb/s。每一個(gè)話路的數(shù)據(jù)傳輸率=8000×8=64kb/s。PCM在通信中的應(yīng)用PCM信號(hào)復(fù)用的復(fù)雜程度,通常用“群(group)”表示一次群(基群)的30路(或24路),北美叫做T1遠(yuǎn)距離數(shù)字通信線,在歐洲叫做E1遠(yuǎn)距離數(shù)字通信線和E1等級(jí)。二次群的120路(或96路)三次群的480路(或384路)數(shù)字網(wǎng)絡(luò)等級(jí)T1/E1T2/E2T3/E3T4/E4T5/E5美國(guó)64kb/s話路數(shù)24966724.32總傳輸率(Mb/s)1.5446.51244.736274.176數(shù)字網(wǎng)絡(luò)等級(jí)12345歐洲64kb/s話路數(shù)3012048019207680總傳輸率(Mb/s)2.0488.44834.368139.2645600日本64kb/s話路數(shù)24964801440總傳輸率(Mb/s)1.5446.31232.06497.728表3-02多次復(fù)用的數(shù)據(jù)傳輸率增量調(diào)制與自適應(yīng)增量調(diào)制增量調(diào)制(DM)增量調(diào)制也稱△調(diào)制(deltamodulation,DM),它是一種預(yù)測(cè)編碼技術(shù),是PCM編碼的一種變形。PCM是對(duì)每個(gè)采樣信號(hào)的整個(gè)幅度進(jìn)行量化編碼,因此它具有對(duì)任意波形進(jìn)行編碼的能力;DM是對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼,將極性變成“0”和“1”這兩種可能的取值之一。如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性為“正”,則用“1”表示;相反則用“0”表示,或者相反。由于DM編碼只須用1位對(duì)話音信號(hào)進(jìn)行編碼,所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。增量調(diào)制(DM)在輸入信號(hào)變化快的區(qū)域,斜率過(guò)載是關(guān)心的焦點(diǎn),而在輸入信號(hào)變化慢的區(qū)域,關(guān)心的焦點(diǎn)是粒狀噪聲。為了盡可能避免出現(xiàn)斜率過(guò)載,就要加大量化階Δ,但這樣做又會(huì)加大粒狀噪聲;相反,如果要減小粒狀噪聲,就要減小量化階Δ,這又會(huì)使斜率過(guò)載更加嚴(yán)重。這就促進(jìn)了對(duì)自適應(yīng)增量調(diào)制(adaptivedeltamodulation,ADM)的研究自適應(yīng)增量調(diào)制(ADM)基本方法:在檢測(cè)到斜率過(guò)載時(shí)開(kāi)始增大量化階Δ,而在輸入信號(hào)的斜率減小時(shí)降低量化階Δ。例如,宋(Song)在1971描述的自適應(yīng)增量調(diào)制技術(shù)中提出:假定增量調(diào)制器的輸出為1和0,每當(dāng)輸出不變時(shí)量化階增大50%,使預(yù)測(cè)器的輸出跟上輸入信號(hào);每當(dāng)輸出值改變時(shí),量化階減小50%,使粒狀噪聲減到最小,這種自適應(yīng)方法使斜率過(guò)載和粒狀噪聲同時(shí)減到最小。又如,使用較多的另一種自適應(yīng)增量調(diào)制器是由格林弗基斯(Greefkes)1970提出的,稱為連續(xù)可變斜率增量調(diào)制(continuouslyvariableslopedeltamodulation,CVSD)。它的基本方法是:如果連續(xù)可變斜率增量調(diào)制器(continuouslyvariableslopedeltamodulator,CVSD)的輸出連續(xù)出現(xiàn)三個(gè)相同的值,量化階就加上一個(gè)大的增量,反之,就加一個(gè)小的增量。自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)脈沖編碼調(diào)制(adaptivepulsecode

modulation,APCM)是根據(jù)輸入信號(hào)幅度大小來(lái)改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時(shí)自適應(yīng),即量化階的大小每隔幾個(gè)樣本就改變,也可以是音節(jié)自適應(yīng),即量化階的大小在較長(zhǎng)時(shí)間周期里發(fā)生變化。改變量化階大小的方法有兩種:一種稱為前向自適應(yīng)(forwardadaptation),另一種稱為后向自適應(yīng)(backwardadaptation)。前向自適應(yīng):根據(jù)未量化的樣本值的均方根值來(lái)估算輸入信號(hào)的電平,以此來(lái)確定量化階的大小,并對(duì)其電平進(jìn)行編碼作為邊信息(sideinformation)傳送到接收端。后向自適應(yīng):從量化器剛輸出的過(guò)去樣本中來(lái)提取量化階信息。由于后向自適應(yīng)能在發(fā)收兩端自動(dòng)生成量化階,所以它不需要傳送邊信息。自適應(yīng)差分脈沖編碼調(diào)制差分脈沖編碼調(diào)制的思想:根據(jù)過(guò)去的樣本去估算(estimate)下一個(gè)樣本信號(hào)的幅度大小,這個(gè)值稱為預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)。它與脈沖編碼調(diào)制(PCM)不同的是,PCM是直接對(duì)采樣信號(hào)進(jìn)行量化編碼,而DPCM是對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,存儲(chǔ)或者傳送的是差值而不是幅度絕對(duì)值,這就降低了傳送或存儲(chǔ)的數(shù)據(jù)量。此外,它還能適應(yīng)大范圍變化的輸入信號(hào)。自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM(adaptivedifferencepulsecodemodulation)綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。它的核心想法是:①利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值,②使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。它的編碼簡(jiǎn)化框圖如下圖所示。ADPCM編譯碼器G.721推薦標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)叫做32kb/s自適應(yīng)差分脈沖編碼調(diào)制。在此基礎(chǔ)上還制定了G.721的擴(kuò)充推薦標(biāo)準(zhǔn),即G.723,使用該標(biāo)準(zhǔn)的編碼器的數(shù)據(jù)率可降低到40kb/s和24kb/s。G.722SB-ADPCM編譯碼器G.722推薦標(biāo)準(zhǔn),叫做“數(shù)據(jù)率為64kb/s的7kHz聲音信號(hào)編碼——這個(gè)標(biāo)準(zhǔn)把話音信號(hào)的質(zhì)量由電話質(zhì)量提高到AM無(wú)線電廣播質(zhì)量,而其數(shù)據(jù)傳輸率仍保持為64kb/s。子帶編碼(subbandcoding,SBC)的基本思想是:使用一組帶通濾波器(band-passfilter,BPF)把輸入音頻信號(hào)的頻帶分成若干個(gè)連續(xù)的頻段,每個(gè)頻段稱為子帶。對(duì)每個(gè)子帶中的音頻信號(hào)采用單獨(dú)的編碼方案去編碼。在信道上傳送時(shí),將每個(gè)子帶的代碼復(fù)合起來(lái)。在接收端譯碼時(shí),將每個(gè)子帶的代碼單獨(dú)譯碼,然后把它們組合起來(lái),還原成原來(lái)的音頻信號(hào)。子帶編碼的編碼/譯碼器,可以采用ADPCM,APCM,PCM等。等帶寬的子帶不等帶寬的子帶G.722SB-ADPCM編譯碼器窄帶和寬帶音頻信道頻率特性

全頻帶聲音的第1代編碼技術(shù)全頻帶聲音指的是10Hz~20,000Hz范圍里的所有可聽(tīng)聲音.也叫做寬帶聲音或高保真(high-fidelity)聲音;第1代全頻帶數(shù)字聲音(CD,DAT)的編碼采用PCM編碼:采樣頻率:44.1kHz或48kHz量化精度:16位聲道數(shù)目:1或2碼率:705.6/768(kb/s)或1.41/1.54(Mb/s)全頻帶聲音的第2代編碼技術(shù)目標(biāo):在保持高保真聲音質(zhì)量(transparentcompression)的前提下,降低碼率,減輕網(wǎng)絡(luò)帶寬的壓力;不但充分使用聲音信息的統(tǒng)計(jì)冗余,而且利用人耳的聽(tīng)覺(jué)特性,即使用“心理聲學(xué)模型(psycho-acousticmodel)”,來(lái)達(dá)到壓縮數(shù)據(jù)的目的,稱為感知聲音編碼(perceptualaudiocoding)。全頻帶數(shù)字音頻的編碼標(biāo)準(zhǔn)MP3音樂(lè)是什么?DolbyAC-3是什么?RealAudio是什么?數(shù)字語(yǔ)音編碼標(biāo)準(zhǔn)標(biāo)準(zhǔn)

方法 比特率 質(zhì)量 時(shí)間 應(yīng)用G.711 PCM 64 4.4 1972 PSTNANSI1015 LPC-10 2.4 2.7 1976 保密通信G.721 ADPCM 32 4.1 1984 PSTNGSM(歐洲蜂窩通信) RPE-CELP 13 3.6 1991 ANSI1016 CELP 4.8 3.2 1991 G.728 低延時(shí)CD-CELP 16 4.0 1992 IS54(北美TDMA) VSELP 8 3.5 1992 IS96(北美

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論