信息論與編碼-自學報告_第1頁
信息論與編碼-自學報告_第2頁
信息論與編碼-自學報告_第3頁
信息論與編碼-自學報告_第4頁
信息論與編碼-自學報告_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

《信息論與編碼》課程自學報告題目:AAC音頻壓縮編碼學號:xxxxxxxxx姓名:xxxxxxx任課教師:xxxxxxx聯(lián)系方式:xxxxxxxxxxxxx二零一六年一月一日

一、自學內(nèi)容小結與分析基本概念要想無失真地傳送連續(xù)信源的消息,要求信息率R必須為無窮大。這實際上是做不到的,因此實際通信系統(tǒng)允許一定的失真存在,那么對信息率的要求便可降低,換言之,就是允許壓縮信源輸出的信息率。信息率失真理論研究的就是信息率與允許失真之間的關系。失真函數(shù)與平均失真度為了定量地描述信息率與失真的關系,首先定義失真的測度。設離散無記憶信源。信源符號通過信道傳送到接收端Y,。對于每一對,指定一個非負的函數(shù)(1)稱d(ai,b由于ai和bj都是隨機變量,所以失真函數(shù)(2)信息率失真函數(shù)的定義1.2.1D允許試驗信道平均失真由信源分布p(ai)、假想信道的轉移概率p(bj/ai)和失真函數(shù)d(a1.2.2信息率失真函數(shù)R(D)由于互信息取決于信源分布和信道轉移概率分布,當p(ai)一定時,互信息I是關于p(bj/ai1.3信息率失真函數(shù)的性質1.3.1率失真函數(shù)的定義域率失真函數(shù)的定義域問題就是在信源和失真函數(shù)已知的情況下,討論允許平均失真度D的最小和最大取值問題。根據(jù)平均失真度的定義,平均失真度是一個非負的函數(shù),其下限顯然為零。那么,允許平均失真度D的下限也必然是零,這就是不允許任何失真的情況。另一方面,根據(jù)率失真函數(shù)的定義,R(D)是在一定約束條件下平均互信息I(X;Y)的極小值。當允許一定的失真存在時,傳送信源符號所需的信息率就可小些。當R(D)等于零時,對應的平均失真最大,也就是函數(shù)定義域的上界值Dmax1.3.2率失真函數(shù)對允許平均失真度的下凸性所謂下凸性是指對任一0≤θ≤1和任意平均失真度D(4)1.3.3率失真函數(shù)的單調(diào)遞減和連續(xù)性由于R(D)函數(shù)具有凸狀性,保證了它在定義域內(nèi)是連續(xù)的。用R(D)函數(shù)的下凸性可以證明它是嚴格遞減的。即在Dmin<D<D1.4離散信源的信息率失真函數(shù)1.4.1離散信源信息率失真函數(shù)的參量表達式以S為參量的平均失真函數(shù)D(S):(5)信息率失真函數(shù)R(S):(6)1.4.2二元及等概率離散信源的信息率失真函數(shù)設二元信源。再設失真函數(shù)為對稱函數(shù),相應的失真矩陣為,則信息率失真函數(shù)R(D)為:(7)上式第一項是信源熵,第二項則是因容忍一定的失真而可能壓縮的信息率。1.5保真度準則下的信源編碼定理設一離散平穩(wěn)無記憶信源的輸出隨機變量序列為X=(X1X2…XL),若該信源的信息率失真函數(shù)是R(D),并選定有限的失真函數(shù),對于任意允許平均失真度D≥0,和任意小的ε>0,當信息率R>R(D)二、保真度準則下的信源編碼典型案例的實現(xiàn)方案2.AAC音頻編碼格式介紹2.1簡介AAC音頻編碼格式,完整名稱叫做”高級音頻編碼(AdvancedAudioCodec)”。這種先進而高級的編碼規(guī)范,是由FraunhoferIIS公司(前MP3標準的制定者)、Dolby、AT&T、索尼、蘋果等產(chǎn)業(yè)巨頭共同開發(fā)的。AAC音頻編碼技術早在1997年就制定成型,當時在MPEG-2中作為了MPEG2-AAC音頻編碼規(guī)格之一,后來,在2000年被用在MPEG-4中(ISO14496-3Audio),所以現(xiàn)在變更為MPEG-4AAC標準,也就是說,AAC已經(jīng)成為MPEG4家族的主要成員之一,它是MPEG4第三部分中的音頻編碼系統(tǒng)。AAC可提供最多48個全音域音頻通道。2.2AAC理論及算法MPEG音頻壓縮規(guī)格在數(shù)字音頻的發(fā)展史上占有很重要的地位,而MP3正是應用此規(guī)格所發(fā)展出來的一種技術。MPEG最早的標準稱為MPEG-1,有國際標準化組織(ISO)在1992年完成,并制定成IS0/IEC11172標準。從MPEG-1的規(guī)格上來看,設計的最大比特率達到了1.5Mbps,規(guī)格中分別規(guī)范了視頻壓縮與聲音壓縮,VCD就是使用了MPEG-1的規(guī)格。MPEG-1本身分成三個部分,包括了系統(tǒng)、視頻和聲音資料。隨著時間的推移,MP3越來越不能滿足我們的需要了,比如壓縮率比較低,音質也不夠理想,僅有兩個聲道等等。于是FraunhoferIIS于AT&T、Sony、Dolby、Nokia等公司展開合作,共同開發(fā)出了被譽為“21世紀的資料壓縮方法”的AdvancedAudioCoding(AAC)音頻格式,以取代MP3的位置。其實AAC的算法在1997年就完成了,當時被稱為MPEG-2AAC,因為還是把它作為MPEG-2標準的延伸。但是隨著MPEG-4音頻標準在2000年成型,MPEG-2AAC也被作為它的編碼技術核心,同時追加了一些新的編碼特性,所以我們又叫MPEG-4AAC。但這兩者目前尚未被廣泛應用。增益控制增益控制濾波器組時域噪聲修正強度聯(lián)結預測M/S強度編碼數(shù)量因數(shù)量化無噪聲編碼感知模型碼率/失真控制模塊比特流輸入信號圖1.AAC編碼流程圖2.2.1增益控制增益控制模組可用于可變抽樣率配置中,它由多相正交濾波器PQF、增益檢測器和增益修正器組成。這個模組把輸入信號分離到4個相等帶寬的頻帶中。在解碼器中也有增益控制模組,通過忽略PQF的高子帶信號獲得低抽樣率輸出信號。2.2.2濾波器組AAC使用的是MDCT(ModifiedDiscreteCosineTransform)濾波器組。AAC的濾波器組被設計成允許改變視窗大小,用來適應輸入信號的狀態(tài)。視窗的大小隨著編碼器及解碼器同時改變,好讓濾波器組能有效地分辨變化多端的輸入信號。加上較長的轉換視窗長度,可變換的視窗形態(tài),及可變轉換區(qū)塊的長度,是的MDCT優(yōu)于使用預先編碼法的濾波器組,并且提供濾波器組更好的頻率選擇性。雖然量化和編碼都是在頻域里執(zhí)行完,解碼濾波器組的功能是反MDCT(IMDCT),將解碼器輸入端頻譜值,轉換成時域的輸出值。MDCT可以表示為:(8)同樣的,IMDCT可以表示為:(9)此處n為樣本指標,N為轉換視窗長度,i為區(qū)指標。AAC主要使用兩種視窗形態(tài):正弦視窗(sinewindow)及貝塞爾視窗(Kaiser-BesselDerivedwindow)。AAC允許濾波器組針對輸入信號的特性來改變時間頻率解析度。在復雜的頻譜上信號編碼效率會提升,并且對短暫的靜態(tài)信號有很好的頻率解析度,然而,長轉換對急速變化的信號編碼的效率比較低。但在轉變的區(qū)塊間轉換,卻在不同的聲道中產(chǎn)生了時間調(diào)整上的問題。為了解決這個問題和確保在長區(qū)塊和短區(qū)塊轉換間有平滑的傳輸,在長短視窗切換間,使用了開始視窗(startwindow)及結束視窗(stopwindow)。這個設計保留了MDCT和IMDCT的特性,并維持了區(qū)塊的排列。2.2.3時域噪聲修正(TNS,TemporalNoiseShaping)在感知聲音編碼中,TNS模組是用來控制量化噪聲的一種方法,解決量化噪聲的錯誤匹配問題。這個技術的基本想法是,在時域中的音頻信號在頻域中有一個暫態(tài)尖峰,TNS使用這種雙重性來拓展已知的預測編碼技術,把量化噪聲置于實際的信號之下以避免錯誤匹配。2.2.4M/S強度編碼在SSR中,M/S聯(lián)合聲道解碼機制將重建左右聲道的頻譜系數(shù),M/S立體聲編碼是用來控制并預測編碼時產(chǎn)生的噪聲。M/S立體聲的開關狀態(tài)已經(jīng)以信號位元的陣列被傳送至解碼器中。當加強編碼被使用時,M/S解碼機制將不會被啟動。2.2.5量化AAC的量化過程是使用兩個巢狀圓圈進行反復運算。通過對量化分析的良好控制,比特率能夠被高效地利用。2.2.6無噪聲編碼無噪聲編碼實際上就是霍夫曼編碼,它對被量化的譜系數(shù)、比例因數(shù)和方向信息進行編碼。2.2.7數(shù)量因數(shù)AAC在頻譜系數(shù)群眾使用個別放大率,稱為數(shù)量因數(shù)頻帶,來當作另一個方法以調(diào)整在頻域中的量化噪聲。數(shù)量因數(shù)表示一個增益值,用來改變頻譜系數(shù)在數(shù)量因數(shù)中的振幅大小。對所有的數(shù)量因數(shù)來說,不同值在于使用霍夫曼編碼。數(shù)量因數(shù)頻帶和與其相對因的系數(shù)是照著頻率的高低進行排列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論