


版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一. 音頻基礎(chǔ)知識1. 音頻編解碼原理數(shù)字音頻的出現(xiàn),是為了滿足復(fù)制、存儲、傳輸?shù)男枨?,音頻信號的數(shù)據(jù)量對于進(jìn)行傳輸或存儲形成巨大的壓力,音頻信號的壓縮是在保證一定聲音質(zhì)量的條件下,盡可能以最小的數(shù)據(jù)率來表達(dá)和傳送聲音信息。 信號壓縮過程是對采樣、 量化后的原始數(shù)字音頻信號流運(yùn)用適, 當(dāng)?shù)臄?shù)字信號處理技術(shù)進(jìn)行信號數(shù)據(jù)的處理, 將音頻信號中去除對人們感受信息影響可以忽略的成分, 僅僅對有用的那部分音頻信號, 進(jìn)行編排,從而降低了參與編碼的數(shù)據(jù)量。數(shù)字音頻信號中包含的對人們感受信息影響可以忽略的成分稱為冗余, 包括時域冗余、頻域冗余和聽覺冗余。1.1 時域冗余A幅度分布的非均勻性 :信號的量化比特
2、分布是針對信號的整個動態(tài)范圍而設(shè)定的,對于小幅度信號而言,大量的比特數(shù)據(jù)位被閑置。B樣值間的相關(guān)性 :聲音信號是一個連續(xù)表達(dá)過程, 通過采樣之后, 相鄰的信號具有極強(qiáng)的相似性,信號差值與信號本身相比,數(shù)據(jù)量要小的多。C信號周期的相關(guān)性 :聲音信息在整個可聞域的范圍內(nèi),每個瞬間只有部分頻率成分在起作用, 即特征頻率, 這些特征頻率會以一定的周期反復(fù)出現(xiàn), 周期之間具有相關(guān)關(guān)系。D長時自我相關(guān)性 :聲音信息序列的樣值、周期相關(guān)性,在一個相對較長的時間間隔也會是相對穩(wěn)定的,這種穩(wěn)定關(guān)系具有很高的相關(guān)系數(shù)。E靜音:聲音信息中的停頓間歇, 無論是采樣還是量化都會形成冗余, 找出停頓間歇并將其樣值數(shù)據(jù)去除
3、,可以減少數(shù)據(jù)量。1.2 頻域冗余A長時功率譜密度的非均勻性 :任何一種聲音信息,在相當(dāng)長的時間間隔內(nèi),功率分布在低頻部分大于高頻部分, 功率譜具有明顯的非平坦性, 對于給定的頻段而 言,存在相應(yīng)的冗余。B語言特有的短時功率譜密度 :語音信號在某些頻率上會出現(xiàn)峰值, 而在另一些頻率上出現(xiàn)谷值,這些共振峰頻率具有較大的能量,由它們決定了不同的語音特征,整個語言的功率譜以基音頻率為基礎(chǔ),形成了向高次諧波遞減的結(jié)構(gòu)。1.3 聽覺冗余根據(jù)分析人耳對信號頻率、 時間等方面具有有限分辨能力而設(shè)計的心理聲學(xué)模型,將通過聽覺領(lǐng)悟信息的復(fù)雜過程, 包括接受信息, 識別判斷和理解信號內(nèi)容等幾個層次的心理活動, 形
4、成相應(yīng)的連覺和意境, 由此構(gòu)成聲音信息集合中的所以數(shù)據(jù),并非對人耳辨別聲音的強(qiáng)度、音調(diào)、方位都產(chǎn)生作用,形成聽覺冗余,由聽覺冗余引出了降低數(shù)據(jù)率 ,實現(xiàn)更高效率的數(shù)字音頻傳輸?shù)目赡?。2. 常見音頻編解碼標(biāo)準(zhǔn)2.1 AAC(Advanced Audio Codin)AAC 于 1997 年形成國際標(biāo)準(zhǔn) ISO 13818-7。先進(jìn)音頻編碼 AAC 開發(fā)成功,成為繼 MPEG-2 音頻標(biāo)準(zhǔn)( ISO/IEC13818-3 )之后的新一代音頻壓縮標(biāo)準(zhǔn)。在 MPEG-2 制訂的早期,本來是想將其音頻編碼部分保持與 MPEG-1 兼容的。但后來為了適應(yīng)演播電視的要求而將其定義成為一個可以獲得更高質(zhì)量的
5、多聲道音頻標(biāo)準(zhǔn)。 理所當(dāng)然地, 這個標(biāo)準(zhǔn)是不兼容 MPEG-1 的,因此被稱為 MPEG-2AAC 。換句話說,從表面上看,要制作和播放 AAC ,都需要使用與 MP3 完全不同的工具。類型: Audio制定者: MPEG所需頻寬: 96-128 kbps優(yōu)點(diǎn):支持多種音頻聲道組合,提供優(yōu)質(zhì)的音質(zhì)。應(yīng)用領(lǐng)域: voip特性:AAC 可以支持 1 到 48 路之間任意數(shù)目的音頻聲道組合、 包括 15 路低頻效果聲道、配音 /多語音聲道,以及 15 路數(shù)據(jù)。它可同時傳送 16 套節(jié)目,每套節(jié)目的音頻及數(shù)據(jù)結(jié)構(gòu)可任意規(guī)定。AAC 主要可能的應(yīng)用范圍集中在因特網(wǎng)網(wǎng)絡(luò)傳播、 數(shù)字音頻廣播, 包括衛(wèi)星直播
6、和數(shù)字 AM 、以及數(shù)字電視及影院系統(tǒng)等方面。 AAC 使用了一種非常靈活的熵編碼核心去傳輸編碼頻譜數(shù)據(jù)。 具有 48 個主要音頻通道, 16 個低頻增強(qiáng)通道,16 個集成數(shù)據(jù)流 , 16 個配音, 16 種編排。2.2 PCM 編碼(原始數(shù)字音頻信號流 )類型: Audio制定者: ITU-T所需頻寬: 1411.2 Kbps特性:音源信息完整,但冗余度過大。優(yōu)點(diǎn):音源信息保存完整 ,音質(zhì)好。缺點(diǎn):信息量大,體積大,冗余度過大。2.3 WMA(Windows Media Audio)類型: Audio制定者:微軟公司所需頻寬: 320112kbps(壓縮 1012 倍)優(yōu)點(diǎn):當(dāng) Bitrat
7、e 小于 128K 時,WMA 最為出色且編碼后得到的音頻文件很小。缺點(diǎn):當(dāng) Bitrate 大于 128K 時,WMA 音質(zhì)損失過大。 WMA 標(biāo)準(zhǔn)不開放,由微軟掌握。特性:當(dāng) Bitrate 小于 128K 時,WMA 幾乎在同級別的所有有損編碼格式中表現(xiàn)得最出色,但似乎 128k 是 WMA 一個檻,當(dāng) Bitrate 再往上提升時,不會有太多的音質(zhì)改變。2.4 PCMU(G .711U)類型: Audio制定者: ITU-T所需頻寬: 64Kbps(90.4)特性:PCMU 和 PCMA 都能提供較好的語音質(zhì)量, 但是它們占用的帶寬較高,需要 64kbps。優(yōu)點(diǎn):語音質(zhì)量優(yōu)。缺點(diǎn):占用
8、的帶寬較高。2.5 PCMA(G .711A)類型: Audio制定者: ITU-T所需頻寬: 64Kbps(90.4)特性:PCMU 和 PCMA 都能提供較好的語音質(zhì)量, 但是它們占用的帶寬較高,需要 64kbps。優(yōu)點(diǎn):語音質(zhì)量優(yōu)。缺點(diǎn):占用的帶寬較高。2.6 MP3MP3(CBR、VBR、ABR) MP3 應(yīng)該算目前使用用戶最多的有損壓縮數(shù)字音頻格式了。它的全稱 MPEG(MPEGMoving Picture Experts Group) Audio Layer-3 ,1993 年由德國夫朗和費(fèi)研究院和法國湯姆生公司合作發(fā)展成功。剛出現(xiàn)時它的編碼技術(shù)并不完善,它更像一個編碼標(biāo)準(zhǔn)框架,留
9、待人們?nèi)ネ晟?。早期?MP3 編碼采用的的是固定編碼率的方式( CBR ),我們??吹降?128KBPS ,就是代表它是以128KBPS 固定數(shù)據(jù)速率編碼 你可以提高這個編碼率,最高可以到 320KBPS ,音質(zhì)會更好,自然,文件的體積會相應(yīng)增大。 因為 MP3 的編碼方式是開放的,你可以在這個標(biāo)準(zhǔn)框架的基礎(chǔ)上自己選擇不同的聲學(xué)原理進(jìn)行壓縮處理, 所以, 很快由 Xing 公司推出可變編碼率的壓縮方式 (VBR )。它的原理就是利用將一首歌的復(fù)雜部分用高 bitrate 編碼, 簡單部分用低 bitrate 編碼, 通過這種方式, 進(jìn)一步取得質(zhì)量和體積的統(tǒng)一。當(dāng)然,早期的 Xing 編碼器的
10、VBR 算法很差,音質(zhì)與 CBR (固定碼率)相去甚遠(yuǎn)。但是,這種算法指明了一種方向,其他開發(fā)者紛紛推出自己的VBR 算法,使得效果一直在改進(jìn)。目前公認(rèn)比較好的首推 LAME ,它完美地實現(xiàn)了 VBR 算法,而且它是是完全免費(fèi)的軟件,并且由愛好者組成的開發(fā)團(tuán)隊一直在不斷的發(fā)展完善。3. 音頻采樣通過將聲波波形轉(zhuǎn)換成一連串的二進(jìn)制數(shù)據(jù)來再現(xiàn)原始聲音,實現(xiàn)這個步驟使用的設(shè)備是模 /數(shù)轉(zhuǎn)換器 (A/D )它以每秒上萬次的速率對聲波進(jìn)行采樣, 每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態(tài), 稱之為樣本。 將一串的樣本連接起來, 就可以描述一段聲波了,這就是音頻采集。4. 常見音頻參數(shù)4.1 采樣位
11、數(shù)采樣位數(shù)可以理解為采集卡處理聲音的解析度。 這個數(shù)值越大, 解析度就越高, 錄制和回放的聲音就越真實。 采集卡的位數(shù)客觀地反映了數(shù)字聲音信號對輸入聲音信號描述的準(zhǔn)確程度。市面上常用的采集卡位數(shù)如下:8 位代表 2 的 8 次方 -25616 位則代表 2 的 16 次方-64K4.2 位速說明位速是指在一個數(shù)據(jù)流中每秒鐘能通過的信息量。您可能看到過音頻文件用128Kbps MP3或64Kbps WMA 進(jìn)行描述的情形。 Kbps 表示 每秒千字節(jié)數(shù) ,因 此 數(shù) 值 越 大 表 示 數(shù) 據(jù) 越 多 : 128Kbps MP3 音 頻 文 件 包 含 的 數(shù) 據(jù) 量 是64Kbps WMA 文
12、件的兩倍,并占用兩倍的空間。 (不過在這種情況下,這兩種文件聽起來沒什么兩樣。原因是什么呢?有些文件格式比其他文件能夠更有效地利用數(shù)據(jù),64Kbps WMA 文件的音質(zhì)與 128Kbps MP3 的音質(zhì)相同。 )需要了解的重要一點(diǎn)是,位速越高,信息量越大,對這些信息進(jìn)行解碼的處理量就越大,文件需要占用的空間也就越多。為項目選擇適當(dāng)?shù)奈凰偃Q于播放目標(biāo):如果您想把制作的 VCD 放在 DVD 播放 器 上 播 放 , 那 么 視 頻 必 須 是 1150 Kbps , 音 頻 必 須 是 224 Kbps 。 典 型 的206 MHz Pocket PC 支持的 MPEG 視頻可達(dá)到 400 K
13、bps 超過這個限度播放時就會出現(xiàn)異常。位速還有三種不同形式的:VBR (Variable Bitrate )動態(tài)比特率也就是沒有固定的比特率,壓縮軟件在壓縮時根據(jù)音頻數(shù)據(jù)即時確定使用什么比特率,這是以質(zhì)量為前提兼顧文件大小的方式,推薦編碼模式;ABR (Average Bitrate )平均比特率 是 VBR 的一種插值參數(shù)。 LAME 針對 CBR不佳的文件體積比和 VBR 生成文件大小不定的特點(diǎn)獨(dú)創(chuàng)了這種編碼模式。 ABR 在指定的文件大小內(nèi),以每 50 幀( 30 幀約 1 秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態(tài)表現(xiàn)時使用高流量,可以做為 VBR 和 CBR 的一種
14、折衷選擇。CBR(Constant Bitrate),常數(shù)比特率指文件從頭到尾都是一種位速率。相對于VBR 和 ABR 來講,它壓縮出來的文件體積很大,而且音質(zhì)相對于 VBR 和 ABR 不會有明顯的提高。4.3 音頻采樣級別(音頻采樣頻率)數(shù)碼音頻系統(tǒng)是通過將聲波波形轉(zhuǎn)換成一連串的二進(jìn)制數(shù)據(jù)來再現(xiàn)原始聲音的,實現(xiàn)這個步驟使用的設(shè)備是模 /數(shù)轉(zhuǎn)換器 (A/D )它以每秒上萬次的速率對聲波行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態(tài),稱之為樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鐘所采樣的數(shù)目稱為采樣頻率或采率,單位為 HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就
15、越高。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對聲音信號的采樣次數(shù),采樣頻率越高聲音的還原就越真實越自然。在當(dāng)今的主流采集卡上,采樣頻率一般共分為 22.05KHz 、44.1KHz 、48KHz 三個等級,22.05 KHz 只能達(dá)到 FM 廣播的聲音品質(zhì), 44.1KHz 則是理論上的 CD 音質(zhì)界限,48KHz 則更加精確一些。 對于高于 48KHz 的采樣頻率人耳已無法辨別出來了, 所以在電腦上沒有多少使用價值。4.4 音頻采樣頻率音頻采樣率是指錄音設(shè)備在一秒鐘內(nèi)對聲音信號的采樣次數(shù), 采樣頻率一般共分為 22.05KHz 、44.1KHz 、48KHz 三個等級, 22.05KHz 只能達(dá)到
16、FM 廣播的聲音品質(zhì),44.1KHz 則是理論上的 CD 音質(zhì)界限, 48KHz 則更加精確一些。 對于高于 48KHz 的采樣頻率人耳已無法辨別出來了, 所以在電腦上沒有多少使用價值; 5kHz 的采樣率僅能達(dá)到人們講話的聲音質(zhì)量; 11kHz 的采樣率是播放小段聲音的最低標(biāo)準(zhǔn),是 CD 音質(zhì)的四分之一; 22kHz 采樣率的聲音可以達(dá)到 CD 音質(zhì)的一半,目前大多數(shù)網(wǎng)站都選用這樣的采樣率; 44kHz 的采樣率是標(biāo)準(zhǔn)的 CD 音質(zhì),可以達(dá)到很好的聽覺效果。5.影響音頻質(zhì)量的因素比特率、數(shù)據(jù)壓縮率、壓縮技術(shù)。古希臘哲學(xué)大師亞里士多德說: 人有兩種,一種即 吃飯是為了活著 一, 種是 活著是為
17、了吃飯 一. 個人之所以偉大,首先是因為他有超于常人的心。 志當(dāng)存高遠(yuǎn),風(fēng)物長宜放眼量這, 些古語皆鼓舞人們要樹立雄無數(shù)個自己,萬千種模樣,萬千愫情懷。有的和你心手相牽,有的和你對抗,有的給你雪中送炭,有的給你煩憂 與其說人的一生是同命運(yùn)抗?fàn)?,與性格妥協(xié),不如說是與自己抗?fàn)?,與自己妥協(xié)。人最終要尋找的,就是最愛的那個自己。只是這個自己,有人終其一生也未找到;有人只揭開了冰山的一角,有人有幸會晤一次,卻已用盡一生。人生最難抵達(dá)的其實就是自己。我不敢恭維我所有的自己都是美好的,因為總有個對抗的聲音: 你還沒有這樣的底氣。 很慚愧,坦白說,自己就是這個樣子:卑微過,像一棵草,像一只蟻,甚至像一粒土塊
18、,但拒絕猥瑣!懦弱過,像掉落下來的果實,被人撣掉的灰塵,但拒絕屈膝,寧可以卵擊石,以渺小決戰(zhàn)強(qiáng)大。自私過,比如遇到喜歡的人或物,也想不擇手段,據(jù)為己有。貪婪過,比如面對名利、金錢、豪宅名車,風(fēng)花雪月,也會心旌搖搖,浮想聯(lián)翩。倔強(qiáng)過,比如面對誤解、輕蔑,有淚也待到無人處再流,有委屈也不訴說,不申辯,直到做好,給自己證明,給自己看!溫柔過,當(dāng)愛如春風(fēng)襲來,當(dāng)情如花朵芳醇,黃昏月下,你儂我儂。強(qiáng)大過,內(nèi)剛外柔,和風(fēng)雨搏擊,和坎坷宣戰(zhàn),不失初心,不忘夢想,雖敗猶榮。這樣的自己一個個站到鏡中來,千面萬孔。有的隱著,有的浮著,有的張揚(yáng),有的壓抑,有的狂狷,有的沉寂,有的暴躁,有的溫良 庸俗的自己,逐流的自己,又兼點(diǎn)若仙的自己,美的自己,丑的自己,千篇一律的自己,獨(dú)一無二的自己。我們總想尋一座廟
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2020-2021深圳育才中學(xué)(初中)小學(xué)三年級數(shù)學(xué)下期末一模試卷帶答案
- 安裝鐵塔施工方案
- 2024年黑龍江大慶中考滿分作文《詩中誦出赤子心》
- 個人購銷合同范例范例
- 修路個人勞務(wù)合同范例
- 合伙餐廳合同范本
- 跨部門合作的工作計劃實例
- 鄉(xiāng)村樹苗銷售合同范例
- 學(xué)生自我管理與目標(biāo)追蹤計劃
- 培養(yǎng)員工潛能與激勵方式計劃
- 勞務(wù)派遣勞務(wù)外包項目方案投標(biāo)文件(技術(shù)方案)
- 2025年安全員C證(專職安全員)考試題庫
- 地理-天一大聯(lián)考2025屆高三四省聯(lián)考(陜晉青寧)試題和解析
- 2025年廣州市公安局招考聘用交通輔警200人高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 貴州省貴陽市2024-2025學(xué)年九年級上學(xué)期期末語文試題(含答案)
- 2025年江蘇海事職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年??及鎱⒖碱}庫含答案解析
- 2024年尖葉菠菜種子項目可行性研究報告
- 計件工資計算表格模板
- 兩癌防治知識培訓(xùn)
- 《moldflow學(xué)習(xí)資料》課件
- 2025中國移動安徽分公司春季社會招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
評論
0/150
提交評論