




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、PowerPoint Template第三章 數(shù)字聲音基礎(chǔ) 1234聲音特性 聲音信號(hào)數(shù)字化 聲音編碼方法 聲音合成與MIDI系統(tǒng) 56常用音頻處理軟件 聲音文件的存儲(chǔ)與編輯 數(shù)字聲音基礎(chǔ)知識(shí)結(jié)構(gòu)聲音特性聲音信號(hào)數(shù)字化聲音編碼方法聲音合成與MIDI系統(tǒng)聲音的存儲(chǔ)及編輯音頻文件的存儲(chǔ)格式轉(zhuǎn)換CD音軌MP3與WAV格式互換音頻處理軟件簡(jiǎn)介Cool Edit編輯制作聲音編碼分類線性預(yù)測(cè)編碼GSMMP3G721標(biāo)準(zhǔn)常用音頻處理軟件數(shù)字聲音基礎(chǔ)3.1.1 聲音的基本特點(diǎn)聲音的定義 聲音是通過(guò)空氣傳播的一種連續(xù)的振動(dòng)波,具有幅度和頻率。 聲音用電信號(hào)表示時(shí),聲音信號(hào)在時(shí)間和幅度上都是連續(xù)的模擬信號(hào),如圖所
2、示。3.1.1 聲音的基本特點(diǎn)復(fù)合信號(hào):聲音信號(hào)由許多不同頻率的信號(hào)組成,這類信號(hào)稱為復(fù)合信號(hào),復(fù)合信號(hào)的頻率范圍稱為聲音信號(hào)的帶寬。分量信號(hào):?jiǎn)我活l率的信號(hào)稱為分量信號(hào)。復(fù)合信號(hào)與分量信號(hào)3.1.1 聲音的基本特點(diǎn)聲音的頻率分布次聲波人耳可聽(tīng)域(音頻)超聲波20,000Hz調(diào)幅廣播(AM)50Hz 7,000Hz調(diào)頻廣播(FM)20Hz 15,000Hz高級(jí)音響3Hz 40,000Hz話音信號(hào)300Hz 3,000Hz聲源種類頻帶寬度3.1.2 聲音質(zhì)量的度量聲音類型帶寬電話語(yǔ)音2003.4kHz調(diào)幅廣播507kHz調(diào)頻廣播2015kHzCD2020kHz評(píng)價(jià)方法一:帶寬度量法 聲音信號(hào)的帶
3、寬來(lái)衡量,頻率范圍越寬音質(zhì)越好。等級(jí)由高到低依次為DAT、CD、FM、AM和數(shù)字電話。3.1.2 聲音質(zhì)量的度量評(píng)價(jià)方法二:客觀質(zhì)量度量法 信噪比(Signal to Noise Ratio,SNR):指聲源產(chǎn)生最大不失真聲音信號(hào)強(qiáng)度與同時(shí)發(fā)出噪聲強(qiáng)度之間的比率,以S/N表示,單位為分貝(dB)。信噪比越高,音頻質(zhì)量越好。SNR=10log(Vsingnal)2(Vnoise)2=20log|Vsingnal/Vnoise|Vsingnal: 信號(hào)電壓Vnoise: 噪聲電壓S/N: 信噪比(單位為dB)3.1.2 聲音質(zhì)量的度量分?jǐn)?shù)質(zhì)量級(jí)別失真級(jí)別5優(yōu)(excellent)無(wú)察覺(jué)4良(goo
4、d)(剛)察覺(jué)但不討厭3中(fair)(察覺(jué))有點(diǎn)討厭2差(poor)討厭但不反感1劣(bad)極討厭(令人反感)評(píng)價(jià)方法三:主觀質(zhì)量度量法 主觀平均判分法:召集若干實(shí)驗(yàn)者對(duì)聲音質(zhì)量進(jìn)行評(píng)分,求出平均值作為對(duì)聲音質(zhì)量的評(píng)價(jià)。所得分?jǐn)?shù)稱為主觀平均分(Mean Opinion Score, MOS)。3.2.1 聲音數(shù)字化過(guò)程聲音采樣量化編碼聲音數(shù)字化過(guò)程 101100 1100113.2.1 聲音數(shù)字化過(guò)程聲音數(shù)字化的兩個(gè)重要參數(shù)聲音數(shù)字化需要回答兩個(gè)問(wèn)題每秒鐘需要采集多少個(gè)聲音樣本,也就是采樣頻率(fs)是多少,每個(gè)聲音樣本的位數(shù)(bit per sample,bps)應(yīng)該是多少,也就是量化精
5、度。3.2.1 聲音數(shù)字化過(guò)程采樣頻率采樣頻率的高低是根據(jù)奈奎斯特理論(Nyquist theory)和聲音信號(hào)本身的最高頻率決定的。奈奎斯特理論指出,采樣頻率不應(yīng)低于聲音信號(hào)最高頻率的兩倍,這樣就能把以數(shù)字表達(dá)的聲音還原成原來(lái)的聲音,這叫做無(wú)損數(shù)字化(lossless digitization)。采樣定律用公式表示為 fs 2f 或者 Ts T/2 其中f為被采樣信號(hào)的最高頻率。 你可以這樣來(lái)理解奈奎斯特理論:聲音信號(hào)可以看成由許許多多正弦波組成的,一個(gè)振幅為A、頻率為f的正弦波至少需要兩個(gè)采樣樣本表示,因此,如果一個(gè)信號(hào)中的最高頻率為 ,采樣頻率最低要選擇2 。例如,電話話音的信號(hào)頻率約為
6、3.4 kHz,采樣頻率就選為8 kHz。3.2.1 聲音數(shù)字化過(guò)程量化精度 樣本大小是用每個(gè)聲音樣本的位數(shù)bit/s(即bps)表示的,它反映度量聲音波形幅度的精度。例如,每個(gè)聲音樣本用16位(2字節(jié))表示,測(cè)得的聲音樣本值是在065535的范圍里,它的精度就是輸入信號(hào)的1/65536。樣本位數(shù)的大小影響到聲音的質(zhì)量,位數(shù)越多,聲音的質(zhì)量越高,而需要的存儲(chǔ)空間也越多;位數(shù)越少,聲音的質(zhì)量越低,需要的存儲(chǔ)空間越少。 量化精度的另一種表示方法是信號(hào)噪聲比,簡(jiǎn)稱為信噪比(signal-to-noise ratio,SNR),并用下式計(jì)算: SNR 3 log2 (Vsignal)2 / (Vnoi
7、se)26 log2 (Vsignal / Vnoise) 其中,Vsignal表示信號(hào)電壓,Vnoise表示噪聲電壓;SNR的單位為分貝(db) 例1:假設(shè)Vnoise1,采樣精度為1位表示Vsignal21,它的信噪比SNR6分貝。 假設(shè)Vnoise1,采樣精度為16位表示Vsignal216,它的信噪比SNR96分貝。3.2.2 聲音質(zhì)量與數(shù)據(jù)率采樣頻率 Hz數(shù)據(jù)長(zhǎng)度 bit數(shù)據(jù)量分鐘11,02580.66 MB22,05081.32 MB44,10082.64 MB11,025161.32 MB22,050162.64 MB44,100165.29 MB音質(zhì)評(píng)價(jià)低一般良好中良好優(yōu)秀3.
8、2.2 聲音質(zhì)量與數(shù)據(jù)率聲音數(shù)據(jù)率計(jì)算 單聲道,計(jì)算數(shù)字聲音文件大小的公式為S=R*D*(r/8)*1S:文件大小,單位BR:采樣頻率,KHzD:錄音時(shí)間,s r:分辨率,b1:對(duì)應(yīng)單聲道例:R=44.1Khz,r=16b,立體聲,D=10s此為CD質(zhì)量的紅皮書音頻標(biāo)準(zhǔn),屬消費(fèi)者級(jí)的壓縮盤標(biāo)準(zhǔn)。3.2.2 聲音質(zhì)量與數(shù)據(jù)率2020 000 Hz質(zhì)量采樣頻率(kHz)樣本精度(bit/s)單道聲/立體聲數(shù)據(jù)率(kB/s)(未壓縮)頻率范圍電話*88單道聲8 2003 400 HzAM11.0258單道聲11.02015 000HzFM22.05016立體聲88.2 507 000HzCD44.1
9、16立體聲176.42020 000 HzDAT4816立體聲192.0聲音數(shù)據(jù)率計(jì)算3.3.1 語(yǔ)音編碼技術(shù)分類波形編譯碼器(waveform coder):不利用生成話音的信號(hào)的任何知識(shí),將話音視為一種普通的聲音,直接對(duì)波形信號(hào)進(jìn)行采樣和量化。例如PCM、DPCM、ADPCM等。音源編譯碼器(Source coder):也叫參數(shù)編譯碼器、聲碼器(vocoder)。它從話音波形信號(hào)中提取話音生成模型的參數(shù),使用這些參數(shù)通過(guò)話音生成模型重構(gòu)出話音。例如LPC編碼?;旌暇幾g碼器(Hybrid coder):綜合使用上述兩種技術(shù)。使用的激勵(lì)信號(hào)波形盡可能接近于原始話音信號(hào)的波形。例如CELP。3.
10、3.1 語(yǔ)音編碼技術(shù)分類音源編譯碼器話音產(chǎn)生的數(shù)字模型周期脈沖序列發(fā)生器偽隨機(jī)噪聲產(chǎn)生器周期時(shí)變數(shù)字濾波器音量控制聲道參數(shù)語(yǔ)音輸出濁/清選擇3.3.1 語(yǔ)音編碼技術(shù)分類語(yǔ)音編碼技術(shù)比較一般來(lái)說(shuō),波形編譯碼器的話音質(zhì)量高,但數(shù)據(jù)率也很高;音源編譯碼器的數(shù)據(jù)率很低,產(chǎn)生的合成話音的音質(zhì)有待提高;混合編譯碼器使用音源編譯碼技術(shù)和波形編譯碼技術(shù),數(shù)據(jù)率和音質(zhì)介于它們之間。3.3.1 語(yǔ)音編碼技術(shù)分類語(yǔ)音編碼技術(shù)分類LDM多脈沖線性預(yù)測(cè)(MPLPC)碼激勵(lì)線性預(yù)測(cè)(MPLPC)音頻壓縮編碼方法有損壓縮無(wú)損壓縮波形編碼參數(shù)編碼 (LPC)混合編碼Huffman編碼行程編碼增量調(diào)制脈沖編碼調(diào)制子帶編碼(SB
11、S)DPCMADPCMADM3.3.2 脈沖編碼調(diào)制(PCM)概念 它僅僅是對(duì)輸入信號(hào)進(jìn)行采樣和量化。在這個(gè)編碼框圖中,它的輸入是模擬聲音信號(hào),它的輸出是PCM樣本。圖中的“防失真濾波器”是一個(gè)低通濾波器,用來(lái)濾除聲音頻帶以外的信號(hào);“波形編碼器”可暫時(shí)理解為“采樣器”,“量化器”可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器。3.3.2 脈沖編碼調(diào)制(PCM)PCM編碼步驟PCM編碼的兩個(gè)步驟: 第一步是采樣,就是每隔一段時(shí)間間隔讀 一次聲音的幅度; 第二步是量化,就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn) 換成數(shù)字值。量化歸納成兩類: 一類稱為均勻量化 另一類稱為非均勻量
12、化采用的量化方法不同,量化后的數(shù)據(jù)量也就不同。因此,可以說(shuō)量化也是一種壓縮數(shù)據(jù)的方法。3.3.2 脈沖編碼調(diào)制(PCM)均量化如果采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來(lái)度量采樣得到的幅度,也稱為線性量化,如圖所示。量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲。3.3.2 脈沖編碼調(diào)制(PCM)非均量化無(wú)論對(duì)大的輸入信號(hào)還是小的輸入信號(hào)一律都采用相同的量化間隔。但是,對(duì)話音信號(hào)來(lái)說(shuō),大信號(hào)出現(xiàn)的機(jī)會(huì)并不多,增加的樣本位數(shù)就沒(méi)有充分利用。為了克服這個(gè)不足,就出現(xiàn)了非均勻量化的方法,這種方法也叫做非線性量化。非線性量化
13、的基本想法是,對(duì)輸入信號(hào)進(jìn)行量化時(shí),大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔 采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系: 律壓擴(kuò)(companding)算法,A律壓擴(kuò)算法。3.3.2 脈沖編碼調(diào)制(PCM)率壓擴(kuò)式中:x為輸入信號(hào)幅度,規(guī)格化成; -1x1sgn(x)為x的極性;律( -Law)壓擴(kuò)(G.711)主要用在北美和日本等地區(qū)的數(shù)字電話通信中 3.3.2 脈沖編碼調(diào)制(PCM)率壓擴(kuò)曲線3.3.2 脈沖編碼調(diào)制(PCM)A率壓擴(kuò)0 |x| 1/A 1/A |x| 1 式中:x為輸入信號(hào)幅度,規(guī)格化成 -1 x 1;sgn(x)為x的極性;A為確定壓縮量的
14、參數(shù),它反映最大量化間隔和最小量化間隔之比。A律壓擴(kuò)的前一部分是線性的,其余部分與 律壓擴(kuò)相同。A律(A-Law)壓擴(kuò)(G.711)主要用在歐洲和中國(guó)大陸等地區(qū)的數(shù)字電話通信中 3.3.2 脈沖編碼調(diào)制(PCM)A率壓擴(kuò)曲線3.3.3 差分脈沖編碼調(diào)制(DPCM) 是利用樣本與樣本之間存在的信息冗余度來(lái)進(jìn)行編碼的一種數(shù)據(jù)壓縮技術(shù)。差分脈沖編碼調(diào)制的思想是,根據(jù)過(guò)去的樣本去估算(estimate)下一個(gè)樣本信號(hào)的幅度大小,這個(gè)值稱為預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)。它與脈沖編碼調(diào)制(PCM)不同的是,PCM是直接對(duì)采樣信號(hào)進(jìn)行量化編碼,而DPC
15、M是對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,存儲(chǔ)或者傳送的是差值而不是幅度絕對(duì)值,這就降低了傳送或存儲(chǔ)的數(shù)據(jù)量。此外,它還能適應(yīng)大范圍變化的輸入信號(hào)。3.3.3 差分脈沖編碼調(diào)制(DPCM)DPCM原理圖 3.3.3 差分脈沖編碼調(diào)制(DPCM)各信號(hào)意義差分信號(hào)d(k):離散輸入信號(hào)S(K)和預(yù)測(cè)器輸出的估算值Se(k-1)之差。注意,Se(k-1)是對(duì)S(K)的預(yù)測(cè)值,而不是過(guò)去樣本的實(shí)際值。 d= S(K)- Se(k-1)重構(gòu)信號(hào):由逆量化器產(chǎn)生的量化差分信號(hào),與對(duì)過(guò)去樣本信號(hào)的估算值求和得到。它們的和,即作為預(yù)測(cè)器確定下一個(gè)信號(hào)估算值的輸入信號(hào)。 Sr(k)= Se(k-1)+ dq(
16、k)由于在發(fā)送端和接收端都使用相同的逆量化器和預(yù)測(cè)器,所以接收端的重構(gòu)信號(hào)可從傳送信號(hào)獲得。誤差來(lái)源: d與d(k)之間的差異是誤差,原因?3.3.4自適應(yīng)差分脈沖編碼調(diào)制(ADPCM) 核心想法:利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值;使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。 ADPCM:采用自適應(yīng)技術(shù)和差分編碼技術(shù)相結(jié)合。將64kb/s的PCM信號(hào)壓縮為32kb/s的脈沖編碼信號(hào),廣泛應(yīng)用與電話通信網(wǎng)。3.3.4自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM原理圖自適應(yīng)
17、量化自適應(yīng)預(yù)測(cè)3.3.5 線性預(yù)測(cè)編碼(LPC)LPC是通過(guò)分析話音波形來(lái)產(chǎn)生聲道激勵(lì)和轉(zhuǎn)移函數(shù)的參數(shù),對(duì)聲音波形的編碼實(shí)際就轉(zhuǎn)化為對(duì)這些參數(shù)的編碼,這就使聲音的數(shù)據(jù)量大大減少。在接收端使用LPC分析得到的參數(shù),通過(guò)話音合成器重構(gòu)話音。合成器實(shí)際上是一個(gè)離散的隨時(shí)間變化的時(shí)變線性濾波器,它代表人的話音生成系統(tǒng)模型。時(shí)變線性濾波器既當(dāng)作預(yù)測(cè)器使用,又當(dāng)作合成器使用。3.3.5 線性預(yù)測(cè)編碼(LPC) 線性預(yù)測(cè)器是使用過(guò)去的P個(gè)樣本值來(lái)預(yù)測(cè)現(xiàn)時(shí)刻的采樣值x(n),預(yù)測(cè)值可以用過(guò)去P個(gè)樣本值的線性組合來(lái)表示: =殘差誤差(residual error)即線性預(yù)測(cè)誤差為 =3.3.5 線性預(yù)測(cè)編碼(L
18、PC)在給定的時(shí)間范圍里,如 ,使 的平方和即 為最小 通過(guò)求解偏微分方程,可找到系數(shù)ai的值。如果把發(fā)音器官等效成濾波器,這些系數(shù)值就可以理解成濾波器的系數(shù)。這些參數(shù)不再是聲音波形本身的值,而是發(fā)音器官的激勵(lì)參數(shù)。 3.4.1 ITU-T音頻壓縮標(biāo)準(zhǔn)用于電話質(zhì)量的語(yǔ)音壓縮標(biāo)準(zhǔn)G.711, G.721, G.723,G.728用于調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)G.7223.4.1 ITU-T音頻壓縮標(biāo)準(zhǔn)ITU-TG電話質(zhì)量語(yǔ)音壓縮標(biāo)準(zhǔn)電話質(zhì)量的語(yǔ)音信號(hào)頻率范圍為300hz3.4khz。G.711:1972年CCITT制定,用標(biāo)準(zhǔn)的PCM,采頻8khz,量化倍數(shù)8b,對(duì)應(yīng)的速率64kb/s)。 主要
19、用于公用電話網(wǎng)中。G.721:將64kb/s比特流轉(zhuǎn)換成32kb/s比特流,基于ADPCM。G.723: 5.3kb/s或6.3kb/s數(shù)據(jù)流,可用于可視電話和IP電話等系統(tǒng)中。G.728:1992年, 16kb/s比特流,采用短時(shí)延碼本激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)算法。主要用于公用電話網(wǎng)中。3.4.1 ITU-T音頻壓縮標(biāo)準(zhǔn)ITU-T調(diào)幅廣播質(zhì)量語(yǔ)音壓縮標(biāo)準(zhǔn)用于調(diào)幅廣播的質(zhì)量的音頻信號(hào)頻率范圍為50hz7khz。 G.722:16kHz,14b量化1988年,子帶編碼及ADPCM編碼,能將224kb/s的此類信號(hào)壓縮為64kb/s,主要用于視聽(tīng)多媒體和會(huì)議電視等。3.4.2 MPEG音
20、頻壓縮標(biāo)準(zhǔn)ISO 11172-3:MPEG-1音頻標(biāo)準(zhǔn)(MP1、MP2、MP3)(高保真音頻壓縮標(biāo)準(zhǔn):音頻信號(hào)50hz20khz )ISO 13818-3:MPEG-2音頻標(biāo)準(zhǔn)(Dolby AC-3): 5+1 聲道、低比特率和后向兼容性ISO 13818-7:MPEG-2 AAC音頻標(biāo)準(zhǔn)支持采樣頻率從8kHz到96kHz,可支持48個(gè)主聲道、16個(gè)配聲道和16個(gè)數(shù)據(jù)流。ISO 14496-3:MPEG-4音頻標(biāo)準(zhǔn) 集成從話音到高質(zhì)量的多通道聲音,從自然聲音到合成聲音3.4.2 MPEG音頻壓縮標(biāo)準(zhǔn)MPEG-1音頻提供3個(gè)獨(dú)立的壓縮層次,用戶可在復(fù)雜性和壓縮質(zhì)量之間權(quán)衡選擇。層1最簡(jiǎn)單,使用比
21、特率384kbps,主要用于數(shù)字盒式磁帶DCC; 層2的復(fù)雜度中等,使用比特率192kbps左右, 主要應(yīng)用于數(shù)字廣播的音頻編碼、CD-ROM上的音頻信號(hào)以及CD-I和VCD。 層3最為復(fù)雜,使用比特率64kbps,尤其適用于ISDN上的音頻傳輸,有損壓縮但音質(zhì)保持逼真效果。MP3音樂(lè) 是利用 MPEG Audio Layer 3 的技術(shù), 聲音采用 1:10 甚至 1:12 的壓縮率 3.4.2 MPEG音頻壓縮標(biāo)準(zhǔn)MP3 層3使用比較好的臨界頻帶濾波器,把聲音頻帶分成非等帶寬的子帶,心理聲學(xué)模型除了使用頻域掩蔽特性和時(shí)間掩蔽特性之外,還考慮了立體聲數(shù)據(jù)的冗余,并且使用了霍夫曼(Huffma
22、n)編碼器。 3.4.3 GSM標(biāo)準(zhǔn)GSM(Global System for Mobile communications):可譯成全球數(shù)字移動(dòng)通信系統(tǒng)。GSM算法是1992年柏林技術(shù)大學(xué)(Technical University Of Berlin)根據(jù)GSM協(xié)議開(kāi)發(fā)的,這個(gè)協(xié)議是歐洲最流行的數(shù)字蜂窩電話通信協(xié)議。GSM的輸入是幀(frame)數(shù)據(jù): 一幀(20毫秒)由采樣頻率為8 kHz的帶符號(hào)的160個(gè)樣本組成,每個(gè)樣本為13位或者16位的線性PCM(linear PCM)碼。GSM編碼器可把一幀(16016位)的數(shù)據(jù)壓縮成260位的GSM幀,壓縮后的數(shù)據(jù)率為1625字節(jié),相當(dāng)于13 k
23、b/s。由于260位不是8位的整數(shù)倍,因此編碼器輸出的GSM幀為264位的線性PCM碼。采樣頻率為8 kHz、每個(gè)樣本為16位的未壓縮的話音數(shù)據(jù)率為128 kb/s,使用GSM壓縮后的數(shù)據(jù)率為:(264位8000樣本/秒)/160樣本=13.2 千位/秒GSM的壓縮比:128:13.2 = 9.7,近似于10:1。3.5.1 MIDI簡(jiǎn)介MIDI(Musical Instrument Digital Interface):可譯成“電子樂(lè)器數(shù)字接口”。用于在音樂(lè)合成器(music synthesizers)、樂(lè)器(musical instruments)和計(jì)算機(jī)之間交換音樂(lè)信息的一種標(biāo)準(zhǔn)協(xié)議從2
24、0世紀(jì)80年代初期開(kāi)始,MIDI已經(jīng)逐步被音樂(lè)家和作曲家廣泛接受和使用。MIDI消息:樂(lè)譜的數(shù)字描述,即一套指令(即命令的約定),它指示樂(lè)器即MIDI設(shè)備要做什么,怎么做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號(hào),在MIDI電纜上傳送的不是聲音,而是發(fā)給MIDI設(shè)備或其它裝置讓它產(chǎn)生聲音或執(zhí)行某個(gè)動(dòng)作的指令。3.5.2 MIDI系統(tǒng)音樂(lè)合成器:解釋MIDI消息并產(chǎn)生音樂(lè)。含有鍵盤、音色和音序器。音樂(lè)合成方法:頻率調(diào)制合成法(frequency modulation,F(xiàn)M)和樂(lè)音樣本合成法(波形表(Wavetable)合成法)音源:產(chǎn)生聲音的設(shè)備,提供很多不同音色的樣本波形音序
25、器:用來(lái)記錄、編輯和播放MIDI文件的設(shè)備。軟件音序器 Cakewalk采樣器:開(kāi)放式音源,對(duì)聲音進(jìn)行采樣,合成音色來(lái)供電腦音樂(lè)系統(tǒng)使用。其他設(shè)備:錄音設(shè)備、監(jiān)聽(tīng)設(shè)備、音響功放3.5.2 MIDI系統(tǒng)一個(gè)簡(jiǎn)單的MIDI系統(tǒng) 上圖表示的是一個(gè)簡(jiǎn)單的MIDI系統(tǒng),它由一個(gè)MIDI鍵盤控制器和一個(gè)MIDI聲音模塊組成。 許多MIDI鍵盤樂(lè)器在其內(nèi)部既包含鍵盤控制器,又包含MIDI聲音模塊功能。在這些單元中,鍵盤控制器和聲音模塊之間已經(jīng)有內(nèi)部鏈接,這個(gè)鏈接可以通過(guò)該設(shè)備中的控制功能(local control)對(duì)鏈接打開(kāi)(ON)或者關(guān)閉(OFF)。3.5.2 MIDI系統(tǒng)頻率調(diào)制(FM )合成法的原理
26、它由5個(gè)基本模塊組成:數(shù)字載波器、調(diào)制器、聲音包絡(luò)發(fā)生器、數(shù)字運(yùn)算器和模數(shù)轉(zhuǎn)換器。聲音包絡(luò)發(fā)生器用來(lái)調(diào)制聲音的電平,這個(gè)過(guò)程也稱為幅度調(diào)制(amplitude modulation),并且作為數(shù)字式音量控制旋鈕,它的4個(gè)參數(shù)寫成ADSR,這條包絡(luò)線也稱為音量升降維持靜音包絡(luò)線(Attack,decay,sustain,release,ADSR)包絡(luò)線。3.5.2 MIDI系統(tǒng)頻率調(diào)制(FM )合成法的原理在樂(lè)音合成器中,數(shù)字載波波形和調(diào)制波形有很多種,不同型號(hào)的FM合成器所選用的波形也不同。下圖是Yamaha OPL-III數(shù)字式FM合成器采用的波形。各種不同樂(lè)音的產(chǎn)生是通過(guò)組合各種波形和各種
27、波形參數(shù)并采用各種不同的方法實(shí)現(xiàn)的。用什么樣的波形作為數(shù)字載波波形、用什么樣的波形作為調(diào)制波形、用什么樣的波形參數(shù)去組合才能產(chǎn)生所希望的樂(lè)音,這就是FM合成器的算法。3.5.2 MIDI系統(tǒng)樂(lè)音樣本合成聲音參數(shù),產(chǎn)生的聲音質(zhì)量比FM合成方法產(chǎn)生的聲音質(zhì)量要高這種方法就是把真實(shí)樂(lè)器發(fā)出的聲音以數(shù)字的形式記錄下來(lái),播放時(shí)改變播放速度,從而改變音調(diào)周期,生成各種音階的音符。樂(lè)音樣本的采集相對(duì)比較直觀。音樂(lè)家在真實(shí)樂(lè)器上演奏不同的音符,選擇44.1 kHz的采樣頻率、16位的樂(lè)音樣本,這相當(dāng)于CD-DA的質(zhì)量,把不同音符的真實(shí)聲音記錄下來(lái),這就完成了樂(lè)音樣本的采集。樂(lè)音樣本通常放在ROM芯片上。樂(lè)音樣
28、本合成器所需要的輸入控制參數(shù)比較少,可控的數(shù)字音效也不多,大多數(shù)采用這種合成方法的聲音設(shè)備都可以控制聲音包絡(luò)的ADSR 。3.5.3 MIDI規(guī)范與接口MIDI規(guī)范:1988年MIDI制造商協(xié)會(huì)正式公布MIDI技術(shù)規(guī)范第一版(MIDI 1.0),作為數(shù)字式音樂(lè)的國(guó)際標(biāo)準(zhǔn)。MIDI是由軟件和硬件兩部分共同組成的系統(tǒng)規(guī)范,它定義了電子合成器、定序器、節(jié)拍器、個(gè)人計(jì)算機(jī)和其他電子樂(lè)器的相互連接性和通信協(xié)議。相互連接性:定義了使這些不同的MIDI儀器能夠相互連接的接線方式、連接器類型,和輸入輸出線路。通信協(xié)議定義了能夠控制樂(lè)器聲音和消息(包括:發(fā)出反應(yīng),發(fā)出狀態(tài),及發(fā)出系統(tǒng)獨(dú)有)的標(biāo)準(zhǔn)多字節(jié)消息。補(bǔ)充
29、規(guī)范:“MIDI 1.0詳解”、“ MIDI 1.0規(guī)定的補(bǔ)充說(shuō)明”、“通用MIDI(GM)規(guī)范”3.5.3 MIDI規(guī)范與接口MIDI接口MIDI In :接受從其他MIDI裝置傳來(lái)的信息MIDI Out:發(fā)送某裝置生成的原始MIDI消息,向其他設(shè)備發(fā)送MIDI消息MIDI Thru :傳送從輸入口接收的消息到其他MIDI裝置,向其他設(shè)備發(fā)送MIDI消息。3.5.3 MIDI規(guī)范與接口MIDI工作過(guò)程MIDI樂(lè)器MIDI接口合成器音序器MIDI文件揚(yáng)聲器音頻卡PC機(jī)MIDI指令模擬音頻信號(hào)3.6.1 數(shù)字音頻文件的種類.mid MIDI (Musical Instrument Digital
30、 Interface)樂(lè)器接口文件 用于合成、游戲,記錄音符時(shí)值、頻率、音色特征,數(shù)據(jù)量小.wav WAVE (Waveform Audio)波形音頻文件 多媒體系統(tǒng)、音樂(lè)光盤制作,記錄物理波形,數(shù)據(jù)量大.cda CDA (CD Audio)激光音頻文件 準(zhǔn)確記錄聲波,數(shù)據(jù)量大,經(jīng)過(guò)采樣,生成wav和mp3音頻文件.mp3 mp3 (MPEG音頻壓縮標(biāo)準(zhǔn))壓縮音頻文件 必須經(jīng)過(guò)解壓縮,數(shù)據(jù)量小3.6.1 數(shù)字音頻文件的種類文件的擴(kuò)展名說(shuō)明auSun和NeXT公司的聲音文件存儲(chǔ)格式(8位m 律編碼或者16位線性編碼)aif(Audio Interchange)Apple計(jì)算機(jī)上的聲音文件存儲(chǔ)格式
31、cmf(Creative Music Format)聲霸(SB)卡帶的MIDI文件存儲(chǔ)格式mctMIDI文件存儲(chǔ)格式mff(MIDI Files Format)MIDI文件存儲(chǔ)格式mid(MIDI)Windows的MIDI文件存儲(chǔ)格式mp2MPEG Layer I , IImp3MPEG Layer IIImod(Module)MIDI文件存儲(chǔ)格式3.6.1 數(shù)字音頻文件的種類rm(RealMedia)RealNetworks公司的流放式聲音文件格式ra(RealAudio)RealNetworks公司的流放式聲音文件格式rolAdlib聲音卡文件存儲(chǔ)格式snd(sound)Apple計(jì)算機(jī)上
32、的聲音文件存儲(chǔ)格式seqMIDI文件存儲(chǔ)格式sngMIDI文件存儲(chǔ)格式voc(Creative Voice)聲霸卡存儲(chǔ)的聲音文件存儲(chǔ)格式wav(Waveform)*Windows采用的波形聲音文件存儲(chǔ)格式wrkCakewalk Pro軟件采用的MIDI文件存儲(chǔ)格式3.6.1 數(shù)字音頻文件的種類.WAV聲音文件用.wav為擴(kuò)展名的文件格式稱為波形文件格式(WAVE File Format),它在多媒體編程接口和數(shù)據(jù)規(guī)范1.0(Multimedia Programming Interface and Data Specifications 1.0)文檔中有詳細(xì)的描述。該文檔是由IBM和微軟公司于1
33、991年8月聯(lián)合開(kāi)發(fā)的,它是一種為交換多媒體資源而開(kāi)發(fā)的資源交換文件格式(Resource Interchange File Format,RIFF)。波形文件格式支持存儲(chǔ)各種采樣頻率和樣本精度的聲音數(shù)據(jù),并支持聲音數(shù)據(jù)的壓縮。3.6.1 數(shù)字音頻文件的種類.WAV聲音文件波形文件有許多不同類型的文件構(gòu)造塊組成,其中最主要的兩個(gè)文件構(gòu)造塊是Format Chunk(格式塊)和Sound Data Chunk(聲音數(shù)據(jù)塊)。格式塊包含有描述波形的重要參數(shù),例如采樣頻率和樣本精度等,聲音數(shù)據(jù)塊則包含有實(shí)際的波形聲音數(shù)據(jù)。RIFF中的其他文件塊是可選擇的。它的簡(jiǎn)化結(jié)構(gòu)如圖所示。3.6.2 主要音頻處理軟件錄音軟件:Windows錄音機(jī)編輯與轉(zhuǎn)換軟件Windows錄音機(jī)CoolEditGoldWaveCake Walk3.6.2 主要音頻處理軟件 設(shè)備間的信號(hào)連接SPEAKERMICLINE IN1mV500mV聲卡機(jī)箱后背插頭: 3.5mm/stereo 使用“錄音機(jī)”獲取聲音(1) 選擇“程序附件娛樂(lè) 錄音機(jī)”菜單,啟動(dòng)錄音機(jī)(2) 單擊 錄音按鈕,開(kāi)始錄音 (錄音時(shí)間為60秒)教學(xué)進(jìn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)生思品課件
- 廣州代理銷售合同范本
- 鋼廠皮帶銷售合同范本
- 小型設(shè)備采購(gòu)合同范本
- 臨時(shí)搭建合同范本
- 香港租憑合同范本
- 按摩課程培訓(xùn)課件
- 農(nóng)村的門窗合同范本
- 智能家居設(shè)備使用安全免責(zé)協(xié)議
- 綠色農(nóng)業(yè)科技項(xiàng)目投資扶持協(xié)議
- 泡沫鉆井技術(shù)
- 大學(xué)數(shù)學(xué)實(shí)驗(yàn)(MATLAB版)PPT全套完整教學(xué)課件
- 2022年臨西縣事業(yè)單位考試真題及答案
- 新蘇教版三年級(jí)科學(xué)下冊(cè)知識(shí)點(diǎn)歸納復(fù)習(xí)資料
- 航天集團(tuán)人才隊(duì)伍建設(shè)經(jīng)驗(yàn)介紹
- 牙周炎-侵襲性牙周炎
- 心理委員工作記錄表
- 教師的十大轉(zhuǎn)變課件
- 焦化廠生產(chǎn)工序及工藝流程圖
- 可下載打印的公司章程
- 中藥熏洗法課件
評(píng)論
0/150
提交評(píng)論