版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 第七章 矢量量化技術(shù) (vector quantization VQ)(vector quantization VQ) 7.1 概述 7.2 矢量量化的基本原理 7.3 矢量量化的失真測(cè)度 7.4 矢量量化的最佳碼本設(shè)計(jì) 7.1 概述 一、矢量量化的應(yīng)用 二、標(biāo)量量化和矢量量化的區(qū)別 矢量量化技術(shù)技術(shù)是一種數(shù)據(jù)壓縮和編碼技術(shù),矢量量化技術(shù)技術(shù)是一種數(shù)據(jù)壓縮和編碼技術(shù), 矢量量化壓縮技術(shù)的應(yīng)用領(lǐng)域非常廣闊,如軍事部門(mén)矢量量化壓縮技術(shù)的應(yīng)用領(lǐng)域非常廣闊,如軍事部門(mén) 和氣象部門(mén)的衛(wèi)星和氣象部門(mén)的衛(wèi)星( (或航天飛機(jī)或航天飛機(jī)) )遙感照片的壓縮編碼遙感照片的壓縮編碼 和實(shí)時(shí)傳輸、雷達(dá)圖像和軍用地圖
2、的存儲(chǔ)與傳輸、數(shù)和實(shí)時(shí)傳輸、雷達(dá)圖像和軍用地圖的存儲(chǔ)與傳輸、數(shù) 字電視和字電視和DVDDVD的視頻壓縮、醫(yī)學(xué)圖像的壓縮與存儲(chǔ)、的視頻壓縮、醫(yī)學(xué)圖像的壓縮與存儲(chǔ)、 網(wǎng)絡(luò)化測(cè)試數(shù)據(jù)的壓縮和傳輸、語(yǔ)音編碼、圖像識(shí)別網(wǎng)絡(luò)化測(cè)試數(shù)據(jù)的壓縮和傳輸、語(yǔ)音編碼、圖像識(shí)別 和語(yǔ)音識(shí)別等等和語(yǔ)音識(shí)別等等 。 一、矢量量化的應(yīng)用 整個(gè)動(dòng)態(tài)范圍被分成若干個(gè)小區(qū)間,每個(gè)小區(qū)間整個(gè)動(dòng)態(tài)范圍被分成若干個(gè)小區(qū)間,每個(gè)小區(qū)間 有一個(gè)代表值,量化時(shí)落入小區(qū)間的信號(hào)值就用這個(gè)有一個(gè)代表值,量化時(shí)落入小區(qū)間的信號(hào)值就用這個(gè) 代表值代替,或者叫被量化為這個(gè)代表值。這時(shí)的信代表值代替,或者叫被量化為這個(gè)代表值。這時(shí)的信 號(hào)量是一維的,所
3、以稱為標(biāo)量量化。號(hào)量是一維的,所以稱為標(biāo)量量化。 二、標(biāo)量量化和矢量量化的區(qū)別 采樣采樣量化量化 x xa a(t)(t) x xa a(nT)(nT) x(n)x(n) x xa1 a1 x x1 1x xk k x xak ak x xak+1 ak+1 x xk+1 k+1 x xL L x xaL aL x xaL+1 aL+1 x(n)=Qxx(n)=Qxa a(nT)(nT)。 1.標(biāo)量量化: 2 2 - - -2-2 2 2 標(biāo)量量化標(biāo)量量化 1-dimensional VQ is shown below: 2. 矢量量化: 若干個(gè)標(biāo)量數(shù)據(jù)組成一個(gè)矢量,若干個(gè)標(biāo)量數(shù)據(jù)組成一個(gè)矢量
4、,矢量量化是矢量量化是 對(duì)矢量進(jìn)行量化,和標(biāo)量量化一樣,它把矢量空間對(duì)矢量進(jìn)行量化,和標(biāo)量量化一樣,它把矢量空間 分成若干個(gè)小區(qū)域,每個(gè)小區(qū)域?qū)ふ乙粋€(gè)代表矢量,分成若干個(gè)小區(qū)域,每個(gè)小區(qū)域?qū)ふ乙粋€(gè)代表矢量, 量化時(shí)落入小區(qū)域的矢量就用這個(gè)代表矢量代替,量化時(shí)落入小區(qū)域的矢量就用這個(gè)代表矢量代替, 或者叫著被量化為這個(gè)代表矢量。例如,所有可能或者叫著被量化為這個(gè)代表矢量。例如,所有可能 的二維矢量就構(gòu)成了一個(gè)平面,將平面分成的二維矢量就構(gòu)成了一個(gè)平面,將平面分成7 7個(gè)小個(gè)小 區(qū)域。區(qū)域。 Y Y1 1 Y Y2 2 Y Y3 3 Y Y4 4 Y Y5 5 Y Y6 6 Y Y7 7 x1 x
5、2 Y Yi i(x x1i 1i ,x ,x2i 2i) ) 假設(shè)聲道濾波器傳輸函數(shù)用假設(shè)聲道濾波器傳輸函數(shù)用4 4個(gè)系數(shù)來(lái)描述,個(gè)系數(shù)來(lái)描述, 而且,又假設(shè)聲道只能為而且,又假設(shè)聲道只能為4 4個(gè)可能的形狀之一。這個(gè)可能的形狀之一。這 意味著只存在意味著只存在4 4組可能的聲道濾波器傳輸函數(shù)。組可能的聲道濾波器傳輸函數(shù)。 現(xiàn)在考慮對(duì)每一個(gè)濾波器系數(shù)單獨(dú)進(jìn)行標(biāo)量量現(xiàn)在考慮對(duì)每一個(gè)濾波器系數(shù)單獨(dú)進(jìn)行標(biāo)量量 化,需要化,需要2bit2bit,每一分析幀需要,每一分析幀需要8 8個(gè)比特來(lái)進(jìn)行編個(gè)比特來(lái)進(jìn)行編 碼。碼。 3、舉例說(shuō)明標(biāo)量量化與矢量量化的區(qū)別、舉例說(shuō)明標(biāo)量量化與矢量量化的區(qū)別 如果我們
6、知道只有如果我們知道只有4 4種可能的聲道形狀,與種可能的聲道形狀,與 4 4個(gè)可能的聲道濾波器系數(shù)組成的矢量相對(duì)應(yīng),個(gè)可能的聲道濾波器系數(shù)組成的矢量相對(duì)應(yīng), 若某一個(gè)濾波器系數(shù)知道了,其它系數(shù)就知道若某一個(gè)濾波器系數(shù)知道了,其它系數(shù)就知道 了,也就是矢量中的標(biāo)量值之間是高度相關(guān)的,了,也就是矢量中的標(biāo)量值之間是高度相關(guān)的, 在這種情況下,一個(gè)分析幀,只需要一個(gè)在這種情況下,一個(gè)分析幀,只需要一個(gè) 2bits2bits對(duì)對(duì)4 4個(gè)濾波器系數(shù)進(jìn)行編碼,這樣降低了個(gè)濾波器系數(shù)進(jìn)行編碼,這樣降低了 所需的比特?cái)?shù)。矢量量化就是利用數(shù)據(jù)之間的所需的比特?cái)?shù)。矢量量化就是利用數(shù)據(jù)之間的 相關(guān)性來(lái)降低所需的比
7、特率。相關(guān)性來(lái)降低所需的比特率。 4.2 矢量量化的基本原理 一、矢量量化的基本原理 二、矢量量化在語(yǔ)音通信中的應(yīng)用 三、矢量量化在語(yǔ)音識(shí)別中的應(yīng)用 四、矢量量化的關(guān)鍵之處 1.1.基礎(chǔ)知識(shí) 一、矢量量化的基本原理 若干個(gè)標(biāo)量數(shù)據(jù)組成一個(gè)矢量,標(biāo)量的個(gè)數(shù)就為若干個(gè)標(biāo)量數(shù)據(jù)組成一個(gè)矢量,標(biāo)量的個(gè)數(shù)就為 矢量的維數(shù)。如語(yǔ)音信號(hào)某一幀中提取的聲道參數(shù),矢量的維數(shù)。如語(yǔ)音信號(hào)某一幀中提取的聲道參數(shù), 共共P P個(gè)個(gè),X,Xi i=a=ai1 i1,a ,ai2 i2,a ,aiP iP 。則 。則X Xi i是一個(gè)是一個(gè)P P維矢量。設(shè)維矢量。設(shè) 共有共有N N個(gè)個(gè)P P維矢量維矢量X=XX=X1 1
8、,X,X2 2,X,XN N,其中第其中第i i個(gè)矢量為個(gè)矢量為X Xi i, , i=1,2,Ni=1,2,N。類比過(guò)來(lái),。類比過(guò)來(lái),N N個(gè)語(yǔ)音幀,每幀中共有個(gè)語(yǔ)音幀,每幀中共有P P個(gè)個(gè) 聲道參數(shù),共組成聲道參數(shù),共組成N N個(gè)個(gè)P P維矢量。維矢量。 a a11 11,a ,a12 12,a ,a1K 1K a aN1 N1,a ,aN2 N2,a ,aNK NK 第第1 1幀幀第第N N幀幀 X X1 1=a=a11 11,a ,a12 12,a ,a1P 1P X X2 2=a=a21 21,a ,a22 22,.,a ,.,a2P 2P X XN N=a=aN1 N1,a ,aN
9、2 N2,.,a ,.,aNP NP N個(gè)矢量,每個(gè)矢量的維數(shù)為個(gè)矢量,每個(gè)矢量的維數(shù)為P 第一幀第一幀 第二幀第二幀 第第N幀幀 將一個(gè)將一個(gè)P維隨機(jī)矢量映射成另一個(gè)離散取值的實(shí)維隨機(jī)矢量映射成另一個(gè)離散取值的實(shí)P 維矢量的過(guò)程。維矢量的過(guò)程。 ()q XY 所有所有P P維矢量構(gòu)成了一個(gè)空間為維矢量構(gòu)成了一個(gè)空間為R RP P,無(wú)遺漏地劃,無(wú)遺漏地劃 分成分成J J個(gè)互不相交的子空間個(gè)互不相交的子空間R R1 1,R,R2 2RRJ J , ,將 將R Rj j稱為胞腔。稱為胞腔。 在每一個(gè)子空間在每一個(gè)子空間R Rj j找一代表矢量找一代表矢量Y Yj j,則,則J J個(gè)代表矢量個(gè)代表矢
10、量 可以組成矢量集為:可以組成矢量集為: Y=YY=Y1 1,Y,Y2 2,Y,YJ J 構(gòu)成了一個(gè)矢量量化器,構(gòu)成了一個(gè)矢量量化器,Y Y叫著叫著 碼本,碼本,J J稱為碼本長(zhǎng)度稱為碼本長(zhǎng)度, Y, Yj j稱為碼字,有:稱為碼字,有: Y Yj j=y=yj1 j1,y ,yj2 j2,y ,yjP jP , ,j=1,2,Jj=1,2,J。 2.2.矢量空間的劃分 舉例 以以P=2P=2為例來(lái)說(shuō)明。當(dāng)為例來(lái)說(shuō)明。當(dāng)P=2P=2時(shí),所得到的是二維時(shí),所得到的是二維 矢量。所有可能的二維矢量就構(gòu)成了一個(gè)平面。第矢量。所有可能的二維矢量就構(gòu)成了一個(gè)平面。第 i i個(gè)二維矢量記為:個(gè)二維矢量記為
11、: X Xi i=x=xi1 i1,x ,xi2 i2 。先把這個(gè)平面 。先把這個(gè)平面 劃分成劃分成J J塊互不相交的子區(qū)域,從每個(gè)子區(qū)域中找塊互不相交的子區(qū)域,從每個(gè)子區(qū)域中找 出一個(gè)代表矢量。如出一個(gè)代表矢量。如J=7J=7。 Y Y1 1 Y Y2 2 Y Y3 3 Y Y4 4 Y Y5 5 Y Y6 6 Y Y7 7 x1 x2 碼本碼本 Y=YY=Y1 1,Y,Y2 2,Y,YJ J 碼本長(zhǎng)度碼本長(zhǎng)度 J=7J=7 碼字碼字 Y Yj j=x=xj1 j1,x ,xj2 j2 , ,j=1,2,Jj=1,2,J 維數(shù)為維數(shù)為P P,碼本長(zhǎng)度為,碼本長(zhǎng)度為J J的矢量量化器的矢量量化
12、器Q Q定義:定義: 為從為從P P維歐幾里德空間維歐幾里德空間R RP P到一包含到一包含J J個(gè)輸出個(gè)輸出( (重構(gòu)重構(gòu)) ) 點(diǎn)的有限集合點(diǎn)的有限集合C C的映射,的映射, Q Q:R RP PCC,其中,其中C=yC=y1 1 ,y ,y2 2 , ,y , ,yJ J y yi i R RP P, ,i i1,J1,J 集合集合C C稱作稱作碼本或碼書(shū)碼本或碼書(shū),碼本長(zhǎng)度碼本長(zhǎng)度為為J J 。 碼本的碼本的J J個(gè)元素稱作個(gè)元素稱作碼字碼字或碼矢量,它們均或碼矢量,它們均 為為R RP P中的矢量,中的矢量,P P維矢量。維矢量。 矢量量化器定義:矢量量化器定義: An exampl
13、e of a 2-dimensional VQ is shown below: 當(dāng)給矢量量化器輸入一個(gè)任意矢量當(dāng)給矢量量化器輸入一個(gè)任意矢量X Xi i進(jìn)行矢量進(jìn)行矢量 量化時(shí),矢量量化器首先判斷它屬于那個(gè)子空間,量化時(shí),矢量量化器首先判斷它屬于那個(gè)子空間, 然后輸出該子空間的代表矢量然后輸出該子空間的代表矢量Y Yj j。矢量量化過(guò)程就。矢量量化過(guò)程就 是用是用Y Yj j代替代替X Xi i的過(guò)程。的過(guò)程。 Y Yj jQ(XQ(Xi i) 1) 1 j j J 1J 1 i i N N 3.3.矢量量化的過(guò)程 矢量矢量 量化器量化器 X Xi iY Yj j 當(dāng)給矢量量化器輸入一個(gè)任意矢
14、量當(dāng)給矢量量化器輸入一個(gè)任意矢量X Xi i進(jìn)行矢進(jìn)行矢 量量化時(shí),矢量量化器首先判斷它屬于那個(gè)子空量量化時(shí),矢量量化器首先判斷它屬于那個(gè)子空 間,如何判斷就是要依據(jù)一定的規(guī)則,選擇一個(gè)間,如何判斷就是要依據(jù)一定的規(guī)則,選擇一個(gè) 合適的失真測(cè)度,分別計(jì)算每個(gè)碼字代替合適的失真測(cè)度,分別計(jì)算每個(gè)碼字代替X Xi i所帶所帶 來(lái)的失真,當(dāng)確定產(chǎn)生最小失真的那個(gè)碼字來(lái)的失真,當(dāng)確定產(chǎn)生最小失真的那個(gè)碼字Y Yj j時(shí),時(shí), 就將就將X Xi i量化成量化成Y Yj j, Y Yj j就是就是X Xi i的重構(gòu)矢量(和恢復(fù)的重構(gòu)矢量(和恢復(fù) 矢量)。矢量)。 4.判斷規(guī)則 X Xi i=a=ai1 i
15、1,a ,ai2 i2,a ,aiP iP Y Y2 2 Y Y1 1= y y11 11,y ,y12 12,y ,y1P 1P Y Y2 2= y y21 21,y ,y22 22,y ,y2P 2P Y YJ J= y yJ1 J1,y ,yJ2 J2,y ,yJP JP 矢量量化器矢量量化器 (碼本)(碼本) 最小失真最小失真 計(jì)算失真計(jì)算失真 x 4 矢量量化矢量量化 3 3 2 3 1 3 2 2 2 1 3 4 341 1 1 3 4 碼書(shū)碼書(shū) 碼字碼字c0 碼字碼字c1 碼字碼字c2 碼字碼字c3 索引索引0 d(x,c0)=5 d(x,c1)=11 d(x,c2)=8 d(x
16、,c3)=8 argmind(x,cj) x 4 1 2 )(),( i ii cxCXd 圖像編碼例子:圖像編碼例子: 原圖象塊(原圖象塊(4灰度級(jí),矢量維數(shù)灰度級(jí),矢量維數(shù) k=44=16) x 0 1 2 3 碼書(shū)碼書(shū)C y0, y1 , y2, y3 y0 y1 y2 y3 碼字碼字y1最接近輸入矢量圖象塊最接近輸入矢量圖象塊 x,故用索引,故用索引“01”編編 碼碼 d(x,y0)=25 d(x,y1)=5 d(x,y2)=25 d(x,y3)=46 標(biāo)量量化是維數(shù)為標(biāo)量量化是維數(shù)為1的矢量量化。一般矢量量化均指的矢量量化。一般矢量量化均指 大于大于1的多維量化。的多維量化。 一個(gè)一
17、個(gè)P維最佳矢量量化器的性能總是優(yōu)于維最佳矢量量化器的性能總是優(yōu)于P個(gè)最佳標(biāo)量個(gè)最佳標(biāo)量 量化器。量化器。 在相同的編碼速率下,矢量量化的失真明顯比標(biāo)量量在相同的編碼速率下,矢量量化的失真明顯比標(biāo)量量 化的失真??;而在相同的失真條件下,矢量量化所需化的失真??;而在相同的失真條件下,矢量量化所需 的碼速率比標(biāo)量量化所需的碼速率低得多。的碼速率比標(biāo)量量化所需的碼速率低得多。 由于矢量量化的復(fù)雜度隨矢量維數(shù)成指數(shù)形式增加,由于矢量量化的復(fù)雜度隨矢量維數(shù)成指數(shù)形式增加, 故矢量量化的復(fù)雜度比標(biāo)量量化的復(fù)雜度高故矢量量化的復(fù)雜度比標(biāo)量量化的復(fù)雜度高。 標(biāo)量量化和矢量量化比較標(biāo)量量化和矢量量化比較 二、矢量
18、量化在語(yǔ)音通信中的應(yīng)用 通信系統(tǒng)中有通信系統(tǒng)中有兩個(gè)完全相同的碼本兩個(gè)完全相同的碼本,一個(gè)在,一個(gè)在編碼編碼 器(發(fā)送端),器(發(fā)送端),另一個(gè)在另一個(gè)在解碼器(接收端)解碼器(接收端)。每個(gè)碼。每個(gè)碼 本包含本包含J J個(gè)碼字個(gè)碼字Y Yj j, ,每個(gè)碼字是一個(gè)每個(gè)碼字是一個(gè)P P維矢量。維矢量。VQVQ編碼器編碼器 的運(yùn)行原理是根據(jù)輸入矢量的運(yùn)行原理是根據(jù)輸入矢量X Xi i從編碼器碼本中選擇一從編碼器碼本中選擇一 個(gè)與之失真誤差最小的碼字個(gè)與之失真誤差最小的碼字Y Yj j ,其輸出的,其輸出的V V就是該碼就是該碼 字的下標(biāo),字的下標(biāo),V V是一個(gè)數(shù)字,因而可以通過(guò)任何數(shù)字信是一個(gè)數(shù)
19、字,因而可以通過(guò)任何數(shù)字信 道傳輸或任何數(shù)字存儲(chǔ)器來(lái)存儲(chǔ)。如在編碼速率為道傳輸或任何數(shù)字存儲(chǔ)器來(lái)存儲(chǔ)。如在編碼速率為 2.4kbit/s2.4kbit/s的的LPCLPC聲碼器中,將每幀的聲碼器中,將每幀的1010個(gè)預(yù)測(cè)系數(shù)加個(gè)預(yù)測(cè)系數(shù)加 以以1010維的矢量量化,編碼速率降低到維的矢量量化,編碼速率降低到800bit/s800bit/s,而語(yǔ),而語(yǔ) 音質(zhì)量沒(méi)有下降。音質(zhì)量沒(méi)有下降。 特征特征 矢量矢量 形成形成 語(yǔ)音語(yǔ)音 信號(hào)信號(hào) 幀幀Xi 碼本碼本 Y1 Y2 YJ VQ 編碼編碼 器器 傳輸傳輸 或或 存儲(chǔ)存儲(chǔ) V VQ 譯碼譯碼 器器 V Yj 碼本碼本 Y1 Y2 YJ 矢量量化在語(yǔ)
20、音通信中的應(yīng)用矢量量化在語(yǔ)音通信中的應(yīng)用 信信 源源 用用LBG(GLA)算算 法生成法生成 最近鄰最近鄰 搜索搜索 信信 宿宿 查表查表 信道信道 索引索引索引索引 碼書(shū)碼書(shū)碼書(shū)碼書(shū) 輸入輸入 矢量矢量 輸出輸出 矢量矢量 編碼編碼 器器 解碼解碼 器器 矢量量化編碼與解碼結(jié)構(gòu)圖:矢量量化編碼與解碼結(jié)構(gòu)圖: XX1 1 , X , X2 2 , , X , , XN N 模板庫(kù)模板庫(kù) 語(yǔ)語(yǔ) 碼本碼本 YY1 1 ,Y ,Y2 2 ,Y ,YJ J 學(xué)學(xué) 碼本碼本 音音 碼本碼本 文文 碼本碼本 wenwen 22 , 4, , 1, 4, , 1 N個(gè)特征矢量個(gè)特征矢量 三、矢量量化在語(yǔ)音識(shí)
21、別中的應(yīng)用 先對(duì)系統(tǒng)中的每個(gè)字,做一個(gè)碼本作為該字先對(duì)系統(tǒng)中的每個(gè)字,做一個(gè)碼本作為該字 的參考(標(biāo)準(zhǔn))模板的參考(標(biāo)準(zhǔn))模板, ,共有共有M M個(gè)字,故共有個(gè)字,故共有M M個(gè)碼個(gè)碼 本,組成一個(gè)模板庫(kù)。本,組成一個(gè)模板庫(kù)。 識(shí)別時(shí),對(duì)于任意輸入的語(yǔ)音識(shí)別時(shí),對(duì)于任意輸入的語(yǔ)音特征矢量序列特征矢量序列X X XX1 1 , X , X2 2 , , X , , XN N ,計(jì)算該序列中每一個(gè)特,計(jì)算該序列中每一個(gè)特 征矢量對(duì)模板庫(kù)中的每個(gè)碼本的總平均失真量誤征矢量對(duì)模板庫(kù)中的每個(gè)碼本的總平均失真量誤 差,找出最小的失真誤差對(duì)應(yīng)的碼本(代表一個(gè)差,找出最小的失真誤差對(duì)應(yīng)的碼本(代表一個(gè) 字),
22、將對(duì)應(yīng)的字輸出作為識(shí)別的結(jié)果。字),將對(duì)應(yīng)的字輸出作為識(shí)別的結(jié)果。 特征矢量序列特征矢量序列 X XXX1 1 , X , X2 2 , , X , , XN N 模板庫(kù)模板庫(kù) Y Y1 1 , Y , Y2 2 , , Y , , YM M 特征矢量特征矢量 序列形成序列形成 任意任意 語(yǔ)音語(yǔ)音 X X 碼本碼本 Y Y1 1 Y Y2 2 Y YM M 計(jì)算計(jì)算 失真誤差失真誤差 判決判決 輸出結(jié)果輸出結(jié)果Y Yi i 每一個(gè)字做一每一個(gè)字做一 個(gè)碼本,共個(gè)碼本,共M M個(gè)字個(gè)字 模板庫(kù)模板庫(kù) XX1 1 , X , X2 2 , , X , , XN N 模板庫(kù)模板庫(kù) 語(yǔ)語(yǔ) 碼本碼本 Y
23、Y1 1 ,Y ,Y2 2 ,Y ,YN N 學(xué)學(xué) 碼本碼本 音音 碼本碼本 文文 碼本碼本 wenwen 四、矢量量化的關(guān)鍵之處 1. 1. 首先設(shè)計(jì)首先設(shè)計(jì)一個(gè)一個(gè)好好碼本。關(guān)鍵在于如何劃分碼本。關(guān)鍵在于如何劃分 J J個(gè)區(qū)域邊界。這需要大量的輸入信號(hào)矢量,經(jīng)個(gè)區(qū)域邊界。這需要大量的輸入信號(hào)矢量,經(jīng) 過(guò)統(tǒng)計(jì)實(shí)驗(yàn)才能確定,這個(gè)過(guò)程稱為過(guò)統(tǒng)計(jì)實(shí)驗(yàn)才能確定,這個(gè)過(guò)程稱為“訓(xùn)練訓(xùn)練”或或 “學(xué)習(xí)學(xué)習(xí)”。 應(yīng)用聚類算法,按照一定的應(yīng)用聚類算法,按照一定的失真度準(zhǔn)則失真度準(zhǔn)則(失 真測(cè)度),對(duì)訓(xùn)練的數(shù)據(jù)進(jìn)行,對(duì)訓(xùn)練的數(shù)據(jù)進(jìn)行分類分類,從而把訓(xùn),從而把訓(xùn) 練數(shù)據(jù)在多維空間中劃分成一個(gè)以碼字為中心的練數(shù)據(jù)
24、在多維空間中劃分成一個(gè)以碼字為中心的 胞腔,常用的是胞腔,常用的是LBGLBG算法來(lái)實(shí)現(xiàn)。算法來(lái)實(shí)現(xiàn)。 2. 2. 未知矢量的量化。按照選定的未知矢量的量化。按照選定的失真度準(zhǔn)則失真度準(zhǔn)則 (失真測(cè)度),把未知矢量,量化為失真度最,把未知矢量,量化為失真度最 小的碼字。小的碼字。 失真測(cè)度就是兩矢量之間的失真測(cè)度就是兩矢量之間的距離距離。 7.3 矢量量化的失真測(cè)度 一、失真測(cè)度的定義 二、歐氏距離測(cè)度 三、線性預(yù)測(cè)失真測(cè)度 四、識(shí)別失真測(cè)度 一、失真測(cè)度的定義 失真測(cè)度(距離測(cè)度)就是將輸入矢量失真測(cè)度(距離測(cè)度)就是將輸入矢量X Xi i用碼用碼 本重構(gòu)矢量本重構(gòu)矢量Y Yj j來(lái)表征時(shí)所
25、產(chǎn)生的來(lái)表征時(shí)所產(chǎn)生的誤差或失真的度量誤差或失真的度量 方法方法,它可以描述兩個(gè)或多個(gè)模型矢量之間的相,它可以描述兩個(gè)或多個(gè)模型矢量之間的相 似程度。常用的失真測(cè)度為歐氏距離測(cè)度、加權(quán)似程度。常用的失真測(cè)度為歐氏距離測(cè)度、加權(quán) 歐氏距離測(cè)度和識(shí)別失真測(cè)度。歐氏距離測(cè)度和識(shí)別失真測(cè)度。 K K維語(yǔ)音特征矢量維語(yǔ)音特征矢量X X和碼本和碼本Y Y的失真測(cè)度的失真測(cè)度d(X,Y)d(X,Y)需需 滿足滿足下列條件下列條件: (1 1)對(duì)稱性)對(duì)稱性 d(X,Y)d(X,Y)d(Y,X) d(Y,X) (2 2)正值性)正值性 d(X,Y)0,d(X,X)=0 d(X,Y)0,d(X,X)=0 (3
26、3)d(X,Y)=d(X,Z)+d(Z,Y)d(X,Y)=d(X,Z)+d(Z,Y) (4 4)對(duì))對(duì)d(X,Y)d(X,Y)有高效率的計(jì)算方法有高效率的計(jì)算方法 二、歐氏距離測(cè)度 K K維特征矢量:維特征矢量: X Xi ixxi1 i1 , x , xi2 i2 , , x , , xiK iK Y Yj jyyj1 j1 , y , yj2 j2 , , y , , yjK jK K i ii yx K YXd 1 2 2 )( 1 ),( 1.1.均方誤差歐氏距離均方誤差歐氏距離 K i ii yx K YXd 1 1 | 1 ),( 2.2.絕對(duì)值平均誤差絕對(duì)值平均誤差 3.3.加權(quán)
27、歐氏距離測(cè)度加權(quán)歐氏距離測(cè)度 K i ii yxiw K YXd 1 2 )( 1 ),( 三、線性預(yù)測(cè)失真測(cè)度 當(dāng)語(yǔ)音信號(hào)特征矢量使用線性預(yù)測(cè)方法求出當(dāng)語(yǔ)音信號(hào)特征矢量使用線性預(yù)測(cè)方法求出 的的LPCLPC系數(shù)時(shí),系數(shù)時(shí),不宜直接用歐氏距離。不宜直接用歐氏距離。應(yīng)該直接應(yīng)該直接 用預(yù)測(cè)系數(shù)所描述的信號(hào)模型的用預(yù)測(cè)系數(shù)所描述的信號(hào)模型的功率譜功率譜來(lái)進(jìn)行來(lái)進(jìn)行 比較。通過(guò)推導(dǎo),采用對(duì)數(shù)似然比失真測(cè)度和比較。通過(guò)推導(dǎo),采用對(duì)數(shù)似然比失真測(cè)度和 模型失真測(cè)度。模型失真測(cè)度。 Raa aRa YXd T T LLR )( ln),( 1.1.對(duì)數(shù)似然比失真測(cè)度對(duì)數(shù)似然比失真測(cè)度 R R是輸入語(yǔ)音信號(hào)
28、的是輸入語(yǔ)音信號(hào)的(p(p1)1)(p+1p+1)自相關(guān)矩)自相關(guān)矩 陣陣 ,., 1 21p T aaaa 輸入語(yǔ)音信號(hào)的預(yù)輸入語(yǔ)音信號(hào)的預(yù) 測(cè)系數(shù)矢量測(cè)系數(shù)矢量 ,., 1)( 21p T aaaa 碼字預(yù)測(cè)系數(shù)矢量碼字預(yù)測(cè)系數(shù)矢量 )0()2()( )2()0() 1 ( )() 1 ()0( nnn nnn nnn RpRpR pRRR pRRR R 1 )( ),( Raa aRa YXd T T M 2. 2. 模型失真測(cè)度模型失真測(cè)度 R R是輸入語(yǔ)音信號(hào)的是輸入語(yǔ)音信號(hào)的(p+1)(p+1)(p+1p+1)自相關(guān)矩陣)自相關(guān)矩陣 ,., 1 21p T aaaa 輸入語(yǔ)音信號(hào)的
29、預(yù)輸入語(yǔ)音信號(hào)的預(yù) 測(cè)系數(shù)矢量測(cè)系數(shù)矢量 ,., 1)( 21p T aaaa 碼字預(yù)測(cè)系數(shù)矢量碼字預(yù)測(cè)系數(shù)矢量 7.4 矢量量化的最佳碼本設(shè)計(jì) 一、最佳碼本設(shè)計(jì)的原則 二、LBG算法 三、碼字搜索 碼本設(shè)計(jì)碼本設(shè)計(jì) 碼字搜索碼字搜索 碼字索引分配碼字索引分配 . . . . . . x 訓(xùn)練集合訓(xùn)練集合X M 訓(xùn)練矢量訓(xùn)練矢量 . . . . . . . 碼本碼本C y1 y2 yN N 個(gè)碼字個(gè)碼字 . . . . . . . x d(x,y1) d(x,y0) d(x, yN-1) min d(x,yj) 碼本碼本C y0 y1 yN-1 所謂最佳設(shè)計(jì),就是從大量信號(hào)樣本中訓(xùn)所謂最佳設(shè)計(jì)
30、,就是從大量信號(hào)樣本中訓(xùn) 練出好的碼本;從實(shí)際效果出發(fā)尋找到好的失練出好的碼本;從實(shí)際效果出發(fā)尋找到好的失 真測(cè)度定義公式;用最少的搜索和計(jì)算失真的真測(cè)度定義公式;用最少的搜索和計(jì)算失真的 運(yùn)算量。運(yùn)算量。 一、最佳碼本設(shè)計(jì)的原則 最佳碼本的設(shè)計(jì),就是在一定條件下,使得最佳碼本的設(shè)計(jì),就是在一定條件下,使得 d(X,Y)d(X,Y)的統(tǒng)計(jì)平均最小。需滿足下列條件:的統(tǒng)計(jì)平均最小。需滿足下列條件: (1 1)最鄰)最鄰近近準(zhǔn)則;根據(jù)該條件對(duì)信號(hào)空間進(jìn)行最佳準(zhǔn)則;根據(jù)該條件對(duì)信號(hào)空間進(jìn)行最佳 劃分,得到劃分,得到S Sl l稱為一個(gè)胞腔。稱為一個(gè)胞腔。 (2 2)所有選擇碼字)所有選擇碼字Y Yl
31、 l的輸入矢量的輸入矢量X X的集合為的集合為S Sl l, Y Yl l 是是S Sl l中所有矢量的質(zhì)心。根據(jù)這兩條原則,這個(gè)算中所有矢量的質(zhì)心。根據(jù)這兩條原則,這個(gè)算 法就是法就是LBGLBG算法。算法。 l SX l l X N Y 1N Nl l為集合中矢量的個(gè)數(shù)為集合中矢量的個(gè)數(shù) JiliYXdYXdRXS il K l , 1,);,(),(: x x x x x x x x x x x i S K S ),(),(: ik K k YXdYXdRXS k Y i Y k SX k k X N Y 1 i SX i i X N Y 1 質(zhì)心的形成質(zhì)心的形成 X1( 220, 40
32、0, 430, 390, 300 )X1( 220, 400, 430, 390, 300 ) X2( 220, 400, 410, 380, 310 )X2( 220, 400, 410, 380, 310 ) X3( 220, 450, 410, 390, 300 )X3( 220, 450, 410, 390, 300 ) X4( 220, 450, 420, 370, 290 )X4( 220, 450, 420, 370, 290 ) 所有選擇碼字所有選擇碼字Y Y的輸入矢量的輸入矢量X X的集合為的集合為S S, Y Y是是S S中所有矢量的質(zhì)心。中所有矢量的質(zhì)心。 300,5.3
33、82,425,220XXXX 4 1 XXXX 4 11 4321 4321 SX X N Y LBG LBG算法是一種遞推算法,從一個(gè)事先選定的算法是一種遞推算法,從一個(gè)事先選定的 初始碼本開(kāi)始迭代。把訓(xùn)練序列按照碼本中的元素初始碼本開(kāi)始迭代。把訓(xùn)練序列按照碼本中的元素 根據(jù)最鄰近準(zhǔn)則分組,對(duì)每一分組找質(zhì)心,得到新根據(jù)最鄰近準(zhǔn)則分組,對(duì)每一分組找質(zhì)心,得到新 的碼本,又作為初始碼本,再進(jìn)行分組,重復(fù)上述的碼本,又作為初始碼本,再進(jìn)行分組,重復(fù)上述 過(guò)程,直到系統(tǒng)性能滿足要求和不再有明顯的改進(jìn)過(guò)程,直到系統(tǒng)性能滿足要求和不再有明顯的改進(jìn) 為止。為止。 二、LBG算法 (1 1)初始碼本的選擇)
34、初始碼本的選擇 隨機(jī)選取法:從訓(xùn)練序列中隨機(jī)選取隨機(jī)選取法:從訓(xùn)練序列中隨機(jī)選取J J個(gè)矢?jìng)€(gè)矢 量作為初始碼字,從而構(gòu)成初始碼本。量作為初始碼字,從而構(gòu)成初始碼本。 . . . . . . x . . . . 訓(xùn)練集合訓(xùn)練集合X . . 初始碼本初始碼本 J=2J=2個(gè)碼字個(gè)碼字 (1 1)求出)求出S S中全體訓(xùn)練序列的質(zhì)心中全體訓(xùn)練序列的質(zhì)心 (2 2)然后在)然后在S S中找一個(gè)與此質(zhì)心的失真測(cè)度最大的中找一個(gè)與此質(zhì)心的失真測(cè)度最大的 矢量矢量 ,再在再在S S中找一個(gè)與中找一個(gè)與 的失真測(cè)度最大的矢量的失真測(cè)度最大的矢量 (3 3)以)以 和和 為基準(zhǔn),根據(jù)最鄰近準(zhǔn)則,進(jìn)行為基準(zhǔn),根據(jù)
35、最鄰近準(zhǔn)則,進(jìn)行S S 的劃分,得到兩個(gè)子集的劃分,得到兩個(gè)子集 和和 ,求其質(zhì)心;,求其質(zhì)心; (4 4)對(duì)這兩個(gè)子集分別按同樣方法進(jìn)行處理,可以)對(duì)這兩個(gè)子集分別按同樣方法進(jìn)行處理,可以 得到四個(gè)子集。依次類推,經(jīng)過(guò)得到四個(gè)子集。依次類推,經(jīng)過(guò)r r次分裂,得到次分裂,得到J=2J=2r r 個(gè)子集,分別求子集的質(zhì)心,得到個(gè)子集,分別求子集的質(zhì)心,得到J J個(gè)初始碼字,構(gòu)個(gè)初始碼字,構(gòu) 成初始碼本。成初始碼本。 分裂法分裂法 0 1 Y ii XYXd),(max 0 1 kik XXXd),(max i X i X k X i S K S x x x x x x x x x x x x
36、x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x質(zhì)心質(zhì)心 x x x x x x x x x x x ii XYXd),(max 0 1 x x x x x x x x x x x kik XXXd),(max i S K S k SX k X N Y 1 1 1 分裂分裂1 1次,得到次,得到2 2個(gè)碼字個(gè)碼字 J=2 2J=2 2個(gè)碼字的初始碼本構(gòu)成個(gè)碼字的初始碼本構(gòu)成 ),(),(: ikk XXdXXdSXS S i SX i X N Y 1 1 2 SX X N Y 1 0 1 (2)最佳碼本的設(shè)計(jì))最佳碼
37、本的設(shè)計(jì) 第一步:初始化。給定全部參考矢量集合第一步:初始化。給定全部參考矢量集合S S,設(shè)定,設(shè)定 失真控制門(mén)限失真控制門(mén)限 , , 算法最大迭代次數(shù)算法最大迭代次數(shù)L,L,以及初始碼以及初始碼 本本 ,設(shè)置總失真,設(shè)置總失真 ,初始迭代,初始迭代 次數(shù)次數(shù)m=1m=1,最大迭代次數(shù)為,最大迭代次數(shù)為L(zhǎng) L。 第二步:迭代。第二步:迭代。 (1 1)根據(jù)最鄰近準(zhǔn)則將)根據(jù)最鄰近準(zhǔn)則將S S分成分成J J個(gè)子集,個(gè)子集, (2 2)計(jì)算總失真)計(jì)算總失真 00 2 0 1J YYY )0( D m J mm SSS 21 JlJili YXdYXdRX S m i m l K m l , 1;
38、, 1, );,(),(: 11 J lSX m l m m l YXdD 1 1) ,( (3 3)計(jì)算新碼字:每一個(gè)碼字為其對(duì)應(yīng)子集的質(zhì)心。)計(jì)算新碼字:每一個(gè)碼字為其對(duì)應(yīng)子集的質(zhì)心。 (4 4)計(jì)算相對(duì)失真改進(jìn)量,)計(jì)算相對(duì)失真改進(jìn)量, 與與失真控制門(mén)限比較,失真控制門(mén)限比較, 轉(zhuǎn)入(轉(zhuǎn)入(5 5);); 轉(zhuǎn)入(轉(zhuǎn)入(6 6)。)。 (5 5)若)若m m大于大于L L,則轉(zhuǎn)入,則轉(zhuǎn)入(6)(6),否則,否則m+1m+1,轉(zhuǎn)入,轉(zhuǎn)入(1)(1) (6 6)得到最終的碼書(shū))得到最終的碼書(shū) m J mm YYY 21 m l SXl m l X N Y 1 m mm m D DD| 1 m
39、m m J mm YYY 21 x x x x x x x x x x x xx x x x x x x x x S x x x x x x x x x x x xx x x x x x x x x 1 4 1 3 1 2 1 1 SSSS J=4,m=1 0 4 0 3 0 2 0 1 YYYY 4, 2 , 1, );,(),(: 00 1 lili YXdYXdRX S il K l 4 1 01 ),( lSX l m l YXdD x x x x x x x x x x x x x x x x x x x x x 新碼字新碼字 1 4 1 3 1 2 1 1 YYYY 1 10 1
40、| D DD 1 if m+1=2m+1=2重新開(kāi)始重新開(kāi)始 2 4 2 3 2 2 2 1 SSSS 4, 2 , 1, );,(),(: 11 2 lili YXdYXdRX S il K l 4 1 22 ),( lSX l m l YXdD 新碼字新碼字 2 4 2 3 2 2 2 1 YYYY 2 21 2 | D DD 2 if m+1=3m+1=3重新開(kāi)始重新開(kāi)始 1 4 1 3 1 2 1 1 YYYY x x x x x x x x x x x x x x x x x x x x x J=4,m=2 x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x 最佳碼本的設(shè)計(jì)方法之一:遺傳算法最佳碼本的設(shè)計(jì)方法之一:遺傳算法 (Genetic Algorithm,GAGenetic Al
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版?zhèn)€體廂貨車出租及車輛監(jiān)控系統(tǒng)合同3篇
- 2025版土地居間業(yè)務(wù)規(guī)范化合同書(shū)(2025版)6篇
- 2025版建筑塑料材料買(mǎi)賣合同范本解讀3篇
- 《手機(jī)送分析》課件
- 【中學(xué)課件】香港和澳門(mén)
- 二零二五版汽車銷售退換貨處理合同模板2篇
- 二零二五版智慧城市建設(shè)項(xiàng)目工程勘察設(shè)計(jì)勞務(wù)分包合同3篇
- 家用紡織品的消費(fèi)趨勢(shì)與市場(chǎng)需求預(yù)測(cè)考核試卷
- 《波爾多液配制》課件
- 2025版事業(yè)單位聘用合同起草與審查要點(diǎn)3篇
- 2024-2025學(xué)年山東省濰坊市高一上冊(cè)1月期末考試數(shù)學(xué)檢測(cè)試題(附解析)
- 數(shù)學(xué)-湖南省新高考教學(xué)教研聯(lián)盟(長(zhǎng)郡二十校聯(lián)盟)2024-2025學(xué)年2025屆高三上學(xué)期第一次預(yù)熱演練試題和答案
- 決勝中層:中層管理者的九項(xiàng)修煉-記錄
- 幼兒園人民幣啟蒙教育方案
- 高考介詞練習(xí)(附答案)
- 單位就業(yè)人員登記表
- 衛(wèi)生監(jiān)督協(xié)管-醫(yī)療機(jī)構(gòu)監(jiān)督
- 記錄片21世紀(jì)禁愛(ài)指南
- 腰椎間盤(pán)的診斷證明書(shū)
- 移動(dòng)商務(wù)內(nèi)容運(yùn)營(yíng)(吳洪貴)任務(wù)七 裂變傳播
- 單級(jí)倒立擺系統(tǒng)建模與控制器設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論