![語(yǔ)音壓縮算法測(cè)評(píng)及質(zhì)量評(píng)估_第1頁(yè)](http://file4.renrendoc.com/view/6f8438456222ad8de8107dd8ac29c30c/6f8438456222ad8de8107dd8ac29c30c1.gif)
![語(yǔ)音壓縮算法測(cè)評(píng)及質(zhì)量評(píng)估_第2頁(yè)](http://file4.renrendoc.com/view/6f8438456222ad8de8107dd8ac29c30c/6f8438456222ad8de8107dd8ac29c30c2.gif)
![語(yǔ)音壓縮算法測(cè)評(píng)及質(zhì)量評(píng)估_第3頁(yè)](http://file4.renrendoc.com/view/6f8438456222ad8de8107dd8ac29c30c/6f8438456222ad8de8107dd8ac29c30c3.gif)
![語(yǔ)音壓縮算法測(cè)評(píng)及質(zhì)量評(píng)估_第4頁(yè)](http://file4.renrendoc.com/view/6f8438456222ad8de8107dd8ac29c30c/6f8438456222ad8de8107dd8ac29c30c4.gif)
![語(yǔ)音壓縮算法測(cè)評(píng)及質(zhì)量評(píng)估_第5頁(yè)](http://file4.renrendoc.com/view/6f8438456222ad8de8107dd8ac29c30c/6f8438456222ad8de8107dd8ac29c30c5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
語(yǔ)音壓縮的基本依據(jù)從信息保持的角度講,只有當(dāng)信源本身具有冗余度,才能對(duì)其進(jìn)行壓縮。根據(jù)統(tǒng)計(jì)分析的結(jié)果,語(yǔ)音信號(hào)中存在著多種冗余度m,主要有以下幾個(gè)方面:幅度非均勻分布語(yǔ)音中小幅度樣本比大幅度樣本出現(xiàn)的概率要高。又由于通話必然會(huì)有間隙,更出現(xiàn)了大It的低電平樣本。此外,實(shí)際語(yǔ)音信號(hào)的功率電平也趨向于出現(xiàn)在編碼范圍的較低電平端。因此,語(yǔ)音信號(hào)的幅值分布是非均勻的。樣本之間的相關(guān)性對(duì)語(yǔ)音信號(hào)的波形分析表明to,采樣數(shù)據(jù)的最大相關(guān)性存在于鄰近樣本之間。當(dāng)采樣速率為8KHz時(shí),相鄰采樣值之間的相關(guān)系數(shù)大于0.85,甚至在相距十個(gè)樣本之間,相關(guān)系數(shù)還有0.3左右的數(shù)it級(jí)。如果采樣速率提高,樣本間的相關(guān)性將更強(qiáng)。周期之間的相關(guān)性雖然電話語(yǔ)音信號(hào)的頻率分布在300-3400HZ的頻帶內(nèi),但在特定的瞬間,某一聲音卻往往只是該頻帶內(nèi)的少數(shù)頻率分I起作用。當(dāng)聲音中只存在少數(shù)幾個(gè)基本頻率時(shí),就會(huì)像某些振蕩波形一樣,在周期與周期之間存在著一定的相關(guān)性?;糁g的相關(guān)性語(yǔ)音可以分為清音和濁音兩種基本類(lèi)型.濁音是由聲帶振動(dòng)產(chǎn)生,每一次振動(dòng)使一股空氣從肺部流進(jìn)聲道。激勵(lì)聲道的各股空氣之間的間隔稱(chēng)為基音周期。濁音的波形對(duì)應(yīng)于基音周期的長(zhǎng)期重復(fù)波形。因此,對(duì)語(yǔ)音濁音部分編碼的有效方法之一是對(duì)一個(gè)基音周期波形進(jìn)行編碼,并以它作為其它基音段的模板。此外,電話通信中還有很大的話音間隙。通話分析表明,語(yǔ)音間隙約占通話時(shí)間的60%。這本身也是一種冗余。正是由于語(yǔ)音信號(hào)具有以上特點(diǎn),對(duì)語(yǔ)音的壓縮編碼才成為可能。在現(xiàn)今的通信系統(tǒng)當(dāng)中,各種語(yǔ)音壓縮編碼得到了廣泛的應(yīng)用,并形成了一系列的語(yǔ)音編碼標(biāo)準(zhǔn)。語(yǔ)音壓縮編碼技術(shù)大大緩解了信道緊張的狀況。語(yǔ)音壓縮技術(shù)的發(fā)展概況語(yǔ)音編碼器的主要功能就是把用戶語(yǔ)音的PCM(脈沖編碼調(diào)制)樣值編碼成少量的比特(幀)。這種方法使得語(yǔ)音在鏈路產(chǎn)生誤碼、網(wǎng)絡(luò)抖動(dòng)和突發(fā)傳輸時(shí)具有健壯性。在接收端,語(yǔ)音幀先被解碼為PCM語(yǔ)音樣值,然后再轉(zhuǎn)換成語(yǔ)音波形。語(yǔ)音信號(hào)的數(shù)字編碼方法主要分成三類(lèi):波形編碼、參數(shù)編碼和混合編碼,其編碼質(zhì)量大致如圖2所示,表2給出了各種編碼方法的典型例子。波形編碼是對(duì)語(yǔ)音時(shí)域或頻域波形進(jìn)行編碼,由于這種系統(tǒng)保留原始樣值的細(xì)節(jié),從而保留了信號(hào)的各種過(guò)度特征,因此解碼聲音質(zhì)量較高,但此系統(tǒng)編碼碼率較高,壓縮比不大。參數(shù)編碼的基礎(chǔ)是利用人類(lèi)語(yǔ)音的生成模型,這樣在傳輸過(guò)程中只需要傳送模型的參數(shù),大大降低了系統(tǒng)的碼率,特別適合于無(wú)線通信,保密和軍事通信領(lǐng)域。參數(shù)編碼的缺點(diǎn)在于恢復(fù)的語(yǔ)音質(zhì)量較差。采用參數(shù)編碼方法的編碼器有時(shí)稱(chēng)為聲碼器。正因?yàn)樯鲜鰞煞N編碼存在著不足,因此人們又想到了混合編碼的方法?;旌暇幋a是波形編碼和參數(shù)編碼的結(jié)合。它既利用了語(yǔ)音的生成模型,減少了傳輸碼率,又使解碼的語(yǔ)音產(chǎn)生接近原始語(yǔ)音的波形,以保留說(shuō)話人的各種自然特征,因此當(dāng)前各種國(guó)際標(biāo)準(zhǔn)通常采用這種方法。第一個(gè)語(yǔ)音壓縮系統(tǒng)是1939年貝爾實(shí)驗(yàn)室的H.Duddlyf發(fā)明的通道聲碼器.1938年Reeves提出PCM(脈沖編碼調(diào)制)編碼,后來(lái)成為現(xiàn)代電話系統(tǒng)的常規(guī)語(yǔ)音編碼方式,1977年被ITU-T采用為G.711標(biāo)準(zhǔn)建議。64Kbps速率的PCM方式,采樣速率為8K,每個(gè)采樣點(diǎn)盆化為8bit?,F(xiàn)在所說(shuō)的語(yǔ)音壓縮編碼,都是相對(duì)于64Kbps的PCM標(biāo)準(zhǔn)而言。1946年Delorain提出了增量調(diào)制(0M),1952年貝爾公司的Culter取得了差分脈沖編碼調(diào)制(DPCM)的專(zhuān)利。為了進(jìn)一步降低編碼速率,以后又陸續(xù)提出了一些編碼方案。1988年制定的G.722建議采用32Kbps的ADPCM編碼,雖然碼率較高,但是實(shí)現(xiàn)簡(jiǎn)單,且音質(zhì)很好,在目前的ISDN系統(tǒng)中仍然使用這一編碼方案.1992年制定的ITU-TG.728建議,采用LD-CELP(低延遲碼激勵(lì)線性預(yù)測(cè)),編碼速率達(dá)到16Kbps,1995年制定的G.723.1建議,采用改進(jìn)的激勵(lì)線性預(yù)測(cè)編碼,編碼速率達(dá)到5.3/6.3Kbps。目前,歐洲的GSM通信系統(tǒng)采用的是13Kbps的RPE-LTP(規(guī)則脈沖激勵(lì)長(zhǎng)周期預(yù)測(cè))壓縮編碼方案,同時(shí)正在開(kāi)發(fā)6.5Kbps的CELP方案作為它的半速率標(biāo)準(zhǔn)方案。近年來(lái),低比特率語(yǔ)音編碼(8Kbps以下)的研究取得了很大的飛躍.美國(guó)先后公布了4.8Kbps的CELP編碼,2.4Kbps的MELP編碼,目前甚至出現(xiàn)了速率在1Kbps左右的語(yǔ)音編碼算法noimi由于這些算法的延時(shí)都比較大,一般在20-80ms,還沒(méi)有被米用為國(guó)際標(biāo)準(zhǔn)。隨著算法的進(jìn)一步改進(jìn),其應(yīng)用前景將更加廣闊。語(yǔ)音編碼器的性能測(cè)評(píng)評(píng)估編碼器的性能時(shí)要考慮幾個(gè)重要因素:?幀大?。簬拇笮”硎菊Z(yǔ)音流量的時(shí)間長(zhǎng)度,也稱(chēng)為幀時(shí)延。幀是語(yǔ)音信號(hào)的分立部件,且每幀是根據(jù)語(yǔ)音樣點(diǎn)更新的。?處理時(shí)延:它表示在編碼器中對(duì)一幀語(yǔ)音做編碼算法處理所需時(shí)間。它通常簡(jiǎn)單計(jì)入幀時(shí)延。處理時(shí)延好稱(chēng)為算法時(shí)延。?前視時(shí)延:編碼器為了對(duì)當(dāng)前幀的編碼提供幫助而檢查下一幀的一定長(zhǎng)度,此長(zhǎng)度就稱(chēng)為前視時(shí)延。前視的想法是為了利用相鄰語(yǔ)音幀之間的密切相關(guān)性。幀長(zhǎng)度:這個(gè)值表示經(jīng)編碼處理后的字節(jié)數(shù)(不包括幀頭)。語(yǔ)音比特率:當(dāng)編解碼器的輸入是標(biāo)準(zhǔn)脈沖編碼調(diào)制的語(yǔ)音碼流(比特率為64kbit/s)時(shí),編解碼器的輸出速率。?DSPMIPS:此值是指支持特定編碼器的DSP處理器的最低速度。值提注意的是DSPMISP與其它處理器的MISP速率無(wú)關(guān)。與用在工作站和個(gè)人計(jì)算機(jī)上通用處理器不同,這些DSP是為特定任務(wù)而專(zhuān)門(mén)設(shè)計(jì)的。因此,為實(shí)現(xiàn)上述的編解碼器處理所需求MISP,通用處理器要比專(zhuān)用DSP處理器大。?RAM需求:它描述了支持特定的編碼過(guò)程所需要RAM的大小。評(píng)價(jià)編碼器性能的關(guān)鍵因素是編碼器工作所需時(shí)間。這個(gè)時(shí)間是指編碼器的緩存及處理時(shí)間,稱(chēng)為單向系統(tǒng)時(shí)延。其值等于:幀大小+處理時(shí)延+前視時(shí)延。顯然,解碼時(shí)延也非常重要。實(shí)際上,解碼時(shí)延大約是編碼時(shí)延的一半。語(yǔ)音編碼質(zhì)量評(píng)定評(píng)價(jià)通信系統(tǒng)性能優(yōu)劣的根本標(biāo)志之一是系統(tǒng)所輸出語(yǔ)音質(zhì)量的好壞,所以語(yǔ)音評(píng)估技術(shù)將成為分析各種電話網(wǎng)絡(luò)通話質(zhì)量,不斷提高通信系統(tǒng)性能的關(guān)鍵技術(shù)。4.1語(yǔ)音質(zhì)量的含義一般說(shuō)來(lái),語(yǔ)音質(zhì)量包含個(gè)方面內(nèi)容:清晰度、可懂度和自然度。清晰度是指語(yǔ)音中音節(jié)以下的語(yǔ)音單元(因素、聲母、韻母等)的清晰度;可懂度是指語(yǔ)音中音節(jié)以上的語(yǔ)言單位(如字、單詞和句等)的可懂程度;自然度則是指對(duì)講話人的辨別水平。語(yǔ)音質(zhì)量評(píng)價(jià)不但與語(yǔ)音學(xué)、語(yǔ)言學(xué)、信號(hào)處理等學(xué)科相關(guān),而且還與心理學(xué)、生理學(xué)等學(xué)科有著密切的聯(lián)系,因此語(yǔ)音質(zhì)量評(píng)估是一個(gè)及其復(fù)雜的問(wèn)題4.1語(yǔ)音質(zhì)量評(píng)估的分類(lèi)語(yǔ)音質(zhì)量評(píng)估從評(píng)估主體上講可分為兩大類(lèi):主觀評(píng)估和客觀評(píng)估。4.2.1主觀評(píng)估主觀評(píng)估是以認(rèn)為主體根據(jù)某種預(yù)先約定的尺寸來(lái)對(duì)失真語(yǔ)音(或參考原始語(yǔ)音)來(lái)劃分質(zhì)量等級(jí)的,它反映了評(píng)聽(tīng)者對(duì)語(yǔ)音質(zhì)量好壞程度的一種主觀印象。從理論上講,語(yǔ)音質(zhì)量的客觀評(píng)估測(cè)試可分為兩類(lèi):一類(lèi)是音節(jié)以下(如音素、聲母、韻母)的語(yǔ)音單元的測(cè)試,這常稱(chēng)為“清晰度”測(cè)試:另一類(lèi)是音節(jié)以上(如詞、句)的語(yǔ)言單位的測(cè)試,這一類(lèi)的測(cè)試通常稱(chēng)為“可懂度”測(cè)試。這些測(cè)試的基本原理是相同的,只是測(cè)試的單元有所不同;而且可以按條件用公式從小單元的清晰度算出大單元的可懂度來(lái)。這些測(cè)試方法都屬于主觀聽(tīng)覺(jué)的測(cè)試方法。目前,國(guó)內(nèi)外使用較多的主觀評(píng)價(jià)方法有:平均意見(jiàn)分MOS(MeanOpinionScores)方法、韻母可懂度測(cè)量DRT(DiagnosticRhymeTests)方法、失真平均意見(jiàn)分DMOS(DegradationMeanOpinionScore-DMOS)和滿意讀測(cè)量DAM(DiagnsticAcceptabilityMeasure)、漢語(yǔ)清晰度測(cè)試等。4.2.1.1MOS法簡(jiǎn)介在實(shí)際語(yǔ)音系統(tǒng)應(yīng)用中,MOS評(píng)分法使用最為普遍。它不僅用于語(yǔ)音編碼,通信設(shè)備性能測(cè)試上,也是語(yǔ)音客觀評(píng)估方法研究中,作為衡量評(píng)價(jià)方法好壞的重要依據(jù)之一。MOS法用于對(duì)語(yǔ)音整體滿意度或語(yǔ)音通信質(zhì)量的評(píng)價(jià)。其分值如表2所示。參加測(cè)試的評(píng)聽(tīng)人在聽(tīng)完測(cè)試語(yǔ)音后,從5個(gè)等級(jí)中選擇其中某一級(jí)作為他對(duì)所測(cè)語(yǔ)音質(zhì)量的評(píng)價(jià)。全體實(shí)驗(yàn)者的平均分就是所測(cè)語(yǔ)音質(zhì)量的MOS值。由于主觀上和客觀上的種種原因,每次測(cè)試得到的MOS大都會(huì)有波動(dòng),為了減少波動(dòng)的方差,除了參加測(cè)試的評(píng)聽(tīng)人要足夠多之外(一般至少40人),所測(cè)語(yǔ)音材料也應(yīng)足夠豐富,測(cè)試環(huán)境也要盡量保持相同。在數(shù)字語(yǔ)音通信中,通常認(rèn)為MOS在4.0-5.0分為高質(zhì)量數(shù)字化語(yǔ)音,達(dá)到長(zhǎng)途電話網(wǎng)的質(zhì)量要求,接近于透明信道編碼,也常稱(chēng)為網(wǎng)絡(luò)質(zhì)量或長(zhǎng)途質(zhì)量。MOS在3.5左右稱(chēng)為通信質(zhì)量,這是感到重建話音質(zhì)量下降,但不妨礙正常通話,可以滿足話音系統(tǒng)使用要求,MOS在3.0以下常稱(chēng)為合成語(yǔ)音質(zhì)量,系指一些聲碼器合成的語(yǔ)音所能達(dá)到的質(zhì)量。它一般具有足夠的可懂度,但自然度及講話人的確認(rèn)等方面不夠好。表2為國(guó)際上一些一些標(biāo)準(zhǔn)語(yǔ)音編碼算法的語(yǔ)音質(zhì)量主觀評(píng)估分。4.2.2客觀評(píng)估客觀評(píng)估是指用機(jī)器自動(dòng)判別語(yǔ)音質(zhì)量.它從原理上又可分為兩類(lèi)評(píng)價(jià)方式:基于輸入一輸出方式的客觀評(píng)估和基于輸出方式的客觀評(píng)估?;谳斎胼敵龇绞降脑u(píng)價(jià)是建立在原始語(yǔ)音信號(hào)和失真語(yǔ)音信號(hào)的誤差對(duì)比上,大多數(shù)這種方式的客觀評(píng)估采用數(shù)值距離或者描述聽(tīng)覺(jué)系統(tǒng)如何來(lái)感知質(zhì)量的聽(tīng)覺(jué)模型來(lái)量化語(yǔ)音質(zhì)量的好壞;基于輸出的客觀評(píng)價(jià)是僅以語(yǔ)音系統(tǒng)的輸出信號(hào)來(lái)評(píng)估語(yǔ)音質(zhì)量的好壞。4.2.2.1客觀評(píng)估方法的分類(lèi)客觀評(píng)估方法研究自七十年代以來(lái)迅速發(fā)展,國(guó)內(nèi)外學(xué)者提出了數(shù)以千計(jì)的客觀評(píng)估方法。這些方法從評(píng)估原理上可分為基于輸入一輸出和基于輸出這兩大類(lèi)方法,如果從它們各自使用的主要技術(shù)方法(如譜分析,LPC分析、聽(tīng)覺(jué)模型分析、判斷模型分析等)和主要特征參量<時(shí)域、參量、頻域參量、變換域參量等)又可以將這些客觀評(píng)估方法分為以下六類(lèi):基于SNR的評(píng)估方法、基于LPC技術(shù)的評(píng)估方法、基于譜距離的評(píng)估方法、基于聽(tīng)覺(jué)模型的評(píng)估方法、基于判斷模型的評(píng)估方法、其它類(lèi)評(píng)估方法。4.2.2.2主要客觀評(píng)估方法的性能比較表3分類(lèi)給出了目前主要客觀評(píng)估方法的相關(guān)度數(shù)值表。由于受測(cè)試數(shù)據(jù)、測(cè)試方式等因素的影響,因而在不同文獻(xiàn)中使用同樣方法卻會(huì)得到不同結(jié)果。4.2.2.3客觀評(píng)估方法研究的發(fā)展特點(diǎn)及方向從上述客觀評(píng)價(jià)方法研究的發(fā)展歷程以及各種方法的評(píng)價(jià)性能來(lái)看,語(yǔ)音質(zhì)量客觀評(píng)價(jià)研究的發(fā)展具有以下特點(diǎn):語(yǔ)音質(zhì)量客觀評(píng)價(jià)研究取得了十分可喜的成績(jī)?;谳斎胍惠敵龅目陀^評(píng)價(jià)方法與主觀評(píng)價(jià)的相關(guān)度已達(dá)到了0.95左右,如AD/MNB,MBSD,和PSQM等方法,目前,這類(lèi)評(píng)價(jià)方法的主要問(wèn)題是要解決好穩(wěn)定性等問(wèn)題。從語(yǔ)音質(zhì)量客觀評(píng)估性能的提高過(guò)程來(lái)看,客觀評(píng)估方法研究大致經(jīng)歷了這樣幾個(gè)階段;時(shí)域分析階段(如SNR等),頻域譜分析階段(如SD等),模型參數(shù)(LPC分析)階段(如CD等),聽(tīng)覺(jué)模型階段(BSD,MBSD,PSQM等)及聽(tīng)覺(jué)模型與判斷模型的混合(hybrid)模型階段(如AD/MNB)等。當(dāng)然,各階段不是嚴(yán)格分開(kāi)的,而是互相混迭,特別是新方法往往是建立在傳統(tǒng)方法基礎(chǔ)上。聽(tīng)覺(jué)模型在語(yǔ)音質(zhì)量客觀評(píng)估研究中占有十分重要的地位??v觀客觀評(píng)估的發(fā)展過(guò)程可以清楚看到只要在評(píng)估中考慮了人對(duì)語(yǔ)音信號(hào)的感知特性就會(huì)大幅度提高整個(gè)評(píng)估方法的性能。從這幾年的研究成果來(lái)看,性能較好的客觀評(píng)價(jià)方法都以聽(tīng)覺(jué)模型為基礎(chǔ);如BSD,MBSD,PSQM,AD/MNB等。判斷模型的研究已開(kāi)始得到重視。人對(duì)語(yǔ)音質(zhì)量的評(píng)估包含兩個(gè)過(guò)程;聽(tīng)過(guò)程和判斷過(guò)程,因此,有必要構(gòu)造良好的判斷模型并和聽(tīng)覺(jué)模型相結(jié)合起來(lái)建立更符合主觀評(píng)估過(guò)程的客觀評(píng)估方法。雖然目前判斷模型的研究己有所進(jìn)展,如AD/MNB方法等,但是這方面的研究工作還有待于進(jìn)一步深入下去?;谳敵龅目陀^評(píng)估方法研究有所發(fā)展,但尚屬萌芽階段。目前這種形式的客觀評(píng)估方法與主觀評(píng)估值的相關(guān)度還較低。盡管該方法具有巨大的發(fā)展前景和實(shí)際應(yīng)用價(jià)值,但是在理論方法上和在使用的具體技術(shù)參數(shù)等方面還有待于突破性的進(jìn)展。4.2.2.4常用客觀語(yǔ)音評(píng)估算法介紹語(yǔ)音質(zhì)量是一種主觀的測(cè)量結(jié)果,依賴于聽(tīng)說(shuō)雙方對(duì)語(yǔ)音的主觀評(píng)價(jià)。因此,語(yǔ)音質(zhì)量其實(shí)是一種意見(jiàn),因?yàn)樗Q于大量的個(gè)體感知判斷什么是可以接受的或不能被接受。傳統(tǒng)的語(yǔ)音質(zhì)量測(cè)試方法是通過(guò)在實(shí)驗(yàn)室讓很多人試聽(tīng)語(yǔ)音并按照ITU規(guī)范的“綜合意見(jiàn)評(píng)分法”(MOS)讓他們對(duì)語(yǔ)音質(zhì)量給出主觀評(píng)價(jià)。很顯然這樣的測(cè)試手段不僅是主觀依賴的,而且費(fèi)時(shí)費(fèi)力。因而國(guó)際電信聯(lián)盟ITU在90年代中開(kāi)始對(duì)端到端的語(yǔ)音質(zhì)量自動(dòng)客觀測(cè)試技術(shù)進(jìn)行標(biāo)準(zhǔn)化的工作,并從此發(fā)展出三個(gè)主要的測(cè)試算法可供進(jìn)行自動(dòng)和可重復(fù)性的測(cè)試:PSQM/PSQM+感知通話質(zhì)量測(cè)量、PESQ感知評(píng)估通話質(zhì)量測(cè)量、PAMS(英國(guó)電信)感知分析測(cè)量。PSQM和PAMS測(cè)量方法都需要發(fā)送一個(gè)語(yǔ)音參考信號(hào)通過(guò)電話網(wǎng)絡(luò),在網(wǎng)絡(luò)的另一端采用數(shù)字信號(hào)處理的方式比較樣本信號(hào)和接收到的信號(hào),進(jìn)而估算出網(wǎng)絡(luò)的語(yǔ)音質(zhì)量。PESQ結(jié)合了PSQM和PAMS的優(yōu)勢(shì),針對(duì)VoIP和混合的端到端應(yīng)用作了改進(jìn),并針對(duì)MOS和MOS-LQ計(jì)算方法做了修改。-PAMS(PerceptualAnalysis/MeasurementSystem)是由英國(guó)電信開(kāi)發(fā)出來(lái),它根據(jù)收聽(tīng)費(fèi)勁程度和收聽(tīng)質(zhì)量,利用感官模型比較聲源信號(hào)和經(jīng)過(guò)網(wǎng)絡(luò)傳輸后退化的接聽(tīng)信號(hào)。PAMS分析退化信號(hào)中發(fā)現(xiàn)的不同類(lèi)型的錯(cuò)誤,將不同類(lèi)型錯(cuò)誤參數(shù)化并映射到預(yù)測(cè)感官模型上。這個(gè)模型是在進(jìn)行大量的主觀聽(tīng)力測(cè)試后建立的一個(gè)數(shù)據(jù)庫(kù)。評(píng)測(cè)的結(jié)果給出一個(gè)綜合意見(jiàn)評(píng)分值MOS,分值范圍在2—5之間,5分代表最佳質(zhì)量分值。-PSQM(PercepturalSpeechQualityMeasurement)是由荷蘭的KPN研究機(jī)構(gòu)開(kāi)發(fā)出來(lái),用于測(cè)量數(shù)字編碼器的客觀質(zhì)量。最早被廣泛應(yīng)用的編碼器測(cè)量手段是測(cè)試語(yǔ)音信號(hào)的信噪比S/N,但這種測(cè)試方法對(duì)現(xiàn)代越來(lái)越多的低壓縮比編碼器并不適用。PSQM則比較聲源信號(hào)和退化信號(hào),測(cè)出后者的失真程度、噪音和保真度。它已被ITU制定成P.861推薦規(guī)范,并有了一個(gè)增強(qiáng)型算法PSQM+,可更有效地分析大量瞬時(shí)失真。但這兩種算法對(duì)信號(hào)過(guò)濾、不同的延時(shí)和短暫局部失真不作處理。(現(xiàn)ITU-T已經(jīng)將P.861廢棄,由P.862取代)-PESQ(PerceptualEvaluationofSpeechQuality)是由英國(guó)電信和KPN共同開(kāi)發(fā)出來(lái),并在2001年被ITU采納為P.862規(guī)范。它比較聲源信號(hào)和退化信號(hào)并給出一個(gè)類(lèi)似人工聽(tīng)力評(píng)估測(cè)試的MOS分值。但它的功能要強(qiáng)大得多,不僅能測(cè)試像解碼器這樣的網(wǎng)絡(luò)單元的效果,也能測(cè)量端到端的聲音質(zhì)量。它著重針對(duì)不同的信號(hào)退化原因,如編解碼失真、錯(cuò)誤、丟包、延時(shí)、抖動(dòng)和過(guò)濾,給出-0.5到4.5的分值范圍內(nèi)的值。大多數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年患者隱私保護(hù)協(xié)議與策劃
- 2025年企業(yè)銷(xiāo)售人員招聘合同范例
- 2025年企業(yè)人員臨時(shí)借調(diào)合同范文
- 2025年居民安置過(guò)渡性協(xié)議
- 2025年個(gè)人流轉(zhuǎn)養(yǎng)殖水面使用權(quán)協(xié)議
- 2025年共享發(fā)展市場(chǎng)拓展協(xié)議
- 2025年產(chǎn)業(yè)園區(qū)企業(yè)使用條款協(xié)議
- 2025年醫(yī)療設(shè)備更新協(xié)議文本
- 2025年醫(yī)院食堂后勤服務(wù)合同標(biāo)準(zhǔn)格式
- 農(nóng)業(yè)合作社土地使用權(quán)入股框架協(xié)議
- GB/T 32574-2016抽水蓄能電站檢修導(dǎo)則
- 《社會(huì)主義市場(chǎng)經(jīng)濟(jì)理論(第三版)》第十三章社會(huì)主義市場(chǎng)經(jīng)濟(jì)標(biāo)準(zhǔn)論
- 變更索賠案例分析
- 過(guò)敏性休克的急救及處理流程教材課件(28張)
- 《花婆婆》兒童繪本故事
- DB44∕T 2149-2018 森林資源規(guī)劃設(shè)計(jì)調(diào)查技術(shù)規(guī)程
- 數(shù)據(jù)結(jié)構(gòu)英文教學(xué)課件:chapter10 Hashing
- 機(jī)動(dòng)車(chē)牌證申請(qǐng)表格模板(完整版)
- 部編版小學(xué)語(yǔ)文三年級(jí)(下冊(cè))學(xué)期課程綱要
- 《國(guó)家電網(wǎng)公司十八項(xiàng)電網(wǎng)反事故措施(試行)》實(shí)施細(xì)則
- 鋼絲網(wǎng)架珍珠巖夾心板安裝方法
評(píng)論
0/150
提交評(píng)論