版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
教師整理————語音信號處理復習學問點-11§1.1語音信號處理概述一、語音、語音信號處理的名詞解釋1、語音:是語言的聲學表現(xiàn),是聲音和意義的結合體,是相互傳遞信息的重要手段,是人類最重要、最有效、最常用和最便利的交換信息的形式。2、語音信號處理:是爭論用數(shù)字信號處理技術對語音信號進展處理的一門學科,它是一門興的學科,同時又是綜合性的多學科領域和涉及很廣的穿插學科。它與語音學、語言學、聲學、認知科學、生理學、心理學有親熱關系。3、語音信號的數(shù)字處理的優(yōu)點:其次頁第四段二、語音學的名詞解釋語音學:與語音信號處理存在格外親熱的關系,是爭論言語過程的一門科學,它包括三個爭論內容:發(fā)音器官在發(fā)音過程中的運動和語音的音位特性;語音的物理特性;以及聽覺和語言感知?!?.2語音信號處理的進展概況1、語音編碼:語音編碼技術是伴隨著語音信號的數(shù)字化而產(chǎn)生的,目前主要應用在數(shù)字語音通信領域。2、語音合成:語音合成的目的是使計算機能像人一樣說話。3、語音識別:語音識別是使計算機推斷出所說的話的內容?!?.2語音產(chǎn)生的過程一、語音、清音、濁音1、語音:聲音是一種波,能被人耳聽到,振動頻率在 20Hz-20kHz之間。語音是聲音的一種,它是由人的發(fā)音器官發(fā)出的、具有肯定語法和意義的聲音。語音的振動頻率最高可達15kHz2、濁音、清音:語音由聲帶振動或不經(jīng)聲帶振動來產(chǎn)生,其中由聲帶振動產(chǎn)生的音統(tǒng)稱為濁音,而不由聲帶振動產(chǎn)生的音統(tǒng)稱為清音。濁音中包括全部的元音和一些輔音,清音包括另一局部輔音。二、語音的產(chǎn)生過程〔人體發(fā)出聲音的根本過程〕:人類的語音是由人體發(fā)音器官在大腦掌握下的生理運動產(chǎn)生的。空氣從肺部排出形成氣流,沖擊聲帶,假設聲帶是緊繃的,則則形成準周期性脈沖的空氣流,產(chǎn)生“濁音”。假設聲帶完全伸展,則形成摩擦音或爆破音。經(jīng)過聲道調制的空氣流最終從口或鼻腔輻射出來,形成語音。語言交際:通過連接說話人大腦的一連串心理、生理、和物理的轉換過程實現(xiàn)的。這個過程包括:發(fā)音-傳遞-感知。因此現(xiàn)代語音的三個分支:發(fā)音語言學、聲學語言學、聽覺語言學。三、基音周期、基音頻率基音周期:聲帶開啟和閉合一次的時間即振動周期稱為音調周期或基音周期。基音頻率:基音周期的倒數(shù)稱為基音頻率,簡稱為基頻。四、濁音、清音、爆破音的鼓勵源對于濁音、清音和爆破音來說,鼓勵源是不同的,濁音語音是位于聲門處的準周期脈沖序列,清音的鼓勵源是位于聲道的某個收縮區(qū)的空氣湍流,而爆破音的鼓勵源是位于聲道某個閉合點處建立起來的氣壓及其突然釋放。五、共振峰的概念1、共振峰名詞解釋:聲道是一個分布參數(shù)系統(tǒng),它是一個諧振腔,有很多諧振頻率,稱為共振峰,它是聲道的重要聲學特征。2、共振峰的公式:Fn=(2n-1)c/4L〔會運用公式進展計算,填空、8〕3、諧振點間的間隔不同,但平均仍舊大約為每1KHz有一個諧振點。4、聲道的共振峰特性打算所發(fā)聲音的頻譜特性〔音色〕。5、頭三個共振峰最重要?!?.3語音信號的特性一、語音的物理屬性語音的物理性質包括音質、音調、音強、音長等特性。語音是人的發(fā)音器官發(fā)出的一種聲波,具有聲音的物理屬性。音質是一種聲音區(qū)分于其他聲音的根本特征;音調指聲音的凹凸,取決于聲波的頻率:頻率高則音調高,頻率低則音調低;響度是指聲音的強弱,又稱音量,它是由聲波振動幅度打算的;聲音的長短也稱音長,它取決于發(fā)音持續(xù)時間的長短。二、音素、音節(jié)、單詞、句子的根本概念以及它們之間的關系音素是語音的最小、最根本的組成單位,音素都有其獨立的各不一樣的發(fā)音方法和發(fā)音部位,它是使聽者能區(qū)分一個單詞和另一個單詞的聲音的根底。音節(jié)是最小的語言片段,一個音節(jié)由一個或幾個音素組成。單詞是由音節(jié)結合而成的更大單位,是有意義的語言的最小單位。句子是單詞的進一步組合。三、漢語的特點是:音素少、音節(jié)少。漢語中的音節(jié)即字音由聲母、韻母和聲調按肯定方式構成,即聲、韻、調三個因素構成。四、語音頻譜特性其中虛線稱為譜包絡,其外形是由H(f)和G(f)的包絡乘積得到的。五、清音和濁音的頻譜特性清音和濁音的波形有很大的不同。清音的波形類似于白噪聲,具有很弱的振幅;元音〔濁音〕具有明顯的準周期性,并具有較強的振幅。它們的周期對應的頻率就是基音頻率。假設考察其中一個周期,還可以大致看出其頻譜特性?!?.4語音信號產(chǎn)生的數(shù)學模型一、語音信號的數(shù)字模型1、語音信號數(shù)字模型的概念:語音信號被看成是線性時不變系統(tǒng)〔聲道〕在隨機噪聲或準調周期脈沖序列鼓勵下的輸出。2P163、語音的產(chǎn)生過程〔具體見考題〕二、發(fā)不同性質的音時,鼓勵的狀況是不同的,大致分為兩類:發(fā)濁音時,此時氣流在通過繃緊的聲帶時,沖激聲帶產(chǎn)生振動,使聲門處形成準周期性的脈沖串。聲帶繃緊的程度不同時,振動頻率也不同,這個頻率就是音調頻率,其倒數(shù)為音調周期。不同人的音調周期是不同的,男子大,女子小,老人大,小孩低?!?〕發(fā)清音時,此時聲帶松弛而不振動,氣流通過聲門直接進入聲道。三、語音信號數(shù)字模型的組成等1、語音信號數(shù)字模型由鼓勵模型、聲道模型和輻射模型組成。2、聲道模型包括聲管模型和共振峰模型。3、共振峰模型又可分為級聯(lián)型、并聯(lián)型和混合型。四、語音信號數(shù)字模型的框圖:P212-18圖中,清/濁音開關模擬了加在聲道上的鼓勵的轉變狀況:當開關接在濁音位臵時,鼓勵源是準周期脈沖序列發(fā)生器,其重復頻率由基音頻率來確定;當開關接在清音位臵時,鼓勵源是隨機噪聲發(fā)生器。§2.5語音感知一、聲音的三要素:響度、音調和音色。任何聲音的都可以用聲強的三個物理量表示:幅度、頻率、相位。1、響度:響度是人耳對聲音強弱程度的主觀反響,響度取決于聲音的幅度,主要是聲壓的函數(shù),但和頻率和波形也有關,單位是宋〔sone〕。人耳對3000-4000Hz的聲音感覺最靈敏。2、音調:也稱音高,是一種主觀心理量,是人耳對聲音頻率凹凸的感受,即與聲音的頻率有關。音調與聲音頻率近似為對數(shù)關系,還與聲音的強度及波形有關,單位是美〔mel〕。3、音色:也叫音質,反映了聲音屬性。每個聲音具有特別的音色,人依據(jù)音色在主觀感覺上區(qū)分具有一樣響度和音調的兩個聲音。二、人的聽覺系統(tǒng)的特性〔具體見考題〕三、聽覺掩蔽〔具體見考題〕:人類聽覺中存在一種現(xiàn)象,即兩個音同時存在時,一個聲音有可能受到另一個聲音的干擾或壓制,即一個音被另一音掩蓋,這稱為聽覺掩蔽。兩個聲音音調越接近,掩蓋現(xiàn)象越嚴峻。聽覺掩蔽現(xiàn)象在語音處理中得到了一些應用,比方,在語音編碼中,利用聽覺掩蔽效應改善輸出語音質量已經(jīng)取得了很大的效益。Ch3時域分析§3.1概述一、為什么時域分析要承受短時分析技術〔具體見考題〕1、短時分析技術的根本概念:語音信號是一種隨時間而變化的信號,可能是濁音鼓勵也可能是清音鼓勵,濁音的基音周期以及信號幅度等語音特性也都隨時間變化,但這種變化是緩慢的,在一小段短時間內10-30ms,語音信號近似不變。于是,我們把變化的語音信號分成一些相繼的短時間段來處理。而每一段時間段具有固定的特性,這種方法稱為“短時”處理方法。2、語音信號特點:〔1〕表示語音信號比較直觀、物理意義明確;實現(xiàn)起來比較簡潔、運算量少;〔3〕可以得到語音的一些重要參數(shù)?!?.2數(shù)字化和預處理一、取樣和量化〔具體見考題〕1、為了將原始的模擬信號轉換為數(shù)字信號,必需經(jīng)過取樣和量化兩個步驟。2、取樣是將時間上連續(xù)的語音信號離散化為一個樣本序列。滿足取樣定理,當取樣頻率大于兩倍信號帶寬時,取樣過程不會喪失信息,且從取樣信號中可以準確地重構原始信號的波形。3、量化是指將取樣后得到的樣本序列的幅度再離散化,量化過程是將整個幅度值分割為有限個區(qū)間,將落入同一區(qū)間的樣本賜予一樣的幅度值。分為均勻和非均勻量化。二、量化噪聲的概念及特點1、量化噪聲:量化后信號值與原信號之間的差值稱為量化誤差,即量化噪聲。2、量化信噪比的計算公式:SNR〔dB〕=6.02B-7.2三、語音信號系統(tǒng)框圖〔為什么要進展預處理〕1、系統(tǒng)框圖:P263-42、反混疊濾波器的作用:它是一個具有良好截止特性的模擬低通濾波器,主要是為了防止混疊失真和噪聲干擾?!?.3短時能量分析一、語音信號的能量分析:語音信號的能量分析是基于語音信號能量隨時間有相當大的變化,特別是清音段的能量一般比濁音段的小得多。能量分析包括能量和幅度兩個方面。二、直角窗和海明窗1、不同的窗口選擇將打算短時能量特性,即窗口的外形和長度。2、直角窗和海明窗的比較從窗口外形上:海明窗的帶寬大約是同等寬度矩形窗帶寬的2倍。此外,海明窗在通帶外的衰減比矩形窗大得多,而且通帶與阻帶的起伏比較小。從窗口長度上〔窗口選擇原則〕:N選擇太大,則短時能量E隨時間變化就很小,不能充分反映語音信號的幅度變化;而N選擇得小,即選擇N時,E將依據(jù)信號波形的微小變化而起伏不定,以致短時能量E不夠勻化和平滑。因此,折衷考慮N的值,在通常狀況下,當取樣頻率10KHzN=100-200三、短時平均能量反映了語音能量隨著時間緩慢變化的規(guī)律。它的主要用途有:1、可以區(qū)分清音段和濁音段,由于濁音時比清音時大得多;2、可以區(qū)分聲母與韻母的分界、無聲和有聲的分界、連字的分界等。3、作為一種超音段信息,用于語音識別中?!?.4短時過零分析一、過零分析、過零率和平均過零數(shù)的名詞解釋1、過零分析是語音時域分析中最簡潔的一種,對于離散時間信號的相鄰兩個取樣值具有不同的符號時,便消滅“過零”現(xiàn)象。單位時間過零的次數(shù)叫作“過零率”。2、平均過零數(shù)Z:單位時間內的過零數(shù)〔Z=2f0/fs過零/樣本〕。二、短時平均過零數(shù)的實現(xiàn)1、實現(xiàn)框圖:P323-122、文字描述:首先對語音信號序列x(n)進展成對的查對采樣以確定是否發(fā)生過零,假設發(fā)生符號變化,則表示有一次過零;而后進展一階差分計算,再求確定值,最終進展低通濾波。三、短時過零分析的用途〔包含清音、濁音的各自特點〕1、短時平均過零數(shù)可以用來區(qū)分清音和濁音。發(fā)濁音時,語音能3kHz以下。而發(fā)清音時,多數(shù)能量集中在較高的頻譜上。濁音具有較低的平均過零數(shù),而清音時具有較高的平均過零數(shù)。可見P33的圖3-132、利用短時平均過零數(shù)還可以從背景噪聲中找出語音信號,用于推斷安靜無語音和有語音的起點和終點位臵。3-14由圖可見,這三句話的平均過零數(shù)變換都很大,高平均過零數(shù)對應于清音,低平均過零數(shù)對應于濁音;但是清音和濁音的變化格外明顯。因而,短時平均過零數(shù)可用于清音和濁音的大分類上?!?.5短時相關分析一、短時自相關分析得到語音信號有何特點和用途1、對于濁音語音來說,短時自相關函數(shù)具有明顯的峰值且呈周期分布,而對于清音來說,則沒有很強的自相關周期峰,其性質類似于噪聲的高頻波形。2、短時自相關函數(shù)是語音信號時域分析的重要參量。它有兩個用途,一是推斷清/濁音,并估量濁音的基音周期,由于周期函數(shù)的自相關還是周期函數(shù),周期不變;二是它的傅里葉變換是短時譜,可用于計算語音信號的頻譜特性。3、短時自相關函數(shù)的框圖〔P35圖3-17〕4、短時平均幅度差函數(shù):利用差值來簡化計算自相關函數(shù)。用途:推斷清/濁音,并估量濁音的基音周期。常見的幾種語音信號短時分析法:短時能量、短時平均過零率和短時自相關函數(shù)。Ch4短時傅里葉分析§4.1概述一、傅里葉分析在信號分析與處理中的地位與作用在語音信號處理中,傅里葉表示在傳統(tǒng)上始終起主要作用。其緣由一方面在于穩(wěn)態(tài)語音的產(chǎn)生模型由線性系統(tǒng)組成,此系統(tǒng)被一隨時間作周期變化或隨機變化的源所鼓勵,因而系統(tǒng)輸出頻譜反映了鼓勵與聲道頻率響應特性。另一方面,語音信號的頻譜具有格外明顯的語言聲學意義,可以獲得某些重要的語音特征。同時,語音的感知過程與人類聽覺系統(tǒng)具有頻譜分析功能是親熱相關的。二、短時傅里葉分析的重要性。短時傅里葉分析是分析緩慢時變頻譜的一種簡便方法,是用穩(wěn)態(tài)分析方法處理非穩(wěn)態(tài)信號的一種方法,在語音處理中是一個格外重要的工具?!?.2短時傅里葉變換一、短時傅里葉變換的定義語音信號可以認為是局部平穩(wěn)的,所以可以對某一幀語音進展傅里葉變換,即短時傅里葉變換,定義為:∑∞-∞=--=mnjjemnmxeXωωω)(n2kNπω=,22kkmjjNNnnmXeXkxmnmeππω∞-=-∞==-∑01kN≤≤-二、短時傅里葉變換的兩種解釋一是標準傅里葉變換的解釋,二是濾波器的解釋。三、標準傅里葉變換解釋1、與序列的傅里葉變換一樣,短時傅里葉變換隨著ω作周期變2π。2、窗口序列具有的特性:頻率區(qū)分率高,即主瓣狹窄、鋒利;通過卷積,在其他頻率成分產(chǎn)生的頻譜泄漏少,即旁瓣衰減大。3、海明窗與直角窗的頻率特性〔具體見考題答案〕它們在基音諧波、共振峰構造以及頻譜具有相像性,但其頻譜間也具有差異。〔1〕是基音諧波鋒利度增加,這是由于矩形窗頻率區(qū)分率較高;〔2〕矩形窗較高的旁瓣產(chǎn)生了一個類似于噪聲的頻譜。因此,在語音頻譜分析中極少承受矩形窗。4、窗口寬度與短時傅里葉變換特性之間的關系,即用窄窗可得到好的時間區(qū)分率,用寬窗可得到好的頻率區(qū)分率。四、濾波器的解釋1、第一種形式的濾波器為低通濾波器;其次種形式的濾波器為帶4-5§4.3短時傅里葉變換的取樣率一、時間取樣率、頻域取樣率和總取樣率的相關概念1、時間取樣率2B=2fs/N直角窗2B=4fs/N海明窗2、頻域取樣率為使恢復的時域信號不產(chǎn)生混疊失真,需滿足條件L≥N〔取樣頻L≥N〕。3SR〔Hz〕SR=時域取樣率*頻域取樣率=2B*L=2BLSR=2fsL/NSR=4fsL/N海明窗§4.4語音信號的短時綜合一、語音的短時綜合兩種經(jīng)典的方法是:濾波器組求和法和快速傅里葉變換求和法。§4.5語譜圖〔大綱沒要求,但2023年考題有,所以請參照答案記概念〕Ch5同態(tài)濾波〔同態(tài)信號處理〕及倒譜分析§5.1概述一、依據(jù)語音信號的產(chǎn)生模型,可以將其用一個線性非時變系統(tǒng)的輸出表示,即看做是聲門鼓勵信號和聲道沖激響應的卷積。二、為了分別加性組合信號,常承受線性濾波方法;而為了分別非加性組合信號,常承受同態(tài)濾波技術。§5.2同態(tài)信號處理的根本原理一、同態(tài)信號處理的概念同態(tài)信號處理就是將非線性問題轉化為線性問題來處理,按處理的信號可分為乘積同態(tài)處理和卷積同態(tài)處理。二、同態(tài)信號處理的實現(xiàn)框圖、根本原理〔要把握公式的推導〕任何同態(tài)系統(tǒng)都可以表示為三個同態(tài)系統(tǒng)的級聯(lián),框圖如圖 5-2所示。即同態(tài)系統(tǒng)可分解為兩個特征系統(tǒng)和一個線性系統(tǒng)。在同態(tài)系統(tǒng)的組成中第一個系統(tǒng)以假設干信號的卷積作為輸入,并將它變換成對應輸出的相加性組合。其次個系統(tǒng)是一個一般的線性系統(tǒng),聽從疊加定理。第三個系統(tǒng)是第一個系統(tǒng)的逆變換,即它將信號的相加性組合反變換為卷積組合。特征系統(tǒng)和逆特征系統(tǒng)如圖5-3所示?!?.3復倒譜和倒譜一、復倒譜和倒譜的概念復倒譜:信號經(jīng)過同態(tài)濾波的特征系統(tǒng)環(huán)節(jié)后,xn∧仍舊是一個時域序列,我們稱xn∧是xn的復倒譜域,簡稱為復倒譜〔具體名詞解釋見考題答案〕1cn2cn1xn2xn倒12xnxnxn=*xn的倒譜為12cncncn=+。§5.4兩個卷積重量復倒譜的性質一、一個周期沖激的有限長度序列,其復倒譜也是一個周期沖激序列,并且長度Np不變,只是序列變?yōu)闊o限長度序列。同時其振幅隨K值的增大而衰減。二、聲道沖激響應序列復倒譜的性質1、xn∧是雙邊序列,存在于-≦<n<≦。<p=““>2、xn∧是衰減序列。3、xn∧隨|n|1/|n|快。4、假設x(nz平面單位圓內,此時xn∧只在n≥0xn∧是因果序列。最小相位信號序列的復倒譜是因果序列。5、假設x(nz平面單位圓外,此時xn∧只在n≤0時有值,為左邊序列。最大相位信號序列的復倒譜是左邊序列。三、聲道沖激響應序列的全零點模型描述§5.5避開相位卷繞的算法一、避開相位卷繞求復倒譜的方法包括:微分法、最小相位信號法、遞推法。二、相位卷繞:在復倒譜分析中,Z變換后得到的是復數(shù),所以取對數(shù)時進展的是復對數(shù)運算。這時存在相位的多值性問題,使得后面求復倒譜以及恢復語音等運算均存在不確定性而產(chǎn)生錯誤。三、微分法和最小相位法求復倒譜框圖。Ch6線性推測分析§6.1概述一、線性推測分析的根本概念線性推測分析的根本概念是,一個語音的抽樣能夠用過去假設干個語音抽樣的線性組合來靠近。通過使實際語音抽樣和線性推測抽樣之間差值的平方和〔在一個有限間隔上〕到達最小值,即進展最小均方誤差的靠近,能夠打算唯一的一組推測系數(shù),即線性組合的加權系數(shù)?!?.2線性推測分析的根本原理一、線性推測模型承受全極點模型的緣由〔具體見答案〕全極點模型最易于計算,對全極點模型作參數(shù)估量是對線性方程組的求解過程;有時無法知道輸入序列;人的聽覺對于那種只能用零點來表示的頻譜陡峭谷點是遲鈍的;假設不考慮鼻音和摩擦音,那么語音的聲道傳遞函數(shù)就是一個全極點模型。二、全極點模型——非鼻音濁音語音極零點模型——鼻音和摩擦音三、1、對于濁音信號譜在諧波成分處的匹配效果要遠比諧波之間好得多。2、LPC譜對其他譜的優(yōu)點是可以很好地表示共振峰構造而不消滅額外的峰起和起伏?!?.4線性推測分析的解法〔1〕一、線性推測的經(jīng)典解法有兩種,一種是自相關法,一種是協(xié)方差法,另外還有格型法。〔優(yōu)缺點比較,具體看書〕§6.6線性推測分析應用——LPC譜估量和LPC復倒譜一、線性推測分析〔LPC〕P首先要保證有足夠的極點來模擬聲道響應的諧振構造,但P值到達12-14二、線性推測分析中,幀長度N線性推測分析中,分析幀長度N同樣重要,N盡可能小有好處,在LPC線性方程組求解中,計算量都與N成正比。但譜估量的精度隨N的增加而提高。通常取N2-3三、復倒譜分析的優(yōu)點:運算量小,可用于實時語音識別。Ch7VQ§7.1概述一、量化可以分為兩類:標量量化和矢量量化。VQ矢量量化是將假設干個取樣信號分成一組,即構成一個矢量,然后對此矢量一次進展量化,即作為一個整體進展量化,既能有效降低數(shù)碼率,又能保證語音質量。三、矢量量化的理論依據(jù)與優(yōu)越性〔大綱〕依據(jù)仙農(nóng)信息論可以得出,矢量量化總是優(yōu)于標量量化,且矢量維數(shù)越大性能越優(yōu)越。由于矢量量化有效利用了矢量中各重量間的各種相互關聯(lián)的性質。承受矢量量化技術對信號波形數(shù)據(jù)進展壓縮,可以獲得格外高的壓縮比?!?.2矢量量化的根本原理一、矢量量化的過程〔VQ的根本原理〕將語音信號波形的K個樣點的每一幀,或有K個參數(shù)的每一幀參數(shù),構成K§7.3失真測度一、失真測度必需具備的幾個特性必需在主觀評價上有意義,即小的失真應當對應于好的主觀語音質量;必需是易于處理的,即在數(shù)學上易于實現(xiàn);平均失真存在且可計算;易于硬件實現(xiàn)。二、歐氏距離-均方誤差的概念〔P96公式7-1〕§7.4最正確矢量量化器和碼本的設計一、矢量量化器最正確設計的兩個條件是:最正確劃分和最正確碼書。二、幾種初始碼書的生成方法包括:隨機選取法、分裂法、乘積碼書法?!?.5降低簡單度的矢量量化系統(tǒng)一、矢量量化器的爭論主要是圍圍著降低速率、削減失真和降低簡單度開放的。速率、失真和簡單度是矢量量化器的三個關鍵問題。二、矢量量化系統(tǒng)主要由編碼器和譯碼器組成。三、降低簡單度的設計方法包括兩類:無記憶的矢量量化器和有記憶的矢量量化器。四、無記憶的矢量量化器和有記憶的矢量量化器的概念及區(qū)分無記憶的矢量量化器是指量化每一個矢量時都不依靠于此矢量前面的其他矢量,即每一個矢量都是獨立量化的。有記憶的矢量量化器與無記憶的矢量量化器不同,它是量化每一個輸入矢量時,不僅與此矢量本身有關,而且也與其前面的矢量有關。五、無記憶的矢量量化系統(tǒng)包括樹形搜尋的矢量量化系統(tǒng)和多級矢量量化系統(tǒng)。有記憶的矢量量化分為反響矢量量化和自適應矢量量化兩類。Ch9§9.1基音檢測一、基音檢測的重要性和難點基音的提取和估量是語音信號處理中格外重要的一個問題,準確地檢測語音信號的基音周期對于高質量的語音分析與合成、語音壓縮編碼、語音識別和說話人確認等具有重要意義。在低速率語音編碼中,準確的基音檢測是格外關鍵的,它直接影響到整個系統(tǒng)的性能。二、基音檢測的三個爭論方面1、穩(wěn)定并提取準周期性信號的周期性方法;2、因周期混亂,實行基音提取誤差補償?shù)姆椒ǎ?、消退聲道影響的方法。三、基音檢測的三種方法:波形估量法、相關處理法和變換法。1、波形估量法包括:并行處理法、數(shù)據(jù)削減法、過零數(shù)法;2、相關處理法包括:自相關法、SIFTAMDF法;3、變換法:倒譜法、循環(huán)直方圖。四、清/濁音推斷的關心參量1、語音信號能量2、過零數(shù)3、自相關函數(shù)4、線性推測系數(shù)五、常用的幾種基音檢測方法包括:自相關法、并行處理法、倒譜法、簡化逆濾波法。六、中心削波法的根本原理,三電平削波函數(shù)特性〔P119-120〕七、利用倒譜法提取基音的根本原理和實現(xiàn)方法〔P123〕八、利用簡化逆濾波器法進展基音檢測的根本原理和方法〔P125〕§9.2共振峰估值一、共振峰估量中存在的問題1、虛假峰值2、共振峰合并3、高基音語音二、幾種常用的提取共振峰特性的方法1、帶通濾波器組法2、離散傅立葉變換3、倒譜法4、LPC法三、濁音和清音時DFT譜特性比較1、濁音時DFT得到的頻譜受基頻諧波的影響,最大值只能消滅在諧波頻率上,因此共振峰測定誤差較大。2、清音時此時信號具有隨機噪聲的特點,其頻譜不具有離散諧波特性,但其包絡根本上反映了聲道的特性。對其頻譜進展線性平滑而得到譜包絡,并用一個峰值搜尋算法來確定峰值。四、濁音和清音時倒譜法檢測效果比照1、濁音時,假設頻譜包絡的變換和基音峰值的變換在倒譜域中的間隔足夠大,則前者簡潔識別。2、清音時,聲門鼓勵序列具有噪聲特性,其倒譜沒有明顯峰值,且倒譜分布于從低倒譜域到高倒譜域的很寬的范圍之內,因而在低倒譜域對聲道響應的信息產(chǎn)生了影響。五、倒譜法難以解
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《現(xiàn)代公務禮儀》課件
- 2021年高考語文作文專家解析及審題立意(附范文)
- 2024版裝修工程協(xié)議3篇
- 2024版北京小客車租賃合同(含異地還車)
- 2024版建設工程施工合同-安裝定額
- 2019-2021高考英語真題重點詞匯再復習
- 2024年滁州愛德醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 2024年湛江博康醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 2024年清華大學校醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 第四單元 第五課 城市規(guī)劃的典范:巴西利亞 說課稿-人教版歷史與社會七年級上冊001
- 新開模具清單
- 抗菌藥物臨床應用指導原則(2023年版)
- 2023年軍政知識綜合題庫
- 2023-2024學年福建省福州市小學語文 2023-2024學年六年級語文期末試卷期末評估試卷
- YY 0286.1-2019專用輸液器第1部分:一次性使用微孔過濾輸液器
- GB/T 22544-2008蛋雞復合預混合飼料
- GB/T 12224-2015鋼制閥門一般要求
- 特殊焊接作業(yè) 安全要求
- 浩學堂中西醫(yī)結合執(zhí)業(yè)醫(yī)師系列之診斷學基礎
- CRRT-抗凝詳解課件
- plc控制的電動機正反轉課件
評論
0/150
提交評論