




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第9章隱馬爾可夫模型(HMM)一、馬爾可夫模型的定義二、隱馬爾可夫模型的定義三、隱馬爾可夫模型的參數(shù)四、隱馬爾可夫模型在語(yǔ)音識(shí)別中的應(yīng)用五、隱馬爾可夫模型的基本算法第9章隱馬爾可夫模型(HMM)一、馬爾可夫模型的定11870年,俄國(guó)有機(jī)化學(xué)家VladimirV.Markovnikov第一次提出馬爾可夫模型HMM的由來(lái)1870年,俄國(guó)有機(jī)化學(xué)家VladimirV.Marko2馬爾可夫性如果一個(gè)過(guò)程的“將來(lái)”僅依賴“現(xiàn)在”而不依賴“過(guò)去”,則此過(guò)程具有馬爾可夫性,或稱此過(guò)程為馬爾可夫過(guò)程X(t+1)=f(X(t))X(n+1)=f(X(n))馬爾可夫性如果一個(gè)過(guò)程的“將來(lái)”僅依賴“現(xiàn)在”而不依賴“過(guò)去3馬爾科夫鏈時(shí)間和狀態(tài)都離散的馬爾科夫過(guò)程稱為馬爾科夫鏈記作{Sn=S(n),n=0,1,2,…}在時(shí)間集T1={0,1,2,…}上對(duì)離散狀態(tài)的過(guò)程相繼觀察的結(jié)果鏈的狀態(tài)空間記做I={S1,S2,…},Si∈R.條件概率P{Sj|Si}為馬氏鏈在時(shí)刻m處于狀態(tài)Si條件下,在時(shí)刻m+1轉(zhuǎn)移到狀態(tài)Sj的轉(zhuǎn)移概率。馬爾科夫鏈時(shí)間和狀態(tài)都離散的馬爾科夫過(guò)程稱為馬爾科夫鏈4一個(gè)關(guān)于天氣的3狀態(tài)馬爾可夫模型雨S1多云S2晴S30.40.30.30.60.80.20.20.10.1一個(gè)關(guān)于天氣的3狀態(tài)馬爾可夫模型雨多云晴0.40.30.305一、馬爾可夫模型(MM)的定義
MM是一個(gè)輸出符號(hào)序列的統(tǒng)計(jì)模型,具有N個(gè)狀態(tài)S1,S2,…SN,它按一定的周期從一個(gè)狀態(tài)轉(zhuǎn)移到另外一個(gè)狀態(tài),每次轉(zhuǎn)移時(shí),輸出一個(gè)符號(hào)。S1S2S3起始狀態(tài)終止?fàn)顟B(tài)a/b輸出符號(hào)一、馬爾可夫模型(MM)的定義MM是一個(gè)輸出符號(hào)序列6
轉(zhuǎn)移到哪一個(gè)狀態(tài),轉(zhuǎn)移時(shí)輸出什么符號(hào),分別由狀態(tài)轉(zhuǎn)移概率和轉(zhuǎn)移時(shí)的輸出概率來(lái)決定。即每一條弧上有一個(gè)狀態(tài)轉(zhuǎn)移概率以及輸出概率。aij表示從狀態(tài)Si轉(zhuǎn)移到狀態(tài)Sj的概率。S1S2S3轉(zhuǎn)移到哪一個(gè)狀態(tài),轉(zhuǎn)移時(shí)輸出什么符號(hào),分別由狀態(tài)轉(zhuǎn)移7S1S2S3從一個(gè)狀態(tài)轉(zhuǎn)移出去的概率之和為1。每次轉(zhuǎn)移時(shí)輸出符號(hào)a和b的概率之和為1。S1S2S3從一個(gè)狀態(tài)轉(zhuǎn)移出去每次轉(zhuǎn)移時(shí)輸出符號(hào)a和b8一個(gè)關(guān)于天氣的3狀態(tài)馬爾可夫模型雨S1多云S2晴S30.40.30.30.60.80.20.20.10.1一個(gè)關(guān)于天氣的3狀態(tài)馬爾可夫模型雨多云晴0.40.30.309已知一天(t=1)的天氣是晴(S3),問(wèn):其后7天的天氣為“晴,晴,雨,雨,晴,多云,晴”的概率是多少?觀察序列O={S3,S3,S3,S1,S1,S3,S2,S3}對(duì)應(yīng)時(shí)間t=1,2,3,4,5,6,7,8已知一天(t=1)的天氣是晴(S3),問(wèn):其后7天的天氣為“10
一般情況下,只能觀察到輸出符號(hào)序列(ab),而不能觀測(cè)到狀態(tài)之間如何轉(zhuǎn)移(狀態(tài)轉(zhuǎn)移概率)和狀態(tài)的分布(狀態(tài)的概率),所以稱為隱藏的馬爾可夫模型。
二、隱馬爾可夫模型的定義一般情況下,只能觀察到輸出符號(hào)序列(ab),而不能觀11球和缸S1SNS2P(red)=b1(1)P(yellow)=b1(2)P(bule)=b1(3)P(green)=b1(4)P(black)=b1(M)P(red)=b2(1)P(yellow)=b2(2)P(bule)=b2(3)P(green)=b2(4)P(black)=b2(M)P(red)=bN(1)P(yellow)=bN(2)P(bule)=bN(3)P(green)=bN(4)P(black)=bN(M)觀察序列O={綠,綠,藍(lán),紅,紅,黃,…..藍(lán)}球和缸S1SNS2P(red)=b1(1)P(red)=b212設(shè)有N個(gè)缸,每個(gè)缸中裝有很多彩色的球,不同顏色的球(M)的多少由一組概率分布來(lái)描述,根據(jù)某個(gè)初始概率分布,隨機(jī)選擇一個(gè)缸,例如第i個(gè)缸,再根據(jù)這個(gè)缸中彩色球顏色的概率分布,隨機(jī)選擇一個(gè)球,記O1,再把球放回缸中。根據(jù)缸的轉(zhuǎn)移概率,選擇下一個(gè)缸,例如第j個(gè)缸。再根據(jù)這個(gè)缸中彩色球顏色的概率分布,隨機(jī)選擇一個(gè)球,記O2,再把球放回缸中。最后得到描述球顏色的序列O1O2
,成為觀察值序列,但每次選取的缸和缸之間的轉(zhuǎn)移并不能直接觀察,被隱藏。設(shè)有N個(gè)缸,每個(gè)缸中裝有很多彩色的球,不同顏色的球(M)的多13第9章-隱馬爾可夫模型課件14一個(gè)硬幣正面反面二個(gè)硬幣S1S2狀態(tài)12一個(gè)硬幣正面反面二個(gè)硬幣S1S2狀態(tài)1215從S1到S3,并且輸出aab,可能的路徑有三種:S1S1S2S3S1S2S2S3S1S1S1S30.3×0.8×0.5×1×0.6×0.5=0.0360.5×1×0.4×0.3×0.6×0.5=0.0180.3×0.8×0.3×0.8×0.2×0=0S1S2S3設(shè)觀察到的輸出符號(hào)序列是aab。試求aab的輸出概率?從S1到S3,并且輸出aab,可能的路徑有三種:S1S1S216
由于是隱HMM模型,不知輸出aab時(shí),到底是經(jīng)過(guò)了哪一條不同狀態(tài)組成的路徑,因此,求aab的輸出概率時(shí),將每一種可能路徑的的輸出概率相加得到的總的概率值作為aab的輸出概率值:0.036+0.018+0=0.054由于是隱HMM模型,不知輸出aab時(shí),到底是經(jīng)過(guò)了哪171.HMM包含兩個(gè)隨機(jī)過(guò)程:(1)馬爾可夫鏈:一個(gè)隨機(jī)過(guò)程描述的狀態(tài)(S1,S2,S3)和狀態(tài)轉(zhuǎn)移序列(狀態(tài)轉(zhuǎn)移序列S1S1S2S3、S1S2S2S3和S1S1S1S3等);(2)一個(gè)隨機(jī)過(guò)程描述狀態(tài)和觀察值之間的統(tǒng)計(jì)對(duì)應(yīng)關(guān)系(每次轉(zhuǎn)移時(shí)輸出的符號(hào)組成的符號(hào)序列,如,aab)??偨Y(jié)1.HMM包含兩個(gè)隨機(jī)過(guò)程:總結(jié)18轉(zhuǎn)移中輸出符號(hào)的概率P32.HMM包含三個(gè)概率矩陣:每個(gè)狀態(tài)存在的概率矩陣P1狀態(tài)之間轉(zhuǎn)移的概率矩陣P2轉(zhuǎn)移中輸出符號(hào)的概率P32.HMM包含三個(gè)概率矩陣:每個(gè)狀態(tài)193.一個(gè)輸出概率:將每一種可能路徑的的輸出概率相加得到的總的概率值作為輸出概率。3.一個(gè)輸出概率:將每一種可能路徑的的輸出概率相加20三、隱馬爾可夫模型的參數(shù)模型中狀態(tài)的數(shù)目。狀態(tài)的集合每個(gè)狀態(tài)對(duì)應(yīng)的觀測(cè)符號(hào)數(shù)。觀測(cè)符號(hào)集合觀測(cè)符號(hào)序列的長(zhǎng)度,觀測(cè)符號(hào)序列狀態(tài)轉(zhuǎn)移概率分布狀態(tài)的觀測(cè)符號(hào)概率分布初始狀態(tài)的概率分布三、隱馬爾可夫模型的參數(shù)模型中狀態(tài)的數(shù)目。狀態(tài)的集合每個(gè)狀態(tài)21HMM的基本要素參數(shù)含義實(shí)例N狀態(tài)數(shù)目缸的數(shù)目M每個(gè)狀態(tài)可能的觀察值數(shù)目彩球顏色數(shù)目A與時(shí)間無(wú)關(guān)的狀態(tài)轉(zhuǎn)移概率矩陣在選定某個(gè)缸的情況下,選擇另一個(gè)缸的概率B給定狀態(tài)下,觀察值概率分布每個(gè)缸中的顏色分布p初始狀態(tài)空間的概率分布初始時(shí)選擇某口缸的概率HMM的基本要素參數(shù)含義實(shí)例N狀態(tài)數(shù)目缸的數(shù)目M每個(gè)狀態(tài)可能22HMM的應(yīng)用領(lǐng)域語(yǔ)音識(shí)別機(jī)器視覺(jué)人臉檢測(cè)機(jī)器人足球圖像處理圖像去噪圖像識(shí)別生物醫(yī)學(xué)分析DNA/蛋白質(zhì)序列分析HMM的應(yīng)用領(lǐng)域語(yǔ)音識(shí)別23四、隱馬爾可夫模型在語(yǔ)音識(shí)別中的應(yīng)用1.利用HMM進(jìn)行孤立字語(yǔ)音識(shí)別,每一字必須有一個(gè)HMM模型來(lái)描述,通過(guò)學(xué)習(xí)和訓(xùn)練來(lái)完成。字庫(kù)語(yǔ)文學(xué)音語(yǔ)S1S2S3四、隱馬爾可夫模型在語(yǔ)音識(shí)別中的應(yīng)用1.利用HMM進(jìn)行孤立字242.現(xiàn)對(duì)一個(gè)要識(shí)別的未知字語(yǔ)音,首先通過(guò)分幀、參數(shù)分析和特征參數(shù)提取,取得一組向量序列{X1,X2,..XN},N為幀長(zhǎng)。wen{X1,X2,..XN}發(fā)音2.現(xiàn)對(duì)一個(gè)要識(shí)別的未知字語(yǔ)音,首先通過(guò)分幀、參數(shù)分析和特征253.通過(guò)矢量量化把{X1,X2,..XN}轉(zhuǎn)化成一組符號(hào)序列(碼字)O={o1,o2,..oN},oi為碼本中的碼字,這個(gè)碼本是所有字的一個(gè)共同的碼本。{X1,X2,..XN}y1y2yJ{o1,o2,..oN}碼本3.通過(guò)矢量量化把{X1,X2,..XN}轉(zhuǎn)化成一組符號(hào)序列26
4.用這組符號(hào){o1,o2,..oN}計(jì)算在每個(gè)HMM上的輸出概率,輸出概率最大的HMM對(duì)應(yīng)的孤立字,就是識(shí)別結(jié)果。{o1,o2,..oN}字庫(kù)語(yǔ)文學(xué)音S1S2S3S1S2S3S1S2S3S1S2S34.用這組符號(hào){o1,o2,..oN}計(jì)算在每個(gè)HMM27無(wú)聲段鼻音段聲母輔音段元音段送氣段前過(guò)渡段后過(guò)渡段(1)發(fā)音的各個(gè)段(穩(wěn)定段,用一個(gè)全極點(diǎn)的濾波器來(lái)描述)構(gòu)成相應(yīng)的狀態(tài)。(2)聲學(xué)變化(LPC倒譜)對(duì)應(yīng)輸出序列,概率分布成混合高斯密度函數(shù)。(3)基本單元發(fā)音速率(停留時(shí)間和轉(zhuǎn)移時(shí)間)對(duì)應(yīng)狀態(tài)轉(zhuǎn)移概率(0.5)。無(wú)聲鼻音聲母元音送氣前過(guò)后過(guò)(1)發(fā)音的各個(gè)段(穩(wěn)定段,用一28五、隱馬爾可夫模型的基本算法識(shí)別問(wèn)題:給定觀測(cè)符號(hào)序列和模型,如何快速有效地計(jì)算輸出概率
估計(jì)模型產(chǎn)生觀測(cè)符號(hào)序列的最有可能經(jīng)過(guò)的路徑。所有可能的路徑中,概率最大的路徑。模型訓(xùn)練問(wèn)題:調(diào)整模型參數(shù),使得輸出概率最大。五、隱馬爾可夫模型的基本算法識(shí)別問(wèn)題:給定觀測(cè)符號(hào)序列291、前向-后向算法Forward-Backward給定一個(gè)觀測(cè)序列以及一個(gè)模型,由模型產(chǎn)生出的概率直接方法,列舉所有可能的路徑,計(jì)算輸出概率,然后求和。計(jì)算量為2TNT。如狀態(tài)數(shù)N=5,觀測(cè)值序列長(zhǎng)度T=100,計(jì)算量為1072。前向-后向算法1、前向-后向算法Forward-Backward給定一個(gè)觀30√前向算法一個(gè)前向變量
給定模型下,產(chǎn)生t以前的部分觀測(cè)符號(hào)序列(包含t在內(nèi)),且t時(shí)刻又處于狀態(tài)的概率。迭代算法初始化:
迭代計(jì)算:
最后計(jì)算:√前向算法一個(gè)前向變量31初始狀態(tài)和初始觀測(cè)的聯(lián)合概率。無(wú)論t時(shí)刻處于哪個(gè)狀態(tài),它都會(huì)以一定概率在t+1時(shí)刻轉(zhuǎn)移到t+1t表示t時(shí)刻的觀測(cè)的符號(hào)序列,并由t時(shí)刻轉(zhuǎn)移到t+1時(shí)刻的狀態(tài)發(fā)生的概率。初始狀態(tài)和初始觀測(cè)的聯(lián)合概率。無(wú)論t時(shí)刻處于哪個(gè)狀32觀測(cè)到的符號(hào)序列且在t+1時(shí)刻的處于狀態(tài)發(fā)生的概率。
給定模型下,產(chǎn)生t+1以前的部分觀測(cè)符號(hào)序列(包含t+1在內(nèi)),且時(shí)刻又處于狀態(tài)的概率。將所有的對(duì)i求和所需總乘數(shù)為:N(N+1)(T-1)總加數(shù)為:N(N-1)(T-1)觀測(cè)到的符號(hào)序列且在t+1時(shí)刻的處于狀態(tài)33S1S2S3S1S2S334√后向算法一個(gè)后向變量
給定模型下,t時(shí)刻處于狀態(tài),產(chǎn)生觀測(cè)符號(hào)序列的概率。迭代算法初始化:
迭代計(jì)算:
最后計(jì)算:√后向算法一個(gè)后向變量35S1S2S3S1S2S3362.維特比(viterbi)算法一個(gè)前向變量
給定模型下,產(chǎn)生t以前的部分觀測(cè)符號(hào)序列(包含t在內(nèi)),且時(shí)刻又處于狀態(tài)的最大概率。2.維特比(viterbi)算法一個(gè)前向變量37迭代算法(1)初始化:
(2)迭代計(jì)算:
(3)最后計(jì)算:
迭代算法38S1S1S2S30.3×0.8×0.5×1×0.6×0.5=0.036S1S2S3S1S1S2S30.3×0.8×0.5×1×0.6×0.5=393.Baum-Welch算法(模型訓(xùn)練算法)目的:給定觀察值序列O,通過(guò)計(jì)算確定一個(gè)模型
,使得最大。算法步驟: 1.初始模型(待訓(xùn)練模型), 2.基于以及觀察值序列O,訓(xùn)練新模型; 3.如果,說(shuō)明訓(xùn)練已經(jīng)達(dá)到預(yù)期效果,算法結(jié)束。 4.否則,令,繼續(xù)第2步工作
3.Baum-Welch算法(模型訓(xùn)練算法)目的:給定觀察值40給定模型和觀測(cè)序列條件下,在時(shí)間t處于狀態(tài)i,而在t+1處于狀態(tài)j的概率。t+1t給定模型和觀測(cè)序列條件下,在時(shí)間t處于狀態(tài)i,而在t41給定模型和觀測(cè)序列條件下,在時(shí)間t處于狀態(tài)i的概率。在時(shí)間T內(nèi),從狀態(tài)i進(jìn)行轉(zhuǎn)移的次數(shù)。在時(shí)間T內(nèi),從狀態(tài)i轉(zhuǎn)移到j(luò)的次數(shù)。給定模型和觀測(cè)序列條件下,在時(shí)間t處于狀態(tài)i的概率。在時(shí)間T42Baum-Welch算法重估:表示在時(shí)刻T內(nèi),狀態(tài)i轉(zhuǎn)移到狀態(tài)j的總次數(shù),除以在時(shí)間T內(nèi),狀態(tài)i被經(jīng)過(guò)的總次數(shù);表示在時(shí)刻T內(nèi),經(jīng)過(guò)狀態(tài)j,并且狀態(tài)j對(duì)應(yīng)的觀測(cè)事件為vk的總數(shù)除以時(shí)間T內(nèi),經(jīng)過(guò)狀態(tài)j的總數(shù)。表示在t=1處于狀態(tài)i的次數(shù)Baum-Welch算法重估:表示在時(shí)刻T內(nèi),狀態(tài)i轉(zhuǎn)移到狀43幾種典型形狀的馬爾可夫鏈a.A矩陣沒(méi)有零值的Markov鏈b.A矩陣有零值的Markov鏈c./d.左-右形式的Markov鏈幾種典型形狀的馬爾可夫鏈a.A矩陣沒(méi)有零值的Markov441.前向后向算法計(jì)算P(O|λ);2.Baum-Welch算法求出最優(yōu)解λ*=argmax{P(O|λ)};3.Viterbi算法解出最佳狀態(tài)轉(zhuǎn)移序列;4.根據(jù)最佳狀態(tài)序列對(duì)應(yīng)的λ給出候選音節(jié)或聲韻母;5.通過(guò)語(yǔ)言模型形成詞和句子。經(jīng)典HMM語(yǔ)音識(shí)別一般過(guò)程
1.前向后向算法計(jì)算P(O|λ);經(jīng)典HMM語(yǔ)音識(shí)別一般45Baum-WelchRe-estimationSpeechdatabaseFeatureExtractionConverged?l1l2l7HMMwaveformfeatureYesNoend經(jīng)典HMM語(yǔ)音識(shí)別訓(xùn)練過(guò)程Baum-WelchSpeechFeatureConverg46SelectmaximumRecognizedwordSpeechFeatureextractionLikelihoodcomputationλ1Likelihoodcomputationλ
V...P(O|
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)評(píng)工程師環(huán)境影響評(píng)價(jià)報(bào)告編制與審核流程
- 2025年度車輛掛靠與二手車交易市場(chǎng)合作協(xié)議
- 人教版七年級(jí)歷史與社會(huì)上冊(cè)2.1大洋與大洲 教學(xué)設(shè)計(jì)
- 2025年度商業(yè)物業(yè)租賃合同(含租戶經(jīng)營(yíng)風(fēng)險(xiǎn)分擔(dān))4篇
- 2025年度物聯(lián)網(wǎng)技術(shù)應(yīng)用合伙協(xié)議書(shū)范本
- 2025年度液化氣智能調(diào)度與優(yōu)化運(yùn)營(yíng)合同
- 2025年度智能化樁基材料采購(gòu)合同范本
- 2025年度醫(yī)師多點(diǎn)執(zhí)業(yè)醫(yī)療資源共享合作協(xié)議范本
- 2025年度押一付三租賃合同(含租賃合同續(xù)簽條款)
- 2025年度海關(guān)協(xié)管員聘用合同規(guī)范文本
- 高考地理一輪復(fù)習(xí)新題精練:九 鄉(xiāng)村和城鎮(zhèn) 考點(diǎn)1 城鄉(xiāng)內(nèi)部空間結(jié)構(gòu) 課件(通用版)(31張PPT)
- 《數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論》完整版課件(全)
- 智慧教育 云平臺(tái)建設(shè)方案
- 精雕JDPaint快捷鍵大全
- 燈泡貫流式機(jī)組基本知識(shí)培訓(xùn)ppt課件
- 小學(xué)數(shù)學(xué)四年級(jí)下冊(cè)培優(yōu)補(bǔ)差記錄
- 人教版三年級(jí)下冊(cè)體育與健康教案(全冊(cè)教學(xué)設(shè)計(jì))
- DB61∕T 5006-2021 人民防空工程標(biāo)識(shí)標(biāo)準(zhǔn)
- 土壤學(xué)習(xí)題與答案
- 產(chǎn)品結(jié)構(gòu)設(shè)計(jì)(課堂PPT)
- 第九課_靜止的生命
評(píng)論
0/150
提交評(píng)論