版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、模式識(shí)別與機(jī)器學(xué)習(xí)課程實(shí)驗(yàn)報(bào)告1實(shí)驗(yàn)內(nèi)容DesignanHMMmodel,andgeneratesequentialdata(trainingandtest)withthemodel.Learningmodelparametersonthetrainingdata.Testthemodellearnedonthetestdata:Estimatethemostprobablevaluesforthelatentvariables.2實(shí)驗(yàn)環(huán)境Window7,matlab7.11.03實(shí)驗(yàn)原理HMM即隱性馬爾可夫模型,此模型可認(rèn)為是狀態(tài)空間模型的一個(gè)特殊情況。當(dāng)令狀態(tài)空間模型中的潛變量為離散的時(shí),
2、我們即得到了隱性馬爾可夫模型。3.1模型狀態(tài)在一個(gè)典型的HMM模型中,通常有兩個(gè)狀態(tài)集合來描述該模型狀態(tài):隱含狀態(tài),通常用S表示。這些狀態(tài)之間滿足馬爾可夫性質(zhì),是馬爾可夫模型中實(shí)際所隱含的狀態(tài)。這些狀態(tài)通常無法通過直接觀測而得到。(例如SI、S2、S3等等)??捎^測狀態(tài),通常用O表示。在模型中與隱含狀態(tài)相關(guān)聯(lián),可通過直接觀測而得到。(例如Ol、O2、03等等)??捎^測狀態(tài)的數(shù)目不一定要和隱含狀態(tài)的數(shù)目一致。3.2模型參數(shù)一個(gè)典型的HMM模型包含以下參數(shù): 初始狀態(tài)概率矩陣n。表示隱含狀態(tài)在初始時(shí)刻t=l時(shí)刻的概率矩陣,(例如t=l時(shí),P(Sl)=pl、P(S2)=P2、P(S3)=p3,則初始
3、狀態(tài)概率矩陣n=p1p2p3).隱含狀態(tài)轉(zhuǎn)移概率矩陣A。描述了HMM模型中各個(gè)狀態(tài)之間的轉(zhuǎn)移概率,N代表隱含狀態(tài)數(shù)目。其中Aij=P(Sj|Si),lWi,jWN。表示在t時(shí)刻、狀態(tài)為Si的條件下,在t+1時(shí)刻狀態(tài)是Sj的概率。觀測狀態(tài)發(fā)射概率矩陣B。表示在t時(shí)刻、隱含狀態(tài)是Sj條件下,觀察狀態(tài)為Oi的概率。令N代表隱含狀態(tài)數(shù)目,M代表可觀測狀態(tài)數(shù)目,貝V:Bij=P(Oi|Sj),lWiWM,lWjWN.一般來說,可以用入=(A,B,n)三元組來表示一個(gè)隱性馬爾可夫模型。給定了這三個(gè)參數(shù),我們便得到了一個(gè)HMM模型。在實(shí)驗(yàn)過程中,我們在matlab環(huán)境下指定各組參數(shù),得到一個(gè)HMM后,便可以
4、利用這個(gè)模型生成一定量的數(shù)據(jù)作為訓(xùn)練集與測試集。3相關(guān)算法根據(jù)實(shí)驗(yàn)內(nèi)容,可以得知這個(gè)實(shí)驗(yàn)中主要涉及到利用HMM解決的三類問題:給定觀察得到的序列O,如何調(diào)整參數(shù)入,使P(O|入)最大。即通過給定O,不斷估算一個(gè)適合的參數(shù)入=(A,B,n),使發(fā)生這個(gè)O的概率P(O|入)最大。這個(gè)問題的一種有效解決算法是Baum-Welch算法,即EM算法的一種特殊形式。且通過對(duì)BW算法的分析可以看出,該算法以前后向算法為基礎(chǔ)。前后向算法用于計(jì)算在某一時(shí)刻t,潛變量處于某一狀態(tài)的概率。EM算法的具體過程在此不再贅述。給定觀測序列0=0102030t和模型參數(shù)入=(A,B,n),怎樣有效計(jì)算某一觀測序列的概率,進(jìn)
5、而可對(duì)該HMM做出相關(guān)評(píng)估。例如,已有一些模型參數(shù)各異的HMM,給定觀測序列O=O1O2O3-Ot,我們想知道哪個(gè)HMM模型最可能生成該觀測序列。通常我們利用前后向算法分別計(jì)算每個(gè)HMM產(chǎn)生給定觀測序列O的概率,然后從中選出最優(yōu)的HMM模型。給定一個(gè)觀察到的序列O,及參數(shù)入,求出最有可能產(chǎn)生這種序列的狀態(tài)序列S。這個(gè)問題的一種有效解決算法是Viterbi算法,也是一種動(dòng)態(tài)的規(guī)劃方法,用來找出最可能的狀態(tài)路徑。Viterbi算法的具體原理及過程在此不再絜述。4實(shí)驗(yàn)過程一、定義HMM模型中的各參數(shù),得到一個(gè)HMM模型。在本實(shí)驗(yàn)中,定義該HMM模型為以下實(shí)例。假設(shè)程序員Tom每天的活動(dòng)會(huì)被其所在項(xiàng)目
6、組是否忙碌所影響。在本例中,項(xiàng)目組忙碌情況為潛變量,包括忙(Busy),閑(free)二種狀態(tài);Tom每天的活動(dòng)是觀測變量,包括編程(programming,運(yùn)動(dòng)(Sport)休息(Relax),讀書(Reading,旅行(Travellin)潛變量對(duì)應(yīng)狀態(tài)如表1所示:忙閑12表1可觀測變量狀態(tài)對(duì)應(yīng)如表2所示:編程運(yùn)動(dòng)休息讀書旅行12345表2此HMM模型中的參數(shù)的初始值分別定義如下:n二0.50.5A=0.60.7_0.40.3_0.60.20.10.2B=0.10.40.10.1_0.10.1_賦得初始值后,利用matlab中的某函數(shù),隨機(jī)根據(jù)(A,B,n)的值,生成一個(gè)data集合,即可
7、根據(jù)已有的markov模型來生成一個(gè)數(shù)據(jù)集。在這個(gè)數(shù)據(jù)集中,將會(huì)80%的數(shù)據(jù)用來訓(xùn)練生成一個(gè)HMM的參數(shù),另外20%將會(huì)用來作為測試集來測試這一模型的準(zhǔn)確性。具體的程序運(yùn)行及實(shí)現(xiàn)過程詳見代碼說明及注釋。程序運(yùn)行后,可見代碼運(yùn)行產(chǎn)生的數(shù)據(jù)集data的部分?jǐn)?shù)值顯示如圖1所示(也可在命令窗口中通過指令顯示變量數(shù)值,這里我們直接在workspace中查看):二、根據(jù)所得的數(shù)據(jù)集作為輸入,對(duì)HMM模型進(jìn)行訓(xùn)練,產(chǎn)生一組新的參數(shù)。如實(shí)驗(yàn)原理部分所述,該部分所采用EM作為訓(xùn)練參數(shù)產(chǎn)生的方法。在程序中,設(shè)置迭代次數(shù)為50次。經(jīng)過50次迭代后,程序運(yùn)行結(jié)果如圖2所示:迭代數(shù)次后得到的訓(xùn)練模型中的對(duì)數(shù)似然值:it
8、eration4乞loglik=-481.581776iteration47,loglik=-481.569585iteration48jloglik=-481.557800iteration49loglik=-481.546372iteration50jloglik=-481.535261圖2得到的訓(xùn)練模型中的初始概率矩陣的值如圖3所示:圖3得到訓(xùn)練模型中的轉(zhuǎn)移矩陣的值如圖4所示:得到的訓(xùn)練模型中的發(fā)射矩陣的值如圖5所示:三、利用前后向算法,通過計(jì)算測試數(shù)據(jù)的似然數(shù)值,對(duì)訓(xùn)練所得的模型進(jìn)行測試。程序運(yùn)行后產(chǎn)生的似然對(duì)數(shù)值為loglik,結(jié)果如下圖6所示:三、根據(jù)Viterbi算法,用訓(xùn)練產(chǎn)生
9、的模型,估算出該模型下測試數(shù)據(jù)的最大可能的潛變量序列。程序運(yùn)行后產(chǎn)生的序列如下圖7所示:5實(shí)驗(yàn)結(jié)果本實(shí)驗(yàn)的實(shí)驗(yàn)結(jié)果已在實(shí)驗(yàn)過程中給出。6實(shí)驗(yàn)總結(jié)及存在的問題6.1實(shí)驗(yàn)總結(jié):給定參數(shù),完成對(duì)HMM模型的構(gòu)建,并基于該模型生成數(shù)據(jù)集,用于訓(xùn)練與測試(80%用作訓(xùn)練數(shù)據(jù),20%用作測試數(shù)據(jù))。以上一步所產(chǎn)生的數(shù)據(jù)集的部分?jǐn)?shù)據(jù)作為訓(xùn)練集,對(duì)HMM模型進(jìn)行訓(xùn)練,生成訓(xùn)練參數(shù)?;谟?xùn)練模型,計(jì)算測試數(shù)據(jù)集的似然對(duì)數(shù)值.給定模型參數(shù)及測試觀測序列,估計(jì)潛變量最大可能序列。6.2存在的問題:由于選取的訓(xùn)練集及算法本身存在的各種問題,從程序的運(yùn)行結(jié)果可以看出,EM算法在若干次迭代后其最大似然對(duì)數(shù)值不再發(fā)生大的變化,而且,訓(xùn)練參數(shù)的結(jié)果并不十分令人滿意。訓(xùn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版高性能鋁合金管材購銷合同4篇
- 2025年度通信管材采購與環(huán)保監(jiān)測服務(wù)合同3篇
- 2025年培訓(xùn)實(shí)習(xí)招聘合同
- 2025年押證不押車健身貸款合同為健身創(chuàng)業(yè)者提供資金保障6篇
- 2025年上市發(fā)行擔(dān)保協(xié)議
- 2025年園藝代理協(xié)議
- 2025年醫(yī)療項(xiàng)目合作合同
- 2025年新三板協(xié)議轉(zhuǎn)讓股權(quán)專項(xiàng)資產(chǎn)評(píng)估與轉(zhuǎn)讓協(xié)議2篇
- 二零二五版企業(yè)人力資源規(guī)劃與配置合同3篇
- 2025年健身培訓(xùn)營合同
- 醫(yī)藥銷售合規(guī)培訓(xùn)
- 青島版二年級(jí)下冊三位數(shù)加減三位數(shù)豎式計(jì)算題200道及答案
- DB51-T 5038-2018 四川省地面工程施工工藝標(biāo)準(zhǔn)
- 三年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)附答案
- GB/T 12723-2024單位產(chǎn)品能源消耗限額編制通則
- 2024年廣東省深圳市中考英語試題含解析
- GB/T 16288-2024塑料制品的標(biāo)志
- 麻風(fēng)病防治知識(shí)課件
- 建筑工程施工圖設(shè)計(jì)文件審查辦法
- 培訓(xùn)機(jī)構(gòu)應(yīng)急預(yù)案6篇
- 北師大版數(shù)學(xué)五年級(jí)上冊口算專項(xiàng)練習(xí)
評(píng)論
0/150
提交評(píng)論