西南林學院 2009 屆本(專)科畢業(yè)生_第1頁
西南林學院 2009 屆本(專)科畢業(yè)生_第2頁
西南林學院 2009 屆本(專)科畢業(yè)生_第3頁
西南林學院 2009 屆本(專)科畢業(yè)生_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、西南林學院 2009 屆本(專)科畢業(yè)生畢業(yè)論文(設計)畢業(yè)實習計劃表(本表由指導教師填寫)論文(設計)題目基于GMM的語者辨識系統(tǒng)的設計Speaker Identification using GMM類別科研 設計 調查 其它性質自選題 計劃任務 橫向任務 其它指導教師呂丹桔職稱講 師學 號學生姓名主 要 完 成 工 作論文指導工作計劃:(包括以下7個部分:1. 目的意義。2. 簡要內容。3.重點解決的問題。4.預期結果或成果。5.所需軟件平臺或設備。6.時間進度。7.要求學生的基礎。1、目的意義本課題擬采用人的語音特征進行個人身份的辨識Speaker Identification(SI)。

2、采用語音識別方式與傳統(tǒng)方式(如證件、ATM卡等)和身份標識知識(如用戶名和密碼)相比更具通用性(每個人都具有),獨特性(每個人都不一樣),恒定性(不隨時間變化而變化),可收集性(可定量測量),準確性,高可采用性(易于授受)和低欺騙性。2、主要內容本課題擬采用GMM(Gaussian Mixture Model)的方法實現(xiàn)簡單的語者辨識(Speaker Identification)系統(tǒng)。其系統(tǒng)實現(xiàn)主要由兩個部分組成,即:訓練階段(training)和識別階段(recognition)。訓練階段(training)主要完成語音段的選取,以提取特征參數(shù),由于語音信號是十分復雜的非平穩(wěn)信號,它不僅包

3、含語義信息,還有個人特征信息,因此特征參數(shù)應能完全,準確在表達語音信號所攜帶的全部信息。再完成特征參數(shù)選擇后將利用GMM技術,在時間表上對其特征序列多次平均,形成每個說話人的參考模板,從而完成訓練階段的任務;識別階段(recognition)將針對語音信號進行特征參數(shù)分析,計算與訓練階段得出的參考模板的距離,進行判決,從而實現(xiàn)對說話人的識別。3、重點解決的問題:Training:(1)完成對語音信號的采集,收集工作,建立語音庫:選取一定數(shù)量的樣本信號。 (2)主要完成特征參數(shù)的提取,主要選取目前世界上最常采用的參數(shù):Mel Frequency Cepstrum Coefficient, MFC

4、C , 該參數(shù)考慮了人耳的聽覺特性,將頻譜轉化為基于Mel頻率的非線性頻譜。由于充分考慮了人的聽覺特性,而且沒有任何的前提假設,MFCC參數(shù)具有良好的識別性能和抗噪聲能力。同時對其它參數(shù)如LPCC ,PLP也進行一定的對比研究;對于計算機性能有一定的要求;(3)運用數(shù)據(jù)聚類方法,完成對特征參數(shù)的變換,以求最佳參考模板。由于語音信號的復雜性在特定語音識別系統(tǒng)中要求把語音信號的某些特征突現(xiàn)出來,進行分類。該SI系統(tǒng)主要采用線性判別分析(LDA)與主分量分析方法(PCA),實現(xiàn)對特征參數(shù)的抽取,建立說話人與文本無關(Text-Independent)的參考模板;對于計算機性能有一定的要求;(4)識別

5、模型的選擇高斯混合模型(GMM):多維概率密度函數(shù),在矢量聚類的基礎上,把每一類視為一個多維高斯分布函數(shù)。求出每一類的均值,協(xié)方差矩陣和出現(xiàn)的概率,將此作為每個人的訓練模板;Recognition:(1)待識別人語音信號的提?。哼M行8kHz采樣,每樣點8bit量化;(2)完成該信號特征參數(shù)的提取,與訓練階段類似,在此不再重復;(3)運用識別模型進行識別,判決;對于模型的選擇主要是:GMM與訓練階段類似,在此不再重復;4、預期結果:實現(xiàn)基于GMM的語者辨識系統(tǒng)(Speaker Identification System using GMM)Training:(1)完成語音信號的采集,建立語音庫(

6、2)完成特征參數(shù)MFCC的提?。?)采用Data Cluster 完成對MFCC的變換,建立訓練模板(4)計算GMM識別模型Recognition:(1) 待識別人語音信號的采樣;(2) 完成該信號特征參數(shù)MFCC的提??;(3) 運用GMM模型進行識別,判決;(4) 統(tǒng)計識別率,進行系統(tǒng)評定。5、所需軟件平臺或設備: 軟件平臺: Matlab7.0 設備:能夠滿足開發(fā)需要的PC機。6、時間進度2008.10.1511.15 學生選題2008.11.1612-31 學生收集論文相關資料,并指導學生撰寫開題報告2009.1.12008.3.10 熟練掌握Matlab語言的使用;信號的采集;系統(tǒng)預備

7、知識的準備(數(shù)學概率論(Bayes),線性代數(shù)(矩陣變化),數(shù)字信號處理(付里葉變化),數(shù)據(jù)分類Data Cluster)2009.3.11 4.20 中期評估,系統(tǒng)實現(xiàn)2009. 4.215.15 學生整理資料,撰寫論文初稿2009 5.16答辯前 測試軟件,完善系統(tǒng),進行論文修改與定稿7、要求學生基礎:(1) 具有一定的模式識別與數(shù)據(jù)分類知識基礎;(2) 了解信號與系統(tǒng)分析的知識;(3) 掌握Matlab的運用續(xù)表:畢業(yè)實習指導工作計劃:2008.10.1511.15 學生選題,確定論文方向2008.11.1612-31 指導學生收集課題相關資料,了解技術背景,特別是國內研究現(xiàn)狀,確定系統(tǒng)解決方案,完成開題報告2009.1.108.3.10 參照課題需求,學習相關課題技術知識,進一步明確系統(tǒng)解決和實現(xiàn)方案,并完成系統(tǒng)總體方案設計和技術方案設計,系統(tǒng)編程工作200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論