2、外文參考資料及譯文-楊敏_第1頁
2、外文參考資料及譯文-楊敏_第2頁
2、外文參考資料及譯文-楊敏_第3頁
2、外文參考資料及譯文-楊敏_第4頁
2、外文參考資料及譯文-楊敏_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、畢 業(yè) 設(shè) 計(論 文)外 文 參 考 資 料 及 譯 文譯文題目: 基于語音識別的智能門控系統(tǒng)設(shè)計 學(xué)生姓名: 楊 敏 學(xué)號: 0805110732 專業(yè): 通信工程 所在學(xué)院: 信息技術(shù)學(xué)院 指導(dǎo)教師: 陳 美 君 職稱: 高級工程師/副教授 2011年 12月 7 日說明:要求學(xué)生結(jié)合畢業(yè)設(shè)計(論文)課題參閱一篇以上的外文資料,并翻譯至少一萬印刷符(或譯出3千漢字)以上的譯文。譯文原則上要求打印(如手寫,一律用400字方格稿紙書寫),連同學(xué)校提供的統(tǒng)一封面及英文原文裝訂,于畢業(yè)設(shè)計(論文)工作開始后2周內(nèi)完成,作為成績考核的一部分。13基于語音識別的智能門控系統(tǒng)設(shè)計崔波中國,唐山河北理工

2、大學(xué)信息學(xué)院郵箱:mikecui薛同澤中國,石家莊河北科技大學(xué)信息科學(xué)與工程學(xué)院郵箱:dianzixinxi摘要:該智能門控系統(tǒng)采用語音識別技術(shù),在陵陽單片機SPCE061A上實現(xiàn)。硬件部分主要由SPCE061A單片機、電源與門控電路、外擴存儲器SPR4096、音頻輸入與輸出電路等組成。主要技術(shù)是該單片機在語音識別中的應(yīng)用和對門控電路的設(shè)計。該系統(tǒng)軟件部分由語音訓(xùn)練模塊、語音識別模塊、語音數(shù)據(jù)處理模塊、語音播報模塊和密碼輸入與確認(rèn)模塊組成,通過對系統(tǒng)的初始化和識別訓(xùn)練實現(xiàn)了語音數(shù)據(jù)的采集、特征提取、特定語音識別和語音播放等功能。根據(jù)語音識別算法原理,對語音信號的預(yù)處理、特征提取、模式匹配做了分

3、析。該系統(tǒng)實驗結(jié)果表明,系統(tǒng)性能穩(wěn)定,識別效果好,可用于家庭或小型辦公場所的門鎖控制。關(guān)鍵詞: 訪問控制、線性預(yù)測、語音識別、模式匹配、特征提取一、引言當(dāng)前智能型門衛(wèi)系統(tǒng)中利用的識別技術(shù)有很多種,其中基于特定人的身份識別的技術(shù)也有很多,但相對于其他技術(shù),語音識別技術(shù)是目前公認(rèn)的比較方便與安全的識別技術(shù)之一,該技術(shù)是利用人體生物特征進行身份認(rèn)證的一種技術(shù)。由于每個人的生物特征與其他人相比具有不同的唯一性和在一定時期內(nèi)不變的穩(wěn)定性,因此不易偽造和假冒,所以利用語音識別技術(shù)進行身份認(rèn)證,安全、準(zhǔn)確、可靠。二、語音識別的分類由于語音識別的目的和作用不同,識別又分為說話人識別和語音識別。其中說話人識別,

4、可分為與文本有關(guān)和與文本無關(guān)兩類。與文本有關(guān)的語音識別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音,每個人的語音模型逐個被精確地建立,而識別時也必須按規(guī)定的內(nèi)容發(fā)音,因此可以達(dá)到較好的識別效果;而與文本無關(guān)的識別系統(tǒng)則不規(guī)定說話人的發(fā)音內(nèi)容,模型建立相對困難,但用戶使用方便,應(yīng)用范圍較寬。從用途上看,可分為說話人識別和說話人確認(rèn)。前者判定某一待識別的聲音是多個話者中的一個,是多選一的問題,屬于閉集識別范圍。后者判定一個待識別的聲音“是或不是”某一特定說話者的語音,其輸出只有兩種結(jié)果,為肯定或否定的問題。該系統(tǒng)的核心處理器是陵陽16位單片機SPCE061A,并在其上實現(xiàn)與文本有關(guān)的說話人的確認(rèn),然后執(zhí)行相應(yīng)的

5、命令與操作。該系統(tǒng)主要由說話人識別模塊、門鎖控制電機以及門鎖等部分組成。在訓(xùn)練時,說話人的聲音通過麥克風(fēng)進入說話人語音信號采集前端電路,由語音信號處理電路對采集的語音信號進行特征化和語音處理,提取說話人的個性特征參數(shù)并進行存儲,形成說話人特征參數(shù)數(shù)據(jù)庫。在識別時,將待識別語音與說話人特征參數(shù)數(shù)據(jù)庫進行匹配,通過輸出電路控制門控電機,最終實現(xiàn)對門鎖的控制。本系統(tǒng)的硬件部分由單片機SPCE061A、音頻輸出電路、音頻輸入電路、語音識別電路、門鎖控制電路、FLASH電路和按鍵電路等部分組成。系統(tǒng)框圖如圖1所示。硬件系統(tǒng)主要完成的任務(wù)是將語音信號數(shù)字化,實現(xiàn)語音數(shù)據(jù)的采集、上傳、保存、識別及播放。三、

6、硬件系統(tǒng)的設(shè)計(一)、CPU核心電路SPCE061A 高性能 16 位單片機的工作電壓范圍為 2.65.5V , 系統(tǒng)工作頻率為 0.37549.152MHz。在片內(nèi)集成有 32 位可編程的多功能 I/O 端口、兩個 16 位定時器/計數(shù)器、7 通道10位電壓模-數(shù)轉(zhuǎn)換器(ADC)、自動增益控制功能的麥克風(fēng)輸入方式、雙通道10位DAC方式的音頻輸出功能及看門狗定時器。中斷控制器可處理3種 FIQ中斷和 11種IRQ 中斷,以及一個由指令BREAK控制的軟中斷。提供豐富的C函數(shù)庫和語音處理函數(shù)庫,因此非常適合數(shù)字聲音和語音識別產(chǎn)品的開發(fā)。(二)、語音識別電路語音識別電路的工作原理是智能系統(tǒng)在提取

7、語音后,對語音信號進行分析,首先是噪音的濾除和預(yù)加重,然后語音信號經(jīng)過濾波器組進行信號的選擇,提取有用信號,通過PARCOR系數(shù)、線性預(yù)測系數(shù)、過零次數(shù)和能量性關(guān)函數(shù)等的計算匹配對信號進行處理選擇。語音信號在進行分析處理后與語音庫(即字典)里的語音量進行模式匹配,最后根據(jù)匹配的結(jié)果輸出語音識別結(jié)果。語音識別電路的基本結(jié)構(gòu)如圖2所示。(三)、電源電路為了減少功率的消耗,單片機SPCE061A芯片采用低供電電壓來實現(xiàn)。它有兩個電源,一個是內(nèi)部集成的電源VDD,另一個是通過I / O口供電的電源VDDH。I / O口供電電源的電壓是5V,內(nèi)部電源的電壓則是3.3V。內(nèi)部電源電壓較低主要是為了減少功率

8、消耗和降低單片機的工作溫度。雖然SPCE061A單片機的電壓范圍很廣,芯片仍然能穩(wěn)定運行,且能滿足I / O端口電壓,其外部供電電路如圖3所示。220V的交流電壓由穩(wěn)壓模塊7805轉(zhuǎn)化為直流電壓5 V,再為語音識別模塊和每一個內(nèi)部I / O口提供電源。5 V的直流電壓由TR1972-33轉(zhuǎn)換成3.3 V的直流電壓。四、語音信號的處理語音信號處理過程的總體結(jié)構(gòu)框架圖,如圖4所示。從總體結(jié)構(gòu)圖可以看出:首先對輸入的語音信號要進行預(yù)處理,對信號進行適當(dāng)?shù)姆糯?,并進行反混疊濾波來消除工頻干擾;然后為方便數(shù)字化設(shè)備對信號進行計算處理則對信號進行數(shù)字化,將模擬信號轉(zhuǎn)化為數(shù)字信號;接著進行特征提取,用反映語

9、音信號特點的若干參數(shù)來代表語音,最后根據(jù)任務(wù)的不同,采用不同的處理方法。語音識別分為兩個階段:訓(xùn)練階段和識別階段。在訓(xùn)練階段對用特征參數(shù)形式表示的語音信號進行相應(yīng)的處理,獲得表示識別基本單元共性特點的標(biāo)準(zhǔn)數(shù)據(jù),以此形成參考模板,將所有能識別的基本單元的參考模板結(jié)合在一起,形成參考模板庫。在識別階段將待識別的語音經(jīng)過特征提取后逐一與參考模板比較,找出最相似的參考模板所對應(yīng)的發(fā)音,即為識別結(jié)果。(一)語音信號預(yù)處理噪聲的存在對語音信號的處理和識別存在著嚴(yán)重的干擾,因此我們在處理前先要進行噪聲的處理。對麥克風(fēng)輸入的模擬語音信號要進行采樣和量化,獲得數(shù)字化的語音信號。在語音信號數(shù)字化之前,要進行防混疊

10、濾波及防工頻干擾。其中防混疊濾波是濾除高于1/2采樣頻率的信號成分或噪聲,使信號帶寬限制在某個范圍內(nèi)。得到干凈的語音信號后并通過預(yù)加重技術(shù)濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,提升語音信號的高頻部分,而且它還可以起到消除直流漂移、抑制隨機噪聲和提升清音部分能量的作用。(二)特征提取本系統(tǒng)采用了不同說話人的分散程度與各說話人自身的分散程度之間的對比值作為特征參數(shù)的評價方法。其基本思想是:對同一說話人的一段語音提取一組特征參數(shù),相當(dāng)于把該段語音映射到多維空間上的一個點。同一說話人的不同語音會在特征空間產(chǎn)生不同的點,其分布可用多變量概率密度函數(shù)來描述。對同一個說話人的不相同單次的發(fā)音,這

11、些點比較集中;而不同說話人的發(fā)音分布相距較遠(yuǎn),則所選擇的這組特征參數(shù)就能夠有效的描述說話人的個性特征。根據(jù)這一原則,對單個參數(shù)而言,可以取兩種分布參數(shù)的方差比(稱為F比)作為有效的度量準(zhǔn)則。F比反映了不同說話人的分散程度與各說話人自身的分散程度之間的對比關(guān)系。某一特征參數(shù)的F比越大,說明對于本特征,平均而言前者要大于后者。因此,說話人識別系統(tǒng)中采用F比較大的,這樣系統(tǒng)會得到較好的性能。(三)模塊匹配目前針對各種特征參數(shù)提出的模式匹配方法的研究越來越深入。典型的方法有:矢量量化方法、高斯混合模型方法、隱馬爾可夫模型方法、動態(tài)時間規(guī)整(DTW)方法和人工神經(jīng)網(wǎng)絡(luò)方法。這些方法都有各自的優(yōu)點和缺點。

12、其中DTW算法對于較長語音的識別,模版匹配運算量太大,但對短語音(有效語音長度低于3s)的識別既簡單又有效,而且并不比其他方法識別率低,特別適用于短語音、與文本有關(guān)的說話人識別系統(tǒng)。本系統(tǒng)采用端點松弛兩點的(DTW)算法,端點松弛引起的計算量增加并不大,還可以放松對端點檢測的精度要求五、實驗結(jié)果對于使用者要確認(rèn)該系統(tǒng)的實用性和穩(wěn)定性,則表征系統(tǒng)性能的兩個重要的參量是錯誤識別率和拒絕識別率。前者是系統(tǒng)接受非使用者的語音信號而造成的錯誤,后者是系統(tǒng)拒絕使用者的語音信號而造成的錯誤,二者與匹配閾值的設(shè)定相關(guān)。匹配閾值的設(shè)定與語音鎖系統(tǒng)的功能側(cè)重有關(guān)、應(yīng)用場合,對于特意為家用使用者設(shè)計的該智能系統(tǒng)而言

13、,要求錯誤識別率和拒絕識別率盡可能低,甚至為零。表1是先用錄音機對特定人的發(fā)音進行錄音(發(fā)音的語調(diào)、語素和話音內(nèi)容相同),然后用錄音與特定人真實發(fā)音在不同的距離范圍內(nèi)做40次比較。在實驗結(jié)果中,使用錄音機進行40次實驗,非特定人通過認(rèn)證的次數(shù)為零。對于使用該系統(tǒng)的家庭而言,這個結(jié)果十分理想的。而當(dāng)說話人與麥克風(fēng)距離較遠(yuǎn)時,識別率有明顯下降,主要是因為隨著距離的增加,有用的語音信號的能量與噪聲能量的比值逐漸下降,使得在特征提取時發(fā)生失真,最終導(dǎo)致在模式匹配時很難達(dá)到匹配要求。解決這一問題可以通過調(diào)整閾值來實現(xiàn)。六、結(jié)論本文介紹的智能門控系統(tǒng)采用的是語音識別技術(shù),即利用語音控制智能系統(tǒng)來執(zhí)行對門禁

14、系統(tǒng)的操作,并隨語音的不同給予相應(yīng)的語音回答與提示。語音識別與其他生物識別技術(shù)相比,不僅具有不會遺失和忘記、不需記憶、使用方便等優(yōu)點,而且還具有用戶接受程度高,聲音輸入設(shè)備造價低廉等優(yōu)點。由于涉及不到用戶的隱私問題,所以可以方便的推廣應(yīng)用。實驗測試表明,該系統(tǒng)性能穩(wěn)定、識別效果好。本文作者創(chuàng)新點:將陵陽單片機的語音處理技術(shù)用于門控系統(tǒng),拓展了單片機使用范圍,豐富了語音識別應(yīng)用領(lǐng)域,為智能門控系統(tǒng)提供了一種新方法。參考文獻(xiàn):1 韓吉慶張磊鄭鐵燃語音信號處理M 北京:清華大學(xué)出版社, 20042 俞鐵城.語音識別的發(fā)展現(xiàn)狀J通信世界,20052:563 趙世強荊炳禮趙滿凌陽16位單片機SPCE061A的最小系統(tǒng)及開發(fā)J國外電子元器件,20035:37394 姜志玲用凌陽單片機實現(xiàn)多路數(shù)據(jù)采集與傳輸系統(tǒng)J西華大學(xué)學(xué)報:自然科學(xué)版,200524(2): 69725 羅俊光湯榮江基于DSP的非特定人語音識別系統(tǒng)J微計算機信息,2007 4-2:1951966 Mohamed AbouiianaOn line weight and shrinkage control of cotton kn-itsEB/OLhttp : /www.ntcre

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論