




已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
h uj i np i n g o fw i r e l e s sa c c e s sc o n t r o l b e l a n z h o uu n i v e r s i t yo ft e c h n o l o g y 2 0 0 8 at h e s i ss u b m i a e di np a r t i a ls a t i s f a c t i o no ft h e r e q u i r e m e n t sf o rt h ed e g r e eo f m a s t e ro f e n g i n e e r i n g c i r c u i t sa n ds y s t e m s i nt h e g r a d u a t es c h o o l o f l a n z h o uu n i v e r s i t yo f t e c h n o l o g y s u p e r v i s o r e n g i n e e rc h e n r u o z h u m a y 2 0 1 1 蘭州理工大學學位論文原創(chuàng)性聲明和使用授權說明 原創(chuàng)性聲明 本人鄭重聲明 所呈交的論文是本人在導師的指導下獨立進行研究所 取得的研究成果 除了文中特別加以標注引用的內容外 本論文不包含任 何其他個人或集體已經發(fā)表或撰寫的成果作品 對本文的研究做出重要貢 獻的個人和集體 均已在文中以明確方式標明 本人完全意識到本聲明的 法律后果由本人承擔 作者簽名 易 童彳日期 矽 7 年彥月7 日 學位論文版權使用授權書 本學位論文作者完全了解學校有關保留 使用學位論文的規(guī)定 即 學校有權保留并向國家有關部門或機構送交論文的復印件和電子版 允許 論文被查閱和借閱 本人授權蘭州理工大學可以將本學位論文的全部或部 分內容編入有關數據庫進行檢索 可以采用影印 縮印或掃描等復制手段 保存和匯編本學位論文 同時授權中國科學技術信息研究所將本學位論文 收錄到 中國學位論文全文數據庫 并通過網絡向社會公眾提供信息服 務 篡釹 導師簽名 伢痧影節(jié) 日期 知 7 年多月7 日 日期 沙 年莎月7 日 1 2 國內外研究現狀 1 1 3 研究的主要內容及論文結構 6 1 4 本章小結 6 第2 章門禁系統(tǒng)的設計方案與相關理論研究 7 2 1 說話人識別原理 7 2 2 語音信號的預處理 8 2 2 1 預加重 8 2 2 2 分幀與加窗 8 2 3 語音信號的端點檢測 一9 2 4 語音信號的特征提取 1 1 2 4 1 線性預測系數 1 1 2 4 2 美爾倒譜系數m f c c 1 2 2 5 語音信號的模式匹配 1 4 2 6 本章小結 1 7 第3 章基于說話人識別的門禁系統(tǒng)的硬件設計 1 8 3 1 系統(tǒng)的硬件結構 1 8 3 2t m s 3 2 0 v c 5 5 xd s p 的基本結構 18 3 2 1c 5 5 x 的c p u 結構 2 0 3 2 2 存儲器映射 2 l 3 2 3d s p 的片內外設 2 2 3 2 4c 5 5 x 的指令流水線和并行性 2 2 3 3 各主要單元電路 2 3 3 3 1 電源電路 2 3 3 3 2 時鐘電路 一2 4 3 3 3 音頻編解碼模塊 2 6 3 3 4 外擴存儲電路 2 9 3 3 5 上電自舉模式與語音處理模式的設定 3 3 基于說話人識別的無線門禁系統(tǒng)的應用研究 3 3 6j t a g 接口電路 3 5 3 3 7 無線傳輸電路 3 5 3 4 硬件電路板的抗干擾設計 3 8 3 5 本章小結 3 8 第4 章基于說話人識別門禁系統(tǒng)的軟件設計 3 9 4 1 說話人識別的結構框圖 3 9 4 2 說話人識別的軟件設計 4 0 4 2 1 系統(tǒng)的初始化 4 0 4 2 2a i c 2 3 語音信號采集 4 3 4 2 3 數據處理 4 3 4 2 4b o o tl o a d e r 程序設計 一4 4 4 2 5 非易失存儲器f l a s h 在線編程 4 5 4 3 無線通信的軟件設計 4 8 4 4 本章小結 5 l 第5 章系統(tǒng)聯調測試與結果分析 5 2 5 1 系統(tǒng)的硬件調試 5 2 5 2 系統(tǒng)的軟件調試 5 2 5 3 系統(tǒng)的測試設備 5 4 5 4 測試結果與分析 5 5 5 5 本章小結 5 7 結論與展望 5 8 參考文獻 6 0 致謝 6 4 附錄攻讀學位期間所發(fā)表的學術論文目錄 6 5 介紹了說話人識別的基本原理 包括語音信號的預處理 端點檢測 在研究傳統(tǒng) 端點檢測的基礎上提出雙門限的比較方法 特征提取 重點分析了l p c 倒譜和m f c c 倒譜 模式匹配采用改進的動態(tài)時間規(guī)整算法并進行詳細的分析 對算法的各個 部分進行了m a t l a b 仿真驗證 本文以t m s 3 2 0 v c 5 5 0 9 ad s p 芯片為核心 以高保真語音編解碼芯片 t l v 3 2 0 a i c 2 3 同步動態(tài)隨機存儲器s d r a m 和異步存儲器f l a s h 為主要外設 完成了系統(tǒng)的硬件設計 具體硬件設計電路包括 電源模塊 時鐘模塊 外擴存 儲器模塊 音頻編解碼器模塊 j t a g 接口 s i 4 4 3 2 模塊 根據系統(tǒng)實現的功能 要求 軟件基于c c s 開發(fā)環(huán)境 采用并行e m i f 引導方式 實現了 t m s 3 2 0 v c 5 5 0 9 ad s p 擴展f l a s h 的在線燒寫 采用了模塊化的程序設計方法 程序整體采用c 語言和匯編語言混合方式編程 完成了語音識別工程及無線數 據收發(fā)工程 本文基于實驗室環(huán)境 實現了說話人識別的無線門禁系統(tǒng)的軟硬件設計 基 本實現了預期的目標 充分體現系統(tǒng)的可行性 具有較強的實用價值 關鍵詞 說話人識別 d s p 動態(tài)時間規(guī)整 s i 4 4 3 2 門禁系統(tǒng) i l l s p e a k e rr e c o g n i t i o n i sak i n do fb i o l o g i c a lc e r t i f i c a t i o n t e c h n o l o g y i nt h e b i o l o g i c a lc e r t i f i c a t i o na r e a s p e a k e rr e c o g n i t i o nw i d e l yd r a w st h ea t t e n t i o nb e c a u s eo f i t sc o n v e n i e n c e e f f i c i e n c ya n da c c u r a c y a tp r e s e n t t h es p e a k e rr e c o g n i t i o ns y s t e m a r ew o r kd e p e n do nc o m p u t e rm o s t l y s ot h es y s t e mi se x p e n s i v ea n ds e r v e j u s tf o ra s i n g l eu s e r t oac e r t a i ne x t e n t i th i n d e r e dt h es p e a k e rr e c o g n i t i o na c c e s sc o n t r o l s y s t e md e v e l o p m e n t t h i sa r t i c l er e v i e wt h ec o u r s e so fs p e e c hr e c o g n i t i o nt e c h n o l o g y o nt h eb a s i so f t h ea b o v e t h eb a s i ct h e o r yo fs p e a k e rr e c o g n i t i o ni si n t r o d u c e da c c o r d i n gt ot h em o d e l o fs p e a k e rr e c o g n i t i o ns y s t e m w h i c hi n c l u d e st h ev o i c e s i g n a l s p r e t r e a t m e n ta n dt h e d e t e c t i o no fe n d p o i n t c o m p a r i n gt h et r a d i t i o n a lm e t h o do fd e t e c t i o n t h i s p a p e r p r o p o s e sad o u b l et h r e s h o l dc o m p a r a t i v em e t h o d t h ef e a t u r ei se x t r a c t e da n di ti s f o c u so nt h ei n v e r t e d p e d i g r e eo fl p ca n dm e ls c a l ef r e q u e n c y t h es p e a k e r r e c o g n i t i o na l g o r i t h md t w i si n t r o d u c e da n da n a l y z e di nt h ep a p e r e a c hp a r to ft h e a l g o r i t h mi sv e r i f i e do nt h em a t l a bs i m u l a t i o n i nt h eh a r d w a r e d e s i g n t h es y s t e m u s e st h ed i g i t a l s i g n a lp r o c e s s o ro f t m s 3 2 0 v c 5 5 0 9 aa st h e c o r e h i g h f i d e l i t yv o i c ec o d e cc h i pt l v 3 2 0 a i c 2 3 s y n c h r o n o u sd y n a m i cr a n d o ma c c e s sm e m o r ys d r a ma n da s y n c h r o n o u sm e m o r y f l a s ha st h em a i np e r i p h e r a l s t h ep a r to fh a r d w a r ec i r c u i td e s i g n s p e c i f i c a l l y i n c l u d e sp o w e rm o d u l e s c l o c km o d u l e s e x t e r n a le x p a n s i o nm e m o r ym o d u l e s a u d i o c o d e cm o d u l e s j t a gi n t e r f a c ea n ds i 4 4 3 2m o d e b a s e do nc c sd e v e l o p m e n t e n v i r o n m e n t t h i sp i e c eo fp a p e rh a sp a r a l l e le m i f b o o tm o d et oa c h i e v et h eo n c h i p b o o t l o a d e ro ft h e d i g i t a ls i g n a lp r o c e s s o ro ft m s 3 2 0 v c 5 5 0 9 aa f t e ro n l i n e s i m u l a t i o n u s i n gm o d u l a rp r o g r a m m i n gm e t h o d s p r o c e d u r e su s i n gcl a n g u a g ea n d a s s e m b l yl a n g u a g eh y b r i d s i tf i n i s h e dt h e i p r o g r a m m i n g i t s p e e c hr e c o g n i t i o n e n g i n e e r i n ga n dw i r e l e s sd a t at r a n s c e i v e re n g i n e e r i n g i ti sp r o v e dt h a tt h ed e s i g n s c h e m eo ft h es y s t e mi se f f e c t i v e k e yw o r d s s p e a k e ri d e n t i f i c a t i o n d s p d t w s i 4 4 3 2 w i r e l e s sa c c e s sc o n t r o ls y s t e m i v 圖2 6m f c c 計算流程圖 1 4 圖2 7d t w 算法搜索路徑 15 圖2 8 匹配路徑約束示意圖 1 6 圖3 1 系統(tǒng)硬件結構圖 18 圖3 2c 5 5 x 的c p u 結構圖 2 0 圖3 3t m s 3 2 0 v c 5 5 0 9 a 封裝存儲器映射圖 2 l 圖3 4c 5 5 x 流水線示意圖 2 3 圖3 5 電源電路 2 4 圖3 6 時鐘電路 2 5 圖3 7t 3 2 0 a i c 2 3 芯片引腳圖 2 6 圖3 8t m s 3 2 0 v c 5 5 0 9 a 與a i c 2 3 接口示意圖 2 8 圖3 91 2 c 模塊數據傳輸圖 2 9 圖3 1 0a i c 2 3 在d s p 模式下的串口時序圖 2 9 圖3 1 1t m s 3 2 0 v c 5 5 0 9 a 與s d r a m 接口示意圖 3l 圖3 1 2t m s 3 2 0 v c 5 5 0 9 a 與f l a s h 接口示意圖 3 2 圖3 1 3l v c l 6 2 4 5 連接圖 一3 4 圖3 1 4 上電自舉模式示意圖 3 4 圖3 15j t a g 接口電路 3 5 圖3 1 6s i 4 4 3 2 硬件連接圖 3 7 圖4 1 說話人識別的軟件流程圖 3 9 圖4 2 擦除和編程命令示意圖 4 6 圖4 3 觸發(fā)位檢測算法流程圖 4 7 圖4 4f l a s h 擦除圖 4 8 圖4 5f l a s h 燒寫圖 4 8 圖4 6d s p 與s 1 4 4 3 2 連接圖 4 9 圖4 7s p c r l 控制寄存器圖 4 9 圖4 8s p c i l 2 控制寄存器圖 j 4 9 圖4 9s p i 操作模式3 時序圖 5 0 圖4 10s i 4 4 3 2 發(fā)送軟件流程圖 5 0 圖5 1 語音工程y u y i n s h i b i e p j t 界面 5 3 v 5 3 5 4 5 4 5 4 5 5 5 6 5 6 5 6 表3 8l v c l6 2 4 5 功能表 3 4 表3 9s 1 4 4 3 2 的引腳定義與描述 3 7 表4 1 引導構 4 4 表4 2a m 2 9 l v 8 0 0 b 操作命令說明 一4 5 表4 3 寫操作各時間參數 4 7 表5 1 說話人識別實驗結果 5 5 v l i 禁系 容易 的要 求 而在生物技術和信息科學迅速發(fā)展的今天 生物認證技術是一種方便 先進 的信息安全技術在現實生活中已經得到廣泛的應用 人的語音信號是自然界生物 信號的一種 每個人的聲音都與環(huán)境 情緒 聲道模型 健康狀況等有關 都有 自己獨特的特性 所以可以通過分析語音信號來識別說話人成為可能n 2 1 特別 是進入j u 2 1 世紀以來 科研人員對說話人識別進行了很廣泛的研究 在生物識別 領域中 利用說話人的語音信號來進行說話人識別有許多獨特的優(yōu)點 如語音信 號相對于其它的生物信號 成本比較低廉 采集相對簡單 沒有嚴格的方向性 可以在黑暗中傳播等 說話人識別技術被廣泛的應用于醫(yī)學應用 聲控電子鎖 搜索罪犯等領域 而綜合集成了大型計算機 無線通訊 自動識別 機械工程和安全管理等相 關技術的門禁系統(tǒng)有效地解決了重要部門和場合的安全控制問題 已經被應用的 越來越廣泛 并產生了深遠的影響 目前市場上的門禁系統(tǒng)大多是采用有線的通 信方式 小區(qū)單元通過有線的方式與各個用戶端相連 與這類有線網絡通信的樓 宇控制產品相比 無線門禁的解決方案安裝布置更加靈活 費用低廉 樓宇間的 設備重組更加方便 可移動性強等方面的優(yōu)勢 因此 無線門禁系統(tǒng)受到相關公 司 研究團隊的重視 其將在門禁市場中占據越來越重要的地位 本課題針對人們對智能安防系統(tǒng)日益增長的需求 提出了基于說話人識別的 無線門禁系統(tǒng)的應用研究 該系統(tǒng)可應用于小區(qū)單元及用戶控制鎖的工程實踐 中 充分體現了生物信號中說話人識別的便利性 無線通信的實時性 為現代化 的門禁系統(tǒng)提供一種可靠的方案 1 2 國內外研究現狀 對說話人識別的研究d 4 開始于上世紀六十年代 主要研究內容是人工的說 話人識別 1 9 6 6 年 美國法院第一次采用語譜圖進行了取證 5 蚓 7 0 年代中期 b s a t a l 研究了線性預測l p c l i n e a rp r e d i c t i v ec o d i n g 系數 倒譜系數等不同 的特征參數 并論證了倒譜系數在進行說話人識別中是比較理想的特征參數 許 多學者和研究人將對矢量量化模型v q v e c t o rq u a n t i z a t i o n 隱馬爾科夫模型 h m m h i d d e nm a r k o vm o d e l 1 7 j 和人工神經網絡a n n a r t i f i c i a l n e u r a l n e t w o r k 8 1 0 1 弓i 入到說話人識別研究中 大大地推動了說話人識別技術的發(fā)展 綦丁 說i 再人識別的無線門禁系統(tǒng)的麻用研究 我國說話人識別的研究工作開始于五十年代 伴隨著計算機技術的快速發(fā)展 根 據我國的具體實際情況 特別是在漢語識別技術上 創(chuàng)造出適合漢語識別的技術 說話人識別要求從語音信號中提取個體差異 提取出能反映說話人是誰的信息 從而進行說話人識別 其基本原理是為每一個說話人建立一個能夠描述這一說話 人個性特征的模型 作為此說話人個性特征的描述 說話人識別可以分為兩個范 疇 即說話人辨認和說話人確認 前者是把要檢測的語句判為n 個訓練說話人之 一所說 是一個多擇一的問題 后者則是把帶檢測人的語句與其參考說話人的相 比較 相符的即得到確認 不相符的則得到否定 是二擇一的問題 說話人辨識 時取與測試語音匹配距離最小的說話人模型所對應的說話人作為說話人辨識的 結果 說話人確認時與所聲稱的說話人模型進行匹配 若匹配距離小于規(guī)定的閥 值 則該說話人得到證實 否則該說話人不是他所聲稱的說話人 要實現說話人 識別系統(tǒng)需要解決三個問題 1 首先對說話人的語音信號進行預處理 端點檢 測和特征提取 2 說話人模板的建立和模板參數的訓練 3 測試的語音模板與 說話人模板的匹配距離計算 針對當前的說話人識別 大致可歸為三類 第一類 模板匹配法 以前的說話人識別是根據簡單的模板匹配的原理構造 的特定人 小詞匯量 孤立詞識別系統(tǒng) 叫引 在訓練和識別的時候 必須保證兩 個模板采用相同的幀數 相同的預處理與窗函數 但是在實際的應用中 說話人 的語音具有很大的似然性 所以要把兩幀延長到相同的長度 于是 日本學者板 倉 i t a k u r a 將動態(tài)規(guī)劃算法 d y n a m i cp r o g r a m m i n g d p 的概念用于解決孤立詞 識別時的說話速度不均勻的難題 提出了著名的動態(tài)時間規(guī)整算法 d y n a m i c t i m ew a r p i n g 簡稱d t w 它是最近被廣泛研究和應用的一種模式識別的方法 在說話人識別中獲得了比較廣泛的應用 h o 引 d t w 是一個典型的求解最優(yōu)化問題 將說話人的語音信號在時間軸上進行不均勻的彎曲 使其測試模板與參考模板 對齊 并計算最小的幀匹配距離 從而獲得累計距離最小的規(guī)整函數 這就保證 了參考模板的特征和測試模板特征之問最大的聲學相似性和最小的誤差失真 但 是對于非特定人 大詞匯量 連續(xù)語音識別系統(tǒng)來講 這種模板匹配就顯得力不 從心 就必須尋求模板匹配以外的其它識別方法一隨機模型法及概率語法分析 法 第二類 概率模型法 突出的代表是 1 隱馬爾可夫模型h m m 方法i l 昏博j 可以 使用h 刪的概率參數來對似然函數進行估計與判決 從而得到識別結果 在用于 語音建模時 它是雙重的隨機過程 2 高斯混合模型 g a u s s i a nm i x t u r e m o d e l g m m 1 9 2 1 因為每一個說話人的個性特征都可由形式一致的高斯混合概率 密度函數中的參數來表示 故為每一個說話人建立一個g m m 混合模型來訓練 從 而獲得模型中的參數 第三類 概率語法分析法 對于大詞匯量 連續(xù)非特定人的語音識別具有較 2 大的優(yōu)勢 專家學者通過采集分析語音信號 并建立不同的約束規(guī)則來描述不 同人的語音信號 從而達到識別說話人的目的 而說話人的語音具有較大的隨機 性和時變性 此方法的重點是如何選取這些約束規(guī)則以及它們之間相互轉化的條 件等 雖然說話人識別的正確率大大提高 但是算法計算的復雜度要遠遠的高于 前兩種方法 并且占用較大的存儲空間 移植起來具有很大的難度 在介紹了常用的說話人識別的方法外 還有很多像神經網絡方法 2 2 2 3 算法 的識別方法 人工神經網絡可采用物理可實現的器件或利用現有的計算機來模 擬生物神經網絡的某些結構與功能 包括神經元 網絡拓撲和網絡的訓練算法 三個部分 神經網絡對復雜不確定性的問題具有自適應和自學習能力 快速優(yōu) 化能力 對大量定性或定量信息的分布存儲能力 并行處理與合成能力 神經 網絡還具有較強的魯棒性 若局部或部分神經元損壞后 不會影響全局的活動 最近采用不同方法的融合技術 2 4 2 6 有了廣泛的應用 1 維數約簡與識別方 式相結合 局部p c a p r i n c i p a lc o m p o n e n t a n a l y s i s 2 7 j 和g m m 結合的說話人識別系統(tǒng) 2 聚類與識別方法的結合 3 識別方式的結合 主要是采用了s v m s u p p o r tv e c t o r m a c h i n e 2 8 2 9 分類器 充分利用了s v m 適合不同樣本之間的分類 對于異類樣本 具有很強的分類能力 可以與其它很多模式識別的算法相結合 利用不同分類器 的特點 實現識別結果的最優(yōu)化 近年來雖然說話人識別的研究已經取得很大的進展 但應用于實際情況還需 要解決很多問題1 3 問題一 高維說話人特征的缺陷 為了提高說話人識別系統(tǒng)的識別率 往往 采用更高維的特征 然而 高維的特征矢量會增加計算量與存儲空間 不利于實 時的對語音信號進行處理 問題二 說話人分類方法的局限性 目前雖然有很多說話人識別的方法 在 說話人識別的領域中也取得了很好的識別效果 如矢量量化模型 隱馬爾科夫模 型 神經網絡模型 支持向量機模型等 但是選用這些高維向量 需要不斷的迭 代計算 使得說話人識別的時間相對較長 因此 高復雜度的精確的模式匹配方 法并不適合于實時的說話人識別應用 這需要強大的計算處理能力與數據存儲設 備 現有的低復雜度低計算量的模式識別方法 雖然所需的訓練時間和測試時間 都比較短 但對說話人識別的準確率有所下降 只適用于識別人數相對較少的情 況 一旦說話人的數量增多 識別性能就會急劇下降 隨著說話人識別中對于語音信號處理技術和計算機硬件 d s p 的高速發(fā)展 語音信號處理的硬件方式發(fā)生著質的飛躍 隨著c 5 5 x 系y u d s p 的推出和應用開發(fā) 的逐步深入 在實時性和低功耗方面體現出其優(yōu)良的性能 c 5 5 x 正成為通信和個 人消費領域的主流d s p 產品1 3 作為t i 公司低功耗系列的d s p 芯片 2 0 0 0 系列主要 用于工程電機等的自動控制中 5 0 0 0 系列主要用于語音信號處理 算法的實現 6 0 0 0 系列主要用于圖像的壓縮 增強等 對于市場上的c 8 0 5 1 單片機 a r m 及f p g a 3 藎 j 說i 再人識j j l j 的無線門禁系統(tǒng)的啦用研究 曼曼曼曼曼曼曼皇曼皇 蔓曼曼曼曼曼魯曼量皇曼曼曼曼黑笪曼曼曼曼曼量量曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼量皇曼皇呂曼曼曼皇曼曼蔓曼蘭曼鼉蔓量 等 它在功耗 信號算法的處理等方面具有顯著的優(yōu)勢 3 2 d s p 主要發(fā)展現狀如 下 1 制造工藝與存儲容量 目前的d s p 芯片都采用c m o s i 藝 芯片的引腳 越來越多 集成的功能也越來越強 需要設計的外圍電路越來越少 t i 公司在 2 0 0 5 年1 2 月發(fā)布的達芬奇系統(tǒng)已經把音視頻部件集成在d s p 內部 內部集成的 數據和程序存儲器也不斷增大 成本 體積和功耗不斷下降 2 內存結構和運算速度 目前的d s p 模塊基本上都采用數據總線和程序總 線分離的哈佛結構或改進的哈佛結構 多級流水線指令 內部集成了鎖相環(huán) 可 以相應的進行倍頻或者分頻 在一定范圍內實現任意的時鐘頻率 使c u p 在一 個指令周期內可多次對程序空間和數據空間進行訪問 大大提高了d s p 的運行 速度 3 開發(fā)工具 具有完善的軟件仿真工具和硬件開發(fā)工具 如 軟件開發(fā)環(huán) 境c c s 軟件仿真器s i m u l a t o r 在線仿真器e m u l a t o r c 編譯器 在線分析器 p r o f i l e 等 給開發(fā)帶來了極大的便利 其中c c s 軟件開發(fā)環(huán)境是t i 公司針對本 公司的d s p 產品開發(fā)的集成開發(fā)環(huán)境 它集成了代碼的編譯 鏈接和調試等諸 多功能 而且支持c c 和匯編的混合編程 開放式的結構允許用戶外擴自身的 模塊 隨著芯片工藝的不斷發(fā)展 d s p 性能的進一步增強 為說話人識別技術走向 實踐應用奠定了基礎 3 3 3 4 1 基于說話人識別的無線門禁系統(tǒng) 作為新型的現代 化智能化安全管理系統(tǒng) 它包括電子信息技術 計算機技術 無線通訊技術 生 物識別技術等諸多新技術 如何設置參考模板和測試模板 何時打開門鎖 遇到 特殊情況是否要發(fā)出警報等 以達到安全快捷的目的 是門禁系統(tǒng)最基本的功 能 在六十年代 計算機的應用推動了說話人識別的發(fā)展 日本的東京無線電研 究實驗室 京都大學和n e c 實驗室都制作了能夠進行說話人識別的專用硬件 對 說話人識別領域進行了開拓性的研究工作 近年來 高性能數字信號處理芯片 d s p d g i t i a l s i n g a l p o r e c s s 技術的迅速發(fā)展 為說話人識別的實時實現提供了 可能 說話人識別的研究人員也一直致力于語音識別專用芯片和系統(tǒng)的研究 但 是 大多數的語音識別專用芯片識別性能差 不具備實用的要求 直到近十年以 來 隨著說話人識別算法的深入研究和集成電路技術的發(fā)展 才出現了一些具有 實用價值和市場前景的說話人識別專用芯片 其中 較為成功的兩個芯片詳細介 紹如下 1 r s c 一3 6 4 由美國的公司開發(fā) 2 0 0 0 年開始生產 是一顆為消費類電子產品應用的低 價位的語音識別專用芯片 即r s 3 6 4 它使用預先學習好的人工神經網絡進行 4 碩f j 學位論文 非特定人語音識別 不需要經過訓練就可以識別 y e s o 0 k 等簡單語 句 其說明書上介紹其識別率為9 7 此外 r s c 3 6 4 可以識別特定人 孤立詞 命令語句 約6 0 條左右 其說明書上稱其識別率為9 9 以上 r s c 3 6 4 還具有 5 1 5 k b s 的語音合成 其語音合成由s n e s o r y 專門設計 其音質較好 它還具 有改進的a d p c m 自適應差分脈沖調制 語音編解碼功能 用作語音回放 2 u n i s p e e c h s d a 8 0 d 5 1 德國i n f i n e o n 公司2 0 0 0 年開始生產的產品 它是一顆高性能的語音專用芯 片 這樣的設計能夠滿足立體聲處理或者消除外界干擾等功能要求 u n i s p e e c h s d a 8 0 d 5 l 的語音處理軟件包括 利用d t w 算法的特定人語音識別 能 夠識別1 0 0 條語句 利用h m m 算法的非特定人語音識別 詞匯量可以達到1 0 0 條 語句 高質量 低碼率 2 4 1 3 k b s 的語音編解碼 用作語音提示和語音降低外 界的噪聲干擾 說話人識別功能等等 國內在語音識別專用芯片的開發(fā)與研究方面起步較晚 比如清華大學 語音 識別專用芯片研究開發(fā) 課題 研究開發(fā)了國內第一個具有自主知識產權的語音 識別專用芯片的軟件部分 該實驗室是國內最早專門從事語音技術與專用芯片設 計研究單位之一 芯片能夠識別約2 0 3 0 條特定人語音命令 同時具有語音合成 提示 與語音編解碼 回放 功能 語音識別率達到9 8 以上 隨著現代社會的發(fā)展 人們對門禁系統(tǒng)的要求越來越嚴格和現代化 智能化 門禁系統(tǒng)的應用范圍也越來越廣泛 近年來 國內的門禁市場增長比較快速 門禁管理系統(tǒng)應用于現代化智能大廈的出入控制 公司考勤 安防報警等許多場 合 也出現了許多生產門禁管理系統(tǒng)的公司 也研發(fā)出許多新型的門禁控制系 統(tǒng) 國內外研發(fā)和使用的門禁控制系統(tǒng)主要都使用r f i d 門禁系統(tǒng)和生物識別門 禁系統(tǒng) 從1 9 9 4 年r f i d 射頻卡 進入中國 就帶動了中國r f i d 卡的技術快速 革新 在國內r j c l d 的應用領域越來越廣 它的應用也促進了門禁管理系統(tǒng)的發(fā) 展 近年來我國經濟總體水平明顯提高 各行各業(yè)對于現代化 智能化安防設備 的需求也會越來越多 安防產品也隨之迅速發(fā)展 目前在歐美的發(fā)達國家 它們的門禁系統(tǒng)市場已經進入到細化的階段 其產 業(yè)的分工越來越細化 生產卡的公司單獨生產卡 生產控制器的公司獨立生產控 制器和配套的軟件 都集中生產某一種產品 而不是生產所有的設備 最近幾年 歐美各大公司也開始投入到無線門禁系統(tǒng)的研究設計 生產中來 正是由于d s p 計算機數字化的大量普及 高性能的模擬數字電路的不斷完善 各種保護電路 的不斷成熟改進 各種芯片的大幅降價 使得全世界的工程師才有機會設計出 性能良好 結構完善 性價比極高的優(yōu)秀產品 表現出門禁系統(tǒng)對安防工作以及 對日常管理工作的真實貢獻 由于磁卡 接觸式i c 卡對操作環(huán)境的要求相對較高 磁卡及i c 卡容易磨損 本身的工作時間也是一定的 再加上識別過程中使用者的動作和所需時間明顯的 5 鋤 耔 基丁說 五人識別的無線門禁系統(tǒng)的戍用研究 要多于非接觸式卡 所以 i c 卡和生物識別的門禁系統(tǒng)相比 有很多缺點 從 科學技術長遠的發(fā)展角度上看 基于說話人識別的無線門禁系統(tǒng)或與以上技術相 結合的新型門禁產品將成為未來門禁系統(tǒng)發(fā)展的重要方向 本文針對說話人識別門禁系統(tǒng)的現狀 從研究與使用的角度出發(fā) 提出了基 于說話人識別的無線門禁系統(tǒng)并進行相關的研究設計 主要研究設計是針對小區(qū) 的單元門禁 包括每個小區(qū)單元的主機與用戶端的分機 整個系統(tǒng)由一臺主機和 多個用戶端共同完成 本文針對用戶端進行了設計研究 音頻編解碼模塊實現對 語音信號的采集 f l a s h 模塊實現說話人模板的存儲 主控模塊實現說話人識 別 無線模塊實現用戶端與主機之間的通信 用l e d 的狀態(tài)來實現說話人識別 的結果與電磁鎖的狀態(tài) 1 3 研究的主要內容及論文結構 論文共分五章 第一章為緒論 介紹選題的目的和意義 國內外研究說話人識別的主要方法 d s p 的發(fā)展和主要特點 門禁系統(tǒng)的研究現狀以及論文的主要內容 第二章詳細闡述了門禁系統(tǒng)的設計方案 說話人識別的基本原理 說話人識 別系統(tǒng)的構成 對說話人語音信號處理的流程 詳細研究了動態(tài)時問規(guī)整及改進 算法的原理 采用雙門限檢測法 通過對過零率和短時能量參數的檢測來判斷起 始點和結束點 提取出語音信號數據 采用m e l i n 譜m f c c 提取語音信號的特征參 數 這些特征參數組成特征矢量 從而構成參考的語音模板 在模式匹配中 采 用了改進的動態(tài)時間歸整d t w 方法 將測試模板與參考模板進行匹配計算 比較 兩者之間的失真 最后計算出最小的匹配距離作為規(guī)整函數的路徑 從而得出說 話人識別判決的結果 第三章為基于說話人識別門禁系統(tǒng)的硬件電路設計 以要單元中各個用戶為 對象 詳細設計了整個系統(tǒng)的硬件結構與元器件的選型標準 各個主要模塊電路 的構成與p c b 制圖 電路的抗干擾設計等 第四章為系統(tǒng)的軟件設計 基于c c s 開發(fā)環(huán)境 采用并行e m i f 引導方式 實現了t m s 3 2 0 v c 5 5 0 9 ad s p 擴展f l a s h 的在線燒寫 完成各個主要模塊的初 始化過程 采用c 語言完成語音識別工程及無線數據收發(fā)工程 第五章介紹了系統(tǒng)軟硬件調試過程 m a t l a b 仿真結果與移植的實現結果 最后為結論與展望 論述了論文的主要貢獻以及在研究中所遇到的主要不足 之處 指出接下來研究的主要方向 1 4 本章小結 本章介紹了論文選題的目的和意義 課題的國內外研究現狀以及論文研究的 主要內容 論文結構等等 6 碩i j 學位論文 第2 章門禁系統(tǒng)的設計方案與相關理論研究 本文根據實際應用 提出了基于說話人識別的無線門禁系統(tǒng) 主要目標是基 于各個小區(qū)單元 以各個用戶為單位 實現用戶與樓宇單元門之間的無線通信并 且實現用戶端的說話人識別 以開啟用戶端自家的門鎖 達到便捷性 降低成本 等的目的 門禁系統(tǒng)的設計框圖如圖2 1 所示 在用戶端 通過采集說話人的語 音信號 經過預處理 端點檢測 特征提取與參考模板相比較 輸出比較結果 如果匹配成功 則打開用戶端的門鎖 當在小區(qū)單元門口來訪人員按下用戶門鈴 時 主機會通過無線收發(fā)模塊尋找用戶端的i d 號 進而建立主機與用戶端的無 線連接 如果用戶允許來訪人員進入 則用戶端給主機發(fā)個開鎖的信號 主機接 收到這個信號后 打開單元門 要實現這些要求 要解決的主要理論問題是說話 人識別的原理 語音采集 上 語音處理 上 模式匹配 l j r 結果輸出 無線通信 無線收發(fā)模塊 無線收發(fā)模塊 單元主機用戶端 2 1 說話人識別原理 圖2 1 門禁系統(tǒng)框圖 無論是小詞匯 特定人 文本有關的說話人識別 還是連續(xù)詞匯 非特定人 文本無關的說話人識別 其基本原理都是先要建立說話人語音信號特征參數的 參考模板 在進行說話人識別時 先計算參考模板與測試模板兩幀之間的幀匹 配距離矩陣 再計算出最小的累積距離 作為規(guī)整函數的路徑 因此 若要實現 對說話人的識別 需解決以下幾個基本問題 1 對語音信號的加重 分幀 加窗 端點檢測和特征提取 2 建立說話人的參考模板和測試模板 3 計算測試模板與參考模板的最小累計距離 其中關鍵問題是建立說話人識別的參考模板 為了保證測試模板與參考模 7 幕于說話人識別的無線門禁系統(tǒng)的應用研究 板的特征參數一致 常將每一說話人語音信號進行預加重 分幀 加窗等 它 們的模型結構取得相同 不同的只是模型中的參數l l l 伴隨著計算機和語音信號 處理 高速的d s p 芯片等外圍電路的不斷發(fā)展 說話人模型已經從單一的d t w v q h m m a n n 等模型向著多模型方向發(fā)展 同時也從實驗室無噪聲的背景 下向著復雜噪聲的應用場合發(fā)展 說話人識別從實驗環(huán)境走向實用有了堅實的理 論基礎 從本質上講 說話人識別是一個語音信號的模式識別問題 它由訓練和識別 兩個過程來完成 說話人識別的基本原理框圖如圖2 2 示 2 2 語音信號的預處理 圖2 2 說話人識別原理圖 在對語音信號進行時域或頻域分析前 理 預處理主要包括對語音信號的預加重 2 2 1 預加重 首先要對語音信號進行一定的預處 分幀和加窗 說話人的語音信號經過a d 將模擬信號變?yōu)閿底中盘柡?依次存入一個數 據區(qū) 在語音信號處理中一般用循環(huán)隊列的方式來存儲這些數據 根據語音信號 產生的機制 高頻端大約在8 0 0 h z 以上按6 d b 倍頻程跌落 這就需要進行預加 重來提升高頻部分 使信號的頻譜變得平坦 l 預加重一般是一階的數字濾波器 h z l z z 1u 值接近為1 2 1 u 決定截止頻率 此濾波器為單零點濾波器 呈高通特性 u 0 9 5 2 2 2 分幀與加窗 在完成預加重之后 要對語音信號要進行分幀與加窗處理 根據語音信號的 短時平穩(wěn)性 語音信號以幀為單位進行處理 一般每秒的幀數為3 3 1 0 0 幀 要 根據實際情況而定 分幀應該采用部分互相交錯的形式 目的是為了使語音信息 損失最小 幀與幀之間平滑的過渡 保持其連續(xù)性 前一幀與后一幀的重合部分 稱為幀移 幀移與幀長的比值一般取為0 1 2 幀與幀之間重合太多 會增大計 算量 重合太少會漏掉部分信息 分幀是通過一個有限長度窗口進行加權的方法 來實現 用窗函數國 z 乘語音信號j 療 得到s 文功 s 功木奴功 本文采樣頻率 為8 k h z 每幀長2 4 0 點 3 0 m s 幀移8 0 點 采集3 秒的數據 約為1 2 0 幀 窗函數緲 長度與形狀的選擇 影響到短時參數的分析 因此在對說話人 8 從表2 1 可以看出 漢明窗的帶寬增加一倍 能減小時間窗兩端的坡度 使 得語音信號能夠很平滑的過渡 語音信號變化的幅度不是很大 減小語音幀的截 斷效應 所以本文選擇漢明窗 2 3 語音信號的端點檢測 從背景的噪聲環(huán)境中提取出說話人語音信號的特征信息不是一件容易的事 情 一個比較好的端點檢測算法可以精確的檢測到語音信號的開始點與結束點 在一定程度上能夠有效提高說話人識別系統(tǒng)的識別率 信號的幅度用短時能量 來表示 過零率定義為一幀語音信號穿越零電平的次數 兩者的結合可以有效的 檢測到語音信號的起始點和終止點 故本文采用短時能量和過零率的雙門限檢測 殿 法來進行端點檢測 并把可容忍的靜音區(qū)問延長為1 5 幀 設語音波形的時域信號為x t 加窗分幀處理后得得的第n 幀語音信號為 勘 朋 則勛 聊 滿足 洳 聊 w 冊 x z 歷 0 m n l 2 4 其中 w 腳 為漢明窗 n 0 lt 2 t 并且n 為幀移長度 設第n 幀語音信號渤 聊 的短時能量用e 甩表示 則 v e n l 渤 圳 2 5 n 1 e 玎 y x 2 肌 2 6 一 n 1 v e n l o g x 2 m 2 7 n l 表達式分別為絕對值的累加 平方累加和平方的對數的累加 只是表達方 式的不同 實質上是一致的 選擇其中的一種就可以 根據人的發(fā)音機理和聲道 模型 人的語音信號分清音和濁音兩種 濁音的幅度相對高 相對的能量也比較 9 藎于說話人識別的無線門禁系統(tǒng)的麻用研究 大 而清音的幅度比較小 所以可以用短時能量來區(qū)分清音段與濁音段 根據 實驗及前人的工作總結 短時能量高門限的值為t 氐f j 限的5 倍 通過觀察比較能夠發(fā)現 在靜音段語音信號的短時能量低門限很容易被超 過 能量比較低 波形的變化相對平緩 而在語音段 語音信號的能量已經超 過了雙門限中的高門限 幅度變化比較劇烈 通常用一幀信號中波形穿越零電平 的次數來表達這種變化的程度 稱為過零率 它的公式是 z n l s g n x m 一s g n x m 1 w 刀一肌 i 聊5 一 2 8 n n l i s g n 工 朋 卜s g n x 一1 w 刀一朋 l 式中 s g n 是符號函數 即 唧瞰糾 鼉蒜 9 而w n 為窗口序列 設 以班j 專 刀 旺 10 其它 在實際的應用中 靜音段的隨機噪聲有可能會產生過高的過零率 往往先 設定一個低門限 在靜音段 如果短時能量或過零率超過低門限 就認為是起 始點 進入到過渡段 在語音段 一些突發(fā)性的噪聲也可能引起短時能量或過零 率的數值較高 但是往往不能維持很長時間 如果兩個參數的數值降低到低門限 以下 且一直持續(xù)1 5 幀 則認為是一段噪音而放荊3 4 語音進入停止 如果說 話人的語音信號中包含2 個字的時間間隔很長 雙門限端點檢測法有可能只檢 測到第一個字 從而導致語音信號端點檢測的錯誤 漏掉需要檢測的語音信息 使得語音信號的識別率下降 如圖2 3 所示 檢測到語音信號中 你好 的第一 個字 為了避免這種情況 這需要把雙門限端點檢測可容忍的靜音區(qū)間適當的 延長 本文把靜音區(qū)間設置為1 5 幀 假設1 5 幀之內語音信號沒有短時能量或 過零率超過低門限 就認為語音信號結束 反之 則把短時能量和過零率計算在 內語音段內 圖2 4 是以語音 你好 為例 是改進后的雙門限端點檢測 可以 精確的檢測到語音的起始點和終止點 1 0 圖2 3 改進前的端點檢測圖2 4 改進后的端點檢測 根據前面的理論分析 短時過零率可以檢測到語音信號的清音段 短時能量 可以檢測到濁音段 所以采用延長幀的雙門限端點檢測法可以準確的判斷語音 信號的起始點和結束點 使得端點檢測更精確 丟棄一些噪聲信號幀 減少系統(tǒng) 的計算量 降低噪聲對系統(tǒng)性能的影響 采用改進后的端點檢測算法 對單個漢 字或多個漢字的語音命令均識別正常 2 4 語音信號的特征提取 在說話人識別時 特征參數的選取是至關重要的 能夠表征說話人個性的特 征有 語音幀能量 基因頻率 語音信號的短時頻譜 線性預測系數 倒譜特征 基因輪廓特征等 目前進行語音信號特征分析最有效 最重要的方法有線性預測 系數和美爾倒譜系數 躲 2 4 1 線性預測系數 說話人的語音信號是一種典型的時變信號 如果語音信號的觀察時間盡可能 短 則語音信號可以看做是近似平穩(wěn)的信號 全極點線性預測模型l p c l i n e a r p r e d i c t i v ec o d i n g 簡稱l p c 可以對聲管模型進行很好的描述 它的基本思想是 利用語音信號的相關性 用過去的取樣值來預測現在或未來的取樣值 即利用 過去若干個語音信號的取樣值與線性組合來逼近語音信號的取樣值 l p c 是基 于發(fā)音模型建立的 對于一個l p c 系統(tǒng) 采樣點n 的輸出s n 用p 個樣本的線 性組合來表示 一 s n a l s n 一1 口2 s n 2 口 口s n p q 口2 a p 為常數 2 1 1 口 上式可簡寫為s 珂 吼
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新經濟時代對企業(yè)人力資源管理的挑戰(zhàn)與機遇
- 小學語文課堂中多元文化教育的理念與實施策略
- Unit 6 My family Unit review課件 冀教版(三起)英語三年級上冊
- 公司各類材料管理制度
- 公司員工上班車管理制度
- 公司圖書室借閱管理制度
- 公司外協供應商管理制度
- 公司女員工福利管理制度
- 公司消防設施器材維護管理制度
- 公司空氣凈化劑管理制度
- 乙醇危險化學品安全周知卡
- 胸痹心痛的中醫(yī)診治專家講座
- GB/T 33011-2016建筑用絕熱制品抗凍融性能的測定
- GB/T 25775-2010焊接材料供貨技術條件產品類型、尺寸、公差和標志
- CB/T 3790-1997船舶管子加工技術條件
- NB∕T 10731-2021 煤礦井下防水密閉墻設計施工及驗收規(guī)范
- 中國古代文學作品選復習資料
- 末梢采血課件
- 2022年昌吉回族自治州昌吉工會系統(tǒng)招聘考試題庫及答案解析
- 腫瘤標志物及其臨床意義課件
- 設備供應商評估報告
評論
0/150
提交評論