盲源分離開題報告_第1頁
盲源分離開題報告_第2頁
盲源分離開題報告_第3頁
盲源分離開題報告_第4頁
盲源分離開題報告_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文開題報告學(xué)號1215012537姓名趙城手業(yè)(領(lǐng)域)電子與通信工程所在學(xué)院通信與信息工程學(xué)院實踐企業(yè)南京郵電大學(xué)已獲得的課程學(xué)分28是否達到培養(yǎng)計劃要求是未完成的課程及預(yù)計完成時間無補修課程及成績無初定論文題目基于稀疏表示的盲源分離技術(shù)研究論文選題來源國家自然科學(xué)基金和江蘇省自然科學(xué)基金論文類型應(yīng)用研究論文形式應(yīng)用技術(shù)研究論文1、 選題依據(jù)(綜述報告)背景及發(fā)展趨勢:在現(xiàn)實生活和自然界中存在許多我們?nèi)祟愋枰粩嗳フJ知和獲取的信息,這主要包括視覺、聽覺等方面的信息,但這些信息通常是紛繁復(fù)雜的,有用、無用、準確、不準確、真實的、虛假的

2、。這就給人們的生活和工作帶來了諸多不便和困難,因為人們不但需要去辨別信息的真?zhèn)危€需要從這些已獲取的信息中提取出自己關(guān)心和感興趣的內(nèi)容。盲信號分離問題的主要任務(wù)就是從大量數(shù)據(jù)中提取出人們所希望得到的信息。信號處理理論告訴我們,一個系統(tǒng)是由有著相互聯(lián)系的輸入信號、輸出信號和系統(tǒng)特征三者構(gòu)成的,如果我們知道其中任意的兩個,第三個就能求出。但在真實的情形中,是不可能事先知道輸入信號與系統(tǒng)特征信息的,在信源和信道未知或部分未知的情況下求解原信號的問題在學(xué)術(shù)上稱之為盲源分離。盲信號分離問題的科學(xué)定義指的是在源信號與傳輸信道的先驗知識都未知的情況下,根據(jù)僅有的源信號的統(tǒng)計特性,由所得到的觀測信號分離或恢復(fù)

3、出源信號的過程。由于無從得知源信號和傳輸信道的先驗信息,盲信號分離問題具有極大的難度,但這種情形在許多實際環(huán)境中又的的確確存在,比如有名的雞尾酒會問題。信號盲源分離問題的研究最早是由法國的J.Herauh和C.Jutten在1985年左右開始的,他們的方法現(xiàn)在常稱為算法 1。90年代,L.Tong、Comon、曹希仁等學(xué)者在盲源分離的可分性問題上作出了許多卓有成效的工作23。1994年,Comom將數(shù)據(jù)處理與壓縮的主分量分析(Principal Component Analysis. PCA)加以擴展成為獨立分量分析(Independent Component Correlation Algo

4、rithm .ICA),闡述了獨立分量分析這一概念2,提出了ICA方法的基本假設(shè)條件,并明確指出,應(yīng)該通過某個稱為對比函數(shù)的目標函數(shù)達到極大值來消除觀測信號中的高階統(tǒng)計關(guān)聯(lián),以實現(xiàn)線性混合的ICA。1995年,Bell和Sejnowski 4利用神經(jīng)網(wǎng)絡(luò)的非線性特性來消除觀測信號中的高階統(tǒng)計關(guān)聯(lián),并把盲分離問題歸入信息論框架,用信息最大化準則建立目標函數(shù)(Infomax算法)。1999年,Hyvarinen和Oja基于源信號的非高斯性測度,給出一類定點算法(Fixed-Point) 法,其具有非常快的收斂速度,因此也稱為FastICA 5,該方法至今仍然被廣泛應(yīng)用于盲源分離問題中。隨后,Zha

5、ng、Ci-chocki和Amari發(fā)展了處理線性盲源分離/解卷積問題的狀態(tài)空間方法,并推導(dǎo)出了相應(yīng)的自然梯度算法6。另一方面,隨著稀疏表示理論的提出,人們開始嘗試利用稀疏表示實現(xiàn)盲源分離,在1998年,Chen、Donoho and Saunders等人就討論在一組超完備(如小波基)下使用大規(guī)模線性規(guī)劃尋找信號的稀疏表示7。2001年前后,Zibulevsky,Kisilev, Zeevi和Pearlmutter等先后發(fā)表了關(guān)于信號字典、超完備、稀疏分解方法的多篇文章8。2004年,李遠青在Neuro Computations分析了稀疏表示和欠定的盲分離問題9。近年來,基于稀疏表示理論和字典

6、學(xué)習(xí)的單通道盲源分離問題逐漸成為人們研究的熱點,文獻10是一個單通道盲信號分離問題的綜述,總結(jié)了單通道盲信源分離常用的研究方法,文獻1112提出了基于部分字典學(xué)習(xí)和在線字典學(xué)習(xí)的的盲源分離方法。與此同時,人們更加關(guān)注盲源分離理論在生產(chǎn)、生活中的應(yīng)用13。根據(jù)上文的論述,結(jié)合已有的研究成果,我們可以對盲源分離問題作出下面的分類,并針對不同的類別給出不同的研究方法。從源信號與觀察信號數(shù)量關(guān)系上區(qū)分,現(xiàn)有的盲信號分離算法可以分為兩類:第一類算法能夠處理觀察信號數(shù)量大于或等于源信號數(shù)量的情形,這種情形稱之為超定。研究者們提出了許多效果良好的算法,例如PCA、ICA,最大信息熵(Infomax)方法,最

7、大化負熵方法,最大化似然估計,基于信號時間關(guān)聯(lián)性的方法(SOBI)等,采用上述方法,以及能夠較好的求解這一類超定、適定盲源分離問題,故這一類問題以及不是研究的重點。第二類算法是處理觀察信號數(shù)量小于源信號數(shù)量的情形,這種情況稱為欠定,對于欠定情形,求解欠定問題的一個必備條件是原信號必須具有稀疏性,由于在日常生活中的信號不是稀疏的,為了使信號足夠的稀疏,將信號進行變換,在變換域中得到足夠稀疏的信號,如對混合信號進行時頻變換、小波變換預(yù)處理9,隨著稀疏字典的出現(xiàn),人們也開始利用字典對信號進行稀疏表示1112。在得到稀疏的原信號后,欠定盲源分離問題可以按照下面的方法展開。先估計出混疊矩陣A,然后利用剛

8、得到的混疊矩陣A來進一步估計出源信號或者是在迭代過程中對混疊矩陣A和源信號兩者交替估計,因此總可以把欠定盲分離問題歸結(jié)為兩步法來實現(xiàn)。對混合矩陣的估計以及原信號的重構(gòu)成為目前研究的熱點,求解混合矩陣的方法目前主要采用的是聚類的方法,如勢函數(shù)法、均值法、模糊C均值法、基于霍夫直線檢測的方法。估計原信號的方法也是盲源分離問題的研究重點。目前,重構(gòu)算法主要分為三類?;诜稊?shù)最小化的貪婪類算法,比如正交匹配追蹤15(Orthogonal Matching Pursuit, OMP)算法;基于范數(shù)最小化的凸優(yōu)化算法,比如基追蹤1617 (Basis Pursuit, BP)法;以及它們的組合算法。同時,

9、平滑 算法開始被用到重構(gòu)方法中1819。技術(shù)難度:本課題在基于稀疏表示進行語音后,擬進一步研究壓縮感知主要三個核心問題: (1)選擇合適的稀疏基使語音信號盡可能的稀疏; (2)混合矩陣的估計; (3)快速魯棒的信號重構(gòu)算法設(shè)計;在每一個過程中,需要結(jié)合語音信號自身的特性設(shè)計多種方法,對結(jié)果進行分析比較,從而找出一種最合適的方法,使得能夠高質(zhì)量的重構(gòu)出原始信號。參考文獻:1 . Jutten C and Herault J. Blind separation of sources, part: an adaptive algorithm based on neuromimetic archite

10、ctureJ.SignalProeessing,1991,28:l-102 . Comon P. Independent Component Analysis, A New ConceptJ.Signal Processing,1994,36(3):287-314.3 . Cao X R and Liu RW. General approach to blind source separationJ.IEEE Transactions on Signal Proeessing,1996,44(3):562一5714 . Bell A J, Sejnowski T J. A informatio

11、n-maximization approach to blind source separation and blind deconvolution J. Neural Computation, 1995, 7(6): 1129-1159.5 . Hyvarinen A. Fast and Robust Fixed-Point Algorithms for Independent Component AnalysisJ.IEEE Trans On Neural Networks, 1999, 10(3):626-634.6 . Zhang L,Amari S, Cichocki A. Natu

12、ral Gradient Approach to Blind Separation of Over-and Under Complete MixturesC/ Proc of the First International Workshop on Independent Component Analysis and Signal SeparationICA99, Aussois,F(xiàn)rance,1999:455-460.7 . Cichocki A,Zhang L. Two-Stage Blind Deconvolution Using State-Space ModelsC/Proceedin

13、gs of the Fifth International Conference on Neural Information Processing(ICONIP98),Kitaky-ushu,Japan,1998:729-732.8 . P. Bofill, M. Zibulevsky. Underdetermined source separation using sparse representationJ. Signal processing,2001, 81,2353-2362.9 . Y. Li, A. Cichocki,S. Amari. Analysis of sparse re

14、presentation and blind source separationJ. Neural computation, June 2004, vol. 16, no.6,1193-1234.10. 彭耿,黃知濤等.單通道盲信號分離研究進展與展望J.中國電子科學(xué)研究院學(xué)報,2009,03:268-277.11. Plumbley M D, Blumensath T, Daudet L, et al. Sparse representations in audio & music: from coding to source separationJ. Proceedings of the I

15、EEE, 2010, 98(6):995 - 1005.12. Shapoori S, Sanei S, Wang W. Blind Source Separation of Medial Temporal Discharges via Partial Dictionary LearningC/ IEEE International Workshop on MACHINE LEARNING FOR SIGNAL PROCESSING. 2015.13. Rambhatla S, Haupt J. Semi-blind source separation via sparse represent

16、ations and online dictionary learningC/ Asilomar Conference on Signals, Systems and Computers. IEEE, 2013.14. 練秋生,石保順等.字典學(xué)習(xí)模型、算法及其應(yīng)用研究進展J.自動化學(xué)報,2015,41(2):240-60.15. M. Yang and F. de Hoog, Orthogonal Matching Pursuit With Thresholding and its Application in Compressive Sensing, in IEEE Transactions

17、 on Signal Processing, vol. 63, no. 20, pp. 5479-5486, Oct.15, 2015.16. 楊真真,楊震,孫林慧. 信號壓縮重構(gòu)的正交匹配追蹤類算法綜述J. 信號處理,2013,04:486-496.17. Ekanadham, D. Tranchina and E. P. Simoncelli, Recovery of Sparse Translation-Invariant Signals With Continuous Basis Pursuit, in IEEE Transactions on SignalProcessing, vo

18、l. 59, no. 10, pp. 4735-4744, Oct. 2011.18. H. Mohimani, M. Babaie-Zadeh and C. Jutten, A Fast Approach for Overcomplete Sparse Decomposition Based on Smoothed L0 Norm, in IEEE Transactions on Signal Processing, vol. 57, no. 1, pp. 289-301, Jan. 2009.19. 楊良龍, 趙生妹, 鄭寶玉,等. 基于SL0壓縮感知信號重建的改進算法J. 信號處理, 2

19、012, 28(6):834-841.二、課題內(nèi)容及具體方案研究內(nèi)容及擬采用的設(shè)計方法:本課題基于稀疏表示分離語音信號,在充分考慮語音語音信號自身特點的基礎(chǔ)上,實現(xiàn)多個混疊信號的分離。重點在于擬提出一種稀疏基使語音信號在某個變換域內(nèi)用盡可能少的非零值進行表示,而不同語音信號在此稀疏域內(nèi)不能夠稀疏的表示。同時,本課題擬提出一種重構(gòu)算法使稀疏表示后的語音信號能夠?qū)崿F(xiàn)高質(zhì)量的重構(gòu),本課題擬采用一種改進的OMP重構(gòu)算法對語音信號進行重構(gòu)。(一)選取稀疏基假設(shè)有限實值離散空間為,它的基向量為(i=1,2,.,N),則空間內(nèi)任意信號(N個信息量)可以表示為: 式(1)式(1)中是由基向量(i=1,2,.,

20、N)構(gòu)成的NN正交矩陣,矩陣s是信號x在域稀疏后的矩陣。信號稀疏指的是當(dāng)0p0時,如果矩陣s有K個非零值(或大系數(shù))且KN,則s稱為x在域的K階稀疏矩陣(稀疏度為K)。使用稀疏表示的前提是信號是稀疏的,信號越稀疏,重構(gòu)信號就越精確。因此稀疏基的選擇將會影響重構(gòu)時間的長短和重構(gòu)質(zhì)量的好壞。經(jīng)過幾十年的研究,已經(jīng)提出多種信號系數(shù)的表示方法,主要分為三大類:正交基矩陣,多尺度幾何變換以及過完備字典。稀疏基的分類如圖1所示。信號稀疏基冗余字典多尺度幾何變換正交基變換字典訓(xùn)練人工構(gòu)造離散余弦變換CurveletRidgeletBandeletcontourlet傅里葉變換小波變換圖2 稀疏基的分類多尺度

21、幾何變換以“最優(yōu)”圖像表示理論為基礎(chǔ),解決了高維信號稀疏表示的問題,并且取得了很好的效果,但是對一維信號來說不能得到最稀疏的解。冗余字典的優(yōu)點是它能夠使信號達到最稀疏的狀態(tài),稀疏后的信號只有在很少的位置有值并且值很大,大部分位置的值為零;這種方法是利用參數(shù)以及含參數(shù)的函數(shù)來近似表達信號,那么參數(shù)的選取是主要解決的問題,另外隨著冗余字典的基向量大大增加,計算復(fù)雜度升高。正交基變換對高維信號如圖像和視頻信號等效果不好,但是它對處理一維信號有比較好的效果,而且選擇的稀疏基是唯一的,計算簡單、性能比較穩(wěn)定。語音信號是一維的,并且在頻域、離散余弦變換(Discrete Cosine Transform.

22、 DCT)變換域、小波域(wavelet)都有可稀疏性。本課題擬采用DCT作為稀疏基,選擇DCT作為稀疏基的原因在于DCT是一種正交投影的方法,它具有與語音信號較匹配獨立的變換核函數(shù),是應(yīng)用于語音稀疏分解的最佳方法之一。(二)重構(gòu)算法重構(gòu)算法主要有基于范數(shù)最小化的貪婪迭代匹配追蹤系統(tǒng)算法,如MP、OMP、梯度類算法等;基于范數(shù)最小化的凸優(yōu)化算法,如基追蹤法、內(nèi)點法等;相關(guān)參考文獻指出,貪婪算法主要思想是每次迭代時得到的不是精確解,而是選擇迭代點的局部最優(yōu)解逼近原始信號。貪婪算法計算簡單、重構(gòu)效果好,但大部分貪婪算法要求已知信號的稀疏度,在實際中比較難以滿足。凸優(yōu)化算法是把范數(shù)的求解問題轉(zhuǎn)換成范

23、數(shù),從而解決范數(shù)的NP難題。凸優(yōu)化算法信號重構(gòu)率高,所需的觀測點少。但是,計算復(fù)雜度高,計算速度比較慢。綜合考慮,本方案擬采用OMP算法,并在此基礎(chǔ)上做出改進,以達到較好的分離效果。(三)混合矩陣的估計混合矩陣的估計是稀疏源盲分離的關(guān)鍵組成部分,其估計精度直接影響到源信號的估計精度,常用的基于勢函數(shù)表示的方法、基于K均值聚類、基于譜聚類方法、模糊C均值法、基于霍夫直線檢測以及基于粒子群優(yōu)化求解的方法??紤]到語音信號自身的特性,各種算法的理論完備性以及算法的實現(xiàn)復(fù)雜度等因素,本課題擬采用K均值聚類方法來估計混合矩陣,也就是機器學(xué)習(xí)中的K-means,并在此基礎(chǔ)上給出改進算法。(四)分離語音的性能

24、評價(1)主觀評價語音信號主觀評價語音信號一般采用MOS(Mean Opinion Score)值,本課題擬采用ITUP.862的PESQ程序?qū)υ嫉恼Z音信號和重構(gòu)后的語音信號的對比來得到MOS分,實現(xiàn)對語音信號質(zhì)量的客觀評價。如表1所示,不同的MOS分所對應(yīng)的重構(gòu)信號的質(zhì)量。表1 MOS值對應(yīng)的重構(gòu)信號質(zhì)量MOS值質(zhì)量級別失真級別5優(yōu)不察覺4良稍有察覺3一般稍有察覺且有點厭煩2差明顯察覺但可以忍受1很差無法忍受(2)客觀評價語音信號衡量一段語音信號的重構(gòu)質(zhì)量,一般用Averge Frame Signal to Noise Ratio(簡稱AFSNR,中文稱為平均幀信噪比),它的表達公式如式(

25、2): 式(2) 其中,N是語音信號的總幀數(shù)。AFSNR越大,說明信號重構(gòu)質(zhì)量越好,反之,信號的重構(gòu)質(zhì)量越差。實驗可行性本課題主攻方向明確,研究目標適度,擬解決的關(guān)鍵問題均有有效的對策,課題具有良好的前期研究基礎(chǔ),因而是切實可行的。國內(nèi)外已在相關(guān)方面作了一定的理論性探討,為本課題研究提供了有益的參考。本人到目前為止已對稀疏表示的基本算法及其在語音信號盲源分離中的應(yīng)用等進行了一定的預(yù)研工作,做了較充分的前期準備。因此,相信能夠達到預(yù)期的研究目標。三、工作進度安排2015年9月2016年9月:基礎(chǔ)理論學(xué)習(xí),收集和閱讀文獻,跟蹤國內(nèi)外最新研究動態(tài),做好相關(guān)的理論準備和進一步的預(yù)研工作;2016年9月2017年3月:在充分研,掌握相關(guān)理論和預(yù)研工作的基礎(chǔ)上,確定技術(shù)方案,建立相關(guān)模型;2017年6月2017年9月:在建立相關(guān)模型的基礎(chǔ)上,對基于稀疏表示的盲源分離進行理論分析和系統(tǒng)仿真;2017年9月201

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論