基于改進(jìn)型支持向量機(jī)的語(yǔ)音信號(hào)情感識(shí)別研究_第1頁(yè)
基于改進(jìn)型支持向量機(jī)的語(yǔ)音信號(hào)情感識(shí)別研究_第2頁(yè)
基于改進(jìn)型支持向量機(jī)的語(yǔ)音信號(hào)情感識(shí)別研究_第3頁(yè)
基于改進(jìn)型支持向量機(jī)的語(yǔ)音信號(hào)情感識(shí)別研究_第4頁(yè)
基于改進(jìn)型支持向量機(jī)的語(yǔ)音信號(hào)情感識(shí)別研究_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 基于改進(jìn)型支持向量機(jī)的語(yǔ)音信號(hào)情感識(shí)別研究 胡明崔冉郭健鵬吳靜然翟曉東Summary:語(yǔ)音信號(hào)包含了人類豐富的情感信息,本文從離散情感模型出發(fā),選擇了高興、悲傷、憤怒和害怕4種基本情感作為研究對(duì)象,利用螢火蟲(chóng)算法實(shí)現(xiàn)了支持向量機(jī)參數(shù)自動(dòng)尋優(yōu),從而提高了識(shí)別的效率。為了使測(cè)試數(shù)據(jù)更據(jù)代表性,選取了中文和德文數(shù)兩種據(jù)庫(kù),400個(gè)樣本進(jìn)行訓(xùn)練和測(cè)試。實(shí)驗(yàn)表明,對(duì)SVM分類器進(jìn)行優(yōu)化在一定程度上提高了情感識(shí)別率。Key:語(yǔ)音信號(hào);螢火蟲(chóng)算法;改進(jìn)的支持向量機(jī);情感識(shí)別:TP18 :A :1007-9416(2019)06-0109-020 前言機(jī)器情感這一研究領(lǐng)域從提出概念伊始,就伴隨著倫理道德的疑

2、慮。而隨著人工智能技術(shù)的發(fā)展,如何設(shè)計(jì)并實(shí)現(xiàn)一個(gè)具有情感識(shí)別的智能機(jī)器人顯得尤為重要了。而其關(guān)鍵技術(shù)就是研究情感識(shí)別核心算法,不斷提高識(shí)別的速度和準(zhǔn)確率。目前情感識(shí)別研究領(lǐng)域中,最主要的途徑就是通過(guò)對(duì)人的生理信息,例如聲音信號(hào)、脈搏信號(hào)、腦電信號(hào)、面部表情、身體形態(tài)等一種信號(hào)分析或多種信號(hào)的多模分析,利用識(shí)別技術(shù)進(jìn)行訓(xùn)練學(xué)習(xí)和類型識(shí)別判斷。本文主要通過(guò)對(duì)語(yǔ)音信號(hào)的拾取、預(yù)處理、特征提取和類型識(shí)別,達(dá)到情感識(shí)別的目的,這一過(guò)程的核心是類型識(shí)別,也是近幾年研究最多、成果最豐富的環(huán)節(jié)。本文利用改進(jìn)的支持向量開(kāi)展語(yǔ)音信號(hào)情感識(shí)別的研究,研究思路如圖1所示。1 語(yǔ)音情感的分類人類的情感是一個(gè)復(fù)雜的系統(tǒng),

3、屬于心理學(xué)范疇,目前尚無(wú)一個(gè)統(tǒng)一的、標(biāo)準(zhǔn)的定義。人類的情感是人類對(duì)不同物理、事件體現(xiàn)出的反映,再通過(guò)人的語(yǔ)音、表情、動(dòng)作、生理信號(hào)等各種外在的方式表達(dá)出來(lái)。各個(gè)國(guó)家心理專家、情感識(shí)別專家對(duì)情感有不同的分類依據(jù)和方法,主要有離散情感模型和緯度情感模型。離散情感模型,將人類的情感分為基本情感和復(fù)雜情感,且復(fù)雜情感是有基本情感的有機(jī)組合產(chǎn)生的,因此研究基本情感就顯得尤為重要了。不同的心理學(xué)家將人類的基本情感進(jìn)行了不同的分類,有的分為高興和悲傷兩種,而其它各種情感均是這兩種情感的不同比例組合而成。而有的專家則將人的基本情感分為3-9種更加細(xì)膩的情感。緯度情感模型,則認(rèn)為人的感情是連續(xù)的,不是離散的,主

4、要有二緯度情感模型和三維度情感模型,每個(gè)緯度分為正向積極方向和反向消極方向。本文主要從離散情感模型出發(fā),重點(diǎn)研究公認(rèn)的幾種基本情感:高興、悲傷、憤怒和害怕。2 語(yǔ)音情感的數(shù)據(jù)庫(kù)樣本選取語(yǔ)音情感的數(shù)據(jù)庫(kù)是分析識(shí)別語(yǔ)音情感的前提。因?yàn)檎Z(yǔ)言、方言、性別等因素不同,目前尚無(wú)公認(rèn)的、統(tǒng)一的、標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)庫(kù)庫(kù)。為了驗(yàn)證改進(jìn)型支持向量機(jī)的準(zhǔn)確率,本文選取兩種語(yǔ)言的語(yǔ)音情感數(shù)據(jù)庫(kù):EMO-DB數(shù)據(jù)庫(kù)和CASIA數(shù)據(jù)庫(kù)1。2.1 CASIA數(shù)據(jù)庫(kù)CASIA數(shù)據(jù)庫(kù)是一個(gè)中文情感數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由中國(guó)科學(xué)院錄制,分別錄制了4名人員在6類不同情感(快樂(lè)、中性、憤怒、悲傷、害怕、驚訝)下的聲音,采樣頻率16KHz,16

5、位AD采集量化,每種感情保留200句。根據(jù)本文設(shè)計(jì)需要,選取其中高興(原數(shù)據(jù)庫(kù)中的快樂(lè))、悲傷、憤怒和害怕4類數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試,每類選取50句,如表1所示。2.2 EMO-DB數(shù)據(jù)庫(kù)EMO-DB數(shù)據(jù)庫(kù)是一個(gè)德語(yǔ)情感數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由柏林工業(yè)大學(xué)建立,是目前國(guó)際上相對(duì)標(biāo)準(zhǔn)和認(rèn)可的數(shù)據(jù)庫(kù),分別錄制了10名專業(yè)演員在7類不同情感(快樂(lè)、中性、憤怒、悲傷、恐懼、無(wú)聊、厭惡),共計(jì)錄制800句,最終保留535句。根據(jù)本文設(shè)計(jì)需要,選取其中高興(原數(shù)據(jù)庫(kù)中的快樂(lè))、悲傷、憤怒和害怕(原數(shù)據(jù)庫(kù)中的恐懼)4類數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試,每類選取50句,如表2所示。3 語(yǔ)音信號(hào)的預(yù)處理語(yǔ)音信號(hào)具有隨著時(shí)間變化而變化的

6、特性,而且是不穩(wěn)定的,因此需要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,從而去除干擾,獲得高質(zhì)量的信號(hào)2。語(yǔ)音信號(hào)的預(yù)處理過(guò)程如圖2所示??紤]到小波變換處理語(yǔ)音信號(hào)時(shí)存在一定的局限性,本文采取了近期較為常用、不需要事先選定基函數(shù)的EMD算法對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,取得了較好的效果。4 語(yǔ)音信號(hào)情感特征參數(shù)的提取語(yǔ)音信號(hào)中的情感特征參數(shù)是其能表達(dá)感情的關(guān)鍵,包含了韻律特征、音質(zhì)特征、基于譜的相關(guān)特征2。其中,韻律特征參數(shù)主要有語(yǔ)速、基因頻率及短時(shí)能量,而音質(zhì)特征參數(shù)主要有共振峰、聲門參數(shù),基于譜的相關(guān)特征參數(shù)主要有線性譜特征和倒譜特征。我們主要研究了梅爾頻率倒譜系數(shù)(MFCC),基音周期,共振峰參數(shù),短時(shí)過(guò)零率,短時(shí)

7、能量,能量抖動(dòng)參數(shù),時(shí)域及頻域能量,平均功率,語(yǔ)速等參數(shù),并通過(guò)對(duì)這些參數(shù)的分析,分別計(jì)算了它們的統(tǒng)計(jì)學(xué)特征,包括平均值、中位值、標(biāo)準(zhǔn)差、最小值、最大值、方差、變化率、一階差分等。5 改進(jìn)的支持向量機(jī)算法對(duì)語(yǔ)音信號(hào)情感的分類識(shí)別5.1 螢火蟲(chóng)算法優(yōu)化支持向量機(jī)參數(shù)螢火蟲(chóng)算法(Firefly Algorithm,F(xiàn)A)是由Xin-she Yang教授于2008年提出的一種十分新穎的生物群智能優(yōu)化算法,算法的靈感來(lái)源于對(duì)螢火蟲(chóng)群體行為的簡(jiǎn)化和模擬,一經(jīng)提出就吸引了國(guó)內(nèi)外大量學(xué)者的關(guān)注,是優(yōu)化算法研究領(lǐng)域的熱點(diǎn)之一3。本文選取FA算法對(duì)SVM的關(guān)鍵參數(shù)進(jìn)行優(yōu)化,建立FA-SVM模型4,主要流程如圖3

8、所示。5.2 情感分類結(jié)果分析本文將從EMO-DB數(shù)據(jù)庫(kù)和CASIA數(shù)據(jù)庫(kù)中選取關(guān)于高興、憤怒、悲傷、害怕等四類情感各50個(gè),合計(jì)400個(gè)數(shù)據(jù)分別在SVM和FA-SVM模型中訓(xùn)練和測(cè)試,識(shí)別結(jié)果統(tǒng)計(jì)如表3所示。通過(guò)對(duì)表3的橫向和縱向進(jìn)行分析,可以得出,經(jīng)過(guò)改進(jìn)的支持向量機(jī)FA-SVM針對(duì)語(yǔ)音信號(hào)的情感識(shí)別率,比未經(jīng)過(guò)優(yōu)化的支持向量機(jī)的識(shí)別率有明顯的改善,尤其是憤怒的識(shí)別最高,提高了11.1%,而高興、 悲傷、害怕分別有4.1%、7.6%、5.6%的效果改善。Reference1 王艷,胡維平.基于BP特征選擇的語(yǔ)音情感識(shí)別J.微電子學(xué)與計(jì)算機(jī),2019,36(5):14-18.2 李曉琴.基于支持向量機(jī)的語(yǔ)音情感識(shí)別D.吉林:哈爾濱理工大學(xué),2018.3 臧睿,李晶.基于維度加權(quán)的改進(jìn)螢火蟲(chóng)算法J.計(jì)算機(jī)科學(xué),2017,44(6A):123-125.4 曾建梅.改進(jìn)的支持向量機(jī)用于脈搏信號(hào)的情感識(shí)別研究D.吉林:重慶理工大學(xué),2016.數(shù)字技術(shù)與

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論