Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第1頁(yè)
Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第2頁(yè)
Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第3頁(yè)
Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第4頁(yè)
Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、使用疾病特異特征選取分類心跳類型摘要自動(dòng)分類心跳類型是協(xié)助醫(yī)生找出在長(zhǎng)期的動(dòng)態(tài)心電圖記錄中異常的心跳的重要手段。在本文中,我們介紹了一種新的疾病特異特征選取的方法,它由一個(gè)一對(duì)一的特征排名階段和一個(gè)包含在同一個(gè)一對(duì)一的支持向量機(jī)的二類分類器中的特征搜索階段組成。 本文提出的方法與傳統(tǒng)方法的不同之處在于它的重點(diǎn)是對(duì)有效的特征子集的選擇,從而能通過(guò)一對(duì)一的對(duì)比從其他分類器中挑選出一個(gè)分類器。從MIT-BIH心律失常數(shù)據(jù)庫(kù)中得到的心電圖被用來(lái)評(píng)估本文所提出的特征選取方法。所采用的心電圖特征包括跨節(jié)拍內(nèi)和逐次心跳間期,振幅形態(tài),面積形態(tài)和形貌上的距離。 采取美國(guó)醫(yī)療儀器促進(jìn)協(xié)會(huì)(AAMI)提出的建議,

2、MIT-BIH-AR的所有心率樣本分為四類,即: 正常搏動(dòng)或束支傳導(dǎo)阻滯(N),室上性早搏(S),室性早搏(V)和心室融合心跳(F)。 訓(xùn)練和測(cè)試數(shù)據(jù)的劃分遵守個(gè)體間的圖示。 實(shí)驗(yàn)結(jié)果表明,所提出的特征選取方法的的平均分類精度是86.66,勝過(guò)那些無(wú)特征選擇的方法。對(duì)N,S,V和F分類的靈敏度分別是88.94,79.06,85.48和93.81,相應(yīng)的陽(yáng)性預(yù)測(cè)值分別為98.98,35.98,92.75和13.74。 在靈敏度和陽(yáng)性預(yù)測(cè)值的算術(shù)平均值方面,所提出的方法也有比其他的最先進(jìn)的特征選擇方法更好的性能。1.簡(jiǎn)介心電圖(ECG)是一個(gè)無(wú)創(chuàng),廉價(jià)且相當(dāng)成熟的診斷工具。它含有基本的生理信號(hào),被

3、廣泛得用于分析心臟功能。然而,對(duì)于長(zhǎng)期的心電圖記錄的分析,逐拍的手動(dòng)檢查既乏味又耗時(shí),尤其是對(duì)于床邊監(jiān)護(hù)或可穿戴式在線醫(yī)療監(jiān)護(hù),其中實(shí)時(shí)診斷對(duì)初級(jí)醫(yī)生來(lái)說(shuō)是一項(xiàng)艱巨的任務(wù)。因此,臨床醫(yī)生通常采用計(jì)算機(jī)輔助方法來(lái)分析和解釋ECG信號(hào)。在臨界條件下,心律失常可以被分成兩種類型,即致命的和非致命的。致命的心律失??赡芤l(fā)心臟驟停而突然死亡,如心室顫動(dòng)和心動(dòng)過(guò)速?;颊咴谶@種情況下,需要緊急治療。雖然非致命的心律失??赡懿粫?huì)立即導(dǎo)致心臟衰竭,但是仍然需要及時(shí)的治療,以避免病情進(jìn)一步惡化。在某些情況下,心律失常只會(huì)偶爾發(fā)生在患者的日常生活中。為了捕捉到這些稀少的信號(hào),通常采用動(dòng)態(tài)心電圖裝置來(lái)記錄長(zhǎng)期的心電

4、數(shù)據(jù)。因此,從大量的ECG數(shù)據(jù)中自動(dòng)識(shí)別出異常的心跳是一個(gè)既重要又必要的任務(wù)。第一類型的心律失常已經(jīng)被詳細(xì)的研究過(guò)了,并且一些檢測(cè)算法已經(jīng)被開(kāi)發(fā)和實(shí)施在自動(dòng)體外除顫器(AED)。識(shí)別第二類的異位搏動(dòng)檢測(cè)是關(guān)鍵的一步。在這項(xiàng)研究中,我們只專注于非致命的心律失常研究以及相關(guān)的異位搏動(dòng)檢測(cè)。 在過(guò)去的幾十年里,大量的研究一直致力于心跳類型自動(dòng)分類。該工作可被分為兩種分類模式,即 “內(nèi)患者” 和“跨患者”或者也分別被稱為 “面向類的” 和 “面向主題的”。內(nèi)患者模式僅根據(jù)節(jié)拍標(biāo)簽劃分整個(gè)數(shù)據(jù)集為訓(xùn)練和測(cè)試子集,其中部分的心電圖上的記錄可能同時(shí)出現(xiàn)在兩個(gè)數(shù)據(jù)子集上。通過(guò)這樣的方案,分類通常會(huì)產(chǎn)生過(guò)于樂(lè)觀

5、的結(jié)果。在臨床實(shí)踐中,由于的個(gè)體間差異會(huì)導(dǎo)致分類性能的下降。 為了適應(yīng)實(shí)際的情況中,de Chazal等人建議當(dāng)訓(xùn)練和測(cè)試的子集是從不同的心電圖記錄中構(gòu)造得到時(shí),將會(huì)把個(gè)體間的差異考慮在內(nèi),并且分類器將會(huì)呈現(xiàn)較好的泛化能力。這種模式已經(jīng)被采納并用來(lái)評(píng)估對(duì)MIT-BIH心律失常數(shù)據(jù)集的分類性能。此外,一個(gè)被稱為“患者特異性”的混合模式也被de Chazal等人提出,其中,先訓(xùn)練一個(gè)全局分類器,然后再用一個(gè)本地分類來(lái)調(diào)整全局分類器。據(jù)文獻(xiàn)指出,這種方法優(yōu)于那些純粹由患者間的分類實(shí)現(xiàn)的分類器。Ince等人受這種模式的啟發(fā),提出了“患者特異性”神經(jīng)網(wǎng)絡(luò),其中訓(xùn)練數(shù)據(jù)由兩部分組成:()從訓(xùn)練記錄中隨機(jī)選

6、出的共同的具有代表性的節(jié)拍以及()從每個(gè)記錄的前5分鐘取出的患者特異性節(jié)拍。此外,Wiens等人采用了一種主動(dòng)學(xué)習(xí)的方法來(lái)檢測(cè)室性早搏和室上性異位早搏。另外,Llamedo等人研究發(fā)現(xiàn),當(dāng)專家們能有效的改進(jìn)在主動(dòng)學(xué)習(xí)中的迭代步驟時(shí),性能將得到許多改善。大多數(shù)研究參考美國(guó)醫(yī)療儀器促進(jìn)協(xié)會(huì)(AAMI)的意見(jiàn),對(duì)心律指定使用5個(gè)標(biāo)簽,分別是正常搏動(dòng)或束支傳導(dǎo)阻滯(N),室上性早搏(S),室性早搏(V)和心室融合心跳(F),以及不能被分類的心律(Q)的。這一建議使得各心律之間能進(jìn)行公平的比較分類。 考慮到通常用心電圖的特征來(lái)分類,被最廣泛使用的是RR間隔周圍的特征,例如前一筆RR間期,后一筆RR間期,

7、當(dāng)下的RR間期,平均的RR間期和其它基于RR間期的特征。其他的時(shí)域特征,包括PP間期,P波持續(xù)時(shí)間,QRS寬度,PR間期,T波間期和QT間期。此外,ECG樣本在P波,QRS波群和T波上的 “形態(tài)學(xué)”特征以及節(jié)拍和平均節(jié)拍之間的形態(tài)的距離也已經(jīng)被采用。這些特征已經(jīng)用于臨床上的研究,相關(guān)的診斷標(biāo)準(zhǔn)也已被規(guī)定。 雖然基于向量圖(VCG)的特征可以提供有關(guān)心臟疾病的全面信息,但是VCG的重建需要更多的信息,因此這些特征的應(yīng)用是相當(dāng)有限的。此外,頻域上的特征分析還可以用來(lái)深入了解ECG信號(hào)。信號(hào)處理方法包括小波分解(WT),主成分分析(PCA),獨(dú)立成分分析(ICA)。 雖然這些功能都具有明確的數(shù)學(xué)相關(guān)

8、解釋,但是他們沒(méi)有可以讓醫(yī)生以直觀的方式來(lái)理解的生理意義。 因此,從大量的特征中選擇最相關(guān)的特征來(lái)改善分類的性能群眾是一個(gè)極大的挑戰(zhàn)。Llamedo等人采用一種順序浮動(dòng)特征選擇(SFFS)算法以增強(qiáng)貝葉斯分類器。他們?cè)噲D為所有的子分類器尋找一個(gè)最佳的特征子集。可是,在臨床實(shí)踐中,不同的疾病所參考的特征不同。通過(guò)對(duì)特征的分析,臨床醫(yī)生可以把一種疾病從其他疾病中分別出來(lái),或者把有疾病的狀態(tài)和健康的狀態(tài)區(qū)別開(kāi)來(lái)?;谶@個(gè)想法,我們?cè)噲D提出一個(gè)新穎的“疾病特異”特征選取方法并且用它來(lái)增強(qiáng)心律分類器的性能。為了評(píng)估這種方法,我們采用了患者間分類模式來(lái)保證更好的泛華能力,并且關(guān)注于四個(gè)在臨床上已經(jīng)被較全面

9、的研究過(guò)了的種類,N,S,V和F。所呈現(xiàn)的測(cè)試結(jié)果采用了美國(guó)醫(yī)療儀器促進(jìn)協(xié)會(huì)的建議。2. ECG 數(shù)據(jù)在本文的研究中,用MIT-BIH心律失常數(shù)據(jù)集來(lái)訓(xùn)練以及測(cè)試分類器。該數(shù)據(jù)集包括了從47個(gè)被試者(201和202記錄采自從同一個(gè)被試者中)中得到的48筆雙導(dǎo)聯(lián)記錄,每一筆記錄長(zhǎng)約30分鐘,采樣率都為360Hz。在48筆記錄中,23筆(“100系列”)從日常的非固定的訓(xùn)練中得到,從在23筆100系列中沒(méi)有被很好的呈現(xiàn)出來(lái)的,不平常的但在臨床上是非常重要的心律失常案例中提取出剩余的25筆(“200系列”)。ECG的導(dǎo)聯(lián)隨被試者的改變而改變,取決于電極放置的物理位置。對(duì)于大多數(shù)的記錄來(lái)說(shuō),第一個(gè)通道

10、是一個(gè)改進(jìn)的第二肢導(dǎo)聯(lián)(MLII)(只有114記錄使用V5來(lái)當(dāng)做第一導(dǎo)聯(lián),用MLII當(dāng)做第二導(dǎo)聯(lián);在這篇論文中我們交換了導(dǎo)聯(lián))。第二個(gè)通道通常是V1(有時(shí)是V2,V4或者V5,取決于被試者)。該數(shù)據(jù)庫(kù)包含了QRS位置和節(jié)拍種類的信息注釋,至少被兩個(gè)專家驗(yàn)證過(guò)。為了保證對(duì)相關(guān)文獻(xiàn)有一個(gè)公平的比較,并且遵守AAMI的意見(jiàn),我們放棄了四筆有步調(diào)節(jié)拍的記錄,即102,104,107以及217。另外,所有的原始心律標(biāo)簽同AAMI的標(biāo)簽相對(duì)應(yīng),對(duì)應(yīng)規(guī)則如表1所示。同時(shí),我們也采用了文獻(xiàn)6中所采用的劃分計(jì)劃訓(xùn)練集(DS1)和訓(xùn)練集(DS2)。請(qǐng)注意我們放棄了AAMI中的Q種類(未被分類且有節(jié)奏的心跳),因?yàn)?/p>

11、這種類型在MIT-BIH-AR中比較少。DS1和DS2中的數(shù)據(jù)集的數(shù)量按類型列在表1中。表1.數(shù)據(jù)集DS1和DS2的大小以及他們?cè)贏AMI和MIT-BIH-AR標(biāo)簽中的映射。a DS1中的記錄: 101, 106, 108, 109, 112, 114, 115, 116, 118, 119, 122, 124, 201, 203, 205, 207, 208, 209, 215, 220, 223, 230.b DS2中的記錄: 100, 103, 105, 111, 113, 117, 121, 123, 200, 202, 210, 212, 213, 214, 219, 221, 22

12、2, 228, 231, 232, 233, 234.3.方法在本文中我們采用了一個(gè)四階的分類策略來(lái)分析ECG數(shù)據(jù)。如圖1所示,整個(gè)分類策略由四個(gè)階段組成:信號(hào)預(yù)處理,特征提取,特征選取和分類器調(diào)諧。相對(duì)于之前文獻(xiàn)中的方法來(lái)說(shuō),多加了形態(tài)學(xué)和間隔的特征。在本文中P波下的面積,QRS波群和T波也被采用做心臟特征。此外,我們用特征選取階段來(lái)決定合適的特征。另外,我們通過(guò)將一些被獨(dú)立訓(xùn)練的一對(duì)一的二類支持向量機(jī)分類器與從兩個(gè)導(dǎo)聯(lián)中得到的數(shù)據(jù)相結(jié)合,完善了一個(gè)具有增強(qiáng)型泛化能力的混合分類器。Llamedo等人使用同樣的特征子集來(lái)分類,與他們的方法不同,我們提出的基于特征排序方法的一對(duì)一的分類器更合理。

13、現(xiàn)實(shí)的特征選取方法,即獲取最佳的特征子集是具有疾病特異性的,并且只能是二類分類器任務(wù)。這個(gè)優(yōu)點(diǎn)將會(huì)在3.3部分被詳細(xì)討論。3.1. ECG預(yù)處理自從MIT-BIH-AR資料庫(kù)中的ECG信號(hào)被動(dòng)態(tài)心電圖裝置采集到了后,信號(hào)被基線漂移,電源線噪聲以及高頻肌電圖干擾所污染。用被文獻(xiàn)6,12所采用的方法,先用一個(gè)200-ms寬度的中頻濾波器除掉所有的ECG信號(hào)中的P波和QRS波群,再用一個(gè)600-ms寬度的中頻濾波器來(lái)除掉T波。將得到的信號(hào)被視為隨后從原始信號(hào)中減去,以產(chǎn)生基線校正的心電圖信號(hào)的基線。用一個(gè)12序列截止頻率為35Hz的FIR低通濾波器來(lái)去除因?yàn)殡娫淳€和高頻產(chǎn)生的噪聲。最后,濾波后的二導(dǎo)

14、聯(lián)心電信號(hào)會(huì)被送入下一步進(jìn)行進(jìn)一步的處理。圖1.全自動(dòng)心律分類過(guò)程。3.2 心跳劃分和分割在心跳特征提取之前,由QRS波的位置將ECG的時(shí)間序列分割成獨(dú)立的心跳。許多方法可以用來(lái)定位出QRS波的位置并且檢測(cè)出那些基準(zhǔn)點(diǎn),比如文獻(xiàn)20,21中用到的方法以及文獻(xiàn)22,23中用到的小波算法。本文的目的則是完善一種基于特征選取的心律分類器。為了方便也為了能在波形數(shù)據(jù)庫(kù)(WFDB)中更好的操作,我們用包含在MIT-BIH-AR中的QRS的注釋以及工具“ecgpuwave”(一種QRS探測(cè)器,波形限制定位器可以從生理網(wǎng)上下載得到。)來(lái)檢測(cè)基準(zhǔn)點(diǎn),包括P波的起始點(diǎn),P波尖峰,P波終點(diǎn),QRS波群起點(diǎn),QRS

15、終點(diǎn),T波起點(diǎn),T波尖峰以及T波終點(diǎn)。當(dāng)一個(gè)心跳節(jié)拍中沒(méi)有P波時(shí),該心跳節(jié)拍的起點(diǎn)和終點(diǎn)由下一個(gè)QRS波群的起點(diǎn)開(kāi)始算起。因此,該心跳會(huì)有零個(gè)P波間期,被縮短的PR間期以及被縮短了的后一個(gè)的PP間期。同樣的,當(dāng)心跳中沒(méi)有T波時(shí),心跳節(jié)拍的起點(diǎn)和終點(diǎn)由下一個(gè)QRS波群的起點(diǎn)開(kāi)始算起,導(dǎo)致該心跳節(jié)拍會(huì)有零個(gè)T波間期,以及被縮短了的QT間期。3.3. 特征提取基于檢測(cè)出的基準(zhǔn)點(diǎn),每個(gè)節(jié)拍以及每個(gè)導(dǎo)聯(lián)的46個(gè)的特征都會(huì)被本文考慮到,這些特征被列在表2,其具體介紹在圖2.表2.本文用到的特征。圖2.ECG中基于區(qū)域和基于間隔的特征的圖解:充滿+和/符號(hào)的區(qū)域分別代表正負(fù)區(qū)。3.3.1. 心搏間期五個(gè)心搏

16、間期是指逐次心跳基準(zhǔn)點(diǎn)之間的間隔?;赒RS尖峰點(diǎn),一共有四個(gè)相關(guān)的RR間期。前一筆的RR間期是給定的心跳與前一筆心跳間的RR間期。后一筆的RR間期是給定的心跳與后一個(gè)心跳之間的RR間期。10筆局部的平均的RR間期由一個(gè)心跳節(jié)拍附近的10個(gè)RR間期取均值得到。RR間期的均值指的一筆記錄中的RR間期值,并且該值與在一筆數(shù)據(jù)中的所有心跳的RR間期具相等。最后,基于P波的尖峰點(diǎn),后一筆的RR間期被定義為給定的心跳的R波尖峰與后一筆心跳的R波尖峰。后一筆的RR間期表征心室周期,后一筆的 PP間期表征心房周期。如圖二所示,后一筆的RR間期,后一筆的PP間期以及心搏間期是相互依賴的。3.3.2 內(nèi)部節(jié)拍間

17、期內(nèi)部節(jié)拍間期被定義為一個(gè)在一個(gè)心跳上后一個(gè)基準(zhǔn)點(diǎn)與前一個(gè)基準(zhǔn)點(diǎn)間的間期。本篇論文采用了五個(gè)內(nèi)部節(jié)拍間期,如圖2所述,并且他們相關(guān)的基準(zhǔn)點(diǎn)也被列在相應(yīng)的行和圖2的最后一欄。我們用這些間期來(lái)當(dāng)做心臟特征,因?yàn)樗麄兪潜娝苤?,并被廣泛的用于臨床實(shí)踐中。3.3.3. 形態(tài)學(xué)振幅本文采用了文獻(xiàn)6中提到的形態(tài)振幅。為了描述ECG的形態(tài),我們通過(guò)一個(gè)特定的窗口對(duì)信號(hào)振幅向下采樣了一組數(shù)值。P波的形態(tài)定義為P波的起始點(diǎn)和P波的終點(diǎn)之間的10個(gè)采樣點(diǎn)的物理振幅。同樣地,QRS的形態(tài)和ST的形態(tài)分別定義為QRS的起始點(diǎn)和QRS的終點(diǎn)之間的10個(gè)采樣點(diǎn)的物理振幅和QRS的起始點(diǎn)和T波的終點(diǎn)之間的9個(gè)采樣點(diǎn)的物理

18、振幅.3.3.4. 形態(tài)面積由于形態(tài)學(xué)和間期的特征在自動(dòng)心率節(jié)拍分類器上的重要性,我們?cè)诒疚闹薪榻B了一種基于波區(qū)域的特征,為了能當(dāng)對(duì)特征選取的性能進(jìn)行評(píng)估時(shí)將心跳的形態(tài)考慮在內(nèi),并且提高分類器的分類性能。特別地,如圖2所示,很顯然,有些區(qū)域被波的間期,典型的ECG波以及基線所封閉。所以基線以上的區(qū)域的總面積被定義為正區(qū),反之,位于基線以下的區(qū)域被定義為負(fù)區(qū)。用這些測(cè)量出來(lái)的封閉區(qū)域可以得到6個(gè)基于波區(qū)域的特征,即P波,QRS波群,T波的正區(qū)和負(fù)區(qū),共同地代表了波間隔和采樣幅度的綜合特征。3.3.5. 形態(tài)距離盡管個(gè)體間的差異,一筆數(shù)據(jù)中正常的ECG通常擁有一個(gè)相似的同一個(gè)導(dǎo)聯(lián)的心跳形態(tài)距離。為

19、了描述心跳之間的相似性,Wiens 等人提出了一個(gè)基于動(dòng)態(tài)時(shí)間規(guī)整的新特征,該特征是給定的節(jié)拍和一筆數(shù)據(jù)的中部的距離。這一特點(diǎn)具有良好的對(duì)心室異位、早搏和室上性異位搏動(dòng)的辨別能力。在本文中,ECG信號(hào)心電信號(hào)從250毫秒QRS左峰值開(kāi)始,在QRS的右峰值的380毫秒結(jié)束,其中每個(gè)每個(gè)節(jié)拍都以50Hz的采樣率分割和下采樣。形態(tài)距離即每個(gè)分段和中間分段的動(dòng)態(tài)時(shí)間規(guī)整距離。雖然ecgpuwave是一個(gè)用來(lái)檢測(cè)QRS周期以及定位波形時(shí)限的強(qiáng)大工具,但是它仍然不能在有嚴(yán)重噪聲的片段中檢測(cè)出基準(zhǔn)點(diǎn),從而導(dǎo)致錯(cuò)誤的測(cè)量和不正常的特征。所以為了比較這些特征分?jǐn)?shù),必須消除這些異常值。在本文中,我們用了一個(gè)基于規(guī)

20、則的程序來(lái)識(shí)別和過(guò)濾異常值。這里,間期特征被限制在一個(gè)合理的范圍內(nèi)。任何一個(gè)超出這個(gè)范圍節(jié)拍都被當(dāng)做異常值。參照心臟的生理功能,在表3中列出的相關(guān)特征的上限和下限被用來(lái)限定一個(gè)心跳節(jié)拍。注意當(dāng)一個(gè)異常心跳從一個(gè)導(dǎo)聯(lián)中被移除的時(shí)候,為了配合不同的導(dǎo)聯(lián)的節(jié)拍,其他導(dǎo)聯(lián)中的相應(yīng)的節(jié)拍會(huì)被手動(dòng)刪除。異常值的移除過(guò)程只在預(yù)處理階段中應(yīng)用于DS1。被移除異常值后的DS1只在特征選取和分類器調(diào)諧中使用。如第4部分所示,在最后的訓(xùn)練和測(cè)試過(guò)程中,DS1和DS2都是原始心跳并且沒(méi)有一個(gè)異常值有被移除。此外,為了排序特征必須進(jìn)行歸一化。在本文中,用正切S型函數(shù)對(duì)所有特征進(jìn)行歸一化至-1,1范圍。表3.識(shí)別心律的特

21、征的上下界。3.4. 帶特征選取的支持向量機(jī)二級(jí)正則化支持向量機(jī)因其出色的泛化能力,在本文中被用做心跳節(jié)拍分類器。這種分類器致力于找到一個(gè)最佳的超平面,使得兩個(gè)不同的類別中有個(gè)最大的分類間隔。在這個(gè)任務(wù)中,假設(shè)一個(gè)訓(xùn)練集有N個(gè)樣本(yi,xi),i=1,.,N,其中xiRd,表示d維特征向量中的第i個(gè)樣本,yiR,表示相對(duì)應(yīng)的類標(biāo)簽,并且yi±1.最優(yōu)超平面由一個(gè)從訓(xùn)練集中得到的用來(lái)預(yù)測(cè)隨后的測(cè)試集的類型的決策函數(shù)f(x)表示。通過(guò)使用核方法,決策函數(shù)可表示為,(1)其中K(xi,x)是一個(gè)能將數(shù)據(jù)映射到一個(gè)更高維度的空間上的核函數(shù),而i為每個(gè)訓(xùn)練數(shù)據(jù)范例的拉格朗日乘子。線性核函數(shù)因

22、為其在特征選取過(guò)程中所表現(xiàn)出的線性解釋能力而被采用。在(1)中,一些i通常等于零,其相應(yīng)的訓(xùn)練數(shù)據(jù)范例被稱為支持向量。與二級(jí)正規(guī)化支持向量機(jī)相比,另一種常規(guī)化的支持向量機(jī),也被稱為一級(jí)正規(guī)化支持向量機(jī),它的優(yōu)化目標(biāo)是將更多的轉(zhuǎn)為零。這種分類器可被當(dāng)做自然特征選擇法也叫作嵌入式特征選擇法。在本文中,它被用作第四部分中的用來(lái)作比較的基線。許多軟件包都可以用來(lái)學(xué)習(xí)該決策函數(shù),本文選擇liblinear來(lái)當(dāng)做二類分類器的解,因?yàn)樗哂懈咝砸约霸贛ATLAB中的友好界面。因?yàn)橹С窒蛄繖C(jī)在本質(zhì)上是一個(gè)二類分類器,為了將它擴(kuò)展為一個(gè)多類分類器,特別是一個(gè)四類心律分類器,通常會(huì)結(jié)合使用一對(duì)多和一對(duì)一的方法。

23、如上所述,在心律分類的任務(wù)中,將一種疾病的心電圖特征與另一種疾病的心電圖特征是一個(gè)更現(xiàn)實(shí)的方法,而且它的分解也會(huì)更精細(xì)。因此,用一對(duì)一的模式,6個(gè)二類分類器被建立用來(lái)決定出一個(gè)預(yù)測(cè)類。此外,我們會(huì)證明一對(duì)一的模式同樣適用于多類特征選取。眾所周知,特征選取可以提高分類器的泛化能力。為了能提供一個(gè)更快更具成本效益的預(yù)測(cè)器,同時(shí)也為了能更好的理解所處理的數(shù)據(jù),許多方法都能被用來(lái)挑選出一個(gè)最優(yōu)的特征子集,比如基于封裝器的方法,基于濾波器的方法以及基于嵌入式的方法。在基于封裝器的方法中,分類器被當(dāng)做一個(gè)黑盒子,根據(jù)特征的的預(yù)測(cè)能力對(duì)特征子集進(jìn)行評(píng)分。然而在基于濾波器的方法上特征子集的選擇僅僅是一個(gè)預(yù)處理

24、步驟,與被選擇的預(yù)測(cè)器無(wú)關(guān)。對(duì)于基于嵌入式的方法,是在訓(xùn)練過(guò)程中進(jìn)行變量選擇,并且通常是具體的分類。為了能與支持向量機(jī)綜合,本文采用基于封裝器的方法與支持向量機(jī)相結(jié)合??墒?,基于封裝器的方法伴隨著兩個(gè)問(wèn)題,即長(zhǎng)的搜索時(shí)間和對(duì)支持向量機(jī)預(yù)測(cè)器的評(píng)估。為了解決第一個(gè)問(wèn)題,我們用F值準(zhǔn)則對(duì)特征進(jìn)行排序來(lái)加速搜索過(guò)程,并且在搜索策略中使用向后消去法。對(duì)于后一個(gè)問(wèn)題,先將所有特征根據(jù)其重要性進(jìn)行排序。然后,逐步消除最不重要的特征。特別地,在一個(gè)二元分類器中,給定一個(gè)訓(xùn)練向量xi,i=1,.,N,陽(yáng)性和陰性的實(shí)例數(shù)量分別為n+和n-,對(duì)于第k個(gè)特征的F值準(zhǔn)則為其中分別是第k個(gè)特征對(duì)于整體的平均值,陽(yáng)性數(shù)據(jù)

25、樣本數(shù),陰性數(shù)據(jù)樣本數(shù),是對(duì)于第i個(gè)陽(yáng)性實(shí)例和第j個(gè)陰性實(shí)例的第k個(gè)特征。公式中的分子和分母分別代表類間的區(qū)分度和跨類的緊湊度。所以,一個(gè)特征的F值越大,它的判別力和重要性可能就越大。從表1中我們看到對(duì)于四個(gè)類別訓(xùn)練實(shí)例的數(shù)量是不平衡的。為了平衡一個(gè)二元分類器的靈敏度,我們使用兩個(gè)預(yù)測(cè)靈敏度的幾何平均值來(lái)得到支持向量機(jī)的預(yù)測(cè),即其中Se+和Se-分別是陽(yáng)性和陰性類別的預(yù)測(cè)靈敏度。該度量已被廣泛用于處理不平衡數(shù)據(jù)集,為了將陽(yáng)性類別和陰性類別的分類的結(jié)果考慮在內(nèi)。對(duì)于每個(gè)二元分類器,調(diào)整懲罰因子C是必不可少的。本文提出的方法中會(huì)介紹一個(gè)外加的特征選取階段,用來(lái)在后面的特征消除過(guò)程中調(diào)整前特征。22

26、折交叉驗(yàn)證方法被用來(lái)調(diào)整DS1中的C和,其中C是在坐標(biāo)20,22,.,220中搜索得到的。有了這些參數(shù),在訓(xùn)練集中一對(duì)一的訓(xùn)練過(guò)程被重新執(zhí)行來(lái)獲得相對(duì)應(yīng)的支持向量機(jī)的本模型。這些過(guò)程在導(dǎo)聯(lián)上是各自獨(dú)立執(zhí)行的。所以,在每個(gè)導(dǎo)聯(lián)上都有6個(gè)二元分類器,對(duì)于兩導(dǎo)聯(lián)的MIT-BIH-AR一共有12個(gè)二元分類器。在接下來(lái)的小節(jié)中,我們會(huì)展示如何融合這些二元分類器并且選出最后的預(yù)測(cè)類別。3.5 組合分類器ECG數(shù)據(jù)通常包括多導(dǎo)聯(lián)中的信號(hào),可以被視為對(duì)同一心臟活動(dòng)的不同位置的觀察。整和不同導(dǎo)聯(lián)中的信號(hào)可以增強(qiáng)分類的準(zhǔn)確度。在本文中,我們采用乘積規(guī)則來(lái)混合兩導(dǎo)聯(lián)的MIT-BIH-AR中相同的一對(duì)。它基于貝葉斯理

27、論,并且其強(qiáng)大的性能已經(jīng)被報(bào)道。正如前面所討論的,因?yàn)閺拿總€(gè)導(dǎo)聯(lián)中得到的數(shù)據(jù)被兩個(gè)獨(dú)立的過(guò)程訓(xùn)練,我們簡(jiǎn)單的假設(shè)他們有相等的先驗(yàn)概率。給定M個(gè)類別和L個(gè)分類器,最終的預(yù)測(cè)類別ym由平均值決定,為其中P(ym|xl)是分類器xl對(duì)于類別ym預(yù)測(cè)的后驗(yàn)概率。在兩個(gè)雙導(dǎo)聯(lián)訓(xùn)練的獨(dú)立的二元分類器上執(zhí)行混合過(guò)程,即M=2,L=2。對(duì)于一個(gè)二元分類器,y1=+1,y2=-1分別表示陽(yáng)性和陰性類。給定一個(gè)未來(lái)的觀察x,x的成對(duì)后驗(yàn)概率P(ym,x),是陽(yáng)性還是陰性類可以由S型函數(shù)計(jì)算得到:其中f(x)是由(1)給定的判定值,表示x到超平面的距離。經(jīng)過(guò)一系列的混合過(guò)程后,可以得到一個(gè)用來(lái)對(duì)多類問(wèn)題做出預(yù)測(cè)的本

28、模型+1,-1。然后應(yīng)用下面的多數(shù)表決規(guī)則其中只計(jì)算從每個(gè)二元分類器中獲得類c的投票數(shù),c=1,.,4(即類N,S,V和F),r=1,.,6.3. 結(jié)果在本文中,我們提出了一個(gè)通過(guò)識(shí)別一個(gè)最優(yōu)特征子集來(lái)提高ECG數(shù)據(jù)心律分類的性能的疾病特異特征選取方法。實(shí)驗(yàn)包括三個(gè)步驟,來(lái)評(píng)估這個(gè)方法。第一,所有的特征根據(jù)通過(guò)(2)計(jì)算得到的F值從大到小進(jìn)行排列。第二,這些排列的特征被喂給DS1的驗(yàn)證模型和參數(shù)搜索程序。為了展現(xiàn)特征選取的作用,沒(méi)有用特征選取,但有相同的一對(duì)一規(guī)則的二級(jí)正則化支持向量機(jī),一級(jí)正則化支持向量機(jī)被作為基線分類器。在所有方法上的每個(gè)一對(duì)一的規(guī)則的支持向量機(jī)的懲罰參數(shù)在坐標(biāo)20,22,

29、.,220中搜索得到,并且由幾何均值和在DS1上的22折交叉驗(yàn)證策略調(diào)整。所提出的方法的最佳參數(shù)列于表4中。有了這些參數(shù),我們建立了2個(gè)評(píng)估實(shí)驗(yàn)。在第一個(gè)實(shí)驗(yàn)中,一系列的最優(yōu)一對(duì)一二元分類器在DS1中被重新訓(xùn)練,然后在DS2中執(zhí)行預(yù)測(cè)和聯(lián)合。使用相同的訓(xùn)練和測(cè)試集來(lái)劃分方案,參考的分類器和本文所提出的方法進(jìn)行了比較,其詳細(xì)混淆矩陣和一對(duì)一的記錄性能比較被列在表5和表6中。在第二個(gè)實(shí)驗(yàn)中,我們運(yùn)行了10次的隨機(jī)劃分而不是固定的劃分方案,以評(píng)估所提出的方法的泛化能力,其結(jié)果如表7所示。4.1 特征評(píng)估為了方便直觀的比較,我們將最小的特征評(píng)分?jǐn)U展到0,最大到1,所以所有的特征評(píng)分被歸一化到0,1范圍

30、中。歸一化并不影響特征的排序。圖3展示了在導(dǎo)聯(lián)A的前20個(gè)F值以及他們?cè)谝粚?duì)一規(guī)則上的相對(duì)應(yīng)的特征指標(biāo)。同時(shí),我們堆起所有的由每個(gè)特征按不同的規(guī)則得到的F值。圖4展示了前20個(gè)F值。由圖可見(jiàn),不同的規(guī)則可以得到不同的特征排序,這正好解釋了特征對(duì)于所關(guān)注的疾病是特定的,并且根據(jù)比較規(guī)則可以轉(zhuǎn)移到其他特征。此外,圖4的特征排名和圖3是不同的。這意味著對(duì)于多類的分類任務(wù),F(xiàn)值只能提供對(duì)特征重要性的粗略評(píng)估。把整體的比較分解成精細(xì)的規(guī)則更適合。從圖4中進(jìn)一步觀察得到導(dǎo)聯(lián)A的排序和導(dǎo)聯(lián)B的排序是不同的,并且除了指標(biāo)46導(dǎo)聯(lián)A上的所有F值都比導(dǎo)聯(lián)B上的高。第46個(gè)特征是基于一個(gè)節(jié)拍和一筆記錄上中間的節(jié)拍的

31、形態(tài)學(xué)距離。該特征對(duì)室性早搏、陣發(fā)性室上性節(jié)拍具有優(yōu)良的辨別力。在MIT-BIH-AR中,導(dǎo)聯(lián)B是靠近心室的胸導(dǎo)聯(lián),所以這一特征有助于識(shí)別室性異位搏動(dòng),圖3(h)(N vs. V)和圖3(j)(S vs,F)上它的得分比其他特征的得分高。其他在導(dǎo)聯(lián)B上低的F值可能是因?yàn)樾盘?hào)在該通道上的變化所致,通常是V1,有時(shí)也有可能是V2,V4或者V5。此后,我們主要關(guān)注于導(dǎo)聯(lián)A上的特征排序分析,因?yàn)閷?dǎo)聯(lián)B上的F值相對(duì)較低。在所有表2所列的特征中,和RR間期相關(guān)的特征(指標(biāo)1-4)是重要的特征,經(jīng)常排在前20,甚至前10,除了在導(dǎo)聯(lián)A上的N vs. F規(guī)則之外。這符合在7中特征選擇的結(jié)果,其中四個(gè)與RR間期

32、相關(guān)的特征從39個(gè)特征中被選出來(lái)。另外,如圖3(a)所示,與P波相關(guān)的特征(P波正區(qū),P波段,PR間期,PP間期以及P波的形態(tài),在40,6,9,5以及15-18各項(xiàng)指標(biāo)中)以及與ST相關(guān)的特征(QT間期,T波段,T波的正區(qū)和負(fù)區(qū),在10,8,44以及45各項(xiàng)指標(biāo)中)對(duì)于從?;蚴ё铚墓?jié)拍中鑒別出室上性異位搏動(dòng)是很重要的。值得注意的是圖3(a),(b)和(f)P波的正區(qū)(40)與P波段(6)以及PR間期(9)相關(guān),這些特征的排列是相近的。該現(xiàn)象歸因于生理事實(shí),即寬的P波會(huì)導(dǎo)致短的PR間期,反之亦然。相似的,在圖3(c)-(e)中,第九個(gè)樣本(29)的QRS的形態(tài)與QRS波群的負(fù)區(qū)(43)相關(guān)。

33、 這是因?yàn)镼RS波群的負(fù)區(qū)主要由S波的波谷決定,如圖2所示。從降維的角度來(lái)看,這些特征共同存在的冗余并不可取。利用功能之間的相互信息,可以移除多余的特征??墒牵诒疚闹?,我們的目標(biāo)是找到最佳的特征來(lái)改善心律分類而不是得到最低的可能的維度。事實(shí)上,多余的特征可補(bǔ)償在劃定階段引入的錯(cuò)誤,并且提高分類器的穩(wěn)定性。表4.用幾何均值標(biāo)準(zhǔn)搜索得到的參數(shù)。a 在一個(gè)“1類對(duì)2類”的二元分類器中,我們將1類視為陽(yáng)性類,2類視為陰性類。4.2. 對(duì)DS1/DS2的分類評(píng)估在這個(gè)小節(jié)中,采用文獻(xiàn)6中運(yùn)用的記錄分類來(lái)將所提出的方法與其他參考方法相比較。一級(jí)正規(guī)化支持向量機(jī)與二級(jí)正規(guī)化支持向量機(jī)都運(yùn)用于所有的特征上。

34、他們的懲罰因子C在DS1中通過(guò)留下一個(gè)的交叉驗(yàn)證策略進(jìn)行調(diào)整,并且運(yùn)用如3.4部分所述的相同的坐標(biāo)搜索模式。其結(jié)果由Llamedo等人先報(bào)道了,并且在表5中作為比較的基線。采用AAMI的意見(jiàn),多類分類器的結(jié)果采用混淆矩陣來(lái)說(shuō)明分類器的性能和錯(cuò)誤分類樣本的詳細(xì)分布來(lái)評(píng)估。基于混淆矩陣,分類的性能測(cè)量依據(jù)分類敏感度Sec和陽(yáng)性分類預(yù)測(cè)值(即和C類),這已經(jīng)在7中詳細(xì)闡明了,并且通過(guò)不同的數(shù)據(jù)庫(kù)和分類器來(lái)檢測(cè)患者間的分類性能。此外,表6中給出在DS2上一對(duì)一記錄的分類性能以作參考。表5中的結(jié)果表明我們的方法優(yōu)于Llamedo等人的方法中的13個(gè)指標(biāo)中的10個(gè)指標(biāo)。文獻(xiàn)7在其他三個(gè)指標(biāo)上有更好的結(jié)果。

35、與沒(méi)有特征選取的一級(jí)和二級(jí)支持向量機(jī)方法相比,我們的方法明顯地改善了分類性能并且在其他指標(biāo)上也表現(xiàn)的更好。這些發(fā)現(xiàn)表明本文所提出的特征選取方法能夠?qū)Ψ诸愋阅茏龀龇e極貢獻(xiàn)。表5.用參考分類器和本文所提出的分類器在DS2中對(duì)MIT-BIH-AR的分類性能。1.在每一指標(biāo)列中,加粗的指標(biāo)代表在四種方法中最好的。另一方面,從得到的混合矩陣和與同樣采用了特征選取的Llamedo等人所提出的方法的比較中可以明顯看出,本文所提出的方法損失了S的陽(yáng)性率和F的靈敏度。第一,多類分類的數(shù)目從”SN”是359,比Llamedo等人的工作發(fā)現(xiàn)來(lái)得大。這可能歸因于N對(duì)S的二類分類器在導(dǎo)聯(lián)A上表現(xiàn)不佳。如表4所示,S類的

36、靈敏度是87.98%低于其他的靈敏度。靈敏度的損失可能是因?yàn)椴黄胶獾挠?xùn)練數(shù)據(jù)。此外,因?yàn)镾類是MIT-BIH標(biāo)簽6個(gè)類的混合,進(jìn)一步分解S類成若干子類可能需要訓(xùn)練相關(guān)的分類器。對(duì)于F類,只有414心跳,分配在DS1中的10筆數(shù)據(jù)上。數(shù)據(jù)的數(shù)量不夠用來(lái)訓(xùn)練一個(gè)患者間的分類器。按照N類的陽(yáng)性預(yù)測(cè)值,其結(jié)果表明我們的方法只比Ref的方法低0.49%,這是因?yàn)椤癝N”的錯(cuò)誤心跳分類。臨床實(shí)踐上,N類的陽(yáng)性預(yù)測(cè)值比N類的靈敏度重要,因?yàn)閷⒁粋€(gè)患者誤診為一個(gè)健康的人可能會(huì)延誤治療,加重病情。所以,醫(yī)生通常試圖實(shí)現(xiàn)這兩者之間的權(quán)衡。我們通常希望得到在高危異位心跳上更高的靈敏度,可是這可能導(dǎo)致在N類上的較低的

37、陽(yáng)性預(yù)測(cè)值。所以我們必須在追求S和N類的高靈敏度的同時(shí),保持一個(gè)合理的陽(yáng)性率。從這個(gè)角度出發(fā),本文提出的方法在計(jì)算機(jī)輔助異位心跳辨識(shí)更合適。表6顯示了通過(guò)記錄DS2的詳細(xì)性能,結(jié)果演示遵照AAMI的建議。該表格提供了每個(gè)記錄在每個(gè)類上的損失的深入理解。如表6所示,232和222記錄上集中的例子多數(shù)為室上性類。雖然232上的結(jié)果比較高,222上的結(jié)果比較差并且這些缺點(diǎn)降低了S類的整體表現(xiàn)。232和222記錄間的差別也表明了個(gè)體間的差異性會(huì)影響心律的分類性能,所以應(yīng)該考慮使用患者特異分類方法來(lái)改善性能。表6.所提出的方法在DS2中對(duì)每一個(gè)MIT-BIH-AR數(shù)據(jù)集的表現(xiàn)性能。表7.一級(jí),二級(jí)正規(guī)化支持向量機(jī)和我們的方法的分類性能比較。4.3. 對(duì)隨機(jī)分配的評(píng)估為了對(duì)泛化能力進(jìn)行評(píng)估,我們將所有的44筆記錄隨機(jī)分配成兩個(gè)組,一組用來(lái)訓(xùn)練另一組用來(lái)測(cè)試。我們重復(fù)分配了10次,對(duì)表7中的平均值,靈敏度和準(zhǔn)確度的幾何均值的標(biāo)準(zhǔn)偏差取和。具有0.05個(gè)顯著性水平的配對(duì)t檢驗(yàn)也被用來(lái)評(píng)估幾何均值和由一級(jí)正規(guī)化,二級(jí)正規(guī)化的支持向量機(jī)得到的準(zhǔn)確度是否存在差別,并且所提出的方法有統(tǒng)計(jì)學(xué)意義。這里,如果一個(gè)P波值小于0.05則表示差異顯著,并且P波值越小,差異越大。由表7中的結(jié)果總結(jié)可以看出,將一級(jí)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論