Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第1頁
Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第2頁
Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第3頁
Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第4頁
Heartbeatclassificationusingdisease-specificfeatureselection外文翻譯_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、使用疾病特異特征選取分類心跳類型摘要自動分類心跳類型是協(xié)助醫(yī)生找出在長期的動態(tài)心電圖記錄中異常的心跳的重要手段。在本文中,我們介紹了一種新的疾病特異特征選取的方法,它由一個一對一的特征排名階段和一個包含在同一個一對一的支持向量機(jī)的二類分類器中的特征搜索階段組成。 本文提出的方法與傳統(tǒng)方法的不同之處在于它的重點是對有效的特征子集的選擇,從而能通過一對一的對比從其他分類器中挑選出一個分類器。從MIT-BIH心律失常數(shù)據(jù)庫中得到的心電圖被用來評估本文所提出的特征選取方法。所采用的心電圖特征包括跨節(jié)拍內(nèi)和逐次心跳間期,振幅形態(tài),面積形態(tài)和形貌上的距離。 采取美國醫(yī)療儀器促進(jìn)協(xié)會(AAMI)提出的建議,

2、MIT-BIH-AR的所有心率樣本分為四類,即: 正常搏動或束支傳導(dǎo)阻滯(N),室上性早搏(S),室性早搏(V)和心室融合心跳(F)。 訓(xùn)練和測試數(shù)據(jù)的劃分遵守個體間的圖示。 實驗結(jié)果表明,所提出的特征選取方法的的平均分類精度是86.66,勝過那些無特征選擇的方法。對N,S,V和F分類的靈敏度分別是88.94,79.06,85.48和93.81,相應(yīng)的陽性預(yù)測值分別為98.98,35.98,92.75和13.74。 在靈敏度和陽性預(yù)測值的算術(shù)平均值方面,所提出的方法也有比其他的最先進(jìn)的特征選擇方法更好的性能。1.簡介心電圖(ECG)是一個無創(chuàng),廉價且相當(dāng)成熟的診斷工具。它含有基本的生理信號,被

3、廣泛得用于分析心臟功能。然而,對于長期的心電圖記錄的分析,逐拍的手動檢查既乏味又耗時,尤其是對于床邊監(jiān)護(hù)或可穿戴式在線醫(yī)療監(jiān)護(hù),其中實時診斷對初級醫(yī)生來說是一項艱巨的任務(wù)。因此,臨床醫(yī)生通常采用計算機(jī)輔助方法來分析和解釋ECG信號。在臨界條件下,心律失??梢员环殖蓛煞N類型,即致命的和非致命的。致命的心律失常可能引發(fā)心臟驟停而突然死亡,如心室顫動和心動過速?;颊咴谶@種情況下,需要緊急治療。雖然非致命的心律失??赡懿粫⒓磳?dǎo)致心臟衰竭,但是仍然需要及時的治療,以避免病情進(jìn)一步惡化。在某些情況下,心律失常只會偶爾發(fā)生在患者的日常生活中。為了捕捉到這些稀少的信號,通常采用動態(tài)心電圖裝置來記錄長期的心電

4、數(shù)據(jù)。因此,從大量的ECG數(shù)據(jù)中自動識別出異常的心跳是一個既重要又必要的任務(wù)。第一類型的心律失常已經(jīng)被詳細(xì)的研究過了,并且一些檢測算法已經(jīng)被開發(fā)和實施在自動體外除顫器(AED)。識別第二類的異位搏動檢測是關(guān)鍵的一步。在這項研究中,我們只專注于非致命的心律失常研究以及相關(guān)的異位搏動檢測。 在過去的幾十年里,大量的研究一直致力于心跳類型自動分類。該工作可被分為兩種分類模式,即 “內(nèi)患者” 和“跨患者”或者也分別被稱為 “面向類的” 和 “面向主題的”。內(nèi)患者模式僅根據(jù)節(jié)拍標(biāo)簽劃分整個數(shù)據(jù)集為訓(xùn)練和測試子集,其中部分的心電圖上的記錄可能同時出現(xiàn)在兩個數(shù)據(jù)子集上。通過這樣的方案,分類通常會產(chǎn)生過于樂觀

5、的結(jié)果。在臨床實踐中,由于的個體間差異會導(dǎo)致分類性能的下降。 為了適應(yīng)實際的情況中,de Chazal等人建議當(dāng)訓(xùn)練和測試的子集是從不同的心電圖記錄中構(gòu)造得到時,將會把個體間的差異考慮在內(nèi),并且分類器將會呈現(xiàn)較好的泛化能力。這種模式已經(jīng)被采納并用來評估對MIT-BIH心律失常數(shù)據(jù)集的分類性能。此外,一個被稱為“患者特異性”的混合模式也被de Chazal等人提出,其中,先訓(xùn)練一個全局分類器,然后再用一個本地分類來調(diào)整全局分類器。據(jù)文獻(xiàn)指出,這種方法優(yōu)于那些純粹由患者間的分類實現(xiàn)的分類器。Ince等人受這種模式的啟發(fā),提出了“患者特異性”神經(jīng)網(wǎng)絡(luò),其中訓(xùn)練數(shù)據(jù)由兩部分組成:()從訓(xùn)練記錄中隨機(jī)選

6、出的共同的具有代表性的節(jié)拍以及()從每個記錄的前5分鐘取出的患者特異性節(jié)拍。此外,Wiens等人采用了一種主動學(xué)習(xí)的方法來檢測室性早搏和室上性異位早搏。另外,Llamedo等人研究發(fā)現(xiàn),當(dāng)專家們能有效的改進(jìn)在主動學(xué)習(xí)中的迭代步驟時,性能將得到許多改善。大多數(shù)研究參考美國醫(yī)療儀器促進(jìn)協(xié)會(AAMI)的意見,對心律指定使用5個標(biāo)簽,分別是正常搏動或束支傳導(dǎo)阻滯(N),室上性早搏(S),室性早搏(V)和心室融合心跳(F),以及不能被分類的心律(Q)的。這一建議使得各心律之間能進(jìn)行公平的比較分類。 考慮到通常用心電圖的特征來分類,被最廣泛使用的是RR間隔周圍的特征,例如前一筆RR間期,后一筆RR間期,

7、當(dāng)下的RR間期,平均的RR間期和其它基于RR間期的特征。其他的時域特征,包括PP間期,P波持續(xù)時間,QRS寬度,PR間期,T波間期和QT間期。此外,ECG樣本在P波,QRS波群和T波上的 “形態(tài)學(xué)”特征以及節(jié)拍和平均節(jié)拍之間的形態(tài)的距離也已經(jīng)被采用。這些特征已經(jīng)用于臨床上的研究,相關(guān)的診斷標(biāo)準(zhǔn)也已被規(guī)定。 雖然基于向量圖(VCG)的特征可以提供有關(guān)心臟疾病的全面信息,但是VCG的重建需要更多的信息,因此這些特征的應(yīng)用是相當(dāng)有限的。此外,頻域上的特征分析還可以用來深入了解ECG信號。信號處理方法包括小波分解(WT),主成分分析(PCA),獨立成分分析(ICA)。 雖然這些功能都具有明確的數(shù)學(xué)相關(guān)

8、解釋,但是他們沒有可以讓醫(yī)生以直觀的方式來理解的生理意義。 因此,從大量的特征中選擇最相關(guān)的特征來改善分類的性能群眾是一個極大的挑戰(zhàn)。Llamedo等人采用一種順序浮動特征選擇(SFFS)算法以增強(qiáng)貝葉斯分類器。他們試圖為所有的子分類器尋找一個最佳的特征子集??墒牵谂R床實踐中,不同的疾病所參考的特征不同。通過對特征的分析,臨床醫(yī)生可以把一種疾病從其他疾病中分別出來,或者把有疾病的狀態(tài)和健康的狀態(tài)區(qū)別開來?;谶@個想法,我們試圖提出一個新穎的“疾病特異”特征選取方法并且用它來增強(qiáng)心律分類器的性能。為了評估這種方法,我們采用了患者間分類模式來保證更好的泛華能力,并且關(guān)注于四個在臨床上已經(jīng)被較全面

9、的研究過了的種類,N,S,V和F。所呈現(xiàn)的測試結(jié)果采用了美國醫(yī)療儀器促進(jìn)協(xié)會的建議。2. ECG 數(shù)據(jù)在本文的研究中,用MIT-BIH心律失常數(shù)據(jù)集來訓(xùn)練以及測試分類器。該數(shù)據(jù)集包括了從47個被試者(201和202記錄采自從同一個被試者中)中得到的48筆雙導(dǎo)聯(lián)記錄,每一筆記錄長約30分鐘,采樣率都為360Hz。在48筆記錄中,23筆(“100系列”)從日常的非固定的訓(xùn)練中得到,從在23筆100系列中沒有被很好的呈現(xiàn)出來的,不平常的但在臨床上是非常重要的心律失常案例中提取出剩余的25筆(“200系列”)。ECG的導(dǎo)聯(lián)隨被試者的改變而改變,取決于電極放置的物理位置。對于大多數(shù)的記錄來說,第一個通道

10、是一個改進(jìn)的第二肢導(dǎo)聯(lián)(MLII)(只有114記錄使用V5來當(dāng)做第一導(dǎo)聯(lián),用MLII當(dāng)做第二導(dǎo)聯(lián);在這篇論文中我們交換了導(dǎo)聯(lián))。第二個通道通常是V1(有時是V2,V4或者V5,取決于被試者)。該數(shù)據(jù)庫包含了QRS位置和節(jié)拍種類的信息注釋,至少被兩個專家驗證過。為了保證對相關(guān)文獻(xiàn)有一個公平的比較,并且遵守AAMI的意見,我們放棄了四筆有步調(diào)節(jié)拍的記錄,即102,104,107以及217。另外,所有的原始心律標(biāo)簽同AAMI的標(biāo)簽相對應(yīng),對應(yīng)規(guī)則如表1所示。同時,我們也采用了文獻(xiàn)6中所采用的劃分計劃訓(xùn)練集(DS1)和訓(xùn)練集(DS2)。請注意我們放棄了AAMI中的Q種類(未被分類且有節(jié)奏的心跳),因為

11、這種類型在MIT-BIH-AR中比較少。DS1和DS2中的數(shù)據(jù)集的數(shù)量按類型列在表1中。表1.數(shù)據(jù)集DS1和DS2的大小以及他們在AAMI和MIT-BIH-AR標(biāo)簽中的映射。a DS1中的記錄: 101, 106, 108, 109, 112, 114, 115, 116, 118, 119, 122, 124, 201, 203, 205, 207, 208, 209, 215, 220, 223, 230.b DS2中的記錄: 100, 103, 105, 111, 113, 117, 121, 123, 200, 202, 210, 212, 213, 214, 219, 221, 22

12、2, 228, 231, 232, 233, 234.3.方法在本文中我們采用了一個四階的分類策略來分析ECG數(shù)據(jù)。如圖1所示,整個分類策略由四個階段組成:信號預(yù)處理,特征提取,特征選取和分類器調(diào)諧。相對于之前文獻(xiàn)中的方法來說,多加了形態(tài)學(xué)和間隔的特征。在本文中P波下的面積,QRS波群和T波也被采用做心臟特征。此外,我們用特征選取階段來決定合適的特征。另外,我們通過將一些被獨立訓(xùn)練的一對一的二類支持向量機(jī)分類器與從兩個導(dǎo)聯(lián)中得到的數(shù)據(jù)相結(jié)合,完善了一個具有增強(qiáng)型泛化能力的混合分類器。Llamedo等人使用同樣的特征子集來分類,與他們的方法不同,我們提出的基于特征排序方法的一對一的分類器更合理。

13、現(xiàn)實的特征選取方法,即獲取最佳的特征子集是具有疾病特異性的,并且只能是二類分類器任務(wù)。這個優(yōu)點將會在3.3部分被詳細(xì)討論。3.1. ECG預(yù)處理自從MIT-BIH-AR資料庫中的ECG信號被動態(tài)心電圖裝置采集到了后,信號被基線漂移,電源線噪聲以及高頻肌電圖干擾所污染。用被文獻(xiàn)6,12所采用的方法,先用一個200-ms寬度的中頻濾波器除掉所有的ECG信號中的P波和QRS波群,再用一個600-ms寬度的中頻濾波器來除掉T波。將得到的信號被視為隨后從原始信號中減去,以產(chǎn)生基線校正的心電圖信號的基線。用一個12序列截止頻率為35Hz的FIR低通濾波器來去除因為電源線和高頻產(chǎn)生的噪聲。最后,濾波后的二導(dǎo)

14、聯(lián)心電信號會被送入下一步進(jìn)行進(jìn)一步的處理。圖1.全自動心律分類過程。3.2 心跳劃分和分割在心跳特征提取之前,由QRS波的位置將ECG的時間序列分割成獨立的心跳。許多方法可以用來定位出QRS波的位置并且檢測出那些基準(zhǔn)點,比如文獻(xiàn)20,21中用到的方法以及文獻(xiàn)22,23中用到的小波算法。本文的目的則是完善一種基于特征選取的心律分類器。為了方便也為了能在波形數(shù)據(jù)庫(WFDB)中更好的操作,我們用包含在MIT-BIH-AR中的QRS的注釋以及工具“ecgpuwave”(一種QRS探測器,波形限制定位器可以從生理網(wǎng)上下載得到。)來檢測基準(zhǔn)點,包括P波的起始點,P波尖峰,P波終點,QRS波群起點,QRS

15、終點,T波起點,T波尖峰以及T波終點。當(dāng)一個心跳節(jié)拍中沒有P波時,該心跳節(jié)拍的起點和終點由下一個QRS波群的起點開始算起。因此,該心跳會有零個P波間期,被縮短的PR間期以及被縮短了的后一個的PP間期。同樣的,當(dāng)心跳中沒有T波時,心跳節(jié)拍的起點和終點由下一個QRS波群的起點開始算起,導(dǎo)致該心跳節(jié)拍會有零個T波間期,以及被縮短了的QT間期。3.3. 特征提取基于檢測出的基準(zhǔn)點,每個節(jié)拍以及每個導(dǎo)聯(lián)的46個的特征都會被本文考慮到,這些特征被列在表2,其具體介紹在圖2.表2.本文用到的特征。圖2.ECG中基于區(qū)域和基于間隔的特征的圖解:充滿+和/符號的區(qū)域分別代表正負(fù)區(qū)。3.3.1. 心搏間期五個心搏

16、間期是指逐次心跳基準(zhǔn)點之間的間隔?;赒RS尖峰點,一共有四個相關(guān)的RR間期。前一筆的RR間期是給定的心跳與前一筆心跳間的RR間期。后一筆的RR間期是給定的心跳與后一個心跳之間的RR間期。10筆局部的平均的RR間期由一個心跳節(jié)拍附近的10個RR間期取均值得到。RR間期的均值指的一筆記錄中的RR間期值,并且該值與在一筆數(shù)據(jù)中的所有心跳的RR間期具相等。最后,基于P波的尖峰點,后一筆的RR間期被定義為給定的心跳的R波尖峰與后一筆心跳的R波尖峰。后一筆的RR間期表征心室周期,后一筆的 PP間期表征心房周期。如圖二所示,后一筆的RR間期,后一筆的PP間期以及心搏間期是相互依賴的。3.3.2 內(nèi)部節(jié)拍間

17、期內(nèi)部節(jié)拍間期被定義為一個在一個心跳上后一個基準(zhǔn)點與前一個基準(zhǔn)點間的間期。本篇論文采用了五個內(nèi)部節(jié)拍間期,如圖2所述,并且他們相關(guān)的基準(zhǔn)點也被列在相應(yīng)的行和圖2的最后一欄。我們用這些間期來當(dāng)做心臟特征,因為他們是眾所周知的,并被廣泛的用于臨床實踐中。3.3.3. 形態(tài)學(xué)振幅本文采用了文獻(xiàn)6中提到的形態(tài)振幅。為了描述ECG的形態(tài),我們通過一個特定的窗口對信號振幅向下采樣了一組數(shù)值。P波的形態(tài)定義為P波的起始點和P波的終點之間的10個采樣點的物理振幅。同樣地,QRS的形態(tài)和ST的形態(tài)分別定義為QRS的起始點和QRS的終點之間的10個采樣點的物理振幅和QRS的起始點和T波的終點之間的9個采樣點的物理

18、振幅.3.3.4. 形態(tài)面積由于形態(tài)學(xué)和間期的特征在自動心率節(jié)拍分類器上的重要性,我們在本文中介紹了一種基于波區(qū)域的特征,為了能當(dāng)對特征選取的性能進(jìn)行評估時將心跳的形態(tài)考慮在內(nèi),并且提高分類器的分類性能。特別地,如圖2所示,很顯然,有些區(qū)域被波的間期,典型的ECG波以及基線所封閉。所以基線以上的區(qū)域的總面積被定義為正區(qū),反之,位于基線以下的區(qū)域被定義為負(fù)區(qū)。用這些測量出來的封閉區(qū)域可以得到6個基于波區(qū)域的特征,即P波,QRS波群,T波的正區(qū)和負(fù)區(qū),共同地代表了波間隔和采樣幅度的綜合特征。3.3.5. 形態(tài)距離盡管個體間的差異,一筆數(shù)據(jù)中正常的ECG通常擁有一個相似的同一個導(dǎo)聯(lián)的心跳形態(tài)距離。為

19、了描述心跳之間的相似性,Wiens 等人提出了一個基于動態(tài)時間規(guī)整的新特征,該特征是給定的節(jié)拍和一筆數(shù)據(jù)的中部的距離。這一特點具有良好的對心室異位、早搏和室上性異位搏動的辨別能力。在本文中,ECG信號心電信號從250毫秒QRS左峰值開始,在QRS的右峰值的380毫秒結(jié)束,其中每個每個節(jié)拍都以50Hz的采樣率分割和下采樣。形態(tài)距離即每個分段和中間分段的動態(tài)時間規(guī)整距離。雖然ecgpuwave是一個用來檢測QRS周期以及定位波形時限的強(qiáng)大工具,但是它仍然不能在有嚴(yán)重噪聲的片段中檢測出基準(zhǔn)點,從而導(dǎo)致錯誤的測量和不正常的特征。所以為了比較這些特征分?jǐn)?shù),必須消除這些異常值。在本文中,我們用了一個基于規(guī)

20、則的程序來識別和過濾異常值。這里,間期特征被限制在一個合理的范圍內(nèi)。任何一個超出這個范圍節(jié)拍都被當(dāng)做異常值。參照心臟的生理功能,在表3中列出的相關(guān)特征的上限和下限被用來限定一個心跳節(jié)拍。注意當(dāng)一個異常心跳從一個導(dǎo)聯(lián)中被移除的時候,為了配合不同的導(dǎo)聯(lián)的節(jié)拍,其他導(dǎo)聯(lián)中的相應(yīng)的節(jié)拍會被手動刪除。異常值的移除過程只在預(yù)處理階段中應(yīng)用于DS1。被移除異常值后的DS1只在特征選取和分類器調(diào)諧中使用。如第4部分所示,在最后的訓(xùn)練和測試過程中,DS1和DS2都是原始心跳并且沒有一個異常值有被移除。此外,為了排序特征必須進(jìn)行歸一化。在本文中,用正切S型函數(shù)對所有特征進(jìn)行歸一化至-1,1范圍。表3.識別心律的特

21、征的上下界。3.4. 帶特征選取的支持向量機(jī)二級正則化支持向量機(jī)因其出色的泛化能力,在本文中被用做心跳節(jié)拍分類器。這種分類器致力于找到一個最佳的超平面,使得兩個不同的類別中有個最大的分類間隔。在這個任務(wù)中,假設(shè)一個訓(xùn)練集有N個樣本(yi,xi),i=1,.,N,其中xiRd,表示d維特征向量中的第i個樣本,yiR,表示相對應(yīng)的類標(biāo)簽,并且yi±1.最優(yōu)超平面由一個從訓(xùn)練集中得到的用來預(yù)測隨后的測試集的類型的決策函數(shù)f(x)表示。通過使用核方法,決策函數(shù)可表示為,(1)其中K(xi,x)是一個能將數(shù)據(jù)映射到一個更高維度的空間上的核函數(shù),而i為每個訓(xùn)練數(shù)據(jù)范例的拉格朗日乘子。線性核函數(shù)因

22、為其在特征選取過程中所表現(xiàn)出的線性解釋能力而被采用。在(1)中,一些i通常等于零,其相應(yīng)的訓(xùn)練數(shù)據(jù)范例被稱為支持向量。與二級正規(guī)化支持向量機(jī)相比,另一種常規(guī)化的支持向量機(jī),也被稱為一級正規(guī)化支持向量機(jī),它的優(yōu)化目標(biāo)是將更多的轉(zhuǎn)為零。這種分類器可被當(dāng)做自然特征選擇法也叫作嵌入式特征選擇法。在本文中,它被用作第四部分中的用來作比較的基線。許多軟件包都可以用來學(xué)習(xí)該決策函數(shù),本文選擇liblinear來當(dāng)做二類分類器的解,因為它具有高效性以及在MATLAB中的友好界面。因為支持向量機(jī)在本質(zhì)上是一個二類分類器,為了將它擴(kuò)展為一個多類分類器,特別是一個四類心律分類器,通常會結(jié)合使用一對多和一對一的方法。

23、如上所述,在心律分類的任務(wù)中,將一種疾病的心電圖特征與另一種疾病的心電圖特征是一個更現(xiàn)實的方法,而且它的分解也會更精細(xì)。因此,用一對一的模式,6個二類分類器被建立用來決定出一個預(yù)測類。此外,我們會證明一對一的模式同樣適用于多類特征選取。眾所周知,特征選取可以提高分類器的泛化能力。為了能提供一個更快更具成本效益的預(yù)測器,同時也為了能更好的理解所處理的數(shù)據(jù),許多方法都能被用來挑選出一個最優(yōu)的特征子集,比如基于封裝器的方法,基于濾波器的方法以及基于嵌入式的方法。在基于封裝器的方法中,分類器被當(dāng)做一個黑盒子,根據(jù)特征的的預(yù)測能力對特征子集進(jìn)行評分。然而在基于濾波器的方法上特征子集的選擇僅僅是一個預(yù)處理

24、步驟,與被選擇的預(yù)測器無關(guān)。對于基于嵌入式的方法,是在訓(xùn)練過程中進(jìn)行變量選擇,并且通常是具體的分類。為了能與支持向量機(jī)綜合,本文采用基于封裝器的方法與支持向量機(jī)相結(jié)合??墒?,基于封裝器的方法伴隨著兩個問題,即長的搜索時間和對支持向量機(jī)預(yù)測器的評估。為了解決第一個問題,我們用F值準(zhǔn)則對特征進(jìn)行排序來加速搜索過程,并且在搜索策略中使用向后消去法。對于后一個問題,先將所有特征根據(jù)其重要性進(jìn)行排序。然后,逐步消除最不重要的特征。特別地,在一個二元分類器中,給定一個訓(xùn)練向量xi,i=1,.,N,陽性和陰性的實例數(shù)量分別為n+和n-,對于第k個特征的F值準(zhǔn)則為其中分別是第k個特征對于整體的平均值,陽性數(shù)據(jù)

25、樣本數(shù),陰性數(shù)據(jù)樣本數(shù),是對于第i個陽性實例和第j個陰性實例的第k個特征。公式中的分子和分母分別代表類間的區(qū)分度和跨類的緊湊度。所以,一個特征的F值越大,它的判別力和重要性可能就越大。從表1中我們看到對于四個類別訓(xùn)練實例的數(shù)量是不平衡的。為了平衡一個二元分類器的靈敏度,我們使用兩個預(yù)測靈敏度的幾何平均值來得到支持向量機(jī)的預(yù)測,即其中Se+和Se-分別是陽性和陰性類別的預(yù)測靈敏度。該度量已被廣泛用于處理不平衡數(shù)據(jù)集,為了將陽性類別和陰性類別的分類的結(jié)果考慮在內(nèi)。對于每個二元分類器,調(diào)整懲罰因子C是必不可少的。本文提出的方法中會介紹一個外加的特征選取階段,用來在后面的特征消除過程中調(diào)整前特征。22

26、折交叉驗證方法被用來調(diào)整DS1中的C和,其中C是在坐標(biāo)20,22,.,220中搜索得到的。有了這些參數(shù),在訓(xùn)練集中一對一的訓(xùn)練過程被重新執(zhí)行來獲得相對應(yīng)的支持向量機(jī)的本模型。這些過程在導(dǎo)聯(lián)上是各自獨立執(zhí)行的。所以,在每個導(dǎo)聯(lián)上都有6個二元分類器,對于兩導(dǎo)聯(lián)的MIT-BIH-AR一共有12個二元分類器。在接下來的小節(jié)中,我們會展示如何融合這些二元分類器并且選出最后的預(yù)測類別。3.5 組合分類器ECG數(shù)據(jù)通常包括多導(dǎo)聯(lián)中的信號,可以被視為對同一心臟活動的不同位置的觀察。整和不同導(dǎo)聯(lián)中的信號可以增強(qiáng)分類的準(zhǔn)確度。在本文中,我們采用乘積規(guī)則來混合兩導(dǎo)聯(lián)的MIT-BIH-AR中相同的一對。它基于貝葉斯理

27、論,并且其強(qiáng)大的性能已經(jīng)被報道。正如前面所討論的,因為從每個導(dǎo)聯(lián)中得到的數(shù)據(jù)被兩個獨立的過程訓(xùn)練,我們簡單的假設(shè)他們有相等的先驗概率。給定M個類別和L個分類器,最終的預(yù)測類別ym由平均值決定,為其中P(ym|xl)是分類器xl對于類別ym預(yù)測的后驗概率。在兩個雙導(dǎo)聯(lián)訓(xùn)練的獨立的二元分類器上執(zhí)行混合過程,即M=2,L=2。對于一個二元分類器,y1=+1,y2=-1分別表示陽性和陰性類。給定一個未來的觀察x,x的成對后驗概率P(ym,x),是陽性還是陰性類可以由S型函數(shù)計算得到:其中f(x)是由(1)給定的判定值,表示x到超平面的距離。經(jīng)過一系列的混合過程后,可以得到一個用來對多類問題做出預(yù)測的本

28、模型+1,-1。然后應(yīng)用下面的多數(shù)表決規(guī)則其中只計算從每個二元分類器中獲得類c的投票數(shù),c=1,.,4(即類N,S,V和F),r=1,.,6.3. 結(jié)果在本文中,我們提出了一個通過識別一個最優(yōu)特征子集來提高ECG數(shù)據(jù)心律分類的性能的疾病特異特征選取方法。實驗包括三個步驟,來評估這個方法。第一,所有的特征根據(jù)通過(2)計算得到的F值從大到小進(jìn)行排列。第二,這些排列的特征被喂給DS1的驗證模型和參數(shù)搜索程序。為了展現(xiàn)特征選取的作用,沒有用特征選取,但有相同的一對一規(guī)則的二級正則化支持向量機(jī),一級正則化支持向量機(jī)被作為基線分類器。在所有方法上的每個一對一的規(guī)則的支持向量機(jī)的懲罰參數(shù)在坐標(biāo)20,22,

29、.,220中搜索得到,并且由幾何均值和在DS1上的22折交叉驗證策略調(diào)整。所提出的方法的最佳參數(shù)列于表4中。有了這些參數(shù),我們建立了2個評估實驗。在第一個實驗中,一系列的最優(yōu)一對一二元分類器在DS1中被重新訓(xùn)練,然后在DS2中執(zhí)行預(yù)測和聯(lián)合。使用相同的訓(xùn)練和測試集來劃分方案,參考的分類器和本文所提出的方法進(jìn)行了比較,其詳細(xì)混淆矩陣和一對一的記錄性能比較被列在表5和表6中。在第二個實驗中,我們運行了10次的隨機(jī)劃分而不是固定的劃分方案,以評估所提出的方法的泛化能力,其結(jié)果如表7所示。4.1 特征評估為了方便直觀的比較,我們將最小的特征評分?jǐn)U展到0,最大到1,所以所有的特征評分被歸一化到0,1范圍

30、中。歸一化并不影響特征的排序。圖3展示了在導(dǎo)聯(lián)A的前20個F值以及他們在一對一規(guī)則上的相對應(yīng)的特征指標(biāo)。同時,我們堆起所有的由每個特征按不同的規(guī)則得到的F值。圖4展示了前20個F值。由圖可見,不同的規(guī)則可以得到不同的特征排序,這正好解釋了特征對于所關(guān)注的疾病是特定的,并且根據(jù)比較規(guī)則可以轉(zhuǎn)移到其他特征。此外,圖4的特征排名和圖3是不同的。這意味著對于多類的分類任務(wù),F(xiàn)值只能提供對特征重要性的粗略評估。把整體的比較分解成精細(xì)的規(guī)則更適合。從圖4中進(jìn)一步觀察得到導(dǎo)聯(lián)A的排序和導(dǎo)聯(lián)B的排序是不同的,并且除了指標(biāo)46導(dǎo)聯(lián)A上的所有F值都比導(dǎo)聯(lián)B上的高。第46個特征是基于一個節(jié)拍和一筆記錄上中間的節(jié)拍的

31、形態(tài)學(xué)距離。該特征對室性早搏、陣發(fā)性室上性節(jié)拍具有優(yōu)良的辨別力。在MIT-BIH-AR中,導(dǎo)聯(lián)B是靠近心室的胸導(dǎo)聯(lián),所以這一特征有助于識別室性異位搏動,圖3(h)(N vs. V)和圖3(j)(S vs,F)上它的得分比其他特征的得分高。其他在導(dǎo)聯(lián)B上低的F值可能是因為信號在該通道上的變化所致,通常是V1,有時也有可能是V2,V4或者V5。此后,我們主要關(guān)注于導(dǎo)聯(lián)A上的特征排序分析,因為導(dǎo)聯(lián)B上的F值相對較低。在所有表2所列的特征中,和RR間期相關(guān)的特征(指標(biāo)1-4)是重要的特征,經(jīng)常排在前20,甚至前10,除了在導(dǎo)聯(lián)A上的N vs. F規(guī)則之外。這符合在7中特征選擇的結(jié)果,其中四個與RR間期

32、相關(guān)的特征從39個特征中被選出來。另外,如圖3(a)所示,與P波相關(guān)的特征(P波正區(qū),P波段,PR間期,PP間期以及P波的形態(tài),在40,6,9,5以及15-18各項指標(biāo)中)以及與ST相關(guān)的特征(QT間期,T波段,T波的正區(qū)和負(fù)區(qū),在10,8,44以及45各項指標(biāo)中)對于從?;蚴ё铚墓?jié)拍中鑒別出室上性異位搏動是很重要的。值得注意的是圖3(a),(b)和(f)P波的正區(qū)(40)與P波段(6)以及PR間期(9)相關(guān),這些特征的排列是相近的。該現(xiàn)象歸因于生理事實,即寬的P波會導(dǎo)致短的PR間期,反之亦然。相似的,在圖3(c)-(e)中,第九個樣本(29)的QRS的形態(tài)與QRS波群的負(fù)區(qū)(43)相關(guān)。

33、 這是因為QRS波群的負(fù)區(qū)主要由S波的波谷決定,如圖2所示。從降維的角度來看,這些特征共同存在的冗余并不可取。利用功能之間的相互信息,可以移除多余的特征。可是,在本文中,我們的目標(biāo)是找到最佳的特征來改善心律分類而不是得到最低的可能的維度。事實上,多余的特征可補(bǔ)償在劃定階段引入的錯誤,并且提高分類器的穩(wěn)定性。表4.用幾何均值標(biāo)準(zhǔn)搜索得到的參數(shù)。a 在一個“1類對2類”的二元分類器中,我們將1類視為陽性類,2類視為陰性類。4.2. 對DS1/DS2的分類評估在這個小節(jié)中,采用文獻(xiàn)6中運用的記錄分類來將所提出的方法與其他參考方法相比較。一級正規(guī)化支持向量機(jī)與二級正規(guī)化支持向量機(jī)都運用于所有的特征上。

34、他們的懲罰因子C在DS1中通過留下一個的交叉驗證策略進(jìn)行調(diào)整,并且運用如3.4部分所述的相同的坐標(biāo)搜索模式。其結(jié)果由Llamedo等人先報道了,并且在表5中作為比較的基線。采用AAMI的意見,多類分類器的結(jié)果采用混淆矩陣來說明分類器的性能和錯誤分類樣本的詳細(xì)分布來評估?;诨煜仃?,分類的性能測量依據(jù)分類敏感度Sec和陽性分類預(yù)測值(即和C類),這已經(jīng)在7中詳細(xì)闡明了,并且通過不同的數(shù)據(jù)庫和分類器來檢測患者間的分類性能。此外,表6中給出在DS2上一對一記錄的分類性能以作參考。表5中的結(jié)果表明我們的方法優(yōu)于Llamedo等人的方法中的13個指標(biāo)中的10個指標(biāo)。文獻(xiàn)7在其他三個指標(biāo)上有更好的結(jié)果。

35、與沒有特征選取的一級和二級支持向量機(jī)方法相比,我們的方法明顯地改善了分類性能并且在其他指標(biāo)上也表現(xiàn)的更好。這些發(fā)現(xiàn)表明本文所提出的特征選取方法能夠?qū)Ψ诸愋阅茏龀龇e極貢獻(xiàn)。表5.用參考分類器和本文所提出的分類器在DS2中對MIT-BIH-AR的分類性能。1.在每一指標(biāo)列中,加粗的指標(biāo)代表在四種方法中最好的。另一方面,從得到的混合矩陣和與同樣采用了特征選取的Llamedo等人所提出的方法的比較中可以明顯看出,本文所提出的方法損失了S的陽性率和F的靈敏度。第一,多類分類的數(shù)目從”SN”是359,比Llamedo等人的工作發(fā)現(xiàn)來得大。這可能歸因于N對S的二類分類器在導(dǎo)聯(lián)A上表現(xiàn)不佳。如表4所示,S類的

36、靈敏度是87.98%低于其他的靈敏度。靈敏度的損失可能是因為不平衡的訓(xùn)練數(shù)據(jù)。此外,因為S類是MIT-BIH標(biāo)簽6個類的混合,進(jìn)一步分解S類成若干子類可能需要訓(xùn)練相關(guān)的分類器。對于F類,只有414心跳,分配在DS1中的10筆數(shù)據(jù)上。數(shù)據(jù)的數(shù)量不夠用來訓(xùn)練一個患者間的分類器。按照N類的陽性預(yù)測值,其結(jié)果表明我們的方法只比Ref的方法低0.49%,這是因為“SN”的錯誤心跳分類。臨床實踐上,N類的陽性預(yù)測值比N類的靈敏度重要,因為將一個患者誤診為一個健康的人可能會延誤治療,加重病情。所以,醫(yī)生通常試圖實現(xiàn)這兩者之間的權(quán)衡。我們通常希望得到在高危異位心跳上更高的靈敏度,可是這可能導(dǎo)致在N類上的較低的

37、陽性預(yù)測值。所以我們必須在追求S和N類的高靈敏度的同時,保持一個合理的陽性率。從這個角度出發(fā),本文提出的方法在計算機(jī)輔助異位心跳辨識更合適。表6顯示了通過記錄DS2的詳細(xì)性能,結(jié)果演示遵照AAMI的建議。該表格提供了每個記錄在每個類上的損失的深入理解。如表6所示,232和222記錄上集中的例子多數(shù)為室上性類。雖然232上的結(jié)果比較高,222上的結(jié)果比較差并且這些缺點降低了S類的整體表現(xiàn)。232和222記錄間的差別也表明了個體間的差異性會影響心律的分類性能,所以應(yīng)該考慮使用患者特異分類方法來改善性能。表6.所提出的方法在DS2中對每一個MIT-BIH-AR數(shù)據(jù)集的表現(xiàn)性能。表7.一級,二級正規(guī)化支持向量機(jī)和我們的方法的分類性能比較。4.3. 對隨機(jī)分配的評估為了對泛化能力進(jìn)行評估,我們將所有的44筆記錄隨機(jī)分配成兩個組,一組用來訓(xùn)練另一組用來測試。我們重復(fù)分配了10次,對表7中的平均值,靈敏度和準(zhǔn)確度的幾何均值的標(biāo)準(zhǔn)偏差取和。具有0.05個顯著性水平的配對t檢驗也被用來評估幾何均值和由一級正規(guī)化,二級正規(guī)化的支持向量機(jī)得到的準(zhǔn)確度是否存在差別,并且所提出的方法有統(tǒng)計學(xué)意義。這里,如果一個P波值小于0.05則表示差異顯著,并且P波值越小,差異越大。由表7中的結(jié)果總結(jié)可以看出,將一級

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論