ccml改進(jìn)多支持向量機遞歸特征消除在癌癥分類中應(yīng)用_第1頁
ccml改進(jìn)多支持向量機遞歸特征消除在癌癥分類中應(yīng)用_第2頁
ccml改進(jìn)多支持向量機遞歸特征消除在癌癥分類中應(yīng)用_第3頁
ccml改進(jìn)多支持向量機遞歸特征消除在癌癥分類中應(yīng)用_第4頁
ccml改進(jìn)多支持向量機遞歸特征消除在癌癥分類中應(yīng)用_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

SVM-RFE特征選擇算法改進(jìn)的多類特征選擇算法實驗設(shè)計與實驗結(jié)果總結(jié)主要內(nèi)容2支持向量機3SVM-RFE特征選擇算法支持向量機通過引入拉格朗日乘子,可以將SVM的優(yōu)化問題轉(zhuǎn)變?yōu)橐韵碌膶ε家?guī)劃問題:SVM-RFE特征選擇算法min2Ni

j

i

j

i

jiNsubject

toi

1

j

1

i

11

N

N

yiii

1

0,0

i

C,i

1,

2,...,

N

y

y

(

x

x

)

(2)4(3)(4)SVM-RFE特征選擇算法SVM-RFE特征選擇算法5多類SVM-RFE特征選擇算法目前已經(jīng)提出兩種多類SVM-RFE特征選擇算法。MSVM-RFEMSVM-RFE-KERNEL這兩種算法采用線性核時是等價的。MSVM-RFE算法先用一對一的策略把多類問題分解為多個兩類問題,每個兩類問題用一個SVM-RFE來進(jìn)行特征選擇。利用多個SVM-RFE獲得多個排序準(zhǔn)則分?jǐn)?shù),然后把多個排序準(zhǔn)則分?jǐn)?shù)相加后得到排序準(zhǔn)則總分,以此來作為特征剔除的依據(jù),每次迭代消去總分最小的特征,直至所有特征被刪除。MSVM-RFE的具體算法見算法2.6SVM-RFE特征選擇算法多類SVM-RFE特征選擇算法SVM-RFE特征選擇算法7改進(jìn)的多類特征選擇算法(MMSVM-RFE)問題:上述的多類SVM-RFE特征選擇方法考慮的是所有子學(xué)習(xí)機的權(quán)重融合,忽略了各子學(xué)習(xí)機自身挑選特征的能力。改進(jìn):利用一對一的策略把多類問題分解了多個兩類問題。每個兩類問題采用一個SVM-RFE方法逐漸剔除掉冗余特征,得到一個特征子集;最后將所有特征子集合并得到最終的特征子集。改進(jìn)的多類特征選擇算法X1X

2F1F22FX

Fl(l-1)2Fl(l-1)X

l(l-1)

28改進(jìn)的多類特征選擇算法改進(jìn)的多類特征選擇算法(MMSVM-RFE)

j

l

l

12ji

i1

j

12

j

l

3l

1

lN

Ni1N

Ni1N

Ni1X, 當(dāng)vi

1時,yi

1;當(dāng)vi

j

1,yi

1,j

1,,l1, 當(dāng)vi

2時,yi

1;當(dāng)vi

j

l

3,yi

1,j

l,,2l

3,當(dāng)vi

l

1時,yi

1;當(dāng)vi

l,yi

1,xi

,

yixi

,

yi

x

,

y9改進(jìn)的多類特征選擇算法改進(jìn)的多類特征選擇算法(MMSVM-RFE)X1X

2F1F22FX

Fl(l-1)2Fl(l-1)X

l(l-1)

21改進(jìn)的多類特征選擇算法改進(jìn)的多類特征選擇算法(MMSVM-RFE)11數(shù)據(jù)集類別基因數(shù)#訓(xùn)練樣本#測試樣本CNS

tumors5

(M/

CRE/

MG/N/

S)98921(5/5/5/2/4)21(5/5/5/2/4)Leukemia3

(ALL/

MLL/

AML)99920(10/4/6)18(9/4/6)Lung

cancer4

(AD/

NL/

SQ/

COID)1000100(70/9/11/10)97(69/8/10/10)12數(shù)據(jù)集描述我們采用了三個多類基因數(shù)據(jù)集:CNS

tumors,Leukemia和Lung

cancer。數(shù)據(jù)集的詳細(xì)信息實驗設(shè)計與實驗結(jié)果對比實驗:MMSVM-RFEVS.

MSVM-RFE實驗設(shè)計與實驗結(jié)果13對比實驗:MMSVM-RFE

VS.

MSVM-RFE下面是在三個基因數(shù)據(jù)集上的平均精度對比圖.實驗設(shè)計與實驗結(jié)果050

100

150200

250

0.40.50.60.70.80.91Gene

Num

berAverage

accuracyMMS

VM-

RFE

MSVM-R

FE050

100

150

2000.65

0.70.75

0.80.85

0.90.95

1Gene

Num

ber

Average

accuracyMMSVM-

RFE

MSVM-RFE50

1502002500.7250

0100Gene

Num

ber0.750.80.850.90.951Average

accuracyMMSVM-

RFEMSVM-R

FE(a)CNS

tumors14(b)

Leukemia(c)Lung

cancer實驗設(shè)計與實驗結(jié)果15(a)CNS

tumorMSVM-RFEMMSVM-RFEBest

number

of

selectedgenes14798Average

accuracy

(%)90.48±7.1092.38±6.02Average

accuracy

of

classM

(%)100.00±0.00100.00±0.00Average

accuracy

of

classCRE(%)94.00±9.6692.00±10.33Average

accuracy

of

class

MG

(%)98.00±6.3298.00±6.32Average

accuracy

of

class

N

(%)85.00±24.1595.00±15.81Average

accuracy

of

classS(%)67.50±33.4475.00±31.18對比實驗:MMSVM-RFEVS.

MSVM-RFE(b)

LeukemiaMSVM-RFEMMSVM-RFEBest

number

of

selected

genes143185Average

accuracy

(%)97.78±2.2299.44±0.56Average

accuracy

of

class

ALL

(%)97.78±4.68100.00±0.00Average

accuracy

of

class

MLL

(%)100.00±0.00100.00±0.00Average

accuracy

of

class

AML

(%)96.00±8.4398.00±6.32(c)Lung

cancerMSVM-RFEMMSVM-RFEBest

number

of

selected

genes242160Average

accuracy

(%)96.08±0.9596.29±1.00Average

accuracy

of

class

AD

(%)97.39±1.1497.54±1.53Average

accuracy

of

class

NL

(%)91.25±11.8691.25±8.44Average

accuracy

of

class

SQ

(%)87.00±9.4988.00±8.50Average

accuracy

of

class

COID

(%)100.00±0.00100.00±0.00實驗設(shè)計與實驗結(jié)果對比實驗:SVM

VS.

K近鄰

VS.

隨機森林將本文方法特征提取后的結(jié)果采用K近鄰和隨機森林等分類器進(jìn)行實驗1實驗設(shè)計與實驗結(jié)果(a)CNS

tumors(b)

Leukemia(c)Lung

cancer050

1502000.55100Gene

Num

ber0.60.650.70.750.80.850.90.95Average

accuracyMMSVM-KNNMMSVM-R

F

MMSVM-R

FE250

050

100

150200250

0.70.75

0.80.85

0.90.95

1Gene

Num

ber

Average

accuracyMMSVM-KNN

MMSVM-R

F

MMSVM-R

FE050

150200250

0.87

100

Gene

Num

ber0.88

0.89

0.90.91

0.92

0.93

0.94

0.95

0.96

0.97

Average

accuracyMMSVM-

KNN

MMSVM-

RFMMSVM-

RFE對比實驗:SVM

VS.

K近鄰

VS.

隨機森林下面是在三個分類器上的平均精度對比.17實驗設(shè)計與實驗結(jié)果對比實驗:MMSVM-RFE

VS.

PCA將本文MMSVM-RFE特征選擇算法與經(jīng)典的降維算法——主成分分析算法(principle

component

analysis,PCA)進(jìn)行對比1實驗設(shè)計與實驗結(jié)果19對比實驗:MMSVM-RFEVS.

PCA(a)CNS

tumorMMSVM-RFEPCABest

number

of

selectedgenes9898Average

accuracy

(%)92.38±6.0291.43±5.85Average

accuracy

of

classM

(%)100.00±0.00100.00±0.00Average

accuracy

of

classCRE(%)92.00±10.3392.00±10.33Average

accuracy

of

class

MG

(%)98.00±6.3298.00±6.32Average

accuracy

of

class

N

(%)95.00±15.8185.00±24.15Average

accuracy

of

classS(%)75.00±31.1862.50±31.18(b)

LeukemiaMMSVM-RFEPCABest

number

of

selected

genes185185Average

accuracy

(%)99.44±0.5698.89±5.85Average

accuracy

of

class

ALL

(%)100.00±0.0097.78±4.68Average

accuracy

of

class

MLL

(%)100.00±0.00100.00±0.00Average

accuracy

of

class

AML

(%)98.00±6.32100.00±0.00(c)Lung

cancerMMSVM-RFEPCABest

number

of

selected

ge

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論