三個(gè)有名的決策樹算法chaid、cart和c4_第1頁
三個(gè)有名的決策樹算法chaid、cart和c4_第2頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 成功的算法了。CHAID(chi-squared 動(dòng)交互檢測(cè))的前身是 AID,主要特征是多向分叉,前向修剪,其標(biāo)準(zhǔn)如名所 成功的算法了。CHAID(chi-squared 動(dòng)交互檢測(cè))的前身是 AID,主要特征是多向分叉,前向修剪,其標(biāo)準(zhǔn)如名所 輸入變量首先要進(jìn)行離散處理。標(biāo)準(zhǔn)的 CART(classification and regrestrees)ndex);C4.5 源自有名的 ID3,它只能進(jìn)行L111222333355555666661010101010為小時(shí)。滿意度中 1 為不滿意、0 為滿意。n個(gè)自變量中,優(yōu)先選擇哪c4.5、CART 三種決策樹算法選擇樹叉的方式是不一樣的,

2、后文詳細(xì)描述。 量:滿意(記為 0)和不滿意(記為 1)。自變量為根據(jù)修理ID3算法是采用信息增益來選擇樹叉,c4.5算法采用增益率,CARTGini指標(biāo)。此外離散型變量和連續(xù)型變量在計(jì)算信息增益、增益率、ID3算法是采用信息增益來選擇樹叉,c4.5算法采用增益率,CARTGini指標(biāo)。此外離散型變量和連續(xù)型變量在計(jì)算信息增益、增益率、Gini指標(biāo)時(shí)會(huì)有些區(qū)別。詳細(xì)描 定理,ID3 算法選擇具有最高信息增益的自變量例的信息需求,記為a)-按照故障原因劃分所需要的信息需求(記為 a1)。其中原信息需求a 的計(jì)算方式為其中D為目標(biāo)變量,此例中為滿意度。m=2,即滿意和不滿意兩種情況。Pi為 其中A

3、 表示目標(biāo)變量D(即滿意度)中按自變量A 劃分所需要的信息,即按故障類型進(jìn)行劃分所需要的信息。V 表示在目標(biāo)變量D(即滿意度)中,按照自變量 A(此處為故障原因)1、2、33個(gè)子集,因此變量故障原因的信息增益Gain(故障原因)=Info(滿意度Info故障原因(滿意度)=1- 因此變量故障原因的信息增益Gain(故障原因)=Info(滿意度Info故障原因(滿意度)=1- 變量故障類型的信息增益Gain(故障類型)=1-修障時(shí)長(zhǎng)遞增排序,即10. 、 、 、 10.212,中點(diǎn)即為(10.2+12)/2=11.1,、5,取相鄰兩個(gè)值的11.1、13離散化為兩個(gè)11.1 Gain(A)=Inf

4、o(D)-InfoA(D) 影響信息增益的關(guān)鍵為:-InfoA(D),即按自變量A 進(jìn)行劃屬性的方式會(huì)傾向于選擇具有大量值的屬性(即自變量)IDID 對(duì)應(yīng)一個(gè)滿意度,即按此變量劃分每個(gè)劃分都是純的(即完全的 (GainRate)來選其中Gain(A)的計(jì)算方式與 ID3 算法中的信息增益計(jì)算方式相同Gain(故障原因)=0.835(前文已求得 3.CART 算法的Gini CART Gini 何意義,因此實(shí)際分為 2V-2 6 個(gè)有效子集。然后計(jì)算這 6 個(gè)有效子集的不純度和Gini 指標(biāo),選取最小的Gini 某個(gè)自變量的Gini 對(duì)應(yīng)到滿意度模型中,A 為自變量,即故障原因、故障類型、修障時(shí)長(zhǎng)。D 代表滿意 某個(gè)自變量的Gini 對(duì)應(yīng)到滿意度模型中,A 為自變量,即故障原因、故障類型、修障時(shí)長(zhǎng)。D 代表滿意價(jià),共有 3 條數(shù)據(jù)。計(jì)算子集1,2的不純度時(shí),即Gini(D1),在故障原因?qū)儆?,2的樣 計(jì)算子集故障原因=1,3Gini指標(biāo)時(shí),D1D2分別為故障原因=1,3的元組共計(jì) 7條數(shù)據(jù),故障原因不屬于1,323 條數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論