關聯(lián)分析-SPSS例析_第1頁
關聯(lián)分析-SPSS例析_第2頁
關聯(lián)分析-SPSS例析_第3頁
關聯(lián)分析-SPSS例析_第4頁
關聯(lián)分析-SPSS例析_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

關聯(lián)分析(筆記)事物之間的關聯(lián)關系包括:簡單關聯(lián)關系、序列關聯(lián)關系。關聯(lián)關系簡單關聯(lián)關系序列關聯(lián)關系簡單關聯(lián)規(guī)則:屬于無指導學習方法,不直接用于分類預測,只揭示事物內部的結構Spssmodeler提供了APriori、GRI、Carma等經(jīng)典算法。APriori和Carma屬于同類算法。序列關聯(lián):關聯(lián)具有前后順序,通常與時間有關SPSSModeler提供了sequence算法;數(shù)據(jù)格式如下:按照事務表存儲,同事需要時間變量。

IDCONTENTIDCONTENTTIME1oo-i香腸1200-1花生米1300-1飲料24001啤酒35002飲料16002啤酒27002香腸3003面包1g003飲料210003香腸311003啤酒312004花生米113004214004315004香腸416005117005香腸21B005花生米219005面包320006花生米1CustomerGuidURLCategorySequencelD10.000Loan2.00020.000Kits3.00030.000Insurance1.00041.000NewsNorthAmerica1.00051.000Football2.00061.000Football3.00071.000Baseball4-.000S1.000Basketball5.000g2.000Weather1.000102.000Weather2.000-1-12.000Weather3.000122.000Weather4-.000■132.000Weather5.000U2.000Weather6.0003.0Q0ShoppingComputer1.Q00163.0Q0NewsEurope2.Q00173.000NewsAsia3.000184.000NewsNorthAmerica1.000194.000Weather2.000205.000Flight1.000簡單關聯(lián)規(guī)則要分析的對象是事務事務的儲存方式有事務表和事實表兩種方式。事務表顧客ID項集1A1D2B2D3A3C事實表顧客ID項目A項目B項目C項目D110012010131010兩種表均表明,顧客1購買了AD兩種物品,顧客2購買了BD兩種物品,顧客三購買了AC兩種物品。關聯(lián)規(guī)則有效性的測度指標1、支持度support:所有購買記錄中,A、B同時被購買的比例。2、置信度confidence:在購買A的事務中,購買B的比例。關聯(lián)規(guī)則實用性的測度指標1、提升度lift:(在購買A的事務中,購買B的比例)/(所有事務中,購買B的比例)

2、置信差3、置信率、正態(tài)卡方、信息差等等簡單關聯(lián)關系實例例1數(shù)據(jù)格式:事實表算法:Aprioricardidvaluepmsthodsexhomeownincomeagefruitvegfreshneat|dairy|cannedvegcannedmemt139S0S42.712CHEQUEMNO2700046FTTFF26736225357CASHFNO3000020FT二FF310S7220.618CASHMNO1320036FF二TF42674823.688CARDFNO1220026FFTFF59160918.813CARDMYES1100024FF-FF6266304Gl487CARDFNO1500035FT=FF76299514.047CASHFYES2030030TF-FF33876522.203CASHMYES2440022FF-FF[1W:[1:H#亠尉T^le室段!Tablei適—?鑒BA&KETS.txt11字段

所有購買項目均選入前項antecedent和后項consequent。輸出結果的最低支持度是10%;本例設定的劃分頻繁項集的標準大于最小支持度10%。最小置信度是80%;前項最多項目數(shù):5本例中,三項以上沒有超過10%的支持度,所以不能形成三項以上的頻繁項集,最大的頻繁項集大小是2。后項前項規(guī)則ID實例支持變%置信度軸規(guī)則支捋%握升]部署能Rfrozenmealbeermrinedveg216716.7S7.42514.62.39521cannedvegbeerfrozenmeal17017085.89214.62.83424beerfrozenmealcannedveg317304.393U.62.3827結論解釋:實例:包含前項beer、cannedveg的樣本有167個,在1000個樣本中前項支持度為16.7%。規(guī)則支持度:同時購買beer、cannedveg、frozenmeal三項的支持度為14.6%。規(guī)則置信度:購買beer、cannedveg的客戶中,87.425%的人有購買frozenmeal。規(guī)則2下,購買frozenmeal的可能性比購買frozenmeal的支持度提高2.895倍。

例2數(shù)據(jù)格式:事實表算法:Apriori本例前項選擇性別和家鄉(xiāng),旨在不同性別和地區(qū)客戶的購買行為是否存在頻繁項集由于AGE是數(shù)據(jù)類型變量,所以前項不能選入AGE,可在GRI算法中選入AGE。cardidvaluepmethodsexhomeownincomeagefruitvegfreshmeat|dairy|cannedvegcannedmeM13980842.712CHEQUEMNO2700046FTTFF26736225357CASHFNO3000028FT-FF31087220.618CASHMNO1320036FF二TF42674823.683CARDFNO1220026FFTFF59160918813CARDMYES1100024FF-FF6266304&4S7CARDFNO1M0035FT-FF76299514.047CASHFYES2000030TF-FF03S76522.203CASHMYES2440022FF二FFBASKETS.bd/11宇段I/

字段模型專家注解?自動◎自定曳最低條件支捋度:最小規(guī)則置信度〔附字段模型專家注解?自動◎自定曳最低條件支捋度:最小規(guī)則置信度〔附最犬前項數(shù):回恨包含標志孌量的再值優(yōu)化:(?速度◎內存優(yōu)化:后項規(guī)則ID實例支持度%置信度軸規(guī)則支捋%提升部署能力frozenmealsex2408|48.3|42.32820.91.418279cann百dv^gsex243a4S.S4077919.91.34623.9beersex-43843.3O..1I6419.61.371292Sex=M序列關聯(lián)規(guī)則實例例1數(shù)據(jù)格式:事務表時間變量:time算法:sequenceIDCONTENTTIME1001香腸|12001花生米13001飲料2斗0013500216002嘛酒27002香腸30003面包19003210003香腸311003嗥酒312004花生米113004飲料214004哩酒315004香腸4-16005啤酒1-17005香腸2-18005花生米2-19005面包350006花生米121006面包2

前項后項實例支持度%置信厘%規(guī)則支持%飲料啤酒466.667100.066.667飲料香腸366.66775.050.Q啤酒香腸383.33360.050.0飲料=》啤酒:規(guī)則支持度66.7%,規(guī)則置信度100%。0使用分區(qū)數(shù)據(jù)0使用分區(qū)數(shù)據(jù)飲料=》香腸:規(guī)則支持度50%,規(guī)則置信度75%。啤酒=》香腸:規(guī)則支持度50%,規(guī)則置信度60%。將最下置信度調整為30%,結果為:

前項后項實例支捋度騎規(guī)則支持陰餓料啤酒466.667100.066.667I香腸366.66775.050.0啤酒383.33360.050.0花生米飲料266.66750.033.333花生米面包266.66750.0站.333花生米嘛酒266.66750.033.333俄料啤酒香腸266.66750.033333例2本例是客訪問網(wǎng)頁的數(shù)據(jù),包括瀏覽的內容和順序等信息。模型旨在發(fā)現(xiàn)各類網(wǎng)頁的瀏覽是否存在某種序列關系。Customerguide:客戶IDURKcategory:網(wǎng)頁瀏覽內容sequencelD:瀏覽順序,即時間順序。CustomerGuidURLCategorySequencelD|AgeGenderMaritalStatus;1o.oaoLoan2.00010-1&MS20.000Kits3.0QQ10-1&MS3o.oaoInsurance1.00010-15Ms4i.oaoNewsNorthAmerica1.00010-1&Fs5i.oaoFootball2.00010-1&Fs61.000Football3.00010-15Fs7i.oaoBaseball4.00010-1&Fs8i.oaoBasketball5.00010-15Fs92.000Weather1.00020-3&FM102.000Weather2.00020-5&FMcustomer2穆型容稱:◎自動@自逹文URLCalegory懸小規(guī)則支捋度(呦:最小規(guī)則置信度〔呦:〔完整規(guī)則}穆型容稱:◎自動@自逹文URLCalegory懸小規(guī)則支捋度(呦:最小規(guī)則置信度〔呦:〔完整規(guī)則}最犬序列大小:使用分區(qū)數(shù)據(jù)苗項百項室例主捋雀嗝規(guī)則主捋%Ria

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論