版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、建立得分模型Itellin2005年12月7日分類樹過程最實(shí)用的特征和最有力的功能之一就是有從所建模型中提取數(shù)據(jù)到 其他數(shù)據(jù)文件中參與預(yù)測(cè)的能力。例如,基于包含人口統(tǒng)計(jì)信息和車輛購(gòu)買價(jià)格 信息的數(shù)據(jù)文件,我們能夠建立一個(gè)模型,用于預(yù)測(cè)有相似人口統(tǒng)計(jì)特征的人中 有多少人可能購(gòu)買新車 然后將這個(gè)模型用于有人口統(tǒng)計(jì)信息但沒有車輛購(gòu) 買信息的數(shù)據(jù)文件。例如,我們將要使用的數(shù)據(jù)文件tree car.sav.一、建立模型從菜單中選擇:AnalyzeClassifyTree.選擇 Price of primary vehicle 作為因變量。選擇所有剩余變量作為自變量。(過程會(huì)自動(dòng)排除對(duì)最終模型沒有顯著性貢
2、獻(xiàn)的變量。)選擇所有剩余變量作為自變量。(過程會(huì)自動(dòng)排除對(duì)最終模型沒有顯著性貢獻(xiàn)的變量。)在生成方法下來列表框中選擇CRT (分類和回歸樹。適用于二元變量分類)。點(diǎn)擊 Output。點(diǎn)擊Rules頁(yè)。選擇(打勾)Generate classification rules.Syntax欄中選擇 SPSS。Type 欄中選擇 Assign values to cases.在Export rules to a file中打勾并輸入文件名和路徑。注意:文件名和路徑必須寫下來,因?yàn)椴痪媚銜?huì)用到這個(gè)文件。如果不包括路徑, 你就不會(huì)知道文件保存在什么地方??梢允褂脼g覽按鈕尋找(有效的)路徑。二、評(píng)估模型在應(yīng)
3、用模型到其他數(shù)據(jù)文件之前,你可能想證實(shí)使用原始數(shù)據(jù)建立的模型合理 嗎。(1)模型匯總模型匯總表顯示只有三個(gè)自變量對(duì)最終模型有顯著性的貢獻(xiàn):income, age, 和education。如果你想在其它數(shù)據(jù)中使用這個(gè)模型,知道這些非常重要。因?yàn)?這個(gè)模型中使用的自變量必須出現(xiàn)在其它數(shù)據(jù)文件中。SpecificationsGrowing MethodDependent VariableIndependent VariablesValidationMaximum Tree DepthMinimum Cases in ParentNodeMinimum Cases in Child NodeCRTPr
4、ice of primary vehicleAge in years , Gender , Income category in thousands , Level of education , Marital statusNONE10050Resultsllndependent Variables |lncludHIncome category in thousands , Age in years , Level of educationNumber offlooesNumber of Terminal NodesDepth2915匯總表也顯示樹模型自身可能比較復(fù)雜因?yàn)樗?9個(gè)節(jié)點(diǎn)15個(gè)
5、端點(diǎn)。如果模 型可信這根本就無所謂,使用實(shí)際的模型比簡(jiǎn)單的模型更加容易解釋或描述。當(dāng) 然,從實(shí)際考慮,你可能不希望模型里有太多的自變量。本例中,這不是問題因 為只有三個(gè)自變量包含在最終模型中。Specifications Growing MethodDependent Variable Independent VariablesValidationMaximum Tree Depth Minimum Cases in Parent NodeMinimum Cases in Child NodeResultsIndependent VariablesCRTPrice of primary veh
6、icleAge in years , Gender , Income category in thousands , Level of education , Marital statusNONE10050Income category in thousands , Age in years , Level oducartionI Number of NodesNumber df Terininal Nuci鴕LepinF(2)樹形圖樹形圖有許多節(jié)點(diǎn)以致立刻在目測(cè)的范圍內(nèi)看到節(jié)點(diǎn)信息全貌很困難。使用 tree map可以解決這個(gè)問題。在Viewer窗口雙擊樹,打開樹編輯器。從樹編輯器菜單中選擇
7、:ViewTree Map tree map顯示完整的樹,在窗口四邊拖動(dòng)可以改變窗口的大小,圖形按照 窗口的大小自動(dòng)顯示完整的圖形。. tree map中紅色區(qū)域是當(dāng)前顯示的樹??梢允褂胻ree map瀏覽樹和選擇節(jié)點(diǎn)。對(duì)連續(xù)因變量,每個(gè)節(jié)點(diǎn)顯示因變量的均值和標(biāo)準(zhǔn)差。根節(jié)點(diǎn)顯示購(gòu)車價(jià)格的總 平均值約為29.9 (千美元),標(biāo)準(zhǔn)差為21.6.節(jié)點(diǎn)1表示收入小于75 (千美元)的購(gòu)買者,購(gòu)車價(jià)格平均只有18.7。File View Rules Options Help85% jJ85% jJArial二|10 dBP室,口卜Price of primarii- i.iehicle1Noide 01
8、:Mean29.861 I1 Std. Dev.21.576 :h3110:冬1LILI.LI :L P瀏 it*d胡.誦1 :Income cstegon/ in thousandslmpruiiemerit=347.883-=:=:I50 -=:=:I50 - $74MeanStd. Dev.nPredicted118.6638.114228673.518.663LINode 2IMean60.928Std. Dev.16.163n824華26 .5I P配ictedED衛(wèi)巽|:= :I5ij - $74lmpnovement=32.340用lmpnovement=32.340用/ in
9、yearslmprovement=5.411與此相反,在節(jié)點(diǎn)2,收入大于75的購(gòu)買者,購(gòu)車均價(jià)為60.9。進(jìn)一步研究顯示年齡和教育與購(gòu)車價(jià)格有相關(guān)性,但是目前我們主要關(guān)心模型的 實(shí)際應(yīng)用而不是它的成分的細(xì)節(jié)檢查。(3)風(fēng)險(xiǎn)估計(jì)到目前為止提供不出什么結(jié)果證明模型如何好。模型性能的一個(gè)指示因子是風(fēng)險(xiǎn) 估計(jì)。對(duì)連續(xù)因變量而言,風(fēng)險(xiǎn)估計(jì)是節(jié)點(diǎn)內(nèi)方差的度量,單獨(dú)看它不能告訴你 多少信息。方差小表示模型較好,但是方差大小是相對(duì)觀念,例如,如果價(jià)格是 按照個(gè)位而不是千位計(jì)算,風(fēng)險(xiǎn)估計(jì)將相差上千倍。要提供對(duì)連續(xù)因變量風(fēng)險(xiǎn)估計(jì)有意義的解釋還需要做一點(diǎn)工作:總方差等于節(jié)點(diǎn)內(nèi)(誤差)方差加上節(jié)點(diǎn)間(已解釋)方差。節(jié)
10、點(diǎn)內(nèi)方差是風(fēng)險(xiǎn)估計(jì)值:68.485.總方差是沒有考慮自變量前因變量的方差,它在根節(jié)點(diǎn)上。在根節(jié)點(diǎn)的標(biāo)準(zhǔn)方差顯示是21.576;所以總方差是這個(gè)值的平方465.524. 未解釋的方差是 68.485/465.524 = 0.147。由模型解釋的方差是1 0.147 = 0.853,或85.3%,它表示這是個(gè)相當(dāng)不 錯(cuò)的模型。(類似的解釋是分類因變量的總正確分類率)。三、應(yīng)用模型到其它數(shù)據(jù)集已經(jīng)確定模型相當(dāng)不錯(cuò),現(xiàn)在可以應(yīng)用模型到包含年齡,收入和教育變量的其它 數(shù)據(jù)文件中,并產(chǎn)生一個(gè)新變量,它表示消費(fèi)者購(gòu)車的預(yù)測(cè)價(jià)格。這種處理手法就是常常提到的得分模型。在生成模型時(shí),我們定義了指定個(gè)案保存在文本文
11、件值的“規(guī)則”一用SPSS 命令句法形式。現(xiàn)在我們?cè)谀莻€(gè)文件中使用命令產(chǎn)生另一個(gè)數(shù)據(jù)文件的得分。SPSS安裝文件夾sample_files下打開數(shù)據(jù)文件 tree_score_car.sav。接下來從SPSS菜單中選擇:FileNewSyntax在命令句法窗口中鍵入:INSERT FILE= c:tempcar_scores.sps.如果使用不同的文件名或路徑,可以做適當(dāng)?shù)母淖?。有兩個(gè)新變量增加到數(shù)據(jù)文件中:nod_001包含按照模型預(yù)測(cè)的端點(diǎn)數(shù)。pre_001包含購(gòu)車價(jià)格的預(yù)測(cè)值。因?yàn)槲覀冃枰┮?guī)則為端點(diǎn)指定值,可能的預(yù)測(cè)值數(shù)就是與端點(diǎn)相同的數(shù)。例如, 預(yù)測(cè)節(jié)點(diǎn)數(shù)為10的個(gè)案都有相同的購(gòu)車價(jià)
12、格預(yù)測(cè)值30.56。這同原始模型中端 點(diǎn)10的均值不太一致。雖然你將模型用在因變量值未知的數(shù)據(jù)文件中,在這個(gè)例子中,我們使用實(shí)際包 含哪些信息的數(shù)據(jù)文件以便你能比較模型預(yù)測(cè)值和實(shí)際值。從菜單中選擇:AnalyzeCorrelateBivariate.File Edit View Data Transform1 Graphs 旦 tilitiEW Window HelpReportsDescriptive StatisticsCustom TablesCompare MeansGeneral Linear Model卜Correlate 1Bivariate.Partial.Distances.
13、RegressionLoglinearClassifyData ReductionScaleNonparametric TestsTime SeriesSurvivalMultiple ResponseMissing Value Analysis.選擇 Price of primary vehicle 和 pre_001。點(diǎn)擊 OK 運(yùn)行該過程。相關(guān)系數(shù)0.92表示在實(shí)際購(gòu)車價(jià)與預(yù)測(cè)購(gòu)車價(jià)間存在很高的正相關(guān),它也表示 模型擬和良好。Price of primary vehiclepre_001Price of primary vehicle Pearson Correlation1.919*Sig. (2-tailed).000N32903290pre_001Pearson Correl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人搬家服務(wù)2024年度合同3篇
- 二零二五版KTV消防安全檢查與整改服務(wù)合同2篇
- 二零二五年方管產(chǎn)品綠色包裝設(shè)計(jì)與實(shí)施合同3篇
- 2024年高端定制家具制造合同
- 2024無人機(jī)航拍與監(jiān)測(cè)服務(wù)合同
- 二零二五版歷史文化名城保護(hù)項(xiàng)目技術(shù)咨詢合同3篇
- 二零二五版廢鐵回收處理與環(huán)保服務(wù)合同3篇
- 2024年薪資隱私協(xié)議3篇
- 二零二五年白酒質(zhì)量檢測(cè)與認(rèn)證服務(wù)合同2篇
- 武漢華夏理工學(xué)院《世界音樂文化》2023-2024學(xué)年第一學(xué)期期末試卷
- 《如何存款最合算》課件
- 2023年全國(guó)統(tǒng)一高考數(shù)學(xué)甲卷【文科+理科】試題及答案解析
- 社區(qū)團(tuán)支部工作計(jì)劃
- 廢品處置招標(biāo)書
- GA/T 1280-2024銀行自助設(shè)備安全性規(guī)范
- 數(shù)據(jù)標(biāo)注基地項(xiàng)目實(shí)施方案
- 教培行業(yè)研究系列(七):出國(guó)考培的再研究供需變化的新趨勢(shì)
- 靜脈治療??谱o(hù)士競(jìng)聘
- 2024年第一季度醫(yī)療安全(不良)事件分析報(bào)告
- 中醫(yī)課件英語教學(xué)課件
- 《哪吒鬧?!冯娪百p析
評(píng)論
0/150
提交評(píng)論