通過SPSS建立得分模型_第1頁(yè)
通過SPSS建立得分模型_第2頁(yè)
通過SPSS建立得分模型_第3頁(yè)
通過SPSS建立得分模型_第4頁(yè)
通過SPSS建立得分模型_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、建立得分模型Itellin2005年12月7日分類樹過程最實(shí)用的特征和最有力的功能之一就是有從所建模型中提取數(shù)據(jù)到 其他數(shù)據(jù)文件中參與預(yù)測(cè)的能力。例如,基于包含人口統(tǒng)計(jì)信息和車輛購(gòu)買價(jià)格 信息的數(shù)據(jù)文件,我們能夠建立一個(gè)模型,用于預(yù)測(cè)有相似人口統(tǒng)計(jì)特征的人中 有多少人可能購(gòu)買新車 然后將這個(gè)模型用于有人口統(tǒng)計(jì)信息但沒有車輛購(gòu) 買信息的數(shù)據(jù)文件。例如,我們將要使用的數(shù)據(jù)文件tree car.sav.一、建立模型從菜單中選擇:AnalyzeClassifyTree.選擇 Price of primary vehicle 作為因變量。選擇所有剩余變量作為自變量。(過程會(huì)自動(dòng)排除對(duì)最終模型沒有顯著性貢

2、獻(xiàn)的變量。)選擇所有剩余變量作為自變量。(過程會(huì)自動(dòng)排除對(duì)最終模型沒有顯著性貢獻(xiàn)的變量。)在生成方法下來列表框中選擇CRT (分類和回歸樹。適用于二元變量分類)。點(diǎn)擊 Output。點(diǎn)擊Rules頁(yè)。選擇(打勾)Generate classification rules.Syntax欄中選擇 SPSS。Type 欄中選擇 Assign values to cases.在Export rules to a file中打勾并輸入文件名和路徑。注意:文件名和路徑必須寫下來,因?yàn)椴痪媚銜?huì)用到這個(gè)文件。如果不包括路徑, 你就不會(huì)知道文件保存在什么地方??梢允褂脼g覽按鈕尋找(有效的)路徑。二、評(píng)估模型在應(yīng)

3、用模型到其他數(shù)據(jù)文件之前,你可能想證實(shí)使用原始數(shù)據(jù)建立的模型合理 嗎。(1)模型匯總模型匯總表顯示只有三個(gè)自變量對(duì)最終模型有顯著性的貢獻(xiàn):income, age, 和education。如果你想在其它數(shù)據(jù)中使用這個(gè)模型,知道這些非常重要。因?yàn)?這個(gè)模型中使用的自變量必須出現(xiàn)在其它數(shù)據(jù)文件中。SpecificationsGrowing MethodDependent VariableIndependent VariablesValidationMaximum Tree DepthMinimum Cases in ParentNodeMinimum Cases in Child NodeCRTPr

4、ice of primary vehicleAge in years , Gender , Income category in thousands , Level of education , Marital statusNONE10050Resultsllndependent Variables |lncludHIncome category in thousands , Age in years , Level of educationNumber offlooesNumber of Terminal NodesDepth2915匯總表也顯示樹模型自身可能比較復(fù)雜因?yàn)樗?9個(gè)節(jié)點(diǎn)15個(gè)

5、端點(diǎn)。如果模 型可信這根本就無所謂,使用實(shí)際的模型比簡(jiǎn)單的模型更加容易解釋或描述。當(dāng) 然,從實(shí)際考慮,你可能不希望模型里有太多的自變量。本例中,這不是問題因 為只有三個(gè)自變量包含在最終模型中。Specifications Growing MethodDependent Variable Independent VariablesValidationMaximum Tree Depth Minimum Cases in Parent NodeMinimum Cases in Child NodeResultsIndependent VariablesCRTPrice of primary veh

6、icleAge in years , Gender , Income category in thousands , Level of education , Marital statusNONE10050Income category in thousands , Age in years , Level oducartionI Number of NodesNumber df Terininal Nuci鴕LepinF(2)樹形圖樹形圖有許多節(jié)點(diǎn)以致立刻在目測(cè)的范圍內(nèi)看到節(jié)點(diǎn)信息全貌很困難。使用 tree map可以解決這個(gè)問題。在Viewer窗口雙擊樹,打開樹編輯器。從樹編輯器菜單中選擇

7、:ViewTree Map tree map顯示完整的樹,在窗口四邊拖動(dòng)可以改變窗口的大小,圖形按照 窗口的大小自動(dòng)顯示完整的圖形。. tree map中紅色區(qū)域是當(dāng)前顯示的樹??梢允褂胻ree map瀏覽樹和選擇節(jié)點(diǎn)。對(duì)連續(xù)因變量,每個(gè)節(jié)點(diǎn)顯示因變量的均值和標(biāo)準(zhǔn)差。根節(jié)點(diǎn)顯示購(gòu)車價(jià)格的總 平均值約為29.9 (千美元),標(biāo)準(zhǔn)差為21.6.節(jié)點(diǎn)1表示收入小于75 (千美元)的購(gòu)買者,購(gòu)車價(jià)格平均只有18.7。File View Rules Options Help85% jJ85% jJArial二|10 dBP室,口卜Price of primarii- i.iehicle1Noide 01

8、:Mean29.861 I1 Std. Dev.21.576 :h3110:冬1LILI.LI :L P瀏 it*d胡.誦1 :Income cstegon/ in thousandslmpruiiemerit=347.883-=:=:I50 -=:=:I50 - $74MeanStd. Dev.nPredicted118.6638.114228673.518.663LINode 2IMean60.928Std. Dev.16.163n824華26 .5I P配ictedED衛(wèi)巽|:= :I5ij - $74lmpnovement=32.340用lmpnovement=32.340用/ in

9、yearslmprovement=5.411與此相反,在節(jié)點(diǎn)2,收入大于75的購(gòu)買者,購(gòu)車均價(jià)為60.9。進(jìn)一步研究顯示年齡和教育與購(gòu)車價(jià)格有相關(guān)性,但是目前我們主要關(guān)心模型的 實(shí)際應(yīng)用而不是它的成分的細(xì)節(jié)檢查。(3)風(fēng)險(xiǎn)估計(jì)到目前為止提供不出什么結(jié)果證明模型如何好。模型性能的一個(gè)指示因子是風(fēng)險(xiǎn) 估計(jì)。對(duì)連續(xù)因變量而言,風(fēng)險(xiǎn)估計(jì)是節(jié)點(diǎn)內(nèi)方差的度量,單獨(dú)看它不能告訴你 多少信息。方差小表示模型較好,但是方差大小是相對(duì)觀念,例如,如果價(jià)格是 按照個(gè)位而不是千位計(jì)算,風(fēng)險(xiǎn)估計(jì)將相差上千倍。要提供對(duì)連續(xù)因變量風(fēng)險(xiǎn)估計(jì)有意義的解釋還需要做一點(diǎn)工作:總方差等于節(jié)點(diǎn)內(nèi)(誤差)方差加上節(jié)點(diǎn)間(已解釋)方差。節(jié)

10、點(diǎn)內(nèi)方差是風(fēng)險(xiǎn)估計(jì)值:68.485.總方差是沒有考慮自變量前因變量的方差,它在根節(jié)點(diǎn)上。在根節(jié)點(diǎn)的標(biāo)準(zhǔn)方差顯示是21.576;所以總方差是這個(gè)值的平方465.524. 未解釋的方差是 68.485/465.524 = 0.147。由模型解釋的方差是1 0.147 = 0.853,或85.3%,它表示這是個(gè)相當(dāng)不 錯(cuò)的模型。(類似的解釋是分類因變量的總正確分類率)。三、應(yīng)用模型到其它數(shù)據(jù)集已經(jīng)確定模型相當(dāng)不錯(cuò),現(xiàn)在可以應(yīng)用模型到包含年齡,收入和教育變量的其它 數(shù)據(jù)文件中,并產(chǎn)生一個(gè)新變量,它表示消費(fèi)者購(gòu)車的預(yù)測(cè)價(jià)格。這種處理手法就是常常提到的得分模型。在生成模型時(shí),我們定義了指定個(gè)案保存在文本文

11、件值的“規(guī)則”一用SPSS 命令句法形式。現(xiàn)在我們?cè)谀莻€(gè)文件中使用命令產(chǎn)生另一個(gè)數(shù)據(jù)文件的得分。SPSS安裝文件夾sample_files下打開數(shù)據(jù)文件 tree_score_car.sav。接下來從SPSS菜單中選擇:FileNewSyntax在命令句法窗口中鍵入:INSERT FILE= c:tempcar_scores.sps.如果使用不同的文件名或路徑,可以做適當(dāng)?shù)母淖?。有兩個(gè)新變量增加到數(shù)據(jù)文件中:nod_001包含按照模型預(yù)測(cè)的端點(diǎn)數(shù)。pre_001包含購(gòu)車價(jià)格的預(yù)測(cè)值。因?yàn)槲覀冃枰┮?guī)則為端點(diǎn)指定值,可能的預(yù)測(cè)值數(shù)就是與端點(diǎn)相同的數(shù)。例如, 預(yù)測(cè)節(jié)點(diǎn)數(shù)為10的個(gè)案都有相同的購(gòu)車價(jià)

12、格預(yù)測(cè)值30.56。這同原始模型中端 點(diǎn)10的均值不太一致。雖然你將模型用在因變量值未知的數(shù)據(jù)文件中,在這個(gè)例子中,我們使用實(shí)際包 含哪些信息的數(shù)據(jù)文件以便你能比較模型預(yù)測(cè)值和實(shí)際值。從菜單中選擇:AnalyzeCorrelateBivariate.File Edit View Data Transform1 Graphs 旦 tilitiEW Window HelpReportsDescriptive StatisticsCustom TablesCompare MeansGeneral Linear Model卜Correlate 1Bivariate.Partial.Distances.

13、RegressionLoglinearClassifyData ReductionScaleNonparametric TestsTime SeriesSurvivalMultiple ResponseMissing Value Analysis.選擇 Price of primary vehicle 和 pre_001。點(diǎn)擊 OK 運(yùn)行該過程。相關(guān)系數(shù)0.92表示在實(shí)際購(gòu)車價(jià)與預(yù)測(cè)購(gòu)車價(jià)間存在很高的正相關(guān),它也表示 模型擬和良好。Price of primary vehiclepre_001Price of primary vehicle Pearson Correlation1.919*Sig. (2-tailed).000N32903290pre_001Pearson Correl

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論