下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、線性回歸是很重要的一種回歸方法,但是線性回歸只適用于因變量為連續(xù)型變量的情況,那如果因變量為分類變量呢?比方說我們想預(yù)測(cè)某個(gè)病人會(huì)不會(huì)痊愈,顧客會(huì)不會(huì)購買產(chǎn)品,等等,這時(shí)候我們就要用到logistic回歸分析了。Logistic回歸主要分為三類,一種是因變量為二分類得logistic回歸,這種回歸叫做二項(xiàng)logistic回歸,一種是因變量為無序多分類得logistic回歸,比如傾向于選擇哪種產(chǎn)品,這種回歸叫做多項(xiàng)logistic回歸。還有一種是因變量為有序多分類的logistic回歸,比如病重的程度是高,中,低呀等等,這種回歸也叫累積logistic回歸,或者序次logistic回歸。二彳Kl
2、ogistic回歸:選擇分析回歸二元logistic,打開主面板,因變量勾選你的二分類變量,這個(gè)沒有什么疑問,然后看下邊寫著一個(gè)協(xié)變量。有沒有很奇怪什么叫做協(xié)變量?在二元logistic回歸里邊可以認(rèn)為協(xié)變量類似于自變量,或者就是自變量。把你的自變量選到協(xié)變量的框框里邊。細(xì)心的朋友會(huì)發(fā)現(xiàn),在指向協(xié)變量的那個(gè)箭頭下邊,還有一個(gè)小小的按鈕,標(biāo)著a*b,這個(gè)按鈕的作用是用來選擇交互項(xiàng)的。我們知道,有時(shí)候兩個(gè)變量合在一起會(huì)產(chǎn)生新的效應(yīng),比如年齡和結(jié)婚次數(shù)綜合在一起,會(huì)對(duì)健康程度有一個(gè)新的影響,這時(shí)候,我們就認(rèn)為兩者有交互效應(yīng)。那么我們?yōu)榱四P偷臏?zhǔn)確,就把這個(gè)交互效應(yīng)也選到模型里去。我們?cè)谟疫叺哪莻€(gè)框框
3、里選擇變量a,按住ctrl,在選擇變量b,那么我們就同時(shí)選住這兩個(gè)變量了,然后點(diǎn)那個(gè)a*b的按鈕,這樣,一個(gè)新的名字很長的變量就出現(xiàn)在協(xié)變量的框框里了,就是我們的交互作用的變量。然后在下邊有一個(gè)方法的下拉菜單。默認(rèn)的是進(jìn)入,就是強(qiáng)迫所有選擇的變量都進(jìn)入到模型里邊。除去進(jìn)入法以外,還有三種向前法,三種向后法。一般默認(rèn)進(jìn)入就可以了,如果做出來的模型有變量的p值不合格,就用其他方法在做。再下邊的選擇變量則是用來選擇你的個(gè)案的。一般也不用管它。選好主面板以后,單擊分類(右上角),打開分類對(duì)話框。在這個(gè)對(duì)話框里邊,左邊的協(xié)變量的框框里邊有你選好的自變量,右邊寫著分類協(xié)變量的框框則是空白的。你要把協(xié)變量里
4、邊的字符型變量和分類變量選到分類協(xié)變量里邊去(系統(tǒng)會(huì)自動(dòng)生成啞變量來方便分析,什么事啞變量具體參照前文)。這里的字符型變量指的是用值標(biāo)簽標(biāo)注過得變量,不然光文字,系統(tǒng)也沒法給你分析啊。選好以后,分類協(xié)變量下邊還有一個(gè)更改對(duì)比的框框,我們知道,對(duì)于分類變量,spss需要有一個(gè)參照,每個(gè)分類都通過和這個(gè)參照進(jìn)行比較來得到結(jié)果,更改對(duì)比這個(gè)框框就是用來選擇參照的。默認(rèn)的對(duì)比是指示符,也就是每個(gè)分類都和總體進(jìn)行比較,除了指示符以外還有簡(jiǎn)單,差值等。這個(gè)框框不是很重要,默認(rèn)就可以了。點(diǎn)擊繼續(xù)。然后打開保存對(duì)話框,勾選概率,組成員,包含協(xié)方差矩陣。點(diǎn)擊繼續(xù),打開選項(xiàng)對(duì)話框,勾選分類圖,估計(jì)值的相關(guān)性,迭代
5、歷史,exp(B)的CI,在模型中包含常數(shù),輸出一一在每個(gè)步驟中。如果你的協(xié)變量有連續(xù)型的,或者小樣本,那還要勾選Hosmer-Lemeshow擬合度,這個(gè)擬合度表現(xiàn)的會(huì)較好一些。繼續(xù),確定。然后,就會(huì)輸出結(jié)果了。主要會(huì)輸出六個(gè)表。第一個(gè)表是模型系數(shù)綜合檢驗(yàn)表,要看他模型的p值是不是小于0.05,判斷我們這個(gè)logistic回歸方程有沒有意義。第二個(gè)表示模型匯總表。這個(gè)表里有兩個(gè)RA2,叫做廣義決定系數(shù),也叫偽RA2,作用類似于線性回歸里的決定系數(shù),也是表示這個(gè)方程能夠解釋模型的百分之多少。由于計(jì)算方法不同,這兩個(gè)廣義決定系數(shù)的值往往不一樣,但是出入并不會(huì)很大。在下邊的分類表則表述了模型的穩(wěn)定
6、性。這個(gè)表最后一行百分比校正下邊的三個(gè)數(shù)據(jù)列出來在實(shí)際值為0或者1時(shí),模型預(yù)測(cè)正確的百分比,以及模型總的預(yù)測(cè)正確率。一般認(rèn)為預(yù)測(cè)正確概率達(dá)到百分之五十就是良好(標(biāo)準(zhǔn)真夠低的),當(dāng)然正確率越高越好。在然后就是最重要的表了,方程中的變量表。第一行那個(gè)B下邊是每個(gè)變量的系數(shù)。第五行的p值會(huì)告訴你每個(gè)變量是否適合留在方程里。如果有某個(gè)變量不適合,那就要從新去掉這個(gè)變量做回歸。根據(jù)這個(gè)表就可以寫出logistic方程了:P=Exp(常量+a1*變量1+a2*變量2.。°°)/(1+Exp(常量+a1*變量1+a2*變量2.。)。如果大家學(xué)過一點(diǎn)統(tǒng)計(jì),那就應(yīng)該對(duì)這個(gè)形式的方程不陌生。提
7、供變量,它最后算出來會(huì)是一個(gè)介于0和1的數(shù),也就是你的模型里設(shè)定的值比較大的情況發(fā)生的概率,比如你想推算會(huì)不會(huì)治愈,你設(shè)0治愈,1為沒有治愈。那你的模型算出來就是沒有治愈的概率。如果你想直接計(jì)算治愈的概率,那就需要更改一下設(shè)定,用1去代表治愈。此外倒數(shù)后兩列有一個(gè)EXP(B),也就是OR值,哦,這個(gè)可不是或者的意思,OR值是優(yōu)勢(shì)比。在線性回歸里邊我們用標(biāo)準(zhǔn)化系數(shù)來對(duì)比兩個(gè)自變量對(duì)于因變量的影響力的強(qiáng)弱,在logistic回歸里邊我們用優(yōu)勢(shì)比來比較不同的情況對(duì)于因變量的影響。舉個(gè)例子。比如我想看性別對(duì)于某種病是否好轉(zhuǎn)的影響,假設(shè)0代表女,1代表男,0代表不好轉(zhuǎn),1代表好轉(zhuǎn)。發(fā)現(xiàn)這個(gè)變量的OR值為
8、2.9,那么也就是說男人的好轉(zhuǎn)的可能是女人好轉(zhuǎn)的2.9倍。注意,這里都是以數(shù)值較大的那個(gè)情況為基準(zhǔn)的。而且OR值可以直接給出這個(gè)倍數(shù)。如果是0,1,2各代表一類情況的時(shí)候,那就是2是1的2.9倍,1是0的2.9倍,以此類推。OR值對(duì)于方程沒什么貢獻(xiàn),但是有助于直觀的理解模型。在使用OR值得時(shí)候一定要結(jié)合它95%的置信區(qū)間來進(jìn)行判斷。此外還有相關(guān)矩陣表和概率直方圖,就不再介紹了。多項(xiàng)logistic回歸:選擇分析回歸多項(xiàng)logistic,打開主面板,因變量大家都知道選什么,因變量下邊有一個(gè)參考類別,默認(rèn)的第一類別就可以。再然后出現(xiàn)了兩個(gè)框框,因子和協(xié)變量。很明顯,這兩個(gè)框框都是要你選因變量的,那
9、么到底有什么區(qū)別呢?嘿嘿,區(qū)別就在于,因子里邊放的是無序的分類變量,比如性別,職業(yè)什么的,以及連續(xù)變量(實(shí)際上做logistic回歸時(shí)大部分自變量都是分類變量,連續(xù)變量是比較少的。),而協(xié)變量里邊放的是等級(jí)資料,比如病情的嚴(yán)重程度啊,年齡?。ㄒ允隇橐粋€(gè)年齡段撒,一年一個(gè)的話就看成連續(xù)變量吧還是)之類的。在二項(xiàng)logistic回歸里邊,系統(tǒng)會(huì)自動(dòng)生成啞變量,可是在多項(xiàng)logistic回歸里邊,就要自己手動(dòng)設(shè)置了。參照上邊的解釋,不難知道設(shè)置好的啞變量要放到因子那個(gè)框框里去。然后點(diǎn)開模型那個(gè)對(duì)話框,哇,好恐怖的一個(gè)對(duì)話框,都不知道是干嘛的。好,我們一點(diǎn)點(diǎn)來看。上邊我們已經(jīng)說過交互作用是干嘛的了,
10、那么不難理解,主效應(yīng)就是變量本身對(duì)模型的影響。明確了這一點(diǎn)以后,這個(gè)對(duì)話框就沒有那么難選了。指定模型那一欄有三個(gè)模型,主效應(yīng)指的是只做自變量和因變量的方程,就是最普通的那種。全因子指的是包含了所有主效應(yīng)和所有因子和因子的交互效應(yīng)的模型(我也不明白為什么只有全因子,沒有全協(xié)變量。這個(gè)問題真的很難,所以別追問我啦。)第三個(gè)是設(shè)定/步進(jìn)式。這個(gè)是自己手動(dòng)設(shè)置交互項(xiàng)和主效應(yīng)項(xiàng)的,而且還可以設(shè)置這個(gè)項(xiàng)是強(qiáng)制輸入的還是逐步進(jìn)入的。這個(gè)概念就不用再啰嗦了吧???點(diǎn)擊繼續(xù),打開統(tǒng)計(jì)量對(duì)話框,勾選個(gè)案處理摘要,偽R方,步驟摘要,模型擬合度信息,單元格可能性,分類表,擬合度,估計(jì),似然比檢驗(yàn),繼續(xù)。打開條件,全勾,
11、繼續(xù),打開選項(xiàng),勾選為分級(jí)強(qiáng)制條目和移除項(xiàng)目。打開保存,勾選包含協(xié)方差矩陣。確定(總算選完了)。結(jié)果和二項(xiàng)logistic回歸差不多,就是多了一個(gè)似然比檢驗(yàn),p值小于0.05認(rèn)為變量有意義。然后我們直接看參數(shù)估計(jì)表。假設(shè)我們的因變量有n個(gè)類,那參數(shù)估計(jì)表會(huì)給出n-1組的截距,變量1,變量2。我們我們用Zm代表Exp(常量m+am1*變量1+am2*變量2+。),那么就有第m類情況發(fā)生的概率為Zn/1+Z2+Z3+Zn(如果我們以第一類為參考類別的話,我們就不會(huì)有關(guān)于第一類的參數(shù),那么第一類就是默認(rèn)的1,也就是說Z1為1)。有序回歸(累積logistic回歸):選擇菜單分析一一回歸一一有序,打開主面板。因變量,因子,協(xié)變量如何選取就不在重復(fù)了。選項(xiàng)對(duì)話框默認(rèn)。打開輸出對(duì)話框,勾選擬合度統(tǒng)計(jì),摘要統(tǒng)計(jì),參數(shù)估計(jì),平行線檢驗(yàn),估計(jì)響應(yīng)概率,實(shí)際類別概率,確定,位置對(duì)話框和上文的模型對(duì)話框類似,也不重復(fù)了。確定。結(jié)果里邊特有的一個(gè)表是平行線檢驗(yàn)表。這個(gè)表的p值小于0.05則認(rèn)為斜率系數(shù)對(duì)于不同的類別是不一樣的。此外參數(shù)估計(jì)表得出的參數(shù)也有所不同。假設(shè)我們的因變量有四個(gè)水平,自變量有兩個(gè),那么參數(shù)估計(jì)表會(huì)給出三個(gè)閾值a1,a2,a3(也就是截距),兩個(gè)自變量的參數(shù)m,n。計(jì)算方程時(shí),首
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025廣告公司合作協(xié)議合同樣本
- 2025軟件銷售代理合同書
- 2025小型汽車配件購買合同
- 2025公司向個(gè)人借款合同范本
- 二零二五年度房地產(chǎn)項(xiàng)目土地租賃及銷售代理協(xié)議3篇
- 2025農(nóng)村家庭土地流轉(zhuǎn)合同分家協(xié)議書樣本2篇
- 公墓生態(tài)葬服務(wù)及配套設(shè)施建設(shè)合同(年度)3篇
- 二零二五年度電子商務(wù)企業(yè)高管平臺(tái)運(yùn)營管理聘用合同3篇
- 2025年度房屋維修服務(wù)與社區(qū)環(huán)境改善合作協(xié)議2篇
- 二零二五年度新型塑鋼窗研發(fā)與生產(chǎn)合同3篇
- 2025年國家圖書館招聘筆試參考題庫含答案解析
- 機(jī)器人課程課程設(shè)計(jì)
- 南充市市級(jí)事業(yè)單位2024年公招人員擬聘人員歷年管理單位遴選500模擬題附帶答案詳解
- 安全知識(shí)考試題庫500題(含答案)
- 2024-2025學(xué)年上學(xué)期南京小學(xué)數(shù)學(xué)六年級(jí)期末模擬試卷
- 河北省保定市定興縣2023-2024學(xué)年一年級(jí)上學(xué)期期末調(diào)研數(shù)學(xué)試題(含答案)
- 2025年中國蛋糕行業(yè)市場(chǎng)規(guī)模及發(fā)展前景研究報(bào)告(智研咨詢發(fā)布)
- 護(hù)理組長年底述職報(bào)告
- 護(hù)理不良事件分析 課件
- 糖尿病患者健康管理測(cè)試試題(三套題-有答案)
- 《住院患者身體約束的護(hù)理》團(tuán)體標(biāo)準(zhǔn)解讀課件
評(píng)論
0/150
提交評(píng)論