回歸分析實(shí)驗(yàn)課實(shí)驗(yàn)8_第1頁(yè)
回歸分析實(shí)驗(yàn)課實(shí)驗(yàn)8_第2頁(yè)
回歸分析實(shí)驗(yàn)課實(shí)驗(yàn)8_第3頁(yè)
回歸分析實(shí)驗(yàn)課實(shí)驗(yàn)8_第4頁(yè)
回歸分析實(shí)驗(yàn)課實(shí)驗(yàn)8_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.實(shí)驗(yàn)報(bào)告八實(shí)驗(yàn)課程 :回歸分析實(shí)驗(yàn)課專業(yè):統(tǒng)計(jì)學(xué)年級(jí):姓名:學(xué)號(hào):指導(dǎo)教師 :完成時(shí)間 :得分:.專業(yè)學(xué)習(xí)資料.教師評(píng)語(yǔ) :學(xué)生收獲與思考 :.專業(yè)學(xué)習(xí)資料.實(shí)驗(yàn)八含定性變量的回歸模型(4學(xué)時(shí))一、實(shí)驗(yàn)?zāi)康? 掌握含定性變量的回歸模型的建模步驟3 運(yùn)用 SAS 計(jì)算含定性變量的各種回歸模型的各參數(shù)估計(jì)及相關(guān)檢驗(yàn)統(tǒng)計(jì)量二、實(shí)驗(yàn)理論與方法在實(shí)際問(wèn)題的研究中,經(jīng)常會(huì)遇到一些非數(shù)量型的變量。如品質(zhì)變量 ;性別 ;戰(zhàn)爭(zhēng)與和平 。我們把這些品質(zhì)變量也稱為定性變量,在建立回歸模型的時(shí)候我們需要考慮到這些定性變量。定性變量的回歸模型分為自變量含定性變量的回歸模型和因變量是定性變量的回歸模型。自變量含有定性變

2、量的時(shí)候,我們一般引進(jìn)虛擬變量,將這些定性變量數(shù)量化。例如研究糧食產(chǎn)量問(wèn)題 , y為糧食產(chǎn)量 , x為施肥量 ,另外考慮氣候問(wèn)題,分為正常年份和干旱年份兩種情況,這個(gè)問(wèn)題數(shù)量化方法就是引入一個(gè)0-1 型變量 D,令 Di=1表示正常年份 , Di=0 表示干旱年份,糧食產(chǎn)量的回歸模型為 : yi =0+ 1xi +2Di+ i。因變量是定性變量時(shí),一般用 logistic 回歸模型 (分組數(shù)據(jù)的 logistic 回歸模型 ,未分組數(shù)據(jù)的logistic 回歸模型 ,多類別的 logistic 回歸模型 ), probit 回歸模型等 。.專業(yè)學(xué)習(xí)資料.三 . 實(shí)驗(yàn)內(nèi)容1用 DATA步建立一個(gè)

3、永久SAS數(shù)據(jù)集 ,數(shù)據(jù)集名為 xt103, 數(shù)據(jù)見表 21;對(duì)數(shù)據(jù)集 xt103, 建立 y對(duì)公司規(guī)模和公司類型的回歸,并對(duì)所得到的模型進(jìn)行解釋 。2研制一種新型玻璃 ,對(duì)其做耐沖實(shí)驗(yàn) 。用一個(gè)小球從不同的高度 h 對(duì)玻璃做自由落體撞擊,玻璃破碎記為 y=1 ,玻璃未破碎記 y=0. 數(shù)據(jù)見表 22.是對(duì)表中數(shù)據(jù)建立玻璃耐沖性對(duì)高度h的logistic 回歸 ,并解釋回歸方程的含義 。3某學(xué)校對(duì)本科畢業(yè)生的去向做了一個(gè)調(diào)查,分析影響畢業(yè)去向的相關(guān)因素,結(jié)果見表 23.其中畢業(yè)去向 “1”= 工作 ,“2”= 讀研 ,“3”= 出國(guó)留學(xué) 。 性別 “1”= 男生 ,“0”= 女生 。 用多類別

4、的Logisitic 回歸分析影響畢業(yè)去向的因素。四 實(shí)驗(yàn)儀器計(jì)算機(jī)和SAS 軟件五 . 實(shí)驗(yàn)步驟和結(jié)果分析1 用 DATA步建立一個(gè)永久SAS數(shù)據(jù)集 ,數(shù)據(jù)集名為 xt103, 數(shù)據(jù)見表 21;對(duì)數(shù)據(jù)集 xt103, 建立 y對(duì)公司規(guī)模和公司類型的回歸,并對(duì)所得到的模型進(jìn)行解釋。.專業(yè)學(xué)習(xí)資料.R 檢驗(yàn)中 R 方為 0.8951 ,可以認(rèn)為回歸擬合效果較好。回歸方程通過(guò)F 檢驗(yàn),說(shuō)明模型是顯著成立的。由參數(shù)估計(jì)表 ,可以看出 ,全部變量都是顯著的,回歸方程為 :y33.870.102x18.06 x2其中 ,x2 是虛擬變量 ,當(dāng)公司類型為“互助 ”時(shí),x2 為 0,為“股份 ”時(shí), x2

5、為 1。由方程可知 , x2 為 1,即股份制公司的保險(xiǎn)革新措施速度y 會(huì)更大 。 股份制公司采取保險(xiǎn)革新措施的積極性比互助型公司高,股份制公司建立在共同承擔(dān)風(fēng)險(xiǎn)上,更愿意革新 。公司規(guī)模越大,采取保險(xiǎn)革新措施的傾向越大:大規(guī)模公司保險(xiǎn)制度的更新對(duì)公司的影響程度比小規(guī)模公司大 。SAS 程序:data xt103;input y x1 x2 ;/* 引入虛擬變量,將公司類型的互助設(shè)為0,股份設(shè)為1*/cards ;17 151 026 92 0.專業(yè)學(xué)習(xí)資料.21175 03031022 104 00 277 012 210 019 120 04 290 016 238 028 164 115

6、 272 111 295 1386813185121 224 120 166 113 305 130 124 114 246 1;run ;procregdata =xt103;.專業(yè)學(xué)習(xí)資料.modely=x1 x2;run ;2 研制一種新型玻璃,對(duì)其做耐沖實(shí)驗(yàn)。用一個(gè)小球從不同的高度h 對(duì)玻璃做自由落體撞擊,玻璃破碎記為 y=1 ,玻璃未破碎記y=0. 數(shù)據(jù)見表 22. 是對(duì)表中數(shù)據(jù)建立玻璃耐沖性對(duì)高度h 的 logistic 回歸,并解釋回歸方程的含義。模型信息 :模型解出的是 y=0 的概率 。.專業(yè)學(xué)習(xí)資料.由三個(gè)檢驗(yàn)中 ,統(tǒng)計(jì)量的 P值都小于 0.05 ,可以認(rèn)為模型是顯著的。由

7、 Wald 檢驗(yàn)的顯著性概率及其P 值,可以看出 , h 變量對(duì)方程的影響是顯著的。由極大似然估計(jì),各個(gè)參數(shù)系數(shù)也通過(guò)檢驗(yàn)。因此模型有效。二元 logit模型為exp( 14.597.98h)p( y 0)7.98h)1 exp( 14.59模型意義為 ,小球掉落高度為h,則玻璃未破碎的概率為p,而 y=0 表示玻璃未破碎。也就是說(shuō) ,該種新型的玻璃,用小球?qū)ζ渥矒簦?dāng)小球的掉落高度為h 時(shí),玻璃未破碎的概率就是.專業(yè)學(xué)習(xí)資料.exp( 14.597.98h)p( y 0)7.98h)1 exp( 14.59,那么 ,玻璃會(huì)破碎的概率就為1-p(y=0) ,這也可以看成是一種比例 ,就是大量實(shí)

8、驗(yàn)中,同個(gè)高度h ,玻璃會(huì)被擊破的比例。SAS 程序:data wjz;input h y ; /* 引入虛擬變量,將公司類型的互助設(shè)為0,股份設(shè)為1*/cards ;1.50 01.52 01.54 01.56 01.58 11.60 01.62 01.64 01.66 01.68 11.70 01.72 01.74 01.76 11.78 0.專業(yè)學(xué)習(xí)資料.1.80 11.82 01.84 01.86 11.88 11.90 01.92 11.94 01.96 11.98 12.00 1;run ;proclogisticdata =wjz;modely=h;run ;proclogist

9、icdata =wjz;class h;modely=h/ link =glogitaggregatescale =none;run ;.專業(yè)學(xué)習(xí)資料.3 某學(xué)校對(duì)本科畢業(yè)生的去向做了一個(gè)調(diào)查,分析影響畢業(yè)去向的相關(guān)因素,結(jié)果見表 23.其中畢業(yè)去向 “1”= 工作 ,“2 ”= 讀研,“3 ”= 出國(guó)留學(xué) 。 性別 “1”= 男生,“0 ”= 女生 。 用多類別的 Logisitic 回歸分析影響畢業(yè)去向的因素。專業(yè)課 x1英語(yǔ) x2性別 x3月生活費(fèi) x4畢業(yè)去向 y兩個(gè)統(tǒng)計(jì)量的P 值均大于 0.05 ,說(shuō)明模型擬合的較好。.專業(yè)學(xué)習(xí)資料.檢驗(yàn)全局零假設(shè): BETA=0 無(wú)效假設(shè)檢驗(yàn)結(jié)果(

10、似然比 ,評(píng)分)的結(jié)果 P 值均小于0.01 ,具有顯著統(tǒng)計(jì)學(xué)意義 。三個(gè)變量中 ,有兩個(gè)是不顯著的變量, x3,x2, 剔除 x3:兩個(gè)統(tǒng)計(jì)量的P 值均大于 0.05 ,說(shuō)明模型擬合的較好。.專業(yè)學(xué)習(xí)資料.檢驗(yàn)全局零假設(shè): BETA=0 無(wú)效假設(shè)檢驗(yàn)結(jié)果(似然比 ,評(píng)分 ,wald )的結(jié)果 P 值均小于0.01 ,具有顯著統(tǒng)計(jì)學(xué)意義 。三個(gè)變量都是顯著的。以 x4= “1”,即參加工作 ,為參照 。由模型可以看出:.專業(yè)學(xué)習(xí)資料.exp( -19.116 0.17 x10.038x2 0.004x4 )p( y 2)exp( -18.01 0.012x1 0.122x2 0.0101x4

11、)1 exp( -19.116 0.17x1 0.038x2 0.004 x4 )exp( -18.010.012x10.122 x2 0.0101x4 )p( y 3)0.004x4 )exp( -18.01 0.012x1 0.122x2 0.0101x4 )1 exp( -19.116 0.17x1 0.038x2從參數(shù)估計(jì)表中,與參加工作的同學(xué)相比,讀研的 ( y=2 )的同學(xué)相比 ,讀研的同學(xué)其專業(yè)課成績(jī)更好 (x1 的 P 值 =0.003 ), 而外語(yǔ)成績(jī) ( x2 的 p 值 =0.356 )和經(jīng)濟(jì)狀況 ( x4 的 P 值 =0.184 )沒有顯著差異 ;出國(guó)留學(xué)的 ( y=

12、3 )學(xué)生其專業(yè)課成績(jī)和參加工作的沒有顯著差異,外語(yǔ)成績(jī)和經(jīng)濟(jì)狀況則更好 。Sas 程序:dataa;inputx1 x2 x3 x4 y;cards ;9565.01600 26362.00850 18253.00700 26088.00850 37265.01750 18585.00100039595.0012002.專業(yè)學(xué)習(xí)資料.9292.01950 26363.00850 17875.01900 19078.00500 18283.01750 28065.01850 38375.00600 26090.00650 37590.01800 26383.01700 18575.00750

13、27386.00950 28666.01150039363.00130027372.00850 18660.01950 27663.00110019686.00750 27175.01100016372.01850 26088.00650 16795.01500 1.專業(yè)學(xué)習(xí)資料.8693.0 0550 16376.0 0650 18686.0 0750 27685.0 1650 18292.0 1950 37360.0 0800 18285.0 1750 27575.0 0750 17263.0 1650 18188.0 0850 39296.0 1950 2;run ;procprint

14、;run ;proclogistic;class x3;modely( ref = '3' )=x1 x2 x3 x4/ link =glogitaggregatescale =none ;run ;proclogistic;class x3;modely( ref = '3' )=x1 x2x4/ link =glogitaggregatescale =none ;.專業(yè)學(xué)習(xí)資料.run ;proclogistic;class x3;modely( ref = '1' )=x1 x2x4/ link =glogitaggregatescale

15、=none ;run ;六 收獲與思考七. 思考題當(dāng)自變量是定性變量的時(shí)候,我們需要引進(jìn)虛擬變量進(jìn)行數(shù)量化,當(dāng)定性變量有n 個(gè)水平的時(shí)候,我們?cè)撘M(jìn)多少的虛擬變量,否則會(huì)怎樣 ?不妨試試在sas 中試試會(huì)出現(xiàn)什么問(wèn)題。答:當(dāng)定性變量有n 個(gè)水平時(shí)應(yīng)該引進(jìn)n-1 個(gè)虛擬變量 。否則最后一個(gè)虛擬變量無(wú)法用最小二乘估計(jì)計(jì)算出來(lái) 。例: X1-X3 為虛擬變量 。Data a;input x1 x2 x3 x y;cards ;.專業(yè)學(xué)習(xí)資料.procregdata =a;modely=x1-x3 x;run ;X3 沒有參數(shù)估計(jì)結(jié)果。因?yàn)?x1 x2 x3出現(xiàn)完全共線性, x1 x2 均為 0 時(shí)即

16、代表了x3 為 1.表 21iyx1公司類型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份表 22.專業(yè)學(xué)習(xí)資料.序號(hào)hy序號(hào)hy(m(m)11.500141.76121.520151.78031.540161.80141.560171.82051.581181.84061.600191.86171.620201.

17、88181.640211.90091.660221.921101.681231.940111.700241.961121.720251.981131.740262.001表 23序號(hào)專業(yè)課 x1英語(yǔ) x2性別 x3月生活費(fèi) x4畢業(yè)去向 y19565.01600226362.00850138253.00700246088.00850357265.01750168585.001000379595.001200289292.01950296363.008501.專業(yè)學(xué)習(xí)資料.107875.019001119078.005001128283.017502138065.018503148375.006002156090.006503167590.018002176383.017001188575.007502197386.009502208666.0115003219363

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論