版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Slide 1彭斌直線相關(guān)與回歸分析直線相關(guān)與回歸分析Linear Correlation and RegressionSlide 2彭斌相關(guān)分析和回歸分析是研究變量與變量間相互關(guān)系的重要方法。為此,SAS系統(tǒng)提供了強(qiáng)大的相關(guān)分析與回歸分析手段。相關(guān)分析可用CORR過(guò)程來(lái)處理,而回歸分析則可用REG過(guò)程來(lái)完成。當(dāng)然,特殊的回歸分析SAS提供了專(zhuān)用的過(guò)程。這里,僅僅討論CORR過(guò)程和REG過(guò)程的常規(guī)用法。Slide 3彭斌 PROC CORR ; VAR variables;一、直線相關(guān)分析一、直線相關(guān)分析 SAS提供的相關(guān)分析過(guò)程是提供的相關(guān)分析過(guò)程是CORR過(guò)程,它位于過(guò)程,它位于BASE模
2、塊中,可模塊中,可以計(jì)算的相關(guān)系數(shù)有:以計(jì)算的相關(guān)系數(shù)有:PearsonPearson積差相關(guān)系數(shù)、積差相關(guān)系數(shù)、SpearmanSpearman等級(jí)相關(guān)等級(jí)相關(guān)系數(shù)、系數(shù)、KendallKendalls tau-bs tau-b統(tǒng)計(jì)量、統(tǒng)計(jì)量、HoeffdingHoeffdings s獨(dú)立性分析統(tǒng)計(jì)量獨(dú)立性分析統(tǒng)計(jì)量D D。此外,還可以計(jì)算偏相關(guān)系數(shù)等。此外,還可以計(jì)算偏相關(guān)系數(shù)等。CORR過(guò)程只有第一條語(yǔ)句(下劃線部份)是必需的,其它過(guò)程只有第一條語(yǔ)句(下劃線部份)是必需的,其它語(yǔ)句都是可選的。語(yǔ)句都是可選的。 常用語(yǔ)句及格式:Slide 4彭斌語(yǔ)句說(shuō)明1、PROC CORR option
3、s; 這里的選項(xiàng)有20多項(xiàng)。我們現(xiàn)在只介紹最簡(jiǎn)單的兩個(gè)選項(xiàng): 缺省值:即第一條語(yǔ)句只有兩個(gè)單詞加上分號(hào),即Proc corr; 這時(shí),SAS系統(tǒng)計(jì)算Pearson積差相關(guān)系數(shù)(普通相關(guān)系數(shù))和進(jìn)行顯著性檢驗(yàn),以及簡(jiǎn)單統(tǒng)計(jì)量。 Spearman:即 Proc corr spearman; 此時(shí),SAS系統(tǒng)計(jì)算Spearman等級(jí)相關(guān)系數(shù)。2、VAR variables; 指明要計(jì)算相關(guān)系數(shù)的變量。Slide 5彭斌例7-1 為了了解年齡與總膽固醇之間的關(guān)系,隨機(jī)抽查了20高血脂病人治療前的總膽固醇水平(mmol/L)與年齡,資料見(jiàn)下表。試問(wèn)年齡與膽固醇之間是否存在相關(guān)關(guān)系?年齡年齡膽固醇膽固醇2
4、4245.435.43606010.2710.2728287.497.4930306.346.34525210.5310.5352529.009.0023234.714.7125257.857.85484811.2811.2830306.486.48363610.0110.0120204.944.9444449.499.4950508.018.01575711.7311.73575710.4510.4551519.729.7234345.725.7237377.127.1231317.547.54Slide 6彭斌首先建立首先建立SAS數(shù)據(jù)集數(shù)據(jù)集 data ex71; input age c
5、hol; cards; 245.43 6010.27 287.49 . 519.72 345.72 377.12 317.54 ; run;由于數(shù)據(jù)太長(zhǎng),此處以省略號(hào)代之Slide 7彭斌調(diào)用調(diào)用CORR過(guò)程過(guò)程 PROC CORR data=ex71; RUN;程序中只有兩條語(yǔ)句,第一條語(yǔ)句調(diào)用程序中只有兩條語(yǔ)句,第一條語(yǔ)句調(diào)用CORR過(guò)程,過(guò)程,并指明分析數(shù)據(jù)集;第二條詞句就是程序結(jié)束語(yǔ)并指明分析數(shù)據(jù)集;第二條詞句就是程序結(jié)束語(yǔ)句句RUN。程序中沒(méi)有程序中沒(méi)有VAR語(yǔ)句,則語(yǔ)句,則SAS系統(tǒng)對(duì)數(shù)據(jù)集中所有系統(tǒng)對(duì)數(shù)據(jù)集中所有數(shù)值型變量進(jìn)行相關(guān)分析。數(shù)值型變量進(jìn)行相關(guān)分析。Slide 8彭斌分
6、析結(jié)果分析結(jié)果The CORR Procedure2 Variables:age chol Simple StatisticsVariableNMeanStd DevSumMinimumMaximumage2039.4500013.01204789.0000020.0000060.00000chol208.205502.17555164.110004.7100011.73000 Pearson Correlation Coefficients, N = 20 Prob |r| under H0: Rho=0 agecholage1.00000 0.84993.0001chol0.84993.0
7、0011.00000 第一行為相關(guān)第一行為相關(guān)系數(shù)系數(shù)第二行為假設(shè)第二行為假設(shè)檢驗(yàn)檢驗(yàn)P值值Slide 9彭斌CORR過(guò)程的默認(rèn)輸出結(jié)果主要包括各個(gè)變量的簡(jiǎn)單統(tǒng)過(guò)程的默認(rèn)輸出結(jié)果主要包括各個(gè)變量的簡(jiǎn)單統(tǒng)計(jì)描述和一個(gè)相關(guān)系數(shù)矩陣。計(jì)描述和一個(gè)相關(guān)系數(shù)矩陣。 簡(jiǎn)單統(tǒng)計(jì)描述:包括變量名、例數(shù)、均數(shù)、標(biāo)準(zhǔn)差等,簡(jiǎn)單統(tǒng)計(jì)描述:包括變量名、例數(shù)、均數(shù)、標(biāo)準(zhǔn)差等,這些都是前面的統(tǒng)計(jì)過(guò)程經(jīng)常出現(xiàn)的。這些都是前面的統(tǒng)計(jì)過(guò)程經(jīng)常出現(xiàn)的。相關(guān)系數(shù)矩陣:相關(guān)系數(shù)矩陣: 在相關(guān)系數(shù)矩陣的上方指明了相關(guān)系數(shù)的類(lèi)型,如本在相關(guān)系數(shù)矩陣的上方指明了相關(guān)系數(shù)的類(lèi)型,如本例是例是”P(pán)earson Correlation Coef
8、ficients”,接下來(lái)就是對(duì)接下來(lái)就是對(duì)相關(guān)系數(shù)矩陣的說(shuō)明,矩陣中每一個(gè)格子有兩個(gè)數(shù)據(jù),相關(guān)系數(shù)矩陣的說(shuō)明,矩陣中每一個(gè)格子有兩個(gè)數(shù)據(jù),上方的數(shù)據(jù)是對(duì)應(yīng)變量的相關(guān)系數(shù),其下方的數(shù)據(jù)是上方的數(shù)據(jù)是對(duì)應(yīng)變量的相關(guān)系數(shù),其下方的數(shù)據(jù)是該相關(guān)系數(shù)的顯著性檢驗(yàn)。該相關(guān)系數(shù)的顯著性檢驗(yàn)。本例中,本例中,age與與chol的相關(guān)系數(shù)的相關(guān)系數(shù)r=0.84993,p |r| under H0: Rho=0 agecholage1.00000 0.84456.0001chol0.84456.00011.00000 本例計(jì)算的本例計(jì)算的age與與chol的的等級(jí)相關(guān)系數(shù)等級(jí)相關(guān)系數(shù)rs=0.84456,p F
9、Model164.9613664.9613646.84 |t|Intercept12.599510.860443.020.0073age10.142100.020766.84.0001模型的顯著性檢驗(yàn)一些統(tǒng)計(jì)量參數(shù)估計(jì)及檢驗(yàn)Slide 17彭斌結(jié)果的解釋結(jié)果的解釋 結(jié)果主要分為三部份:回歸模型的顯著性檢驗(yàn)、一些統(tǒng)計(jì)量、回歸參數(shù)的估計(jì)及檢驗(yàn)。 對(duì)回歸模型的顯著性檢驗(yàn):F=46.84,p.0001,可以認(rèn)為回歸模型是成立的。 一些統(tǒng)計(jì)量包括:Root MSE(均方根),即誤差均方的平方根;R-Square(R2),即決定系數(shù); Adj R-Sq(校正R平方);Coeff Var(應(yīng)變量的變異系數(shù))。 參數(shù)估計(jì)及檢驗(yàn):回歸方程的截距intercept= 2.59951,自變量age的回歸系數(shù)為0.14210,因此回歸方程為: chol=2.59951+0.14210age 對(duì)回歸系數(shù)的假設(shè)檢驗(yàn)得t=6.84,p |t|StandardizedEstimateIntercept12.599510.860443.020.00730age1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《普洱茶包裝的設(shè)計(jì)研究》
- 《清腸解毒方聯(lián)合化療治療濕熱蘊(yùn)結(jié)型晚期結(jié)直腸癌的臨床研究》
- 不帶括號(hào)的兩步混合運(yùn)算
- 2024年度互聯(lián)網(wǎng)金融擔(dān)保合同標(biāo)準(zhǔn)示范3篇
- 2024年互聯(lián)網(wǎng)企業(yè)員工數(shù)據(jù)安全保密合同范本2篇
- 2024年互聯(lián)網(wǎng)企業(yè)產(chǎn)品經(jīng)理聘任合同2篇
- 2024年度國(guó)有企業(yè)員工勞動(dòng)合同解除合同3篇
- 2024年時(shí)尚生活類(lèi)雜志訂閱與品牌授權(quán)合同3篇
- 頭顯電池續(xù)航提升-洞察分析
- 采購(gòu)服務(wù)合同格式3篇
- 【9歷期末】安徽省合肥市包河區(qū)智育聯(lián)盟2023-2024學(xué)年九年級(jí)上學(xué)期1月期末歷史試題
- 大學(xué)生朋輩心理輔導(dǎo)智慧樹(shù)知到期末考試答案章節(jié)答案2024年浙江大學(xué)
- 中國(guó)馬克思主義與當(dāng)代2021版教材課后思考題
- CNAS-TRC-014_2018《能源管理體系(EnMS)能源績(jī)效參數(shù)和能源基準(zhǔn)的建立方法及認(rèn)證審核》
- 旋轉(zhuǎn)式濾水器控制系統(tǒng)設(shè)計(jì)1
- 考試焦慮及相關(guān)因素研究
- 崗位風(fēng)險(xiǎn)告知卡(40個(gè)風(fēng)險(xiǎn)點(diǎn))
- 質(zhì)量體系審核不符合項(xiàng)案例
- 鉆井工程巖石力學(xué)與破巖原理
- 《熱軋U型鋼板樁》國(guó)家標(biāo)準(zhǔn)——報(bào)審稿
- 最新工程簽證單范本
評(píng)論
0/150
提交評(píng)論