方差分析和回歸分析課件_第1頁
方差分析和回歸分析課件_第2頁
方差分析和回歸分析課件_第3頁
方差分析和回歸分析課件_第4頁
方差分析和回歸分析課件_第5頁
已閱讀5頁,還剩225頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第五章 方差分析和回歸分析第一節(jié) 單因素方差分析第二節(jié) 雙因素方差分析第三節(jié) 相關(guān)分析第四節(jié) 回歸分析第五章 方差分析和回歸分析第一節(jié) 單因素方差分析掌握單因素方差分析F檢驗(yàn)的內(nèi)容并理解多重比較的基本原理了解雙因素方差分析的基本概念與原理掌握相關(guān)關(guān)系的概念、皮爾遜相關(guān)系數(shù)的估計(jì)和檢驗(yàn)了解斯皮爾曼秩相關(guān)和肯德爾相關(guān)的原理學(xué)習(xí)要求掌握單因素方差分析F檢驗(yàn)的內(nèi)容并理解多重比較的基本原理學(xué)習(xí)掌握一元線性回歸模型的基本概念、回歸系數(shù)的最小二乘估計(jì)理解因變量與自變量之間線性關(guān)系的檢驗(yàn)和回歸系數(shù)的檢驗(yàn)了解多元線性回歸分析和邏輯斯蒂回歸分析學(xué)習(xí)要求掌握一元線性回歸模型的基本概念、回歸系數(shù)的最小二乘估計(jì)學(xué)習(xí)知識

2、結(jié)構(gòu)圖第五章方差分析與回歸分析單因素方差分析方差分析的F檢驗(yàn)方差分析的多重比較多因素方差分析無交互作用的雙因素方差分析有交互作用的雙因素方差分析相關(guān)分析皮爾遜相關(guān)系數(shù)斯皮爾曼秩相關(guān)系數(shù)肯德爾相關(guān)系數(shù)回歸分析一元線性相關(guān)分析多元線性相關(guān)分析邏輯斯蒂回歸知識結(jié)構(gòu)圖第五章單因素方差分析方差分析的F檢驗(yàn)方差分析的多重第一節(jié) 單因素方差分析一、方差分析的概念二、單因素方差分析的F檢驗(yàn)三、方差分析中的多重比較第一節(jié) 單因素方差分析一、方差分析的概念方差分析(Analysis of Variance;ANOVA)是費(fèi)希爾(R.A.Fisher)在分析生物和農(nóng)業(yè)實(shí)驗(yàn)數(shù)據(jù)時(shí)提出來的,通過檢驗(yàn)多個(gè)總體均值是否相等

3、,來判斷一個(gè)或多個(gè)分類型變量對某一關(guān)心的數(shù)值型變量是否有影響。數(shù)值型變量被稱為因變量,分類型自變量被稱為“因素”或“因子”,因素的不同狀態(tài)被稱為水平或處理一、方差分析的概念方差分析(Analysis of Variance;ANOV進(jìn)行方差分析需要滿足三個(gè)基本假定:(1)每個(gè)因素水平組合下的觀測或?qū)嶒?yàn)數(shù)據(jù)服從正態(tài)分布(2)正態(tài)分布的方差是相等的(3)觀測或?qū)嶒?yàn)數(shù)據(jù)相互獨(dú)立,即這些觀測或?qū)嶒?yàn)時(shí)是互不干擾、獨(dú)立進(jìn)行的一、方差分析的概念進(jìn)行方差分析需要滿足三個(gè)基本假定:一、方差分析的概念按照所研究的因素個(gè)數(shù)的不同:方差分析單因素方差分析多因素方差分析二、單因素方差分析的F檢驗(yàn)按照所研究的因素個(gè)數(shù)的不

4、同:方差分析單因素方差分析多因素方差記因素為A,它有k個(gè)水平: 在每個(gè)水平 下有數(shù)據(jù) 這里 ,并且不要求每個(gè)水平下的數(shù)據(jù)量 相等,總樣本量記為 在數(shù)據(jù)滿足三個(gè)基本假定的前提下,所謂的“因素沒有影響”就意味著每個(gè)水平下的總體均值是相等的,“因素有影響”就意味著這些均值必然不全相等。二、單因素方差分析的F檢驗(yàn)記因素為A,它有k個(gè)水平: 二、單因素方差分析的F檢驗(yàn)因此,方差分析實(shí)際上就是要對如下的原假設(shè)與備擇假設(shè)進(jìn)行假設(shè)檢驗(yàn):二、單因素方差分析的F檢驗(yàn)因此,方差分析實(shí)際上就是要對如下的二、單因素方差分析的F檢驗(yàn)表5-1 單因素方差分析的數(shù)據(jù)結(jié)構(gòu)二、單因素方差分析的F檢驗(yàn)表5-1 單因素方差分析的數(shù)據(jù)

5、結(jié)二、單因素方差分析的F檢驗(yàn)基于表5-1的數(shù)據(jù),可有如下定義:總離差平方和組間離差平方和二、單因素方差分析的F檢驗(yàn)基于表5-1的數(shù)據(jù),可有如下定義:二、單因素方差分析的F檢驗(yàn)組內(nèi)離差平方和其中 為第i 個(gè)水平下的樣本平均數(shù), 為總樣本平均數(shù)。二、單因素方差分析的F檢驗(yàn)組內(nèi)離差平方和二、單因素方差分析的F檢驗(yàn)可以證明: 其中: SST反映了因變量全部觀測值的總變動 SSA反映了樣本均值不同水平之間的差異程度,它一般有兩個(gè)方面的來源,一是由于因素取不同水平所導(dǎo)致的因變量取不同值的影響,即系統(tǒng)因素,二是隨機(jī)誤差的影響 SSE反映的是每一因素水平下樣本內(nèi)各個(gè)觀測值的變動程度,它源于隨機(jī)誤差的影響。二、

6、單因素方差分析的F檢驗(yàn)可以證明: 二、單因素方差分析的F檢驗(yàn)定義 它近似反映了在因變量的總變動中可以由因素解釋的部分所占的比例,是一種對因素與因變量之間的關(guān)系強(qiáng)度的測量二、單因素方差分析的F檢驗(yàn)定義 二、單因素方差分析的F檢驗(yàn)可以證明,在原假設(shè)成立的條件下,下面的統(tǒng)計(jì)量服從自由度為 的 分布,即上式中k-1, n-k分別是組間離差平方和與組內(nèi)離差平方和的自由度二、單因素方差分析的F檢驗(yàn)可以證明,在原假設(shè)成立的條件下,下二、單因素方差分析的F檢驗(yàn)在原假設(shè)成立的情況下,由于因素的不同水平對于因變量的取值沒有影響,那么組間離差平方和中就只包含隨機(jī)誤差的影響而沒有系統(tǒng)誤差的影響,這時(shí)組間均方誤差MSA

7、(組間離差平方和除以它的自由度k-1)與組內(nèi)均方誤差MSE(組內(nèi)離差平方和除以它的自由度n-k)就應(yīng)該很接近,它們的比值就會接近1二、單因素方差分析的F檢驗(yàn)在原假設(shè)成立的情況下,由于因素的不二、單因素方差分析的F檢驗(yàn)如果原假設(shè)不成立,即因素的不同水平對于因變量的取值有顯著影響,那么組間離差平方和中除了包含隨機(jī)誤差的影響外,還會受到系統(tǒng)誤差的影響,這時(shí)組間均方誤差MSA就會大于組內(nèi)均方誤差MSE,它們的比值就會大于1。當(dāng)這個(gè)比值大到某種程度時(shí),根據(jù)小概率事件原理,就認(rèn)為因素的不同水平對因變量的取值有顯著影響,即自變量對因變量有顯著影響。二、單因素方差分析的F檢驗(yàn)如果原假設(shè)不成立,即因素的不同水平

8、二、單因素方差分析的F檢驗(yàn)做統(tǒng)計(jì)判斷時(shí),可以利用樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的具體值,然后計(jì)算該具體值所對應(yīng)的p值,用p值與給定的顯著性水平 的大小進(jìn)行比較來決策,若 時(shí),就拒絕原假設(shè),否則不拒絕?;蛘吒鶕?jù)所給定的顯著性水平 計(jì)算相應(yīng)的臨界值 ,然后比較其與檢驗(yàn)統(tǒng)計(jì)量的具體值F的大小進(jìn)行判斷,若 時(shí),就拒絕原假設(shè),否則不拒絕。二、單因素方差分析的F檢驗(yàn)做統(tǒng)計(jì)判斷時(shí),可以利用樣本數(shù)據(jù)計(jì)算三、方差分析中的多重比較多重比較方法是通過對各水平下總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底是哪些水平之間存在差異。多重比較的方法很多,常用的有最小顯著差異法(Least Significant Difference;L

9、SD)、Bonferroni法、Scheffe法、Tukey法、Duncan多重區(qū)域檢驗(yàn)法等,這里僅介紹LSD三、方差分析中的多重比較多重比較方法是通過對各水平下總體均值三、方差分析中的多重比較第一步:提出原假設(shè)與備擇假設(shè) 第二步:計(jì)算具體的 的值;三、方差分析中的多重比較第一步:提出原假設(shè)與備擇假設(shè)三、方差分析中的多重比較第三步:計(jì)算LSD,其公式為 是自由度為 的t分布的臨界值 是給定的顯著性水平第四步:進(jìn)行決策,如果 則拒絕 ;否則不拒絕 三、方差分析中的多重比較第三步:計(jì)算LSD,其公式為【例5-1】一家管理咨詢公司為不同的客戶舉辦人力資源講座。每次講座的內(nèi)容基本上是一樣的,但講座的聽

10、課者有時(shí)是高級管理者,有時(shí)是中級管理者,有時(shí)是初級管理者。該咨詢公司認(rèn)為,不同層次的管理者對講座的滿意度可能存在差異。聽完講座后隨機(jī)抽取不同層次的管理者的滿意度評分如表5-2所示(評分標(biāo)準(zhǔn)為1-10,10代表非常滿意):【例5-1】一家管理咨詢公司為不同的客戶舉辦人力資源講座。每【例5-1】表5-2 不同層次管理者的滿意度高級管理者中級管理者初級管理者77879898109108565748【例5-1】表5-2 不同層次管理者的滿意度高級管理者中級【解】(1)建立原假設(shè)與備擇假設(shè)(2)計(jì)算有關(guān)的均值及離差平方和試據(jù)此檢驗(yàn)管理者的層次不同是否會導(dǎo)致評分的顯著差異,如果是,究竟存在于哪些層次之間(

11、取顯著性水平 )【解】(1)建立原假設(shè)與備擇假設(shè)試據(jù)此檢驗(yàn)管理者的層次不同是【解】【解】【解】(3)列出方差分析表表5-3 方差分析表方差來源離差平方和S自由度df均方MSF組間29.610214.80511.756組內(nèi)18.890151.259總計(jì)48.50017【解】(3)列出方差分析表表5-3 方差分析表方差來源離差【解】(4)統(tǒng)計(jì)決策對顯著性水平 ,能夠得到 由于檢驗(yàn)統(tǒng)計(jì)量 所以拒絕原假設(shè),即有95%的把握認(rèn)為不同層次的管理者對講座的滿意度是不同的。當(dāng)然也可以通過比較p值與顯著性水平 的大小來決策,在這里可以計(jì)算出p值為0.001,它遠(yuǎn)遠(yuǎn)小于0.05 ,因此決策結(jié)果同樣是拒絕原假設(shè)?!?/p>

12、解】(4)統(tǒng)計(jì)決策【解】(5)多重比較拒絕了原假設(shè),說明管理者層次對講座的滿意度得分確實(shí)存在顯著性差異,但具體是哪些水平之間存在差異,還需要進(jìn)行多重比較才能判斷。由題意及計(jì)算可知:【解】(5)多重比較【解】(5)多重比較第一步:提出假設(shè)第二步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值【解】(5)多重比較【解】(5)多重比較第三步:計(jì)算LSD由表5-3可知, MSE=1.259 ,又知道 ,得到下面LSD值【解】(5)多重比較【解】(5)多重比較第四步:進(jìn)行決策由以上計(jì)算可知, 顯示中級管理者與初級管理者之間以及高級管理者與初級管理者之間的差異顯著,但高級管理者與中級管理者之間的差異在統(tǒng)計(jì)上不顯著。【解】(5)多重比

13、較【在SPSS中的實(shí)現(xiàn)】具體操作步驟如下:(1)選擇菜單“分析(A)比較均值(M)單因素(ANOVA)”,于是出現(xiàn)圖5-1所示的主對話框;(2)選擇“滿意度得分”到“因變量列表(E) “框,選擇“所屬管理層次”到“因子(F)”框;【在SPSS中的實(shí)現(xiàn)】具體操作步驟如下:圖5-1 單因素方差分析主對話框圖5-1 單因素方差分析主對話框具體操作步驟如下:(3)單擊“兩兩比較(H)”按鈕 ,打開兩級對話框如圖5-2所示,勾中復(fù)選框“LSD(L)”,然后點(diǎn)擊按鈕“繼續(xù)”回到原窗口?!驹赟PSS中的實(shí)現(xiàn)】具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】圖5-2 兩兩比較對話框圖5-2 兩兩比較對話框(4)單擊“

14、確定”按鈕,SPSS的輸出結(jié)果如表5-4和表5-5所示。表5-4 滿意度得分的方差分析表平方和自由度df均方F顯著性組間29.610214.80511.756.001組內(nèi)18.890151.259總數(shù)48.50017【在SPSS中的實(shí)現(xiàn)】(4)單擊“確定”按鈕,SPSS的輸出結(jié)果如表5-4和表5-表5-5 滿意度得分的多重比較(I) 所屬管理層次(J) 所屬管理層次均值差 (I-J)標(biāo)準(zhǔn)誤顯著性95% 置信區(qū)間下限上限高級中級-1.257.657.075-2.66.14初級1.767*.680.020.323.22中級高級1.257.657.075-.142.66初級3.024*.624.00

15、01.694.35初級高級-1.767*.680.020-3.22-.32中級-3.024*.624.000-4.35-1.69*意味著結(jié)果顯著 【在SPSS中的實(shí)現(xiàn)】表5-5 滿意度得分的多重比較(I) 所屬管理層次(J) 第五章 方差分析和回歸分析第一節(jié) 單因素方差分析第二節(jié) 雙因素方差分析第三節(jié) 相關(guān)分析第四節(jié) 回歸分析第五章 方差分析和回歸分析第一節(jié) 單因素方差分析第二節(jié) 雙因素方差分析一、問題的提出二、無交互作用的雙因素方差分析三、有交互作用的雙因素方差分析第二節(jié) 雙因素方差分析一、問題的提出單因素方差分析只考慮一個(gè)因素對因變量的影響,它可以進(jìn)一步拓展為多因素方差分析。雙因素方差分析

16、是多因素方差分析最簡單的一種情形,它旨在判斷兩個(gè)因素中某一個(gè)或兩個(gè)因素對因變量是否有顯著影響,以及兩個(gè)因素的不同搭配是否有新效應(yīng)。一、問題的提出單因素方差分析只考慮一個(gè)因素對因變量的影響,它可以進(jìn)一步拓展記某一因素為A,它有r個(gè)水平記另一個(gè)因素為B,它有s個(gè)水平因變量記為X研究的目的:要分析因素A和因素B對因變量X取值的影響一、問題的提出記某一因素為A,它有r個(gè)水平一、問題的提出如果因素A和因素B對因變量X取值的影響是相互獨(dú)立的,這時(shí)只需分別判斷這兩個(gè)因素的影響,這被稱為無交互作用的雙因素方差分析如果這兩個(gè)因素的影響不是相互獨(dú)立的,也就是說兩個(gè)因素互相搭配的效果會對因變量X的取值產(chǎn)生一種新的影

17、響,也就是說兩個(gè)因素有交互效應(yīng),就稱之為有交互作用的雙因素方差分析一、問題的提出如果因素A和因素B對因變量X取值的影響是相互獨(dú)立的,這時(shí)只需二、無交互作用的雙因素方差分析在A的r個(gè)水平和B的s個(gè)水平的每一種組合下做一次觀測或試驗(yàn),可以得到無交互作用的雙因素方差分析的數(shù)據(jù)結(jié)構(gòu),如表5-6所示。如果在每一組合下做兩次以上的觀測或試驗(yàn),就能進(jìn)一步考察交互作用了。二、無交互作用的雙因素方差分析在A的r個(gè)水平和B的s個(gè)水平的二、無交互作用的雙因素方差分析表5-6 無交互作用雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)二、無交互作用的雙因素方差分析表5-6 無交互作用雙因素方二、無交互作用的雙因素方差分析在表5-6中:二、無

18、交互作用的雙因素方差分析在表5-6中:二、無交互作用的雙因素方差分析對于無交互作用的雙因素方差分析,其分析原理與單因素方差分析相同。判斷因素A的影響是否顯著等價(jià)于檢驗(yàn)原假設(shè):判斷因素B的影響是否顯著等價(jià)于檢驗(yàn)原假設(shè):其中 表示A的第i個(gè)水平構(gòu)成的總體的均值; 表示B的第j個(gè)水平構(gòu)成的總體的均值。二、無交互作用的雙因素方差分析對于無交互作用的雙因素方差分析二、無交互作用的雙因素方差分析為了檢驗(yàn)這些假設(shè),同樣需要對總離差平方和SST進(jìn)行分解,可以證明其中二、無交互作用的雙因素方差分析為了檢驗(yàn)這些假設(shè),同樣需要對總二、無交互作用的雙因素方差分析二、無交互作用的雙因素方差分析二、無交互作用的雙因素方差

19、分析SSA主要反映了因素A的不同水平引起的因變量的變動,如果因素A各水平之間沒有差異,SSA僅僅反映了隨機(jī)誤差的純效應(yīng)SSB主要反映了因素B的不同水平引起的變動,如果因素B各水平之間沒有差異, SSB也僅僅反映了隨機(jī)誤差的純效應(yīng);SSE中只有數(shù)據(jù)隨機(jī)誤差效應(yīng)的影響。二、無交互作用的雙因素方差分析SSA主要反映了因素A的不同水二、無交互作用的雙因素方差分析在一定條件下,可以證明在原假設(shè) 成立的條件下二、無交互作用的雙因素方差分析在一定條件下,可以證明在原假設(shè)二、無交互作用的雙因素方差分析在原假設(shè) 成立的條件下上列式子中, 和 分別是SSA、SSB和SSE的自由度,可以利用上面兩個(gè)表達(dá)式作為檢驗(yàn)統(tǒng)

20、計(jì)量。二、無交互作用的雙因素方差分析在原假設(shè)上列式子中, 和 二、無交互作用的雙因素方差分析表5-7 無交互作用的雙因素方差分析表方差來源平方和S自由度df均方MSF值因素ASSAr-1MSA=SSA/(r-1)MSA/MSE因素BSSBs-1MSB=SSB/(s-1)MSB/MSE隨機(jī)誤差SSE(r-1)(s-1)MSE=SSE/(r-1)(s-1)總計(jì)SSTrs-1二、無交互作用的雙因素方差分析表5-7 無交互作用的雙因素【例5-2】為研究食品的包裝方法和銷售部門對其銷量是否有影響,在三個(gè)銷售部門用三種不同包裝進(jìn)行銷售,獲得的銷量數(shù)據(jù)如下,取顯著性水平為0.05,檢驗(yàn)不同的銷售部門和不同的

21、包裝方法對該食品的銷量是否有顯著影響。【例5-2】為研究食品的包裝方法和銷售部門對其銷量是否有影響【例5-2】表5-7 無交互作用的雙因素方差分析表銷售部門(A)包裝方法(B)盒裝袋裝散裝一部二部三部420480530228245270347369412【例5-2】表5-7 無交互作用的雙因素方差分析表銷售部門【解】(1)建立原假設(shè)(2)計(jì)算相應(yīng)的離差平方和【解】(1)建立原假設(shè)【解】【解】【解】(3)列出方差分析表方差來源平方和SS自由度df均方MSF值因素A7868.2223934.1112.32因素B79044.22239522.11123.79隨機(jī)誤差1277.114319.28總計(jì)8

22、8189.568表5-9 方差分析表【解】(3)列出方差分析表方差來源平方和SS自由度df均方M【解】(4)統(tǒng)計(jì)判斷對于顯著性水平0.05,能夠查表或用軟件得到臨界值 因?yàn)橛纱丝梢耘袛?,銷售部門和包裝方法對于銷售量的影響均是顯著的?!窘狻浚?)統(tǒng)計(jì)判斷具體操作步驟如下:(1)選擇菜單“分析(A)一般線性模型(G)單變量(U)”,就會出現(xiàn)如圖5-3所示的窗口。選擇“銷售量”到“因變量(D)”框,選擇“銷售部門”和“包裝方法”到“固定因子(F)”框?!驹赟PSS中的實(shí)現(xiàn)】具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】圖5-3 雙因素方差分析主對話框圖5-3 雙因素方差分析主對話框具體操作步驟如下:(2)

23、點(diǎn)擊“模型(M)”按鈕,打開如圖5-4所示的對話框,“指定模型”選擇“設(shè)定(C)”,然后設(shè)定模型結(jié)構(gòu):把“因子與協(xié)變量(F)”中的因素列表選入“模型(M)”框,“構(gòu)建項(xiàng)”選擇“主效應(yīng)”;“平方和(Q)”選擇“類型III”,勾中復(fù)選框“在模型中包含截距(I)”,具體見圖5-4?!驹赟PSS中的實(shí)現(xiàn)】具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】圖5-4 模型設(shè)定對話框圖5-4 模型設(shè)定對話框(3)點(diǎn)擊“繼續(xù)”回到圖5-3的窗口,點(diǎn)擊“確定”即可得到最終的輸出結(jié)果,整理后見表5-10?!驹赟PSS中的實(shí)現(xiàn)】表5-10 銷售量的無交互作用的雙因素方差分析表源III 型平方和df均方FSig.校正模型869

24、12.444421728.11168.054.001截距1210733.44411210733.4443792.101.000銷售部門7868.22223934.11112.322.020包裝方法79044.222239522.111123.786.000誤差1277.1114319.278總計(jì)1298923.0009校正的總計(jì)88189.5568(3)點(diǎn)擊“繼續(xù)”回到圖5-3的窗口,點(diǎn)擊“確定”即可得到最由上表可以看出,因素A對應(yīng)的p值為0.020(實(shí)際為0.01951),因素B對應(yīng)的p值為0.000(實(shí)際為0.00025),通過與顯著性水平0.05比較,兩者都小于0.05,均拒絕原假設(shè),同

25、樣得到了銷售部門和包裝方法對于銷售量的影響均是顯著的結(jié)論?!驹赟PSS中的實(shí)現(xiàn)】由上表可以看出,因素A對應(yīng)的p值為0.020(實(shí)際為0.01三、有交互作用的雙因素方差分析交互作用,就是兩個(gè)因素對觀測或試驗(yàn)數(shù)據(jù)值的影響效應(yīng)不是簡單的疊加,而是跟具體的搭配方式有關(guān)。這個(gè)時(shí)候共要做三個(gè)檢驗(yàn):判斷因素A對因變量X是否有顯著影響,判斷因素B對因變量X是否有顯著影響,判斷因素A和因素B的交互作用對因變量X是否有顯著影響。三、有交互作用的雙因素方差分析交互作用,就是兩個(gè)因素對觀測或三、有交互作用的雙因素方差分析為了能分辨出兩個(gè)因素的交互作用,要求每一個(gè)水平組合下至少取得兩個(gè)數(shù)據(jù)值。設(shè)兩個(gè)影響因素為A和B,分

26、別有r和s個(gè)水平,在每一個(gè)水平組合下取得t個(gè)數(shù)據(jù)值(t可以不等,為簡單起見假設(shè)是相等的),從而可以得到如表5-11的數(shù)據(jù)結(jié)構(gòu)。三、有交互作用的雙因素方差分析為了能分辨出兩個(gè)因素的交互作用三、有交互作用的雙因素方差分析表5-11 有交互作用的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)三、有交互作用的雙因素方差分析表5-11 有交互作用的雙因三、有交互作用的雙因素方差分析三個(gè)檢驗(yàn)的原假設(shè)分別是:在這里因素A和因素B的每一種搭配組合都是一個(gè)總體,因此共有rs個(gè)總體,每一種搭配組合比如 下的數(shù)據(jù)值是隨機(jī)樣本,其期望值為 。三、有交互作用的雙因素方差分析三個(gè)檢驗(yàn)的原假設(shè)分別是:三、有交互作用的雙因素方差分析定義:同樣,首先

27、建立樣本數(shù)據(jù)的方差分解恒等式其中三、有交互作用的雙因素方差分析定義:三、有交互作用的雙因素方差分析三、有交互作用的雙因素方差分析三、有交互作用的雙因素方差分析上面式中各種樣本平均數(shù)的定義分別為三、有交互作用的雙因素方差分析上面式中各種樣本平均數(shù)的定義分三、有交互作用的雙因素方差分析針對前面的三個(gè)原假設(shè)可建立下面的檢驗(yàn)統(tǒng)計(jì)量:三、有交互作用的雙因素方差分析針對前面的三個(gè)原假設(shè)可建立下面三、有交互作用的雙因素方差分析方差來源平方和SS自由度df均方MSF值因素ASSAr-1MSA=SSA/(r-1)MSA/MSE因素BSSBs-1MSB=SSB/(s-1)MSB/MSE因素ABSSAB(r-1)(

28、s-1)MSAB=SSAB/(r-1)(s-1)MSAB/MSE隨機(jī)誤差SSErs(t-1)MSE=SSE/rs(t-1)總計(jì)SSTrst-1表5-12 有交互作用的雙因素方差分析表三、有交互作用的雙因素方差分析方差來源平方和SS自由度df均【例5-3】用兩種不同的教學(xué)方法和三種不同的教材在6個(gè)小班進(jìn)行英語口語教學(xué)試驗(yàn),在每個(gè)小班隨機(jī)抽取3人,共抽取18人進(jìn)行測驗(yàn),得到他們的成績?nèi)绫?-13所示,判斷教材、教學(xué)方法及它們的交互作用對成績的影響是否顯著( )?!纠?-3】用兩種不同的教學(xué)方法和三種不同的教材在6個(gè)小班進(jìn)【例5-3】表5-13 教學(xué)方法與教材的交互作用教學(xué)方法(A)教材(B)教材一

29、教材二教材三教學(xué)方法一教學(xué)方法二64、67、7075、73、7488、86、9284、82、8390、92、8785、83、89【例5-3】表5-13 教學(xué)方法與教材的交互作用教學(xué)方法(【解】(1)建立原假設(shè)(2)計(jì)算相應(yīng)的離差平方和【解】(1)建立原假設(shè)【解】(2)計(jì)算相應(yīng)的離差平方和【解】(2)計(jì)算相應(yīng)的離差平方和【解】(3)列出方差分析表表5-14 方差分析表方差來源平方和SS自由度df均方MSF值因素A3.55613.5560.593因素B1066.3332533.16788.861因素AB142.111271.05611.843隨機(jī)誤差72.000126.000總計(jì)1284.0001

30、7【解】(3)列出方差分析表表5-14 方差分析表方差來源平【解】(4)統(tǒng)計(jì)判斷對于顯著性水平0.05,能夠查表或用軟件得到臨界值 因?yàn)橛纱说玫降慕Y(jié)論是,因素A也即教學(xué)方法的效應(yīng)是不顯著的,因素B也即教材自身的主效應(yīng)及它與教學(xué)方法的交互效應(yīng)對于成績的影響均是顯著的【解】(4)統(tǒng)計(jì)判斷具體操作步驟如下:(1)選擇菜單“分析(A)一般線性模型(G)單變量(U)”,就會出現(xiàn)如圖5-5所示的窗口。選擇“成績”到“因變量(D)”框,選擇“教材”和“方法”到“固定因子(F)”框?!驹赟PSS中的實(shí)現(xiàn)】具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】具體操作步驟如下:(2)點(diǎn)擊“模型(M)”按鈕,打開如圖5-6所示

31、的對話框,“指定模型”選擇“全因子(A)”、“平方和(Q)”選擇“類型III”,勾中復(fù)選框“在模型中包含截距(I)”【在SPSS中的實(shí)現(xiàn)】具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】圖5-3 雙因素方差分析主對話框圖5-3 雙因素方差分析主對話框圖5-4 模型設(shè)定對話框圖5-4 模型設(shè)定對話框(3)點(diǎn)擊“繼續(xù)”回到圖5-5的窗口,點(diǎn)擊“確定”得到最終的輸出結(jié)果。【在SPSS中的實(shí)現(xiàn)】表5-15 成績的有交互作用的雙因素方差分析表源III 型平方和df均方FSig.校正模型1212.0005242.40040.400.000截距119072.0001119072.00019845.333.000教材

32、1066.3332533.16788.861.000教學(xué)方法3.55613.556.593.456教材 * 教學(xué)方法142.111271.05611.843.001誤差72.000126.000總計(jì)120356.00018校正的總計(jì)1284.00017(3)點(diǎn)擊“繼續(xù)”回到圖5-5的窗口,點(diǎn)擊“確定”得到最終的由上表可以看出,因素A(教學(xué)方法)對應(yīng)的p值為0.456,因素B(教材)對應(yīng)的p值接近于0,因素A與因素B的交互作用對應(yīng)的p值為0.001,通過與顯著性水平0.05比較,得到與前述相同的結(jié)論,即因素A(教學(xué)方法)的影響是不顯著的,因素B(教材)自身的影響以及它與教學(xué)方法的交互效應(yīng)對于成績

33、的影響均是顯著的。【在SPSS中的實(shí)現(xiàn)】由上表可以看出,因素A(教學(xué)方法)對應(yīng)的p值為0.456,因第五章 方差分析和回歸分析第一節(jié) 單因素方差分析第二節(jié) 雙因素方差分析第三節(jié) 相關(guān)分析第四節(jié) 回歸分析第五章 方差分析和回歸分析第一節(jié) 單因素方差分析第三節(jié) 相關(guān)分析一、相關(guān)的基本問題二、相關(guān)圖三、皮爾遜相關(guān)系數(shù)四、斯皮爾曼秩相關(guān)系數(shù)五、肯德爾相關(guān)系數(shù)第三節(jié) 相關(guān)分析一、相關(guān)的基本問題現(xiàn)實(shí)世界的現(xiàn)象之間都是相互聯(lián)系的,這些聯(lián)系可以概括為三類,即函數(shù)關(guān)系、相關(guān)關(guān)系和相互獨(dú)立關(guān)系。函數(shù)關(guān)系是指變量之間存在的嚴(yán)格確定的依賴關(guān)系相關(guān)關(guān)系是指變量之間客觀存在的非嚴(yán)格確定的依賴關(guān)系獨(dú)立關(guān)系也稱為不相關(guān)關(guān)系,

34、意指變量間的取值互不影響,沒有聯(lián)系一、相關(guān)的基本問題(一)相關(guān)關(guān)系的概念現(xiàn)實(shí)世界的現(xiàn)象之間都是相互聯(lián)系的,這些聯(lián)系可以概括為三類,即相關(guān)關(guān)系可以從不同的角度加以分類:1按變量的多少可分為單相關(guān)、復(fù)相關(guān)和偏相關(guān)單相關(guān)是指一個(gè)變量與另一個(gè)變量之間的相關(guān)關(guān)系復(fù)相關(guān)則是指一個(gè)變量與兩個(gè)或兩個(gè)以上變量之間的相關(guān)關(guān)系一、相關(guān)的基本問題(二)相關(guān)關(guān)系的分類相關(guān)關(guān)系可以從不同的角度加以分類:一、相關(guān)的基本問題(二)相單相關(guān)按變量間的相關(guān)方向不同又可分為正相關(guān)和負(fù)相關(guān)。當(dāng)一個(gè)變量的數(shù)值由小變大時(shí),另一個(gè)變量的數(shù)值也相應(yīng)地由小變大,則稱這種相關(guān)為正相關(guān)當(dāng)一個(gè)變量的數(shù)值由小變大,另一個(gè)變量的數(shù)值卻相應(yīng)地由大變小,則

35、這兩個(gè)變量間的相關(guān)關(guān)系稱為負(fù)相關(guān)一、相關(guān)的基本問題(二)相關(guān)關(guān)系的分類單相關(guān)按變量間的相關(guān)方向不同又可分為正相關(guān)和負(fù)相關(guān)。一、相關(guān)現(xiàn)實(shí)中的變量之間的關(guān)系很復(fù)雜,一個(gè)變量的變化可能受到不止一個(gè)變量的影響,單相關(guān)一般不能夠真實(shí)地反映出兩個(gè)變量之間的相關(guān)性,這個(gè)時(shí)候就要進(jìn)一步開展偏相關(guān)分析它是當(dāng)研究某一個(gè)變量對另一個(gè)變量的影響程度時(shí),將其它變量的影響視作常數(shù),即暫時(shí)不考慮其它變量的影響,單獨(dú)研究兩個(gè)變量之間的相互聯(lián)系的程度。一、相關(guān)的基本問題(二)相關(guān)關(guān)系的分類現(xiàn)實(shí)中的變量之間的關(guān)系很復(fù)雜,一個(gè)變量的變化可能受到不止一個(gè)2按變量間相關(guān)的表現(xiàn)形式可分為線性相關(guān)和非線性相關(guān)若一個(gè)變量與另一個(gè)或一組變量之

36、間的關(guān)系顯著呈現(xiàn)某種線性組合時(shí),稱之為線性相關(guān)若一個(gè)變量與另一個(gè)或一組變量之間的關(guān)系并不表現(xiàn)為直線關(guān)系,而是大致表現(xiàn)為曲線、曲面或更復(fù)雜的形式時(shí),稱這種相關(guān)關(guān)系為非線性相關(guān)一、相關(guān)的基本問題(二)相關(guān)關(guān)系的分類2按變量間相關(guān)的表現(xiàn)形式可分為線性相關(guān)和非線性相關(guān)一、相關(guān)3按變量間相關(guān)的密切程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)若一個(gè)變量的值完全由另一個(gè)或一組變量的值所決定,則稱變量之間的這種相關(guān)關(guān)系為完全相關(guān),即函數(shù)關(guān)系。若一個(gè)變量的值與另一個(gè)或一組變量的值有關(guān),但并不能由其完全確定,還受隨機(jī)因素的影響,則稱變量之間的這種相關(guān)關(guān)系為不完全相關(guān)。一、相關(guān)的基本問題(二)相關(guān)關(guān)系的分類3按變量間相關(guān)

37、的密切程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)3按變量間相關(guān)的密切程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)若一個(gè)變量的值完全不受另一個(gè)或一組變量值的影響,則稱變量之間不相關(guān),即相互獨(dú)立。大量社會經(jīng)濟(jì)現(xiàn)象之間的相關(guān)關(guān)系都屬于不完全相關(guān),不完全相關(guān)是相關(guān)分析的基本內(nèi)容,完全相關(guān)和不相關(guān)可視為相關(guān)關(guān)系中的特例。一、相關(guān)的基本問題(二)相關(guān)關(guān)系的分類3按變量間相關(guān)的密切程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)刻畫變量之間相關(guān)關(guān)系的方法較多,常用的有相關(guān)圖和相關(guān)系數(shù)。相關(guān)圖能夠反映變量之間相關(guān)的形式和密切程度,其優(yōu)點(diǎn)是形象直觀,但不夠精確相關(guān)系數(shù)提供了一套對變量之間線性相關(guān)的方向和密切程度進(jìn)行刻畫的完整的統(tǒng)計(jì)

38、分析框架,包括對相關(guān)程度的估計(jì)和假設(shè)檢驗(yàn),以及對相關(guān)關(guān)系的數(shù)學(xué)形式進(jìn)行描述。一、相關(guān)的基本問題(三)相關(guān)關(guān)系的研究方法刻畫變量之間相關(guān)關(guān)系的方法較多,常用的有相關(guān)圖和相關(guān)系數(shù)。一關(guān)系數(shù)測定方法與變量的數(shù)據(jù)類型有關(guān)對于數(shù)值型變量,通常采用皮爾遜相關(guān)系數(shù)進(jìn)行測定;對于定序變量,通常采用斯皮爾曼秩相關(guān)系數(shù)或肯德爾相關(guān)系數(shù)進(jìn)行測定;對于定類變量,通常采用列聯(lián)系數(shù)進(jìn)行測定。一、相關(guān)的基本問題(三)相關(guān)關(guān)系的研究方法關(guān)系數(shù)測定方法與變量的數(shù)據(jù)類型有關(guān)一、相關(guān)的基本問題(三)相相關(guān)圖又叫散點(diǎn)圖它是以直角坐標(biāo)系的橫軸代表某一變量X,縱軸代表另一變量Y,將兩個(gè)變量間相對應(yīng)的變量值用坐標(biāo)點(diǎn)的形式描繪出來,用來反映

39、兩變量之間相關(guān)關(guān)系的狀態(tài)。二、相關(guān)圖相關(guān)圖又叫散點(diǎn)圖二、相關(guān)圖常見的相關(guān)關(guān)系示意圖二、相關(guān)圖(a)完全正線性相關(guān)(b)完全負(fù)線性相關(guān)(c)正線性相關(guān)(d)負(fù)線性相關(guān)(e)非線性相關(guān)(f)不相關(guān)常見的相關(guān)關(guān)系示意圖二、相關(guān)圖(a)完全正線性相關(guān)(b)完全1皮爾遜相關(guān)系數(shù)的概念皮爾遜相關(guān)系數(shù)用于對兩個(gè)數(shù)值型變量的線性相關(guān)程度進(jìn)行度量,是一種定量刻畫變量間相關(guān)關(guān)系的方法??傮w相關(guān)系數(shù):總體相關(guān)系數(shù)一般是未知的三、皮爾遜(K. Pearson)相關(guān)系數(shù)1皮爾遜相關(guān)系數(shù)的概念三、皮爾遜(K. Pearson)相根據(jù)樣本數(shù)據(jù)計(jì)算總體相關(guān)系數(shù)的估計(jì)值,稱之為樣本相關(guān)系數(shù),記為r。設(shè)樣本 是總體 的大小為n的

40、樣本觀測值,兩個(gè)變量之間的樣本相關(guān)系數(shù)的計(jì)算公式如下:三、皮爾遜(K. Pearson)相關(guān)系數(shù)根據(jù)樣本數(shù)據(jù)計(jì)算總體相關(guān)系數(shù)的估計(jì)值,稱之為樣本相關(guān)系數(shù),記式中:三、皮爾遜(K. Pearson)相關(guān)系數(shù)式中:三、皮爾遜(K. Pearson)相關(guān)系數(shù)2相關(guān)系數(shù)的性質(zhì)(1)r的取值在-1與1之間,當(dāng) 時(shí)表示正相關(guān),當(dāng) 時(shí)表示負(fù)相關(guān)。(2)當(dāng) 時(shí)表示X與Y的樣本觀測值之間完全正線性相關(guān);當(dāng) 時(shí)表示X與Y的樣本觀測值之間完全負(fù)線性相關(guān);當(dāng) 時(shí),表示X與Y的樣本觀測值之間沒有線性相關(guān)關(guān)系,但不表示沒有相關(guān)關(guān)系。三、皮爾遜(K. Pearson)相關(guān)系數(shù)2相關(guān)系數(shù)的性質(zhì)三、皮爾遜(K. Pearson

41、)相關(guān)系數(shù)2相關(guān)系數(shù)的性質(zhì)(3) 越趨近于1說明X與Y的樣本觀測值之間 線性相關(guān)關(guān)系越強(qiáng) 越趨近于0說明X與Y的樣本觀測值之間 線性相關(guān)關(guān)系越弱。三、皮爾遜(K. Pearson)相關(guān)系數(shù)2相關(guān)系數(shù)的性質(zhì)三、皮爾遜(K. Pearson)相關(guān)系數(shù)2相關(guān)系數(shù)的性質(zhì)對于樣本相關(guān)系數(shù)r,可以根據(jù)經(jīng)驗(yàn)分為以下幾種情況:當(dāng) 時(shí),可視為高度相關(guān)當(dāng) 時(shí),可視為中等程度的相關(guān)當(dāng) 時(shí),視為低度相關(guān)而當(dāng) 時(shí),就說明兩個(gè)變量之間相關(guān)程度極弱,可以視為幾乎不存在線性相關(guān)關(guān)系了。 三、皮爾遜(K. Pearson)相關(guān)系數(shù)2相關(guān)系數(shù)的性質(zhì)三、皮爾遜(K. Pearson)相關(guān)系數(shù)3相關(guān)系數(shù)的顯著性檢驗(yàn)樣本相關(guān)系數(shù)r是根

42、據(jù)樣本數(shù)據(jù)計(jì)算出來的,會受到抽樣誤差的影響,因此在估計(jì)出樣本相關(guān)系數(shù)后,還需要對它的顯著性做假設(shè)檢驗(yàn)。如果樣本數(shù)據(jù)服從二元正態(tài)分布,可以采用t檢驗(yàn)方法,其原假設(shè)和備擇假設(shè)分別為 檢驗(yàn)統(tǒng)計(jì)量為 三、皮爾遜(K. Pearson)相關(guān)系數(shù)3相關(guān)系數(shù)的顯著性檢驗(yàn)三、皮爾遜(K. Pearson)相【例5-4】為研究在統(tǒng)計(jì)學(xué)期末考試之前用于復(fù)習(xí)的時(shí)間和考試分?jǐn)?shù)之間是否存在相關(guān)關(guān)系,一位研究者隨機(jī)抽取了某高校的8名學(xué)生進(jìn)行跟蹤調(diào)查,得到的數(shù)據(jù)如表5-16所示,假設(shè)學(xué)生的復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)服從二元正態(tài)分布,請做出分析。這里的顯著性水平為0.05。【例5-4】為研究在統(tǒng)計(jì)學(xué)期末考試之前用于復(fù)習(xí)的時(shí)間和考試分

43、表5-16 8名學(xué)生的復(fù)習(xí)時(shí)間(單位:小時(shí))與考試分?jǐn)?shù)(單位:分)【例5-4】復(fù)習(xí)時(shí)間2016342327321822考試分?jǐn)?shù)6461847088927277表5-16 8名學(xué)生的復(fù)習(xí)時(shí)間(單位:小時(shí))與考試分?jǐn)?shù)(單【解】(1)根據(jù)數(shù)據(jù)做出相關(guān)圖,在SPSS中選擇菜單“圖形(G)散點(diǎn)/點(diǎn)狀(S)”,在打開的對話框中把“考試分?jǐn)?shù)”選入“Y軸”、把“復(fù)習(xí)時(shí)間”選入“X軸”,然后點(diǎn)擊“確定”按鈕,得到的相關(guān)圖如圖5-8所示【解】(1)根據(jù)數(shù)據(jù)做出相關(guān)圖,在SPSS中選擇菜單“圖形(【解】由圖可知復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)之間有一定的正相關(guān)性。圖5-8 學(xué)生的復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)相關(guān)圖【解】由圖可知復(fù)習(xí)時(shí)間與考

44、試分?jǐn)?shù)之間有一定的正相關(guān)性。圖5-【解】(2)計(jì)算復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)的樣本相關(guān)系數(shù)表5-17 樣本相關(guān)系數(shù)計(jì)算表【解】(2)計(jì)算復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)的樣本相關(guān)系數(shù)表5-17 【解】將上表的合計(jì)數(shù)據(jù)代入公式即得【解】將上表的合計(jì)數(shù)據(jù)代入公式【解】(3)檢驗(yàn)原假設(shè)與備擇假設(shè)由于顯著性水平值0.05對應(yīng)的臨界值是2.447,10.21遠(yuǎn)遠(yuǎn)大于2.447,因此,可以認(rèn)為復(fù)習(xí)時(shí)間與考試成績之間的線性相關(guān)關(guān)系是顯著的。【解】(3)檢驗(yàn)原假設(shè)與備擇假設(shè)具體操作步驟如下:(1)選擇菜單“分析(A)相關(guān)(C)雙變量(B)”,出現(xiàn)圖5-9所示的窗口。把”復(fù)習(xí)時(shí)間”與”考試分?jǐn)?shù)”選入”變量(V)”框;相關(guān)系數(shù)框根據(jù)需

45、要勾選相應(yīng)的相關(guān)度量方法,本例勾選了復(fù)選框“Pearson”;顯著性檢驗(yàn)選擇了“雙尾檢驗(yàn)”【在SPSS中的實(shí)現(xiàn)】具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】圖5-9 相關(guān)系數(shù)對話框圖5-9 相關(guān)系數(shù)對話框具體操作步驟如下:(2)點(diǎn)擊“確定”得到輸出結(jié)果,如表5-18所示。表中顯示了皮爾遜相關(guān)系數(shù)的樣本估計(jì)值及相應(yīng)的雙側(cè)檢驗(yàn)的p值?!驹赟PSS中的實(shí)現(xiàn)】具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】表5-18 皮爾遜相關(guān)系數(shù)及檢驗(yàn)表同樣可得到復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)是高度相關(guān)的結(jié)論。復(fù)習(xí)時(shí)間考試分?jǐn)?shù)復(fù)習(xí)時(shí)間皮爾遜相關(guān)性1.862顯著性(雙側(cè)).006N88考試分?jǐn)?shù)皮爾遜相關(guān)性.8621顯著性(雙側(cè)).006N8

46、8【在SPSS中的實(shí)現(xiàn)】表5-18 皮爾遜相關(guān)系數(shù)及檢驗(yàn)表同樣可得到復(fù)習(xí)時(shí)間與考試四、斯皮爾曼(C. E. Spearman)秩相關(guān)系數(shù)斯皮爾曼秩相關(guān)是對皮爾遜相關(guān)系數(shù)的改進(jìn),以便用于數(shù)據(jù)分布明顯偏離正態(tài)分布的場合。對于樣本容量為n的互不相等的獨(dú)立同分布樣本 ,用 表示 的秩,即樣本中小于或等于 的樣本點(diǎn)的個(gè)數(shù)用公式表示為 如果樣本中有相同的樣本點(diǎn)(稱為打結(jié)),就取這些相同樣本點(diǎn)的秩的平均數(shù)作為共同的秩。四、斯皮爾曼(C. E. Spearman)秩相關(guān)系數(shù)斯皮爾四、斯皮爾曼(C. E. Spearman)秩相關(guān)系數(shù)考慮樣本數(shù)據(jù)對 ,若以 代表 在樣本x的秩,以 表示 在樣本y中的秩,則斯皮爾

47、曼秩相關(guān)系數(shù)定義為 其中四、斯皮爾曼(C. E. Spearman)秩相關(guān)系數(shù)考慮樣四、斯皮爾曼(C. E. Spearman)秩相關(guān)系數(shù)可看出來,斯皮爾曼秩相關(guān)僅僅是模仿了皮爾遜相關(guān)的思想,區(qū)別是把公式中具體的數(shù)值變換成數(shù)據(jù)在樣本中的秩。需要指出的是斯皮爾曼秩相關(guān)系數(shù)定義公式的第二個(gè)等號只有在數(shù)據(jù)沒有打結(jié)的情況下才成立,在結(jié)很少的情況下近似成立。與皮爾遜相關(guān)系數(shù)一樣,斯皮爾曼秩相關(guān)系數(shù)同樣取值于-1到1之間,且絕對值越大相關(guān)性越強(qiáng)。在大樣本情況下, 可以將其用來進(jìn)行假設(shè)檢驗(yàn)。四、斯皮爾曼(C. E. Spearman)秩相關(guān)系數(shù)可看出【例5-5】兩名裁判員X、Y對六名歌手評分的結(jié)果如下 X:

48、9.97,9.95,9.87,9.85,9.90,9.94 Y:9.89,9.93,9.88,9.91,9.95,9.96。用斯皮爾曼秩相關(guān)系數(shù)分析兩位裁判員評分的相關(guān)程度?!纠?-5】兩名裁判員X、Y對六名歌手評分的結(jié)果如下【解】(1)首先把裁判員對6名歌手的打分分別轉(zhuǎn)化成相應(yīng)的秩 X的秩:6,5,2,1,3,4 Y的秩:2,4,1,3,5,6【解】(1)首先把裁判員對6名歌手的打分分別轉(zhuǎn)化成相應(yīng)的秩【解】(2)計(jì)算過程表5-19 斯皮爾曼秩相關(guān)系數(shù)的計(jì)算【解】(2)計(jì)算過程表5-19 斯皮爾曼秩相關(guān)系數(shù)的計(jì)算【解】(3)因?yàn)?,將其代入公式即可求得具體的數(shù)值 【解】(3)因?yàn)?,將其代入公

49、式即可求得具體的數(shù)值五、肯德爾(M. Kendall)相關(guān)系數(shù)肯德爾相關(guān)同斯皮爾曼秩相關(guān)一樣,可以用于數(shù)據(jù)分布明顯偏離正態(tài)分布的場合,但兩者的思想也有明顯區(qū)別??系聽栂嚓P(guān)首先引入兩個(gè)新的概念,即協(xié)同對與不協(xié)同對,然后在此基礎(chǔ)上定義肯德爾相關(guān)系數(shù)。五、肯德爾(M. Kendall)相關(guān)系數(shù)五、肯德爾(M. Kendall)相關(guān)系數(shù)考慮數(shù)據(jù)對 ,對任意的ij,如果乘積 ,稱數(shù)據(jù)對 為協(xié)同對,顯然協(xié)同意味著它們有相同的趨勢如果乘積 ,稱數(shù)據(jù)對 為不協(xié)同對,不協(xié)同意味著它們有相反的趨勢。五、肯德爾(M. Kendall)相關(guān)系數(shù)五、肯德爾(M. Kendall)相關(guān)系數(shù)令定義肯德爾為其中, 表示協(xié)同對

50、的數(shù)目 表示不協(xié)同對的數(shù)目五、肯德爾(M. Kendall)相關(guān)系數(shù)令五、肯德爾(M. Kendall)相關(guān)系數(shù)在數(shù)據(jù)沒有打結(jié),即沒有 的情況下,容易看出, 。如果所有的數(shù)據(jù)對都是協(xié)同對,則在沒有打結(jié)時(shí)反之如果所有的數(shù)據(jù)對都是不協(xié)同對,則在沒有打結(jié)時(shí)五、肯德爾(M. Kendall)相關(guān)系數(shù)在數(shù)據(jù)沒有打結(jié),五、肯德爾(M. Kendall)相關(guān)系數(shù)對于的檢驗(yàn),可以通過檢驗(yàn)K來實(shí)現(xiàn)在樣本量足夠大時(shí),原假設(shè)成立的條件下有五、肯德爾(M. Kendall)相關(guān)系數(shù)對于的檢驗(yàn),可【例5-6】用肯德爾相關(guān)系數(shù)分析例5-5?!窘狻浚?)利用求得的秩,重新對歌手排序,結(jié)果為X的秩:1,2,3,4,5,6 Y

51、的秩:3,1,5,6,4,2【例5-6】用肯德爾相關(guān)系數(shù)分析例5-5?!窘狻浚?)利用【解】(2)容易得到協(xié)同對的數(shù)目為8,不協(xié)同對的數(shù)目為肯德爾相關(guān)系數(shù)為【解】(2)容易得到協(xié)同對的數(shù)目為8,不協(xié)同對的數(shù)目為具體操作步驟如下:(1)選擇菜單“分析(A)相關(guān)(C)雙變量(B)”,出現(xiàn)如圖5-10所示的窗口。把X與Y選入“變量(V)”框;在相關(guān)系數(shù)框中勾選復(fù)選框“Kendalls tau-b”和“Spearman”;顯著性檢驗(yàn)選擇“雙尾檢驗(yàn)”?!驹赟PSS中的實(shí)現(xiàn)】具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】圖5-10 相關(guān)系數(shù)對話框圖5-10 相關(guān)系數(shù)對話框具體操作步驟如下:(2)點(diǎn)擊“確定”得到

52、輸出結(jié)果【在SPSS中的實(shí)現(xiàn)】Y肯德爾相關(guān)X相關(guān)系數(shù).067Sig.(雙側(cè)).851N6斯皮爾曼秩相關(guān)X相關(guān)系數(shù).143Sig.(雙側(cè)).787N6表5-20 對歌手評分的秩相關(guān)與相關(guān)檢驗(yàn)表具體操作步驟如下:【在SPSS中的實(shí)現(xiàn)】Y肯德爾相關(guān)X相表5-20顯示了斯皮爾曼秩相關(guān)系數(shù)和肯德爾相關(guān)系數(shù)的樣本估計(jì)值以及相應(yīng)的雙側(cè)檢驗(yàn)的p值,兩者均表明,兩位裁判員對6名歌手打分結(jié)果的相關(guān)性不顯著?!驹赟PSS中的實(shí)現(xiàn)】表5-20顯示了斯皮爾曼秩相關(guān)系數(shù)和肯德爾相關(guān)系數(shù)的樣本估第五章 方差分析和回歸分析第一節(jié) 單因素方差分析第二節(jié) 雙因素方差分析第三節(jié) 相關(guān)分析第四節(jié) 回歸分析第五章 方差分析和回歸分析第

53、一節(jié) 單因素方差分析第四節(jié) 回歸分析一、回歸分析的基本問題二、一元線性回歸模型三、多元線性回歸模型四、邏輯斯蒂(Logistic)回歸第四節(jié) 回歸分析一、回歸分析的基本問題通過相關(guān)分析,可以判斷變量之間相關(guān)關(guān)系的方向和密切程度,但相關(guān)分析未給出變量之間具體的數(shù)量變動依存關(guān)系,從而不能根據(jù)一個(gè)變量估計(jì)另一個(gè)變量的取值因此,為了探求變量之間的具體數(shù)量變動關(guān)系,一般要在相關(guān)分析的基礎(chǔ)上再進(jìn)行回歸分析。一、回歸分析的基本問題(一)回歸分析的概念通過相關(guān)分析,可以判斷變量之間相關(guān)關(guān)系的方向和密切程度,但相回歸分析就是對具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變量之間的數(shù)量變動的一般關(guān)系進(jìn)行測定,確定因變量和自變量之

54、間數(shù)量變動關(guān)系的數(shù)學(xué)表達(dá)式,以便對因變量進(jìn)行估計(jì)和預(yù)測的統(tǒng)計(jì)分析方法。簡言之,相關(guān)分析的主要任務(wù)是研究變量之間相關(guān)關(guān)系的表現(xiàn)形式和密切程度,而回歸分析則是在相關(guān)分析的基礎(chǔ)上,確定變量間具體的數(shù)量變動依存關(guān)系。一、回歸分析的基本問題(一)回歸分析的概念回歸分析就是對具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變量之間的數(shù)量變動假設(shè)對某個(gè)現(xiàn)象要估計(jì)或預(yù)測其某一變量的具體取值是多少,這個(gè)變量就是“因變量”或“被解釋變量”,記為y可以考慮與該變量有相關(guān)關(guān)系的一組k 個(gè)變量,也就是“自變量”或“解釋變量”,記為一、回歸分析的基本問題(一)回歸分析的概念假設(shè)對某個(gè)現(xiàn)象要估計(jì)或預(yù)測其某一變量的具體取值是多少,這個(gè)變根據(jù)變量

55、之間相關(guān)關(guān)系的含義,可以設(shè)想因變量的取值依賴于兩部分:一部分是用來描述因變量與自變量之間確定依賴關(guān)系的,它是自變量的函數(shù),稱為回歸方程,記為另一部分是不能由自變量的變化來解釋的那一部分,通常用一個(gè)隨機(jī)變量來表示,稱為隨機(jī)誤差,記為一、回歸分析的基本問題(一)回歸分析的概念根據(jù)變量之間相關(guān)關(guān)系的含義,可以設(shè)想因變量的取值依賴于兩部分假設(shè)因變量是由回歸方程和隨機(jī)誤差疊加生成的,即 回歸分析的目的:利用樣本數(shù)據(jù)在某些假定下對 的具體形式進(jìn)行估計(jì)。一、回歸分析的基本問題(一)回歸分析的概念假設(shè)因變量是由回歸方程和隨機(jī)誤差疊加生成的,即 一、回歸分析回歸分析按照自變量的個(gè)數(shù)多少可分為一元回歸分析和多元回

56、歸分析一元回歸模型中只包含一個(gè)自變量多元回歸模型則是對兩個(gè)及以上的自變量進(jìn)行考察。一、回歸分析的基本問題(二)回歸分析的分類回歸分析按照自變量的個(gè)數(shù)多少可分為一元回歸分析和多元回歸分析如果按照變量間相關(guān)關(guān)系的形態(tài)劃分,回歸分析可分為線性回歸和非線性回歸當(dāng)變量之間的相關(guān)關(guān)系表現(xiàn)為線性相關(guān)時(shí),擬合的模型稱為線性回歸模型,模型的確定部分稱為線性回歸方程一、回歸分析的基本問題(二)回歸分析的分類如果按照變量間相關(guān)關(guān)系的形態(tài)劃分,回歸分析可分為線性回歸和非當(dāng)變量之間的相關(guān)關(guān)系表現(xiàn)為非線性的曲線相關(guān)模式時(shí),擬合的模型稱為非線性回歸模型,模型的確定部分稱為曲線回歸方程。上述分類還可以交叉進(jìn)行,進(jìn)一步細(xì)分為一

57、元線性回歸和多元線性回歸,一元非線性回歸和多元非線性回歸等一、回歸分析的基本問題(二)回歸分析的分類當(dāng)變量之間的相關(guān)關(guān)系表現(xiàn)為非線性的曲線相關(guān)模式時(shí),擬合的模型一元線性回歸模型假定只有一個(gè)自變量x,而且關(guān)于自變量的函數(shù)表達(dá)式是線性的,模型的具體形式為:上式中,回歸方程 部分也稱為回歸直線, 和 是待估的參數(shù)稱為回歸系數(shù), 表示自變量每變動一個(gè)單位,因變量的平均變動值,它具有比較明確的意義, 是保證方程成立的截距項(xiàng),又稱為回歸常數(shù)。 是隨機(jī)誤差。二、一元線性回歸模型(一)一元線性回歸模型概述一元線性回歸模型假定只有一個(gè)自變量x,而且關(guān)于自變量的函數(shù)表關(guān)于隨機(jī)誤差的假定是:(1) 是均值為0的隨機(jī)

58、變量;(2) 的方差(或標(biāo)準(zhǔn)差)對于所有x的值是不變的;(3) 是相互獨(dú)立的且其與自變量也是不相關(guān)的。(4) 是正態(tài)分布的隨機(jī)變量,即 二、一元線性回歸模型(一)一元線性回歸模型概述關(guān)于隨機(jī)誤差的假定是:二、一元線性回歸模型(一)一元線性回歸在一般情況下,回歸系數(shù)均是未知的,只能根據(jù)樣本數(shù)據(jù)進(jìn)行估計(jì),根據(jù)樣本數(shù)據(jù)估計(jì)出來的回歸系數(shù)稱為樣本回歸系數(shù),記為 和相應(yīng)的回歸方程稱為樣本回歸方程,記為二、一元線性回歸模型(一)一元線性回歸模型概述在一般情況下,回歸系數(shù)均是未知的,只能根據(jù)樣本數(shù)據(jù)進(jìn)行估計(jì),假設(shè)一個(gè)大小為n的隨機(jī)樣本 對于某一個(gè)樣本點(diǎn)i,由樣本回歸方程根據(jù)自變量的取值估計(jì)的因變量稱為擬合值

59、即 因變量的實(shí)際觀測值與擬合值之差稱為殘差,記為 ,二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)假設(shè)一個(gè)大小為n的隨機(jī)樣本 二、一元線性回歸模型(二)回歸參在根據(jù)樣本數(shù)據(jù)確定樣本回歸方程時(shí),總是希望y的估計(jì)值從整體來看盡可能地接近其實(shí)際觀測值,也就是說 的總量越小越好,可是 有正有負(fù),簡單的求和會導(dǎo)致正負(fù)互相抵消(見圖5-11)因此為了便于處理,通常采用殘差平方和作為衡量總偏差的尺度。二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)在根據(jù)樣本數(shù)據(jù)確定樣本回歸方程時(shí),總是希望y的估計(jì)值從整體來二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)圖5-11 最小二乘法殘差示意圖二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)圖5

60、-11 最小二二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)所謂最小二乘法,就是根據(jù)這一思路,通過使殘差平方為最小來估計(jì)回歸系數(shù)的一種方法。用數(shù)學(xué)符號表示二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)所謂最小二乘法,就是二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)由于 的非負(fù)的二次函數(shù),因而它的最小值是確定存在的,根據(jù)微積分知識,最小值位于 的一階偏導(dǎo)數(shù)都為0的點(diǎn),也即二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)由于 二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)求解上面的方程組,就得到了 的 最小二乘(OLS)估計(jì)量,即二、一元線性回歸模型(二)回歸參數(shù)的估計(jì)求解上面的方程組,就二、一元線性回歸模型(二)回歸參數(shù)的估

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論