Spearman秩相關(guān)檢驗_第1頁
Spearman秩相關(guān)檢驗_第2頁
Spearman秩相關(guān)檢驗_第3頁
Spearman秩相關(guān)檢驗_第4頁
Spearman秩相關(guān)檢驗_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、變量間的關(guān)系 人們每時每刻都在關(guān)心事物之間的關(guān)系。 比如,職業(yè)種類和收入之間的關(guān)系、政府投入和經(jīng)濟增長之間的關(guān)系、廣告投入和經(jīng)濟效益之間的關(guān)系、治療手段和治愈率之間的關(guān)系等等。 這些都是二元的關(guān)系。 還有更復(fù)雜的諸多變量之間的相互關(guān)系,比如企業(yè)的固定資產(chǎn)、流動資產(chǎn)、預(yù)算分配、管理模式、生產(chǎn)率、債務(wù)和利潤等諸因素的關(guān)系是不能用簡單的一些二元關(guān)系所描述的。 廣告投入和銷售之間的關(guān)系:AALE706050403020100 這兩個變量是否有關(guān)系? 顯然,它們有關(guān)系;這從散點圖就很容易看出。 基本上銷售額是隨著廣告投入的遞增而遞增。 如果有關(guān)系,它們的關(guān)系是否顯著? 這也可以

2、從散點圖得到。當(dāng)廣告投入在6萬元以下,銷售額 增長很快;但大于這個投入時,銷售額增長就不明顯了。 因此,這兩個變量的關(guān)系是由強變?nèi)酢?這些關(guān)系是什么關(guān)系,是否可以用數(shù)學(xué)模型來描述? 本例看上去是可以擬合一個回歸模型,但絕不是線性的 (用一條直線可以描述的)。具體細(xì)節(jié)需要進一步的分析 這兩個變量是否有關(guān)系?參數(shù)統(tǒng)計的關(guān)聯(lián)性分析 參數(shù)統(tǒng)計中衡量兩個定量變量之間線性相關(guān)程度的常用指標(biāo)是皮爾遜 (Pearson) 相關(guān)系數(shù),也稱積距相關(guān)系數(shù)或動差相關(guān)系數(shù) (離差相乘) 。 相關(guān)系數(shù)的定義公式是:12211()()()()niiinniiiiXXYYrXXYY1122(,),(,),.,(,).nnXY

3、XYXY “相關(guān)”一詞涉及一組二元觀測的相關(guān)值這又是什么關(guān)系? 這個關(guān)系是否帶有普遍性? 也就是說,僅僅這一個樣本有這樣的關(guān)系,還是對于其他企業(yè)也有類似的規(guī)律。這里的數(shù)據(jù)還不足以回答這個問題??赡苄枰紤]更多的變量和收集更多的數(shù)據(jù)。 一般來說,人們希望能夠從一些特殊的樣本,得到普遍的結(jié)論,以利于預(yù)測。 這個關(guān)系是不是因果關(guān)系? 在本問題中,看來似乎有因果關(guān)系。這類似于一種試驗;而試驗時是容易找到因果關(guān)系的。但是,一般來說,變量之間有關(guān)系但絕不意味著存在因果關(guān)系。這里充滿了危險和未知!1. 提出假設(shè):H0: ;H1: 02. 計算檢驗的統(tǒng)計量: 3. 確定顯著性水平 ,并作出決策。 相關(guān)系數(shù)非常

4、高的樣本也有可能來自無相關(guān)關(guān)系的總體。為了排除這種情況,需要對相關(guān)系數(shù)進行顯著性檢驗。注: 這一檢驗是在零假設(shè)成立且兩個變量服從正態(tài)分布的情況下得出的。參數(shù)統(tǒng)計檢驗的步驟是:22 (2)1rntt nr皮爾遜相關(guān)系數(shù)的局限性 Pearson 相關(guān)系數(shù)及其顯著性檢驗是建立在數(shù)據(jù)變量為定量且服從正態(tài)分布的前提下。若這一前提不成立,則結(jié)果不可信或是錯誤的。此時需要非參數(shù)方法。 Pearson 相關(guān)系數(shù)只能用來度量兩個變量的線性相關(guān)性,不能用來度量兩者的相關(guān)性.sPearsonrSpearmanrKendall實踐中經(jīng)常應(yīng)用的三種相關(guān)系數(shù):相關(guān)系數(shù)秩相關(guān)系數(shù)相關(guān)系數(shù)sPearsonrXYSpearma

5、nrKendall傳統(tǒng)的相關(guān)系數(shù)是度量和的線性關(guān)系的而后兩種非參數(shù)的秩相關(guān)系數(shù)和相關(guān)系數(shù)則度量更加廣義的單調(diào)關(guān)系(不一定是線性的).這是因為變量的秩不會被變量的任何嚴(yán)格單調(diào)遞增變換所改變.6.1 Spearman 秩相關(guān)檢驗 SpearmanSpearman秩相關(guān)是利用等級相關(guān)系數(shù)測定變量間等級相關(guān)程度的一種非參數(shù)統(tǒng)計相關(guān)分析方法。.Spearman檢驗統(tǒng)計量是歷史最久(1904 年)的秩統(tǒng)計量.SpearmanSpearman檢驗統(tǒng)計量也被稱為1122(,),(,),.,(,).nnXYXYXYXY之后,要檢驗它們所代表的二元變量和在給定一列數(shù)對是否相關(guān)010101:HXYHXYHXYHXY

6、HXYHXY和不相關(guān).和相關(guān).或和不相關(guān).和正相關(guān).或和不相關(guān).和假設(shè)檢驗問題負(fù)相關(guān).12121122,.,.,(,),(,),.,(,)nnnnx xxyyyxyXYxyxyxy設(shè) ,是抽自兩個不同總體,的樣本,其觀察值為,將它們配對形成和;基本思路與檢驗步驟基本思路與檢驗步驟 1122(,),(,),.,(, ).iiiiiinnxyxyRSR SRSRnS如果將各自排序,分別評出在兩個順序樣本中所在位置的名次(即 秩),記作和,得到對秩和和n 對秩可能完全相同,也可能完全相反,或者不完全相同.( )00iiiiiXYxyxyRSddd可見,當(dāng)與完全相關(guān)時,記作.其中可以用來度量和的相關(guān)程

7、度:越大, 與之間的相關(guān)越不完全.22 iiiiiiiiiiddRSdRSdnRS與與由于可正可負(fù),直接用測度相關(guān)會縮小之間的差值,故用來反映的差值大?。坏仁懿灰恢鲁潭鹊挠绊?,也受觀察值個數(shù)的多與少之影響。22 .iiddxySpearmanR為了準(zhǔn)確度量和的相關(guān)程度,我們用的最大值去除,則得到了一個相對測量指標(biāo),稱為等級相關(guān)系數(shù),記為22223(1) / 3(1)iiddRn nn n22222222(1)(1)2.2(1)(1)2 (1)(3).(1) . / 3idnnnnnnn n的注:這是因為最大值等于22223.(1) / 3(1)iiddRn nn n故22()iiidRS很大

8、,則說明兩個變量可能負(fù)相關(guān),而如果它們很小,則如果可能正相關(guān).010101:1:HXYHXYHXYHXYHXYHXY和不相關(guān).和相關(guān).或和不相關(guān).和正相關(guān).或和不相關(guān).檢驗步驟()建立假和設(shè)負(fù)相關(guān).11 0011 00.8ssssssssrrrrrrrr 的取值范圍在到之間.為正相關(guān),為負(fù)相關(guān);為完全正相關(guān),為完全負(fù)相關(guān);當(dāng)越接近 1,表示樣本之間的相關(guān)程度越高;越接近于,表示樣本之間的相關(guān)程注度越低。一般認(rèn)為為相關(guān)程:時時度越高.2112221111()()61(1)()()11,.2nniiiiisnniiiinniiiiSpearRRSSdrn nRRSSRRmanSSnn( )計算檢驗

9、統(tǒng)計量:等級相關(guān)系數(shù)是測定兩個樣本相關(guān)程度的重要指標(biāo):其中003 .)sssssrrHrrHnSpea manrcr( )做出決策:當(dāng)時,拒絕;當(dāng)時,不能拒絕是臨界值(書中記為,它是根據(jù)樣本觀測之個數(shù) 、備擇假設(shè)(單側(cè)或雙側(cè))以及給定的顯著性水平查秩相關(guān)系數(shù)檢驗臨界值表查得。11/ 520,1()1( )(2 (2)szrnZzzZxyznNPPz 注:.遇到打結(jié)的情況時,如果或打結(jié)不多,可以用平均秩解決;如果打結(jié)過多(超過全部數(shù)據(jù)的),在計算時需要加上校正因子. 當(dāng)為大樣本時,近似服從正態(tài)分布。單側(cè):雙側(cè): 例題:某班15名學(xué)生的數(shù)學(xué)成績與統(tǒng)計學(xué)成績?nèi)缦卤硭驹嚪治鰧W(xué)生的數(shù)學(xué)成績和統(tǒng)計學(xué)成績

10、的相關(guān)性( ) 05. 001:(1).HXYHXY解:提出假設(shè)和不相關(guān).和正相關(guān)2126698110.825(1)15(.1)512niisdrn n:計算檢驗統(tǒng)計量( )0.050(3)5%82.5%.0.4460.8sssrrHr:作決策所以拒絕,可以在的顯著性水平下認(rèn)為數(shù)學(xué)成績與統(tǒng)計學(xué)成績存在正相關(guān)關(guān)系。又因為,兩者呈高度正相關(guān),相關(guān)程度達,2125%在一次跳水比賽中,有名裁判員給運動員的評分引起了爭議。下表列出了他們給名選手的評分情況。試在的顯著性水平下對這兩名裁判員在本次比賽中的評分進行相關(guān)分析。選手A裁判員評分B裁判員評分選手A裁判員評分B裁判員評分18.09.078.910.0

11、29.08.889.18.337.58.598.89.548.59.8108.28.9510.08.7119.58.667.08.0128.07.5 這兩個變量是否有關(guān)系? 顯然,它們有關(guān)系;這從散點圖就很容易看出。 基本上銷售額是隨著廣告投入的遞增而遞增。 如果有關(guān)系,它們的關(guān)系是否顯著? 這也可以從散點圖得到。當(dāng)廣告投入在6萬元以下,銷售額 增長很快;但大于這個投入時,銷售額增長就不明顯了。 因此,這兩個變量的關(guān)系是由強變?nèi)酢?這些關(guān)系是什么關(guān)系,是否可以用數(shù)學(xué)模型來描述? 本例看上去是可以擬合一個回歸模型,但絕不是線性的 (用一條直線可以描述的)。具體細(xì)節(jié)需要進一步的分析 這兩個變量是否有關(guān)系?這又是什么關(guān)系? 這個關(guān)系是否帶有普遍性? 也就是說,僅僅這一個樣本有這樣的關(guān)系,還是對于其他企業(yè)也有類似的規(guī)律。這里的數(shù)據(jù)還不足以回答這個問題??赡苄枰紤]更多的變量和收集更多的數(shù)據(jù)。 一般來說,人們希望能夠從一些特殊的樣本,得到普遍的結(jié)論,以利于預(yù)測。 這個關(guān)系是不是因果關(guān)系? 在本問題中,看來似乎有因果關(guān)系。這類似于一種試驗;而試驗時是容易找到因果關(guān)系的。但是,一般來說,變量之間有關(guān)系但絕不意味著存在因果關(guān)系。這里充滿了危險和未知!12121122,.,.,(,),(,),.,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論