《相關測量法》PPT課件.ppt_第1頁
《相關測量法》PPT課件.ppt_第2頁
《相關測量法》PPT課件.ppt_第3頁
《相關測量法》PPT課件.ppt_第4頁
《相關測量法》PPT課件.ppt_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第三講 統(tǒng)計相關測量法,一、選擇相關測量法需要注意三個問題,第一、變量的測量層次:定類、定序和定距。屬于不同測量層次的變量,就要用不同的相關測量法。 第二、變量之間關系是對稱還是不對稱的。有些相關測量法是假定變量與變量之間具有對稱關系,有些則假定是不具有對稱關系。 第三、注意統(tǒng)計值的意義。一般選擇具有消減誤差比例意義的測量法,即PRE測量法。 根據(jù)變量層次,有六種相關測量情況: 兩個定類變量 兩個定序變量 兩個定距變量 一個定類變量和一個定距變量 一個定類變量和一個定序變量 一個定序變量和一個定距變量,二、兩個變量的相關測量法,三、兩個定類變量的統(tǒng)計相關,1、Lambda相關測量法 Lambd

2、a相關測量法的基本邏輯是用一個定類變量來解釋或預測另一個定類變量時,以眾數(shù)作為解釋或預測的標準,可以減除多少預測誤差。 Lambda相關測量法有兩種形式。一種是對稱形式,即兩個變量間的關系是對稱的,不分自變量或因變量。另一種是不對稱形式,即要求一個是自變量(X),另一個是因變量(Y)。,(對稱形式),(非對稱形式),其中:My是Y變量的眾數(shù)次數(shù)。 Mx是X變量的眾數(shù)次數(shù)。 mx是Y變量的每個值(類別)之下X變量的眾值次數(shù)。 my是X變量的每個值(類別)之下X變量的眾值次數(shù)。 n 是全部樣本數(shù)目。,表1 100名青年的人生志愿與性別的關系,資料表明性別與志愿是非對稱關系,性別為自變量,志愿為因變

3、量,二者都是定類變量,故要應用Lambda系數(shù)來計算相關情況。 根據(jù)的系數(shù)公式和表1的次數(shù)資料,可知M=50, m=40+30=70,n=100, 該統(tǒng)計量表明,以X解釋或預測Y,可以消減40%的誤差。,2、 tauY相關測量法,測量方法 tauY系數(shù)是屬于不對稱相關測量法,要求兩個定類變量中有一個是自變量(X),另一個是因變量(Y)。系數(shù)值在0與1之間,具有消減誤差比例的意義。該方法與Lamabda不同在于計算系數(shù)時,包括所有的邊緣次數(shù)和條件次數(shù)。,其中:E1為不知道X而預測Y時的全部誤差,E2為知道X預測Y時的誤差。 n為全部個案數(shù)目, f為某條件次數(shù), Fy為Y變量的某個邊緣次數(shù), Fx

4、為X變量的某個邊緣次數(shù)。,根據(jù)表1的研究資料。全部樣本數(shù)目(n)是100。性別是自變量(X),邊緣次數(shù)(Fx)分別是60和40;志愿是因變量(Y),邊緣次數(shù)(Fy)分別是40、50和10。表內有六個條件次數(shù),每者都代表同屬于某項Y值與某項X值的樣本數(shù)目(f)。,這個數(shù)值不但能表示性別與志愿的相關程度,而且可以解釋為以性別來預測或估計志愿,能夠消減22.4%的誤差。 由于tau-y測量法是考慮全部次數(shù),故其敏感度高于Lambda測量法。,tauy = (58-45)/58=22.4%,四、兩個定序變量的統(tǒng)計相關,計算一個定序變量與另一個定序變量的相關系數(shù),可用Gamma系數(shù),dy 系數(shù),肯得爾的

5、tau系數(shù)以及斯皮爾曼的rho系數(shù)。 1、計算中所用的基本概念(同序對、異序對、同分對) 同序對。如果某對樣本在兩個變量上的相對等級是相同的,則稱為同序對(sameordered pair)。 異序對。如果某對樣本在兩個變量上的相對等級是不相同的,則稱為異序對(different-ordered pair)。 同分對。如果兩個樣本在某變量上可能是同分(tie),即不能分高低,則稱為同分對。,四名學生的成績等級,A與C是同序對,因為A的數(shù)學成績等級低于C,其英文成績也低于C同理,B與C也是同序對至于A與B則是異序對,因為A的數(shù)學成績等級低于B,但其英文成績高于B同理,A與D, B與D,和C與D皆

6、是異序對綜合起來,同序對有個,異序對有個 s=2, Nd=4,2、Gamma相關測量法 計算公式: Gamma系數(shù)不考慮同分對數(shù)。公式中的分母,表示在預測或解釋任何一個個案的相對等級時可能的最大誤差。公式中的分子,表示以一對個案在一個變量上的相對等級來預測其在另一變量上的相對等級所能減少的誤差。 Gamma屬于對稱相關測量法。 3、d相關測量法 計算公式: 其中Ns是同序對數(shù),Nd是異序對數(shù),T是只在因變量Y上同分的對數(shù)。d相關測量法屬于非對稱相關測量法。,G=(Ns-Nd)/(Ns+Nd),D=(Ns-Nd)/(Ns-Nd+Ty),4、肯德爾的tau系數(shù),肯德爾的tau系數(shù)可分三種形式,分別

7、稱為tau-a,tau-b,tau-c,都是適用于分析對稱的關系。其基本邏輯是計算同序對數(shù)與異序對數(shù)之差在全部可能對數(shù)中所占的比例 如何選用這三種系數(shù)呢? 1、如果在兩個變量上都沒有同分對,則使用tau-a,該系數(shù)值是由-1+1。 2、如果有同分對,且在交叉分組表行數(shù)與列數(shù)相同(即r=c)的情況下,可用tau-b,其系數(shù)值是由-1+1。 3、tau-c則不考慮是否有同分對,也不考慮行數(shù)與列數(shù)是否相等,其系數(shù)值在-1+1之間。 Tau-c系數(shù)適合于社會科學研究,因為社會科學研究在問卷的設計時,不一定各個問題的選項都相同,在做交叉分析時,表的大小無一定規(guī)則,同時表中常有很多同分對。,其中,Ns是同

8、序對,Nd是異序對,n是全部個案數(shù)目,m是交互分類表的行數(shù)(r)與列數(shù)(c)中的較小者。,5、斯皮爾曼rho系數(shù),斯皮爾曼rho系數(shù)也稱等級相關系數(shù),其特點是在計算每個個案在兩個變量上的等級時,不僅要區(qū)別二者的高低差異,而且還要計算二者差異的確切數(shù)值。 該方法的特點是:1、是對稱相關測量法,其統(tǒng)計值在-1+1之間;2、該值具有消減誤差比例的意義。,十個鄉(xiāng)的經(jīng)濟水平與衛(wèi)生水平,五、兩個定距變量的相關,如果所研究的變量都屬于定距測量層次,可以用簡單線性回歸分析法測算以自變量的數(shù)值預測或估計因變量的數(shù)值,也可以用積距相關系數(shù)來測量兩個變量的相關程度。 1、 簡單線性回歸分析 簡單線性回歸分析就是根據(jù)

9、一個直線方程式,以一個自變量(X)的數(shù)值來預測一個因變量(Y)的數(shù)值。這個方程式表示為: Y1=a+bX,由于實際值是Y,則預測誤差便是:e = Y- Y1。將全部樣本個案的各個e相加起來就是誤差總數(shù),但這樣做的結果會引起正負值相抵消的問題。為了克服“正負抵消”問題,我們將e的平方值相加起來,再使之最小,這就是所謂的“最小二乘法準則”。,通過求極值得到b解:,r=,2、積距相關測量法 盡管通過b值的作用,使我們能夠以X的變化來預測Y的變化。但由于b值沒有上限,難以判斷變量之間的相關強弱。因此需要應用皮爾遜(pearson)的積距相關系數(shù)(r),公式如下:,r系數(shù)與b系數(shù)的區(qū)別,是r系數(shù)假定X與

10、Y的關系是對稱的,而且r的統(tǒng)計值是由-1至+1,同時r的平方值具有消減誤差的意義。這個r值,稱為決定系數(shù)。,六、定類與定距、定類與定序、定序與定距 變量的相關,1、定類與定距相關比率測量法(Eta) 相關比率是測量一個定類變量與一個定距變量相關關系的方法。其中定類變量為自變量(X),定距變量為因變量(Y)。相關比率就是根據(jù)自變量的每一個值來預測或估計因變量的均值。Eta系數(shù)值是由0到1,其平方值具有消減誤差比例的意義。 2、定類與定序Lambda,tauy系數(shù) 3、定序與定距相關比率,例:語文水平與職業(yè)的關系,上表是研究20名學生的家庭職業(yè)背景(分為干部工人和農(nóng)民三類對其語文能力(由0至100

11、分)的影響. 家庭職業(yè)背景是自變量,屬于定類測量層次.而語文水平是因變量,屬于定距測量層次,故可用Eta統(tǒng)計量.,六、偏相關系數(shù),1、概念 在多元回歸分析中,其他變量被固定后,給定的任意兩個變量之間的相關系數(shù),叫偏相關系數(shù)。 在因果分析中,控制第三類變量以后,兩個變量的相關系數(shù)也稱偏相關系數(shù)。 2、計算公式 偏相關系數(shù)屬于對稱相關測量法的一種,它要求變量間是直線關系,且所有變量都必須是定距變量。 假定我們所研究的兩個變量X與Y,如果控制一個變量W,則偏相關系數(shù)的計算公式如下 :,公式1左邊的符號表示在控制W變量以后,X與Y的凈相關(下標中的小點表示控制),而公式1右邊的各個r就是兩個變量之間的

12、積矩相關。分子中的第一項表示X與Y的相關程度,第二項分別表示X、Y與控制變量之間的相關關系。公式2、3表示同時控制兩個或兩個以上的第三變量,X與Y的凈相關。如此類推,可以同時控制更多的第三類變量。公式1也稱為一階相關,公式2稱為二階相關,等等。 例題4:利用偏相關系數(shù)分析27個村工業(yè)化程度與人均耕地面積和距離城市遠近的關系。,27個村的工業(yè)化程度、耕地人口比例和距城遠近,從理論上講,村的工業(yè)化程度與耕地面積有較強的負相關性。如果村中人均耕地面積多,就沒有迫切的需要和剩余的人力來發(fā)展工業(yè),相反,如果地少人多,就具有發(fā)展工業(yè)的迫切性與可能性。二者的相關關系為-0.64,能夠驗證理論。 如果考慮到村子距城鎮(zhèn)距離遠近這個因素,上述關系還存在嗎?離城越近的村,在信息與市場等要素方面,更具發(fā)展工業(yè)的條件。因此需要對距城鎮(zhèn)遠近加以控制,作為進一步考察工業(yè)化程度與人均耕地面積的前提條件。計算得偏相關系數(shù)為-0.47。這個數(shù)與原相關系數(shù)比較,明顯地減弱了。這說明人均耕地面積與工業(yè)化的關系,部分需要由離城遠近來解釋。,七、其他偏相關測量法,如果是定類變量,需要用偏Lambda或凈tau-y系數(shù)來測量。該種方法就是依據(jù)控制變量的值把樣本分組,然后計算各個分組的系數(shù)值的加權平均。通常是以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論