




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三講 統(tǒng)計(jì)相關(guān)測(cè)量法,一、選擇相關(guān)測(cè)量法需要注意三個(gè)問(wèn)題,第一、變量的測(cè)量層次:定類、定序和定距。屬于不同測(cè)量層次的變量,就要用不同的相關(guān)測(cè)量法。 第二、變量之間關(guān)系是對(duì)稱還是不對(duì)稱的。有些相關(guān)測(cè)量法是假定變量與變量之間具有對(duì)稱關(guān)系,有些則假定是不具有對(duì)稱關(guān)系。 第三、注意統(tǒng)計(jì)值的意義。一般選擇具有消減誤差比例意義的測(cè)量法,即PRE測(cè)量法。 根據(jù)變量層次,有六種相關(guān)測(cè)量情況: 兩個(gè)定類變量 兩個(gè)定序變量 兩個(gè)定距變量 一個(gè)定類變量和一個(gè)定距變量 一個(gè)定類變量和一個(gè)定序變量 一個(gè)定序變量和一個(gè)定距變量,二、兩個(gè)變量的相關(guān)測(cè)量法,三、兩個(gè)定類變量的統(tǒng)計(jì)相關(guān),1、Lambda相關(guān)測(cè)量法 Lambd
2、a相關(guān)測(cè)量法的基本邏輯是用一個(gè)定類變量來(lái)解釋或預(yù)測(cè)另一個(gè)定類變量時(shí),以眾數(shù)作為解釋或預(yù)測(cè)的標(biāo)準(zhǔn),可以減除多少預(yù)測(cè)誤差。 Lambda相關(guān)測(cè)量法有兩種形式。一種是對(duì)稱形式,即兩個(gè)變量間的關(guān)系是對(duì)稱的,不分自變量或因變量。另一種是不對(duì)稱形式,即要求一個(gè)是自變量(X),另一個(gè)是因變量(Y)。,(對(duì)稱形式),(非對(duì)稱形式),其中:My是Y變量的眾數(shù)次數(shù)。 Mx是X變量的眾數(shù)次數(shù)。 mx是Y變量的每個(gè)值(類別)之下X變量的眾值次數(shù)。 my是X變量的每個(gè)值(類別)之下X變量的眾值次數(shù)。 n 是全部樣本數(shù)目。,表1 100名青年的人生志愿與性別的關(guān)系,資料表明性別與志愿是非對(duì)稱關(guān)系,性別為自變量,志愿為因變
3、量,二者都是定類變量,故要應(yīng)用Lambda系數(shù)來(lái)計(jì)算相關(guān)情況。 根據(jù)的系數(shù)公式和表1的次數(shù)資料,可知M=50, m=40+30=70,n=100, 該統(tǒng)計(jì)量表明,以X解釋或預(yù)測(cè)Y,可以消減40%的誤差。,2、 tauY相關(guān)測(cè)量法,測(cè)量方法 tauY系數(shù)是屬于不對(duì)稱相關(guān)測(cè)量法,要求兩個(gè)定類變量中有一個(gè)是自變量(X),另一個(gè)是因變量(Y)。系數(shù)值在0與1之間,具有消減誤差比例的意義。該方法與Lamabda不同在于計(jì)算系數(shù)時(shí),包括所有的邊緣次數(shù)和條件次數(shù)。,其中:E1為不知道X而預(yù)測(cè)Y時(shí)的全部誤差,E2為知道X預(yù)測(cè)Y時(shí)的誤差。 n為全部個(gè)案數(shù)目, f為某條件次數(shù), Fy為Y變量的某個(gè)邊緣次數(shù), Fx
4、為X變量的某個(gè)邊緣次數(shù)。,根據(jù)表1的研究資料。全部樣本數(shù)目(n)是100。性別是自變量(X),邊緣次數(shù)(Fx)分別是60和40;志愿是因變量(Y),邊緣次數(shù)(Fy)分別是40、50和10。表內(nèi)有六個(gè)條件次數(shù),每者都代表同屬于某項(xiàng)Y值與某項(xiàng)X值的樣本數(shù)目(f)。,這個(gè)數(shù)值不但能表示性別與志愿的相關(guān)程度,而且可以解釋為以性別來(lái)預(yù)測(cè)或估計(jì)志愿,能夠消減22.4%的誤差。 由于tau-y測(cè)量法是考慮全部次數(shù),故其敏感度高于Lambda測(cè)量法。,tauy = (58-45)/58=22.4%,四、兩個(gè)定序變量的統(tǒng)計(jì)相關(guān),計(jì)算一個(gè)定序變量與另一個(gè)定序變量的相關(guān)系數(shù),可用Gamma系數(shù),dy 系數(shù),肯得爾的
5、tau系數(shù)以及斯皮爾曼的rho系數(shù)。 1、計(jì)算中所用的基本概念(同序?qū)?、異序?qū)Α⑼謱?duì)) 同序?qū)?。如果某?duì)樣本在兩個(gè)變量上的相對(duì)等級(jí)是相同的,則稱為同序?qū)Γ╯ameordered pair)。 異序?qū)ΑH绻硨?duì)樣本在兩個(gè)變量上的相對(duì)等級(jí)是不相同的,則稱為異序?qū)Γ╠ifferent-ordered pair)。 同分對(duì)。如果兩個(gè)樣本在某變量上可能是同分(tie),即不能分高低,則稱為同分對(duì)。,四名學(xué)生的成績(jī)等級(jí),A與C是同序?qū)?,因?yàn)锳的數(shù)學(xué)成績(jī)等級(jí)低于C,其英文成績(jī)也低于C同理,B與C也是同序?qū)χ劣贏與B則是異序?qū)?因?yàn)锳的數(shù)學(xué)成績(jī)等級(jí)低于B,但其英文成績(jī)高于B同理,A與D, B與D,和C與D皆
6、是異序?qū)C合起來(lái),同序?qū)τ袀€(gè),異序?qū)τ袀€(gè) s=2, Nd=4,2、Gamma相關(guān)測(cè)量法 計(jì)算公式: Gamma系數(shù)不考慮同分對(duì)數(shù)。公式中的分母,表示在預(yù)測(cè)或解釋任何一個(gè)個(gè)案的相對(duì)等級(jí)時(shí)可能的最大誤差。公式中的分子,表示以一對(duì)個(gè)案在一個(gè)變量上的相對(duì)等級(jí)來(lái)預(yù)測(cè)其在另一變量上的相對(duì)等級(jí)所能減少的誤差。 Gamma屬于對(duì)稱相關(guān)測(cè)量法。 3、d相關(guān)測(cè)量法 計(jì)算公式: 其中Ns是同序?qū)?shù),Nd是異序?qū)?shù),T是只在因變量Y上同分的對(duì)數(shù)。d相關(guān)測(cè)量法屬于非對(duì)稱相關(guān)測(cè)量法。,G=(Ns-Nd)/(Ns+Nd),D=(Ns-Nd)/(Ns-Nd+Ty),4、肯德?tīng)柕膖au系數(shù),肯德?tīng)柕膖au系數(shù)可分三種形式,分別
7、稱為tau-a,tau-b,tau-c,都是適用于分析對(duì)稱的關(guān)系。其基本邏輯是計(jì)算同序?qū)?shù)與異序?qū)?shù)之差在全部可能對(duì)數(shù)中所占的比例 如何選用這三種系數(shù)呢? 1、如果在兩個(gè)變量上都沒(méi)有同分對(duì),則使用tau-a,該系數(shù)值是由-1+1。 2、如果有同分對(duì),且在交叉分組表行數(shù)與列數(shù)相同(即r=c)的情況下,可用tau-b,其系數(shù)值是由-1+1。 3、tau-c則不考慮是否有同分對(duì),也不考慮行數(shù)與列數(shù)是否相等,其系數(shù)值在-1+1之間。 Tau-c系數(shù)適合于社會(huì)科學(xué)研究,因?yàn)樯鐣?huì)科學(xué)研究在問(wèn)卷的設(shè)計(jì)時(shí),不一定各個(gè)問(wèn)題的選項(xiàng)都相同,在做交叉分析時(shí),表的大小無(wú)一定規(guī)則,同時(shí)表中常有很多同分對(duì)。,其中,Ns是同
8、序?qū)?,Nd是異序?qū)?,n是全部個(gè)案數(shù)目,m是交互分類表的行數(shù)(r)與列數(shù)(c)中的較小者。,5、斯皮爾曼rho系數(shù),斯皮爾曼rho系數(shù)也稱等級(jí)相關(guān)系數(shù),其特點(diǎn)是在計(jì)算每個(gè)個(gè)案在兩個(gè)變量上的等級(jí)時(shí),不僅要區(qū)別二者的高低差異,而且還要計(jì)算二者差異的確切數(shù)值。 該方法的特點(diǎn)是:1、是對(duì)稱相關(guān)測(cè)量法,其統(tǒng)計(jì)值在-1+1之間;2、該值具有消減誤差比例的意義。,十個(gè)鄉(xiāng)的經(jīng)濟(jì)水平與衛(wèi)生水平,五、兩個(gè)定距變量的相關(guān),如果所研究的變量都屬于定距測(cè)量層次,可以用簡(jiǎn)單線性回歸分析法測(cè)算以自變量的數(shù)值預(yù)測(cè)或估計(jì)因變量的數(shù)值,也可以用積距相關(guān)系數(shù)來(lái)測(cè)量?jī)蓚€(gè)變量的相關(guān)程度。 1、 簡(jiǎn)單線性回歸分析 簡(jiǎn)單線性回歸分析就是根據(jù)
9、一個(gè)直線方程式,以一個(gè)自變量(X)的數(shù)值來(lái)預(yù)測(cè)一個(gè)因變量(Y)的數(shù)值。這個(gè)方程式表示為: Y1=a+bX,由于實(shí)際值是Y,則預(yù)測(cè)誤差便是:e = Y- Y1。將全部樣本個(gè)案的各個(gè)e相加起來(lái)就是誤差總數(shù),但這樣做的結(jié)果會(huì)引起正負(fù)值相抵消的問(wèn)題。為了克服“正負(fù)抵消”問(wèn)題,我們將e的平方值相加起來(lái),再使之最小,這就是所謂的“最小二乘法準(zhǔn)則”。,通過(guò)求極值得到b解:,r=,2、積距相關(guān)測(cè)量法 盡管通過(guò)b值的作用,使我們能夠以X的變化來(lái)預(yù)測(cè)Y的變化。但由于b值沒(méi)有上限,難以判斷變量之間的相關(guān)強(qiáng)弱。因此需要應(yīng)用皮爾遜(pearson)的積距相關(guān)系數(shù)(r),公式如下:,r系數(shù)與b系數(shù)的區(qū)別,是r系數(shù)假定X與
10、Y的關(guān)系是對(duì)稱的,而且r的統(tǒng)計(jì)值是由-1至+1,同時(shí)r的平方值具有消減誤差的意義。這個(gè)r值,稱為決定系數(shù)。,六、定類與定距、定類與定序、定序與定距 變量的相關(guān),1、定類與定距相關(guān)比率測(cè)量法(Eta) 相關(guān)比率是測(cè)量一個(gè)定類變量與一個(gè)定距變量相關(guān)關(guān)系的方法。其中定類變量為自變量(X),定距變量為因變量(Y)。相關(guān)比率就是根據(jù)自變量的每一個(gè)值來(lái)預(yù)測(cè)或估計(jì)因變量的均值。Eta系數(shù)值是由0到1,其平方值具有消減誤差比例的意義。 2、定類與定序Lambda,tauy系數(shù) 3、定序與定距相關(guān)比率,例:語(yǔ)文水平與職業(yè)的關(guān)系,上表是研究20名學(xué)生的家庭職業(yè)背景(分為干部工人和農(nóng)民三類對(duì)其語(yǔ)文能力(由0至100
11、分)的影響. 家庭職業(yè)背景是自變量,屬于定類測(cè)量層次.而語(yǔ)文水平是因變量,屬于定距測(cè)量層次,故可用Eta統(tǒng)計(jì)量.,六、偏相關(guān)系數(shù),1、概念 在多元回歸分析中,其他變量被固定后,給定的任意兩個(gè)變量之間的相關(guān)系數(shù),叫偏相關(guān)系數(shù)。 在因果分析中,控制第三類變量以后,兩個(gè)變量的相關(guān)系數(shù)也稱偏相關(guān)系數(shù)。 2、計(jì)算公式 偏相關(guān)系數(shù)屬于對(duì)稱相關(guān)測(cè)量法的一種,它要求變量間是直線關(guān)系,且所有變量都必須是定距變量。 假定我們所研究的兩個(gè)變量X與Y,如果控制一個(gè)變量W,則偏相關(guān)系數(shù)的計(jì)算公式如下 :,公式1左邊的符號(hào)表示在控制W變量以后,X與Y的凈相關(guān)(下標(biāo)中的小點(diǎn)表示控制),而公式1右邊的各個(gè)r就是兩個(gè)變量之間的
12、積矩相關(guān)。分子中的第一項(xiàng)表示X與Y的相關(guān)程度,第二項(xiàng)分別表示X、Y與控制變量之間的相關(guān)關(guān)系。公式2、3表示同時(shí)控制兩個(gè)或兩個(gè)以上的第三變量,X與Y的凈相關(guān)。如此類推,可以同時(shí)控制更多的第三類變量。公式1也稱為一階相關(guān),公式2稱為二階相關(guān),等等。 例題4:利用偏相關(guān)系數(shù)分析27個(gè)村工業(yè)化程度與人均耕地面積和距離城市遠(yuǎn)近的關(guān)系。,27個(gè)村的工業(yè)化程度、耕地人口比例和距城遠(yuǎn)近,從理論上講,村的工業(yè)化程度與耕地面積有較強(qiáng)的負(fù)相關(guān)性。如果村中人均耕地面積多,就沒(méi)有迫切的需要和剩余的人力來(lái)發(fā)展工業(yè),相反,如果地少人多,就具有發(fā)展工業(yè)的迫切性與可能性。二者的相關(guān)關(guān)系為-0.64,能夠驗(yàn)證理論。 如果考慮到村子距城鎮(zhèn)距離遠(yuǎn)近這個(gè)因素,上述關(guān)系還存在嗎?離城越近的村,在信息與市場(chǎng)等要素方面,更具發(fā)展工業(yè)的條件。因此需要對(duì)距城鎮(zhèn)遠(yuǎn)近加以控制,作為進(jìn)一步考察工業(yè)化程度與人均耕地面積的前提條件。計(jì)算得偏相關(guān)系數(shù)為-0.47。這個(gè)數(shù)與原相關(guān)系數(shù)比較,明顯地減弱了。這說(shuō)明人均耕地面積與工業(yè)化的關(guān)系,部分需要由離城遠(yuǎn)近來(lái)解釋。,七、其他偏相關(guān)測(cè)量法,如果是定類變量,需要用偏Lambda或凈tau-y系數(shù)來(lái)測(cè)量。該種方法就是依據(jù)控制變量的值把樣本分組,然后計(jì)算各個(gè)分組的系數(shù)值的加權(quán)平均。通常是以
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 綏化智能小區(qū)管理辦法
- 繼續(xù)教育學(xué)院管理辦法
- 育嬰師職業(yè)道德培訓(xùn)課件
- 肩周炎中醫(yī)講座課件
- 機(jī)房安全管理培訓(xùn)課件
- 復(fù)印五年級(jí)數(shù)學(xué)試卷
- 阜陽(yáng)一模高三數(shù)學(xué)試卷
- 東營(yíng)三模高考數(shù)學(xué)試卷
- 高三五調(diào)數(shù)學(xué)試卷
- 高起本高等數(shù)學(xué)試卷
- 設(shè)備運(yùn)行狀態(tài)實(shí)時(shí)監(jiān)測(cè)系統(tǒng)
- 深圳市企業(yè)職工養(yǎng)老保險(xiǎn)養(yǎng)老金申請(qǐng)表
- DLT1249-2013 架空輸電線路運(yùn)行狀態(tài)評(píng)估技術(shù)導(dǎo)則
- 業(yè)主項(xiàng)目部項(xiàng)目管理策劃
- 劍橋Think第一級(jí)Unit+1+Welcome課件
- 基于水凝膠模板原位合成磷酸鈣類骨組織修復(fù)材料及表征
- 畜牧獸醫(yī)畢業(yè)論文名字
- 報(bào)告流動(dòng)式起重機(jī)械定期檢驗(yàn)自檢報(bào)告
- 系統(tǒng)規(guī)劃與管理師-輔助記憶口訣
- 預(yù)防接種異常反應(yīng)監(jiān)測(cè)與處理
- (完整word版)個(gè)人簡(jiǎn)歷模板(表格式)
評(píng)論
0/150
提交評(píng)論