版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第十章
兩變量關(guān)聯(lián)性分析
本章內(nèi)容
第一節(jié)線性相關(guān)
第二節(jié)秩相關(guān)第三節(jié)分類變量的關(guān)聯(lián)性分析
第一節(jié)線性相關(guān)
一線性相關(guān)的概念線性相關(guān)(linearcorrelation)又稱簡單相關(guān)(simplecorrelation),用于雙變量正態(tài)分布(bivariatenormaldistribution)資料。其性質(zhì)可由圖11-2散點圖直觀的說明。目的:研究兩個變量X,Y數(shù)量上的依存(或相關(guān))關(guān)系。特點:統(tǒng)計關(guān)系圖10-1兩變量散點圖二、相關(guān)系數(shù)的意義與計算意義:相關(guān)(correlationcoefficient)又稱Pearson積差相關(guān)系數(shù),用來說明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向。2.計算:樣本相關(guān)系數(shù)的計算公式為例1例10-1在某地一項膳食調(diào)查中,隨機抽取了14名40~60歲的健康婦女,測得每人40~60歲的健康婦女,測得每人的基礎(chǔ)代謝(kj/d)與體重(kg)數(shù)據(jù),見表10-1。據(jù)此數(shù)據(jù)如何判斷這兩項指標(biāo)間有無關(guān)聯(lián)?表10-1
14名健康婦女的基礎(chǔ)代謝率與體重編號基礎(chǔ)代謝(kJ/d)體重(kg)編號基礎(chǔ)代謝(kJ/d)體重(kg)14175.650.783970.648.624435.053.793983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5圖10-214例中年健康婦女基礎(chǔ)代謝與體重的散點圖相關(guān)系數(shù)的特點1.相關(guān)系數(shù)r是一個無量綱的數(shù)值,且-1<r<1;2.r>0為正相關(guān),r<0為負(fù)相關(guān);3./r/越接近于1,說明相關(guān)性越好./r/越接近于0,說明相關(guān)性越差.相關(guān)系數(shù)的統(tǒng)計推斷(一)相關(guān)系數(shù)的假設(shè)檢驗
例10-2繼例10-2中算得r=0.964后,試檢驗相關(guān)是否具有統(tǒng)計學(xué)意義檢驗步驟
本例
n=14,r=0.964,計算t值10215(二)總體相關(guān)系數(shù)的可信區(qū)間
10216具體步驟如下10217
例10-3對例10-1所得r值,估計總體相關(guān)系數(shù)的95%可信區(qū)間。
再按公式(10-22)將z作反變換,得到基礎(chǔ)代謝與體重的總體相關(guān)系數(shù)95%可信區(qū)間為(0.8872,0.9888)。
線性相關(guān)中應(yīng)注意的問題1.樣本的相關(guān)系數(shù)接近零并不意味著兩變量間一定無相關(guān)性.2.一個變量的數(shù)值人為選定時莫作相關(guān).3.出現(xiàn)異常值時甚用相關(guān).4.相關(guān)未必真有內(nèi)在聯(lián)系.5.分層資料盲目合并易出假象.6.線性相關(guān)分析雙變量是隨機且服從正態(tài)分布第二節(jié)秩相關(guān)適用條件:①資料不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;②總體分布型未知,一端或兩端是不確定數(shù)值(如<10歲,≥65歲)的資料;③原始數(shù)據(jù)用等級表示的資料。一、Spearman秩相關(guān)1.意義:等級相關(guān)系數(shù)rs用來說明兩個變量間直線相關(guān)關(guān)系的密切程度與相關(guān)方向。2.計算公式例10-5某地研究2~7歲貧血病患兒的血紅蛋白含量與出血癥狀程度之間的相關(guān)性,結(jié)果見表10-2,試用秩相關(guān)進行分析表10-2貧血患兒的血紅蛋白含量(g/l)和出血癥狀病人編號血小板數(shù)秩次p2出血癥狀秩次q2pqXpYq(1)(2)(3)(4)(5)(6)(7)(8)=(3).(6)5.011+++10100105.824++864366.139+636187.3416-39128.8525++864409.1636++8644811.1749-392112.3864-392413.5981-392713.810100-3930合計—55385-55373266利用表10-2中的數(shù)據(jù)容易算得
秩相關(guān)系數(shù)為負(fù),說明兩變量間有負(fù)相關(guān)關(guān)系,同樣由樣本算得的秩相關(guān)系數(shù)是否有統(tǒng)計學(xué)意義,也應(yīng)做檢驗秩相關(guān)系數(shù)的統(tǒng)計推斷
檢驗步驟假設(shè)檢驗統(tǒng)計推斷當(dāng)時,可查書后的臨界值表,
若秩相關(guān)系數(shù)超過臨界值,則拒絕;當(dāng)時,也可采用公式(10-5)或(10-6)式做檢驗例10-5對例1-4的秩相關(guān)系數(shù)作假設(shè)檢驗例10-4中算得查臨界值表,,按的水準(zhǔn),拒絕,可以認(rèn)為貧血病患兒的出血癥狀與血紅蛋
白量之間呈負(fù)相關(guān)關(guān)系五、簡單線性相關(guān)的樣本量估算簡單線性相關(guān)的樣本量估算公式為:例10-4根據(jù)以往調(diào)查,某地某年大學(xué)生女大學(xué)生的體重(kg)與肺活量(L)的線性相關(guān)系數(shù)0.7165,若想在α=0.05,β=0.90水平下得到相關(guān)系數(shù)有統(tǒng)計學(xué)意義的結(jié)論,至少應(yīng)調(diào)查多少人?據(jù)已知條件代入公式:第三節(jié)分類變量的關(guān)聯(lián)性分析交叉分類2×2表的關(guān)聯(lián)分析例10-7
為觀察大學(xué)生專業(yè)與艾滋病知曉程度之間是否有關(guān),某研究者調(diào)查了某一年級不同專業(yè)的500名學(xué)生,對每個個體分別觀察專業(yè)與艾滋病知曉程度兩種屬性,2×2種結(jié)果分類記述如表10-3所示,試分析兩種屬性的關(guān)聯(lián)性。適用條件對定性變量之間的聯(lián)系通用的方法是根據(jù)兩個定性變量交叉分類基數(shù)所得的頻數(shù)資料(列聯(lián)表)作關(guān)聯(lián)性分析,即關(guān)于兩種屬性獨立性的卡方檢驗計算公式表10-3專業(yè)與艾滋病知曉程度之間的關(guān)系大學(xué)生專業(yè)
艾滋病知曉程度合計
高低醫(yī)學(xué)預(yù)科3191121其它19359合計50
450
500假設(shè)檢驗
:大學(xué)生專業(yè)與與艾滋病知曉程度之間相互獨立
:大學(xué)生專業(yè)與與艾滋病知曉程度之間關(guān)聯(lián)將表中各數(shù)據(jù)代入公式得拒絕原假設(shè),說明大學(xué)生專業(yè)與與艾滋病知曉程度之間存在關(guān)聯(lián)性.關(guān)于兩分類變量之間的關(guān)聯(lián)程度,可采用(phicoefficient)、GramerV系數(shù)、Gramer‘sVcoefficient)和Pearson列聯(lián)系數(shù)(contingencycoefficient),三個系數(shù)愈近1說明關(guān)系愈密切,三個愈近0,說明兩分類變量幾乎沒有關(guān)系。只適用于四格表資料,對于多行多列只能采用后兩種.本列二2×2配對資料的關(guān)聯(lián)性分析例10-8
有132食品標(biāo)本,把每份標(biāo)本一分為二,分別用兩種檢測方法作沙門菌檢驗,觀察結(jié)果如表10-5,問兩種檢測方法的結(jié)果有無關(guān)聯(lián)?表10-5兩種檢測方法結(jié)果甲法
乙法合計+-+8010
90-31
11
42合計111
21
132假設(shè)檢驗
:兩種檢測方法的結(jié)果之間互相獨立
:兩種檢測方法的結(jié)果之間有關(guān)聯(lián)將本例數(shù)據(jù)代入公式得有理由拒絕零假設(shè),可以認(rèn)為甲、乙兩種方法檢測方法之間存在關(guān)聯(lián)性,進一步計算三R×C表分類資料的關(guān)聯(lián)性分析例10-9
欲探討職業(yè)類型與胃癌,得表10-6的資料。問職業(yè)類型與胃癌是否關(guān)聯(lián)?表10-6310胃病患者按胃病類型與職業(yè)兩種屬性的交叉分類表職業(yè)
胃病合計淺表型慢性胃炎胃潰瘍機關(guān)干部80
484
132工人52
62
12
126公交車司機20221052合設(shè)檢驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版建筑工程委托管理合同
- 2024年度倒貸業(yè)務(wù)過橋借款合同模板下載6篇
- 2024年版股權(quán)投資與收購合同
- 站場樞紐課程設(shè)計
- 2024年度戶外健身場地專用雨棚定制合同3篇
- 2024年版員工勞動協(xié)議疑問全解版B版
- 2024年度長春市個性化定制離婚協(xié)議書模板3篇
- 比賽造型培訓(xùn)課程設(shè)計
- 2024年度融資評估合同書3篇
- 2024年度企業(yè)內(nèi)部員工臨時借支費用管理合同范本3篇
- 國家開放大學(xué)電大??啤吨袊?dāng)代文學(xué)》期末試題及答案
- 廣東話粵語姓名拼音大全
- 《金融工程原理-無套利均衡分析》筆記01
- 工程項目收尾管理辦法
- 閘門及啟閉機安裝專項施工方案
- 應(yīng)征公民體格檢查表(征兵)
- 電力系統(tǒng)分析名詞解釋、簡答、模擬試卷
- 家具制造企業(yè)消防安全要求
- 鋼筋位置及保護層厚度檢測ppt課件
- 巖石堅固性和穩(wěn)定性分級表
- 控制網(wǎng)復(fù)測及控制點加密復(fù)測報告課件
評論
0/150
提交評論