統(tǒng)計中的相關(guān)分析_第1頁
統(tǒng)計中的相關(guān)分析_第2頁
統(tǒng)計中的相關(guān)分析_第3頁
統(tǒng)計中的相關(guān)分析_第4頁
統(tǒng)計中的相關(guān)分析_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計中的相關(guān)分析第一頁,共四十一頁,編輯于2023年,星期一3.1什么是相關(guān)?1、什么是相關(guān)?事物間的關(guān)系有三種:(1)因果關(guān)系:一種現(xiàn)象是另一種現(xiàn)象的因,而另一種現(xiàn)象則是果。(2)共變關(guān)系:兩事物本身之間沒有直接的關(guān)系,但它們都受第三種現(xiàn)象的影響而發(fā)生變化。(3)相關(guān)關(guān)系:兩類現(xiàn)象在發(fā)展變化的方向與大小方面存在一定關(guān)系,但不能確定兩者中哪個是因,哪個是果。3.1什么是相關(guān)第二頁,共四十一頁,編輯于2023年,星期一相關(guān)(統(tǒng)計學(xué)意義):指具有相關(guān)關(guān)系的不同現(xiàn)象之間的關(guān)系程度。相關(guān)分分類,按性質(zhì):(1)正相關(guān):兩列變量變動方向相同。同時增大,同時減少。如身高與體重的關(guān)系。(2)負相關(guān):兩列變量變動方向相反。一個增大,另一個卻減少;反之亦然。如年齡越大,走路速度越慢。(3)零相關(guān):兩列變量之間無關(guān)系。如學(xué)習(xí)成績與身高的關(guān)系。3.1什么是相關(guān)第三頁,共四十一頁,編輯于2023年,星期一

相關(guān)的分類相關(guān)分類,按程度:強相關(guān)若相關(guān)完全相關(guān)相關(guān)分分類,按趨勢:線性相關(guān)曲線相關(guān)第四頁,共四十一頁,編輯于2023年,星期一2、相關(guān)系數(shù)相關(guān)系數(shù)是兩列變量相關(guān)程度的數(shù)字表現(xiàn)形式。樣本相關(guān)系數(shù)用r表示;總體相關(guān)系數(shù)用表示。,r-1.00,1.00(1)完全相關(guān):-1.00或1.00,說明兩個變量之間為確定關(guān)系;(2)不完全相關(guān):|,r|<1;(3)不相關(guān):當相關(guān)系數(shù)在0附近時,說明兩個變量之間毫無關(guān)系。正相關(guān)時,相關(guān)系數(shù)為正,取值在0~1之間;負相關(guān)時,相關(guān)系數(shù)為負,取值在-1~0之間。3.1什么是相關(guān)第五頁,共四十一頁,編輯于2023年,星期一相關(guān)意義的理解1.相關(guān)的意義要看判定系數(shù)R2。2.相關(guān)系數(shù)0.3以下,為低相關(guān),有理論意義而無實際意義。3.相關(guān)系數(shù)0.4-0.6,為中等相關(guān),既有有理論意義,也有實際意義。4.相關(guān)系數(shù)0.7以上,為高相關(guān),理論意義與實際意義都很大。第六頁,共四十一頁,編輯于2023年,星期一(a)完全正相關(guān)(b)完全負相關(guān)(c)無相關(guān)關(guān)系(d)非線性關(guān)系(e)正相關(guān)(f)負相關(guān)散點圖的繪制第七頁,共四十一頁,編輯于2023年,星期一計算相關(guān)系數(shù)時應(yīng)注意的問題:(1)相關(guān)系數(shù)易受樣本容量n的影響。如果n很小,可能完全沒有相關(guān)的兩事物,卻計算出較大的相關(guān)系數(shù)。樣本容量要求。以n>=30為宜。(2)相關(guān)系數(shù)不能直接進行四則運算。(3)存在相關(guān)關(guān)系不一定存在因果關(guān)系。(4)計算相關(guān)系數(shù)要求成對數(shù)據(jù)。若干個個體中每個個體要有兩種不同的觀測值。如每個學(xué)生的智力分數(shù)和學(xué)習(xí)成績。任意兩個個體之間的觀測值不能求相關(guān)。(5)沒有線性相關(guān),不一定沒有關(guān)系,可能是非線性的。3.2積差相關(guān)第八頁,共四十一頁,編輯于2023年,星期一相關(guān)系數(shù)的合并相關(guān)系數(shù)的合并意義:來自同一總體的多個樣本的相關(guān)系數(shù)的合成。步驟:P138,例3.2(1)將各樣本的r轉(zhuǎn)換成費舍Z分數(shù),見附表8。(2)求每一樣本的Z分數(shù)之和(3)求平均Z分數(shù)第九頁,共四十一頁,編輯于2023年,星期一2、計算積差相關(guān)系數(shù)的公式:3.2積差相關(guān)第十頁,共四十一頁,編輯于2023年,星期一3.2積差相關(guān)積差相關(guān),也稱積矩相關(guān)、皮爾遜相關(guān)(Pearson,英國統(tǒng)計學(xué)家),是求直線相關(guān)的基本方法。積差相關(guān)適用條件:(1)兩列數(shù)據(jù)都是測量的數(shù)據(jù)(數(shù)值型變量),即要求是連續(xù)變量;(2)成對數(shù)據(jù),且n≥30。(3)雙變量正態(tài)(可對較大樣本分別做正態(tài)性檢驗)。要求總體為正態(tài),但對樣本不要求一定為正態(tài)。(4)兩列變量之間的關(guān)系應(yīng)是線性的,如果是非線性的,則不能計算線性相關(guān)。3.2積差相關(guān)第十一頁,共四十一頁,編輯于2023年,星期一例3.1計算身高與體重的相關(guān)系數(shù)。3.2積差相關(guān)第十二頁,共四十一頁,編輯于2023年,星期一3.2積差相關(guān)第十三頁,共四十一頁,編輯于2023年,星期一3.3等級相關(guān)順序量表的數(shù)據(jù)或等距、等比數(shù)據(jù)而總體非正態(tài),不能計算積差相關(guān)的條件下,可以計算等級相關(guān)。優(yōu)點:對總體沒有特別要求,是非參數(shù)的相關(guān)方法,適用面廣。缺點:與積差相關(guān)相比,精度稍差。3.3.等級相關(guān)第十四頁,共四十一頁,編輯于2023年,星期一等級相關(guān)請注意:盡可能不出現(xiàn)相同等級,即不能并列排名,否則誤差大1、定義公式:(一)斯皮爾曼等級相關(guān)

斯皮爾曼等級相關(guān)是等級相關(guān)的一種,適用于只有兩列變量,而且是屬于等級變量性質(zhì)具有線性關(guān)系的資料。其中:N成對數(shù);D=Rx-Ry

對偶等級之差

第十五頁,共四十一頁,編輯于2023年,星期一一家廣告代理商想了解一家公司產(chǎn)品質(zhì)量等級是否與其商場份額等級有關(guān)。小規(guī)模的實驗研究,獲得該行業(yè)12家公司的質(zhì)量等級。例3.3.等級相關(guān)第十六頁,共四十一頁,編輯于2023年,星期一公司的質(zhì)量形象與其市場份額等級成正相關(guān)。3.3.等級相關(guān)第十七頁,共四十一頁,編輯于2023年,星期一有相同等級的等級相關(guān)系數(shù)3.3.等級相關(guān)第十八頁,共四十一頁,編輯于2023年,星期一(1)是計算多個等級變量相關(guān)程度的一種相關(guān)量,既可是k個評分者評(N)個對象,也可以是同一個人先后k次評N個對象。

(2)公式:Ri為每一被評事物k個等級之和,n為被評價事物的數(shù)目,即等級數(shù),k為評價者的數(shù)目或等級變量的列數(shù)。肯德爾(Kendall)和諧系數(shù)(W)3.3.等級相關(guān)第十九頁,共四十一頁,編輯于2023年,星期一有10人對七件廣告作品進行等級評價,結(jié)果如下表,問這10人的評價是否具有一致性?所以,10人對7個作品的評價具有較高的一致性。排名為(從小到大):4、6、1、5、3、7、2。例3.33.3.等級相關(guān)第二十頁,共四十一頁,編輯于2023年,星期一肯德爾W系數(shù)的性質(zhì)若k個評價者的評價完全一致,W=1;若完全沒有相關(guān),W=0;若k個評價者的評價完全相反,W=-1;若k個評價者的評價存在一定關(guān)系,但又不完全一致,則0<W<1一般來說,W[0,1],沒有負值。原理:和諧系數(shù)W=最大可能的方差/實際等級和方差。第二十一頁,共四十一頁,編輯于2023年,星期一肯德爾(Kendall)U系數(shù)肯德爾U系數(shù)又稱一致性系數(shù)。處理的數(shù)據(jù)同肯德爾W系數(shù),但數(shù)據(jù)獲得的方法不同。1、適用的資料:由K個評價者采用對偶比較方法對其優(yōu)劣、大小、高低等單一維度的屬性進行評價得到的數(shù)據(jù)。具體方法為:將N件事物兩兩配對比較,優(yōu)者為1,非優(yōu)為0,難以判定為0.5。3.3.等級相關(guān)第二十二頁,共四十一頁,編輯于2023年,星期一10個評價者對7種顏色對偶評價,其中一個評價者的評價為:例如:紅橙黃綠青藍紫紅110001橙000001黃010101綠111111青110001藍111011紫0000003.3.等級相關(guān)第二十三頁,共四十一頁,編輯于2023年,星期一整理得到10個評價者對7種顏色對偶評價的結(jié)果為:紅橙黃綠青藍紫紅10906210橙020005黃180308綠10101010510青4107009藍8101051010紫0520103.3.等級相關(guān)第二十四頁,共四十一頁,編輯于2023年,星期一肯德爾U系數(shù)的計算公式N-被評價事物的數(shù)目,即等級數(shù)K-評價者數(shù)目rij-對偶比較記錄中i>j(i<j)格子中擇優(yōu)分數(shù)3.3.等級相關(guān)第二十五頁,共四十一頁,編輯于2023年,星期一質(zhì)與量相關(guān)質(zhì)與量相關(guān)指一列變量為數(shù)值型數(shù)據(jù),另一列變量為類別變量,求兩列變量的直線相關(guān),稱為質(zhì)與量相關(guān)。包括:點二列相關(guān)二列相關(guān)多系列相關(guān)。第二十六頁,共四十一頁,編輯于2023年,星期一1、點二列相關(guān)(1)適用資料兩列變量中一列為等距或等比的測量數(shù)據(jù)而且總體分布為正態(tài),另一列變量為類別(名義)變量,分為兩類。點二列相關(guān)多用于編制是非測驗題評價測驗內(nèi)部一致性等問題。每個題目(二分名義變量)與總分(數(shù)值)變量的相關(guān),稱為每個題目的區(qū)分度。(2)計算公式3.4質(zhì)與量相關(guān)第二十七頁,共四十一頁,編輯于2023年,星期一例:有一是非選擇測驗,共有50題,每題選對得2分,滿分為100分。現(xiàn)有20人的總成績及對第5題的選答情況,問第5題與總分的相關(guān)程度如何?1、點二列相關(guān)3.4質(zhì)與量相關(guān)第二十八頁,共四十一頁,編輯于2023年,星期一例3.43.4質(zhì)與量相關(guān)第二十九頁,共四十一頁,編輯于2023年,星期一n=20,Xt=81.6,St=8.66,答對人數(shù)10,答錯人數(shù)10,p=答對學(xué)生的比率=10/20=0.5,q=1-p=0.5,Xp=88.4,Xq=74.8,

第5題與總分相關(guān)較高,相關(guān)系數(shù)為0.785,即第5題的答對答錯與總分有一致性。也可以說該題的區(qū)分度較高。3.4質(zhì)與量相關(guān)第三十頁,共四十一頁,編輯于2023年,星期一(1)適用資料

適用于兩列變量都為正態(tài)等距變量,但其中一列變量被人為地劃分成兩類。二列相關(guān)與點二列相關(guān)的主要區(qū)別在于二分變量是否正態(tài)。(2)計算公式2、二列相關(guān)3.4質(zhì)與量相關(guān)第三十一頁,共四十一頁,編輯于2023年,星期一(3)下表為10名考生一次測驗的卷面總分和一道回答題的得分,試求該問答題的區(qū)分度(該回答題滿分為10分,因此得6分以上則認為該題通過)。例3.53.4質(zhì)與量相關(guān)第三十二頁,共四十一頁,編輯于2023年,星期一解:回答題得分被認為劃分為通過和不通過兩類,應(yīng)求二列相關(guān)。查正態(tài)分布表:當p=0.60時y=0.3866,3.4質(zhì)與量相關(guān)第三十三頁,共四十一頁,編輯于2023年,星期一偏相關(guān)(PartialCorrelation)

多要素系統(tǒng)中,一個要素的變化要影響到其它要素的變化,因此它們之間存在著不同的相關(guān)關(guān)系。消除其它要素影響后兩個要素之間的相關(guān),稱為偏相關(guān)。偏相關(guān)系數(shù)是度量偏相關(guān)程度和方向的指標,它可以通過相關(guān)系數(shù)法來計算。設(shè)有三個要素或變量x1,x2,x3,其簡單相關(guān)系數(shù)矩陣如圖。第三十四頁,共四十一頁,編輯于2023年,星期一3.6偏相關(guān)(PartialCorrelation)三個變量間的偏相關(guān)系數(shù)有三個,即r12·3,r13·2,r23·1下標圓點后面的數(shù)字,代表保持不變的變量,如r12·3表示X3保持不變,稱為一級偏相關(guān)系數(shù)。若有四個要素或變量相關(guān),則有六個偏相關(guān)系數(shù),即r12·34,r13·24,r14·23,r23·14,r24·13,r34·12,稱為二級偏相關(guān)系數(shù)。要素或變量多于四個時,可以類推。第三十五頁,共四十一頁,編輯于2023年,星期一偏相關(guān)的計算公式rij有是變量xi,xj,的簡單相關(guān)系數(shù)例如:假定測量了某個班級學(xué)生的三個變量數(shù)學(xué)成績x1、外語成績x2和語文成績x3。計算這三個測量值之間線性相關(guān)系分別為:r12=0.58,r13=0.70,r23=0.80。3.6偏相關(guān)第三十六頁,共四十一頁,編輯于2023年,星期一3.7多重相關(guān)表示一個變量與一組變量的“綜合”效應(yīng)之間的相關(guān)一般以為高中平時成績和高考成績可以對大學(xué)一年級學(xué)業(yè)成績有預(yù)測作用。如何考慮大學(xué)一年級學(xué)業(yè)成績與高中平時成績和高考成績“總和”的相關(guān)?第三十七頁,共四十一頁,編輯于2023年,星期一六、相關(guān)系數(shù)的選用與解釋如何選擇合適的相關(guān)系數(shù)1、選擇計算相關(guān)系數(shù)的方法主要取決于要處理的數(shù)據(jù)的性質(zhì)以及某一相關(guān)系數(shù)需要滿足的假設(shè)條件2、總的來說,為了選擇一個合適的相關(guān)系數(shù)進行相關(guān)分析,要分下面幾個步驟考慮①

考慮每種測量所產(chǎn)生的數(shù)據(jù)類型。②

要對第一種測量數(shù)據(jù)和第二種測量數(shù)據(jù)的類型依次做出判斷③

確定采用哪一種相關(guān)系數(shù)。至于兩個測量數(shù)據(jù)哪個為第一哪個標為第二,沒有差別。第三十八頁,共四十一頁,編輯于2023年,星期一1、相關(guān)系數(shù)是一個指標值,它表示兩個變量之間的相關(guān)程度。2、相關(guān)系數(shù)不是等距的測量值,因此在比較相關(guān)程度時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論