語言統(tǒng)計第八章 線性關(guān)系的測量——相關(guān)ppt課件_第1頁
語言統(tǒng)計第八章 線性關(guān)系的測量——相關(guān)ppt課件_第2頁
語言統(tǒng)計第八章 線性關(guān)系的測量——相關(guān)ppt課件_第3頁
語言統(tǒng)計第八章 線性關(guān)系的測量——相關(guān)ppt課件_第4頁
語言統(tǒng)計第八章 線性關(guān)系的測量——相關(guān)ppt課件_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第八章 線性關(guān)系的丈量相關(guān)n第一節(jié) 什么是相關(guān)n第二節(jié) 相關(guān)的直觀表示法n第三節(jié) 線性相關(guān)的量化n 一、皮爾遜積距相關(guān)系數(shù)n 二、皮爾遜積距相關(guān)系數(shù)的計算n 三、皮爾遜積距相關(guān)系數(shù)的假設(shè)檢驗(yàn)n第四節(jié) 斯皮爾曼等級相關(guān)系數(shù)n 一、斯皮爾曼等級相關(guān)系數(shù)的運(yùn)用與計n 二、斯皮爾曼等級相關(guān)系數(shù)的假設(shè)檢驗(yàn)第一節(jié) 什么是相關(guān) 變量之間往往存在一定程度的聯(lián)絡(luò)或關(guān)聯(lián),比如變量X的值能夠隨變量Y的值的增大而增大,或隨變量的值能夠隨值的增大而減小等。相關(guān)本質(zhì)上就是變量之間的協(xié)變或共變,即一個變量隨另一個變量的變化而變化。既然相關(guān)的變量之間存在規(guī)律性的關(guān)系,那么有了一個變量的值就可以在一定程度上預(yù)測另一個變量的值,

2、預(yù)測的準(zhǔn)碗性顯然取決于變量之間相關(guān)程度的強(qiáng)弱,假設(shè)兩變量完全相關(guān)這種情況非常少見,那么預(yù)測的準(zhǔn)碗性就可以到達(dá)百分之百。第二節(jié) 相關(guān)的直觀表示法 變量之間相關(guān)的強(qiáng)弱可以量化,也可以用直觀的方法表示出來。在對相關(guān)量化之前,最好先用直觀的方法,看看變量之間的大體關(guān)系如何,比如相關(guān)的程度能否強(qiáng),是正相關(guān)還是負(fù)相關(guān),是線性關(guān)系還是非線性關(guān)系 由于對相關(guān)的量化往往要求變量之間呈線性關(guān)系 , 等等。 此外, 我們還能很容易、很直觀地發(fā)現(xiàn)能否有反常的數(shù)據(jù)值,這些反常值會對相關(guān)的量化 相關(guān)系數(shù)產(chǎn)生很大的影響。 對相關(guān)的直觀表示普通是利用分布圖。分布圖就是一個直角坐標(biāo),橫坐標(biāo)代表一個變量,縱坐標(biāo)代表另一個變量。在

3、坐標(biāo)內(nèi)用一個個的點(diǎn)來表示相關(guān)變量的一對對的觀測值,這些點(diǎn)所構(gòu)成的圖形的外形就可以表達(dá)變量之間的相關(guān)情況。 圖8.1和圖8.2 表示完全線性相關(guān),即變量X和變量Y之間的關(guān)系完全可以用一條直線來表達(dá),這時給出一個變量的值就可以完全預(yù)測另一個變量的值。正相關(guān)表示變量Y的值隨變量X的值的增大而增大,負(fù)相關(guān)表示變量Y的值隨變量X的值的增大而減小。圖8.3表示線性強(qiáng)正相關(guān),即隨變量X的值增大,變量Y的值也傾向于增大,兩者之間存在很強(qiáng)的線性關(guān)系,即各點(diǎn)相聚很緊,經(jīng)過各點(diǎn)的中間根本上可以劃一條直線。 圖8.4表示線性強(qiáng)負(fù)相關(guān),即隨變量X的值的增大,變量Y的值傾向于減小,各點(diǎn)之間相聚同樣很緊,經(jīng)過各點(diǎn)的中間也根

4、本上可以劃一條直線。 圖8.5表示弱正相關(guān),變量Y的值大休上隨變量X的值的增大而增大,但有很多例外,因此各點(diǎn)不是緊聚在一條直線兩側(cè)。 圖8.6表示弱負(fù)相關(guān),變量Y的值大體上隨變量X 的值的增大而減小,但有很多例外,因此各點(diǎn)不是緊聚在一條直線兩側(cè)。 圖8.7中看不出明顯的規(guī)律性,這闡明兩變量不相關(guān)或相關(guān)很低。 圖8.8闡明兩變量之間雖有規(guī)律性的關(guān)系U型,變量X的小值和變量Y的大值相聯(lián)絡(luò),但該關(guān)系是非線性關(guān)系。 第三節(jié)線性 相關(guān)的量化 一、 皮爾遜積矩相關(guān)系數(shù) 最常用的一種指數(shù)是皮爾遜積矩相關(guān)系數(shù)或積差相關(guān)系數(shù),用符號r表示。 該相關(guān)系數(shù)有以下幾個特點(diǎn): 1就像比例或百分比那樣,相關(guān)系數(shù)沒有單位,

5、變量的丈量單位的改動不影響相關(guān)系數(shù)的值。 2與其值在 -1與+1之間, 即-1r +1。 -1和+1分別表示完全的負(fù)相關(guān)和完全的正相關(guān); 3適用于兩變量都是等距變量或比率變量,且每一變量的數(shù)據(jù)都是呈正態(tài)分布的情況。二、皮爾遜積矩相關(guān)系數(shù)的計算皮爾遜積矩相關(guān)系數(shù)的計算公式為8.1其中 代表變量X的任一個觀測值的規(guī)范分; 代表變量Y的任一個觀測值的規(guī)范分; ,即每對規(guī)范分之積的和,就表示了兩變量之間的關(guān)系;N表示兩變量觀測值的對子數(shù),N-1就是相關(guān)系數(shù)的自在度。在上式中又因所以上述公式可以改寫為(8.1) 三、皮爾遜積矩相關(guān)系數(shù)的假設(shè)檢驗(yàn) 對皮爾遜積矩相關(guān)系數(shù)的假設(shè)檢驗(yàn)為參數(shù)檢驗(yàn)。 檢驗(yàn)步驟如下:

6、 第一步:陳說零假設(shè)和備擇假設(shè): 為希臘字母, 表示總體的相關(guān)系數(shù),表示樣本所來自的總體之間不存在任何相關(guān) 雙尾檢驗(yàn) 或 單尾檢驗(yàn) 或 單尾檢驗(yàn) 第二步: 設(shè)定顯著程度 第三步: 計算檢驗(yàn)統(tǒng)計值 如兩變量呈正態(tài)分布, 即用r作為檢驗(yàn)計值。 第四步: 查表:附表3給出了對應(yīng)于各顯著程度和數(shù)據(jù)對子數(shù) N 的 臨界值。 第五步: 假設(shè)r值大于或等于臨界值,就可以在所設(shè)定的顯著程度上回絕零假設(shè)。 對于上例,假設(shè)設(shè) 為 0.05,雙尾檢驗(yàn),那么臨界值為 0.444。由于r值0.672 大于臨界值, 所以該檢驗(yàn)有顯著意義, 即兩組分?jǐn)?shù)之間確實(shí)存在相關(guān)。假設(shè)設(shè) ,該檢驗(yàn)即為單尾檢驗(yàn)值,如 仍為0.05 ,那

7、么臨界值為0.378 ,檢驗(yàn)依然有顯著意義。第四節(jié)斯皮爾曼等級相關(guān)系數(shù) 一、 斯皮爾曼等級相關(guān)系數(shù)的運(yùn)用與計算 另一個常用的相關(guān)系數(shù)是斯皮爾曼等級相關(guān)系數(shù),符號為 。該相關(guān)系數(shù)用來比較兩組等級數(shù)據(jù),來決議兩者之間的相關(guān)程度,因此,它適用于兩變量都是順 序變量的情況。斯皮爾曼等級相關(guān)系數(shù)的計算公式為8.3 上述計算方法僅適用于兩變量都是順序變量即變量的值為等級的情況。假設(shè)一個是順序變量,而另一個是等距變量,或者兩個變量都是等距變量因種種緣由不能運(yùn)用皮爾遜積矩相關(guān)系數(shù),就要先把等距變量轉(zhuǎn)換為順序變量當(dāng)然隨著轉(zhuǎn)換,將會失去一定量的信息。轉(zhuǎn)換的方法是:先把第一個變量的觀測值按從小到大的順序一一轉(zhuǎn)換成等

8、級,即最小的觀測值的等級為如遇并列的觀測值,那么把它們的平均等級即假設(shè)它們不并列而本應(yīng)占的等級除以并列的觀測值個數(shù)用作它們的等級。轉(zhuǎn)換以后,其他計算方法同 上。 計算斯皮爾曼等級相關(guān)系數(shù)時有一點(diǎn)需求留意,那就是并列等級有能夠?qū)?值帶來偏向。假設(shè)并列等級過多,就會大大影響值的準(zhǔn)確性傾向于過高估計相關(guān)強(qiáng)度在上例中,有一部分觀測值的等級是并 性列的, 所以計算出的 值略高于r值。在這種情況下, 一個更精碗的方法是把等級作為觀測值,計算皮爾遜相關(guān)系數(shù)。二、皮爾曼等級相關(guān)系數(shù)的假設(shè)檢驗(yàn)檢驗(yàn)的步驟與方法如下:第一步:零假設(shè)與備擇假設(shè)為: 即樣本所來自的總體之間不存在相關(guān); 單尾檢驗(yàn),即總體之間的相關(guān)為正相關(guān)。第二步: 設(shè)顯著程度為0.05第三步: 檢驗(yàn)統(tǒng)計值第四步:查表得臨界值為第五步:由于 值大于臨界值,所以零假設(shè)被推翻,證明兩變量之間確實(shí)存在顯著的正相關(guān)。小 結(jié) 在研討相關(guān)時有兩點(diǎn)需求留意。一是,相關(guān)并不意味著因果關(guān)系,兩變量相關(guān)并不闡明兩者之間存在因果關(guān)系。舉一個很極端的例子,某年的降雨量與出生率之間有很高的正相關(guān),但是不能因此說高降雨量導(dǎo)致了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論