第九章 列聯(lián)分析_第1頁
第九章 列聯(lián)分析_第2頁
第九章 列聯(lián)分析_第3頁
第九章 列聯(lián)分析_第4頁
第九章 列聯(lián)分析_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第九章列聯(lián)分析第一頁,共二十頁,2022年,8月28日第一節(jié)列聯(lián)分析

第二頁,共二十頁,2022年,8月28日二維列聯(lián)表(contingencytable;交叉表:crosstable):

這些變量中每個(gè)都有兩個(gè)或更多的可能取值,這些取值也稱為水平;比如收入有三個(gè)水平,觀點(diǎn)有兩個(gè)水平。各個(gè)變量不同水平的交匯處是頻數(shù)。

更多維的列聯(lián)表稱為高維列聯(lián)表。第三頁,共二十頁,2022年,8月28日

列聯(lián)表分析的一個(gè)重要內(nèi)容是看變量之間是否獨(dú)立,如本例中的收入和觀點(diǎn)是否無關(guān)。原假設(shè)和備選假設(shè):H0:(觀點(diǎn)和收入)變量之間獨(dú)立;H1:變量之間相關(guān)。所用的檢驗(yàn)統(tǒng)計(jì)量一般為Pearson卡方統(tǒng)計(jì)量(也有其他統(tǒng)計(jì)量,如似然比統(tǒng)計(jì)量,但Pearson卡方統(tǒng)計(jì)量最常用),它在原假設(shè)成立的前提下有(大樣本時(shí))近似的卡方分布。第四頁,共二十頁,2022年,8月28日第五頁,共二十頁,2022年,8月28日第六頁,共二十頁,2022年,8月28日第七頁,共二十頁,2022年,8月28日既然這個(gè)c2統(tǒng)計(jì)量是近似的,那么有沒有精確的統(tǒng)計(jì)量呢?有。這個(gè)檢驗(yàn)稱為Fisher精確檢驗(yàn);它不是c2分布,而是超幾何分布。當(dāng)數(shù)目很大時(shí),超幾何分布計(jì)算相當(dāng)緩慢(比近似計(jì)算會(huì)差很多倍的時(shí)間);而且在計(jì)算機(jī)速度不快時(shí),根本無法計(jì)算。因此人們多用大樣本近似的c2統(tǒng)計(jì)量。第八頁,共二十頁,2022年,8月28日例:收入水平與對(duì)待該項(xiàng)政策的態(tài)度獨(dú)立(無關(guān))嗎?第九頁,共二十頁,2022年,8月28日例:收入水平與對(duì)待該項(xiàng)政策的態(tài)度相關(guān)嗎?第十頁,共二十頁,2022年,8月28日>data=read.csv("table7.csv",head=TRUE);attach(data)>data1=xtabs(number~opinion+income)#把三維表轉(zhuǎn)化為二維>sum=sum(data1)>理論頻率=c(sum(number[opinion==0])/sum,sum(number[opinion==1])/sum)>理論頻數(shù)=cbind(sum(number[income==1])*理論頻率,sum(number[income==2])*理論頻率,sum(number[income==3])*理論頻率)#計(jì)算理論頻數(shù)>實(shí)際理論之差=data1-理論頻數(shù)>卡方統(tǒng)計(jì)量值=sum(實(shí)際理論之差^2/理論頻數(shù))>自由度=(2-1)*(3-1)>pvalue=1-pchisq(卡方統(tǒng)計(jì)量值,自由度);pvalue[1]3.614199e-05第十一頁,共二十頁,2022年,8月28日列聯(lián)檢驗(yàn)的軟件實(shí)現(xiàn):SPSS:Analyze(分析)→DescriptiveStatistics(描述統(tǒng)計(jì))→Crosstabs(交叉表)。R:>data=read.csv("table7.csv",head=TRUE);attach(data)>data1=xtabs(number~opinion+income)#把三維表轉(zhuǎn)化為二維>chisq.test(data1)或>fisher.test(data1)#fisher精確檢驗(yàn)第十二頁,共二十頁,2022年,8月28日第二節(jié)檢驗(yàn)

第十三頁,共二十頁,2022年,8月28日第十四頁,共二十頁,2022年,8月28日1、看看基本指標(biāo)>data=read.csv("概率論與數(shù)理統(tǒng)計(jì)課程成績數(shù)據(jù).csv",head=TRUE)>attach(data);length(課程成績);mean(課程成績);sd(課程成績);range(課程成績)[1]147[1]80.57143[1]12.61278[1]391002、劃分區(qū)間并計(jì)算實(shí)際頻數(shù)>區(qū)間=quantile(課程成績,prob=seq(0,1,0.1))#把課程成績分成等概率的10個(gè)區(qū)間(即頻數(shù)為147*0.1)第十五頁,共二十頁,2022年,8月28日>實(shí)際頻數(shù)=table(cut(課程成績,區(qū)間,include.lowest=TRUE))#計(jì)算成績落在各區(qū)間的頻數(shù)(并列成績的存在使各區(qū)間頻數(shù)并不嚴(yán)格相等),include.lowest=TRUE選項(xiàng)保證39分的成績不被漏掉3、計(jì)算理論概率>理論概率1=pnorm(區(qū)間,mean(課程成績),sd(課程成績))>理論概率1=理論概率1[-1]>理論概率=c(理論概率1[1],理論概率1[2:10]-理論概率1[1:9])>理論頻數(shù)=理論概率*length(課程成績)第十六頁,共二十頁,2022年,8月28日4、計(jì)算卡方統(tǒng)計(jì)量、p值>卡方統(tǒng)計(jì)量=sum((實(shí)際頻數(shù)-理論頻數(shù))^2/理論頻數(shù))>df=10-1#自由度為10個(gè)區(qū)間數(shù)(即卡方統(tǒng)計(jì)量中sum的項(xiàng)數(shù))-1>pvalue=1-pchisq(卡方統(tǒng)計(jì)量,df)>卡方統(tǒng)計(jì)量;pvalue[1]30.6344[1]0.0003419502第十七頁,共二十頁,2022年,8月28日分布的擬合優(yōu)度的卡方檢驗(yàn)的計(jì)算機(jī)實(shí)現(xiàn):SPSS:Analyze(分析)→NonparametricTests(非參數(shù)檢驗(yàn))→Chi-Square(卡方)。(麻煩:理論頻數(shù)需要一個(gè)一個(gè)地輸入)第十八頁,共二十頁,2022年,8月28日R:#讀入數(shù)據(jù)、劃分區(qū)間、計(jì)算實(shí)際頻數(shù)>data=read.csv("概率論與數(shù)理統(tǒng)計(jì)課程成績數(shù)據(jù).csv",head=TRUE)>attach(data);n=length(課程成績);mean=mean(課程成績);sd=sd(課程成績);range(課程成績)>區(qū)間=quantile(課程成績,prob=seq(0,1,0.1))#把課程成績分成等概率的10個(gè)區(qū)間(即頻數(shù)為147*0.1)>實(shí)際頻數(shù)=table(cut(課程成績,區(qū)間,include.lowest=TRUE))#計(jì)算成績落在各區(qū)間的頻數(shù)(由于有并列成績所以各區(qū)間頻數(shù)并不嚴(yán)格相等),include.lowest=TRUE選項(xiàng)保證39分的成績不被漏掉第十九頁,共二十頁,2022年,8月28日#構(gòu)造概率向量:為了使概率向量的區(qū)間數(shù)與實(shí)際頻數(shù)相等并使概率和為1(這是使用chisq.test命令的前提),需要進(jìn)行修正>累積理論概率1=pnorm(區(qū)間,mean,sd)>累積理論概率修正1=c(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論