專題分組數(shù)據(jù)的統(tǒng)計(jì)分析復(fù)習(xí)課程_第1頁
專題分組數(shù)據(jù)的統(tǒng)計(jì)分析復(fù)習(xí)課程_第2頁
專題分組數(shù)據(jù)的統(tǒng)計(jì)分析復(fù)習(xí)課程_第3頁
專題分組數(shù)據(jù)的統(tǒng)計(jì)分析復(fù)習(xí)課程_第4頁
專題分組數(shù)據(jù)的統(tǒng)計(jì)分析復(fù)習(xí)課程_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

專題:分組數(shù)據(jù)的統(tǒng)計(jì)分析分析方法選擇的依據(jù)需要哪種分析方法:描述或推論擁有哪類樣本:概率樣本與非概率樣本測量尺度:定距/定比,定序,定類何種比較:集中趨勢(shì),變異性,形狀,比例,相關(guān)性結(jié)果呈現(xiàn)方式:表,圖,統(tǒng)計(jì)摘要分組方式:單組或與已知值對(duì)比,兩組,多組分組獨(dú)立性:獨(dú)立樣本,配對(duì)樣本正態(tài)性:因變量是否滿足正態(tài)分布方差齊性:各組因變量方差是否相同自變量數(shù)量:多個(gè)自變量的獨(dú)立影響,偏影響檢驗(yàn)1:兩個(gè)相關(guān)樣本1.符號(hào)檢驗(yàn)對(duì)于配對(duì)樣本,檢驗(yàn)兩個(gè)組的對(duì)應(yīng)樣本之差,計(jì)算取+號(hào)和取-號(hào)的頻數(shù),進(jìn)行符號(hào)檢驗(yàn)??梢赃M(jìn)行雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)。2、Wilcoxon符號(hào)秩檢驗(yàn)符號(hào)秩檢驗(yàn)與符號(hào)檢驗(yàn)的原理相同,但增加了對(duì)差值大小的檢驗(yàn),因此判斷能力更強(qiáng)考察以下數(shù)據(jù)24.325.825.424.825.225.125.025.5能否認(rèn)為其中位數(shù)是25?建立原假設(shè)H0:數(shù)據(jù)中位數(shù)為25計(jì)算下表編號(hào)數(shù)值的秩D的符號(hào)124.3-0.70.76—225.80.80.87+325.40.40.44+424.8-0.20.22.5—525.20.20.22.5+625.10.10.11+725.000825.50.50.55+計(jì)算所有+號(hào)的秩和T+=19.5,所有-號(hào)的秩和T-=8.5查表得P-level=0.211,不能拒絕原假設(shè),即無法否認(rèn)中位數(shù)為25。在N足夠大時(shí)對(duì)于兩個(gè)相關(guān)樣本的情況,可以計(jì)算二者之差,然后建立原假設(shè),檢驗(yàn)二者之差的中位數(shù)為0,在此基礎(chǔ)上進(jìn)行Wilcoxon符號(hào)秩檢驗(yàn)。檢驗(yàn)2:兩個(gè)獨(dú)立樣本1、Mann-Whitney-Wilcoxon檢驗(yàn)譯作:曼-惠特尼-威爾克森檢驗(yàn),有時(shí)簡作“曼-惠特尼U檢驗(yàn)”。檢驗(yàn)?zāi)康脑谟谂袛鄡蓚€(gè)獨(dú)立樣本是否為同分布。對(duì)于兩個(gè)獨(dú)立樣本X和Y,假定其樣本量分別為m和n,將其進(jìn)行混合,并進(jìn)行排列,計(jì)算各自的秩和。在一次實(shí)驗(yàn)中,獲得實(shí)驗(yàn)組和對(duì)照組結(jié)果如下實(shí)驗(yàn)組(X):8,12,18對(duì)照組(Y):6,9,11,13建立原假設(shè)H0:兩個(gè)獨(dú)立樣本同分布,進(jìn)行混合排序計(jì)算X和Y的秩和均為14。構(gòu)造統(tǒng)計(jì)量在m≤n≤10的條件下,可以查表獲得其顯著性。M和n均大于10時(shí)數(shù)據(jù)68911121318秩1234567組別YXYYXYX2、Wald-Wolfowitz游程檢驗(yàn)H0:兩個(gè)獨(dú)立樣本同分布,或者二者有相同的中位數(shù)。將兩組數(shù)據(jù)進(jìn)行混合排列,觀察所產(chǎn)生的序列的游程數(shù)U。在原假設(shè)成立的情況下,兩個(gè)樣本高度混合,游程數(shù)較多。如果游程數(shù)偏少,則表明二者的中位數(shù)不同。在m+n<20時(shí),可通過查表獲得檢驗(yàn)結(jié)果。當(dāng)m+n>20時(shí),U近似服從于正態(tài)分布。3、兩樣本的χ2檢驗(yàn)對(duì)于兩個(gè)定類尺度的樣本,假定劃分為R個(gè)組,則各組的理論頻數(shù)可以按下列公式計(jì)算構(gòu)造統(tǒng)計(jì)量若兩總體同分布,Q服從于r-1個(gè)自由度的卡方分布4、兩樣本的Kolmogorov-Smirnov檢驗(yàn)對(duì)于兩個(gè)定序以上尺度的樣本,計(jì)算建立原假設(shè)H0:兩個(gè)樣本同分布在假設(shè)下,D值應(yīng)當(dāng)很小。當(dāng)D值超過指定的邊界值時(shí),拒絕原假設(shè)。檢驗(yàn)3:K個(gè)相關(guān)樣本1、CochranQ檢驗(yàn)用于檢驗(yàn)K個(gè)組的某些定類測量結(jié)果是否存在差異。觀察一個(gè)口味調(diào)查的例子:對(duì)18名受訪者進(jìn)行四種飲料(熱牛奶,酸奶,果汁,可樂)的偏好調(diào)查,得到數(shù)據(jù)如下消費(fèi)者熱牛奶酸奶果汁可樂合計(jì)(Y)110012200101300112411002510102601001700011801001901102101110311001011200101131001214110021511002160100117100121800011合計(jì)(X)887629建立原假設(shè)H0:K個(gè)樣本間無明顯差異構(gòu)造統(tǒng)計(jì)量在樣本量N比較大時(shí),Q服從于K-1個(gè)自由度的卡方分布。2.Friedman檢驗(yàn)檢驗(yàn)K個(gè)樣本是否來自于同一個(gè)總體,與CochranQ檢驗(yàn)一樣,F(xiàn)riedman檢驗(yàn)也要求樣本是配對(duì)樣本,即在K個(gè)不同條件下的同一組樣本作出的反應(yīng)。Friedman檢驗(yàn)主要針對(duì)定序數(shù)據(jù)。構(gòu)造Q服從于K-1個(gè)自由度的卡方分布學(xué)生組電視教學(xué)課堂講授課堂討論11322123323143215213613271238231921310213111321213213123141321512.52.5161231712318123合計(jì)()2540.542.5數(shù)據(jù):將54名學(xué)生分成18個(gè)組,每組3名學(xué)生,分別接受電視教學(xué)、課堂講授和課堂討論三種教學(xué)方法。學(xué)習(xí)后進(jìn)行測試,根據(jù)分?jǐn)?shù)計(jì)算三種方法的秩如下。計(jì)算Q=10.8,2個(gè)自由度的卡方值為5.99,拒絕原假設(shè),即認(rèn)為三種教學(xué)方法存在差異性。檢驗(yàn)4:K個(gè)獨(dú)立樣本1、Kruskol-Wallis檢驗(yàn)譯作“克拉夏爾-瓦里斯檢驗(yàn)”,也可稱為“克氏檢驗(yàn)”,是對(duì)兩個(gè)獨(dú)立樣本的Mann-Whitney-Wilcoxon檢驗(yàn)的推廣。假設(shè)有K個(gè)總體,各自的連續(xù)累積分布函數(shù)分別為Fi(x)。建立原假設(shè)將K個(gè)樣本進(jìn)行混合,其秩和為N(N+1)/2,平均每個(gè)值的秩為(N+1)/2考察第J個(gè)樣本,其實(shí)際秩和為Rj,理論秩和為nj(N+1)/2。在原假設(shè)成立的情況下,實(shí)際秩和與理論秩和的差異應(yīng)當(dāng)很小。構(gòu)造統(tǒng)計(jì)量H服從K-1個(gè)自由度的卡方分布。2.K個(gè)樣本的χ2檢驗(yàn)建立原假設(shè)H0:K個(gè)樣本同分布將K個(gè)樣本分布為r個(gè)組,每組計(jì)算期望頻數(shù)和理論頻數(shù)。統(tǒng)計(jì)量Q服從于(k-1)(r-1)個(gè)自由度的卡方分布檢驗(yàn)5:兩個(gè)樣本的相關(guān)分析1、等級(jí)相關(guān)計(jì)算斯皮爾曼等級(jí)相關(guān)系數(shù)(Spearmancoefficientofrankcorrelation)。將兩個(gè)樣本按觀察數(shù)據(jù)的順序進(jìn)行配對(duì),分別計(jì)算每個(gè)數(shù)據(jù)的秩,將兩組樣本的秩分別記錄為U和V。如果兩個(gè)測度完全一致,則U與V的差異應(yīng)當(dāng)為0。計(jì)算D=U-V的平方和,該值越大,表明相關(guān)性越差。2、Kendall秩相關(guān)對(duì)于n個(gè)配對(duì)樣本,先將樣本X的秩按自然順序排列,然后將Y的秩與X的秩相對(duì)應(yīng),從而得到Y(jié)的一個(gè)秩排列順序。計(jì)算Y的秩序情況,得到“一致對(duì)”的數(shù)量U和“非一致對(duì)”的數(shù)量V。利用上述三個(gè)公式之一,可以計(jì)算出秩相關(guān)系數(shù)T,取值在-1至+1之間。K=U-V,T為希臘字母τ的大寫,發(fā)音為Tao。Kendall秩相關(guān)中的“一致對(duì)”也稱協(xié)同對(duì)(Concordant),意思為滿足下列條件的數(shù)對(duì):協(xié)同對(duì)的數(shù)量減去不協(xié)同對(duì)的數(shù)量得到的K值在大樣本條件下有3.偏秩相關(guān)偏秩相關(guān)是檢驗(yàn)當(dāng)存在第三組樣本量時(shí),前兩組樣本之間的相關(guān)系數(shù)獨(dú)立于第三組樣本的情況。該相關(guān)系數(shù)的取值范圍也在-1至+1之間,但其抽樣分布至今未知,因此難以進(jìn)行顯著性檢驗(yàn)。檢驗(yàn)6:K個(gè)樣本的相關(guān)分析1、完全秩評(píng)定的Kendall協(xié)和系數(shù)KendallCoefficientofConcordanceforCompleteRankings。數(shù)據(jù):3名消費(fèi)者對(duì)6個(gè)品牌的電冰箱質(zhì)量評(píng)定的秩如下消費(fèi)者品牌A品牌B品牌C品牌D品牌E品牌F116325421564233632541秩和(Rj)8141111118各品牌秩和的期望值為k(n+1)/2,在各組呈正相關(guān)的情況下,秩和Rj的離散程度較大。特別是,當(dāng)各組的秩評(píng)定嚴(yán)格相等的時(shí)候,秩和表現(xiàn)為如下序列:k,2k,3k,……,jk。構(gòu)造統(tǒng)計(jì)量定義Kendall完全秩評(píng)定協(xié)和系數(shù)為該系數(shù)取值為0-1,取值為0時(shí),表示K組秩不相關(guān)2.Kendall不完全秩評(píng)定協(xié)和系數(shù)假定有K個(gè)樣本,每組含有n個(gè)觀察值,但每組觀察值評(píng)定的秩為m,m<n,此為不完全秩評(píng)定??紤]評(píng)定次數(shù)λ的影響,建立以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論