總體分布的正態(tài)性檢驗(yàn)_第1頁
總體分布的正態(tài)性檢驗(yàn)_第2頁
總體分布的正態(tài)性檢驗(yàn)_第3頁
總體分布的正態(tài)性檢驗(yàn)_第4頁
總體分布的正態(tài)性檢驗(yàn)_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

總體分布的正態(tài)性檢驗(yàn)第一頁,編輯于星期六:十八點(diǎn)三十四分。第1頁,共35頁。正態(tài)檢驗(yàn)法偏度、峰度檢驗(yàn)法(樣本容量大于100)K-s正態(tài)性檢驗(yàn)Lilliefor正態(tài)性檢驗(yàn)W檢驗(yàn)(2<n≤50)第二頁,編輯于星期六:十八點(diǎn)三十四分。第2頁,共35頁。(一)偏度、峰度檢驗(yàn)法由于中心極限定理知道,正態(tài)分布隨機(jī)變量是較為廣泛地存在,因此,當(dāng)研究一個(gè)連續(xù)型總體時(shí)候,往往先考察它是否服從正態(tài)分布。上面介紹的擬合檢驗(yàn)法雖是一般方法,但他在檢驗(yàn)正態(tài)時(shí),犯第二類錯(cuò)誤的概率較大。下面來介紹“偏度、峰度檢驗(yàn)法”,還有“夏丕羅-威爾克法”也較為有效。第三頁,編輯于星期六:十八點(diǎn)三十四分。第3頁,共35頁。隨機(jī)變量X的偏度和峰度指的是X的標(biāo)準(zhǔn)化變量的三階矩和四階矩:當(dāng)隨機(jī)變量X服從正態(tài)分布時(shí)第四頁,編輯于星期六:十八點(diǎn)三十四分。第4頁,共35頁。若X服從正態(tài)分布,當(dāng)n充分大時(shí)第五頁,編輯于星期六:十八點(diǎn)三十四分。第5頁,共35頁。H0為真,當(dāng)n充分大一般說來G1與v1的偏離不應(yīng)該太大,同樣G2與v2的偏離也不應(yīng)該太大。取顯著水平α下,H0的拒絕域?yàn)椋夯驒z驗(yàn)統(tǒng)計(jì)量:第六頁,編輯于星期六:十八點(diǎn)三十四分。第6頁,共35頁。男子的頭顱的最大寬度(mm),141148132138154142150146155158150140147148144150149145149158143141144144126140144142141140145135147146141136140146142137148154137139143140131143141149148135148152143144141143147146150132142142143153149146149138142149142137134144146147140142140137152145例1下面給出了84個(gè)伊特拉斯坎(Etruscan)人數(shù)據(jù)的“頻率直方圖”.現(xiàn)在來畫這些第七頁,編輯于星期六:十八點(diǎn)三十四分。第7頁,共35頁。解:這里第八頁,編輯于星期六:十八點(diǎn)三十四分。第8頁,共35頁。計(jì)算樣本中心距:帶入觀察值得第九頁,編輯于星期六:十八點(diǎn)三十四分。第9頁,共35頁。由拒絕域的公式,所以拒絕域?yàn)椋含F(xiàn)算得:故接收H0。Matlab中計(jì)算命令:skewness(偏度)

kurtosis(峰度)第十頁,編輯于星期六:十八點(diǎn)三十四分。第10頁,共35頁。用Fn(x)表示樣本量為n的隨機(jī)樣本觀察值的累計(jì)分布函數(shù),且Fn(x)=i/n(i是等于或小于x的所有觀察結(jié)果的數(shù)目,i=1,2,…,n)。F(x)表示正態(tài)分布的累計(jì)概率分布函數(shù)。(二)k-s檢驗(yàn)(D檢驗(yàn))第十一頁,編輯于星期六:十八點(diǎn)三十四分。第11頁,共35頁。K-S單樣本檢驗(yàn)通過樣本的累計(jì)分布函數(shù)Fn(x)和理論分布函數(shù)F(x)的比較來做擬合優(yōu)度檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量是F(x)與Fn(x)間的最大偏差Dn:若對每一個(gè)x值來說,F(xiàn)(x)與Fn(x)都十分接近,則表明實(shí)際樣本的分布函數(shù)與理論分布函數(shù)的擬合程度很高。第十二頁,編輯于星期六:十八點(diǎn)三十四分。第12頁,共35頁。1.建立假設(shè)組:H0:Fn(x)=F(x)

H1:Fn(x)≠F(x)

2.計(jì)算樣本累計(jì)頻率與理論分布累計(jì)概率的絕對差,令最大的絕對差為Dn;3.用樣本容量n和顯著水平a查出臨界值Dna;4.通過Dn與Dna的比較做出判斷,若Dn<Dna,則認(rèn)為擬合是滿意的即接收H0。第十三頁,編輯于星期六:十八點(diǎn)三十四分。第13頁,共35頁。K-s檢驗(yàn)只能做標(biāo)準(zhǔn)正態(tài)分布的檢驗(yàn),所以,用該方法檢驗(yàn)前先將數(shù)據(jù)中心化Z=ZSCORE(X),然后再對Z進(jìn)行檢驗(yàn)。第十四頁,編輯于星期六:十八點(diǎn)三十四分。第14頁,共35頁。該檢驗(yàn)是對Kolmogorov-Smirnov檢驗(yàn)的修正,參數(shù)未知時(shí),由可計(jì)算得檢驗(yàn)統(tǒng)計(jì)量的值。三、Lilliefor正態(tài)性檢驗(yàn)第十五頁,編輯于星期六:十八點(diǎn)三十四分。第15頁,共35頁。檢驗(yàn)統(tǒng)計(jì)量:

當(dāng)原假設(shè)為真時(shí),W的值應(yīng)接近于1,若值過小,則懷疑原假設(shè),從而拒絕域?yàn)樵诮o定的下,可求出臨界值c(四)Shapiro-Wilk(W檢驗(yàn))第十六頁,編輯于星期六:十八點(diǎn)三十四分。第16頁,共35頁。將數(shù)據(jù)按數(shù)值大小重新排列,使計(jì)算有表可以查。

步驟:第十七頁,編輯于星期六:十八點(diǎn)三十四分。第17頁,共35頁。若W值小于判斷界限值Wα(可通過查表求得),按表上行寫明的顯著性水平α舍棄正態(tài)性假設(shè);若W>Wα,接受正態(tài)性假設(shè)。第十八頁,編輯于星期六:十八點(diǎn)三十四分。第18頁,共35頁。正態(tài)性方法比較1.經(jīng)常使用的擬合優(yōu)度檢驗(yàn)和Kolmogorov-Smirnov檢驗(yàn)的檢驗(yàn)功效較低,在許多計(jì)算機(jī)軟件的Kolmogorov-Smirnov檢驗(yàn)無論是大小樣本都用大樣本近似的公式,很不精準(zhǔn),一般使用Shapiro-Wilk檢驗(yàn)和Lilliefor檢驗(yàn)。2.Kolmogorov-Smirnov檢驗(yàn)只能檢驗(yàn)是否一個(gè)樣本來自于一個(gè)已知樣本,而Lilliefor檢驗(yàn)可以檢驗(yàn)是否來自未知總體。3.Shapiro-Wilk檢驗(yàn)和Lilliefor檢驗(yàn)都是進(jìn)行大小排序后得到的,所以易受異常值的影響。4.Shapiro-Wilk檢驗(yàn)只適用于小樣本場合(3n50),其他方法的檢驗(yàn)功效一般隨樣本容量的增大而增大。第十九頁,編輯于星期六:十八點(diǎn)三十四分。第19頁,共35頁。5.擬合優(yōu)度檢驗(yàn)和Kolmogorov-Smirnov檢驗(yàn)都采用實(shí)際頻數(shù)和期望頻數(shù)進(jìn)行檢驗(yàn),前者既可用于連續(xù)總體,又可用于離散總體,而Kolmogorov-Smirnov檢驗(yàn)只適用于連續(xù)和定量數(shù)據(jù)。6.?dāng)M合優(yōu)度檢驗(yàn)的檢驗(yàn)結(jié)果依賴于分組,而其他方法的檢驗(yàn)結(jié)果與區(qū)間劃分無關(guān)。7.偏度和峰度檢驗(yàn)易受異常值的影響,檢驗(yàn)功效就會(huì)降低。8.假設(shè)檢驗(yàn)的目的是拒絕原假設(shè),當(dāng)p值不是很大時(shí),應(yīng)根據(jù)數(shù)據(jù)背景再作討論。第二十頁,編輯于星期六:十八點(diǎn)三十四分。第20頁,共35頁。Matlab相關(guān)命令最值:max(x),min(x)(1)max(X):返回向量X的最大值,如果X中包含復(fù)數(shù)元素,則按模取最大值。(2)

max(A):返回一個(gè)行向量,向量的第i個(gè)元素是矩陣A的第i列上的最大值。(3)

[Y,U]=max(A):返回行向量Y和U,Y向量記錄A的每列的最大值,U向量記錄每列最大值的行號。(4)

max(A,[],dim):dim取1或2。dim取1時(shí),該函數(shù)和max(A)完全相同;dim取2時(shí),該函數(shù)返回一個(gè)列向量,其第i個(gè)元素是A矩陣的第i行上的最大值。數(shù)據(jù)統(tǒng)計(jì)處理基本命令第二十一頁,編輯于星期六:十八點(diǎn)三十四分。第21頁,共35頁。Matlab相關(guān)命令求和:

(1)

sum(X),返回向量X各元素的和。(2)sum(A),返回一個(gè)行向量,其第i個(gè)元素是A的第i列的元素和。(3)sum(A,dim),當(dāng)dim為1時(shí),該函數(shù)等同于sum(A);當(dāng)dim為2時(shí),返回一個(gè)列向量,其第i個(gè)元素是A的第i行的各元素之和。乘積:(1)

prod(X)

,返回向量X各元素的乘積。(2)prod(A),返回一個(gè)行向量,其第i個(gè)元素是A的第i列元素的乘積。(3)prod(A,dim),當(dāng)dim為1時(shí),該函數(shù)等同于prod(A);當(dāng)dim為2時(shí),返回一個(gè)列向量,其第i個(gè)元素是A的第i行的各元素之乘積。數(shù)據(jù)統(tǒng)計(jì)處理基本命令第二十二頁,編輯于星期六:十八點(diǎn)三十四分。第22頁,共35頁。Matlab相關(guān)命令累加和與累乘積

在MATLAB中,使用cumsum和cumprod函數(shù)能方便地求得向量和矩陣元素的累加和與累乘積向量,函數(shù)的調(diào)用格式為:cumsum(X):返回向量X累加和向量。cumprod(X):返回向量X累乘積向量。cumsum(A):返回一個(gè)矩陣,其第i列是A的第i列的累加和向量。cumprod(A):返回一個(gè)矩陣,其第i列是A的第i列的累乘積向量。cumsum(A,dim):當(dāng)dim為1時(shí),該函數(shù)等同于cumsum(A);當(dāng)dim為2時(shí),返回一個(gè)矩陣,其第i行是A的第i行的累加和向量。cumprod(A,dim):當(dāng)dim為1時(shí),該函數(shù)等同于cumprod(A);當(dāng)dim為2時(shí),返回一個(gè)向量,其第i行是A的第i行的累乘積向量。數(shù)據(jù)統(tǒng)計(jì)處理基本命令第二十三頁,編輯于星期六:十八點(diǎn)三十四分。第23頁,共35頁。Matlab相關(guān)命令相關(guān)系數(shù)

MATLAB提供了corrcoef函數(shù),可以求出數(shù)據(jù)的相關(guān)系數(shù)矩陣。corrcoef函數(shù)的調(diào)用格式為:corrcoef(X):返回從矩陣X形成的一個(gè)相關(guān)系數(shù)矩陣。此相關(guān)系數(shù)矩陣的大小與矩陣X一樣。它把矩陣X的每列作為一個(gè)變量,然后求它們的相關(guān)系數(shù)。corrcoef(X,Y):在這里,X,Y是向量,它們與corrcoef([X,Y])的作用一樣。數(shù)據(jù)統(tǒng)計(jì)處理基本命令第二十四頁,編輯于星期六:十八點(diǎn)三十四分。第24頁,共35頁。Matlab相關(guān)命令排序

MATLAB中對向量X是排序函數(shù)是sort(X),函數(shù)返回一個(gè)對X中的元素按升序排列的新向量。sort函數(shù)也可以對矩陣A的各列或各行重新排序,其調(diào)用格式為:[Y,I]=sort(A,dim)其中dim指明對A的列還是行進(jìn)行排序。若dim=1,則按列排;若dim=2,則按行排。Y是排序后的矩陣,而I記錄Y中的元素在A中位置。

數(shù)據(jù)統(tǒng)計(jì)處理基本命令第二十五頁,編輯于星期六:十八點(diǎn)三十四分。第25頁,共35頁。Matlab相關(guān)命令類似的用法,請自己借助matlab在線幫助功能自己了解:中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x)

方差:var(x)偏度:skewness(x)

峰度:kurtosis(x)數(shù)據(jù)統(tǒng)計(jì)處理基本命令第二十六頁,編輯于星期六:十八點(diǎn)三十四分。第26頁,共35頁。常見的概率分布二項(xiàng)式分布Binomialbino卡方分布Chisquarechi2指數(shù)分布ExponentialexpF分布Ff幾何分布Geometricgeo正態(tài)分布Normalnorm泊松分布PoissonpoissT分布Tt均勻分布Uniformunif離散均勻分布DiscreteUniformunid第二十七頁,編輯于星期六:十八點(diǎn)三十四分。第27頁,共35頁。概率密度函數(shù)【例】繪制卡方分布密度函數(shù)在自由度分別為1、5、15的圖形x=0:0.1:30;y1=chi2pdf(x,1);plot(x,y1,':')holdon【例】繪制標(biāo)準(zhǔn)正態(tài)分布的概率密度圖.x=-4:0.1:4;y=normpdf(x,0,1);plot(x,y)title('N(0,1)的概率密度曲線圖')第二十八頁,編輯于星期六:十八點(diǎn)三十四分。第28頁,共35頁。累積分布函數(shù)(cdf)【例】求服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量落在區(qū)間[-2,2]上的概率.>>P=normcdf([-2,2])ans=0.02280.9772>>P(2)-P(1)ans=0.9545第二十九頁,編輯于星期六:十八點(diǎn)三十四分。第29頁,共35頁。累積分布函數(shù)(cdf)>>u_alpha=norminv(0.9,0,1)u_alpha=1.2816>>t_alpha=tinv(0.25,4)t_alpha=-0.7407>>F_alpha=finv(0.1,14,10)F_alpha=0.4772>>X

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論