版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
非參數(shù)統(tǒng)計講義(總14頁)--本頁僅作為文檔封面,使用時請直接刪除即可----內(nèi)頁可以根據(jù)需求調(diào)整合適字體及大小--第一章緒論本章主要內(nèi)容:1.非參數(shù)方法介紹預(yù)備知識第一節(jié)非參數(shù)方法介紹非參數(shù)方法的概念和實例復(fù)習(xí)參數(shù)方法定義:設(shè)總體X的分布函數(shù)的形式是已知的,而未知的僅僅是分布函數(shù)具體的參數(shù)值,用樣本對這些未知參數(shù)進行估計或進行某種形式的假設(shè)檢驗,這類推斷方法稱為參數(shù)方法。先來看兩個實例。例供應(yīng)商供應(yīng)的產(chǎn)品是否合格某工廠產(chǎn)品的零件由某個供應(yīng)商供應(yīng)。合格零件標(biāo)準(zhǔn)長度為(土)cm。這也就是說合格零件長度的中心位置為,允許誤差界為,即長度在-之間的零件是合格的。為評估近年來供應(yīng)的零件是否合格,隨機抽查了門二100個零件,它們的長度數(shù)據(jù)X見第一章附表。解答:根據(jù)我們已學(xué)過的參數(shù)統(tǒng)計的方法,如何根據(jù)數(shù)據(jù)來判斷這批零件合格否用參數(shù)數(shù)據(jù)分析方法,在參數(shù)統(tǒng)計中,運用得最多的是正態(tài)分布,所以考慮假設(shè)供應(yīng)商供應(yīng)的零件長度X服從正態(tài)分布,即X~N(呻2)其中兩個參數(shù)均未知,但可用樣本均值估計R,樣本方差估計。2。由已知的數(shù)據(jù)計算可得:零件的平均長度,即樣本均值為X二,樣本標(biāo)準(zhǔn)差為s二。則零件合格的可能性近似等于P(8.4<X<8.6)=中((8.6f)/。)-①((8.4-四)/。)2((8.6-8.9458)/0.1047)—中((8.4-8.4958)/0.1047)牝66%這個說明:約有三分之一的零件不合格,該工廠需要換另一個供銷商了。但這個結(jié)論與實際數(shù)據(jù)符不符合呢這是我們要思考的問題。我們可以對數(shù)據(jù)做一個描述性分析,先對這100個樣本數(shù)據(jù)做一個頻率分布。觀察到:在這100個零件中有91個零件的長度在~之間,所以零件合格的比例為91%,超過66%很多!統(tǒng)計分析的結(jié)論與數(shù)據(jù)不吻合的!這是什么原因呢我們可以作出數(shù)據(jù)的直方圖來分析數(shù)據(jù)的分布情況。由圖知,該數(shù)據(jù)的總體不是近似服從正態(tài)分布的!所以我們對于數(shù)據(jù)的總體分布的假設(shè)錯了!問題就出在假設(shè)總體是正態(tài)分布上!繼續(xù)看直方圖,能否很容易就觀察出來它大概是什么分布呢答案是不易看出,所以試圖先確定數(shù)據(jù)的分布函數(shù),再利用參數(shù)的方法來分析是不太容易的。例哪一個企業(yè)職工的工資高這里有22名職工的工資情況,其中的12名職工來自企業(yè)1,另外的10名職工來自企業(yè)2。他們的工資(單位:千元)如附表。僅從數(shù)據(jù)來看,顯然企業(yè)1職工的工資較高。根據(jù)我們已學(xué)過的參數(shù)統(tǒng)計的方法,這個問題用什么方法來解決呢(提問)采用參數(shù)數(shù)據(jù)分析方法,假設(shè)企業(yè)1和企業(yè)2職工的工資分別服從正態(tài)分布Ng2)和N(b,o2),則該問題轉(zhuǎn)化為假設(shè)檢驗問題:H0:a=b,%:a>b即兩樣本t檢驗。計算可得,檢驗統(tǒng)計量的值t二。若取a二,其臨界值為%5(20)=1.725,不能拒絕原假設(shè),即認(rèn)為二者沒有區(qū)別;若取a二,其臨界值為%(20)=1.325,仍不能拒絕原假設(shè)!計算p值得到的結(jié)論也一樣。這個統(tǒng)計分析的結(jié)論顯然與數(shù)據(jù)不吻合!之所以有問題,就是因為假設(shè)職工的工資服從正態(tài)分布的緣故。一般來說,工資、收入等的分布是不對稱的,并且有一部分人的工資比較高,所以分布的右邊有較長的尾巴。對于以上的這樣的問題,若想用參數(shù)數(shù)據(jù)的分析方法,就不能再假設(shè)總體服從正態(tài)分布,必須給它們賦一個較合理的分布函數(shù),做到這點對于很多實際問題上是難度比較大的。除了這個辦法之外,我們還可以用另外的處理辦法,例如,非參數(shù)統(tǒng)計、參數(shù)和非參數(shù)方法相結(jié)合等等。這門課,我們主要討論非參數(shù)方法。非參數(shù)統(tǒng)計方法特點非參數(shù)統(tǒng)計方法通常稱為“分布自由”的方法,即非參數(shù)數(shù)據(jù)分析方法對產(chǎn)生數(shù)據(jù)的總體的分布不做假設(shè),或者僅給出很一般的假設(shè),例如連續(xù)型分布、對稱分布等一些簡單的假設(shè),結(jié)果一般有較好的穩(wěn)定性。所以適用范圍非常寬泛。在經(jīng)典的統(tǒng)計框架下,正態(tài)分布一直是最引人注目的,但是對總體的分布不是隨便做出來的,如以上兩例,盲目地做出正態(tài)分布的假設(shè)有時候是起反作用的。當(dāng)數(shù)據(jù)的分布不是很明確,特別當(dāng)樣本含量不大,幾乎無法對分布作推斷的時候,此時使用參數(shù)方法就有一定的風(fēng)險,我們就可以考慮用非參數(shù)的方法。但要注意,非參數(shù)方法是與總體分布無關(guān),而不是與所有分布無關(guān)!非參數(shù)統(tǒng)計可以處理所有類型的數(shù)據(jù)。我們知道,統(tǒng)計數(shù)據(jù)按照數(shù)據(jù)類型可以分為兩大類:定性數(shù)據(jù)和定量數(shù)據(jù)。一般地,參數(shù)統(tǒng)計是處理定量數(shù)據(jù),如果所收集到的數(shù)據(jù)不符合參數(shù)模型的假定,比如:數(shù)據(jù)只有順序,沒有大小,則很多參數(shù)模型無能為力,此時只能嘗試非參數(shù)方法。例如:研究急性白血病患兒血液中血小板數(shù)與出血癥狀之間的關(guān)系。血小板數(shù)可用數(shù)據(jù)衡量,但出血癥狀則只能分為:明顯、較明顯、有出血點和無這4類。類似于這樣的“等級資料”,參數(shù)方法沒轍,可用非參數(shù)方法中的Spearman等級相關(guān)方法來做。在不知道總體分布的情況下,如何利用數(shù)據(jù)所包含的信息呢一組數(shù)據(jù)最基本的信息就是次序。非參數(shù)統(tǒng)計就是利用這個最基本的信息。如果把數(shù)據(jù)點按從小到大的次序排隊,每一個具體數(shù)目都有它在整個數(shù)據(jù)中的位置,這稱為該數(shù)據(jù)的秩(rank)。非參數(shù)統(tǒng)計的一個基本思想:用數(shù)據(jù)的秩代替數(shù)據(jù),構(gòu)造統(tǒng)計量進行統(tǒng)計推斷。數(shù)據(jù)有多少個觀察值,就有多少個秩。在一定的假設(shè)條件下,這些和由它們構(gòu)成的統(tǒng)計量的分布是求得出來的,而且和原來的總體分布無關(guān)。就可以進行所需要的統(tǒng)計推斷了。所以說,非參數(shù)統(tǒng)計只是和總體的分布無關(guān),但和秩以及它們統(tǒng)計量的分布是密切相關(guān)的!另外,其它與總體分布無關(guān)的統(tǒng)計方法也屬于非參數(shù)統(tǒng)計。在考慮非參數(shù)統(tǒng)計量的分布時,我們較多考慮這些統(tǒng)計量的漸近分布,由于利用到一些大樣本方面的定理,得出來的漸近分布都服從正態(tài)分布或是由正態(tài)分布導(dǎo)出的分布,較容易計算和處理。非參數(shù)方法與參數(shù)方法通過剛才上面的解說,不要產(chǎn)生錯覺,認(rèn)為非參數(shù)方法總比參數(shù)方法有效!非參數(shù)方法不是總比參數(shù)方法有效!畢竟非參數(shù)方法利用到的數(shù)據(jù)信息非常有限。如果人們對總體有充分的了解且足以確定其分布類型,則非參數(shù)方法比參數(shù)方法效率低。例如在總體分布族已知的情況下,非參數(shù)統(tǒng)計一般不如參數(shù)統(tǒng)計結(jié)果精確!另外,在總體分布是均勻分布時,正態(tài)的參數(shù)方法又比非參數(shù)方法好!這點可以通過計算漸近相對效率來說明。非參數(shù)統(tǒng)計的歷史相對參數(shù)統(tǒng)計而言,非參數(shù)統(tǒng)計起步較晚,但有后來者居上的趨勢。非參數(shù)統(tǒng)計的形成主要歸功于20世紀(jì)40年代~50年代化學(xué)家F.Wilcoxon等人的工作。Wilcoxon于1945年提出兩樣本秩和檢驗。1947年Mann和Whitney兩人將結(jié)果推廣到兩組樣本量不等的一般情況。之后,相繼涌現(xiàn)出大量論文。Savage1962年統(tǒng)計的非參數(shù)論文就有3000多項。Pitman于1948年回答了非參數(shù)統(tǒng)計方法相對于參數(shù)方法來說的相對效率方面的問題。1956年,J.L.Hodges和E.L.Lehmann則發(fā)現(xiàn)了一個令人驚訝的結(jié)果,與正態(tài)模型中t檢驗相比較,秩檢驗?zāi)芙?jīng)受住有效性的較小損失。而對于重尾分布所產(chǎn)生的數(shù)據(jù),秩檢驗可能更為有效。第一本論述非參數(shù)應(yīng)用的書于1956年由出版,有人記載從1956年到1972年,該書被引用了1824次。這也說明非參數(shù)統(tǒng)計在這一時期的發(fā)展是相當(dāng)活躍的。60年代,J.L.Hodges和E.L.Lehmann從秩檢驗統(tǒng)計量出發(fā),導(dǎo)出了若干估計量和置信區(qū)間。這些方法為后來非參數(shù)方法成功應(yīng)用于試驗設(shè)計數(shù)據(jù)開啟了一道大門。之后,非參數(shù)統(tǒng)計的應(yīng)用和研究獲得了巨大的成功。上世紀(jì)六十年代中后期,Cox和Ferguson最早將非參數(shù)方法應(yīng)用于生存分析。上世紀(jì)70年代到80年代,非參數(shù)統(tǒng)計借助計算機技術(shù)和大量計算獲得了更穩(wěn)健的估計和預(yù)測,以P.J.Huber和F.Hampel為代表的統(tǒng)計學(xué)家從計算技術(shù)的實現(xiàn)角度,為衡量估計量的穩(wěn)定性提出了新準(zhǔn)則。上世紀(jì)90年代有關(guān)非參數(shù)統(tǒng)計的應(yīng)用和研究主要集中在非參數(shù)回歸和非參數(shù)密度領(lǐng)域,其中較有代表性的人物是Silverman和.Fan。非參數(shù)統(tǒng)計主要內(nèi)容非參數(shù)統(tǒng)計可以分成兩個范疇,一個是比較經(jīng)典的基于秩的,以檢驗為主的非參數(shù)統(tǒng)計推斷,而另一部分是近二三十年來發(fā)展的非參數(shù)回歸、非參數(shù)密度估計、自助法以及小波方法等現(xiàn)代非參數(shù)統(tǒng)計方法。這兩者均不對總體分布做較為確定的假設(shè),但除此之外,這兩部分內(nèi)容在方法和概念上均沒有多少共同點。我們首先介紹經(jīng)典地基于秩的,以檢驗為主的非參數(shù)統(tǒng)計推斷,這也是我們的主要內(nèi)容,然后介紹現(xiàn)代非參數(shù)統(tǒng)計的部分內(nèi)容。第二節(jié)預(yù)備知識一、秩統(tǒng)計量1.定義:設(shè)Z.Z是來自連續(xù)分布F(z)的簡單隨機樣本,Z⑴<…<Z(〃)為其次序統(tǒng)計量。定義隨機變量R=r,當(dāng)Z=Z(),i=1,2,???,n。當(dāng)是唯一確定時,稱樣本觀測值Z.有秩R,i=1,2,...,n。(由于F(z)連續(xù),因而R不唯一確定的概率為0。)i即R.是第i個樣本單元Z在樣本次序統(tǒng)計量(Z),..?%)中的位置。例1:已知一組數(shù)據(jù),請寫出它們相應(yīng)的秩。20,10,30。解:先將該組數(shù)據(jù)從小到大排列如下:10,20,30。所以10對應(yīng)的秩為1,20對應(yīng)的秩為2,30對應(yīng)的秩為3。200,100,300。解:先將該組數(shù)據(jù)從小到大排列如下:100,200,300。所以100對應(yīng)的秩為1,200對應(yīng)的秩為2,300對應(yīng)的秩為3。注意:這兩組數(shù)據(jù)顯然區(qū)別較大,但他們對應(yīng)的秩卻都是1,2,3。沒有差別II2.性質(zhì)。定理1記R=(R1,…,Rn),集合M={(尸,…,r)|(r,…,r)是(1,…,n)的一個排列},1n1n則R在沉上均勻分布。證明:易知R僅在沉上取值。對任意一個r=(個…,r)6沉,P{R=r}=P{(R,…,R)=(r,…,r)}1 n1n=P{(Z,…,Z)=(Z ,…,Z )}1 n (r1) (rn)=P{((Z1L"=(Z(1),…,Z(n))}=P{Zd1<???<Zdn}'其中q=k,當(dāng)「i時,即d,(i=1,...,n)是i在排列r中的位置。又由于(Z,Z,…,Z)d(Z,Z,…,Z),
1 2n=d1 d2dn所以P{R=r}=P{Z1<???<Zn}對任意re沮,上式均成立,所以對任意r,這個概率均相等。而全部這樣的事件互不相容且它們的和是必然事件,故對任意r6沮,有P{R=r}=1/n!。定理2R=(R「氣,…,Rn)的邊緣分布也是均勻分布,特別一維邊緣分布有P(R=r)=<^'當(dāng)’=1,2,~,"時,i0,其他。二維邊緣分布,當(dāng)i。j時,有P(R=r,R=s)=<n(n-P(R=r,R=s)=<n(n-1)
0,當(dāng),豐s,r,s=1,2,…,n時,
其他。證明:當(dāng)r。1,…,n時,P(R=r)=0。i當(dāng)r=1,…,n時,因為(Z,Z,…,Z)d(Z,Z,…,Z),
1 2 n= 2 1 n于是有RdR,類似可證明:RdR,i=2,...,n。1=2 1=i所以,P(R1=r)=P(R=r)=…=P(R=r)。又因為{R.=r}D{R=r}=4,i。j,(考慮n個樣本兩兩不相等)£p(R=r)=1,ii=11所以P(R=r)=-。類似可證明二維邊緣分布和高維邊緣分布是均勻分布。in定理3對秩統(tǒng)計量R=(R1,R2,…,Rn),有 n+1E(R)=—^,i=1,2,…,n,i2Var(R)=(n+W-1),i=1,2,.,n,i 12n+1Cov(R,,R「=一刁須,i,j=1,2,…,n,證明:由上定理可知,對于i=1,2,.,n,sT1 1n(n+1)n+1E(R)=,r—= = inn2 2r=1Var(R)=E(R2)-(ER)2=(n+D(n-'iii 12 '因為0=r=1r=1于是有Cov(R,R)=E(R—ER)(R—ER)=—1—Efr—U1丫ijiijj n(n+1) k2n+1's-—八27由以上三個定理知:僅依賴R的統(tǒng)計量S(R)關(guān)于連續(xù)分布構(gòu)成的分布類是適應(yīng)任何分布的。二、次序統(tǒng)計量1.定義:設(shè)有樣本X=(X"..,Xn)。把X1,…,Xn按由小到大的次序排列為X⑴<X⑵<…<X(), (1)則(X⑴,X⑵,…,X(n))稱為樣本X的次序統(tǒng)計量,orderstatistics。習(xí)慣上也常把序列(1)的一部分稱為次序統(tǒng)計量。特別,X(,.)常稱為第/個次序統(tǒng)計量。如果X1,…,X.是從分布F中抽取的獨立同分布樣本,則稱(1)是從F中抽出的(大小為〃的)次序樣本。次序統(tǒng)計量在統(tǒng)計問題中有著廣泛的應(yīng)用,其理論也有深入的發(fā)展,也有不少這方面的專著。在一定程度上講,次序統(tǒng)計量的研究已形成數(shù)理統(tǒng)計學(xué)和概率論的一個分支。但有點需要明確:次序統(tǒng)計量既可以用于典型的非參數(shù)統(tǒng)計問題,如找連續(xù)分布函數(shù)的分位數(shù)的置信區(qū)間;也可用于典型的參數(shù)統(tǒng)計問題,如用極差的適當(dāng)倍數(shù)去估計正態(tài)分布的標(biāo)準(zhǔn)差。所以從學(xué)科角度,不好把次序統(tǒng)計量的理論與方法說成是非參數(shù)統(tǒng)計的一部分,但很多著作上,卻往往把次序統(tǒng)計量納入其中。所以我們先介紹次序統(tǒng)計量的相關(guān)知識。2.基本分布在應(yīng)用上,最常見的情況是:X1,…,X.是從一個有分布F的總體中抽取的簡單隨機樣本(即獨立同分布樣本)。
<1>.單個次序統(tǒng)計量X官)的分布。以「記X(r)的分布函數(shù),依定義有F(x)=P(X()<x)=P(X1,…,X中至少有,個小于工)=£p(X1,…,X〃中恰好有?個小于x)=£c,Fj(x)(1-F(x))n-jj=r j=rn! 1^ j(Qtr-1(1—t)n-rdt(2)中的最后一個等式是基于以下的(3)式:(r=1,…,n,0<p<1)8Cjpj(1—p)n—j= -— jPtr—(r=1,…,n,0<p<1)j=r 0的證明可依如下方法進行:當(dāng)p=0時,兩邊都是0。又兩邊都是關(guān)于p的可導(dǎo)函數(shù),且可證其一階導(dǎo)數(shù)相同。注意(2)的積分是一個不完全6積分,其值可查不完全6函數(shù)表。若F有概率密度f,則F(x)也有概率密度f(x),且frfr(x)=n!(r—1)!(n一r)!Fr-1(x)(1—F(x))n-rf(x)。特例:當(dāng)r=1和r=n,即極小值與極大值的分布:F(x)=1—(1—F(x))n,f(x)=n(1—F(x))n—1f(x);F(x)=Fn(x),f(x)=nFn-1(x)f(x)。<2>.兩個次序統(tǒng)計量(X⑺,X(s))的聯(lián)合分布。在實用中,最重要的是密度存在的情況,所以只給出兩個次序統(tǒng)計量的聯(lián)合密度函數(shù)的公式,推導(dǎo)可參見陳希孺和柴根象編寫的《非參數(shù)統(tǒng)計教程》P23。f(x,y)=(1)!(n?DR)!Fr-1(x)(F(y)—F(x))s-r—1(1一F(y))n—sf(x)f(y),當(dāng)X<y時;否則,為0。特別地,全體次序統(tǒng)計量(X⑴,…,X(.))的聯(lián)合密度函數(shù)為/(y,…,y)=n'.f(y)—f(y),當(dāng)y<...<y時;否則,為0。TOC\o"1-5"\h\z12…n1n 1 n 1 n3.總體分布F為(0,1)均勻分布的情況。當(dāng)總體分布為(0,1)均勻分布U(0,1)時,密度函數(shù)為f(x)=I(01)(x)。此時當(dāng)0<x<1時,有F(x)=X,f(X)= 1)^ )!尤一1(1-X)n-rI (X)r. . n'f(X,y)=(r-1)'(s-r-1)'(n-s)!?一">一小 一')"一"°<X<><1其他處為0。這個情況的重要性并不由于其形式簡單,而是在于下面的定理。定理4設(shè)隨機變量X的分布函數(shù)F在(-8,8)處處連續(xù)。記K=F(X)。則y有分布U(0,1)。證法一:由于分布函數(shù)只?。?,1]之間的值,有:當(dāng)y<0時,P(y<y)=0;當(dāng)y>1時,P(Y<y)=1;當(dāng)0<y<1,集合A={x:F(x)>y}有有限的下確界X。,且由F的連續(xù)性知,F(xiàn)(x0)=y。因而P(Y<y)=P(F(X)<F(x0))=P(X<x}=F邕)=y,0<y<1。最后,由分布函數(shù)的右連續(xù)性知,對于y=0,P(Y<0)=lim^P(Y<y)=lim^y=0。證法二:由于分布函數(shù)只?。?,1]之間的值,有:當(dāng)y<0時,P(Y<y)=0;當(dāng)y>1時,P(Y<y)=1;當(dāng)0<y<1,記x0=sup{x;F(x)<y},則x0有限,并且由F的連續(xù)性知F(x0)=y。所以,P(Y<y)=P(F(X)<F(x0))=P(X<x0)=F(x0)=y,0<y<1。最后,由分布函數(shù)的右連續(xù)性知,對于y=0,P(Y<0)=lim^P(Y<y)=lim^y=0。注意:由此定理可知,若X(1)<…<X)是從連續(xù)分布F中抽出的次序樣本,而記U(,■=F(x(i)),i=1,2,...,n,則U(1)<…<U(心是從分布R(0,1)中抽出的次序樣本。注意R(0,1)是一個完全確定的分布,與總體分布F無關(guān)。正是這一點導(dǎo)致它在非參數(shù)統(tǒng)計中的應(yīng)用,在理論上說,它可以把某些針對一般分布的問題轉(zhuǎn)化為均勻分布之下的問題。對于均勻分布,還有以下的結(jié)論需引起注意:定理5.隨機變量0服從U(0,1)分布。設(shè)F(x)是任意一個分布函數(shù),且在(-8,8)上處處連續(xù),定義F-1(y)=inf{x:F(x)>y},令&=F-1(0),則&是服從分布函數(shù)為F(x)的隨機變量。證明:顯然F-1(y)也是一個單調(diào)不減的函數(shù),并且F(F-1(y))=y。記&的分布函數(shù)為F&(x),貝UF(x)=P(&<x)=P(F-1(0)<x)=P(0<F(x))=F(x),所以F(x)=F(x)"旺~F(x)。g注意:以上定理說明,只要能產(chǎn)生服從U(0,1)分布的隨機變量,則對任意在(-8,8)上處處連續(xù)的分布函數(shù)F⑴,就能生成以F(x)為分布函數(shù)的隨機變量.以下定理可做了解:定理6.以X⑴<…<X(n)記U(0,1)中大小為n的次序樣本。又ZfZ為獨立同分布的,Z]有負指數(shù)分布,其密度為e-xI(x>0),記Y=也-Z「/(n+1-i),=1r=1,2,…,n,則(-logX⑴,...,-log、)蟲《,???匕)。三、假設(shè)檢驗1.顯著性檢驗的基本思想為了對總體的分布類型或分布中的未知參數(shù)作出推斷,首先對它們提出一個假設(shè)H0,然后在H0為真的條件下,通過選取恰當(dāng)?shù)慕y(tǒng)計量來構(gòu)造一個小概率事件,若在一次試驗中,這個小概率事件居然發(fā)生了,就完全有理由拒絕H0,否則沒有充分的理由拒絕H0,從而接受H0。兩種假設(shè)的選取例2某批發(fā)商欲從廠家購進一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不能低于1000小時。已知燈泡使用壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為20小時。在總體中隨機抽取了100個燈泡,得知樣本均值為996小時。批發(fā)商是否應(yīng)該購買這批燈泡3=0.05)即為單個正態(tài)總體均值的U檢驗。假設(shè)檢驗取為H0:心1000,H1:|i<1000計算可得檢驗統(tǒng)計量的值U=-2,查表可得a=0.05,n=100時,該檢驗的拒絕域為(-8,-1.645]。結(jié)論:在a=0.05時,拒絕H0,即我們有充分的理由認(rèn)為這批燈泡的壽命低于1000小時!進一步提出一個問題:若我們將原假設(shè)和備擇假設(shè)換一下,即H0:^<1000,H"|i>1000經(jīng)計算,檢驗統(tǒng)計量U=-2,查表可得a=0.05,n=100時,該檢驗的拒絕域為[1.645,+8)。結(jié)論:在a=0.05時,不能拒絕H0,即這批燈泡的壽命可能低于1000小時!從這個例子我們可以看出,就檢驗結(jié)果而言,拒絕原假設(shè)的理由是充分的,而接受原假設(shè)的理由是不充分的。所以一般把希望拒絕的,有把握拒絕的命題作為原假設(shè)!所以在零假設(shè)和備擇假設(shè)的選取上一定要把握好這個原則!兩類錯誤第一類錯誤:棄真,即:H0是真的,但被拒絕了。犯第一類錯誤的概率計算公式:a(0)=尸{拒絕H0|H°為真}第二類錯誤:存?zhèn)?,即:H0是假的,但被接受了。犯第二類錯誤的概率計算公式:P(0)=尸{接受氣隊為假}=尸{接受氣”為真}樣本容量確定之后,不可能同時讓犯兩類錯誤的概率減少[所以采用的方法是控制犯第一類錯誤的概率,讓犯第二類錯誤的概率盡可能地小。顯著性水平和功效顯著性水平a就是犯第一類錯誤的概率的最大值。即:sup以(9)<a,0e00換句話說:當(dāng)H0為真,拒絕零假設(shè)的最大概率是a,則接受零假設(shè)的最小概率是1-a。檢驗功效就是拒絕錯誤零假設(shè)的概率,即1-P(0)。注:不同于顯著性水平a,若H]是復(fù)雜假設(shè)時,功效不一定唯一!5.p值檢驗的p值就是根據(jù)已知的觀測,犯第一類錯誤的最小概率。若p<a,則拒絕H0;若p>a,則不拒絕H0。那么如何計算p值呢若令r表示檢驗統(tǒng)計量T的觀察值,則在單邊檢驗中,obs當(dāng)T的值越大越能拒絕H0,接受H1時,p值=P(T>t);當(dāng)T的值越小越能拒絕H0,接受H1時,p值=P(T<t)。而在雙邊檢驗中,p值=2min{P(T>t),P(T<t)}。在本課程中很多地方要計算p值,非常重要。6.置信區(qū)間定義:設(shè)X=(X1,,X〃)為來自總體的樣本,若不論參數(shù)。在參數(shù)空間0中取什么值,"區(qū)間(g(X),g(X))包含6”這個事件的概率,總不小于指定的常1 2數(shù)1-a,即:P(g(X)<0<g(X))>1-a,-切6€0,6 1 2則稱(g1(X),g2(X))是0的置信水平1-a的置信區(qū)間。注意:(1)若1-a為置信水平,對于0<a<a1<1,則1-a1也是置信水平,稱一切置信水平中的最大者為置信系數(shù)。(2)-般而言,a一般取值很小,所以1-a是很接近1的。例如取a=0.05,置信區(qū)間的說明:以的概率保證被估計參數(shù)0包含在區(qū)間(g1(X),g2(X))中。7.置信區(qū)間與假設(shè)檢驗的雙邊檢驗關(guān)系考慮顯著性水平為a的雙邊檢驗H0:0=00,H:0必0得到它的拒絕域為:00<g1(X)或00>g2(X)即: %0(00<g1(X)或00>g2(X))<a這等價于:P(g(X)<0<g(X))>1-a,TOC\o"1-5"\h\z00 1 0 2即,區(qū)間(g](X),g2(X))是00的置信系數(shù)為1-a的置信區(qū)間!反之,設(shè)(g1(X),g2(X))是參數(shù)0的一個置信系數(shù)為1-a的置信區(qū)間,則對于任意的0€0,有P(g(X)<0<g(X))>1-a, (5)0 1 2考慮顯著性水平為a的雙邊檢驗H0:0=00,H1:0必°由⑸得:%0(g1(X)<00<g2(X))>1-a即有: %0(00^gi(X)或00>g2(X))<a按顯著性水平為a的假設(shè)檢驗的拒絕域的定義,TOC\o"1-5"\h\z該檢驗的拒絕域為:0<g(X)或0>g(X),接受域為g(X)<0<g(X)。0 1 0 2 1 0 2四、相對效率與漸近相對效率定義1:設(shè)t和匕分別表示兩種檢驗,用來檢驗相同的原假設(shè)和備擇假設(shè),取相等顯著性水平a和相同功效P,T對T的相對效率定義為比值n/n,其中2 1 1 2n和n分別是檢驗T和T的樣本容量。12 12從定義1可以看出:相對效率越大,則檢驗T越有效|2定義2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國冷沖壓數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國T形把手?jǐn)?shù)據(jù)監(jiān)測研究報告
- 2025年中國雜醇油市場調(diào)查研究報告
- 2025年中國醫(yī)用腳輪市場調(diào)查研究報告
- 2025至2031年中國砂輪修整機行業(yè)投資前景及策略咨詢研究報告
- 二零二四年度中小企業(yè)適用勞動合同法免除條件協(xié)議書3篇
- 二零二五年度水利工程鋼管腳手架搭設(shè)及質(zhì)量保障合同4篇
- 個人交易知識產(chǎn)權(quán)許可使用合同(2024版)3篇
- 2025年度航空航天器密封打膠工程合同書4篇
- 中醫(yī)師專屬2024聘用協(xié)議模板版
- 完整版秸稈炭化成型綜合利用項目可行性研究報告
- 油氣行業(yè)人才需求預(yù)測-洞察分析
- 《數(shù)據(jù)采集技術(shù)》課件-Scrapy 框架的基本操作
- 2025年河北省單招語文模擬測試二(原卷版)
- 高一化學(xué)《活潑的金屬單質(zhì)-鈉》分層練習(xí)含答案解析
- DB34∕T 4010-2021 水利工程外觀質(zhì)量評定規(guī)程
- 2024年內(nèi)蒙古中考英語試卷五套合卷附答案
- 2024年電工(高級)證考試題庫及答案
- 農(nóng)產(chǎn)品質(zhì)量評估與分級
- 華為集團干部管理
- YY/T 0698.5-2023最終滅菌醫(yī)療器械包裝材料第5部分:透氣材料與塑料膜組成的可密封組合袋和卷材要求和試驗方法
評論
0/150
提交評論