




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1,分布擬合檢驗,2,前面介紹的各種檢驗法都是在總體分布形式為已知的前提下進(jìn)行討論的.在實際問題中, 有時不知道總體服從什么類型的分布需要根據(jù)樣本來檢驗關(guān)于分布的假設(shè). 本節(jié)介紹2擬合檢驗法和專用于檢驗分布是否為正態(tài)的 偏度,峰度檢驗法.,引 入,?,3,2擬合檢驗法 在總體未知時, 根據(jù)樣本X1,X2,.,Xn來檢驗關(guān)于總體分布的假設(shè)H0:總體X的分布函數(shù)為F(x),H1:總體X的分布函數(shù)不是F(x), (6.1)若總體X為離散型則(6.1)中的H0相當(dāng)于H0:總體X的分布律為P(X=ti)=pi,i=1,2,. (6.2)若總體X為連續(xù)型, 則(6.1)中的H0相當(dāng)于H0:總體X的概率密度
2、為f(x) (6.3),4,設(shè)H0中假設(shè)的X的分布函數(shù)F(x)不含未知參數(shù).,將在H0下, X可能值的全體分成k個兩兩不相交的子集A1,A2,.,Ak.以fi(i=1,2,.,k)記樣本觀察值x1,x2,.,xn中落在Ai中的個數(shù), 在n次試驗中事件Ai發(fā)生的頻率為fi/n 當(dāng)H0為真時, 根據(jù)H0所假設(shè)的X的分布函數(shù)來計算事件Ai的概率pi=P(Ai), 若H0為真,且試驗的次數(shù)又足夠多時,fi/n與pi=P(Ai) 不應(yīng)差異太大!,5,采用形如,的統(tǒng)計量來度量樣本與H0中所假設(shè)的分布的吻合程度, 其中hi(i=1,2,.,k)是給定的常數(shù). 皮爾遜證明, 如果選取hi=n/pi(i=1,2
3、,.,k)則(6.4)式定義的統(tǒng)計量近似服從c2(k-1)分布. (n50),作為檢驗統(tǒng)計量,選擇統(tǒng)計量,6,若H0中所假設(shè)的X的分布函數(shù)F(x)中包含未知參數(shù)先利用樣本求出未知參數(shù)的最大似然估計(在H0下), 以估計值作為參數(shù)值, 然后根據(jù)H0中所假設(shè)的分布函數(shù), 求出pi的估計值,作為檢驗統(tǒng)計量.近似地服從c2(k-r-1)分布, 其中r是被估計的參數(shù)的個數(shù).,7,當(dāng)H0為真時c2不應(yīng)太大如c2過分大就拒絕H0, 拒絕域的形式為c2G (G為正常數(shù)).對于給定的顯著性水平a, 確定G使,確定拒絕的原則,8,即當(dāng)樣本觀察值使(6.5)或(6.6)的c2值有,則在顯著性水平a下拒絕H0, 否則
4、就接受H0, c2擬合檢驗法,求拒絕域,9,c2擬合檢驗法使用的注意事項,10,例1 在一實驗中, 每隔一定時間觀察一次由某種鈾所放射的到達(dá)計數(shù)器上的a粒子數(shù)X, 共觀察了100次, 得結(jié)果如下表所示:,其中fi是觀察到有i個a粒子的次數(shù), 在水平a=0.05下檢驗假設(shè) H0:總體X服從泊松分布:,11,解 因在H0中參數(shù)l未具體給出, 所以先估計l,下, X所有可能取的值為W=0,1,2,., 將W分成前表所示的兩兩不相交子集A1,A2,.,A12, 則PX=i有估計,12,c2擬合檢驗計算表,13,并組后k=8, 但因在計算概率時, 估計了一個參數(shù)l, 故r=1, c2的自由度為8-1-1
5、=6.,現(xiàn)在c2=106.281-100=6.28112.592,?,拒絕,接受,14,例2 1965年1月1日至1971年2月9日共2231天中, 全世界記錄到里氏震級4級和4級以上地震計162次, 統(tǒng)計如下:(x-相繼兩次地震間隔天數(shù), f-出現(xiàn)的頻數(shù)),試檢驗相繼兩次地震間隔的天數(shù)X服從指數(shù)分布(a=0.05). *-8個數(shù)值是40,43,44,49,58,60,81,109.,15,解 按題意需檢驗假設(shè):H0: X的概率密度為,H0中的參數(shù)q未給出, 先由最大似然估計法,下, X可能取值的全體W為區(qū)間0,). 將區(qū)間分為k=9個不重疊的小區(qū)間:A1=0,4.5, A2=(4.5,9.5
6、,.,A9=(39.5,).,16,若H0為真, X的分布函數(shù)的估計為,由上式可得概率pi=P(Ai)的估計:,17,例2的c2檢驗計算表,18,c2=163.5633-162=1.5633,故在水平0.05下接受H0, 認(rèn)為X服從指數(shù)分布.,19,例3 下面列出64個伊特拉斯坎人男子的頭顱的最大寬度(mm), 檢驗這些數(shù)據(jù)是否來自正態(tài)總體(取a=0.1),20,解 為了粗略了解這些數(shù)據(jù)的分布情況, 我們先根據(jù)所給數(shù)據(jù)畫出直方圖.上述數(shù)據(jù)的最小值, 最大值分別為126,158, 即所有數(shù)據(jù)落在區(qū)間126,158上, 現(xiàn)取區(qū)間124.5, 159.5, 它能覆蓋區(qū)間126,158. 將此區(qū)間等分
7、為7個小區(qū)間, 小區(qū)間的長度記為D, D=(159.5-124.5)/7=5. D稱為組距. 小區(qū)間的端點稱為組限. 數(shù)出落在每個小區(qū)間內(nèi)的數(shù)據(jù)的頻數(shù)fi, 算出頻率fi/n(n=84, i=1,2,.,7).,21,列出下表:,22,繪出的直方圖如下,129.5,134.5,139.5,144.5,149.5,154.5,159.5,23,從直方圖看樣本很象來自正態(tài)總體. 現(xiàn)作c2擬合檢驗如下. 即需檢驗假設(shè)H0: X的概率密度為,因H0未給出m,s2的數(shù)值, 需先估計m,s2, 由最大似然估計法得m,s2的估計值分別為,將在H0下X可能取值的區(qū)間(-,)分為7個小區(qū)間A1,A2,.,A7.
8、,24,若H0為真, X的概率密度的估計為,按上式查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表即可得概率P(Ai)的估計, 例如,25,例3的c2檢驗計算表,26,現(xiàn)在c2=87.67-84=3.67, 因為,故在水平0.1下接受H0, 即認(rèn)為數(shù)據(jù)來自正態(tài)分布總體.,27,例4 一農(nóng)場10年前在一魚塘里按比例20:15:40:25投放了四種魚:鮭魚,鱸魚,竹夾魚和鲇魚的魚苗. 現(xiàn)在在魚塘里獲得一樣本如下:,試取a=0.05檢驗各類魚數(shù)量的比例較10年前是否有顯著改變.,28,解 以X記魚種類的序號, 按題意需檢驗假設(shè):H0:X的分布律為,所需計算列表如下(n=600):,29,現(xiàn)在c2=611.14-600=11.1
9、4, k=4, r=0,故拒絕H0, 認(rèn)為各魚類數(shù)量之比較10年前有顯著改變.,30,奧地利生物學(xué)家孟德爾進(jìn)行了長達(dá)八年之久的豌豆雜交試驗, 并根據(jù)試驗結(jié)果,運用他的數(shù)理知識, 發(fā)現(xiàn)了遺傳的基本規(guī)律.,孟德爾,31,他的一組觀察結(jié)果為:,黃70,綠27,近似為2.59:1,與理論值相近.,根據(jù)他的理論,子二代中, 黃、綠之比 近似為3:1,,32,由于隨機性,觀察結(jié)果與3:1總有些差距,因此有必要去考察某一大小的差異是否已構(gòu)成否定3:1理論的充分根據(jù)?,這里,n=70+27=97, k=2,檢驗孟德爾的3:1理論:,提出假設(shè)H0: p1=3/4, p2=1/4,理論頻數(shù)為: np1=72.75
10、, np2=24.25,實測頻數(shù)為f 1=70,f2=27.,01 分布,33,自由度為 k-1=1,=0.41583.841,,按 =0.05,自由度為1,查 分布表得,=3.841,未落入否定域.,故認(rèn)為試驗結(jié)果符合孟德爾的3:1理論.,34,偏度、峰度檢驗 用于檢驗正態(tài)總體分布,35,隨機變量X的偏度和峰度指的是X的標(biāo)準(zhǔn)化變量的三階矩和四階矩:,當(dāng)X服從正態(tài)分布時, n1=0且n2=3.,36,設(shè)X1,X2,.,Xn是來自總體X的樣本, 則n1,n2的矩估計量分別是,其中Bk(k=2,3,4)是樣本k階中心矩, 并分別稱G1,G2為樣本偏度和樣本峰度.若總體X為正態(tài)變量, 則可證當(dāng)n充分
11、大時, 近似地有,37,設(shè)X1,X2,.,Xn是來自總體X的樣本, H0:X為正態(tài)總體.,當(dāng)H0為真且n充分大時, 近似地有 U1N(0,1), U2N(0,1). 因G1,G2依概率收斂于n1,n2, 因此一般來說G1與n1=0,G2與n2=3的偏離不應(yīng)太大.,38,當(dāng)|U1|的觀察值|u1|或|U2|的觀察值|u2|過大時就拒絕H0, 取顯著性水平為a, H0的拒絕域為|u1|k1 或 |u2|k2, (6.11)其中k1,k2由以下兩式確定:,即有k1=za/4,k2= za/4. 于是得拒絕域為 |u1|za/4 或 |u2|za/4, (6.12),39,驗證當(dāng)n充分大時上述檢驗法近
12、似地滿足顯著性水平為a的要求. 當(dāng)n充分大時有,40,例5 下面列出84個伊特拉斯坎人男子的頭顱的最大寬度(mm), 檢驗這些數(shù)據(jù)是否來自正態(tài)總體(取a=0.1),41,例5 用偏度,峰度檢驗法檢驗是否來自正態(tài)總體(取a=0.1).解 現(xiàn)在來檢驗假設(shè)H0:數(shù)據(jù)來自正態(tài)總體.這里a=0.1, n=84,42,計算樣本中心矩B2,B3,B4時可利用以下關(guān)系式:,經(jīng)計算得A1=143.7338, A2=20706.13, A3=2987099, A4=4.316426108, B2=35.2246, B3=-28.5, B4=3840.,43,樣本偏度和樣本峰度的觀察值分別為g1=-0.1363,
13、g2=3.0948而za/4=z0.025=1.96. 由(6.11)式, 拒絕域為|u1|=|g1/s1|1.96 或 |u2|=|g2-m2|/s21.96.現(xiàn)算得|u1|=0.52851.96, |u2|=0.33811.96, 故接受H0, 認(rèn)為數(shù)據(jù)來自正態(tài)分布的總體.使用偏度峰度檢驗法時樣本容量以大于100為宜.,44,秩 和 檢 驗,45,設(shè)有兩個連續(xù)型總體, 它們的概率密度函數(shù)分別為f1(x), f2(x), 均為未知, 但已知f1(x)=f2(x-a), a為未知常數(shù), (7.1)即f1與f2至多只差一平移. 我們要檢驗下述各項假設(shè)H0:a=0, H1:a0.(7.3)H0:a
14、=0, H1:a0.(7.4),46,若總體的均值存在, 分別記作m1, m2, 則由于f1,f2至多只差一平移, 故有m2=m1-a.此時, 上述各項假設(shè)分別等價于H0:m1=m2, H1:m1m2.(7.3)H0:m1=m2, H1:m1m2.(7.4),47,秩 設(shè)X為一總體, 將一容量為n的樣本觀察值按自小到大的次序編號排成x(1)x(2).x(n),(7.5)稱x(i)的足標(biāo)i為x(i)的秩, i=1,2,.,.現(xiàn)設(shè)自1,2兩總體分別抽取容量為n1,n2的樣本, 且設(shè)兩樣本獨立, 假定n1n2. 將這n1+n2個觀察值放在一起, 按自小到大的次序排列, 求出每個觀察值的秩, 然后將屬
15、于第1個總體的樣本觀察值的秩相加, 其和記為R1, 稱為第1樣本的秩和. 其余觀察值的秩的總和記作R2, 稱為第2樣本的秩和. 顯然R1,R2是隨機變量。,48,例如, 假設(shè)來自兩個總體的兩個樣本觀察值為:樣本1:23, 48, 10. n1=3.樣本2: 11, 45, 50, 2. n2=4.排序得:2, 10, 11, 23, 45, 48, 50(1),(2),(3),(4), (5),(6),(7).則r1=2+4+6=12r2=1+3+5+7.,49,R1,R2滿足:,R1,R2中的任一個確定后另一個隨之確定. 只要考慮統(tǒng)計量R1即可. H0:a=0, H1:a0. 當(dāng)H0為真時,
16、 即有f1(x)=f2(x), 這時兩個獨立樣本實際上來自同一總體. 因而第1個樣本中諸元素的秩應(yīng)該隨機地、分散地在自然數(shù)1n1+n2中取值, 一般來說不應(yīng)過分集中取較小的或較大的值.,50,H0:a=0, H1:a0. 當(dāng)H0為真時, 即有f1(x)=f2(x), 這時兩個獨立樣本實際上來自同一總體. 第1個樣本中諸元素的秩應(yīng)該隨機地、分散地在自然數(shù)1n1+n2中取值, 一般來說不應(yīng)過分集中取較小的或較大的值.,51,即當(dāng)H0為真時秩和R1一般來說不應(yīng)取太靠近上述不等式兩端的值. 拒絕原則:當(dāng)R1的觀察值r1過分大或過分小時, 拒絕H0. 據(jù)以上分析, 對于雙邊檢驗(7.4), 在給定顯著性
17、水平a下, H0的拒絕域為,來自樣本1的秩和取值范圍:,52,拒絕域,53,若已知R1的分布, 則臨界點是不難求得的. 以n1=3, n2=4為例說明求臨界點的方法.當(dāng)n1=3, n2=4時, 第1個樣本中各觀察值的秩的不同取法共有35種, 列表如下:,54,由于這35種情況的出現(xiàn)是等可能的, 由上表容易求得R1的分布律和分布函數(shù)如下:,55,于是, 對于不同的a值, 容易寫出檢驗問題(7.4)的臨界點和拒絕域. 例如, 給定a=0.2. 由上表知,即有CU(0.1)=7, CL(0.1)=17. 故當(dāng)n1=3, n2=4, 在水平0.2下檢驗問題(7.4)的拒絕域為 r17 或 r117.
18、此時, 犯第I類錯誤的概率為 Pa=0R17+Pa=0R117=2/35+2/35=0.114.,56,類似地可得左邊檢驗H0:m1=m2, H1:m1m2的拒絕域為(顯著性水平為a) r1CL(a)此處, 臨界點CL(a)是滿足Pa=0R1CL(a)a的最小整數(shù).,57,例如, 若給定a=0.1, 抽取的樣本容量為n1=3, n2=4, 則檢驗問題H0:m1=m2, H1:m1m2的拒絕域為 r117.此時犯第1類錯誤的概率為2/350.1.附表8中列出了n1和n2自2到10為止的n1,n2的各種組合的臨界點, 以及相應(yīng)的犯第I類錯誤的概率.,58,例1 為查明某種血清是否會抑制白血病, 選
19、取患白血病已到晚期的老鼠9只, 其中有5只接受這種治療, 另4只則不作這種治療. 設(shè)兩樣本相互獨立. 從試驗開始時計算, 其存活時間(以月計)如下:,設(shè)治療與否的存活時間的概率密度至多差一個平移, 取a=0.05, 問這種血清對白血病是否有抑制作用?,59,解 以m1,m2表示不作治療和接受治療的老鼠的存活時間的均值, H0:m1=m2, H1:m1m2 拒絕域形式:r1CU(a), n1=4, n2=5, a=0.05. 將兩樣本排序如下:,則r1=1+2+4+5=12. 查附表8知CU(0.05)=12, 即拒絕域為r112. 而現(xiàn)在r1=12, 故拒絕H0, 即認(rèn)為這種血清對白血病有抑制作用.,60,附表8給出的樣本容量為210 若樣本容量大于10,臨界點怎么確定,?,61,可以證明, 當(dāng)H0為真時(即a=0時),而當(dāng)n1,n210, 當(dāng)H0為真時, 近似地有,62,因此, 當(dāng)n1,n210時我們可以采用,作為檢驗統(tǒng)計量. 在水平a下雙邊檢驗, 右邊檢驗, 左邊檢驗的近似拒絕域分別為 |z|za/2, zza, z-za. z是Z的觀察值.,63,例2 某商店為了確定向公司A或公司B購買某種商品, 將A,B公司以往各次進(jìn)貨的次品率進(jìn)行比較, 數(shù)據(jù)如下, 設(shè)兩樣本獨立. 問兩公司的商品質(zhì)量有無顯著差異. 設(shè)兩公司的商品的次品率的密度至多只差一個平移, 取水平a=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安徽省阜陽市潁上縣第二中學(xué)2025屆化學(xué)高一下期末教學(xué)質(zhì)量檢測模擬試題含解析
- 江西省永豐中學(xué)2025年高一下化學(xué)期末達(dá)標(biāo)檢測試題含解析
- 河北省深州市中學(xué)2025屆高二化學(xué)第二學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 條形碼管理辦法規(guī)定為
- 農(nóng)家書屋維護(hù)管理辦法
- 材料外放加工管理辦法
- 晉安白蟻防治管理辦法
- 華為電子發(fā)票管理辦法
- 機電運輸三違管理辦法
- 教師業(yè)務(wù)專長案例分析
- 河北省2025年中考數(shù)學(xué)真題試卷(含答案)
- 福建福州金山中學(xué)2024~2025學(xué)年高一下冊期末考試數(shù)學(xué)試題含解析
- 2025年廣東省高考生物真題(解析版)
- 2024年哈爾濱市道里區(qū)執(zhí)法輔助人員招聘考試真題
- 學(xué)堂在線 研究生的壓力應(yīng)對與健康心理 期末考試答案
- 2025年7月自考13811績效管理試題及答案含解析
- 企業(yè)環(huán)境監(jiān)測管理制度
- 試藥員知情協(xié)議書
- 2025年嘉興市恒光電力建設(shè)有限責(zé)任公司招聘筆試參考題庫附帶答案詳解
- 2025內(nèi)蒙古鄂爾多斯農(nóng)商行烏海各機構(gòu)員工社會招聘37人筆試歷年典型考題及考點剖析附帶答案詳解
- XX林場20XX年度森林質(zhì)量精準(zhǔn)提升項目實施方案(范文)
評論
0/150
提交評論