下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
PAGEPAGE5概率檢驗(yàn)中的兩類錯(cuò)誤論文摘要:概率檢驗(yàn)又稱假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)實(shí)質(zhì)上就是在原假設(shè)和備擇假設(shè)中二者擇其中之一的決策過程。決策的依據(jù)就是檢驗(yàn)統(tǒng)計(jì)量的樣本植。本文以文字的形式論述了什么是概率檢驗(yàn)中的兩類錯(cuò)誤,即在原假設(shè)正確時(shí)但卻被拒絕了的錯(cuò)誤,稱為第一類錯(cuò)誤;在原假設(shè)錯(cuò)誤時(shí)但卻接受了的錯(cuò)誤,稱為第二類錯(cuò)誤。兩類錯(cuò)誤概率的相互關(guān)聯(lián)可以粗略的概括為在樣本含量不變的前提下,第一類錯(cuò)誤的概率α越小,第二類錯(cuò)誤的概率β越大;反之,第一類錯(cuò)誤的概率α越大,第二類錯(cuò)誤的概率β越小的特點(diǎn),以及由此而得出的對兩類錯(cuò)誤概率的控制。關(guān)鍵字:概率檢驗(yàn)假設(shè)檢驗(yàn)兩類錯(cuò)誤原假設(shè)備擇假設(shè)概率檢驗(yàn)又稱假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)實(shí)質(zhì)上就是在原假設(shè)和備擇假設(shè)中二者擇其中之一的決策過程。決策的依據(jù)就是檢驗(yàn)統(tǒng)計(jì)量的樣本植。在給定的顯著性水平之下,若檢驗(yàn)統(tǒng)計(jì)量的樣本植落入拒絕域,則拒絕原假設(shè);若檢驗(yàn)統(tǒng)計(jì)量的樣本植落入接受域,則接受原假設(shè)。然而,由于樣本抽取的隨機(jī)性,檢驗(yàn)統(tǒng)計(jì)量的樣本植落入接受域,也不意味著原假設(shè)就肯定正確;檢驗(yàn)統(tǒng)計(jì)量的樣本植落入拒絕域,并不意味著原假設(shè)就肯定不正確。由此可見,在假設(shè)檢驗(yàn)過程中,人們可能做出正確的決策,也可能做出錯(cuò)誤的決策。做出正確決策的情形有兩種,即當(dāng)原假設(shè)正確時(shí)做出接受原假設(shè)的決策情形和當(dāng)原假設(shè)不正確時(shí)做出,做出拒絕原假設(shè)的決策情形。做出錯(cuò)誤決策的情形也有兩種,即當(dāng)原假設(shè)正確時(shí)做出拒絕原假設(shè)的決策情形和當(dāng)原假設(shè)不正確時(shí)做出接受原假設(shè)的決策情形。這兩種決策錯(cuò)誤分別成為第一類錯(cuò)誤和第二類錯(cuò)誤。原假設(shè)H。為真原假設(shè)H。為假接受原假設(shè)H。正確決策第Ⅱ類錯(cuò)誤拒絕原假設(shè)H。第Ⅰ類錯(cuò)誤正確決策為了在假設(shè)檢驗(yàn)中盡量少犯錯(cuò)誤,我們就需要對這兩類錯(cuò)誤決策加以討論和研究。假設(shè)檢驗(yàn)的第一類錯(cuò)誤是在原假設(shè)正確時(shí)但卻拒絕了的錯(cuò)誤,又稱為棄真錯(cuò)誤。產(chǎn)生第一類錯(cuò)誤的概率是由假設(shè)檢驗(yàn)的顯著性水平給出的,而事實(shí)上犯此錯(cuò)誤的概率就等于給定的顯著性水平。由于假設(shè)檢驗(yàn)中接受域和拒絕域是臨界值,是根據(jù)給定的顯著性水平α而確定的,所以在原假設(shè)正確的條件下,檢驗(yàn)統(tǒng)計(jì)量的樣本植落入拒絕域的概率就為α,從而犯第一類錯(cuò)誤的概率就是α。α可以取單尾也可以取雙尾。假設(shè)檢驗(yàn)時(shí),研究者可以根據(jù)需要確定α值的大小,一般規(guī)定α=0.05或0.01。其意義為假設(shè)檢驗(yàn)中如果拒絕H0時(shí)發(fā)生第一類錯(cuò)誤的概率為5%或1%,即100次拒絕H0的結(jié)論中,平均有五次或一次是錯(cuò)誤的.假設(shè)檢驗(yàn)中的第二類錯(cuò)誤是原假設(shè)不正確,但卻被接受了的錯(cuò)誤,又稱為納偽的錯(cuò)誤.由于假設(shè)檢驗(yàn)中,原假設(shè)H0和備擇假設(shè)H1必有一個(gè)為真,原假設(shè)不正確必定是備擇假設(shè)正確,所以犯第二類錯(cuò)誤的概率就等于備擇假設(shè)成立時(shí)的概率,即等于備擇假設(shè)成立的條件下,相應(yīng)統(tǒng)計(jì)量的樣本值落入接受域的概率,此概率一般用β表示,可根據(jù)備擇假設(shè)成立時(shí)相應(yīng)統(tǒng)計(jì)量的概率分布計(jì)算出來。β只取單尾。一、兩類錯(cuò)誤概率之間的關(guān)系發(fā)生兩類錯(cuò)誤的概率之間也有一定的關(guān)系。如前所述,假設(shè)檢驗(yàn)時(shí)根據(jù)檢驗(yàn)結(jié)果做出的判斷,即決絕H0或不拒絕H0,并不是百分之百正確,可能發(fā)生兩類錯(cuò)誤。我們以樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)為例說明。1.拒絕了實(shí)際上成立的H0,即樣本原本來自μ=μ0的總體,由于抽樣的偶然性得到了較大的t值,因t≥t0.05,按照α=0.05的顯著性水平拒絕了H0而接受了H1,這類錯(cuò)誤為第一類錯(cuò)誤。如下圖B。2.不決絕實(shí)際上不成立的H0,即樣本原本來自μ≠μ0的總體,H0:μ=μ0是不成立的,但由于抽樣的偶然性,得到了較小的t值。因?yàn)閠≤ta按照α=0.05的顯著性水平不拒絕H0,這為第二類錯(cuò)誤,如下圖C,犯第二類錯(cuò)誤的概率為β。β值的大小一般很難確切的估計(jì),但知道在樣本含量不變的前提下,α越小,β越大;反之,α越大,β越小。同時(shí)減小α和β的唯一方法是增加樣本含量,因?yàn)樵黾恿藰颖竞亢?,均?shù)的抽樣誤差小,樣本均數(shù)的代表性強(qiáng),也就是樣本均數(shù)接近總體均數(shù),因而可使犯第一類錯(cuò)誤的和第二類錯(cuò)誤的概率減少。μ1μ01—βα1-αβ臨界值判斷正確判斷正確判斷錯(cuò)誤(Ⅱ類錯(cuò)誤)判斷錯(cuò)誤(Ⅰ類錯(cuò)誤)DCBA無效假設(shè)不成立(即樣本來自μ≠μο的總體)無效假設(shè)成立(即樣本來自μ=μο的總體)拒絕H0,認(rèn)為樣本不來自μ=μο的總體不拒絕H0,認(rèn)為樣本來自μ=μο的總體實(shí)際情況Aμ1μ01—βα1-αβ臨界值判斷正確判斷正確判斷錯(cuò)誤(Ⅱ類錯(cuò)誤)判斷錯(cuò)誤(Ⅰ類錯(cuò)誤)DCBA無效假設(shè)不成立(即樣本來自μ≠μο的總體)無效假設(shè)成立(即樣本來自μ=μο的總體)拒絕H0,認(rèn)為樣本不來自μ=μο的總體不拒絕H0,認(rèn)為樣本來自μ=μο的總體實(shí)際情況Ⅰ型錯(cuò)誤與Ⅱ型錯(cuò)誤的關(guān)系二、犯兩類錯(cuò)誤的原因我們知道犯第一類錯(cuò)誤的概率α為統(tǒng)計(jì)量T的觀測值落在決絕域中的概率α,由于可以調(diào)節(jié)拒絕域的大小,從而檢驗(yàn)統(tǒng)計(jì)量T的觀測值落入拒絕域這一小概率事件發(fā)生的概率α可由我們控制,因此我們可以控制犯第一類錯(cuò)誤的概率大小。但對第二類錯(cuò)誤,卻不好似第一類錯(cuò)誤那么簡單。下面我們來研究一下犯第二類錯(cuò)誤的原因。我們知道在原假設(shè)H0是不成立時(shí),統(tǒng)計(jì)量T的觀測值也有可能落入接受域中。這是因?yàn)槲覀兊臋z驗(yàn)統(tǒng)計(jì)量T是子樣X1、X2、……Xn的函數(shù)。T的分布是由子樣X1、X2、……Xn的聯(lián)合分布決定的。而子樣X1、X2、……Xn的聯(lián)合分布是由母體的分布決定的。關(guān)于母體的分布我們做出原假設(shè)H0與備擇假設(shè)H1,不管原假設(shè)與備擇假設(shè)中那一個(gè)是正確的,檢驗(yàn)統(tǒng)計(jì)量都會(huì)相應(yīng)的確定一個(gè)分布。由于檢驗(yàn)統(tǒng)計(jì)量T在H0成立條件下與在H1成立條件下的分布是不一樣的,從而檢驗(yàn)統(tǒng)計(jì)量T在數(shù)軸上同一個(gè)區(qū)間上取值的概率H0成立條件下與在H1成立的條件下也就不一樣。在原假設(shè)成立的情況下,我們得到的檢驗(yàn)統(tǒng)計(jì)量T服從某一分布,依據(jù)此分布我們得出T的觀測值以很大的概率1-α落在實(shí)數(shù)軸的某一區(qū)間上,這一區(qū)間即為接受域。這里所說的T以很大的概率1-α落在某一區(qū)間的含義為:T的密度曲線上包括峰值及峰值左右各有一大部分在內(nèi)的密度函數(shù)曲線部分與其下面對應(yīng)的坐標(biāo)軸上的區(qū)間之間的面積為1-α。問題是如果H0是假的,H1才是真的,從而檢驗(yàn)統(tǒng)計(jì)量T服從的真實(shí)分布是由H1確定的某個(gè)分布。那么檢驗(yàn)統(tǒng)計(jì)量T落在上面所確定的接受域中的真實(shí)概率實(shí)際上應(yīng)當(dāng)是根據(jù)檢驗(yàn)統(tǒng)計(jì)量T在H1成立下所確定的分布計(jì)算出來的一個(gè)數(shù)值β。這個(gè)β正是我們犯第二類錯(cuò)誤的概率。這是因?yàn)樵贖0為假時(shí),檢驗(yàn)統(tǒng)計(jì)量的觀測值以概率β落在接受域中,而我們根據(jù)T的觀測值落入接受域中已做出了接受H0的決策。β的值一般比較小,這是因?yàn)樵贖0為假時(shí),檢驗(yàn)統(tǒng)計(jì)量T的真實(shí)分布既然是由H1確定的某一個(gè)分布,而不是由H0確定的分布,其密度函數(shù)曲線的峰值部分必然偏離接受域上方,從而β的值必然是比較小的。需要注意的一點(diǎn)是:當(dāng)H1成立時(shí),一般來說我們并不知道檢驗(yàn)統(tǒng)計(jì)量T的確切分布是什么,即使知道T的分布類型,也不知道T的分布中的參數(shù)到底取什么值。因此我們并不知道β的值到底有多大。當(dāng)然,在給定了α后,我們可挑選檢驗(yàn)法即挑選檢驗(yàn)統(tǒng)計(jì)量T使得β盡量小,即尋找一致最優(yōu)勢檢驗(yàn);但是在備擇假設(shè)是復(fù)合備擇假設(shè)或較為復(fù)雜的其它備擇假設(shè)的情況下,也是無法控制犯第二類錯(cuò)誤的概率β。在某些情況下,增加樣本容量可以減少β,這是因?yàn)樵谀承┣闆r下增加樣本容量以后,檢驗(yàn)統(tǒng)計(jì)量T的方差變小了,使得T的密度曲線高窄峰,從而在備擇假設(shè)H1為真時(shí),檢驗(yàn)統(tǒng)計(jì)量T的觀測值落入接受域中的概率也變小。三、假設(shè)檢驗(yàn)中應(yīng)注意的一些事項(xiàng)假設(shè)檢驗(yàn)時(shí)也應(yīng)注意一些事項(xiàng)。首先,要有嚴(yán)密的抽樣研究設(shè)計(jì);樣本必須是從同質(zhì)總體中隨即抽取的;要保證組間的均衡性和資料的可比性。第二,根據(jù)現(xiàn)有的資料的性質(zhì)設(shè)計(jì)類型、樣本含量大小,正確選用檢驗(yàn)方法。第三,對差別有無統(tǒng)計(jì)學(xué)意義的判斷不能絕對化,因檢驗(yàn)水準(zhǔn)只是人為規(guī)定的界限,是相對的。差別有統(tǒng)計(jì)學(xué)意義時(shí),是指無效假設(shè)H0被接受的可能性只有5%或不到5%,甚至不到1%,根據(jù)小概率事件一次不可能拒絕H0,但尚不能排除有5%或1%出現(xiàn)的可能,所以可能產(chǎn)生第一類錯(cuò)誤;同樣,若不拒絕H0,可能產(chǎn)生第二類錯(cuò)誤。第四,統(tǒng)計(jì)學(xué)上差別顯著與否,與實(shí)際意義是有差別的。如應(yīng)用某藥治療高血壓,平均降壓0.5Kpa并得出差別有高度統(tǒng)計(jì)學(xué)意義的結(jié)論。從統(tǒng)計(jì)學(xué)高度,說明該藥有降壓作用,但實(shí)際上,降低0.5Kpa是無臨床意義的。四、假設(shè)檢驗(yàn)的功效下面在說一下假設(shè)檢驗(yàn)的功效。犯第二類錯(cuò)誤的概率β是在假設(shè)檢驗(yàn)中原假設(shè)錯(cuò)誤但卻接受了它的概率,也就是備擇假設(shè)正確卻拒絕了它的概率。由此可得備擇假設(shè)正確并接受了它的概率為1-β,稱為假設(shè)檢驗(yàn)的功效。一般來說,隨著備擇假設(shè)值與原假設(shè)值離差的增大,犯第二類錯(cuò)誤的概率會(huì)變小,檢驗(yàn)的功效則會(huì)增大。由兩類錯(cuò)誤的關(guān)系可得,對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版無人駕駛技術(shù)研發(fā)公司股權(quán)轉(zhuǎn)讓及合作生產(chǎn)合同3篇
- 二零二五年網(wǎng)絡(luò)安全違約責(zé)任承擔(dān)詳細(xì)合同解析3篇
- 二零二五年鋼板樁租賃與施工方案優(yōu)化合同3篇
- 二零二五版水電安裝工程節(jié)能改造與施工合同2篇
- 二零二五版房產(chǎn)代持權(quán)違約責(zé)任合同范本3篇
- 二零二五年窗簾藝術(shù)中心窗簾定制合同3篇
- 二零二五年度高品質(zhì)地暖系統(tǒng)安裝與維護(hù)服務(wù)合同書2篇
- 二零二五版海洋工程建設(shè)項(xiàng)目擔(dān)保合同3篇
- 二零二五年度酒店窗簾改造升級合同2篇
- 二零二五版服務(wù)器租賃與云存儲(chǔ)解決方案合同3篇
- GB/T 24479-2023火災(zāi)情況下的電梯特性
- 鼻空腸管的護(hù)理
- ICH Q3D元素雜質(zhì)指導(dǎo)原則
- 五年級解方程計(jì)算題100道
- 漢語教學(xué) 《成功之路+進(jìn)步篇+2》第16課課件
- GB/T 20028-2005硫化橡膠或熱塑性橡膠應(yīng)用阿累尼烏斯圖推算壽命和最高使用溫度
- 廣州新版四年級英語下冊-復(fù)習(xí)計(jì)劃
- 地震工程學(xué)概論課件
- 小學(xué)語文三年級下冊生字偏旁、拼音、組詞
- 2022年寧波開發(fā)投資集團(tuán)有限公司招聘筆試題庫及答案解析
- 論財(cái)務(wù)共享服務(wù)模式下財(cái)務(wù)稽核體系
評論
0/150
提交評論