第三節(jié)---非參數(shù)假設(shè)檢驗推薦課件_第1頁
第三節(jié)---非參數(shù)假設(shè)檢驗推薦課件_第2頁
第三節(jié)---非參數(shù)假設(shè)檢驗推薦課件_第3頁
第三節(jié)---非參數(shù)假設(shè)檢驗推薦課件_第4頁
第三節(jié)---非參數(shù)假設(shè)檢驗推薦課件_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、12021/8/22我們已討論的假設(shè)檢驗是建立在假定樣本來自的總體是正態(tài)分布的。當(dāng)沒有這個假定或不成立時,這些檢驗的結(jié)論就可能被質(zhì)疑。為了解決該問題,統(tǒng)計學(xué)家發(fā)展了無需上述假定的非參數(shù)檢驗。22021/8/221.定義:它泛指參數(shù)假設(shè)檢驗以外的各種檢驗。2.特點:(1)非參數(shù)檢驗不依賴于總體分布。(2)非參數(shù)假設(shè)檢驗適用于較低的計量水平,如等級、順序的計量等。 (3)常常用于參數(shù)以外的檢驗,如隨機變量是否服從某種規(guī)律、某種分布的擬合優(yōu)度檢驗,數(shù)據(jù)是否隨機的游程檢驗等。32021/8/221.如何探討數(shù)據(jù)規(guī)律(一)分類(一)分類數(shù)據(jù)數(shù)據(jù)的擬合優(yōu)度檢驗的擬合優(yōu)度檢驗2二、檢驗 顯示數(shù)據(jù)規(guī)律性的方法

2、:頻數(shù)分布表,能否了解數(shù)據(jù)來自某一分布或與某一理論分布相一致的程度如何?2-檢 驗 直方圖和統(tǒng)計量的檢測可能給出了一些探索性的假設(shè)。然而,這些應(yīng)該用一些較為正規(guī)的方式來加以論證。擬合優(yōu)度檢驗給出了統(tǒng)計意義上的證據(jù)來檢驗有關(guān)分布的假設(shè)。最為通用的擬合優(yōu)度檢驗是卡方卡方檢驗檢驗。42021/8/22擬合優(yōu)度的卡方檢驗的假設(shè)為:抽樣數(shù)據(jù)來自于一個特殊的分布(如正態(tài)分布)0H:抽樣數(shù)據(jù)不是來自于這個特殊的分布1H52021/8/222.利用 進行擬合優(yōu)度檢驗的步驟:2,(1,2,)iuim第一步:先將觀測到的數(shù)據(jù)分類,假設(shè)分成m類, 每類中的頻數(shù)為第二步:根據(jù)觀測結(jié)果似乎服從某一理論分布的 規(guī)律,需要

3、進一步檢驗。按照理論分布, 各類的頻數(shù)應(yīng)為(1,2,)iienP im:根據(jù)理論分布,觀測發(fā)生在第i類的概率。iP第三步:計算統(tǒng)計量221()miiiiuee62021/8/22 如果理論分布的參數(shù)是預(yù)先給定的(已知的),則 統(tǒng)計量服從自由度為m-1的 分布。若理論分布的參數(shù)是未知的,需要用樣本觀測值來估計時, 統(tǒng)計量服從自由度為m-r-1的 分布,其中r為需要估計的參數(shù)的個數(shù)。222272021/8/2222a第四步:根據(jù)顯著性水平a查 分布表求相應(yīng)的 臨界值 22a 時,拒絕原假設(shè),說明樣本觀測并非來自該理論分布。82021/8/22【例6.10】某百貨公司的電器部下半年各月洗衣機 的銷售

4、數(shù)量如下: 該電器部經(jīng)理想了解洗衣機的銷售數(shù)量是否在各月是均勻分布的,也就是說各月中銷售數(shù)量的差別可以歸結(jié)為隨機原因,這樣可以為以后的進貨提供依據(jù)。要求以a=0.05 的顯著性水平進行檢驗。92021/8/22解:本例中的觀測值以月為組,共分為m=6組,每 月的銷售臺數(shù)即為觀測的頻數(shù) ,觀測的總次數(shù)為n=150?,F(xiàn)欲檢驗是否服從(離散的)均勻分布,即每月的銷售量是否為iv15025(),6iienP臺1,1,66iPi為此,設(shè)0H1H:洗衣機銷售量服從均勻分布;:并不服從均勻分布;102021/8/22計算 統(tǒng)計量的值:22621222222()(2725)(1825)(1525)(2425)

5、25252525(3625)(3025)122525iiiiuee ,說明下半年各月銷售量與均勻分布有差別,這些差別尚不能完全歸結(jié)為隨機原因。0H所以拒絕 在本例的情況下, 統(tǒng)計量的自由度為m-1=6-1=5。查表得知,20.05(5)11.072,1211.07由于2112021/8/22【例6.11】在高速公路收費站100分鐘內(nèi)觀測到通過 收費站的汽車共190輛,每分鐘通過的汽車輛 數(shù)分布如下表:用顯著性水平a=0.05檢驗這些數(shù)據(jù)是否來自泊松分布。解:設(shè) :汽車通過收費站的輛數(shù)服從泊松分布; :不服從泊松分布。0H1H觀測值分為5組,且有012410,26,35,5uuuu122021/

6、8/22回憶泊松分布,0,1,2,!xeP Xxxx 其中 為泊松分布的期望值,是未知的,需要用樣本觀測值來估計。由于100分鐘內(nèi)觀測到190輛汽車,所以平均每分鐘觀測到190/100=1.9輛汽車,故取 。據(jù)此,我們可以用參數(shù) 的泊松分布來計算每分鐘內(nèi)通過收費站的汽車為0輛、1輛、2輛、3輛、4輛或更多的概率。1.91.9132021/8/22ie計算 統(tǒng)計量的值:2222222(14.96 10)(28.4226)(27.035)14.9614.9614.96(17.124)(12.525)11.5214.9614.96自由度為m-1-1=5-1-1=3,臨界值20.05(3)7.185

7、,說明每分鐘通過收費站的汽車輛數(shù)不服從泊松分布。0H所以拒絕各概率乘以觀測總數(shù)n=100,便得到理論頻數(shù) ,具體結(jié)果見下表:ie142021/8/22 在應(yīng)用 分布擬合優(yōu)度檢驗時,應(yīng)注意每一類中理論頻數(shù)不宜過小,通常應(yīng)不小于5。如果出現(xiàn)理論頻數(shù)太低,就應(yīng)當(dāng)與鄰近的類進行合并。2152021/8/22(二(二) 分布分布的獨立性檢驗的獨立性檢驗2 擬合優(yōu)度檢驗是根據(jù)樣本觀測值與一個理論值進行比較來檢驗的,但是有些數(shù)值并不知道服從何種理論分布。因此在雙邊量的分布中,有時想了解兩個變量是相依的還是獨立的??ǚ綑z驗可用于這樣的檢驗,稱作卡方的獨立性檢驗。 這種情況下可以使用列連表進行分析,并用卡方進行

8、獨立性檢驗。列連表是一個表示兩個分類變量的r行c列的矩陣。162021/8/221.如何探討兩個變量是相依的還是獨立的 的 獨立性檢驗2.檢驗的基礎(chǔ)列聯(lián)表列聯(lián)表的構(gòu)成理論頻數(shù)的計算獨立性檢驗的統(tǒng)計量2172021/8/22P187表6.2 表6.2是最簡單的2行2列的列聯(lián)表,它可以擴展到rc列聯(lián)表。 代表行的第1類和列的第1類所出現(xiàn)的實際頻數(shù),依次類推。那么相應(yīng)于 理論值如何計算呢?因為 位于第1行,整個樣本量為n,落入第1行的概率根據(jù)樣本估計應(yīng)該是 , 又同時位于第1列,落入第1列的概率根據(jù)樣本計算應(yīng)該是11f11f11f1(/ )rn11f1(/ )cn182021/8/22根據(jù)概率論的原

9、理,如果行和列的變量是獨立的,那么落入第1行和第1列的概率應(yīng)該是 , 由于樣本量為n,則落入第1行第1列的理論頻數(shù)應(yīng)該是11(/ )(/ )rn cn111 111( )()rcrcennnn( )()jijiijcrcrennnn由此可以推廣到在獨立性檢驗中的 統(tǒng)計量為22211()rcijijijijfee192021/8/22【例6.12】某副食品商店欲研究顧客的性別與購物金額大小之間 是有關(guān)系,還是沒有關(guān)系(意味著相互獨立)。在該商店內(nèi) 隨機調(diào)查了548位顧客,按金額大小和性別進行分類,取得 如下數(shù)據(jù)(見表6.3):表6.3顧客的性別與購買金額列聯(lián)表(括號內(nèi)是理論頻數(shù) )ije要求用a

10、=0.05的顯著性水平檢驗顧客的性別和購買金額是否獨立。解: :購物的金額大小與性別無關(guān)(獨立); :購物的金額大小與性別有關(guān)。0H1H202021/8/22計算列聯(lián)表各格的理論值:111213212223(106)(260)(210)(260)50.2999.46548548(232)(260)(106)(288)110.0755.71548548(210)(288)(232)(288)110.36121.93548548ijijrceneeeeee212021/8/222222222(40 50.29)(90 99.64)(130 110.07)50.2999.64110.07(66 55

11、.71)(120 110.36)(102 121.93)55.71110.3650.292.105 0.933 3.609 1.901 0.842 3.25812.648并列入列聯(lián)表各格的括號內(nèi)。計算 值2222021/8/2223列聯(lián)表的自由度為(r-1)(c-1)=2,當(dāng)a=0.05時,20.055.991220.05 ,拒絕 ,接受 ,即購物的金額大小與性別有關(guān)。0H1H22列聯(lián)表的2值計算還可以簡化,為了說明方便,將列聯(lián)表每格的數(shù)字用字母表示22()()()()()n adbcac bd ab cd232021/8/22【例6.13】某市場調(diào)研機構(gòu),調(diào)查某種光盤的購買者和性別 之間是否

12、有關(guān)系取得如下數(shù)據(jù):令a=0.05,用 獨立性檢驗推斷購買某種光盤與性別是否有關(guān)?2解: :購買與性別無關(guān), :購買與性別有關(guān)。 現(xiàn)采用兩種方法計算 值。0H1H2222222()(3226)(118124)26124(2026)(130125)261241.38460.29031.38460.29033.3498fee242021/8/22222()()()()()300(32)(130)(118)(20)(52)(248)(150)(150)3.3498n adbcac bd ab cd兩種方法的計算結(jié)果相同當(dāng)a=0.05, ,接受 ,說明買該光盤與性別的關(guān)系不顯著。220.05(1)3.

13、841,3,8410H252021/8/22三、秩和檢驗(等級和檢驗)三、秩和檢驗(等級和檢驗) 參數(shù)中均值檢驗在小樣本時是如何處理的要求總體服從正態(tài)分布,當(dāng)總體不符合正態(tài)分布時如何處理?轉(zhuǎn)換成等級,然后檢驗,這一類的檢驗統(tǒng)稱為秩和檢驗。(一)曼(一)曼- -惠特尼惠特尼U U檢驗檢驗1.什么是曼-惠特尼U檢驗。它假設(shè)兩個樣本分別來自兩個總 體,目的是檢驗這兩個總體的均值是否有顯著的差別。2.具體步驟。第一步:把兩組數(shù)據(jù)混和在一起,按照大小順序編排等級。 最小的為1,其次為2等等,兩個數(shù)據(jù)和三個數(shù)據(jù)相等如 何處理?262021/8/22 若有兩個數(shù)據(jù)相等,且它們在按大小順序編排好的數(shù)列里是第m

14、和第m+1個數(shù)據(jù),則它們的等級(也稱作秩)都是m+(m+1)/2=2m+1/2。同理,若有3個數(shù)據(jù)相等,且它們在按大小順序編排好的數(shù)據(jù)列里第m,第m+1和第m+2位數(shù)據(jù),則它們的等級都是3m+3/3=m+1。第二步:分別求兩個樣本的等級和。設(shè)第一個樣本的等級和 為 ,第二個樣本的等級和為 ,則有 1W2W12(1)/ 2WWn n第三步:計算曼-惠特尼U檢驗統(tǒng)計量111121222122(1)2(1)2n nUn nWn nUn nW從 和 中選擇較小者并稱其為 。1U2UU272021/8/22第四步:作出判斷 對于 都比較小的情形,可以查附表6得到臨界值 ,在 時,拒絕 。在原假設(shè)為真的情

15、況下,可以證明隨機變量U的均值和方差分別為12,n naUU012:HaU121212()2(1)()12n nE Un nnnD U并且當(dāng) 和 都不小于10時,隨機變量1n2n( )( )UE UZD U近似地服從標(biāo)準(zhǔn)正態(tài)分布。282021/8/22012112001211200121120:,:,:,HHZZHHHZZHHHZZH 如果則拒絕;對于如果則拒絕;對于如果則拒絕 設(shè)第一個總體的均值為 ,第二總體的均值為 ,則對于12292021/8/22【例6.14】為了比較兩個小學(xué)貫徹素質(zhì)教育的情況,現(xiàn)從甲學(xué) 校抽15名學(xué)生,乙學(xué)校抽25名學(xué)生,按素質(zhì)教育的要求進 行測試并評分,按評分高低順

16、序排隊并編上等級,其結(jié)果 如下:要求以顯著性水平a=0.05檢驗兩學(xué)校的素質(zhì)教育有沒有差別。解:解:我們假設(shè)兩個學(xué)校的素質(zhì)教育除了平均水平以外在 其他方面沒有差異。我們需要檢驗 :兩校素質(zhì)教育水平無差異。 :兩校素質(zhì)教育水平有差異。0H1H302021/8/22計算U值:(15)(16)15 253331622U U的均值和標(biāo)準(zhǔn)差分別為121212( )187.52(1)( )35.812( )162 187.50.7135.8( )n nE Un n nnD UUE UZD U 因此,0.052=0.711.96ZZ因為 ,所以我們不能拒絕 ,說明兩個學(xué)校素質(zhì)教育的水平?jīng)]有顯著性的差異。0H

17、312021/8/22(二)威爾科克森帶符號的秩檢驗(二)威爾科克森帶符號的秩檢驗1.什么是威爾科克森帶符號的秩檢驗?它只要求數(shù)據(jù)之差所 服從的分布是對稱分布。目的是檢驗成對觀測的數(shù)據(jù)之差 是否來自均值為0的總體,或產(chǎn)生數(shù)據(jù)的兩個總體是否具 有相同的均值。2.具體步驟。第一步:求出成對觀測數(shù)據(jù)的差 ,并將其絕對值按 照大小順序編排等級。最小的為1,其次為2等等。 兩個數(shù)據(jù)和三個數(shù)據(jù)相等如何處理?同曼-惠特 尼U檢驗。id322021/8/22第三步:作出判斷對于小樣本,根據(jù)顯著性水平a查數(shù)表7,得到臨界值 ,若 則拒絕 ;對于大樣本(觀測不少于20對),可以證明統(tǒng)計量T的均值和方差分別為aTa

18、TT0H(1)( )4(1)(21)( )24n nE Tn nnD T其中n為成對觀測的個數(shù),并且( )( )TE TZD T近似地服從標(biāo)準(zhǔn)正態(tài)分布 因此,對于單側(cè)檢驗,若 ,則拒絕 ;對于雙側(cè)檢驗,若 ,則拒絕 。aZZ 0H0H/2aZZ 第二步:編碼等級后再恢復(fù)其正負(fù)號,并將正號的等級與負(fù)號的 等級分別相加,分別用 表示。取較小的一個為威爾科 克森檢驗統(tǒng)計量。TT和332021/8/22【例6.15】為比較兩種輪胎的平均使用里程,在6輛汽車的后輪分 別用兩種不同的牌號的輪胎,直到用壞后加以記錄里程, 取得的數(shù)據(jù)如表6.5。要求a=0.05,檢驗兩種輪胎的平均行駛里程是否有顯著差別。34

19、2021/8/22解:解: :兩種輪胎的平均行駛里程無顯著差別, :兩種輪胎的平均使用里程有差別。0H1H將成對的差列于表6.5的第4列( ),根據(jù) 的絕對值由小到大順序編號,然后恢復(fù)正負(fù)號,再將不同符號的等級分別相加,見表6.5最后一列。計算得到正負(fù)號的等級和, ,用較小的T與臨界值Ta相比較,由附表7得到:對于a=0.05的雙側(cè)檢驗,n=6時, ,T已超過臨界值,因此不能推翻 ,可認(rèn)為兩種輪胎的行駛里程無顯著差別。idid9,12TT0.0251T0H352021/8/22【例6.16】某飲料商用兩種不同的配料方法推出了兩種新的飲料, 現(xiàn)抽取了20個消費者,讓其分別品嘗兩種飲料并加以評分,

20、 從不喜歡到喜歡,評分由110,其評分結(jié)果如下:要求以a=0.05的顯著性水平檢驗對兩種飲料的評分是否有顯著差別。解:應(yīng)用威爾科克森帶符號的成對檢驗,將評分之差變換為等級, 再恢復(fù)正負(fù)號,其計算過程見計算表6.6。將評分相同的樣本 加以剔除,因此樣本量就由20變?yōu)?8。362021/8/22最后得到 ,取其中較小的 來檢驗,在大樣本的情況下T近似正態(tài)分布表6.6154,17TT17T372021/8/22(1)(18)(19)( )85.544(1)(21)(18)(19)(37)( )527.252424( )1785.52.98( )527.25n nE Tn nnV TTE TZV T 當(dāng)a=0.05時雙側(cè)檢驗,因此拒絕 接受 ,說明兩種飲料的評分有差別。0H1H382021/8/22四、等級相關(guān)系數(shù)及其檢驗四、等級相關(guān)系數(shù)及其檢驗主要用于測量兩組變量之間是否存在相關(guān)以及相關(guān)程度數(shù)值型和非數(shù)值型:(一)測定兩組等級變量之間的相關(guān)系數(shù)1.斯皮爾曼等級相關(guān)系數(shù)2261(1)iS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論