![定型數(shù)據(jù)分析習(xí)題答案_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/10/14a8a525-8a15-4175-870d-78e9bdb51aaf/14a8a525-8a15-4175-870d-78e9bdb51aaf1.gif)
![定型數(shù)據(jù)分析習(xí)題答案_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/10/14a8a525-8a15-4175-870d-78e9bdb51aaf/14a8a525-8a15-4175-870d-78e9bdb51aaf2.gif)
![定型數(shù)據(jù)分析習(xí)題答案_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/10/14a8a525-8a15-4175-870d-78e9bdb51aaf/14a8a525-8a15-4175-870d-78e9bdb51aaf3.gif)
![定型數(shù)據(jù)分析習(xí)題答案_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/10/14a8a525-8a15-4175-870d-78e9bdb51aaf/14a8a525-8a15-4175-870d-78e9bdb51aaf4.gif)
![定型數(shù)據(jù)分析習(xí)題答案_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/10/14a8a525-8a15-4175-870d-78e9bdb51aaf/14a8a525-8a15-4175-870d-78e9bdb51aaf5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、作業(yè)中的一些錯誤 情況1:解題過程不完整,沒有明確指出 所檢驗(yàn)的假設(shè) 和檢驗(yàn)統(tǒng)計量2:算錯檢驗(yàn)統(tǒng)計量的值,或算錯檢驗(yàn)的 p 值。(P27Ex2)解法一:總體總共分 3 類,要檢驗(yàn)顧客是否對這三種肉食的喜好程度相同,這 是一個分布的擬合優(yōu)度檢驗(yàn)問題。(1)要檢驗(yàn)的原假設(shè)為H0 :顧客對這三種肉食的喜好程度相同,即要檢驗(yàn) H0 :顧客對這三種肉食的喜好程度的分布為豬肉13牛肉13羊肉132)3)4)2 3 (ni npi0 )2 2取檢驗(yàn)統(tǒng)計量 i i0 ,檢驗(yàn)分布為 2(3 1) ;i 1npi0;題中 n 200 , npi 0 200,i 1,2,3,則檢驗(yàn)統(tǒng)計量的值為( 計算過程略 ) 3
2、200 2200 2200 22(853 )2(413 )2(743 )2233315.73200 20033p值 P( 2(2) 15.73) 0.000384 0.05 ,200 232003計算 P 值為 :npi0故在水平 0.05下拒絕 H0,即調(diào)查數(shù)據(jù) 不符合該均勻分布 .解法二(采用似然比檢驗(yàn) +p值形式 )(1)要檢驗(yàn)的原假設(shè)為H0 :顧客對這三種肉食的喜好程度相同,豬肉 牛肉 羊肉即要檢驗(yàn) H0 :顧客對這三種肉食的喜好程度的分布為1 1 1 ,333(2)選取似然比檢驗(yàn)統(tǒng)計量 rrG22ln 2 ni ln pni02 ni ln npi0 ,檢驗(yàn)分布為 2(r 1);i
3、1nii 1nin(3)題中 n 200 , npi 0 200,i 1,2,3,則檢驗(yàn)統(tǒng)計量的值為( 計算過程略 )i 0 32G22 ni lni1npi0ni16.88(4)計算 P值為: p值 P( 2(2) 16.88) 0.00022 0.05 , 故在水平0.05下拒絕 H 0, 即顧客對這三種肉食的喜好程度的分布 不是均勻分布 .注:若顯著性水平取 0.05,則臨界值為 1 0.05 (3 1) 0.95 (2) 5.99(P27Ex3)即要檢驗(yàn) H0 :學(xué)生選擇這十門課的人數(shù)分布為2)3)課程1110課程 2課程101110 102 10 (ni npi0 )2取檢驗(yàn)統(tǒng)計量i
4、 1npi0800 80,i 1, ,10 ,則檢驗(yàn)統(tǒng)計量的值為( 計算過程 102檢驗(yàn)分布為 2 (10 1) ;題中 n 800, npi0解法一:總體總共分 10 類,這是一個分布的擬合優(yōu)度檢驗(yàn)問題 ( 1)要檢驗(yàn)的原假設(shè)為 :學(xué)生對這十門課的選擇沒有傾向性,略)22 (74 80)2 802(91 80)25.12580(4) 故在水平計算 P值為: p值 P( 2(9) 5.125) 0.823 0.05 ,0.05下不能拒絕 H0 , 即認(rèn)為學(xué)生對這十門課的選擇沒有傾向性解法二 (采用似然比檢驗(yàn) + p 值形式 )1) 要檢驗(yàn)的原假設(shè)為:學(xué)生對這十門課的選擇沒有傾向性,課程1 課程
5、 2即要檢驗(yàn) H0 :學(xué)生選擇這十門課的人數(shù)分布為10110課程101102) 選取似然比檢驗(yàn)統(tǒng)計量10G22ln 2i1ni lnpi0 ni102nii1ln npi0ni檢驗(yàn)分布為2(10 1) ;3)題中 n 800 ,npi0 800 80,i 1, ,10 , 則檢驗(yàn)統(tǒng)計量的值為( 計算過程10略)10G22 nii1計算 P 值為 :ln npi05.017nip值 P( 2(9) 5.017) 0.833 0.05 ,(4)故在水平 0.05下不能拒絕 H0, 即認(rèn)為學(xué)生對這十門課的選擇沒有傾向性注:若采用拒絕域法,臨界值為 12 0.05 (10 1)02.95 ( 9) 1
6、6.92 。(P27Ex4)解法一:(采用卡方擬合優(yōu)度檢驗(yàn)法 +拒絕域形式 )總體總共分 3 類,這是一個不含未知參數(shù)的分布檢驗(yàn)問題。 (1)要檢驗(yàn)的原假設(shè)為盈 持平 虧H0:股票投資的盈虧分布為 0.1 0.2 0.72)3)4)統(tǒng)計得到的頻數(shù)分別為 1697,1780,2129。23 (ninp?i )2222 i? i ,拒絕域?yàn)?212(3 1) ,i 1np?i對顯著性水平0.05 ,臨界值為題中 n 5606, 則檢驗(yàn)統(tǒng)計量的值為取檢驗(yàn)統(tǒng)計量0.95 (2) 5.99 ,2 2 22 (1697 560.6)2 (1780 1121.2)2 (2129 3924.2)2 3511.
7、96 5.99560.6 1121.2 3924.2故在水平0.05下拒絕 H0,即調(diào)查數(shù)據(jù) 不符合該偏好分布 .總體總共分 3 類,這是一個不含未知參數(shù)的分布檢驗(yàn)問題。 (1)要檢驗(yàn)的原假設(shè)仍為H 0 :股票投資的盈虧分布為盈 持平 虧0.1 0.2 0.7統(tǒng)計得到的頻數(shù)分別為 151+122,240, 517+240。2 3 (ni np?i )22 22)取檢驗(yàn)統(tǒng)計量i np? i ,拒絕域?yàn)?212 (3 1) ,i 1np?i13)對顯著性水平0.05,臨界值為 02.95 ( 2) 5.991 ,4)題中 n 5606, 則檢驗(yàn)統(tǒng)計量的值為2 2 22 (273 127) (240
8、 254)2 (757 889)2 188.2 5.991 127 254 889故在水平0.05下拒絕 H0,即調(diào)查數(shù)據(jù) 不符合該偏好分布.解法二:(采用似然比檢驗(yàn)法 +拒絕域形式 ) 總體總共分 3 類,這是一個不含未知參數(shù)的分布檢驗(yàn)問題。 (1)要檢驗(yàn)的原假設(shè)為H 0 :股票投資的盈虧分布為 0盈.1 持0.平2 0虧.7 0 0.1 0.2 0.7統(tǒng)計得到的頻數(shù)分別為 1697,1780,2129。32i 1ni ln nnpii0 ,2 檢驗(yàn)分布為 2(3 1) ,拒絕域?yàn)?G 3)對顯著性水平0.05 ,臨界值為 4)題中 n 5606, 則檢驗(yàn)統(tǒng)計量的值為 2 127 254 8
9、89 G2 (2 273ln240ln 757ln ) 147.3 5.991 273 240 757 p2)選取似然比檢驗(yàn)統(tǒng)計量 G22ln 2 ni ln ni0i 1nin220.05,臨界值為 02.95 ( 2) 5.991 ,檢驗(yàn)分布為 2(3 1) ,拒絕域?yàn)?G212 (2)3) 對顯著性水平4) 題中 n 5606, 則檢驗(yàn)統(tǒng)計量的值為2 560.6 1121.2 3924.2G2 (2 1697 ln1780 ln2129 ln) 2800.9 5.9911697 1780 2129故在水平0.05下拒絕 H0,即調(diào)查數(shù)據(jù) 不符合該偏好分布.總體總共分 3 類,這是一個不含
10、未知參數(shù)的分布檢驗(yàn)問題。 (1)要檢驗(yàn)的原假設(shè)仍為H 0 :股票投資的盈虧分布為盈 持平0.1 0.2虧0.7統(tǒng)計得到的頻數(shù)分別為273,240,757。2)選取似然比檢驗(yàn)統(tǒng)計量G22ln 2 ni lni1pi02ni lnnii 1nnpi0, ni12 (2)02.95 ( 2) 5.991 ,故在水平0.05下拒絕 H0,即調(diào)查數(shù)據(jù) 不符合該偏好分布.注 1:有同學(xué)混淆了兩種解法 (卡方擬合優(yōu)度檢驗(yàn)法 與似然比檢驗(yàn)法 ) 的記號 與稱呼。注 2 :本題中兩種方法得到的檢驗(yàn)統(tǒng)計量的值相差很大。(P28Ex5) 解法一:(卡方擬合優(yōu)度檢驗(yàn)) 總體總共分 3類,分布中有 1 個未知參數(shù),這是
11、一個含參數(shù)的分布檢驗(yàn)問題。 (1)要檢驗(yàn)的原假設(shè)為紅 白 粉紅H0 :紅、白、粉紅色花的分布為 2 2 ,其中 p q 1。0p2 q2 2pq(2)先在 H0 為真時,似然函數(shù)為2n1 2n2 n3n3 2n1 n3 2n2 n360 108 132L(p) p2n1q2n2(2pq)n32n3 p2n1 n3(1p)2n2 n3260 p108 (1p)132 ,0p 1取對數(shù)得ln L(p) 60ln2 108ln( p) 132ln(1 p)求關(guān)于 p 的導(dǎo)數(shù),并令之為 0 得對數(shù)似然方程為:108 1320 108(1 p) 132p 0 p 1 p解得 p 的極大似然估計值為 p?
12、 108 9240 20(3)算出 H 0的分布列中 p1, p2, p3 的極大似然估計值p?1 p?281400p?2 (1 p?)2 (1201)2121400p?3 2p?(1 p?) 29 1120 20992002 3 (ni np?i )24)取檢驗(yàn)統(tǒng)計量,拒絕域?yàn)?212 (3 1 1) ,i 1np?i5)對顯著性水平0.05,臨界值為 02.95 (1) 3.84146 ,81121996)題中 n 120,np?1 12024.3,np?2 12036.3, np?3 120 59.4,400400200則檢驗(yàn)統(tǒng)計量的值為0.01224 3.84(24 24.3)2 (3
13、6 36.3)2 (60 59.4)2 24.3 36.3 59.4故在水平0.05下不能拒絕 H 0 ,即調(diào)查數(shù)據(jù) 符合該偏好分布 .2注:有同學(xué)誤認(rèn)為檢驗(yàn)的臨界值為02.95 (2) 5.991解法二:(采用似然比檢驗(yàn) )(1) (2) (3)步驟同上。(4)算出無假定條件下諸 pi 的極大似然估計:p1 n1 24 0.2 ,1 n 120n1p2n2 362 0.3, p3 n3 60 0.5,n 120 3 n 120(5) 選取似然比檢驗(yàn)統(tǒng)計量3p?ip拒絕域?yàn)?G2 12 (3 1 1) 12 (1) ,2G2 2ln 2 ni lni12(6)對顯著性水平0.05,臨界值為 0
14、2.95 (1) 3.84146 ,(7)則檢驗(yàn)統(tǒng)計量的值為8112199G22ln2 ni lnp?i2(24ln 40036ln 40060ln 200)0.01225i 1 ipi0.20.30.5故在水平0.05下不能拒絕 H 0 ,即調(diào)查數(shù)據(jù) 符合該偏好分布 .注:p 值P( 2(1) 0.01225) 0.91 0.05(P28Ex6) 解法一:(卡方擬合優(yōu)度檢驗(yàn)) 總體總共分 4類,分布中有 2 個參數(shù),這是一個含參數(shù)的分布擬合檢驗(yàn)問題 (1)要檢驗(yàn)的原假設(shè)為H0 :人的血型分布為“O”型 “A”型r2p2 2pr“B”型q2 2qrAB”型 ,其中 p q r 12pq2)先在
15、 H0 為真時,算出似然函數(shù)L(p,q,r) r2n1(p2 2pr)n2(q2 2qr)n3 (pq)n4748 2 436 2 132 58r 748(p2 2pr)436(q2 2qr )132 ( pq)58在約束條件 p q r 1下,取 q 1 p r ,化似然函數(shù)為無約束二元函數(shù):748 2 436 2 2 132 58L(p,r) r748(p2 2 pr ) 436 (1 p)2 r 2 )132 ( p(1 p r)58取對數(shù)得ln L(p,r) 748 ln r 436 ln( p2 2pr) 132ln(1 p)2 r2) 58ln( p(1 p r) 注意到用微分法很
16、難求出極大似然估計值的精確解 ,我們考慮近似計算。首先由“ O”型和“ B”型兩類的矩估計算出參數(shù)向量 ( p,r )的初始估計:r?2 0.374(1 p?)2 r?2 0.132r? 0.374 0.61161 p? 0.506 0.7113r? 0.6116 p? 0.2887然后參照課本 25頁利用 EXCEL 算得 ( p, r )的極大似然估計值p? 0.288632r? 0.611379( 3)算出諸 p1, pr 的極大似然估計值p?1 r?2 0.6113792 0.373784 ;p?2 p?2 2p?r? 0.2886322 2 0.288632 0.611379 0.4
17、36236p?3 (1 p?) 2 r?2 (1 0.288632 ) 2 0.611379 2 0.13226p?4 2p?(1 p? r?) 2 0.288632 (1 0.288632 0.611379) 0.05772 且在 H 0為真時,對數(shù)似然函數(shù)的最大值為 ln L(p?,r?) -1162.1971 。2 4 (ni np?i )22 24)5)6)取檢驗(yàn)統(tǒng)計量 ,拒絕域?yàn)?2 12 (4 1 2) ,i 1np?i對顯著性水平 0.05,臨界值為 02.95 (1) 3.84146 , 題中 n 1000, np?1 1000 0.373784 373.784, ,np?4
18、1000 0.05772 57.72 , 則檢驗(yàn)統(tǒng)計量的值為( 計算過程略 )2 (374 373.78)2(58 57.72)2 0.002121 3.84373.78 57.72 故在水平 0.05下不能拒絕 H 0 ,即調(diào)查數(shù)據(jù) 符合該偏好分布 .解法二:(采用似然比檢驗(yàn) )(1) (2) (3)步驟同上。(4)算出無假定條件下諸 pi 的極大似然估計:nnp11 0.374 , p22 0.436 ,nnp3 n3 0.132 , p4 n4 0.058 nnp?i4np?iln i 2 ni ln i ,nii 1nin(5)選取似然比檢驗(yàn)統(tǒng)計量4 p? 4G 2ln 2 ni ln
19、 i2 nii 1pii 102.95 (1) 3.84146 ,拒絕域?yàn)?G212 (4 1 2) 12 (1) ,(6) 對顯著性水平0.05 ,臨界值為(7) 題中 n 1000, np?1 1000 0.373784 373.784, ,np?4 1000 0.05772 57.72 , 則檢驗(yàn)統(tǒng)計量的值為( 計算過程略 )2 4np?i373.784 57.72G2 2 ni ln i(2 374 ln 58 ln ) 0.002119i 1 i ni374 58故在水平0.05下不能拒絕 H 0 ,即調(diào)查數(shù)據(jù) 符合該偏好分布 .注 1 :本題中極大似然估計值的精確解很難得到 ,采用
20、迭代法進(jìn)行近似計算,計算量大,要使用軟件進(jìn)行計算, 而且要確定未知參數(shù)向量 (p,q,r) 的迭代初始值。由于實(shí)際未知參數(shù)只有兩個,需要建立兩個方程用于給出迭代初始值。一個很 自然的考慮是利用諸 pi 的矩估計(也就是無假定條件下諸 pi 的極大似然估計) 可建立四個方程:2 n1 r n2n2p 2pr n2n3q 2qr n 2pq n4 n2r 2 0.374。q2 2qr 0.132為方便,關(guān)鍵是選擇哪兩個變量,和選擇哪兩個方程來建立方程組,計算用于 迭代的初始值。本題中,我們選擇了變量 ( p,r ) ,選擇了方程 注 2 : 無假定條件下似然函數(shù)374 436 132 58Lp1
21、p2p 3 p 4對數(shù)似然函數(shù)的最大值為ln L 374ln p?1 436ln p?2 132ln p?3 58ln p?4 -1162.1960 442G2 (2 lnL ln L ( p?, r?) 0.00211929 1 注: p 值 P( 2(1) 0.00212 ) 0.963 0.05(P68Ex1)解:(本題是單邊檢驗(yàn),采用 四格表的 U 檢驗(yàn)法 ) (1)建立四格表正常數(shù)病例數(shù)合計人數(shù)處理組20068857200745對照組201087142201229合計401775199401974(2)記概率 p1 P(正常|處理組), p2 P(正常|對照組),疫苗有效是指 p1
22、p2 ,所以本題是要檢驗(yàn)假設(shè)H0:p1 p2H1:p1 p2 ,(3)取檢驗(yàn)統(tǒng)計量 U n(n11n22 n12n21) ,拒絕域?yàn)?U u1 ,n1 n2 n 1n 21( 4)對顯著性水平0.05 ,臨界值 u1u0.95 (0.95) 1.645 ,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為n (n11n 22 n12n21) 401974 ( 200688 142 57 201087)U 6.01 1.645n1 n2 n 1n 2200745 201229 401775 199故在水平0.05下拒絕 H0,即疫苗有效 .注 1 :假設(shè)檢驗(yàn)的第一步是建立假設(shè) ,要正確建立原假設(shè),并且要正確建
23、立備擇 假設(shè)!對于備擇假設(shè),具體場合下 要能正確區(qū)分 “雙邊檢驗(yàn) ”與“單邊檢驗(yàn)(P68Ex3)解法一:(本題是單邊檢驗(yàn),采用 四格表的 U 檢驗(yàn)法)1)建立四格表長勢良好A種肥料53B種肥料783合計836長勢不好合計4710011790016410002)記概率 p1 P(長勢良好 |施 A 種肥料), p2 P(長勢良好 |施 B 種肥料),B 種肥料效果顯著的好是指 p2 p1 ,所以本題是要檢驗(yàn)假設(shè)H0:p1 p2H1:p1 p2 ,n1 n2 n 1n 23)取檢驗(yàn)統(tǒng)計量 Un(n11n22 n12n21) ,拒絕域?yàn)?Uu1 ,4)對顯著性水平0.05 ,臨界值 u1u0.951
24、.645 ,5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為n1 n2 n 1n 2100 900 836 164U n(n11n22 n12n21) 1000(53 117 47 783) 8.71 1.645故在水平0.05下拒絕 H0,即 B種肥料效果顯著的好解法二:(本題是單邊檢驗(yàn),采用 修正的四格表的 U 檢驗(yàn)法 )(1)建立四格表長勢良好長勢不好合計A種肥料5347100B種肥料783117900合計8361641000(2)記概率 p1 P(長勢良好 |施 A 種肥料), p2 P(長勢良好 |施 B 種肥料), B 種肥料效果顯著的好是指 p2 p1 ,所以本題是要檢驗(yàn)假設(shè)H0:p1 p2H
25、1:p1 p2 ,n(n11n22 n12n21 n)3)取檢驗(yàn)統(tǒng)計量 U2 ,拒絕域?yàn)?Uu1 ,n1 n2 n 1n 24)對顯著性水平0.05 ,臨界值 u1u0.951.645 ,5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為1000(53 117 47 783 500)U 8.57 1.645100 900 836 1648.57 和 8.71似乎差故在水平0.05下拒絕 H0,即 B種肥料效果顯著的好 .注 1 :本題中的樣本量比較大,故是否使用連續(xù)性修正, 異不大。一般樣本容量比較大時不必使用連續(xù)性修正。注 2 :本題應(yīng)采用單邊檢驗(yàn),所以 不能使用卡方檢驗(yàn) ?。≒68Ex4)解法一:(本題是
26、雙邊檢驗(yàn),采用 四格表的 U 檢驗(yàn)法 )1)建立四格表有自殺情緒無自殺情緒合計精神病患者32225神經(jīng)病患者91625合計123850( 2)記 p1 精神病患者有自殺情緒的比例, p2 神經(jīng)病患者有自殺情緒的比例, 本題要檢驗(yàn)兩比例是否相等,即要檢驗(yàn)假設(shè)H0:p1 p2H1:p1 p2 ,(3)取檢驗(yàn)統(tǒng)計量 Un(n11n22 n12n21) ,拒絕域?yàn)?|U | u1 /2,n1 n2 n 1n 2(4)對顯著性水平0.05,臨界值 u1 /2 u0.9751 (0 .975 ) 1.96 ,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為U 1.986798525 25 12 38因?yàn)閨U | 1.
27、9867985 1.96 ,故在水平0.05下拒絕 H 0 ,即兩比例不相等 .解法二:(本題是雙邊檢驗(yàn),采用 四格表的卡方檢驗(yàn)法 )(1)建立四格表有自殺情緒無自殺情緒合計精神病患者32225神經(jīng)病患者91625合計123850( 2)記 p1 精神病患者有自殺情緒的比例, p2 神經(jīng)病患者有自殺情緒的比例, 本題要檢驗(yàn)兩比例是否相等,即要檢驗(yàn)假設(shè)H0:p1 p2H1:p1 p2 ,( 3)取檢驗(yàn)統(tǒng)計量 2 n(n11n22 n12n21) ,拒絕域?yàn)?2 12 (1) , n1 n2 n 1n 2(4)對顯著性水平0.05 ,臨界值 12 (1)02.975 (1) 3.84 ,(5)由題
28、中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為222 n(n11n22 n12n21)2 50(3 16 22 9)22 11 22 12 21 3.947368421 3.84 n1 n2 n 1n 225 25 12 38故在水平0.05下拒絕 H 0 ,即兩比例不相等 .3)4)5)H1:p1 p2 ,22 取檢驗(yàn)統(tǒng)計量 G22ln 2nij ln(ni n j ) ,拒絕域?yàn)?G212 (1) ,i 1 j 1nnij12 (1)H0:p1 p2對顯著性水平0.05 ,臨界值由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為222 2 2ni n jG2 2nij ln( i j ) 4.091 3.84i 1 j 1nni
29、j故在水平0.05下拒絕 H 0 ,即兩比例不相等 .02.975 (1) 3.84 ,解法三:(本題是雙邊檢驗(yàn),采用 四格表的似然比檢驗(yàn)法 )(1)建立四格表有自殺情緒無自殺情緒合計精神病患者32225神經(jīng)病患者91625合計123850( 2)記 p1 精神病患者有自殺情緒的比例, p2 神經(jīng)病患者有自殺情緒的比例, 本題要檢驗(yàn)兩比例是否相等,即要檢驗(yàn)假設(shè)注 1:拒絕域要與假設(shè)配套,主要看備擇假設(shè)!本題是雙邊檢驗(yàn), U 檢驗(yàn)的 拒絕 域也應(yīng)是 雙邊形式的 ,不能再象 P68ex1那樣用 單邊形式的拒絕域 !具體場合下 要能正確區(qū)分 “雙邊檢驗(yàn)”與“單邊檢驗(yàn) ”。注 2:考慮到本題中的樣本量
30、比較小, 特別有的格子里的值為 3(都小于 5 了?。?, 故使用連續(xù)性修正似乎更好些。采用四格表的 修正的卡方檢驗(yàn)法 (解法四),則n(|n11n22 n12n21 | )3)取檢驗(yàn)統(tǒng)計量 2 2 ,拒絕域?yàn)?212 (1) ,n1 n2 n 1n 24)對顯著性水平0.05 ,臨界值 1 (1) 0.975 (1) 3.84 ,5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為22.74122807 3.842 50(|3 16 22 9| 25)225 25 12 38故在水平 0.05下不能拒絕 H 0 ,即兩比例相等 .有意思的是,這時候 得出了相 反的結(jié)論 !注 3: SPSS 軟件能很方便地計算四
31、格表獨(dú)立性雙邊檢驗(yàn)的幾種檢驗(yàn)統(tǒng)計量和p值,下列為本題的 SPSS卡方檢驗(yàn)的程序輸出??ǚ綑z驗(yàn)值df漸進(jìn) Sig. (雙側(cè) )精確 Sig.( 雙側(cè) )精確 Sig.( 單側(cè) )Pearson 卡方3.947 a1.047連續(xù)校正 b2.7411.098似然比4.0911.043Fisher 的精確檢驗(yàn).095.048有效案例中的 N50a. 0 單元格 (.0%) 的期望計數(shù)少于 5 。最小期望計數(shù)為 6.00b. 僅對 2x2 表計算(P71Ex12)本題是一個著名的心理學(xué)實(shí)驗(yàn)。 解:(本題不妨取單邊檢驗(yàn),采用 四格表的 U 檢驗(yàn)法)分兩方面進(jìn)行分析: 種口味是否比 6 種口味更能吸引顧客
32、試吃 ?種口味是否比 6 種口味更能吸 引顧客 購買?另外,數(shù)據(jù)計算上注意到:242 60% 145, 242 60% 3% 4,260 40% 104, 260 40% 30% 31。(一)種口味是否比 6 種口味更能吸引顧客 試吃? (1)建立四格表顧客試吃顧客未試吃合計種口味145972426 種口味104156260合計249253502(2)記概率 p1 P(顧客試吃 |種口味), p2 P(顧客試吃 |6 種口味), 現(xiàn)在要檢驗(yàn)假設(shè)H0:p1 p2H1:p1 p2 ,(3)取檢驗(yàn)統(tǒng)計量 U n(n11n22 n12n21) ,拒絕域?yàn)?U u1 , n1 n2 n 1n 2(4)對
33、顯著性水平0.05,臨界值 u1u0.95 1.645 ,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為n(n11n22 n12n21 ) 502(145 156 97 104) U 4.46 1.645n1 n2 n 1n 2242 260 249 253故在水平0.05下拒絕 H0, 即種口味比 6種口味更能吸引顧客試吃 .(二)種口味是否比 6 種口味更能吸引顧客購買? (1)建立四格表顧客購買顧客未購買合計種口味42382426 種口味31229260合計35467502(2)記概率 p1 P(顧客購買 |種口味), p2 P(顧客購買 |6 種口味), 現(xiàn)在要檢驗(yàn)假設(shè)H0:p1 p2H1:p1
34、 p2 ,(3)取檢驗(yàn)統(tǒng)計量 Un(n11n22 n12n21) ,拒絕域?yàn)?U u1 ,n1 n2 n 1n 2(4)對顯著性水平0.05,臨界值 u1u0.95 1.645 ,(5)由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為Un(n11n22 n12n21)502(4 229 238 31) 4.515 1.645n1 n2 n 1n 2242 260 35 467故在水平0.05下接受 H0, 即種口味沒能比 6種口味更能吸引顧客購買(三)進(jìn)一步考察種口味是否比 6 種口味更能吸引顧客購買? 考慮改成要檢驗(yàn)假設(shè)H0:p1 p2H1:p1 p2 ,3)4)5)取檢驗(yàn)統(tǒng)計量 U n(n11n22 n12
35、n21) ,拒絕域?yàn)?U u1 ,n1 n2 n 1n 2對顯著性水平 0.05 ,臨界值 u1u0.951.645 ,由題中數(shù)據(jù)算得檢驗(yàn)統(tǒng)計量的值為U n(n11n22 n12n21) 502(4 229 238 31) 4.515 1.645n1 n2 n 1n 2242 260 35 467故在水平0.05下拒絕 H0, 即種口味吸引顧客購買的比例 竟然顯著低于 6種口味吸引顧客購買的比例 . 這似乎有點(diǎn)奇怪,不過仔細(xì)想來,符合生活中的實(shí) 際情況。注 1:關(guān)于本題的背景:果醬實(shí)驗(yàn)選擇不是越多越好? 有選擇比沒選擇好,選擇多比選擇少好,這幾乎成了人們生活中的常識。但實(shí) 際情況并非如此。紐約
36、哥倫比亞大學(xué)的研究人員希娜延加開展自己的實(shí)驗(yàn), 研究發(fā)現(xiàn),如果讓 消費(fèi)者選擇在 6 種還是 24 種果醬中挑選一種時,人們都愿意有更多的選擇???是真正決定購買的時候,在 6 種果醬中選擇的人們作出的購買決定,是在 24種 果醬中選擇的人作出購買決定的 10 倍。實(shí)驗(yàn)是在加州斯坦福大學(xué)附近的一個以 食品種類繁多而聞名的超市中進(jìn)行的。工作人員在超市里設(shè)置了兩個試吃攤位, 一個有種口味的果醬,另一個有種口味的果醬。結(jié)果顯示有種口味 的攤位吸引的顧客較多: 242位經(jīng)過的客人中, 60會停下來試吃,而 260 個經(jīng) 過種口味的攤位的客人中,停下來試吃的只有 40。不過最終的結(jié)果卻出乎 人們的意料:在
37、有種口味的攤位前停下的顧客中有30的人都至少買了一瓶果醬,而在有種口味的攤位前停下試吃者中只有 3的人購買了果醬。 看來 過多選項(xiàng)也不見得是一件好事,它會使人們陷入游移不定的狀態(tài)。注 2 :考察種口味是否比 6 種口味更能吸引顧客購買時, 有同學(xué)采用的假設(shè) 檢驗(yàn)如下: 記概率 p1 P(顧客購買 |試吃種口味), p2 P(顧客購買 |試吃 6 種口味), 現(xiàn)在要檢驗(yàn)假設(shè)H 0: p1 p2H1:p1 p2(P69Ex5)分析:記 p1 左半球中有良性腫瘤的比例,p2 右半球中有良性腫瘤的比例, 本題要檢驗(yàn)假設(shè)H 0: p1 p2H1:p1 p2注意到四個格子中有三個格子的頻數(shù)小于 5,顯然這
38、是一個 小樣本 的 場合,所以題目要求采用 Fisher 精確檢驗(yàn)法進(jìn)行檢驗(yàn)。 解:(Fisher 精確檢驗(yàn)法 )( 1)記 p1 左半球中有良性腫瘤的比例, p2 右半球中有良性腫瘤的比例, 本題要檢驗(yàn)假設(shè)H 0:p1 p2H1: p1 p2(2) 采用 Fisher 精確檢驗(yàn)法,即取超幾何分布 HG (16,12,10) 為檢驗(yàn)分布,檢 驗(yàn)的 p值為 P ( HG (16,12,10) n11), (3)題中 n11 9 ,并注意到題中 minn1 ,n 1 min12,10 10 , 故檢驗(yàn)的 p 值為P( HG (16,12,10) 9) P(HG(16,12,10) 9) P(HG(
39、16,12,10) 10)0.109890 0.008242 0.11813212!4!1!3! 12!4!1!3!16!9!3!1!1! 16!10!2!0!4!因?yàn)?.118132 0.05 ,故在水平0.05下不能拒絕 H 0 ,即認(rèn)為兩比例相等 .注 1:有同學(xué)未按照題目要求解題,題目要求采用 Fisher 精確檢驗(yàn)法 ,但仍有 同學(xué)采用單邊的 U檢驗(yàn)法甚至采用雙邊的卡方檢驗(yàn)。注 2:在計算出 p 值后,有不少同學(xué)給出的檢驗(yàn)結(jié)論是錯誤的。 P 值是要和檢驗(yàn) 水平 比較的: 當(dāng) P值小時,不能拒絕原假設(shè), 即認(rèn)為兩比例相等 .注 3:計算 P(HG(N,M,n)=k) ,可調(diào)用 Exce
40、l 中的函數(shù)HYPGEOMDIST (sample_s,number_sample,population_s,number_population) =HYPGEOMDIST(k;n,M,N)注 4 :下表中有其他幾種方法的檢驗(yàn)結(jié)果,由于是小樣本,可以看到,連續(xù)性校 正的效果與精確檢驗(yàn)一致。又問為何下表中精確檢驗(yàn)的雙側(cè)p 值與單側(cè) p 值差不多?卡方檢驗(yàn)值df漸進(jìn) Sig. (雙側(cè) )精確 Sig.( 雙側(cè) )精確 Sig.( 單側(cè) )Pearson 卡方3.200 a1.074連續(xù)校正 b1.4221.233似然比3.1751.075Fisher 的精確檢驗(yàn).118.118有效案例中的 N16
41、a. 3 單元格 (75.0%) 的期望計數(shù)少于 5 。最小期望計數(shù)為 1.50b. 僅對 2x2 表計算(P69Ex7)解法一:(Fisher 精確檢驗(yàn)法 )(1)將這個人隨機(jī)猜測作為原假設(shè) H0 ,將有品酒能力作為備擇假設(shè)。即 記 p1 P(猜測為黃酒 |實(shí)際為黃酒 ), p1 P(猜測為黃酒 |實(shí)際為白酒 ) , 本題要檢驗(yàn)假設(shè)H 0: p1 p2H1: p1 p22)采用 Fisher 精確檢驗(yàn)法,即取超幾何分布 HG(30,15,15) 為檢驗(yàn)分布,檢驗(yàn)的 p值為 P(HG(30,15,15) n11), (3)題中 n11 11 ,并注意到題中 minn1 ,n 1 min15,1
42、5 15 , 故檢驗(yàn)的 p 值為15P(HG(30,15,15) 11) P(HG(30,15,15) k)k 1115k 110.013415!15!15!15!30!k!(15 k )! (15 k)!k!因?yàn)?0.0134 0.05 ,故在水平0.05下拒絕 H0, 即認(rèn)為這個人不是隨機(jī)猜測, 而是有品酒能力的 注 1 :不少同學(xué)在如何建立原假設(shè)時有問題,首先應(yīng)該選擇“ 沒有品酒能力 ”為 原假設(shè)。注 2 :如何具體表示“沒有品酒能力為原假設(shè)”,將其數(shù)學(xué)化,也存在不同的想 法,這個問題的確值得進(jìn)一步探討。聯(lián)系 Ex8,大家可以討論下如何建立假設(shè)的 問題,這應(yīng)該是一個沒有絕對正確答案的問題
43、,應(yīng)該有一定主觀性。注 3 :下表中有其他幾種方法的檢驗(yàn)結(jié)果,由于是小樣本,可以看到,連續(xù)性校 正的效果與精確檢驗(yàn)一致??ǚ綑z驗(yàn)值df漸進(jìn) Sig. (雙側(cè) )精確 Sig.( 雙側(cè) )精確 Sig.( 單側(cè) )Pearson 卡方6.533 a1.011連續(xù)校正 b4.8001.028似然比6.7941.009Fisher 的精確檢驗(yàn).027.013有效案例中的 N30a. 0 單元格 (.0%) 的期望計數(shù)少于 5 。最小期望計數(shù)為 7.50b. 僅對 2x2 表計算(P70Ex9)解:(本題應(yīng)該仿照例 3.9 進(jìn)行統(tǒng)計分析)方法一:采用 McNemar 檢驗(yàn)記 A 檢測方法 1檢驗(yàn)為陽性
44、 ,B 檢測方法 2檢驗(yàn)為陽性 , (1)要進(jìn)行邊緣齊性檢驗(yàn),即檢驗(yàn)假設(shè)H 0 :p1 p 1H 1:p1p 1也就是要進(jìn)行對稱性檢驗(yàn) H0:p122)采用 McNemar 卡方檢驗(yàn)統(tǒng)計量p21H1:p122 (n12 n21)12 21 ,拒絕域?yàn)?2 12 (1) 。p21,n12 n213)題中 n12 18, n21 9 , 則檢驗(yàn)統(tǒng)計量的值為2 (18 9)223 3.84 0.95(1) ,18 9 0.95故在水平0.05下不能拒絕 H0, 即認(rèn)為檢測方法 1 檢驗(yàn)為陽性的比例與檢測方法 2 檢驗(yàn)為陽性的比例相等 .方法二:采用似然比檢驗(yàn)(1)要進(jìn)行邊緣齊性檢驗(yàn),即檢驗(yàn)假設(shè)H 0
45、 :p1p 1H 1:p1p 1也就是要進(jìn)行對稱性檢驗(yàn) H0:2)采用 似然比檢驗(yàn)統(tǒng)計量p12p21H1:p12G 2 2( n12 lnn12 n21 n21 lnn12 n212n12p21,n12 n21 ),拒絕域?yàn)?n21 212 (1) 。( 3)題中 n12 18, n21 9 ,2 27 G 2 2(18 ln則檢驗(yàn)統(tǒng)計量的值為279 ln2 18 2 9 故在水平0.05下不能拒絕 H0, 即認(rèn)為檢測方法方法 2 檢驗(yàn)為陽性的比例相等 .) 3.06 3.84 02.95(1) ,1 檢驗(yàn)為陽性的比例與檢測(P71Ex11) 分析:很多同學(xué)對本題也仿照例 3.9 進(jìn)行統(tǒng)計分析
46、, 處于 Ex10 之后,似乎按照 Ex10 進(jìn)行統(tǒng)計分析更為合理。 關(guān)鍵是對文字“競選初期支持民主黨的選民后來支持共和黨的比例”的解讀產(chǎn) 生的歧義,究竟是理解成: “選民 在競選初期支持民主黨 且后來支持共和黨的比 例”,還是“ 在競選初期支持民主黨 的選民中 后來支持共和黨的比例” 。即究竟 是積事件的概率 ,還是 條件概率 ? 以下我把兩種分析結(jié)果都羅列出來: 理解一:理解為 積事件的概率相等 ( 1)要進(jìn)行 對稱性檢驗(yàn) ,即檢驗(yàn)假設(shè)H 0:p12 p21H 1:但也有少數(shù)同學(xué)注意到本題:采用 McNemar 檢驗(yàn)2)采用 McNemar 卡方檢驗(yàn)統(tǒng)計量p12 p21(n12 n21)2
47、12 21 ,拒絕域?yàn)?2 12 (1) 。n12 n213)題中 n12 52, n21 38 , 則檢驗(yàn)統(tǒng)計量的值為2 (52 38)252 382.718 3.8402.95(1) ,故在水平0.05下不能拒絕 H0, 即認(rèn)為競選初期支持民主黨且后來支持共和 黨的比例與競選初期支持共和黨且后來支持民主黨的比例相等理解二:理解為 兩條件概率的相等 :采用 Ex10 的檢驗(yàn)方法 記 A 選民競選初期支持民主 黨, B 選民選舉時支持民主黨 1)要檢驗(yàn)假設(shè)0:P(B |A) P(B|A)H1:P(B |A) P(B| A)(考慮交換頻數(shù) n11與n12的位置,形成新的四格表,再用 U 檢驗(yàn))
48、(2)采用檢驗(yàn)統(tǒng)計量 Un(n12n22 n11n21),拒絕域?yàn)?u u1 。n1 n2 (n12 n21 )( n11 n22)8.8758 1.645 u0.95 ,(3) 算得檢驗(yàn)統(tǒng)計量的值為 un(n12n22 n11n21)n1 n2 (n12 n21 )(n11 n22)故在水平0.05下拒絕 H0, 即認(rèn)為“在競選初期支持民主黨的選民中后來支持 共和黨的比例”顯著“小于競選初期支持共和黨的選民中后來支持民主黨的比 例”.(P71Ex13)解:由題意知: P?( A | B) n11n15010 ,P?(A|B)n12n2112 50011000則相對危險度為:1P?(A|B)
49、500 2 1P?(A|B)11000又因?yàn)?P?(A |B) 1 P?(A|B)500499500110009991000P?(A|B) 1 P?(A|B) 1所以優(yōu)比為:2.0020041 499500 500 2 99910001000注 1 :有些同學(xué)在解題時,設(shè)法還原出概率四格表,甚至還原出頻率四格表。但 這些表格都是錯的。因?yàn)閮H 根據(jù)題中的已知條件是 無法還原出四格表的 !由題 意可知條件概率 P(A|B), P(A| B ) ,但不知道 P(B)或P(B)的值,所以無法 知道積事件的概率: P(AB),P(AB),P(AB),P(AB),所以 無法還原出概 率四格表 ,更無法知道
50、頻率四格表。注 2:本題未要求進(jìn)行顯著性檢驗(yàn)。(P108Ex1) 解:(本題是關(guān)于分布齊性的檢驗(yàn),也可以看作是獨(dú)立性檢驗(yàn),應(yīng)該采用二維列 聯(lián)表的卡方檢驗(yàn)或似然比檢驗(yàn),具體可以寫成如下四種不同的解法) (1)要檢驗(yàn)假設(shè)H 0:供應(yīng)商與零件質(zhì)量獨(dú)立H 1:供應(yīng)商與零件質(zhì)量不相互獨(dú)立。(也就是要進(jìn)行齊性檢驗(yàn)H 0:各供應(yīng)商的零件質(zhì)量分布相同H 1:供應(yīng)商的零件質(zhì)量分布不全相同)方法一:卡方檢驗(yàn) +臨界值檢驗(yàn)法2)采用 卡方檢驗(yàn)統(tǒng)計量r c (nij2i 1 j 1ni n jni n j 2 ) r c nni 1 j 1 ni n j2nijn,3)4)n 拒絕域?yàn)?2 12 (r 1)(c 1)
51、 。題中0.05,臨界值為 12 (r 1)(c 1) 02.95(2 2) 02.95(4) 9.488 ,檢驗(yàn)統(tǒng)計量的值為2902922 445 ( ) 445 7.712 9.488 ,395 100 23 150 故在水平0.05下不能拒絕 H0, 即認(rèn)為供應(yīng)商與零件質(zhì)量獨(dú)立, 即各供應(yīng)商的零件的質(zhì)量分布都相同 .方法二:似然比檢驗(yàn) +臨界值檢驗(yàn)法2)r c n n 采用似然比檢驗(yàn)統(tǒng)計量 G2 2ln 2nij ln( i j ),i 1 j 1nnij拒絕域?yàn)?G2 12 (r 1)(c 1) 。 題中0.05,臨界值為 12 (r 1)(c 1)檢驗(yàn)統(tǒng)計量的值為2 395 100 23 150G2 2(90 ln 9 ln ) 7.807 9.488 ,445 90 445 9故在水平0.05下不能拒絕 H0, 即認(rèn)為供應(yīng)商與零件質(zhì)量獨(dú)立, 即各供應(yīng)商的零件的質(zhì)量分布都相同 .3)4)20.95(2 2)02.95(4) 9.488 ,方法三:卡方檢驗(yàn) +p 值檢驗(yàn)法2)采用 卡方檢驗(yàn)統(tǒng)計量rci1j1(nijni n j )2rc2ni2jni n ji
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 五年級上冊數(shù)學(xué)聽評課記錄 《擲一擲》人教版
- 一年級上冊數(shù)學(xué)聽評課記錄-第4單元:第2課時《一起來分類》北師大版
- 豬肉攤位員工合同(2篇)
- 魯人版九年級道德與法治上冊 3.1 我們共同的精神家園 聽課評課記錄
- 粵教版地理七年級上冊5.3《聚落的發(fā)展變化》聽課評課記錄
- 八年級歷史人教版下冊聽課評課記錄:第15課 鋼鐵長城
- 湘教版數(shù)學(xué)七年級上冊4.1《幾何圖形》聽評課記錄
- 蘇科版數(shù)學(xué)七年級下冊《11.2 不等式的解集》聽評課記錄2
- 2022年新課標(biāo)八年級上冊道德與法治《10.2 天下興亡 匹夫有責(zé) 》聽課評課記錄
- 魯教版地理七年級下冊第九章《青藏地區(qū)》單元備課聽課評課記錄
- 三年級上冊數(shù)學(xué)脫式計算大全600題及答案
- 計算機(jī)控制系統(tǒng) 課件 第10章 網(wǎng)絡(luò)化控制系統(tǒng)的分析與設(shè)計
- 魯教版(五四制)七年級數(shù)學(xué)上冊期末考試卷-附帶答案
- 南京大學(xué)儀器分析習(xí)題集
- 空調(diào)維保應(yīng)急預(yù)案
- 小學(xué)六年級數(shù)學(xué)上冊解決問題專項(xiàng)必考題西師大版
- 2023年高考語文全國乙卷作文范文及導(dǎo)寫(解讀+素材+范文)課件版
- 模塊建房施工方案
- 多域聯(lián)合作戰(zhàn)
- 定向鉆出入土點(diǎn)平面布置圖(可編輯)
- 美容美發(fā)場所衛(wèi)生規(guī)范
評論
0/150
提交評論