《管理統(tǒng)計學(xué)》馬慶國著-部分2參數(shù)假設(shè)檢驗.ppt_第1頁
《管理統(tǒng)計學(xué)》馬慶國著-部分2參數(shù)假設(shè)檢驗.ppt_第2頁
《管理統(tǒng)計學(xué)》馬慶國著-部分2參數(shù)假設(shè)檢驗.ppt_第3頁
《管理統(tǒng)計學(xué)》馬慶國著-部分2參數(shù)假設(shè)檢驗.ppt_第4頁
《管理統(tǒng)計學(xué)》馬慶國著-部分2參數(shù)假設(shè)檢驗.ppt_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第五章 參數(shù)假設(shè)檢驗,構(gòu)造假設(shè),什么是“假設(shè)檢驗” ,處理“可信度”的基本概念,判斷樣本統(tǒng)計量值與總體(參數(shù))假設(shè)值之間是否存在可以觀察到的差值,以及這種差值在統(tǒng)計上是否明顯.,可以觀察到的差值 由于隨機原因 或者 存在實質(zhì)性的差別, 5.1 假設(shè)檢驗的概念,假設(shè)檢驗可分為:參數(shù)假設(shè)檢驗和非參數(shù)假設(shè)檢驗。 1、參數(shù)假設(shè)檢驗: 已知總體分布,猜出總體的某個參數(shù)(假設(shè)H0),用一組樣本來檢驗這個假設(shè)是否正確(是接受還是拒絕H0 )。 2、非參數(shù)假設(shè)檢驗: 猜出總體分布(假設(shè)H0),用一組樣本來檢驗這個假設(shè)是否正確(是接受還是拒絕H0 )。 在檢驗中,我們通常設(shè)法保證“棄真”(以真為假)的錯誤的概率

2、很小,也就是概率 P拒絕H0 | H0為真很小。這是我們在假設(shè)檢驗時,分析問題的主線。,原假設(shè) (H0) 對被研究的總體參數(shù)做試探性的假設(shè),備擇假設(shè) (HA) 原假設(shè)(H0)的對立面,H0 和 HA 是兩個對抗性陳述 - 被觀察的樣本數(shù)據(jù)只能支持其中一個陳述 .,構(gòu)造假設(shè),構(gòu)造假設(shè), 舉例:,一個電燈泡生產(chǎn)商想生產(chǎn)平均壽命為1,000小時的燈泡,如果燈泡壽命太短,他就會失去客戶;如果燈泡壽命太長,生產(chǎn)成本則會上升。為此,他從燈泡中抽取了一個樣本來觀察其平均壽命是否可以達(dá)到1,000小時。請構(gòu)造H0 和 HA。,H0 : = 1,000,HA : 1,000,vs.,構(gòu)造假設(shè),一名銷售經(jīng)理要求其

3、銷售人員將每天的交通費用控制在100元之內(nèi),為此,他從日常交通費用中抽取了一個樣本來檢查是否將有關(guān)費用控制在規(guī)定的范圍內(nèi)。請構(gòu)造原假設(shè)和備擇假設(shè)。, 舉例:,H0 : 100,HA : 100,vs.,統(tǒng)計意義上的“對”與“不對”,就有可能犯錯誤。 當(dāng)我們認(rèn)為參數(shù)的某個假設(shè) H0 正確時(接受假設(shè)H0時), 有可能假設(shè) H0 本身是錯誤的,而我們把它當(dāng)作正確的,稱犯了第二類錯誤(“存?zhèn)巍钡腻e誤),我們應(yīng)當(dāng)保證犯這種錯誤的概率很小,也就是概率=P接受H0 | H0為假很小。 反之,當(dāng)我們拒絕假設(shè)H0 時,也可能犯“以真為假”的錯誤(“棄真”的錯誤),稱為犯第一類錯誤。當(dāng)然,我們也希望所犯的“以真

4、為假”錯誤的概率很小,也就是 =P拒絕H0 | H0為真很小。,兩類錯誤, =第I類錯誤的概率 = Pr拒絕 H0 | H0 為真, 顯著水平, =第II類錯誤的概率 = Pr接受 H0 | H0 為假, 與 之間的關(guān)系 , 與 之間具有反向關(guān)系,當(dāng)進(jìn)行假設(shè)檢驗時,必須預(yù)先確定與 哪個更重要,為了防止錯誤拒絕 H0 盡量減少拒絕H0 的機率 降低 ,提高 ,為了防止錯誤接受H0 盡量減少接受H0 的機率 提高,降低, 舉例:,測試一座橋梁是否可以安全地承受至少50噸的運輸量 a)你是想犯第I 類錯誤還是第II類錯誤? b)你是采用較低的顯著水平還是較高的顯著水平?,H0 : 50而HA : 5

5、0,第I類錯誤 = Pr拒絕H0 | H0 為真 第II類錯誤 = Pr接受 H0 | H0為假, 第II類錯誤會導(dǎo)致非常嚴(yán)重的后果(斷定橋梁安全,而事實上它并不安全) 提高 ,降低,什么是“檢驗統(tǒng)計量”? ,“檢驗統(tǒng)計量”是指:樣本統(tǒng)計量值與總體參數(shù)假設(shè)值之間可以觀察到的差值,它可以用標(biāo)準(zhǔn)誤差來表示。, 決策原則 臨界區(qū)域法:,什么是“臨界值” (CV) ,“顯著水平” 單尾或雙尾檢驗 Z分布或者t分布,什么是“臨界區(qū)域” (CR) 或 拒絕域,尾部區(qū)域超過了臨界值,原假設(shè) (H0) 或備擇假設(shè)(HA) ,檢驗統(tǒng)計量落在臨界區(qū)域之外 接受 H0,檢驗統(tǒng)計量落在臨界區(qū)域之內(nèi) 拒絕 H0,構(gòu)造假

6、設(shè),決策原則 p值法:,原假設(shè) (H0) 或備擇假設(shè)(HA) ,什么是“p值” ,p值 顯著水平 ()接受 H0,p值 顯著水平 ()拒絕 H0,幾乎不可能獲得樣本統(tǒng)計量的值,或者說在研究過程中獲得樣本統(tǒng)計量值的概率非常小。,p值大 H0 可能為真,p值小 H0可能為假,如果H0 為真,與總體均值有關(guān)的決策,步驟1,步驟2,步驟3,構(gòu)造H0和 HA,整理基本信息 , 確定“抽樣分布”(Z 分布或 t分布),計算檢驗統(tǒng)計量,與總體均值有關(guān)的決策,步驟4,步驟5,步驟6,確定檢驗類型(單尾或雙尾)以及 確定 p值 或者 確定臨界值和臨界區(qū)域,做出決定 決定“拒絕”或者“接受” H0 H0,得出結(jié)論

7、并進(jìn)行解釋,1、關(guān)于正態(tài)總體均值 的假設(shè)檢驗 關(guān)于均值的假設(shè)檢驗,可分如下三種情況: (1)已知方差2,假設(shè) H0 := 0,通過樣本觀測值x1,x2,xn ,檢驗H0 是否成立。 (2)未知方差2,假設(shè) H0 := 0,通過樣本觀測值x1,x2,xn ,檢驗H0 是否成立。 (3)未知方差2,假設(shè) H0 : 0 (或 0), 通過樣本觀測值x1,x2,xn ,檢驗H0 是否成立。, 5.2 一個正態(tài)總體下的參數(shù)假設(shè)檢驗,與總體均值有關(guān)的決策, 已知 ,X 服從均值為 、標(biāo)準(zhǔn)差為 (已知)的正態(tài)分布 ; 或者,雖然X不 服從正態(tài)分布,但其樣本容量 n 30,而且已知其均值為 、標(biāo)準(zhǔn)差為 , 服

8、從均值 、標(biāo)準(zhǔn)差為 的正態(tài)分布,檢驗統(tǒng)計量,與總體均值有關(guān)的決策,一家醫(yī)院正在使用某種藥品,已知藥品每包的平均劑量為100 cm3,標(biāo)準(zhǔn)差為3cm3。隨機抽取36包藥品作為一個樣本,并得到每包藥品的平均劑量為101cm3。檢驗當(dāng) = 0.01時,每包藥品的劑量是否過大。, 舉例:,H0 : 100 而. HA : 100,n = 36, = 3, 而且 = 101, 利用Z分布,1.,2.,3.,檢驗統(tǒng)計量,與總體均值有關(guān)的決策,4.,5.,6.,右側(cè)尾部檢驗 , = 0.01,臨界值 = 2.325,檢驗統(tǒng)計量落在臨界區(qū)域之外 接受 H0,數(shù)據(jù)顯示:當(dāng)顯著水平 = 0.01時,每包藥品的劑量

9、不大,例:已知生產(chǎn)線上生產(chǎn)出來的零件直徑服從正態(tài)分布,已知方差為0.09(毫米2) , 現(xiàn)有假設(shè) H0 :=10(毫米). 這個假設(shè)可以是生產(chǎn)標(biāo)準(zhǔn)的要求. 現(xiàn)有一組樣本觀測值: 10.01, 10.02, 10.02, 9.99 (在實際問題樣本容量大些更好). 請判斷這批零件的平均直徑 =10(毫米)是否正確. 解: 首先設(shè): 原假設(shè)H0 :=10(毫米) 備擇假設(shè)H1 :10(毫米) 其次: 構(gòu)造一個統(tǒng)計量, 要滿足: a. 其分布和參數(shù)已知; b . 在已知條件下, 能算出這個 統(tǒng)計量. 構(gòu)造統(tǒng)計量為:,設(shè)原假設(shè)H0成立, 如果原假設(shè)H0是正確的, 我們希望拒絕H0(犯錯誤)的概率很小,

10、 也就是 P( |Z| k ) = 很小. 稱為顯著性水平.,/2,/2,-k,k,算得該 z =0.067, (取=0.05 )小于 k= z 0.025=1.96, 所以不應(yīng)當(dāng)拒絕假設(shè)H0 :=10(毫米).,與總體均值有關(guān)的決策,未知 大樣本,無論X服從什么分布,當(dāng)樣本容量 n 30時,可以用樣本標(biāo)準(zhǔn)差s來估計未知標(biāo)準(zhǔn)差 , 近似服從以下參數(shù)的正態(tài)分布,檢驗統(tǒng)計量,與總體均值有關(guān)的決策,一家大型電子商店的信貸經(jīng)理說,該商店賒購帳戶上的平均余額為575元。一名審計人員隨機抽取了33名顧客作為一個樣本,結(jié)果發(fā)現(xiàn)賒購帳戶上的平均余額為518.5元、標(biāo)準(zhǔn)差為181元。如果信貸經(jīng)理的陳述得不到數(shù)據(jù)

11、支持,審計人員將檢查所有的賒購帳戶。請問當(dāng) = 0.05時,審計人員應(yīng)當(dāng)采取什么行動?, 舉例:,H0 : = $575 而 HA : $575,n = 33, = 518.5, s = 181, 而且 利用 Z分布,1.,2.,與總體均值有關(guān)的決策,/2 = 0.025,Z,3.,檢驗統(tǒng)計量,4.,雙尾檢驗 , = 0.05,臨界 值= 1.96,5.,6.,檢驗統(tǒng)計量落在臨界區(qū)域之外 接受 H0,當(dāng) = 0.05時,數(shù)據(jù)看來支持信貸經(jīng)理的陳述 審計人員無需審查所有的賒購帳戶 。,與總體均值有關(guān)的決策,未知 小樣本,X的分布是正態(tài)分布或接近正態(tài)分布,當(dāng)樣本容量 n 30時,可以用樣本標(biāo)準(zhǔn)差s

12、來估計未知標(biāo)準(zhǔn)差 , 近似服從自由度為n 1的t分布,檢驗統(tǒng)計量,而且,與總體均值有關(guān)的決策,當(dāng)?shù)匾患殷w育館新上任的經(jīng)理被他的前任告知:會員資格的平均年限為8.7年。為此,他隨機抽取了15份會員文件,結(jié)果發(fā)現(xiàn)會員資格的平均年限為7.2年,標(biāo)準(zhǔn)差為2.5年。假設(shè)這家體育館的會員資格年限近似服從正態(tài)分布。當(dāng)顯著水平 = 0.05時,樣本結(jié)果是否表明這家體育館的實際會員資格年限小于8.7年?, 舉例:,H0 : 8.7 而 HA : 8.7,n = 15, = 7.2, s = 2.5, 而且 利用 t14分布,1.,2.,與總體均值有關(guān)的決策,3.,檢驗統(tǒng)計量,4.,左側(cè)尾部檢驗 , = 0.05

13、,臨界 值= 1.761,5.,檢驗統(tǒng)計量落在臨界區(qū)域之內(nèi) 拒絕 H0,6.,數(shù)據(jù)顯示:當(dāng)顯著水平 = 0.05時,這家體育館會員資格的平均年限明顯小于8.7年,例:已知生產(chǎn)線上生產(chǎn)出來的零件直徑服從正態(tài)分布,現(xiàn)有假設(shè) H0 :=10(毫米). 這個假設(shè)可以是生產(chǎn)標(biāo)準(zhǔn)的要求. 現(xiàn)有一組樣本觀測值: 10.01, 10.02, 10.02, 9.99 (在實際問題樣本容量大些更好). 請判斷假設(shè)H0 :=10(毫米)是否正確. 解: 首先設(shè): 原假設(shè)H0 :=10(毫米) 備擇假設(shè)H1 :10(毫米) 其次: 構(gòu)造一個統(tǒng)計量, 也要滿足: a. 其分布和參數(shù)已知; b . 在已知條件下, 能算出

14、這個 統(tǒng)計量. 構(gòu)造統(tǒng)計量為:,t,由 P( |T| t0.025 ) = , 取=0.05. 算得 |t | =1.414, t0.025 =3.182. 有|t | t0.025. 所以接受原假設(shè).,-t,4、未知方差2,檢驗假設(shè) H1 : 0 (這是作為備擇假設(shè)出現(xiàn)) 例:已知生產(chǎn)線上生產(chǎn)出來的零件抗剪強度服從服從正態(tài)分布,以往的數(shù)據(jù)表明抗剪強度的均值 0 =10(毫米). 現(xiàn)在改用一種新材料來生產(chǎn)該零件,得到一組零件的抗剪強度的樣本觀測值: 10.01, 10.02, 10.02, 9.99. 請問:改用新材料后,零件的平均抗剪強度是否提高?,/2,/2,解: 首先作原假設(shè)H0 :=

15、0 =10(毫米) 備擇假設(shè)H1 : 10(毫米) 其次: 構(gòu)造一個統(tǒng)計量, 也要滿足: a. 其分布和參數(shù)已知; b . 在已知條件下, 能算出這個 統(tǒng)計量. 構(gòu)造統(tǒng)計量為:,由 P( T t0.05 ) = , 取=0.05. 算得 t0.05 =2.3534由樣本點算得 t =14.14. 有 t t0.025. 所以接受備擇假設(shè). 零件的抗剪強度得到提高了.,5、關(guān)于正態(tài)總體的方差2的檢驗 關(guān)于正態(tài)總體的假設(shè)檢驗,分為如下兩種情況: (1)未知均值 ,假設(shè)H0 : 2 = 02 ,通過樣本觀測值 x1,x2,xn , 檢驗H0 是否成立; (2)未知均值 ,假設(shè)H0 : 2 02 (反

16、之亦然),通過樣本觀測值 x1,x2,xn , 檢驗H0 是否成立。 第一種情況: 未知均值 ,檢驗假設(shè)H0 : 2 = 02 是否成立; 例:已知生產(chǎn)線上生產(chǎn)出來的零件直徑服從正態(tài)分布,長期以來直徑的根方差 = 0.3, 現(xiàn)材質(zhì)改進(jìn), 抽出20個樣本, (這里只給出20個樣本的方差s2 = 0.16). 請判斷該生產(chǎn)線的方差是否改變?,解: 首先作原假設(shè)H0 :總體方差 2 = 02 =0.09 備擇假設(shè)H1 :總體方差 2 02 =0.09 其次: 構(gòu)造一個統(tǒng)計量, 也要滿足: a. 其分布和參數(shù)已知; b . 在已知條件下, 能算出這個 統(tǒng)計量. 構(gòu)造統(tǒng)計量為:,在原假設(shè)下, 由 P(2

17、 2/2 ) = /2 或 P(2 21-/2 ) = /2 取 = 0.05, 算得 20.025 (19) = 32.9, 20.975 (19) = 8.91, 2 =33.7778. 有2 20.025 (19) = 32.9. 所以拒絕原假設(shè), 接受備擇假設(shè).生產(chǎn)線的方差有改變. (犯錯誤的概率只有0.05),第二種情況: 未值均值 ,檢驗假設(shè) : 2 02 是否成立; 例:已知生產(chǎn)線上生產(chǎn)出來的零件直徑服從正態(tài)分布,長期以來直徑的根方差 = 0.3, 現(xiàn)材質(zhì)改進(jìn), 抽出9個樣本, (這里只給出20個樣本的方差 s2 = 0.352). 請判斷該生產(chǎn)線的方差是否會小于0.09 ?,解

18、: 作原假設(shè)H0 :總體方差 2 02 =0.09 備擇假設(shè)H1 :總體方差 2 02 =0.09 這是單尾檢驗問題, (且是左側(cè)單尾問題) 仍構(gòu)造統(tǒng)計量為:,取 = 0.05, 由 P(2 21- ) = =0.05 , 算得 2 =10.8889, 查表得 20.95 (8) = 15.5, 有2 =10.8889 20.95 (8) = 15.5. 所以拒絕原假設(shè), 接受備擇假設(shè). 總體方差2 0.09 ., 5.3 0-1 總體分布下的參數(shù)假設(shè)檢驗,1、一個0-1分布總體的小樣本比例值的參數(shù)檢驗 某類個體占總體的比例問題, 是社會科學(xué)和自然科學(xué)研究中的最常見的基本問題之一. 而反映總體

19、中某類個體的比例的隨機變量 X , 可以簡單地用 0-1 分布 B(1, p)來表示, p就是總體中某類個體的比例. 如何進(jìn)行 p 的假設(shè)檢驗問題?,例、招聘測試問題。某公司人力資源部要招聘若干名某專業(yè)領(lǐng)域的工程師。出了10道選擇題, 每題有4個備選答案,其中只有一個正確的,或者說,正確的比率只有1/4 = 0.25。問:至少應(yīng)答對幾道題,才能考慮錄用?,如果應(yīng)聘者答對的問題比較少 (如23個題), 則可能是猜對的, 這樣的樣本所反映的母體的正確比例應(yīng)與0.25 沒有本質(zhì)區(qū)別, (只有憑借的知識)答對的題多, 樣本所反映的母體的正確比例 p, 才可能大于0.25, 于是問題轉(zhuǎn)化為: 總體0-1

20、分布 B(1, p). 應(yīng)答者答對了, X 取值為1; 答錯了, X取值為0. 由0-1分布知道, E(X)= p, D(X) =p(1-p) . 一個完全靠猜的應(yīng)聘者, 答對的概率應(yīng)當(dāng)是0.25, 即 p=0.25.但對于任意應(yīng)聘者, 我們不知道他是不是靠猜的 (即不知道他的p值), 于是我們做如下的假設(shè)檢驗問題: 原假設(shè)H0 :p = 0.25 (即回答者靠猜答案, 不聘) 備擇假設(shè)H1 :P 0.25 (回答者依據(jù)知識選擇答案, 聘用) 這是單側(cè)檢驗問題, 任意一個應(yīng)聘者回答10個問題,相當(dāng)于從總體 B(1, p) 分布中抽出10個樣本X1, X2,X10, 進(jìn)而得到均值函數(shù)X. 但我們

21、不知道統(tǒng)計量X的分布形式, 所以不,能直接用 X 做統(tǒng)計檢驗. 但知道統(tǒng)計量 Y= X1+X2+ X10的分布, 即 Y服從 二項分布B (n, p), n=10, 并該統(tǒng)計量中含有要檢驗的參數(shù) p, 因此, 我們可以用統(tǒng)計量 Y 來做參數(shù)的檢驗問題. 這里, Y的含義就是(某應(yīng)聘者)答對題目的個數(shù). 設(shè) r 是Y的觀測值. 當(dāng)正確回答題目的個數(shù) r 大于等于閥值 k 時, 就拒絕原假設(shè)H0 , 認(rèn)為某應(yīng)答者的正確比例大于 0.25 的假設(shè)(即不是隨機猜出的). 如果在某個 r 大于等于 k 時就拒絕H0 ,那么在回答正確的題目數(shù)為 r +1, r +2, ,時, 也應(yīng)當(dāng)拒絕H0.于是應(yīng)有:,

22、式中, k是拒絕H0的答對的最少題目數(shù). 取 k = 6 時, 由所有大于等于k 的 r 計算出的概率之和為0.0197 = 0.05.,一個B(1, p)總體的小樣本比例值 p 的檢驗問題 有關(guān)某類個體在總體中的比例問題,本質(zhì)上是用B(1,p)分布的樣本X1,X2,, Xn 來檢驗均值 p 和先驗值p0的關(guān)系問題。 統(tǒng)計量 X 的均值和方差是已值的,但是不知道X的分布形式,所以不能直接用均值函數(shù)做假設(shè)檢驗。 統(tǒng)計量 Y = X1+X2+ Xn的分布,是二項分布B(1,p),完全已知的,并且包含要檢驗的參數(shù) p,所以可以用統(tǒng)計量 Y 來作為假設(shè)檢驗。,所以, 拒絕H0 , 認(rèn)為回答者不是猜的,

23、是靠知識回答的,可以及格, 此時犯錯誤(本來是猜的,結(jié)果猜對了6道題以上)的概率最大只是5%的可能.,首先做零假設(shè)H0 :p=p0,備擇假設(shè)H1 : p p0 設(shè)k是拒絕H0的閥值(Y k 就拒絕H0), k的外側(cè)概率為, 也就是 P(Y k) = , 用Y的概率計算公式 (二項分布的概率計算公式), 把大于等于 k 的 Y 概率都加起來, 這個概率和應(yīng)當(dāng)小于等于. 其中:,所以, 從Y= r = n的概率開始, 加 Y = r = n-1的概率,直到其概率的和要超過為 為止, 此時的 r-1 就是k(拒絕H0 的閥值).,2. 一個0-1總體的大樣本比例值的參數(shù)檢驗 例: 一個賣男士襯衣的郵

24、購店, 從過去的經(jīng)驗中總結(jié)出有15%的購買者說襯衣的大小不合身,要求退貨. 現(xiàn)在這家郵購店改進(jìn)了郵購定單的設(shè)計, 結(jié)果在接下來出售的500件襯衣中, 有60件要求退貨. 問: 在 5% 的 水平上, 改進(jìn)后的退貨的比例 與原來的退貨比例有無顯著性差異? 分析: 對每個購買者而言, 買來的襯衣只有兩種可能的情況: 合身, 不合身. 按照過去經(jīng)驗, 不合身的概率為15%, 此時隨機變量 X = 1; 合身的概率是 0.85, 此時 X = 0. 從總體角度看, 即總體服從0-1分布 B(1, p)中 p = 15%. 于是由500個隨機樣本X1, X2,X500 構(gòu)成的統(tǒng)計量 Y = X1+X2+

25、 X500 服從二項分布 B (500, p). 根據(jù)題目, 可以模仿上題來解決. 但現(xiàn)在的樣本觀測值是x1,x2,xn ,n=500, 由于n 很大, 且np=500 0.15=7510, 已足夠大, 故根據(jù)中心,極限定理, 樣本均值 X 服從正態(tài)分布: , x = p, 2x= p(1-p)/n. 從已知得到不合身的比例 (退貨的比例) 為 x =60/500, 即 . 統(tǒng)計量 X 符合做假設(shè)檢驗條件(分布已知, 含參數(shù)), 于是設(shè): 原假設(shè)H0 :p = 0.15 備擇假設(shè)H1 :P 0.15 取顯著性水平 = 0.05 (是一個單側(cè)檢驗問題).,查表, z =1.645, 由 z -

26、z = -1.645, 所以拒絕H0 , 郵購定單改進(jìn)后的退貨比例12%與改進(jìn)前的15%有顯著性差異.,歸納: 一個B (1, p)總體的大樣本比例值 p 的檢驗問題 有關(guān)某類個體在總體中的比例問題, 本質(zhì)上是用B(1,p)分布的樣本X1,X2,, Xn 來檢驗B(1, p)的均值 p 和先驗值p0的關(guān)系問題. 雖然Y = X1+X2+ Xn服從二項分布B(n,p), 完全已知, 并且包含要檢驗的參數(shù)p, 可以用 Y 來檢驗p 和先驗值p0的關(guān)系. 但 n 很大時, 計算不便, 可采用中心極限定理, 按照統(tǒng)計量 X 近似地服從正態(tài)分布來處理 (一般 n p 10, 且n(1- p) 10).

27、在標(biāo)準(zhǔn)化變換后, 于是, 可以用 Z 來做關(guān)于其均值 p 和先驗值p0的關(guān)系問題的檢驗.,與總體比例有關(guān)的決策,在一次調(diào)查中抽取了300份銀行貸款,結(jié)果發(fā)現(xiàn)37%的款項貸給了女性職員。5年前曾進(jìn)行過類似的調(diào)查,結(jié)果發(fā)現(xiàn)32%的借款人是女性。當(dāng)顯著水平為0.1時,確認(rèn)女性借款的比例是否有明顯的變化?, 舉例:,H0 : p = 0.32 而 HA : p 0.32,n = 300, = 0.37 而且 利用 Z分布,1.,2.,3.,檢驗統(tǒng)計量,與總體比例有關(guān)的決策,4.,5.,雙尾檢驗 , = 0.1,臨界 值= 1.645,檢驗統(tǒng)計量落在臨界區(qū)域之內(nèi) 拒絕 H0,6.,數(shù)據(jù)顯示: 當(dāng)顯著水平

28、 = 0.10時,女性借款的比例有明顯的變化。, 5.4 兩個正態(tài)總體下的參數(shù)假設(shè)檢驗 本節(jié)研究兩個相互獨立的正態(tài)總體的參數(shù)檢驗問題.,兩個正態(tài)總體參數(shù)檢驗概述 設(shè): 獲得來自兩個相互獨立的總體的樣本觀測值: x1, x2,xn 與y1,y2,ym . 所要完成的參數(shù)檢驗問題, 主要有如下4種情況: 未知兩個總體的均值1, 2 , 檢驗假設(shè)H0 : 總體方差12 = 22 未知兩個總體的均值1, 2 ,檢驗備擇假設(shè)H1 :總體方差 12 22 未知兩個總體的方差12 , 22, 但知道12 = 22, 檢驗假設(shè)H0 : 1= 2,(4) 未知兩個總體的方差12 , 22, 但知道12 22,

29、檢驗假設(shè)H0 : 1= 2 于是, 檢驗的順序是: 當(dāng)1, 2, 12 , 22均未知時, 先做 (1) ,即 檢驗12 = 22成立否? 若證實12 = 22, 再做(3), 檢驗假設(shè)H0 : 1 = 2成立否? 若不能證實12 22, 再做(4), 檢驗假設(shè)H0 : 1 = 2成立否? 對第(1)與第(2)個問題而言, 顯然應(yīng)當(dāng)用 F 統(tǒng)計量來檢驗:,服從 F (n-1, m-1)分布,1. 對問題 (1): 未知兩個總體的均值1, 2 , 檢驗假設(shè)H0 : 12 = 22 , H1 :12 22 由于假設(shè)H0是總體方差12 = 22 , 所以,F(xiàn)統(tǒng)計量可以,簡化為:F = S12/S22

30、 服從 F(n-1,m-1)分布。,備擇假設(shè)H1為: 12 22,這是一個雙尾檢驗。(注意:F分布是非對稱的)所以,檢驗分析式為:,根據(jù)觀測值,計算出F的觀測值 f 值,與查表值f/2與f1-/2比較,就行了。(注意:如果查表時查不到f1-/2 ,就應(yīng)用f1-/2 =1/ f/2來計算。),2. 對問題 (2): 未知兩個總體的均值 1, 2 , 檢驗備擇假設(shè)H1 :總體方差 12 22 由于備擇假設(shè)是H1 :12 22 , 所以這是一個單尾檢驗問題. 此時, H0 仍設(shè)定為 12 = 22 , 以便利用統(tǒng)計量 :,F = S12/S22 . 拒絕 H0 而接受 H1 的表達(dá)式為: PF f=

31、 ,根據(jù)觀測值,計算出 F的觀測值 f 值,與查表值f比較,就行了。,3. 對問題 (3): 未知兩個總體方差12 , 22, 但知道12 = 22,檢驗假設(shè)H0 :1= 2 由于已知12 = 22 , 要檢驗的零假設(shè)H0是 1= 2 (此時的備擇假設(shè)是1 2 ), 為此12 = 22條件下引入一個新的 T 統(tǒng)計量:,服從 t (m+n-2).,式中, n 是總體X的樣本數(shù), m是總體Y的樣本數(shù).,由于零假設(shè)是 1= 2 , 所以式中分子第二項為零, 于是根據(jù)樣本值: x1, x2,xn 與y1,y2,ym . 可計算出 t 統(tǒng)計量值:,然后比較 t 與 t0.025 (若取 = 0.05)

32、. 若| t | t0.025 , 則拒絕 H0 , 若| t | t0.025 , 則接受 H0 .,4. 對問題 (4): 未知兩個總體方差12 , 22, 但知道12 22,檢驗假設(shè)H0 :1= 2 在12 22 情況下, 檢驗的零假設(shè)H0 : 1= 2 , 引入如下統(tǒng)計量:,檢驗過程同上., 5.5 大樣本下兩個任意總體的均值檢驗,1. 大樣本下兩個任意總體均值檢驗問題,在大樣本下檢驗兩個任意總體的均值1 , 2 是否相等, 就是檢驗 1 - 2 =0 的檢驗問題. 因為大樣本, 根據(jù)中心極限定理, 每個總體的隨機均值函數(shù)( X 與 Y ) 都近似地服從正態(tài)分布.,設(shè): 相互獨立地從兩

33、個總體中隨機抽取數(shù)量足夠大的樣本. 來自總體 1 的樣本為X1,X2,, , 來自總體 2 的樣本為Y1,Y2,, . 則有,于是, 統(tǒng)計量 X Y 的分布, 具有如下性質(zhì): 均值: EX Y = 12 方差: D X Y = D(X) + D(Y) = 12 /n1 + 22 / n2 (3) 分布形式: 在大樣本下, 近似于正態(tài)分布. 即,于是, 在已知12 , 22的情況下, 用如下統(tǒng)計量檢驗H0 : 1 - 2 =0 .,在未知12 , 22的情況下, 用下面統(tǒng)計量檢驗H0 : 1 - 2 =0 .,2. 大樣本下兩個 0-1 總體的比例值檢驗問題 對于兩個總體分布都是 0-1 分布:

34、 B(1, p1) 和 B(1, p2) .檢驗兩個總體比例值是否相等. 即檢驗H0 : p1 - p2 =0 . 設(shè): 相互獨立地從兩個總體中隨機抽取數(shù)量足夠大的樣本, 來自總體 1 的樣本為: X1,X2,, Xn1, 來自總體 2 的樣本為Y1,Y2,, Yn2. 則由上節(jié)結(jié)論, 得出:,由于假設(shè)H0 : p1 - p2 =0 . 所以有p1 = p2 = p, 所以在大樣本下,但是, 由于 p 未知, 故無法利用上式進(jìn)行檢驗, 為此, 先解決 p 的估計問題. 設(shè): 樣本 X1,X2,, Xn1 中具有某性質(zhì)的樣本數(shù)為r1,樣本Y1,Y2,, Yn2中具有某性質(zhì)的樣本數(shù)為r2. 我們用

35、下式定義的(兩組樣本的綜合比例)來估計 p:,于是, 在大樣本下, 近似地服從 N (0, 1)的如下統(tǒng)計量是可以計算的:,計算 z 的值時, 用x,y 代替X , Y . 而 x =r1 / n1, y =r2 / n2 .,現(xiàn)在, 在選定 和規(guī)定備選假設(shè) (p1 - p2 0 , 或 p1 - p2 0等 )后, 就可以依據(jù)兩組樣本觀測值做相應(yīng)的假設(shè)檢驗了.,例. 有一個奶酪進(jìn)口商是靠直接郵寄廣告來銷售產(chǎn)品的. 在開發(fā)圣誕節(jié)的廣告小冊中時, 進(jìn)口商設(shè)計了兩個根本不同的方案, 為了想知道方案 1 是否比方案 2 更好, 該進(jìn)口商從它的客戶名單中隨機地抽取了樣本進(jìn)行實驗, 結(jié)果如表:,抽樣結(jié)果

36、,定單數(shù),樣本數(shù),樣本比例,方案 2,方案 1,n1 =400 r1 =100 x = r1 / n1 =0.25,n2 = 200 r1 = 44 y = r2 / n2 =0.22,對于每個接到定單的消費者而言, 只有“買” 或 “不買 ” 兩種可能的情況. 對于第一組樣本而言, 購買的客戶的樣本比例為 25%, 即 x = 25%. 對于第二組樣本而言, 購買的客戶的樣本比例為 22%, 即 y = 22%. 按照上節(jié)分析, 此問題的解法是 H0 : p1 - p2 = 0 H1 : p1 p2 按照上節(jié)公式, 可以計算出:,從而算出:,在 =0.05 的水平上, z 1.645, 即

37、z z 1.645, 所以, 接受H0 , 方案 1 沒有比方案 2 有顯著性差別.,利用SPSS進(jìn)行統(tǒng)計推斷,最新報道顯示: CBD區(qū)內(nèi)上班的人花在路上的單程平均時間為半個小時。隨機從CBD區(qū)內(nèi)上班的人當(dāng)中抽取15個人作為一個樣本,并得到他們花在路上的單程時間(單位為分鐘,如下所示)。假設(shè)這些人花在路上的單程時間近似服從正態(tài)分布,檢驗當(dāng)顯著水平為0.05時,報導(dǎo)中的單程平均時間是否可信?,21.726.833.127.923.5 39.028.024.728.428.9 30.033.633.334.135.1,利用SPSS進(jìn)行統(tǒng)計推斷,H0 : = 30 vs. HA : 30,n = 1

38、5, 未知,并且總體近似服從正態(tài)分布, 的抽樣分布服從自由度= 14的 t 分布,定義數(shù)據(jù) 變量圖,只有一個變量有待定義: 時間,利用SPSS進(jìn)行統(tǒng)計推斷,輸入數(shù)據(jù) 數(shù)據(jù)圖,有1欄、15排數(shù)據(jù)需要輸入,利用SPSS進(jìn)行統(tǒng)計推斷,進(jìn)行分析 菜單條,1.在菜單條中單擊 Analyze 比較均值 一個樣本的T 檢驗 ,2.將時間規(guī)定為檢驗變量 而類型數(shù)值 30分鐘規(guī)定為檢驗值 單擊選項 而且 將類型數(shù)值95 放入置信區(qū)間視窗內(nèi) 單擊繼續(xù),3.單擊 OK,利用SPSS進(jìn)行統(tǒng)計推斷, SPSS 輸出結(jié)果 ,從輸出結(jié)果得到 = 29.8733,s = 4.7711, = 1.2319,p值 = 0.87,

39、因為p值 (= 0.05) 接受 H0,利用SPSS進(jìn)行統(tǒng)計推斷,檢驗統(tǒng)計量,p值,第六章 商業(yè)統(tǒng)計學(xué),類型數(shù)據(jù)分析,類型數(shù)據(jù)分析,目的: 本講結(jié)束后,學(xué)生們應(yīng)能夠:,將類型數(shù)據(jù)整理為列聯(lián)表 解釋卡方分布的性質(zhì) 運用卡方分布進(jìn)行同質(zhì)性檢驗 運用卡方分布進(jìn)行獨立性檢驗 解釋卡方檢驗的SPSS輸出結(jié)果,類型數(shù)據(jù)分析,講課提綱 ,列聯(lián)表 交叉列聯(lián)表所講述的內(nèi)容 總體之間的同質(zhì)性 兩個變量之間的獨立性 將統(tǒng)計學(xué)運用于具體情形 SPSS發(fā)揮的作用,列聯(lián)表 -交叉列聯(lián)表所講述的內(nèi)容, 收集抽樣單位特征或特點方面的資料,整理 數(shù)據(jù)以反映每種類型的計數(shù)情況, 與“類型”有聯(lián)系的觀察值被稱為類型數(shù)據(jù),列聯(lián)表 -

40、交叉列聯(lián)表所講述的內(nèi)容,例題 1根據(jù)同一特征對兩個樣本進(jìn)行分類,CF(商業(yè)廣告片)在電視上播放之前,通常要經(jīng)過檢驗和修改。一名軟飲料生產(chǎn)商想在電視上播放一個新的商業(yè)廣告片。他為這個廣告制作了兩個版本,即CF-A和CF-B。這名生產(chǎn)商想對廣告片的兩個版本進(jìn)行初步的檢驗。為此,他將其中一個版本的廣告片播放給一半觀眾看,另一個版本的廣告片播放給另一半觀眾看,然后他對這些觀眾進(jìn)行電話調(diào)查并將他們的反應(yīng)分為以下幾類:,不記得記得只記得 廣告內(nèi)容 觀看過的內(nèi)容 廣告中的要點,69,列聯(lián)表 -交叉列聯(lián)表所講述的內(nèi)容,這兩個不同版本的商業(yè)廣告片是否在人們頭腦中留下了同樣的印象?,70,列聯(lián)表 -交叉列聯(lián)表所講

41、述的內(nèi)容,71,列聯(lián)表 -交叉列聯(lián)表所講述的內(nèi)容,例題 2根據(jù)兩種特征對一個樣本進(jìn)行分類,勞工合同期限與行業(yè)類型之間是否具有聯(lián)系?,72,列聯(lián)表 -交叉列聯(lián)表所講述的內(nèi)容,卡方 (2)分布 -,它由一系列分布組成,其具體形狀取決于一個參數(shù),即自由度 (df),卡方分布是一種抽樣分布,卡方分布傾向右側(cè),隨著自由度 (df)增大,卡方分布將接近正態(tài)分布,73,列聯(lián)表 -交叉列聯(lián)表所講述的內(nèi)容,74,列聯(lián)表 -交叉列聯(lián)表所講述的內(nèi)容,卡方檢驗的基本思想 -,比較觀察頻數(shù)和期望頻數(shù),如果觀察頻數(shù)接近期望頻數(shù),則可以作為接受原假設(shè) (H0)的證據(jù),運用卡方檢驗 -,檢驗同質(zhì)性,檢驗擬合優(yōu)度,檢驗獨立性,

42、檢驗總體方差是否相等,75,總體之間的同質(zhì)性,當(dāng)把從兩個樣本中抽取的數(shù)據(jù)根據(jù)同一特征進(jìn)行了分類并表示為列聯(lián)表之后,目的是檢驗不同總體的反應(yīng)類型是否相同,為了回答這個問題,我們利用卡方檢驗來檢驗同質(zhì)性,76,總體之間的同質(zhì)性,例題 1:兩個不同版本商業(yè)廣告片的反應(yīng)類型,每種版本的商業(yè)廣告片代表一個總體,每一種反應(yīng)類型代表未知的總體比例,77,總體之間的同質(zhì)性,原假設(shè)為具有“同質(zhì)性”或 “相似的反應(yīng)類型”,可以將其寫成,H0 : pA1 = pB1, pA2 = pB2, pA3 = pB3,78,總體之間的同質(zhì)性,根據(jù)H0, pi可以被估計為,和,如果原假設(shè)為真,兩個總體的每種反應(yīng)類型都應(yīng)當(dāng)具有

43、相同的比例,讓我們分別用一些常見的比例符號p1, p2, p3來表示,79,總體之間的同質(zhì)性,期望頻數(shù) -,80,總體之間的同質(zhì)性,檢驗統(tǒng)計量,如果觀察頻數(shù)與期望頻數(shù)相差很大,我們就認(rèn)為原假設(shè)為假,81,總體之間的同質(zhì)性,2 = 0.674 + 0.502 + 2.006 + 0.770 + 0.573 + 2.292 = 6.817, 2值是否過大,使得我們不得不拒絕H0?, 將該值與從2表中獲得的“臨界值”進(jìn)行比較,查表之前需要知道 1.自由度d.f. = (r1) (c1) 2.右尾上面的面積 () 顯著水平,82,總體之間的同質(zhì)性,83,總體之間的同質(zhì)性,自由度 d.f. = (21) (31) = 2,顯著水平, = 0.05,= 5.99,臨界值 ,6.817 5.99 數(shù)據(jù)顯示:當(dāng)顯著水平 = 0.05時,檢驗統(tǒng)計量太大,因此我們應(yīng)當(dāng)拒絕H0,觀眾在觀看完兩種不同版本的商業(yè)廣告片之后,其反應(yīng)類型會有明顯的差異,84,總體之間的同質(zhì)性,進(jìn)行卡方同質(zhì)檢驗的步驟 ,1.構(gòu)造假設(shè),2.建立列聯(lián)表并計算期望頻數(shù),3.計算檢驗統(tǒng)計量,4.計算自由度 并查找臨界值,5.進(jìn)行決策并得出結(jié)論,85,總體之間的同質(zhì)性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論