




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計學(xué)基礎(chǔ)抽樣推斷和假設(shè)檢驗4描述統(tǒng)計分析321用圖表展示數(shù)據(jù)收集統(tǒng)計數(shù)據(jù)走近統(tǒng)計5相關(guān)與回歸分析7認(rèn)識事物發(fā)展趨勢指數(shù)分析數(shù)據(jù)分析報告689任務(wù)一抽樣及抽樣分布任務(wù)二
單一總體的參數(shù)估計項目五抽樣推斷和假設(shè)檢驗任務(wù)三必要樣本容量的確定任務(wù)四
單一總體參數(shù)假設(shè)檢驗知識目標(biāo)1.能掌握抽樣推斷的含義、組織形式和作用。4.能了解影響樣本容量的主要因素,掌握必要樣本容量的確定方法。2.能掌握幾種常用樣本統(tǒng)計量的抽樣分布。3.能了解參數(shù)估計的方法和單一總體均值、比例及方差的區(qū)間估計方法。5.能了解假設(shè)檢驗的基本原理和基本形式,掌握假設(shè)檢驗的基本步驟。技能目標(biāo)1.能夠根據(jù)抽樣調(diào)查所獲得的樣本數(shù)據(jù)對總體參數(shù)進(jìn)行點估計和區(qū)間估計。3.能根據(jù)抽樣調(diào)查所獲得的樣本數(shù)據(jù)對總體參數(shù)進(jìn)行假設(shè)檢驗。2.能夠?qū)Ρ匾臉颖救萘窟M(jìn)行計算。四抽樣方法和樣本可能數(shù)目三二一有關(guān)抽樣推斷的基本概念抽樣推斷的應(yīng)用范圍抽樣推斷的含義任務(wù)一抽樣及抽樣分布八抽樣分布理論七六五抽樣極限誤差抽樣平均誤差抽樣推斷的組織形式任務(wù)5.1抽樣及抽樣分布抽樣推斷又稱抽樣調(diào)查,是按照隨機(jī)原則,從研究對象的全部單位中抽取一部分單位進(jìn)行的調(diào)查,并用調(diào)查所得到的數(shù)據(jù)資料推斷總體數(shù)量特征的一種非全面調(diào)查方式。特點:1)按隨機(jī)原則抽取調(diào)查單位2) 用樣本指標(biāo)推斷總體的數(shù)量特征3)抽樣調(diào)查的誤差可以事先計算和控制1、抽樣推斷能完成其他調(diào)查方式不能完成的調(diào)查任務(wù)。2、利用抽樣推斷結(jié)果對已取得的全面調(diào)查資料進(jìn)行檢驗和修正。3、利用抽樣推斷原理和結(jié)果進(jìn)行假設(shè)檢驗,以對事物做出正確的判斷和認(rèn)識4、利用抽樣推斷方法可用于產(chǎn)品的質(zhì)量控制和管理。任務(wù)5.1抽樣及抽樣分布抽樣推斷的應(yīng)用范圍任務(wù)5.1抽樣及抽樣分布有關(guān)抽樣推斷的基本概念1、總體和樣本2、總體參數(shù)和樣本統(tǒng)計量表5-1相應(yīng)總體參數(shù)及樣本統(tǒng)計量的計算公式任務(wù)5.1抽樣及抽樣分布抽樣方法和樣本的可能數(shù)目表5-2重復(fù)、不重復(fù)抽樣情況下樣本可能的抽取數(shù)目表5-3重復(fù)、不重復(fù)抽樣情況下樣本可能的抽取數(shù)目例:
考慮順序不考慮順序重復(fù)抽樣AA、AB、AC、ADBA、BB、BC、BDCA、CB、CC、CDDA、DB、DC、DDAA、AB、AC、AD
BB、BC、BDCC、CDDD不重復(fù)抽樣AB、AC、ADBA、BC、BDCA、CB、CDDA、DB、DCAB、AC、ADBC、BDCD1、簡單隨機(jī)抽樣簡單隨機(jī)抽樣,又稱純隨機(jī)抽樣。這種抽樣方式是不對總體做任何處理,直接按隨機(jī)原則抽取調(diào)查。2、類型抽樣類型抽樣,又叫分層抽樣或分類抽樣。它是將總體中的所有單位先按某一主要標(biāo)志分成若干類(或組),使組內(nèi)各單位標(biāo)志表現(xiàn)比較接近,然后從各組中隨機(jī)抽取一部分單位,共同組成樣本。任務(wù)5.1抽樣及抽樣分布抽樣推斷的組織形式3、等距抽樣等距抽樣,又叫機(jī)械抽樣。它是先將總體各單位按某一標(biāo)志進(jìn)行排隊,根據(jù)既定的抽樣比例確定抽樣間距,然后按一定順序等間隔抽取一個樣本單位。4、整群抽樣整群抽樣是先將總體分為若干個群(組),每一群內(nèi)包含若干個單位,然后隨機(jī)抽取一部分群作為樣本群,對樣本群中的所有總體單位進(jìn)行全面調(diào)查的調(diào)查方式。任務(wù)5.1抽樣及抽樣分布抽樣推斷的組織形式5、多階段抽樣多階段抽樣是把抽取樣本單位的過程分成兩個或更多階段進(jìn)行。先從統(tǒng)計總體中抽取若干大的樣本單位,也叫第一階段單位,再從第一階段單位中抽取較小的樣本單位,也叫第二階段單位,以此類推,直到最后階段抽出最終的樣本單位,即需要登記標(biāo)志值的單位。任務(wù)5.1抽樣及抽樣分布抽樣推斷的組織形式1、抽樣誤差的概念2、抽樣誤差的來源
從誤差產(chǎn)生的來源來講,抽樣誤差可分為登記性誤差和代表性誤差兩類。
(1)登記性誤差
登記性誤差是指在調(diào)查過程中,由于主客觀原因在登記、匯總、計算、記錄中所產(chǎn)生的差錯。
(2)代表性誤差
代表性誤差又可分為系統(tǒng)性誤差和隨機(jī)性誤差。
抽樣誤差即指這種隨機(jī)誤差,它是抽樣調(diào)查所固有的。抽樣誤差的大小反映著抽樣調(diào)查的準(zhǔn)確性。一
抽樣平均誤差抽樣平均誤差是反映抽樣誤差一般水平的一個指標(biāo)。抽樣平均誤差是指抽樣平均數(shù)的標(biāo)準(zhǔn)差或抽樣成數(shù)的標(biāo)準(zhǔn)差。設(shè)以表示樣本平均數(shù)的抽樣平均誤差,以μp表示樣本成數(shù)的抽樣平均誤差,M表示全部可能的樣本數(shù)目,則
由計算還可看出,不重復(fù)抽樣的抽樣平均誤差小于重復(fù)抽樣的抽樣平均誤差。在簡單隨機(jī)重復(fù)抽樣條件下在簡單隨機(jī)不重復(fù)抽樣條件下近似公式【例5.1.】設(shè)有4位工人每月的工資分別為1160元、1200元、1280元和1320元,方差為4000元?,F(xiàn)在從中隨機(jī)抽取兩位工人的工資,用以代表四人總體的平均工資水平,其抽樣平均誤差為多少?【例5.2】某機(jī)械廠產(chǎn)生一批零件共5000件,隨機(jī)抽查250件,發(fā)現(xiàn)其中有8件不合格,求合格率的平均誤差。影響抽樣平均誤差的因素(1)總體變異的程度。(2)樣本容量的大小。(3)抽樣方法。(4)抽樣組織形式??傮w方差(標(biāo)準(zhǔn)差)資料的替代問題(1)用樣本方差替代總體方差。(2)用過去已經(jīng)進(jìn)行過的全面調(diào)查(或抽樣調(diào)查)的方差替代。(3)用實驗性調(diào)查所獲得的方差資料替代。二
抽樣極限誤差抽樣極限誤差是指樣本指標(biāo)和總體指標(biāo)之間誤差的可能范圍。樣本指標(biāo)變動的上限或下限與總體指標(biāo)的絕對值就可以表示誤差的可能范圍,這種以絕對值形式表示的抽樣誤差的可能范圍稱為抽樣極限誤差。上述不等式可得到和P的取值范圍,也叫置信區(qū)間。抽樣理論已經(jīng)證明:樣本平均數(shù)服從以總體平均數(shù)為中心的正態(tài)分布,該正態(tài)分布的標(biāo)準(zhǔn)差就是抽樣平均誤差μ。
因此,由正態(tài)分布中變量取值區(qū)間與概率的關(guān)系可知:樣本平均數(shù)落在()的范圍內(nèi)的可能性為68.27%;落在以()范圍內(nèi)的可能性為95.45%;落在以()范圍內(nèi)的可能性為99.73%,如下圖在抽樣估計中,表示這個可能性大小的概念叫置信度,習(xí)慣上也稱之為可靠程度、把握程度或概率保證程度等,用F(Z)表示。上述結(jié)論也就等價于:在68.27%的置信度下,平均數(shù)的抽樣極限誤差就等于其抽樣平均誤差;在95.45%的置信度下,抽樣極限誤差等于抽樣平均誤差的兩倍;在99.73%的置信度下,抽樣極限誤差等于抽樣平均誤差的3倍??梢?,平均數(shù)的抽樣極限誤差可以用抽樣平均誤差的倍數(shù)來度量,其計算公式為Z值是由抽樣估計時給定的置信度F(Z)所決定的,其對應(yīng)關(guān)系可查標(biāo)準(zhǔn)正態(tài)分布概率表。常用概率面積、概率度對應(yīng)表F(Z)ZF(Z)Z0.68271.000.95452.000.79951.280.992.580.86641.500.99733.000.901.640.99944.000.95001.960.9999995.00任務(wù)5.2單一總體的參數(shù)估計參數(shù)估計的概念
參數(shù)估計就是用樣本統(tǒng)計量去估計總體的參數(shù)。
參數(shù)估計有點估計和區(qū)間估計兩種方法。點估計
點估計又稱定值估計,它是直接以樣本資料計算樣本指標(biāo),再以樣本指標(biāo)值直接作為相應(yīng)的總體指標(biāo)的估計值。
點估計是不考慮抽樣誤差的參數(shù)估計。區(qū)間估計區(qū)間估計是在點估計的基礎(chǔ)上給出總體參數(shù)的一個估計區(qū)間。
進(jìn)行區(qū)間估計時,根據(jù)樣本統(tǒng)計量的抽樣分布,可以對統(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量,這一概率保證度我們稱為置信水平或置信度。在這種情況下,由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間?!纠?.3】某種零件的長度服從正態(tài)分布,從某天產(chǎn)生的一批零件中按重復(fù)抽樣方法隨機(jī)取9個,測得其平均長度為。已知總體標(biāo)準(zhǔn)差為。試估計該批零件平均長度的置信區(qū)間,置信水平為95%?!纠?.4】在某天生產(chǎn)的500袋食品中,按重復(fù)抽樣方法隨機(jī)抽取25袋進(jìn)行檢查,測得平均每袋的重量為996克。已知該種袋裝食品的重量服從正態(tài)分布,且標(biāo)準(zhǔn)差為20克。試估計該種食品平均重量的置信區(qū)間,置信水平為95%【例5.6】某城市想要估計下崗職工中女性所占的比例,采取重復(fù)抽樣方法隨機(jī)抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間?!纠?.7】某企業(yè)共有職工1000人。企業(yè)準(zhǔn)備實行一項改革,在職工中征求意見,采取重復(fù)抽樣方法隨機(jī)抽取200人作為樣本,調(diào)查結(jié)果顯示,有150人表示贊成該項改革,50人表示反對。試以95%的置信水平確定贊成改革人數(shù)比例的置信區(qū)間。任務(wù)5.3必要樣本容量的確定一、估計總體平均數(shù)時的必要樣本容量在重復(fù)抽樣條件下
在不重復(fù)抽樣條件下二、估計總體比例時的必要樣本容量任務(wù)5.3必要樣本容量的確定在重復(fù)抽樣條件下
在不重復(fù)抽樣條件下【例5.8】對某型號電子元件10000只進(jìn)行耐用性能檢查,根據(jù)以往抽樣測定,求得耐用時數(shù)的標(biāo)準(zhǔn)為600小時,置信水平為95.45%,元件平均耐用時數(shù)的誤差范圍不超過150小時,要抽取多少元件做檢查?【例5.9】對某型號電子元件10000只進(jìn)行耐用性能檢查,根據(jù)以往抽樣檢驗知道,元件合格率為95%。要求在99.73%的置信水平下,允許誤差不超過4%,試確定所需要抽取的元件數(shù)目是多少?任務(wù)5.3必要樣本容量的確定三、影響樣本容量的主要因素1、總體的變異程度2、概率保證度(置信水平)3、精度(抽樣極限誤差)4、抽樣方法5、抽樣組織形式任務(wù)5.4單一總體參數(shù)假設(shè)檢驗5.4.1假設(shè)檢驗的基本內(nèi)容1、假設(shè)檢驗的基本思想假設(shè)檢驗(hypothesistesting)是除參數(shù)估計之外的另一類重要統(tǒng)計推斷問題。它的基本思想可以用小概率原理來解釋。所謂小概率原理,就是認(rèn)為小概率事件在一次試驗中是幾乎不可能發(fā)生的。也就是說,如果對于總體的某個假設(shè)是真實的,那么不利于或不可能支持這一假設(shè)的小概率事件A在一次試驗中幾乎是不可能發(fā)生的,要是一次試驗中事件A竟然發(fā)生了,我們就有理由懷疑這一假設(shè)的真實性,從而拒絕這一假設(shè)。假設(shè)
這是兩個對立的假設(shè),我們稱為原假設(shè)和備擇假設(shè)。2、假設(shè)檢驗的雙側(cè)、單側(cè)檢驗在假設(shè)檢驗中,如果只關(guān)心備擇假設(shè)是否不同于原假設(shè),稱為雙邊備擇假設(shè)(雙側(cè)檢驗)。假設(shè)這種檢驗我們稱為右邊檢驗(右側(cè)檢驗)。假設(shè)這種檢驗我們稱為左邊檢驗(左側(cè)檢驗)。設(shè)為總體均值,為假設(shè)參數(shù)的具體數(shù)值,則假設(shè)檢驗的基本形式見表5-9。3、假設(shè)檢驗中的相關(guān)定義
(1)假設(shè)檢驗中的兩類錯誤肯定意味著放棄;拒絕意味著接受。但實際上當(dāng)為真時,我們?nèi)杂锌赡茏龀鼍芙^的判斷(這種可能性是無法消除的),這是一種錯誤。由于抽樣的隨機(jī)性,我們利用樣本對兩個對立的假設(shè)進(jìn)行推斷,有可能出現(xiàn)兩種情況:犯這種錯誤的概率記為:我們無法排除犯這種錯誤的可能性,但是希望將犯這類錯誤的概率控制在一定限度之內(nèi),因此,給出一個較小的數(shù),使犯這類錯誤的概率不超過,即使得:決策結(jié)果實際情況為真不為真接受
正確決策第II類錯誤拒絕
第I類錯誤正確決策(2)顯著性水平與拒絕域發(fā)生第I類錯誤的概率也常被用于評價檢驗結(jié)論的可靠程度,假設(shè)檢驗中犯第I類錯誤的概率被稱為顯著性水平,記為。即:常用的顯著性水平有。當(dāng)檢驗統(tǒng)計量取某個區(qū)域C中的值時,我們拒絕原假設(shè),則稱區(qū)域C為拒絕域,拒絕域的邊界點稱為臨界點。4、假設(shè)檢驗的基本步驟綜上所述,總體參數(shù)的假設(shè)檢驗問題的步驟可歸納如下:(1)根據(jù)實際問題的要求,提出原假設(shè)和備擇假設(shè)。(2)給定顯著性水平以及樣本容量n。(3)選擇適當(dāng)?shù)臋z驗統(tǒng)計量以及拒絕域的形式。(4)根據(jù)求出拒絕域。5.4.2單一總體的參數(shù)檢驗1、總體均值的檢驗(1)正態(tài)總體、方差已知、小樣本【例5.10】某味精廠生產(chǎn)的味精每袋重量(克)服從正態(tài)分布,質(zhì)檢要求每袋重100克。根據(jù)以往生產(chǎn)經(jīng)驗知該味精重量的標(biāo)準(zhǔn)差為基本穩(wěn)定。現(xiàn)從某天包裝的味精中隨機(jī)抽取9袋,測得它們的重量分別為99.3,98.7,100.5,101.2,99.3,99.7,99.5,102.1,100.5。試問這天包裝的味精是否合格?(2)正態(tài)總體、方差已知、大樣本【例5.11】某批發(fā)商欲從生產(chǎn)廠家購進(jìn)一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不能低于1000小時。已知燈泡使用壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為20小時。在總體中抽取100只燈泡,測得樣本均值為960小時。問批發(fā)商是否應(yīng)該購買這批燈泡?(3)正態(tài)總體、方差未知、小樣本【例5.12】燈泡的使用壽命服從分布,假定燈泡的額定壽命是960小時,從某生產(chǎn)廠家生產(chǎn)的某批燈泡中隨機(jī)抽驗了10只,測得壽命為:950,960,960,950,950,9
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年三級心理咨詢師《理論知識》模擬真題及答案
- 數(shù)學(xué)保研試題及答案詳解
- 家居產(chǎn)品設(shè)計中的技術(shù)創(chuàng)新與應(yīng)用考題試題及答案
- 清華機(jī)測試題及答案
- 靈活應(yīng)變2025年商務(wù)英語考試試題及答案
- 氫能源汽車加氫站投資成本效益評估報告(2025年)
- 電動汽車可靠性分析試題及答案
- 帕金森病試題及答案護(hù)理
- 系統(tǒng)分析2025年土木工程師考試常見評估標(biāo)準(zhǔn)試題及答案
- 敏感拼音測試題及答案
- 附件16:地下室燈帶臨時照明系統(tǒng)方案
- 投顧服務(wù)方案
- 工程師轉(zhuǎn)正匯報課件
- 養(yǎng)殖場安全生產(chǎn)培訓(xùn)
- 礦山生產(chǎn)管理培訓(xùn)課件
- 普及防癌知識宣傳
- 高一數(shù)學(xué)組尖子生培養(yǎng)計劃(修改)
- 醫(yī)療器械輻射安全管理的要求
- 【課件】時代與變革-為人生而藝術(shù)+課件高一上學(xué)期美術(shù)人美版(2019)必修美術(shù)鑒賞
- 6朗誦《唐詩里的中國》朗誦稿
- 博士生入學(xué)復(fù)試面試報告?zhèn)€人簡歷介紹(完美版)模板兩篇
評論
0/150
提交評論