




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
StatisticswithPython
統(tǒng)計學(xué)
基于Python
2023/12/19
課程內(nèi)容描述統(tǒng)計、推斷統(tǒng)計、其他方法使用軟件
Python
語言學(xué)分與課時3學(xué)分,1~17周,每周3課時課程簡介賈俊平2023/12/196.1參數(shù)估計的原理6.2總體均值的區(qū)間估計6.3總體比例的區(qū)間估計6.4總體方差的區(qū)間估計第6章參數(shù)估計點估計與區(qū)間估計
點估計
用樣本的估計量的某個取值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計點估計無法給出估計值接近總體參數(shù)程度的信息由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值一個點估計量的可靠性是由它的標(biāo)準誤來衡量的,這表明一個具體的點估計值無法給出估計的可靠性的度量
6.1
參數(shù)估計的原理點估計與區(qū)間估計區(qū)間估計
在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個估計區(qū)間,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到如果將構(gòu)造置信區(qū)間的步驟重復(fù)多次,置信區(qū)間中包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平,也稱為置信度或置信系數(shù)(confidencecoefficient)。統(tǒng)計上,常用的置信水平有90%、95%和99%。區(qū)間估計的圖示
6.1
參數(shù)估計的原理點估計與區(qū)間估計——區(qū)間估計的表述置信區(qū)間
由樣本估計量構(gòu)造出的總體參數(shù)在一定置信水平下的估計區(qū)間。統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間。同樣,其他置信水平的區(qū)間也可以用類似的方式進行表述總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個隨機區(qū)間,它會因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)實際估計時往往只抽取一個樣本,此時所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間。我們希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個當(dāng)抽取一個具體的樣本,用該樣本所構(gòu)造的區(qū)間是一個特定的常數(shù)區(qū)間,無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值,它可能是包含總體均值的區(qū)間中的一個,也可能是未包含總體均值的那一個一個特定區(qū)間總是“包含”或“絕對不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問題置信水平只是告訴我們在多次估計得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值,而不是針對所抽取的這個樣本所構(gòu)建的區(qū)間而言的
6.1
參數(shù)估計的原理區(qū)間估計——模擬的95%的置信區(qū)間模擬的95%的置信區(qū)間
6.1
參數(shù)估計的原理
區(qū)間估計——影響區(qū)間寬度的因素置信水平、樣本量和方差對置信區(qū)間的影響
6.1
參數(shù)估計的原理影響區(qū)間寬度的因素主要有置信水平、樣本量和總體方差在其他條件不變時,區(qū)間寬度與置信水平成正比,這意味著,一個較大的置信水平會得到一個比較寬的置信區(qū)間在其他條件不變時,區(qū)間的寬度與樣本量成反比,即使用一個較大的樣本會得到一個較準確(較窄)的區(qū)間區(qū)間的寬度與總體方差成正比,總體方差越大,說明數(shù)據(jù)越分散,得到的置信區(qū)間也就越寬評價估計量的標(biāo)準——無偏性估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù)無偏性的模擬樣本均值的均值:49.9881樣本中位數(shù)的均值:50.0030樣本方差的均值:100.2786
6.1
參數(shù)估計的原理評價估計量的標(biāo)準——有效性對同一總體參數(shù)的兩個無偏點估計量,標(biāo)準差小的估計量更有效有效性的模擬——均值與中位數(shù)的比較樣本均值的方差:0.0992樣本中位數(shù)的方差:0.1356
6.1
參數(shù)估計的原理評價估計量的標(biāo)準——一致性隨著樣本量的增大,估計量的值越來越接近被估計的總體參數(shù)一致性的模擬——均值
6.1
參數(shù)估計的原理一個總體均值的估計——大樣本總體均值的置信區(qū)間是由樣本均值加減估計誤差得到的估計誤差由兩部分組成:一是點估計量的標(biāo)準誤,它取決于樣本統(tǒng)計量的抽樣分布。二是估計時所要的求置信水平為時,統(tǒng)計量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度總體均值在置信水平下的置信區(qū)間可一般性地表達為樣本均值±分位數(shù)×樣本均值的標(biāo)準誤
6.2
總體均值的區(qū)間估計一個總體均值的估計——大樣本——例題分析【例6-1】一家研究機構(gòu)隨機抽取40輛相同排氣量的家用轎車,經(jīng)過測試得到每百公里耗油量數(shù)據(jù)(單位:升)。建立該排氣量轎車平均耗油量的90%的置信區(qū)間7.97.96.57.47.78.17.88.68.18.28.18.48.48.28.37.47.57.77.87.48.58.66.98.38.47.58.38.08.77.47.68.57.87.98.78.68.48.27.47.6array([[7.8359],[8.0991]])
6.2
總體均值的區(qū)間估計一個總體均值的估計——小樣本——例題分析
【例6-2】從一批袋裝食品中隨機抽取25袋,測得每袋重量如表5—2所示。假定食品重量服從正態(tài)分布,估計該批食品平均重量的置信區(qū)間,置信水平為95%array([[101.3748],[109.3452]])112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3
6.2
總體均值的區(qū)間估計兩個總體均值差的估計——獨立大樣本
6.2
總體均值的區(qū)間估計兩個總體均值差的估計——獨立大樣本【例6-3】
為研究男性和女性網(wǎng)上購物支出的差異,從某電商中隨機抽取男女各50人,得到某個月的網(wǎng)購支出數(shù)據(jù)如表6-3所示。構(gòu)建男女平均支出差值的95%的置信區(qū)間男女平均支出差值的95%的置信區(qū)間:[381.1844957.7156]
6.2
總體均值的區(qū)間估計女性支出男性支出2692.81242.92787.12635.42172.31574.41914.51741.62711.21169.4……
3350.31930.81194.01262.92681.62753.22694.91208.61276.31157.4兩個總體均值差的估計——獨立小樣本
方法一的平均時間為32.50,方法二的平均時間為28.80假定方差相等,兩方法組裝時間差值95%的置信區(qū)間為[0.14037.2597]假定方差不相等,兩方法組裝時間差值95%的置信區(qū)間為[0.13847.2616]自由度為21.8029
6.2
總體均值的區(qū)間估計兩個總體均值差的估計——配對樣本
兩套試卷分數(shù)之差的95%的置信區(qū)間為:[6.327315.6727]
學(xué)生編號試卷A試卷B178712634437261489845917464951768558766098577105539
6.2
總體均值的區(qū)間估計一個總體比例的估計——大樣本近似假定條件總體服從二項分布可以由正態(tài)分布來近似np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于10置信區(qū)間【例6-6】
某企業(yè)想要進行一項工作時間改革,為征求員工對該項改革措施的意見,在隨機調(diào)查500人,其中325人贊成改革措施。用95%的置信水平估計贊成該項改革的人數(shù)比例的置信區(qū)間贊成該項改革的人數(shù)比例95%置信區(qū)間為:[0.60820.6918]樣本比例±分位數(shù)×樣本比例的標(biāo)準誤
6.3
總體比例的區(qū)間估計一個總體比例的估計——任意大小樣本
【例6-7】
沿用例6-6。用95%的置信水平估計該企業(yè)員工中贊成該項改革的人數(shù)比例的置信區(qū)間贊成該項改革人數(shù)比例的95%的置信區(qū)間為:[0.60710.6905]
6.3
總體比例的區(qū)間估計兩個總體比例差的估計——大樣本近似——任意大小樣本
(p1-p2)±分位數(shù)×(p1-p2)的標(biāo)準誤
6.3
總體比例的區(qū)間估計兩個總體比例差的估計——大樣本近似——任意大小樣本——例題分析【例6-8-9】在某個電視節(jié)目的收視率調(diào)查中,女性觀眾隨機調(diào)查了500人,有225人收看了該節(jié)目;男性觀眾隨機調(diào)查了400人,有128人收看了該節(jié)目。用95%的置信水平估計女性與男性收視率差值的置信區(qū)間#大樣本近似女性與男性收視率差值的95%的置信區(qū)間為:[0.06680.1932]#任意大小樣本女性與男性收視率差值的95%的置信區(qū)間為:[0.06620.1924]
6.3
總體比例的區(qū)間估計一個總體方差的估計——一個總體方差的估計估計一個總體的方差或標(biāo)準差假設(shè)總體服從正態(tài)分布總體方差的置信區(qū)間
6.4
總體方差的區(qū)間估計兩個總體方差比的估計
6.4
總體方差的區(qū)間估計一個總體方差的估計——一個總體方差的估計——例題分析【例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030香醋行業(yè)風(fēng)險投資發(fā)展分析及投資融資策略研究報告
- 2025-2030油煙機行業(yè)市場深度調(diào)研及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 2025-2030寵物醫(yī)院產(chǎn)業(yè)市場發(fā)展分析及前景趨勢與投資戰(zhàn)略研究報告
- 2025-2030農(nóng)村家電市場前景分析及投資策略與風(fēng)險管理研究報告
- 2025-2030人體工程學(xué)鼠標(biāo)行業(yè)市場發(fā)展分析及發(fā)展趨勢與投資研究報告
- 2025-2030中國長租公寓市場營銷優(yōu)勢及未來發(fā)展模式分析研究報告
- 2025-2030中國裝配式裝修行業(yè)市場深度調(diào)研及競爭格局與投資前景研究報告
- 2025-2030中國草酰乙酸市場產(chǎn)能規(guī)模預(yù)測及發(fā)展前景研究研究報告
- 2025-2030中國纖維素粉末行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 2025-2030中國玫瑰花露行業(yè)供需分析及發(fā)展前景研究報告
- 有線電視播放行業(yè)可行性分析報告
- 異常子宮出血患者護理查房
- 中小學(xué)教育懲戒規(guī)則培訓(xùn)
- 科粵版九上化學(xué)-2.2構(gòu)成物質(zhì)的微粒(一)-分子-教案設(shè)計
- 2024年商鋪租賃終止合同標(biāo)準范文(二篇)
- CT設(shè)備維保項目實施方案
- 約克冷水機組年度維護保養(yǎng)方案
- 醫(yī)院年度文化建設(shè)工作方案范文
- 吊裝式風(fēng)機安裝作業(yè)指導(dǎo)書
- 高一數(shù)學(xué)分層訓(xùn)練AB卷(人教A版2019必修第二冊)第九章統(tǒng)計(知識通關(guān)詳解)【單元測試卷】(原卷版+解析)
- 培養(yǎng)自我認知能力-心理健康教案
評論
0/150
提交評論