第6章 參數(shù)估計與假設(shè)檢驗(yàn)_第1頁
第6章 參數(shù)估計與假設(shè)檢驗(yàn)_第2頁
第6章 參數(shù)估計與假設(shè)檢驗(yàn)_第3頁
第6章 參數(shù)估計與假設(shè)檢驗(yàn)_第4頁
第6章 參數(shù)估計與假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第六章參數(shù)估計和假設(shè)檢驗(yàn)統(tǒng)計學(xué)的基本內(nèi)容描述統(tǒng)計推斷統(tǒng)計描述統(tǒng)計是推斷統(tǒng)計的前提,推斷統(tǒng)計是描述統(tǒng)計的發(fā)展。數(shù)據(jù)描述性分析、時間數(shù)列分析和指數(shù)分析參數(shù)估計和假設(shè)檢驗(yàn)指搜集、整理、分析、研究并提供統(tǒng)計資料的理論和方法,用來說明總體的情況和特征。利用樣本統(tǒng)計量對總體某些性質(zhì)或數(shù)量特征進(jìn)行推斷的方法。隨機(jī)原則總體樣本參數(shù)統(tǒng)計量參數(shù)估計假設(shè)檢驗(yàn)抽樣分布概分率布理基論礎(chǔ)容量均值方差標(biāo)準(zhǔn)差成數(shù)總體參數(shù)樣本統(tǒng)計量側(cè)重于用樣本統(tǒng)計量估計總體的某一未知參數(shù)側(cè)重于用樣本統(tǒng)計量驗(yàn)證總體是否具有某種性質(zhì)或數(shù)量特征一、簡單隨機(jī)樣本的性質(zhì)有限總體放回不放回樣本放回不放回樣本樣本獨(dú)立同分布同分布無限總體第一節(jié)抽樣分布統(tǒng)計量:樣本指標(biāo),不依賴于任何未知參數(shù)。樣本均值樣本成數(shù)樣本方差二、統(tǒng)計量與抽樣分布把某一抽樣方法的全部可能的樣本統(tǒng)計量的取值與其相應(yīng)的概率排列起來,就得到樣本的抽樣分布。

抽樣分布:某一統(tǒng)計量所有可能取值的概率分布。性質(zhì)數(shù)字特征0≤P(Xi)≤1∑P(Xi)=1均值E(X)方差E[X-E(X)]2實(shí)踐中,我們只從總體中抽取一個簡單隨機(jī)樣本,抽樣分布是理論分布,重要的是我們必須掌握它的特征。注意區(qū)別三種不同性質(zhì)的分布:總體分布:實(shí)際問題所研究的是總體中個體的某一特征X,X是一個隨機(jī)變量,而X的可能取值全體即為總體.稱X的分布為總體分布。樣本分布:樣本中各觀察值的分布稱為樣本分布,也稱經(jīng)驗(yàn)分布。樣本分布可以用樣本的頻數(shù)分布來表示。抽樣分布:統(tǒng)計量的分布稱為抽樣分布?!纠吭O(shè)一個總體,含有4個元素(個體)分別為:1、2、3、4

3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值重復(fù)抽樣,n=2的樣本(共16個)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值()1.0P(

)1.53.04.03.52.02.511.522.533.540.06250.1250.18750.250.18750.1250.0625總體分布1423P(X)(一)抽樣分布的表示方法若將統(tǒng)計量的取值分別記為其相應(yīng)的概率記為P1,P2,…Pn,將它們按順序排列起來,可得如下概率分布表。

…………

1、分布列表示—適用于離散變量2、密度曲線表示—常用于連續(xù)變量概率分布密度函數(shù)為f(x)概率由概率分布密度函數(shù)確定連續(xù)型隨機(jī)變量概率分布的性質(zhì):1、分布密度函數(shù)總是大于或等于0,即f(x)≥0;2、當(dāng)隨機(jī)變量x取某一特定值時,其概率等于0;xf(x)

Xf(X)正態(tài)分布是依賴于參數(shù)μ和σ2(或σ)的一簇分布,正態(tài)曲線的位置及形態(tài)隨μ和σ2的不同而不同。幾種常用的分布:

※正態(tài)分布

許多統(tǒng)計分析方法都是以正態(tài)分布為基礎(chǔ)的。此外,還有不少隨機(jī)變量的概率分布在一定條件下以正態(tài)分布為其極限分布。正態(tài)分布的密度函數(shù)為:隨機(jī)變量服從正態(tài)分布,記為:對于任何一個服從正態(tài)分布N(μ,σ2)的隨機(jī)變量X,都可以通過標(biāo)準(zhǔn)化變換:

Z=(X-μ)/σ將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量。隨機(jī)變量服從正態(tài)分布,記為:※

分布設(shè)隨機(jī)變量皆服從,且相互獨(dú)立,則隨機(jī)變量服從自由度為n的分布,并記為:xf(x)分布一般為正偏態(tài)分布,但隨著自由度n的增大,曲線趨向于正態(tài)分布?!?/p>

t分布t分布是均值為0的對稱鐘形分布,但與標(biāo)準(zhǔn)正態(tài)分布相比,中心較低尾部較高,隨著自由度n的增大,曲線趨向于標(biāo)準(zhǔn)正態(tài)分布。設(shè)隨機(jī)變量,,且X與Y相互獨(dú)立,則隨機(jī)變量服從自由度為n的t分布,并記為t(11)t(15)xf(x)1、樣本均值的數(shù)字特征有限總體不放回抽樣無限總體或有限總體放回抽樣標(biāo)準(zhǔn)差方差 均值

抽樣方法有限總體的校正系數(shù),當(dāng)N很大時,簡化為,當(dāng)抽樣比時可忽略不計。抽樣誤差(二)樣本均值的抽樣分布樣本均值從正態(tài)分布標(biāo)準(zhǔn)化2、樣本均值抽樣分布的數(shù)學(xué)結(jié)論正態(tài)總體非正態(tài)總體或總體分布未知根據(jù)中心極限定理,當(dāng)樣本容量足夠大時()不管總體分布如何,樣本均值的抽樣分布總可以看作是正態(tài)分布。標(biāo)準(zhǔn)化◆總體成數(shù):是指總體中具有某種特征的單位數(shù)在總體中所占的比例。如某性別比率、產(chǎn)品合格率等總體“是非變量”的平均數(shù)總體“是非變量”的方差為

——“是成數(shù)”——“非成數(shù)”(三)樣本成數(shù)的抽樣分布有限總體不放回抽樣無限總體或有限總體放回抽樣標(biāo)準(zhǔn)差方差 均值抽樣方法1、樣本成數(shù)的數(shù)字特征根據(jù)中心極限定理,當(dāng)樣本容量足夠大時(、),不管總體分布如何,樣本成數(shù)的抽樣分布總可以看作是正態(tài)分布。標(biāo)準(zhǔn)化2、樣本成數(shù)抽樣分布的數(shù)學(xué)結(jié)論第二節(jié)參數(shù)估計點(diǎn)估計區(qū)間估計直接用某一個樣本的指標(biāo)值作為總體未知參數(shù)的估計值。根據(jù)給定的可靠程度的要求,估計總體未知參數(shù)所在的可能區(qū)間。點(diǎn)估計給出一個數(shù)字,用起來很方便;而區(qū)間估計給出一個區(qū)間,說起來留有余地;不象點(diǎn)估計那么絕對。問題:第一,我們?yōu)槭裁匆赃@一個而不是那一個統(tǒng)計量來估計某個總體參數(shù)?第二,如果有兩個以上的統(tǒng)計量可以用來估計某個總體參數(shù),其估計結(jié)果是否一致?是否一個統(tǒng)計量要優(yōu)于另一個?估計量的優(yōu)良標(biāo)準(zhǔn):

無偏性、有效性、一致性一、點(diǎn)估計1、無偏性:是的無偏估計量是的無偏估計量是的無偏估計量(無限總體)估計量的優(yōu)良性標(biāo)準(zhǔn)無偏估計量誤差沒有系統(tǒng)性的方向,沒有系統(tǒng)性誤差,而有偏估計量具有系統(tǒng)性誤差。2、有效性:的無偏估計量一個無偏估計量并不意味著這一估計量一定非常接近待估計的參數(shù),它還必須是與總體參數(shù)的離散程度比較小。在無偏估計的情況下方差愈小也就愈有效。如:樣本平均數(shù)與中位數(shù)都是總體均值的無偏估計量,但在同樣的樣本容量下,樣本平均數(shù)是有效的估計量。3、一致性:隨著樣本容量的增大,的偏差越來越小較大的樣本容量較小的樣本容量數(shù)理統(tǒng)計證明:點(diǎn)估計的不足是不能反映估計的誤差和可靠程度,但一個優(yōu)良的點(diǎn)估計量為區(qū)間估計提供了基礎(chǔ),決定了區(qū)間的位置。是的無偏、有效、一致估計量是的無偏、有效、一致估計量是的無偏、一致估計量二、區(qū)間估計在一定的置信度的保證下,利用抽樣分布理論,確定參數(shù)的置信區(qū)間?!舴Q為參數(shù)的置信度為的置信區(qū)間◆置信區(qū)間包括置信度和精確度兩個方面置信度:隨機(jī)區(qū)間包含的概率,越大越好精確度:隨機(jī)區(qū)間平均長度,越短精確度越好樣本容量一定時,置信度和精確度是一對矛盾。在保證置信度的前提下,盡可能提高精確度。(一)總體均值的置信區(qū)間標(biāo)準(zhǔn)化正態(tài)總體,方差已知為了使置信區(qū)間長度最小,將事先給定的置信度對稱分配到分布的兩側(cè)0例為樣本均值的抽樣誤差的置信度的置信區(qū)間為:為抽樣極限誤差,表明在給定置信度的條件下對總體均值進(jìn)行區(qū)間估計所允許的最大誤差。正態(tài)總體,方差未知(小樣本)0的置信度的置信區(qū)間為:例非正態(tài)總體(大樣本)例例在總體方差已知條件下,根據(jù)分布進(jìn)行區(qū)間估計,可得的置信度為的置信區(qū)間為:在總體方差未知條件下,以代替根據(jù)分布進(jìn)行區(qū)間估計,可得的置信度為的置信區(qū)間為:(二)總體成數(shù)的置信區(qū)間標(biāo)準(zhǔn)化的置信度的置信區(qū)間為:為待估參數(shù),以樣本代替例比例置信區(qū)間的特殊情況(稀有事件的小比例估計問題)若總體中具有某種特征的單元數(shù)很少,因而P很小,即使當(dāng)n很大時,np≤5。這時P就不宜用正態(tài)分布近似計算。由概率論的知識可知,這時n個樣本單元中具有某種特征的單元數(shù)X服從泊松分布,可由泊松分布來求置信區(qū)間??瓶藗悩?biāo)準(zhǔn)P近似正態(tài)分布要求樣本量0.50.4—0.60.3—0.70.2—0.80.1—0.9305080200600簡單隨機(jī)抽樣方式的參數(shù)區(qū)間估計小結(jié)待估計參數(shù)已知條件置信區(qū)間正態(tài)總體,σ2已知正態(tài)總體,σ2未知非正態(tài)總體,n≥30有限總體,n≥30(不放回抽樣)σ未知時,用S總體均值()σ未知時,用S無限總體,np和nq都大于5總體成數(shù)(p)有限總體,np和nq都大于5(三)樣本容量的確定確定的前提預(yù)期可靠程度預(yù)期精確程度考慮的因素總體的差異程度不同的抽樣組織方式現(xiàn)有的人力、財力和時間因素確定方法估計總體均值所需的樣本容量(1)放回抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差?;騍通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗(yàn)數(shù)據(jù);②試驗(yàn)調(diào)查樣本的S。計算結(jié)果通常向上進(jìn)位(2)不放回抽樣條件下:確定方法估計總體均值所需的樣本容量【例】某食品廠要檢驗(yàn)本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?解:在不放回抽樣下:確定方法推斷總體成數(shù)所需的樣本容量⑴放回抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計算結(jié)果通常向上進(jìn)位通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗(yàn)數(shù)據(jù);②試驗(yàn)調(diào)查樣本的;③取方差的最大值0.25。⑵不放回抽樣條件下:確定方法推斷總體成數(shù)所需的樣本容量【例】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進(jìn)行質(zhì)量檢查,過去幾次同類調(diào)查所得的產(chǎn)品合格率為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的概率保證程度下,應(yīng)抽查多少件產(chǎn)品?分析:因?yàn)楣灿腥齻€過去的合格率的資料,為保證推斷的把握程度,應(yīng)選其中方差最大者即P=93﹪。樣本數(shù)的確定待估計參數(shù)已知條件樣本數(shù)的確定正態(tài)總體,σ2已知總體均值(μ)例:誤差范圍簡單隨機(jī)抽樣有限總體,不放回抽樣,σ2已知總體成數(shù)(P)服從正態(tài)分布有限總體,不放回抽樣第三節(jié)假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的基本原理(一)假設(shè)檢驗(yàn)的含義是參數(shù)估計之外的另一類重要的統(tǒng)計推斷問題。它是指事先對總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷該假設(shè)是否成立。由于樣本的隨機(jī)性,這種推斷也同樣有一定的風(fēng)險。(二)邏輯推理方法——反證法

檢驗(yàn)的過程是以否定總體的某種假設(shè)為目標(biāo):事先對總體作出某種假設(shè),然后對樣本值與原假設(shè)的差異進(jìn)行分析。如果有充分的理由證明這種差異并非完全是由于樣本的隨機(jī)性引起的,也即這種差異是顯著的,就否定對總體的這種假設(shè)(較有說服力)。(三)基本思想——小概率原理如果對總體所作的某種假設(shè)是真的,那么樣本值與原假設(shè)出現(xiàn)顯著性差異的概率是很小的。如果在某一次隨機(jī)抽樣中,顯著性差異竟然出現(xiàn)了,我們就有理由懷疑這一假設(shè)的真實(shí)性,拒絕這一假設(shè)??傮w(某種假設(shè))抽樣樣本(觀察結(jié)果)檢驗(yàn)接受拒絕小概率事件未發(fā)生小概率事件發(fā)生

H0—原假設(shè),H1—備擇假設(shè)(四)假設(shè)的形式原假設(shè):是指想收集證據(jù)予以否定的假設(shè)。如果否定不了,那就說明證據(jù)不足。無法否定原假設(shè),也不能說明原假設(shè)正確。

備擇假設(shè):它與原假設(shè)陳述的內(nèi)容相反。在實(shí)際問題中,為了通過樣本信息對總體某一假設(shè)取得強(qiáng)有力的支持,通常把這種假設(shè)作為備擇假設(shè)。三種類型:二、假設(shè)檢驗(yàn)規(guī)則與兩類錯誤

(以總體均值雙側(cè)檢驗(yàn)為例)檢驗(yàn)過程是比較樣本觀察結(jié)果與總體假設(shè)的差異。差異顯著,超過了臨界點(diǎn),拒絕H0;反之,差異不顯著,接受H0差異臨界點(diǎn)拒絕H0接受H0判斷怎樣確定C?總體假設(shè):拒絕H0拒絕H0(一)兩類錯誤I類錯誤——棄真錯誤,發(fā)生的概率為α

II類錯誤——取偽錯誤,發(fā)生的概率為β

檢驗(yàn)決策H0為真H0非真拒絕H0犯I類錯誤(α)正確接受H0正確犯II類錯誤(β)接受或拒絕H0,都可能犯錯誤α大β就小,α小β就大基本原則:力求在控制α前提下減少β在總體均值的雙側(cè)檢驗(yàn)中:樣本均值落在非陰影區(qū)間內(nèi)的概率為(大概率),認(rèn)為該差異是由于樣本的隨機(jī)性引起。假設(shè)檢驗(yàn)又稱為顯著性檢驗(yàn)樣本均值落在陰影區(qū)間內(nèi)的概率為(小概率),認(rèn)為該差異是顯著的,即為顯著性水平。α的取值在檢驗(yàn)前事先確定:0.1、0.05、0.001等。如果犯I類錯誤損失更大,為減少損失,α值取??;如果犯II類錯誤損失更大,α值取大。(二)α與臨界點(diǎn)C的關(guān)系為真時,則臨界點(diǎn)C應(yīng)滿足:令則:0z(三)檢驗(yàn)規(guī)則0接受區(qū)拒絕區(qū)拒絕區(qū)zII類錯誤的概率β的計算(1)先求出拒絕H0的臨界值;(2)再求得在統(tǒng)計量真實(shí)的抽樣分布下達(dá)到臨界值的概率β。(四)檢驗(yàn)步驟建立總體假設(shè)H0,H1抽樣得到樣本觀察值12選擇檢驗(yàn)統(tǒng)計量確定H0為真時的統(tǒng)計量抽樣分布3根據(jù)具體決策要求確定α確定分布上的臨界點(diǎn)值及檢驗(yàn)規(guī)則計算檢驗(yàn)統(tǒng)計量的數(shù)值比較并作出檢驗(yàn)判斷7456三、幾種常見的假設(shè)檢驗(yàn)(一)總體均值的檢驗(yàn)構(gòu)造檢驗(yàn)統(tǒng)計量正態(tài)總體,方差已知檢驗(yàn)規(guī)則雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)拒絕域拒絕域接受域1-

左側(cè)檢驗(yàn)拒絕域接受域1-

右側(cè)檢驗(yàn)拒絕域接受域1-

例構(gòu)造檢驗(yàn)統(tǒng)計量正態(tài)總體,方差未知檢驗(yàn)規(guī)則雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)例方差已知時非正態(tài)總體(必須是大樣本)方差未知時檢驗(yàn)規(guī)則同正態(tài)總體方差已知的情況例(二)總體成數(shù)的檢驗(yàn)構(gòu)造檢驗(yàn)統(tǒng)計量檢驗(yàn)規(guī)則(同正態(tài)總體的均值檢驗(yàn))例由置信區(qū)間方法到假設(shè)檢驗(yàn)的運(yùn)算過程:(1)根據(jù)樣本構(gòu)建總體均值的置信區(qū)間:(2)如果置信區(qū)間包含假定的值,則不拒絕。否則,拒絕。例

五、假設(shè)檢驗(yàn)和置信區(qū)間的關(guān)系(1)總體均值的置信區(qū)間為:樣本均值的非拒絕區(qū)域:(2)以總體均值的雙側(cè)置信區(qū)間和雙側(cè)檢驗(yàn)為例:如果在式(2)所定義的非拒絕區(qū)域之內(nèi),假定的值就在式(1)所定義的置信區(qū)間內(nèi)。關(guān)系:【例】某種零件長度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽取9件,測得其平均長度為21.4mm。已知總體標(biāo)準(zhǔn)差

=0.15mm,試建立該種零件平均長度的置信區(qū)間,給定置信水平為0.95。我們可以95%的概率保證該種零件的平均長度在21.302~21.498mm之間。解:已知總體均值

的置信區(qū)間為返回根據(jù)上述資料建立置信度為95%的總體均值的區(qū)間估計(假定培訓(xùn)時間總體服從正態(tài)分布)【例】謝爾工業(yè)公司擬采用一項(xiàng)計算機(jī)輔助程序來培訓(xùn)公司的維修人員,以減少培訓(xùn)工人所需要的時間。為了評價這種培訓(xùn)方法,生產(chǎn)經(jīng)理需要對這種程序所需要的平均時間進(jìn)行估計。以下是利用新方法對15名職員進(jìn)行培訓(xùn)的培訓(xùn)天數(shù)資料。152659115424475012583558541360444962146254510461563

職員時間職員時間職員時間解答95%的置信區(qū)間為:53.87±3.78即(50.09,57.65)天。解:依題意,總體服從正態(tài)分布,n=15(小樣本),此時總體方差未知。可用自由度為(n-1)=14的t分布進(jìn)行總體均值的區(qū)間估計。返回【例】某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為6分鐘)。解:已

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論