版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第五章樣本及其分布演示文稿目前一頁\總數(shù)九十七頁\編于十八點(diǎn)第五章樣本及其分布ppt課件目前二頁\總數(shù)九十七頁\編于十八點(diǎn)變量函數(shù)的分布等。但是對一個(gè)實(shí)際問題,隨機(jī)變量的概率分布往往是不知道的,如何確定隨機(jī)變量的概率分布或數(shù)字特征就是數(shù)理統(tǒng)計(jì)要解決的問題。在概率論中,我們所研究的隨機(jī)變量,它的分布都是假設(shè)已知的,在這一前提下去研究它的性質(zhì)、特點(diǎn)和規(guī)律性,例如求出它的數(shù)字特征,討論隨機(jī)數(shù)理統(tǒng)計(jì)是一個(gè)內(nèi)容十分豐富的數(shù)學(xué)分支。它既有嚴(yán)格的理論,更有極其廣泛的應(yīng)用。而且隨著科技的發(fā)展其研究內(nèi)容還在不斷地充實(shí)提高。數(shù)理統(tǒng)計(jì)的基本概念目前三頁\總數(shù)九十七頁\編于十八點(diǎn)
從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等等的記載,說明人們很早就開始了統(tǒng)計(jì)的工作.但是當(dāng)時(shí)的統(tǒng)計(jì),只是對有關(guān)事實(shí)的簡單記錄和整理,而沒有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷.目前四頁\總數(shù)九十七頁\編于十八點(diǎn)到了十九世紀(jì)末二十世紀(jì)初,隨著近代數(shù)學(xué)和概率論的發(fā)展,才真正誕生了數(shù)理統(tǒng)計(jì)學(xué)這門學(xué)科.數(shù)理統(tǒng)計(jì)學(xué)目前五頁\總數(shù)九十七頁\編于十八點(diǎn)
數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科.它是研究怎樣以有效的方式收集、整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對所考察的問題作出推斷和預(yù)測,直至為采取一定的決策和行動提供依據(jù)和建議.目前六頁\總數(shù)九十七頁\編于十八點(diǎn)對象:抽樣所獲得的數(shù)據(jù)(帶有隨機(jī)性)數(shù)理統(tǒng)計(jì)學(xué)研究的對象及任務(wù)任務(wù):如何有效地收集、整理和分析數(shù)據(jù),并對所觀察的問題做出推斷或預(yù)測,為采取的決策提供依據(jù)和建議。注:只允許我們對隨機(jī)現(xiàn)象進(jìn)行次數(shù)不多的觀察試驗(yàn),也就是說,我們獲得的只是局部觀察資料.目前七頁\總數(shù)九十七頁\編于十八點(diǎn)作出精確而可靠的結(jié)論.從總體上來說,數(shù)理統(tǒng)計(jì)可以分為兩大類:一類是如何科學(xué)地安排試驗(yàn),此部分內(nèi)容稱為描述統(tǒng)計(jì)學(xué)如:試驗(yàn)設(shè)計(jì)、抽樣方法。另一類是研究如何分析所獲得的隨機(jī)數(shù)據(jù),對所研究的問題進(jìn)行科學(xué)的、合理的估計(jì)和推斷,盡可能地為采取一定的決策提供依據(jù),這部分的內(nèi)容稱為推斷統(tǒng)計(jì)學(xué),如:參數(shù)估計(jì)、假設(shè)檢驗(yàn)等。我們主要討論有關(guān)推斷統(tǒng)計(jì)學(xué)中幾個(gè)最基本的問題。以獲取有效的隨機(jī)數(shù)據(jù)。目前八頁\總數(shù)九十七頁\編于十八點(diǎn)——
對隨機(jī)現(xiàn)象進(jìn)行觀測、試驗(yàn),以取得有代表性的觀測值——
對已取得的觀測值進(jìn)行整理、分析,作出推斷、決策,從而找出所研究的對象的規(guī)律性數(shù)理統(tǒng)計(jì)的分類描述統(tǒng)計(jì)學(xué)推斷統(tǒng)計(jì)學(xué)目前九頁\總數(shù)九十七頁\編于十八點(diǎn)參數(shù)估計(jì)(第6章)假設(shè)檢驗(yàn)(第7章)回歸分析(第8章)方差分析(第8章)
推斷統(tǒng)計(jì)學(xué)目前十頁\總數(shù)九十七頁\編于十八點(diǎn)100個(gè)樣品進(jìn)行強(qiáng)度測試,于是面臨下列幾個(gè)問題:例如
某廠生產(chǎn)一型號的合金材料,用隨機(jī)的方法選取1、估計(jì)這批合金材料的強(qiáng)度均值是多少?(參數(shù)的點(diǎn)估計(jì)問題)2、強(qiáng)度均值在什么范圍內(nèi)?(參數(shù)的區(qū)間估計(jì)問題)3、若規(guī)定強(qiáng)度均值不小于某個(gè)定值為合格,那么這批材料是否合格?(參數(shù)的假設(shè)檢驗(yàn)問題)4、這批合金的強(qiáng)度是否服從正態(tài)分布?5、若這批材料是由兩種不同工藝生產(chǎn)的,那么不同的工藝對合金強(qiáng)度有否影響?若有影響,那一種工藝生產(chǎn)的強(qiáng)度較好?(分布檢驗(yàn)問題)(方差分析問題)目前十一頁\總數(shù)九十七頁\編于十八點(diǎn)6、若這批合金由幾種原料用不同的比例合成,那么如何表達(dá)這批合金的強(qiáng)度與原料比例之間的關(guān)系?(回歸分析問題)我們依次討論參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)、假設(shè)檢驗(yàn)等內(nèi)容。首先我們討論數(shù)理統(tǒng)計(jì)中的一些基本概念。目前十二頁\總數(shù)九十七頁\編于十八點(diǎn)第5章樣本及其分布在數(shù)理統(tǒng)計(jì)中,我們所研究的隨機(jī)變量的分布往往是未知的,通過對隨機(jī)變量進(jìn)行多次獨(dú)立重復(fù)的試驗(yàn)和觀測,獲取數(shù)據(jù),利用實(shí)際觀測數(shù)據(jù)研究隨機(jī)變量的分布,對其分布函數(shù)、數(shù)字特征等進(jìn)行估計(jì)和推斷.本章作為數(shù)理統(tǒng)計(jì)基礎(chǔ),學(xué)習(xí)總體、樣本、統(tǒng)計(jì)量與抽樣分布等有關(guān)概念,以及有關(guān)正態(tài)總體的重要的抽樣分布定理.目前十三頁\總數(shù)九十七頁\編于十八點(diǎn)5.1簡單隨機(jī)樣本目前十四頁\總數(shù)九十七頁\編于十八點(diǎn)目前十五頁\總數(shù)九十七頁\編于十八點(diǎn)總體容量有限的稱為有限總體,
總體一個(gè)統(tǒng)計(jì)問題總有它明確的研究對象.1.總體研究對象的全體稱為總體(母體),總體中每個(gè)對象稱為個(gè)體.研究某批燈泡的質(zhì)量總體考察國產(chǎn)轎車的質(zhì)量§1總體和樣本不過在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每個(gè)個(gè)體的一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況.該批燈泡壽命的全體就是總體燈泡的壽命每公里的耗油量所有國產(chǎn)轎車每公里耗油量的全體就是總體這時(shí),每個(gè)個(gè)體具有的數(shù)量指標(biāo)的全體就是總體.稱總體中所含個(gè)體的數(shù)目為總體容量,總體容量無限的稱為無限總體.當(dāng)個(gè)體個(gè)數(shù)很大時(shí)通常把有限總體看作無限總體。目前十六頁\總數(shù)九十七頁\編于十八點(diǎn)那么,此總體就可用描述其壽命的隨機(jī)變量
X
或用其分布函數(shù)
F(x)表示.因此在理論上可以把總體與概率分布等同起來.概率分布是刻劃這種集體性質(zhì)最適當(dāng)?shù)墓ぞ?統(tǒng)計(jì)的任務(wù),是根據(jù)從總體中抽取的樣本,去推斷總體的性質(zhì).由于我們關(guān)心的是總體中的個(gè)體的某項(xiàng)指標(biāo)(如人的身高、體重,燈泡的壽命,汽車的耗油量…),從另一方面看:如研究某批燈泡的壽命時(shí),關(guān)心的數(shù)量指標(biāo)就是壽命,所謂總體的性質(zhì),無非就是這些指標(biāo)值集體的性質(zhì).我們用X和Y分別表示身高和體重,那么此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù)
F(x,y)來表示.總體概念的要旨:總體就是一個(gè)概率分布再如,若研究某地區(qū)中學(xué)生的營養(yǎng)狀況時(shí),關(guān)心的數(shù)量指標(biāo)是身高和體重,目前十七頁\總數(shù)九十七頁\編于十八點(diǎn)當(dāng)X為離散型時(shí),稱X的概率函數(shù)(分布列)為總體概率函數(shù)。當(dāng)X為連續(xù)型時(shí),稱X的概率密度為總體密度函數(shù)。當(dāng)總體分布為指數(shù)分布時(shí),稱為指數(shù)分布總體;當(dāng)總體分布為正態(tài)分布時(shí),稱為正態(tài)分布總體或簡稱正態(tài)總體等等.目前十八頁\總數(shù)九十七頁\編于十八點(diǎn)例如本市家庭的月收入X是個(gè)隨機(jī)變量,X服從什么在數(shù)理統(tǒng)計(jì)中總體X的分布永遠(yuǎn)是未知的,有足夠的理由可以認(rèn)為總體X服從某種類型的分布,但這個(gè)分布的參數(shù)還是未知的。分布事先是不清楚的,根據(jù)資料可確信即使但究竟取什么值還是未知的,由于總體X的分布是未知的,因此X的數(shù)字特征如均值、方差等往往也是一個(gè)未知的值。對于這些未知值可以根據(jù)有關(guān)數(shù)據(jù)來推測。目前十九頁\總數(shù)九十七頁\編于十八點(diǎn)壞性的試驗(yàn)更是不允許對整個(gè)總體進(jìn)行考察.考察某工廠生產(chǎn)的燈泡壽命考察某型號手機(jī)的質(zhì)量考察吸煙和患肺癌的關(guān)系在實(shí)際問題中,要考察整個(gè)總體往往是不可能的,因?yàn)樗枰馁M(fèi)太多的資源和太多的時(shí)間.有些破2、樣本與簡單樣本目前二十頁\總數(shù)九十七頁\編于十八點(diǎn)樣本中所包含的個(gè)體數(shù)目稱為樣本容量.但是,一旦取定一組樣本,得到的是n個(gè)具體的數(shù)x1,x2,…,xn
,按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察試驗(yàn)以獲得有關(guān)總體的信息.為推斷總體分布及各種特征,從國產(chǎn)轎車中抽5輛進(jìn)行耗油量試驗(yàn)樣本容量為
5樣本是隨機(jī)變量抽到哪5輛是隨機(jī)的!容量為
n的樣本可以看作一n維隨機(jī)變量(X1,X2,
…,Xn).所抽取的部分個(gè)體稱為樣本.這一抽取過程稱為抽樣,稱為樣本(X1,X2,…,Xn)的一組觀測值,簡稱樣本值.樣本的值域稱為樣本空間。目前二十一頁\總數(shù)九十七頁\編于十八點(diǎn)它要求抽取的樣本X1,X2,…,Xn
滿足下面兩點(diǎn):它可以用與總體同分布的n個(gè)相互獨(dú)立的隨機(jī)變量
X1,X2,…,Xn表示.2.代表性:Xi(i=1,2,…,n)與所考察的總體X同分布.為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.最常用的一種抽樣方法叫作簡單隨機(jī)抽樣,1.獨(dú)立性:X1,X2,…,Xn
是相互獨(dú)立的隨機(jī)變量
;抽樣的目的是為了對總體進(jìn)行統(tǒng)計(jì)推斷,由簡單隨機(jī)抽樣得到的樣本稱為簡單隨機(jī)樣本,
今后,說到
“X1,
…,Xn是取自某總體的樣本”時(shí),若不特別說明,就指簡單隨機(jī)樣本.則其簡單隨機(jī)樣本的聯(lián)合分布函數(shù)為F(
x1,x2,…,
xn
)=F(x1)F(x2)…F(xn)
簡單隨機(jī)樣本是應(yīng)用中最常見的情形,若總體
X
的分布函數(shù)為F(x),若總體
X
的概率密度為
f
(x),則其簡單隨機(jī)樣本的聯(lián)合概率密度為目前二十二頁\總數(shù)九十七頁\編于十八點(diǎn)求樣本(X1,X2,X3)的概率分布.ex1.設(shè)總體
X
~
B(1,p),即
P(X=x)=p
x(1-p)1-x,X
=
0
,1
.設(shè)X1,X2,
X3為X的一個(gè)樣本,解
x
i=0,1;
i=1,2,3.∴
(X1,X2,X3)的分布律P(X1=
x1,X2=
x2,X3=
x3)又∵
x1+
x2+
x3=0,1,2,3,
∴
P(X1=
x1,X2=
x2,X3=
x3)k=0,1,2,3.目前二十三頁\總數(shù)九十七頁\編于十八點(diǎn)ex2.設(shè)總體X服從均值為1/2的指數(shù)分布,X1,X2,X3,X4為來自X的樣本,求X1,X2,X3,X4的聯(lián)合概率密度和聯(lián)合分布函數(shù).解:X的概率密度為其分布函數(shù)為則X1,X2,X3,X4的聯(lián)合概率密度為:目前二十四頁\總數(shù)九十七頁\編于十八點(diǎn)比如我們從某班大學(xué)生中抽取10人測量身高,得到10個(gè)數(shù).我們只能觀察到隨機(jī)變量取的值而見不到隨機(jī)變量.它們是樣本取到的值而不是樣本.3.總體、樣本、樣本值的關(guān)系總體(理論分布)?
樣本樣本值統(tǒng)計(jì)是從手中已有的資料—樣本值,去推斷總體的情況
—總體分布F(x)的性質(zhì).總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,事實(shí)上,我們抽樣后得到的資料都是具體的、確定的值.因而可以由樣本值去推斷總體.???是總體的代表,含有總體的信息分散、復(fù)雜樣本是聯(lián)系二者的橋梁目前二十五頁\總數(shù)九十七頁\編于十八點(diǎn)其中
已知,
未知
,
則稱g(x1,…,xn)是一個(gè)統(tǒng)計(jì)量.一個(gè)有效的方法就是構(gòu)造一些樣本的函數(shù),若樣本函數(shù)g(x1,…,xn)中不含任何未知參數(shù),由樣本值去推斷總體情況,需要對樣本值進(jìn)行“加工”,1.統(tǒng)計(jì)量這種不含任何未知參數(shù)、完全由樣本決定的量稱為統(tǒng)計(jì)量
通過樣本函數(shù)把樣本中所含的(某一方面)的信息集中起來.定義設(shè)X1,X2,…,Xn
是來自總體
X
的容量為
n
的樣本,樣本的函數(shù)ex1.設(shè)
X1,X2,X3
是取自正態(tài)總體
X~(
,
2)
的一個(gè)樣本,問下列樣本函數(shù)中哪些是統(tǒng)計(jì)量,那些不是?×X1,X2+1,(X1+
X2
+
Xn)/3,Max{X1,X2,X3},
我們主要研究兩種基本的統(tǒng)計(jì)量:樣本矩和順序統(tǒng)計(jì)量§2統(tǒng)計(jì)量目前二十六頁\總數(shù)九十七頁\編于十八點(diǎn)幾個(gè)常見的統(tǒng)計(jì)量樣本均值樣本方差反映了總體均值的信息它反映了總體方差的信息樣本
k
階原點(diǎn)矩樣本
k
階中心矩
k=1,2,…它反映了總體k階矩的信息反映了總體k階中心矩的信息并稱他們相應(yīng)的觀測值樣本標(biāo)準(zhǔn)差它反映了總體標(biāo)準(zhǔn)差的信息
k=1,2,…仍分別為:
樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本k階原點(diǎn)矩、樣本k階中心矩.10樣本矩——統(tǒng)稱為樣本矩
目前二十七頁\總數(shù)九十七頁\編于十八點(diǎn)統(tǒng)計(jì)量的重要性質(zhì)設(shè)
X1,
X2,…,
Xn
是來自總體
X
的容量為
n
的樣本,若
X
有期望EX=和方差DX
=
2,
則
ex3.=
,(1)
E(S
2)
?
=
2,(2)
=
2/n;目前二十八頁\總數(shù)九十七頁\編于十八點(diǎn)2
順序統(tǒng)計(jì)量與極差設(shè)為樣本,為樣本值,且當(dāng)取值為時(shí),定義r.v.則稱統(tǒng)計(jì)量為順序統(tǒng)計(jì)量.其中,稱為極差目前二十九頁\總數(shù)九十七頁\編于十八點(diǎn)總體樣本統(tǒng)計(jì)量描述作出推斷隨機(jī)抽樣我們介紹了數(shù)理統(tǒng)計(jì)的基本概念.小結(jié)目前三十頁\總數(shù)九十七頁\編于十八點(diǎn)5.2抽樣分布目前三十一頁\總數(shù)九十七頁\編于十八點(diǎn)目前三十二頁\總數(shù)九十七頁\編于十八點(diǎn) 統(tǒng)計(jì)量的分布稱為抽樣分布。 在使用統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷時(shí)常需知道它的分布。當(dāng)總體的分布函數(shù)已知時(shí),抽樣分布是確定的,然而要求出統(tǒng)計(jì)量的精確分布,一般來說是困難的。 本節(jié)介紹來自正態(tài)總體的幾個(gè)常用統(tǒng)計(jì)量的分布。今后,我們將看到這些分布在數(shù)理統(tǒng)計(jì)中有重要的應(yīng)用。目前三十三頁\總數(shù)九十七頁\編于十八點(diǎn)(1)
正態(tài)分布則特別地,則若若~目前三十四頁\總數(shù)九十七頁\編于十八點(diǎn)(2)伽瑪分布(Г分布)如果連續(xù)型隨機(jī)變量X的密度函數(shù)為為函數(shù),則稱X服從參數(shù)是α,λ的伽瑪分布,記為X
~Γ(α,λ).定義其中,目前三十五頁\總數(shù)九十七頁\編于十八點(diǎn)函數(shù)具有以下性質(zhì):設(shè)X
~Γ(α,λ),可以證明:對于任意整數(shù)k,有從而有:目前三十六頁\總數(shù)九十七頁\編于十八點(diǎn)一、統(tǒng)計(jì)學(xué)的三大分布為了討論正態(tài)總體下的抽樣分布,先引入由正態(tài)分布導(dǎo)出的統(tǒng)計(jì)中的三個(gè)重要分布,即分布,分布,分布。
1、分布設(shè)是來自總體的樣本,則稱統(tǒng)計(jì)量(1)服從自由度為的分布,記為目前三十七頁\總數(shù)九十七頁\編于十八點(diǎn)此處,自由度是指(1)式右端包含獨(dú)立變量個(gè)數(shù)分布的概率密度為的圖形如圖5-1所示。(2)目前三十八頁\總數(shù)九十七頁\編于十八點(diǎn)圖5-1目前三十九頁\總數(shù)九十七頁\編于十八點(diǎn)此結(jié)論可推廣:設(shè)且相互獨(dú)立分布的可加性設(shè),并且獨(dú)立,則(證明略)則目前四十頁\總數(shù)九十七頁\編于十八點(diǎn)例設(shè)是總體的簡單隨機(jī)樣本,試確定c和d使得解:容易求得并求出n。并且它們是相互獨(dú)立的,由χ2分布的定義知由此可知,c=1/3,d=1/2,n=2。目前四十一頁\總數(shù)九十七頁\編于十八點(diǎn)若,則有分布的數(shù)學(xué)期望和方差因故因此又所以也相互獨(dú)立由于相互獨(dú)立于是目前四十二頁\總數(shù)九十七頁\編于十八點(diǎn)則稱點(diǎn)為的上分位點(diǎn)分布的分位點(diǎn)定義設(shè)有分布函數(shù)對給定的若有(6)當(dāng)有密度函數(shù)時(shí),式(6)可寫成(7)由上述定義得分布的上分位點(diǎn)為(8)目前四十三頁\總數(shù)九十七頁\編于十八點(diǎn)如圖5-2所示,對于不同的上分位點(diǎn)的值已制成表格,可以查用(參見附表5)。目前四十四頁\總數(shù)九十七頁\編于十八點(diǎn)圖5-2目前四十五頁\總數(shù)九十七頁\編于十八點(diǎn)例如對于,查得但該表只詳列到費(fèi)歇(R.A.Fisher)曾證明,當(dāng)充分大時(shí),近似地有
(9)其中是標(biāo)準(zhǔn)正態(tài)分布的上分位點(diǎn)。利用(8)式可以求得當(dāng)時(shí),分布的上分位點(diǎn)的近似值例如由(9)式可得(由更詳細(xì)的表得)目前四十六頁\總數(shù)九十七頁\編于十八點(diǎn)2、分布設(shè),,且獨(dú)立服從自由度為的分布則稱隨機(jī)變量(10)記為分布又稱為學(xué)生氏(student)分布分布的概率密度函數(shù)為(11)目前四十七頁\總數(shù)九十七頁\編于十八點(diǎn)圖5-3中畫出了的圖形。的圖形關(guān)于對稱,當(dāng)充分大時(shí),其圖形類似于標(biāo)準(zhǔn)正態(tài)變量概率密度的圖形。事實(shí)上,利用函數(shù)的性質(zhì)可得
故當(dāng)足夠大時(shí),分布近似于分布。但對于較小的,分布與分布相差較大(見附表3與附表4)(12)目前四十八頁\總數(shù)九十七頁\編于十八點(diǎn)圖5-3目前四十九頁\總數(shù)九十七頁\編于十八點(diǎn)的點(diǎn)為分布的上分位點(diǎn)。(見圖6-6)分布的分位點(diǎn)對于給定的,,稱滿足條件(13)圖6-6目前五十頁\總數(shù)九十七頁\編于十八點(diǎn)由分布上分位點(diǎn)的定義及圖形的對稱性知在時(shí),對于常用的的值,就用正態(tài)近似(14)分布的上分位點(diǎn)可自附表4查得。(15)目前五十一頁\總數(shù)九十七頁\編于十八點(diǎn)3.分布設(shè)且獨(dú)立,則稱隨機(jī)變量服從自由度為的分布記為(16)的概率密度為(17)目前五十二頁\總數(shù)九十七頁\編于十八點(diǎn)圖5-4中畫出了的圖形由定義可知,若則(18)圖5-4目前五十三頁\總數(shù)九十七頁\編于十八點(diǎn)分布的分位點(diǎn)對于給定的稱滿足條件(19)的點(diǎn)為分布的上分位點(diǎn)(圖5-5)圖5-5目前五十四頁\總數(shù)九十七頁\編于十八點(diǎn)容易證明等式:(20)利用這個(gè)等式,查附錄表,可以計(jì)算當(dāng)時(shí)的的值例如F分布的上分位點(diǎn)有表格可查(見附表6)目前五十五頁\總數(shù)九十七頁\編于十八點(diǎn)二、幾個(gè)常見的抽樣分布 研究數(shù)理統(tǒng)計(jì)的問題時(shí),往往需要知道所討論的統(tǒng)計(jì)量的分布。一般說來,要確定某個(gè)統(tǒng)計(jì)量的分布是困難,有的甚至是不可能的。然而,對于總體服從正態(tài)分布的情形已經(jīng)有了詳盡的研究。 下面我們討論服從正態(tài)分布的總體的統(tǒng)計(jì)量的分布。假設(shè)是來自正態(tài)總體的樣本,即它們是獨(dú)立同分布的皆服從分布樣本均值與樣本方差分別是目前五十六頁\總數(shù)九十七頁\編于十八點(diǎn)定理1設(shè)總體服從正態(tài)分布,(21)即則因?yàn)殡S機(jī)變量相互獨(dú)立且與總體服從相同的正態(tài)分布證所以由正態(tài)分布的性質(zhì)可知,它們的線性組合服從正態(tài)分布即目前五十七頁\總數(shù)九十七頁\編于十八點(diǎn)這個(gè)定理的證明從略,我們僅對自由度作一些說明定理2設(shè)總體服從正態(tài)分布則(1)樣本均值與樣本方差相互獨(dú)立;(2)統(tǒng)計(jì)量服從自由度的分布即(22)目前五十八頁\總數(shù)九十七頁\編于十八點(diǎn)雖然是個(gè)隨機(jī)變量的平方和,但是這些隨機(jī)變量不是相互獨(dú)立的。因?yàn)樗鼈兊暮秃愕扔诹悖河蓸颖痉讲畹亩x易知所以統(tǒng)計(jì)量由于受到一個(gè)條件的約束,所以自由度為目前五十九頁\總數(shù)九十七頁\編于十八點(diǎn) 上述兩定理是正態(tài)總體統(tǒng)計(jì)推斷的基礎(chǔ),因而是十分重要的,下面列舉其應(yīng)用.
目前六十頁\總數(shù)九十七頁\編于十八點(diǎn)ex1.設(shè)是來自的樣本,則統(tǒng)計(jì)量(23)由定理1知,統(tǒng)計(jì)量又由定理2知,統(tǒng)計(jì)量因?yàn)榕c相互獨(dú)立與也相互獨(dú)立所以證于是,由分布的定義可知,統(tǒng)計(jì)量目前六十一頁\總數(shù)九十七頁\編于十八點(diǎn)ex2.設(shè)來自,是來自的兩個(gè)獨(dú)立樣本,記則統(tǒng)計(jì)量(24)目前六十二頁\總數(shù)九十七頁\編于十八點(diǎn)由定理1可知,統(tǒng)計(jì)量證且與相互獨(dú)立由正態(tài)分布的性質(zhì)知即又由定理2知:目前六十三頁\總數(shù)九十七頁\編于十八點(diǎn)因?yàn)榕c相互獨(dú)立,與相互獨(dú)立所以統(tǒng)計(jì)量與也相互獨(dú)立因?yàn)榕c相互獨(dú)立,所以由分布的可加性可知統(tǒng)計(jì)量于是,由分布定義可知,統(tǒng)計(jì)量目前六十四頁\總數(shù)九十七頁\編于十八點(diǎn)由假設(shè),、相互獨(dú)立,則由分布的定義ex3.(續(xù)上例)記則(25)證由定理2知注:若兩個(gè)正態(tài)分布的方差與不相等,則統(tǒng)計(jì)量目前六十五頁\總數(shù)九十七頁\編于十八點(diǎn) 本節(jié)所介紹的幾個(gè)分布以及幾個(gè)重要結(jié)論,在下面各章中都起著重要的作用。應(yīng)注意,它們都是在總體為正態(tài)這一基本假定下得到的。目前六十六頁\總數(shù)九十七頁\編于十八點(diǎn)ex4.在總體中,隨機(jī)地抽取一個(gè)容量為36的樣本,求樣本均值落在50.8到53.8之間的概率.解故目前六十七頁\總數(shù)九十七頁\編于十八點(diǎn)ex5.設(shè)總體X的概率密度函數(shù)為為總體的樣本,求(1)的數(shù)學(xué)期望與方差(2)(3)解(1)目前六十八頁\總數(shù)九十七頁\編于十八點(diǎn)(近似),(3)由中心極限定理(2)目前六十九頁\總數(shù)九十七頁\編于十八點(diǎn)容量為10與15的兩個(gè)獨(dú)立樣本,求它們的均值差大于0.3的概率。ex6.
設(shè)總體,分別從X中抽取解
設(shè)與分別表示容量為10與15的兩個(gè)樣本的均值,則又由于與相互獨(dú)立,從而有目前七十頁\總數(shù)九十七頁\編于十八點(diǎn)
因此??Za-Za查標(biāo)準(zhǔn)正態(tài)分布表:目前七十一頁\總數(shù)九十七頁\編于十八點(diǎn)解ex7.目前七十二頁\總數(shù)九十七頁\編于十八點(diǎn)目前七十三頁\總數(shù)九十七頁\編于十八點(diǎn)目前七十四頁\總數(shù)九十七頁\編于十八點(diǎn)三、直方圖直方圖與經(jīng)驗(yàn)分布函數(shù)如前所述,數(shù)理統(tǒng)計(jì)所研究的實(shí)際問題(總體)的分布一般來說是未知的,需要通過樣本來推斷.但如果對總體一無所知,那么,做出推斷的可信度一般也極為有限.在很多情況下,我們往往可以通過具體的應(yīng)用背景或以往的經(jīng)驗(yàn),再通過觀察樣本觀測值的分布情況,對總體的分布形式有個(gè)大致了解.觀察樣本觀測值的分布規(guī)律,了解總體X的概率密度和分布函數(shù),常用直方圖和經(jīng)驗(yàn)分布函數(shù).目前七十五頁\總數(shù)九十七頁\編于十八點(diǎn)1.直方圖直方圖是對一組數(shù)據(jù)x1,x2,...,xn的分布情況的圖形描述.將數(shù)據(jù)的取值范圍分成若干區(qū)間(一般是等間隔的),在等間隔的情況,每個(gè)區(qū)間的長度稱為組距.考察這些數(shù)據(jù)落入每一個(gè)小區(qū)間的頻數(shù)和頻率,在每一個(gè)區(qū)間上畫一個(gè)矩形,它的寬度是組距,高度可以是頻數(shù)、頻率或頻率/組距,所得直方圖分別稱為頻數(shù)直方圖、頻率直方圖和密度直方圖.圖5-6密度直方圖目前七十六頁\總數(shù)九十七頁\編于十八點(diǎn)如果數(shù)據(jù)x1,x2,...,xn是來自連續(xù)總體X的樣本觀測值,其密度直方圖中,每一個(gè)矩形的面積恰好是觀測數(shù)據(jù)落入對應(yīng)區(qū)間的頻率,這種密度直方圖可以用來估計(jì)總體的概率密度(用密度直方圖的頂部折線估計(jì)X的概率密度曲線).組距對直方圖的形態(tài)有很大的影響,組距太小或太大,直方圖反映概率密度的形態(tài)就不夠準(zhǔn)確.目前七十七頁\總數(shù)九十七頁\編于十八點(diǎn)作直方圖的步驟如下:1找出樣本觀測值中的最小值與最大值,分別記作與,即2適當(dāng)選取略小于的數(shù)與略大于的數(shù),并用分點(diǎn)把區(qū)間分成個(gè)子區(qū)間
第個(gè)子區(qū)間的長度為目前七十八頁\總數(shù)九十七頁\編于十八點(diǎn) 此外,為了方便起見,分點(diǎn)應(yīng)比樣本觀測值多取一位小數(shù)。各子區(qū)間的長度可以相等,也可以不等;若使各子區(qū)間的長度相等,則有子區(qū)間的個(gè)數(shù)一般取為8至15個(gè),太多則由于頻率的隨機(jī)擺動而使分布顯得雜亂,太少則難于顯示分布的特征。3把所有樣本觀測值逐個(gè)分到各子區(qū)間內(nèi),并計(jì)算樣本觀測值落在各子區(qū)間內(nèi)的頻數(shù)及頻率目前七十九頁\總數(shù)九十七頁\編于十八點(diǎn)4在軸上截取各子區(qū)間,并以各子區(qū)間為底,以為高作小矩形,各個(gè)小矩形的面積就等于樣本觀測值落在該子區(qū)間內(nèi)的頻率,即所有小矩形的面積的和這樣作出的所有小矩形就構(gòu)成了直方圖。因?yàn)闃颖救萘砍浞执髸r(shí),隨機(jī)變量落在各個(gè)子區(qū)間內(nèi)的頻率近似等于其概率即所以直方圖大致地描述了總體的概率分布。目前八十頁\總數(shù)九十七頁\編于十八點(diǎn)ex8.測量100個(gè)某種機(jī)械零件的質(zhì)量,得到樣本觀測值如下(單位:g)
246251259254246253237252250251249244249244243246256247252252250247255249247252252242245240260263254240255250256246249253246255244245257252250249255248258242252259249244251250241253250265247249253247248251251249246250252256245254258248255251249252254246250251247253252255254247252257258247252264248244寫出零件質(zhì)量的頻率分布表并作直方圖。目前八十一頁\總數(shù)九十七頁\編于十八點(diǎn)解因?yàn)闃颖居^測中最小值為237,最大值為265,所以我們把數(shù)據(jù)的分布區(qū)間確定為(236.5,266.5)并把這個(gè)區(qū)間等分為10個(gè)子區(qū)間(236.5,239.5),(239.5,242.5),…,(263.5,266.5)由此得到零件質(zhì)量的頻率分布表:
零件質(zhì)量/頻數(shù)頻率
236.5~239.510.01239.5~242.550.05242.5~245.590.09245.5~248.5190.19248.5~251.5240.24251.5~254.5220.22254.5~257.5110.11257.5~260.560.06260.5~263.510.01263.5~266.520.02總計(jì)1001.00目前八十二頁\總數(shù)九十七頁\編于十八點(diǎn)直方圖如圖5-7所示圖5-7目前八十三頁\總數(shù)九十七頁\編于十八點(diǎn)一個(gè)合適的分組是希望密度直方圖的形態(tài)接近總體的概率密度函數(shù)的形態(tài).手工計(jì)算常取組數(shù)等于左右,一些統(tǒng)計(jì)軟件會根據(jù)樣本容量和樣本的取值范圍自動確定一個(gè)合適的分組方式,畫出各種漂亮的直方圖.目前八十四頁\總數(shù)九十七頁\編于十八點(diǎn)ex9.從某高校一年學(xué)生的“高等數(shù)學(xué)”課程考試成績中,隨機(jī)抽取60名學(xué)生的成績?nèi)缦拢涸嚴(yán)肊xcel的“數(shù)據(jù)分析”功能作學(xué)生成績的密度直方圖,并通過直方圖了解學(xué)生成績的分布情況.7669717769718369858586777495668766516873776266739379638787548057727258767276697181
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年變色玻璃幕墻廣告牌企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 2025-2030年塑木兒童游樂設(shè)施行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報(bào)告
- 2025-2030年新型鉆井液添加劑企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 2025-2030年原產(chǎn)地核桃直供平臺行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 二零二五年度蘇州房產(chǎn)買賣稅費(fèi)結(jié)算合同
- 塑料家用器具成型工藝考核試卷
- 干部休養(yǎng)所養(yǎng)老服務(wù)質(zhì)量提升措施與效果考核試卷
- 國際商務(wù)代理文化差異適應(yīng)考核試卷
- 辦事處環(huán)保合作協(xié)議(2025年度)管理規(guī)范
- 康復(fù)輔具維護(hù)與保養(yǎng)知識考核試卷
- 托育園老師培訓(xùn)
- 人教版八年級英語上冊Unit1-10完形填空閱讀理解專項(xiàng)訓(xùn)練
- 脊柱外科護(hù)理進(jìn)修心得
- 4.1中國特色社會主義進(jìn)入新時(shí)代+課件-2024-2025學(xué)年高中政治統(tǒng)編版必修一中國特色社會主義
- 護(hù)理工作中的人文關(guān)懷
- 完整液壓系統(tǒng)課件
- 2024年山東省青島市中考道德與法治試題卷(含答案及解析)
- 生產(chǎn)制造工藝流程規(guī)范與作業(yè)指導(dǎo)書
- 班級建設(shè)方案中等職業(yè)學(xué)校班主任能力大賽
- T-TJSG 001-2024 天津市社會組織社會工作專業(yè)人員薪酬指導(dǎo)方案
- 芯片設(shè)計(jì)基礎(chǔ)知識題庫100道及答案(完整版)
評論
0/150
提交評論