第五章 樣本及其分布_第1頁(yè)
第五章 樣本及其分布_第2頁(yè)
第五章 樣本及其分布_第3頁(yè)
第五章 樣本及其分布_第4頁(yè)
第五章 樣本及其分布_第5頁(yè)
已閱讀5頁(yè),還剩91頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中南大學(xué)數(shù)學(xué)公共課程之

數(shù)理統(tǒng)計(jì)郭孔華Telmail:guokonghua@163中南大學(xué)數(shù)學(xué)科學(xué)與計(jì)算技術(shù)學(xué)院編輯課件變量函數(shù)的分布等。但是對(duì)一個(gè)實(shí)際問(wèn)題,隨機(jī)變量的概率分布往往是不知道的,如何確定隨機(jī)變量的概率分布或數(shù)字特征就是數(shù)理統(tǒng)計(jì)要解決的問(wèn)題。在概率論中,我們所研究的隨機(jī)變量,它的分布都是假設(shè)的,在這一前提下去研究它的性質(zhì)、特點(diǎn)和規(guī)律性,例如求出它的數(shù)字特征,討論隨機(jī)數(shù)理統(tǒng)計(jì)是一個(gè)內(nèi)容十分豐富的數(shù)學(xué)分支。它既有嚴(yán)格的理論,更有極其廣泛的應(yīng)用。而且隨著科技的開(kāi)展其研究?jī)?nèi)容還在不斷地充實(shí)提高。數(shù)理統(tǒng)計(jì)的根本概念編輯課件

從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等等的記載,說(shuō)明人們很早就開(kāi)始了統(tǒng)計(jì)的工作.但是當(dāng)時(shí)的統(tǒng)計(jì),只是對(duì)有關(guān)事實(shí)的簡(jiǎn)單記錄和整理,而沒(méi)有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷.編輯課件到了十九世紀(jì)末二十世紀(jì)初,隨著近代數(shù)學(xué)和概率論的開(kāi)展,才真正誕生了數(shù)理統(tǒng)計(jì)學(xué)這門學(xué)科.數(shù)理統(tǒng)計(jì)學(xué)編輯課件

數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科.它是研究怎樣以有效的方式收集、整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對(duì)所考察的問(wèn)題作出推斷和預(yù)測(cè),直至為采取一定的決策和行動(dòng)提供依據(jù)和建議.編輯課件對(duì)象:抽樣所獲得的數(shù)據(jù)(帶有隨機(jī)性)數(shù)理統(tǒng)計(jì)學(xué)研究的對(duì)象及任務(wù)任務(wù):如何有效地收集、整理和分析數(shù)據(jù),并對(duì)所觀察的問(wèn)題做出推斷或預(yù)測(cè),為采取的決策提供依據(jù)和建議。注:只允許我們對(duì)隨機(jī)現(xiàn)象進(jìn)行次數(shù)不多的觀察試驗(yàn),也就是說(shuō),我們獲得的只是局部觀察資料.編輯課件作出精確而可靠的結(jié)論.從總體上來(lái)說(shuō),數(shù)理統(tǒng)計(jì)可以分為兩大類:一類是如何科學(xué)地安排試驗(yàn),此局部?jī)?nèi)容稱為描述統(tǒng)計(jì)學(xué)如:試驗(yàn)設(shè)計(jì)、抽樣方法。另一類是研究如何分析所獲得的隨機(jī)數(shù)據(jù),對(duì)所研究的問(wèn)題進(jìn)行科學(xué)的、合理的估計(jì)和推斷,盡可能地為采取一定的決策提供依據(jù),這局部的內(nèi)容稱為推斷統(tǒng)計(jì)學(xué),如:參數(shù)估計(jì)、假設(shè)檢驗(yàn)等。我們主要討論有關(guān)推斷統(tǒng)計(jì)學(xué)中幾個(gè)最根本的問(wèn)題。以獲取有效的隨機(jī)數(shù)據(jù)。編輯課件——

對(duì)隨機(jī)現(xiàn)象進(jìn)行觀測(cè)、試驗(yàn),以取得有代表性的觀測(cè)值——

對(duì)已取得的觀測(cè)值進(jìn)行整理、分析,作出推斷、決策,從而找出所研究的對(duì)象的規(guī)律性數(shù)理統(tǒng)計(jì)的分類描述統(tǒng)計(jì)學(xué)推斷統(tǒng)計(jì)學(xué)編輯課件參數(shù)估計(jì)(第6章)假設(shè)檢驗(yàn)(第7章)回歸分析(第8章)方差分析(第8章)

推斷統(tǒng)計(jì)學(xué)編輯課件100個(gè)樣品進(jìn)行強(qiáng)度測(cè)試,于是面臨以下幾個(gè)問(wèn)題:例如

某廠生產(chǎn)一型號(hào)的合金材料,用隨機(jī)的方法選取1、估計(jì)這批合金材料的強(qiáng)度均值是多少?(參數(shù)的點(diǎn)估計(jì)問(wèn)題〕2、強(qiáng)度均值在什么范圍內(nèi)?(參數(shù)的區(qū)間估計(jì)問(wèn)題〕3、假設(shè)規(guī)定強(qiáng)度均值不小于某個(gè)定值為合格,那么這批材料是否合格?(參數(shù)的假設(shè)檢驗(yàn)問(wèn)題〕4、這批合金的強(qiáng)度是否服從正態(tài)分布?5、假設(shè)這批材料是由兩種不同工藝生產(chǎn)的,那么不同的工藝對(duì)合金強(qiáng)度有否影響?假設(shè)有影響,那一種工藝生產(chǎn)的強(qiáng)度較好?(分布檢驗(yàn)問(wèn)題〕(方差分析問(wèn)題〕編輯課件6、假設(shè)這批合金由幾種原料用不同的比例合成,那么如何表達(dá)這批合金的強(qiáng)度與原料比例之間的關(guān)系?(回歸分析問(wèn)題〕我們依次討論參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)、假設(shè)檢驗(yàn)等內(nèi)容。首先我們討論數(shù)理統(tǒng)計(jì)中的一些根本概念。編輯課件第5章樣本及其分布在數(shù)理統(tǒng)計(jì)中,我們所研究的隨機(jī)變量的分布往往是未知的,通過(guò)對(duì)隨機(jī)變量進(jìn)行屢次獨(dú)立重復(fù)的試驗(yàn)和觀測(cè),獲取數(shù)據(jù),利用實(shí)際觀測(cè)數(shù)據(jù)研究隨機(jī)變量的分布,對(duì)其分布函數(shù)、數(shù)字特征等進(jìn)行估計(jì)和推斷.本章作為數(shù)理統(tǒng)計(jì)根底,學(xué)習(xí)總體、樣本、統(tǒng)計(jì)量與抽樣分布等有關(guān)概念,以及有關(guān)正態(tài)總體的重要的抽樣分布定理.編輯課件5.1簡(jiǎn)單隨機(jī)樣本編輯課件編輯課件總體容量有限的稱為有限總體,

總體一個(gè)統(tǒng)計(jì)問(wèn)題總有它明確的研究對(duì)象.1.總體研究對(duì)象的全體稱為總體(母體),總體中每個(gè)對(duì)象稱為個(gè)體.研究某批燈泡的質(zhì)量總體考察國(guó)產(chǎn)轎車的質(zhì)量§1總體和樣本不過(guò)在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每個(gè)個(gè)體的一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況.該批燈泡壽命的全體就是總體燈泡的壽命每公里的耗油量所有國(guó)產(chǎn)轎車每公里耗油量的全體就是總體這時(shí),每個(gè)個(gè)體具有的數(shù)量指標(biāo)的全體就是總體.稱總體中所含個(gè)體的數(shù)目為總體容量,總體容量無(wú)限的稱為無(wú)限總體.當(dāng)個(gè)體個(gè)數(shù)很大時(shí)通常把有限總體看作無(wú)限總體。編輯課件那么,此總體就可用描述其壽命的隨機(jī)變量

X

或用其分布函數(shù)

F(x)表示.因此在理論上可以把總體與概率分布等同起來(lái).概率分布是刻劃這種集體性質(zhì)最適當(dāng)?shù)墓ぞ?統(tǒng)計(jì)的任務(wù),是根據(jù)從總體中抽取的樣本,去推斷總體的性質(zhì).由于我們關(guān)心的是總體中的個(gè)體的某項(xiàng)指標(biāo)(如人的身高、體重,燈泡的壽命,汽車的耗油量…),從另一方面看:如研究某批燈泡的壽命時(shí),關(guān)心的數(shù)量指標(biāo)就是壽命,所謂總體的性質(zhì),無(wú)非就是這些指標(biāo)值集體的性質(zhì).我們用X和Y分別表示身高和體重,那么此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù)

F(x,y)來(lái)表示.總體概念的要旨:總體就是一個(gè)概率分布再如,假設(shè)研究某地區(qū)中學(xué)生的營(yíng)養(yǎng)狀況時(shí),關(guān)心的數(shù)量指標(biāo)是身高和體重,編輯課件當(dāng)X為離散型時(shí),稱X的概率函數(shù)〔分布列〕為總體概率函數(shù)。當(dāng)X為連續(xù)型時(shí),稱X的概率密度為總體密度函數(shù)。當(dāng)總體分布為指數(shù)分布時(shí),稱為指數(shù)分布總體;當(dāng)總體分布為正態(tài)分布時(shí),稱為正態(tài)分布總體或簡(jiǎn)稱正態(tài)總體等等.編輯課件例如本市家庭的月收入X是個(gè)隨機(jī)變量,X服從什么在數(shù)理統(tǒng)計(jì)中總體X的分布永遠(yuǎn)是未知的,有足夠的理由可以認(rèn)為總體X服從某種類型的分布,但這個(gè)分布的參數(shù)還是未知的。分布事先是不清楚的,根據(jù)資料可確信即使但究竟取什么值還是未知的,由于總體X的分布是未知的,因此X的數(shù)字特征如均值、方差等往往也是一個(gè)未知的值。對(duì)于這些未知值可以根據(jù)有關(guān)數(shù)據(jù)來(lái)推測(cè)。編輯課件壞性的試驗(yàn)更是不允許對(duì)整個(gè)總體進(jìn)行考察.考察某工廠生產(chǎn)的燈泡壽命考察某型號(hào)的質(zhì)量考察吸煙和患肺癌的關(guān)系在實(shí)際問(wèn)題中,要考察整個(gè)總體往往是不可能的,因?yàn)樗枰奶嗟馁Y源和太多的時(shí)間.有些破2、樣本與簡(jiǎn)單樣本編輯課件樣本中所包含的個(gè)體數(shù)目稱為樣本容量.但是,一旦取定一組樣本,得到的是n個(gè)具體的數(shù)x1,x2,…,xn

,按一定規(guī)那么從總體中抽取假設(shè)干個(gè)體進(jìn)行觀察試驗(yàn)以獲得有關(guān)總體的信息.為推斷總體分布及各種特征,從國(guó)產(chǎn)轎車中抽5輛進(jìn)行耗油量試驗(yàn)樣本容量為

5樣本是隨機(jī)變量抽到哪5輛是隨機(jī)的!容量為

n的樣本可以看作一n維隨機(jī)變量(X1,X2,

…,Xn).所抽取的局部個(gè)體稱為樣本.這一抽取過(guò)程稱為抽樣,稱為樣本(X1,X2,…,Xn)的一組觀測(cè)值,簡(jiǎn)稱樣本值.樣本的值域稱為樣本空間。編輯課件它要求抽取的樣本X1,X2,…,Xn

滿足下面兩點(diǎn):它可以用與總體同分布的n個(gè)相互獨(dú)立的隨機(jī)變量

X1,X2,…,Xn表示.2.代表性:Xi(i=1,2,…,n)與所考察的總體X同分布.為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.最常用的一種抽樣方法叫作簡(jiǎn)單隨機(jī)抽樣,1.獨(dú)立性:X1,X2,…,Xn

是相互獨(dú)立的隨機(jī)變量

;抽樣的目的是為了對(duì)總體進(jìn)行統(tǒng)計(jì)推斷,由簡(jiǎn)單隨機(jī)抽樣得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,今后,說(shuō)到“X1,…,Xn是取自某總體的樣本〞時(shí),假設(shè)不特別說(shuō)明,就指簡(jiǎn)單隨機(jī)樣本.那么其簡(jiǎn)單隨機(jī)樣本的聯(lián)合分布函數(shù)為F(

x1,x2,…,

xn

)=F(x1)F(x2)…F(xn)

簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見(jiàn)的情形,假設(shè)總體X的分布函數(shù)為F(x),假設(shè)總體X的概率密度為f(x),那么其簡(jiǎn)單隨機(jī)樣本的聯(lián)合概率密度為編輯課件求樣本(X1,X2,X3)的概率分布.ex1.設(shè)總體

X

~

B(1,p),即

P(X=x)=p

x(1-p)1-x,X

=

0

,1

.設(shè)X1,X2,

X3為X的一個(gè)樣本,解

x

i=0,1;

i=1,2,3.∴

(X1,X2,X3)的分布律P(X1=

x1,X2=

x2,X3=

x3)又∵

x1+

x2+

x3=0,1,2,3,

P(X1=

x1,X2=

x2,X3=

x3)k=0,1,2,3.編輯課件ex2.設(shè)總體X服從均值為1/2的指數(shù)分布,X1,X2,X3,X4為來(lái)自X的樣本,求X1,X2,X3,X4的聯(lián)合概率密度和聯(lián)合分布函數(shù).解:X的概率密度為其分布函數(shù)為那么X1,X2,X3,X4的聯(lián)合概率密度為:編輯課件比方我們從某班大學(xué)生中抽取10人測(cè)量身高,得到10個(gè)數(shù).我們只能觀察到隨機(jī)變量取的值而見(jiàn)不到隨機(jī)變量.它們是樣本取到的值而不是樣本.3.總體、樣本、樣本值的關(guān)系總體(理論分布)?

樣本樣本值統(tǒng)計(jì)是從手中已有的資料—

樣本值,去推斷總體的情況

—總體分布F(x)的性質(zhì).總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,事實(shí)上,我們抽樣后得到的資料都是具體的、確定的值.因而可以由樣本值去推斷總體.???是總體的代表,含有總體的信息分散、復(fù)雜樣本是聯(lián)系二者的橋梁編輯課件其中,未知,那么稱g(x1,…,xn)是一個(gè)統(tǒng)計(jì)量.一個(gè)有效的方法就是構(gòu)造一些樣本的函數(shù),假設(shè)樣本函數(shù)g(x1,…,xn)中不含任何未知參數(shù),由樣本值去推斷總體情況,需要對(duì)樣本值進(jìn)行“加工〞,1.統(tǒng)計(jì)量這種不含任何未知參數(shù)、完全由樣本決定的量稱為統(tǒng)計(jì)量

通過(guò)樣本函數(shù)把樣本中所含的(某一方面)的信息集中起來(lái).定義設(shè)X1,X2,…,Xn

是來(lái)自總體

X

的容量為

n

的樣本,樣本的函數(shù)ex1.設(shè)

X1,X2,X3

是取自正態(tài)總體

X~(

,

2)

的一個(gè)樣本,問(wèn)以下樣本函數(shù)中哪些是統(tǒng)計(jì)量,那些不是?×X1,X2+1,(X1+

X2

+

Xn)/3,Max{X1,X2,X3},

我們主要研究?jī)煞N根本的統(tǒng)計(jì)量:樣本矩和順序統(tǒng)計(jì)量§2統(tǒng)計(jì)量編輯課件幾個(gè)常見(jiàn)的統(tǒng)計(jì)量樣本均值樣本方差反映了總體均值的信息它反映了總體方差的信息樣本

k

階原點(diǎn)矩樣本

k

階中心矩

k=1,2,…它反映了總體k階矩的信息反映了總體k階中心矩的信息并稱他們相應(yīng)的觀測(cè)值樣本標(biāo)準(zhǔn)差它反映了總體標(biāo)準(zhǔn)差的信息

k=1,2,…仍分別為:

樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本k階原點(diǎn)矩、樣本k階中心矩.10樣本矩——統(tǒng)稱為樣本矩

編輯課件統(tǒng)計(jì)量的重要性質(zhì)設(shè)

X1,

X2,…,

Xn

是來(lái)自總體

X

的容量為

n

的樣本,假設(shè)X有期望EX=和方差DX=2,

那么

ex3.=

,(1)

E(S

2)

?

=

2,(2)

=

2/n;編輯課件2

順序統(tǒng)計(jì)量與極差設(shè)為樣本,為樣本值,且當(dāng)取值為時(shí),定義r.v.那么稱統(tǒng)計(jì)量為順序統(tǒng)計(jì)量.其中,稱為極差編輯課件總體樣本統(tǒng)計(jì)量描述作出推斷隨機(jī)抽樣我們介紹了數(shù)理統(tǒng)計(jì)的根本概念.小結(jié)編輯課件5.2抽樣分布編輯課件編輯課件 統(tǒng)計(jì)量的分布稱為抽樣分布。 在使用統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷時(shí)常需知道它的分布。當(dāng)總體的分布函數(shù)時(shí),抽樣分布是確定的,然而要求出統(tǒng)計(jì)量的精確分布,一般來(lái)說(shuō)是困難的。 本節(jié)介紹來(lái)自正態(tài)總體的幾個(gè)常用統(tǒng)計(jì)量的分布。今后,我們將看到這些分布在數(shù)理統(tǒng)計(jì)中有重要的應(yīng)用。編輯課件(1)

正態(tài)分布那么特別地,那么假設(shè)假設(shè)~編輯課件(2)伽瑪分布(Г分布)如果連續(xù)型隨機(jī)變量X的密度函數(shù)為為函數(shù),那么稱X服從參數(shù)是α,λ的伽瑪分布,記為X~Γ(α,λ).定義其中,編輯課件

函數(shù)具有以下性質(zhì):設(shè)X

~Γ(α,λ),可以證明:對(duì)于任意整數(shù)k,有從而有:編輯課件一、統(tǒng)計(jì)學(xué)的三大分布為了討論正態(tài)總體下的抽樣分布,先引入由正態(tài)分布導(dǎo)出的統(tǒng)計(jì)中的三個(gè)重要分布,即分布,分布,分布。

1、分布設(shè)是來(lái)自總體的樣本,則稱統(tǒng)計(jì)量(1)服從自由度為的分布,記為編輯課件此處,自由度是指〔1〕式右端包含獨(dú)立變量個(gè)數(shù)分布的概率密度為的圖形如圖5-1所示?!?〕編輯課件圖5-1編輯課件此結(jié)論可推廣:設(shè)且相互獨(dú)立分布的可加性設(shè),并且獨(dú)立,則〔證明略〕那么編輯課件例設(shè)是總體的簡(jiǎn)單隨機(jī)樣本,試確定c和d使得解:容易求得并求出n。并且它們是相互獨(dú)立的,由χ2分布的定義知由此可知,c=1/3,d=1/2,n=2。編輯課件若,則有分布的數(shù)學(xué)期望和方差因故因此又所以也相互獨(dú)立由于相互獨(dú)立于是編輯課件則稱點(diǎn)為的上分位點(diǎn)分布的分位點(diǎn)定義設(shè)有分布函數(shù)對(duì)給定的若有(6)當(dāng)有密度函數(shù)時(shí),式(6)可寫成(7)由上述定義得分布的上分位點(diǎn)為(8)編輯課件如圖5-2所示,對(duì)于不同的上分位點(diǎn)的值已制成表格,可以查用(參見(jiàn)附表5)。編輯課件圖5-2編輯課件例如對(duì)于,查得但該表只詳列到費(fèi)歇(R.A.Fisher)曾證明,當(dāng)充分大時(shí),近似地有

(9)其中是標(biāo)準(zhǔn)正態(tài)分布的上分位點(diǎn)。利用(8)式可以求得當(dāng)時(shí),分布的上分位點(diǎn)的近似值例如由(9)式可得(由更詳細(xì)的表得)編輯課件2、分布設(shè),,且獨(dú)立服從自由度為的分布則稱隨機(jī)變量(10)記為分布又稱為學(xué)生氏(student)分布分布的概率密度函數(shù)為(11)編輯課件圖5-3中畫出了的圖形。的圖形關(guān)于對(duì)稱,當(dāng)充分大時(shí),其圖形類似于標(biāo)準(zhǔn)正態(tài)變量概率密度的圖形。事實(shí)上,利用函數(shù)的性質(zhì)可得

故當(dāng)足夠大時(shí),分布近似于分布。但對(duì)于較小的,分布與分布相差較大(見(jiàn)附表3與附表4)(12)編輯課件圖5-3編輯課件的點(diǎn)為分布的上分位點(diǎn)。(見(jiàn)圖6-6)分布的分位點(diǎn)對(duì)于給定的,,稱滿足條件(13)圖6-6編輯課件由分布上分位點(diǎn)的定義及圖形的對(duì)稱性知在時(shí),對(duì)于常用的的值,就用正態(tài)近似〔14〕分布的上分位點(diǎn)可自附表4查得?!?5〕編輯課件3.分布設(shè)且獨(dú)立,則稱隨機(jī)變量服從自由度為的分布記為〔16〕的概率密度為〔17〕編輯課件圖5-4中畫出了的圖形由定義可知,若則(18)圖5-4編輯課件分布的分位點(diǎn)對(duì)于給定的稱滿足條件〔19〕的點(diǎn)為分布的上分位點(diǎn)(圖5-5)圖5-5編輯課件容易證明等式:〔20〕利用這個(gè)等式,查附錄表,可以計(jì)算當(dāng)時(shí)的的值例如F分布的上分位點(diǎn)有表格可查〔見(jiàn)附表6〕編輯課件二、幾個(gè)常見(jiàn)的抽樣分布 研究數(shù)理統(tǒng)計(jì)的問(wèn)題時(shí),往往需要知道所討論的統(tǒng)計(jì)量的分布。一般說(shuō)來(lái),要確定某個(gè)統(tǒng)計(jì)量的分布是困難,有的甚至是不可能的。然而,對(duì)于總體服從正態(tài)分布的情形已經(jīng)有了詳盡的研究。 下面我們討論服從正態(tài)分布的總體的統(tǒng)計(jì)量的分布。假設(shè)是來(lái)自正態(tài)總體的樣本,即它們是獨(dú)立同分布的皆服從分布樣本均值與樣本方差分別是編輯課件定理1設(shè)總體服從正態(tài)分布,〔21〕即那么因?yàn)殡S機(jī)變量相互獨(dú)立且與總體服從相同的正態(tài)分布證所以由正態(tài)分布的性質(zhì)可知,它們的線性組合服從正態(tài)分布即編輯課件這個(gè)定理的證明從略,我們僅對(duì)自由度作一些說(shuō)明定理2設(shè)總體服從正態(tài)分布則(1)樣本均值與樣本方差相互獨(dú)立;(2)統(tǒng)計(jì)量服從自由度的分布即(22)編輯課件雖然是個(gè)隨機(jī)變量的平方和,但是這些隨機(jī)變量不是相互獨(dú)立的。因?yàn)樗鼈兊暮秃愕扔诹悖河蓸颖痉讲畹亩x易知所以統(tǒng)計(jì)量由于受到一個(gè)條件的約束,所以自由度為編輯課件 上述兩定理是正態(tài)總體統(tǒng)計(jì)推斷的根底,因而是十分重要的,下面列舉其應(yīng)用.

編輯課件ex1.設(shè)是來(lái)自的樣本,則統(tǒng)計(jì)量(23)由定理1知,統(tǒng)計(jì)量又由定理2知,統(tǒng)計(jì)量因?yàn)榕c相互獨(dú)立與也相互獨(dú)立所以證于是,由分布的定義可知,統(tǒng)計(jì)量編輯課件ex2.設(shè)來(lái)自,是來(lái)自的兩個(gè)獨(dú)立樣本,記則統(tǒng)計(jì)量(24)編輯課件由定理1可知,統(tǒng)計(jì)量證且與相互獨(dú)立由正態(tài)分布的性質(zhì)知即又由定理2知:編輯課件因?yàn)榕c相互獨(dú)立,與相互獨(dú)立所以統(tǒng)計(jì)量與也相互獨(dú)立因?yàn)榕c相互獨(dú)立,所以由分布的可加性可知統(tǒng)計(jì)量于是,由分布定義可知,統(tǒng)計(jì)量編輯課件由假設(shè),、相互獨(dú)立,則由分布的定義ex3.(續(xù)上例)記則(25)證由定理2知注:若兩個(gè)正態(tài)分布的方差與不相等,則統(tǒng)計(jì)量編輯課件 本節(jié)所介紹的幾個(gè)分布以及幾個(gè)重要結(jié)論,在下面各章中都起著重要的作用。應(yīng)注意,它們都是在總體為正態(tài)這一根本假定下得到的。編輯課件ex4.在總體中,隨機(jī)地抽取一個(gè)容量為36的樣本,求樣本均值落在50.8到53.8之間的概率.解故編輯課件ex5.設(shè)總體X的概率密度函數(shù)為為總體的樣本,求(1)的數(shù)學(xué)期望與方差(2)(3)解(1)編輯課件(近似),(3)由中心極限定理(2)編輯課件容量為10與15的兩個(gè)獨(dú)立樣本,求它們的均值差大于0.3的概率。ex6.

設(shè)總體,分別從X中抽取解設(shè)與分別表示容量為10與15的兩個(gè)樣本的均值,那么又由于與相互獨(dú)立,從而有編輯課件

因此??Za-Za查標(biāo)準(zhǔn)正態(tài)分布表:編輯課件解ex7.編輯課件編輯課件編輯課件三、直方圖直方圖與經(jīng)驗(yàn)分布函數(shù)如前所述,數(shù)理統(tǒng)計(jì)所研究的實(shí)際問(wèn)題〔總體〕的分布一般來(lái)說(shuō)是未知的,需要通過(guò)樣本來(lái)推斷.但如果對(duì)總體一無(wú)所知,那么,做出推斷的可信度一般也極為有限.在很多情況下,我們往往可以通過(guò)具體的應(yīng)用背景或以往的經(jīng)驗(yàn),再通過(guò)觀察樣本觀測(cè)值的分布情況,對(duì)總體的分布形式有個(gè)大致了解.觀察樣本觀測(cè)值的分布規(guī)律,了解總體X的概率密度和分布函數(shù),常用直方圖和經(jīng)驗(yàn)分布函數(shù).編輯課件1.直方圖直方圖是對(duì)一組數(shù)據(jù)x1,x2,...,xn的分布情況的圖形描述.將數(shù)據(jù)的取值范圍分成假設(shè)干區(qū)間〔一般是等間隔的〕,在等間隔的情況,每個(gè)區(qū)間的長(zhǎng)度稱為組距.考察這些數(shù)據(jù)落入每一個(gè)小區(qū)間的頻數(shù)和頻率,在每一個(gè)區(qū)間上畫一個(gè)矩形,它的寬度是組距,高度可以是頻數(shù)、頻率或頻率/組距,所得直方圖分別稱為頻數(shù)直方圖、頻率直方圖和密度直方圖.圖5-6密度直方圖編輯課件如果數(shù)據(jù)x1,x2,...,xn是來(lái)自連續(xù)總體X的樣本觀測(cè)值,其密度直方圖中,每一個(gè)矩形的面積恰好是觀測(cè)數(shù)據(jù)落入對(duì)應(yīng)區(qū)間的頻率,這種密度直方圖可以用來(lái)估計(jì)總體的概率密度〔用密度直方圖的頂部折線估計(jì)X的概率密度曲線〕.組距對(duì)直方圖的形態(tài)有很大的影響,組距太小或太大,直方圖反映概率密度的形態(tài)就不夠準(zhǔn)確.編輯課件作直方圖的步驟如下:1找出樣本觀測(cè)值中的最小值與最大值,分別記作與,即2適中選取略小于的數(shù)與略大于的數(shù),并用分點(diǎn)把區(qū)間分成個(gè)子區(qū)間

第個(gè)子區(qū)間的長(zhǎng)度為編輯課件 此外,為了方便起見(jiàn),分點(diǎn)應(yīng)比樣本觀測(cè)值多取一位小數(shù)。各子區(qū)間的長(zhǎng)度可以相等,也可以不等;若使各子區(qū)間的長(zhǎng)度相等,則有子區(qū)間的個(gè)數(shù)一般取為8至15個(gè),太多那么由于頻率的隨機(jī)擺動(dòng)而使分布顯得雜亂,太少那么難于顯示分布的特征。3把所有樣本觀測(cè)值逐個(gè)分到各子區(qū)間內(nèi),并計(jì)算樣本觀測(cè)值落在各子區(qū)間內(nèi)的頻數(shù)及頻率編輯課件4在軸上截取各子區(qū)間,并以各子區(qū)間為底,以為高作小矩形,各個(gè)小矩形的面積就等于樣本觀測(cè)值落在該子區(qū)間內(nèi)的頻率,即所有小矩形的面積的和這樣作出的所有小矩形就構(gòu)成了直方圖。因?yàn)闃颖救萘砍浞执髸r(shí),隨機(jī)變量落在各個(gè)子區(qū)間內(nèi)的頻率近似等于其概率即所以直方圖大致地描述了總體的概率分布。編輯課件ex8.測(cè)量100個(gè)某種機(jī)械零件的質(zhì)量,得到樣本觀測(cè)值如下〔單位:g〕246251259254246253237252250251249244249244243246256247252252250247255249247252252242245240260263254240255250256246249253246255244245257252250249255248258242252259249244251250241253250265247249253247248251251249246250252256245254258248255251249252254246250251247253252255254247252257258247252264248244寫出零件質(zhì)量的頻率分布表并作直方圖。編輯課件解因?yàn)闃颖居^測(cè)中最小值為237,最大值為265,所以我們把數(shù)據(jù)的分布區(qū)間確定為〔236.5,266.5〕并把這個(gè)區(qū)間等分為10個(gè)子區(qū)間(236.5,239.5),(239.5,242.5),…,(263.5,266.5)由此得到零件質(zhì)量的頻率分布表:

零件質(zhì)量/頻數(shù)頻率

236.5~239.510.01239.5~242.550.05242.5~245.590.09245.5~248.5190.19248.5~251.5240.24251.5~254.5220.22254.5~257.5110.11257.5~260.560.06260.5~263.510.01263.5~266.520.02總計(jì)1001.00編輯課件直方圖如圖5-7所示圖5-7編輯課件一個(gè)適宜的分組是希望密度直方圖的形態(tài)接近總體的概率密度函數(shù)的形態(tài).手工計(jì)算常取組數(shù)等于左右,一些統(tǒng)計(jì)軟件會(huì)根據(jù)樣本容量和樣本的取值范圍自動(dòng)確定一個(gè)適宜的分組方式,畫出各種漂亮的直方圖.編輯課件ex9.從某高校一年學(xué)生的“高等數(shù)學(xué)〞課程考試成績(jī)中,隨機(jī)抽取60名學(xué)生的成績(jī)?nèi)缦拢涸嚴(yán)肊xcel的“數(shù)據(jù)分析〞功能作學(xué)生成績(jī)的密度直方圖,并通過(guò)直方圖了解學(xué)生成績(jī)的分布情況.766971776971836985858677749566876651687377626673937963878754805772725876727669718175667460677963887885725890617077688079編輯課件實(shí)驗(yàn)步驟:(1)確定分組個(gè)數(shù):因?yàn)?,取分組個(gè)數(shù)為8.?dāng)?shù)據(jù)的最小值為51,最大值為95,為分組方便起見(jiàn),考慮范圍從50到100,分為8個(gè)組,組距取50/8=6.25,分點(diǎn)分別為:50,56.25,62.5,68.75,75,81.25,87.5,93.75,100。整理學(xué)生成績(jī)數(shù)據(jù),在“組上限〞欄中填入各組的上限值,如圖5-8左所示.編輯課件

圖5-8數(shù)據(jù)整理與“直方圖〞對(duì)話框編輯課件(2)在Excel主菜單中選擇“工具〞“數(shù)據(jù)分析〞,翻開(kāi)“數(shù)據(jù)分析〞對(duì)話框,在“分析工具〞列表中選擇“直方圖〞選項(xiàng),單擊“確定〞按鈕.(3)在翻開(kāi)的“直方圖〞對(duì)話框中,依次輸入〔或用鼠標(biāo)拖動(dòng)選擇〕“輸入?yún)^(qū)域〞、“接收區(qū)域〞和“輸出區(qū)域〞,如圖5-8右所示,單擊“確定〞按鈕.得到頻率分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論