




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第五章統(tǒng)計(jì)量及其分布
§5.1
總體與樣本§5.2
樣本數(shù)據(jù)的整理與顯示§5.3
統(tǒng)計(jì)量及其分布§5.4
三大抽樣分布§5.5
充分統(tǒng)計(jì)量
編輯ppt
數(shù)理統(tǒng)計(jì)是在概率論的基礎(chǔ)上研究怎樣以有效的方式收集、整理和分析可獲得的有限的,帶有隨機(jī)性的數(shù)據(jù)資料,對(duì)所考察問(wèn)題的統(tǒng)計(jì)規(guī)律性盡可能作出精確而可靠的推斷或預(yù)測(cè),為采取一定的決策和行動(dòng)提供依據(jù)和建議.數(shù)理統(tǒng)計(jì)與概率論是兩個(gè)有密切聯(lián)系的學(xué)科,它們都以隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律為研究對(duì)象。編輯ppt但在研究問(wèn)題的方法上有很大區(qū)別:概率論——已知隨機(jī)變量服從的分布規(guī)律,尋求分布的性質(zhì)、數(shù)字特征、及其應(yīng)用;
數(shù)理統(tǒng)計(jì)
——通過(guò)對(duì)試驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)分析,尋找隨機(jī)變量所服從的分布和數(shù)字特征,從而推斷整體的規(guī)律性.
數(shù)理統(tǒng)計(jì)的核心問(wèn)題——由樣本推斷總體
編輯ppt統(tǒng)計(jì)推斷數(shù)理統(tǒng)計(jì)的一般步驟:數(shù)據(jù)資料的收集數(shù)據(jù)的整理、分析編輯ppt第5.1節(jié)總體與子樣一、總體與個(gè)體二、隨機(jī)樣本的定義編輯ppt一、總體與個(gè)體一個(gè)統(tǒng)計(jì)問(wèn)題總有它明確的研究對(duì)象.研究對(duì)象的全體稱為總體(母體),總體中每個(gè)成員稱為個(gè)體.研究某批燈泡的質(zhì)量…考察國(guó)產(chǎn)轎車的質(zhì)量總體總體編輯ppt然而在統(tǒng)計(jì)研究中,人們往往關(guān)心每個(gè)個(gè)體的一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況.這時(shí),每個(gè)個(gè)體具有的數(shù)量指標(biāo)的全體就是總體.該批燈泡壽命的全體就是總體燈泡的壽命國(guó)產(chǎn)轎車每公里的耗油量所有國(guó)產(chǎn)轎車每公里耗油量的全體就是總體編輯ppt相應(yīng)的數(shù)量指標(biāo)值的出現(xiàn)帶有隨機(jī)性。從而可把此種數(shù)量指標(biāo)看作隨機(jī)變量,我們用一個(gè)隨機(jī)變量或其分布來(lái)描述總體。為此常用隨機(jī)變量的符號(hào)來(lái)表示總體,并把隨機(jī)變量的分布稱為總體分布。
通常,我們用隨機(jī)變量,…,等表示總體。當(dāng)我們說(shuō)到總體,就是指一個(gè)具有確定概率分布的隨機(jī)變量。注:總體的分布一般來(lái)說(shuō)是未知的,統(tǒng)計(jì)學(xué)的主要任務(wù)正是要對(duì)總體的未知分布進(jìn)行推斷.編輯ppt如:研究某批燈泡的壽命時(shí),我們關(guān)心的數(shù)量指標(biāo)就是壽命,那么,此總體就可以用隨機(jī)變量X表示,其分布函數(shù)F(x).總體某批燈泡的壽命壽命可用一概率分布來(lái)刻劃F(x)編輯ppt總體的三層含義:
研究對(duì)象的全體;
數(shù)據(jù);
分布編輯ppt例5.1.1考察某廠的產(chǎn)品質(zhì)量,以0記合格品,以1記不合格品,則總體={該廠生產(chǎn)的全部合格品與不合格品}={由0或1組成的一堆數(shù)}若以
p表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個(gè)二點(diǎn)分布表示:X0
1P1
pp編輯ppt比如:兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品的總體
分布:X01p0.9830.017X01p0.9150.085編輯ppt5.1.2樣本樣品、樣本、樣本容量:樣本具有兩重性
一方面,由于樣本是從總體中隨機(jī)抽取的,抽取前無(wú)法預(yù)知它們的數(shù)值,因此,樣本是隨機(jī)變量,用大寫(xiě)字母X1,X2,…,Xn
表示;
另一方面,樣本在抽取以后經(jīng)觀測(cè)就有確定的觀測(cè)值,因此,樣本又是一組數(shù)值。此時(shí)用小寫(xiě)字母x1,x2,…,xn
表示是恰當(dāng)?shù)?。?jiǎn)單起見(jiàn),無(wú)論是樣本還是其觀測(cè)值,樣本一般均用x1,x2,…xn
表示,應(yīng)能從上下文中加以區(qū)別。編輯ppt例5.1.3
啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640
克。由于隨機(jī)性,事實(shí)上不可能使得所有的啤酒凈含量均為640克?,F(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測(cè)定其凈含量,得到如下結(jié)果:641,635,640,637,642,638,645,643,639,640這是一個(gè)容量為10的樣本的觀測(cè)值,對(duì)應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。這樣的樣本稱為完全樣本。編輯ppt例5.1.4
考察某廠生產(chǎn)的某種電子元件的壽命,選了100只進(jìn)行壽命試驗(yàn),得到如下數(shù)據(jù):編輯ppt表5.1.2
100只元件的壽命數(shù)據(jù)表5.1.2中的樣本觀測(cè)值沒(méi)有具體的數(shù)值,只有一個(gè)范圍,這樣的樣本稱為分組樣本。
壽命范圍元件數(shù)壽命范圍元件數(shù)壽命范圍元件數(shù)(024]4(192216]6(384408]4(2448]8(216240]3(408432]4(4872]6(240264]3(432456]1(7296]5(264288]5(456480]2(96120]3(288312]5(480504]2(120144]4(312336]3(504528]3(144168]5(336360]5(528552]1(168192]4(360184]1>55213編輯ppt
獨(dú)立性:
樣本中每一樣品的取值不影響其它樣品的取值--
x1,x2,…,xn
相互獨(dú)立。要使得推斷可靠,對(duì)樣本就有要求,使樣本能很好地代表總體。通常有如下兩個(gè)要求:隨機(jī)性:
總體中每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本--
xi
與總體X有相同的分布。樣本的要求:簡(jiǎn)單隨機(jī)樣本編輯ppt用簡(jiǎn)單隨機(jī)抽樣方法得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,也簡(jiǎn)稱樣本。于是,樣本
x1,x2,…,xn
可以看成是獨(dú)立同分布(iid)
的隨機(jī)變量,其共同分布即為總體分布。獲得簡(jiǎn)單隨機(jī)樣本的抽樣方法稱為簡(jiǎn)單隨機(jī)抽樣.(總體規(guī)模很大)編輯ppt總體分為有限總體與無(wú)限總體實(shí)際中總體中的個(gè)體數(shù)大多是有限的。當(dāng)個(gè)體數(shù)充分大時(shí),將有限總體看作無(wú)限總體是一種合理的抽象。對(duì)無(wú)限總體,隨機(jī)性與獨(dú)立性容易實(shí)現(xiàn),困難在于排除有意或無(wú)意的人為干擾。對(duì)有限總體,只要總體所含個(gè)體數(shù)很大,特別是與樣本量相比很大,則獨(dú)立性也可基本得到滿足。編輯ppt定理(補(bǔ)充)3.樣本的分布編輯ppt解例1編輯ppt解例2編輯ppt編輯ppt5.2.1經(jīng)驗(yàn)分布函數(shù)§5.2樣本數(shù)據(jù)的整理與顯示設(shè)
x1,x2,…,xn是取自總體分布函數(shù)為F(x)的樣本,若將樣本觀測(cè)值由小到大進(jìn)行排列,為x(1),x(2),…,x(n),則稱
x(1),x(2),…,x(n)為有序樣本,用有序樣本定義如下函數(shù)
編輯ppt則Fn(x)是一非減右連續(xù)函數(shù),且滿足Fn()=0和Fn()=1由此可見(jiàn),F(xiàn)n(x)是一個(gè)分布函數(shù),并稱Fn(x)為經(jīng)驗(yàn)分布函數(shù)。編輯ppt例5.2.1
某食品廠生產(chǎn)聽(tīng)裝飲料,現(xiàn)從生產(chǎn)線上隨機(jī)抽取5聽(tīng)飲料,稱得其凈重(單位:克)351347355344351x(1)=344,x(2)=347,x(3)=351,x(4)=354,x(5)=355這是一個(gè)容量為5的樣本,經(jīng)排序可得有序樣本:編輯ppt其經(jīng)驗(yàn)分布函數(shù)為由伯努里大數(shù)定律:只要n相當(dāng)大,F(xiàn)n(x)依概率收斂于F(x)。
0,x<344
0.2,344x
<347Fn(x)=0.4,347x
<3510.8,344x
<3471,x355編輯ppt更深刻的結(jié)果也是存在的,這就是格里紋科定理。定理5.2.1(格里紋科定理)
設(shè)x1,x2,…,xn是取自總體分布函數(shù)為F(x)的樣本,Fn(x)是其經(jīng)驗(yàn)分布函數(shù),當(dāng)n時(shí),有PsupFn(x)F(x)0=1格里紋科定理表明:當(dāng)n相當(dāng)大時(shí),經(jīng)驗(yàn)分布函數(shù)是總體分布函數(shù)F(x)的一個(gè)良好的近似。經(jīng)典的統(tǒng)計(jì)學(xué)中一切統(tǒng)計(jì)推斷都以樣本為依據(jù),其理由就在于此。編輯ppt練習(xí)編輯ppt160196164148170
175178166181162
161168166162172
156170157162154
5.2.2頻數(shù)--頻率分布表樣本數(shù)據(jù)的整理是統(tǒng)計(jì)研究的基礎(chǔ),整理數(shù)據(jù)的最常用方法之一是給出其頻數(shù)分布表或頻率分布表。例5.2.2
為研究某廠工人生產(chǎn)某種產(chǎn)品的能力,我們隨機(jī)調(diào)查了20位工人某天生產(chǎn)的該種產(chǎn)品的數(shù)量,數(shù)據(jù)如下編輯ppt(1)對(duì)樣本進(jìn)行分組:作為一般性的原則,組數(shù)通常在5~20個(gè),對(duì)容量較小的樣本分5組或6組(2)確定每組組距:近似公式為組距d=(最大觀測(cè)值
最小觀測(cè)值)/組數(shù);(3)確定每組組限:各組區(qū)間端點(diǎn)為a0,a1=a0+d,
a2=a0+2d,…,ak=a0+kd,形成如下的分組區(qū)間(a0,a1],(a1,a2],…,(ak-1
,ak]對(duì)這20個(gè)數(shù)據(jù)(樣本)進(jìn)行整理,具體步驟如下:其中a0
略小于最小觀測(cè)值,ak
略大于最大觀測(cè)值.編輯ppt(4)統(tǒng)計(jì)樣本數(shù)據(jù)落入每個(gè)區(qū)間的個(gè)數(shù)——頻數(shù),
并列出其頻數(shù)頻率分布表。表5.2.1
例5.2.2的頻數(shù)頻率分布表
組序分組區(qū)間組中值頻數(shù)頻率累計(jì)頻率(%)1(147,157]152
4
0.20
20
2
(157,167]162
8
0.4060
3(167,177]172
5
0.25
85
4
(177,187]18220.10955(187,197]19210.05100合計(jì)201編輯ppt5.2.3樣本數(shù)據(jù)的圖形顯示一、直方圖直方圖是頻數(shù)分布的圖形表示,它的橫坐標(biāo)表示所關(guān)心變量的取值區(qū)間,縱坐標(biāo)有三種表示方法:頻數(shù),頻率,最準(zhǔn)確的是頻率/組距,它可使得諸長(zhǎng)條矩形面積和為1。凡此三種直方圖的差別僅在于縱軸刻度的選擇,直方圖本身并無(wú)變化。編輯ppt把每一個(gè)數(shù)值分為兩部分,前面一部分(百位和十位)稱為莖,后面部分(個(gè)位)稱為葉,然后畫(huà)一條豎線,在豎線的左側(cè)寫(xiě)上莖,右側(cè)寫(xiě)上葉,就形成了莖葉圖。如:二、莖葉圖數(shù)值分開(kāi)莖和葉11211|211和2編輯ppt例5.2.3
某公司對(duì)應(yīng)聘人員進(jìn)行能力測(cè)試,測(cè)試成績(jī)總分為150分。下面是50位應(yīng)聘人員的測(cè)試成績(jī)(已經(jīng)過(guò)排序):64677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133我們用這批數(shù)據(jù)給出一個(gè)莖葉圖,見(jiàn)下頁(yè)。編輯ppt圖5.2.3測(cè)試成績(jī)的莖葉圖47024669012235681123335667790024667882246899235683
編輯ppt在要比較兩組樣本時(shí),可畫(huà)出它們的背靠背的莖葉圖。甲車間62056乙車間87775554211667788877664421722455556668898766532801133344466778732109023585300107注意:莖葉圖保留數(shù)據(jù)中全部信息。當(dāng)樣本量較大,數(shù)據(jù)很分散,橫跨二、三個(gè)數(shù)量級(jí)時(shí),莖葉圖并不適用。編輯ppt5.3.1統(tǒng)計(jì)量與抽樣分布§5.3統(tǒng)計(jì)量及其分布當(dāng)人們需要從樣本獲得對(duì)總體各種參數(shù)的認(rèn)識(shí)時(shí),最好的方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。定義5.3.1
設(shè)x1,x2,…,xn
為取自某總體的樣本,若樣本函數(shù)T=T(x1,x2,…,xn)中不含有任何未知參數(shù)。則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布。編輯ppt按照這一定義:若x1,x2,…,xn為樣本,則以及經(jīng)驗(yàn)分布函數(shù)Fn(x)都是統(tǒng)計(jì)量。而當(dāng),2未知時(shí),x1,x1/
等均不是統(tǒng)計(jì)量。盡管統(tǒng)計(jì)量不依賴于未知參數(shù),但是它的分布一般是依賴于未知參數(shù)的。下面介紹一些常見(jiàn)的統(tǒng)計(jì)量及其抽樣分布。編輯ppt5.3.2樣本均值及其抽樣分布
定義5.3.2
設(shè)x1,x2,…,xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用表示,即思考:在分組樣本場(chǎng)合,樣本均值如何計(jì)算?二者結(jié)果相同嗎?
xx=
(x1+…+xn)/n例5.3.1編輯ppt定理5.3.2
數(shù)據(jù)觀測(cè)值與均值的偏差平方和最小,即在形如(xic)2的函數(shù)中,樣本均值的基本性質(zhì):定理5.3.1
若把樣本中的數(shù)據(jù)與樣本均值之差稱為偏差,則樣本所有偏差之和為0,即
最小,其中c為任意給定常數(shù)。編輯ppt樣本均值的抽樣分布:定理5.3.3
設(shè)x1,x2,…,xn是來(lái)自某個(gè)總體的樣本,x為樣本均值。(1)若總體分布為N(,2),則xx的精確分布為N(,2/n)
;若總體分布未知或不是正態(tài)分布,但E(x)=,Var(x)=2,則n較大時(shí)
的漸近分布為N(,2/n)
,常記為。xAN(,2/n)這里漸近分布是指n較大時(shí)的近似分布.編輯ppt5.3.3樣本方差與樣本標(biāo)準(zhǔn)差稱為樣本標(biāo)準(zhǔn)差。sn=
sn2定義5.3.3稱為樣本方差,其算術(shù)平方根在n不大時(shí),常用作為樣本方差,其算術(shù)平方根也稱為樣本標(biāo)準(zhǔn)差。編輯ppt在這個(gè)定義中,
(
xix)2n1稱為偏差平方和的自由度。其含義是:x在確定后,
n個(gè)偏差x1x,x2x,…,xnx能自由取值,因?yàn)橹挥衝1個(gè)數(shù)據(jù)可以自由變動(dòng),而第n個(gè)則不
(xix)=0.稱為偏差平方和,中樣本偏差平方和有三個(gè)不同的表達(dá)式:(
xix)2=xi2–(xi)2/n=xi2–nx它們都可用來(lái)計(jì)算樣本方差。思考:分組樣本如何計(jì)算樣本方差?例5.3.4編輯ppt樣本均值的數(shù)學(xué)期望和方差,以及樣本方差的數(shù)學(xué)期望都不依賴于總體的分布形式。定理5.3.4
設(shè)總體X具有二階矩,即
E(x)=
,Var(x)=2
,
x1,x2,…,xn為從該總體得到的樣本,x和s2分別是樣本均值和樣本方差,則E(x)=,Var(x)=2/n,E(s2)=2E(sn2)=(n-1/n)2
編輯ppt5.3.4樣本矩及其函數(shù)
樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見(jiàn)的統(tǒng)計(jì)量。定義5.3.4
ak=(xik)/n稱為樣本k階原點(diǎn)矩,
特別,樣本一階原點(diǎn)矩就是樣本均值。
稱為樣本k階中心矩。
特別,樣本二階中心矩就是樣本方差。
bk=
(xi
x)k/n編輯ppt當(dāng)總體關(guān)于分布中心對(duì)稱時(shí),我們用x和s刻畫(huà)樣本特征很有代表性,而當(dāng)其不對(duì)稱時(shí),只用
就顯得很不夠。為此,需要一些刻畫(huà)分布形狀的統(tǒng)計(jì)量,如樣本偏度和樣本峰度,它們都是樣本中心矩的函數(shù)。樣本偏度1反映了總體分布密度曲線的對(duì)稱性信息。樣本峰度2反映了總體分布密度曲線在其峰值附近的陡峭程度。定義:
1=b3/b23/2稱為樣本偏度,
2=b4/b22-3
稱為樣本峰度。x和s編輯ppt5.3.5次序統(tǒng)計(jì)量及其分布
另一類常見(jiàn)的統(tǒng)計(jì)量是次序統(tǒng)計(jì)量。一、定義5.3.7
設(shè)x1,x2,…,xn是取自總體X的樣本,x(i)稱為該樣本的第i個(gè)次序統(tǒng)計(jì)量,它的取值是將樣本觀測(cè)值由小到大排列后得到的第i個(gè)觀測(cè)值。其中x(1)=minx1,x2,…,xn稱為該樣本的最小次序統(tǒng)計(jì)量,稱x(n)=maxx1,x2,…,xn為該樣本的最大次序統(tǒng)計(jì)量。編輯ppt例5.3.6設(shè)總體X的分布為僅取0,1,2的離散
均勻分布,分布列為我們知道,在一個(gè)樣本中,x1,x2,…,xn是獨(dú)立同分布的,而次序統(tǒng)計(jì)量x(1),x(2),…,x(n)則既不獨(dú)立,分布也不相同,看下例?,F(xiàn)從中抽取容量為3的樣本,其一切可能取值有33=27種,表5.3.6列出了這些值,由此0
1
2
1/3
1/31/3編輯ppt012012我們可以清楚地看到這三個(gè)次序統(tǒng)計(jì)量的分布是不相同的。可給出的x(1),x(2),x(3)分布列如下:012編輯ppt進(jìn)一步,我們可以給出兩個(gè)次序統(tǒng)計(jì)量的聯(lián)合分布,如,x(1)和x(2)的聯(lián)合分布列為01207/279/273/27104/273/272001/27x(1)x(2)編輯ppt因?yàn)镻(x(1)=0,x(2)=0)=7/27,二者不等,由此可看出x(1)和x(2)是不獨(dú)立的。而P(x(1)=0)*P(x(2)=0)=(19/27)*(7/27),編輯ppt二、單個(gè)次序統(tǒng)計(jì)量的分布定理5.3.5設(shè)總體X的密度函數(shù)為p(x),分布函數(shù)為F(x),x1,x2,…,xn為樣本,則第k個(gè)次序統(tǒng)計(jì)量x(k)的密度函數(shù)為編輯ppt例5.3.7設(shè)總體密度函數(shù)為p(x)=3x2,0x1.
從該總體抽得一個(gè)容量為5的樣本,試計(jì)算P(x(2)1/2)。例5.3.8
設(shè)總體分布為U(0,1),x1,x2,…,xn為樣本,試求第k個(gè)次序統(tǒng)計(jì)量的分布。編輯ppt三、多個(gè)次序統(tǒng)計(jì)量的聯(lián)合分布對(duì)任意多個(gè)次序統(tǒng)計(jì)量可給出其聯(lián)合分布,以兩個(gè)為例說(shuō)明:定理5.3.6在定理5.3.5的記號(hào)下,次序統(tǒng)計(jì)量(x(i),x(j)),(ij)的聯(lián)合分布密度函數(shù)為編輯ppt次序統(tǒng)計(jì)量的函數(shù)在實(shí)際中經(jīng)常用到。如樣本極差
Rn
=x(n)
x(1),
樣本中程
[x(n)
x(1)]/2。樣本極差是一個(gè)很常用的統(tǒng)計(jì)量,其分布只在很少幾種場(chǎng)合可用初等函數(shù)表示。編輯ppt令R
=x(n)
x(1),由R0,可以推出0
x(1)
=
x(n)R
1
R
,則例5.3.9設(shè)總體分布為U(0,1),x1,x2,…,xn為樣本,則(x(n),x(1))的聯(lián)合密度函數(shù)為p1,n(y,z)=n(n1)(zy)n-2,0
yz1這正是參數(shù)為(n1,2)的貝塔分布。編輯ppt5.3.6樣本分位數(shù)與樣本中位數(shù)樣本中位數(shù)也是一個(gè)很常見(jiàn)的統(tǒng)計(jì)量,它也是次序統(tǒng)計(jì)量的函數(shù),通常如下定義:更一般地,樣本p分位數(shù)mp可如下定義:編輯ppt定理5.3.7設(shè)總體密度函數(shù)為p(x),xp為其p分位數(shù),p(x)在xp處連續(xù)且p(xp)0,則特別,對(duì)樣本中位數(shù),當(dāng)n時(shí)近似地有當(dāng)n時(shí)樣本p分位數(shù)mp的漸近分布為編輯ppt例5.3.10設(shè)總體為柯西分布,密度函數(shù)為p(x,)=1/[(1+(x)2)],x+通常,樣本均值在概括數(shù)據(jù)方面具有一定的優(yōu)勢(shì)。但當(dāng)數(shù)據(jù)中含有極端值時(shí),使用中位數(shù)比使用均值更好,中位數(shù)的這種抗干擾性在統(tǒng)計(jì)中稱為具有穩(wěn)健性。
不難看出是該總體的中位數(shù),即x0.5=。設(shè)x1,x2,…,xn是來(lái)自該總體的樣本,當(dāng)樣本量n較大時(shí),樣本中位數(shù)m0.5的漸近分布為m0.5AN(,2/4n).編輯ppt5.3.7五數(shù)概括與箱線圖次序統(tǒng)計(jì)量的應(yīng)用之一是五數(shù)概括與箱線圖。在得到有序樣本后,容易計(jì)算如下五個(gè)值:最小觀測(cè)值
xmin=x(1),最大觀測(cè)值
xmax=x(n),中位數(shù)
m0.5,第一4分位數(shù)
Q1=m0.25,第三4分位數(shù)
Q3=m0.75.所謂五數(shù)概括就是指用這五個(gè)數(shù):xmin,Q1,m0.5,Q3,xmax來(lái)大致描述一批數(shù)據(jù)的輪廓。編輯ppt§5.4三大抽樣分布大家很快會(huì)看到,有很多統(tǒng)計(jì)推斷是基于正態(tài)分布的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個(gè)著名統(tǒng)計(jì)量在實(shí)際中有廣泛的應(yīng)用,這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有明顯表達(dá)式,它們被稱為統(tǒng)計(jì)中的“三大抽樣分布”。編輯ppt5.4.12
分布(卡方分布)定義5.4.1設(shè)X1,X2,…,Xn,獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布N(0,1),則2=
X12+…Xn2的分布稱為自由度為n的2分布,記為2
2(n)
。編輯ppt編輯ppt編輯ppt性質(zhì)1(此性質(zhì)可以推廣到多個(gè)隨機(jī)變量的情形)性質(zhì)2編輯ppt同理與相互獨(dú)立編輯ppt當(dāng)隨機(jī)變量
2
2(n)時(shí),對(duì)給定
(01),稱滿足P(2
12(n))的12(n)是自由度為n1的卡方分布的1
分位數(shù).分位數(shù)
12(n)可以從附表3中查到。編輯ppt5.4.2F分布定義5.4.2
設(shè)X1
2(m),X2
2(n),X1與X2獨(dú)立,則稱F=(X1/m)/(X2/n)的分布是自由度為
m與n
的F分布,記為FF(m,n),其中m稱為分子自由度,n稱為分母自由度。編輯ppt編輯ppt該密度函數(shù)的圖象也是一只取非負(fù)值的偏態(tài)分布
編輯ppt(1)(2)編輯ppt當(dāng)隨機(jī)變量FF(m,n)時(shí),對(duì)給定(01),稱滿足P(F
F1(m,n))=1的F1(m,n)是自由度為m與n的F分布的1分位數(shù)。由F分布的構(gòu)造知F(n,m)=1/F1(m,n)。例5.4.2編輯ppt5.4.3t
分布
定義5.4.3
設(shè)隨機(jī)變量X1
與X2
獨(dú)立,且X1N(0,1),X2
2(n),則稱t=X1/X2/n的分布為自由度為n
的t分布,記為tt(n)。
編輯pptt分布的密度函數(shù)的圖象是一個(gè)關(guān)于縱軸對(duì)稱的分布,與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形狀類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。編輯ppt
n1時(shí),t分布的數(shù)學(xué)期望存在且為0;
n2時(shí),t
分布的方差存在,且為n/(n2);當(dāng)自由度較大(如n30)時(shí),
t分布可以用正態(tài)分布
N(0,1)近似。自由度為1的
t
分布就是標(biāo)準(zhǔn)柯西分布,
它的均值不存在;編輯ppt編輯ppt當(dāng)隨機(jī)變量tt(n)時(shí),稱滿足P(t
t1(n))=1的t1(n)是自由度為n的t分布的1分位數(shù).分位數(shù)t1(n)可以從附表4中查到。譬如n=10,=0.05,那么從附表4上查得t10.05(10)=t0.95(10)=1.812.由于t分布的密度函數(shù)關(guān)于0對(duì)稱,故其分位數(shù)間有如下關(guān)系t(n1)=t1(n1)編輯ppt5.4.4一些重要結(jié)論定理5.4.1設(shè)x1,x2,…,xn是來(lái)自N(,2)的樣本,其樣本均值和樣本方差分別為和x=xi/n
s2=
(xix)2/(n1)(3)(n1)s2/2
2(n1)。
則有(1)x與s2相互獨(dú)立;(2)xN(,2/n)
;編輯ppt推論5.4.1設(shè)x1,x2,…,xn是來(lái)自N(,2)的樣本,其樣本均值和樣本方差分別為和x=xi/n
s2=
(xix)2/(n1)則有編輯ppt推論5.4.2
設(shè)x1,x2,…,xn是來(lái)自N(1,12)的樣本,y1,y2,…,yn是來(lái)自N(2,22)的樣本,且此兩樣本相互獨(dú)立,則有特別,若12=22,則F=sx2/sy2
F(m1,n1)編輯ppt推論5.4.3在推論5.4.1的記號(hào)下,設(shè)12=22=2,并記則編輯ppt§5.5充分統(tǒng)計(jì)量5.5.1充分性的概念例5.5.1
為研究某個(gè)運(yùn)動(dòng)員的打靶命中率,我們對(duì)該運(yùn)動(dòng)員進(jìn)行測(cè)試,觀測(cè)其10次,發(fā)現(xiàn)除第三、六次未命中外,其余8次都命中。這樣的觀測(cè)結(jié)果包含了兩種信息:(1)打靶10次命中8次;(2)2次不命中分別出現(xiàn)在第3次和第6次打靶上。編輯ppt第二種信息對(duì)了解該運(yùn)動(dòng)員的命中率是沒(méi)有什么幫助的。一般地,設(shè)我們對(duì)該運(yùn)動(dòng)員進(jìn)行n次觀測(cè),得到x1,x2,…,xn,每個(gè)xj
取值非0即1,命中為1,不命中為0。令T=x1+…+xn
,T為觀測(cè)到的命中次數(shù)。在這種場(chǎng)合僅僅記錄使用T不會(huì)丟失任何與命中率有關(guān)的信息,統(tǒng)計(jì)上將這種“樣本加工不損失信息”稱為“充分性”。樣本x=(x1,x2,…,xn)有一個(gè)樣本分布F
(x),這個(gè)分布包含了樣本中一切有關(guān)的信息。編輯ppt統(tǒng)計(jì)量T=T(x1,x2,…,xn)也有一個(gè)抽樣分布FT(t),當(dāng)我們期望用統(tǒng)計(jì)量T代替原始樣本并且
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 印刷服務(wù)合同
- 手破碎機(jī)設(shè)備買賣合同
- 聘用出納合同增加多場(chǎng)景
- 生產(chǎn)車間承包合同協(xié)議
- 機(jī)械工程勞務(wù)分包合同
- 河北化工醫(yī)藥職業(yè)技術(shù)學(xué)院《中學(xué)生物課堂教學(xué)技能訓(xùn)練》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣州華立科技職業(yè)學(xué)院《數(shù)據(jù)挖掘與決策管理》2023-2024學(xué)年第二學(xué)期期末試卷
- 寧波衛(wèi)生職業(yè)技術(shù)學(xué)院《界面化學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 宜春學(xué)院《需求工程》2023-2024學(xué)年第二學(xué)期期末試卷
- 宿州職業(yè)技術(shù)學(xué)院《水質(zhì)工程學(xué)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 家校共育之道
- 公司EHS知識(shí)競(jìng)賽題庫(kù)附答案
- 社區(qū)健康促進(jìn)工作計(jì)劃
- 《作文中間技巧》課件
- 2025年度移動(dòng)端SEO服務(wù)及用戶體驗(yàn)優(yōu)化合同
- 中小學(xué)《清明節(jié)活動(dòng)方案》班會(huì)課件
- 新蘇教版一年級(jí)下冊(cè)數(shù)學(xué)第1單元第3課時(shí)《8、7加幾》作業(yè)
- 特殊教育學(xué)校2024-2025學(xué)年度第二學(xué)期教學(xué)工作計(jì)劃
- 【公開(kāi)課】同一直線上二力的合成+課件+2024-2025學(xué)年+人教版(2024)初中物理八年級(jí)下冊(cè)+
- 人教鄂教版六年級(jí)下冊(cè)科學(xué)全冊(cè)知識(shí)點(diǎn)
- 鄭州市地圖含區(qū)縣可編輯可填充動(dòng)畫(huà)演示矢量分層地圖課件模板
評(píng)論
0/150
提交評(píng)論