統(tǒng)計量及其抽樣分布_第1頁
統(tǒng)計量及其抽樣分布_第2頁
統(tǒng)計量及其抽樣分布_第3頁
統(tǒng)計量及其抽樣分布_第4頁
統(tǒng)計量及其抽樣分布_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計量及其抽樣分布第一頁,共六十頁,編輯于2023年,星期一第6章統(tǒng)計量及其抽樣分布6.1統(tǒng)計量6.2關(guān)于分布的幾個概念6.3由正態(tài)分布導(dǎo)出的幾個重要分布

6.4樣本均值的分布與中心極限定理6.5樣本比例的抽樣分布6.6兩個樣本平均值之差的分布6.7關(guān)于樣本方差的分布

第二頁,共六十頁,編輯于2023年,星期一6.1統(tǒng)計量6.1.1統(tǒng)計量的概念6.1.2常用統(tǒng)計量6.1.3次序統(tǒng)計量

6.1.4充分統(tǒng)計量

第三頁,共六十頁,編輯于2023年,星期一6.1.1統(tǒng)計量的概念(statistic)設(shè)X1,X2,…,Xn是從總體X中抽取的容量為n的一個樣本,如果由此樣本構(gòu)造一個函數(shù)T(X1,X2,…,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,…,Xn)是一個統(tǒng)計量樣本均值、樣本比例、樣本方差等都是統(tǒng)計量統(tǒng)計量是樣本的一個函數(shù)統(tǒng)計量是統(tǒng)計推斷的基礎(chǔ)第四頁,共六十頁,編輯于2023年,星期一6.1.2常用統(tǒng)計量樣本均值樣本方差樣本變異系數(shù)樣本k階矩樣本k階中心矩樣本偏度樣本峰度掌握一般了解第五頁,共六十頁,編輯于2023年,星期一6.1.3次序統(tǒng)計量一組樣本觀測值X1,X2,…,Xn由小到大的排序

X(1)≤X(2)≤…≤X(i)≤…≤X(n)后,稱X(1),X(2),…,X(n)為次序統(tǒng)計量中位數(shù)、分位數(shù)、四分位數(shù)等都是次序統(tǒng)計量第六頁,共六十頁,編輯于2023年,星期一6.1.4充分統(tǒng)計量統(tǒng)計量加工過程中一點信息都不損失的統(tǒng)計量稱為充分統(tǒng)計量。當X=(X1,X2,…,Xn)是來自正態(tài)分布總體N(m,s2)的一個樣本時,若m已知,則是s2

的充分統(tǒng)計量;若s2已知,則是m

的充分統(tǒng)計量。方差均值第七頁,共六十頁,編輯于2023年,星期一6.2關(guān)于分布的幾個概念6.2.1抽樣分布6.2.2漸進分布6.2.3隨機模擬獲得的近似分布

第八頁,共六十頁,編輯于2023年,星期一為什么要抽樣?

為了收集必要的資料,對所研究對象(總體)的全部元素逐一進行觀測,往往不很現(xiàn)實。抽樣原因元素多,搜集數(shù)據(jù)費時、費用大,不及時而使所得的數(shù)據(jù)無意義總體龐大,難以對總體的全部元素進行研究檢查具有破壞性炮彈、燈管、磚等第九頁,共六十頁,編輯于2023年,星期一關(guān)于總體,知道得很少所有數(shù)據(jù)何種分布+樣本數(shù)據(jù)已知總體特征總體特征想知道描述性統(tǒng)計,計算參數(shù)統(tǒng)計推斷第十頁,共六十頁,編輯于2023年,星期一為什么能抽樣?中國成語:“一葉知秋”出自《淮南子·說山訓(xùn)》:“以小明大,見一葉落而知歲之將暮,睹瓶中之冰而知天下之寒。”

諺語:“你不必吃完整頭牛,才知道肉是老的”從檢查一部分得知全體。第十一頁,共六十頁,編輯于2023年,星期一復(fù)習(xí)抽樣方法簡單隨機抽樣分層抽樣整群抽樣系統(tǒng)抽樣多階段抽樣概率抽樣方便抽樣判斷抽樣自愿樣本滾雪球抽樣配額抽樣非概率抽樣抽樣方式第十二頁,共六十頁,編輯于2023年,星期一樣本統(tǒng)計量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布隨機變量是樣本統(tǒng)計量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 6.2.1抽樣分布(samplingdistribution)第十三頁,共六十頁,編輯于2023年,星期一抽樣分布的形成過程(samplingdistribution)總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本第十四頁,共六十頁,編輯于2023年,星期一當樣本量n無限增大時,計算統(tǒng)計量T(X1,X2,…,Xn)的極限分布,把極限分布作為抽樣分布的一種近似,這種極限分布就被稱為漸近分布。6.2.2漸近分布第十五頁,共六十頁,編輯于2023年,星期一6.2.3隨機模擬獲得的近似分布

隨機模擬:大樣本時,樣本均值服從正態(tài)分布嗎?提示:EXCEL——數(shù)據(jù)分析——隨機數(shù)發(fā)生器思考第十六頁,共六十頁,編輯于2023年,星期一幾種概率分布正態(tài)分布分布

F分布

t分布6.3由正態(tài)分布導(dǎo)出的幾個重要分布第十七頁,共六十頁,編輯于2023年,星期一6.3.12分布(2

distribution)設(shè)隨機變量X1,X2,…,Xn相互獨立,且,則服從自由度為n的2分布。當總體,從中抽取容量為n的樣本,則由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來。&&第十八頁,共六十頁,編輯于2023年,星期一6.3.12分布(2

distribution)2分布的概率密度函數(shù)第十九頁,共六十頁,編輯于2023年,星期一分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)

可加性:若U和V為兩個獨立的2分布隨機變量,U~2(n1),V~2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布n→∞時,2分布的極限分布是正態(tài)分布。2分布(性質(zhì)和特點)第二十頁,共六十頁,編輯于2023年,星期一c2分布(圖示)不同容量樣本的抽樣分布c2n=1n=4n=10n=20第二十一頁,共六十頁,編輯于2023年,星期一例題設(shè)隨機變量,求中的。解:,查表:即臨界值第二十二頁,共六十頁,編輯于2023年,星期一6.3.2t分布(t

distribution)高塞特(W.S.Gosset)于1908年在一篇以“Student”(學(xué)生)為筆名的論文中首次提出。設(shè)隨機變量,,且X與Y獨立,則,稱為t分布,記為t(n),n為自由度。第二十三頁,共六十頁,編輯于2023年,星期一6.3.2

t分布(t

distribution)t分布的概率密度函數(shù)t分布數(shù)學(xué)期望與方差n≥2時,t分布期望為:E(t)=0,n≥3時,t分布方差為:D(t)=n/n-2(n為自由度)

第二十四頁,共六十頁,編輯于2023年,星期一t分布圖示xt

分布與標準正態(tài)分布的比較t分布標準正態(tài)分布t不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)z

t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布第二十五頁,共六十頁,編輯于2023年,星期一例題第二十六頁,共六十頁,編輯于2023年,星期一由統(tǒng)計學(xué)家費希爾(R.A.Fisher)

提出的,以其姓氏的第一個字母來命名設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為6.3.3

F分布(F

distribution)第二十七頁,共六十頁,編輯于2023年,星期一F分布的概率密度函數(shù)為:6.3.3

F分布(Fdistribution)X~F(m,n),則

n>2時,期望為:E(X)=n/n-2

n>4時,方差為:第二十八頁,共六十頁,編輯于2023年,星期一F分布(圖示)

不同自由度的F分布F(1,10)(5,10)(10,10)第二十九頁,共六十頁,編輯于2023年,星期一6.3.3

F分布(F

distribution)F分布與t分布關(guān)系如果隨機變量X~t(n),,則X2~F(1,n)。第三十頁,共六十頁,編輯于2023年,星期一例題第三十一頁,共六十頁,編輯于2023年,星期一6.4樣本均值的分布與中心極限定理樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 第三十二頁,共六十頁,編輯于2023年,星期一樣本均值的抽樣分布(例題分析)【例】設(shè)一個總體含有4個個體,分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下??傮w均值和方差總體的頻數(shù)分布14230.1.2.3第三十三頁,共六十頁,編輯于2023年,星期一樣本均值的抽樣分布

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果如下表.3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n

=2的樣本(共16個)第三十四頁,共六十頁,編輯于2023年,星期一樣本均值的抽樣分布

各樣本的均值如下表,并給出樣本均值的抽樣分布x樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.53.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)第三十五頁,共六十頁,編輯于2023年,星期一所有樣本均值的均值和方差1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值2.樣本均值的方差等于總體方差的1/nM為樣本數(shù)目第三十六頁,共六十頁,編輯于2023年,星期一樣本均值的抽樣分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5第三十七頁,共六十頁,編輯于2023年,星期一構(gòu)造樣本統(tǒng)計量抽樣分布的步驟1、從容量為N的有限總體中隨機選取容量為n的所有可能樣本;2、計算出每個樣本的統(tǒng)計量值;3、將來自不同樣本的不同統(tǒng)計量值分組排列,把對應(yīng)于每個數(shù)值的相對出現(xiàn)頻數(shù)排成另一列,由此,全部可能的樣本統(tǒng)計量值形成了一個概率分布,這個分布就是我們想要得到的抽樣分布。第三十八頁,共六十頁,編輯于2023年,星期一樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)第三十九頁,共六十頁,編輯于2023年,星期一抽樣分布的特征與總體分布的均值和方差有關(guān)。第四十頁,共六十頁,編輯于2023年,星期一例:設(shè)從一個均值為10、標準差為0.6的總體中隨機選取容量為36的樣本。假定該總體不是很偏的,要求:(1)計算樣本均值小于9.9的近似概率。(2)計算樣本均值超過9.9的近似概率。(3)計算樣本均值在總體均值10附近0.1范圍內(nèi)的近似概率。第四十一頁,共六十頁,編輯于2023年,星期一中心極限定理(centrallimittheorem)當樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x第四十二頁,共六十頁,編輯于2023年,星期一中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程第四十三頁,共六十頁,編輯于2023年,星期一樣本均值的抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布第四十四頁,共六十頁,編輯于2023年,星期一總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

6.5樣本比例(proportion)的抽樣分布第四十五頁,共六十頁,編輯于2023年,星期一在重復(fù)選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分布當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似推斷總體比例的理論基礎(chǔ) 樣本比例的抽樣分布第四十六頁,共六十頁,編輯于2023年,星期一樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布

(數(shù)學(xué)期望與方差)第四十七頁,共六十頁,編輯于2023年,星期一有限總體校正系數(shù)

FinitePopulationCorrectionFactor注意:不重復(fù)抽樣時樣本均值的方差等于重復(fù)抽樣時的方差乘以有限總體校正系數(shù):

當n/N<0.05時可以忽略有限總體校正系數(shù)。第四十八頁,共六十頁,編輯于2023年,星期一數(shù)學(xué)期望和方差的主要數(shù)學(xué)性質(zhì)如果X是一隨機變量,C是一常數(shù),則CX與X有相同的分布形狀。設(shè)E(X)=m,D(X)=s2,則若C是一常數(shù),則E(CX)=CE(X)=Cm,D(CX)=C2s2。補充:對于任意兩個隨機變量X、Y,有

E(X+Y)=E(X)+E(Y)若兩個隨機變量X、Y相互獨立,則

E(XY)=E(X)E(Y)

若兩個隨機變量X、Y相互獨立,則

D(X+Y)=D(X)+D(Y)

第四十九頁,共六十頁,編輯于2023年,星期一例題例:設(shè)X~N(9,4),試描述10X的抽樣分布。解:E(10X)=10E(X)=90D(10X)=102s2=400所以,10X~N(90,400)。第五十頁,共六十頁,編輯于2023年,星期一例:假定某統(tǒng)計人員在其填寫的報表中有2%至少會有一處錯誤,如果我們檢查了一個由600份報表組成的隨機樣本,其中至少有一處錯誤的報表所占的比例在0.025~0.070之間的概率有多大?第五十一頁,共六十頁,編輯于2023年,星期一6.7關(guān)于樣本方差的分布6.7.1樣本方差的分布

第五十二頁,共六十頁,編輯于2023年,星期一6.7.1樣本方差的分布在重復(fù)選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布對于來自正態(tài)總體的簡單隨機樣本,則比值的抽樣分布服從自由度為(n

-1)的2分布,即第五十三頁,共六十頁,編輯于2023年,星期一例題調(diào)節(jié)一個裝瓶機使其對每個瓶子的灌裝量均值為m盎司,通過觀察這臺裝瓶機對每個瓶子的灌裝量服從標準差s=1盎司的正態(tài)分布。隨機抽取由這臺機器灌裝的10個瓶子形成一個樣本,并測定每個瓶子的灌裝量,計算出樣本方差,試確定一個合適范圍,使得樣本方差落入其中的概率為90%。第五十四頁,共六十頁,編輯于2023年,星期一第6章小結(jié)統(tǒng)計量及其分布由正態(tài)分布導(dǎo)出的幾個重要分布樣本均值的分布與中心極限定理樣本比例的抽樣分布關(guān)于樣本方差的分布第五十五頁,共六十頁,編輯于2023年,星期一第6章課堂練習(xí)1.抽樣調(diào)查的主要目的是()。

A.用樣本統(tǒng)計量來推斷總體參數(shù)

B.對調(diào)查單位作深入研究

C.計算和控制抽樣誤差

D.廣泛運用數(shù)學(xué)方法

2.抽樣分布是指()。A.一個樣本各觀測值的分布B.總體中各觀測值的分布C.樣本統(tǒng)計量的分布D.樣本數(shù)量的分布AC第五十六頁,共六十頁,編輯于2023年,星期一3.從服從正態(tài)分布的無限總體中分別抽取容量為4,16,36的樣本,當樣本容量增大時,樣本均值的標準差()。

A.保持不變B.增加C.減小D.無法確定4.假設(shè)總體比例為0.55

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論