第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第1頁
第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第2頁
第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第3頁
第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第4頁
第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一節(jié) 事件與概率(一)概率的定義 n 研究隨機(jī)試驗(yàn),需了解各種隨機(jī)事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性。n 能夠刻畫事件發(fā)生可能性大小的數(shù)量指標(biāo)稱之為概率(probability)。事件A的概率記為P(A)。1概率的古典定義 (先驗(yàn)概率)n 隨機(jī)試驗(yàn)具有以下特征,稱為古典概型。1.試驗(yàn)的所有可能結(jié)果只有有限個(gè),即樣本空間中的基本事件只有有限個(gè);2.各試驗(yàn)的結(jié)果出現(xiàn)的可能性相等,即所有基本事件的發(fā)生是等可能的;3.試驗(yàn)的所有可能結(jié)果兩兩互不相容。對(duì)于古典概型,概率的定義:設(shè)樣本空間由 n 個(gè)等可能的基本事件所構(gòu)成,其中事件A包含有m個(gè)基本事件,則事件A的概率為m/n,即 P(

2、A)=m/n 這樣定義的概率稱為古典概率2概率的統(tǒng)計(jì)定義(經(jīng)驗(yàn)概率)n 在相同條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事件A發(fā)生的次數(shù)為m,那么m/n稱為隨機(jī)事件A的頻率;當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí),隨機(jī)事件A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把 p稱為隨機(jī)事件A的概率(probability)。2概率的運(yùn)算法則n 加法法則:互斥事件A和B的和事件的概率等于事件A和事件B的概率之和。即 P(A+B)=P(A)+P(B)。n 加法定理對(duì)于多個(gè)兩兩互斥的事件也成立。P(A+B+N)=P(A)+P(B)+P(N)P(A+B)=P(A)+P(B)-P(AB)乘法法則:n 如果A事件和 B事件為獨(dú)立事件,則

3、事件A與B事件同時(shí)發(fā)生的概率等于兩獨(dú)立事件概率的乘積,即: P(AB)=P(A) P(B)n 乘法定理對(duì)于n個(gè)相互獨(dú)立的事件也成立,即 P(A1A2 An)=P(A1) P(A2) P (An)書上例題第二節(jié) 常用離散變量的理論分布一、二項(xiàng)分布(一)貝努里試驗(yàn)及其概率函數(shù):Ø 指只有兩種可能結(jié)果的隨機(jī)試驗(yàn),我們將其中比較關(guān)注的結(jié)果稱為“成功”,另一個(gè)結(jié)果稱為“失敗”。Ø 將某隨機(jī)試驗(yàn)重復(fù)進(jìn)行n次,若各次試驗(yàn)結(jié)果互不影響,即每次試驗(yàn)結(jié)果出現(xiàn)的概率都不依賴于其它各次試驗(yàn)的結(jié)果,則稱n次試驗(yàn)是獨(dú)立的對(duì)于n次獨(dú)立的試驗(yàn)如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與 之一, 在每次試驗(yàn)中出

4、現(xiàn)A的概率是常數(shù)p(0<p<1), 因而出現(xiàn)對(duì)立事件 的概率是1-p=q,則稱這一串重復(fù)的獨(dú)立試驗(yàn)為n重貝努里試驗(yàn),簡(jiǎn)稱貝努里試驗(yàn)Ø 在n重貝努里試驗(yàn)中,事件 A 可能發(fā)生0,1,2,n次,來求事件 A 恰好發(fā)生k(0kn)次的概率Pn(k)。Ø 例:拋擲4次硬幣,正面朝上(A)出現(xiàn)2次的概率。先取n=4,k=2。在4次試驗(yàn)中,事件A發(fā)生2次的方式有以下C42種:一般,在n重貝努里試驗(yàn)中,事件A恰好發(fā)生k(0kn)次的概率為 k=0,1,2,n(二)二項(xiàng)分布的定義及性質(zhì)1、二項(xiàng)分布的定義:Ø 設(shè)隨機(jī)變量 x 所有可能取的值為零和正整數(shù):0,1,2,,n

5、,且有:Ø k=0,1,2,nØ 其中p0,q0,p+q=1,則稱隨機(jī)變量x服從參數(shù)為n和p的二項(xiàng)分布 ,記為: B(x;n,p)。Ø 二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。參數(shù)n稱為正整數(shù)離散參數(shù);p 是連續(xù)參數(shù),它能取0與1之間的任何數(shù)值(q=1p)。2、二項(xiàng)分布的性質(zhì):容易驗(yàn)證,二項(xiàng)分布具有概率分布的一切性質(zhì),即:(1)P(x=k)= Pn(k) (k=0,1,,n)(2)二項(xiàng)分布的概率之和等于1,即(3)(4)(5)(m1<m2)3、二項(xiàng)分布的圖形特征:二項(xiàng)分布的圖形由n和p兩個(gè)參數(shù)決定: (1)當(dāng)p值較小且n不大時(shí),分布是偏斜的。但隨著n增大 ,

6、分布逐漸趨于對(duì)稱; (2)當(dāng)p值趨于0.5時(shí),分布趨于對(duì)稱;(3)對(duì)于固定n及p,當(dāng)k增加時(shí) ,概率P(X=k) 先是隨之增加直至 達(dá)到最大值, 隨后單調(diào)減少。Ø 此外,在n較大,np、nq較接近時(shí) ,二項(xiàng)分布接近于正態(tài)分布;當(dāng)n時(shí),二項(xiàng)分布的極限分布是正態(tài)分布。(n30,np5,nq5時(shí),近似正態(tài)分布。)(三)二項(xiàng)分布概率計(jì)算及應(yīng)用條件二項(xiàng)分布的應(yīng)用條件有三:1.各觀察單位只具有互相對(duì)立 的一種結(jié)果,屬于二項(xiàng)分類資料;2.已知發(fā)生某一結(jié)果的概率為p,其對(duì)立結(jié)果的概率則為1p=q ,要求p是從大量觀察中獲得的穩(wěn)定數(shù)值;3.n個(gè)觀察單位的觀察結(jié)果互相獨(dú)立,即每個(gè)觀察單位的結(jié)果不會(huì)影響到

7、其它觀察單位的觀察結(jié)果(四)二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差Ø 統(tǒng)計(jì)學(xué)證明,服從二項(xiàng)分布B(n,p)的隨機(jī)變量之平均數(shù)、標(biāo)準(zhǔn)差與參數(shù)n、p有如下關(guān)系:當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生次數(shù)k表示時(shí) = np =三.幾何分布(Geometry distribution) 在貝努里試驗(yàn)中,每次試驗(yàn)成功的概率為p,失敗的概率為q=1-p, 設(shè)試驗(yàn)進(jìn)行到第 次才出現(xiàn)成功。 (xi)的分布列為 P k=1.2 (k=1.2)是幾何級(jí)數(shù)的 一般項(xiàng)。因此稱它為幾何分布記為 g(k;p)。四、超幾何分布Ø 對(duì)于抽樣調(diào)查,只有在大群體(即總體比樣本相對(duì)大很多)的情況下,二項(xiàng)分布的獨(dú)立試驗(yàn)要求才能夠近似得到滿足(

8、重復(fù)抽樣)。但如果研究對(duì)象是小群體,這時(shí)總體單位不多,一般只有幾十個(gè)。假定總體只有兩類,其中K個(gè)成功類,(N-K)個(gè)為失敗類,這時(shí)如果從總體中抽取一容量為n的樣本,那么成功的概率將不再恒定,也就是二相分布所要求的獨(dú)立試驗(yàn)的條件不再被滿足,而超幾何分布將適合于這種小群體的研究。形式:P(X=k)= , K=0,1,min(n,M)超幾何概型,例:產(chǎn)品檢驗(yàn)。有N個(gè)產(chǎn)品(其中有K個(gè)合格品)從N個(gè)產(chǎn)品中取n個(gè)檢驗(yàn),求n中有X個(gè)合格品的概率。(即X合格品個(gè)數(shù)) 不回置抽樣!期望:E(X)=nK/N=np方差:D(X)=npq(N-n)/(N-1)當(dāng)研究對(duì)象是小群體,并且采用不回置抽樣時(shí),成功的概率將不再

9、恒定,也就是二項(xiàng)分布所要求的獨(dú)立試驗(yàn)的條件不再被滿足,而超幾何分布將適合于這種情況的研究。 當(dāng)群體規(guī)模逐漸增大,以致不回置抽樣可以作為回置抽樣來處理,可用二項(xiàng)分布來近似超幾何分布。一般當(dāng)n/N0.1時(shí),這種近似就是可以采用的。五、泊松分布Ø 泊松分布是一種描述和分析稀有事件的概率分布。要觀察到這類事件,樣本含量 n 必須很大 。Ø 例:盒子中裝有999個(gè)黑棋子,一個(gè)白棋子,在一次抽樣中,抽中白棋子的概率1/1000(一)泊松分布的定義與特征Ø 1、定義:若隨機(jī)變量x(x=k)只取零和正整數(shù)值0,1,2,且其概率分布為 x=0,1,(稀有事件出現(xiàn)的次數(shù))Ø

10、 其中0;e 是自然對(duì)數(shù)的底數(shù)(e=2.71828) ,則稱 x 服從參數(shù)為的泊松分布(Poissons distribution),記為P(x;)2、泊松分布重要的特征Ø 平均數(shù)和方差相等,都等于常數(shù),即 =2=np 3、泊松分布的圖形特征: 是泊松分布所依賴的唯一參數(shù)。 值愈小分布愈偏倚,隨著的增大,分布趨于對(duì)稱。 當(dāng)= 20時(shí)分布接近于正態(tài)分布;當(dāng)=50時(shí),可以認(rèn)為波松分布呈正態(tài)分布。 在實(shí)際工作中,當(dāng)20時(shí)就可以用正態(tài)分布來近似地處理泊松分布的問題(二)泊松分布的概率計(jì)算Ø 泊松分布的概率計(jì)算依賴于參數(shù),只要參數(shù)確定了,把k=0,1,2,代入公式即可求得各項(xiàng)的概率。

11、但是在大多數(shù)服從泊松分布的實(shí)例中,分布參數(shù)往往是未知的,只能從所觀察的隨機(jī)樣本中計(jì)算出相應(yīng)的樣本平均數(shù)作為的估計(jì)值,將其代替公式中的,計(jì)算出k = 0,1,2,時(shí)的各項(xiàng)概率。 例:一個(gè)合訂本共100頁,假定每頁上印刷錯(cuò)誤的,數(shù)目X服從泊松分布(=1),計(jì)算該合訂本中各頁的印刷錯(cuò)誤都不超過4個(gè)的概率。解: 由題目P(x;1).P(X4)= P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)+ P(X=4).查表求值 =?+?+?+?+?所求概率為 (?)100=0.0045。【例】為監(jiān)測(cè)飲用水的污染情況,現(xiàn)檢驗(yàn)?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù),共得400個(gè)記錄如下經(jīng)計(jì)算得每毫升水中平均細(xì)菌數(shù)

12、 =0.500,方差S2=0.496。兩者很接近, 故可認(rèn)為細(xì)菌數(shù)/ml(水) 服從泊松分布。以 =0.500代替公式中的,得 (k=0,1,2)計(jì)算結(jié)果如下表。 細(xì)菌數(shù)的泊松分布Ø 可見細(xì)菌數(shù)的頻率分布與=0.5的波松分布是相當(dāng)吻合的,進(jìn)一步說明用波松分布描述單位容積(或面積)中細(xì)菌數(shù)的分布是適宜的。Ø 注意:泊松分布的應(yīng)用條件與二項(xiàng)分布相似(三)泊松分布與二項(xiàng)分布泊松定理: 設(shè)隨機(jī)變量B(x;n,p)。當(dāng) n很大時(shí),p 很小。有以下近似式: 其中=np實(shí)際計(jì)算中,n10,p0.1,近似效果就較好,而n 100, np 10 時(shí)近似效果就很好。由泊松定理,n重貝努里試驗(yàn)中

13、稀有事件出現(xiàn)的次數(shù)近似地服從泊松分布。例見:P133,例(四)泊松分布與正態(tài)分布的關(guān)系Ø 當(dāng)l較小時(shí), Piosson分布呈偏態(tài)分布,隨著l增大,迅速接近正態(tài)分布,當(dāng)l ³20時(shí),可以認(rèn)為近似正態(tài)分布。第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布一、正態(tài)分布正態(tài)分布是最重要的概率分布。因?yàn)? 第一,許多自然現(xiàn)象與社會(huì)現(xiàn)象,都可用正態(tài)分布加以敘述; 第二,許多概率分布以正態(tài)分布為其極限; 第三,許多統(tǒng)計(jì)量的抽樣分布呈現(xiàn)正態(tài)分布。 因此,許多統(tǒng)計(jì)分析方法都是以正態(tài)分布為基礎(chǔ)的(一)正態(tài)分布的概率函數(shù)若連續(xù)型隨機(jī)變量x的概率分布密度函數(shù)為 其中為平均數(shù),2為方差,則稱隨機(jī)變量x服從正態(tài)分

14、布(normal distribztion),記為xN(,2)。相應(yīng)的概率分布函數(shù)為 標(biāo)準(zhǔn)正態(tài)分布的三個(gè)常用概率99.74%95.46%68.26%(二) 正態(tài)分布的特征1. 正態(tài)分布密度曲線是單峰、對(duì)稱的懸鐘形曲線,對(duì)稱軸為x =;2. f(x) 在x=處達(dá)到極大,極大值 ; 3. f(x)是非負(fù)函數(shù),以x軸為漸近線,分布從-至+; 4. 曲線在x=±處各有一個(gè)拐點(diǎn),即曲線在(-,-)和(+,+) 區(qū)間上是下凸的,在-,+區(qū)間內(nèi)是上凸的;5. 正態(tài)分布有平均數(shù)和標(biāo)準(zhǔn)差兩個(gè)參數(shù)。是位置參數(shù),是變異度參數(shù)。6. 分布密度曲線與橫軸所夾面積為1,即: (三)標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布是依賴于參

15、數(shù)和的一簇分布。將一般的N(,2)轉(zhuǎn)換為= 0,2=1的正態(tài)分布,應(yīng)用就方便了。稱=0,2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作(z)和(z),得:2221)(zez-=pjdzezzzò¥-=22121)(pf隨機(jī)變量z服從標(biāo)準(zhǔn)正態(tài)分布,記作zN(0,1)。 v 對(duì)于任何一個(gè)服從正態(tài)分布N(,2)的隨機(jī)變量x,都可以通過標(biāo)準(zhǔn)化變換: z=(x-)將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量z。z稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差(四)正態(tài)分布的概率計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算 設(shè)z服從標(biāo)準(zhǔn)正態(tài)分布,則z在z1,z2 )何內(nèi)取值的概率為: (z2)(z1

16、)v 而(z1)與(z2)可由附表查得【例】 已知z-N(0,1),試求: (1) P(z-1.64)? (2) P (z2.58)=? (3) P (z2.56)=? (4) P(0.34z1.53) =? 關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記: P(-1z1)=0.6826 P(-2z2)=0.9546 P(-3z3)=0.9974P(-1.96z1.96)=0.95 P (-2.58z2.58)=0.99 z在上述區(qū)間以外取值的概率分別為: P(z1)=2(-1)=1- P(-1z1) =1-0.6826=0.3174 P(z2)=2(-2) =1- P(-2z2)=1-0.9545=

17、0.0455 P(z3)=1-0.9973=0.0027 P(z1.96)=1-0.95=0.05 P(z2.58)=1-0.99=0.01 一般正態(tài)分布的概率計(jì)算v 正態(tài)分布密度曲線和橫軸圍成的區(qū)域,其面積為1,是一個(gè)必然事件。v 若隨機(jī)變量x服從正態(tài)分布N(,2),則x的取值落在任意區(qū)間x1, x2)的概率,記作P(x1 xx2),等于這部分曲邊梯形面積。即:對(duì)上式作變換z=(x-),得dx=dz,故有)()(122121221zzdzezzzF-F=ò-p其中,z1=(x1-),z2=(x2-))這表明服從正態(tài)分布N(,2)的隨機(jī)變量x在x1,x2)內(nèi)取值的概率,等于服從標(biāo)準(zhǔn)正

18、態(tài)分布的隨機(jī)變量z在(x1-), (x2-))內(nèi)取值的概率。因此,計(jì)算一般正態(tài)分布的概率時(shí),只要將區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化),就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率了。 【例】設(shè)x服從=30.26,2=5.102的正態(tài)分布,試求P(21.64x32.98)。 令 則z服從標(biāo)準(zhǔn)正態(tài)分布,故 =P(-1.69z0.53) =(0.53)-(-1.69) =0.7019-0.04551=0.6564v 關(guān)于一般正態(tài)分布,以下幾個(gè)概率是經(jīng)常用到的。 P(-x+)=0.6826 P(-2x+2) =0.9546 P (-3x+3) =0.9974 P (-1.96x+1.96)=0.95 P

19、(-2.58x+2.58)=0.993、正態(tài)分布分位點(diǎn)計(jì)算正態(tài)分布的分位點(diǎn)的定義標(biāo)準(zhǔn)正態(tài)分布 密度函數(shù)圖形為圖中的點(diǎn) 稱為標(biāo)準(zhǔn)正態(tài)分布的 的分位點(diǎn),相當(dāng)于已知 求其中的 4、單側(cè)概率與雙側(cè)概率v 統(tǒng)計(jì)學(xué)中,把隨機(jī)變量 x 落在區(qū)間(-k,+k)之外的概率稱為雙側(cè)(兩尾)概率,記作。v 對(duì)應(yīng)于雙側(cè)概率可以求得隨機(jī)變量x小于k或大于+k的概率,稱為單側(cè)概率,記作2。如,x落在(-1.96,+1.96)之外的雙側(cè)概率為0.05,而單側(cè)概率為0.025。即P(x-1.96)=P(x+1.96)=0.025v x落在(-2.58,+2.58)之外的雙側(cè)概率為0.01,而單側(cè)概率 P(x-2.58)= P

20、(x +2.58)=0.005 (五)二項(xiàng)分布及泊松分布與正態(tài)分布的關(guān)系v 對(duì)于二項(xiàng)分布,在n,p0,且np=(較小常數(shù))情況下,二項(xiàng)分布趨于泊松分布。在這種場(chǎng)合,泊松分布中的參數(shù) 用二項(xiàng)分布的np代之;在n,p0.5時(shí),二項(xiàng)分布趨于正態(tài)分布。在這種場(chǎng)合,正態(tài)分布中的 、2用二項(xiàng)分布的np、npq代之。在實(shí)際計(jì)算中,當(dāng)p0.1且n很大時(shí) , 二項(xiàng)分布可由泊松分布近似;當(dāng)p0.1且n很大時(shí) ,二項(xiàng)分布可由正態(tài)分布近似。對(duì)于泊松分布,當(dāng)時(shí),泊松分布以正態(tài)分布為極限。在實(shí)際計(jì)算中,當(dāng)20時(shí),用泊松分布中的代替正態(tài)分布中的及2,即可由后者對(duì)前者進(jìn)行近似計(jì)算。 二、抽樣分布與中心極限定理v 研究總體與從

21、中抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中心內(nèi)容。對(duì)這種關(guān)系的研究可從兩方面著手:v 一是從總體到樣本,這就是研究抽樣分布(sampling distribution)的問題; v 二是從樣本到總體,這就是統(tǒng)計(jì)推斷(statistical inference)問題(一)抽樣分布的含義與無偏估計(jì)量1、抽樣分布的含義:統(tǒng)計(jì)推斷是以總體分布和樣本抽樣分布的理論關(guān)系為基礎(chǔ)的。由總體中隨機(jī)地抽取若干個(gè)體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計(jì)量也將隨樣本的不同而有所不同。因而樣本統(tǒng)計(jì)量也是隨機(jī)變量,也有其概率分布,我們把統(tǒng)計(jì)量的概率分布稱為抽樣分布。2、無偏估計(jì)在統(tǒng)計(jì)學(xué)上,如果所有可能樣本的某一統(tǒng)計(jì)數(shù)的平均

22、數(shù)等于總體的相應(yīng)參數(shù),則稱該統(tǒng)計(jì)數(shù)為總體相應(yīng)參數(shù)的無偏估計(jì)值。設(shè)有一N=3的總體,具有變量3,4,5;求得=4,2=0.6667, =0.8165現(xiàn)以n=2作獨(dú)立的回置抽樣,總共得Nn=32=9個(gè)樣本。抽樣結(jié)果列入下表:N=3 n=2時(shí)抽樣的平均數(shù) 方差 標(biāo)準(zhǔn)差樣本編號(hào)樣本值平均數(shù)方差標(biāo)準(zhǔn)差1234567893,33,43,54,34,44,55,35,45,53.03.54.03.54.04.54.04.55.00.00.52.00.50.00.52.00.50.00.00000.70711.41420.70710.00000.70711.41420.70710.0000 36.0

23、6.05.6567從上表的資料可以求出:樣本平均數(shù)的平均數(shù)x=4樣本方差的平均數(shù)S2=0.6667=2樣本標(biāo)準(zhǔn)差的平均數(shù)S=0.62850.8165= 所以,惟有樣本標(biāo)準(zhǔn)差s的平均數(shù)不是總體標(biāo)準(zhǔn)差的無偏差估計(jì)值。其余兩個(gè)參數(shù)為無偏差估計(jì)值。(二)樣本平均數(shù)的抽樣分布v 1、樣本平均數(shù)抽樣分布的含義及其參數(shù)設(shè)有一個(gè)總體 ,總體平均數(shù)為,方差為2,總體中各變數(shù)為xi,將 此總體稱為原總體?,F(xiàn)從這個(gè)總體中隨機(jī)抽取含量為n的樣本,樣本平均數(shù)記為 ??梢栽O(shè)想,從原總體中可抽出很多甚至無窮多個(gè)含量為n的樣本。如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到 個(gè)樣本(所有可能的樣本個(gè)

24、數(shù))。 抽樣所得到的每一個(gè)樣本可以計(jì)算一個(gè)平均數(shù),全部可能的樣本都被抽取后可以得到許多平均數(shù)。 如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來便構(gòu)成一個(gè)新的總體,平均數(shù)就成為這個(gè)新總體的變量。 由平均數(shù)構(gòu)成的新總體的分布,稱為平均數(shù)的抽樣分布。 隨機(jī)樣本的任何一種統(tǒng)計(jì)數(shù)都可以是一個(gè)變量,這種變量的分布稱為統(tǒng)計(jì)數(shù)的抽樣分布。v 由這些樣本算得的平均數(shù)與原總體平均數(shù)相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機(jī)抽樣造成的,稱為抽樣誤差(sampling error)。由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體,其平均數(shù)和標(biāo)準(zhǔn)差分別記為 和 。 是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡(jiǎn)稱標(biāo)準(zhǔn)誤(stan

25、dard error),它表示平均數(shù)抽樣誤差的大小。統(tǒng)計(jì)學(xué)上已證明總體的兩個(gè)參數(shù)與x 總體的兩個(gè)參數(shù)有如下關(guān)系:2、中心極限定理設(shè)有一個(gè)N=4的有限總體,變數(shù)為2,3,3,4。根據(jù)=xN和2=(x-)2N求得該總體的、2、為: =3,2=12,=1/21/2=0.707v 從有限總體作回置隨機(jī)抽樣,所有可能的樣本數(shù)為Nn其中n為樣本含量 。以上述總體而論,如果從中抽取n=2的樣本,共可得 42=16 個(gè)樣本;如果樣本含量n為4,則一共可抽得44=256個(gè)樣本。分別求這些樣本的平均數(shù) ,其次數(shù)分布如下表所示。v 在n=2的試驗(yàn)中,樣本平均數(shù)抽樣總體的平均數(shù)、方差與標(biāo)準(zhǔn)差分別為 =4/16=1/4

26、=(1/2)/2= 2/n表 N=4, n=2和n=4時(shí)的次數(shù)分布同理,可得n=4時(shí):驗(yàn)證了 的正確性。也可以將表中兩個(gè)樣本平均數(shù)的抽樣總體作次數(shù)分布圖。 由以上模擬抽樣試驗(yàn)可以看出,雖然原總體并非正態(tài)分布,但從中隨機(jī)抽取樣本,即使樣本含量很小,樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本含量 n 的增大,樣本平均數(shù)的分布愈來愈從不連續(xù)趨向于連續(xù)的正態(tài)分布。當(dāng)n30時(shí), 的分布就近似正態(tài)分布了。X變量與 變量概率分布間的關(guān)系可由下列兩個(gè)定理說明: (1) 若隨機(jī)變量x服從正態(tài)分布N(,2);x1、x2、xn,是由x 總體得來的隨機(jī)樣本,則統(tǒng)計(jì)量 =xn的概率分布也是正態(tài)分布,且有 , 即服從

27、正態(tài)分布N(,2n)。(2) 若隨機(jī)變量x服從平均數(shù)是,方差是2的分布(不是正態(tài)分布); x1、x2、xn,是由此總體得來的隨機(jī)樣本,則統(tǒng)計(jì)量 =xn的概率分布,當(dāng)n相當(dāng)大時(shí)逼近正態(tài)分布N(,2n)。這就是中心極限定理。 中心極限定理告訴我們:不論x變量是連續(xù)型還是離散型,也無論x服從何種分布,一般只要n30,就可認(rèn)為 的分布是正態(tài)分布。若x的分布不很偏斜,在n20時(shí) , 的分布就近似于正態(tài)分布了由中心極限定理知,只要樣本容量適當(dāng)大,不論總體分布形狀如何,其 的分布都可看作為正態(tài)分布,且具平均數(shù) 和方差 。在實(shí)際應(yīng)用上,如n>30就可以應(yīng)用這一定理。 平均數(shù)的標(biāo)準(zhǔn)化分布是將上述平均數(shù) x

28、轉(zhuǎn)換為z變數(shù)。nxxzxsmsm)()(-=-=、標(biāo)準(zhǔn)誤v 標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差) 的大小反映樣本平均數(shù) 的抽樣誤差的大小,即精確性的高低。標(biāo)準(zhǔn)誤大,說明各樣本平均數(shù) 間差異程度大,樣本平均數(shù)的精確性低。反之, 小,樣本平均數(shù)的精確性高。 的大小與原總體的標(biāo)準(zhǔn)差成正比,與樣本含量n的平方根成反比。從某特定總體抽樣,因?yàn)槭且怀?shù),所以只有增大樣本含量才能降低樣本平均數(shù) 的抽樣誤差。 在實(shí)際工作中,總體標(biāo)準(zhǔn)差往往是未知的,因而無法求得 。此時(shí),可用樣本標(biāo)準(zhǔn)差S估計(jì)。于是,以 估計(jì) 。記 為 , 稱作樣本標(biāo)準(zhǔn)誤或均數(shù)標(biāo)準(zhǔn)誤。樣本標(biāo)準(zhǔn)誤 是平均數(shù)抽樣誤差的估計(jì)值。若樣本中各觀測(cè)值為 x1、x

29、2、xn,則注意:樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個(gè)統(tǒng)計(jì)量。二者的區(qū)別是樣本標(biāo)準(zhǔn)差S是反映樣本中各觀測(cè)值的變異程度,它的大小說明了 對(duì)該樣本代表性的強(qiáng)弱。樣本標(biāo)準(zhǔn)誤是樣本平均數(shù) 的標(biāo)準(zhǔn)差,它是抽樣誤差的估計(jì)值,其大小說明了樣本間變異程度的大小及精確性的高低。(二) 兩個(gè)獨(dú)立樣本平均數(shù)差數(shù)的分布假定有兩個(gè)正態(tài)總體各具有平均數(shù)和標(biāo)準(zhǔn)差為 , 和 , ,從第一個(gè)總體隨機(jī)抽取n1個(gè)觀察值,同時(shí)獨(dú)立地從第二個(gè)總體隨時(shí)機(jī)抽取n2個(gè)觀察值。這樣計(jì)算出樣本平均數(shù)和標(biāo)準(zhǔn)差 ,s1和 ,s2。從統(tǒng)計(jì)理論可以推導(dǎo)出其樣本平均數(shù)的差數(shù)( )的抽樣分布,具有以下特性(1) 如果兩個(gè)總體各作正態(tài)分布,則其樣本

30、平均數(shù)差數(shù)( )準(zhǔn)確地遵循正態(tài)分布律,無論樣本容量大或小,都有N( , )。 (2) 兩個(gè)樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個(gè)總體平均數(shù)的差數(shù),即 (3) 兩個(gè)獨(dú)立的樣本平均數(shù)差數(shù)分布的方差等于兩個(gè)總體的樣本平均數(shù)的方差總和,即 其差數(shù)標(biāo)準(zhǔn)差為: 這個(gè)分布也可標(biāo)準(zhǔn)化,獲得z值nnyyz2221212121)()(ssmm+-=小結(jié):l 若兩個(gè)樣本抽自于同一正態(tài)總體,則其平均數(shù)差數(shù)的抽樣分布不論容量大小亦作正態(tài)分布具:l 若兩個(gè)樣本抽自于同一總體,但并非正態(tài)總體,則其平均數(shù)差數(shù)的抽樣分布按中心極限定理在n1和n2相當(dāng)大時(shí)(大于30)才逐漸接近于正態(tài)分布。l 若兩個(gè)樣本抽自于兩個(gè)非正態(tài)總體,當(dāng)n1

31、和n2相當(dāng)大、而 與 相差不太遠(yuǎn)時(shí),也可近似地應(yīng)用正態(tài)接近方法估計(jì)平均數(shù)差數(shù)出現(xiàn)的概率,當(dāng)然這種估計(jì)的可靠性得依兩總體偏離正態(tài)的程度和相差大小而轉(zhuǎn)移。(三)二項(xiàng)總體的抽樣分布、 二項(xiàng)總體的分布參數(shù)(成數(shù))平均數(shù): 方差: 標(biāo)準(zhǔn)差: 、 樣本平均數(shù)(成數(shù))的抽樣分布 從二項(xiàng)總體進(jìn)行抽樣得到樣本,樣本平均數(shù)(成數(shù))抽樣分布的參數(shù)為:平均數(shù): 方差: 標(biāo)準(zhǔn)誤: (四)不重復(fù)抽樣的修正系數(shù)前所講的抽樣分布和抽樣平均誤差的計(jì)算公式,都是就重復(fù)抽樣而言的??梢宰C明,采用不重復(fù)抽樣時(shí),平均數(shù)和比例的抽樣平均誤差應(yīng)為:可見,不重復(fù)抽樣的抽樣平均誤差公式比重復(fù)抽樣的相應(yīng)公式多一個(gè)系數(shù) 這個(gè)系數(shù)稱為不重復(fù)抽樣修正

32、系數(shù)。當(dāng)N很大時(shí), (其中:n/N為抽樣比例)。 實(shí)際中,當(dāng)抽樣比例很小時(shí),(一般認(rèn)為小于5%),不重復(fù)抽樣的抽樣誤差常采用重復(fù)抽樣的公式計(jì)算。三、t 分布1、t 分布的定義: 若xN(, 2), 則 N(, 2/n)。 將隨機(jī)變量 標(biāo)準(zhǔn)化得: ,則zN(0,1)。 當(dāng)總體標(biāo)準(zhǔn)差未知時(shí), 以樣本標(biāo)準(zhǔn)差S代替所得到的統(tǒng)計(jì)量 記為t。在計(jì)算 時(shí),由于采用S來代替,使得t 變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布(tdistribztion)。它的概率分布密度函數(shù)如下: 式中,t的取值范圍是(-,+); df=n-1為自由度。 - 函 數(shù)自由度df(degree of freedom )的含義 df=k=n-1T 分布密度曲線2、t 分布的圖形特征t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布。 (1)t 分布受自由度的制約,每一個(gè)自由度都有一條t分布密度曲線。(2)t分布密度曲線以縱軸為對(duì)稱軸,左右對(duì)稱,且在t0時(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論