




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
理論分布與抽樣分布第一頁,共四十八頁,編輯于2023年,星期日Section3.1
二項(xiàng)分布
TheBinomialDistributions第二頁,共四十八頁,編輯于2023年,星期日一、二項(xiàng)分布設(shè)定
TheBinomialSetting固定的觀察次數(shù)n。n次的觀察都獨(dú)立,每次的觀察都不會(huì)對(duì)其他觀察提供任何信息。每次的觀察都只有兩種可能的結(jié)果,多假設(shè)為“成功”或“失敗”兩種。每次的觀察“成功”的概率都一樣,設(shè)定為p。第三頁,共四十八頁,編輯于2023年,星期日二、二項(xiàng)分布
BinomialDistribution滿足二項(xiàng)分布設(shè)定的試驗(yàn),以X記錄n次觀察中“成功”的次數(shù),則稱X的分布為參數(shù)為n與p的二項(xiàng)分布(binomial),記為B(n,p)。X的所有可能取值為{0,1,…,n}。對(duì)應(yīng)的概率函數(shù)為P(X=x)=P(x)。第四頁,共四十八頁,編輯于2023年,星期日
[例]有一批食品,其合格率為0.85,今在該批食品中隨機(jī)抽取6分該食品,求正好有5份食品合格的概率?
由前述所知,在二項(xiàng)分布中n辭試驗(yàn)正好有k次發(fā)生的概率公式就:
三、二項(xiàng)分布概率的計(jì)算第五頁,共四十八頁,編輯于2023年,星期日若問最多有4個(gè)合格的概率為多少?則應(yīng)該應(yīng)用累積函數(shù),即第六頁,共四十八頁,編輯于2023年,星期日四、二項(xiàng)分布的期望值與標(biāo)準(zhǔn)差期望值:E(X)=np方差: Var(X)=np(1-p)標(biāo)準(zhǔn)差:第七頁,共四十八頁,編輯于2023年,星期日Section3.2
NormalDistributions
正態(tài)分布第八頁,共四十八頁,編輯于2023年,星期日一、特點(diǎn)正態(tài)曲線所有正態(tài)曲線都有相同的外型具有對(duì)稱、單峰及鐘形的特性。正態(tài)曲線所代表的分布即為正態(tài)分布(normaldistribution)每一正態(tài)分布都有其平均值μ與標(biāo)準(zhǔn)差σ
第九頁,共四十八頁,編輯于2023年,星期日ms第十頁,共四十八頁,編輯于2023年,星期日正態(tài)曲線σ較大ms第十一頁,共四十八頁,編輯于2023年,星期日正態(tài)曲線的拐點(diǎn)拐點(diǎn)落在一個(gè)σ處拐點(diǎn)落在-σ處第十二頁,共四十八頁,編輯于2023年,星期日二、為什么這么重要Gooddescriptionsforsomedistributionsofrealdata身高,體重,考試成績(jī)GoodapproximationstotheresultsofmanykindsofchanceoutcomesTossingacoinmanytimesManystatisticalinferenceproceduresarebasedonnormaldistributions第十三頁,共四十八頁,編輯于2023年,星期日三、68-95-99.7規(guī)則正態(tài)分布有其特定的數(shù)據(jù)分布規(guī)則:平均值為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布68%的觀察資料落在m的1σ之內(nèi)95%的觀察資料落在m的2σ之內(nèi)99.7%的觀察資料落在m的3σ之內(nèi)第十四頁,共四十八頁,編輯于2023年,星期日0123-1-2-3mm+sm+2sm+3sm-sm-2sm-3s68%的資料95%的資料99.7%的資料第十五頁,共四十八頁,編輯于2023年,星期日四、變量標(biāo)準(zhǔn)化(Standardization)令觀察值x服從平均值為μ,標(biāo)準(zhǔn)差為σ的分布,則x的標(biāo)準(zhǔn)化值(standardizedvalue)定義為標(biāo)準(zhǔn)化值又稱為z-值(z-score)。第十六頁,共四十八頁,編輯于2023年,星期日標(biāo)準(zhǔn)化變量可以證明z的平均值為0z的標(biāo)準(zhǔn)差為1
第十七頁,共四十八頁,編輯于2023年,星期日五、標(biāo)準(zhǔn)正態(tài)分布變量X服從平均值為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布,簡(jiǎn)記為X~N(μ,σ2)。X經(jīng)過標(biāo)準(zhǔn)化后為Z(=(X-μ)/s),則Z也服從正態(tài)分布,并且平均值為0,標(biāo)準(zhǔn)差為1,即Z
~N(0,1)。我們稱Z服從標(biāo)準(zhǔn)正態(tài)(standardnormal)。第十八頁,共四十八頁,編輯于2023年,星期日六、標(biāo)準(zhǔn)正態(tài)表z表列數(shù)字是z左邊的面積z=-0.44z左邊的面積為0.33-0.440.33第十九頁,共四十八頁,編輯于2023年,星期日z表列數(shù)字是z左邊的面積z=0.44z左邊的面積為0.67第二十頁,共四十八頁,編輯于2023年,星期日七、雙側(cè)臨界值在標(biāo)準(zhǔn)正態(tài)曲線圖下,右方與左方的面積和為a,則稱為標(biāo)準(zhǔn)正態(tài)分布概率為a的雙側(cè)臨界值。可查表。m=0面積為a/2面積為a/2第二十一頁,共四十八頁,編輯于2023年,星期日八、單側(cè)臨界值在標(biāo)準(zhǔn)正態(tài)曲線圖下,右方的面積為a,則稱為標(biāo)準(zhǔn)正態(tài)分布概率為a的單側(cè)臨界值??刹楸?。m=0面積為a第二十二頁,共四十八頁,編輯于2023年,星期日
[例]假定y是一隨機(jī)變數(shù)具有正態(tài)分布,平均數(shù)
=30,標(biāo)準(zhǔn)差=5,試計(jì)算小于26,小于40的概率,介乎26和40區(qū)間的概率以及大于40的概率。首先計(jì)算:先將x轉(zhuǎn)換為u值
九、計(jì)算第二十三頁,共四十八頁,編輯于2023年,星期日同理可得:
FN(40)=0.9773
所以:P(26<x≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654
P(x>40)=1-P(x≤40)=1-0.9773=0.0227查附表,當(dāng)u=-0.8時(shí),F(xiàn)N(26)=0.2119,說明這一分布從-∞到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,x≤26概率為0.2119.第二十四頁,共四十八頁,編輯于2023年,星期日[例]在應(yīng)用正態(tài)分布時(shí),經(jīng)常要討論隨機(jī)變數(shù)x離其平均數(shù)的差數(shù)大于或小于若干個(gè)值的概率。例如計(jì)算離均差絕對(duì)值等于小于和等于大于1的概率為:也可以簡(jiǎn)寫為
第二十五頁,共四十八頁,編輯于2023年,星期日相應(yīng)地,離均差絕對(duì)值等于小于2、等于大于2、等于小于3和等于大于3的概率值為:第二十六頁,共四十八頁,編輯于2023年,星期日[例]計(jì)算正態(tài)分布曲線的中間概率為0.99時(shí),其y或u值應(yīng)等于多少?
因?yàn)檎龖B(tài)分布是對(duì)稱的,故在曲線左邊從-∞到-
u的概率和在曲線右邊從u到∞的概率都應(yīng)等于1/2(1-0.99)=0.005。查表,u=-2.58時(shí),fN(x)
=0.00494≈0.005。于是知,當(dāng)±2.58時(shí),在其范圍內(nèi)包括99%的變量,僅有1%變量在此范圍之外。上述結(jié)果寫作:第二十七頁,共四十八頁,編輯于2023年,星期日同理可求得:第二十八頁,共四十八頁,編輯于2023年,星期日同理,亦可寫成:以上
乃正態(tài)曲線下左邊一尾x從-∞到
上的面積和右邊一尾y從到∞上的面積之和,亦可寫成:第二十九頁,共四十八頁,編輯于2023年,星期日Section3.3
SamplingDistributions
抽樣分布第三十頁,共四十八頁,編輯于2023年,星期日統(tǒng)計(jì)學(xué)的一個(gè)主要任務(wù)是研究總體和樣本之間的關(guān)系。
兩個(gè)方向從總體到樣本的方向,即本節(jié)所要討論的抽樣分布。從樣本到總體的方向,即統(tǒng)計(jì)推斷問題。抽樣分布(samplingdistribution)是統(tǒng)計(jì)推斷的基礎(chǔ)。第三十一頁,共四十八頁,編輯于2023年,星期日一、統(tǒng)計(jì)數(shù)的抽樣及其分布參數(shù)從總體中隨機(jī)抽樣得到樣本,獲得樣本觀察值后可以計(jì)算一些統(tǒng)計(jì)數(shù),統(tǒng)計(jì)數(shù)分布稱為抽樣分布。抽樣
復(fù)置抽樣,指將抽得的個(gè)體放回總體后再繼續(xù)抽樣不復(fù)置抽樣,指將抽得的個(gè)體不放回總體而繼續(xù)進(jìn)行抽樣第三十二頁,共四十八頁,編輯于2023年,星期日(一)樣本平均數(shù)的抽樣及其分布參數(shù)總體隨機(jī)樣本123無窮個(gè)樣本……
如圖從一個(gè)總體進(jìn)行隨機(jī)抽樣可以得到許多樣本,如果總體是無限總體,那么可以得到無限多個(gè)隨機(jī)樣本。
第三十三頁,共四十八頁,編輯于2023年,星期日如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到個(gè)樣本(所有可能的樣本個(gè)數(shù))。抽樣所得到的每一個(gè)樣本可以計(jì)算一個(gè)平均數(shù),全部可能的樣本都被抽取后可以得到許多平均數(shù),如等。如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來便構(gòu)成一個(gè)新的總體,平均數(shù)就成為這個(gè)新總體的變量。由平均數(shù)構(gòu)成的新總體的分布,稱為平均數(shù)的抽樣分布。隨機(jī)樣本的任何一種統(tǒng)計(jì)數(shù)都可以是一個(gè)變量,這種變量的分布稱為統(tǒng)計(jì)數(shù)的抽樣分布。除平均數(shù)抽樣分布外還有總和數(shù)、方差的抽樣分布等。第三十四頁,共四十八頁,編輯于2023年,星期日新總體與母總體在特征參數(shù)上存在函數(shù)關(guān)系。以平均數(shù)抽樣分布為例,這種關(guān)系可表示為以下兩個(gè)方面。
(1)該抽樣分布的平均數(shù)與母總體的平均數(shù)相等。(2)該抽樣分布的方差與母總體方差間存在如下關(guān)系:
其中n為樣本容量。抽樣分布的標(biāo)準(zhǔn)差又稱為標(biāo)準(zhǔn)誤,它可以度量抽樣分布的變異。第三十五頁,共四十八頁,編輯于2023年,星期日設(shè)有一總體N=3(例2,4,6)。以樣本容量n=1、n=2、n=4及n=8,從總體中進(jìn)行復(fù)置抽樣,抽出全部樣本于表1。表1中列出這些不同樣本容量的抽樣分布,并在圖1用方柱形圖表示其分布形狀。由表中第一列當(dāng)N=3,n=1的總體平均數(shù)和方差為:
當(dāng)樣本容量依次為2、4、8時(shí),其相應(yīng)為4、4、4;其相應(yīng)為4/3、2/3、1/3。即,。第三十六頁,共四十八頁,編輯于2023年,星期日n=1n=2n=4n=8yffff24611123456123212.02.53.03.54.04.55.05.56.0141016191610412.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.001836112266504784101611071016784504266112368139816561平均數(shù)4444方差8/34/32/31/3表1各種不同樣本容量的樣本平均數(shù)()的抽樣分布
第三十七頁,共四十八頁,編輯于2023年,星期日n=1n=2圖4.15各種不同樣本容量的
分布方柱形圖第三十八頁,共四十八頁,編輯于2023年,星期日?qǐng)D4.15各種不同樣本容量的
分布方柱形圖n=4n=8第三十九頁,共四十八頁,編輯于2023年,星期日(二)兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣及其分布參數(shù)如果從一個(gè)總體隨機(jī)地抽取一個(gè)樣本容量為n1的樣本,同時(shí)隨機(jī)獨(dú)立地從另一個(gè)總體抽取一個(gè)樣本容量為n2的樣本,那么可以得到分別屬于兩個(gè)總體的樣本,這兩個(gè)獨(dú)立隨機(jī)抽取的樣本平均數(shù)間差數(shù)()的抽樣分布參數(shù)與兩個(gè)母總體間存在如下關(guān)系:(1)該抽樣分布的平均數(shù)與母總體的平均數(shù)之差相等。(2)該抽樣分布的方差與母總體方差間的關(guān)系為:第四十頁,共四十八頁,編輯于2023年,星期日二、正態(tài)總體的抽樣分布(一)樣本平均數(shù)的分布從正態(tài)總體抽取的樣本平均數(shù)的分布一般為N(,)。圖1給出樣本容量n=1,4與9時(shí)的分布,從圖中可以看出隨著樣本容量的增加,分布的集中程度增加了,說明方差減少了。圖1不同樣本容量的抽樣分布第四十一頁,共四十八頁,編輯于2023年,星期日由中心極限定理知,只要樣本容量適當(dāng)大,不論總體分布形狀如何,其的分布都可看作為正態(tài)分布,且具平均數(shù)和方差。在實(shí)際應(yīng)用上,如n>30就可以應(yīng)用這一定理。
平均數(shù)的標(biāo)準(zhǔn)化分布是將上述平均數(shù)轉(zhuǎn)換為u變數(shù)。第四十二頁,共四十八頁,編輯于2023年,星期日(二)兩個(gè)獨(dú)立樣本平均數(shù)差數(shù)的分布假定有兩個(gè)正態(tài)總體各具有平均數(shù)和標(biāo)準(zhǔn)差為,和,,從第一個(gè)總體隨機(jī)抽取n1個(gè)觀察值,同時(shí)獨(dú)立地從第二個(gè)總體隨時(shí)機(jī)抽取n2個(gè)觀察值。這樣計(jì)算出樣本平均數(shù)和標(biāo)準(zhǔn)差,s1和,s2。從統(tǒng)計(jì)理論可以推導(dǎo)出其樣本平均數(shù)的差數(shù)()的抽樣分布,具有以下特性:
(1)如果兩個(gè)總體各作正態(tài)分布,則其樣本平均數(shù)差數(shù)()準(zhǔn)確地遵循正態(tài)分布律,無論樣本容量大或小,都有N(,)。第四十三頁,共四十八頁,編輯于2023年,星期日(2)兩個(gè)樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個(gè)總體平均數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 租電瓶電子合同協(xié)議
- 直播業(yè)務(wù)訂單合同協(xié)議
- 小車過戶協(xié)議合同協(xié)議
- 租用廚房合同協(xié)議
- 土方開挖合同安全協(xié)議
- 知識(shí)產(chǎn)權(quán)解約合同協(xié)議
- 堡坎合作協(xié)議合同
- 雜糧煎餅加盟協(xié)議書
- 工地民工勞務(wù)合同協(xié)議
- 土地租憑合同協(xié)議
- 統(tǒng)信服務(wù)器UOS操作系統(tǒng)-產(chǎn)品白皮書
- 糧庫火災(zāi)的防控措施與技術(shù)
- 5G-Advanced通感融合仿真評(píng)估方法研究報(bào)告
- DB33 860-2012 危險(xiǎn)化學(xué)品重大危險(xiǎn)源安全監(jiān)控管理規(guī)范
- 隱蔽工程影像資料采集要求和拍攝方法(網(wǎng)絡(luò)版)
- DB37T 1913-2011 金屬非金屬地下礦山特種作業(yè)人員配置
- 2025年日歷(日程安排-可直接打印)
- 大單元教學(xué)學(xué)歷案4 《現(xiàn)代詩二首》(略讀實(shí)踐課) 統(tǒng)編版語文四年級(jí)上冊(cè)
- 3.1 農(nóng)業(yè)區(qū)位因素及其變化-看《種地吧》思考 課件 高一下學(xué)期 地理 人教版(2019)必修二
- 《保護(hù)板培訓(xùn)教材》課件
- 綠色醫(yī)療器械設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論