第三四章抽樣與抽樣分布_第1頁(yè)
第三四章抽樣與抽樣分布_第2頁(yè)
第三四章抽樣與抽樣分布_第3頁(yè)
第三四章抽樣與抽樣分布_第4頁(yè)
第三四章抽樣與抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、正態(tài)分布及其應(yīng)用:引言:無(wú)論是二項(xiàng)分布還是泊松分布,它們都有一個(gè)共同的特點(diǎn),即當(dāng)n逐漸增大時(shí),都將趨近于對(duì)稱分布,進(jìn)而趨近于正態(tài)分布,因此,二項(xiàng)分布和泊松分布的概率表,通常只列出n=20的概率,當(dāng)n30時(shí),兩個(gè)分布都趨近于正態(tài)分布。正態(tài)分布(高斯分布),是一種常用的典型的概率分布。18世紀(jì)德國(guó)的數(shù)學(xué)家和天文學(xué)家高斯在正態(tài)分布理論發(fā)展過程中做過突出貢獻(xiàn),因此也被稱作“高斯分布”。正態(tài)分布的重要地位:1、在實(shí)際觀察到社會(huì)、經(jīng)濟(jì)、自然現(xiàn)象的數(shù)據(jù)表現(xiàn)上,其頻率分布與正態(tài)分布十分接近;2、正態(tài)分布的固有性質(zhì),給抽樣推斷理論提供了必要的基礎(chǔ),使它在抽樣分布、區(qū)間估計(jì)、假設(shè)檢驗(yàn)中被廣泛應(yīng)用。正態(tài)分布的概率密

2、度函數(shù): 式中:x在正負(fù)無(wú)窮之間;、2為參數(shù);e=2.7183;=3.14159;可記為XN(,2)。1、正態(tài)分布曲線特征:(1)曲線為對(duì)稱分布,在X=處達(dá)到極大值;(2)曲線兩尾端趨向無(wú)窮小,但永不與橫軸相交;(3)曲線的形狀取決于標(biāo)準(zhǔn)差的大??;(4)曲線的位置取決于平均數(shù)的大小;(5)曲線的平均數(shù)、中位數(shù)、眾數(shù)相等;(6)曲線下全部面積為1,并在一定標(biāo)準(zhǔn)差倍數(shù)范圍內(nèi),所含的概率比重是相同的。2、數(shù)理統(tǒng)計(jì)證明:1)、平均數(shù)加減一個(gè)標(biāo)準(zhǔn)差(1)的范圍,包含總體全面積的68.26%;2)、平均數(shù)加減一個(gè)標(biāo)準(zhǔn)差(2)的范圍,包含總體全面積的95.44%;xf(x)CAB3)、平均數(shù)加減一個(gè)標(biāo)準(zhǔn)差(

3、3)的范圍,包含總體全面積的99.74%。正態(tài)分布曲線族有兩類: 平均數(shù)相等標(biāo)準(zhǔn)差不等 平均數(shù)不等標(biāo)準(zhǔn)差相等 3、標(biāo)準(zhǔn)正態(tài)分布表的使用:怎樣將各種形狀的正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布呢?標(biāo)準(zhǔn)正態(tài)分布要求: Z值為從隨機(jī)變量X到該分布平均數(shù)的距離,相當(dāng)于的倍數(shù)。Z值可以看成是的標(biāo)準(zhǔn)單位。=60 =20 40 80 原始分布:=60,=20 =60 Z分布:=0 =1 -3 -2 -1 0 1 2 3 例題:已知某總體服從平均數(shù)為10,標(biāo)準(zhǔn)差為2.5的正態(tài)分布。求任意值大于或等于15的概率。解: Z=(15-10)/2.5=2 0.97725 與Z=2對(duì)應(yīng)的概率為0.97725 P(x15)=1-0.

4、97725 10 15 =0.02275習(xí)題1、假如某一學(xué)院的入學(xué)考試分?jǐn)?shù)是服從平均數(shù)為450,標(biāo)準(zhǔn)差為100的正態(tài)分布,求:(1)有多少學(xué)生比率的得分在400500之間?(2)若某一學(xué)生得分是630分,則比他更好和更差的學(xué)生其比率各為多少?解:(1) Z1=(400-450)/100= -0.5 Z2=(500-450)/100= 0.5 與Z=0.5對(duì)應(yīng)的概率為0. 400 450 500 則:P(400x500 = 0.-0.5 = 0.2 = 0. (2)Z=(630-450)/100=1.8 則:P(x630= 0.9641P(x630)=1-0.9641= 0.0359習(xí)題2、教材

5、P101,11(1) 95.254% 150-Z 200(2) 90% -Z 200 Z習(xí)題3、美國(guó)某大型商場(chǎng)牙膏銷量,據(jù)信是服從每周平均數(shù)為10000盒,標(biāo)準(zhǔn)差為1500盒的正態(tài)分布。問:(1)任意一周牙膏銷量超過12000盒的概率是多少?(2)為使公司庫(kù)存充裕,以滿足每周需求高達(dá)95%的概率,問庫(kù)存應(yīng)備多少盒牙膏?解: (1) Z=(12000-10000)/1500=1.33,與1.33對(duì)應(yīng)的概率=0.4082,超過12000盒的10000 12000 概率=1- 0.=0.(9.176%)。0.95 (2)與0.95概率對(duì)應(yīng)的Z值為1.645, (X-10000)/15000=1.64

6、5,X=12468(盒)。習(xí)題4、某一出口產(chǎn)品(容器),技術(shù)資料顯示,其填裝量為服從標(biāo)準(zhǔn)差為0.6盎司的正態(tài)分布。若填裝重量少于18盎司的比率為2%,問其平均填裝重量為多少?解: 與比率1-0.02=0.98,對(duì)應(yīng)的Z=-2.05,綠色健康飲品0.02 (18-)/0.6=-2.05, =19.23(盎司) 18習(xí)題5、已知某加工廠工人日包裝量為平均每人25件,從中抽取一人,其日包裝量小于10件的概率為7.78%,問工人日包裝量的標(biāo)準(zhǔn)差是多少?7.78% 解;因?yàn)椋?-0.0778=0.9222,對(duì)應(yīng)的Z=1.42 所以:與0.0778對(duì)應(yīng)的Z=-1.4210 25 則;(10-25)/=-1

7、.42 -Z =10.56(件)正態(tài)分布是推斷統(tǒng)計(jì)的基石第四章 抽樣與抽樣分布抽樣調(diào)查的必要性告訴人們,在許多情況下不必要或不可能進(jìn)行全面調(diào)查,這時(shí),要了解總體的情況,只能由樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)。常用的抽樣方法 1、簡(jiǎn)單隨機(jī)抽樣 重復(fù)抽樣 等概率(純隨機(jī)抽樣) 不重復(fù)抽樣 等可能2、分層抽樣 先分組,后抽樣。 (分類抽樣) 4個(gè)優(yōu)點(diǎn)P106(3)3、系統(tǒng)抽樣:有序排列 確定起點(diǎn) 間隔抽取 (機(jī)械抽樣、等距抽樣) 隨機(jī)性4、整群抽樣:簡(jiǎn)便。前提是總體分布均勻。抽樣分布與中心極限定理 1、抽樣分布:全部可能樣本統(tǒng)計(jì)量的概率分布叫做抽樣分布。(總體分布、樣本分布)的抽樣形式與特征:以下是一個(gè)極端的

8、例子:假定一個(gè)實(shí)驗(yàn)小組有四人N=4,其寫作成績(jī)分別為:21、20、19、18(分)(25為滿分)。若樣本容量n=2,則全部可能樣本(不重復(fù)抽樣)是6個(gè),6個(gè)樣本及它們的平均數(shù)、準(zhǔn)差如下表:樣本容量n=2,則全部可能樣本(重復(fù)抽樣)是16個(gè): 頻數(shù) 頻率(%) 18.0 1 0.06 18.5 2 0.1319.0 3 0.19 19.5 4 0.25 20.0 3 0.19 20.5 2 0.1321.0 1 0.06 合計(jì) 16 1.00 =? = ? 對(duì)比不重復(fù)抽樣的、有何啟示?平均數(shù)抽樣分布圖:接近正態(tài)分布。 18 18.5 19 19.5 20 20.5 21 =19.5; =0.79

9、;= = 重復(fù)抽樣2、中心極限定理:數(shù)理統(tǒng)計(jì)證明:(1)當(dāng)總體很大時(shí),無(wú)論它呈現(xiàn)何種分布,只要樣本容量n足夠大,那么樣本平均數(shù)的抽樣分布,必定趨近于正態(tài)分布;(2)從正態(tài)總體中抽取的全部可能樣本,無(wú)論樣本容量有多大,樣本平均數(shù)的抽樣分布必定遵從于正態(tài)分布;即使是非正態(tài)總體,只要n30,其抽樣分布必定趨近于正態(tài)分布;見書P111圖4.5(3)抽樣分布的平均數(shù)等于總體平均數(shù):= ;(4)抽樣分布的標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差小,且隨著樣本容量的增加,隨之減?。? ;也稱為“抽樣平均誤差”。在區(qū)間估計(jì)中,樣本容量n越大,樣本平均數(shù)圍繞總體平均數(shù)擺動(dòng)的幅度越小,樣本平均數(shù)的分布曲線變得又窄又高,它意味著樣本平均數(shù)

10、落在總體平均數(shù)附近的概率也相應(yīng)增大。極限定理在區(qū)間估計(jì)中的作用:可以確定從總體中抽取一個(gè)隨機(jī)樣本,其平均數(shù)出現(xiàn)在一個(gè)指定值域內(nèi)的概率。3、平均數(shù)的抽樣分布及應(yīng)用:(見PPT)例題:假定某大型公司全部推銷員個(gè)人營(yíng)業(yè)額(月)的總體分布如下圖1,現(xiàn)從中抽取一個(gè)包括30人的隨機(jī)樣本,其樣本平均數(shù)大于15750元的概率是多少?圖1:總體分布:=2000 圖2:抽樣分布 P? 15000 X 15000 解:由于n30,是容量為30的所有可能樣本之一,15750是所有樣本平均數(shù)隨機(jī)變量之一,見圖2。根據(jù)中心極限定理作適當(dāng)變換,下列關(guān)系式成立:所以:Z=2.05,查表,對(duì)應(yīng)概率為0.4798,故大于1575

11、0元的概率為0.5-0.4798=0.02。教材P117,16 17教材P118,18(1)20;2;(2)正態(tài);(3)-2.25;(4)1.5教材P118,18(1)1-0.97725=0.02275; (2)1-0.=0.0668;(3)1-0.99379=0.00621; (4)(0.97725 -0.5)+(0.-0.5)=0.;(5)1-0.99865=0.00135。教材P118,19(1)0.8944;(2)0.0228;(3)0.1292;(4)0.9699。教材P118,20(1)(2)1;(3)不一定。教材P118,22趨于正態(tài)分布教材P118,23(1)n=4930,正態(tài)

12、分布; =213(美元);=4.5918 (2)0.5;大于217的概率是1-0.=0.; 在P(209217)=(0.-0.5)2 = 0.教材P119,(1)=406克;=1.68333;正態(tài)分布。(2)1-0.=0.(3)是。因?yàn)閆=-3.09,超出了3Z,出現(xiàn)了小概率。教材P18(1)增加;(2)減少。教材P119(1)n=5030,正態(tài)。(2)P(830)0;(因?yàn)閆=-4.7);(3)生產(chǎn)過程不正常;(4)仍是正態(tài); P(830)=0.0582),(Z=1.57)。教材P119,(3)由(1)可知【】4、有限總體(或不重復(fù)抽樣)修正系數(shù):?jiǎn)栴}的提出:用樣本估計(jì)總體時(shí)比較下列誤差誰(shuí)大

13、?無(wú)限總體 有限總體 重復(fù)抽樣 不重復(fù)抽樣有限總體修正系數(shù)為:它永遠(yuǎn)小于1。當(dāng)抽樣比例n/N0.05時(shí),可以省略修正系數(shù);當(dāng)抽樣比例n/N0.05時(shí),一般需要使用修正系數(shù),原平均誤差公式修正為:; 案例:從阿根廷、加拿大、美國(guó)到貨三批玉米,分別為600包、6000包、60000包。合同規(guī)定三批玉米平均每包重量都是80公斤,標(biāo)準(zhǔn)差都是4公斤。要求:(1)若從每批玉米中都抽取300包為樣本,分別計(jì)算它們的平均誤差。有何啟示?(要求都使用修正系數(shù))三批玉米的抽樣比例n/N分別為:阿300/600=0.5;加300/6000=0.05;美300/60000=0.005習(xí)題1:某地有200家外貿(mào)企業(yè),年

14、平均出口額為90萬(wàn)美元,標(biāo)準(zhǔn)差為27萬(wàn)美元,隨機(jī)抽取36家企業(yè)調(diào)查,問其年平均出口額在100萬(wàn)美元以上的概率為多少?解:習(xí)題2:某食品公司收購(gòu)一批鮮蛋共1500箱,平均每箱為25.75斤,標(biāo)準(zhǔn)差5.25公斤。問由100箱組成的一個(gè)隨機(jī)樣本所計(jì)算的平均重量在2527公斤之間的概率有多大?超過26公斤的概率有多大?解:5、比例的抽樣分布:當(dāng)總體中各元素只能以“成功”和“失敗”表示時(shí),用P表示“成功”的比例,(1-P)表示“失敗”的比例。中心極限定理證明:P不接近0或1,且n很大時(shí),其抽樣分布趨近于正態(tài)分布。比例抽樣分布的平均誤差為:無(wú)限總體(或重復(fù)抽樣):。有限總體(或不重復(fù)抽樣):。其他問題與平

15、均數(shù)相同。 例題:據(jù)資料記錄,二年級(jí)的學(xué)生中有43%人,閱讀某類文章后表示有困難,現(xiàn)隨機(jī)抽取100人閱讀同類文章,問:感到有困難的學(xué)生占五成以下的概率是多少?習(xí)題1、一家工廠在正常情況下產(chǎn)品次品率為8%,若產(chǎn)品批量比較大,隨機(jī)抽取100個(gè)產(chǎn)品進(jìn)行檢驗(yàn),求次品率在7%9%之間的概率。解:(修正系數(shù)可以省略)6、t分布:(小樣本理論)t分布也稱“學(xué)生分布” 。19081909年,英國(guó)統(tǒng)計(jì)學(xué)家戈塞特(Gosset),以筆名(Student)陸續(xù)在生物計(jì)量學(xué)雜志上發(fā)表了三篇文章:“平均數(shù)的概差”、“相關(guān)系數(shù)的概差”、“論非隨機(jī)樣本平均數(shù)的分布”,從而奠定了“小樣本理論”的基礎(chǔ),并使他獲得了崇高的榮譽(yù)。因此, t分布也稱“學(xué)生分布”。 t分布也是對(duì)稱分布,形狀比正態(tài)分布更平緩些,當(dāng)n30時(shí)t分布與正態(tài)分布很接近。t分布特征:(1)t分布平均數(shù)所處的曲線峰頂?shù)陀谡龖B(tài)分布;(2)t分布兩個(gè)尾端的面積按一定比例比正態(tài)分布多起來(lái);(3)如果包含曲線下相同的面積,t分布的界限必須離開平均數(shù)更遠(yuǎn)些。自由度:指可以自由選擇的數(shù)值的個(gè)數(shù)。不同容量的樣本對(duì)應(yīng)與不同的t分布,統(tǒng)計(jì)上說“不同的自由度對(duì)應(yīng)著不同的樣本”。如:(a+b+c)/3=4,則3*4=12,必須是a+b+c=12,其中:a、

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論