抽樣方法、正態(tài)分布_第1頁
抽樣方法、正態(tài)分布_第2頁
抽樣方法、正態(tài)分布_第3頁
抽樣方法、正態(tài)分布_第4頁
抽樣方法、正態(tài)分布_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

#抽樣方法、正態(tài)分布重點、難點講解:1.抽樣的三種方法:簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣。后兩種方法是建立在第一種方法基礎上的。2.了解如何用樣本估計總體:用樣本估計總體的主要方法是用樣本的頻率分布來估計總體分布,主要有總體中的個體取不同數(shù)值很少和較多甚至無限兩種情況。3.正態(tài)曲線及其性質:N3.正態(tài)曲線及其性質:N(如口2),其正態(tài)分布函數(shù)??f占,xU(-8,+w)。任一正態(tài)總體N(如°任一正態(tài)總體N(如°為(匕)),其取值小于x的概率F(x)=,xU(-8,+g)。把,xU(-8,+g)。曲線在x軸的上方,與x軸不相交。曲線關于直線x=g對稱。曲線在x=g時位于最高點。當xVy時,曲線上升;當x>卩時,曲線下降,并且當曲線向左、右兩邊無限延伸時,以x軸為漸近線,向它無限靠近。當卩一定時,曲線的形狀由口確定,口越大,曲線越“矮胖”,表示總體的分布越分散;口越小,曲線越“瘦高”,表示總體的分布越集中。一般正態(tài)分布與標準正態(tài)分布的轉化對于標準正態(tài)分布,用少(可)表示總體取值小于x0的概率,即①(心)=p(xvx0),其幾何意義是由正態(tài)曲線N(0,1),x軸,直線x=x0所圍成的面積。又根據(jù)N(0,1)曲線關于y軸的對稱性知,少(一坯)=1-飆坯),并且標準正態(tài)總體在任一區(qū)間(a,b)內取值概率廠恥)一%)。了解“小概率事件”和假設檢驗的思想。知識應用舉例:例1.從503名大學一年級學生中抽取50名作為樣本,如何采用系統(tǒng)抽樣方法完成這一抽樣?思路分析:因為總體的個數(shù)503,樣本的容量50,不能整除,故可采用隨機抽樣的方法從總體中剔除3個個體,使剩下的個體數(shù)500能被樣本容量50整除,再用系統(tǒng)抽樣方法。解:第一步:將503名學生隨機編號1,2,3,……,503第二步:用抽簽法或隨機數(shù)表法,剔除3個個體,剩下500名學生,然后對這500名學生重新編號。500第三步:確定分段間隔k^°=10,將總體分成50個部分,每部分包括10個個體,第一部分的個體編號為1,2,……,10;第二部分的個體編號11,12,……,20;依此類推,第50部分的個體編號491,492,……,500。第四步:在第一部分用簡單隨機抽樣確定起始的個體編號,例如是7。第五步:依次在第二部分,第三部分,,第五十部分,取出號碼為17,27,,497,這樣就得到了一個容量為50的樣本。

例2.對某電子元件進行壽命追蹤調查,情況如下:壽命"】100—200200^300300-100400^500L500-600個敕20|'308040i30列出頻率分布表;(2)畫出頻率分布直方圖;(3)估計電子兀件壽命在100h?400h以內的概率;(4)估計電子元件壽命在400h以上的概率;(5)估計總體的數(shù)學期望。思路分析:由于樣本的取得具有代表性,因此,可以利用樣本的期望近似地估計總體的期望。解:(2)頻率分布直方圖如下:從頻率分布表可知,壽命在100h?400h的元件出現(xiàn)的概率為0.65;壽命在400h以上的電子元件出現(xiàn)的頻率為0.20+0.15=0.35,故我們估計電子元件壽命在400h以上的概率為0.35。樣本的期望為:100+200門“200+300門訃300+400門“400+500門“xO.10+xO.15+xO.40+xO.20+500+6002222500+600x0.15=15+37.5+140+90+82.5=365.所以,我們估計生產的電子元件壽命的總體期望值(總體均值)為365h。例3.正態(tài)總體為卩=0,g=1時的概率密度函數(shù)是f(x)=,xU(-g,+w),(1)證明f(x)是偶函數(shù);(2)利用指數(shù)函數(shù)的性質說明f(x)的增減性。證明:(1)任意的證明:(1)任意的xUR,f(-x)=(2)任取x1<x2<0,則4電<4芳,,即f(X])vf(x2)。這說明f(x)在(-8,0)上是遞增函數(shù),同理可證f(x)在(0,+8)上是遞減函數(shù)。例4.隨機變量g服從N(0,1),求下列值。(1)P(g>2.55)(2)P(g<-1.44)(3)P(|g|<1.52)思路分析:標準正態(tài)分布,可以借助標準正態(tài)分布表。用到的公式主要有:①(-x)=1-少(x);P(avxvb)=①(b)-少(a);p(x>x0)=1-p(xvx0)。

解:(1)P(22.55)=l-p(g<2.55)=l-①(2.55)=1-0.9946=0.0054。解:(1)P(22.55)=l-p(g<2.55)=l-①(2.55)=1-0.9946=0.0054。P(|g|<1.52)=p(-1.52<g<1.52)=少(1.52)-①(-1.52)=2少(1.52)-1=2x0.9357-1=0.8714。例5.設*~"仏代,且總體密度曲線的函數(shù)表達式為:f(x)2氏,xu(4,+w)。(1)求卩,g;(2)求p(lx-1lv旋)及p(1-血VXV1+》旋)。解:(1)整理得:f(x)「阪、扭,所以,日",故Zg思路分析:對照正態(tài)曲線函數(shù),可以得出卩,6利用一般正態(tài)總體皿仏解:(1)整理得:f(x)「阪、扭,所以,日",故Zg1+-11--\/2-1=少(旋)一少(龐)=叫1)一少(-1)=2①(1)-1=2x0.8413-1=0.6826。p(1p(11+-11--1=少(忑)-少(血)=少(2)-①(-1)=少(2)+少(1)-1=0.9772+0.8413-1=0.8185。例6.某城市從南郊某地乘車前往北區(qū)火車站有兩條路可走,第一條線路穿過市區(qū),路程較短,但交通擁擠,所需時間(單位:分鐘)服從正態(tài)分布N(50,100),第二條線路沿環(huán)城公路走,路程較長,但交通阻塞少,所需時間(單位:分鐘)服從正態(tài)分布N(60,16),(1)若只有70分鐘時間可用,應走哪條路?(2)若只有65分鐘時間可用,應走哪條路?思路分析:所謂最佳線路(應選擇的線路)就是在允許的時間內有較大概率趕到火車站的那條線路。解:設x為行車時間。(1)走第一條路及時趕到的概率為:P(0<xW70)=1°10P(0<xW70)=1°10-①(2)=0.9772。70-60走第二條線路及時趕到的概率為:P(0<xW70)=①(也)=少(2.5)=0.9938。65-50(2)走第一條線路及時趕到的概率為:P(0<x<65)^(1°)=少(1.5)=0.9332。65-60走第二條線路及時趕到的概率為:P(0<x<65戸少(4)=少(1.25)=0.8944。因此應走第一條線路。在線測試1.于()A、1.于()A、B、C、D、選擇題如果采用分層抽樣,從個體數(shù)為N的總體中,抽取一個容量為n的樣本,那么每個個體被抽到的概率等2.青年人81人,為了調查他們身體狀況的某項指標,需要從他們某單位有老年人28人,中年人2.青年人81人,為了調查他們身體狀況的某項指標,需要從他們中抽取一個容量為36的樣本,適合抽取樣本的方法是()。A、簡單隨機抽樣BA、簡單隨機抽樣B、系統(tǒng)抽樣C、分層抽樣D、先從老年人中剔除1人,然后再分層抽樣3.4.A、總體容量越大,估計越精確C、樣本容量越大,估計越精確在10人中,有4個學生,13.4.A、總體容量越大,估計越精確C、樣本容量越大,估計越精確在10人中,有4個學生,1個干部,A、頻數(shù)B、概率C、B、總體容量越小,D、樣本容量越小,2個工人,3個農民,估計越精確估計越精確數(shù)彳是工人占總體的()。頻率D、累積頻率在用樣本頻率分布估計總體分布的過程中,下列說法正確的是()。5.A、頻率分布直方圖與總體密度曲線無關。B、頻率分布直方圖就是總體密度曲線。5.A、頻率分布直方圖與總體密度曲線無關。B、頻率分布直方圖就是總體密度曲線。C、樣本容量很大的頻率分布直方圖就是總體密度曲線。組距[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)頻數(shù)234542一個容量為20的樣本數(shù)據(jù),分組后組距與頻數(shù)如下:則樣本在區(qū)間(-8,50)上的頻率為()。A、0.5B、0.25C、0.6D、0.76.對于樣本頻率分布的直方圖與總體密度曲線的關系,下列說法正確的是()。6.D、線。7.關于正態(tài)總體的密度函數(shù)所對應的曲線,下列敘述中不正確的是:)。A、D、線。7.關于正態(tài)總體的密度函數(shù)所對應的曲線,下列敘述中不正確的是:)。A、曲線總是在x軸的上方。B、曲線關于直線x=p對稱。如果樣本容量無限增大,分組的組距無限減小,那么頻率分布的直方圖就會無限接近于總體密度曲C、D、在區(qū)間(p-2o,p+20)內取值的概率為C、D、當x2p時,f(x)隨x的增大而增大,當xWp時,f(x)隨x的減小而增大。

8.9.若隨機變量E?N(p,B8.9.若隨機變量E?N(p,B、p設隨機變量E?N(p,rA、0O2),且P(EWa)=P(E>a),則a的值為()。C、-pO2),且EE=3D、ODE=1,則P(-1<EW1)等于()?!窩、0(-4)-q(-2)「D、0(2)-q⑷A、2q(1)-1B、Q(4)-q(2)10.已知從某批材料中任取一件時,取得的這件材料的強度E?N(200,18),則取得的這件材料的強度不低于180的概率為()。A、0.9973B、0.8665C、0.8413D、0.8159答案與解析答案:1、C2、D3、C4、C5、D6、D7、D8、B9、B10、B解析:1.提示:采用分層抽樣時,各部分抽取的個體數(shù)與這一部分個體數(shù)的比等于樣本容量與總體的個體數(shù)的比,所以每個個體被抽到的概率都是相等的。2.提示:當總體由有明顯差別的幾部分組成時,為了使抽取的樣本更好地反映總體的情況,常采用分層抽樣。4?提示:,所以數(shù)了是工人占總體的頻率。5.提示:組距[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)頻數(shù)234542頻率0.10.150.20.25則樣本在區(qū)間(-8,50)上的頻率為0.1+0.15+0.2+0.25=0.7。提示:如果樣本容量越大,所分組數(shù)越多,也就是組距不斷縮小,那么頻率分布的直方圖就會無限接近于總體密度曲線。因此它們有關,但頻率分布的直方圖不是總體密度曲線。9?提示:一般的正態(tài)分布問題,能轉化成標準正態(tài)分布問題來處理,即將正態(tài)分布中觀察值x的概率P(a(2—B_|_1VxVb)表示成標準正態(tài)分中的P(Z]WzWz2),其中乙廠°,zj°P二①〔一2)-飆一4)二1-①⑵一1+①⑴=①(4)-①⑵?!案怕逝c統(tǒng)計”內容分析(二)6、簡單隨機抽樣有哪些特點?答:(1)它要求被抽取樣本的總體的個數(shù)有限,以便對其中各個體被抽取的概率進行分析。這種抽樣是從總體中逐個進行抽取,這就使得它具有可操作性。這是一種不放回抽樣。由于在抽樣的實踐中常常采用不放回抽樣,使簡單隨機抽樣具有較廣泛的實用性,而且由于在所抽取的樣本中沒有被重復抽取的個體,所以便于進行分析與計算。這是一種等概率的抽樣,不僅每次從總體中抽取一個個體時,各個體被抽取的概率相等,而且在整個抽樣過程中,各個體被抽取的概率相等,從而保證了這種抽樣方法的公平性。實施簡單隨機抽樣主要有兩種方法;即抽簽法和隨機數(shù)表法。與系統(tǒng)抽樣、分層抽樣相比,簡單隨機抽樣是最簡單、最基本的抽樣方法,另兩種抽樣方法都建立在簡單隨機抽樣的基礎之上。這三種抽樣方法的共同點是:它們都屬于等概率的抽樣,都體現(xiàn)了抽樣的公平性。7、擲一枚均勻硬幣兩次,如何從二項分布的直方圖上算出正面朝上至多發(fā)生一次的概率?答:先畫出直方圖(n=2,p=0.5)如圖1所示。由圖可見,正面朝上至多發(fā)生一次的概率,就是橫坐標從-0.5到1.5這兩個長方形的面積之和,其中第一個長方形的面積對應于正面朝上至多發(fā)生一次的概率P=0.25x1+0.5x1=0.75o8、如何利用直方圖來引進正態(tài)曲線與正態(tài)分布?答:對于n較大,p=0.5的二項分布直方圖,如果用一條平滑的曲線把每個長方形的中點聯(lián)結起來,就能得到一條鐘形曲線,稱為正態(tài)曲線(圖2),其函數(shù)解析式為其中f(x)=,xUR,其中M=哪,口=J即堺,s沁2.718280回顧二項分布的直方圖及上面7中所舉的例子,直方圖中各長方形的面積可以表示有關的概率值。對于正態(tài)曲線,如果規(guī)定,試驗的觀察值X落在區(qū)間(a,b)內的概率P(aVxVb)就是由這條曲線、x軸、直線x=a及x=b所圍成的圖形的面積(圖3),那么稱這種概率分布為正態(tài)分布。圖3x~一個平均數(shù)為卩、標準差為口的正態(tài)分布可以用公式z=□將它變換成平均數(shù)為0、標準差為1的正態(tài)中⑵=e2分布。平均數(shù)為0、標準差為1的正態(tài)分布稱為標準正態(tài)分布(圖4),其公式為,其中一般的正態(tài)分布問題,能轉化成標準正態(tài)分布問題來處理,即將正態(tài)分布中觀察值x的概率P(aVxVb)表a~b示成標準正態(tài)分中的P(zi<z<z2),其中Z1=,z2=口0由于必然事件的概率是1,所以在標準正態(tài)曲線下方、Z軸上方的總面積等于1,為了計算與標準正態(tài)分布有關的事件的概率,可以列出如圖5中陰影部分面積的表,以備查用。用正態(tài)曲線去近似二項分布的直方圖,當n比較大,p等于或接近于0.5時,效果比較好(圖2)。一般地說,n越大,p越接近于0.5,近似程度就越高;反過來,n很小,p接近于0或1時,近似程度就不好,我們一般要求np>5及nq>5,否則計算概率的誤差太大。簡單隨機捋柑的方就有:捋叢法和鏈機數(shù)我沈。塞統(tǒng)抽樣的步驟:(1)將總棒中的個體隨機編號;卩)將編號分段;G)在第1段中用簡單隨機抽樣確定起始的個體編號;的按照事先研竄的規(guī)卿抽取樣本。分層抽樣的步驟:⑴分層;卩)按比惻確定每層抽取牛怵的個數(shù);⑶各層抽樣(方法可以不同h牌)匯合成樣本。例2.在一次游戲中,獲勝者可得到3件不同的獎品,這些獎品要從已編號的300種不同獎品中隨機抽取確定,用系統(tǒng)抽樣法確定某獲勝者所得到的3件獎品的編號。解析:設300件不同獎品編號為1,2,……,300,由于300:3=100:1,現(xiàn)將總體分成3個部分,其中每部分包括100個個體,若第1部分的個體編號為1,2,……,100,然后在第1部分隨機抽取一個號碼。比如它為10號,那么可以從第10號起每隔100個抽取1個號碼,這樣得到了一個容量為3的樣本:10,110,210。例1.某鄉(xiāng)鎮(zhèn)有12個行政村,現(xiàn)考察其人口中癌癥的發(fā)病率,對其進行樣本分析,要從3000人中抽出300人進行樣本分析,應采取什么樣的抽樣方法較為合理?并簡述抽樣過程。解析:一般情況下,每個村癌癥發(fā)病率是有差異的,各村人口數(shù)量又有差別,于是采取分層抽樣方法進行抽樣較為合理。具體實施過程:將3000人按12個村分成12份,每份250人,然后從每村的250人中采用系統(tǒng)抽樣法抽取25人,每人被抽到的概率為占,然后再把各村抽出的25人合起來,就抽出一個容量為300的樣本。例3.—批產品中,有一級品100個,二級品60個,三級品40個,分別用系統(tǒng)抽樣法和分層抽樣法,從這批產品中抽取一個容量為20的樣本。解析:系統(tǒng)抽樣法:將200個產品隨機地分為20組,每組10個產品,在每組中對每個元素進行編號“1,2……,10”,然后在各組中隨機抽出一個相同的號,比如都抽“3”,這樣就抽出一個容量為20的樣本。分層抽樣法:因為一、二、三級品的個數(shù)之比為5:3:2,所以從一級品中抽取^x20=10(個),從二級品中抽取存20=6(個),從三級品中抽取^x20=4(個),具體抽法可用隨機數(shù)表進行抽取。例例1?從甲,乙兩種棉苗中,各抽10株,測得它們的株高分別如下:(單位:cm)甲:25,41,40,37,22,14,19,39,21,42乙:27,16,44,27,44,16,40,40,16,40(1)哪種棉花的苗長得高?(2)哪種棉花的苗長得整齊?用樣本估計總體是研究統(tǒng)計問題的一個基本思想方法。對于不易知道的總體分布,常用樣本的頻率分布對它進行估計。對總體的平均數(shù)、方差、標準差,常用樣本的平均數(shù)、方差、標準差進行估計,樣本容量越大,這種估計就越精確。用樣本估計總體的思想就是用部分考查全體,用離散考查連續(xù),用有限考查無限的思想,使原來不可以解決的問題,能基本解決。總體分布反映了總體在各個范圍內取值的概率。由于總體分布通常不易知道,我們往往是用樣本的頻率分布去估計總體分布。一般地,樣本容量越大,這種估計就越精確,對于所取不同數(shù)值較少的總體,常用條形圖來表示相應的樣本的頻率分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論