第四章抽樣分布

上傳人：6*** IP屬地：湖北上傳時間：2023-02-04 格式：PPT 頁數(shù)：75 大小：1.67MB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩70頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2023/2/41第四章概率分布與抽樣2023/2/42第一節(jié)隨機變量的概率分布第二節(jié)大數(shù)定律與中心極限定理第三節(jié)統(tǒng)計量的抽樣分布(54張)第四章抽樣分布2023/2/43

學(xué)習(xí)目標(biāo)1.定義和解釋隨機變量及其概率分布2.計算隨機變量的概率和概率分布3.理解正態(tài)分布及其標(biāo)準(zhǔn)化問題；√4.理解大數(shù)定律和中心極限定理;5.掌握常用統(tǒng)計量的抽樣分布;√6.會用Excel計算常見分布的概率。√2023/2/44

重點與難點1.隨機變量概率分布意義的理解2.統(tǒng)計量抽樣分布的若干結(jié)論3.兩類極限定理的意義及其若干結(jié)論4.小樣本的精確分布2023/2/45第一節(jié)隨機變量的概率分布一、隨機變量的定義及其類型

1.隨機變量的定義

2.兩種類型的隨機變量二、隨機變量的概率分布

1.概率分布的含義及意義

2.離散型隨機變量的概率分布

3.連續(xù)型隨機變量的概率分布

4.隨機變量的分布函數(shù)三、幾種常見的概率分布

1.正態(tài)分布

2.小樣本的精確分布2023/2/46一、隨機變量的定義及其類型（一）隨機變量的定義在隨機試驗中，若隨著試驗結(jié)果的不同而隨機地取各種不同的數(shù)值，并且對取每一個數(shù)值或某一范圍內(nèi)的值都有相應(yīng)的概率，即對任意實數(shù)，是隨機事件，且概率存在，則稱為一個隨機變量。（二）兩種類型的隨機變量（按取值的特點不同來劃分）1．離散型隨機變量2.連續(xù)型隨機變量

2023/2/471．離散型隨機變量

如果隨機變量的所有取值是有限個或都可以逐個列舉出來，則稱為離散型隨機變量。例如，擲骰子試驗中“出現(xiàn)的點數(shù)”、質(zhì)量檢驗中從一批產(chǎn)品里“取到次品的個數(shù)”等都是離散型隨機變量。2023/2/482.連續(xù)型隨機變量

如果隨機變量的取值不僅是無窮多個，而是可取到某個區(qū)間或整個數(shù)軸上的一切值，不能夠無遺漏地一一列舉出來，則稱該隨機變量為連續(xù)型隨機變量。例如，一批電子元件的“使用壽命”、抽樣調(diào)查中的“測量誤差”等都是連續(xù)型隨機變量。2023/2/49二、隨機變量的概率分布（一）概率分布的含義及意義1.概率分布的含義隨機變量在其取值范圍內(nèi)，取值與取值概率間一一對應(yīng)的關(guān)系，稱之為隨機變量的概率分布，簡稱分布。2.概率分布的意義描述隨機變量變化的統(tǒng)計規(guī)律。方便地計算任一事件發(fā)生的概率。2023/2/410（二）離散型隨機變量的概率分布

1.離散型隨機變量概率分布的兩種表現(xiàn)形式分布列（律）2.概率函數(shù)2023/2/411概率函數(shù)的數(shù)學(xué)性質(zhì)2023/2/412（三）連續(xù)型隨機變量的概率分布（1）

1.連續(xù)型隨機變量的表現(xiàn)方式－－密度函數(shù)2023/2/413（三）連續(xù)型隨機變量的概率分布（2）2.密度函數(shù)的數(shù)學(xué)性質(zhì)3.事件“”發(fā)生的概率的計算方法2023/2/414（三）連續(xù)型隨機變量的概率分布（3）4.事件“”發(fā)生的概率的幾何意義5.連續(xù)型隨機變量的期望值和方差分別為2023/2/415（四）隨機變量的分布函數(shù)

1.分布函數(shù)的來源離散型隨機變量的分布用概率函數(shù)來描述，連續(xù)型隨機變量的分布用密度函數(shù)來描述，兩者形式不同，表現(xiàn)各異。為了更方便地表現(xiàn)隨機變量的分布，下面引入分布函數(shù)。

2.分布函數(shù)的定義2023/2/416分布函數(shù)的幾何意義及數(shù)學(xué)性質(zhì)1.幾何意義2.數(shù)學(xué)性質(zhì)2023/2/417隨機變量分布函數(shù)的具體表現(xiàn)2023/2/4182023/2/419（五）連續(xù)型隨機變量的概率分布1.密度函數(shù)的定義2023/2/420（六）常見的連續(xù)型隨機變量的分布---------

正態(tài)分布定義2023/2/421

正態(tài)分布正態(tài)分布的密度函數(shù)圖形是一條以均值為中心的對稱鐘型曲線2023/2/422

正態(tài)分布正態(tài)分布密度函數(shù)的數(shù)學(xué)性質(zhì)2023/2/423

正態(tài)分布參數(shù)和對曲線形態(tài)的影響2023/2/424標(biāo)準(zhǔn)正態(tài)分布及其重要意義2023/2/425

正態(tài)分布標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化法2023/2/426標(biāo)準(zhǔn)化法的幾何意義標(biāo)準(zhǔn)化變換實質(zhì)上是作了一個坐標(biāo)軸的平移和尺度變換，使正態(tài)分布的平均數(shù)，標(biāo)準(zhǔn)差。2023/2/427

正態(tài)分布正態(tài)分布表及上側(cè)分位數(shù)2023/2/428

正態(tài)分布

準(zhǔn)則2023/2/429

正態(tài)分布（P118）(記住啦)準(zhǔn)則示意圖2023/2/430

正態(tài)分布正態(tài)分布的重要意義在隨機理論中，正態(tài)分布是最重要的一種分布，理由如下：⑴它是最常見的一種分布，現(xiàn)實中許多隨機變量服從或近似服從正態(tài)分布。⑵在一定的條件下，正態(tài)分布是其他分布的近似分布。⑶許多有用的分布，特別是小樣本的精確分布是由正態(tài)分布推導(dǎo)出來的。2023/2/431

小樣本的精確分布

1.分布由阿貝(Abbe)于1863年首先給出，后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導(dǎo)出來。2.分布也稱學(xué)生氏（Student）分布，是由哥塞特（W.S.Gosset）在1908年首次提出，其重要意義在于提供了小樣本研究方法。3.分布是由統(tǒng)計學(xué)家費雪（R.A.Fisher）首次提出的。2023/2/432

分布－－定義2023/2/433

分布－－密度函數(shù)圖象

2023/2/434

分布－－期望和方差及上側(cè)分位數(shù)

2023/2/435

分布－－定義2023/2/436

分布－－密度函數(shù)圖象2023/2/437

分布－－期望和方差及上側(cè)分位數(shù)2023/2/438

分布的上側(cè)分位數(shù)2023/2/439

分布－－定義2023/2/440

分布－－密度函數(shù)圖象2023/2/441

分布－－期望和方差2023/2/442

分布－－上側(cè)分位數(shù)2023/2/443常見的概率分布在抽樣推斷中的作用2023/2/444第二節(jié)大數(shù)定律與中心極限定理p119一、大數(shù)定律1.切比雪夫大數(shù)定律2.貝努里大數(shù)定律二、中心極限定理1.林德貝格-勒維中心極限定理2.棣莫弗-拉普拉斯中心極限定理2023/2/445一、大數(shù)定律

大數(shù)定律又稱作大數(shù)法則，是關(guān)于“均值具有穩(wěn)定性”的一類定理。個別事物因偶然因素的影響而產(chǎn)生變異，有各自不同的表現(xiàn)，但是，對總體進(jìn)行大量觀察后平均，就能使偶然因素的影響相互抵消，消除由個別偶然因素引起的極端性影響，從而使總體均值穩(wěn)定下來，反映出事物變化的一般規(guī)律。2023/2/446（一）切比雪夫大數(shù)定律2023/2/447（一）切比雪夫大數(shù)定律2023/2/448（二）貝努里大數(shù)定律

2023/2/449

二、中心極限定理

大數(shù)定律說明了當(dāng)樣本容量n充分大時，樣本均值趨于總體均值，但并不等于總體均值，說明樣本推斷總體時存在誤差。若要控制推斷誤差，顯然須知樣本均值這一隨機變量的概率分布，可惜大數(shù)定律只提供了推斷方法，并未給出推斷誤差的概率分布。而中心極限定理正好彌補了大數(shù)定律的這一不足。2023/2/450（一）林德貝格-勒維中心極限定理2023/2/451（一）林德貝格-勒維中心極限定理2023/2/452（二）棣莫弗-拉普拉斯（）

中心極限定理2023/2/453兩類極限定理的意義1.如果說大數(shù)定律是關(guān)于“均值具有穩(wěn)定性”的一類定律，它提供了樣本估計總體的方法，那么中心極限定理則是關(guān)于“估計誤差概率分布”的一類定理，它不僅提供了估計方法，而且還提供了控制估計誤差的方法。2.中心極限定理還揭示了正態(tài)分布形成的機制，即如果某一個量是許多隨機因素綜合影響迭加形成的，在這許多影響因素中沒有任何一個起著主導(dǎo)作用，那么這個量就是一個服從正態(tài)分布的正態(tài)隨機變量?；貧w模型中的隨機誤差項常假定服從正態(tài)分布，其依據(jù)便在于此。2023/2/454第三節(jié)統(tǒng)計量的抽樣分布

(重點)p123-137一、抽樣方式二、樣本與統(tǒng)計量三、抽樣分布1.樣本均值的抽樣分布2.樣本方差的抽樣分布3.樣本成數(shù)的抽樣分布（大樣本情形）注意：

在學(xué)習(xí)下面內(nèi)容之前，同學(xué)們自己一定要去好好復(fù)習(xí)、理解隨機變量、概率、概率分布、隨機變量的分布函數(shù)、正態(tài)分布、正態(tài)分布標(biāo)準(zhǔn)化、t分布、參數(shù)、統(tǒng)計量等概念的涵義，會查表計算標(biāo)準(zhǔn)正態(tài)分布的概率。2023/2/4552023/2/456

第三節(jié)統(tǒng)計量的抽樣分布

一、抽樣方式

抽樣調(diào)查屬于非全面調(diào)查，抽樣的核心問題是如何保證樣本對總體具有充分的代表性。按是否根據(jù)已知概率抽選樣本單位，抽樣方式可分為概率抽樣和非概率抽樣；統(tǒng)計推斷主要采用概率推斷。按抽取樣本單位后是否放回，抽樣方式又可分為重置抽樣（放回）和不重置抽樣（不放回）。2023/2/457一、抽樣方式P123（一）概率抽樣概率抽樣是按照隨機原則進(jìn)行抽樣的方式，它不加任何主觀因素，組成總體的每個單位都有被抽中的概率，樣本對總體有很強的代表性。1．概率抽樣的優(yōu)點和不足概率抽樣的優(yōu)點有：（1）調(diào)查結(jié)果可以用來推斷總體；（2）能估算出并能控制抽樣誤差。概率抽樣的不足有：（1）在大多數(shù)案例中，相同規(guī)模的概率抽樣的費用要比非概率抽樣高；（2）概率抽樣比非概率抽樣的技術(shù)要求高，需要更多的時間策劃和實施。2.常用的概率抽樣方法

（1）簡單隨機抽樣，又稱純隨機抽樣，它是抽樣前對總體不加任何分組、劃類、排隊等處理，完全隨機地抽取樣本單位的方法。（2）等距抽樣，又稱機械抽樣或系統(tǒng)抽樣，它是抽樣前將總體各單位按一定標(biāo)志或次序排隊，然后按相等的距離抽取樣本單位的方法。（3）類型抽樣，又稱分類抽樣或分層抽樣，它是抽樣前將總體單位按其屬性特征分成若干類型或?qū)樱缓笤诟黝愋突驅(qū)又须S機抽取樣本單位的方法。（4）整群抽樣，又稱集團抽樣，它是抽樣前將總體各單位按一定標(biāo)準(zhǔn)分成若干群或組，再從總體中隨機抽取一定數(shù)量的群或組，對抽中的群或組的所有單位進(jìn)行全面調(diào)查的方法。（5）多階段抽樣，又稱多級抽樣，它是將調(diào)查分成兩個或兩個以上的階段進(jìn)行抽樣的方法。第一階段先將總體按照一定的規(guī)范分成若干抽樣單位，稱之為一級抽樣單位，再把抽中的一級抽樣單位分成若干更小的二級抽樣單位，從抽中的二級抽樣單位再分三級抽樣單位，…，這樣就形成一個多階段抽樣過程。其特點是，當(dāng)一次抽樣不能得到樣本單位而總體又超大、復(fù)雜時使用。

在抽樣調(diào)查的實際工作中，經(jīng)常是要將幾種抽樣方法結(jié)合起來應(yīng)用。2023/2/459（二）非概率抽樣

非概率抽樣是按主觀意向進(jìn)行抽樣的方式，因組成總體的一部分單位沒有被抽中的機會，故容易出現(xiàn)樣本對總體的系統(tǒng)性偏差。一般情況下，非概率抽樣得到的樣本不適宜推斷總體。1．非概率抽樣的特點非概率抽樣的優(yōu)點是簡單易行、成本低、省時間等，在操作上也比概率抽樣簡單。但由于無法排除抽樣者的主觀性，無法客觀地評價樣本的代表性，特別是不能計算和控制抽樣誤差，因此樣本不具有推論總體的性質(zhì)。非概率抽樣多用于探索性研究、預(yù)備性研究和總體邊界不清難于實施概率抽樣的研究。實際應(yīng)用時，采用非概率抽樣的原因包括：（1）受客觀條件的限制，無法采用嚴(yán)格的概率抽樣方法；（2）調(diào)查時效性要求高，要迅速取得調(diào)查結(jié)果；（3）調(diào)查對象不確定或者無法確定；（4）總體各單位的標(biāo)志值差異不大，而且調(diào)查者有豐富的調(diào)查經(jīng)驗等。因概率抽樣與非概率抽樣各有優(yōu)缺點，且各有適宜使用的場合，故在實際應(yīng)用中，非概率抽樣往往與概率抽樣結(jié)合使用。2．常用的非概率抽樣方法常用的非概率抽樣方法包括方便抽樣、配額抽樣、判斷抽樣和滾雪球抽樣等。2023/2/461（三）重復(fù)抽樣和不重復(fù)抽樣1．重復(fù)抽樣又稱有放回抽樣，它是每次從總體中抽取一個單位，觀察記錄后又放回，再抽取下一個。因此，重復(fù)抽樣的樣本是由次相互獨立的連續(xù)試驗所組成的，每次實驗在相同條件下進(jìn)行，在整個抽樣過程中總體單位數(shù)始終不變，各單位被抽中的概率前后相等。2．不重復(fù)抽樣又稱無放回抽樣，它是每次從總體中抽取一個單位，觀察記錄后不放回，再抽取下一個。因此，不重復(fù)抽樣的樣本雖由次連續(xù)試驗所組成，而實質(zhì)等于一次同時從總體中抽個單位組成一個樣本，每次實驗不是相互獨立的，在整個抽樣過程中每抽一次總體單位就少一個，各單位被抽中的概率前后不等，越往后被抽中的機會就越大。在實踐中當(dāng)總體單位數(shù)很大，樣本單位數(shù)相對較小時，可以把不重復(fù)抽樣看成重復(fù)抽樣，這時的計算比較簡單。2023/2/462二、樣本與統(tǒng)計量

（一）簡單隨機樣本（二）參數(shù)、統(tǒng)計量參數(shù)(parameter)來描述總體特征的概括性數(shù)字度量，是研究者想要了解的總體的某種特征值所關(guān)心的參數(shù)主要有總體均值()、標(biāo)準(zhǔn)差()、總體比例()等總體參數(shù)通常用希臘字母表示統(tǒng)計量(statistic)用來描述樣本特征的概括性數(shù)字度量，它是根據(jù)樣本數(shù)據(jù)計出來的一些量，是樣本的函數(shù)。（統(tǒng)計量是隨機變量）。所關(guān)心的樣本統(tǒng)計量有樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等樣本統(tǒng)計量通常用小寫英文字母來表示2023/2/464（三）常用統(tǒng)計量--12023/2/465（三）常用統(tǒng)計量

-22023/2/466（三）常用統(tǒng)計量-32023/2/467補充：三種不同性質(zhì)的分布P129

總體分布：總體中各元素的觀察值所形成的相對頻率分布。

樣本分布：一個樣本中各元素的觀察值所成的相對頻率分布。當(dāng)樣本容量n逐漸增大時，樣本分布逐漸接近總體的分布。抽樣分布：樣本統(tǒng)計量的概率分布，是一種理論分布在重復(fù)選取容量為n的樣本時，由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布2023/2/468補充：抽樣分布（第66-76張）①指樣本統(tǒng)計量的概率分布；②樣本統(tǒng)計量是樣本的函數(shù)，依據(jù)不同的樣本計算出來的值是不同的所以統(tǒng)計量是隨機變量樣本均值,樣本比例，樣本方差等;③它的結(jié)果來自容量相同的所有可能樣本;④它提供了樣本統(tǒng)計量長遠(yuǎn)而穩(wěn)定的信息，是進(jìn)行推斷的理論基礎(chǔ)，也是抽樣推斷科學(xué)性的重要依據(jù) 補充：樣本均值抽樣分布的形成過程【例】設(shè)一個總體，含有4個元素(個體)

，即總體單位數(shù)N=4。4

個個體分別為x1=1，x2=2，x3=3，x4=4

?？傮w分布、總體的均值、方差及分布如下：總體分布14230.1.2.3均值和方差

補充：現(xiàn)從總體中抽取n＝2的簡單隨機樣本，在重復(fù)抽樣條件下，共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本（共16個）總體1、2、3、4樣本總體1、2、3、4

計算出各樣本的均值，如下表。并給出樣本均值的抽樣分布P1853.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值（）樣本均值的抽樣分布樣本均值所有可能取值2023/2/472補充：樣本均值的抽樣分布形式（樣本均值的分布與總體分布的比較)

=2.5why?σ2=1.25

的分布形式與原有總體和樣本容量n的大小有關(guān)總體分布14230.1.2.3的抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時，來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布，x

的數(shù)學(xué)期望為μ，方差為σ2/n。即x～N(μ,σ2/n)（記住，已知）2023/2/474中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(n

30)，樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理：設(shè)從均值為，方差為2的一個任意總體中抽取容量為n的樣本，當(dāng)n充分大時，樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x中心極限定理(centrallimittheorem)x的分布趨于正態(tài)分布的過程樣本均值的數(shù)學(xué)期望樣本均值的方差（方差的概率意義在于刻畫了隨機變量取值的分散程度。方差越小，隨機變量的取值越集中在期望值附近。）

重復(fù)抽樣不重復(fù)抽樣補充：樣本均值抽樣分布的特征(數(shù)

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第四章抽樣分布

文檔簡介

溫馨提示

最新文檔

評論

第四章抽樣分布

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔