




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、2020/9/11,第五章,抽樣調(diào)查,2020/9/11,本 章 內(nèi) 容,第一節(jié) 抽樣調(diào)查概述,第二節(jié) 抽樣調(diào)查的數(shù)理基礎(chǔ),第三節(jié) 抽樣誤差與參數(shù)估計,第四節(jié) 抽樣調(diào)查的組織方式,2020/9/11,綜合指標,總量指標,相對指標,平均指標,變異指標,反映總體數(shù)量特征,如何取得總體指標數(shù)據(jù)? 一是通過全面調(diào)查方式,如普查、全面統(tǒng)計報表等。 二是通過抽樣調(diào)查(即抽樣推斷)方式。,2020/9/11,.,第一節(jié) 抽樣調(diào)查概述,一、抽樣調(diào)查的概念、特點及作用 二、抽樣調(diào)查中的基本概念 三、抽樣調(diào)查的一般步驟,2020/9/11,(一)抽樣調(diào)查的概念 (二)抽樣調(diào)查的特點 (三)抽樣調(diào)查的應(yīng)用場合 (四
2、)抽樣調(diào)查推斷總體的兩種類型,一、抽樣調(diào)查的概念、特點及作用,2020/9/11,抽樣調(diào)查是以概率論和數(shù)理統(tǒng)計理論為基礎(chǔ),按照隨機原則從調(diào)查總體中抽取一部分單位作為樣本進行調(diào)查,再用樣本數(shù)值,對總體數(shù)量特征作出具有一定可靠程度的推斷。 也稱為抽樣推斷、抽樣估計或統(tǒng)計推斷,是一種非全面調(diào)查。,,,(一)抽樣調(diào)查的概念,2020/9/11,抽樣,樣本,n = 100,總體,N =10000,推斷,(總體指標),(樣本指標),【例】要得到某廠生產(chǎn)10000只燈泡的平均耐用時間,就只能采用抽樣調(diào)查的方法,從中隨機抽取100只燈泡組成樣本,對樣本進行檢驗。,2020/9/11,(二) 抽樣調(diào)查的特點,實
3、施隨機抽樣的原因: 能使樣本分布與總體分布相同或相近,使樣本代表性變強。 能使樣本統(tǒng)計量成為具有一定分布規(guī)律的隨機變量,可以根據(jù)樣本統(tǒng)計量的分布規(guī)律,運用概率理論對抽樣調(diào)查結(jié)果的誤差進行計算和評價。,2、調(diào)查目的是根據(jù)樣本指標來推斷總體; 3、在調(diào)查之前可以計算出抽樣誤差和控制大小; 4、運用概率對總體進行估計和推斷。,1、實施隨機抽樣,即按照隨機原則從總體中抽取樣本,使各個調(diào)查單位被抽中的概率相等。,2020/9/11,(三)抽樣調(diào)查的應(yīng)用 用于不能用全面調(diào)查方式進行調(diào)查的現(xiàn)象。,用于通過全面調(diào)查后結(jié)果將失去意義的現(xiàn)象。,如調(diào)查某地區(qū)的礦藏、某城市的空氣質(zhì)量等。,如炮彈射程的測量,電視、燈泡
4、等耐用時數(shù)的檢驗等屬于破壞性調(diào)查。,用于經(jīng)全面調(diào)查后成本過高或調(diào)查精度要求不高的現(xiàn)象。,如某市居民家計調(diào)查,某林區(qū)的木材儲存量調(diào)查等。,2020/9/11,用于調(diào)查時效性要求較強的現(xiàn)象。,如為滿足領(lǐng)導(dǎo)機關(guān)及時制訂政策、安排工作需要而進行的民意測驗,某農(nóng)產(chǎn)品的產(chǎn)量調(diào)查等。,1994年,我國確立了以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)查為主體,同時輔之以重點調(diào)查、科學(xué)核算等綜合運用的統(tǒng)計調(diào)查方法體系,抽樣調(diào)查的主體方法地位得以正式確立。,5.用于修正全面調(diào)查的結(jié)果。,如在人口普查結(jié)束后,運用抽樣調(diào)查的方法對普查結(jié)果進行修正等。,2020/9/11,(四)抽樣調(diào)查推斷總體的兩種類型 一類是參數(shù)估計:研究
5、的是用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))的方法。 一類是假設(shè)檢驗: 它是先對總體參數(shù)或特征提出一個假設(shè),然后利用樣本信息去檢驗這個假設(shè)是否成立。如果成立,就接受這個假設(shè);如果不成立,就放棄這個假設(shè)。 例:,【例】對可口可樂公司生產(chǎn)的一種瓶裝雪碧產(chǎn)品進行檢查,包裝上標明其凈含量是500ml。在市場上隨機抽取了50瓶,測得到其平均含量為499.5ml,標準差為2.63ml。根據(jù)這些數(shù)據(jù)可以進行:,一是參數(shù)估計:用95%的概率保證,該種包裝的雪碧平均含量在498.77-500.23ml之間;,二是假設(shè)檢驗:根據(jù)樣本數(shù)據(jù)結(jié)合統(tǒng)計分布規(guī)律,對 “該種瓶裝雪碧重量不符合所標明的重量”假設(shè)進行否定或肯定
6、。,2020/9/11,二、抽樣調(diào)查中的基本概念,(一)抽樣調(diào)查中常用的指標 (二)抽樣方法 (三)抽樣框 (四)樣本的可能個數(shù),2020/9/11,總體:即根據(jù)研究目的確定的所要研究的同類事物的全體,也稱為全集總體、母體。 總體單位:組成總體的各個單位,也稱為個體或子體。 總體容量:總體單位的總數(shù),一般用“N”表示。,1、總體與總體指標,2020/9/11,總體參數(shù)的具體形式見后表:抽樣調(diào)查中常用的指標,總體指標,或總體參數(shù):它是用來反映總體數(shù)量特征的指標。,總體,是唯一確定的,注意:由于總體是唯一確定的,所以總體指標也是唯一確定的,但又是未知的,需要用樣本指標來估計。,總體參數(shù),2020/
7、9/11,總體,是唯一確定的,樣本:也稱為抽樣總體,是從總體中按隨機原則抽取出來的一部分單位的組成集合體,作為總體的代表。,樣本容量:樣本中包含的單位數(shù),一般用n表示。 n30為大樣本,n30為小樣本,樣本k,由于抽樣方法和樣本容量的不同,從一個總體中可以抽出許多個不同的樣本。在實際調(diào)查時,一般只從總體中抽取一個或幾個樣本進行調(diào)查,哪一個樣本被抽到完全是隨機的。,2、樣本與樣本指標,不是唯一確定的,2020/9/11,樣本指標是隨機變量,它會隨著樣本的不同而有不同的取值。,樣本指標,也稱為樣本統(tǒng)計量、估計量:是根據(jù)樣本中各個單位數(shù)據(jù)計算的反映樣本特征的指標。,抽樣調(diào)查中常用的指標: 總量指標
8、平均數(shù)(均值) 方差或標準差 成數(shù)或比例(是非標志比重) (計算公式見下表),注意:總體指標(參數(shù))和樣本指標(統(tǒng)計量)是一一對應(yīng)的。,2020/9/11,是唯一確定的,是隨機變量,它會隨著樣本的不同而有不同的取值,總體平均 數(shù),總體標準 差,樣本平均 數(shù),樣本標準 差,總體平均 數(shù),總體標準 差,樣本平均 數(shù),總體成數(shù),樣本標準 差,變量 總 體,屬性 總 體,性質(zhì),變量 樣 本,屬性 樣 本,性質(zhì),表5-1 抽樣調(diào)查中常用指標及計算公式,2020/9/11,(二)抽樣方法,重復(fù)抽樣 不重復(fù)抽樣,2020/9/11,1、重復(fù)抽樣,即指要從總體的N個單位中隨機抽取一個單位數(shù)為n的樣本,每次抽出
9、一個單位記錄其特征后,再放回總體中參加下一次抽選。這樣連續(xù)抽n次即得到所需樣本。,(即每次抽取是獨立的,條件相同),(重置抽樣,有放回的抽樣),2020/9/11,2、不重復(fù)抽樣(不重置抽樣,無放回的抽樣),即每次從總體N個單位中隨機抽出一個單位后,就不再放回總體中,下一個樣本單位再從余下的總體單位中抽取。這樣連續(xù)抽n次即得到一個單位數(shù)為n的樣本。,(即每次抽取不是獨立的,條件不同),2020/9/11,概率抽樣(隨機抽樣):是指按照隨機原則抽取樣本單位。,非概率抽樣(非隨機抽樣):是指調(diào)查單位的抽取是非隨機的。 重點調(diào)查、典型調(diào)查、方便抽樣中單位的選取就屬于非隨機抽樣形式。在抽樣調(diào)查中有時也
10、采用非概率抽樣方式抽取樣本。,此外,從抽取樣本的隨機性看,分為兩類形式:,2020/9/11,抽樣框是包括全部總體單位名單的框架。 實施概率抽樣必須具備抽樣框。,抽樣框的形式有:,名單抽樣框:列出全部單位名單的一覽表。,區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小的 區(qū)域,以小區(qū)域為抽樣單位。,時間表抽樣框:將總體全部單位按時間順序排列,把總 體的時間分為若干小段時間,以各個小 段的時間單位為抽樣單位。,(三)抽樣框,2020/9/11,(四)樣本的可能個數(shù) 它是指從總體N個單位中隨機抽選n個單位構(gòu)成樣本,結(jié)果有排列組合,一種排列組合便構(gòu)成一個可能的樣本,排列組合的總數(shù)稱為樣本的可能個數(shù)。,【
11、例】假設(shè)總體有A、B、C、D、E五個單位,現(xiàn)純隨機重復(fù)抽取2個單位組成樣本,求全部可能樣本個數(shù)。,(N = 5 n = 2),2020/9/11,(1)在 n 次抽樣中,總體每個單位在各次抽樣中被抽取的概率都相同(即均為 1N );,重復(fù)抽樣的特點:,(2)共可組成 個樣本,每個樣本在各次抽樣中被抽取的概率都相同(即均為1k) 。,(抽后放回),第二次抽?。?則所有可能的樣本個數(shù)為:,AA AB AC AD AE BA BB BC BD BE CA CB CC CD CE DA DB DC DD DE EA EB EC ED EE,即:,第一次抽取:,解:,2020/9/11,【例】假設(shè)總體有
12、A、B、C、D、E五個單位,現(xiàn)純隨機不重復(fù)抽取2個單位組成樣本,求全部可能樣本個數(shù)。,(N = 5 n = 2),第一次抽?。?第二次抽取:,則所有可能的樣本個數(shù)為:, AB AC AD AE BA BC BD BE CA CB CD CE DA DB DC DE EA EB EC ED ,(抽后不放回),解:,2020/9/11,(1)n次抽樣中,總體每個單位在各次抽樣中被抽取的概率不相同(第1次是1N,第2次是1N1, );,(2)可組成k = N(N1) (N 2) (N n + 1)個樣本,每個樣本在各次抽樣中被抽取的概率都相同(即均為1k) 。,不重復(fù)抽樣的特點:,2020/9/11
13、,可能的樣本個數(shù)計算公式,2020/9/11,設(shè)計抽樣方案,抽取樣本單位,收集樣本數(shù)據(jù),計算樣本統(tǒng)計量,推斷總體,三、抽樣調(diào)查的一般步驟,界定調(diào)查總體 選擇收集資料的方式 選擇抽樣框 確定抽樣組織形式 確定抽樣方法 確定樣本單位數(shù),抽取樣本 評估樣本,2020/9/11,.,.,隨機原則,樣本,n = 100,總體,N =10000,推斷,(抽樣誤差),(總體指標),(樣本指標),M個樣本,抽樣實際誤差,抽樣平均誤差,(可以計算),(無法計算),抽樣極限誤差,概率度,置信度(概率),2020/9/11,.,第二節(jié) 抽樣調(diào)查的數(shù)理基礎(chǔ),一、概率 二、隨機變量及其分布 三、大數(shù)定律和中心極限定理
14、四、抽樣分布,2020/9/11,一、概率,(一)隨機事件 (二)事件的概率 (三)概率的基本性質(zhì),2020/9/11,隨機現(xiàn)象:在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象。 如,“一分鐘內(nèi)從某十字路口通過30輛汽車” “拋一次硬幣,正面朝上”。,隨機試驗:對隨機現(xiàn)象進行觀察的過程。,可在相同條件下重復(fù)進行; 所有可能結(jié)果可知; 事先不能肯定哪一結(jié)果出現(xiàn)。,須滿足三 個條件:,與隨機現(xiàn)象相對應(yīng)的是確定性現(xiàn)象,是指在一定條件下,能夠明確預(yù)見其結(jié)果的現(xiàn)象。,(一)隨機事件,2020/9/11,隨機事件:隨機試驗的每一可能結(jié)果。,基本事件(樣本點):不可能再分的事件; 例如:擲一枚骰子出現(xiàn)的點數(shù),有“1
15、”、“2”“6”6個 樣本空間 (基本空間):基本事件的全體()。 一個試驗中所有基本事件的集合,用表示 例如:在擲枚骰子的試驗中, 1,2,3,4,5,6 在投擲硬幣的試驗中,正面,反面,2020/9/11,復(fù)雜事件:由某些基本事件組合而成的事件。 必然事件:每次試驗必然發(fā)生的事件()。,不可能事件:每次試驗必然不會發(fā)生的事件()。,例如,在擲一枚骰子觀察點數(shù)的試驗中, “出現(xiàn)的點數(shù)不超過6”是必然事件; “出現(xiàn)8點”是不可能事件; “出現(xiàn)點數(shù)是奇數(shù)”是復(fù)雜事件,是由若干個基本事件組合而成的。,2020/9/11,(二)事件的概率,概率(幾率)是指隨機事件發(fā)生的可能性。事件A的概率是對事件A
16、在試驗中出現(xiàn)的可能性大小的一種度量; 表示事件A出現(xiàn)可能性大小的數(shù)值; 事件A的概率表示為P(A); 概率的定義有:古典定義、統(tǒng)計定義和主觀概率定義,2020/9/11,古典定義: 某一事件A發(fā)生的概率,是該事件所包含的基本事件數(shù) m與基本空間中基本事件總數(shù)n 的比值。(客觀存在),【例】投擲 2 枚骰子,求 2 枚骰子中至少有一枚出現(xiàn) 6 點,且點數(shù)之和為偶數(shù)的概率。,解:A有“(6,2),(6,4),(6,6),(2,6),(4,6)”5種;,2020/9/11,【例】某鋼鐵公司所屬三個工廠的職工人數(shù)如下表。從該公司中隨機抽取1人,問: (1)該職工為男性的概率; (2)該職工為煉鋼廠職工
17、的概率。,2020/9/11,解: (1)用A 表示“抽中的職工為男性”這一事件;A為全公司男職工的集合;基本空間為全公司職工的集合。則,(2) 用B 表示“抽中的職工為煉鋼廠職工”;B為煉鋼廠 全體職工的集合;基本空間為全體職工的集合。則,2020/9/11, 統(tǒng)計定義: 在相同條件下重復(fù)進行n次試驗,事件A發(fā)生m次,隨著試驗次數(shù)n的增大,事件A發(fā)生的頻率 m/n 圍繞某一常數(shù)p上下波動的幅度愈來愈小,且逐步趨于穩(wěn)定,則稱p為事件A的概率。(多次試驗),(5.2),如:,2020/9/11,【例】投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù) n 的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左
18、右,2020/9/11,【例】某工廠為節(jié)約用電,規(guī)定每天的用電量指標為1000度。按照上個月的用電記錄,30天中有12天的用電量超過規(guī)定指標,若第二個月仍沒有具體的節(jié)電措施,試問該廠第一天用電量超過指標的概率。 解:上個月30天的記錄可以看作是重復(fù)進行了30次試驗,試驗A表示用電超過指標出現(xiàn)了12次。根據(jù)概率的統(tǒng)計定義有,2020/9/11, 主觀定義: 人們根據(jù)經(jīng)驗和所掌握的有關(guān)信息,對事件發(fā)生的可能性大小給出的估計值。(調(diào)查研究),例如,高考填志愿時,某考生估計自己被一本第一志愿錄取的可能性為80%;如果一本落榜,被二本第一志愿錄取的可能性為99%。,2020/9/11,(三)概率的基本性
19、質(zhì),非負性 對任意事件A,有 0 P 1 規(guī)范性 必然事件的概率為1;不可能事件的概率為0。即P ( ) = 1; P ( ) = 0 可加性 若A與B互斥,則P( AB ) = P( A ) + P( B ) 推廣到多個兩兩互斥事件A1,A2,An,有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ),2020/9/11,(四)概率的加法法則(兩個)法則1:兩個互斥事件之和的概率,等于兩個事件概率之和。假設(shè)A和B是互斥事件,則:,法則2:對于任意兩個隨機事件,它們之和的概率等于兩事件的概率之和減去兩事件之交的概率。即:,2020/9/11,【例】設(shè)某
20、地有甲、乙兩種報紙,該地成年人中有20讀甲報紙,16讀乙報紙,8兩種報紙都讀,問成年人中有百分之幾至少讀一種報紙?解:設(shè)A讀甲報紙,B讀乙報紙,C至少讀一種報紙,則:由題意知 于是 即有28的成年人至少讀一種報紙。,2020/9/11,二、隨機變量及其分布,(一)隨機變量 (二)離散型隨機變量的概率分布 (三)連續(xù)型隨機變量的概率分布 (四) 正態(tài)分布,2020/9/11,隨機變量的概念:描述隨機現(xiàn)象某一側(cè)面的變量,是對一次試驗的結(jié)果的數(shù)值性描述。 一般用 X、Y、Z 來表示。,隨機變量的特點: 取值的隨機性;取值的規(guī)律性。,3.隨機變量的種類:根據(jù)取值情況的不同分 離散型隨機變量 連續(xù)型隨機
21、變量,(一)隨機變量,2020/9/11,(1)離散型隨機變量,概念:隨機變量 X 取有限個值或所有取值都可以逐個列舉出來 X1 , X2, 離散型隨機變量的例子:,2020/9/11,(2)連續(xù)型隨機變量,概念:隨機變量 X 取無限個值。 取數(shù)軸上某一區(qū)間內(nèi)的任意點。 所有可能取值不可以逐個列舉出來。 連續(xù)型隨機變量的例子:,2020/9/11,1、概念:先列出離散型隨機變量X的所有可能取值;再列出隨機變量取這些值的概率。 用下面的表格來表示:,P(X =xi)=pi稱為離散型隨機變量的概率函數(shù),(二)離散型隨機變量的概率分布,pi0,2020/9/11,2、離散型隨機變量的概率分布舉例:,
22、【例】如規(guī)定打靶中域得3分,中域得2分,中域得1分,中域外得0分。 今某射手每100次射擊,平均有30次中域,55次中域,10次中,5次中域外。則考察每次射擊得分為0,1,2,3這一離散型隨機變量,其概率分布為,2020/9/11,3、離散型隨機變量的概率分布的類型,2020/9/11,(1) 二項分布(01分布),產(chǎn)生二項分布的過程稱為貝努里試驗。每一次試驗只有兩個結(jié)果的重復(fù)試驗稱為貝努里試驗。,貝努里試驗的特點:,第一,每次試驗只有兩種可能結(jié)果:成功或失敗、是或否 第二,不管進行多少次,任何一次試驗結(jié)果的概率是固定的 第三,試驗是相互獨立的,2020/9/11,一個離散型隨機變量X只取兩個
23、可能的值; 例如: 男性用 1表示,女性用0表示; 合格品用 1 表示,不合格品用0表示 列出隨機變量取這兩個值的概率,就形成二項分布。,隨機變量X服從參數(shù)n和p的二項分布,記為: ,其期望值等于 ,其方差等于 。,2020/9/11,【例】已知一批產(chǎn)品的次品率為p0.05,合格率為q=1-p=1-0.5=0.95。并指定廢品用1表示,合格品用0表示。則任取一件為廢品或合格品這一離散型隨機變量,其概率分布為,二項分布的概率分布表達式:,2020/9/11,(2)泊松分布,泊松分布是一種描述離散型隨機變量的概率分布。若 代表離散型隨機變量, 值可以取 ,用小寫的 表示變量 可能取的某個具體值,則
24、事件恰好發(fā)生 次的泊松分布公式為:,式中:,是 的期望和方差,是自然對數(shù)的底,約等于2.71828,是 的階乘,2020/9/11,=2,= 3,= 5,= 10,= 15,泊松分布圖一般是正偏斜的, 值越小,偏斜度越大,隨著 的值的增大,偏斜度逐漸縮小。如左圖所示。,2020/9/11,當要研究在指定時間或空間區(qū)間內(nèi)隨機現(xiàn)象發(fā)生的問題時,比如說,單位時間、單位長度或單位面積上觀察到的次品數(shù),或在某一固定時間區(qū)間內(nèi)到達某加油站的顧客數(shù),以及某企業(yè)每月發(fā)生的工傷事故次數(shù)等等,就產(chǎn)生了泊松分布的重要應(yīng)用。泊松分布可以用于解決指定時間或空間區(qū)間內(nèi)隨機現(xiàn)象發(fā)生的問題。,當二項試驗中樣本容量 很大而成功
25、的概率 很小時,那么,二項概率一般可以采用泊松分布所產(chǎn)生的相應(yīng)概率來逼近。為了逼近二項概率分布,可以令 。當 很大而 又很小 ( 為最佳)時,泊松分布就成了二項概率的良好近似方法。,2020/9/11,(3)超幾何分布,二項分布主要用于計算有限總體重復(fù)抽樣的概率,而如果在有限總體中進行不重復(fù)抽樣,就會破壞有關(guān)貝努里試驗獨立性的條件。而超幾何分布就是研究不重復(fù)抽樣的適當?shù)哪P汀?若隨機變量具有下述概率密度函數(shù),則稱為服從 超幾何分布,2020/9/11,一個離散型隨機變量取各個值的概率相同。 列出隨機變量取值及其取值的概率,就形成了均勻分布。,(4) 均勻分布,2020/9/11,【例】投擲一枚
26、骰子,出現(xiàn)的點數(shù)是個離散型隨機變量,其概率分布為,2020/9/11,期望值在描述具體的統(tǒng)計數(shù)據(jù)時,我們使用均值來描述數(shù)據(jù)的集中趨勢。而期望值是均值的一種推廣,它反映隨機變量的平均水平。 方差除了隨機變量的平均水平之外,有時我們還要測定它的離散程度。前面我們曾用方差來描述數(shù)據(jù)的離散程度。同樣,這里我們用隨機變量的方差來反映隨機變量取值的離散程度。,4、離散型隨機變量的數(shù)學(xué)期望和方差,2020/9/11,離散型隨機變量的數(shù)學(xué)期望,概念:在離散型隨機變量X的一切可能取值的完備組中,各可能取值xi與其取相對應(yīng)的概率pi乘積之和。 作用:描述離散型隨機變量取值的集中程度 公式:,2020/9/11,概
27、念:隨機變量X的每一個取值與期望值的離差平方和的數(shù)學(xué)期望,記為D(X)。 作用:描述離散型隨機變量取值的分散程度 公式:,離散型隨機變量的方差,2020/9/11,例:離散型隨機變量的指標計算,【例】投擲一枚骰子,出現(xiàn)的點數(shù)是個離散型隨機變量,其概率分布為如下。計算數(shù)學(xué)期望和方差,解:數(shù)學(xué)期望為:,方差為:,2020/9/11,(三)連續(xù)型隨機變量的概率分布,由于連續(xù)型隨機變量可以取某一區(qū)間或整個實數(shù)軸上的任意一個值,它取任何一個特定的值的概率都等于0,所以不能列出每一個值及其相應(yīng)的概率。通常研究它取某一區(qū)間值的概率。 連續(xù)型隨機變量的概率分布用數(shù)學(xué)函數(shù)的形式和分布函數(shù)的形式來描述。,2020
28、/9/11,1、概率密度函數(shù)的概念,設(shè)X為一連續(xù)型隨機變量,x 為任意實數(shù),X的概率密度函數(shù)記為f(x),它滿足條件,注意:f(x)不是概率,是一種函數(shù),2020/9/11,密度函數(shù) f(x)表示X 的所有取值 x 及其頻數(shù)f(x),2020/9/11,在平面直角坐標系中畫出f(x)的圖形,則對于任何實數(shù) x1x2,P(x1Xx2)是該曲線下從x1 到 x2的面積,概率是曲線下的面積,2020/9/11,2、分布函數(shù),連續(xù)型隨機變量的概率也可以用分布函數(shù)F(x)來表示 分布函數(shù)定義為:,根據(jù)分布函數(shù),P(aXb)可以寫為:,2020/9/11,3、分布函數(shù)與密度函數(shù)的圖示,密度函數(shù)曲線下的面積
29、等于1; 分布函數(shù)是曲線下小于 x0 的面積。,2020/9/11,4、連續(xù)型隨機變量的期望和方差,數(shù)學(xué)期望為 方差為,2020/9/11,5、常見的連續(xù)型隨機變量的概率分布,2020/9/11,(四) 正態(tài)分布,1. 正態(tài)分布在統(tǒng)計學(xué)中的地位,正態(tài)分布是統(tǒng)計和抽樣的基礎(chǔ),在統(tǒng)計中具有極其重要的理論意義和實踐意義,主要表現(xiàn)在:,(1)客觀世界中有許多隨機現(xiàn)象都服從或近似服從正態(tài)分布; (2)正態(tài)分布具有很好的數(shù)學(xué)性質(zhì),根據(jù)中心極限定理,很多分布的極限是正態(tài)分布,在抽樣時有些總體雖然不知道其確定的分布,但隨著樣本容量的增大,很多統(tǒng)計量可以看作近似正態(tài)分布;可用于近似離散型隨機變量的分布。 (3)
30、盡管經(jīng)濟管理活動中的有些變量是正偏斜的,但并不影響正態(tài)分布在抽樣應(yīng)用中的地位。,2020/9/11,f(x) = 隨機變量 X 的頻數(shù) = 總體方差 =3.14159; e = 2.71828 x = 隨機變量的取值 (- x ) = 總體均值,2、正態(tài)分布的概率密度函數(shù),2020/9/11,3、正態(tài)分布函數(shù)的性質(zhì),概率密度函數(shù)在x 的上方,即f (x)0; 正態(tài)曲線的最高點在均值,它也是分布的中位數(shù)和眾數(shù); 正態(tài)分布是一個分布族,每一特定正態(tài)分布通過均值的標準差來區(qū)分。 決定曲線的高度,決定曲線的平緩程度,即寬度; 曲線f(x)相對于均值對稱,尾端向兩個方向無限延伸,且理論上永遠不會與橫軸相
31、交; 正態(tài)曲線下的總面積等于1; 隨機變量的概率由曲線下的面積給出。,2020/9/11,4、參數(shù)和對正態(tài)曲線的影響,平均數(shù)決定密度函數(shù) f(x)的中心位置。 如圖:,2020/9/11,標準差決定 f(x)曲線的陡緩程度,越大曲線越平緩,越小曲線越陡峭。 如圖:,2020/9/11,正態(tài)分布的概率,概率是曲線下的面積。,2020/9/11,5、標準正態(tài)分布,一般的正態(tài)分布取決于均值和標準差 ,計算概率時 ,每一個正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無窮多的,若能將一般的正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布,計算概率時只需要查一張表即可。,(1)標準正態(tài)分布的重要性,2020/9/11,(2
32、)標準正態(tài)分布函數(shù),標準正態(tài)分布的概率密度函數(shù),任何一個一般的正態(tài)分布,可通過下面的線性變換轉(zhuǎn)化為標準正態(tài)分布,標準正態(tài)分布的分布函數(shù),2020/9/11,標準正態(tài)分布形式,2020/9/11,(3)標準正態(tài)分布表的使用,將一個一般的轉(zhuǎn)換為標準正態(tài)分布,在計算概率時 ,查標準正態(tài)概率分布表 對于負的 x ,可由 (-x) x得到; 對于標準正態(tài)分布,即X N(0,1),有 P (a X b) b a P (|X| a) 2 a 1 對于一般正態(tài)分布,即X N( , ),有,2020/9/11,【例】設(shè)X N(5,10),計算 P(5 X 6.2),查表P=0.5478-0.5=0.0478,2
33、020/9/11,【例】設(shè)X N(5,10),計算P(2.9 X 7.1),一般正態(tài)分布,2020/9/11,【例】設(shè)X N(5,32),求以下概率 (1) P(X 10) ; (2) P(2X 10) 解: (1),(2),注意: (-x) x,2020/9/11,三、大數(shù)定律與中心極限定理,(一)大數(shù)定律 (二)中心極限定理,2020/9/11,(一)大數(shù)定律,大數(shù)定律是闡述大量隨機變量的平均結(jié)果具有穩(wěn)定性的一系列定律的總稱。 本節(jié)只介紹兩個最常用的大數(shù)定律。,獨立同分布大數(shù)定律:獨立隨機變量x1,x2,具有相同分布,且存在有限的數(shù)學(xué)期望和方差2,則對于任意小的正數(shù),有,2020/9/11
34、,該定律表明,當n足夠大時,獨立同分布的一系列隨機變量的均值接近(依概率收斂于)數(shù)學(xué)期望,即平均數(shù)具有穩(wěn)定性。,2020/9/11,例如,調(diào)查成年男性的平均身高,可能會有如下結(jié)果:,2020/9/11,該定律表明,當n足夠大時,事件A發(fā)生的頻率接近于事件A發(fā)生的概率,即頻率具有穩(wěn)定性。,貝努力大數(shù)定律: 設(shè)m是n次獨立隨機試驗中事件A 發(fā)生(“成功”)的次數(shù),p是事件A在每次試驗 中發(fā)生的概率,則對于任意小的正數(shù),有,2020/9/11,(二)中心極限定理,中心極限定理是闡述大量隨機變量之和的極限分布是正態(tài)分布的一系列定理的總稱。,獨立同分布中心極限定理:設(shè)x1,x2,是獨立同分布的隨機變量序
35、列,且存在有限的數(shù)學(xué)期望和方差2,那么當n時,,2020/9/11,該定理表明,不論總體服從什么分布,只要其數(shù)學(xué)期望和方差存在,對這一總體進行重復(fù)抽樣,當樣本容量n充分大時,其標志總量或均值就趨于正態(tài)分布。,例如,調(diào)查成年男性的平均身高,可能會有如右圖。,2020/9/11,四、抽樣分布,樣本統(tǒng)計量的概率分布(理論分布),構(gòu)造抽樣分布的步驟:,樣本統(tǒng)計量全部可能的數(shù)值對應(yīng)的頻數(shù)分布,即抽樣分布。,2020/9/11,樣本平均數(shù)的抽樣分布(例題分析),【例】設(shè)一個總體,含有4個元素(個體) ,即總體單位數(shù)N=4。4 個個體分別為x1=1,x2=2,x3=3,x4=4 ??傮w的均值、方差及分布如下:,均值和方差,2020/9/11, 現(xiàn)從總體中抽取n2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為:,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二個觀察值,第一個 觀察值,所有可能的n = 2 的樣本(共16個),2020/9/11,計算出各樣本的均值,如下表。并給出樣本均值的 抽樣分布。,3.5,3.0,2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- (二模)晉中市2025年高三高考二模 語文試卷(含A+B卷答案詳解)
- 2.2聲音的特性說課稿2025年初中人教版物理八年級上冊
- 微整顧客協(xié)議書
- 需求導(dǎo)向性干預(yù)下行無縫隙護理在腹腔鏡子宮肌瘤剔除術(shù)圍術(shù)期的干預(yù)效果分析
- 住宅裝修設(shè)計協(xié)議
- 文化創(chuàng)意產(chǎn)業(yè)內(nèi)容創(chuàng)新與市場推廣方案
- 商業(yè)房產(chǎn)交易居間合同范本
- 提升客戶滿意度服務(wù)質(zhì)量方案
- 提高客戶服務(wù)質(zhì)量與滿意度的實施方案
- 產(chǎn)品設(shè)計與生產(chǎn)制造委托協(xié)議
- 2025年兒科常見面試題及答案
- (一模)贛州市2025年高三年級摸底考試物理試卷(含標準答案)
- 數(shù)學(xué)-湖北省武漢市2025屆高中畢業(yè)生二月調(diào)研考試(武漢二調(diào))試題和解析
- 【公開課】同一直線上二力的合成+課件+2024-2025學(xué)年+人教版(2024)初中物理八年級下冊+
- 學(xué)術(shù)英語智慧樹知到答案2024年南開大學(xué)
- 【部編版道德與法治六年級下冊】全冊測試卷(含答案)
- GB/T 10752-2005船用鋼管對焊接頭
- 現(xiàn)代商業(yè)空間展示設(shè)計ppt
- 高家堡副井井筒壁座施工安全技術(shù)措施
- 世界貿(mào)易組織(WTO課件(25頁PPT)
- FMEA第五版表格(實例)
評論
0/150
提交評論