第五章抽樣分布與參數(shù)估計_第1頁
第五章抽樣分布與參數(shù)估計_第2頁
第五章抽樣分布與參數(shù)估計_第3頁
第五章抽樣分布與參數(shù)估計_第4頁
第五章抽樣分布與參數(shù)估計_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第五章抽樣分布與參數(shù)估計 第一節(jié)抽樣的基本概念 第:節(jié)參數(shù)估計 第三行樣本容量的確定投資何道?時間才是收益默三聯(lián)生活周刊2008.3.177中國證券登記結算公司的數(shù)據顯示,2006年底,滬) 深兩市的帳戶總數(shù)為7 854萬戶,2008年1月這一數(shù) 字變?yōu)?1 462萬戶2007年一年的開戶數(shù),已經 接近過去17年開戶總數(shù)的50%去年底,中國證券報和大智慧公司聯(lián)合進行了一 項投資者2007年的收益調告,在11 205位被調令者 中,只有48.6%的投資者在股市獲利,其中726%的 投資者跑贏大盤,11%獲利在50%100%, 16.88% 獲利為20%50%, 13.51%獲利在10%左右、在

2、51.4%的虧損者中,18.61%的人虧損在10%左右,更 有2.44%的虧損超過50%。投資何道?時間才是收益三聯(lián)生活周刊2008.3.17顯然,調查結果可以用下表表示:分組比重獲利者48. 6其中:跑贏大盤7. 26獲利50%100%11.00獲利20%50%16. 88獲利10%左右13.51虧損者51.4D 其中:虧損20%50%16.61虧損超過50%2. 44超八成美國民眾認為:美國正在錯誤方向上前行2008.4.11青年參考 3月28口到4月2日,美國紐約時報 和CBS新聞報道頻道合作進行了一項 電話民意調查。結果顯示,美國民眾 對國家政策方向的不滿達到了上世紀 90年代以來的最

3、高點。81%的受訪者 認為“美國的情況已經發(fā)展到了錯誤 的方向上”。一年前持有類似觀點的訪者只占69%,而2002年這個數(shù)字 又為35%。超八成美國民眾認為:飛美國正在錯誤方向上前行N2008.4.11青年參考V 關于這次民調4 這次民調一共為1368名美國成年人接受了電話 訪問。受訪電話號碼字段是由電腦從42。00個 遍布全國的電話中隨機抽取的。 同樣以隨機的程序,從每一個家庭選出一個成年 人作為采訪對象。 理論上說,通過這種采樣方法得到的結果,與對 全美成年人口進行普查的結果相比較,20次中 有19次誤差不超過3%。蓋洛普調查小美國人對中國敵視度上升V2008.4.4青年參考、美國著名民調

4、機構蓋洛普于3月28口發(fā)布了一 項調查結果,在被問道誰是美國最大的敵人時, 伊朗、伊拉克和中國分列前三位。對中國的敵 視度上升了 3%。蓋洛普在今年2月1111至2月14日就這一問題 電話調查了 1007位美國成年人,結果顯示, 25%的美國人認為伊朗是美國的首要敵人;第 二位是伊拉克占22%;第三為中國,占14%;_然后是朝鮮,為9%蓋洛普調查美國人對中國敵視度上升2008.4.4青年參考同樣,上述調查結果可以整理如下:國別比重%國別比重%伊朗25伊拉克35伊拉克22中國14中國14伊朗8朝鮮9朝鮮22007年淮是美國最大的敵人2001年誰是美國最大的敵人第一節(jié)抽樣的基本概念、 #抽樣推斷的

5、作用(應用場合)號 1、在不可能進行全面調查時,可以通過抽樣調查說 明總體情況: 2?對沒有必要進行全面調查的社會經濟現(xiàn)象進行分 析H寸; 3、對全面調查的結果進行評價和修正; 4、用于工業(yè)牛.產過程的質量控制 #抽樣推斷的特點: 1、抽樣推斷是由部分推斷整體的一種研究方法。 2、抽樣推斷建立在隨機概率抽取樣木的基礎上。 甬3樣推斷是運用概率估計的方法。d®用樣推斷的誤差可以事先計算,并能加以控制。第一節(jié)抽樣的基本概念 一、有關抽樣的基本概念(-)樣本容量與樣本個數(shù) 1、總體:是指包括調查對象所有單位的全體。 一般用A/代表總體單位數(shù)。 2、樣本:是從總體中抽出的部分單位所的整 春舞

6、篇鐮翻I為線黃馥1祟亶 一定條件下,樣本容量大,調查誤差會小。 330為大樣本。 3、樣木個數(shù):又稱樣木可能數(shù)目,是指從一 一個總體中可能抽取多少個樣本。fjR樣本個數(shù)與抽取樣本的方法相關。第一節(jié)抽樣的基本概念於 #交替標志平均數(shù)與的標準差: 1、交替標志:只表現(xiàn)為是或否、有或無、對或 錯的標志稱為交替標志,也稱作是非標志。 交替標志實際是品質標志,是把總體單位髡此廖隹金分為兩組的。所有品質標忐都可以作 2、晶;%有某種表現(xiàn)的單位數(shù)占總體單位數(shù) 的比重稱為成數(shù)。通常用p表示。 例如:將產品分為合格與不合格兩組,當你關心期在抽樣調查中,除了對平均數(shù)的估計外, 和KJ成數(shù)的估計。第一節(jié)抽樣的基本概

7、念- 4、交替標志的標準差:為被研究的標準的標志3 現(xiàn)的成數(shù)p與另一種表現(xiàn)的成數(shù)(1-p)乘積的平方交替標志變量X單位數(shù)fX - x(x-xf贊成1028642.8-57.252.3970.02不贊成合計500122.41根。x =57.2%=122.41 =49 48% J = V57.2%x42.8%J 50()v=49.48%第一節(jié)抽樣的基本概念飛 (-)總體參數(shù)和樣本統(tǒng)計量、 1、總體參數(shù):總體分布的數(shù)量特征的就是總體的 參數(shù)。總體參數(shù)是常數(shù),一般是未知的,其中只 有總體單位數(shù)N可能已知。 2、樣本統(tǒng)計量:又稱樣本指標。是反映樣本特征 的統(tǒng)計指標。由于樣本是從總體中隨機抽取的單 位構成

8、的,因而,樣本統(tǒng)計量是隨機變量。樣本 單位數(shù)用n表示。 總體參數(shù)和統(tǒng)計量各有四個,分別為:平均數(shù)、 成數(shù)、方差、標準差。其中統(tǒng)計量是可以計算的。公式見下表:第一節(jié)抽樣的基本概念於指標總體樣本p = M NS(xx):FZF平均數(shù)成數(shù)方差標準差第一節(jié)抽樣的基本概念%(三)抽取樣本單位的方法(重置抽樣與不重:置抽樣)V 1、重置抽樣:具體做法是從總體中隨機抽取一個單* 位,記錄其標志值后,乂將其放回總體中,在新一輪的抽 取時,該單位有可能被抽中。 #特點:(1) n個樣本單位是由n次試驗是結果構成的。(2)每次試驗是獨立的。 (3)每次試驗是在相同條件下進行的。 2、不重置抽樣:具體做法是從總體中

9、隨機抽取一個 單位,記錄其標志值后不放回總體中,在新一輪的抽取時, 該單位有沒有可能被抽中。 #特點:(1) n個樣本單位是山n次試驗是結果構成的。 (2)每次試驗不是獨立的。第一節(jié)抽樣的基本概念3、樣本個數(shù)(所有可能樣本數(shù)目)N!3與)!否棄5 (3)每個單位在多次試驗中中選的機會是不等 趣的。放回抽樣樣本數(shù)目=N” 不放回抽樣:樣本數(shù)目= 以N=4, n = 2為例放回抽樣,樣木數(shù)目M = 16不放回抽樣,樣本數(shù)目M = 12 以48人一個班,從中選取12人為例: 放回抽樣,樣木數(shù)目M = l.50xl0 2。不放回抽樣,樣本數(shù)目M= 3.34x10第一節(jié)抽樣的基本概念Z (R)概率抽樣及

10、其組織形式 1、概率抽樣:就是要求對總體的每次觀察(抽?。?都是次隨機試驗,并旦有和總體相同的分布。按這樣 的要求對總體觀測(抽?。﹏次,可得到容量為n的樣本。 只有概率抽樣,才能進行科學的統(tǒng)計推斷。 【例5-1】有10個同樣的球,分別標有從1至10的號碼。(1)從中有目的地抽出5號球; (2)從中隨便地取一個球; (3)把10個球放在袋中,充分混勻,從中抽出一個球, 抽取時,要求袋中各個球有相等的被抽中的概率。第一節(jié)抽樣的基本概念 顯然,(1)和(2)的抽取行為都不是隨機試驗。 因而不屬于概率抽樣。只有(3)的抽取行為是隨 機試驗??傮w的分布可用表5-1的分布列來描述, 而(3)的隨機試驗中

11、所觀測的隨機變量也行與表 5-1有相同的分布。所以,(3)的抽取行為是概 率軸樣。 表5-110個球號碼的分布號石馬 1頻率 1/101/10 1/10 1/10 1/10 1/10 1/10 1/101/10101/10第一節(jié)抽樣的基本概念 2、概率抽樣的組織形式 (1)簡單隨機抽樣 定義:乂稱純隨機抽樣,是從總體全部單位 中直接按隨機原則抽取樣本單位,使每個總體Jf多0從理論上說最符合具體方法:直接抽選法、抽簽法和隨機數(shù)字 蓑法。采用這種抽樣方,總體很大時,編號工作困難。而且,當總體各第一節(jié)抽樣的基本概念(2)等距抽樣 定義:乂稱機械抽樣或系統(tǒng)抽樣,是將總體全部單位投 某一 標志排隊,而后

12、按固定的順序和間隔在總體中抽取若 干個樣本單位組成樣本的一種抽樣方式。 特點:(1)簡便、易于實施。 (2)在己知總體有關信息時,可提高樣本對總體的代表性。 (3)類型抽樣定義:又稱分層抽樣,是先把總體按某一標志分成若干 個類型組,然后分別在各組內按隨機原則抽取樣木單位。特點:把分組法和貫徹隨機原則結合起來。類型抽樣的總體方差由兩部分組成:(1 )組間方差(2)組內方差第一節(jié)抽樣的基本概念5 (4)整群抽樣 定義:是先將總體分成若干群,然后以群為鸚就為悔能齦牖嬲減群作 分群基本要求:(1)不重復(2)不遺漏 特點:(1)從總體中抽取的是“群” o (2)影響總體方差的是總體的群間方差,群內方差

13、不影響抽樣誤差。 (5)階段抽樣 定義:是將抽樣分成若干個階段進行,除了 羊,最第二節(jié)參數(shù)估計飛 一、抽樣誤差的概念:' 1、概念:是指樣本指標與被它估計的總體相應指 標之間數(shù)量上的差數(shù)。即隨機誤差。 2、產生原因: (1)登記性誤差。主觀原因造成。 全面調查和非全面調查都可能產生。 (2)代表性誤差。是抽樣調杳可能產生的誤差, 包括兩種: 溫宿常建希汰蚤稱偏差,是由于沒有遵循隨機 向隨機誤差:發(fā)稱偶然的代表性誤差,是指遵循Z(x-X)第二節(jié)參數(shù)估計 二、抽樣平均誤差的概念和計算(-)抽樣平均誤差的概念 隨機誤差包括:抽樣實際誤差和抽樣平均誤差。 實際誤差是不可求的: 1、由于總體參數(shù)

14、是未知的。 2、雖然總體參數(shù)是確定的,樣本卻有無數(shù)個, 樣本不同,誤差也不一樣。 抽樣平均誤差:是所有可能出現(xiàn)的樣本指標的 標準差,也可以理解為所有樣本指標和總體指 武的平均離差。第二節(jié)參數(shù)估計(-)抽樣平均誤差的計算 1、定義公式:按抽樣平均誤差的定義,其計算公式應為平均數(shù)估計Ib-=J成數(shù)估計0Z(p-P)(7、 P V第二節(jié)參數(shù)估計樣本構成平均數(shù)x-X11.11-152 2521, 21.5-1131, 32-0.50 2541, 42 50052, 11.5-1162, 22-0 50 2572, 32.50082, 430.50 2593, 12-0.50 25103, 22.500

15、113, 330.50 25123, 43.511134, 12 500_ 4, 230 50 25D 4, 33 5114, 44152 25合計:10=O.7906 這是放回抽樣 的平均誤差=0.6455由此可見。不放回 抽樣的誤差更小, 例如:N=4; X分別為1, 2, 3, 4o 貝小平均數(shù)口 = 2.5 標準差。=1.1180 方差= 1.25 n = 2時,放回抽樣共有16個樣木,不放回為 12個。將放回抽樣所有16個樣本的平均數(shù)、抽樣平均 誤差的計算列表如下;同時,計算不放回抽樣 的12個樣本的抽樣平均誤差。第二節(jié)參數(shù)估計定義公式只是告訴我們按照抽樣平均誤 差的定義,應如何計算

16、,由于計算時要 應用總體參數(shù),實際抽樣中是無法按這 一公式計算的。第二節(jié)參數(shù)估計Q2、理論公式:數(shù)理統(tǒng)計證明抽樣平均誤差可達 按以下公式計算。(1)放回抽樣生=后(2)不放回抽樣(急)或軟=&(1 -9 代入數(shù)據計算如下:放回抽樣不放回抽樣=0.6455第二節(jié)參數(shù)估計顯然,理論公式的計算結果與定義公式是一樣的。但是,由于計算中要使用總體參數(shù),理論公式與定義 公式一樣,不能計算。當總體標準差和方差未知時:1、用樣本方差來代替總體方差。2:用過去全面調查的資料或過去抽樣調查的資料代(三)影響抽樣平均誤差的因素,=行%=1、總體各單位標志的變異程度。(成正比)2、樣本容量的大小。(成反比)3

17、、不同抽樣方法的影響。(不放回抽樣誤差?。┘?,口 4、不同抽樣組織方式的影響。第二節(jié)參數(shù)估計V 三、抽樣極限誤差:X 1、定義:是指樣本統(tǒng)計量與總體參數(shù)之間可能 的誤差范圍。 抽樣極限誤差的大小取決于人們希望控制總體 參數(shù)的把握程度的大小。統(tǒng)計上稱之為概率保 證程度。 抽樣極限誤差與概率保證程度成反比關系。 2、t概率度的確定:=41 或即= ta gJcA = ta6 axp第二節(jié)參數(shù)估計 四、參數(shù)估計概述 (-)參數(shù)估計的定義與種類: 1、定義:就是用樣木統(tǒng)計量去估計總體的未 知參數(shù)。 2、參數(shù)估計的種類: (1)點估計:用一個樣本統(tǒng)計量作為總體參 數(shù)的估計值。 #特點:方法簡單,適用于對

18、推斷準確程度與 可靠程度不高的秸況。 #實際應用:用樣本方差估計總體方差。2)區(qū)間估計:給出總體參數(shù)具體的上限和至年限。第二節(jié)參數(shù)估計(二)估計量的優(yōu)良標準P108同一個未知參數(shù)nJ能有多個可供選擇的估計量,因而 必須對估計量進行評價,從中選擇最佳(滿意)估計 量的問題。估計量優(yōu)良性包括以下四條標準:1、無偏性:如果估計量的數(shù)學期里值等于總體參數(shù), 則這個估計量為總體參數(shù)的無偏估計量。例如:總體均值的估計量可以是反映總體的集中趨勢 的樣本統(tǒng)計量,包括:均值、眾數(shù)、中位數(shù)。而總體均值的無偏估計最是樣木均值(算術平均數(shù))。但注意,樣木方差不是總體方差的無偏估計量總偏估計量即準確的估計量。樣本構成平

19、均數(shù)11, 11 )21. 21.531, 3241, 42.552, 11.562, 2272, 32.582, 4393, 12103, 22.5113, 33123, 43.5一 134, 12.54, 23154, 33.5164, 44 對于放回抽樣市)=卒=40/16=2.5 對于不放回抽樣 E(X)=邱 M=30/12=2.5顯然:無論是放回抽樣 還是不放回抽樣,樣本平均數(shù)都是總體平均數(shù)的無偏估計量第二節(jié)參數(shù)估計 2、有效性:(乂稱最小方差性) 有效性:如果對比任何一個其它估計量,某估計 量有最小方差,則這個估計量為總體該參數(shù)的有 效估計量。 例如:樣本平均數(shù)是總體均值的有效估計

20、量而眾 數(shù)、中位數(shù)則不是總體均值的有效估計量。 有效估計量即精確的估計量 3、一致性 一致性:是指(在一定條件下)隨著樣本容量的 不斷增大,樣本統(tǒng)計量接近總體參數(shù)的可能性就 越大。品A抽樣推斷的條件指一定的把握程度和允許誤 4膈圍卷翁球/在舞褥蕾奧招金要根據研究對象的變異程 顯解,一個良好維乂則行計,應該是置信概率高,置 信區(qū)間小,既可邪乂精確。然而,置信概率與置信區(qū)間卻是互相制約的,在n相應的置第二節(jié)參數(shù)估計 、 (四)區(qū)間估計與估計的精度和可靠性 所謂區(qū)間估計,實質上就是用兩個互相聯(lián)系的 樣本統(tǒng)計量給出夕的區(qū)間。即以和分別作為總 體參數(shù)區(qū)間估計的卜限與上限,同時要求該區(qū) 間將電含在內的概率

21、應達到一定的程度。B|J: 戶(心(5.19)式中被和框定的區(qū)間叫做置信區(qū)間。二叫做抽 樣極限誤差,它可以反映抽樣估計誤差的最大 范圍。第二節(jié)參數(shù)估計歲數(shù)的區(qū)間估計,應滿足以卜兩個要求:鬻霆“酷飆如疆噬褊徽第二節(jié)參數(shù)估計 #區(qū)間估計的步驟: 計算樣本指標。 (2)計算抽樣平均誤差。 根據把握程度確定概率度t O 計算抽樣極限誤差。 給出總體參數(shù)的區(qū)間范圍。概率度11.6451.9623常用概率: 可靠件F (t) 68.27% 90% 95% 95.45% 99.73%第二節(jié)參數(shù)估計 常用概率: 可靠性F (t)概率度十 68.27%1 90%1.645 95%1.96 95.45%2 99.

22、73%3=1.56A-=tp-=2x 1.56=3. 12X = x±A-=58.27 ±3.12第二節(jié)參數(shù)估計 例如:從某校學生中隨機抽取100人,得出平均體 重58.27公斤,標準差15.64公斤,試以95.45%的 可靠性對全部學生的平均體重進行區(qū)間估計。解:已知平均體重58.270=15.64當可靠性為95.45%時,t=2即:有95.45%的把握, 該校學生平均體重在57.15公斤61.39公斤之間人均收入農戶數(shù)f9以下 39-107-從某縣農民家庭中隨機抽取100戶調 查其年收入情況(單位:千元)要求:(1)以95%的可靠性對全縣 農民家庭年人均收入進行區(qū)間估計

23、。(2)以90%的可靠性估計年 收入在10千元以上家庭所占比重。10-112811-123212-1313以上合計人均收入農戶數(shù)f組中值Xxf離差(X-浦 f9以下38.525.52.8925.05639-1079.566.51.8925,004710-112810.5294.50.8922.178811-123211.536.80.110.387212-132012.525.01.1124.642013以上1013.5135.02.1144,5210合計1001139.0141.790平均收入=1139/100=11.39'方差=141.79/100=1.42 抽樣極限誤差=1.96

24、 X 0.119抽樣平均誤差=0.119=0.23全部農民家庭年人均收入為=11.39±0.23即:有95%的把握估計全部農民家庭年人均收入 在11.16至11.62千元之間。(2)以90%的可靠性估計年收入在10元以上家 庭所占比里。 1)樣本中年收入在10千元以上家庭所占比重為 2) p=90/100二90% 3)抽樣平均誤差4= 4)抽樣極限誤差;:曰 )=1.64 x 3% =4.92% 5)給出總體參數(shù)白貓信區(qū)間P=p±A=90%±4.92%即:有90%的把握估計年收入在10千元以上家庭 所占比重在85.08%94.92%之間。平均收入=1139/100

25、=11.39人均收入農戶數(shù)f組中值Xxf離差平方(x-xyf9以下38.525.58352.125056.39-1079.566.53572.125004.710-112810.5294.5792.122178.811-123211.536.812.1387.212-132012.525.01232.124642.013以上1013.5135.04452.144521.0合計1001139.0141790第三節(jié)樣本容量的確定 一、問題的提出: 隹參數(shù)估計中,精確度當然要求越高越好。例 如:3%的誤差顯然不如1.5%.而可靠性要求則也是越高越好。例如:9。%的 可靠性不如95%的。 然而,這是一對矛盾。在抽樣實踐中,精確度 高(縮?。?,可靠性就會降低;可靠性提高(t加大),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論