




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、Chap 2 簡單隨機抽樣2.2 簡單估計法SE 2.1 定義與符號抽樣調(diào)查 2.5 樣本量確實定 2.6 其它相關(guān)問題 2.3 比率估計量 2.4 回歸估計量.2.1 定義與符號一、定義與符號 一定義上述抽樣就稱為不放回簡單隨機抽樣 定義2.1:設(shè)有限總體共有N個單元,一次整批抽取 n個單元 使得每個單元被抽中的概率都相等,任何 n個不同單元的組合樣本都有一樣的概率被抽中,這種抽樣方法稱為簡單隨機抽樣法,所抽到的樣本為簡單隨機樣本。 . 定義2.2:在詳細實施過程中,從總體中逐個等概率抽取單元每次抽取到尚未入樣的任何一個單元的概率都相等,直到抽滿 n個為止。假設(shè)每次抽中一個單元,然后放回總體
2、,重新抽取。這樣一個單元有能夠被反復(fù)抽中,故又稱反復(fù)抽樣。. 定義2.3 按照從總體的N個單元中抽取n個單元的一切能夠不同的組合構(gòu)造一切能夠的 CNn 個樣本,從CNn 個樣本隨機抽取一個樣本,使每個樣本被抽中的概率都等于 1/CNn.上述三中定義其實是完全等價的,而定義2.2在實踐中容易實施 。.例2.1 設(shè)總體有5個單元1,2,3,4,5,按有放回簡單隨機抽樣的方式抽取容量為2的樣本,那么一切能夠樣本為個,如表2.1。 表2.1 放回簡單隨機抽樣一切能夠樣本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25
3、,35,45,5.例2.2 上述總體按不放回簡單隨機抽樣方式抽取容量為2的樣本,那么一切能夠樣本為個,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2 不放回簡單隨機抽樣一切能夠樣本.二樣本分布與符號從總體抽樣單元。假設(shè)順序被抽中的樣本單元的號碼為入樣號碼,那么樣本為,稱為抽樣比Sampling fraction。中逐個不放回抽取n個作為隨機變量樣本有什么分布呢?.1 y1,yn同分布但不相互獨立,其共同分布列為 2 ( yi, yj)的結(jié)合分布列均同(y1, y2 ).表2.3符號總體參數(shù)樣本統(tǒng)計量.二、抽樣方法一抽簽法 制造N個外形一樣的簽,將它們充分混合,
4、然后一次抽取n個簽,或一次抽取一個但不放回,抽取n次得到n個簽。那么這n個簽上所對應(yīng)號碼表示入樣的單元號。例如:某中學(xué)為了解學(xué)生身體素質(zhì)的根本情況,從全校N1200人中抽取一個簡單樣本n100人進展檢查。.1 隨機數(shù)表二隨機數(shù)法如上例,N1200,那么在表中隨機延續(xù)取四列,順序往下,選出前面100個不同不放回抽樣的00011200之間的數(shù)字。假設(shè)不夠100個,可隨機再取四列,同樣操作,直至抽取100個止。 .Simple random sampling.Table of random numbers.2 隨機數(shù)骰子 隨機數(shù)骰子是由均勻材質(zhì)制成的正20面體,每個面上刻有一個09的數(shù)字,且每個數(shù)字
5、只出如今兩個面上。要產(chǎn)生一個m位數(shù)的隨機數(shù)如m4,N1200,那么將mm=4個顏色不同的骰子盒中,并規(guī)定每個顏色代表的位數(shù),蓋上蓋子,充分搖動盒子后,翻開讀出各色骰子的數(shù)字,即可得一個隨機數(shù)。反復(fù)上述過程,直至產(chǎn)生了n個滿足條件的隨機數(shù)。.3 利用統(tǒng)計軟件直接抽取法 大部分統(tǒng)計軟件都有產(chǎn)生隨機數(shù)的功能,快捷方便。不過產(chǎn)生的是偽隨機數(shù),有一定循環(huán)周期的。簡單引見一下利用EXCEL產(chǎn)生隨機數(shù)的方法. .2.2 簡單估計法SE一、總體均值的估計一簡單估計定義 .(2.6) 二簡單估計量的性質(zhì) 引理2.1 從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本,那么總體中每個特定的單元入樣的概率為n/N
6、,兩個特定單元入樣的概率為nn1/NN-1。 . 引理2.2從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本。假設(shè)令: 那么:.二簡單估計量的性質(zhì) 定理2.1上述簡單估計是無偏的,即 定理2.2 上述簡單估計的方差均方誤差為:.(2.12/2.18) .證明P35證法1對稱證法: 為0留意樣本分布.推論2.7的無偏估計為.(2.25) 證明:只須闡明樣本方差是總體方差的無偏估計即可。 留意. 例2.3 從某個N100的總體重抽取一個容量n=10的簡單隨機樣本,要估計總體平均程度,并給出置信度為95的置信區(qū)間估計。如表2.4序號1 2 3 4 5 6 7 8 9 104 5 2 0 4 6
7、6 15 0 8表2.4 簡單隨機樣本目的 .三有放回簡單隨機抽樣的簡單估計量由于故有放回抽樣的精度低于不放回抽樣的精度。.闡明:1 抽樣調(diào)查中的估計量與傳統(tǒng)數(shù)理統(tǒng)計中估計量的區(qū)別見表2.5表2.5 抽樣實際與傳統(tǒng)數(shù)理統(tǒng)計關(guān)于樣本均值性質(zhì)異同比較抽樣理論數(shù)理統(tǒng)計理論假設(shè)樣本之間不獨立,所以可能樣本最多 個,欲估計總體特征為 ,當(dāng)nN時可以求出樣本之間獨立,所有可能樣本最多為無限多個;欲估計總體特征為總體(一般是隨機變量X)期望,一般不能通過樣本求出 符號、定義期望方差.2 總體方差普通也是未知的,故計算估計量方差估計值時總是用樣本方差直接去估計它,由于該估計無偏,故這樣做相對是合理的。 3 對
8、于無限總體的簡單隨機抽樣或有限總體有放回簡單抽樣估計中由于N普通很大, 即從有限總體抽樣得到簡單隨機樣本均值得方差是從無限總體抽樣得的獨立樣本均值的方差的1f 倍,要小些,這意味著對同等樣本量,不放回簡單隨機抽樣的精度高于有放回的。 由于樣本點不會反復(fù),樣本量一樣時所包含的有效樣本點更多,因此信息更多,效果當(dāng)然好些。 1f又被稱為有限總體校正系數(shù)。. 4樣本容量n越大,估計量方差越小。當(dāng)樣本容量一定時,總體方差越大,估計量方差越大。由于總體方差是固定的,因此在簡單隨機抽樣的條件下,要提高估計量精度就只需添加樣本容量了。但添加樣本容量也會帶來計算量驟增和本錢添加,所以是矛盾的一對,需求找到適宜的
9、平衡點。.二、總體總量的估計一簡單估計量.(2.7) 二估計量性質(zhì) 推論2.1 2.4 2.8 .(2.13) .(2.19) .(2.26) .例2.4續(xù)例2.3估計總體總量,并給出置信度為95條件下的估計相對誤差 。三、總體比例的估計 將總體分為兩類,一類具有該特征的單元A個,另一類不具有該特征的單元NA個 。調(diào)查的目的是估計或A 假設(shè)令那么.一估計量的定義 二估計量性質(zhì) 推論2.2 2.5 2.9 對于簡單隨機抽樣,p是P無偏估計。 p的方差為 方差的無偏估計 (2.27) 2.20.例2.5某超市開張一段時間后,為改良銷售效力環(huán)境,欲調(diào)查附近幾個小區(qū)居民到該超市購物的稱心度。該超市與附
10、近一個小區(qū)的居委會獲得聯(lián)絡(luò),在總體中按簡單隨機抽樣抽取了一個大小為n=200人的樣本。調(diào)查發(fā)現(xiàn)對購物表示稱心或根本稱心的居民有130人,估計對該超市購物環(huán)境持一定態(tài)度的居民的比例,并在置信度95%條件下,給出估計的絕對誤差和置信區(qū)間,假設(shè)抽樣比可以忽略。.2樣本協(xié)方差是總體協(xié)方差的無偏估計. 2.22,2.23 2.29 思索二維總體.證明:仍采用對稱法P40證法11留意樣本分布留意為0. 1證法2: 構(gòu)造性展開.2留意由1.一、概念與作用 一概念 比率Ratio與比例Proportion區(qū)別 二作用2.3 比率估計量及其性質(zhì)一種場所是待估的總體參數(shù)R是兩個變量比值。如人口密度,恩格爾系數(shù)等。
11、 分子分母均為r.v.分子為r.v.另一種運用場所,雖然待估的參數(shù)是某個研討變量的均值或總體總量,它本來可以經(jīng)過樣本均值加以估計,但是為了提高估計的效率,它經(jīng)過引進一個輔助變量xi ,來計算比率,即 再經(jīng)過這一比率乘以總體知的輔助變量均值或總量來到達估計的目的。 .二、運用條件 1輔助變量auxiliary variable資料易得或知 2輔助變量與目的變量之間存在高度相關(guān)性且相關(guān) 性穩(wěn)定。 3樣本量普通要求比較大三、簡單隨機抽樣下的比率估計.一定義 比率估計量ratio estimator又稱比估計。 2.30 2.31 .二比率估計的性質(zhì)引理2.3定理2.6推論2.11.引理2.4證:當(dāng)n
12、充分大時 .定理2.7推論2.12.因此方差估計有兩種思緒(2.39)(2.40).例2.6i123456均值XiYi011331151882910464.518表4.1 假設(shè)的總體數(shù)據(jù).解:i樣本簡單估計比率估計123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.26921
13、9.218.7517.68644.解.例2.7P51例2.4 在二十世紀(jì)90年代初的一項工資研討中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者的現(xiàn)薪與起薪之間相關(guān)系數(shù)高達0.88,知某IT企業(yè)474名員工的評鑒起薪為17 016.00元/年,現(xiàn)根據(jù)對100個按簡單隨機抽樣方式選出的員工現(xiàn)薪的調(diào)查結(jié)果,估計該企業(yè)員工的現(xiàn)薪平均程度。數(shù)據(jù)如下:, , .解:簡單估計 95的置信區(qū)間 比率估計 95的置信區(qū)間 .例2.8某縣在對船舶月完成的貨運量進展調(diào)查,對運管部門登記的船舶臺帳進展整理后獲得注冊船舶2 860艘,載重噸位154 626 噸。從2 860艘船舶中抽取一個n10的簡單隨機樣本。調(diào)查得到樣本船舶月完成的
14、貨運量及其載重噸位如表4.2單位:噸要估計該縣船舶月完成貨運量 1234578015001005376600100505010206789102170182314501581370120150802050表4.2樣本船舶貨運量及載重噸位數(shù)據(jù) . 解. 三消除比率估計偏倚的方法. 哈特利-羅斯Hartley-Ross,1954提出的估計量 (2.51) 于是可以令.現(xiàn)實上: .例2.9 .四、比率估計的效率1/2.2.4 回歸估計量及其性質(zhì)比率估計成為最優(yōu)線性估計的條件:1樣本點yi,xi構(gòu)成過原點的直線2yi對直線的偏向與xi成比例.一、回歸估計的定義二、是知常數(shù)時記為0 定理2.8 .Q:“
15、0取何值時,回歸估計量的精度最高,即最 ???定理2.9:三、由樣本回歸系數(shù)計算得到 2.56 Y對X回歸系數(shù) 定理2.10 這時的均值估計量是漸近無偏估計 留意b并不是B的無偏估計.定理2.11 它的一個近似估計為: .例2.10 續(xù)例2.8.四、精度比較1回歸估計總優(yōu)于簡單估計,除非=0 2比率估計優(yōu)于簡單估計的條件 3回歸估計優(yōu)于比率估計的條件是 五、多變量回歸估計略 .2.5 樣本量確實定一、總體均值情形1 給定規(guī)范誤差上限,求滿足條件的最小n . 2 給定絕對誤差上限及信度,求滿足條件的最小n有放回,不放回 3 給定相對誤差上限及信度,求滿足條件的最小n有放回不放回 .給定相對規(guī)范誤差
16、上限 ,求滿足條件 的最小n.放回不放回例2.6 在例2.3中,假設(shè)要求以95%的把握保證相對誤差不超越10%,樣本量應(yīng)該取多少? .二、總體總量情形 作業(yè) 思索各種情行的公式例 欲估計一個鄉(xiāng)村的每月平均副業(yè)收入,知該村共有1000戶農(nóng)戶,月副業(yè)收入的規(guī)范差不超越300元。1現(xiàn)要求置信度為95%,估計每戶月副業(yè)收入的誤 差不超越50元,應(yīng)抽取多少戶作為樣本?2假設(shè)每戶調(diào)查費用為15元,調(diào)查管理費用為800元, 該項調(diào)查估計費用是多少?.例 假設(shè)上例目的是要估計全村1000戶一月的副業(yè)總收入,允許總量的誤差為40000,置信度為95%,應(yīng)抽取多少樣本? 三、總體參數(shù)P的情形四、總體參數(shù)的預(yù)先估計
17、.1根據(jù)以往的閱歷數(shù)據(jù) 例如對同類問題獲得過一個樣本量n0為的簡單隨機樣本,并且知在一定置信度下比如95%,該調(diào)查對總體均值或總量估計的相對誤差上限為r0,那么在一樣的置信度下,假設(shè)希望本次調(diào)查的相對誤差上限為r,那么在抽樣比可以忽略的情況下,可以近似地計算出本次調(diào)查所需的樣本量: 作業(yè) 證明上述結(jié)論.2在正式調(diào)查前進展試點調(diào)查,根據(jù)試點調(diào)查的 結(jié)果作出估計,或者采用兩步抽樣 3沒有同類調(diào)查閱歷,又不能進展預(yù)調(diào)查, 那么只能經(jīng)過有閱歷的專家作一些定性分析, 對總體變異系數(shù)C比較穩(wěn)定作出估計。 4留意:針對總體參數(shù)為 時情形 當(dāng)估計P0.5,那么選取較小的P,如假設(shè)估計P為0.6,0.8那么選取P為0.6 假設(shè)對P一無所知那么取P=0.5。.例2.7 某銷售公司希望了解全部3000家客戶對公司的稱心度,決議用調(diào)查一個簡單隨機樣本。這時銷售公司希望以95的把握保證客戶稱心度比例P在樣本比例p10,p+10范圍內(nèi),但對總體比例P無法給出一個大致范圍。這時調(diào)查多少個客戶,才干保證滿足要求?.2.6 其它相關(guān)問題一、逆抽樣比例P是稀有事件的比例,普通P0.2 事先給定一個正整數(shù)m,然后逐個隨機抽取樣本,n個單元。 直到抽到m個所思索特征的單元為止,設(shè)共取了. 現(xiàn)實
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 油罐制作安裝合同
- 智能金融風(fēng)控與反欺詐技術(shù)合作協(xié)議
- 人力資源公司合作合同協(xié)議書
- 企業(yè)間人才培訓(xùn)合作協(xié)議
- 新能源農(nóng)業(yè)項目開發(fā)合同
- 工程建筑工程中介合同
- 建筑施工機械租賃合同
- 公對公借款合同
- 工程補充協(xié)議
- Module 7 Unit3 教學(xué)設(shè)計 2024-2025學(xué)年外研版九年級英語上冊
- 宿舍、辦公樓消防應(yīng)急預(yù)案
- 細胞全能性的課件資料
- 2023年公務(wù)員面試情景模擬題
- 簡易呼吸球囊的使用演示文稿
- YB 4022-1991耐火泥漿荷重軟化溫度試驗方法(示差-升溫法)
- GB 6722-2014爆破安全規(guī)程
- 一本好書《中華上下五千年》課件
- 網(wǎng)絡(luò)營銷講義網(wǎng)絡(luò)營銷產(chǎn)品策略課件
- 《小型混凝土預(yù)制件標(biāo)準(zhǔn)化生產(chǎn)管理辦法》
- 胸腔積液護理查房-范本模板
- 水土保持方案中沉沙池的布設(shè)技術(shù)
評論
0/150
提交評論