抽樣誤差和分布_第1頁
抽樣誤差和分布_第2頁
抽樣誤差和分布_第3頁
抽樣誤差和分布_第4頁
抽樣誤差和分布_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

抽樣誤差和分布第1頁,課件共20頁,創(chuàng)作于2023年2月抽樣誤差的概念

由抽樣引起的樣本統(tǒng)計量與總體參數(shù)間的差異

兩種表現(xiàn)形式

樣本統(tǒng)計量與總體參數(shù)間的差異樣本統(tǒng)計量間的差異

第2頁,課件共20頁,創(chuàng)作于2023年2月抽樣研究

個體變異抽樣誤差產(chǎn)生的條件

第3頁,課件共20頁,創(chuàng)作于2023年2月均數(shù)的抽樣誤差及標準誤

表現(xiàn)一:樣本均數(shù)與總體均數(shù)之差值表現(xiàn)二:多個樣本均數(shù)間的離散度第4頁,課件共20頁,創(chuàng)作于2023年2月中心極限定理(centrallimittheorem)從均數(shù)為、標準差為的總體中獨立隨機抽樣,當樣本含量n增加時,樣本均數(shù)的分布將趨于正態(tài)分布,此分布的均數(shù)為,標準差為。

第5頁,課件共20頁,創(chuàng)作于2023年2月標準誤(standarderror,SE),樣本統(tǒng)計量的標準差稱為標準誤,用來衡量抽樣誤差的大小。樣本均數(shù)的標準差稱為標準誤。此標準誤與個體變異成正比,與樣本含量n的平方根成反比。第6頁,課件共20頁,創(chuàng)作于2023年2月實際工作中,往往是未知的,一般可用樣本標準差s代替:因為標準差s隨樣本含量的增加而趨于穩(wěn)定,故增加樣本含量可以降低抽樣誤差。

第7頁,課件共20頁,創(chuàng)作于2023年2月中心極限定理表明,即使從非正態(tài)總體中隨機抽樣,只要樣本含量足夠大,樣本均數(shù)的分布也趨于正態(tài)分布,見圖3.1。第8頁,課件共20頁,創(chuàng)作于2023年2月圖3.1描述了來自不同總體的樣本均數(shù)之抽樣誤差和抽樣分布規(guī)律。事實上,任何一個樣本統(tǒng)計量均有其分布。統(tǒng)計量的抽樣分布規(guī)律是進行統(tǒng)計推斷的理論基礎(chǔ)。

第9頁,課件共20頁,創(chuàng)作于2023年2月標準差與標準誤的聯(lián)系和區(qū)別

聯(lián)系都是變異指標。S反映個體觀察值的變異;反映統(tǒng)計量的變異。當n不變時,標準差↑,標準誤↑

第10頁,課件共20頁,創(chuàng)作于2023年2月標準差與均數(shù)結(jié)合,用于描述觀察值的分布范圍,如醫(yī)學參考值范圍的估計;標準誤與均數(shù)結(jié)合,用于估計總體均數(shù)可能出現(xiàn)的范圍,如參數(shù)估計的置信區(qū)間。第11頁,課件共20頁,創(chuàng)作于2023年2月t分布設(shè)從正態(tài)分布N(,2)中隨機抽取含量為n的樣本,樣本均數(shù)和標準差分別為和s,設(shè):

則t值服從自由度為n-1的t分布(t-distribution)。Gosset于1908年在《生物統(tǒng)計》雜志上發(fā)表該論文時用的是筆名“Student”,故t分布又稱Studentt分布。

第12頁,課件共20頁,創(chuàng)作于2023年2月

f(t)

=∞(標準正態(tài)曲線)

=5

=10.10.2-4-3-2-1012340.3圖3.2自由度分別為1、5、∞時的t分布

第13頁,課件共20頁,創(chuàng)作于2023年2月

t分布的特征

t分布為一簇單峰分布曲線t分布以0為中心,左右對稱t分布與自由度有關(guān),自由度越小,t分布的峰越低,而兩側(cè)尾部翹得越高,;自由度逐漸增大時,t分布逐漸逼近標準正態(tài)分布;當自由度為無窮大時,t分布就是標準正態(tài)分布。

第14頁,課件共20頁,創(chuàng)作于2023年2月每一自由度下的t分布曲線都有其自身分布規(guī)律t分布表明,從正態(tài)分布總體中隨機抽取的樣本,由樣本計算的t值接近0的可能性較大,遠離0的可能性較小。t0.05,10=2.228,表明,從正態(tài)分布總體中抽取樣本含量為n=11的樣本,則由該樣本計算的t值大于等于2.228的概率為0.025,小于等于-2.228的概率亦為0.025。P(t≤-2.228)+P(t≥2.228)=0.05或:P(-2.228<t<2.228)=1-0.05=0.95。第15頁,課件共20頁,創(chuàng)作于2023年2月請問SD與SE的差別。多除了一個n有什麼差別。

我查過了課本,他說有時候SD會等於SE那是在什麼情況下阿。

感覺有一點點奇怪,除非n很小不然SE會比SD小

第16頁,課件共20頁,創(chuàng)作于2023年2月回答者:統(tǒng)計老兵yhliu

回答時間:2008-01-1520:06:34

如果SE=SD/√n,怎可能SE=SD?除非n=1.實際上SD(標準差,standarddeviation)與SE(standarderror)

說起來頗複雜...複雜的原因是:因為它們都代表了不只一

個量!簡單地說,每一個資料分布,不管是群體或樣本,基本上都可

以算出一個標準差(當然,就理論上的群體分布而言,是有可

能不存在標準差.)從群體抽樣,可以計算樣本平均數(shù),樣本標準差等等.但這些

由樣本算出的量,所謂"統(tǒng)計量"(statistic),本身也有個機率分

布,稱為這統(tǒng)計量的"抽樣分布"(samplingdistribution).舉個簡單的例子,群體數(shù)據(jù)是{1,2,3,4,5,6}.你可以計算這群

體的平均數(shù),標準差,中位數(shù),四分位數(shù)等等一堆量.現(xiàn)在從

這群體去抽樣,假設(shè)n=3.如果不重複(抽出後不放回,或一次

抓3個),可能抽到(1,2,3),也可能抽到(1,3,6).有20種不同組

合.每一種組合就是一個可能的樣本.以(1,3,6)這樣本來說,

樣本平均數(shù)是10/3=3.33;但以(1,2,3)這個樣本來說,樣本平

均數(shù)是2.有20種不同樣本組合,就有20個或相等或不等的

樣本平均數(shù).這20個樣本平均數(shù)當做資料,它也構(gòu)成一個分布,

就是

從{1,2,3,4,5,6}這群體隨機抽取n=3之樣本的樣本平

均數(shù)抽樣分布.

(好長的名詞!)這個分布本身也有個標準差.第17頁,課件共20頁,創(chuàng)作于2023年2月現(xiàn)在問題來了!名詞從這裡開始有點混亂.還是簡單地說.我說"名詞混亂",是因為有新舊不同說法.

[以前]

如上述樣本平均數(shù)抽樣分布的標準差,就稱為

"樣本平均數(shù)的標準誤".

類似地,我們可以有樣本比例的標準誤,樣本標準差的標準誤.

[現(xiàn)在]

新的說法對上述樣本平均數(shù)等統(tǒng)計量之抽樣分布的標準差,

就只說是某統(tǒng)計量(如樣本平均數(shù))的標準差!而因這個理

論的標準差通常"不知";因此會用樣本資料估計.

統(tǒng)計量的標準差,只有利用樣本資料估計出來的結(jié)果,才叫

標準誤(thestandarderrorofastatistic).以樣本平均數(shù)為統(tǒng)計量之例.

設(shè)群體標準差是σ,一個樣本的標準差以s表示.

則樣本平均數(shù)抽樣分布的標準差=σ/√n;

以前稱"樣本平均數(shù)的標準誤".

而現(xiàn)在把s/√n稱為"樣本平均數(shù)的標準誤",

以前稱為"樣本平均數(shù)的標準誤的估計"或"估計的標準誤".

第18頁,課件共20頁,創(chuàng)作于2023年2月(3)方差(VAR)方差是描述個體值間的變異,即觀察值的離散度,方差較小,表示觀察值圍繞均數(shù)的波動較小,反之亦然。方差計算公式是(4)標準差(SD)描述個體值間的變異,即觀察值的離散度,標準差較小,表示觀察值圍繞均數(shù)的波動較小,當觀察值呈正態(tài)分布或近似正態(tài)分布時可將均數(shù)及標準差同時寫出,如平均值±SD,計算公式。(5)標準誤(SE)描述統(tǒng)計量的抽樣誤差,即樣本統(tǒng)計量與總體參數(shù)的接近程度,標準誤小,表示抽樣誤差小,則統(tǒng)計量較穩(wěn)定并與參數(shù)較接近,可將統(tǒng)計量及其標準誤同時寫出,如樣本均數(shù)及其標準誤可寫為平均值±SE,計算公式。(6)變異系數(shù)(CV)又稱離散系數(shù),即標準差與均數(shù)之比用百分數(shù)表示,,它反映計量資料的變異程度,變異系數(shù)無單位。第19頁,課件共20頁,創(chuàng)作于2023年2月方差反映變量的變異程度,但由于取了平方值,使得與原始數(shù)據(jù)的單位不一樣,因此將方差開平方,這個值就是標準差(standarddeviation,Sd).標準差分為總體標準差(σ)和樣本標準差(s).實驗中由于我們都是取樣測量,所以一般用樣本標準差(s).

當計算樣本平均數(shù)的標準差時,結(jié)果叫:標準誤(standarderror)(這個不好理解)

舉例說明一下什么時候該用標準差,什么時候該用標準誤.

一個小樣方(同樣的處理)有5株幼苗,每株高度分別為(單位cm):

2

2.2

2.3

2.4

2.5

這五個數(shù)據(jù)用樣本標準差(s)來計算.

如果有五個這樣的小樣方(同樣的處理),每個小樣方的平均值是

2

2.2

2.3

2.4

2.5

那么要用標準誤來計算.

因為上面的值是平均值,源數(shù)據(jù)可能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論