第四章抽樣及分布藥學_第1頁
第四章抽樣及分布藥學_第2頁
第四章抽樣及分布藥學_第3頁
第四章抽樣及分布藥學_第4頁
第四章抽樣及分布藥學_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章抽樣及分布藥學第1頁,共27頁,2023年,2月20日,星期三

通過抽取總體中的部分(樣本)進行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對總體進行推斷。一、數(shù)理統(tǒng)計研究的問題(1)怎樣設(shè)計試驗,決定觀察的數(shù)目;(2)怎樣利用試驗觀察的結(jié)果作出一個“好”的推斷等。

第一個問題是怎樣進行抽樣,使抽得的樣本更合理,并有更好的代表性?這是抽樣方法和試驗設(shè)計問題.

第二個問題是怎樣從取得的樣本去推斷總體?這種推斷具有多大的可靠性?這是統(tǒng)計推斷問題.第2頁,共27頁,2023年,2月20日,星期三統(tǒng)計方法具有“部分推斷整體”的特征.因為從一小部分樣本觀察值去推斷全體對象(總體),即由部分推斷全體。這里使用了“歸納推理”的方法,它不同于數(shù)學中的“演繹推理”。歸納推理--根據(jù)觀察到的大量個別情況,歸納推斷總體。演繹推理--從一些假設(shè)、命題、已知的事實等出發(fā),按一定的邏輯推理得出結(jié)果。二、數(shù)理統(tǒng)計方法的特點第3頁,共27頁,2023年,2月20日,星期三

例如,在幾何學中要證明“等腰三角形底角相等”,只須從“等腰”這個前提出發(fā),運用幾何公理,一步一步推出這個結(jié)論.這是演繹推理。

而一個習慣于統(tǒng)計思想的人,可能這樣推理:做很多大小形狀不一的等腰三角形,實地測量其底角,看差距如何,根據(jù)所得資料看看可否作出“底角相等”的結(jié)論.這樣做就是歸納式的方法.第4頁,共27頁,2023年,2月20日,星期三

問題:用局部觀察對總體下結(jié)論,有沒有片面性?結(jié)論是否可靠?

顯然這不僅依賴于進行局部觀察的“樣本”是否具有總體的代表性,也依賴于對從這些樣本得到數(shù)據(jù)的合理加工、分析并得出論斷.

事實上,如果一切都建立在可靠的科學基礎(chǔ)上,則對總體下結(jié)論是可能的,也是可靠的.

但也應(yīng)記住,畢竟是由“局部”推斷“整體”,因而仍可能犯錯誤,結(jié)論往往是在某個“可靠性水平”之下得出的.第5頁,共27頁,2023年,2月20日,星期三

概率論是數(shù)理統(tǒng)計的基礎(chǔ),而數(shù)理統(tǒng)計是概率論的重要應(yīng)用.但它們是并列的兩個數(shù)學學科,并無從屬關(guān)系。

學習數(shù)理統(tǒng)計無須把過多時間化在計算上,可以更有效地把時間用在基本概念、方法原理及方法適用對象的正確理解上.

國內(nèi)外著名的統(tǒng)計軟件包:SAS,SPSS,STAT等,都可以讓你快速、簡便地進行數(shù)據(jù)處理和分析.第6頁,共27頁,2023年,2月20日,星期三第四章隨機抽樣和抽樣分布§4.1抽樣的基本概念和方法第7頁,共27頁,2023年,2月20日,星期三一、總體(Population)與個體(Sample)

一個統(tǒng)計問題總有它明確的研究對象.…研究某批燈泡的質(zhì)量總體--研究對象的全體(或集合)??傮w個體--總體中每個對象(或元素)。

每個個體具有的數(shù)量指標的全體就是總體.總體通常以一個概率分布描述。第8頁,共27頁,2023年,2月20日,星期三實例研究某地區(qū)12歲兒童生長發(fā)育情況,總體和個體應(yīng)為什么?顯然,總體為該地區(qū)的全體兒童個體為每一個兒童。

當然,衡量兒童生長發(fā)育情況要通過諸如身高、體重等數(shù)量指標進行,所以對總體的研究實際上是對該地區(qū)的全體兒童的這些指標值概率分布進行研究。第9頁,共27頁,2023年,2月20日,星期三

根據(jù)研究指標的多少,總體分為一維總體-研究一項描述指標,常用隨機變量X表示;多維總體-研究多項描述指標,常用隨機向量表示,如二維總體(X,Y)。根據(jù)含個體數(shù)量多少,總體分為有限總體和無限總體。第10頁,共27頁,2023年,2月20日,星期三二、簡單隨機樣本(simplerandomsample)

研究總體通常有兩種方法:一是全面地觀察統(tǒng)計(普查),二是從總體中抽取一部分個體觀察統(tǒng)計(抽樣)。抽樣(sampling)—從總體中抽取部分個體的過程。從國產(chǎn)轎車中抽5輛進行耗油量試驗樣本容量為5樣本(sample)—在一維總體中,抽取得到的n個體。樣本容量(sampleSize)—樣本中所含個體的數(shù)量。第11頁,共27頁,2023年,2月20日,星期三注意:(1)一維總體的每個個體的描述指標常用一個隨機變量表達,所以容量為n的樣本一般用n個隨機變量X1,X2,…,Xn

表達。(2)一維總體X的取值,是每個個體對應(yīng)的指標數(shù)據(jù)x;而樣本X1,X2,…,Xn的取值,是指每抽取一次樣本所對應(yīng)n個個體的指標數(shù)據(jù),稱為樣本觀察值(簡稱樣本值),記作x1,x2,…,xn。第12頁,共27頁,2023年,2月20日,星期三總體、樣本、樣本值的關(guān)系:總體(理論分布)?樣本

樣本值樣本是聯(lián)系二者的橋梁第13頁,共27頁,2023年,2月20日,星期三簡單隨機樣本—在隨機抽樣中,與總體X有相同概率分布,且相互獨立的樣本X1,X2,…,Xn

。簡單隨機樣本的性質(zhì):1、隨機性

Xi的取每個個體的概率相等。2、獨立性

X1,X2,…,Xn的相互獨立,其樣本觀察值互不影響。3、代表性

X1,X2,…,Xn與總體X有相同概率分布。后面提到的樣本如不說明,都是指簡單隨機樣本。第14頁,共27頁,2023年,2月20日,星期三

一般地,對有限總體,應(yīng)采用有放回抽樣,對無限總體(或數(shù)量較多),可采用無放回抽樣(近似看作有放回),否則違背獨立性。簡單隨機抽樣具體實施的方法:抽簽法隨機數(shù)法第15頁,共27頁,2023年,2月20日,星期三三、統(tǒng)計量(Statistic)

樣本是對總體的代表和反映,抽樣的目的是利用樣本值對總體進行統(tǒng)計推斷。而對總體進行統(tǒng)計推斷,常根據(jù)需要的不同,利用樣本構(gòu)造一些包含所需要的多種信息的量,就是關(guān)于樣本X1,X2,…,Xn的一些函數(shù),這些函數(shù)統(tǒng)稱為統(tǒng)計量。

統(tǒng)計量實際上表示樣本的數(shù)字特征。

若X1,…,Xn為總體X的一個樣本,g(X1,X2,…,Xn)是一個不包含任何未知參數(shù)的函數(shù),則g(X1,…,Xn)稱為一個統(tǒng)計量。統(tǒng)計量定義:第16頁,共27頁,2023年,2月20日,星期三統(tǒng)計量的特點:(1)統(tǒng)計量是樣本中n個隨機變量X1,X2,…,Xn的函數(shù),它是完全由樣本決定的量,仍是一個隨機變量。(2)統(tǒng)計量不包含任何未知參數(shù)。第17頁,共27頁,2023年,2月20日,星期三幾種常用統(tǒng)計量:用于反映總體均值的信息注意與總體數(shù)學期望的區(qū)別和聯(lián)系。用于反映總體方差的信息

注意與總體方差的區(qū)別和聯(lián)系。分母為n-1的原因:

第18頁,共27頁,2023年,2月20日,星期三第19頁,共27頁,2023年,2月20日,星期三SD與SE的區(qū)別:

SD是描述個體觀察值變異程度的大小,樣本標準差越小,樣本均數(shù)對一組樣本觀察值的代表性就越好;

SE是描述樣本均數(shù)變異程度和抽樣誤差的大小,樣本標準誤越小,用樣本均數(shù)估計總體均數(shù)的可靠性就越高。在實際中,一般用樣本標準差與樣本均數(shù)結(jié)合,用于描述樣本觀察值的分布范圍;樣本標準誤與樣本均數(shù)結(jié)合,用于估計總體均數(shù)可能出現(xiàn)的范圍。五、變異系數(shù)見課本P49P49案例4-1第20頁,共27頁,2023年,2月20日,星期三四、常用抽樣方法抽樣方法就是獲取樣本的方法。1、單純隨機抽樣

是一種等概率抽樣,即總體中每個個體都有相等的機會被抽取。

對有限總體,應(yīng)采用有放回抽樣,對無限總體(或數(shù)量較多),可采用無放回抽樣(近似看作有放回)。第21頁,共27頁,2023年,2月20日,星期三

例:從某年級1000名學生抽查100名調(diào)查上網(wǎng)情況

該法是其他抽樣方法的基礎(chǔ)。優(yōu)點是均數(shù)及標準差(誤)計算簡單,且抽得的樣本是簡單隨機樣本;缺點是總體量較大時,編號及隨機抽取工作量大。

把學號后4位作為編號,做成簽,充分混合后,從中摸出100個,則把這100位同學作為樣本?;蛴梦C隨機產(chǎn)生。常用實施方法:抽簽法和隨機數(shù)法。第22頁,共27頁,2023年,2月20日,星期三2、系統(tǒng)抽樣(機械抽樣)按一定順序和間隔從總體中抽取樣本的方法。步驟:編號分段確定起始編號獲取樣本

例:從某年級1000名學生抽查100名調(diào)查上網(wǎng)情況

該法優(yōu)點是簡單易行,樣本觀察值在總體中分布均勻;缺點是樣本觀察值總按一定周期趨勢得到,易產(chǎn)生偏性。

可把學號的后4位作為編號,把個位數(shù)0-9做成簽,充分混合后,從中摸1個數(shù)(如摸得6),則把這1000位同學中個位數(shù)字為6的100位同學作為樣本。第23頁,共27頁,2023年,2月20日,星期三3、分層抽樣

按某種特征將總體分成若干互不重疊組別、類型或區(qū)域等(稱為分層),再從各層中隨機抽樣組成樣本。例:調(diào)查某校同學上網(wǎng)情況

該法要求各層間差異盡可能大,才能得到有較好代表性的樣本,并便于各層間分析比較。

可采用以年級分層抽樣的方法,但上面例子則不適用,因差異較小。第24頁,共27頁,2023年,2月20日,星期三4、整群抽樣

先將總體分成若干互不重疊部分(稱為群),再從各群中隨機抽取某群或幾群作為樣本。

例:調(diào)查某年級學生上網(wǎng)情況

該法適用于大規(guī)模調(diào)查,易于組織,節(jié)省人力物力,但誤差較大,適于群體差異較小的調(diào)查對象。

可把每班作為一群,從中隨機抽取一班或幾班作為樣本。第25頁,共27頁,2023年,2月20日,星期三5、多階段抽樣

先將總體分成若干互不重疊組,再將各組分成幾個亞組,各亞組再分成幾個小組等,每一分組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論