數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷演示文稿_第1頁
數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷演示文稿_第2頁
數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷演示文稿_第3頁
數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷演示文稿_第4頁
數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷演示文稿_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷演示文稿目前一頁\總數(shù)四十二頁\編于十四點(diǎn)(優(yōu)選)第二節(jié)數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷目前二頁\總數(shù)四十二頁\編于十四點(diǎn)學(xué)習(xí)目標(biāo)1.說出抽樣誤差的概念2.記住標(biāo)準(zhǔn)誤計(jì)算公式并能說出公式的含義3.描述t分布的特征及應(yīng)用4.說出參數(shù)估計(jì)的含義及方法5.描述均數(shù)檢驗(yàn)t檢驗(yàn)和u檢驗(yàn)的方法目前三頁\總數(shù)四十二頁\編于十四點(diǎn)總體樣本抽取部分觀察單位

統(tǒng)計(jì)量

參數(shù)

統(tǒng)計(jì)推斷如:總體均數(shù)μ

總體標(biāo)準(zhǔn)差σ

總體率π如:樣本均數(shù)樣本標(biāo)準(zhǔn)差S

樣本率P

內(nèi)容:參數(shù)估計(jì)(estimationofparameters)

包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2.假設(shè)檢驗(yàn)(testofhypothesis)統(tǒng)計(jì)推斷statisticalinference目前四頁\總數(shù)四十二頁\編于十四點(diǎn)一均數(shù)的抽樣誤差

抽樣誤差(samplingerror):由于個(gè)體差異導(dǎo)致的樣本統(tǒng)計(jì)量之間或與總體參數(shù)間的差別。

從某正態(tài)分布總體中,隨機(jī)抽取樣本含量n=100的樣本,每次抽樣獲得其均數(shù)分別為,,,,他們之間及與總體均數(shù)μ總是不相等。這種差異就是抽樣誤差。

目前五頁\總數(shù)四十二頁\編于十四點(diǎn)1.抽樣試驗(yàn)

從正態(tài)分布總體N(5.00,0.502)中,每次隨機(jī)抽取樣本含量n=5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。目前六頁\總數(shù)四十二頁\編于十四點(diǎn)抽樣試驗(yàn)(n=5)目前七頁\總數(shù)四十二頁\編于十四點(diǎn)抽樣試驗(yàn)(n=10)目前八頁\總數(shù)四十二頁\編于十四點(diǎn)抽樣試驗(yàn)(n=30)目前九頁\總數(shù)四十二頁\編于十四點(diǎn)1000份樣本抽樣計(jì)算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913目前十頁\總數(shù)四十二頁\編于十四點(diǎn)3個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示目前十一頁\總數(shù)四十二頁\編于十四點(diǎn)抽樣實(shí)驗(yàn)小結(jié)

均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。

均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤與總體標(biāo)準(zhǔn)差相差一個(gè)常數(shù)的倍數(shù),即

樣本均數(shù)的標(biāo)準(zhǔn)誤(StandardError)=樣本標(biāo)準(zhǔn)差/

從正態(tài)總體N(μ,σ2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(μ,σ2/n)

。目前十二頁\總數(shù)四十二頁\編于十四點(diǎn)2.中心極限定理(centrallimittheorem)①即使從非正態(tài)總體中抽取樣本,所得均數(shù)分布仍近似呈正態(tài)。②隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。目前十三頁\總數(shù)四十二頁\編于十四點(diǎn)隨機(jī)變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)u變換均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1二t分布目前十四頁\總數(shù)四十二頁\編于十四點(diǎn)t分布曲線

t分布有如下特征:①是以0為中心隨自由度而變化的一簇左右對稱的曲線

②單峰分布,曲線在t=0處最高,并以t=0為中心左右對稱③與正態(tài)分布相比,曲線最高處較矮,自由度越小,兩尾部翹得越高(見綠線)④隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標(biāo)準(zhǔn)正態(tài)分布。目前十五頁\總數(shù)四十二頁\編于十四點(diǎn)t分布曲線

t分布有如下特征:①自由度相同時(shí),t越大,

p值越?、趐值相同時(shí),自由度越大,

t值越?、踭值相同時(shí),自由度越大

p值越小t1t2(t1>t2,p1<p2)(n1>n2,t1<t2)(n1>n2,p1<p2)t1t2t目前十六頁\總數(shù)四十二頁\編于十四點(diǎn)t分布曲線下面積單側(cè)t0.05,9=1.833雙側(cè)t0.05/2,9=2.262

=單側(cè)t0.025,9單側(cè)t0.01,9=2.821雙側(cè)t0.01/2,9=3.250

=單側(cè)t0.005,9雙側(cè)t0.05/2,∞=1.96

=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.640.013.2502.8210.005目前十七頁\總數(shù)四十二頁\編于十四點(diǎn)三總體均數(shù)的估計(jì)

1.總體均數(shù)的估計(jì)

(1).總體均數(shù)的點(diǎn)估計(jì)(pointestimation)與區(qū)間估計(jì)

(2).總體均數(shù)的可信區(qū)間(confidenceinterval,CI)(3).大樣本總體均數(shù)的可信區(qū)間2.可信區(qū)間的解釋目前十八頁\總數(shù)四十二頁\編于十四點(diǎn)1.總體均數(shù)的估計(jì)

(1).總體均數(shù)的點(diǎn)估計(jì)與區(qū)間估計(jì)參數(shù)的估計(jì)點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì):在一定可信度(1-α)下,同時(shí)考慮抽樣誤差目前十九頁\總數(shù)四十二頁\編于十四點(diǎn)

區(qū)間的可信度(如95%或99%)是重復(fù)抽樣(如1000次)時(shí),樣本(如n=5)區(qū)間包含總體參數(shù)(μ)的百分?jǐn)?shù)。常用(1-α)表示,α值一般取0.05或0.01。)或(;或?qū)懗?,可信區(qū)間為(XXXXXStXStXStXStXStXnananananama,2/,2/,2/,2/,2/)1(+<<-±+--(2).總體均數(shù)的可信區(qū)間(CI)目前二十頁\總數(shù)四十二頁\編于十四點(diǎn)

(2).總體均數(shù)的可信區(qū)間目前二十一頁\總數(shù)四十二頁\編于十四點(diǎn)(3).大樣本總體均數(shù)的可信區(qū)間

目前二十二頁\總數(shù)四十二頁\編于十四點(diǎn)2.可信區(qū)間的解釋

95%可信區(qū)間:從總體中作隨機(jī)抽樣,作100次抽樣,每個(gè)樣本可算得一個(gè)可信區(qū)間,得100個(gè)可信區(qū)間,平均有95個(gè)可信區(qū)間包括μ(估計(jì)正確),只有5個(gè)可信區(qū)間不包括μ(估計(jì)錯(cuò)誤)。95%可信區(qū)間

99%可信區(qū)間公式區(qū)間范圍窄寬估計(jì)錯(cuò)誤的概率大(0.05)小(0.01)XXStXStXnn,2/05.0,2/05.0,+-目前二十三頁\總數(shù)四十二頁\編于十四點(diǎn)

可信區(qū)間與參考值范圍的比較目前二十四頁\總數(shù)四十二頁\編于十四點(diǎn)四均數(shù)的假設(shè)檢驗(yàn)1.樣本均數(shù)與總體均數(shù)的比較2.配對資料的比較3.兩樣本均數(shù)的比較4.大樣本均數(shù)比較的u檢驗(yàn)5.假設(shè)檢驗(yàn)的步驟及有關(guān)概念目前二十五頁\總數(shù)四十二頁\編于十四點(diǎn)1.樣本均數(shù)與總體均數(shù)的比較

推斷樣本所代表的未知總體均數(shù)μ與已知總體均數(shù)μ0有無差別。已知總體均數(shù)μ0一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值。統(tǒng)計(jì)量t的計(jì)算公式:目前二十六頁\總數(shù)四十二頁\編于十四點(diǎn)實(shí)例目前二十七頁\總數(shù)四十二頁\編于十四點(diǎn)目前二十八頁\總數(shù)四十二頁\編于十四點(diǎn)根據(jù)專業(yè)知識確定單、雙側(cè)檢驗(yàn)?zāi)壳岸彭揬總數(shù)四十二頁\編于十四點(diǎn)2.配對資料的比較

兩種情況:1.隨機(jī)配對設(shè)計(jì)(randomizedpaireddesign)是將受試對象按某些混雜因素(如性別、年齡、窩別等)配成對子,每對中的兩個(gè)個(gè)體隨機(jī)分配給兩種處理(如處理組與對照組);2.或者同一受試對象作兩次不同的處理(自身對照)。

優(yōu)點(diǎn):配對設(shè)計(jì)減少了個(gè)體差異。

特點(diǎn):資料成對,每對數(shù)據(jù)不可拆分。目前三十頁\總數(shù)四十二頁\編于十四點(diǎn)2.配對資料的比較—方法目前三十一頁\總數(shù)四十二頁\編于十四點(diǎn)例:

兩法測定12份尿鉛含量的結(jié)果樣品號尿鉛含量(μmol.L-1)簡便法常規(guī)法差值(d)

1

2.41

2.80-0.390.1521

2

2.90

3.04-0.140.0196

3

2.75

1.88

0.870.7569

4

3.23

3.43-0.200.0400

5

3.67

3.81-0.140.0196

6

4.49

4.00

0.490.2401

7

5.16

4.44

0.720.5184

8

5.45

5.41

0.040.0016

9

2.06

1.24

0.820.672410

1.64

1.83-0.190.036111

1.06

1.45-0.390.152112

0.77

0.92-0.150.0225合計(jì)----

1.342.6314目前三十二頁\總數(shù)四十二頁\編于十四點(diǎn)兩法測定結(jié)果的比較目前三十三頁\總數(shù)四十二頁\編于十四點(diǎn)3.兩樣本均數(shù)的比較

完全隨機(jī)設(shè)計(jì)(completelyrandomdesign):把受試對象完全隨機(jī)分為兩組,分別給予不同處理,然后比較獨(dú)立的兩組樣本均數(shù)。各組對象數(shù)不必嚴(yán)格相同。

目的:比較兩總體均數(shù)是否相同。

條件:假定資料來自正態(tài)總體,σ12=σ22目前三十四頁\總數(shù)四十二頁\編于十四點(diǎn)實(shí)例目前三十五頁\總數(shù)四十二頁\編于十四點(diǎn)4.大樣本均數(shù)比較的u檢驗(yàn)

兩樣本均數(shù)比較時(shí)當(dāng)每組樣本量大于30(或50)時(shí),可采用u檢驗(yàn);但只是近似方法。優(yōu)點(diǎn):簡單,u界值與自由度無關(guān),

u0.05=1.96,u0.01=2.58目前三十六頁\總數(shù)四十二頁\編于十四點(diǎn)5.假設(shè)檢驗(yàn)的步驟及有關(guān)概念總體間差異:1.個(gè)體差異,抽樣誤差所致;

2.總體間固有差異判斷差別屬于哪一種情況的統(tǒng)計(jì)學(xué)檢驗(yàn),就是假設(shè)檢驗(yàn)(testofhypothesis)。

t檢驗(yàn)是最常用的一種假設(shè)檢驗(yàn)之一。小概率思想:P<0.05(或P<0.01)是小概率事件。在一次試驗(yàn)中基本上不會發(fā)生。P≤α(0.05)樣本差別有統(tǒng)計(jì)學(xué)意義;P>α(0.05)樣本差別無統(tǒng)計(jì)學(xué)意義目前三十七頁\總數(shù)四十二頁\編于十四點(diǎn)1、建立假設(shè)與確定檢驗(yàn)水準(zhǔn)(α)

H0:μ1=μ2無效假設(shè)(nullhypothesis)

H1:μ1≠μ2備擇假設(shè)(alternativehypothesis)

檢驗(yàn)水準(zhǔn)(levelofatest):α=0.05(雙側(cè))2、選定方法和計(jì)算統(tǒng)計(jì)量:根據(jù)統(tǒng)計(jì)推斷目的、設(shè)計(jì)、資料組數(shù)、樣本含量、等選擇方法。如兩組小樣本比較用t檢驗(yàn)、大樣本比較u檢驗(yàn)、方差齊性檢驗(yàn)用F檢驗(yàn)。3、確定P值,作出判斷

P≤α(0.05)樣本差別有統(tǒng)計(jì)學(xué)意義;

P>α(0.05)樣本差別無統(tǒng)計(jì)學(xué)意義

假設(shè)檢驗(yàn)的步驟

目前三十八頁\總數(shù)四十二頁\編于十四點(diǎn)

Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤由樣本推斷的結(jié)果真實(shí)結(jié)果拒絕H0不拒絕H0

H0成立Ⅰ型錯(cuò)誤a推斷正確(1-a

)

H0不成立推斷正確(1-b)Ⅱ型錯(cuò)誤b

(1-b)即把握度(powerofatest):兩總體確有差別,被檢出有差別的能力(1-a)即可信度(confidencelevel):重復(fù)抽樣時(shí),樣本區(qū)間包含總體參數(shù)(m)的百分?jǐn)?shù)目前三十九頁\總數(shù)四十二頁\編于十四點(diǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論