版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷演示文稿目前一頁\總數(shù)四十二頁\編于十四點(diǎn)(優(yōu)選)第二節(jié)數(shù)值變量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)推斷目前二頁\總數(shù)四十二頁\編于十四點(diǎn)學(xué)習(xí)目標(biāo)1.說出抽樣誤差的概念2.記住標(biāo)準(zhǔn)誤計(jì)算公式并能說出公式的含義3.描述t分布的特征及應(yīng)用4.說出參數(shù)估計(jì)的含義及方法5.描述均數(shù)檢驗(yàn)t檢驗(yàn)和u檢驗(yàn)的方法目前三頁\總數(shù)四十二頁\編于十四點(diǎn)總體樣本抽取部分觀察單位
統(tǒng)計(jì)量
參數(shù)
統(tǒng)計(jì)推斷如:總體均數(shù)μ
總體標(biāo)準(zhǔn)差σ
總體率π如:樣本均數(shù)樣本標(biāo)準(zhǔn)差S
樣本率P
內(nèi)容:參數(shù)估計(jì)(estimationofparameters)
包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2.假設(shè)檢驗(yàn)(testofhypothesis)統(tǒng)計(jì)推斷statisticalinference目前四頁\總數(shù)四十二頁\編于十四點(diǎn)一均數(shù)的抽樣誤差
抽樣誤差(samplingerror):由于個(gè)體差異導(dǎo)致的樣本統(tǒng)計(jì)量之間或與總體參數(shù)間的差別。
從某正態(tài)分布總體中,隨機(jī)抽取樣本含量n=100的樣本,每次抽樣獲得其均數(shù)分別為,,,,他們之間及與總體均數(shù)μ總是不相等。這種差異就是抽樣誤差。
目前五頁\總數(shù)四十二頁\編于十四點(diǎn)1.抽樣試驗(yàn)
從正態(tài)分布總體N(5.00,0.502)中,每次隨機(jī)抽取樣本含量n=5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。目前六頁\總數(shù)四十二頁\編于十四點(diǎn)抽樣試驗(yàn)(n=5)目前七頁\總數(shù)四十二頁\編于十四點(diǎn)抽樣試驗(yàn)(n=10)目前八頁\總數(shù)四十二頁\編于十四點(diǎn)抽樣試驗(yàn)(n=30)目前九頁\總數(shù)四十二頁\編于十四點(diǎn)1000份樣本抽樣計(jì)算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913目前十頁\總數(shù)四十二頁\編于十四點(diǎn)3個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示目前十一頁\總數(shù)四十二頁\編于十四點(diǎn)抽樣實(shí)驗(yàn)小結(jié)
均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。
均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤與總體標(biāo)準(zhǔn)差相差一個(gè)常數(shù)的倍數(shù),即
樣本均數(shù)的標(biāo)準(zhǔn)誤(StandardError)=樣本標(biāo)準(zhǔn)差/
從正態(tài)總體N(μ,σ2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(μ,σ2/n)
。目前十二頁\總數(shù)四十二頁\編于十四點(diǎn)2.中心極限定理(centrallimittheorem)①即使從非正態(tài)總體中抽取樣本,所得均數(shù)分布仍近似呈正態(tài)。②隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。目前十三頁\總數(shù)四十二頁\編于十四點(diǎn)隨機(jī)變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)u變換均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1二t分布目前十四頁\總數(shù)四十二頁\編于十四點(diǎn)t分布曲線
t分布有如下特征:①是以0為中心隨自由度而變化的一簇左右對稱的曲線
②單峰分布,曲線在t=0處最高,并以t=0為中心左右對稱③與正態(tài)分布相比,曲線最高處較矮,自由度越小,兩尾部翹得越高(見綠線)④隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標(biāo)準(zhǔn)正態(tài)分布。目前十五頁\總數(shù)四十二頁\編于十四點(diǎn)t分布曲線
t分布有如下特征:①自由度相同時(shí),t越大,
p值越?、趐值相同時(shí),自由度越大,
t值越?、踭值相同時(shí),自由度越大
p值越小t1t2(t1>t2,p1<p2)(n1>n2,t1<t2)(n1>n2,p1<p2)t1t2t目前十六頁\總數(shù)四十二頁\編于十四點(diǎn)t分布曲線下面積單側(cè)t0.05,9=1.833雙側(cè)t0.05/2,9=2.262
=單側(cè)t0.025,9單側(cè)t0.01,9=2.821雙側(cè)t0.01/2,9=3.250
=單側(cè)t0.005,9雙側(cè)t0.05/2,∞=1.96
=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.640.013.2502.8210.005目前十七頁\總數(shù)四十二頁\編于十四點(diǎn)三總體均數(shù)的估計(jì)
1.總體均數(shù)的估計(jì)
(1).總體均數(shù)的點(diǎn)估計(jì)(pointestimation)與區(qū)間估計(jì)
(2).總體均數(shù)的可信區(qū)間(confidenceinterval,CI)(3).大樣本總體均數(shù)的可信區(qū)間2.可信區(qū)間的解釋目前十八頁\總數(shù)四十二頁\編于十四點(diǎn)1.總體均數(shù)的估計(jì)
(1).總體均數(shù)的點(diǎn)估計(jì)與區(qū)間估計(jì)參數(shù)的估計(jì)點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì):在一定可信度(1-α)下,同時(shí)考慮抽樣誤差目前十九頁\總數(shù)四十二頁\編于十四點(diǎn)
區(qū)間的可信度(如95%或99%)是重復(fù)抽樣(如1000次)時(shí),樣本(如n=5)區(qū)間包含總體參數(shù)(μ)的百分?jǐn)?shù)。常用(1-α)表示,α值一般取0.05或0.01。)或(;或?qū)懗?,可信區(qū)間為(XXXXXStXStXStXStXStXnananananama,2/,2/,2/,2/,2/)1(+<<-±+--(2).總體均數(shù)的可信區(qū)間(CI)目前二十頁\總數(shù)四十二頁\編于十四點(diǎn)
(2).總體均數(shù)的可信區(qū)間目前二十一頁\總數(shù)四十二頁\編于十四點(diǎn)(3).大樣本總體均數(shù)的可信區(qū)間
目前二十二頁\總數(shù)四十二頁\編于十四點(diǎn)2.可信區(qū)間的解釋
95%可信區(qū)間:從總體中作隨機(jī)抽樣,作100次抽樣,每個(gè)樣本可算得一個(gè)可信區(qū)間,得100個(gè)可信區(qū)間,平均有95個(gè)可信區(qū)間包括μ(估計(jì)正確),只有5個(gè)可信區(qū)間不包括μ(估計(jì)錯(cuò)誤)。95%可信區(qū)間
99%可信區(qū)間公式區(qū)間范圍窄寬估計(jì)錯(cuò)誤的概率大(0.05)小(0.01)XXStXStXnn,2/05.0,2/05.0,+-目前二十三頁\總數(shù)四十二頁\編于十四點(diǎn)
可信區(qū)間與參考值范圍的比較目前二十四頁\總數(shù)四十二頁\編于十四點(diǎn)四均數(shù)的假設(shè)檢驗(yàn)1.樣本均數(shù)與總體均數(shù)的比較2.配對資料的比較3.兩樣本均數(shù)的比較4.大樣本均數(shù)比較的u檢驗(yàn)5.假設(shè)檢驗(yàn)的步驟及有關(guān)概念目前二十五頁\總數(shù)四十二頁\編于十四點(diǎn)1.樣本均數(shù)與總體均數(shù)的比較
推斷樣本所代表的未知總體均數(shù)μ與已知總體均數(shù)μ0有無差別。已知總體均數(shù)μ0一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值。統(tǒng)計(jì)量t的計(jì)算公式:目前二十六頁\總數(shù)四十二頁\編于十四點(diǎn)實(shí)例目前二十七頁\總數(shù)四十二頁\編于十四點(diǎn)目前二十八頁\總數(shù)四十二頁\編于十四點(diǎn)根據(jù)專業(yè)知識確定單、雙側(cè)檢驗(yàn)?zāi)壳岸彭揬總數(shù)四十二頁\編于十四點(diǎn)2.配對資料的比較
兩種情況:1.隨機(jī)配對設(shè)計(jì)(randomizedpaireddesign)是將受試對象按某些混雜因素(如性別、年齡、窩別等)配成對子,每對中的兩個(gè)個(gè)體隨機(jī)分配給兩種處理(如處理組與對照組);2.或者同一受試對象作兩次不同的處理(自身對照)。
優(yōu)點(diǎn):配對設(shè)計(jì)減少了個(gè)體差異。
特點(diǎn):資料成對,每對數(shù)據(jù)不可拆分。目前三十頁\總數(shù)四十二頁\編于十四點(diǎn)2.配對資料的比較—方法目前三十一頁\總數(shù)四十二頁\編于十四點(diǎn)例:
兩法測定12份尿鉛含量的結(jié)果樣品號尿鉛含量(μmol.L-1)簡便法常規(guī)法差值(d)
1
2.41
2.80-0.390.1521
2
2.90
3.04-0.140.0196
3
2.75
1.88
0.870.7569
4
3.23
3.43-0.200.0400
5
3.67
3.81-0.140.0196
6
4.49
4.00
0.490.2401
7
5.16
4.44
0.720.5184
8
5.45
5.41
0.040.0016
9
2.06
1.24
0.820.672410
1.64
1.83-0.190.036111
1.06
1.45-0.390.152112
0.77
0.92-0.150.0225合計(jì)----
1.342.6314目前三十二頁\總數(shù)四十二頁\編于十四點(diǎn)兩法測定結(jié)果的比較目前三十三頁\總數(shù)四十二頁\編于十四點(diǎn)3.兩樣本均數(shù)的比較
完全隨機(jī)設(shè)計(jì)(completelyrandomdesign):把受試對象完全隨機(jī)分為兩組,分別給予不同處理,然后比較獨(dú)立的兩組樣本均數(shù)。各組對象數(shù)不必嚴(yán)格相同。
目的:比較兩總體均數(shù)是否相同。
條件:假定資料來自正態(tài)總體,σ12=σ22目前三十四頁\總數(shù)四十二頁\編于十四點(diǎn)實(shí)例目前三十五頁\總數(shù)四十二頁\編于十四點(diǎn)4.大樣本均數(shù)比較的u檢驗(yàn)
兩樣本均數(shù)比較時(shí)當(dāng)每組樣本量大于30(或50)時(shí),可采用u檢驗(yàn);但只是近似方法。優(yōu)點(diǎn):簡單,u界值與自由度無關(guān),
u0.05=1.96,u0.01=2.58目前三十六頁\總數(shù)四十二頁\編于十四點(diǎn)5.假設(shè)檢驗(yàn)的步驟及有關(guān)概念總體間差異:1.個(gè)體差異,抽樣誤差所致;
2.總體間固有差異判斷差別屬于哪一種情況的統(tǒng)計(jì)學(xué)檢驗(yàn),就是假設(shè)檢驗(yàn)(testofhypothesis)。
t檢驗(yàn)是最常用的一種假設(shè)檢驗(yàn)之一。小概率思想:P<0.05(或P<0.01)是小概率事件。在一次試驗(yàn)中基本上不會發(fā)生。P≤α(0.05)樣本差別有統(tǒng)計(jì)學(xué)意義;P>α(0.05)樣本差別無統(tǒng)計(jì)學(xué)意義目前三十七頁\總數(shù)四十二頁\編于十四點(diǎn)1、建立假設(shè)與確定檢驗(yàn)水準(zhǔn)(α)
H0:μ1=μ2無效假設(shè)(nullhypothesis)
H1:μ1≠μ2備擇假設(shè)(alternativehypothesis)
檢驗(yàn)水準(zhǔn)(levelofatest):α=0.05(雙側(cè))2、選定方法和計(jì)算統(tǒng)計(jì)量:根據(jù)統(tǒng)計(jì)推斷目的、設(shè)計(jì)、資料組數(shù)、樣本含量、等選擇方法。如兩組小樣本比較用t檢驗(yàn)、大樣本比較u檢驗(yàn)、方差齊性檢驗(yàn)用F檢驗(yàn)。3、確定P值,作出判斷
P≤α(0.05)樣本差別有統(tǒng)計(jì)學(xué)意義;
P>α(0.05)樣本差別無統(tǒng)計(jì)學(xué)意義
假設(shè)檢驗(yàn)的步驟
目前三十八頁\總數(shù)四十二頁\編于十四點(diǎn)
Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤由樣本推斷的結(jié)果真實(shí)結(jié)果拒絕H0不拒絕H0
H0成立Ⅰ型錯(cuò)誤a推斷正確(1-a
)
H0不成立推斷正確(1-b)Ⅱ型錯(cuò)誤b
(1-b)即把握度(powerofatest):兩總體確有差別,被檢出有差別的能力(1-a)即可信度(confidencelevel):重復(fù)抽樣時(shí),樣本區(qū)間包含總體參數(shù)(m)的百分?jǐn)?shù)目前三十九頁\總數(shù)四十二頁\編于十四點(diǎn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年血液凈化信息系統(tǒng)項(xiàng)目資金申請報(bào)告代可行性研究報(bào)告
- 公路護(hù)欄施工合同
- 《項(xiàng)目組管理方案》課件
- 2015年中考思品熱點(diǎn)總復(fù)習(xí)(終極預(yù)測)
- 余弦定理課件
- 【培訓(xùn)課件】防雷裝置設(shè)計(jì)技術(shù)評價(jià)講座
- 16.2《登泰山記》課件 2024-2025學(xué)年統(tǒng)編版高中語文必修上冊-8
- 2025屆內(nèi)蒙古包頭市高考考前提分語文仿真卷含解析
- 2025屆遼寧省重點(diǎn)協(xié)作校高三一診考試數(shù)學(xué)試卷含解析
- 安徽省安慶市達(dá)標(biāo)名校2025屆高考沖刺英語模擬試題含解析
- 機(jī)械專業(yè)職業(yè)生涯規(guī)劃
- 護(hù)士法律法規(guī)培訓(xùn)通用課件
- 幼兒園大班建構(gòu)式課程
- 終端設(shè)備量子通信與后量子密碼技術(shù)
- 新北師大版小學(xué)數(shù)學(xué)二年級上冊《六-測量:課桌有多長》-公開課教案-1
- 云南中煙公司招聘考試題目
- 論社會系統(tǒng)研究方法及其運(yùn)用讀馬克思主義與社會科學(xué)方法論有感
- 環(huán)境監(jiān)測投標(biāo)書
- 支氣管鏡術(shù)后護(hù)理常規(guī)
- 兒科護(hù)理培訓(xùn):兒童流行性感冒護(hù)理
- 解答-統(tǒng)計(jì)學(xué)導(dǎo)論-曾五一課后習(xí)題答案
評論
0/150
提交評論