SPSS均數(shù)比較過程_第1頁
SPSS均數(shù)比較過程_第2頁
SPSS均數(shù)比較過程_第3頁
SPSS均數(shù)比較過程_第4頁
SPSS均數(shù)比較過程_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1應(yīng)用統(tǒng)計(jì)學(xué)SPSS統(tǒng)計(jì)分析方法及應(yīng)用主講:馮運(yùn)義 Email:rich_1698.2第四節(jié) SPSS均數(shù)比較過程.3一、參數(shù)檢驗(yàn)概述參數(shù):描述總體的數(shù)字特征,如總體均數(shù)。統(tǒng)計(jì)量:描述樣本的數(shù)字特征,如樣本均數(shù)。置信度(1-):樣本統(tǒng)計(jì)量推斷總體特征的可靠性程度置信區(qū)間:概率保證下的總體參數(shù)的可能取值范圍,如本地男性平均初婚年齡有95的可能性為252周歲。.4推斷統(tǒng)計(jì)本節(jié)中的均數(shù)比較過程是典型的參數(shù)檢驗(yàn),參數(shù)檢驗(yàn)是推斷統(tǒng)計(jì)的重要組成部分。推斷統(tǒng)計(jì):由樣本數(shù)據(jù)推斷總體特征的方法。在對樣本數(shù)據(jù)描述的基礎(chǔ)上,以概率形式對總體的數(shù)量特征進(jìn)行表述??傮w數(shù)據(jù)無法獲得搜集總體數(shù)據(jù)投入較大。推斷統(tǒng)計(jì)包括參數(shù)估

2、計(jì)和假設(shè)檢驗(yàn)兩種形式,二者原理一致,僅表現(xiàn)形式不同。.51、參數(shù)估計(jì)定義:應(yīng)用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)的統(tǒng)計(jì)推斷過程。如果在估計(jì)中直接用樣本統(tǒng)計(jì)量作為固定的數(shù)值對參數(shù)做出估計(jì),就是參數(shù)的點(diǎn)估計(jì)。如初婚年齡為25周歲。如果在估計(jì)中要對參數(shù)做出帶有某種可靠性的估計(jì),就需要給出對應(yīng)于這一可靠性或置信度的區(qū)間,即區(qū)間估計(jì)。如初婚年齡為252周歲。.6區(qū)間估計(jì)與置信度估計(jì)的區(qū)間越大,參數(shù)被包含在該區(qū)間的概率就越大,估計(jì)的可靠性即置信度也就越大。反之亦然。觀測值的離散程度即方差越小(即觀測值的精度越高),相同的置信度下,其區(qū)間越短??梢妳^(qū)間估計(jì)總是與一定的置信度相對應(yīng)的。.72、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的思想:首

3、先提出假設(shè),然后利用樣本數(shù)據(jù)來檢驗(yàn)假設(shè),支持,則接受假設(shè);不支持,則推翻假設(shè)。假設(shè)檢驗(yàn)的基本信條:小概率原理,即發(fā)生概率很小的隨機(jī)事件,在一次實(shí)驗(yàn)中幾乎不可能發(fā)生。假設(shè)檢驗(yàn)分為兩類:參數(shù)檢驗(yàn):總體分布已知時(如正態(tài)分布),根據(jù)樣本數(shù)據(jù)對某些總體參數(shù)(如均值)進(jìn)行推斷。非參數(shù)檢驗(yàn):總體分布未知或不符合參數(shù)檢驗(yàn)的假定分布時。.8假設(shè)檢驗(yàn)的基本步驟提出無效(零)假設(shè)(H0)。選擇檢驗(yàn)統(tǒng)計(jì)量,給定顯著性水平。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的發(fā)生概率。依據(jù)顯著性水平,作出統(tǒng)計(jì)結(jié)論。.9區(qū)間估計(jì)與假設(shè)檢驗(yàn)的對偶性在進(jìn)行統(tǒng)計(jì)推斷時,如果總體分布的形式是已知的,只是參數(shù)未知,則統(tǒng)計(jì)推斷問題就可歸結(jié)為推斷總體參數(shù)的問題。例如在

4、產(chǎn)品質(zhì)量檢驗(yàn)中,通過隨機(jī)抽取的樣本不合格品率,以一定的概率把握程度估計(jì)總體不合格品率,這就是參數(shù)的區(qū)間估計(jì)問題;如果要以一定的概率判斷這整批產(chǎn)品是否合格,這就是一個假設(shè)檢驗(yàn)的問題。同一個樣本-同一個統(tǒng)計(jì)量-同一種分布,因而兩個問題可互相轉(zhuǎn)換。這種互相轉(zhuǎn)換形成了區(qū)間估計(jì)與假設(shè)檢驗(yàn)的對偶性。.10假設(shè)檢驗(yàn)的幾個概念無效假設(shè)H0:關(guān)于總體參數(shù)的假設(shè),必定包含等號H0 :某值; H0 :某值; H0 : 某值; 對立假設(shè)H1 : H1 : 某值; H1 : 某值;檢驗(yàn)水平:即顯著性水平,一般取005或001。第類錯誤:當(dāng)無效假設(shè)為真時,卻被否定,即“棄真”錯誤。 為第類錯誤的概率。第類錯誤:當(dāng)無效假設(shè)

5、為假時,卻被接受,即“取偽”錯誤。 為第 類錯誤的概率。.11假設(shè)檢驗(yàn)的兩類錯誤假設(shè)檢驗(yàn)基于小概率原理:給定檢驗(yàn)水平,如果零假設(shè)成立條件下出現(xiàn)現(xiàn)有統(tǒng)計(jì)量的概率等于或小于,則認(rèn)為此事件可能性很小,因此就拒絕零假設(shè)。第一類錯誤和第二類錯誤又是一對矛盾:在其他條件不變下,減少犯第一類錯誤的可能性,勢必增加犯第二類錯誤的可能性。要同時減少一、二兩類錯誤的概率,只有增加樣本量。棄真錯誤置信度取偽錯誤檢驗(yàn)效能.12雙側(cè)檢驗(yàn)檢驗(yàn)樣本均值與總體均值有沒有顯著性差異顯著性水平005如:出生嬰兒的平均體重是否為3公斤?陰影部分為拒絕域.13單側(cè)檢驗(yàn)左單側(cè)檢驗(yàn)拒絕域右單側(cè)檢驗(yàn)拒絕域顯著性水平005.14二、均數(shù)比較

6、涉及的統(tǒng)計(jì)學(xué)原理1、正態(tài)分布:概率分布密度曲線呈鐘型,兩頭低中間高,左右對稱,近似于數(shù)學(xué)上的正態(tài)曲線。其性質(zhì)和特點(diǎn):決定于均數(shù) 和方差 2 。鐘形曲線位置特征量均數(shù)、中位數(shù)、眾數(shù)相等偏度和峰度均為零.15標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換對于不同的與 ,范圍內(nèi)的概率不同,例如當(dāng)=0,=1時,在(-1.96,1.96)范圍內(nèi)正態(tài)變量取值概率為0.95,而當(dāng)=0, =1.96時,在 (-1.96, 1.96)范圍內(nèi)正態(tài)變量取值概率就不是0.95,而是0.68。為了制一張可供不同的、 共同使用的表,考慮引進(jìn)標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換標(biāo)準(zhǔn)正態(tài)分布:是一種特殊的正態(tài)分布,其均數(shù)為0,標(biāo)準(zhǔn)差為1。Z變換:即標(biāo)準(zhǔn)化變換

7、。若變量X服從正態(tài)分布,則Z變換后Z就服從標(biāo)準(zhǔn)正態(tài)分布。 .16 圖 標(biāo)準(zhǔn)正態(tài)曲線下從 到u范圍面積示意圖.172、標(biāo)準(zhǔn)正態(tài)分布與t統(tǒng)計(jì)量正態(tài)分布N(,2)的資料,其樣本均數(shù)服從正態(tài)分布N(,2/n),并且變換后的統(tǒng)計(jì)量 服從標(biāo)準(zhǔn)正態(tài)分布N(0,1) 。但在實(shí)際研究時,往往是未知的,因此只能用樣本的標(biāo)準(zhǔn)差S作為的一個近似值(估計(jì)值)代替,得到變換后的統(tǒng)計(jì)量并記為 。對于Z而言,正態(tài)總體確定后,就已經(jīng)確定了,但是對于統(tǒng)計(jì)量t,則樣本標(biāo)準(zhǔn)差S隨樣本而變。因此統(tǒng)計(jì)量t變異程度要大于Z,故t不再服從標(biāo)準(zhǔn)正態(tài)分布。 .18N=5, t統(tǒng)計(jì)量的峰值比標(biāo)準(zhǔn)正態(tài)分布的峰值略小,雙側(cè)尾部的值則較標(biāo)準(zhǔn)正態(tài)分布略大

8、。N=100,接近標(biāo)準(zhǔn)正態(tài)分布在正態(tài)總體N(168.18,62)中隨機(jī)抽樣,樣本量分別取n =5,n =100,均抽10000個樣本,分別計(jì)算t值并作相應(yīng)頻數(shù)圖如下:.193、 t分布英國統(tǒng)計(jì)學(xué)家W. S. Gosset(1908)給出了統(tǒng)計(jì)量t的分布規(guī)律,并稱統(tǒng)計(jì)量t 服從自由度為 ( =n-1) 的t()分布。 v=1v=5v=.20 t分布的圖形特征和t界值 分布特征: t分布曲線是單峰的,且關(guān)于t = 0對稱。t分布與標(biāo)準(zhǔn)正態(tài)分布的關(guān)系: 自由度 較小時,t分布與標(biāo)準(zhǔn)正態(tài)分布相差較大,t分布曲線的尾部面積大于標(biāo)準(zhǔn)正態(tài)分布曲線的尾部面積。當(dāng)自由度較大時,t分布逼近于標(biāo)準(zhǔn)正態(tài)分布。t分布的

9、界值:給定自由度,t分布曲線的雙側(cè)尾部面積為時對應(yīng)的t值,記為 ,并稱為t的雙側(cè)界值。統(tǒng)計(jì)意義?.214、 抽樣分布抽樣分布是所有可能的樣本統(tǒng)計(jì)量和相應(yīng)的概率構(gòu)成的分布,以均值和方差為數(shù)字特征。正態(tài)分布再生定理:如果變量X 服從正態(tài)分布N ( ,2),則從這個總體中抽取容量為n 的樣本,其樣本均數(shù)也服從于正態(tài)分布N ( ,2/n )。 中心極限定理:對不服從正態(tài)分布的總體進(jìn)行抽樣,只要樣本量n足夠大,其樣本均數(shù)也服從于正態(tài)分布N ( ,2/n )。 .225、 總體參數(shù)區(qū)間估計(jì)的一般步驟明確待估參數(shù)和置信度。用樣本統(tǒng)計(jì)量導(dǎo)出總體參數(shù)的點(diǎn)估計(jì)值。 利用檢驗(yàn)統(tǒng)計(jì)量的分布給出置信區(qū)間。.23總體均數(shù)

10、的區(qū)間估計(jì)樣本量較大時,且總體標(biāo)準(zhǔn)差已知:總體均數(shù)的95%置信區(qū)間估計(jì)樣本量較大時(如n =100 ),且總體標(biāo)準(zhǔn)差未知:總體均數(shù)的95%置信區(qū)間估計(jì).24樣本量較小時,且總體標(biāo)準(zhǔn)差未知:樣本均數(shù)只能進(jìn)行t變換,總體均數(shù)的95%置信區(qū)間估計(jì).256、 均數(shù)比較的假設(shè)檢驗(yàn)數(shù)據(jù)類型:服從正態(tài)分布的定距型變量擬解決:某樣本均值是否來自某個已知的正態(tài)總體?兩個樣本所代表的總體均值是否相同?某樣本所代表的總體均值是否發(fā)生了數(shù)量上的變化?區(qū)分兩種可能性:如果兩個樣本均數(shù)不同,可能兩個樣本所來自的總體均數(shù)相同,差別來自抽樣誤差??傮w均數(shù)確實(shí)不同.26均數(shù)比較的類型單個樣本均數(shù)與總體均數(shù)比較配對樣本的均數(shù)比較

11、兩個樣本均數(shù)的比較兩樣本方差齊:原始資料呈正態(tài)分布時:t檢驗(yàn)原始資料不呈正態(tài)分布,但樣本量較大時:t檢驗(yàn)原始資料不呈正態(tài)分布,且樣本量較小時:非參數(shù)檢驗(yàn)兩樣本方差不齊:數(shù)據(jù)變換后方差齊:t檢驗(yàn)數(shù)據(jù)變換后方差不齊:t檢驗(yàn).27三、SPSS均數(shù)比較過程單樣本T 檢驗(yàn)過程:One-Sample T test配對樣本T 檢驗(yàn)過程:Paried-Samples T test獨(dú)立樣本T 檢驗(yàn)過程:Indepentdent-Samples T test.281、單樣本T 檢驗(yàn)過程統(tǒng)計(jì)思想:推斷樣本數(shù)據(jù)是否來自某一總體,即樣本數(shù)據(jù)所代表的總體均值與指定的檢驗(yàn)值是否存在統(tǒng)計(jì)學(xué)差異。僅涉及一個樣本數(shù)據(jù)。前提條件:

12、樣本所來自的總體為正態(tài)或近似正態(tài)分布例如:兒童1周歲時的平均身高是否為75厘米居民平均存(?。┛罱痤~是否為2000元.29檢驗(yàn)步驟與統(tǒng)計(jì)量事先確定是否雙側(cè)檢驗(yàn),建立無效假設(shè)H0 :=0(雙);對立假設(shè)?單側(cè)檢驗(yàn)?確定檢驗(yàn)水準(zhǔn)=0.05選擇檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)(=n-1)結(jié)果判斷與解釋P0.05,不能拒絕H0,p=0.05,拒絕H0。.30SPSS基本操作操作:AnalyzeCompare Means One-Sample T Test 選定分析的變量輸入待比較的總體參數(shù)0,確定單雙側(cè)檢驗(yàn)水準(zhǔn)選定需要輸出的差異的置信區(qū)間.31例子:人口調(diào)查資料假設(shè)該市人口平均年齡去年為31.8歲,問今年人口平均年

13、齡是否發(fā)生了變化? H0 :318;有理由認(rèn)定該市人口存在老齡化趨勢,問今年人口平均年齡是否高于31.8歲? H0 :318;.32.33.34例子儲戶平均一次存款金額是否不高于2000元?根據(jù)全國保險(xiǎn)公司人員構(gòu)成數(shù)據(jù),推斷具有高等教育水平的員工比例是否不低于08?.352、配對樣本T 檢驗(yàn)統(tǒng)計(jì)思想:推斷兩個配對的樣本數(shù)據(jù)是否來自同一總體,即每對觀測值之差(差值樣本)的總體均值是否為零。涉及兩個配對的樣本數(shù)據(jù)。轉(zhuǎn)化為對差值是否為零進(jìn)行單樣本T檢驗(yàn)前提條件:被比較的兩個樣本有配對關(guān)系;要求兩個樣本均來自正態(tài)或近似正態(tài)的總體。特征:兩組樣本的樣本量相同;兩組觀測值存在一一對應(yīng)的關(guān)系。.36檢驗(yàn)步驟

14、與統(tǒng)計(jì)量事先確定是否雙側(cè)檢驗(yàn),建立無效假設(shè)H0 :12=0=0(雙);確定檢驗(yàn)水準(zhǔn)選擇檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)(=n-1) 計(jì)算差值x=x1-x2, 計(jì)算統(tǒng)計(jì)量t結(jié)果判斷與解釋.37SPSS基本操作按AnalyzeCompare Means Paired-Sample T Test 選定待分析的配對變量,成對選入。默認(rèn)輸出差異的95%置信區(qū)間.38例:比較飲用減肥茶前后體重是否發(fā)生變化.39.403、獨(dú)立樣本T 檢驗(yàn)統(tǒng)計(jì)思想:推斷兩個樣本數(shù)據(jù)是否來自同一總體,即樣本數(shù)據(jù)所代表的兩個總體均值是否存在統(tǒng)計(jì)學(xué)差異。涉及兩個樣本數(shù)據(jù)。前提條件:被比較的兩個樣本彼此獨(dú)立;樣本均來自正態(tài)或近似正態(tài)總體;方差齊性。例如:男生和女生的計(jì)算機(jī)平均成績有顯著差異嗎? 城鎮(zhèn)和農(nóng)村的平均存款金額有顯著差異嗎?.41合并方差與自由度兩總體方差相等(方差齊性)時,=n1+n2-1:兩總體方差不相等(方差不齊)=f

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論