第五章均值比較與檢驗詳解演示文稿_第1頁
第五章均值比較與檢驗詳解演示文稿_第2頁
第五章均值比較與檢驗詳解演示文稿_第3頁
第五章均值比較與檢驗詳解演示文稿_第4頁
第五章均值比較與檢驗詳解演示文稿_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章均值比較與檢驗詳解演示文稿1現(xiàn)在是1頁\一共有48頁\編輯于星期五優(yōu)選第五章均值比較與檢驗2現(xiàn)在是2頁\一共有48頁\編輯于星期五5.1統(tǒng)計推斷與假設檢驗1、參數(shù)檢驗利用樣本數(shù)據(jù)對總體特征的推斷通常有兩種情況:(1)當總體分布已知(如總體為正態(tài)分布)的情況下,對總體包含的參數(shù)進行推斷的問題稱為參數(shù)檢驗;(2)當總體分布未知的情況下,根據(jù)樣本數(shù)據(jù)對總體的分布形式或特征進行推斷,通常采用的統(tǒng)計推斷方法是非參數(shù)檢驗方法。3現(xiàn)在是3頁\一共有48頁\編輯于星期五5.1統(tǒng)計推斷與假設檢驗1、參數(shù)檢驗①均值比較(Means),用于計算指定變量的綜合描述統(tǒng)計量;②單樣本T檢驗(One-SampleTTest),檢驗單個變量的均值與假設檢驗值之間是否存在差異;③獨立樣本T檢驗(IndependentSampleTTest),用于檢驗兩組來自獨立總體的樣本,其獨立總體的均值或中心位置是否一樣;④配對樣本T檢驗(Paired-SampleTTest),用于檢驗兩個相關的樣本是否來自具有相同均值的總體。CompareMeans子菜單4現(xiàn)在是4頁\一共有48頁\編輯于星期五5.1統(tǒng)計推斷與假設檢驗2、假設檢驗的幾個概念(1)統(tǒng)計假設原假設:在很多情況下,我們給出一個統(tǒng)計假設僅僅是為了拒絕它。例如,如果我們要判斷給定的一枚硬幣是否均勻,則我們假設硬幣是均勻的(即p=0.5,其中p是正面出現(xiàn)的概率)類似地,如果我們要判斷一種方法是否優(yōu)于其他的方法,則我們假設兩種方法之間沒有差異。這樣的假設通常稱為零假設或原假設,記為備擇假設:任何不同于零假設的假設都稱為備擇假設。例如,如果零假設是,則備擇假設是。備擇假設記為。

5現(xiàn)在是5頁\一共有48頁\編輯于星期五5.1統(tǒng)計推斷與假設檢驗2、假設檢驗的幾個概念(2)假設檢驗的兩類錯誤第一類錯誤:在假設檢驗中拒絕了本來是正確的零假設,稱為“棄真”錯誤。第二類錯誤:在假設檢驗中沒有拒絕本來是錯誤的零假設,稱為“取偽”錯誤。6現(xiàn)在是6頁\一共有48頁\編輯于星期五5.1統(tǒng)計推斷與假設檢驗2、假設檢驗的幾個概念(3)顯著性水平在作假設檢驗時,我們犯第一類錯誤的最大概率稱為檢驗的顯著性水平。這個概率常記為,通常抽樣前就指定好,這樣得到的結果才不會影響我們的選擇。在實際問題中,顯著性水平可以有多種選擇,但最為普通的是0.05或0.01。例如,如果設計一個決策法則選擇的顯著性水平是0.05(5%),那么在100次中可能有5次機會使我們拒絕本該接受的假設。也就是說,我們大約有95%的把握作出正確的決策。此時,我們說拒絕假設的顯著性水平為0.05,即犯拒絕本應接受的假設這類錯誤的概率是0.05。7現(xiàn)在是7頁\一共有48頁\編輯于星期五5.1統(tǒng)計推斷與假設檢驗2、假設檢驗的幾個概念(4)概率p值p值是當零假設正確時,觀測到的樣本信息出現(xiàn)的概率。如果這個概率很小,以至于幾乎不可能在零假設正確時出現(xiàn)目前的觀測數(shù)據(jù)時,我們就拒絕零假設。p值越小,拒絕零假設的理由就越充分。但怎樣的p值才算“小”呢?通常是與預先設定的顯著性水平值比較,若值為0.05,p值小于0.05則認為該概率值足夠小,應拒絕零假設。8現(xiàn)在是8頁\一共有48頁\編輯于星期五5.1統(tǒng)計推斷與假設檢驗3、假設檢驗的基本步驟第1步給出檢驗問題的原假設;根據(jù)檢驗問題的要求,將需要檢驗的最終結果作為零假設。例如,需要檢驗某學校的高考數(shù)學平均成績是否同往年的平均成績一樣,都為75,由此可做出零假設,第2步選擇檢驗統(tǒng)計量;在統(tǒng)計推斷中,總是通過構造樣本的統(tǒng)計量并計算統(tǒng)計量的概率值進行推斷,一般構造的統(tǒng)計量應服從或近似服從常用的已知分布,例如均值檢驗中最常用的t分布和F分布等。9現(xiàn)在是9頁\一共有48頁\編輯于星期五5.1統(tǒng)計推斷與假設檢驗3、假設檢驗的基本步驟第3步計算檢驗統(tǒng)計量的觀測值及其發(fā)生的概率值;

在給定零假設前提下,計算統(tǒng)計量的觀測值和相應概率p值。概率p值就是在零假設成立時檢驗統(tǒng)計量的觀測值發(fā)生的概率,該概率值間接地給出了樣本值在零假設成立的前提下的概率,對此可以依據(jù)一定的標準來判斷其發(fā)生的概率是否為小概率。第4步在給定顯著性水平條件下,做出統(tǒng)計推斷結果。這里的顯著性水平指的是當假設正確時被拒絕的概率,即棄真概率,一般取0.01或0.05。當檢驗統(tǒng)計量的概率p值小于顯著性水平時,則認為此時拒絕零假設而犯棄真錯誤的概率小于顯著性水平,即低于預先給定的水平,也就是說犯錯誤的概率小到我們能容忍的范圍,這時可以拒絕零假設;反之,如果檢驗統(tǒng)計量的概率p值大于顯著性水平,如果拒絕零假設,犯棄真錯誤的概率大于預先給定的容忍水平,這時不應該拒絕零假設。10現(xiàn)在是10頁\一共有48頁\編輯于星期五主要內容5.1統(tǒng)計推斷與假設檢驗5.2Means過程5.3單樣本T檢驗5.4兩獨立樣本T檢驗5.5兩配對樣本T檢驗11現(xiàn)在是11頁\一共有48頁\編輯于星期五5.2Means過程1、Means過程的主要功能

Means過程即均值過程,其主要功能是分組計算,比較指定變量的描述性統(tǒng)計量包括均值、標準差、總和、觀測量數(shù)、方差等一系列單變量描述性統(tǒng)計量,還可以給出方差分析表和線性檢驗結果。均值過程中系統(tǒng)默認的描述統(tǒng)計量可按分組給出指定變量的均值、標準差、觀測量數(shù)等,對話框中的選項可以給出其他更加豐富的描述統(tǒng)計量。12現(xiàn)在是12頁\一共有48頁\編輯于星期五5.2Means過程2、Means過程的操作界面

選擇待分析的變量。在該選項組中定義分組變量,主要包括以下幾項:IndependentList文本框:選擇分組變量。可定義多層分組變量,每層分組變量中也可以有多個變量;Previous按鈕:選擇前一層的分組變量;Next按鈕:選擇下一層的分組變量。單擊該按鈕,彈出如圖5-2所示的options子對話框。圖5-113現(xiàn)在是13頁\一共有48頁\編輯于星期五5.2Means過程2、Means過程的操作界面

圖5-2Option按鈕Statistics文本框:在該文本框中列出可以選擇的描述性統(tǒng)計量,這些統(tǒng)計量的具體含義同描述性統(tǒng)計分析中的統(tǒng)計量含義一樣。CellStatistics文本框:列出要輸出的統(tǒng)計量。默認輸出Mean(均值)、NumberofCases(觀測量數(shù))和StandardDeviation(標準差);StatisticsforFirstLayer選項組:該選項組定義是否進行分組第一層變量的方差分析(Anovatableandeta)和線性檢驗(Testforlinearity)。14現(xiàn)在是14頁\一共有48頁\編輯于星期五5.2Means過程3、實例分析【例5-1】表5.1是各地區(qū)分性別受教育程度的人口數(shù)量,利用均值過程比較受教育程度是否受性別的影響。

15現(xiàn)在是15頁\一共有48頁\編輯于星期五5.2Means過程3、實例分析第1步數(shù)據(jù)組織;

根據(jù)表5.1生成SPSS數(shù)據(jù)文件,建3個變量:“sex”、“edu”、“num”,數(shù)據(jù)文件的部分數(shù)據(jù)如圖5-3所示。圖5-316現(xiàn)在是16頁\一共有48頁\編輯于星期五5.2Means過程3、實例分析第2步打開主對話框;選擇Analyze→CompareMeans→Means,打開同圖5-1一樣的均值過程主對話框。第3步確定要進行均值比較的變量;在圖5-1的對話框中,從左邊的候選變量列表框中選擇“人口數(shù)量(num)”變量,移入DependentList文本框中,表示對該變量進行均值比較分析。第4步確定分組變量;分組變量可以有幾層,選擇“性別(sex)”變量作為第一層分組變量,將其移入IndependentList文本框中。17現(xiàn)在是17頁\一共有48頁\編輯于星期五5.2Means過程3、實例分析第5步確定輸出的統(tǒng)計量;單擊圖5-1上的Options…按鈕,彈出如圖5-2所示的子對話框,選擇Anovatableandeta復選框,進行方差分析,單擊Continue按鈕,返回主對話框。18現(xiàn)在是18頁\一共有48頁\編輯于星期五5.2Means過程3、實例分析結果分析19現(xiàn)在是19頁\一共有48頁\編輯于星期五5.2Means過程3、實例分析結果分析表5.4是性別的單因素方差分析,在下一章會詳細介紹方差分析,此處不再詳細講述。表中的Sig.值遠大于0.05,說明不同性別受教育的人口數(shù)量沒有顯著性差異。20現(xiàn)在是20頁\一共有48頁\編輯于星期五5.2Means過程3、實例分析結果分析表5.5是人口數(shù)量與性別的相關性度量表。此時的Eta和EtaSquared取值都很小,說明性別和受教育的人口數(shù)量的相關性很差,這也和單因素方差分析表的結論是一致的。21現(xiàn)在是21頁\一共有48頁\編輯于星期五主要內容5.1統(tǒng)計推斷與假設檢驗5.2Means過程5.3單樣本T檢驗5.4兩獨立樣本T檢驗5.5兩配對樣本T檢驗22現(xiàn)在是22頁\一共有48頁\編輯于星期五5.3單樣本T檢驗1、單樣本T檢驗目的和步驟(1)單樣本T檢驗的目的單樣本T檢驗的目的是利用來自某總體的樣本數(shù)據(jù),推斷該總體的均值是否與指定的檢驗值之間存在顯著性差異。它是對總體均值的假設檢驗。例如,從新生的入學成績的抽樣數(shù)據(jù)推斷平均成績是否為75分;在人口普查中,某地區(qū)職工今年的平均收入是否和往年的平均收入有顯著差異。23現(xiàn)在是23頁\一共有48頁\編輯于星期五5.3單樣本T檢驗1、單樣本T檢驗目的和步驟(2)單樣本T檢驗的步驟第1步提出零假設;單樣本T檢驗需要檢驗總體均值與指定的檢驗值是否存在顯著差異。為此,給出檢驗均值為,零假設為:,其中,為總體均值。例如,假設儲戶一次平均存(?。┛罱痤~與2000元無顯著性差異,零假設則為:。24現(xiàn)在是24頁\一共有48頁\編輯于星期五5.3單樣本T檢驗1、單樣本T檢驗目的和步驟(2)單樣本T檢驗的步驟第2步選擇檢驗統(tǒng)計量;單樣本T檢驗的前提是總體服從正態(tài)分布,其中為總體均值,為總體方差。如果樣本容量為n,樣本均值為,則仍服從正態(tài)分布,即:。在零假設成立的條件下,均值檢驗使用t統(tǒng)計量,構造的t統(tǒng)計量為:,其中,用代入,t統(tǒng)計量服從自由度為n-1的t分布,S為樣本標準差。SPSS的操作結果中還顯示均值標準誤差(Std.ErrorMean),計算公式為:,即統(tǒng)計量的分母部分。25現(xiàn)在是25頁\一共有48頁\編輯于星期五5.3單樣本T檢驗1、單樣本T檢驗目的和步驟(2)單樣本T檢驗的步驟第3步計算檢驗統(tǒng)計量的觀測值及其發(fā)生的概率;在給定零假設的前提下,SPSS將檢驗值代入t統(tǒng)計量,得到檢驗統(tǒng)計量觀測值以及根據(jù)t分布的分布函數(shù)計算出概率p值。第4步給定顯著性水平,做出統(tǒng)計推斷。給出顯著性水平,與檢驗統(tǒng)計量的概率p值作比較。當檢驗統(tǒng)計量的概率p值小于顯著性水平時,則拒絕零假設,認為總體均值與要檢驗的之間存在差異;反之,如果檢驗統(tǒng)計量的概率p值大于顯著性水平,則接受零假設,認為總體均值與檢驗值之間無顯著性差異。26現(xiàn)在是26頁\一共有48頁\編輯于星期五5.3單樣本T檢驗2、單樣本T檢驗的操作界面從候選變量框中選擇要進行T檢驗的變量移入此框中,可同時選擇多個變量,此時,SPSS就將分別產(chǎn)生多個變量的T檢驗分析結果。在此框中輸入檢驗值,即檢驗與什么值有無顯著性差異。單擊該按鈕彈出Option對話框,該對話框用于指定置信水平和缺失值的處理方法

圖5-327現(xiàn)在是27頁\一共有48頁\編輯于星期五5.3單樣本T檢驗3、實例分析【例5-2】某生產(chǎn)食鹽的生產(chǎn)線,其生產(chǎn)的袋裝食鹽的標準重量為500g,現(xiàn)隨機抽取10袋,其重量分別為:495,502,508,496,505,499,503,498,505,500。假設數(shù)據(jù)呈正態(tài)分布,請檢驗生產(chǎn)線的工作情況。第1步數(shù)據(jù)組織;首先建立SPSS數(shù)據(jù)文件,只需建立一個變量“Weight”,錄入相應的數(shù)據(jù)即可。28現(xiàn)在是28頁\一共有48頁\編輯于星期五5.3單樣本T檢驗3、實例分析第2步打開主對話框;選擇Analyze→CompareMeans→One-SampleTTest,打開同圖5-3一樣的單樣本T檢驗主對話框。第3步確定要進行T檢驗的變量;在圖5-3所示的對話框中,選擇“Weight”變量作為檢驗變量,移入“TestVariable(s)”框中。第4步輸入要檢驗的值;在圖5-4的對話框中的“Testvalue”中輸入要檢驗的值,本例應輸入500。29現(xiàn)在是29頁\一共有48頁\編輯于星期五5.3單樣本T檢驗3、實例分析結果分析30現(xiàn)在是30頁\一共有48頁\編輯于星期五5.3單樣本T檢驗3、實例分析結果分析表5.7是單樣本T檢驗結果表,第一行的TestValue為檢驗參數(shù)值500,即用于比較的總體均值,下面從左至右依次為檢驗統(tǒng)計量(t)、自由度(df)、雙尾檢測概率P值(Sig.(2-tailed))、樣本均值與和檢驗值的差(MeanDifference)、均值差的95%置信區(qū)間(95%ConfidenceIntervaloftheDifference)。當置信水平為95%時,顯著性水平為0.05,從表5.7中可以看出,雙尾檢測概率P值為0.432,大于0.05,故零假設成立,也就是說抽樣袋裝食鹽的重量與500克無顯著性差異,有理由相信生產(chǎn)線工作狀態(tài)正常。31現(xiàn)在是31頁\一共有48頁\編輯于星期五主要內容5.1統(tǒng)計推斷與假設檢驗5.2Means過程5.3單樣本T檢驗5.4兩獨立樣本T檢驗5.5兩配對樣本T檢驗32現(xiàn)在是32頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗1、兩獨立樣本T檢驗目的和主要步驟(1)兩獨立樣本T檢驗的目的單樣本T檢驗是檢驗樣本均值和總體均值是否有顯著性差異,而兩獨立樣本T檢驗的目的是利用來自某兩個總體的獨立樣本,推斷兩個總體的均值是否存在顯著差異。例如,為比較兩種牧草對奶牛的飼養(yǎng)效果,隨機從奶牛群中選取喂養(yǎng)不同牧草的奶牛各10頭記錄每日平均產(chǎn)奶的量,根據(jù)記錄的數(shù)據(jù)推斷兩種牧草對奶牛飼養(yǎng)的效果有無顯著性差異。33現(xiàn)在是33頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗1、兩獨立樣本T檢驗目的和主要步驟(2)兩獨立樣本T檢驗的主要步驟第1步提出零假設;兩獨立樣本T檢驗需要檢驗兩個總體的均值是否存在顯著性差異。因此,零假設為:,即假設兩樣本均值相等,備擇假設為:,即假設兩樣本均值不等。34現(xiàn)在是34頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗1、兩獨立樣本T檢驗目的和主要步驟(2)兩獨立樣本T檢驗的主要步驟第2步選擇檢驗統(tǒng)計量;

兩獨立樣本T檢驗的前提是兩個獨立的總體分別服從和。在零假設成立的條件下,獨立樣本T檢驗使用t統(tǒng)計量。構造獨立樣本T檢驗的t統(tǒng)計量分為兩種情況。1)當樣本方差相等時,t統(tǒng)計量定義為:其中和分別為兩樣本容量,和分別為兩樣本標準差。該統(tǒng)計量服從自由度為的t分布。35現(xiàn)在是35頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗1、兩獨立樣本T檢驗目的和主要步驟(2)兩獨立樣本T檢驗的主要步驟第2步選擇檢驗統(tǒng)計量;

2)當樣本方差不等時,t統(tǒng)計量定義為:可見,兩獨立樣本T檢驗的結論在很大程度上取決于兩個總體的方差是否相等。這就要求在檢驗兩總體均值是否相等之前,首先應對兩總體方差是否相等進行檢驗,也稱之為方差齊性檢驗。36現(xiàn)在是36頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗1、兩獨立樣本T檢驗目的和主要步驟(2)兩獨立樣本T檢驗的主要步驟第3步計算檢驗統(tǒng)計量的觀測值及其發(fā)生的概率;

在給定零假設的前提下,SPSS將檢驗值0代入t統(tǒng)計量的部分,得到檢驗統(tǒng)計量觀測值以及根據(jù)t分布的分布函數(shù)計算出概率p值。第4步給定顯著性水平,做出統(tǒng)計推斷。給出顯著性水平,與檢驗統(tǒng)計量的概率p值作比較。當檢驗統(tǒng)計量的概率p值小于顯著性水平時,則拒絕零假設,認為兩個總體均值之間存在差異;反之,如果檢驗統(tǒng)計量的概率p值大于顯著性水平,則接受零假設,認為兩個總體均值之間無顯著性差異。37現(xiàn)在是37頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗2、兩獨立樣本T檢驗的操作界面從候選變量框中選擇要進行T檢驗的變量移入此框中,圖5-4選擇分組變量,在選擇變量進入GroupingVariable框后,DefineGroups…按鈕將被激活,單擊該按鈕定義分組信息單擊該按鈕彈出Option對話框,該對話框用于指定置信水平和缺失值的處理方法

38現(xiàn)在是38頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗3、實例分析【例5-3】為比較兩種不同品種的玉米的產(chǎn)量,分別統(tǒng)計了8個地區(qū)的單位面積產(chǎn)量,具體數(shù)據(jù)見表5.8。假定樣本服從正態(tài)分布,且兩組樣本相互獨立,試比較在置信度為95%的情況下,兩種玉米產(chǎn)量是否有顯著性差異。

39現(xiàn)在是39頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗3、實例分析第1步數(shù)據(jù)組織;根據(jù)表5.8,SPSS數(shù)據(jù)文件中建立兩個變量,分別為“品種”、“產(chǎn)量”,變量“品種”的變量值標簽為:a-品種A,b-品種B,錄入數(shù)據(jù)即可。第2步打開主對話框;選擇Analyze→CompareMeans→Independent-Samples,打開同圖5-4一樣的兩獨立樣本T檢驗主對話框。40現(xiàn)在是40頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗3、實例分析第3步確定要進行T檢驗的變量;在圖5-4所示的對話框中,選擇“產(chǎn)量”變量作為檢驗變量,移入“TestVariable(s)”框中。第4步確定分組變量;選擇變量“品種”作為分組變量,將其移入圖5-4中的“Groupingvariable”文本框中,并定義分組的變量值:Group1—a,Group2—b。41現(xiàn)在是41頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗3、實例分析結果分析42現(xiàn)在是42頁\一共有48頁\編輯于星期五5.4兩獨立樣本T檢驗3、實例分析結果分析在方差相等的情況下,兩獨立樣本T檢驗的結果應該看表5.10中的“Equalvariancesassumed”一行,第5列為相應的雙尾檢測概率(Sig.(2-tailed))為0.332,在顯著性水平為0.05的情況下,T統(tǒng)計量的概率p值大于0.05,故不應拒絕零假設,,即認為兩樣本的均值是相等的,在本例中,不能認為兩種玉米品種的產(chǎn)量有顯著性差異。43現(xiàn)在是43頁\一共有48頁\編輯于星期五主要內容5.1統(tǒng)計推斷與假設檢驗5.2Means過程5.3單樣本T檢驗5.4兩獨立樣本T檢驗5.5兩配對樣本T檢驗44現(xiàn)在是44頁\一共有48頁\編輯于星期五5.5兩配對樣本T檢驗1、兩配對樣本T檢驗目的和主要步驟(1)兩配對樣本T檢驗目的兩配對樣本T檢驗的目的是檢驗兩個相關樣本是否來自相同均值的正態(tài)總體,即推斷兩個總體的均值是否存在顯著差異。

配對的概念是指兩個樣本的各樣本值之間存在著對應關系,配對樣本的兩個樣本值之間的配對是一一對應的,并且兩個樣本的容量相同。配對樣本T檢驗與獨立樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論