第08章 假設檢驗_第1頁
第08章 假設檢驗_第2頁
第08章 假設檢驗_第3頁
第08章 假設檢驗_第4頁
第08章 假設檢驗_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第八章

假設檢驗授課教師:程曉謨主要內容★1假設檢驗的基本概念2單樣本t檢驗3兩個獨立樣本t檢驗4配對樣本t檢驗5采用概率P值判斷原假設是否成立6用SPSS作均值假設檢驗第一節(jié)

假設檢驗的基本問題什么是假設?

(hypothesis)對總體參數的數值所作的一種推斷??傮w參數包括總體均值、比例、方差等;分析之前必須先給出參數的估計值。我認為該地區(qū)新生嬰兒的平均體重為3190克!什么是假設檢驗?

(hypothesistesting)事先對總體參數或分布形式作出某種假設,然后利用樣本信息來判斷原假設是否成立;有參數假設檢驗和非參數假設檢驗;采用邏輯上的反證法,依據統(tǒng)計上的小概率原理。假設檢驗中的小概率原理什么是小概率?在一次試驗中,一個幾乎不可能發(fā)生事件的發(fā)生概率;假如概率很小的隨機事件,在一次實驗中竟然發(fā)生了,則認為原假設不正確;小概率由研究者事先確定。小概率事件據統(tǒng)計,校園內受傷的概率是1/3;行車遭遇車禍(指道路)的概率是1/12;在家中受傷的概率是1/80;家中成員死于突發(fā)事件的概率是1/1000;死于道路交通車禍(乘坐車輛)的概率是1/5000;行人被汽車撞死的概率是1/40000;死于火災的概率是1/50000;溺水而死的概率是1/50000;因中毒而死(不含自殺)的概率是1/86000;騎自行車死于車禍的概率是1/130000;吃東西被噎死的概率是1/160000;死于飛機失事的概率是1/2500000;被凍死、熱死的概率是1/1500000;被動物咬死的概率是1/2000000;被龍卷風刮走摔死的概率是1/2000000。 數據來源“中國教育報”總體假設檢驗的過程抽取隨機樣本均值

X=20我認為人口的平均年齡是50歲提出假設

拒絕假設!

別無選擇.作出決策假設檢驗的步驟提出原假設和備擇假設

什么是原假設?(nullhypothesis)待檢驗的假設,又稱“零假設”研究者想收集證據予以反對的假設總是有等號,或表示為H0H0:

某一數值例如,H0:

3190(克)什么是備擇假設?(alternativehypothesis)與原假設對立的假設,也稱“研究假設”研究者想收集證據予以支持的假設總是有不等號:

,

或表示為H1H1:

<某一數值,或某一數值例如,H1:

<3910(克),或3910(克)提出原假設和備擇假設

什么是檢驗統(tǒng)計量?用于假設檢驗決策的統(tǒng)計量選擇統(tǒng)計量的方法與參數估計相同,需考慮是大樣本還是小樣本總體方差已知還是未知檢驗統(tǒng)計量的基本形式為:確定適當的檢驗統(tǒng)計量規(guī)定顯著性水平

(significantlevel)

什么是顯著性水平?是一個概率值;原假設為真時,拒絕原假設的概率;被稱為抽樣分布的拒絕域表示為(alpha);常用的值有0.01,0.05,0.10由研究者事先確定;作出統(tǒng)計決策計算檢驗的統(tǒng)計量;按P{當H0為真拒絕H0}≤求出拒絕域;將檢驗統(tǒng)計量的值與水平的臨界值進行比較;得出接受或拒絕原假設的結論;假設檢驗中的兩類錯誤第一類錯誤(棄真錯誤)原假設為真時拒絕原假設第一類錯誤的概率為P{拒絕H0∣H0為真}=被稱為顯著性水平第二類錯誤(取偽錯誤)原假設為假時接受原假設第二類錯誤的概率為P{接受H0∣H0為假}=

錯誤和錯誤的關系n一定時,你不能同時減少兩類錯誤!和的關系就像翹翹板,小就大,大就小雙尾檢驗和單尾檢驗雙尾檢驗(Two-Tailedtest)H0:μ=μ0;H1:μ≠μ0(即μ>μ0或μ<μ0);單尾檢驗(One-Tailedtest)左邊檢驗:H0:μ≥μ0H1:μ<μ0右邊檢驗:H0:μ≤μ0H1:μ>μ0雙尾檢驗的拒絕域

(RejectionRegions)抽樣分布H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域1-置信水平雙尾檢驗

(顯著性水平與拒絕域)H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平統(tǒng)計量的值雙尾檢驗

(顯著性水平與拒絕域)H0值臨界值臨界值

a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平統(tǒng)計量的值雙尾檢驗

(顯著性水平與拒絕域)H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域抽樣分布1-置信水平統(tǒng)計量的值單尾檢驗

(左邊檢驗的拒絕域)H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平左邊檢驗

(顯著性水平與拒絕域)H0值a抽樣分布1-置信水平觀察到的樣本統(tǒng)計量拒絕域臨界值樣本統(tǒng)計量左邊檢驗

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量右邊檢驗

(顯著性水平與拒絕域)H0值a抽樣分布1-置信水平觀察到的樣本統(tǒng)計量拒絕域臨界值樣本統(tǒng)計量右邊檢驗

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計量抽樣分布1-置信水平拒絕域觀察到的樣本統(tǒng)計量第二節(jié)

一個正態(tài)總體下的

參數假設檢驗總體均值μ的檢驗

(2

已知)假定條件總體服從正態(tài)分布若不服從正態(tài)分布,可用正態(tài)分布來近似(n30)使用Z統(tǒng)計量2

已知:總體均值μ的檢驗

(2未知)假定條件總體為正態(tài)分布正態(tài)分布,2未知,且小樣本使用t

統(tǒng)計量2

已知,檢驗假設:μ=μ0觀察檢驗統(tǒng)計量~N(0,1)若原假設成立

值應該較小這個數值是多大?如果值很大,超過某一數值,則懷疑原假設的真實。假設時,拒絕H0如果H0是正確的,要使棄真的概率很小即a/2a/2

拒絕域拒絕域1-置信水平Z根據一個樣本計算即的值如果發(fā)現說明在一次觀察中,統(tǒng)計量Z就落入拒絕域而這是個小概率事件,在一次試驗中幾乎不可能發(fā)生,這樣的結果是在原假設的基礎上推導出來,因此有理由懷疑原假設的正確性。如果發(fā)現則接受原假設2

已知,檢驗假設:μ=μ0

(例題)【例】已知生產線上生產出來的零件直徑服從正態(tài)分布,已知方差為0.09,通過抽取一批樣本n=4,得到為10.01mm,現在假設H0:均值μ=10mm,試判斷假設正確與否?(α=0.05)解:統(tǒng)計量接受H02

未知,檢驗假設:μ=μ0

(更符合統(tǒng)計實際需要)檢驗統(tǒng)計量具體檢驗思路與σ2已知相同SPSS軟件主要完成這種情況下的均值假設檢驗拒絕域2

未知,單邊假設檢驗左邊檢驗H0:μ≥μ0;H1:μ<μ0拒絕域:右邊檢驗H0:μ≤μ0;H1:μ>μ0拒絕域:單尾檢驗

(原假設與備擇假設的確定)將研究者想收集證據予以支持的假設作為備擇假設H1例如,一個研究者總是想證明自己的研究結論是正確的一個銷售商總是想證明供貨商的說法是不正確的備擇假設的方向與想要證明其正確性的方向一致將研究者想收集證據證明其不正確的假設作為原假設H0先確立備擇假設H1單尾檢驗

(原假設與備擇假設的確定)一項研究表明,采用新技術生產后,將會使產品的使用壽命明顯延長到1500小時以上。檢驗這一結論是否成立。研究者總是想證明自己的研究結論(壽命延長)是正確的備擇假設的方向為“>”(壽命延長)建立的原假設與備擇假設應為

H0:

1500H1:

1500單側檢驗

(原假設與備擇假設的確定)一項研究表明,改進生產工藝后,會使產品的廢品率降低到2%以下。檢驗這一結論是否成立。研究者總是想證明自己的研究結論(廢品率降低)是正確的備擇假設的方向為“<”(廢品率降低)建立的原假設與備擇假設應為

H0:2%H1:

<2%用概率P值判斷原假設成立與否

(重點內容)雙尾檢驗的P值P值是如果原假設為真,抽樣分布中大于或小于樣本統(tǒng)計量的概率。單尾檢驗的P值左邊檢驗時,P值為曲線上方小于等于檢驗統(tǒng)計量部分的面積;右邊檢驗時,P值為曲線上方大于等于檢驗統(tǒng)計量部分的面積。雙尾檢驗的P值/

2/

2t拒絕拒絕H0值臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值t統(tǒng)計量落入拒絕域等價于:P值<α雙尾檢驗的P值/

2/

2tH0值臨界值計算出的樣本統(tǒng)計量臨界值t統(tǒng)計量落入接受域等價于:P值>α左邊檢驗的P

值H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布1-置信水平計算出的樣本統(tǒng)計量P值t統(tǒng)計量落入拒絕域等價于:P值<α右邊檢驗的P

值H0值臨界值a拒絕域抽樣分布1-置信水平計算出的樣本統(tǒng)計量P值t統(tǒng)計量落入拒絕域等價于:P值<α利用P值進行檢驗

(決策準則)雙尾檢驗若p值>

,

不能拒絕H0若p值<,拒絕H0單尾檢驗若p值>

,不能拒絕H0若p值<,拒絕H0關于正態(tài)總體方差2

的檢驗未知均值μ,檢驗總體方差σ2=σ02檢驗統(tǒng)計量c2拒絕域或未知均值μ,檢驗總體方差σ2>σ02檢驗統(tǒng)計量c2H0:拒絕域第三節(jié)

兩個正態(tài)總體下的

參數假設檢驗適用條件μ1和μ2是否相等方差齊性檢驗未知總體均值μ1,μ2H1:H0:檢驗統(tǒng)計量拒絕域或兩個總體方差的F

檢驗

(臨界值)0不能拒絕H0F拒絕H0a/2a/2拒絕H0兩個總體均值是否相等的檢驗

(12、22

未知但相等)H0:μ1=μ2拒絕域統(tǒng)計檢驗量兩個總體均值是否相等的檢驗

(12、22

未知且不相等)H0:μ1=μ2統(tǒng)計檢驗量~t(f)大樣本下兩個任意總體

的均值檢驗大樣本下兩個任意總體

均值檢驗問題在大樣本下12、22

已知的情況下,檢驗統(tǒng)計量為:近似服從12、22

未知的情況下,檢驗統(tǒng)計量為:大樣本下兩個0-1總體的

比例值檢驗問題原假設:p1-p2=0檢驗統(tǒng)計量為:原假設:p1-p2=0p1=p2=p檢驗統(tǒng)計量變成如何得到p的值?r1,r2是具有某性質的樣本數第四節(jié)

用SPSS作假設檢驗單樣本T檢驗

(One-SampleTTest)使用“Analyze→CompareMeans→One-SampleTTest”模塊數據文件:

CH6參檢1小學生400米v提高.savH0:該市五年級學生的400米成績仍為100秒;H1:該市五年級學生的400米成績不為100秒;輸入你所假設的均值輸入置信水平1-a計算所涉及的變量存在缺失值,則剔除在該變量上存在缺失值的個案。剔除在所有任意變量上存在缺失值的個案后再分析。Std.ErrorMean=Std.Deviation/=38.82007/=5.01165MeanDifference=Mean-100=5.38500t=MeanDifference/Std.ErrorMean=5.38500/5.01165=1.074df=N-1=60-1=59Sig.(2-tailed)=(1-CDF.T(1.074,59))*295%ConfidenceIntervaloftheDifference是95%的置信區(qū)間如何判斷原假設成立?1.074<t0.025=2.000.287>0.05(-4.6433,15.4133)不能拒絕原假設!再看一個類似的例子使用數據文件:CH6參檢1小學生400米v提高B.sav再次執(zhí)行單樣本T檢驗均值101.4017似乎和100差距較小,但sig值要小于0.05,拒絕H0,反而認為跑步的成績明顯下降了。相互獨立的兩組樣本的T檢驗使用“Analyze→CompareMeans→Independent-SampleTTest”模塊數據文件:教材:例8.11

經常食用谷類者

非經常使用谷類者午餐平均大卡攝入量是否存在差異一定要注意數據的組織形式!要求兩組樣本數據存放在一個SPSS變量中。還需要定義一個存放總體區(qū)分標志的變量。選入待檢驗的變量選入分組變量“1”輸入Group1,“0”輸入Group2注意與分類變量的編碼對應若分組變量為連續(xù)變量,輸入分界值置信水平1-a首先方差齊性檢驗,SPSS用LeveneF方法實現統(tǒng)計量F的值為0.207,介于[F0.975(14,19),F0.025(14,19)]即(0.30,2.65),沒有落入拒絕域,同時sig值(即概率P值)為0.652>0.05,因此不能拒絕原假設,認為兩個總體的方差相等。兩個總體方差相等,選擇“Equalvariancesassumed”這一行的數據來判斷。其中df自由度為n1+n2-2=33,MeanDifference為均值差異=583.00-629.25t=-2.413>t0.025(33)=-2.035,落入拒絕域中,拒絕原假設;Sig值為0.022<0.05,拒絕原假設;

95%的置信區(qū)間在“0”點右側,說明總體1的均值顯著小于總體2的均值。數據支持研究者的結論,即早餐食用較多的谷類食物有助于減少午餐中熱量的攝取。配對樣本的T檢驗何為配對樣本?個案在“前”、“后”兩種狀態(tài)下某屬性的兩種狀態(tài);對某事物兩個不同側面或方面的描述;兩個樣本是相互關聯的,不是相互獨立的;兩個樣本的順序不可顛倒;兩組樣本的樣本量必須相同。配對樣本的T檢驗使用“Analyze→CompareMeans→Paired-SampleTTest”模塊數據文件:

教材P235例8.15

H0:訓練前和訓練后的體重沒有顯著差異(μ1=μ2)H1:訓練前和訓練后的體重有顯著差異(μ1≠μ2)配對樣本t檢驗的數據組織用兩個變量分別存放數據同時選中兩個變量數據正態(tài)分布檢驗SPSS數據正態(tài)分布檢驗方法“Analyze”→“NonParametricTests”→“LegacyDialogs”→“1-SampleK-S”方法一“Analyze”→“DescriptiveStatistics”→“Explore”→“Plot”方法二方法一:K-S檢驗K-S檢驗思路首先,H0:樣本來自的總體服從正態(tài)分布;在該假設前提下,計算各樣本觀測值在理論分布(正態(tài)分布)中出現的理論累計概率值F(x);其次,計算各樣本觀測值的實際累計概率值S(x),以及實際累計概率值與理論累計概率值的差D(x);最后,計算差值序列中的最大絕對值,即D=max(|S(xi)-F(xi)|),為使差值序列均勻,D修正為D=max[max(|S(xi)-F(xi)|)max(|S(xi-1)-F(x

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論