統計學第六章 假設檢驗課件_第1頁
統計學第六章 假設檢驗課件_第2頁
統計學第六章 假設檢驗課件_第3頁
統計學第六章 假設檢驗課件_第4頁
統計學第六章 假設檢驗課件_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第六章假設檢驗第一節(jié)假設檢驗的基本概念第二節(jié)單個總體參數的假設檢驗第三節(jié)兩個總體參數的假設檢驗第四屆非參數檢驗教學目的與要求:1.掌握假設檢驗的相關概念及思路和步驟;2.掌握單個總體的假設檢驗方法;3.了解兩個總體假設檢驗方法;4.了解非參數檢驗的特點和方法。第一節(jié)假設檢驗概述一、假設檢驗的基本概念(一)、假設檢驗與區(qū)間參數估計的區(qū)別和聯系1、聯系:參數估計和假設檢驗是統計推斷的兩個組成部分,都是利用樣本對總體進行某種推斷。2、區(qū)別:推斷的角度不同,區(qū)間估計是用給定的大概率推斷出總體參數的范圍,而假設檢驗是以小概率為標準,對總體的狀況所做出的假設進行判斷。假設檢驗與區(qū)間估計結合起來,構成完整的統計推斷內容。(二)、假設檢驗的兩大類別:一類是參數假設檢驗,另一類是非參數假設檢驗。本章分別討論這兩類檢驗方法。

二、單側檢驗與雙側檢驗(一)、雙側檢驗α/21–αα/2-Zα/2

Zα/2雙側檢驗雙側檢驗中拒絕域位于正態(tài)分布的兩邊上,對于提出的,只要或二者之中有一個成立,就可以否定原假設,這種假設有兩個拒絕域、兩個臨界值,每個拒絕域的面積為α/2,臨界值為-Zα/2、Zα/2。(二)單側檢驗1、左單側檢驗(下限檢驗)2、右單側檢驗(上限檢驗)

α–Zα0

α0Zα左側檢驗右側檢驗假定:–Zα為臨界值

假定Zα為臨界值(三)、用單側檢驗還是雙側檢驗,使用左側檢驗還是右側檢驗,決定于備選假設中的不等式形式與方向。與“不相等”對應的是雙側檢驗,與“小于”相對應的是左側檢驗,與“大于”相對應的是右側檢驗。三、兩種類型的錯誤

1、決策結果存在四種情形:

接受拒絕真實判斷正確棄真錯誤(第一類錯誤或α錯誤)

不真實取偽錯誤(第二類錯誤或β錯誤)

判斷正確四、檢驗功效1、檢驗功效或檢驗力:在犯第一類錯誤的概率α得到控制的條件下,犯取偽錯誤的概率β也要盡可能地小,或者說,不取偽的概率1-β應盡可能增大。1-β越大,意味著當原假設不真實時,檢驗判斷出原假設不真實的概率越大,檢驗的判別能力就越好;1-β越小,意味著當原假設不真實時,檢驗結論判斷出原假設不真實的概率越小,檢驗的判別能力就越差。可見1-β是反映統計檢驗判別能力大小的重要標志,我們稱之為檢驗功效或檢驗力。2、影響檢驗功效的因素1)、α取值:α大,檢驗功效就大(1-β)2)、要滿足α、β都盡可能的小,只有增加樣本的容量,但樣本容量都是有限的,因此在實際應用中會先控制α

原因如下:五、值 值是指在原假設為真的情況下,得到某一樣本觀察結果或更為極端情形出現的概率。如果值很小,說明小概率事件發(fā)生了,從而有理由拒絕原假設,值愈小則拒絕的理由愈充分。與根據檢驗統計量是否落入拒絕域的方法相比,利用值檢驗要更精確。在前一種方法中,在顯著性水平確定后,拒絕域也就確定了,如果檢驗統計量落入拒絕域,我們犯棄真的錯誤就是,而不管得到這一樣本觀察結果或更為極端情形出現的概率大小,根據這一方法的做出決策對決策錯誤的風險反映不夠。而值在決策風險度量上要更為精確。在應用中,通常先確定一個顯著性水平,然后用值與比較,在雙側檢驗中,時拒絕原假設,在單側檢驗中,

時拒絕原假設。1.建立假設

1)、原假設(nullhypothesis):需要通過樣本去推斷其正確與否的命題稱為原假設。用表示,即:2)、備選假設(alternativehypothesis):與原假設對立的是假設,備選假設是在原假設被否定時另一種可能成立的結論。備選假設比原假設還重要,這要由實際問題來確定,一般把期望出現的結論作為備選假設。用表示,備選假設與原假設相對立,原假設成立,則備選假設不真實,如原假設不真實,則備選假設成立。關于均值,原假設與備選假設有三種情況:

雙側檢驗左側檢驗右側檢驗2、確定適當的檢驗統計量確定適當的統計量,且能在原假設成立的條件下知其分布。一般來說,檢驗統計量的基本形式可表示如下:

3、選擇顯著性水平和否定域被我們事先選定的可以犯第一類錯誤的概率,叫做檢驗的顯著性水平(用α表示),它決定了否定域的大小。因此,有人也把第一類錯誤稱之α錯誤。相應地第二類錯誤被人稱為錯誤。在原假設成立的條件下,統計檢驗中所規(guī)定的小概率標準一般取為α=0.05或α=0.01。由α所決定的否定域與接受域之間的分界值被稱為臨界值,如Zα。4.計算檢驗統計量

在完成了上述工作之后,接下來就是做一次與理想試驗盡量相同的實際抽樣(比如實際做一次重復拋擲硬幣的試驗),并從獲取的樣本資料算出檢驗統計量。根據顯著性水平確定統計量的否定域或臨界值,并注意是單側檢驗還是雙側檢驗。5.判定

假設檢驗系指拒絕或保留原假設的判斷,又稱顯著性檢驗。在選擇否定域并計算檢驗統計量之后,我們完成最后一道手續(xù),即根據計算結果決定假設的取與舍。如果結果落在否定域內,我們將在已知犯第一類錯誤概率的條件下,否定零假設。反之,如果結果落在否定域外,則不否定零假設,與此同時,我們就有了犯第二類錯誤的危險。

第二節(jié)單個總體參數的假設檢驗

一、總體均值檢驗1、提出原假設和備選假設(有三種情況)雙側檢驗左側檢驗右側檢驗2、確定統計量3、確定顯著性水平及拒絕域

(一)、總體σ已知,對總體均值的檢驗1)、確定顯著性水平α

2)、雙側檢驗時,拒絕域為Z<-Zα/2或Z>Zα/2,即在

Z<-Zα/2或Z>Zα/2時拒絕原假設,接受備選假設,反

之接受原假設,拒絕備選假設。如Z=Zα/2或Z=-Zα/2

為了慎重,一般先不下結論,應再進行一次抽檢。

3)、單側檢驗時,左單側檢驗時,拒絕域為Z<–Zα,即

Z<–Zα時拒絕原假設,接受備選假設;右單側檢驗

時,拒絕域為Z>Zα,即Z>Zα時,拒絕原假設,接

受備選假設

4、計算統計量z的值

5、根據統計量的值與臨界值的關系,進行判定是接受原假設還是拒絕備選假設(二)、總體σ未知,對總體均值的檢驗總體方差未知時,可用樣本標準差與方差代替它們,檢驗統計量應改為自由度為N-1的T分布,即:稱為t-檢驗統計量,這個檢驗統計量適用于小樣本情況,在大樣本場合,t統計量與標準正態(tài)分布統計量近似,通常用z檢驗代替t檢驗。另T檢驗的步驟與z檢驗的步驟相同。1、提出原假設和備選假設(有三種情況)雙側檢驗左側檢驗右側檢驗2、確定統計量3、確定顯著性水平及拒絕域

1)、確定顯著性水平α2)、雙側檢驗時,拒絕域為t<-tα/2或t>tα/2,即在t<-tα/2或t>tα/2時拒絕原假設,接受備選假設,反之接受原假設,拒絕備選假設。3)、單側檢驗時,左單側檢驗時,拒絕域為t<–tα,即t<–tα時拒絕原假設,接受備選假設;右單側檢驗時,拒絕域為t>tα,即t>tα時,拒絕原假設,接受備選假設

二、總體成數的檢驗當樣本容量較大時,下列統計量服從標準正態(tài)分布:

上式中,ρ代表總體的成數,p代表樣本的成數。以上的z統計量可以用作總體成數檢驗的檢驗統計量。檢驗的步驟和總體均值的檢驗步驟相同。練習:一項調查結果表明某市老年人口比重為14.7%,該市老年人口研究會為了檢驗該項調查是否可靠,隨機抽選了400名居民,發(fā)現其中有57人年齡在65歲以上,調查結果是否支持該市老年人口比重為14.7%的看法?(顯著性水平為0.05)三、p-值檢驗1、定義:p-值檢驗就是通過計算p-值,再將它與顯著性水平α作比較,決定拒絕還是接受原假設。所謂p-值就是拒絕原假設所需的最低顯著性水平。2、p-值判斷的原則是:如果p-值小于給定的顯著性水平α,則拒絕原假設;否則,接受原假設?;蛘撸庇^來說就是:如果p-值很小,拒絕原假設,p-值很大,接受原假設。請大家注意的是這里的p-值是指概率,不要與成數指標相混淆。四、總體方差檢驗原假設為:

或或1.總體均值未知時假設~,但總體均值未知,此時可用樣本方差與的比來構造檢驗統計量,在原假設為真時,統計量表達式為:~

當采用雙側檢驗時,若或則拒絕,反之接受;當進行右側檢驗時,時拒絕,反之接受;當進行左側檢驗時,時拒絕,反之接受。2、總體均值已知時假設~,則從總體中抽得的樣本滿足~在原假設為真時,可以構造統計量:~進而可以確定拒絕域。當采用雙側檢驗時,或時拒絕,反之接受;當進行右側檢驗時,時拒絕,反之接受;當進行左側檢驗時,時拒絕,反之接受。第三節(jié)兩個總體參數假設檢驗一、兩個總體均值之差的檢驗原假設(或)1.已知時由于~,~,且相互獨立,所以有:~~

所以可用Z檢驗統計量來檢驗原假設成立與否。2.未知時 當未知但樣本量較大時,依然可以使用Z統計量進行檢驗,此時總體分別用樣本方差代替,公式如下:~

當未知且樣本量較小時,則不能用代替的統計量來檢驗,此時需要使用t統計量。更具體了又可以分為兩種情況,一種是根據以往的大量經驗或者事先通過檢驗知道有,另一種是不相等或無法判斷它們是否相等。我們先討論第一種情況,此時可以得到的標準差的估計,,其中,于是可以構造檢驗統計量~

對于第二種情況,需要用來估計,可以得到,我們仍然通過構造t統計量來進行檢驗~

其中,

注意,此時統計量的自由度已不再是,而是近似服從自由度為的分布。二、兩個總體比例之差的檢驗

實際中經常要檢驗兩個總體中具有某一特征單位數的比例之差是否滿足某一條件。此時需要用到兩個總體比例之差的檢驗。設兩個總體都服從二項分布,兩個總體中具有某一特征單位數的比例分別為。從兩個總體中分別抽出樣本容量為的兩個樣本,樣本比例分別用表示。1.檢驗兩個總體比例之差為零的假設設所要檢驗的問題的原假設為:(或、)在原假設成立時,可以得到兩個樣本合并后得到的比例估計量,其中分別表示兩個樣本中具有該特征的單位數。在大樣本條件下,可以構造統計量進行檢驗~2.檢驗兩個總體比例之差不為零的假設設所要檢驗的問題的原假設為(或、)其中為不等于零的常數。在大樣本條件下,依舊構造Z統計量進行檢驗,但此時Z統計量的形式稍有變化。

~三、兩個總體方差比的檢驗兩總體方差是否相等的檢驗又稱為方差齊性檢驗。實際中常常需要對兩個總體方差是否相等進行檢驗,比如比較兩種資產的波動,比較生產工藝的穩(wěn)定性,等等。在前面介紹的方差未知且小樣本的兩總體均值之差檢驗中,曾假定兩總體的方差相等或不相等。而實際中往往需要通過方差齊性檢驗才能知道兩總體的方差是否相等。四、配對樣本的檢驗在實際中,經常會碰到檢驗兩個相關樣本或配對樣本的平均數間是否有顯著差異的問題,比如檢驗一組肥胖者參加減肥訓練班后體重是否有明顯的變化,車間工人在培訓前后生產效率是否有明顯的差異,等等。對于這類兩個樣本之間存在相關性的問題,采用匹配樣本的檢驗,可以提高效率。這里通過一個例子介紹配對樣本的均值之差的檢驗[例6-13]某工廠為工人組織了一次技術培訓,為檢驗這次培訓是否有效果,隨機抽取了10名工人進行調查,測得他們的培訓前后每小時平均生產零件數,如表6-2所示。第三節(jié)非參數檢驗非參數檢驗是對總體的分布不作任何限制的統計檢驗。故非參數檢驗又稱為自由分布檢驗。非參數檢驗,無需做出經典統計所必要的關于分布的任何假設。唯一需要的假設是:全部數據或數據對都出自相同的基本總體,且取樣是隨機的、相互獨立的。基于這種原因,非參數檢驗又稱為分布自由(或無分布)檢驗?!盁o分布”不是指總體真的無分布,而是指雖有時對總體分布一無所知,但仍可以進行分析。不僅如此,這些很容易理解的方法還可以用于處理等級的資料和定性的信息。正因為如此,非參數檢驗成為管理科學中應用較為廣泛的一種統計檢驗方法。

一、自由分布檢驗概述1、自由分布檢驗概念:又稱為非參數檢驗,對總體分布未加限制的檢驗。2、自由分布檢驗對比參數檢驗,具有以下優(yōu)點:首先,檢驗條件比較寬松,適應性強。其次,自由分布檢驗的方法比較靈活,用途廣泛。對于那些不能進行加、減、乘、除運算的定類數據與定序數據,可使用符號檢驗、秩和檢驗等方法進行檢驗。再次,自由分布檢驗的計算相對簡單。由于自由分布的檢驗方法不用復雜計算,一般使用計數方法就可以了,它的計數過程與結果都比較簡單、直觀與明顯。3、自由分布檢驗缺點由于它對原始數據中包含的信息利用得不夠充分,檢驗的功效相對較弱。當總體的分布形式已知時,基于這種分布類型的參數方法,一般說來比非參數方法為佳。例如,對于一批資料,可同時適用于參數的t-檢驗、非參數的符秩檢驗和符號檢驗。其檢驗功效是,t-檢驗的最好,符秩檢驗次之,符號檢驗最差。這主要是由于符號檢驗對信息的利用最不充分。二、符號檢驗(最簡單的檢驗)該方法是建立在以正、負號表示樣本數據與假設參數值差異關系基礎上的,因此稱之為符號檢驗。該方法既適用于單樣本場合,也適用于配對樣本場合。(一)單樣本場合的符號檢驗中位數檢驗::=A樣本每個數據都減去A,只記錄其差數的符號。n+與n-分別是正、負符號的個數,當原假設為真是時,n+與n-應該很接近;若兩者相差太遠,就有有理由拒絕原假設。例4:設有20個工人,他們一天生產的產品件數,抽樣結果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170。試以α=0.10的檢驗水平,判定總體中位數是否是160。解:第一步:作出假設。:=160,:160由備選假設知,這個檢驗是雙側的。第二步:計數。對樣本數據,大于160的記下“+”,小于160的記下“-”,等于160的,予以剔除(以0記之),結果如下:++0+++--+++-++0+++++計數以上“+”的個數是n+=15,“-”的個數n-=3,剔除數據2個。最后有效的樣本個數為n=n++n-=18。第三步:確定拒絕域。顯著水平α=0.10,由于進行雙側檢驗,拒絕域分布在兩邊,每側概率α/2=0.05,查二項分布臨界值表,得到拒絕域的臨界值是13。第四步:選擇n+、n-較大者,再與臨界值比較。結果是15>13。第五步:判斷。由于上一步的比較結果可知,樣本落入拒絕域,所以拒絕原假設,認為樣本數據不能證明總體中位數等于160件。(二)配對樣本場合的符號檢驗樣本配對場合與單樣本場合的符號檢驗,基本原理是一致的。設從兩個總體中分別抽出一個容量相等的樣本,然后將兩樣本的數據進行一一配對,得到一組配對值。再將各對配對值相減,記錄下差數的符號,計算出“+”的個數n+與“-”的個數n-。如果兩個樣本的總體差異不顯著,配對值之差的正負號出現的概率各是1/2,則n+與n-應當非常接近;如果n+、n-相差太大的話,說明兩總體存在顯著差異。例子見書上的。三、秩和檢驗秩和檢驗也稱Wilcoxon-Man-Whitney檢驗。該檢驗方法可用于檢驗兩個獨立的樣本是否來自同一個總體,或判斷總體間是否存在顯著性的差異。它和符號檢驗最主要的區(qū)別是,符號檢驗只考慮樣本間差數的符號,而秩和檢驗還要考慮差數的順序,比符號檢驗利用數據信息更加充分,因此,檢驗功效就更強。秩和檢驗原理:1、設分別從兩個未知的總體獨立、隨機地抽取容量為n1和n2的樣本,把樣本容量較小的總體稱為總體Ⅰ。如果兩樣本容量相等,就把任意一個總體稱作總體Ⅰ,另一個總體稱作總體Ⅱ,這里不妨設n1<n2。2、現將兩個樣本混合起來,并按數據的大小,從小到大排列編號,每個數值的編號就是它的秩次。如果混合樣本中有若干個相同的數值,則把它們的秩次進行簡單算術平均,用此平均值作為這些數值的秩次,計算來自總體Ⅰ的n1個數據在混合樣本中的秩次之和,記為T。3、顯然T最小的可能值是:T1=1+2+3+…+n1=[n1(n1+1)]/2;最大的可能值是T2=(n2+1)+(n2+2)+…+(n2+n1)=n1[(n2+1)+(n2+n1)]/2。如果兩個總體分布無顯著差異,則T值不應太大或太小,等于中間值(T1+T2)/2;如果總體Ⅰ分布于總體Ⅱ的右邊,T將接近其最大值T2;如果總體Ⅰ位于總體Ⅱ的左邊,T將接近于它的最小值T1。因此,我們可以用秩和T作為檢驗的統計量。4、第一種方法,當n1和n2都不超過10時,查“秩和檢驗表”確定臨界值;第二種方法,當n1和n2都超過10時,秩和T服從正態(tài)分布:先對T進行標準化變換,再利用標準正態(tài)分布表,確定檢驗的臨界值。練習:有A、B兩家廠商供應同一種商品,兩家商品價格與性能一致,但使用壽命是否一致有待檢驗。今分別從兩家生產產品中抽出樣本,測定產品使用壽命(見下表,單位:小時):試以0.05的顯著性水平,檢驗兩廠商產品壽命是否有差異?解:第一步:作出假設。H0:MA=MB,H1:原假設是兩廠商生產的產品沒有差異,平均壽命相同,備選假設是平均壽命不相同,是雙側檢驗。第二步:求秩和。將樣本混合、排列:以上數據下面劃橫線的為B廠商產品壽命。B廠商產品樣本容量小,看做總體Ⅰ,n1=5。A廠商產品是總體Ⅱ,n2=6??傮wⅠ的秩和T

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論