第五章 顯著性檢驗_第1頁
第五章 顯著性檢驗_第2頁
第五章 顯著性檢驗_第3頁
第五章 顯著性檢驗_第4頁
第五章 顯著性檢驗_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章顯著性檢驗

本章要點顯著性檢驗配對設計非配對設計第一節(jié)抽樣分布

研究總體與從中抽取的樣本之間的關系是統(tǒng)計學的中心內容。對這種關系的研究可從兩方面著手,一是從總體到樣本,這就是研究抽樣分布(samplingdistribution)的問題;二是從樣本到總體,這就是統(tǒng)計推斷(statisticalinference)問題。根據(jù)研究目的確定的研究對象的全體稱為總體中的一個研究單位稱為總體的一部分稱為含有有限個個體的總體稱為包含有無限多個個體的總體叫一、總體與樣本總體(population)個體(individual)樣本(sample)有限總體無限總體統(tǒng)計量——樣本單元標志值的函數(shù)稱為統(tǒng)計量二、統(tǒng)計量與抽樣分布

統(tǒng)計推斷是以總體分布和樣本抽樣分布的理論關系為基礎的。為了能正確地利用樣本去推斷總體,并能正確地理解統(tǒng)計推斷的結論,須對樣本的抽樣分布有所了解。由總體中隨機地抽取若干個體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計量(如,S)也將隨樣本的不同而有所不同,因而樣本統(tǒng)計量也是隨機變量,也有其概率分布。我們把統(tǒng)計量的概率分布稱為抽樣分布。常用統(tǒng)計量

其平均數(shù)和標準差分別記為和。是樣本平均數(shù)抽樣總體的標準差,簡稱標準誤(standarderror),它表示平均數(shù)抽樣誤差的大小。統(tǒng)計學上已證明該總體的兩個參數(shù)與x

總體的兩個參數(shù)有如下關系:

=μ,1.若隨機變量x服從正態(tài)分布N(μσ2);、、…、,是由x總體得來的隨機樣本,則統(tǒng)計量=Σx/n的概率分布也是正態(tài)分布,且有=μ,,即服從正態(tài)分布N(μ,σ2/n)。

2.若隨機變量x服從平均數(shù)是μ,方差是σ2的分布(不是正態(tài)分布);,,…,是由此總體得來的隨機樣本,則統(tǒng)計量=Σx/n的概率分布,當n相當大時逼近正態(tài)分布N(μ,σ2/n)。這就是中心極限定理。

中心極限定理告訴我們:不論x變量是連續(xù)型還是離散型,也無論x服從何種分布,一般只要n>30,就可認為的分布是正態(tài)的。若x的分布不很偏倚,在n>20時,的分布就近似于正態(tài)分布了。

標準誤(平均數(shù)抽樣總體的標準差)的大小反映樣本平均數(shù)的抽樣誤差的大小,即精確性的高低。標準誤大,說明各樣本平均數(shù)間差異程度大,樣本平均數(shù)的精確性低。反之,小,說明間的差異程度小,樣本平均數(shù)的精確性高。的大小與原總體的標準差σ成正比,與樣本含量n的平方根成反比。從某特定總體抽樣,因為σ是一常數(shù),所以只有增大樣本含量才能降低樣本平均數(shù)的抽樣誤差。

標準誤

在實際工作中,總體標準差σ往往是未知的,因而無法求得。此時,可用樣本標準差S估計σ。于是,以估計。記為稱作樣本標準誤或均數(shù)標準誤。樣本標準誤是平均數(shù)抽樣誤差的估計值。若樣本中各觀測值為,,…,,則

(5-9)

注意,樣本標準差與樣本標準誤是既有聯(lián)系又有區(qū)別的兩個統(tǒng)計量,(5—9)式已表明了二者的聯(lián)系。二者的區(qū)別在于:樣本標準差S是反映樣本中各觀測值,,…,變異程度大小的一個指標,它的大小說明了對該樣本代表性的強弱。樣本標準誤是樣本平均數(shù)的標準差,它是抽樣誤差的估計值,其大小說明了樣本間變異程度的大小及精確性的高低。三、u統(tǒng)計量U統(tǒng)計量是基于標準正態(tài)分布由樣本構造出的統(tǒng)計量。設有,其數(shù)學期望和方差分別為μ

和σ2

。從該總體中等概率重復抽取樣本x1,x2

,…,xn,樣本平均數(shù)與標準差分別為與S。如果遵從正態(tài)分布,并且σ2

已知,那么統(tǒng)計量遵從標準正態(tài)分布如果n充分大,那么統(tǒng)計量近似遵從標準正態(tài)分布四、

t

分布與t統(tǒng)計量

由樣本平均數(shù)抽樣分布的性質知道:若x~N(μ,σ2),則~N(μ,σ2/n)。將隨機變量標準化得:,則u~N(0,1)。當總體標準差σ未知時,以樣本標準差S代替σ所得到的統(tǒng)計量記為t。在計算時,由于采用S來代替σ,使得t

變量不再服從標準正態(tài)分布,而是服從t分布(t-distribution)。它的概率分布密度函數(shù)如下:

t分布特點是:

1、t分布受自由度的制約,每一個自由度都有一條t分布密度曲線。

2、t分布密度曲線以縱軸為對稱軸,左右對稱,且在t=0時,分布密度函數(shù)取得最大值。

3、與標準正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢越明顯。df越大,t分布越趨近于標準正態(tài)分布。當n>30時,t分布與標準正態(tài)分布的區(qū)別很??;n>100時,t分布基本與標準正態(tài)分布相同;n→∞時,t

分布與標準正態(tài)分布完全一致。

t分布的概率分布函數(shù)為:

(5-12)

因而t在區(qū)間(t1,+∞)取值的概率——右尾概率為1-Ft(df)。由于t分布左右對稱,t在區(qū)間(-∞,-t1)取值的概率也為1-Ftdf)。于是t分布曲線下由-∞到-t1和由t1到+∞兩個相等的概率之和——兩尾概率為2(1-Ft(df))。對于不同自由度下t分布的兩尾概率及其對應的臨界t值已編制成附表,即t分布表。五、統(tǒng)計量設~N(μ,σ2),從該總體中等概率重復抽取樣本x1,x2,…,xn,則隨機變量遵從自由度n-1的分布六、F分布與F統(tǒng)計量F分布F統(tǒng)計量在進行F檢驗是數(shù)理統(tǒng)計的主要方法之一。在假設檢驗、方差分析和回歸分析中構造了形式不同的F統(tǒng)計量。

設從正態(tài)總體N(,)中等概重復抽取m個單元組成樣本,樣本方差為。從另一個正態(tài)總體N(,)中等概重復抽取n個單元組成樣本,樣本方差為。并且兩正態(tài)總體相互獨立。那么,統(tǒng)計量遵從第一自由度m-1,第二自由度n-1的F分布。

統(tǒng)計推斷是根據(jù)樣本和假定模型對總體作出的以概率形式表述的推斷,它主要包括假設檢驗和參數(shù)估計二個內容。第二節(jié)顯著性檢驗

假設檢驗又叫顯著性檢驗。顯著性檢驗的方法很多,常用的有t檢驗、F檢驗和檢驗等。盡管這些檢驗方法的用途及使用條件不同,但其檢驗的基本原理是相同的。本章以兩個樣本平均數(shù)的差異顯著性檢驗為例來闡明顯著檢驗的基本原理。

A、顯著性檢驗的基本原理

一、顯著性檢驗的意義

隨機抽測甲、乙兩種新產(chǎn)品各10家商場銷售量,經(jīng)計算,得:

甲產(chǎn)品品平均銷售量=13.50kg,標準差S1=1.81kg;乙產(chǎn)品平均銷售量=11.63kg,標準差S2=1.93kg。兩個平均數(shù)的差值=1.87kg,

造成這種差異可能有兩種原因:一是品種造成的差異,即甲、乙產(chǎn)品本質不同所致,一是實驗誤差(或抽樣誤差)。

例如,設甲產(chǎn)品銷售量總體平均數(shù)為,乙產(chǎn)品銷售總體平均數(shù)為,實驗研究的目的,就是要給、是否相同做出推斷。由于總體平均數(shù)、未知,在進行顯著性檢驗時只能以樣本平均數(shù)、作為檢驗對象,更確切地說,是以(-)作為檢驗對象。

通過實驗測定得到的每個觀測值,既由被測個體所屬總體的特征決定,又受個體差異和諸多無法控制的隨機因素的影響。所以觀測值由兩部分組成,即

=+

總體平均數(shù)反映了總體特征,表示誤差。若樣本含量為n,則可得到n

個觀測值:,,,。于是樣本平均數(shù)

說明樣本平均數(shù)并非總體平均數(shù),它還包含實驗誤差的成分。對于接受不同處理的兩個樣本來說,則有

=+,=+

說明兩個樣本平均數(shù)之差(-)也包括了兩部分:一部分是兩個總體平均數(shù)的差(-),叫做試驗的真實差異;另一部分是實驗誤差(-)。

也就是說樣本平均數(shù)的差(-)包含有實驗誤差,它只是實驗的表面差異。因此,僅憑(-)就對總體平均數(shù)、是否相同下結論是不可靠的。只有通過顯著性檢驗才能從(-)中提取結論。對(-)進行顯著性檢驗就是要分析:

實驗的表面差異(-)主要由真實差異

(-)引起的,還是主要由實驗誤差所造成。

雖然真實差異(-)未知,但實驗的表面差異是可以計算的,借助數(shù)理統(tǒng)計方法可以對實驗誤差作出估計。所以,可從實驗的表面差異與實驗誤差的權衡比較中間接地推斷真實差異是否存在,這就是顯著性檢驗的基本思想。二、顯著性檢驗的基本步驟

(一)首先對實驗樣本所在的總體作假設

假設=或-=0,即假設甲、乙兩種產(chǎn)品銷售量的總體平均數(shù)相等,其意義是實驗的表面差異:-=1.87kg是實驗誤差,這種假設稱為無效假設,記作:=或-=0。無效假設是被檢驗的假設,通過檢驗可能被接受,也可能被否定。提出:=或-=0的同時,相應地提出一對應假設,稱為備擇假設,記作。備擇假設是在無效假設被否定時準備接受的假設。

本例的備擇假設是:≠或-≠0,即假設甲、乙兩產(chǎn)品銷售量的總體平均數(shù)與不相等或與之差不等于零,亦即存在真實差異,其意義是指實驗的表面差異,除包含實驗誤差外,還含有真實差異在內。

(二)在無效假設成立的前提下,構造合適的統(tǒng)計量,并研究實驗所得統(tǒng)計量的抽樣分布,計算無效假設正確的概率

對于上述例子,研究在無效假設:=成立的前提下,統(tǒng)計量(-)的抽樣分布。經(jīng)統(tǒng)計學研究,得到一個統(tǒng)計量t:其中=

叫做均數(shù)差異標準誤;n1、n2為兩樣本的含量。

所得的統(tǒng)計量t服從自由度df=(n1-1)+(n2-1)的t分布。根據(jù)兩個樣本的數(shù)據(jù),計算得:

-=13.50-11.63=1.87

我們需進一步估計出|t|≥2.234的兩尾概率,即估計P(|t|≥2.234)是多少?查附表,在df=(n1-1)+(n2-1)=(10-1)+(10-1)=18時:

兩尾概率為0.05的臨界t值:=2.101,兩尾概率為0.01的臨界t值:=2.878,即

P(|t|>2.101)=P(t>2.101)+P(t<-2.101)

=0.05P(|t|>2.878)=P(t>2.878)+P(t<-2.878)

=0.01

由于根據(jù)兩樣本數(shù)據(jù)計算所得的t值為2.234,介于兩個臨界t值之間,即:

t0.05<2.234<t0.01

所以,|t|≥2.234的概率P介于0.01和0.05之間,即:0.01<P<0.05。說明無效假設成立的可能性,即實驗的表面差異為實驗誤差的可能性在0.01─0.05之間。

(三)根據(jù)“小概率事件實際不可能性原理”否定或接受無效假設,做出推斷結論當實驗的表面差異是實驗誤差的概率小于0.05時,可以認為在一次實驗中實驗表面差異是實驗誤差實際上是不可能的,因而否定原先所作的無效假設:=,接受備擇假設:≠,即認為:實驗的真實差異是存在的。當實驗的表面差異是實驗誤差的概率大于0.05時,則說明無效假設:=成立的可能性大,不能被否定,因而也就不能接受備擇假設:≠。

本例中,按所建立的:=,實驗的表面差異是實驗誤差的概率在0.01─0.05之間,小于0.05,故有理由否定:=,從而接受:≠??梢哉J為甲、乙兩種新產(chǎn)品銷售量的總體平均數(shù)和不相同。綜上所述,顯著性檢驗,從提出無效假設與備擇假設到根據(jù)小概率事件實際不可能性原理來否定或接受無效假設,這一過程實際上是應用所謂“概率性質的反證法”對實驗樣本所屬總體所作的無效假設的統(tǒng)計推斷。三、雙側檢驗與單側檢驗

在上述顯著性檢驗中,無效假設與備擇假設。此時,備擇假設中包括了或兩種可能。這個假設的目的在于判斷與有無差異,而不考慮誰大誰小。如比較甲、乙兩種新產(chǎn)品銷售量,甲品種可能高于乙品種,也可能低于乙品種。

此時,在α

水平上否定域為和,對稱地分配在t分布曲線的兩側尾部,每側的概率為α/2。這種利用兩尾概率進行的檢驗叫雙側檢驗,也叫雙尾檢驗,為雙側檢驗的臨界t值。

但在有些情況下,雙側檢驗不一定符合實際情況。如采用某種新的配套技術措施以期提高產(chǎn)品銷售量,已知此種配套技術的實施會提高產(chǎn)品銷售量。此時,若進行新技術與常規(guī)技術的比較實驗,則無效假設應為,即假設新技術與常規(guī)技術銷售量是相同的,備擇假設應為,即新配套技術的實施銷售量有所提高。檢驗的目的在于推斷實施新技術是否提高了銷售量,這時H0的否定域在t分布曲線的右尾。在α水平上否定域為,右側的概率為α。若無效假設H0為,備擇假設HA為,此時H0的否定域在t分布曲線的左尾。在α水平上,H0的否定域為,左側的概率為α。四、顯著性檢驗中應注意的問題

(一)為了保證實驗結果的可靠及正確,要有嚴密合理的實驗或抽樣設計,保證各樣本是從相應同質總體中隨機抽取的。并且處理間要有可比性,即除比較的處理外,其它影響因素應盡可能控制相同或基本相近。

(二)選用的顯著性檢驗方法應符合其應用條件。由于研究變量的類型、問題的性質、條件、實驗設計方法、樣本大小等的不同,所用的顯著性檢驗方法也不同,因而在選用檢驗方法時,應認真考慮其適用條件,不能濫用。

(三)要正確理解差異顯著或極顯著的統(tǒng)計意義。

“顯著”或“極顯著”是指表面上如此差別的不同樣本來自同一總體的可能性小于0.05或0.01,已達到了可以認為它們有實質性差異的顯著水平。

顯著水平的高低只表示下結論的可靠程度的高低,即在0.01水平下否定無效假設的可靠程度為99%,而在0.05水平下否定無效假設的可靠程度為95%。

“差異不顯著”是指表面上的這種差異在同一總體中出現(xiàn)的可能性大于統(tǒng)計上公認的概率水平0.05,不能理解為實驗結果間沒有差異。當“差異不顯著”的結論時,客觀上存在兩種可能:

一是本質上有差異,但被實驗誤差所掩蓋,表現(xiàn)不出差異的顯著性來。如果減小實驗誤差或增大樣本含量,則可能表現(xiàn)出差異顯著性;

二是可能確無本質上差異。

顯著性檢驗只是用來確定無效假設能否被否定,而不能證明無效假設是正確的。

(四)合理建立統(tǒng)計假設,正確計算檢驗統(tǒng)計量。

(五)

結論不能絕對化。經(jīng)過顯著性檢驗最終是否否定無效假設則由被研究事物有無本質差異、實驗誤差的大小及選用顯著水平的高低決定的。同樣一種實驗,實驗本身差異程度的不同,樣本含量大小的不同,顯著水平高低的不同,統(tǒng)計推斷的結論可能不同。下結論應慎重,有時應用重復實驗來證明。B、單個樣本平均數(shù)的假設檢驗本節(jié)考慮某一個樣本平均數(shù)所屬的總體平均數(shù),檢驗它與某一指定的總體平均數(shù)是否相同,或者這兩個總體平均數(shù)之間是否存在著差異,根據(jù)樣本平均數(shù)的抽樣分布情況,通常有兩類檢驗。t檢驗總體方差未知,樣本平均數(shù)來自于小樣本,要檢驗樣本所來自的總體和某一指定總體平均數(shù)的差異,需用t檢驗。例:某品牌葡萄日平均銷售量為16kg,為了提高銷售量,進行廣告宣傳,后自17個樣點測定其銷售量為:16.9,18.2,17.5,18.7,18.0,17.9,19.0,17.6,16.8,16.4,19.0,17.3,18.2,19.5,20.0,18.8,17.7。問廣告宣傳是否使葡萄的銷售量有明顯的影響?第一步:建立統(tǒng)計假設第二步確定顯著性水平第三步在H0為正確的前提下,計算樣本平均數(shù)、標準差、平均數(shù)標準誤和t值等相關數(shù)據(jù),并做出統(tǒng)計推斷。第四步:得出結論。廣告宣傳對該品牌葡萄銷售量有著顯著影響。若廣告宣傳對該品牌葡萄銷售量是否有顯著提高作用,需采用單尾檢驗。第三節(jié)兩個樣本平均數(shù)的差異

顯著性檢驗

兩樣本平均數(shù)差異顯著性檢驗,常用于比較不同處理效應的差異顯著性。如兩種包裝的銷售能力。

采用不同的實驗研究方法,所得到的資料性質也不同,因而也隨之采用不同的檢驗方法。按照資料的來源,可將其分為成組數(shù)據(jù)和成對數(shù)據(jù)。非配對設計配對設計

配對設計是指先根據(jù)配對的要求將實驗單位兩兩配對,然后將配成對子的兩個實驗單位隨機地分配到兩個處理組中。配對的要求是:配成對子的兩個實驗單位的初始條件盡量一致,不同對子間實驗單位的初始條件允許有差異,每一個對子就是實驗處理的一個重復。配對的方式有兩種:自身配對與同源配對。1、自身配對

指同一實驗單位在二個不同時間上分別接受前后兩次處理,用其前后兩次的觀測值進行自身對照比較;或同一實驗單位的不同部位的觀測值或不同方法的觀測值進行自身對照比較。

2、同源配對

指將來源相同、性質相同的兩個個體配成一對,如將品種、性別、年齡、體重相同的兩個實驗單位配成一對,然后對配對的兩個個體隨機地實施不同處理。配對設計實驗資料的一般形式見下表5-1:

表5-1配對設計實驗資料的一般形式一般說來,相對于非配對設計,配對設計能夠提高實驗的精確性。一、成對數(shù)據(jù)資料的假設檢驗由于同一配對對內兩個供試單位的實驗條件非常接近,而不同配對間的條件差異又可通過同一配對的差數(shù)予以消除,因而可以控制實驗誤差,具有較高的精確度。在假設檢驗時可以設想有兩個總體:第一總體的觀察值為x11,x12,…,x1i,…,x1n。第二總體的觀察值為x21,x22,…,x2i,…,x2n。由于某種關系,兩總體的觀察值可以一一配對,即(x11

,x21

),(x12

,x22

),…,(x1i

,x2i

),…,(x1n

,x2n

),每對觀察值之間的差數(shù)為di=x1i-x2i(i=1,2…,n)差數(shù)d1,d2,…,di…,dn所構成的總體,具有平均數(shù)、方差,在兩個總體平均數(shù)相等的情況下,。根據(jù)對抽樣分布情況的研究可知,大樣本多服從正態(tài)分布,而小樣本多服從t分布,這時只需檢驗,而不必再假定兩個樣本所屬總體的方差相同。

第一步:提出無效假設與備擇假設

其中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論