![第4章-推斷統(tǒng)計(參數(shù)估計與假設(shè)檢驗)資料課件_第1頁](http://file4.renrendoc.com/view/4bb472cb34ed0df3fdef4e1d7de4db51/4bb472cb34ed0df3fdef4e1d7de4db511.gif)
![第4章-推斷統(tǒng)計(參數(shù)估計與假設(shè)檢驗)資料課件_第2頁](http://file4.renrendoc.com/view/4bb472cb34ed0df3fdef4e1d7de4db51/4bb472cb34ed0df3fdef4e1d7de4db512.gif)
![第4章-推斷統(tǒng)計(參數(shù)估計與假設(shè)檢驗)資料課件_第3頁](http://file4.renrendoc.com/view/4bb472cb34ed0df3fdef4e1d7de4db51/4bb472cb34ed0df3fdef4e1d7de4db513.gif)
![第4章-推斷統(tǒng)計(參數(shù)估計與假設(shè)檢驗)資料課件_第4頁](http://file4.renrendoc.com/view/4bb472cb34ed0df3fdef4e1d7de4db51/4bb472cb34ed0df3fdef4e1d7de4db514.gif)
![第4章-推斷統(tǒng)計(參數(shù)估計與假設(shè)檢驗)資料課件_第5頁](http://file4.renrendoc.com/view/4bb472cb34ed0df3fdef4e1d7de4db51/4bb472cb34ed0df3fdef4e1d7de4db515.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
2011年8月重慶工商大學應用統(tǒng)計應
用
統(tǒng)
計
學
AppliedStatistics不象其他科學,統(tǒng)計從來不打算使自己完美無缺,統(tǒng)計意味著你永遠不需要確定無疑。
GudmundR.Iversen統(tǒng)計名言怎樣解決下面的問題?一個水庫里有多少魚?一片原始森林里的木材儲蓄量有多少?一批燈泡的平均使用壽命是多少?一批產(chǎn)品的合格率是多少?怎樣才能知道這些問題的答案?你不可能把一個水庫里的水抽干去稱魚的重量,不可能把森林伐完去量木材有多少,不可能把一批燈泡都用完去計算它的平均壽命,也不可能把每一件產(chǎn)品都檢測完才知道它的合格率第4章推斷統(tǒng)計4.1
怎樣進行推斷?4.2估計總體參數(shù)4.3檢驗總體假設(shè)4.1怎樣進行推斷?
4.1.1用估計量估計總體參數(shù)
4.1.2用什么方法進行估計?
4.1.3用什么樣的估計量去估計?第4章推斷統(tǒng)計4.1.1用估計量估計總體參數(shù)4.1怎樣進行推斷?2008年5月關(guān)心總體的哪些參數(shù)?一個總體兩個總體參數(shù)符號估計量參數(shù)符號估計量均值均值差比例比例差方差方差比估計量:用于估計總體參數(shù)的隨機變量如樣本均值,樣本比例,樣本方差等例如:樣本均值就是總體均值的一個估計量參數(shù)用表示,估計量用表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值如果樣本均值x
=80,則80就是的估計值估計量與估計值
(estimator&estimatedvalue)4.1.2用什么方法進行估計?4.1怎樣進行推斷?點估計
(pointestimate)用樣本的估計量的某個取值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計無法給出估計值接近總體參數(shù)程度的信息雖然在重復抽樣條件下,點估計的均值可望等于總體真值,但由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值一個點估計量的可靠性是由它的抽樣標準誤差來衡量的,這表明一個具體的點估計值無法給出估計的可靠性的度量區(qū)間估計
(intervalestimate)在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分數(shù)在75~85之間,置信水平是95%
樣本統(tǒng)計量
(點估計)置信區(qū)間置信下限置信上限2008年5月區(qū)間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x將構(gòu)造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應的
為0.01,0.05,0.10置信水平
(confidencelevel)
由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯誤的置信區(qū)間
(confidenceinterval)2008年5月置信區(qū)間
(95%的置信區(qū)間)重復構(gòu)造出的20個置信區(qū)間點估計值?我沒有抓住參數(shù)!2008年5月置信區(qū)間與置信水平均值的抽樣分布(1-)%區(qū)間包含了
%的區(qū)間未包含1–aa/2a/24.1.3用什么樣的估計量去估計?4.1怎樣進行推斷?無偏性
(unbiasedness)無偏性:估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)P(
)BA無偏有偏有效性
(efficiency)有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標準差的估計量更有效
AB
的抽樣分布
的抽樣分布P(
)一致性
(consistency)一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(
)4.2估計總體參數(shù)
4.2.1總體均值的估計
4.2.2總體比例的估計
4.2.3總體方差的估計第4章推斷統(tǒng)計4.2.1總體均值的估計4.2估計總體參數(shù)一個總體均值的區(qū)間估計總體均值在1-置信水平下的置信區(qū)間大樣本(n
30)小樣本(n
<30),總體方差(2)
未知樣本均值±分位數(shù)值×樣本均值的標準誤差一個總體均值的區(qū)間估計
(例題分析—大樣本)【例】一家保險公司收集到由36個投保人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間
36個投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532一個總體均值的區(qū)間估計
(例題分析—大樣本)解:已知n=36,1-=90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計算得:,
總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲
統(tǒng)計函數(shù)—CONFIDENCE一個總體均值的區(qū)間估計
(例題分析—小樣本)【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(單位:小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470一個總體均值的區(qū)間估計
(例題分析—小樣本)解:已知X~N(,2),n=16,1-=95%,t/2=2.131
根據(jù)樣本數(shù)據(jù)計算得:,
總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時~1503.2小時兩個總體均值之差的區(qū)間估計
(獨立大樣本)1-2在1-置信水平下的置信區(qū)間獨立大樣本(n1
30,n2
30)(x1
-x2
)±分位數(shù)值×(x1-x2)的標準誤差兩個總體均值之差的區(qū)間估計
(獨立小樣本:
12=22
)兩個正態(tài)總體,方差未知但相等:12=22兩個獨立小樣本(n1<30和n2<30)估計量x1-x2的標準化總體方差的合并估計量兩個總體均值之差的區(qū)間估計
(獨立小樣本:1222
)兩個正態(tài)總體,方差未知且不等:1222兩個獨立小樣本(n1<30和n2<30)估計量x1-x2的標準化自由度兩個總體均值之差的區(qū)間估計
(匹配樣本)兩個匹配大樣本(n130和n230)d±分位數(shù)值×d的標準誤差d=(1-2)在1-置信水平下的置信區(qū)間兩個匹配小樣本(n1<30和n2<30)2008年5月兩個總體均值之差的估計
(例題分析—獨立小樣本)【例】為估計兩種方法組裝產(chǎn)品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12名工人,每個工人組裝一件產(chǎn)品所需的時間(單位:分鐘)下如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間兩個方法組裝產(chǎn)品所需的時間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521兩個總體均值之差的估計
(例題分析—獨立小樣本)解:
根據(jù)樣本數(shù)據(jù)計算得合并估計量為兩種方法組裝產(chǎn)品所需平均時間之差的置信區(qū)間為0.14分鐘~7.26分鐘兩個總體均值之差的估計
(例題分析—匹配樣本)【例】由10名學生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進行測試,結(jié)果如下表。試建立兩種試卷分數(shù)之差d=1-2
95%的置信區(qū)間
10名學生兩套試卷的得分學生編號試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916STATISTICS兩個總體均值之差的估計
(例題分析—匹配樣本)解:
根據(jù)樣本數(shù)據(jù)計算得兩種試卷所產(chǎn)生的分數(shù)之差的置信區(qū)間為6.3分~15.7分4.2.2總體比例的估計4.2估計總體參數(shù)一個總體比例的區(qū)間估計
(傳統(tǒng)方法)設(shè)總體服從二項分布,即X~(n,p),P為n次獨立伯努利試驗成功的概率試驗次數(shù)n非常大(np≥10;n(1-p)≥10),否則該方法不能用當樣本很小時,傳統(tǒng)方法計算出的1-置信水平下的置信區(qū)間能夠覆蓋總體真實比例的概率小于小于1-傳統(tǒng)方法仍被廣泛使用當樣本量非常大時,傳統(tǒng)方法與現(xiàn)代方法的結(jié)果幾乎相同。小樣本情況下,現(xiàn)代方法更適用總體比例在1-置信水平下的置信區(qū)間樣本比例±分位數(shù)值×樣本比例的標準誤差一個總體比例的區(qū)間估計
(傳統(tǒng)方法)總體比例在1-置信水平下的置信區(qū)間樣本比例p的標準化一個總體比例的區(qū)間估計
(傳統(tǒng)方法)【例】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
設(shè)兩總體都服從二項分布,即X1~(n1,p1),X2~(n2,p2)。x1為n1次獨立伯努利試驗成功的次數(shù),P1位成功的概率概率,x2
為n2次獨立伯努利試驗成功的次數(shù),P2為成功的概率試驗次數(shù)n1和n2都非常大(n1p1≥10,n1(1-p1)≥10;n2p2≥10,n2(1-p2)≥10),否則該方法不能用對于大樣本,傳統(tǒng)方法的結(jié)果與現(xiàn)代方法比較接近,但對于小樣本,傳統(tǒng)方法計算出的1-置信水平下的置信區(qū)間能夠覆蓋總體真實比例的概率小于小于1-兩個總體比例之差的區(qū)間估計
(傳統(tǒng)方法)比例之差1-2在1-置信水平下的置信區(qū)間(p1-p2)±分位數(shù)值×(p1-p2)的標準誤差p1-p2的標準化兩個總體比例之差的區(qū)間估計
(傳統(tǒng)方法)1-2在1-置信水平下的置信區(qū)間4.2.3總體方差的估計4.2估計總體參數(shù)一個總體方差的區(qū)間估計假設(shè)總體服從正態(tài)分布一個總體方差在1-置信水平下的置信區(qū)間兩個總體方差比在1-置信水平下的置信區(qū)間2008年5月總體方差的區(qū)間估計
(圖示)221-2總體方差的1-的置信區(qū)間自由度為n-1的22008年5月兩個總體方差比的區(qū)間估計
(圖示)FF1-F總體方差比的1-的置信區(qū)間方差比置信區(qū)間示意圖4.3檢驗總體假設(shè)
4.3.1怎樣提出假設(shè)?
4.3.2依據(jù)什么作出決策?
4.3.3總體均值的檢驗
4.3.4總體比例的檢驗
4.3.5總體方差的檢驗第4章推斷統(tǒng)計4.3.1怎樣提出假設(shè)?4.3檢驗總體假設(shè)假設(shè)與假設(shè)檢驗
(hypothesis&hypothesistest)假設(shè)是對總體參數(shù)的具體數(shù)值所作的陳述假設(shè)檢驗是利用樣本信息判斷假設(shè)是否成立的過程邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理我認為這種新藥的療效比原有的藥物更有效!原假設(shè)
(nullhypothesis)研究者想收集證據(jù)予以反對的假設(shè)表達參數(shù)沒有變化或變量間沒有關(guān)系假定樣本反映的結(jié)果是由于樣本與總體之間的隨機差異導致的又稱“0假設(shè)”總是有符號,或4. 表示為H0H0:
=某一數(shù)值指定為符號=,或例如,H0:
10cmnull研究者想收集證據(jù)予以支持的假設(shè)假定樣本反映的結(jié)果是真實的也稱“研究假設(shè)”總是有符號
,
或表示為H1H1:
<某一數(shù)值,或某一數(shù)值例如,H1:
<10cm,或
10cm備擇假設(shè)(alternativehypothesis)【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為
H0:
500H1:
<500【例】一家研究機構(gòu)估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構(gòu)隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為
H0:
30%H1:
30%原假設(shè)和備擇假設(shè)是一個完備事件組,而且相互對立在一項假設(shè)檢驗中,原假設(shè)和備擇假設(shè)必有一個成立,而且只有一個成立先確定備擇假設(shè),再確定原假設(shè)等號“=”總是放在原假設(shè)上因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)(結(jié)論與建議)備擇假設(shè)沒有特定的方向性,并含有符號“”的假設(shè)檢驗,稱為雙側(cè)檢驗或雙尾檢驗(two-tailedtest)
備擇假設(shè)具有特定的方向性,并含有符號“>”或“<”的假設(shè)檢驗,稱為單側(cè)檢驗或單尾檢驗(one-tailedtest)備擇假設(shè)的方向為“<”,稱為左側(cè)檢驗
備擇假設(shè)的方向為“>”,稱為右側(cè)檢驗
雙側(cè)檢驗與單側(cè)檢驗4.3.2依據(jù)什么作出決策?4.3檢驗總體假設(shè)檢驗統(tǒng)計量:根據(jù)樣本觀測結(jié)果計算得到的,并據(jù)以對原假設(shè)和備擇假設(shè)作出決策的某個樣本統(tǒng)計量對樣本估計量的標準化結(jié)果原假設(shè)H0為真點估計量的抽樣分布用統(tǒng)計量決策(teststatistic)
標準化的檢驗統(tǒng)計量
2008年5月用統(tǒng)計量決策
(雙側(cè)檢驗)抽樣分布H0臨界值臨界值a/2a/2拒絕H0拒絕H01-置信水平RegionofRejectionRegionofNonrejectionRegionofRejection2008年5月用統(tǒng)計量決策
(左側(cè)檢驗)抽樣分布H0臨界值a拒絕H01-置信水平RegionofRejectionRegionofNonrejection2008年5月用統(tǒng)計量決策
(右側(cè)檢驗)抽樣分布H0臨界值2拒絕H01-置信水平RegionofNonrejectionRegionofRejection用P值決策
(P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會像實際觀測結(jié)果那么極端或更極端的概率P值告訴我們:如果原假設(shè)是正確的話,我們得到得到目前這個樣本數(shù)據(jù)的可能性有多大,如果這個可能性很小,就應該拒絕原假設(shè)被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值<,拒絕H02008年5月雙側(cè)檢驗的P值/
2/
2Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值2008年5月左側(cè)檢驗的P值Z拒絕H00臨界值計算出的樣本統(tǒng)計量1/2P值2008年5月右側(cè)檢驗的P值Z拒絕H00計算出的樣本統(tǒng)計量臨界值1/2P值2008年5月拒絕H0P值決策與統(tǒng)計量的比較拒絕H0的兩個統(tǒng)計量的不同顯著性Z拒絕H00統(tǒng)計量1
P1
值統(tǒng)計量2
P2
值拒絕H0臨界值原假設(shè)的可信度又多高?如果H0所代表的假設(shè)是人們多年來一直相信的,就需要很強的證據(jù)(小的P值)才能說服他們拒絕的結(jié)論是什么?如果拒絕H0而肯定H1
,你就需要有很強的證據(jù)顯示要支持H1。比如,H1代表要花很多錢把產(chǎn)品包裝改換成另一種包裝,你就要有很強的證據(jù)顯示新包裝一定會增加銷售量(因為拒絕H0要花很高的成本)多大的P值合適?顯著性檢驗的目的是要描述樣本所提供不利于原假設(shè)的證據(jù)有多強。P值就在做這件事。但是,要證明原假設(shè)不正確,P值要多小,才能令人信服呢?這要根據(jù)兩種情況來確定決策就有可能犯錯誤1. 第Ⅰ類錯誤(棄真錯誤)原假設(shè)為正確時拒絕原假設(shè)第Ⅰ類錯誤的概率記為被稱為顯著性水平2. 第Ⅱ類錯誤(取偽錯誤)原假設(shè)為錯誤時未拒絕原假設(shè)第Ⅱ類錯誤的概率記為(Beta)2008年5月
錯誤和
錯誤的關(guān)系你要同時減少兩類錯誤的惟一辦法是增加樣本量和的關(guān)系就像翹翹板,小就大,大就小兩類錯誤的控制一般來說,對于一個給定的樣本,如果犯第Ι類錯誤的代價比犯第Ⅱ類錯誤的代價相對較高,則將犯第Ⅰ類錯誤的概率定得低些較為合理;反之,如果犯第Ι類錯誤的代價比犯第Ⅱ類錯誤的代價相對較低,則將犯第Ⅰ類錯誤的概率定得高些一般來說,發(fā)生哪一類錯誤的后果更為嚴重,就應該首要控制哪類錯誤發(fā)生的概率。但由于犯第Ι類錯誤的概率是可以由研究者控制的,因此在假設(shè)檢驗中,人們往往先控制第Ι類錯誤的發(fā)生概率怎樣表述決策結(jié)果?
(“顯著”與“不顯著”)當拒絕原假設(shè)時,我們稱樣本結(jié)果是統(tǒng)計上顯著的拒絕原假設(shè)時結(jié)論是清楚的當不拒絕原假設(shè)時,我們稱樣本結(jié)果是統(tǒng)計上不顯著的不拒絕原假設(shè)時,并未給出明確的結(jié)論,不能說原假設(shè)是正確的,也不能說它不是正確的怎樣表述決策結(jié)果?
(“接受”與“不拒絕”)你不能證明原假設(shè)是什么而只能證明它不是什么假設(shè)檢驗的目的在于試圖找到證據(jù)拒絕原假設(shè),而不在于證明什么是正確的當沒有足夠證據(jù)拒絕原假設(shè)時,不采用“接受原假設(shè)”的表述,而采用“不拒絕原假設(shè)”的表述?!安痪芙^”的表述實際上意為著并未給出明確的結(jié)論,我們沒有說原假設(shè)正確,也沒有說它不正確“接受”的說法有時會產(chǎn)生誤導,因為這種說法似乎暗示著原假設(shè)已經(jīng)被證明是正確的了。但實事上,H0的真實值我們永遠也無法知道,H0只是對總體真實值的一個假定值,由樣本提供的信息也就自然無法證明它是否正確怎樣表述決策結(jié)果?
(為什么不說“接受”)【例】比如原假設(shè)為H0:=10,從該總體中抽出一個隨機樣本,得到x=9.8,在=0.05的水平上,樣本提供的證據(jù)沒有推翻這一假設(shè),我們說“接受”原假設(shè),這意為著樣本提供的證據(jù)已經(jīng)證明=10是正確的。如果我們將原假設(shè)改為H0:=10.5,同樣,在=0.05的水平上,樣本提供的證據(jù)也沒有推翻這一假設(shè),我們又說“接受”原假設(shè)。但這兩個原假設(shè)究竟哪一個是“真實的”呢?我們不知道Significant(顯著的)一詞的意義在這里并不是“重要的”,而是指“非偶然的”在假設(shè)檢驗中,如果樣本提供的證據(jù)拒絕原假設(shè),我們說檢驗的結(jié)果是顯著的,如果不拒絕原假設(shè),我們則說結(jié)果是不顯著的一項檢驗在統(tǒng)計上是“顯著的”,意思是指:這樣的(樣本)結(jié)果不是偶然得到的,或者說,不是靠機遇能夠得到的拒絕原假設(shè),表示這樣的樣本結(jié)果并不是偶然得到的;不拒絕原假設(shè)(拒絕原假設(shè)的證據(jù)不充分),則表示這樣的樣本結(jié)果只是偶然得到的統(tǒng)計顯著不等于實際顯著
(significant)統(tǒng)計顯著不等于實際顯著
(統(tǒng)計上顯著不一定有實際意義)當原假設(shè)被拒絕時,我們稱樣本結(jié)果在統(tǒng)計上是顯著的(statisticallySignificant),當不拒絕原假設(shè)時,我們稱樣本結(jié)果在統(tǒng)計上是不顯著的P值越小,表明結(jié)果越顯著。但檢驗結(jié)果究竟是“顯著的”、“中度顯著的”還是“高度顯著的”,需要由研究者自己根據(jù)P值大小和實際問題來決定在“顯著”和“不顯著”之間沒有清除的界限,只是在P值越來越小時,我們就有越來越強的證據(jù),檢驗的結(jié)果也就越來越顯著一個在統(tǒng)計上顯著的結(jié)論在實際中卻不見得很重要,也不意為著就有實際意義。因為P值不僅和樣本大小密切相關(guān),也和總體參數(shù)的真值有關(guān)樣本容量越大,P值就越小大的樣本幾乎總是導致拒絕原假設(shè)較大的樣本會讓顯著性檢驗比較敏感用小樣本作的顯著性檢驗敏感度又常常不夠在總體真值不變的情況下,大的樣本會使P值變小,而小的P值也不一定就有實際顯著性無論總體的狀況如何,觀測值多一點,就可以讓我們抓的值抓得準些在假設(shè)檢驗時,不僅要報告P值,而且也要報告樣本大小統(tǒng)計顯著不等于實際顯著(大樣本導致結(jié)果顯著)2008年5月統(tǒng)計顯著不等于實際顯著
(樣本量對檢驗結(jié)果的影響)投擲硬幣1000次、4040次和10000次時出現(xiàn)正面樣本比例的抽樣分布0.50.507這個結(jié)果出乎預料嗎?n=1000n=4040n=100004.3.3總體均值的檢驗4.3檢驗總體假設(shè)2008年5月一個總體均值的檢驗
(作出判斷)是否已知小樣本容量n大是否已知否t檢驗否z檢驗是z檢驗
是z檢驗一個總體均值的檢驗
(例題分析—大樣本)【例】一種機床加工的零件尺寸絕對平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機抽取50個進行檢驗。利用這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低?(=0.01)
左側(cè)檢驗50個零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86一個總體均值的檢驗
(例題分析—大樣本)H0
:
1.35H1
:
<1.35
=
0.01n
=
50臨界值(c):檢驗統(tǒng)計量:拒絕H0新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01一個總體均值的檢驗
(P值的計算與應用—大樣本)第1步:進入Excel表格界面,直接點擊【f(x)】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名的菜單下選擇【ZTEST】,然后【確定】第3步:在所出現(xiàn)的對話框【Array】框中,輸入原始數(shù)據(jù)所在區(qū)域;在【X】后輸入?yún)?shù)的某一假定值(這里為
1.35);在【Sigma】后輸入已知的總體標準差(若總體標準差未知則可忽略不填,系統(tǒng)將自動使用樣本標準差代替)第4步:用1減去得到的函數(shù)值0.995421023
即為P值
P值=1-0.995421023=0.004579
P值<=0.01,拒絕H0用Excel計算P值2008年5月一個總體均值的檢驗
(P值的圖示)計算出的樣本統(tǒng)計量=2.6061P=0.004579
Z拒絕H00臨界值P值一個總體均值的檢驗
(例題分析—小樣本)【例】一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產(chǎn)企業(yè)在購進配件時,通常是經(jīng)過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進?,F(xiàn)對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產(chǎn)的配件長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.3一個總體均值的檢驗
(例題分析—小樣本)H0
:
=12H1
:
12
=0.05df=10-1=9臨界值(c):檢驗統(tǒng)計量:不拒絕H0樣本提供的證據(jù)還不足以推翻“該供貨商提供的零件符合要求”的看法決策:結(jié)論:t02.262-2.2620.025拒絕
H0拒絕H00.025一個總體均值的檢驗
(P值的計算與應用-t
檢驗)第1步:進入Excel表格界面,直接點擊【f(x】第2步:在函數(shù)分類中點擊【統(tǒng)計】,并在函數(shù)名的菜單下選擇【TDIST】,然后【確定】第3步:在出現(xiàn)對話框的【X】欄中輸入計算出的t的絕對值0.7035,在【Deg-freedom】(自由度)欄中輸入本例的自由度9,在【Tails】欄中輸入2(表明是雙側(cè)檢驗,如果是單測檢驗則在該欄輸入1)第4步:P值=0.499537958
P值>=0.05,故不拒絕H0
兩個總體均值之差的檢驗
(獨立大樣本)1. 假定條件兩個樣本是獨立的隨機樣本正態(tài)總體或非正態(tài)總體大樣本(n130和n230)檢驗統(tǒng)計量12
,22
已知:12
,22
未知:兩個總體均值之差的檢驗
(獨立小樣本:12,
22
已知)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布12,22已知檢驗統(tǒng)計量兩個總體均值之差的檢驗
(獨立小樣本:12,22
未知但12=22)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布12、22未知但相等,即12=22檢驗統(tǒng)計量其中:自由度:兩個總體均值之差的檢驗
(獨立小樣本:12,22
未知且不等1222)假定條件兩個總體都是正態(tài)分布12,22未知且不相等,即1222樣本容量不相等,即n1n2檢驗統(tǒng)計量自由度:2008年5月兩個總體均值之差的估計
(例題分析—獨立小樣本)【例】為估計兩種方法組裝產(chǎn)品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12名工人,每個工人組裝一件產(chǎn)品所需的時間(單位:分鐘)下如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,方差未知且不相等。檢驗兩種方法組裝產(chǎn)品所需平均時間是否有顯著差異?=0.05兩個方法組裝產(chǎn)品所需的時間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521兩個總體均值之差的檢驗
(用Excel進行檢驗)第1步:將原始數(shù)據(jù)輸入到Excel工作表格中第2步:選擇“工具”下拉菜單并選擇【數(shù)據(jù)分析】選項第3步:在【數(shù)據(jù)分析】對話框中選擇
【t-檢驗:雙樣本異方差假設(shè)】第4步:當對話框出現(xiàn)后在【變量1的區(qū)域】方框中輸入第1個樣本的數(shù)據(jù)區(qū)域在【變量2的區(qū)域】方框中輸入第2個樣本的數(shù)據(jù)區(qū)域在【假設(shè)平均差】方框中輸入假定的總體均值之差在【】方框中輸入給定的顯著性水平(本例為0.05)
在【輸出選項】選擇計算結(jié)果的輸出位置,然后【確定】用Excel進行檢驗兩個總體均值之差的檢驗
(匹配樣本)假定條件兩個總體配對差值構(gòu)成的總體服從正態(tài)分布配對差是由差值總體中隨機抽取的
數(shù)據(jù)配對或匹配(重復測量(前/后))檢驗統(tǒng)計量樣本差值均值樣本差值標準差兩個總體均值之差的檢驗
(用Excel進行檢驗—匹配樣本)第1步:選擇“工具”下拉菜單,并選擇【數(shù)據(jù)分析】選項第3步:在分析工具中選擇【t檢驗:平均值成對二樣本分析】第4步:當出現(xiàn)對話框后
在【變量1的區(qū)域】方框內(nèi)鍵入變量1的數(shù)據(jù)區(qū)域
在【變量2的區(qū)域】方框內(nèi)鍵入變量2的數(shù)據(jù)區(qū)域
在【假設(shè)平均差】方框內(nèi)鍵入假設(shè)的差值(這里為0)
在【】框內(nèi)鍵入給定的顯著性水平,然后【確定】
用Excel進行檢驗兩個總體均值之差的檢驗
(TTEST函數(shù)的應用
)函數(shù)語法:TTEST(array1,array2,tails,type)
說明:【Array1】為樣本1的數(shù)據(jù)區(qū)域
【array2】為樣本2的數(shù)據(jù)區(qū)域
【tails】表示分布曲線的尾數(shù)如果tails=1,返回分布的單尾概率如果tails=2,返回分布的雙尾概率【type】為檢驗的類型1代表配對樣本檢驗1代表雙樣本等方差假設(shè)3代表雙樣本異方差假設(shè)
用TTEST進行檢驗4.3.4總體比例的檢驗4.3檢驗總體假設(shè)一個總體比例檢驗假定條件總體服從二項分布可用正態(tài)分布來近似(大樣本)檢驗的z統(tǒng)計量0為假設(shè)的總體比例1. 假定條件兩個總體都服從二項分布可以用正態(tài)分布來近似檢驗統(tǒng)計量檢驗H0:1-2=0檢驗H0:1-2=d0兩個總體比例之差的檢驗一個總體比例的檢驗
(例題分析)【例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發(fā)現(xiàn)有146個女性經(jīng)常閱讀該雜志。分別取顯著性水平
=0.05和=0.01
,檢驗該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?雙側(cè)檢驗一個總體比例的檢驗
(例題分析)H0
:
=80%H1
:
80%
=0.05n
=200臨界值(c):檢驗統(tǒng)計量:拒絕H0
(P=0.013328<
=0.05)該雜志的說法并不屬實
決策:結(jié)論:z01.96-1.960.025拒絕
H0拒絕
H00.025一個總體比例的檢驗
(例題分析)H0
:
=80%H1
:
80%
=0.01n
=200臨界值(c):檢驗統(tǒng)計量:不拒絕H0
(P=0.013328>=0.01)樣本提供的證據(jù)還不足以推翻“該雜志聲稱讀者群中有80%為女性”的看法
決策:結(jié)論:z02.58-2.580.005拒絕H0拒絕H00.005兩個總體比例之差的檢驗
(例題分析)
【例】一所大學準備采取一項學生在宿舍上網(wǎng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度建筑工程施工安全責任保險合同
- 2025年度海洋工程勞務承包合同模板
- 2025年度新能源車用鋰電池研發(fā)借款保證合同
- 氣模鼓風機項目融資計劃書
- 金華浙江金華永康市信訪局編外工作人員招聘筆試歷年參考題庫附帶答案詳解
- 金華浙江金華市技師學院招聘編外工作人員8人筆試歷年參考題庫附帶答案詳解
- 貴州2025年貴州省工業(yè)和信息化廳所屬事業(yè)單位招聘1人筆試歷年參考題庫附帶答案詳解
- 舟山浙江舟山市普陀區(qū)檔案館(區(qū)史志研究室)招聘勞務派遣工作人員筆試歷年參考題庫附帶答案詳解
- 聊城2024年山東聊城陽谷縣第二批招聘教師70人筆試歷年參考題庫附帶答案詳解
- 湛江廣東湛江市清風苑管理中心招聘事業(yè)編制工作人員10人筆試歷年參考題庫附帶答案詳解
- 裝修垃圾清運方案
- 2024年四川省廣元市中考物理試題(含解析)
- 急救藥品課件教學課件
- 數(shù)字出版概論 課件 第七章 數(shù)字內(nèi)容服務相關(guān)技術(shù)
- 信號與系統(tǒng)復習題(答案全)
- 兒童福利機構(gòu)安全管理規(guī)范
- 第1課 おじぎ 課件高中日語人教版第一冊-1
- ISO∕IEC 23894-2023 信息技術(shù) -人工智能 - 風險管理指南(雷澤佳譯-2024)
- 六年級下冊語文第一單元測試卷 部編版(含答案)
- 鄭州市地圖含區(qū)縣可編輯可填充動畫演示矢量分層地圖課件模板
- 2024年湖南高速鐵路職業(yè)技術(shù)學院單招職業(yè)適應性測試題庫新版
評論
0/150
提交評論