講稿5 區(qū)間估計(jì)與假設(shè)檢驗(yàn)

上傳人：2*** IP屬地：湖北上傳時(shí)間：2023-02-01 格式：PPT 頁(yè)數(shù)：82 大小：1.25MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩77頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

5區(qū)間估計(jì)與假設(shè)檢驗(yàn)5.1區(qū)間估計(jì)與假設(shè)檢驗(yàn)的基本概念5.2總體均值的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)5.3總體比例的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)5.4總體方差的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)5.5分布檢驗(yàn)5.1區(qū)間估計(jì)與假設(shè)檢驗(yàn)的基本概念5.1.1區(qū)間估計(jì)5.1.2假設(shè)檢驗(yàn)5.1.1區(qū)間估計(jì)1.點(diǎn)估計(jì)和區(qū)間估計(jì)參數(shù)的估計(jì)方法主要有兩種：點(diǎn)估計(jì)和區(qū)間估計(jì)。點(diǎn)估計(jì)：用樣本的觀(guān)測(cè)值估計(jì)總體未知參數(shù)的值。區(qū)間估計(jì)：在點(diǎn)估計(jì)的基礎(chǔ)上，給出總體參數(shù)的一個(gè)范圍。2.參數(shù)的置信區(qū)間和置信水平置信區(qū)間：由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間。置信區(qū)間是一個(gè)隨機(jī)區(qū)間，它依賴(lài)與樣本。如果將構(gòu)造置信區(qū)間的步驟重復(fù)多次，置信區(qū)間中包含總體參數(shù)真值的次數(shù)所占的比例，稱(chēng)為置信水平。置信水平為1–α的含義是隨機(jī)區(qū)間(θ1，θ2)以1–α的概率包含了參數(shù)θ。90％α＝0.1為正態(tài)曲線(xiàn)下右側(cè)面積為α/2的Z值。3.正態(tài)總體均值和方差的置信區(qū)間正態(tài)總體參數(shù)的各種置信區(qū)間見(jiàn)表5-1。被估參數(shù)條件樞軸量及其分布參數(shù)的置信區(qū)間單正態(tài)總體μ2已知2未知2μ已知μ未知4.總體比例與比例差的置信區(qū)間實(shí)際應(yīng)用中經(jīng)常需要對(duì)總體比例進(jìn)行估計(jì)，如產(chǎn)品的合格率、大學(xué)生的就業(yè)率和手機(jī)的普及率等。記π和P分別表示總體比例和樣本比例，則當(dāng)樣本容量n很大時(shí)（一般當(dāng)nP和n(1–P)均大于5時(shí)，就可以認(rèn)為樣本容量足夠大），樣本比例P的抽樣分布可用正態(tài)分布近似?？傮w比例與比例差的置信區(qū)間如表5-2所示。待估參數(shù)樞軸量及其分布參數(shù)的置信區(qū)間總體比例π兩總體比例差π1-π2其中P1，P2為兩個(gè)樣本比例

要用到的3個(gè)分布：正態(tài)概率分布有以下重要特征：（1）正態(tài)分布是對(duì)稱(chēng)分布，對(duì)稱(chēng)軸是x=μ。（2）當(dāng)x=μ時(shí)，正態(tài)概率密度最大。（3）正態(tài)分布的圖形由μ和σ決定。（4）當(dāng)σ為定值時(shí)，μ的變化引起正態(tài)概率密度曲線(xiàn)在橫軸上平行移動(dòng)。（5）當(dāng)μ為定值時(shí)，σ的變化將引起正態(tài)概率密度曲線(xiàn)的形狀變得尖峭或偏平。5.1.2假設(shè)檢驗(yàn)1.假設(shè)檢驗(yàn)的基本概念和原理假設(shè)檢驗(yàn)：先對(duì)總體參數(shù)提出某種假設(shè)，然后利用樣本信息判斷假設(shè)是否成立的過(guò)程。備擇假設(shè)：研究者想通過(guò)收集證據(jù)以支持的假設(shè)記為H1

原假設(shè)：研究者想通過(guò)收集證據(jù)以反對(duì)的假設(shè)記為H0a:當(dāng)原假設(shè)為真時(shí)拒絕原假設(shè)的概率，為顯著性水平。檢驗(yàn)統(tǒng)計(jì)量：對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量。拒絕域：能夠拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的所有可能值的集合。對(duì)總體參數(shù)進(jìn)行假設(shè)檢驗(yàn)時(shí)，首先要給定一個(gè)原假設(shè)H0，H0是關(guān)于總體參數(shù)的表述，與此同時(shí)存在一個(gè)與H0相對(duì)立的備擇假設(shè)H1，H0與H1有且僅有一個(gè)成立；經(jīng)過(guò)一次抽樣，若發(fā)生了小概率事件（通常把概率小于0.05的事件稱(chēng)為小概率事件），可以依據(jù)“小概率事件在一次實(shí)驗(yàn)中幾乎不可能發(fā)生”的理由，懷疑原假設(shè)不真，作出拒絕原假設(shè)H0，接受H1的決定；反之，若小概率事件沒(méi)有發(fā)生，就沒(méi)有理由拒絕H0，從而應(yīng)作出拒絕H1的決定。2.假設(shè)檢驗(yàn)的步驟

1)根據(jù)問(wèn)題確立原假設(shè)H0和備選假設(shè)H1；

2)確定一個(gè)顯著性水平，它是衡量稀有性（小概率事件）的標(biāo)準(zhǔn)，常取為0.05；

3)選定合適的檢驗(yàn)用統(tǒng)計(jì)量W（通常在原假設(shè)中相等成立時(shí)，W的分布是已知的），根據(jù)W的分布及的值，確定H0的拒絕域。

4)由樣本觀(guān)測(cè)值計(jì)算出統(tǒng)計(jì)量W的觀(guān)測(cè)值W0，如果W0落入H0的拒絕域，則拒絕H0；否則，不能拒絕原假設(shè)H0。注意：在SAS系統(tǒng)中，是由樣本觀(guān)測(cè)值計(jì)算出統(tǒng)計(jì)量W的觀(guān)測(cè)值W0和衡量觀(guān)測(cè)結(jié)果極端性的p值（p值就是當(dāng)原假設(shè)成立時(shí)得到樣本觀(guān)測(cè)值和更極端結(jié)果的概率），然后比較p和作判斷：p<，拒絕原假設(shè)H0；否則，不能拒絕原假設(shè)H0。

p值通常由下面公式計(jì)算而得到?！駊=P{|W|≥|W0|}=2P{W≥|W0|}

（拒絕域?yàn)閮蛇厡?duì)稱(chēng)的區(qū)域時(shí)）●p=min{P{W≥W0}，P{W

W0}}

（拒絕域?yàn)閮蛇叿菍?duì)稱(chēng)區(qū)域時(shí)）●p=P{W≥W0}（拒絕域?yàn)橛疫厖^(qū)域時(shí)）●p=P{W

W0}（拒絕域?yàn)樽筮厖^(qū)域時(shí)）只需根據(jù)SAS計(jì)算出的p值，就可以在指定的顯著水平下，作出拒絕或不能拒絕原假設(shè)的決定。3.正態(tài)總體均值和方差的假設(shè)檢驗(yàn)對(duì)正態(tài)總體的參數(shù)進(jìn)行假設(shè)檢驗(yàn)是假設(shè)檢驗(yàn)的重要內(nèi)容，如對(duì)單總體均值、方差的檢驗(yàn)、兩總體均值之差的檢驗(yàn)和兩總體方差比的檢驗(yàn)等。正態(tài)總體參數(shù)的各種檢驗(yàn)方法見(jiàn)下表5-3至表5-5。表5-3單正態(tài)總體N(μ,2)均值μ的檢驗(yàn)法檢驗(yàn)名稱(chēng)條件檢驗(yàn)類(lèi)別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域Z檢驗(yàn)已知雙邊檢驗(yàn)μ=μ0μ≠μ0N(0,1)|Z|≥Zα/2左邊檢驗(yàn)μ≥μ0μ<μ0Z≤-Zα右邊檢驗(yàn)μ≤μ0μ>μ0Z≥Zαt檢驗(yàn)未知雙邊檢驗(yàn)μ=μ0μ≠μ0t(n–1)|t|≥tα/2(n–1)左邊檢驗(yàn)μ≥μ0μ<μ0t≤–tα(n–1)右邊檢驗(yàn)μ≤μ0μ>μ0t≥tα(n–1)表5-4單正態(tài)總體N(μ,2)方差2的檢驗(yàn)法或檢驗(yàn)名稱(chēng)條件檢驗(yàn)類(lèi)別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域χ2檢驗(yàn)μ已知雙邊檢驗(yàn)左邊檢驗(yàn)右邊檢驗(yàn)μ未知雙邊檢驗(yàn)左邊檢驗(yàn)右邊檢驗(yàn)表5-5兩正態(tài)總體的均值差與方差比的檢驗(yàn)名稱(chēng)條件類(lèi)別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域Z檢驗(yàn)兩樣本獨(dú)立，12=22=2未知雙邊檢驗(yàn)μ1-μ2=0μ1-μ2≠0t(n1+n2–2)左邊檢驗(yàn)μ1-μ20μ1-μ2<0右邊檢驗(yàn)μ1-μ20μ1-μ2>0t檢驗(yàn)成對(duì)匹配樣本，12，22未知雙邊檢驗(yàn)μd=0μd≠0左邊檢驗(yàn)μd0μd<0右邊檢驗(yàn)μd0μd>0F檢驗(yàn)兩樣本獨(dú)立，μ1,μ2未知雙邊檢驗(yàn)F(n1–1,n2–1)左邊檢驗(yàn)右邊檢驗(yàn)4.總體比例與比例差的檢驗(yàn)當(dāng)樣本容量n很大時(shí)，可根據(jù)表5-6對(duì)總體比例與比例差進(jìn)行假設(shè)檢驗(yàn)。表5-6總體比例與比例差的檢驗(yàn)檢驗(yàn)名稱(chēng)檢驗(yàn)類(lèi)別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域比例檢驗(yàn)雙邊檢驗(yàn)

0N(0，1)|z|

zα/2左邊檢驗(yàn)

<0|z|≤–zα右邊檢驗(yàn)

>0|z|

zα兩總體比例差檢驗(yàn)雙邊檢驗(yàn)1

=21

2N(0，1)|z|

zα/2左邊檢驗(yàn)1

21<2|z|≤–zα右邊檢驗(yàn)1

21>2|z|

zα5.2總體均值的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)5.2.1使用INSIGHT模塊5.2.2使用“分析家”5.2.3使用TTEST過(guò)程5.2.1使用INSIGHT模塊1.總體均值的區(qū)間估計(jì)【例5-1】某藥材生產(chǎn)商要對(duì)其倉(cāng)庫(kù)中的1000箱藥材的平均重量進(jìn)行估計(jì)，藥材重量的總體方差未知，隨機(jī)抽取16箱樣本稱(chēng)重后結(jié)果如表5-7所示。表5-716箱藥材重量（單位：千克）

設(shè)藥材重量數(shù)據(jù)存放于數(shù)據(jù)集L.yczl中，其中重量變量名為weight。求該倉(cāng)庫(kù)中每箱藥材平均重量在95%置信水平下的置信區(qū)間。50505651495347525353495355485055步驟如下：

1)啟動(dòng)INSIGHT模塊，并打開(kāi)數(shù)據(jù)集L.yczl；

2)選擇菜單“Analyze”→“Distribution(Y)”；

3)在打開(kāi)的“Distribution(Y)”對(duì)話(huà)框中進(jìn)行區(qū)間估計(jì)的設(shè)置（如圖）。

結(jié)果包括一個(gè)名為“95％ConfidenceIntervals（95%置信區(qū)間）”的列表，表中給出了均值、標(biāo)準(zhǔn)差、方差的估計(jì)值（Parameter）、置信下限（LCL）和置信上限（UCL），如圖5-2所示。結(jié)果表明，根據(jù)抽樣樣本，該倉(cāng)庫(kù)中藥材的平均重量以95%的可能性位于50.08千克至52.92千克之間。2.單樣本總體均值的假設(shè)檢驗(yàn)【例5-2】一家食品廠(chǎng)以生產(chǎn)袋裝食品為主，每天的產(chǎn)量大約為8000袋，每袋重量規(guī)定為100克。為了分析每袋重量是否符合要求，質(zhì)檢部門(mén)經(jīng)常進(jìn)行抽檢。現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋，顯著性水平為0.05，測(cè)得每袋重量如表5-8所示。表5-825袋食品的重量（單位：克）試從抽檢的樣本數(shù)據(jù)出發(fā)，檢驗(yàn)變量WEIGHT的均值與100克是否有顯著差異。假定表5-8數(shù)據(jù)存放在數(shù)據(jù)集L.spzl中，重量變量名為WEIGHT。112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3設(shè)變量WEIGHT的均值為μ，問(wèn)題是希望通過(guò)樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT均值的如下假設(shè)：

H0：μ=100， H1：μ

100。使用INSIGHT對(duì)均值進(jìn)行檢驗(yàn)的步驟如下：

1)首先啟動(dòng)INSIGHT，并打開(kāi)數(shù)據(jù)集L.spzl；

2)選擇菜單“Analyze”→“Distribution(Y)”；

3)在打開(kāi)的“Distribution(Y)”對(duì)話(huà)框中選定分析變量WEIGHT；

4)單擊“OK”按鈕，得到變量的描述性統(tǒng)計(jì)量；

5)選擇菜單“Tables（表）”→“TestsforLocation（位置檢驗(yàn)）”；在彈出的“TestsforLocation”對(duì)話(huà)框中輸入100，單擊“OK”按鈕得到輸出結(jié)果如圖所示。

結(jié)果顯示，觀(guān)測(cè)值不等于100克的觀(guān)測(cè)有24個(gè)，其中19個(gè)觀(guān)測(cè)值大于100。圖中第一個(gè)檢驗(yàn)為t檢驗(yàn)(Student'st)，需要假定變量服從正態(tài)分布，檢驗(yàn)的p值為0.0105，這個(gè)檢驗(yàn)在0.05水平下是顯著的，所以可認(rèn)為均值與100克有顯著差異。第二個(gè)檢驗(yàn)(Sign)是叫做符號(hào)檢驗(yàn)的非參數(shù)檢驗(yàn)，其p值為0.0066，在0.05水平下也是顯著的，結(jié)論不變。第三個(gè)檢驗(yàn)(SignedRank)是叫做符號(hào)秩檢驗(yàn)的非參數(shù)檢驗(yàn)，其p值為0.0048，在0.05水平下是顯著的，結(jié)論不變。3.兩樣本總體均值的比較：成對(duì)匹配樣本在INSIGHT中比較成對(duì)樣本均值是否顯著差異，可以計(jì)算兩變量的差值變量，再檢驗(yàn)差值變量的均值是否顯著為0?！纠?-3】由10名學(xué)生組成一個(gè)隨機(jī)樣本，讓他們分別采用A和B兩套試卷進(jìn)行測(cè)試，結(jié)果如表5-9所示。表5-910名學(xué)生兩套試卷的成績(jī)?cè)噺臉颖緮?shù)據(jù)出發(fā)，分析兩套試卷是否有顯著差異。試卷A78637289914968768555試卷B71446184745155607739差值71911517-21316816步驟如下：

1)首先生成差值變量：?jiǎn)?dòng)INSIGHT，并打開(kāi)數(shù)據(jù)集L.sjdf。選擇菜單“Edit”→“Variables”→“Other”，打開(kāi)“EditVariables”對(duì)話(huà)框，選擇A為Y變量，B為X變量，然后選擇變換（Transformation）：Y–X，如圖，生成新的差值變量d；

2)然后對(duì)變量d的均值做如下假設(shè)：

H0：μd=0， H1：μd

0。

3)選擇菜單“Analyze”→“Distribution(Y)”；在打開(kāi)的“Distribution(Y)”對(duì)話(huà)框中選定分析變量：選擇變量差值d，單擊“Y”按鈕，將變量d移到右上方的列表框中；

4)單擊“Output”按鈕，在打開(kāi)的對(duì)話(huà)框中選中“TestsforLocation（位置檢驗(yàn)）”復(fù)選框；

5)兩次單擊“OK”按鈕，得到變量的描述性統(tǒng)計(jì)量；

6)選擇菜單“Tables（表）”→“TestsforLocation（位置檢驗(yàn)）”；在彈出的“TestsforLocation”對(duì)話(huà)框中輸入0，單擊“OK”按鈕得到輸出結(jié)果如圖所示。結(jié)果顯示三個(gè)檢驗(yàn)的結(jié)論都是p值小于0.05，所以應(yīng)拒絕原假設(shè)，即總體的均值與0有顯著差異。所以?xún)商自嚲碛酗@著差異。雖然SAS給出三個(gè)檢驗(yàn)結(jié)果，其實(shí)作結(jié)論時(shí)只需其中一個(gè)。如果可以認(rèn)為分析變量服從正態(tài)分布只要看t檢驗(yàn)結(jié)果；否則只須看符號(hào)秩檢驗(yàn)結(jié)果。只有在數(shù)據(jù)為兩兩比較的大小結(jié)果而沒(méi)有具體數(shù)值時(shí)符號(hào)檢驗(yàn)才有用。5.2.2使用“分析家”1.總體均值的置信區(qū)間【例5-4】在“分析家”中求例5-1中每箱藥材平均重量在95%置信水平下的置信區(qū)間。步驟如下：

1)在“分析家”模塊中打開(kāi)數(shù)據(jù)集L.yczl；

2)選擇菜單“Statistics（統(tǒng)計(jì)）”→“HypothesisTests（假設(shè)檢驗(yàn)）”→“OneSamplet–testforaMean（單樣本均值t-檢驗(yàn)）”；

3)在打開(kāi)的“OneSamplet–testforaMean”對(duì)話(huà)框中設(shè)置均值的置信區(qū)間（如圖5-6）。

3)在打開(kāi)的“OneSamplet–testforaMean”對(duì)話(huà)框中設(shè)置均值的置信區(qū)間（如圖5-6）。結(jié)果表明（下圖），根據(jù)抽樣樣本，該倉(cāng)庫(kù)中藥材的平均重量以95%的可能性位于50.08千克至52.92千克之間。

2.單樣本總體均值的假設(shè)檢驗(yàn)【例5-5】使用“分析家”檢驗(yàn)例5-2中食品重量是否符合要求。希望通過(guò)樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT均值的如下假設(shè)：

H0：μ=100， H1：μ

100。由于此時(shí)的方差未知，所以使用t檢驗(yàn)法。步驟如下：

1)在“分析家”中打開(kāi)數(shù)據(jù)集L.spzl；

2)選擇菜單“Statistics（統(tǒng)計(jì)）”→“HypothesisTests（假設(shè)檢驗(yàn)）”→“OneSamplet–testforaMean（單樣本均值t-檢驗(yàn)）”，打開(kāi)“OneSamplet–testforaMean”對(duì)話(huà)框；

4)按圖5-8所示設(shè)置均值檢驗(yàn)，單擊“OK”按鈕，得到結(jié)果如圖左所示。；

顯示結(jié)果（圖右）表明t統(tǒng)計(jì)量的p值為0.0105<0.05，所以拒絕原假設(shè)，即認(rèn)為總體的均值不等于100。3.兩樣本總體均值的比較：成對(duì)匹配樣本【例5-6】使用“分析家”對(duì)例5-3中兩套試卷檢驗(yàn)有無(wú)顯著差異。這是一個(gè)（成對(duì)匹配）雙樣本均值檢驗(yàn)問(wèn)題，若μ1和μ2分別表示兩套試卷的平均成績(jī)，則檢驗(yàn)的是：

H0：μ1–μ2=0， H1：μ1–μ2

0；分析步驟如下：

1)在“分析家”中打開(kāi)數(shù)據(jù)集L.sjdf；

2)選擇菜單“Statistics（統(tǒng)計(jì)）”→“HypothesisTests（假設(shè)檢驗(yàn)）”→“TwoSamplePairedt-TestforaMean（均值的成對(duì)雙樣本t-檢驗(yàn)）”；

3)在打開(kāi)的“TwoSamplePairedt-TestforaMean”對(duì)話(huà)框中，按圖左所示設(shè)置雙樣本均值檢驗(yàn)，單擊“OK”按鈕，得到結(jié)果如圖右所示結(jié)果顯示，無(wú)論兩總體的方差是否相等，t統(tǒng)計(jì)量的p值=0.0005<0.05，所以在95%的置信水平下，拒絕原假設(shè)，兩總體的均值有顯著差異。結(jié)果表明可以95%的把握認(rèn)為兩套試卷有顯著差異。5.2.3使用TTEST過(guò)程TTEST過(guò)程可以執(zhí)行單樣本均值的t檢驗(yàn)、配對(duì)數(shù)據(jù)的t檢驗(yàn)以及雙樣本均值比較的t檢驗(yàn)。1.語(yǔ)法格式PROCTTEST<選項(xiàng)列表>；

[CLASS<分組變量名>；][VAR<分析變量名列表>；][PAIED<變量名列表>；][BY<分組變量名>；]RUN；其中，PROCTTEST和RUN語(yǔ)句是必須的，其余語(yǔ)句都是可選的，而且可調(diào)換順序。

CLASS語(yǔ)句所指定的分組變量是用來(lái)進(jìn)行組間比較的；而B(niǎo)Y語(yǔ)句所指定的分組變量是用來(lái)將數(shù)據(jù)分為若干個(gè)更小的樣本，以便SAS分別在各小樣本內(nèi)進(jìn)行各自獨(dú)立的處理。

VAR語(yǔ)句引導(dǎo)要檢驗(yàn)的所有變量列表，SAS將對(duì)VAR語(yǔ)句所引導(dǎo)的所有變量分別進(jìn)行組間均值比較的t檢驗(yàn)。

PAIED語(yǔ)句用來(lái)指定配對(duì)t檢驗(yàn)中要進(jìn)行比較的變量對(duì)，其后所帶的變量名列表一般形式及其產(chǎn)生的效果見(jiàn)表5-11。表5-11選項(xiàng)及其含義變量名列表形式產(chǎn)生的效果a*ba–ba*bc*da–b,c–d(ab)*(cd)a–c,a–d,b–c,b–d(ab)*(cb)a–c,a–b,b–c

PROCTTEST語(yǔ)句后可跟的選項(xiàng)及其表示的含義如表5-12所示。表5-12選項(xiàng)及其含義選項(xiàng)代表的含義data=等號(hào)后為SAS數(shù)據(jù)集名，指定ttest過(guò)程所要處理的數(shù)據(jù)集，默認(rèn)值為最近處理的數(shù)據(jù)集alpha=等號(hào)后為0~1之間的任何值，指定顯著性水平，默認(rèn)為0.05ci=等號(hào)后為“equal,umpu,none”中的一個(gè)，表示標(biāo)準(zhǔn)差的置信區(qū)間的顯示形式，默認(rèn)為ci=equalcochran有此選項(xiàng)時(shí)，ttest過(guò)程對(duì)方差不齊時(shí)的近似t檢驗(yàn)增加cochran近似法h0=等號(hào)后為任意實(shí)數(shù)，表示檢驗(yàn)假設(shè)中對(duì)兩均值差值的設(shè)定，默認(rèn)值為02.總體均值的置信區(qū)間【例5-8】仍然考慮例5-3中的樣本數(shù)據(jù)。假定其中數(shù)據(jù)使用如下數(shù)據(jù)步存放在數(shù)據(jù)集sjcj中，兩套試卷得分的變量名分別為A和B。datasjcj;inputAB@@;cards;7871634472618984917449516855766085775539;run;【例5-8】仍然考慮例5-3中的樣本數(shù)據(jù)。假定其中數(shù)據(jù)使用如下數(shù)據(jù)步存放在數(shù)據(jù)集sjcj中，兩套試卷得分的變量名分別為A和B。使用最簡(jiǎn)代碼求均值、標(biāo)準(zhǔn)差的置信區(qū)間：procttestdata=sjcj;run;

代碼運(yùn)行結(jié)果給出兩個(gè)變量在95%置信水平下的均值、標(biāo)準(zhǔn)差的置信區(qū)間，以及對(duì)原假設(shè)μ0=0所作的t檢驗(yàn)的p值，如圖所示。3.單樣本總體均值的假設(shè)檢驗(yàn)在例5-8中增加原假設(shè)選項(xiàng)以及置信水平，代碼如下：procttesth0=70alpha=0.01data=l.sjdf;varA;run;

代碼運(yùn)行結(jié)果除了給出變量A在99%置信水平下的均值、標(biāo)準(zhǔn)差的置信區(qū)間外，還給出對(duì)假設(shè)μ0=70，所作的t-檢驗(yàn)的p值，如圖5-15所示。結(jié)果顯示t統(tǒng)計(jì)量的p值=0.5734，不能拒絕（57.34%的把握）原假設(shè)：均值=70。4.配對(duì)兩樣本均值的假設(shè)檢驗(yàn)在例5-8中檢驗(yàn)兩套試卷有無(wú)顯著差異，代碼如下：procttestdata=l.sjdf;pairedA*B;run;

代碼運(yùn)行結(jié)果給出了對(duì)原假設(shè)μ1–μ2=0所作的t檢驗(yàn)的p值，如圖5-16所示。結(jié)果顯示t統(tǒng)計(jì)量的p值=0.0005<0.05，因此拒絕原假設(shè)。說(shuō)明兩套試卷有顯著差異。5.3總體比例的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)5.3.1總體比例的置信區(qū)間5.3.2單樣本總體比例的假設(shè)檢驗(yàn)5.3.3兩總體比例的比較5.3.1總體比例的置信區(qū)間【例5-10】2004年底北京市私家車(chē)擁有量已達(dá)到129.8萬(wàn)輛，位居全國(guó)之首，據(jù)業(yè)內(nèi)人士分析其中國(guó)產(chǎn)中低檔汽車(chē)的比例較大，為了估計(jì)目前北京市場(chǎng)個(gè)人購(gòu)車(chē)的平均價(jià)格，調(diào)查人員于某日在北京最大的車(chē)市隨機(jī)抽取36位私人消費(fèi)購(gòu)車(chē)者，得到他們所購(gòu)汽車(chē)的價(jià)格，見(jiàn)下表。表5-13年底購(gòu)車(chē)價(jià)格(單位：萬(wàn)元)根據(jù)以上調(diào)查數(shù)據(jù)，試以95％的置信水平推斷該地區(qū)購(gòu)買(mǎi)私家車(chē)在15萬(wàn)元以上的消費(fèi)者占有的比例。6.8811.2819.9813.610.614.86.8811.7820.9824.412.314.86.8813.6813.630.314.614.88.2814.9814.79.614.617.49.615.6815.89.612.95.3810.1815.6820.510.614.87.38設(shè)購(gòu)車(chē)價(jià)格數(shù)據(jù)存放在數(shù)據(jù)集L.gcjg中，價(jià)格變量名為price。這是一個(gè)單樣本比例的區(qū)間估計(jì)問(wèn)題。由于在SAS中只能對(duì)兩水平的分類(lèi)變量作比例的區(qū)間估計(jì)與檢驗(yàn)，所以首先要按變量price生成一個(gè)新的分類(lèi)變量。步驟如下：

1)在“分析家”中打開(kāi)數(shù)據(jù)集L.gcjg；

2)選擇主菜單“Edit（編輯）”→“Mode（模式）”→“Edit（編輯）”，使數(shù)據(jù)集可以被編輯（修改）；

3)選擇主菜單“Data（數(shù)據(jù)）”→“Transform（變換）”→“RecodeRanges（重編碼范圍）”，打開(kāi)“RecodeRangesInformation”對(duì)話(huà)框并按圖3-18（左）設(shè)置有關(guān)內(nèi)容；

4)單擊“OK”按鈕，打開(kāi)“RecodeRanges”對(duì)話(huà)框，按圖5-18右所示生成新變量price_f；

6)選擇菜單“Statistics（統(tǒng)計(jì)）”→“HypothesisTests（假設(shè)檢驗(yàn)）”→“OneSampleTestforaProportion（單樣本比例檢驗(yàn)）”；

7)在打開(kāi)的“OneSampleTestforaProportion”對(duì)話(huà)框中，按圖5-19設(shè)置比例的置信區(qū)間。

分析結(jié)果中包括變量的置信區(qū)間：按95%的置信水平變量price取值為“>15”的比例在區(qū)間(0.109，0.391)范圍中（如圖5-20），即可以95%的概率估計(jì)該地區(qū)所購(gòu)買(mǎi)車(chē)輛在15萬(wàn)元以上的消費(fèi)者所占比例在10.9%～39.1%之間。5.3.2單樣本總體比例的假設(shè)檢驗(yàn)【例5-11】考慮例3-10中的數(shù)據(jù)，試檢驗(yàn)總體中購(gòu)買(mǎi)車(chē)輛在15萬(wàn)元以上者所占比例是否超過(guò)30%。這是一個(gè)單樣本比例檢驗(yàn)問(wèn)題，若表示總體中購(gòu)買(mǎi)車(chē)輛在15萬(wàn)元以上者所占比例，則檢驗(yàn)的是：

H0：≥0.3， H1：

<0.3；步驟如下：

1)選擇菜單“Statistics”→“Hypothesis

Tests”→“OneSampleTestforaProportion”，打開(kāi)并按圖左設(shè)置“OneSampleTestforaProportion”對(duì)話(huà)框；檢驗(yàn)結(jié)果如圖右所示。

顯示的結(jié)果表明樣本中購(gòu)買(mǎi)車(chē)輛在15萬(wàn)元以上者的比例為25%，檢驗(yàn)用的Z統(tǒng)計(jì)量的p值為0.2563>0.05，所以不能拒絕原假設(shè)。結(jié)果表明購(gòu)買(mǎi)車(chē)輛在15萬(wàn)元以上者所占比例在95%的置信水平下超過(guò)30%。5.3.3兩總體比例的比較【例5-12】2004年底很多類(lèi)型的國(guó)產(chǎn)轎車(chē)價(jià)格都比年中有所下降，為了對(duì)比2004年底與年中私家購(gòu)車(chē)族購(gòu)車(chē)價(jià)格的差異，在年中新購(gòu)車(chē)者中隨機(jī)抽取32人，調(diào)查得到的價(jià)格數(shù)據(jù)如表5-14。表5-14年中購(gòu)車(chē)價(jià)格(單位：萬(wàn)元)：綜合表5-13與表5-14的調(diào)查數(shù)據(jù)，試以95％的置信水平推斷該地區(qū)年底與年中購(gòu)買(mǎi)私家車(chē)在15萬(wàn)元以上的消費(fèi)者占有比例有無(wú)差異。5.3810.7812.8814.718.8830.37.3811.213.61519.9815.287.9811.7813.6515.820.59.999.3811.7814.615.920.989.3610.312.314.71724.48.9911.3810.28這是一個(gè)雙樣本比例檢驗(yàn)問(wèn)題，若1和2分別表示總體中年底和年中購(gòu)買(mǎi)私家車(chē)在15萬(wàn)元以上的消費(fèi)者所占的比例，則檢驗(yàn)的是假設(shè)：

H0：1–2=0， H1：1–2

0；首先將5-7與表5-8的調(diào)查數(shù)據(jù)存入一個(gè)數(shù)據(jù)集L.gcjgQ中，價(jià)格變量名為price，使用變量period以區(qū)別年中數(shù)據(jù)(2)與年底數(shù)據(jù)(1)。按例5-10中的步驟由price生成兩水平分類(lèi)變量price_F。圖5-23所示即為數(shù)據(jù)集L.gcjgQ中的部分?jǐn)?shù)據(jù)。然后，對(duì)上面假設(shè)進(jìn)行檢驗(yàn)，步驟如下：

1)在分析家中打開(kāi)數(shù)據(jù)集L.gcjgQ后，選擇菜單“Statistics”→“Hypothesis

Tests”→“TwoSampleTestforProportion（雙樣本比例檢驗(yàn)）”，在對(duì)話(huà)框中，按圖左設(shè)置雙樣本比例檢驗(yàn)，分析結(jié)果如圖右所示。結(jié)果顯示，由于Z統(tǒng)計(jì)量的p值為0.5664，所以在95%的置信水平下，不能拒絕原假設(shè)。即該地區(qū)2004年底與年中私家購(gòu)車(chē)價(jià)格在15萬(wàn)元以上者所占比例無(wú)明顯差異。5.4總體方差的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)5.4.1總體方差的置信區(qū)間5.4.2單樣本總體方差的假設(shè)檢驗(yàn)5.4.3兩樣本總體方差的比較5.4.1總體方差的置信區(qū)間【例5-13】表5-15所示為某中學(xué)1980年模擬高考數(shù)學(xué)的部分學(xué)生成績(jī)，試估計(jì)本次模擬考試成績(jī)的方差。表5-15部分學(xué)生成績(jī)

假定表5-15數(shù)據(jù)存放在數(shù)據(jù)集L.kscj中，成績(jī)變量名為score。分析步驟如下：

1)在“分析家”中打開(kāi)數(shù)據(jù)集L.kscj；

2)選擇菜單“Statistics（統(tǒng)計(jì)）”→“HypothesisTests（假設(shè)檢驗(yàn)）”→“OneSampleTestforaVariance（方差的單樣本檢驗(yàn)）”；100969690921001009099921009810097979594100

3)在打開(kāi)的“OneSampleTestforaVariance”對(duì)話(huà)框中設(shè)置方差的置信區(qū)間（如圖3-26）。分析結(jié)果中包括方差的置信區(qū)間估計(jì)，如圖3-27所示。結(jié)果表明，本次模擬考試成績(jī)方差在置信水平95%下的置信區(qū)間為(7.1692，28.614)。

5.4.2單樣本總體方差的假設(shè)檢驗(yàn)【例5-14】考慮例3-13中的模擬考試成績(jī)，檢驗(yàn)考試成績(jī)是否太集中。這是一個(gè)單樣本方差檢驗(yàn)問(wèn)題，若表示總體方差，則檢驗(yàn)的是：

H0：2≤52， H1：2>52；步驟如下：

1)選擇菜單“Statistics”→“Hypothesis

Tests”→“OneSampleTestforaVariance（單樣本方差檢驗(yàn)）”，打開(kāi)“OneSampleTestforaVariance”對(duì)話(huà)框并按圖設(shè)置；

2)單擊“OK”按鈕，得到結(jié)果。結(jié)果（圖左）顯示，樣本方差為12.732，由于2檢驗(yàn)的p值=0.9504，所以不能拒絕方差≤25的原假設(shè)。結(jié)果表明有95%的把握可以認(rèn)為該模擬考試的成績(jī)太過(guò)集中。5.5分布檢驗(yàn)5.5.1數(shù)據(jù)的分布研究5.5.2在INSIGHT模塊中研究分布5.5.3在“分析家”中研究分布5.5.4使用UNIVARIATE過(guò)程5.5.1數(shù)據(jù)的分布研究1.分布擬合圖由于密度直方圖中矩形的面積是數(shù)據(jù)落入對(duì)應(yīng)區(qū)間中的頻率，根據(jù)大數(shù)定理，數(shù)據(jù)量很大時(shí)，頻率近似于概率。所以，如果數(shù)據(jù)來(lái)自一個(gè)具有概率密度f(wàn)(x)的連續(xù)型隨機(jī)變量，密度直方圖就可以作為概率密度f(wàn)(x)的一個(gè)估計(jì)。直方圖頂端的形態(tài)為折線(xiàn)，而常用的一些分布的密度曲線(xiàn)如正態(tài)分布等都是光滑曲線(xiàn)，所謂分布擬合圖就是在限定的參數(shù)分布類(lèi)中通過(guò)對(duì)參數(shù)的估計(jì)，用估計(jì)得到的參數(shù)所對(duì)應(yīng)的密度曲線(xiàn)去擬合直方圖頂部的形態(tài)。圖5-31所示為分布擬合圖，左圖為正態(tài)分布擬合圖，右圖為對(duì)數(shù)正態(tài)分布擬合圖。

在SAS系統(tǒng)中提供的參數(shù)分布類(lèi)型有：正態(tài)（Normal）分布—最為常用的分布、對(duì)數(shù)正態(tài)（Lognormal）分布、指數(shù)分布、Gamma分布、Weibull分布，它們的分布密度分別為：

1)參數(shù)為(μ，)的正態(tài)分布

2)參數(shù)為(，μ，)的對(duì)數(shù)正態(tài)分布

3)參數(shù)為(，)的指數(shù)分布的密度為

4)參數(shù)為(，c，)的指數(shù)分布的密度為

5)參數(shù)為(，α，)的Gamma分布的密度為

6)參數(shù)為(，c，)的Weibull分布的密度為2.QQ圖不論密度直方圖還是分布擬合圖，要從圖上鑒別數(shù)據(jù)的分布是否近似于某種類(lèi)別的分布是較困難的。QQ圖可以幫助我們方便地鑒別數(shù)據(jù)的分布是否近似于某種類(lèi)型的分布。

QQ圖是一種散點(diǎn)圖。對(duì)應(yīng)于正態(tài)分布的QQ圖由點(diǎn)構(gòu)成，其橫坐標(biāo)為標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)，縱坐標(biāo)x(i)（i=1，2，…，n）是將x1，…，xn從小到大排序后的數(shù)列，為總體i/n分位點(diǎn)的估計(jì)。若觀(guān)測(cè)數(shù)據(jù)近似正態(tài)分布N(μ，2)，則QQ圖上這些點(diǎn)近似在直線(xiàn)y=x+μ附近。圖5-32所示為居民家庭收入情況的QQ圖，分別為對(duì)應(yīng)于正態(tài)分布與對(duì)數(shù)正態(tài)分布的QQ圖。

要利用QQ圖鑒別樣本數(shù)據(jù)是否近似于正態(tài)分布，只需看QQ圖上的點(diǎn)是否近似地在一條直線(xiàn)附近，該直線(xiàn)的斜率為標(biāo)準(zhǔn)差，截距為均值。同樣，也可以作對(duì)應(yīng)于對(duì)數(shù)正態(tài)分布、指數(shù)分布、Gamma分布、Weibull分布的QQ圖，以鑒別樣本數(shù)據(jù)是否來(lái)自某一類(lèi)型的總體分布。

5.5.2在INSIGHT模塊中研究分布1.繪制分布擬合圖【例5-16】在INSIGHT模塊中繪制居民家庭收入情況（參見(jiàn)例2-1）的分布擬合圖。選擇菜單“Analyze”→“Distribution(Y)”，打開(kāi)“Distribution(Y)”對(duì)話(huà)框并按如圖5-33所示設(shè)置。

圖5-34參數(shù)估計(jì)對(duì)話(huà)框與income變量的密度擬合圖變量Income的密度擬合圖和參數(shù)密度估計(jì)如圖5-34右與圖5-35所示。圖5-35income變量的參數(shù)密度估計(jì)

2.繪制QQ圖如果在圖5-33右所示的“Distribution(Y)”對(duì)話(huà)框中選中“NormalQQPlot（正態(tài)QQ圖）”復(fù)選框，如圖左所示，則可以得到QQ圖，如圖右所示。

選擇菜單“Curves（曲線(xiàn)）”→“QQRefLine（QQ參考線(xiàn)）”，打開(kāi)“QQRefLine”對(duì)話(huà)框。選擇“Method（方法）”欄下的“LeastSquares（最小二乘）”，如圖左，單擊“OK”按鈕得到帶參考線(xiàn)的QQ圖（圖右）。

選擇菜單“

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

講稿5 區(qū)間估計(jì)與假設(shè)檢驗(yàn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

講稿5 區(qū)間估計(jì)與假設(shè)檢驗(yàn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔