數(shù)學(xué)統(tǒng)計(jì)學(xué)第10講-第10章-單樣本顯著性檢驗(yàn)_第1頁(yè)
數(shù)學(xué)統(tǒng)計(jì)學(xué)第10講-第10章-單樣本顯著性檢驗(yàn)_第2頁(yè)
數(shù)學(xué)統(tǒng)計(jì)學(xué)第10講-第10章-單樣本顯著性檢驗(yàn)_第3頁(yè)
數(shù)學(xué)統(tǒng)計(jì)學(xué)第10講-第10章-單樣本顯著性檢驗(yàn)_第4頁(yè)
數(shù)學(xué)統(tǒng)計(jì)學(xué)第10講-第10章-單樣本顯著性檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

[數(shù)學(xué)]統(tǒng)計(jì)學(xué)第10講-第10章-單樣本顯著性檢驗(yàn)隨機(jī)抽取一個(gè)大樣本,其個(gè)體分?jǐn)?shù)的分布見(jiàn)圖10-1(a)如果抽取樣本量N=3的100個(gè)個(gè)樣本,計(jì)算每個(gè)樣本平均數(shù),圖10-1b包含68%的樣本均數(shù),每個(gè)樣本平均數(shù)會(huì)是一樣嗎?如果抽取N=20的100個(gè)個(gè)樣本,計(jì)算每個(gè)樣本平均數(shù),圖10-1c樣本平均數(shù)與總體平均數(shù)相差較小如果抽取樣本容量N=40的100個(gè)樣本,計(jì)算每個(gè)樣本平均數(shù),圖10-1d樣本平均數(shù)與總體平均數(shù)相差更小從總體抽取一個(gè)樣本的分布總面積的68%=個(gè)體分?jǐn)?shù)方差

樣本平均數(shù)的分布總面積的68%=樣本均數(shù)的方差=樣本均數(shù)的標(biāo)準(zhǔn)差樣本平均數(shù)的平均數(shù)的標(biāo)準(zhǔn)差,就稱(chēng)為均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean),如果總體標(biāo)準(zhǔn)差,那么標(biāo)準(zhǔn)誤:10-1如果總體標(biāo)準(zhǔn)差未知,那么標(biāo)準(zhǔn)誤:10-2無(wú)論總體標(biāo)準(zhǔn)差還是未知,標(biāo)準(zhǔn)誤的大小取決于總體的變異與樣本大小。標(biāo)準(zhǔn)誤=μ=50σ=2總體中個(gè)體分?jǐn)?shù)小樣本大樣本10.2統(tǒng)計(jì)假設(shè)檢驗(yàn):總體均數(shù)和標(biāo)準(zhǔn)差圖a,知總體μ和σ,從中抽取大量樣本,見(jiàn)圖b圖b,可以描述這些大量樣本的平均數(shù)和標(biāo)準(zhǔn)差,可用來(lái)確定正態(tài)曲線下的概率值。圖c,通過(guò)正態(tài)分布的概率關(guān)系,可計(jì)算任意一個(gè)樣本的平均數(shù)有關(guān)的概率10.2.1樣本平均數(shù)落在特定區(qū)間的概率

如前述,任一正態(tài)變量都可轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,可根據(jù)z分?jǐn)?shù)與正態(tài)曲線下的面積關(guān)系求概率

換言之,任給一個(gè)原始分?jǐn)?shù),只要知道該分?jǐn)?shù)之外的面積比例,就可以知道與此相應(yīng)的z值。

同理,任給一個(gè)樣本平均數(shù),只要知道該平均數(shù)之外的面積比例,就可以知道與此相應(yīng)的z值=2/2=1例2:已知μ=50,σ=10,從該總體隨機(jī)抽取一個(gè)N=25的樣本,問(wèn)該≥52的概率為多少?P(48≤X≤52)=P(-1≤z≤1)=2×0.34=68%10.2.2樣本平均數(shù)的假設(shè)檢驗(yàn)例3:一所學(xué)校對(duì)四個(gè)班的教學(xué)進(jìn)行為期一年的計(jì)算機(jī)閱讀教學(xué)。已知測(cè)驗(yàn)的常模為μ=250,σ=50,一年后進(jìn)行測(cè)驗(yàn),從四個(gè)班隨機(jī)抽查100人,=263,試問(wèn)傳統(tǒng)教學(xué)與計(jì)算機(jī)教學(xué)有無(wú)差異?1.H0:μ=μ0=250,2.H1:μ≠2503.統(tǒng)計(jì)檢驗(yàn):因?yàn)棣遥允褂脄檢驗(yàn)4.顯著性水平:α=0.01雙尾5.抽樣分布:正態(tài)概率曲線6.拒絕H0的臨界區(qū)間Z面積尾部2.5800.49510.0049Z面積尾部2.330.49010.0099Z面積尾部1.9600.47500.0250Z面積尾部1.640.44950.0505因?yàn)閨z|>2.58,所以P<0.01,拒絕H0,差異有統(tǒng)計(jì)學(xué)意義。所在四個(gè)班級(jí)平均分不同于250分的總體。犯錯(cuò)誤的風(fēng)險(xiǎn)為0.01。例3:一所學(xué)校對(duì)四個(gè)班的教學(xué)進(jìn)行為期一年的計(jì)算機(jī)閱讀教學(xué)。已知測(cè)驗(yàn)的常模為μ=250,σ=50,一年后進(jìn)行測(cè)驗(yàn),從四個(gè)班隨機(jī)抽查100人,=263,試問(wèn)傳統(tǒng)教學(xué)與計(jì)算機(jī)教學(xué)有無(wú)差異?10.3通過(guò)樣本數(shù)據(jù)進(jìn)行參數(shù)估計(jì)—點(diǎn)估計(jì)人口普查中的資料可以獲得總體信息,多數(shù)情況不能獲得總體信息,盡管如此,我們?nèi)匀豢梢圆捎脴颖窘y(tǒng)計(jì)量推測(cè)總體參數(shù)。實(shí)際工作中是抽取單一樣本,利用樣本統(tǒng)計(jì)量對(duì)總體進(jìn)行的估計(jì)稱(chēng)為點(diǎn)估計(jì)。方差用方差描述樣本的變異有沒(méi)有問(wèn)題?沒(méi)有問(wèn)題再問(wèn):用方差估計(jì)總體方差有沒(méi)有問(wèn)題?答:有問(wèn)題,一般地,樣本方差估計(jì)總體方差是偏低的。如果用大樣本估計(jì)總體方差,得到的是無(wú)偏估計(jì):σ2的無(wú)偏估計(jì):10-4σ的無(wú)偏估計(jì):10-5因此,平均數(shù)抽樣分布的總體方差估計(jì)值:10-6平均數(shù)抽樣分布的標(biāo)準(zhǔn)誤:10-7或者如果選擇有偏S2

而非無(wú)偏估計(jì),常常采用:10-8行為科學(xué)常常采用公式10-8,我們遵循這一公式表10-1溫習(xí)平均數(shù)、方差和標(biāo)準(zhǔn)差的符號(hào)

Sσ標(biāo)準(zhǔn)差

S2σ2σ2方差μ,μ0平均數(shù)樣本統(tǒng)計(jì)量(經(jīng)驗(yàn)上的)總體參數(shù)(理論上的)平均數(shù)抽樣分布的無(wú)偏總體估計(jì)(經(jīng)驗(yàn)上的)平均數(shù)的抽樣分布參數(shù)(理論上的)圖10-6樣本數(shù)據(jù)可以用來(lái)估計(jì)總體方差(σ2)的無(wú)偏估計(jì)以及平均數(shù)的標(biāo)準(zhǔn)誤,樣本方差越大,總體方差的估計(jì)值和平均數(shù)的估計(jì)標(biāo)準(zhǔn)誤也越大樣本數(shù)據(jù)或10.4參數(shù)未知時(shí)統(tǒng)計(jì)假設(shè)檢驗(yàn)—t檢驗(yàn)如果總體方差,用如果總體方差未知,用圖10-7當(dāng)自由度=3,10和∞時(shí),t分布于標(biāo)準(zhǔn)正態(tài)分布的比較注:自由度是指對(duì)一組數(shù)據(jù)進(jìn)行一定的控制之后,可以自由變化的數(shù)據(jù)個(gè)數(shù)。假設(shè)有四個(gè)數(shù):18、23、27、32,和是多少?平均數(shù)是多少?這四個(gè)數(shù)的和是100,平均數(shù)是=25(18-25)+(23-25)+(27-25)+(32-25)=(-7)+(-2)+2+7=0如果必須根據(jù)平均數(shù)計(jì)算離差,那么只有第四個(gè)固定,其他三個(gè)可以自由變化。自由度f(wàn)=4-1=3

推而廣之:任意一個(gè)樣本,我們對(duì)它只有一個(gè)限制條件,那么這個(gè)樣本的自由度就是N-1,今后我們使用t

分布進(jìn)行各種檢驗(yàn),會(huì)用各種不同的自由度。

需要說(shuō)明的是,t檢驗(yàn)是一種穩(wěn)健的檢驗(yàn),這就意味著即使總體分布嚴(yán)重偏離正態(tài)分布,t檢驗(yàn)的統(tǒng)計(jì)推論也是相當(dāng)有效的,這個(gè)結(jié)論是由中心極限定理決定的。我們我們疑心分布是否符合正態(tài)性,明智的做法是增加樣本量。10.4.1t分布的特點(diǎn)t分布與標(biāo)準(zhǔn)正態(tài)分布一樣,關(guān)于平均數(shù)0對(duì)稱(chēng)。t分布的離散程度比正態(tài)分布大|z|≥1.96拒絕區(qū)域面積5%|t|≥1.96拒絕區(qū)域面積15%t分布的臨界值表與正態(tài)分布不同,t分布的臨界值(criticalvalue)是指與各種顯著性水平相對(duì)應(yīng)的臨界值區(qū)域的對(duì)應(yīng)值。查表時(shí),先找到df=3,按雙尾α=0.05往下找到臨界值t=3.182。一旦算的的t值大于3.182,就拒絕Hσ未知時(shí)的統(tǒng)計(jì)假設(shè)檢驗(yàn):?jiǎn)螛颖厩闆r例4:一所學(xué)校對(duì)全校教學(xué)進(jìn)行測(cè)驗(yàn)。如果測(cè)驗(yàn)的分?jǐn)?shù)低于250,可獲得政府部門(mén)的撥款,從全校隨機(jī)隨機(jī)抽查10人進(jìn)行測(cè)驗(yàn),結(jié)果=243.3,標(biāo)準(zhǔn)差S=5.1,試問(wèn)全校平均分與250有無(wú)差異?能否獲得撥款?1.H0:μ=μ0=2502.H0:μ≠2503.統(tǒng)計(jì)檢驗(yàn):因?yàn)棣椅粗?,所以使用t檢驗(yàn)4.顯著性水平:α=0.05,雙尾5.抽樣分布:自由度df=10-1=9的t分布6.拒絕H0的臨界區(qū)間因?yàn)閠=-3.94,|t|>2.262,所以拒絕虛無(wú)假設(shè),按照α=0.05雙尾的顯著性水平差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為該校測(cè)驗(yàn)平均分?jǐn)?shù)低于250??梢垣@得政府撥款。10.5參數(shù)估計(jì):區(qū)間估計(jì)除了點(diǎn)估計(jì)。推論統(tǒng)計(jì)還包括區(qū)間估計(jì)。區(qū)間估計(jì)(intervalestimation)是指包括總體真值的范圍所作的估計(jì)。例5:成都電視臺(tái)8月初報(bào)道有1名13歲的肥胖兒童名叫浩浩的,體重到達(dá)230斤,假設(shè)你不知道他的真實(shí)體重,你憑什么猜測(cè)他的體重呢?你有多大把握說(shuō)他的體重是230斤呢?一般是通過(guò)觀察,憑借印象猜測(cè)他是200斤,這個(gè)就叫“點(diǎn)估計(jì)〞,如果猜測(cè)體重大約在200~240斤,就稱(chēng)為區(qū)間估計(jì)。10.6置信區(qū)間與置信限總體均數(shù)真值落入的區(qū)間,就稱(chēng)為置信區(qū)間。(confidenceinterval),置信界限稱(chēng)為置信限(confidencelimit),α=0.05的置信區(qū)間稱(chēng)為95%的置信區(qū)間。α=0.01的置信區(qū)間稱(chēng)為99%的置信區(qū)間。例5在例4中,已知,N=10,計(jì)算總體測(cè)驗(yàn)分?jǐn)?shù)95%的置信區(qū)間。

所以μ0的下限=解釋置信區(qū)間需注意的問(wèn)題:在計(jì)算總體均數(shù)可能落入的區(qū)間時(shí),我們不知道計(jì)算的樣本平均數(shù)正確的概率有多大,也就不能夠確定總體均數(shù)為μ的概率是95%還是99%。我們計(jì)算的概率不是針對(duì)總體均數(shù),而是針對(duì)區(qū)間內(nèi)包含總體均數(shù)的概率。從總體中重復(fù)抽取100個(gè)樣本,理論上有95的區(qū)間包含總體均數(shù),大約有5個(gè)不包含。這里的C表示總體均數(shù)的置信區(qū)間,而非概率10.7Pearson相關(guān)系數(shù)r的檢驗(yàn):?jiǎn)蝹€(gè)樣本回憶下,相關(guān)系數(shù)在什么范圍?|r|≤1,r=±1,完全相關(guān),r=0,不相關(guān)對(duì)于單個(gè)樣本,假設(shè)H0:ρ=0圖10-9,ρ=-0.8,ρ=0,ρ=+0.8相關(guān)系數(shù)的抽樣分布10.7.1總體相關(guān)系數(shù)ρ=0時(shí)的假設(shè)檢驗(yàn)10-11df=N-2,為什么?例6社會(huì)心理學(xué)家編制了一份測(cè)量人們是否服從權(quán)威的量表,對(duì)15名被試進(jìn)行了測(cè)試,其得分與另外一個(gè)對(duì)少數(shù)群體歧視的調(diào)查量表得分相關(guān)。兩組得分的相關(guān)系數(shù)r=0.6,即對(duì)權(quán)威服從的得分越高,對(duì)少數(shù)群體的歧視就越厲害,這個(gè)相關(guān)系數(shù)是否來(lái)自于ρ=0的總體呢?1.H0:ρ≤02.H0:ρ>03.統(tǒng)計(jì)檢驗(yàn):自由度=N-2,使用t檢驗(yàn)4.顯著性水平:α=0.05,單尾檢驗(yàn)5.抽樣分布:自由度df=15-2=13的t分布6.拒絕H0的臨界區(qū)間:t≥1.771,如果t>1.771,拒絕H0。因?yàn)閠>1.771,它落入了拒絕H0的臨界區(qū)間,所以拒絕H0,這兩個(gè)得分的總體相關(guān)系數(shù)大于零。10.7.2等級(jí)相關(guān)系數(shù)rS

的假設(shè)檢驗(yàn):?jiǎn)螛颖締?wèn)題:假設(shè)你是一名教師,你對(duì)“智力與領(lǐng)導(dǎo)力是相關(guān)變量〞抱有質(zhì)疑,沒(méi)有適當(dāng)?shù)亩攘繙y(cè)量領(lǐng)導(dǎo)力,但是可以對(duì)領(lǐng)導(dǎo)力加以排序,從而組成順序量表如下。智123456789101112131415領(lǐng)429171081353116121514D-30-63-2-4-1-547061-11D2903694161251649036111試問(wèn):r=0.64的相關(guān)系數(shù)是否是顯著的?拒絕H0,智力水平與領(lǐng)導(dǎo)角色顯著相關(guān)。統(tǒng)計(jì)表的來(lái)源:*ReporducedwithkindpermissionfromS.KokoskaandD.Zwillinger.1999.ProbabillityandStatisticsTablesandFormulae,Chapman&Hall/CRC,BocaRaton,Florida,188.查Spearman秩相關(guān)系數(shù)rs

的臨界值表10.8案例2.H0:μ≠1003.統(tǒng)計(jì)檢驗(yàn):因?yàn)棣?,所以使用z檢驗(yàn)4.顯著性水平:α=0.01,雙尾5.抽樣分布:正態(tài)分布6.拒絕H0的臨界區(qū)間1.H0:μ=100某公司欲招聘幾百名裝配工去組裝高精度儀器的小型部件,這個(gè)工作要求手眼協(xié)調(diào)能力高。在例行體檢中,發(fā)現(xiàn)有30名服用了大麻。于是對(duì)這30名進(jìn)行一種手的靈敏度測(cè)驗(yàn),已知測(cè)驗(yàn)常模為μ=100,σ=15,應(yīng)聘者=92,S=10.因?yàn)閦=-2.92<-2.58,P<0.05,按雙尾α=0.05,拒絕H0,這30名體檢陽(yáng)性者應(yīng)聘成績(jī)不如更大總體中隨機(jī)抽取的樣本中的期望成績(jī)。注意:這個(gè)檢查結(jié)果雖然支持了你的疑心,但是實(shí)驗(yàn)設(shè)計(jì)并不嚴(yán)密,該研究沒(méi)有設(shè)置對(duì)照組,也沒(méi)有對(duì)被試者進(jìn)行隨機(jī)分配。這些人是公司挑選的,這個(gè)結(jié)果也可能是出于另外的原因致使其操作水平與預(yù)期水平有顯著差異。計(jì)算置信區(qū)間:于是95%的置

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論