教育評價信息的推斷性統(tǒng)計_第1頁
教育評價信息的推斷性統(tǒng)計_第2頁
教育評價信息的推斷性統(tǒng)計_第3頁
教育評價信息的推斷性統(tǒng)計_第4頁
教育評價信息的推斷性統(tǒng)計_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

教育評價信息的推斷性統(tǒng)計第一頁,共三十三頁,2022年,8月28日6.1統(tǒng)計量的分布6.1.1總體的描述6.1.2樣本均值的分布6.1.3樣本方差的分布6.1.4統(tǒng)計量6.1.5F統(tǒng)計量第二頁,共三十三頁,2022年,8月28日6.1統(tǒng)計量的分布

推斷性統(tǒng)計是根據(jù)樣本提供的信息(樣本統(tǒng)計量或樣本分布),在一定的可靠性程度上對總體的特征(總體參數(shù)或總體分布)所進行的估計或推測。第三頁,共三十三頁,2022年,8月28日總體的描述1.總體平均分樣本的平均分是根據(jù)樣本的觀察數(shù)據(jù)獲得的,類似地,總體的平均分是根據(jù)總體的觀察數(shù)據(jù)獲得的。一般用符號或表示總體平均分。2.總體的標準差和方差3.參數(shù)和統(tǒng)計量第四頁,共三十三頁,2022年,8月28日樣本均值的分布

設(shè)x1,x2,…,xn是總體x的一個容量為n的隨機樣本,統(tǒng)計量稱為樣本均值。第五頁,共三十三頁,2022年,8月28日樣本方差的分布

設(shè)x1,x2,…,xn是總體x的一個容量為n的隨機樣本,統(tǒng)計量稱為樣本方差。樣本方差的算術(shù)根s稱為樣本標準差。第六頁,共三十三頁,2022年,8月28日t統(tǒng)計量設(shè)x1,x2,…,xn是取自正態(tài)總體(,)的一個容量為的隨機樣本,與分別為樣本均值和樣本方差,可以證明,統(tǒng)計量第七頁,共三十三頁,2022年,8月28日F統(tǒng)計量第八頁,共三十三頁,2022年,8月28日6.2參數(shù)估計6.2.1參數(shù)點估計6.2.2參數(shù)區(qū)間估計第九頁,共三十三頁,2022年,8月28日6.2參數(shù)估計

參數(shù)估計就是根據(jù)樣本統(tǒng)計量去估計總體參數(shù)。例如,根據(jù)樣本平均數(shù)估計總體平均數(shù)等。參數(shù)估計可分為點估計和區(qū)間估計。第十頁,共三十三頁,2022年,8月28日參數(shù)點估計

直接用樣本統(tǒng)計量的值作為總體參數(shù)的估計值,稱為點估計。通常要估計的總體參數(shù)有:均值(數(shù)學期望)、方差、標準差、比例、相關(guān)系數(shù)等。第十一頁,共三十三頁,2022年,8月28日參數(shù)區(qū)間估計

區(qū)間估計就是在一定的可靠性程度上估計總體參數(shù)所在的范圍。這里,所謂估計的可靠性通常用概率來描述。例如,通過對113名6歲男孩的抽樣調(diào)查,以0.95的概率估計某市6歲男孩的平均身高在109.82~111.58厘米,就是區(qū)間估計。而這一估計正確的可能性,即可靠性是95%。第十二頁,共三十三頁,2022年,8月28日參數(shù)區(qū)間估計

對總體參數(shù)的區(qū)間估計,必須首先明確相應(yīng)統(tǒng)計量的分布形態(tài)和特征,從而在一定的置信度下,推測樣本統(tǒng)計量將落在以總體參數(shù)為中心的一個什么樣的區(qū)間內(nèi)。然后通過對數(shù)學式子的簡單變形,即可在同樣的置信度下,推測以樣本統(tǒng)計量的觀測值為中心的某個包含總體參數(shù)的區(qū)間范圍(置信區(qū)間)。第十三頁,共三十三頁,2022年,8月28日參數(shù)區(qū)間估計

1.單個總體均值的置信區(qū)間

2.兩個總體均值差異的置信區(qū)間

3.總體比例的區(qū)間估計第十四頁,共三十三頁,2022年,8月28日6.3參數(shù)假設(shè)檢驗6.3.1假設(shè)檢驗的基本原理6.3.2假設(shè)檢驗的幾個基本概念6.3.3單總體的Z檢驗和檢驗6.3.4兩總體的檢驗第十五頁,共三十三頁,2022年,8月28日6.3參數(shù)假設(shè)檢驗

假設(shè)檢驗與參數(shù)估計都屬于統(tǒng)計推斷的范疇,但它們的提法是不同的,處理問題的方法也各具特色。簡單地說,參數(shù)假設(shè)檢驗是檢驗未知參數(shù)的假設(shè)成立與否,非參數(shù)檢驗是檢驗未知總體分布的假設(shè)成立與否。第十六頁,共三十三頁,2022年,8月28日假設(shè)檢驗的幾個基本概念顯著性水平小概率原理雙側(cè)檢驗與單側(cè)檢驗檢驗的兩類錯誤及控制第十七頁,共三十三頁,2022年,8月28日單總體的Z檢驗和t檢驗

單個樣本平均值假設(shè)檢驗的方法有三種:單個樣本Z檢驗、單個樣本t檢驗法和威爾科克森符號秩檢驗(Wilcosonsignedranktest)。每一種方法都有兩種假設(shè)檢形式,即臨界值檢驗法和P值法。這里主要介紹單個樣本Z檢驗和單個樣本t檢驗法。第十八頁,共三十三頁,2022年,8月28日單總體的Z檢驗和t檢驗1.總體標準差已知時,單總體的Z檢驗在某些情況下,當校長或教師將班級的考試結(jié)果與學校平均值進行比較時,考試機構(gòu)的研究人員和學科秘書將學校的考試結(jié)果與全市的平均值比較,或與市重點、省重點的平均值比較時;教育行政部門領(lǐng)導將區(qū)、縣的平均成績與省、市的平均成績比較時,可能知道全市、全省的平均分及標準差,這時的比較就屬于總體標準差已知的條件下,單個樣本平均值與總體比較。第十九頁,共三十三頁,2022年,8月28日單總體的Z檢驗和t檢驗用Z檢驗法進行假設(shè)檢驗時,應(yīng)注意以下幾點:(1)樣本容量小于15時,只有在研究的變量呈正態(tài)分布,或非常接近于正態(tài)分布時,可以使用Z檢驗法;(2)樣本容量在15到30之間時,如果數(shù)據(jù)中不存在極大或極小值,或變量分布不明顯偏離正態(tài),可以使用Z檢驗法;第二十頁,共三十三頁,2022年,8月28日單總體的Z檢驗和t檢驗

(3)樣本容量大于30時,一般可以比較放心地應(yīng)用Z檢驗法。但如果樣本中存在極大、極小值,且刪除這些極值不合理時,應(yīng)該檢查極值對假設(shè)檢驗的影響,即樣本中包含極值檢驗一次,不包含極值再檢驗一次,如果兩次檢驗結(jié)果相同,那么可以認為結(jié)論可靠。否則應(yīng)該得出更加保守的結(jié)論,或者采用其他方法進行檢驗。(4)如果樣本中含有極值,且可以將其合理刪除,剩余的樣本數(shù)據(jù)適合進行Z檢驗,可以采用此方法。第二十一頁,共三十三頁,2022年,8月28日單總體的Z檢驗和t檢驗2.總體標準差未知時,單總體的檢驗在許多研究應(yīng)用中,總體的標準差是未知的。因而需要用樣本標準關(guān)代替總體標準差,相應(yīng)地,檢驗統(tǒng)計量變成了統(tǒng)計量。第二十二頁,共三十三頁,2022年,8月28日兩總體的檢驗1.相關(guān)樣本相關(guān)樣本是指兩個樣本內(nèi)個體之間存在著一一對應(yīng)關(guān)系,具體有兩種情況:用同一個測驗對同一組被試前后進行兩次測量,所獲得的兩組測量結(jié)果是相關(guān)樣本(同一被試組)。根據(jù)某些條件基本相同的原則,把被試一一匹配成對,然后將每對被試隨機地分入兩個組,對兩組被試施以不同的處理后,用同一個測驗所獲得的兩組測量結(jié)果,也是相關(guān)樣本(匹配被試組)。第二十三頁,共三十三頁,2022年,8月28日兩總體的檢驗2.獨立樣本獨立樣本是指兩個樣本內(nèi)的個體是隨機抽取的,它們之間不存在一一對應(yīng)關(guān)系。獨立樣本檢驗較為復雜,涉及兩個樣本所來自的兩個總體的方差是否齊性(即是否相等)。第二十四頁,共三十三頁,2022年,8月28日6.4非參數(shù)檢驗6.4.1檢驗6.4.2單一樣本K-S檢驗6.4.3兩個獨立樣本的非參數(shù)檢驗6.4.4兩個相關(guān)樣本的非參數(shù)檢驗第二十五頁,共三十三頁,2022年,8月28日6.4非參數(shù)檢驗

假設(shè)檢驗分為參數(shù)檢驗和非參數(shù)檢驗。參數(shù)檢驗是根據(jù)樣本的統(tǒng)計量對關(guān)于相應(yīng)總體參數(shù)的假設(shè)進行檢驗,它要求總體服從正態(tài)分布,適用于等距數(shù)據(jù)和比率數(shù)據(jù),檢驗的靈敏度較高;而非參數(shù)檢驗是指在總體不服從正態(tài)分布或分布情況不明時,主要用來檢驗數(shù)據(jù)是否來自同一個總體的假設(shè),其假定的前提比參數(shù)檢驗少得多,也容易滿足,適用于各種類型的數(shù)據(jù),但檢驗的靈敏度較差。第二十六頁,共三十三頁,2022年,8月28日6.4非參數(shù)檢驗

在用SPSS工具時,非參數(shù)檢驗主要通過調(diào)用NonparametricTest菜單項來進行,其中包括:Chi-squareTest:檢驗;BinomialTest:二項式檢驗;RunsTest:游程檢驗;第二十七頁,共三十三頁,2022年,8月28日6.4非參數(shù)檢驗1-SampleK-STest:單一樣本K-S檢驗;2-IndependentSamplesTest:兩個獨立樣本非參數(shù)檢驗;K-IndependentSamplesTest:多個獨立樣本非參數(shù)檢驗;2-RelatedSamplesTest:兩個相關(guān)樣本非參數(shù)檢驗;K-RelatedSamplesTest:多個相關(guān)樣本非參數(shù)檢驗。第二十八頁,共三十三頁,2022年,8月28日

檢驗

檢驗既可用于推斷某個變量是否服從某種特定分布的擬合度檢驗(GoodnessofFitTest),也可用于推斷兩個離散型變量是否存在依從關(guān)系的獨立性檢驗或推斷幾次重復試驗的結(jié)果是否是相同的同質(zhì)性檢驗。第二十九頁,共三十三頁,2022年,8月28日

檢驗1.擬合度檢驗所謂擬合,統(tǒng)計學上也稱為擬合度,即擬合的程度。當總體分布未知時,通過樣本有時可以猜測它們的分布是某種特定的分布。這種猜測是否合理就需要檢驗,這種檢驗過程實際上是考察理論分布曲線和實際觀察曲線相適合的程度。2.獨立性或同質(zhì)性檢驗第三十頁,共三十三頁,2022年,8月28日單一樣本K-S檢驗

單一樣本K-S檢驗以前蘇聯(lián)數(shù)學家Kolmogorov和Smirnov人名命名的,是柯爾莫哥洛夫-斯米爾諾夫非參數(shù)檢驗的簡稱。用以檢驗某個樣本所來自的總體是否服從某一理論分布(如正態(tài)分布、均勻分布、泊松分布或指數(shù)分布)的分布擬合度檢驗方法,其零假設(shè)為:樣本所來自的總體分布服從所指定的理論分布。第三十一頁,共三十三頁,2022年,8月28日兩個獨立樣本的非參數(shù)檢驗

兩獨立樣本的差異顯著性檢驗只有在滿足變量為正態(tài)分布的連續(xù)測量數(shù)據(jù)條件時才能進行檢驗,如果兩個樣本所屬的總體分布類型不明,或兩個變量中至少有一個屬于離散型變量,這時要推斷樣本所來自的兩個總體分布是否存在顯著差異,或兩個總體的平均數(shù)或中位數(shù)是否存在顯著差異,就必須調(diào)用兩個獨立樣本的非參數(shù)檢驗,強行進行檢驗容易造成錯誤的結(jié)論。其零假設(shè)為:兩個總體分布之間沒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論