卡方檢驗法在檢驗學(xué)生成績中的應(yīng)用[高等教育]_第1頁
卡方檢驗法在檢驗學(xué)生成績中的應(yīng)用[高等教育]_第2頁
卡方檢驗法在檢驗學(xué)生成績中的應(yīng)用[高等教育]_第3頁
卡方檢驗法在檢驗學(xué)生成績中的應(yīng)用[高等教育]_第4頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 檢驗法在檢驗學(xué)生成績中的應(yīng)用摘 要在對學(xué)生成績分析時,采用數(shù)理統(tǒng)計中的檢驗法可以方便有效地得出相關(guān)數(shù)據(jù)。以某初中全體學(xué)生的數(shù)學(xué)成績?yōu)榭傮w,采用卡方擬合檢驗法來檢驗初三學(xué)生的數(shù)學(xué)成績近似的服從正態(tài)分布,以及檢驗其相應(yīng)的方差是否正確,完成對考試成績客觀準(zhǔn)確的分析,充分了解學(xué)生的學(xué)習(xí)情況。利用卡方分布檢驗中重要應(yīng)用列聯(lián)表獨(dú)立檢驗對學(xué)生數(shù)學(xué)成績與學(xué)校對其所培養(yǎng)的重視程度的關(guān)系進(jìn)行研究,這可以幫助我們?nèi)グl(fā)現(xiàn)教育教學(xué)中所要發(fā)生的問題,為教育質(zhì)量的認(rèn)定與評價提供有效的保障。關(guān)鍵詞: 檢驗法;假設(shè)檢驗;卡方分布教輔工具bThe application of -test in test scores of s

2、tudentsAbstractIn the analysis of student achievement, using the test statistics can be conveniently and effectively get the relevant data. A junior high school student with math scores for overall, using the chi-squared fit to test the students mathematical results approximately obey the normal dis

3、tribution, and test the corresponding variance is correct, complete analysis of test scores of objective and accurate, the full understanding of students learning. Using the card application distribution test of contingency table test for students to study mathematics achievement and school emphasis

4、 on its culture, which can help us to discover what happens in education and teaching, to provide an effective guarantee for the monitoring and evaluation of the quality of education.Keywords: -test, hypothesis testing, distribution目 錄中文摘要 I英文摘要II引 言11. 常用統(tǒng)計量 21.1 中值21.2 平均值21.3 標(biāo)準(zhǔn)差 21.4 區(qū)域 21.5 模式

5、22.假設(shè)檢驗的基本概念 42.1 問題的提法 42.2 假設(shè)檢驗的基本思想 42.3 假設(shè)檢驗的定義與步驟53.檢驗法在檢驗學(xué)生成績中的應(yīng)用 73.1 參數(shù)檢驗73.2 非參數(shù)檢驗 103.3 列聯(lián)表獨(dú)立性檢驗 164 結(jié)語 19參考文獻(xiàn) 20引 言在現(xiàn)實生活中,我們經(jīng)常遇到一些現(xiàn)象可以利用數(shù)學(xué)知識進(jìn)行解釋與解決的。面對一堆數(shù)據(jù)我們可以應(yīng)用數(shù)理統(tǒng)計的知識去進(jìn)行分析,然后找到它們的規(guī)律,這對我們生活工作有著理論指導(dǎo)作用?,F(xiàn)實中有很多數(shù)據(jù)可以建立數(shù)據(jù)模型進(jìn)行分析利用,如學(xué)生成績、股票收益、人的身高體重等等。在教學(xué)過程中考試是必不可少,它能夠檢驗與反映學(xué)生所掌握的知識水平,也是檢驗教師所實施的教學(xué)

6、方式所達(dá)到的效果的一種重要方法。通過考試,我們可以將學(xué)生的成績看成數(shù)據(jù)資源,然后運(yùn)用所學(xué)數(shù)理統(tǒng)計中知識,進(jìn)行利用分析這些數(shù)據(jù)。在分析這些數(shù)據(jù)之前我們是不知道它們的總體是如何分布的,所以我們就需要利用樣本對總體進(jìn)行假設(shè)檢驗,而這種假設(shè)檢驗稱為非參數(shù)檢驗1。非參數(shù)檢驗方法有很多,如擬合檢驗法、t檢驗、柯爾莫哥洛夫檢驗、符號檢驗、秩檢驗等。這里采用檢驗法來檢驗初三學(xué)生的數(shù)學(xué)成績近似的服從正態(tài)分布。通過理統(tǒng)計分析之后,我們能夠?qū)逃虒W(xué)中效果得到一定了解,這對今后教育教學(xué)工作有一定的借鑒作用。1. 常用統(tǒng)計量為了方便對數(shù)據(jù)分析的說明以及建立模型的需要,我們將成績視為總體隨機(jī)變量,記作,而學(xué)生成績里的數(shù)

7、據(jù)就可視為總體的一組樣本,那么利用統(tǒng)計學(xué)中經(jīng)常用的統(tǒng)計量對樣本作出數(shù)據(jù)分析,就能夠得出一些相關(guān)的教育教學(xué)的結(jié)論2。在平時教育教學(xué)工作中,我們經(jīng)常運(yùn)用以下幾個統(tǒng)計量進(jìn)行數(shù)據(jù)分析:1.1 中值中值是表示對總學(xué)生成績按照高低進(jìn)行排序之后,處于在總成績中間位置的分?jǐn)?shù)。它是用來反映全體學(xué)生考試成績的具有代表性的數(shù)值,在一定程度上可以反映學(xué)生成績整體水平,且不受到學(xué)生成績兩極分化的影響。它的主要不足之處是不具有很強(qiáng)的可靠性,不能客觀的說明學(xué)生成績的水平。1.2 平均值平均值用來反映學(xué)生學(xué)習(xí)成果的平均水平,運(yùn)用它的主要的意義在于方便學(xué)生知道自己在班級的地位,教師也可以利用在各個班級間作比較。它的不足之處是易

8、受到個別數(shù)據(jù)的影響,使其不具有客觀的代表性,從而無法客觀的反映學(xué)生的成績情況。1.3 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是在數(shù)理統(tǒng)計中經(jīng)常使用并作為統(tǒng)計分布程度上的測量。標(biāo)準(zhǔn)差定義是總體各單位標(biāo)志值與其平均數(shù)離差平方的算術(shù)平均數(shù)的平方根,它反映組內(nèi)個體間的離散程度3。而標(biāo)準(zhǔn)差運(yùn)用在教育教學(xué)中就是用來反映了學(xué)生成績的分布相對于總體的均值的離散程度。如果標(biāo)準(zhǔn)差越大,則說明學(xué)生成績的高低相差越大,由此可看出學(xué)生間學(xué)習(xí)成績相距較大。1.4 區(qū)域區(qū)域是指一段數(shù)據(jù)的分布范圍,而運(yùn)用到學(xué)生成績中是指學(xué)生成績的最高分與最低分之差,它是用來反映總體學(xué)生的學(xué)習(xí)成績上的所分布的范圍,運(yùn)用它可以讓我們對學(xué)生成績的有一個大體的了解。1.5

9、模式模式運(yùn)用到學(xué)生成績中去,主要是指總體成績中出現(xiàn)次數(shù)最多的一個分?jǐn)?shù),它是用來反映學(xué)生成績主要分布在什么地方。利用它我們能夠大體知道學(xué)生水平在什么位置,它的不足之處在于不具有客觀的可靠性。2.假設(shè)檢驗的基本概念2.1 問題的提法在數(shù)學(xué)學(xué)習(xí)中,我們常常遇到“假設(shè)正確”、“假設(shè)函數(shù)單調(diào)遞增”之類的語句。而在數(shù)理統(tǒng)計假設(shè)中的“假設(shè)”與這些的意義是不同的。它不是一個正確的命題出現(xiàn)的,而是作為一個陳述,其是否正確,我們是否愿意認(rèn)可它,這些都是需要依據(jù)樣本分析才能做出最后的決定。而這做出決定的過程,我們稱作對該假設(shè)進(jìn)行檢驗4。在統(tǒng)計學(xué)中,我們把需要根據(jù)樣本去推斷命題是否正確的稱為一個假設(shè),通過樣本對一個假

10、設(shè)做出“是”或“不是”的一個判斷的過程,稱這為檢驗這個假設(shè),具體的判斷規(guī)則稱為該假設(shè)的一個檢驗,檢驗的結(jié)果若是肯定該命題,則稱為接受該假設(shè),反之則是否定或拒絕該假設(shè)5。利用統(tǒng)計假設(shè)檢驗處理實際問題時,我們一般可以分為四條:(1)明確所需處理的問題,其答案只能是“不是”或“是”。(2)取得樣本并知道樣本的分布。(3)把回答是“是”的轉(zhuǎn)化到樣本分布上所得命題稱為假設(shè)。(4)根據(jù)樣本數(shù)據(jù),進(jìn)行分析計算,得到“拒絕”、“接受”的假設(shè)的決定。2.2 假設(shè)檢驗的基本思想為了方便理解假設(shè)檢驗的基本思想,我們先說明相應(yīng)的問題。例 假設(shè)小明說他的袋子里裝了10個大小相同的球,其中5個白球,5個黑球?,F(xiàn)在我們進(jìn)行

11、有放回的摸球試驗,每次摸一個球后記錄顏色,試驗結(jié)果是全部是黑色的球,那么我們對小明的說法兩種看法:一種是他的說的是對的,我們的試驗只是運(yùn)氣好而已;另一種看法是認(rèn)為他是說謊,我們運(yùn)氣哪有這么好,而這只是我們自己的想法,這還需要一個科學(xué)客觀的分析論證?,F(xiàn)在我們對上面問題進(jìn)行分析論證:現(xiàn)在我們假設(shè)“一半為黑球”是真命題,那么在有放回的試驗中,我們可以知道其概率分布為 得出這次試驗中黑球總數(shù)為根據(jù)以前所學(xué)知識我們隨機(jī)變量 (2.2.1)顯然這是一個小概率的事件,也就是說100人中大約只有3個人才會出現(xiàn)這樣的結(jié)果。然而我們就是三人中的一個人,而現(xiàn)實生活經(jīng)驗告訴我們這個可能性太低。當(dāng)然我們也不能否認(rèn)這種事

12、件可能出現(xiàn)的,所以我們得出一個比較科學(xué)結(jié)論:冒著的錯誤來不贊成他的說法。以上的分析論證就是數(shù)理統(tǒng)計學(xué)中假設(shè)檢驗的基本思想,它有點(diǎn)像中學(xué)數(shù)學(xué)證明中的反證法,首先需要假設(shè)一個命題為真的,然后根據(jù)這命題和已知的條件進(jìn)行推理,最后得到一個矛盾的結(jié)果,這就可以說該命題不成立,從而確定反命題成立。而在統(tǒng)計學(xué)中這種“矛盾”跟我們以前學(xué)習(xí)的“矛盾”不同,這里我們指小概率事件,還有一點(diǎn)需要說明的是在以前數(shù)學(xué)證明中一旦命題不成立時,我們就認(rèn)為其反命題成立,而我們在數(shù)理統(tǒng)計中否定一個假設(shè)是指“冒多大”的風(fēng)險6。2.3 假設(shè)檢驗的定義與步驟1.零假設(shè)與對立假設(shè)在檢驗假設(shè)中,常把一個被檢驗的假設(shè)稱作為零假設(shè)(原假設(shè)),

13、記為,未知的總體參數(shù)等于某個特殊的常數(shù)值,記作,而與零假設(shè)的對立面叫作對立假設(shè)(備擇假設(shè))7。2.檢驗統(tǒng)計量在檢驗一個假設(shè)時所要使用的統(tǒng)計量稱為檢驗統(tǒng)計量,使原假設(shè)得到接受的那些樣本所在的區(qū)域,稱為該假設(shè)檢驗的接受域,而使原假設(shè)被否定的那些樣本所成德區(qū)域,則稱為該檢驗的否定域8。3.假設(shè)檢驗的步驟(1)根據(jù)相關(guān)的問題做出相應(yīng)的零假設(shè),同時也給出它的對立假設(shè);(2)在的前提下,選擇相應(yīng)的統(tǒng)計量,而統(tǒng)計量需要包含檢驗的參數(shù),并且總體分布已知;(3)根據(jù)相應(yīng)問題定出顯著性水平,然后根據(jù)對立假設(shè)和總體統(tǒng)計量的分布,計算出其小概率事件及其概率表達(dá)式。(4)按照樣本值計算出需要的數(shù)值;(5)判斷小概率事件

14、是否發(fā)生,需要綜合(3)(4)就可以看出。根據(jù)實際推動原理:若小概率事件在一次實驗中發(fā)生就認(rèn)為原假設(shè)不合理,于是就拒絕。若小概率事件不發(fā)生,就認(rèn)為原假設(shè)合理,即接受9.3.檢驗法在檢驗學(xué)生成績中的應(yīng)用3.1 參數(shù)檢驗我們這里僅介紹母體的分布為正態(tài)時的檢驗方法,正態(tài)分布含有兩個參數(shù)和,因此,這里的假設(shè)都是對這兩個參數(shù)的假設(shè),現(xiàn)在我們討論有關(guān)方差假設(shè)的顯著性檢驗問題10。設(shè)是取自正態(tài)分布的母體的子樣?,F(xiàn)在需要檢驗假設(shè).下面分別對已知和未知兩種情況說明與論證。1. 是已知的常量。由于樣本的方差是母體方差的無偏估計,那么統(tǒng)計量為當(dāng)是真命題時,那么統(tǒng)計量應(yīng)該在1的附近隨機(jī)的分布,那么當(dāng)假設(shè)成立時,統(tǒng)計量

15、 (3.1.1)服從自由度為的分布11。而現(xiàn)在對于給定的顯著性水平,那么怎么去確定臨界域?因為統(tǒng)計量的值是在一個閉區(qū)間內(nèi),設(shè)存在與,使得上述可知,臨界域的結(jié)構(gòu)形式是。定出和的方法有很多。這是由于我們把分成任意兩個,;分別由確定和。通常和的選取,都是有犯第二類錯誤的發(fā)生概率來確定的。這就需要選定和使得出現(xiàn)第二類錯誤的可能性盡量小??墒窃趯嶋H中計算最優(yōu)的和很麻煩。通常就選取。那么這時和分別是自由度為的分布的和分位點(diǎn),即,這樣我們就得到臨界域當(dāng)樣本觀測值時,就拒絕零假設(shè),不然就接受零假設(shè)?;蛘咄ㄟ^樣本觀測值算出的統(tǒng)計量的值,若它小于或大于時,就拒絕原假設(shè),否則就接受原假設(shè)12。2. 為未知常數(shù)。這時

16、(3.1.1)式所表示的已經(jīng)不是一個統(tǒng)計量。因為它含有的未知數(shù)。運(yùn)用前面的方法,利用樣本的均值來替代未知的總體均值。零假設(shè)成立時,根據(jù)定理可以知道統(tǒng)計量 (3.1.2)服從自由度為的分布。確定相應(yīng)的后,可以跟前面一樣,通過確定出兩個臨界值。不過此時的和都是通過查自由度為的分布表得出的。上這種通過統(tǒng)計量(3.1.1)和(3.1.2)給出的檢驗法則稱作檢驗。例 某班級學(xué)生進(jìn)入高中前的中考成績服從正態(tài)分布。現(xiàn)在隨機(jī)從中抽取10個學(xué)生的參加中考的成績,具體抽樣分?jǐn)?shù)如下:568,570,578,570,572,572,570,596,572,584在檢測水平為情況下,我們能不能相信該班學(xué)生成績方差為64

17、呢?解:根據(jù)題目的意思,可以知道是要進(jìn)行檢驗假設(shè) 由于未知,所以檢驗統(tǒng)計量是而,然后計算得。由此可知因為,根據(jù)檢驗法,應(yīng)該接受,即認(rèn)為這個班級的學(xué)生成績的方差為64。3.2 非參數(shù)檢驗在前面一節(jié)中,介紹了總體分布形式是在已知的條件下來進(jìn)行假設(shè)檢驗相應(yīng)問題,但是在很多地方,我們常常事先并不知道總體的分布類型,而這時我們就需要根據(jù)樣本的分布對總體的分布類型提出相應(yīng)假設(shè)并進(jìn)行相應(yīng)檢驗,而這種檢驗得方法一般被稱為分布擬合檢驗或非參數(shù)檢驗。例如,我們需要考察一個產(chǎn)品的可靠性從而打算運(yùn)用指數(shù)分布的模型,在此之前可能有些理論或檢驗上的依據(jù),但是這可不可行呢?通常我們就需要根據(jù)樣本對總體進(jìn)行檢驗。那么現(xiàn)在我們

18、說明其中一種分布擬合檢驗的方法非參數(shù)檢驗?,F(xiàn)設(shè)離散型總體只能選取個數(shù)值,現(xiàn)在需要進(jìn)行檢驗 (3.2.1)其中,=1且已知??闪钍录?則式(1)可以寫成 (3.2.2)設(shè)為取自總體的樣本,記為樣本中取值為的個數(shù)且為生的頻率。由于頻率的穩(wěn)定性,故當(dāng)較大時,兩者應(yīng)比較接近,所以在成立時,應(yīng)與非常接近。由此可知,與的差異的大小就可以反映的真?zhèn)?。皮爾遜提出用= (3.2.3)作為檢驗的統(tǒng)計量,利用可以均衡兩者的差異的程度,當(dāng)不真時,的值應(yīng)較大,這時拒絕域可取為其中,為某正數(shù),為了得到水平為的檢驗,還需要檢驗統(tǒng)計量在下的分布。下面我們介紹下皮爾遜定理中指出了的漸近分布。(皮爾遜定理)若總體的真實分布已知。

19、那么可以令 則(3.2.3)式所定義的統(tǒng)計量近似地服從自由度為的分布13。有時把(3.2.3)式中的和和分別稱為(或第組的,因的具體值不起作用,它只是起一個標(biāo)識的作用)經(jīng)驗頻數(shù)和理論頻數(shù)。而有上述定理可知,假設(shè)檢驗(3.2.2)的一個水平為的拒絕域為注意到事件群滿足:(1) 互不相容,即;(2) 。則稱做為有限完備事件群,所以上述檢驗也可以叫作為有限完備事件群的檢驗。由于定理的結(jié)論為近似結(jié)果,應(yīng)用時一般要求,且每個,否則相鄰組要進(jìn)行合并。而皮爾遜擬合檢驗法大體是根據(jù)檢驗各個小組服從的實測頻數(shù)與理論頻數(shù)之間的相距多少來判斷經(jīng)驗分布是否服從任何一個預(yù)先給定的分布。它就是通過用各個小組的實測數(shù)據(jù)與理

20、論頻數(shù)之間的差異構(gòu)成了一個符合分布的統(tǒng)計量,并且利用這個統(tǒng)計量來進(jìn)行相應(yīng)的假設(shè)檢驗使用這種方法時要求選取的樣本容量比較大,并在進(jìn)行分組中,每組的理論頻數(shù)至少不小于5。設(shè)總體分布為,選取總體中的樣本為,那么現(xiàn)在我們就利用這組樣本的數(shù)據(jù)來進(jìn)行檢驗假設(shè): ,其中是一個給定的分布函數(shù)14。具體的操作方法可以分為以下幾條: (1) 數(shù)據(jù)分組:把樣本值出現(xiàn)的范圍劃為組 , ,其中。(2) 先求出各個小組的頻數(shù),然后求出各個小組的頻率為 (其中表示內(nèi)的頻數(shù))。(3) 需要求理論頻率為:當(dāng)為真命題時,樣本X出現(xiàn)在區(qū)間中的頻率為:。(4) 計算出統(tǒng)計量: =.根據(jù)上述可以證明:無論是什么樣的分布,當(dāng)為真命題時,

21、只要充分大那么統(tǒng)計量就近似的服從自由度為的分布對于給定的顯著檢驗水平,可查得分布的分位數(shù)。(5) 具體進(jìn)行相應(yīng)計算:根據(jù)樣本的數(shù)據(jù)進(jìn)行分析計算出統(tǒng)計量的具體值(6) 作出相應(yīng)的判斷:當(dāng)時,則拒絕假設(shè)命題;不然就接受假設(shè)不過需要注意的地方是,在進(jìn)行計算時, 的分布必須全部知道。如果中還有個參數(shù)不能完全確定,那么可以利用這些參數(shù)的極大似然估計量來替代它,以此來使得分布函數(shù)能夠完全確定下來,然后再根據(jù)上述方法進(jìn)行檢驗,不過這時的自由度為15。例1 本文選定某個中學(xué)初三學(xué)生的數(shù)學(xué)成績?yōu)檫M(jìn)行研究,運(yùn)用抽樣調(diào)查法從該學(xué)校的學(xué)生中隨機(jī)地抽取200名學(xué)生作為樣本,對這200名學(xué)生的數(shù)學(xué)成績進(jìn)行調(diào)查收取,通過對

22、數(shù)據(jù)進(jìn)行分析計算,觀察其是否服從某種分布,從而來預(yù)測整個初三學(xué)生的數(shù)學(xué)成績。調(diào)查數(shù)據(jù)表如下:圖表3.2.48056615965632890567357686988655558337350876786576872586745633165436358693785782875496452724769864523513563544569306361487864535225967747768357376655735654754965585066594078986353659658704875629365366185582964566435646765566879575451369271584533535

23、24555 524153576748644364 5752425847583562574352375346646364626853574362374353645436634464466664536852624673576553766845637342634565746575638575647683857253那么我們現(xiàn)在對學(xué)生數(shù)學(xué)成績進(jìn)行假設(shè)檢驗:根據(jù)圖表3.2.4中所列的數(shù)據(jù)為初三學(xué)生數(shù)學(xué)成績的容量為的樣本調(diào)查值,記為初三學(xué)生的數(shù)學(xué)成績,那么我們現(xiàn)在對這些數(shù)據(jù)進(jìn)行分析整理:(1)首先需要找出這些數(shù)據(jù)的最大值與最小值,以此來確定成績的分布區(qū)域:根據(jù)圖表3.2.4我們得出: =23; =96,從

24、而定出區(qū)間 ,區(qū)間的長度為: (2)然后確定需要分組的分組數(shù),我們把區(qū)間分成個小的區(qū)間,使得每個小的區(qū)間上有不少于5個樣本值,為了方便進(jìn)行計算,可以選取=8(3)確定組距: ,則,則把分成8個小區(qū)間,即, ,。(4)根據(jù)上述數(shù)據(jù)做出相應(yīng)的直方圖,然后再根據(jù)圖像來進(jìn)行假設(shè)概率分布,從而進(jìn)行驗證將X的取值離散化,這里將的取值分成8組,如圖表3.2.5所示。圖表3.2.5組限頻數(shù)6142951組限頻數(shù)6024115圖表3.2.6 (5)進(jìn)行估計分布:我們通過觀察樣本的直方圖可以得到,學(xué)生成績的直方圖基本上是單峰對稱的,根據(jù)外輪廓線可以估計總體可能服從正態(tài)分布(6)進(jìn)行假設(shè)檢驗:假設(shè)初三學(xué)生的數(shù)學(xué)成績

25、的分布近似的服從正態(tài)分布,即首先,我們需要給出確定的顯著水平,然后假設(shè),其中為初三學(xué)生數(shù)學(xué)成績的分布函數(shù)?,F(xiàn)在我們對上述結(jié)論進(jìn)行檢驗:在給出的顯著水平下的情況下進(jìn)行檢驗假設(shè)。因為中含有未知的參數(shù),所以需要先進(jìn)行參數(shù)的估計。然而我們可以知道和 的極大似然估計值分別為樣本的均值與樣本的方差 那么現(xiàn)在需要計算和。= =59.48, = 216.56,則= 14.72所以原假設(shè)可寫成現(xiàn)在算每一個區(qū)間的理論概率值,隨后計算出相應(yīng)的理論頻數(shù)與統(tǒng)計量的數(shù)值= -;-;通過進(jìn)行計算我們得到的結(jié)果如圖表3.2.7中所列圖表3.2.7編號 160.0193.82.21.2736842140.07114.2-0.2

26、0.0028173290.16733.4-4.40.5796414510.25150.20.80.0127495600.24949.810.22.0891576240.15731.4-7.41.7439497110.06312.6-1.60.203175850.0163.21.81.01256.917671根據(jù)上面的表中計算得出的觀測值為6.917671.然而在顯著水平情況下,通過查閱的分布表,我們很容易得到相應(yīng)的臨界值: 因為,則不能拒絕原假設(shè)所以可以認(rèn)為隨機(jī)抽取的200名初三學(xué)生的數(shù)學(xué)成績的總體服從正態(tài)分布.因此可以推測整個初三全體學(xué)生的數(shù)學(xué)成績服從正態(tài)分布。3.3 列聯(lián)表獨(dú)立性檢驗檢驗的

27、一個重要應(yīng)用是列聯(lián)表獨(dú)立性檢驗,列聯(lián)表是描述兩個分類變量的頻數(shù)分布表16。設(shè)每一個體可能具有或不具有屬性或,而希望考察這兩個屬性是否關(guān)聯(lián)。屬性分成個等級,分成個等級。比如要考察學(xué)生的數(shù)學(xué)成績與其所在的班級的受教育的培養(yǎng)程度是否有關(guān)聯(lián),可以把人按其數(shù)學(xué)成績分成若干個等級,按其所在的班分成若干的等級。設(shè)在所考察的總體中隨機(jī)抽出若干個體,比方說從特定的一群人中抽出若干人。在此假定總體所含個體數(shù)比于所抽出的人數(shù)是很大的,或者,在相反的情況,則設(shè)想抽樣是有放回的試驗。那么這樣能假定所抽個體的類別是獨(dú)立同分布的??紤]二元總體可以有限離散化,不妨假定X與Y的取值范圍可以分成r和s個互不相交的子區(qū)間和記17

28、顯然, 現(xiàn)在我們考慮到下面非參數(shù)假設(shè)檢驗的相關(guān)問題與Y獨(dú)立顯然它可以轉(zhuǎn)化為 可以設(shè)是總體的容量為的樣本,記為樣本中各個分量落入矩形區(qū)域的頻數(shù),且記, 顯然 表3.3.11212根據(jù)上述的方法,我們可以對其進(jìn)行列聯(lián)表的獨(dú)立性檢驗操作。首先,我們可以進(jìn)行論證,其中參數(shù)和的最大似然估計值為 其次,因為所以個參數(shù)和中僅有個獨(dú)立參數(shù)。所以相應(yīng)的統(tǒng)計量其中, ,漸近服從分布。拒絕域相應(yīng)為上述檢驗通常稱為聯(lián)立表的獨(dú)立性檢驗,它在實際應(yīng)用中非常廣泛。例2 某研究機(jī)構(gòu)欲對學(xué)生數(shù)學(xué)成績與所在班級關(guān)系進(jìn)行研究。為此將學(xué)生數(shù)學(xué)成績分成了三個水平階段:優(yōu)秀、良好與合格,并且相應(yīng)的將所在班級依學(xué)校培養(yǎng)重視程度分成了三個層

29、次:普通班、重點(diǎn)班和實驗班?,F(xiàn)在有一個有500人 的樣本資料,見表3.3.2,請在的情況下檢驗學(xué)生數(shù)學(xué)成績與其所在的班級是否有關(guān)系。表3.3.2 調(diào)查資料表數(shù)學(xué)成績所在班級合計普通班重點(diǎn)班實驗班優(yōu)秀25211056良好828830200合格223165244合計33012545500解:本例要檢驗學(xué)生數(shù)學(xué)成績與所在班級的關(guān)系,也即檢驗獨(dú)立性問題,根據(jù)題意建立假設(shè) 本例中行與列相等,所涉及的一個的列聯(lián)表,所以需要計算9個期望頻數(shù)值。表3.3.3 經(jīng)計算的調(diào)查資料數(shù)學(xué)成績所在班級合計普通班重點(diǎn)班實驗班優(yōu)秀25(36.96)21(14)10(5.04)56良好 200合格223(161.04)16(61)5(21.96)244合計33012545500其中括號中的數(shù)字為的值計算統(tǒng)計量在給定的情況下,通過查閱的分布表,我們可以得到。由于,而其落在的是拒絕域上,故我們拒絕,從而接受,即認(rèn)為學(xué)生數(shù)學(xué)成績與其所在班級有關(guān)聯(lián)。4 結(jié)語對學(xué)生成績及其相關(guān)內(nèi)容進(jìn)行分析時, 首先要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論