




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
考試質(zhì)量分析中的統(tǒng)計(jì)量數(shù)處理
過去,考試只是評(píng)分、評(píng)分和計(jì)算平均值,很少很少科學(xué)評(píng)價(jià)分?jǐn)?shù)的可靠性和有效性。因此,有必要根據(jù)教育測(cè)量學(xué)和教育統(tǒng)計(jì)學(xué)的基本原理和方法,對(duì)原始分?jǐn)?shù)進(jìn)行處理和解釋,只有這樣才能對(duì)考生的真實(shí)水平以及對(duì)試題和試卷的質(zhì)量做出科學(xué)的比較和評(píng)價(jià)。筆者編制了名為Examanls(Examinationanalysis)的考試質(zhì)量分析專用軟件,簡(jiǎn)要介紹考試質(zhì)量分析中,有關(guān)考試分?jǐn)?shù)處理和解釋的基本原理及各統(tǒng)計(jì)量數(shù)的意義和優(yōu)缺點(diǎn),以利于考試質(zhì)量分析的普及和推廣。1.分布分布的描述和分析1.1頻率分布算法根據(jù)統(tǒng)計(jì)學(xué)的中心極限定理,只要考生足夠多,他們的水平一般應(yīng)接近正態(tài)分布。判斷考分是否近似正態(tài)分布,最直觀和有效的方法是把考分的頻率分布曲線與均值和方差相同的正態(tài)分布曲線加以比較。但一般常見的考試,由于數(shù)據(jù)過少(只有數(shù)十到一二百名考生),分?jǐn)?shù)分組不可能太細(xì)(否則大多數(shù)組別的頻率將會(huì)是零,從而顯示不出分?jǐn)?shù)分布的規(guī)律性),不可能畫出光滑的頻率分布曲線,而只能代之以頻數(shù)多邊形或直方圖。Examanls提供傳統(tǒng)的按優(yōu)、良、中、及格和不及格分組的頻數(shù)直方圖(根據(jù)不同用戶的需要,也可提供等組距頻數(shù)直方圖)。頻數(shù)多邊形或直方圖雖然能給出分?jǐn)?shù)分布的直觀圖像,但如需深入了解和準(zhǔn)確描述分?jǐn)?shù)分布的全貌和特征,并與正態(tài)分布進(jìn)行定量的比較,則必須進(jìn)一步整理原始分?jǐn)?shù)并計(jì)算出描述分?jǐn)?shù)分布特征的各種統(tǒng)計(jì)量數(shù)。1.2集中量數(shù)的使用集中量數(shù)是描述一批分?jǐn)?shù)的集中趨勢(shì)的量數(shù)。集中量數(shù)可用于參加同一考試的不同班級(jí)之間的比較。Examanls提供平均數(shù)、中數(shù)和眾數(shù)三個(gè)描述集中趨勢(shì)的統(tǒng)計(jì)量數(shù)。1.2.1考生數(shù)n本文中的平均數(shù)指的就是平均分,即原始分?jǐn)?shù)的算術(shù)平均數(shù):其中xi是第i個(gè)考生的原始分?jǐn)?shù),n是考生數(shù)。平均數(shù)具有嚴(yán)密、可靠、代表性強(qiáng)、容易計(jì)算和易于理解等優(yōu)點(diǎn)。其缺點(diǎn)是易受極端數(shù)值的影響,從而損害其代表性。1.2.2中數(shù)中數(shù)中數(shù)(又稱中值或中位數(shù))是指把所有考生的原始分?jǐn)?shù)從高到代排列時(shí),處于中間位置上的那個(gè)分?jǐn)?shù)(如果考生人數(shù)為偶數(shù),則中數(shù)取處于中間位置的那兩個(gè)分?jǐn)?shù)的平均值)。中數(shù)具有意義明確,不受極端數(shù)值影響的優(yōu)點(diǎn)。一旦平均數(shù)由于極端數(shù)值的存在而失去代表性時(shí),中數(shù)則可作為這批數(shù)據(jù)的代表數(shù)值。中數(shù)的缺點(diǎn)是缺乏靈敏性,不如平均數(shù)可靠,不能用代數(shù)方法計(jì)算。1.2.3眾數(shù)可是的特點(diǎn)眾數(shù)(又稱為范數(shù)或密集數(shù))是原始分?jǐn)?shù)中出現(xiàn)次數(shù)最多的分?jǐn)?shù)。眾數(shù)只有在考生人數(shù)較多,且有明顯集中趨勢(shì)時(shí)才有意義。在考生人數(shù)較少的情況下,可能會(huì)沒有眾數(shù),也可能會(huì)出現(xiàn)兩個(gè)或兩個(gè)以上的眾數(shù)。然而,這些情況出現(xiàn)的幾率會(huì)隨著考生人數(shù)的增加而減少,因此在正常情況下,大型考試的眾數(shù)往往是惟一的。Examanls通過計(jì)算機(jī)的直接“觀察”得出眾數(shù)。眾數(shù)的特點(diǎn)是用頻數(shù)的多少來反映集中趨勢(shì),不受極端數(shù)值的影響,其頻數(shù)在總體中所占的比重越大,其代表性也就越強(qiáng);其缺點(diǎn)是在反映集中趨勢(shì)上不如平均數(shù)可靠,而且不能用代數(shù)方法準(zhǔn)確計(jì)算。1.3集中量數(shù)的代表性差異量數(shù)是描述一批分?jǐn)?shù)的差異程度或離散趨勢(shì)的統(tǒng)計(jì)量數(shù)。集中量數(shù)是一個(gè)點(diǎn),表示各分?jǐn)?shù)圍繞該點(diǎn)而分布;差異量數(shù)則是一段距離,表示各分?jǐn)?shù)與某一量數(shù)或與中心點(diǎn)間相差的統(tǒng)計(jì)距離。只有知道了差異量數(shù),才能了解集中量數(shù)的代表性。差異量數(shù)越大,集中量數(shù)的代表性就越小,反之亦然。Examanls提供全矩和標(biāo)準(zhǔn)差兩個(gè)描述離散趨勢(shì)的差異量數(shù)。1.3.1測(cè)試卷的基本結(jié)果應(yīng)符合以下四全距(又稱為極差或兩極差)是包含全部分?jǐn)?shù)在內(nèi)的最小區(qū)間長(zhǎng)度,即一批分?jǐn)?shù)中的最高分?jǐn)?shù)xmax與最低分?jǐn)?shù)xmin之差:全矩在一定意義上反映了這批考生在學(xué)業(yè)水平上的最大差距。因此,如果xmax等于滿分分?jǐn)?shù),或者xmin等于0分(或者兩者同時(shí)成立),則表明這份試卷無法測(cè)出考生水平的最大差距。要適當(dāng)調(diào)整部分試題的難度,才能測(cè)出考生真正的全矩。全矩具有計(jì)算簡(jiǎn)單、意義明確的優(yōu)點(diǎn),其缺點(diǎn)是完全取決于最高和最低這兩個(gè)極端分?jǐn)?shù),而沒有反映出處于兩者之間的各分?jǐn)?shù)的差異狀況,因此,用它來描述離散趨勢(shì)的代表性是很差的。1.3.2考試全距和標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是最為常用的、非常優(yōu)良的差異量數(shù),它能精確地描述分?jǐn)?shù)分布的離散程度,其定義為:在分?jǐn)?shù)呈正態(tài)分布時(shí),全距約為6個(gè)標(biāo)準(zhǔn)差。在考生人數(shù)不太多的情況下,全距接近或超過滿分分?jǐn)?shù)的1/2,而標(biāo)準(zhǔn)差約為全距的1/5~1/4時(shí),分?jǐn)?shù)的離散程度比較合理。如果全距和標(biāo)準(zhǔn)差都很小,則表明考生水平相近(既沒有拔尖的,也沒有太差的),或表明這份試卷未能測(cè)量出考生在學(xué)業(yè)水平上實(shí)際存在的差距。一般對(duì)于有數(shù)十(或更多)人參加的考試,第一種情況是十分罕見的。因此,一旦發(fā)現(xiàn)差異量數(shù)過小,首先應(yīng)從試卷上找原因。如果全距和標(biāo)準(zhǔn)差都很大,就表明考生的發(fā)展很不平衡(水平很高和水平很低的考生均不少,相對(duì)而言,處于平均分附近考生的則不算太多),這種高離散的情況在實(shí)踐中也是不多見的。1.4字段號(hào)形態(tài)量數(shù)是定量描述分布偏離正態(tài)程度的統(tǒng)計(jì)量數(shù)。Examanls提供偏態(tài)系數(shù)和峰態(tài)系數(shù)兩類形態(tài)量數(shù)。1.4.1偏態(tài)系數(shù)和次中心動(dòng)差相對(duì)數(shù)如果分?jǐn)?shù)呈對(duì)稱性分布(包括正態(tài)分布),其平均數(shù)、中數(shù)和眾數(shù)是重合的。一旦三者錯(cuò)開,則表明分?jǐn)?shù)偏離對(duì)稱分布。偏態(tài)系數(shù)就是描述分?jǐn)?shù)偏離對(duì)稱分布程度的統(tǒng)計(jì)量數(shù)。Examanls提供用平均數(shù)—眾數(shù)比較法偏態(tài)相對(duì)數(shù)以及第三次中心動(dòng)差相對(duì)數(shù)(即對(duì)均值的三階中心矩)來表示的兩個(gè)偏態(tài)系數(shù),其計(jì)算公式分別為:比較法只適用于微偏(分布曲線仍呈鐘形)的情況,動(dòng)差法則既可用于微偏,也可用于極偏(分布曲線呈U形或J形)的情況。對(duì)稱分布的偏態(tài)系數(shù)S(包括Sx和Sm)為零;S>0為正偏態(tài)分布(對(duì)鐘形分布,一般會(huì)有X>Md>M0),表明分?jǐn)?shù)高于平均分的考生比例小于50%;S<0為負(fù)偏態(tài)分布(對(duì)鐘形分布,一般會(huì)有M0>Md>X),表明分?jǐn)?shù)高于平均分的考生比例大于50%。三種分布曲線的形狀如圖1所示。1.4.2正態(tài)分布曲線峰態(tài)系數(shù)是描述頻數(shù)分布曲線高峰形態(tài)(高聳程度)的統(tǒng)計(jì)量數(shù),一般以正態(tài)分布的高峰作為比較的標(biāo)準(zhǔn)。峰態(tài)可以用第四中心次動(dòng)差相對(duì)數(shù)(即對(duì)均值的四階中心距)來描述。由于正態(tài)分布的第四次動(dòng)差相對(duì)數(shù)等于3,習(xí)慣上把峰態(tài)系數(shù)定義為:K=0為正態(tài)高峰;K>0表示該分布曲線比正態(tài)分布曲線陡峭,為尖頂高峰;K<0則表示該分布曲線比正態(tài)分布曲線平緩,為平頂高峰(見圖2)。Examanls根據(jù)偏態(tài)系數(shù)和峰態(tài)系數(shù)的不同搭配,提供多種評(píng)價(jià)語句,顯示其對(duì)分?jǐn)?shù)分布狀態(tài)的綜合評(píng)語,一旦出現(xiàn)嚴(yán)重偏離正態(tài)的情況,Examanls就會(huì)顯示警告語句,并提示出現(xiàn)這種情況的可能原因。根據(jù)Examanls提供的集中量數(shù)、差異量數(shù)和形態(tài)量數(shù)及其對(duì)分?jǐn)?shù)分布狀況的評(píng)語,就能詳盡而精確地了解分?jǐn)?shù)分布的全貌和特征,從而可以對(duì)考試的總體情況做出正確的判斷和評(píng)價(jià)。2.考試成績(jī)的表示方法、初始得分和導(dǎo)出得分2.1考生的學(xué)業(yè)水平和原始分?jǐn)?shù)不高用百分制表示的原始分?jǐn)?shù)無疑是使用最廣泛的成績(jī)表示法。然而,原始分?jǐn)?shù)并不具有可比性,即使在同一考試中,原始分?jǐn)?shù)和考生的學(xué)業(yè)水平也不存在簡(jiǎn)單的比例關(guān)系。為正確解釋分?jǐn)?shù)的意義和進(jìn)行比較,就必須把原始分?jǐn)?shù)轉(zhuǎn)換成具有比例量表性質(zhì)的導(dǎo)出分?jǐn)?shù),從而得出有益于教學(xué)決策的信息。Examanls提供原始分?jǐn)?shù)、名次、百分等級(jí)分、標(biāo)準(zhǔn)分、正態(tài)標(biāo)準(zhǔn)分和T分?jǐn)?shù)等六種學(xué)生成績(jī)的表示方法,供用戶選擇。2.2百分等級(jí)分與原始分?jǐn)?shù)把考生按原始分?jǐn)?shù)從高到低順次排列,各考生所對(duì)應(yīng)的序號(hào)(原始分?jǐn)?shù)相同的考生共占同一個(gè)序號(hào))就是考生的名次。名次雖然能說明各考生在全體考生中所處的絕對(duì)位置,但名次的價(jià)值是隨考生人數(shù)的不同而不同的。顯然,30人的小班中的第十名和120人的大班中第十名是不能等值而論的。百分等級(jí)分更能夠反映出考生所處地位的相對(duì)位置量數(shù),它定義為比該考生成績(jī)差的考生占考生總數(shù)的百分比。在上述例子中(如果不存在并列第十名的話)前者的百分等級(jí)分只有66.7%,而后者則高達(dá)91.7%。百分等級(jí)分不但能確定各考生在全體中的相對(duì)位置,而且還能給出一些有關(guān)分?jǐn)?shù)分布的信息。例如,把任意兩個(gè)原始分?jǐn)?shù)所對(duì)應(yīng)的百分等級(jí)分相減,就可以知道成績(jī)處于這兩個(gè)原始分?jǐn)?shù)之間(左開右閉區(qū)間)內(nèi)的考生比例。值得注意的是,名次或百分等級(jí)分與原始分?jǐn)?shù)不是成比例的(或者說前兩者的單位不是等值的)。一般說來,在高分與低分兩個(gè)極端,名次和百分等級(jí)分對(duì)原始分?jǐn)?shù)的反應(yīng)遲鈍,原始分?jǐn)?shù)要有比較大的變化,名次或百分等級(jí)分才會(huì)跳動(dòng)一個(gè)檔次;相反,在峰值分?jǐn)?shù)附近它們反應(yīng)十分敏感,原始分?jǐn)?shù)有一點(diǎn)點(diǎn)變化也會(huì)引起名次和百分等級(jí)分的極大波動(dòng)。單位的不等值導(dǎo)致不能對(duì)名次和百分等級(jí)分進(jìn)行代數(shù)處理。使用下文介紹的正態(tài)化標(biāo)準(zhǔn)分或T分?jǐn)?shù)則能避免這個(gè)缺陷。2.3標(biāo)準(zhǔn)分的變分為比較測(cè)量結(jié)果,必須有一個(gè)等值的單位和一個(gè)特定的參照點(diǎn)。原始分?jǐn)?shù)之所以不能直接進(jìn)行比較,是因?yàn)榉謹(jǐn)?shù)的單位并不等值。不同的考試(由于難度不同)分?jǐn)?shù)的單位固然不同,就連同一份試卷中的不同試題的分?jǐn)?shù)單位也是不等值(甚至可以說是無定值)的。為使分?jǐn)?shù)之間能夠進(jìn)行比較,必須找到一個(gè)不變的測(cè)量參照點(diǎn)和一個(gè)對(duì)同批考生參加所有的考試都保持等值的測(cè)量單位。根據(jù)統(tǒng)計(jì)學(xué)原理,引入變換:可把一般的正態(tài)分布函數(shù)化為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。標(biāo)準(zhǔn)正態(tài)分布函數(shù)的平均值恰好是0,其標(biāo)準(zhǔn)差恰好是1,這正好可以作為對(duì)任何正態(tài)分布都不變的參考點(diǎn)和等值單位。Z稱為標(biāo)準(zhǔn)分(或Z分?jǐn)?shù)),它代表分?jǐn)?shù)X距離平均分有多少個(gè)標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)分可用于不同考試、不同考生、甚至不同科目的考試之間進(jìn)行相對(duì)位置的比較。例如,某考生數(shù)學(xué)和英語考試的原始分?jǐn)?shù)分別為85和73分,而兩次考試的平均分分別為68和55分,標(biāo)準(zhǔn)差分別為12分和8分。如果只看原始分?jǐn)?shù),人們可能會(huì)認(rèn)為該考生的數(shù)學(xué)學(xué)得比英語好,然而,一旦變換為標(biāo)準(zhǔn)分:Z數(shù)=1.42和Z英=2.25,即可發(fā)現(xiàn),原來該考生的英語成績(jī)?cè)诎嗌系南鄬?duì)位置實(shí)際上比數(shù)學(xué)要高得多。從引入過程可知,僅當(dāng)分?jǐn)?shù)呈(或接近)正態(tài)分布時(shí),標(biāo)準(zhǔn)分才有其作為比較標(biāo)準(zhǔn)的意義。一旦分?jǐn)?shù)分布較為嚴(yán)重地偏離正態(tài),就必須把標(biāo)準(zhǔn)分正態(tài)化后才能用于比較。為方便用戶,避免查找正態(tài)概率積分表的麻煩,Examanls采用曲線擬合法和比例插值法直接計(jì)算出各考生的正態(tài)化標(biāo)準(zhǔn)分(與其標(biāo)準(zhǔn)分并列顯示,通過比較可進(jìn)一步了解分布偏離正態(tài)的程度)。正態(tài)化標(biāo)準(zhǔn)分(下文簡(jiǎn)稱為標(biāo)準(zhǔn)分或Z分?jǐn)?shù))不但具有可比性,而且還具有可加性,可以接受各種代數(shù)處理。例如,可以計(jì)算考生各門考試的加權(quán)平均標(biāo)準(zhǔn)分,從而確定各考生的總體學(xué)業(yè)水平在全體中的相對(duì)位置。標(biāo)準(zhǔn)分的意義明確、內(nèi)涵豐富是教育測(cè)量學(xué)中一個(gè)常用的導(dǎo)出分?jǐn)?shù)。標(biāo)準(zhǔn)分的主要缺點(diǎn)是有負(fù)數(shù)和小數(shù)(對(duì)于正態(tài)分布而言,標(biāo)準(zhǔn)分多在-3到+3之間,而且往往是小數(shù));另外,標(biāo)準(zhǔn)分的0代表考生的分?jǐn)?shù)等于平均分(而不是0分)等等,一般人對(duì)這種表示方法會(huì)感到不習(xí)慣,從而會(huì)給以后的統(tǒng)計(jì)分析帶來一定的麻煩。采用T分?jǐn)?shù)就可以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 西安信息職業(yè)大學(xué)《軌道交通通信系統(tǒng)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025至2031年中國手挽繩行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國地埋方管籃球架行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025機(jī)械設(shè)備購買合同協(xié)議范本
- 2025至2030年中國銑削機(jī)夾刀片數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國轎車用減震器油數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國碟形閥數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國智能顆粒自動(dòng)包裝機(jī)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 石首鋁單板施工方案電話
- 氮?dú)夤芫€施工方案
- 員工雇主責(zé)任險(xiǎn)操作管理規(guī)定
- 授信報(bào)告模板
- 鄉(xiāng)村醫(yī)生藥品培訓(xùn)課件
- 鹽漬天然腸衣
- 2024醫(yī)院消防安全培訓(xùn)
- 幼兒歌曲演唱與技法課件
- 兒科難治性癲癇一病一品優(yōu)質(zhì)護(hù)理匯報(bào)課件
- 科技有限公司員工手冊(cè)
- 10KV配電室倒閘操作票
- 降低會(huì)陰側(cè)切率的PDCA
- 加油站電氣線路檢查安全操作細(xì)則
評(píng)論
0/150
提交評(píng)論