




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、摘要:試卷質(zhì)量分析是學(xué)校教學(xué)質(zhì)量管理工作的一個重要環(huán)節(jié),對于指導(dǎo)教學(xué)工作和提高教學(xué)質(zhì)量有著十分重要的意義1。本文就如何利用數(shù)理統(tǒng)計方法來分析試卷質(zhì)量進行了初步討論。介紹了評估試卷質(zhì)量常用的幾個指標,如信度、效度、難度、區(qū)分度、覆蓋度五度的概念以及計算公式,而且還做了實例分析。最后,文章還對試卷質(zhì)量進行了綜合評價,從而得出如何評價一套試卷質(zhì)量的好壞。關(guān)鍵詞:信度;效度;難度;區(qū)分度;覆蓋度0引言評估試卷的質(zhì)量對教育科學(xué)來說是一個很重要的環(huán)節(jié),試卷質(zhì)量的好壞會間接影響著考試的結(jié)果,而考試的成績又是查看教學(xué)質(zhì)量的重要根據(jù)。對測驗成績的分析與評估,有助于老師總結(jié)經(jīng)驗、吸取教訓(xùn)、改善教學(xué)措施。按照目前我
2、校的學(xué)習(xí)狀況,試卷多為任課老師憑借本身的閱歷,并根據(jù)教學(xué)大綱要求及課堂教學(xué)的實際情況,由不同類型、不同難易水平的試題構(gòu)成的,它或多或少帶有主觀隨意性,可能會造成對學(xué)生結(jié)果評價的主觀性。因而,對學(xué)生測驗成績以及試卷的分析是課堂教學(xué)的延續(xù),是每一位老師必需仔細看待的工作。經(jīng)過分析,一方面能夠及時對試卷中帶有普遍性的題目進行總結(jié)和反思,縮小老師出題的盲目性和隨意性,為后面進一步改良教學(xué)義務(wù)提供信息。另一方面,通過試卷分析可以提升和改善試卷的質(zhì)量,從而真實地反映出教學(xué)程度和學(xué)生的學(xué)習(xí)狀況。1試卷質(zhì)量分析的相關(guān)概念1.1試卷質(zhì)量分析的基本概念分析試卷的質(zhì)量首先要了解試卷質(zhì)量分析的一些基本概念,其幾個基本
3、概念如下:(1)教育評價:根據(jù)一定的教育價值觀或教育目標,通過系統(tǒng)地搜集、分析解釋信息,判斷教育現(xiàn)象的價值,為不斷優(yōu)化教育和教育決策提供依據(jù)的過程2。(2)測量:從廣義而言,測量系根據(jù)法則給事物分派數(shù)字。(3)教育測量:根據(jù)測量學(xué)的原理對教育現(xiàn)象進行量化的過程3。教育測量是教育評價的基礎(chǔ)。(4)教育測驗:教育測量的工具,在教育評價過程中被用來收集資料,簡稱測驗。(5)教育考試:根據(jù)教育目標,選擇有代表性的內(nèi)容,對應(yīng)試者的知識、技能等進行測量與評價的過程。(6)數(shù)學(xué)考試:根據(jù)數(shù)學(xué)教育目標,通過編制試題對學(xué)生進行測驗,然后按照一定的標準對測試結(jié)果加以衡量的一種評價方法。(7)數(shù)學(xué)試卷:數(shù)學(xué)考試運行
4、的實際載體。目前數(shù)學(xué)試卷大致分為四種類型:診斷性試卷,如單元測試卷、教學(xué)質(zhì)量調(diào)研卷、模擬考試試卷;評價性試卷,如期中、期末測試卷,學(xué)業(yè)水平考試卷;選拔性試卷,如高考試卷;競賽性試卷,如全國高中數(shù)學(xué)聯(lián)賽、中國奧林匹克數(shù)學(xué)競賽等各級各類數(shù)學(xué)競賽4。1.2試卷質(zhì)量分析的方法、內(nèi)容對試卷的分析,通常放在學(xué)校教學(xué)考試完畢后才進行,通常從定性和定量兩個方面進行開展。定性分析時,主要考慮:試卷考查的內(nèi)容要求能否達到原定目標;試題間關(guān)系的處理是否恰當(dāng);評分標準是否正確、科學(xué)、合理、明晰,等等。定量分析主要是計算試卷與試題技術(shù)質(zhì)量的指標或參數(shù),包括信度、效度、難度、區(qū)分度、猜測效率等5。1.3試卷質(zhì)量分析的意義
5、試卷質(zhì)量分析對咱們來說有十分重要的意義,但對我們影響最大的有以下三點:(1)評價試卷的質(zhì)量測驗質(zhì)量的好壞很大程度上依賴于測驗試卷的命制質(zhì)量。經(jīng)過對試卷剖析能夠向教師提供相關(guān)試卷與試題的各類技術(shù)指數(shù)值(如:信度、效度、難度、區(qū)分度等),再聯(lián)合教學(xué)內(nèi)容與考察內(nèi)容分析、學(xué)生答卷分析等進行研討,就可以鑒定試卷的好壞,掌握出題技巧,提高教師的專業(yè)水平。(2)改進教學(xué)工作經(jīng)過對試卷剖析,有利于教師仔細反思本身的教學(xué)得失,如教學(xué)過程中教學(xué)內(nèi)容深淺的時候把握得當(dāng),教學(xué)策略方法是否合適,對學(xué)生的學(xué)習(xí)指導(dǎo)是否到位,等等。(3)為以后的考試作準備剖析試卷,能夠改良考試教學(xué)義務(wù),并且,它能夠為改進命題工作提供大量信息
6、,提高試題和試卷的編制質(zhì)量6。為試題庫的建設(shè)做好準備。2試卷質(zhì)量分析的常用指標大批數(shù)據(jù)統(tǒng)計表明,測驗結(jié)果的分布一般遵從正態(tài)分布或類似正態(tài)分布,故咱們可做如下假設(shè): 檢驗的試卷題目數(shù)為 ,評分為百分制,每題滿分為 抽檢容量為 ,樣本值為 , 抽檢的 個學(xué)生各題得分為 則有, ,其中 , 表示第 題的均值和方差。根據(jù)教育測量學(xué)7一書中的相關(guān)知識,衡量試卷質(zhì)量的幾個重要指標有信度、效度、難度、區(qū)分度以及覆蓋度,其概念與計算公式如下:2.1測驗信度信度指可靠性的程度,測驗的信度則指測驗結(jié)果的可靠程度,即實測分數(shù)與考生理論程度間的一致性水平。它是反應(yīng)測量工具可靠性的指標。目前,使用最廣泛的計算信度的方法
7、是克朗巴赫(Cronbach)系數(shù)法8,其計算公式為: 其中 ,N為試卷的考題數(shù)量, 為第 題分數(shù)的方差, 為考試總分的方差。 的值在0與1之間, 越靠近1時,表明考生的分數(shù)與實際程度的差別越小。當(dāng) 越靠近0時,表明考生的分數(shù)是不可信的,受偶然因素的影響太多。通常大范圍標準化測驗要求信度在0.9以上,課程結(jié)業(yè)考試的信度要求在0.50.9之間.2.2測驗效度所謂效度,即是一個檢驗所要測量的屬性可以測量到的水平,即檢驗評估的準確性。關(guān)于效度,有兩點必須要注意:一是針對必然的檢驗指標預(yù)計測驗的效度,一般情況下,一項測驗絕不會完整有效,也不會完整無效,因此一項檢驗的效度僅有程度上的不同;二是檢驗的效度
8、是針對檢驗結(jié)果而言的,而不是針對測量自身的,檢驗的效度只有在理論檢驗之后通過驗證才會體現(xiàn)出來。試卷效度分內(nèi)容效度和關(guān)聯(lián)效度兩種類型。所謂內(nèi)容效度,是指測驗?zāi)康拇硭麥y量的內(nèi)容和引起預(yù)期反應(yīng)所達到的程度。評價內(nèi)容效度的辦法是把試卷和雙向細目表進行對照、分析,看看命題是否合適雙向細目表的要求。要提高試題的內(nèi)容效度,命題人員要按教學(xué)大綱、考試大綱的要求確定考試的內(nèi)容、范圍、比重、題型、題量等。內(nèi)容效度主要是靠專家和老師主觀性評判,沒有數(shù)量指標,因此不怎么精確。校標關(guān)聯(lián)效度是指測驗分數(shù)與作為效標的另一個獨立測驗結(jié)果之間的一致性程度9。所謂效標是用來檢測效度的參照標準,常用另一個標準化檢驗結(jié)論來體現(xiàn)。
9、效度的大小叫效度系數(shù),用 表示,其計算公式為: 其中 為考生數(shù), 與 分別表示第 個考生在 考卷與 考卷中的成績, , , , 分別表示兩次考試的均值與標準差.2.3測驗難度所謂難度是指考試的難易程度,是考生對試題作答工作完成時所表現(xiàn)出來的困難水平的度量。其計算公式為: 其中 表示第 題的難度, 表示第 題全體被試的平均分, 表示第 題分值。以 表示試卷難度,則 試卷的難度應(yīng)按照測驗指標而定,通常認為課程的結(jié)業(yè)考試試題難度值定在在0.20.8為宜,而試卷的平均難度在0.50.85為宜,大范圍的標準化測驗難度定在0.40.7之間。試題的難度太大或太小,容易使考生得高分或低分,從而難以辨別考生的水
10、平。通常來說,難度值為0.7以上的問題為較易題,難度值在0.40.7之間的問題為中等難度題,難度值為0.4以下的問題為較難題和難題。2.4測驗區(qū)分度試題區(qū)分度是指測驗試題鑒別考生實際能力水平高低的指標10。測驗的區(qū)分度又叫鑒別力,它是評估試題質(zhì)量,篩選試題的主要指標和根據(jù)。區(qū)分度通常用P表示,其計算公式為: 其中 表示第 題的區(qū)分度, 表示高分組第 題的平均分,而 表示低分組第 題的平均分,高低分組分別占樣本量的2530%,不過占樣本量的27%為最好,試卷總區(qū)分度用 表示,則 區(qū)分度高的試題能將差異程度的學(xué)生辨別出來,即高水平的學(xué)生可得高分,低水平的學(xué)生可得低分。普通以為區(qū)分度在0.4以上的試
11、題為優(yōu)秀題,位于0.30.39之間的為良好題,位于0.20.29之間的為一般題,0.2以下的為下等題。2.5測驗覆蓋度試卷的覆蓋度,是基于試卷的覆蓋面水平,依據(jù)教育學(xué)的觀念,學(xué)生能力的不同主要反映在知識面的廣窄和知識積累的多少上,試卷質(zhì)量的幾個指標與試卷的覆蓋度有親密聯(lián)系,覆蓋面大的話,指標的性能就較好,而覆蓋面小,指標的性能就比較差。通常用各題目之間的相關(guān)系數(shù)矩陣11 表示覆蓋面的大小,其計算公式為:,其中 表示第 個學(xué)生第 題的得分, 表示第 題的得分的均方差, 表示考生在第 題上所得的分數(shù)平均值, 表示考生數(shù)。試卷的覆蓋面越大,則各題之間的相互關(guān)聯(lián)性就越小,反過來,則越大。相關(guān)系數(shù)矩陣的
12、本質(zhì)即是反映試題的覆蓋面大小,通常以 0.2為覆蓋面大,覆蓋面大試卷的有效性就高。一份好的試卷其試題的決擇必然要有覆蓋面,對所學(xué)的專業(yè)知識一定要覆蓋到,這樣的抽樣才具備代表性。3實例分析本次考試試卷為凱里學(xué)院14級數(shù)本1班(45人)在2015-2016學(xué)年度第一學(xué)期數(shù)學(xué)分析期末考試成績?yōu)槔?。全卷共四道大題,分別為選擇題(5道)、填空題(5道)、計算題(5道)證明題(2道)四種題型。其各題目的滿分值分別為20,20,40,20,考試時間為兩個小時,試卷滿分100分。3.1信度分析各題目的方差 及總方差 如下: 故由公式 因此可以得出本次試卷的信度系數(shù)為0.653,信度較高。原因在于有嚴謹?shù)目紙黾o
13、律和盡職的監(jiān)考老師,以及學(xué)生對待考試的態(tài)度良好,有自信心。3.2效度分析效度是試卷質(zhì)量中最跟本的指標,是測驗成績的準確性水平,是掂量試卷是否精確測出學(xué)生在某一學(xué)科上實際程度的量。但往往被測學(xué)生在某一學(xué)科上的實際程度是無法經(jīng)過一份試卷直接測量出來,因而我就不在這進行效度分析。不過普通考試的效度系數(shù)要求到達0.4以上。3.3難度分析各題目的難度及試卷總難度如下: 題號 一 二 三 四分值 20 20 40 20平均分 14.04 16.36 23.71 13.24難度值 0.298 0.182 0.407 0.338由上可見,第一題和第二題為填空題和選擇題,難度較小,屬于基礎(chǔ)題,其考試內(nèi)容為基本的
14、概念和性質(zhì),以及基本的運算能力,只要求學(xué)生掌握基本知識就能解答;第三題為計算題,難度較大,這一題主要是考導(dǎo)數(shù)的運用,內(nèi)容覆蓋面較廣,只有對微積分內(nèi)容熟練掌握,前后聯(lián)系,才能準確解答;第四題是證明題,難度適中。從總體來看,試卷難度為0.3264,說明試題總體偏容易。3.4區(qū)分度分析分別取前11名的同學(xué)和后11名的同學(xué)作為高分組和低分組: 于是有 : 由公式 ,計算得 故試卷總區(qū)分度 題號 一 二 三 四分值 20 20 40 20標準差 3.829 3.754 9.162 5.317區(qū)分度 0.455 0.455 0.591 0.659區(qū)分度是試卷質(zhì)量的另一重要方面,由上表可知,該試卷的試題區(qū)分
15、度都大于0.4以上,并且沒有太大的差距,都屬于優(yōu)良題。總體來說,區(qū)分度較好,基本能辨別學(xué)生的實際水平。3.5覆蓋度分析依據(jù)相關(guān)系數(shù)矩陣公式 ,其中 從而得出試卷各題相關(guān)系數(shù)矩陣為: 從各題目的相關(guān)系數(shù)矩陣來看,只有第一題與第四題的相關(guān)系數(shù)滿足小于0.2的要求,其他的相關(guān)系數(shù)都大于0.2,說明試卷覆蓋度不好,各題目的交叉相關(guān)性較差,應(yīng)加以調(diào)正。4試卷質(zhì)量的綜合評價4.1“幾度”之間的相關(guān)性4.1.1效度與信度的關(guān)系效度和信度之間存在著辯證關(guān)系。效度高的測驗,信度也一定高,高信度是高效度的必要條件,但信度高的測驗,其效度不一定高,高信度并非高效度的充分條件12。而且一個測驗的效度不能超過它的信度的
16、平方根,或者說一個測驗的效度被它的信度所限制13。因此,本文認為,有時候為保證高效度,甚至可犧牲一些信度。4.1.2信度與難度的關(guān)系信度和難度也存在著密切的聯(lián)系。試題難度太大,學(xué)生大部分得分很低,此時,學(xué)生分數(shù)出現(xiàn)出正偏態(tài),反之,難度太小,學(xué)生大部分得分高,學(xué)生分數(shù)呈現(xiàn)出負偏態(tài)。這兩種情況會使分數(shù)分布范圍和分數(shù)之間的差別變小,因而,使得方差變小,同時信度也變小。所以,當(dāng)試卷難度為中等程度即0.5左右時且試題的平均難度為50%左右且試題之間的難度差距不大時考試的信度才會較高。當(dāng)然,部分結(jié)果與理論不符,則可能是該試卷試題難度差距太大,降低了考試的信度,或者是由于參與測驗的班級學(xué)生水平差距太大等。因
17、此,要提高測驗的信度,還需使難度的波動范圍縮小,即盡量使各題難度接近,當(dāng)然測驗本身難度控制在0.4-0.7之間較合理14。4.1.3信度與區(qū)分度的關(guān)系區(qū)分度與信度有極密切的關(guān)系(見上表)15,從表中咱們能夠看出區(qū)分度值平均數(shù)越高,考試的信度越高。信度隨區(qū)分度的增加而增加,而且增長速率比區(qū)分度增長得快。同時,數(shù)據(jù)結(jié)果表明,區(qū)分度最小的試卷,其所對應(yīng)的信度也比較??;區(qū)分度最大的試卷,其所對應(yīng)的信度也很高。因而,想要到達理想的考試信度,提升試題的區(qū)分度是一個好辦法。4.1.4難度與區(qū)分度的關(guān)系試卷的難度和區(qū)分度也有關(guān)系。難度過低的試卷,其所對應(yīng)的區(qū)分度也很小,難度過高的試卷,其所對應(yīng)的區(qū)分度也很小。
18、因而,難度過高或過低的試卷,其區(qū)分度均較??;難度居中時,區(qū)分度較高。4.2試卷質(zhì)量的整體評價因為試卷的質(zhì)量是由很多要素決擇的。根據(jù)上述分析,從整體來看試卷的信度、區(qū)分度還是不錯的,難度和覆蓋度還可以適當(dāng)?shù)脑黾?。要提高測試質(zhì)量,必須根據(jù)測試的目的、性質(zhì),制定測試編制計劃,決定測試范圍、測題數(shù)量、測題類型及難易程度。一般來說,試卷的題型應(yīng)包含主觀題和客觀題,測試中難題、中等題、易題的比例應(yīng)以253為宜,且應(yīng)從易到難,以免給被試者造成精神壓力,從而提高測試的可靠性16。在對各個指標進行權(quán)衡時,有這樣一個問題,若試卷所對應(yīng)的學(xué)生成績不服從正態(tài)分布或試卷的某個質(zhì)量指標(如信度、效度、區(qū)分度)太小,小于我們通常規(guī)定的基本范圍,我們認為該試卷在某些方面質(zhì)量不合格,應(yīng)屬于被淘汰的試卷。此時,我們定義此試卷質(zhì)量為負無窮17。要客觀評估試卷的質(zhì)量,就得對考試自身,考試所獲得的數(shù)據(jù)進行統(tǒng)計分析,按照所取得的數(shù)據(jù)進行科學(xué)推斷,這是從事教育科學(xué)研究不可或缺的科學(xué)依據(jù)。綜上所述,對試卷進行科學(xué)化的評價和量化分析,是提高試卷質(zhì)量、試題科學(xué)性與客觀性的重要途徑之一,其根本目的是為了提高命題的質(zhì)量和科學(xué)性18。因此作為教師都必須加強有關(guān)考試理論和方法的學(xué)習(xí),掌握命題的技巧,學(xué)習(xí)有關(guān)試卷評價的方法,為逐漸形成考試的標準化體系作好試題的篩選
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 湖南司法警官職業(yè)學(xué)院《室內(nèi)設(shè)計基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江橫店影視職業(yè)學(xué)院《生物儀器原理與使用》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶幼兒師范高等??茖W(xué)?!吨圃炫c材料》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025屆荊州市重點中學(xué)高三下學(xué)期4月診斷考試物理試題含解析
- 工業(yè)用地用地面積優(yōu)化與節(jié)約
- 工程結(jié)算書中的工程量清單編制
- 歐菲醫(yī)療美容客戶滿意度調(diào)查問卷
- 2025年鄰氨基苯甲酸?行業(yè)現(xiàn)狀分析:鄰氨基苯甲酸有望在更多領(lǐng)域?qū)崿F(xiàn)突破
- 電纜更換施工方案
- 北京市豐臺區(qū)2024-2025學(xué)年高三(上)期末生物試卷
- 2024屆北京市豐臺區(qū)等5區(qū)高三下學(xué)期一模英語試題(解析版)
- 我國醫(yī)療保障現(xiàn)狀問題
- 工程項目部安全生產(chǎn)治本攻堅三年行動實施方案
- 家電以舊換新風(fēng)險管控與應(yīng)對策略
- 第三單元名著閱讀《經(jīng)典常談》-2023-2024學(xué)年八年級語文下冊同步教學(xué)課件
- 排污許可證申請與核發(fā)技術(shù)規(guī)范 火電(二次征求意見稿)
- QB-T 2673-2023 鞋類產(chǎn)品標識
- 鄰近鐵路營業(yè)線施工安全監(jiān)測技術(shù)規(guī)程 (TB 10314-2021)
- 《中國帕金森病診療指南(第四版)》(2023)要點
- 2024年揚州市職業(yè)大學(xué)高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 2024年北京京北職業(yè)技術(shù)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
評論
0/150
提交評論