細(xì)說(shuō)試題的難度、區(qū)分度、信度和效度以及對(duì)高考復(fù)習(xí)的啟示【最新】_第1頁(yè)
細(xì)說(shuō)試題的難度、區(qū)分度、信度和效度以及對(duì)高考復(fù)習(xí)的啟示【最新】_第2頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、細(xì)說(shuō)試題的難度、 區(qū)分度、信度和效度以及對(duì)高考復(fù)習(xí)的啟示一.試題的難度(一)什么是難度難度是指試題的難易程度,是評(píng)價(jià)考試的一個(gè)非常重要的一個(gè)指標(biāo)。一個(gè)題目,如果大部分考生都能答對(duì),那么這個(gè)題目的難度就??;如果大部分考生都不能答對(duì),那么這個(gè)題目的難度就大??陀^題難度計(jì)算公式 :P(難度指數(shù))試題答對(duì)人數(shù) /考生人數(shù);主觀題 難度計(jì)算公式 :P試題平均得分 /試題滿分。試卷難度計(jì)算公式: P 為平均分, K 為試卷滿分值。易、中、難的標(biāo)準(zhǔn)為:易: P0.7,中: 0.4 P0.6,9難: P0.39;P 值越大,難度越低, P 值越小,難度越高。一般來(lái)說(shuō),難度值平均在0.5 最佳,難度值過(guò)高或過(guò)低

2、,都會(huì)降低測(cè)驗(yàn)的信度。當(dāng)然,在實(shí)際的評(píng)價(jià)過(guò)程中,測(cè)驗(yàn)的難度水平多高才合適,也還要取決于測(cè)驗(yàn)的目的。如果教師要對(duì)學(xué)生的知識(shí)準(zhǔn)備狀況進(jìn)行一次診斷性測(cè)驗(yàn),為了真實(shí)、準(zhǔn)確地了解學(xué)生的知識(shí)掌握情況,測(cè)驗(yàn)難度大一點(diǎn)也是正常的。(二)難度的計(jì)算(1) )客觀性試題難度 P(這時(shí)也稱通過(guò)率)計(jì)算公式: P=k/N (k 為答對(duì)該題的人數(shù), N 為參加測(cè)驗(yàn)的總?cè)藬?shù))(2) )主觀性試題難度 P 計(jì)算公式:P=X/M ( X 為試題平均得分; M 為試題滿分)(3) )適用于主、客觀試題的計(jì)算公式:P=(PH+PL)/2(PH、PL 分別為試題針對(duì)高分組和低分組考生的難度值)在大群體標(biāo)準(zhǔn)化中,此法較為方便。具體步

3、驟為:將考生的總分由高至低排列;從最 高分開(kāi)始向下取全部試卷的 27%作為高分組;從最低分開(kāi)始向上取全部試卷的27%作為低分組;按上面的公式計(jì)算。例 1:一次生物測(cè)試中,在 100 名學(xué)生中,高低分組各有 27 人,其中高分組答對(duì)第一題有 20 人,低分組答對(duì)第一題的有 5 分,這道題的難度為:PH=20/27=0.74 PL =5/27=0.19 P=(0.74+0.19)/2=0.47整個(gè)試卷的難度等于所有試題難度之平均值(包括主、客觀試題)。(三)試題難度的一般要求就高考來(lái)說(shuō),難度以適中為宜,單個(gè)試題的難度以0.3-0.7 之間為好,整卷以 0.5-0.6 之間為最佳。一般將難度值大于和

4、等于 0.7 的試題定為容易題;大于 0.4 和小于 0.7 的定為中檔題;小于和等于 0.4 的試題定為難題。命題時(shí)難度一般要按一定比例分配,如3:6: 1 或 3:5:2,一般說(shuō)來(lái),容易題、難度系數(shù)為 0.95-0.75,中檔題為 0.74-0.6,難題為 0.59-0.20。二.試題的區(qū)分度(一)什么是區(qū)分度區(qū)分度是指考試題目對(duì)考生心理特征的區(qū)分能力。區(qū)分度高的試題能將不同水平的考生區(qū)分開(kāi)來(lái),水平高的考生得高分,水平低的考生得低分。區(qū)分度高的考試,優(yōu)秀、一般、差三個(gè)層次的學(xué)生都有一定比例,如果某一分?jǐn)?shù)區(qū)間學(xué)生相對(duì)集中,高分太多或不及格太多的考試,區(qū)分度則低。Page 8 of 7(二)區(qū)

5、分度的計(jì)算1.單個(gè)選擇題目區(qū)分度的計(jì)算將全體考生總分從高到低排列,將總分最高的27%考生定為高分組,總分最低的27%考生定為低分組,分別計(jì)算兩組考生在某道題目上的通過(guò)率,兩個(gè)通過(guò)率之差就是這道題的區(qū)分度(又叫鑒別指數(shù))。計(jì)算公式為: D=PH-PL. PH 和 PL 分別為高分組和低分組的通過(guò)率。2 整個(gè)試題的區(qū)分度計(jì)算(常用) 計(jì)算公式為: D=2( XH XL) /W其中 D 為試卷區(qū)分度, XH 為 27%高分組平均分, XL 為 27%低分組平均分, W 為試卷總分。一般也將全體考生總分從高到低排列,將總分最高的27%的考生定為高分組,總分最低的 27%考生定為低分組,再分別計(jì)算各組的

6、平均分。如:一份滿分 100 分的試卷,高分組平均得分 90 分,低分組平均得分 60 分,則區(qū)分度為 2(90-60) /100=0.6一道題值 2 分的試題,高分組平均得分 1.5 分,低分組平均得分 0.5 分,則區(qū)分度為 2(1.5-0.5)/2=1(三)試題區(qū)分度的一般要求區(qū)分度( D)的取值范圍介于 -1.00 至+1.00 之間。通常 D 為正值,稱為積極區(qū)分; D 為負(fù)值稱為消極區(qū)分; D 值為 0 稱為無(wú)區(qū)分作用。具有積極區(qū)分作用的試題,其 D 值越大,區(qū)分的效果越好。試題的區(qū)分度在 0.4 以上表明此題的區(qū)分度很好, 0.30.39 表明此題的區(qū)分度較好, 0.20.29

7、表明此題的區(qū)分度不太好需要修改, 0.19 以下表明此題的區(qū)分度不好應(yīng)淘汰。高考的區(qū)分度一般要求在 0.3 以上,表示高分組的學(xué)生比低分組的學(xué)生能多得30%的分?jǐn)?shù)。一般認(rèn)為,區(qū)分度的數(shù)值達(dá)到了0.3,便可以接受;低于 0.3 的題目,區(qū)分能力就差了。三.試題的信度信度是指使用同一試卷對(duì)考生重復(fù)測(cè)驗(yàn)時(shí),或兩個(gè)平行試卷對(duì)考生測(cè)驗(yàn)時(shí),所得測(cè)驗(yàn)分?jǐn)?shù)的一致性和穩(wěn)定性程度。信度除了要說(shuō)明成績(jī)的真實(shí)性之外,還要說(shuō)明題目涉及的內(nèi)容與教學(xué)的相關(guān)程度。信度系數(shù)愈高即表示該測(cè)驗(yàn)的結(jié)果愈一致、穩(wěn)定與可靠。系統(tǒng)誤差對(duì)信度沒(méi)什么影響,因?yàn)橄到y(tǒng)誤差總是以相同的方式影響測(cè)量值的,因此不會(huì)造成不一致性。反之,隨機(jī)誤差可能導(dǎo)致不

8、致性,從而降低信度。信度可以定義為隨機(jī)誤差R 影響測(cè)量值的程度。如果 R=0, 就認(rèn)為測(cè)量是完全可信的,信度最高。信度的定義信度主要是指測(cè)量結(jié)果的可靠性、一致性和穩(wěn)定性, 即測(cè)驗(yàn)結(jié)果是否反映了被測(cè)者的穩(wěn)定的、 一貫性的真實(shí)特征。 和信度相關(guān)的一個(gè)概念是效度,信度是效度的前提條件。信度只受隨機(jī)誤差的影響,隨機(jī)誤差越大,信度越低。因此,信度可以視為測(cè)試結(jié)果受隨機(jī)誤差影響的程度。系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。測(cè)試信度 (test reliability) 也叫測(cè)試的可靠性,指的是測(cè)試結(jié)果是否穩(wěn)定可靠。也就是說(shuō), 測(cè)試的成績(jī)是不是反映了受試者的實(shí)際語(yǔ)言水平。例如,如果同一套測(cè)試在對(duì)同一測(cè)試對(duì)象(即

9、受試者本身沒(méi)有變化)進(jìn)行的數(shù)次測(cè)試中,受試者的分?jǐn)?shù)忽高忽低的話,則說(shuō)明該測(cè)試缺乏信度。測(cè)試的信度與測(cè)試的效度有著密切的關(guān)系。一般說(shuō)來(lái),只有信度較高的測(cè)試才能有較高的效度,但效度較高不能保證信度也一定較高。測(cè)試的信度主要涉及到試題本身的可靠性和評(píng)分的可靠性這兩個(gè)方面。試題本身是否可靠主要取決于試題的范圍、數(shù)量、試題的區(qū)分度等因素;評(píng)分是否可靠則要看評(píng)分標(biāo)準(zhǔn)是否客觀和準(zhǔn)確。測(cè)試的信度通常用一種相關(guān)系數(shù)(即兩個(gè)數(shù)之間的比例關(guān)系)來(lái)表示,相關(guān)系數(shù)越大,信度則越高。當(dāng)系數(shù)為 1.00 時(shí),說(shuō)明測(cè)試的可靠性達(dá)到最高程度;而系數(shù)是0.00 時(shí),則測(cè)試的可靠性降到最低程度。在一般情況下,系數(shù)不會(huì)高到1.00,

10、也不會(huì)降到 0.00,而是在兩者之間。對(duì)信度指數(shù)的要求因測(cè)試類別的不同而不同,人們通常對(duì)標(biāo)準(zhǔn)化測(cè)試的信度系數(shù)要求在 0.90 以上,例如“托?!钡男哦却笾聻?0.95,而課堂測(cè)試的信度系數(shù)則以 0.70-0.80 之間為可接受性系數(shù)。測(cè)試信度的計(jì)算方法有很多種,以下僅介紹三種易于操作的方法:1) 重測(cè)法( the retesting method)。用同一套試卷在兩個(gè)不同時(shí)間內(nèi)來(lái)測(cè)試同一批受試者,這樣便獲得兩組分?jǐn)?shù),然后計(jì)算出兩組分?jǐn)?shù)的相關(guān)系數(shù)。當(dāng)然,在兩次測(cè)試中,學(xué)生第二次的測(cè)試成績(jī)理應(yīng)比第一次的要高,因?yàn)樵诘诙螠y(cè)試時(shí)學(xué)生已經(jīng)有了進(jìn)步而且臨場(chǎng)經(jīng)驗(yàn)也更豐富了。但是若該試題是比較可靠的,每個(gè)學(xué)

11、生在兩次測(cè)試中的排名次序應(yīng)該是基本不變的。2) 交替形式法( the alternative method)。對(duì)同一批受試者使用試題類型完全相同,難易程度相當(dāng),但具體題目不同的兩套對(duì)等試卷先后進(jìn)行兩次測(cè)試,然后計(jì)算出兩次得分的相關(guān) 系數(shù)。3) 對(duì)半法( the split half method )。測(cè)試只進(jìn)行一次,但將整份試卷的題目按單、雙數(shù)分成兩組來(lái)分別計(jì)分,算出兩組分?jǐn)?shù)的相關(guān)系數(shù),然后再用SpearmanBrown 的公式計(jì)算整份試卷的信度系數(shù)。具體計(jì)算步驟是:將兩組分?jǐn)?shù)的相關(guān)系數(shù)乘以2,再除以 1 加兩組分?jǐn)?shù)的相關(guān)系數(shù)。每一個(gè)測(cè)試的實(shí)得分?jǐn)?shù)(X )總是由真實(shí)分?jǐn)?shù) (T) 和誤差 (E)

12、 兩部分構(gòu)成的,用公式表示如下:X=T+E如果我們討論一組測(cè)驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差代表具體分?jǐn)?shù),得到公式:S2( x) =S2(t)+S2(e)公式中, S2( x)是實(shí)得分?jǐn)?shù)的方差,S2(t) 是真分?jǐn)?shù)的方差, S2(e) 是誤差的方差在測(cè)量理論中,信度被定義為:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)方差與中方差(實(shí)得方差)的比率。即:r(xx)=S2(t)/S2( x)由于真實(shí)分?jǐn)?shù)的方差是無(wú)法統(tǒng)計(jì)的,因此轉(zhuǎn)化為:r(xx)=S2(x)-S2(e)/S2(x)=1-S2(e)/S2(x)因此,信度也可以看做是總方差中非測(cè)量誤差的方差所占的比例信度的指標(biāo)一、信度系數(shù)與信度指數(shù)大部分情況下,信度是以信度系數(shù)為指

13、標(biāo),它是一種相關(guān)系數(shù)。常常是同一被試樣本所得到的兩組資料的相關(guān),理論上說(shuō)就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)方差的比值,公式為:r(xx)=r2(xt)=S2(t)/S2( x)公式中 r2(xt) 是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差的比值,稱作信度系數(shù),公式為:r(xt)=S(t)/S(x)可見(jiàn)信度指數(shù)的平方就是信度系數(shù)。二、測(cè)量標(biāo)準(zhǔn)誤信度系數(shù)僅表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,但并沒(méi)有直接指出個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。我們可以用一組被試兩次測(cè)量結(jié)果來(lái)代替對(duì)同一個(gè)人的反復(fù)施測(cè),于是有了信度的另一個(gè)指標(biāo),公式為:SE=S(x) 1-r(xx)公式中 SE 為測(cè)量的標(biāo)準(zhǔn)誤, S(x) 是所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,r

14、(xx) 為測(cè)驗(yàn)的信度系數(shù), 從公式我們可以看出測(cè)量的標(biāo)準(zhǔn)誤與信度之間有互為消長(zhǎng)的關(guān)系:信度越高,標(biāo)準(zhǔn)誤越小,信度越低,標(biāo)準(zhǔn)誤越大。影響信度的因素一、樣本特征1、樣本團(tuán)體異質(zhì)性的影響2、樣本團(tuán)體的平均能力水平的影響二、測(cè)量長(zhǎng)度一般來(lái)說(shuō),在一個(gè)測(cè)試中增加同質(zhì)的題目,可以使信度提高。需注意的是,增加測(cè)驗(yàn)長(zhǎng)度的效果應(yīng)當(dāng)遵循報(bào)酬遞減原則。通過(guò)斯皮爾曼- 布朗公式的導(dǎo)出公式可以計(jì)算出最少應(yīng)增加的題目:K=r(kk)*(1-r(xx)/r(xx)*(r(kk)-1)K 為改變后的長(zhǎng)度與原長(zhǎng)度之比,r(xx) 為原測(cè)試的信度, r(kk) 為測(cè)驗(yàn)長(zhǎng)度是原來(lái)的K 倍時(shí)的信度估計(jì)。三、測(cè)驗(yàn)難度理論上說(shuō),只有測(cè)驗(yàn)

15、難度為50% 時(shí),才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大,求得的信度也最高。事實(shí)上,難度為0.50 只適合于簡(jiǎn)答型題目,對(duì)于選擇題目由于猜測(cè)因素,難度值應(yīng)當(dāng)提高,洛德提出在學(xué)習(xí)成績(jī)中,為了保證其可靠性,各類選擇題的理想平均難度為:五擇一測(cè),0.70 ;四擇一測(cè), 0.74 ;三擇一測(cè), 0.77 ;是非題。 0.85在實(shí)際情況下, 如果某個(gè)測(cè)驗(yàn)適用范圍廣,其難度水平通常適用于中等能力水平的 被試,而對(duì)較高水平的被試和較低水平的被試可能較易或較難,使得分?jǐn)?shù)分布范圍縮小, 信度水平降低,因此一個(gè)標(biāo)準(zhǔn)化的測(cè)驗(yàn),應(yīng)根據(jù)不同能力水平的報(bào)告測(cè)驗(yàn)的難度,以作為選擇測(cè)驗(yàn)的參考四、時(shí)間間隔時(shí)間間隔只對(duì)重測(cè)信度和不同時(shí)測(cè)量時(shí)

16、的復(fù)本信度有影響,對(duì)其余的信度來(lái)說(shuō), 不存在時(shí)間間隔問(wèn)題。注:我們對(duì)一套問(wèn)卷的信度檢驗(yàn)值(一般是指克隆巴赫阿爾法信度系數(shù))有時(shí)會(huì)出現(xiàn)過(guò)低的情況,可能的原因有:1、試卷本身設(shè)計(jì)不合理,不是圍繞一個(gè)主題或是有矛盾的題目。如果試卷中有題目讓完全相同的人選擇不同的答案,試卷的信度會(huì)降低。2、題目區(qū)分度過(guò)低,特別指有對(duì)錯(cuò)之分的題目。如果一道題正確率或錯(cuò)誤率達(dá)到90%,可以從新審視題目設(shè)計(jì)是否合理。區(qū)分度過(guò)低的題目中真實(shí)偏差的成分較少,隨機(jī)偏差的成分相對(duì)較多,試卷的信度會(huì)降低。3、無(wú)關(guān)變量進(jìn)入信度檢驗(yàn)。除了重測(cè)信度,其他信度檢驗(yàn)方法都只考慮有序變量, 無(wú)序變量,如出身城市,喜好顏色等,如果我們沒(méi)有對(duì)城市或

17、顏色排序的話,帶入信度檢驗(yàn)意義難明,可能會(huì)導(dǎo)致試卷的信度降低。4、題目選項(xiàng)反序。對(duì)有序變量,如果變量值之間序的意義相反,會(huì)降低甚至得出負(fù)的信度。比如檢驗(yàn)老師對(duì)學(xué)生評(píng)分的信度,如果一個(gè)老師的評(píng)分以10 分為最高分, 1分最低,另一個(gè)以1 分最高, 10 分最低。如果不經(jīng)處理帶入信度計(jì)算,信度會(huì)降低。信度評(píng)估的方法一、 重測(cè)信度 ,又稱為穩(wěn)定性系數(shù),它的計(jì)量方法是采用重測(cè)法:用同一測(cè)驗(yàn),在不同時(shí)間對(duì)同一群體施測(cè)兩次,這兩次測(cè)量分?jǐn)?shù)的相關(guān)系數(shù)即為重測(cè)系數(shù)。重測(cè)信度所考察的誤差來(lái)源是時(shí)間的變化所帶來(lái)的隨機(jī)影響。在評(píng)估重測(cè)信度時(shí),必須注意重測(cè)間隔的時(shí)間。對(duì)于人格測(cè)驗(yàn),重測(cè)間隔在兩周到6 個(gè)月之間比較合適

18、。在進(jìn)行重測(cè)信度的評(píng)估時(shí),還應(yīng)注意以下兩個(gè)重要問(wèn)題:重測(cè)信度一般只反映由隨機(jī)因素導(dǎo)致的變化,而不反映被試行為的長(zhǎng)久變化。不同的行為受隨機(jī)誤差影響不同。二、復(fù)本信度 ,是以兩個(gè)測(cè)驗(yàn)復(fù)本來(lái)測(cè)量同一群體,然后求得應(yīng)試者在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。 復(fù)本信度的高低反映了這兩個(gè)測(cè)驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測(cè)驗(yàn)互為復(fù)本。計(jì)算復(fù)本信度的主要目的在于考察兩個(gè)測(cè)驗(yàn)復(fù)本的題目取樣或內(nèi)容取樣是否等值。復(fù)本信度也考慮兩個(gè)復(fù)本實(shí)施的時(shí)間間隔。復(fù)本信度的主要優(yōu)點(diǎn)在于:能夠避免重測(cè)信度的一些問(wèn)題,如記憶效果、練習(xí)效應(yīng)等;適用于進(jìn)行長(zhǎng)期追蹤研究或調(diào)查某些干涉變量對(duì)測(cè)驗(yàn)成績(jī)影響;減少了輔導(dǎo)或作弊的可能性。復(fù)本信度

19、的局限性在于:如果測(cè)量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能消除這種影響;有些測(cè)驗(yàn)的性質(zhì)會(huì)由于重復(fù)而發(fā)生改變;有些測(cè)驗(yàn)很難找到合適的復(fù)本。三、內(nèi)部一致性信度 ,主要反映的是測(cè)驗(yàn)內(nèi)部題目之間的關(guān)系,考察測(cè)驗(yàn)的各個(gè)題目是否測(cè)量了相同的內(nèi)容或特質(zhì)。內(nèi)部一致性信度又分為分半信度和同質(zhì)性信度。分半信度系數(shù)是通過(guò)將測(cè)驗(yàn)分成兩半,計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)。測(cè)驗(yàn)愈長(zhǎng),信度系數(shù)愈高。同質(zhì)性信度是指測(cè)驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。同質(zhì)性信度低時(shí),即使各個(gè)測(cè)試題看起來(lái)似乎是測(cè)量同一特質(zhì),但測(cè)驗(yàn)實(shí)際上是異質(zhì)的,即測(cè)驗(yàn)測(cè)量了不止一種特質(zhì)。同質(zhì)性分析與項(xiàng)目分析中的內(nèi)部一致性分析相類似

20、。四、評(píng)分者信度 ,是指不同評(píng)分者對(duì)同樣對(duì)象進(jìn)行評(píng)定時(shí)的一致性。最簡(jiǎn)單的估計(jì)方法就是隨機(jī)抽取若干份答卷,由兩個(gè)獨(dú)立的評(píng)分者打分,再求每份答卷兩個(gè)評(píng)判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法,也可以采用斯皮爾曼等級(jí)相關(guān)方法。四.試題的效度效度是指考試有效性或正確性的質(zhì)量指標(biāo),即是否考了要考的內(nèi)容,試題難度、區(qū)分度是否適宜,考試最終是否達(dá)到了它的預(yù)定目的等。測(cè)試效度 (test validity) 亦稱測(cè)試的有效性,指一套測(cè)試對(duì)應(yīng)該測(cè)試的內(nèi)容所測(cè)的程度。也就是說(shuō),一套測(cè)試是否達(dá)到了它預(yù)定的目的以及是否測(cè)量了它要測(cè)量的內(nèi)容。例如:“Is photography an art orscie

21、nce?Discuss ”這種題目以攝影的知識(shí)為前提和主要內(nèi)容,用來(lái)考語(yǔ)言能力,就不具有效性。又如用聽(tīng)寫來(lái)測(cè)量學(xué)生的聽(tīng)覺(jué)能力,其效度也是不理想的,因?yàn)闀?面記錄有聲語(yǔ)言不僅涉及學(xué)生的聽(tīng)覺(jué)能力,而且還與他們的書寫速度、拼寫能力、語(yǔ)法知識(shí)、記憶能力和對(duì)全文的理解能力等有關(guān)。測(cè)試的效度一般可分為以下幾類:1) 表面效度( face validity)。指測(cè)試應(yīng)達(dá)到的卷面標(biāo)準(zhǔn),即一套測(cè)試題從表面看來(lái)是否是合適的。例如,若一次閱讀理解力的測(cè)試包括許多受試者沒(méi)有學(xué)過(guò)的方言詞匯,則可認(rèn)為 這次測(cè)試缺乏表面效度。表面效度是測(cè)試出受試者正常水平的一種保證因素。2) 內(nèi)容效度( content validity)

22、。指一套測(cè)試題是否測(cè)試了應(yīng)該測(cè)試的內(nèi)容或者說(shuō)所測(cè)試的內(nèi)容是否反映了測(cè)試的要求,即測(cè)試的代表性和覆蓋面的程度。例如,如果某一套發(fā)音技能測(cè)試題僅僅考查發(fā)音所必須具備的某些技能,如只考單一音素的發(fā)音,而不考查重讀、語(yǔ)調(diào)或音素在詞語(yǔ)中的發(fā)音,那么,該測(cè)試的內(nèi)容效度就很低。3) 編制效度( construct validity)。指一套測(cè)試題的諸項(xiàng)目對(duì)編制該測(cè)試所依據(jù)的理論的各個(gè)基本方面的反映程度。例如,以結(jié)構(gòu)主義語(yǔ)言理論為基礎(chǔ),認(rèn)為系統(tǒng)的語(yǔ)言習(xí)慣是通過(guò) 句型而獲得的,那么,強(qiáng)調(diào)詞匯和語(yǔ)法環(huán)境的測(cè)試題目就失去了編制效度。4) 經(jīng)驗(yàn)效度( empirical validity )。經(jīng)驗(yàn)效度是一種衡量測(cè)試有

23、效性的量度,通過(guò)把一次測(cè)試與一個(gè)或多個(gè)標(biāo)準(zhǔn)尺度相對(duì)照而得出。經(jīng)驗(yàn)效度可分為兩種:一是共時(shí)效度(concurrent validity ),即將一次測(cè)試的結(jié)果同另一次時(shí)間相近的有效測(cè)試的結(jié)果相比較,或同教師的鑒定相比較而得出的系數(shù);二是預(yù)測(cè)效度( predictive validity ),即將一次測(cè)試的結(jié)果同后來(lái)的語(yǔ)言能力相比較,或是同教師后來(lái)對(duì)學(xué)生的鑒定相比較而得出的系數(shù)。一般來(lái)說(shuō),對(duì)某次測(cè)試的效度進(jìn)行檢驗(yàn)時(shí),除了要根據(jù)教學(xué)大綱的要求和觀念有效性的理論對(duì)試卷的內(nèi)容進(jìn)行考查以外,還須采用計(jì)算相關(guān)系數(shù)的定量方法,即計(jì)算出本次試卷與另一份已被確定能正確反映受試者水平的試卷之間的相關(guān)系數(shù)。系數(shù)高則有

24、效性大。課堂測(cè)試的效度應(yīng)在 0.4-0.7 之間,規(guī)模較大的測(cè)試其效度應(yīng)在 0.7 以上。五、高考題的信度、效度、難度和區(qū)分度高考的性質(zhì)最主要的在兩個(gè)方面:一、高考是一種選拔性考試,高考成績(jī)是高等學(xué)校錄取新生的依據(jù),這是高考的選拔性質(zhì)。二、高考是一種導(dǎo)向性考試,高考是中學(xué)教學(xué)的指揮棒,起著對(duì)中學(xué)教學(xué)的引導(dǎo)作用,這是高考的引導(dǎo)性質(zhì)。高考性質(zhì)的這兩方面決定了高考試題應(yīng)有的信度、效度、難度和區(qū)分度,而這些是我們進(jìn)行高考復(fù)習(xí)首先要清楚的,能夠避免我們?cè)趶?fù)習(xí)時(shí)的盲目。信度是指使用同一試卷對(duì)考生重復(fù)測(cè)驗(yàn)時(shí),或兩個(gè)平行試卷對(duì)考生測(cè)驗(yàn)時(shí),所得測(cè)驗(yàn)分?jǐn)?shù)的一致性和穩(wěn)定性程度。效度是指考試有效性或正確性的質(zhì)量指標(biāo),

25、考試效度的高低反映著考試是否達(dá)到它的預(yù)定目的,是否考了要考的內(nèi)容。難度指試卷 (題)的難易程度。一般用試卷 (題)的得分率或答對(duì)率表示,所以難度事實(shí)上是容易度或通過(guò)率。其值在 01 之間,數(shù)值越大,說(shuō)明試卷 (題)越容易。區(qū)分度是指試題對(duì)不同考生的知識(shí)、能力水平的鑒別程度。如果一個(gè)題目的測(cè)試結(jié)果使水平高的考生答對(duì) (得高分),而水平較低的考生答錯(cuò) (得低分),它的區(qū)分能力就很強(qiáng)。題目的區(qū)分度反映了試題這種區(qū)分能力的高低。一般認(rèn)為,區(qū)分度的數(shù)值達(dá)到了0.3,便可以接受; 低于 0.3 的題目,區(qū)分能力差。高考的性質(zhì)決定了高考試題首先要保證信度,缺少信度或信度較低都無(wú)法向幾百萬(wàn)考生交代,無(wú)法向考生家長(zhǎng)交代,無(wú)法向社會(huì)交代。從這一角度看高考試題所考查的一定是確定性和穩(wěn)定性的內(nèi)容,對(duì)于現(xiàn)在還沒(méi)有被確定的內(nèi)容或者說(shuō)有爭(zhēng)議內(nèi)容是不能作為高考命題依據(jù)的。復(fù)習(xí)時(shí),不要讓這樣的問(wèn)題浪費(fèi)你的精力!同時(shí)要注意,有些題目看起來(lái)讓你回答的是假設(shè)和猜想,你可不要忘記高考試題的確定性,不要得意忘形呀,還是老老實(shí)實(shí)從學(xué)科的基本原理來(lái)回答,只有這樣你才能得分。高考的效度要求高考試題是有效和正確的,考查的是考綱規(guī)定的內(nèi)容。你想想牽動(dòng)著百萬(wàn)考生、千萬(wàn)家庭、億萬(wàn)人員,如果哪位命題大人在命題中出了錯(cuò)誤或者超出了考試

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論