考試命題技術(shù)與實例反思課件_第1頁
考試命題技術(shù)與實例反思課件_第2頁
考試命題技術(shù)與實例反思課件_第3頁
考試命題技術(shù)與實例反思課件_第4頁
考試命題技術(shù)與實例反思課件_第5頁
已閱讀5頁,還剩121頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

考試命題技術(shù)要求與實例引言1.先請大家做一道游戲題:【5008】諸多答案99095005151005(許)59091(張)91188(周)97108511108511081把5008倒過來是8005,去掉8右邊的0的上下2個火柴,變成81105,將2個火柴放在81105的右上角,即81105的11次方11的81105次方91108!

2.一則幽默習題解答3.一次考試成績統(tǒng)計某班一次數(shù)學考試成績?nèi)缦?

20333412656452318031721154328613125106453412963112083948平均成績:28.9及格率:10%第一部分關(guān)于考試與試題命制的幾點認識

一、現(xiàn)代考試和素質(zhì)教育是相輔相成的素質(zhì)教育思想古來有之。教育學理論中所追求的教育以及所有教育家所提倡的教育,在本質(zhì)上都是指素質(zhì)教育.

應(yīng)試教育方法也是古今中外有之。第一,考試是人類優(yōu)秀文化不斷傳承和積淀的結(jié)果,堪稱是全人類共有的文化精品。孫中山先生說過:“作為一種手段來說,我國的考試,確實是最‘古’的,也是‘最好’的?!彼€說:“現(xiàn)在各國的考試制度,差不多都是學英國的。窮流溯源,英國的考試制度,原來還是從我們中國學過去的?!倍?、考試是推進素質(zhì)教育的切入點之一

全面推進素質(zhì)教育,要有先進的教育思想方法,按照教育規(guī)律辦事。

考試是我國推進素質(zhì)教育改革的最佳切入點之一。

第一,考試以及學科成就測驗是一種最常用最實在的評價方法。推進素質(zhì)教育應(yīng)該更加重視考試改革與試題命題。

第二,考試具有強烈的導向作用。

學校教育在相當長一段時間仍將關(guān)注升學考試問題。因此,我們要重視考試,發(fā)揮考試積極的導向作用,使考試有利于全面推進素質(zhì)教育。

2.試題命制要體現(xiàn)教育測量評價的科學性

大家都“身經(jīng)百試”,似乎到了“不會作詩也會吟”的程度。其實,考試命題是一項比較專業(yè)的業(yè)務(wù)活動,考試命題有其豐富的科學理論做基礎(chǔ)。中小學教師學點教育測量學和教育評價學方面的理論知識,有利于提高考試評價的科學性,有利于提高教育質(zhì)量,有利于提高教師的專業(yè)化水平。

3.試題命制要與社會實際和學生學習生活經(jīng)驗有合理的對接性

要加強試題與社會實際和學生生活的聯(lián)系,注重考察學生對知識的理解和應(yīng)用,特別是在具體情境中綜合運用能力,即具體情境下分析問題和解決問題的能力。這是當前試題命題努力的方向之一,也是難點之一。

4.試題命制要注重回歸教材、適控難度、具有“減負”的責任性

教育是有計劃、有目標、有標準的。教材編寫、教學改革、考試設(shè)計等,一定要按照教育規(guī)律,要有利于“減負”的學生的學習負擔。因此,試題命題要注重回歸教材、控制適當難度與甑別性。例:探究題29.如圖1所示,把導線放在磁場里,通電導體由于受到磁場力的作用而運動起來。在實驗中,接通電源導體開始運動起來了。發(fā)現(xiàn):導體與鐵軌a、b連接的地方不斷有火花產(chǎn)生。(1)請你猜想接頭處火花產(chǎn)生的原因可能是什么?

(2)用你學過的知識支持你的猜想。試題的來源:

試題的素材選取人民教育出版社《物理》八年級教材中的演示實驗原圖。教材中原圖探究的是“通電導體在磁場中受到作用力”,實驗現(xiàn)象是通電導體在磁場中受力而運動起來。試題的探究點:

演示實驗中,金屬導體與軌道a、b之間產(chǎn)生火花。火花從哪里來?

試題的考查目標:通過實驗中出現(xiàn)的意外現(xiàn)象。利用對比的方法,考查比較、判斷和分析問題的能力。同時考查應(yīng)用知識解釋問題的能力。

試題答案出現(xiàn)的典型問題:

最典型的答案是摩擦生熱,一部分學生回答因為通電導體受到作用力而運動,于是導體滾動與軌道相互摩擦生熱而產(chǎn)生火花。另外大多數(shù)學生無法作答。試題的改進方案建議:

改變試題文字描述結(jié)構(gòu)。學生存在的主要困難是不能夠把注意力集中到有火花處和沒有火花處。沒有進行比較分析??梢园言囶}修改成主動比較描述,引起學生注意。例如把題干修改成:發(fā)現(xiàn):導體與鐵軌a、b連接的地方不斷有火花產(chǎn)生,而軌道和導體不相連接處沒有火花。修改以后的題干明確引導學生要進行比較分析。只需要尋找出兩者的不同點就可以進行合理猜想。從考查能力方面提高指向性,降低難度。

平時加強比較分析能力培養(yǎng)。比較:通電導體、軌道a、b和它們之間的接觸點。發(fā)現(xiàn):它們串聯(lián)電流I相同。分析:在所學習過的知識中能夠迅速回憶并且抽出相對應(yīng)的焦耳定律(Q=I2Rt)與電流產(chǎn)生熱量、溫度升高、引起火花有關(guān)。尋找出導體與接觸點之間的不同點可能是電阻R不同。猜想順利實現(xiàn)。這樣的猜想有依據(jù)、有方向。

參考答案:

⑴導體與軌道A.b連接的地方電阻大

(2分)

⑵根據(jù)焦耳定律Q=I2Rt,在電流相同時,接頭處電阻大于軌道電阻,產(chǎn)生熱量比軌道多,接觸處溫度高有火花產(chǎn)生。

(4分)

5.試題命制要有利于維護教學秩序穩(wěn)定性、降低教師和學生的焦慮性

試題需要改革創(chuàng)新,但務(wù)必有利于穩(wěn)定教學秩序,避免考前各個學校教師猜測捉迷藏以及搞題海戰(zhàn)術(shù)。第二部分試題命制基本要求一、命題原則二、試題命制基本程序三、試卷雙向細目表一、命題原則科學性。要保證試卷內(nèi)容的科學性,避免出現(xiàn)知識型、觀點性、技術(shù)性等錯誤;試卷語言表述規(guī)范、準確、簡潔、邏輯嚴謹。答案與評分標準科學合理,便于操作?;A(chǔ)性。嚴格按照課程標準、學生和教學實際,考查課程標準所要求的學科基礎(chǔ)知識和基本技能。全面性。試題要體現(xiàn)課程標準的要求,在全面考查學生基礎(chǔ)知識、基本技能的同時,還要考查學生學科學習方法的掌握和對歷史事件的認識、態(tài)度等。指導性。正確發(fā)揮考試的導向作用,不出偏題、怪題、死記硬背的題;試題側(cè)重學生對歷史知識的理解,注重試題的綜合性、開放性和教育性。命題要有利于引導教師改進教學,引導學生學會學習。適切性。試題要符合教學及學生的實際,試題的難度比例適當,要有利于不同學習程度的學生都能考出自己的水平;題目設(shè)置要有梯度,起點適當,坡度適宜。一、中考試題命制基本程序1.明確考試性質(zhì)、目標2.編制試題雙向細目表3.獨立命題、試題初選4.審改初選試題,完成正卷組卷5.復審全卷,修改完善6.分頭做答,確定答案及評分標準7.試卷文字及圖片錄入,反復校稿(含答題卡錄校)8.整卷終審,反思自評二、考試命題雙向細目表

考試命題雙向細目表是一種考查目標(能力)和考查內(nèi)容之間的列聯(lián)表。制作考試命題雙向細目表,是命題工作的一個重要環(huán)節(jié)。雙向細目表可以使命題工作避免盲目性而具有計劃性;使命題者明確測驗的目標,把握試題的比例與份量,提高命題的效率和質(zhì)量。同時,它對于審查試題的效度也有重要的指導意義。雙向細目表是包括兩個維度(雙向)的表格,細目表也可以是多維的,一般用雙向細目表。較常見的有四種:(1)反映測驗內(nèi)容與測驗?zāi)繕岁P(guān)系的雙向細目表

(2)反映測驗內(nèi)容與測驗?zāi)繕?、題型之間關(guān)系的雙向細目表該表是上一個表的改進,增加了題型。

(3)反映題型與難度、測驗內(nèi)容之間關(guān)系的雙向細目表(4)反映題型與難度、測驗?zāi)繕酥g關(guān)系的雙向細目表

反映測驗內(nèi)容與測驗?zāi)繕?學習水平)和題型分數(shù)的雙向細目表:把要考查的知識內(nèi)容與學習水平(能力)、試題的類型和分數(shù)呈現(xiàn)在一張表上。命題時,一目了然,便于操作。制作雙向細目表的程序如下:(1)列出大綱的細目表(2)列出各部分內(nèi)容的權(quán)重(3)列出各種認知能力(學習水平)目標的權(quán)重(4)確定各考查點的“三個參數(shù)”(5)審查各考查點的分配是否合理某校八年級期中歷史考試雙向細目表(部分)某校九年級思想品德期末考試雙向細目表

某校九年級思想品德期末考試雙向細目表(詳表部分)某省英語中考命題計劃一、選擇題1.試題的主干語本身有意義且能提出一個明確的問題。試題的主干語中不要濫用否定結(jié)構(gòu)和雙重否定結(jié)構(gòu)。要盡可能將各選項共同的詞句放到題干中。這樣可以使題目簡潔明了,減少學生閱讀選項的時間。第三部分命題的技術(shù)要求如:(某省會考題)如果人體內(nèi)膽汁分泌不足,將會()

A.影響對豆腐的消化B.影響對米飯的消化

C.影響對肥肉的消化D.影響對瘦肉的消化

點評:此題各選項中都有共同的句式“影響對……的消化”,所以選項的設(shè)計不夠簡練。該試題可以修改為:如果人體內(nèi)膽汁分泌不足,將主要影響哪種食物的消化()

A.豆腐B.米飯C.肥肉D.瘦肉2.所有選項在邏輯上應(yīng)與試題的主干語一致,而且錯誤選項在表面上應(yīng)貌似合理。如:(某教輔書試題)對于在35%的蔗糖溶液中已發(fā)生質(zhì)壁分離的細胞,嚴格地說其細胞之間充滿了()

A.35%的蔗糖溶液B.濃度高于35%的蔗糖溶液

C.溶液的濃度高于細胞液D.溶液的濃度低于細胞液

點評:該題目的選項C和D在語法結(jié)構(gòu)上與題干不一致。故可以將這兩個選項分別修改為:

C.高于細胞液濃度的溶液D.低于細胞液濃度的溶液又如:(全國高考題)播種前浸種時間太長,就會引起爛種和爛芽,其主要原因是()

A.二氧化碳中毒B.酒精中毒C.乳酸中毒D.能量不足

點評:修改前,試題的選項D與前三個選項的性質(zhì)明顯不同,實測的結(jié)果發(fā)現(xiàn)選項D的誘答效用性接近于零。如果將選項D改為同性質(zhì)的“丙酮酸中毒”,試題測試效果明顯好轉(zhuǎn)。③所有選項在長度上大體相等,避免把正確選項寫得特別長或特別短為作答提供線索。④用于測量評價高層次能力的試題應(yīng)有新意,避免使用包含難以理解且與考試目標無關(guān)的內(nèi)容的試題。⑤在選項中一般要避免使用“以上都對”或“以上都錯”的選項。正確選項應(yīng)具備唯一性和排他性。⑥正確選項的位置應(yīng)隨機安排。試題之間不要互相提示答案。題干意義要完整。

選擇項敘述的詳略長短,不應(yīng)成為考生選擇答案的暗示因素。

如:下列事件中必然事件是()

A.一次擲10枚均勻的硬幣,一定有正面朝上的

B.下雨天每個人都打雨傘

C.若某種彩票的中獎概率是1%,則買100張這樣的彩票一定有一張能中獎

D.某小組有13名同學,至少有2名同學的生日在同一個月選擇題中備選項的編制是命題的關(guān)鍵環(huán)節(jié),尤其是干擾項的編制應(yīng)該與答案具有似真性。編制具有迷惑性的干擾項的方法使用學生平時練習中最常見的錯誤;使用與題干有關(guān),且聽起來重要的詞,且合適;使用課本上的語言,或者其他具有真理性的語言;使用那些由于學生誤解或粗心而造成的錯誤答案;干擾項在內(nèi)容上與正確答同質(zhì)或相似;干擾項與正確答案在長度、詞匯結(jié)構(gòu)、句子結(jié)構(gòu)和內(nèi)容復雜程度上相似,且在語法上與題干一致。避免題干與正確答案間存在語言聯(lián)系正確答案出現(xiàn)在選項中的位置應(yīng)該大致平均而且是隨機的。注重基礎(chǔ)知識與技能,強調(diào)理解和應(yīng)用(2011年,廣東省,第12題)下列數(shù)軸表示正確的是:

該題結(jié)合數(shù)學上的數(shù)軸考查了著火點、化合價、生鐵和鋼中含碳量以及pH等知識,該題考查的知識點多,且出題新穎。

題干的陳述要簡單、明確,避免使用不必要的修飾詞及過分復雜的句子結(jié)構(gòu)。

如:我國古代數(shù)學發(fā)展一直處于世界領(lǐng)先水平,特別是宋、元時期的“算法”,其中可以同歐幾里德輾轉(zhuǎn)相除法相媲美的是(B).

A.割圓術(shù)B.更相減損術(shù)

C.秦九韶算法 D.孫子乘余定理

二、填空題填空題屬于再生式的客觀測驗。①試題要著眼于考查重要的、關(guān)鍵的知識,不考無關(guān)緊要和稀奇古怪的內(nèi)容。②填空題答案應(yīng)當簡潔、明確,抓住句子內(nèi)容的關(guān)鍵點。③有比較公認的答案,否則就改用其他更加合適的題型。④空格的線段長度應(yīng)與答案內(nèi)容大體相當,太長或太短往往會引起誤會。⑤盡量把填空題的空格留在句子的后面或中間,不要一開頭就是空格。⑥除非默寫回憶形式的填空,一般填空題答案空格以一個或兩個為原則,空格不能太多,以避免句子支離破碎,影響學生理解題意。

二、填空題

填空題屬于再生式的客觀測驗。(某市會考題)昆蟲的腦激素由__________分泌,它作用于__________,使__________釋放__________,以控制昆蟲的__________。

點評:此題由于要求填的空格太多,題干被弄得支離破碎,非常不利于學生閱讀和弄清題意,所以是一道極不合格的試題。

口袋中放有黃、白、紅三種顏色的小球各1個,這3個球除顏色外沒有任何區(qū)別,隨機從口袋中任取1個球,寫出這個實驗中一個可能發(fā)生的事件

。(例如“取出1個黃色的小球”)如:愛美是人類的天性。人類自從在勞動中誕生美之后,就尋找著美,追求著美,創(chuàng)造著美———既孜孜不倦地用美的規(guī)律塑造客觀世界,也孜孜不倦地用美的規(guī)律塑造著自身。馬克思說:“社會的進步,是人類追求美的結(jié)晶?!泵佬g(shù)教育對人的綜合素質(zhì)的提高具有重要作用,它是素質(zhì)教育的重要組成部分。美育的目的是培養(yǎng)健全高尚的人格,塑造完美理想的人性,創(chuàng)造美好的人生,事實上每一種教育的最終目的都是如此,只是美育是最直接的途徑和最有效的辦法。

每道題的空白處應(yīng)是填有考查意義的關(guān)鍵詞語,或是問題的重要內(nèi)容或字眼,而不是旁枝末節(jié)。

一般每道題只有1個空,對于有2個以上空白的題,各個待填答案要相互獨立不能有關(guān)聯(lián)。如:命題包括

;題設(shè)與結(jié)論都成立的命題叫做

;題設(shè)成立,但結(jié)論

的命題叫做假命題;證明一個假命題最簡單的方法是

。對于空白處的答案必須確定和唯一另外,以空格為基本計分單元,一般要求每個空格賦分相同。

三、簡答題

簡答題是提出問題、要求學生用簡潔的語言作答的試題。它可以從不同角度考查學生對科學概念和規(guī)律的理解和運用,比較深入地檢測學生的學習水平。但簡答題評分不容易做到客觀。此外,那些完全照搬課本問題的簡答題也容易導致學生不求理解而死記硬背。設(shè)計簡答題時應(yīng)注意:

1.答案的敘述要確定且簡單

2.問題要涉及重要內(nèi)容

3.測驗題的陳述要避免提供答案線索

4.評分標準應(yīng)該按點給出分數(shù)【例】

“人間四月芳菲盡,山寺桃花始盛開?!闭f的是在春季的四月,山下的桃花已經(jīng)凋謝,而山上寺廟中的桃花才剛剛盛開。請分析這種現(xiàn)象形成的主要原因。答案:春天氣溫是逐漸上升的,但氣溫有隨高度增加而降低的規(guī)律,因此,同一時間山下的氣溫比山上的要高,而桃花的開放與溫度有關(guān),所以形成了山下的桃花已經(jīng)凋謝,而山上寺廟中的桃花才剛剛盛開的現(xiàn)象。評析這道簡答題將生活、科學的人文結(jié)合起來,考查氣溫隨高度的變化及氣溫對植物開花的影響。四、是非題

是非題是由一個完全的陳述句構(gòu)成。設(shè)計是非題時應(yīng)注意:

1.是非題每題只能包括一個概念

2.概念的陳述或?qū)蝈e均需無爭議

3.語句結(jié)構(gòu)簡單,用詞避免晦澀生僻

4.要正面敘述,一般不用否定句

5.是非題要有足夠的量,不宜過少

6.“是”題與“非”題的數(shù)量比例適當,

并隨機排列

7.避免帶有強調(diào)意味的字詞,如“一定”、“常常”、“永不”等五、材料解析題材料解析題主要用來考查學生通過材料再現(xiàn)、再認史實的能力;閱讀并處理信息的能力;綜合歸納、概括提煉歷史知識的能力,分析問題得出結(jié)論的能力,對學生能力要求比較高。編制材料解析題應(yīng)該注意:

1.所選材料不論出自教材,還是出自課外,都應(yīng)是與課程內(nèi)容、課程目標相關(guān)的內(nèi)容;2.材料應(yīng)貼近學生的課程經(jīng)驗和閱讀水平,閱讀量要適當。3.在問題立意上,除知識立意外,還應(yīng)注重能力立意,著重考察學生通過閱讀,歸納總結(jié)、提煉概括信息等能力。例4:閱讀下列材料,并回答相關(guān)問題。材料一:凡未經(jīng)國會同意,以國王權(quán)威停止法律或停止法律實施之覬覦權(quán)利,為非法權(quán)利。除經(jīng)國會同意外,平時在本王國內(nèi)征募或維持常備軍,皆屬違法。材料二:我們以這些殖民地的善良人民的名義和權(quán)利,謹莊嚴地宣布并昭告:這些聯(lián)合殖民從此成為、而且名正言順地應(yīng)當成為自由獨立的合眾國;它們解除對于英王的一切隸屬關(guān)系,而它們與大不列顛王國之間的一切政治聯(lián)系亦應(yīng)從此完全廢止。材料三:第一條:在權(quán)利方面,人們生來就是而且始終是自由平等的。第二條:任何政治結(jié)合的目的都在于保存人的自然的和不可動搖的權(quán)利。這些權(quán)利就是自由、財產(chǎn)、安全和反抗壓迫。第十七條:財產(chǎn)是神圣不可侵犯的權(quán)利。請回答:上述材料分別出自哪三部法律文獻?由哪三個國家頒布?結(jié)合材料分別概括其核心內(nèi)容。此題主要考查學生對課程標準中規(guī)定的英法美三大資產(chǎn)階級革命中頒布的重要文獻內(nèi)容及其歷史意義的掌握情況。提供的三段材料全部是學生熟悉的教材中的材料,閱讀量和難易度比較適中。在問題設(shè)計上,第(1)問側(cè)重考查學生對基礎(chǔ)知識的記憶能力,難度較低;問題(2)則側(cè)重考查學生對材料進行提煉概括的能力,難度較高,該題設(shè)計上的梯度和層次性,使試題有一定的區(qū)分度。六、開放式試題(含計算、探究、論述、作文題)

所謂開放型試題,是指那些條件不固定,結(jié)論不明確,解法無限制,卻能反映學生對知識的總結(jié)、整合、應(yīng)用能力的試題.

開放型試題常見有:條件開放型題、結(jié)論開放型題、組合開放型題(即條件和結(jié)論同時開放)、策略開放型題.①試題應(yīng)該用來測量較高層次的教學目標,如要求學生提出理由、解釋變量間的關(guān)系、描述與評價材料、有系統(tǒng)地陳述結(jié)論等。②在命題時,我們必須對學生提出明確的任務(wù),使每道題都能真實地反映學生實際能力,而不受閱讀、理解等其他因素的干擾。③必要時可以出多道論述題讓學生自由選擇其中的某些問題或所有問題進行作答??荚囋u價要體現(xiàn)人性化、公平性和個性化的理念。④開放性試題具有設(shè)問開放性、答案設(shè)置多元化、解題策略多途徑的特點,考查學生的思維層面更為廣泛?;卮疬@樣的問題,要求考生充分運用發(fā)散性思維,從多角度、多層次、全方位分析和回答問題,同時,考生還必須將歸納和演繹、分析和綜合、抽象和具體等多種方法并用才能圓滿回答這類問題。開放性試題設(shè)問的開放性絕不是漫無目的地亂問一通,答案的多元化也不是考生隨心所欲想怎樣答就怎樣答,任何違背題目主旨、不符合題目要求的作答都不能作為題目答案。在參考答案及評分標準中要提供可能出現(xiàn)的足夠多的正確答案和相應(yīng)的評分要求。

七、對于試題材料選擇的幾點要求

1.試題材料的選擇,要注重思想內(nèi)涵、文化品味,要注意體現(xiàn)情感態(tài)度價值觀的導向。

2.要注意避免試題情境設(shè)置生硬,或脫離客觀實際

。

3.要注意考基礎(chǔ)知識不等于考機械記憶

。

4.注意考知識不等于考生活常識。

5.客觀題的答案要明確、具體,不能存在爭議。

6.注意從實際中選取素材,考查學生在實際情境中提取信息分析和處理問題的能力。

7.要注意對科學探究能力的考查,引導教學注重探究過程和方法,注重培養(yǎng)學生科學地認識事物、分析現(xiàn)象和把握規(guī)律的能力。

八、命題的建議:

1.試題立意,體現(xiàn)教育價值;2.試題創(chuàng)新,以考查學生創(chuàng)新意識為本;3.聯(lián)系實際,增強應(yīng)用,體現(xiàn)時代性;4.試題設(shè)計,體現(xiàn)以考生為本;

5.要有一定的覆蓋面。四、試題編制的技術(shù)規(guī)范和技巧1.難度的控制難度系數(shù)=該試題的平均分÷該試題的滿分值

我們平時的測試題難度系數(shù)把握在0.65-0.75左右比較合適。四、試題編制的技術(shù)規(guī)范和技巧2.區(qū)分度的把握區(qū)分度=(高分組的平均分-低分組的平均分)÷滿分值區(qū)分度的指標為:0.4以上為優(yōu)良題,0.3-0.39為良好題,0.2-0.29為一般題,0.2以下為劣題,需要修改。四、試題編制的技術(shù)規(guī)范3.信度的達成

為了試卷具有較高的信度,首先就是所選習題應(yīng)具有科學性、實效性、明確性,不能出現(xiàn)有科學性錯誤的、不符合學生實際的、設(shè)問不明確的題目,使學生無從答起。信度的理論公式

從以上公式可以看出,隨機誤差的方差越小,測量的信度就越高.信度的取值范圍為[0,1],如果測量誤差的方差為0,那么,測量的信度等于1,如果測量誤差的方差等于觀察分數(shù)的方差,則測量的信度為0.四、試題編制的技術(shù)規(guī)范和技巧4.效度的提升效度是指測試結(jié)果與測試目標的符合程度,即測驗達到測驗?zāi)康牡某潭取?/p>

第四部分考試的教育測量學質(zhì)量特性分析

教育考試的質(zhì)量特性。從宏觀上講有信度、效度及可用度,從微觀上講,有題目的難度、題目的區(qū)分度,以及題目的教學敏感度等。

測驗的信度(reliability),指測量結(jié)果或評價結(jié)果之間的一致性程度。也就是測量結(jié)果是否真實、客觀地反映了考生的實際水平。無論是量的規(guī)定性,還是質(zhì)的分析判斷,高信度的測驗或評價表意味著具有較好的誤差控制能力。因此,信度是反映測量或評價表性能的一個重要的質(zhì)量指標。信度高低可以用信度系數(shù)r來表示,其值在0到1之間。測驗的信度

具體而言,可以從以下三方面來理解測量的信度。

①信度指實測值與真值相差的程度測量的目的之一,就是希望通過測量得到的實測值能夠接近事物的真實值。由于各種原因,實測值一般不會完全等于真實值,兩者之差稱為測量誤差。測量誤差越小,測量的信度就越高。用一個等式表示如下:

②信度指統(tǒng)計量與參數(shù)之間的接近程度

統(tǒng)計量和參數(shù)是統(tǒng)計學中的兩個基本概念。統(tǒng)計量是指樣本上的各種數(shù)字特征(如樣本的平均數(shù)、標準差等),參數(shù)是總體上的各種數(shù)字特征(如總體的平均數(shù)、標準差等)。統(tǒng)計量越接近參數(shù),這個統(tǒng)計量的可靠性就越高,因此,信度就越高。要知道統(tǒng)計量對參數(shù)的接近程度,可以對參數(shù)進行區(qū)間估計。這種方法對估計真分數(shù)也很有用的。但這種理解也無法計算出信度。③信度指兩次重復測量或等值測量之間的關(guān)聯(lián)程度

如果對同一對象進行兩次重復測量或者等值測量以后,計算兩次測量的相關(guān)系數(shù),相關(guān)系數(shù)越高,說明測量的信度就越高;反之,就越低。對于信度的這種理解,有利于信度的計算。但重復測量會受到被測對象的經(jīng)驗、知識增長等因素的影響,等值測量又較難編制,因此,采用這種方法計算信度時,也是有誤差的。

信度是任何一個測量的必要條件,對于教育測量來說,它具有更為重要的意義。因為教育測量的對象主要是精神現(xiàn)象,所測量的特性不易把握,為了能真實地反映測量對象的某種特點,需要更加注意測量的信度,從而正確地判斷測量結(jié)果的價值。只有信度高的測量才能成為教育工作者有用的工具,否則,測量的結(jié)果是無意義的、無效的。信度的理論公式

從以上公式可以看出,隨機誤差的方差越小,測量的信度就越高.信度的取值范圍為[0,1],如果測量誤差的方差為0,那么,測量的信度等于1,如果測量誤差的方差等于觀察分數(shù)的方差,則測量的信度為0.信度的類型(一)穩(wěn)定性系數(shù)

(1)穩(wěn)定性系數(shù)又稱重測信度。它是指用同一測驗試卷,在先后兩個不同時間內(nèi)對同一組被測試卷,兩次測驗實得分數(shù)的相關(guān)系數(shù)。穩(wěn)定性系數(shù)是估量信度最簡單的方法,只需用同一份試卷對同一被測試卷測驗兩次即可。

(2)估計穩(wěn)定系數(shù)的基本程序是:(二)等值性系數(shù)(1)當同一測驗的一種型式不能或不適合實施兩次時,就需要采用該測驗的另一平行型測驗或者復份。(2)決定等值系數(shù)的方法是。先實施第一次測驗,然后在最短的時間內(nèi)實施第二份等值的測驗,再求它們得分的相關(guān)系數(shù)。這個相關(guān)系數(shù)即為信度的等值性系數(shù)。(3)其基本程序為:

(三)內(nèi)部一致性系數(shù)

(1)分半信度這種方法是將一次測驗分成兩個假定相等而獨立的兩部分來記分,通常是以題目的奇數(shù)為一組,偶數(shù)為一組,計算兩組的相關(guān)系數(shù),最后用斯皮爾曼—布朗公式校正,求得整個測驗的信度系數(shù)。(2)庫德爾—理查德森公式法

用這種方法只需測驗一次,然后以各個問題的正確反應(yīng)數(shù)為基礎(chǔ),或根據(jù)各人總分的平均數(shù)和標準差,計算信度系數(shù),常用的庫德爾—理查德森公式有和(四)論文式測驗的信度系數(shù)

論文式測驗的評分,沒有嚴格的評分標準,以致同樣的一個題目,不同的應(yīng)試者的回答和得分都不一樣,所以無法用前面的公式,而要用克龍巴赫所創(chuàng)的系數(shù)公式:考試的效度

效度是指測量結(jié)果的準確性和有效性的程度,亦即測量是否達到了預期的目的??荚嚨男Ф仁侵竿ㄟ^一次考試能確實地測量到它所欲測量的東西的程度。因此,考試的效度既與考試本身屬性有關(guān),也與考試的用途與使用方法有關(guān)。離開考試用途,孤立地研究考試的效度是沒有太大意義的。效度的概念在不斷發(fā)展,效度的種類也因用途或研究方法的不同而不同。

考試的效度可用考試的內(nèi)容效度和效標關(guān)聯(lián)效度來表示。我們可以從以下幾個方面來理解效度:

(一)測量的效度始終是對一定的測量目的而言的。一般而言,任何測量都有某種特定的目的和功能,判斷效度的高低,就是判斷測驗達到目的的程度。

(二)測量的效度也是對測量的結(jié)果而言。一種測量工具只有經(jīng)過實際測量,才能根據(jù)出來的結(jié)果判斷它的效度。

(三)一種測量的效度只是高或低的問題。因為,一種測量在編制時,總是針對一定的目的而編寫的。

(四)在教育測量中,效度問題比在其他領(lǐng)域的測量更為重要。每當進行教育、心理之類的間接測量的時候,必須考慮是否測量到了所要測量的東西,在多大程度上測量到了這些東西。也就是說,必須考慮測量的效度問題。效度的理論公式信度與效度的關(guān)系:①信度是效度的必要條件,但不是充分條件。一個測量工具要有效度必須有信度,沒有信度就沒有效度;但是有了信度不一定有效度。②信度低,效度不可能高。因為如果測量的數(shù)據(jù)不準確,也并不能有效地說明所研究的對象。③信度高,效度未必高。例如,如果我們準確地測量出某人的經(jīng)濟收入,也未必能夠說明他的消費水平。④效度低,信度很可能高。例如,即是一項研究未能說明社會流動的原因,但它很有可能很精確很可靠地調(diào)查各個時期各種類型的人的流動數(shù)量。⑤效度高,信度也必然高。因此,在信度與效度之間,首先要重點保證是高效度,因為,高效度必然高信度;反之,則不然。特別是對于教育測量而言,效度問題顯得更為重要。信度與效度的關(guān)系:效度的估計

(一)內(nèi)容效度

內(nèi)容效度是指測驗?zāi)康拇硭麥y量的內(nèi)容和引起預期反應(yīng)所達到的程度。也就是測量內(nèi)容的代表性程度。在編制測驗時,內(nèi)容效度是一個相當復雜和不易解決的問題。

估計內(nèi)容效度的方法:

①邏輯分析的方法

②用測驗題目與教材內(nèi)容比較的方法(二)效標關(guān)聯(lián)效度

考察測驗有效性的常用方法是選擇一個外在標準,看測驗結(jié)果是否與此標準相符。衡量測驗有效性的外在標準簡稱效標,因為這種方法實際上是考察測驗分數(shù)同效標的關(guān)系,所以稱效標關(guān)聯(lián)效度。效標關(guān)聯(lián)效度有兩種類型:同時效度與預測效度。前者指的是效標分數(shù)在測驗同時即可取得。預測效度指的是效標分數(shù)要經(jīng)過一段較長的時間后才能獲得的效度類型。

(1)效標是用來衡量測驗效度的尺度.

(2)選擇效標是一件困難而重要的工作.

(3)效標關(guān)聯(lián)效度又可稱為經(jīng)驗效度或統(tǒng)計效度,是以測驗分數(shù)和效標之間的相關(guān)系數(shù)來表示測驗的效度的高低的.

(4)效標關(guān)聯(lián)效度又可分為同時效度和預測效度.(三)結(jié)構(gòu)效度(1)所謂結(jié)構(gòu)效度,是指一個測量能實際測量出理論上的構(gòu)念或心理特性的程度。它的目的在于用心理學的概念來說明分析測驗分數(shù)的意義,也就是說從心理學的理論觀點就測驗的結(jié)果加以解釋和探討。(2)結(jié)構(gòu)效度的確定方法:

①從某一結(jié)構(gòu)理論出發(fā),導出各項關(guān)于心理功能或行為的基本假設(shè);

②據(jù)此編制測驗;(3)確立一個測量的結(jié)構(gòu)效度需要兩個步驟

①必須指出,這個測量和所有理論上認為應(yīng)與之有關(guān)的其他測量,有顯著的相關(guān)。

②必須指出這個測量與所有理論上認為不應(yīng)與之有關(guān)的其他測量,沒有顯著的相關(guān)。③由果溯因,以相關(guān)、實驗和因素等方法,檢驗測驗結(jié)果是否符合心理學上的理論見解。各種效度系數(shù)的要求

(1)不同的測驗對效度系數(shù)有不同的要求,例如,智力測驗分數(shù)與教師對學生的等級評定之間的效度系數(shù)一般在0.30~0.50的范圍內(nèi);相同科目的標準測驗成績與教師對學生名次排列之間的相關(guān)系數(shù)一般應(yīng)達到0.60~0.70;兩種不同的智力測驗或標準測驗之間的相關(guān)系數(shù)應(yīng)達到0.60~0.80,才符合要求。各種效度系數(shù)的要求

(2)對效度系數(shù)大小的要求,也受原測驗與獲得效標的測驗之間的相似性的制約。若二者不相似,則效度系數(shù)偏低;若相似,則效度系數(shù)會高些。所以,有的測驗效度系數(shù)達到0.35即已符合要求,有的卻要達到0.65~0.77才能被認為是有效的測驗。題目的難度

難度是指測驗試題的難易程度,可用通過比率來表示。各個試題的難度以適中為宜。試題太難或太易都不會有好的區(qū)分度,其信度也會降低。國外許多研究者以及我國的試驗結(jié)果證明,只有難度中等的試題才是較好的。

在教育測量中,客觀題的難度一般用正確回答試題的人數(shù)與參加測驗的總?cè)藬?shù)的比值來表示。其公式為:題目的難度

這里,難度實際上表示的是容易度,與試題的實際困難程度正好相反。難度是試題對學生知識和能力水平的適合程度的指標。試題的難度不但對題目的區(qū)分度有影響,而且對試卷的信度和效度也有較大的影響。

難度是由參與測量的被試群體的整體水平?jīng)Q定的。

題目的難度難度的計算

(一)計算難度的基本公式

1.客觀題難度的計算:

難度的計算

2.主觀題難度的計算:

(二)用極端分組法計算試題的難度

1.用極端分組法計算客觀題的難度具體步驟如下:

(1)先按測驗總分的高低,按由高到低的順序,依次排列試卷。

(2)從得分最高的一份試卷開始依次向下選出全部試卷的27%,作為高分組。

(3)從得分最低的一份試卷開始依次向上選出全部試卷的27%,作為低分組。1.用極端分組法計算客觀題的難度

(4)按下列公式計算難度:

2.用極端分組法計算主觀題的難度

具體步驟如下:

(1)按測驗得分排列試卷,確定高分組與低分組,各占總?cè)藬?shù)的25%(方法與前面相同)。

(2)分別為高分組、低分組編制每道試題的分析表。

2.用極端分組法計算主觀題的難度

(3)按下列公式計算難度:

難度對測驗的影響

1.測驗難度影響測驗分數(shù)的分布形態(tài)

難度值過大或過小,都會造成測驗分數(shù)的偏態(tài)分布。難度值越接近0,測驗的難度就越大,正確回答試題的人數(shù)就越少,測驗分數(shù)就越是集中在低分段,其分數(shù)分布呈正偏態(tài);相反,難度值越接近1,其難度就越小,正確回答試題的人數(shù)就越多,測驗分數(shù)集中在高分段,分數(shù)分布呈

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論