第六章 心理測驗的編制_第1頁
第六章 心理測驗的編制_第2頁
第六章 心理測驗的編制_第3頁
第六章 心理測驗的編制_第4頁
第六章 心理測驗的編制_第5頁
已閱讀5頁,還剩107頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第四章測驗題目性能與題目編制心理測量學(xué)引子心理測量的工具是測驗,而題目則是構(gòu)成測驗的基石,因此研究題目的性能及其編制至關(guān)重要,它直接影響測量工具(即測驗)的信度及效度,進(jìn)而影響測量的準(zhǔn)確性。在實際工作中,人們應(yīng)如何來編制測驗題目?如何評價測驗題目質(zhì)量的好差呢?本章將對這些問題做出回答。心理測量學(xué)測驗題目性能與題目編制測驗題目類型、功能與題目編制1測驗題目的難度與難度分布控制2測驗題目的區(qū)分度與區(qū)分度的提高3測驗題目的猜測度與猜測控制4選擇題的選項分析與選項修改5題目功能差異與測量偏差控制6第六章心理測驗的編制第一節(jié)心理測驗編制的基本程序與原則一、心理測驗編制的一般程序準(zhǔn)備階段正式編制階段完善階段1、確定測驗?zāi)康模?)明確測量用途用于描述、還是診斷,或用于預(yù)(2)明確測量目標(biāo)

心理變量或行為特征必須有操作定義,目標(biāo)要非常具體。(3)明確測量對象

年齡、性別、職業(yè)、受教育程度、經(jīng)濟狀況、民族、文化背景等。(一)準(zhǔn)備階段:確定目的與制定計劃2、制定編題計劃通常是一張雙向細(xì)目表,指出測驗所包含的內(nèi)容和要測定的各種技能,以及對每一個內(nèi)容和技能的相對重視程度。例:小學(xué)自然常識測驗編題計劃知識理解應(yīng)用分析綜合評價合計生物世界35632120資源利用23311010動力與機械23420112物質(zhì)與能量56832125氣象24322013宇宙25410012地球2221108合計1828301388100(二)正式編制階段:產(chǎn)生測題與合成測驗(二)正式編制階段:產(chǎn)生測題與合成測驗1、產(chǎn)生測題(一)收集測驗資料(1)資料要豐富(2)資料要有普遍性(3)資料要有趣味性

(2)選擇項目形式

紙筆測驗還是操作測驗?是客觀題還是主觀題?概念和原理的記憶——簡答題辨別和判斷——選擇題綜合運用——論文題幼兒——口頭測驗文盲、半文盲、聾啞——操作測驗人多、經(jīng)費有限——團體測驗人少——個體測驗(3)編寫測驗項目題目范圍要與雙向細(xì)目表一致;題目數(shù)量要比最終所需要的數(shù)量多,以便篩選或編制復(fù)本;題目的難度應(yīng)有一定的分布范圍;用詞力求清楚明白。2、合成測驗(1)試測與復(fù)核應(yīng)取自將來正式測驗準(zhǔn)備應(yīng)用的群體施測過程與施測情景時限可稍寬一些記錄被試的各種反應(yīng)。(2)項目選擇與編排項目選擇質(zhì)的分析:內(nèi)容取樣、題目的思想性、表達(dá)是否清楚量的分析:難度、區(qū)分度、備選項分析測驗項目的編排直接遞增式并列直進(jìn)式混合螺旋式(3)編制復(fù)本

各份復(fù)本必須等值。等值要符合下列條件:各份測驗測量的是同一種心理特性。各份測驗具有相同的內(nèi)容和形式。各份測驗的題目不應(yīng)重復(fù)。各份測驗題目數(shù)量相等,難度和區(qū)分度大體相同。各份測驗的分?jǐn)?shù)分布(平均數(shù)和標(biāo)準(zhǔn)差)大致相等。復(fù)本編好后,應(yīng)再測一次,以確保各份測驗的等值。(三)完善階段:測驗標(biāo)準(zhǔn)化與性能評估1、測驗標(biāo)準(zhǔn)化測驗的標(biāo)準(zhǔn)化是指測驗的編制、實施、評分以及分?jǐn)?shù)解釋都有統(tǒng)一的標(biāo)準(zhǔn),以減少無關(guān)因素對測驗的影響。(1)測驗內(nèi)容指測驗內(nèi)容對所有被試都一樣。(2)施測過程測驗情景指導(dǎo)語時限(3)測驗評分為使評分盡可能客觀,有三點要求:對被試反應(yīng)的及時和清楚的記錄。特別是對口試和操作測驗。要有一張標(biāo)準(zhǔn)答案或正確反應(yīng)的表格,即計分鍵。將被試的反應(yīng)和計分鍵比較,對反應(yīng)進(jìn)行分類。(4)測驗分?jǐn)?shù)的解釋常模參照標(biāo)準(zhǔn)參照:內(nèi)容參照,結(jié)果參照2、測驗性能評估(1)信度(2)效度(3)測驗量表與常模

3、編寫測驗說明書測驗的目的和功用;編制測驗的理論背景以及選擇題目的根據(jù)和測驗的構(gòu)成;測驗的實施方法、時限及注意事項;測驗的標(biāo)準(zhǔn)答案和評分方法;測驗的信度和效度資料;常模資料。二、心理測驗編制的主要原則(一)心理測驗編制的基本原則信度好效度高難度適中區(qū)分度強(二)心理測驗編制的具體要求1.針對題目內(nèi)容的要求(1)試題要符合測驗的目的。(2)內(nèi)容取樣要有代表性。(3)各個題目必須彼此獨立,不可互相牽連,不要使一個題目的回答影響另一個題目的回答。

2.針對題目語言的要求(1)文句要簡明扼要,既排除與解題無關(guān)的因素,又不可遺漏解題所依據(jù)的必要條件。要避免使用艱深的字詞。(2)一個概念一句話。(3)意義明確肯定,避免使用雙重否定句。三、心理測驗編制的具體技術(shù)3.針對題目表達(dá)的要求(1)題目中不可含有暗示本題或其他題正確答案的線索。(2)所提問題應(yīng)避免涉及社會禁忌與個人隱私。(3)避免使用主觀情緒化字句和問題4.針對題目理解的要求(1)應(yīng)有不致引起爭論的確定答案(創(chuàng)造力測驗、人格測驗除外)。(2)題目格式不要使被試產(chǎn)生誤解。(3)題目內(nèi)容不要超出受測團體的知識和能力。第四章測驗題目的性能與題目編制測驗題目的類型功能與編制

第一節(jié)心理測量學(xué)第一節(jié)一、測驗題目類型題目主要可分為客觀題和主觀題兩大類??陀^題一般有標(biāo)準(zhǔn)唯一的答案,被試的作答只有與標(biāo)準(zhǔn)答案完全一致才視為答對,否則視為答錯。主觀題無標(biāo)準(zhǔn)唯一答案,只有一個參考答案,被試的作答與參考答案相近或基本一致就可視為答對。心理測量學(xué)客觀題主要包括選擇題(含自陳式選擇題)、填空題、是非判斷題、匹配題、行為情景判斷題等。主觀題主要包括名詞解釋、簡答題、計算題、證明題、論述題、案例分析題、作文題等。心理測量學(xué)單項選擇題多項選擇題自陳式選擇題是非判斷題名詞解釋題簡答題計算題證明題論述題案例分析題組合題行為情景判斷題心理測量學(xué)二、選擇題1、定義:選擇題指給出題干及備選項,要求被試根據(jù)題干從備選項中選出正確選項的題目。單項選擇題指只有唯一正確選項的選擇題。2、特點功能:①評分標(biāo)準(zhǔn)明確,評分客觀,有利于減少評分帶來的評分誤差。②有利于對基礎(chǔ)知識和基本技能進(jìn)行考查。心理測量學(xué)③選擇題適合考查較低層次的能力,如識記能力、較低的理解能力等,而不宜考查較高層次的能力,如綜合能力、創(chuàng)造性和獨立思維能力。④選擇題的命題技術(shù)要求較高,尤其是干擾項的設(shè)置。心理測量學(xué)3、選擇題編制題干要描述清楚。應(yīng)讓答題者明白問題是什么,希望答題者解決什么題干中應(yīng)盡量避免出現(xiàn)與考核內(nèi)容無關(guān)的材料設(shè)問應(yīng)盡量正向,盡量少出現(xiàn)如“下面哪個是不對的?”的設(shè)問心理測量學(xué)題干文字的字體應(yīng)盡量一致(,以減輕考生的閱讀負(fù)擔(dān)備選項應(yīng)避免出現(xiàn)邏輯上的包含關(guān)系備選項的長度、結(jié)構(gòu)、語言表達(dá)要盡量一致增加干擾項的迷惑性干擾項的設(shè)置應(yīng)能反應(yīng)考生缺乏特定的知識或技能心理測量學(xué)三、填空題1、特點功能:①考查的能力層次范圍比較廣,主要考核識記和理解能力。②填空題要求考生把問題的最后答案或結(jié)論正確無誤地表達(dá)出來,在一定程度上是對考生的嚴(yán)謹(jǐn)、嚴(yán)密、認(rèn)真、細(xì)致的工作作風(fēng)和科學(xué)態(tài)度的檢查。心理測量學(xué)③評分簡單,誤差也相對要小。④填空題只要求考生寫出最后答案,而不必寫出解題的具體過程,因此,從試卷上看不出考生的推理、分析等思考過程心理測量學(xué)2、填空題編制試題的空格處應(yīng)考查有意義的關(guān)鍵性內(nèi)容或詞語。每小題的空格數(shù)不宜過多,填寫的字?jǐn)?shù)也不能太多??崭癫糠纸y(tǒng)一用下劃線表示,長度應(yīng)能滿足答題需要若空格處考核計算能力并要求填寫數(shù)字,應(yīng)在空格后標(biāo)明數(shù)字的單位心理測量學(xué)三、論述題與計算題1、定義:論述題指對某一問題或議題進(jìn)行綜合論述的題目。它用于考查被試分析、綜合、評價直至創(chuàng)新、創(chuàng)造等高層次能力。計算題指主要是通過計算或運算來解答的題目。計算題內(nèi)容量有大有小,常常用于考查被試的應(yīng)用能力。一般要求給出條件完備無冗余,答案唯一。心理測量學(xué)心理測量學(xué)2、特點功能:

①論述題有利于考生獨立地、創(chuàng)造性地解題。試題的能力考查涉及的知識面可以比較大,而且要求考生通過分析去找出所涉及的知識并找出它們的內(nèi)在聯(lián)系。試題從定性分析到定量計算,工作量一般比較大。

心理測量學(xué)②論述題和計算題不僅能夠考查考生較低層次的能力目標(biāo),而且能夠比較好地考查較高層次的能力目標(biāo)。心理測量學(xué)③論述題和計算題能夠反映考生的思維過程,因而能比較有效地考查考生接受信息、鑒別和選擇信息的能力,分析、推理、綜合應(yīng)用知識的能力,能鑒別出考生對問題解決的程度。心理測量學(xué)④論述題和計算題可以根據(jù)試題相應(yīng)情境進(jìn)行不同層次、不同角度的設(shè)問,如可以是單問,可以是多問,也可以是分步設(shè)問,使試題的考查目標(biāo)比較明確。心理測量學(xué)⑤論述題、計算題在評分過程具有一定的主觀性。⑥論述題、計算題的最大缺點是閱卷評分的工作量比較大,對閱卷人員的要求比較高,閱卷工作的費用較大。同時論述題、計算題評分誤差較難控制,在控制不好的情況下,評分誤差可能會很大。心理測量學(xué)四、行為情景判斷題1、定義:行為情景判斷題多見于心理測驗中,它指給出一個日常生活中或工作中的具體情景,并針對該情景提供若干解決這一情景下具體問題的行為選項,并要求受測者進(jìn)行選擇/評價的題型。2、特點功能:①與一般認(rèn)知能力有較強的相關(guān),平均達(dá)0.54②跟大五人格因素的多項因素有中度以上的相關(guān),如跟責(zé)任心的相關(guān)為0.26,跟情緒穩(wěn)定性的相關(guān)為0.32,跟宜人性的相關(guān)為0.25心理測量學(xué)心理測量學(xué)③跟所測領(lǐng)域個人的工作經(jīng)驗、工作年限有統(tǒng)計顯著意義的相關(guān)。④有些情景判斷測驗作探索性因素分析,可提取出一個大的一般因素,這時測驗的內(nèi)部一致性系數(shù)可為0.86⑤對員工的工作績效有較好的預(yù)測力,平均效度系數(shù)為0.36心理測量學(xué)3、行為情景判斷題編制①題目編制前應(yīng)先確定所測特質(zhì)的結(jié)構(gòu),然后在這一所測特質(zhì)結(jié)構(gòu)下征集或編寫問題情景及行為反應(yīng)項②問題情景應(yīng)是現(xiàn)實生活中可能發(fā)生的,且有一具體的問題需要受測者來解決,解決問題的行為/方法不應(yīng)是唯一的而是多樣化的③問題情景應(yīng)盡量敘述完整,清晰,語言規(guī)范,字?jǐn)?shù)介于100-300④一般是根據(jù)相關(guān)有豐富經(jīng)驗的專家來確定行為項的優(yōu)劣,然后將受測者的作答與專家的評定進(jìn)行比較,從而確定具體的計分方式及評價標(biāo)準(zhǔn)心理測量學(xué)心理測量學(xué)⑤行為情景判斷題設(shè)問方式一般有四種形式:一是要求受測者選擇最優(yōu)行為項,二是要求受測者選擇最差行為項,三是要求受測者同時選擇最優(yōu)和最差行為項,四是要求受測者針對每一行為項的有效性做出評價。應(yīng)根據(jù)實際選擇具體方式。第六章測驗題目的性能與題目編制測驗題目難度與測驗分布控制

第二節(jié)心理測量學(xué)第二節(jié)一、難度定義及其計算方法(一)難度定義難度是指題目的難易程度。如果一個題目絕大多數(shù)人都答對了,則這個題目比較容易;反之,若絕大多數(shù)人都答錯了,則這個題目比較難。從難度定義可以看到,難度是題目性質(zhì)與作答者群體水平共同作用的結(jié)果。難度這一概念更多地用于能力測驗中,在非能力測驗(如人格測驗)中,一般稱為“通俗性”(popularitylevel),即取自相同總體的樣本中,在答案方向上回答該題的人數(shù)比。心理測量學(xué)心理測量學(xué)(二)難度計算方法1、得分率法得分率指所有被試在題目上的平均得分占題目滿分的百分比。計算公式為

心理測量學(xué)心理測量學(xué)2、極端分組法極端分組法是指將被試按測驗總分分為高分組和低分組,以兩組得分率的平均值作為題目的難度。極端分組法中,首先需對被試進(jìn)行分組,根據(jù)被試的試卷總得分進(jìn)行排序,各取首尾的27%(或25%、33%),組成高分組和低分組。心理測量學(xué)心理測量學(xué)心理測量學(xué)心理測量學(xué)(四)等距難度指標(biāo)及其求取題目的難度一般用通過率或得分率來表示,計算比較方便,但這類變量屬于順序變量,不具有相等的單位,不能具體比較難度的差異。心理測量學(xué)等距轉(zhuǎn)換方法當(dāng)測驗分?jǐn)?shù)接近正態(tài)分布,根據(jù)正態(tài)分布將試題的難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成具有相等測量單位的等距量表,即Z分?jǐn)?shù)。心理測量學(xué)等距轉(zhuǎn)換但是Z值常含有負(fù)值,因此不易理解,通常需轉(zhuǎn)換為另一種等距變量,其中較為常用的是美國教育測驗服務(wù)中心采用的難度指標(biāo):△=13+4*Z式中△表示題目的難度,Z表示由P轉(zhuǎn)換得來的標(biāo)準(zhǔn)分?jǐn)?shù)。心理測量學(xué)二、難度分布及其控制(一)測驗試題難度分布對測驗分?jǐn)?shù)的影響

1、難度對測驗分?jǐn)?shù)分布形態(tài)的影響當(dāng)測驗題目過難時,測驗分?jǐn)?shù)呈負(fù)偏態(tài)分布;當(dāng)測驗題目過易時,測驗分?jǐn)?shù)呈正偏態(tài)分布;當(dāng)測驗題目趨近中等難度,測驗分?jǐn)?shù)基本可呈正態(tài)分布。心理測量學(xué)2、難度對測驗分?jǐn)?shù)離散程度的影響測驗過難或過易,會使測驗分?jǐn)?shù)相對地集中低分端或高分端,這樣被試的差異較小,即測驗分?jǐn)?shù)的離散程度很小,只有當(dāng)測驗趨近中等難度時,測驗分?jǐn)?shù)分布范圍較廣,離散程度就會大。心理測量學(xué)(二)、合理難度及合理難度分布

對于常模參照性測驗而言,測驗?zāi)康氖菫榱藚^(qū)分被試、最大限度地將被試得分“拉開距離”。對所有被試而言,合理項目難度為0.5,分布范圍應(yīng)在0.3到0.7之間。心理測量學(xué)對于目標(biāo)參照性測驗而言,其合理難度分布是:對于恰好合格被試而言難度為0.5左右窄全距分布,也即測驗在合格與合格被試處有較高的區(qū)分能力。心理測量學(xué)(三)、合理難度及合理難度分布的控制

(1)對題目難度的控制主要從考核的知識點及其能力層次等方面進(jìn)行控制??己藛我恢R點的題目相對考核較多同類知識點的題目要容易。心理測量學(xué)考核能力層次相對要低(如識記和記憶)的題目,其難度相對低,而對于考核能力層次高(如理解、綜合應(yīng)用)的題目,其難度相對會高。因而可以通過控制題目考核的知識點及其能力層次來達(dá)到控制試題難度。心理測量學(xué)(2)對試卷難度分布的控制控制試卷難度分布是在控制試題難度的前提下進(jìn)行,它主要是通過控制不同難度題目的比例從而達(dá)到所需的難度分布。如果測驗是選拔性測驗,則難、易題目所占比例應(yīng)充分考慮選拔的比例;如果是常模參照性測驗,則中等難度題比例要多,而偏難偏易的題比例要少;如果是目標(biāo)參照性測驗,不同難度題的比例應(yīng)結(jié)合“目標(biāo)”(如課程標(biāo)準(zhǔn)或《考試大綱》)本身來確定。心理測量學(xué)第四章測驗題目的性能與題目編制測驗題目的區(qū)分度與區(qū)分度的提高

第三節(jié)心理測量學(xué)一、區(qū)分度的定義及其計算方法(一)、區(qū)分度定義

區(qū)分度指題目對被試特質(zhì)差異的區(qū)分能力。若所有考生在某個題目均答對或均答錯,則此題目不能區(qū)分不同特質(zhì)的被試,即此題目無區(qū)分能力。第三節(jié)一般來講,題目是否有區(qū)分能力,主要是看不同能力的被試在同一題目上得分是否不同。理論上,如果題目具有高區(qū)分力,那么高能力的被試在題目上應(yīng)得高分,低能力被試在題目應(yīng)得低分,也即被試的能力與在題目上的得分應(yīng)存高相關(guān)。

心理測量學(xué)心理測量學(xué)(二)、區(qū)分度的計算方法1、相關(guān)系數(shù)法該方法的基本思想是,若題目有好的區(qū)分度,則高能力的被試在該題上應(yīng)得高分,低能力被試應(yīng)得低分,即被試在題目上的得分應(yīng)與測驗總分相一致。其基本假設(shè)是測驗得高分的被試即為高能力被試,測驗得低分的被試即為低能力被試。心理測量學(xué)(1)點二列相關(guān)法

心理測量學(xué)(2)積差相關(guān)法心理測量學(xué)2、鑒別指數(shù)法

心理測量學(xué)(三)、題目區(qū)分度計算實例例4-2下表是隨機抽取22名被試在某語文測驗中四道題目的得分情況,四題滿分分別為1分、3分、5分和60分,其中第4題為作文題,請計算四題的區(qū)分度。心理測量學(xué)心理測量學(xué)心理測量學(xué)二、區(qū)分度的評價標(biāo)準(zhǔn)及其提高(一)、區(qū)分度的評價標(biāo)準(zhǔn)

區(qū)分度的取值范圍為[-1,1],區(qū)分度為負(fù)的(消極區(qū)分),題目性能不好,這種題目對測驗總分合成起著不良的干擾作用。1965年美國測量學(xué)家伊貝爾根據(jù)長期經(jīng)驗提出如下標(biāo)準(zhǔn)。

心理測量學(xué)心理測量學(xué)(二)、影響題目區(qū)分度的因素(1)題目難度(2)被試群體的同質(zhì)性(3)全卷各題所測心理品質(zhì)的一致性。(4)題目本身的文字與內(nèi)容的質(zhì)量也會影響題目的區(qū)分度心理測量學(xué)(三)、提高題目區(qū)分度方法

(1)控制好題目難度。將題目難度在0.5左右時,區(qū)分能力理論上會比較高。(2)保證題目所測心理品質(zhì)與全卷所測心理品質(zhì)的一致性。(3)題干及答案無歧義。(4)語言準(zhǔn)確規(guī)范。(5)借助選項分析提供的信息對不良選項進(jìn)行修改,以提高題目區(qū)分能力。第四章測驗題目的性能與題目編制測驗題目的猜測度與猜測度的控制

第四節(jié)心理測量學(xué)第四節(jié)一、猜測行為與猜測度客觀題中,當(dāng)被試不知道正確答案時,被試可能會進(jìn)行猜測。就目前而言,理論界對于猜測行為有兩種截然相反的觀點:一種認(rèn)為應(yīng)對猜測行為加于控制,另一種認(rèn)為無需控制猜測行為。中。

猜測度是指被試全憑隨機猜測而答對題目的概率。猜測行為主要出現(xiàn)在客觀題(如選擇題、是非判斷題、配對題等)心理測量學(xué)心理測量學(xué)二、猜測度控制①增加選擇題選擇項的個數(shù)(一般不少于四個)。②增加干擾項的迷惑性。③控制存在猜測行為的總題量,以保證猜測誤差控制在較小范圍。④如有特殊需要,還可采用警告、扣分等方式控制被試的猜測行為。第四章測驗題目的性能與題目編制選擇題的選項分析與選項修改

第五節(jié)心理測量學(xué)第五節(jié)一、選項分析基本過程1、根據(jù)被試的測驗總分,對被試進(jìn)行排序2、確定高分組和低分組被試3、分別登記高分組被試和低分組被試在每個備選項的人數(shù)及未作答人數(shù)(也可以是人數(shù)百分比),最終整理成類似表中的數(shù)據(jù)資料4、根據(jù)第3步整理好的數(shù)據(jù)資料,進(jìn)行具體分析心理測量學(xué)心理測量學(xué)二、選項分析的方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論