心理測量學(xué)課件_第1頁
心理測量學(xué)課件_第2頁
心理測量學(xué)課件_第3頁
心理測量學(xué)課件_第4頁
心理測量學(xué)課件_第5頁
已閱讀5頁,還剩630頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

心理測量學(xué)2024/3/20心理測量學(xué)2心理測量概論心理測量的基本性質(zhì)

1測驗(yàn)的類型與功能

2測驗(yàn)的編制與實(shí)施

3心理測量發(fā)展簡史

42024/3/20心理測量學(xué)3心理測量概論心理測量的基本性質(zhì)

第一節(jié)一、心理測量應(yīng)用的普遍性二、心理的可測性三、心理測量的間接性四、心理測量的定義五、心理測量的心理影響性六、心理測量的工具及其特性七、心理測量誤差存在的普遍性與嚴(yán)重性八、心理測量誤差控制的理論與技術(shù)概述2024/3/20心理測量學(xué)4DBCA升學(xué)升級要測驗(yàn)

應(yīng)聘謀職要測驗(yàn)執(zhí)業(yè)上崗要測驗(yàn)晉職晉級要測驗(yàn)

人生的每個(gè)關(guān)鍵時(shí)刻都要用到測驗(yàn)心理測量應(yīng)用的普遍性一、2024/3/20心理測量學(xué)5

1

2

3

4評估人的心理發(fā)展水平有心理成熟測驗(yàn)評估人的智力發(fā)展水平有智力測驗(yàn)評估人的心理健康水平有心理健康測驗(yàn)評估人的人格特征有人格測驗(yàn)人的心理的各個(gè)側(cè)面都有測驗(yàn)2024/3/20心理測量學(xué)65評估人的教育水平有教育成就測驗(yàn)

6評估人的職業(yè)能力有執(zhí)業(yè)資格測驗(yàn)7評估人的學(xué)術(shù)能力有學(xué)術(shù)性向測驗(yàn)

三百六十行,行行有測驗(yàn)2024/3/20心理測量學(xué)7需要更多的專業(yè)人員

社會發(fā)展和進(jìn)步的標(biāo)志

心理測量發(fā)展

2024/3/20心理測量學(xué)8二、心理的可測性人的心理非物質(zhì),人的心理可測嗎?

2024/3/20心理測量學(xué)9孟子:權(quán),然后知輕重;度,然后知長短。物皆然,心為甚。桑代克:凡客觀存在的事物都有其數(shù)量。麥考爾:凡有其數(shù)量的事物都可以測量。2024/3/20心理測量學(xué)10辯證唯物主義的觀點(diǎn):

人的外顯行為客觀存在,可以感覺、知覺,進(jìn)而可以測量。心理學(xué)的研究證明:

可以通過測量人的外顯行為而推測人的心理。

2024/3/20心理測量學(xué)11三、心理測量的間接性心理測量是一種間接測量。間接測量必須找準(zhǔn)中介媒質(zhì)。物理測量也有間接測量:測氣溫中介媒質(zhì):水銀

心理測量的中介媒質(zhì):人的外顯行為。外顯行為:種類眾多而且復(fù)雜多變。心理測量的間接測量難度更大。2024/3/20心理測量學(xué)12四、心理測量的定義廣義測量定義:測量是依據(jù)一定的法則使用量具對事物的特征進(jìn)行定量描述的過程。心理測量定義:依據(jù)一定的心理學(xué)理論,使用測驗(yàn)對人的心理品質(zhì)進(jìn)行定量描述的活動。2024/3/20心理測量學(xué)13定義理解:1、心理測量依據(jù)的法則:心理學(xué)理論2、心理測量工具:測驗(yàn)。測驗(yàn)的本質(zhì):一個(gè)一個(gè)精心設(shè)計(jì)、精心編排,被稱為“題目”的行為刺激組成,“測驗(yàn)”內(nèi)容千差萬別,形式林林總總。3、測量的對象:人的心理品質(zhì)。心理品質(zhì)具有內(nèi)隱性,概念具有抽象性。4、心理測量的結(jié)果:對象的定量描述。2024/3/20心理測量學(xué)141“心理測量”:多指一項(xiàng)活動、一個(gè)過程。2“心理測驗(yàn)”:多指一樣工具,一個(gè)測量文本偶爾當(dāng)動詞用3“心理評估”:指獲取測量結(jié)果信息后根據(jù)某種標(biāo)準(zhǔn)做出狀態(tài)優(yōu)劣判斷的活動。

區(qū)別本書三詞用法差異2024/3/20心理測量學(xué)15五、心理測量的心理影響性心理影響性:無論主觀愿望是什么,只要實(shí)施測量,就會給被測量者的心理發(fā)展帶來影響。影響可能是積極的,也可能是消極的,可能是短期的,也可能是長期的。積極的心理影響:教育測量:準(zhǔn)確評價(jià),激勵學(xué)習(xí);經(jīng)歷測量也是學(xué)習(xí),有助于提高。人格測驗(yàn):了解人格,促使人格健康發(fā)展,促使行為被人悅納。能力傾向測驗(yàn):了解特長,選擇和分配合適工作,人、崗和諧匹配。2024/3/20心理測量學(xué)16消極的心理影響:誤用和濫用,使用質(zhì)量低劣的測驗(yàn)??浯蠼逃荚嚨淖饔茫簽閼?yīng)試而學(xué)習(xí),忽視綜合素質(zhì)發(fā)展。頻繁施行教育考試,學(xué)生疲于應(yīng)付,身心受摧殘。不科學(xué)解釋智力測驗(yàn):盲目樂觀,迷失方向或自暴自棄,喪失動力。不合理使用人格測驗(yàn):傷害自尊,甚至導(dǎo)致人格分裂。使用質(zhì)量低劣測驗(yàn):對被試做出錯(cuò)誤的描述,引發(fā)嚴(yán)重后果。結(jié)論:編制、選擇和使用測驗(yàn)都要非常慎重。2024/3/20心理測量學(xué)17六、心理測量的工具及其特性測驗(yàn)的本質(zhì):任何測量工具都是有參照點(diǎn)和測量單位的數(shù)字系統(tǒng)。在心理測量學(xué)中也把它叫做量表。量表的兩要素:參照點(diǎn)、測量單位參照點(diǎn):測量的起點(diǎn),也稱零點(diǎn)。

絕對零點(diǎn):絕對理解;相對零點(diǎn):零只能說品質(zhì)處于“零點(diǎn)”狀態(tài)。有絕對零點(diǎn)的測量比只有相對零點(diǎn)的測量性能更好。2024/3/20心理測量學(xué)18優(yōu)良測量單位:有統(tǒng)一的意義,有恒定的價(jià)值。心理測量量表兩要素的特點(diǎn):參照點(diǎn)是人為的。測量的單位要經(jīng)過統(tǒng)計(jì)處理才能有統(tǒng)一意義,有恒定價(jià)值。2024/3/20心理測量學(xué)19七、心理測量誤差存在的普遍性與嚴(yán)重性測量的誤差:測量所得值與欲測品質(zhì)實(shí)際值之間的差異值。誤差的區(qū)別:誤差的性質(zhì)誤差的大小誤差的來源誤差控制的難度心理與教育測量誤差:不僅存在而且還非常的嚴(yán)重。測量研究主要任務(wù):研究如何控制測量的誤差。

2024/3/20心理測量學(xué)20(一)測量誤差的類型隨機(jī)誤差:所得值與實(shí)際值之間大小和方向都會隨機(jī)變化的差異值。系統(tǒng)誤差:所得值與實(shí)際值之間的那種大小和方向都不變的差異值。特點(diǎn):誤差與實(shí)際測量值共居一體、混淆難分。任務(wù):將它們分離出來,評估它們的大小,研究控制辦法。2024/3/20心理測量學(xué)21(二)測量誤差形成的原因1、心理品質(zhì)的特殊性內(nèi)隱、抽象,造成對目標(biāo)認(rèn)識不清晰,導(dǎo)致誤差不穩(wěn)定,波動起伏,導(dǎo)致誤差;受測者未掌握正確作答技能,致使作答不能代表真實(shí)水平;受測者故意掩飾。致使評價(jià)出現(xiàn)誤差。2、使用質(zhì)量不高的測量工具人的外顯行為與人的心理品質(zhì)只具備相關(guān)關(guān)系;所測外顯行為不是欲測心理品質(zhì)的代表性行為;測驗(yàn)項(xiàng)目只“刺激”出了欲測心理品質(zhì)的一部分行為;外顯行為不清晰、不穩(wěn)定。2024/3/20心理測量學(xué)223、施測過程和施測環(huán)境安排控制不好施測過程沒有統(tǒng)一要求;測試指導(dǎo)語沒有統(tǒng)一版本;作答起始時(shí)間和長短不統(tǒng)一;測試時(shí)的內(nèi)外環(huán)境令被試不能集中精力;測試過程失控、紀(jì)律混亂,舞弊。4、主試的不良品質(zhì)主試對所測心理品質(zhì)的理解有誤主試實(shí)施的程序有誤;評分標(biāo)準(zhǔn)掌握不準(zhǔn)確2024/3/20心理測量學(xué)23八、心理測量誤差控制的理論與技術(shù)概述目標(biāo)真分?jǐn)?shù),記為V,是測量者所追求的測量值。隨機(jī)誤差分?jǐn)?shù),記為E非目標(biāo)真分?jǐn)?shù)(系統(tǒng)誤差分?jǐn)?shù)):記為I目標(biāo)真分?jǐn)?shù)與非目標(biāo)真分?jǐn)?shù)合在一起稱為真分?jǐn)?shù),記為T。2024/3/20心理測量學(xué)24心理與教育測量學(xué)假設(shè):

進(jìn)而有:在三者都相互獨(dú)立的假設(shè)下,推得以下兩公式:

2024/3/20心理測量學(xué)25信度:真分?jǐn)?shù)方差在觀察分?jǐn)?shù)方差中所占的比,記為:效度:目標(biāo)真分?jǐn)?shù)方差在觀察分?jǐn)?shù)方差中所占的比記為:

心理測量的誤差控制任務(wù):努力控制測量的隨機(jī)誤差,提高測量的信度。努力控制測量的隨機(jī)誤差和系統(tǒng)誤差,提高測量的效度。

2024/3/20心理測量學(xué)26經(jīng)典測量理論(ClassicalTestTheory,CTT)。其他理論:項(xiàng)目反應(yīng)理論(ItemResponseTheory,,TRT)概化理論(JeneralizabilityTheory,GT)2024/3/20心理測量學(xué)27心理測量概論測驗(yàn)的類型與功能

第二節(jié)一、按所測心理品質(zhì)不同分類二、按對被試評價(jià)時(shí)所用的參照標(biāo)準(zhǔn)不同分類三、標(biāo)準(zhǔn)化測驗(yàn)與非標(biāo)準(zhǔn)化測驗(yàn)四、計(jì)算機(jī)化測驗(yàn)與非計(jì)算機(jī)化測驗(yàn)2024/3/20心理測量學(xué)28一、按所測心理品質(zhì)不同分類(一)能力測驗(yàn)1.智力測驗(yàn)(IntelligenceTest):

測量人的一般認(rèn)知能力水平高低的測驗(yàn)。智力測驗(yàn)的結(jié)果比較穩(wěn)定。測量理論與技術(shù)研究最早涉及領(lǐng)域2024/3/20心理測量學(xué)291斯坦福-比內(nèi)量表2韋克斯勒智力量表3瑞文推理測驗(yàn)著名智力測驗(yàn)

2024/3/20心理測量學(xué)302.能力傾向測驗(yàn)(AptitudeTest):能力傾向測驗(yàn)類型:(1)一般能力傾向測驗(yàn):測量個(gè)體在多種能力上的潛在優(yōu)勢的測驗(yàn)。(2)特殊能力傾向測驗(yàn):音樂、繪畫等特殊能力的測驗(yàn)。能力傾向特點(diǎn):依賴于先天,與生活經(jīng)驗(yàn)有關(guān),一般不受專門教學(xué)或訓(xùn)練影響。

能力傾向測驗(yàn)性質(zhì):測值相對穩(wěn)定,具有預(yù)測功能。2024/3/20心理測量學(xué)313.成就測驗(yàn)(AchievementTests):特點(diǎn):

在特定領(lǐng)域?yàn)闄z測應(yīng)試者對有關(guān)知識和技能的掌握程度而設(shè)計(jì)的測驗(yàn)。教學(xué)和訓(xùn)練會明顯改變成就測驗(yàn)的結(jié)果。類型:學(xué)科成就測驗(yàn)、綜合成就測驗(yàn)、診斷測驗(yàn)2024/3/20心理測量學(xué)32具體性越來越強(qiáng)抽象性越來越弱穩(wěn)定性越來越差

智力測驗(yàn)

能力傾向測驗(yàn)

成就測驗(yàn)?zāi)芰y驗(yàn)類型特征:2024/3/20心理測量學(xué)33(二)人格測驗(yàn)(PersonalityTest)測量個(gè)體人格的獨(dú)特性和傾向性特征的測驗(yàn)。心理學(xué)人格概念特征:概念非常廣泛,涉及所有情感和非智力因素。應(yīng)用較廣的人格測驗(yàn):自陳人格測驗(yàn)、人格投射測驗(yàn)。2024/3/20心理測量學(xué)341艾森克人格問卷(EPQ)2明尼蘇達(dá)多相人格調(diào)查表(MMPI)3卡特爾16種人格因素測驗(yàn)(16PF)

著名自陳人格測驗(yàn)

2024/3/20心理測量學(xué)351羅夏墨跡測驗(yàn)(RIT)著名投射測驗(yàn)

2主題統(tǒng)覺測驗(yàn)(TAT)2024/3/20心理測量學(xué)364句字完成測驗(yàn)3詞語聯(lián)想測驗(yàn)其他投射測驗(yàn)

2024/3/20心理測量學(xué)37二、按對被試評價(jià)時(shí)所用的參照標(biāo)準(zhǔn)不同分類對被試評價(jià)所用的參照標(biāo)準(zhǔn):相對標(biāo)準(zhǔn)、絕對標(biāo)準(zhǔn)應(yīng)用相對標(biāo)準(zhǔn)的稱作為常模參照測驗(yàn)應(yīng)用絕對標(biāo)準(zhǔn)的稱作為標(biāo)準(zhǔn)參照測驗(yàn)2024/3/20心理測量學(xué)38二、按評價(jià)參照標(biāo)準(zhǔn)不同分類

(一)常模參照測驗(yàn)(Norm-ReferencedTest)定義:以個(gè)體在團(tuán)體中的相對地位來評價(jià)個(gè)體發(fā)展水平的測驗(yàn)。性質(zhì):執(zhí)行可高可低的相對難度標(biāo)準(zhǔn),難度的高低決定于團(tuán)體本身的水平;可能使一些高利害、高競爭性測驗(yàn)難度失控;團(tuán)體水平發(fā)生變化,常模參照測驗(yàn)要重新修訂。2024/3/20心理測量學(xué)39二、按評價(jià)參照標(biāo)準(zhǔn)不同分類

(二)標(biāo)準(zhǔn)參照測驗(yàn)(Criterion-ReferencedTest)定義:以個(gè)體水平是否達(dá)到測驗(yàn)領(lǐng)域某一固定標(biāo)準(zhǔn)來評價(jià)個(gè)體發(fā)展水平的測驗(yàn)。性質(zhì):使用絕對標(biāo)準(zhǔn),不因很多個(gè)體都已達(dá)到而提高標(biāo)準(zhǔn),也不因很多個(gè)體都未達(dá)到而降低標(biāo)準(zhǔn);各種專業(yè)資格測驗(yàn)都屬于標(biāo)準(zhǔn)參照測驗(yàn)。2024/3/20心理測量學(xué)40小結(jié):常模參照和標(biāo)準(zhǔn)參照區(qū)分:理論上絕對,實(shí)際應(yīng)用中有二者兼具的。附:潛力參照測驗(yàn):定義:以個(gè)體可能達(dá)到的水平來評價(jià)個(gè)體已經(jīng)達(dá)到水平的測驗(yàn)。性質(zhì):符合對個(gè)體進(jìn)行自身激勵的評價(jià)思想。

2024/3/20心理測量學(xué)41三、標(biāo)準(zhǔn)化測驗(yàn)與非標(biāo)準(zhǔn)化測驗(yàn)標(biāo)準(zhǔn)化概念說明:標(biāo)準(zhǔn)化主要都是為了控制測量的隨機(jī)誤差和系統(tǒng)誤差。教育與心理測量中“標(biāo)準(zhǔn)化”可以理解為是一系列的嚴(yán)格標(biāo)準(zhǔn),也可以理解為是一個(gè)過程—

測驗(yàn)的標(biāo)準(zhǔn)化過程。實(shí)際應(yīng)用的測驗(yàn)是否是標(biāo)準(zhǔn)化測驗(yàn)必須嚴(yán)格鑒別。標(biāo)準(zhǔn)化測驗(yàn):四個(gè)方面的標(biāo)準(zhǔn)化要求測驗(yàn)編制過程標(biāo)準(zhǔn)化測驗(yàn)實(shí)施標(biāo)準(zhǔn)化測驗(yàn)評分標(biāo)準(zhǔn)化測驗(yàn)分?jǐn)?shù)解釋標(biāo)準(zhǔn)化2024/3/20心理測量學(xué)42四個(gè)方面的標(biāo)準(zhǔn)化(1)編制過程標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化測驗(yàn)編制步驟(六步):測驗(yàn)?zāi)繕?biāo)分解編制方案設(shè)計(jì)命題征題測試分析分?jǐn)?shù)體系設(shè)計(jì)與制作測驗(yàn)使用指導(dǎo)書編寫

編制質(zhì)量的標(biāo)準(zhǔn)化:測驗(yàn)信度效度要求每個(gè)題目的質(zhì)量要求2024/3/20心理測量學(xué)43(2)測驗(yàn)實(shí)施標(biāo)準(zhǔn)化:對主試的要求對被試的要求對測試場所內(nèi)外環(huán)境的要求測試過程順序的要求(3)測驗(yàn)評分標(biāo)準(zhǔn)化:試題要有公認(rèn)的科學(xué)答案有統(tǒng)一規(guī)范的評分標(biāo)準(zhǔn)2024/3/20心理測量學(xué)44(4)測驗(yàn)分?jǐn)?shù)解釋標(biāo)準(zhǔn)化:測驗(yàn)的報(bào)告分?jǐn)?shù)要有明確的解釋方法和解釋依據(jù)。常模參照測驗(yàn):配有解釋常模,可以確定每個(gè)分?jǐn)?shù)在團(tuán)體中的確切地位。標(biāo)準(zhǔn)參照測驗(yàn):配有合格分?jǐn)?shù)線以確定每個(gè)分?jǐn)?shù)的合格與否

。2024/3/20心理測量學(xué)45標(biāo)準(zhǔn)化測驗(yàn)特點(diǎn):編制要求嚴(yán)格,測驗(yàn)編制周期長;人財(cái)物投入大,測驗(yàn)設(shè)計(jì)要求面向盡量大的被試群體;使用的針對性、靈活性常常不能滿足要求。非標(biāo)準(zhǔn)化測驗(yàn)特點(diǎn):編制目的明確、測試對象熟悉;內(nèi)容設(shè)計(jì)針對性強(qiáng)、方法靈活多變、編程短;不能輕視自編測驗(yàn)的作用,同時(shí)努力提高自編測驗(yàn)的編制質(zhì)量。2024/3/20心理測量學(xué)46四、計(jì)算機(jī)化測驗(yàn)與非計(jì)算機(jī)化測驗(yàn)(一)計(jì)算機(jī)化測驗(yàn)的發(fā)展計(jì)算機(jī)化測驗(yàn):被試在計(jì)算機(jī)前根據(jù)指令進(jìn)行作答。計(jì)算機(jī)化測驗(yàn)特點(diǎn):實(shí)施方便、反饋及時(shí),測驗(yàn)效率高。非計(jì)算機(jī)化測驗(yàn)--傳統(tǒng)的紙筆測驗(yàn),還有用武之地。2024/3/20心理測量學(xué)47(二)幾種常見的計(jì)算機(jī)化測驗(yàn)基于計(jì)算機(jī)的測驗(yàn)(Computer-BasedTest,CBT)。由計(jì)算機(jī)出題,要求被試在計(jì)算機(jī)前操作作答。各種基于計(jì)算機(jī)的測驗(yàn)對計(jì)算機(jī)的利用程度有很大不同。除了計(jì)算機(jī)的形式,基于計(jì)算機(jī)的測驗(yàn)的方法、理念與傳統(tǒng)紙筆測驗(yàn)無本質(zhì)不同。2024/3/20心理測量學(xué)48計(jì)算機(jī)化自適應(yīng)測驗(yàn)(ComputerizedAdaptTest,CAT)。一種新的測驗(yàn)理念:改變傳統(tǒng)測驗(yàn)千人一面形式。針對被試的水平即時(shí)調(diào)題、即時(shí)施測、即時(shí)反饋、即時(shí)估算。同時(shí)提高測驗(yàn)的效率和準(zhǔn)確率。實(shí)現(xiàn)條件:新的測驗(yàn)理論指導(dǎo)、使用計(jì)算機(jī)。優(yōu)點(diǎn)明顯,但技術(shù)上也還需進(jìn)一步完善。2024/3/20心理測量學(xué)49基于網(wǎng)絡(luò)的測驗(yàn)(Internet-bestTest,IBT)基于計(jì)算機(jī)的測驗(yàn)或計(jì)算機(jī)化自適應(yīng)測驗(yàn)采用網(wǎng)絡(luò)的形式實(shí)施遠(yuǎn)程測試,則稱其為基于網(wǎng)絡(luò)的測驗(yàn)?;诰W(wǎng)絡(luò)的測驗(yàn)是當(dāng)前計(jì)算機(jī)化測驗(yàn)發(fā)展的最高形式。2024/3/20心理測量學(xué)50五、其它分類

(一)最佳行為測驗(yàn)和典型行為測驗(yàn)最佳行為測驗(yàn):作答時(shí)必須盡能力找到最佳答案。典型行為測驗(yàn):作答時(shí)要根據(jù)自己平時(shí)怎么想、怎么做如實(shí)作答。能力測驗(yàn)是最佳行為測驗(yàn),自陳式人格測驗(yàn)是典型行為測驗(yàn)。典型行為測驗(yàn)的誤差控制更為困難。2024/3/20心理測量學(xué)51(二)個(gè)別測驗(yàn)與團(tuán)體測驗(yàn)個(gè)別測驗(yàn)應(yīng)用:面向特殊被試或在測試中主被試間需不斷交流的測驗(yàn)。個(gè)別測驗(yàn)特點(diǎn):耗時(shí)費(fèi)力,一般能用團(tuán)體測驗(yàn)就不用個(gè)別測驗(yàn)。教育測驗(yàn)大多采用團(tuán)體測驗(yàn),但也有例外。心理測驗(yàn)采用個(gè)別測驗(yàn)的要多一些。2024/3/20心理測量學(xué)52(三)難度測驗(yàn)與速度測驗(yàn)(四)文字測驗(yàn)與非文字測驗(yàn)(五)主觀題測驗(yàn)與客觀題測驗(yàn)(六)預(yù)測測驗(yàn)(七)行為情境判斷測驗(yàn)(八)內(nèi)隱聯(lián)想測驗(yàn)2024/3/20心理測量學(xué)53小結(jié):測驗(yàn)類型豐富:反應(yīng)社會需求的復(fù)雜性和旺盛性。測量學(xué)者的任務(wù):開發(fā)出更多更好的測驗(yàn)滿足社會的各種需求。2024/3/20心理測量學(xué)54心理測量概論測驗(yàn)的編制與實(shí)施

第三節(jié)2024/3/20心理測量學(xué)55一、測驗(yàn)的編制明確用于:招聘、晉職升級決策?診斷、評價(jià)?了解品質(zhì)還是做合格決策?

明確:測能力、人格?能力屬哪個(gè)層次?人格哪個(gè)側(cè)面?探明品質(zhì)結(jié)構(gòu)明確:測驗(yàn)對象的社會身份、身心特點(diǎn)、分布的范圍與數(shù)量。

測驗(yàn)的對象是誰?

測何種心理品質(zhì)?

測驗(yàn)結(jié)果作何用?

(一)確定測驗(yàn)?zāi)康?-回答三個(gè)問題2024/3/20心理測量學(xué)56(二)設(shè)計(jì)測驗(yàn)編制方案、制定測驗(yàn)編制計(jì)劃目標(biāo):設(shè)計(jì)一個(gè)科學(xué)、詳細(xì)、可行的測驗(yàn)編制方案科學(xué):方案從目標(biāo)到內(nèi)容、方法都要符合心理學(xué)和心理測量學(xué)原理??尚校嚎茖W(xué)意義上的可行、主客觀條件意義上的可行。測驗(yàn)編制方案的內(nèi)容:測驗(yàn)的方法測驗(yàn)的類型題型及其分布題量及其分布分?jǐn)?shù)系統(tǒng)量評價(jià)法測驗(yàn)質(zhì)量總體目標(biāo)編制流程設(shè)計(jì)和要求2024/3/20心理測量學(xué)57(三)題目編寫測驗(yàn)題目:基本元素,主體材料。題目類型:客觀題、主觀題。題型性質(zhì)和功能:各有不同,有互補(bǔ)傾向。編寫要求:發(fā)揮題型功能,測出欲測心理品質(zhì)。題干編寫:內(nèi)容科學(xué)、語言精練。作答要求編寫:語言準(zhǔn)確無歧義、信號強(qiáng)烈醒目??陀^題:正確項(xiàng)唯一正確,迷惑項(xiàng)有適度迷惑力。主觀題:保證答案科學(xué)性、評分標(biāo)準(zhǔn)的客觀性。題量分布:題型分布、品質(zhì)或內(nèi)容分布、題目難度分布。

2024/3/20心理測量學(xué)58一、測驗(yàn)的編制(四)測試分析測試分析目的:評估和篩選試題評估篩選指標(biāo):定性指標(biāo)、定量指標(biāo)。分析決策:留用、修改留用、修改再測、淘汰定性指標(biāo):題目的科學(xué)性、所測心理品質(zhì)的相符性、答案的正確性、表述的準(zhǔn)確性等等。2024/3/20心理測量學(xué)59定量指標(biāo):題目定性質(zhì)量優(yōu)劣的量化指標(biāo)有各自的定義和計(jì)算方法、有各自的質(zhì)量優(yōu)劣標(biāo)準(zhǔn)測試對象:代表性的樣本,有足夠容量,與正式測試相同的動機(jī)水平,在似真環(huán)境中進(jìn)行。2024/3/20心理測量學(xué)60(五)組卷組卷要求:1、保證入選試題高質(zhì)量。2、嚴(yán)格按照設(shè)計(jì)好的各種題量分布選調(diào)試題。3、試題順序:題型順序、難度順序、心理品質(zhì)層次順序。目的:有效控制測驗(yàn)的系統(tǒng)誤差。(六)信、效度調(diào)查試卷整體質(zhì)量調(diào)查:信度和效度。信度:只需測驗(yàn)自身數(shù)據(jù)效度:還需要測驗(yàn)外部的一些相關(guān)憑證調(diào)查目標(biāo):信效度證據(jù)足夠且都達(dá)到一定標(biāo)準(zhǔn)。

2024/3/20心理測量學(xué)61(七)編制測驗(yàn)分?jǐn)?shù)系統(tǒng)原始分?jǐn)?shù):以測驗(yàn)內(nèi)容為參照背景,不方便比較。分?jǐn)?shù)轉(zhuǎn)換:

1、獲取以被試群體為參照背景的分?jǐn)?shù)。

2、獲取以某種客觀標(biāo)準(zhǔn)為參照背景的分?jǐn)?shù)。報(bào)告分?jǐn)?shù):方便比較、理解和解釋。2024/3/20心理測量學(xué)62一、測驗(yàn)的編制(八)編寫測驗(yàn)使用手冊:指導(dǎo)正確使用手冊內(nèi)容(10項(xiàng)):1、測驗(yàn)?zāi)康呐c性質(zhì)說明;2、適用對象說明;3、測驗(yàn)內(nèi)容結(jié)構(gòu)、題型結(jié)構(gòu)介紹;4、測驗(yàn)編制方法介紹;5、測驗(yàn)施測方法說明;6、評分方法與標(biāo)準(zhǔn)說明;7、測試對象范圍、數(shù)量、來源、抽樣方法說明;8、測驗(yàn)信、效度報(bào)告;9、分?jǐn)?shù)系統(tǒng)編制方法及分?jǐn)?shù)解釋方法介紹;10、測驗(yàn)使用人員資質(zhì)要求說明。2024/3/20心理測量學(xué)63(九)編制測驗(yàn)備份測驗(yàn)備份:正式測驗(yàn)的平行復(fù)份。平行復(fù)份不同處:表面文字內(nèi)容相同處:所測心理品質(zhì)內(nèi)容結(jié)構(gòu)難度結(jié)構(gòu)題型結(jié)構(gòu)信度效度測驗(yàn)備份目的:應(yīng)付突發(fā)事件特殊研究需要取得更可靠結(jié)果測驗(yàn)備份的編制:

與正式測驗(yàn)有完全相同的過程和標(biāo)準(zhǔn)。2024/3/20心理測量學(xué)64二、測驗(yàn)的實(shí)施(一)選擇測驗(yàn)測驗(yàn)內(nèi)容和報(bào)告分?jǐn)?shù)形式是否符合測驗(yàn)?zāi)康模繙y驗(yàn)形式和方法是否適合被試心身特點(diǎn)?測驗(yàn)的信度和效度是否達(dá)到標(biāo)準(zhǔn)?有無所需特殊資質(zhì)技術(shù)人員?2024/3/20心理測量學(xué)65(二)實(shí)際施測施測相對簡單:教育測驗(yàn)、團(tuán)體測驗(yàn)、紙筆測驗(yàn)施測較為復(fù)雜:心理測驗(yàn)、個(gè)別測驗(yàn)、操作測驗(yàn)規(guī)范目的:控制各種可能誤差,提高測驗(yàn)信效度。施測要求:由具備相應(yīng)資質(zhì)的技術(shù)人員實(shí)施按照測驗(yàn)指導(dǎo)書的要求按步驟實(shí)施規(guī)范:測驗(yàn)環(huán)境布置指導(dǎo)語宣講

測驗(yàn)材料發(fā)放測驗(yàn)進(jìn)程控制

2024/3/20心理測量學(xué)66(三)評分評分要求:按照測驗(yàn)指導(dǎo)書規(guī)定的方法和標(biāo)準(zhǔn)進(jìn)行客觀題交由計(jì)算機(jī)評分,主觀題主要采用人工評閱心理測驗(yàn):具備相應(yīng)資質(zhì)的技術(shù)人員評閱大規(guī)模教育測驗(yàn):篩選閱卷員嚴(yán)格培訓(xùn)

統(tǒng)一評分標(biāo)準(zhǔn)閱卷質(zhì)量監(jiān)控網(wǎng)上閱卷系統(tǒng)電子閱卷員系統(tǒng)

2024/3/20心理測量學(xué)67(四)測驗(yàn)結(jié)果解釋注意常模參照測驗(yàn)與標(biāo)準(zhǔn)參照測驗(yàn)報(bào)告的不同。解釋要有辯證思維,不要絕對化,更不要標(biāo)簽化。善于在個(gè)體內(nèi)部作比較,強(qiáng)調(diào)優(yōu)勢品質(zhì),鼓勵改善劣勢品質(zhì)。以發(fā)展的眼光解釋測驗(yàn)結(jié)果,防止負(fù)面影響。2024/3/20心理測量學(xué)68三、測驗(yàn)編制與實(shí)施中的法律與道德問題(一)為維護(hù)社會公平而努力保證測驗(yàn)質(zhì)量。因?yàn)闇y量嚴(yán)重不準(zhǔn)導(dǎo)致決策不公,是測量工作者的法律與道德責(zé)任。為了保證測驗(yàn)質(zhì)量,要防止:因粗制濫造導(dǎo)致測驗(yàn)結(jié)果不準(zhǔn);題目內(nèi)容有文化、職業(yè)或宗教偏見;某些群體數(shù)據(jù)失實(shí)或缺失,導(dǎo)致常模失準(zhǔn);因不精心或別有用心而選用粗制濫造的測驗(yàn);因不精心或別有用心而導(dǎo)致測試過程失控;無相應(yīng)資質(zhì)人員主持測驗(yàn)。2024/3/20心理測量學(xué)69(二)為保護(hù)個(gè)人權(quán)益而尊重測驗(yàn)對象的選擇要征求被試是否愿意參加測驗(yàn),沒有權(quán)利強(qiáng)迫個(gè)體參加測驗(yàn)。要尊重被試的作答選擇,不能干涉被試的作答。使用被試信息及如何使用都要有被試的授權(quán)。2024/3/20心理測量學(xué)70(三)為保證測驗(yàn)的安全而嚴(yán)守測驗(yàn)的秘密

測驗(yàn)泄密后果嚴(yán)重:能力測驗(yàn)泄密,造成虛高能力評價(jià)。人格測驗(yàn)泄密,造成虛假的人格評價(jià)。高競爭性測驗(yàn)泄密,造成社會不公。重要測驗(yàn)為國家機(jī)密,受法律保護(hù)。為了尊重著作權(quán),維護(hù)社會公正,遵守職業(yè)道德有義務(wù)保證測驗(yàn)的安全、嚴(yán)守測驗(yàn)的秘密,不向他人傳送任何測驗(yàn)信息。2024/3/20心理測量學(xué)711心理測驗(yàn)管理?xiàng)l例中國心理學(xué)會有關(guān)測驗(yàn)的兩個(gè)重要文件:2心理測驗(yàn)工作者的道德準(zhǔn)則2024/3/20心理測量學(xué)72心理測量概論心理測量發(fā)展簡史

第四節(jié)2024/3/20心理測量學(xué)73一、中國古代的心理測量思想(一)個(gè)體差異及其可測性思想孔子:“性相近,習(xí)相遠(yuǎn)?!保幻献樱骸皺?quán),然后知輕重;度,然后知長短。物皆然,心為甚。”

(二)人才的內(nèi)涵及其測量方法三國時(shí)的魏人劉劭:“夫圣賢之所美,莫美乎聰明。聰明之所貴,莫貴乎知人。知人誠智,則眾材得其序,而庶績之業(yè)興矣?!彼讶说男袨楸憩F(xiàn)概括為9種,稱為“九征”。提出“八觀”和“五視”的觀察方法識別人才。2024/3/20心理測量學(xué)74(三)心理測量的實(shí)踐活動孔子:將人的智力分成三個(gè)等級,即中上之人、中人和中下之人;不得中行而與之,必也狂狷乎?狂者進(jìn)取,狷者有所不為也。董仲舒:“一手畫方,一手畫圓,莫能成?!眲③浚骸度宋镏尽肺髦埽骸皣鴮W(xué)”2024/3/20心理測量學(xué)75古代中國心理測量的特點(diǎn):1.描述性的,定性的,而非定量的;2.分類式的;3.注重對人作整體的鑒定和評價(jià),并傾向于和人的道德品質(zhì)聯(lián)系起來;4.具有強(qiáng)烈的應(yīng)用性質(zhì)。2024/3/20心理測量學(xué)76二、現(xiàn)代心理測量在西方國家的產(chǎn)生與發(fā)展(一)心理測量的產(chǎn)生是社會的需要(二)心理測量的早期探索者(三)心理測量的發(fā)展(四)心理測量發(fā)展的當(dāng)代趨勢2024/3/20心理測量學(xué)77(一)心理測量的產(chǎn)生是社會的需要工業(yè)革命成功后,對勞動力的需求急劇增加;19世紀(jì),科學(xué)的發(fā)展和歐洲人道主義思想的廣泛傳播。(二)心理測量的早期探索者1.德國:馮特(W.Wundt)2.英國:高爾頓(F.Galton)3.美國:卡特爾(JamesM.Cattell)4.法國:比納(A.Binet)和西蒙(T.Simon)2024/3/20心理測量學(xué)78(三)心理測量的發(fā)展斯坦福大學(xué)推孟(L.M.Terman)教授1916年修訂斯坦福-比納量表;桑代克(E.L.Thorndike)編制了第一個(gè)標(biāo)準(zhǔn)化的教育成就測驗(yàn);人格測驗(yàn)的先驅(qū)克雷佩林(E.Kraepelin),他最早用自由聯(lián)想測驗(yàn)來診斷精神病患者。2024/3/20心理測量學(xué)79(四)心理測量發(fā)展的當(dāng)代趨勢1.實(shí)驗(yàn)法和測驗(yàn)法相結(jié)合,產(chǎn)生了信息加工測驗(yàn);2.計(jì)算機(jī)測試代替紙筆測試;3.項(xiàng)目反應(yīng)理論和概化理論等現(xiàn)代測量理論產(chǎn)生;4.新一代測驗(yàn)理論。2024/3/20心理測量學(xué)80三、現(xiàn)代心理測量在中國的發(fā)展(一)二十世紀(jì)前半葉的初步繁榮介紹和翻譯西方心理測驗(yàn)量表,修訂和編制了多種智力測驗(yàn)、人格測驗(yàn)及教育測驗(yàn);出版的有關(guān)心理測量方面的著作達(dá)到了20多種。(二)二十世紀(jì)后半葉的再度繁榮與發(fā)展1.理論發(fā)展:經(jīng)典測量理論、項(xiàng)目反應(yīng)理論、概化理論、新一代測驗(yàn)理論。2.實(shí)踐作用:測驗(yàn)編制、教育及社會考試、人才選拔和人事測評。2024/3/20心理測量學(xué)81本章小結(jié)

心理測量學(xué)研究內(nèi)容:如何編制測驗(yàn);如何實(shí)施測驗(yàn);如何控制測量誤差,提高測驗(yàn)質(zhì)量。2024/3/20心理測量學(xué)82本章小結(jié)心理測量主要性質(zhì):心理測量是間接測量。測量有兩個(gè)要素,心理與教育測量的參照點(diǎn)是相對的,測量單位很難恒定。任何測量都有誤差,測量的誤差包括隨機(jī)誤差和系統(tǒng)誤差兩種。心理測驗(yàn)依據(jù)不同指標(biāo)可做許多不同分類。

2024/3/20心理測量學(xué)83本章小結(jié)測量學(xué)工作者的社會責(zé)任:測量學(xué)者關(guān)注測驗(yàn)編制與實(shí)施中的法律與道德問題。測量學(xué)者還從測量及測量學(xué)發(fā)展史中汲取經(jīng)驗(yàn)和教訓(xùn),升華品質(zhì)與修養(yǎng)。測量學(xué)者關(guān)注測驗(yàn)編制與實(shí)施中的法律與道德問題。測量學(xué)者還從測量及測量學(xué)發(fā)展史中汲取經(jīng)驗(yàn)和教訓(xùn),升華品質(zhì)與修養(yǎng)。2024/3/20心理測量學(xué)84本章小結(jié)測量學(xué)發(fā)展的啟示:我國測量活動歷史悠久。現(xiàn)代測量學(xué)發(fā)端于西方。心理測量學(xué)者還從測量以及測量學(xué)的發(fā)展歷史中汲取經(jīng)驗(yàn)和教訓(xùn),升華品質(zhì)與修養(yǎng)。2024/3/20心理測量學(xué)85討論:1.為什么說人的心理是可測的,心理可測的意義何在?2.分析心理測量誤差的類型與來源,試說控制方法。3.你從心理測量發(fā)展歷史的介紹中感悟到了什么?

測量信度與隨機(jī)誤差控制第一節(jié)信度概述一、信度與測量誤差1.經(jīng)典測量理論的假設(shè)上式中,X為觀察分?jǐn)?shù),T為一般真分?jǐn)?shù),E為隨機(jī)誤差分?jǐn)?shù),V為目標(biāo)真分?jǐn)?shù),I為非目標(biāo)真分?jǐn)?shù)(系統(tǒng)誤差)。

第一節(jié)信度的概述一、信度與測量誤差2.信度的定義測量追求的初步目標(biāo):T占X的比例越大越好。測量追求的終極目標(biāo):V占X的比例越大越好。第一節(jié)信度的概述當(dāng)T占X的比例很大時(shí),那么測值就會是穩(wěn)定的。一般來說,穩(wěn)定的測值是可靠的、可信的,因此,信度可被認(rèn)為是測量結(jié)果的穩(wěn)定性程度。一、信度與測量誤差2.信度的定義第一節(jié)信度的概述信度(reliability)是指在不同時(shí)間,使用同一測驗(yàn),或者使用兩個(gè)不同項(xiàng)目的等值測驗(yàn),抑或在其他不同的測試條件下,對同一組被試實(shí)施兩次或多次測試所得分?jǐn)?shù)的一致性。測驗(yàn)信度表示測驗(yàn)分?jǐn)?shù)中個(gè)體差異可歸因于所測特質(zhì)中“真實(shí)”差異的程度,以及可歸因于隨機(jī)誤差的程度。二、信度的統(tǒng)計(jì)定義1.經(jīng)典測量理論假設(shè)的推論第一節(jié)信度的概述2.信度的統(tǒng)計(jì)定義定義1:信度是被試團(tuán)體真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)方差之比定義2:信度是被試團(tuán)體真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)相關(guān)系數(shù)的平方定義3:信度是一個(gè)測驗(yàn)X(A卷)與它的任意一個(gè)平行測驗(yàn)(B卷)的相關(guān)系數(shù)第一節(jié)信度的概述三、描述信度的指標(biāo)1.經(jīng)典測量理論的信度系數(shù)信度系數(shù)是表示測量結(jié)果的穩(wěn)定性程度的指標(biāo)。記為:第一節(jié)信度的概述信度系數(shù)的值域:[0,1]沒有百分之百可靠的測量,因此,rXX=1只是理論上的值,實(shí)際當(dāng)中是不存在的。?相關(guān)系數(shù)的值域是[-1,+1],信度系數(shù)的值域:[0,1],為什么?1.經(jīng)典測量理論的信度系數(shù)(1)重測信度(test-retestcoefficients),是指用同一個(gè)量表對同一組被試施測兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。(2)復(fù)本信度(alternative--formcoefficients),是指兩個(gè)平行的測驗(yàn)測量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個(gè)復(fù)本測驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。(3)內(nèi)部一致性系數(shù)(internalconsistencycoefficients)也叫同質(zhì)性信度(homogeneityreliability),是指測驗(yàn)內(nèi)部所有題目間的一致性程度,主要的計(jì)算方法有KR20公式、KR21公式、克龍巴赫α系數(shù),以及荷伊特信度等。第一節(jié)信度的概述2.經(jīng)典測量理論的測量標(biāo)準(zhǔn)誤測量標(biāo)準(zhǔn)誤差(standarderrorofmeasurement)是測量誤差的假設(shè)分布的標(biāo)準(zhǔn)差。用下列公式能夠容易地計(jì)算測量標(biāo)準(zhǔn)誤差:第一節(jié)信度的概述式中,SDt表示測驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,rXX表示信度系數(shù)。3.概化理論的概化系數(shù)(generaliabilitycoefficients)4.IRT的測驗(yàn)信息函數(shù)(testinformationfunction)四、分析測驗(yàn)信度應(yīng)注意的問題1.針對測驗(yàn)類型選用恰當(dāng)指標(biāo)(1)傳統(tǒng)的信度概念適合于常模參照測驗(yàn),這種測驗(yàn)的主要目的是為了區(qū)分個(gè)體在特定特征上所表現(xiàn)出的差異性。個(gè)體在測驗(yàn)分?jǐn)?shù)中表現(xiàn)出的差異范圍越大,該測驗(yàn)的信度也就越高。第一節(jié)信度的概述(2)標(biāo)準(zhǔn)參照測驗(yàn)(內(nèi)容參照或領(lǐng)域參照測驗(yàn))的目標(biāo)是要確定被試是否達(dá)到或未達(dá)到某個(gè)標(biāo)準(zhǔn),從而將個(gè)體分到不同的組別:“達(dá)標(biāo)”和“未達(dá)標(biāo)”。這種情況下,傳統(tǒng)的重測信度、復(fù)本信度以及內(nèi)部一致性系數(shù)就不再適用。標(biāo)準(zhǔn)參照測驗(yàn)可根據(jù)具體情況分別采用如下指標(biāo):適用于簡單的掌握與否的兩分決策,即所有的分類誤差都被認(rèn)為同樣嚴(yán)重而不管它們離開臨界分?jǐn)?shù)的距離。在這種情況下,可以使用平行型式進(jìn)行再測,以便得出在兩次測驗(yàn)上得到相同決策的個(gè)體的百分比,進(jìn)一步可算得分類一致性系數(shù)(coefficientofagreement)。

第一節(jié)信度的概述不僅僅關(guān)心對掌握者和未掌握者的質(zhì)的區(qū)分,同時(shí)也在分?jǐn)?shù)連續(xù)體上描述了關(guān)于掌握和未掌握的量的差異。這類信度主要采用K2(X,T)指標(biāo):

第一節(jié)信度的概述式中,、分別為被試總體在測驗(yàn)上的真分?jǐn)?shù)方差和觀測分?jǐn)?shù)方差;、分別為真分?jǐn)?shù)和觀測分?jǐn)?shù)的平均值;ng為測驗(yàn)題目數(shù),c是以做對題目百分比表示的區(qū)分標(biāo)準(zhǔn)。K2(X,T)值越大,說明觀測分與區(qū)分標(biāo)準(zhǔn)分?jǐn)?shù)(劃界分?jǐn)?shù))之間的差異代表真分?jǐn)?shù)的對應(yīng)差異量的可能性越大,因而觀測分與劃界分?jǐn)?shù)的差異就越能反映真實(shí)能力上的差異。換言之,測驗(yàn)就更可信。就單個(gè)測驗(yàn)的結(jié)果而言,K2(X,T)的計(jì)算公式如下:第一節(jié)信度的概述式中,是由庫德-理查德KR20公式求出的信度系數(shù),其余符號意義同前。(3)在純速度測驗(yàn)(speedtest)中,個(gè)體差異完全取決于速度,此時(shí)就無法恰當(dāng)?shù)亟忉屖y一次測驗(yàn)的信度系數(shù)。如果條件許可,可采用重測法或是復(fù)本法,這是比較合適的。分半法也可以使用,但是此時(shí)的分半是按時(shí)間分半,而不是按照項(xiàng)目來分半。也就是,兩半分?jǐn)?shù)必須根據(jù)分別規(guī)定時(shí)間的兩個(gè)半測驗(yàn)。例如,可以把奇偶項(xiàng)目分別印制在兩張卷上,每組項(xiàng)目的用時(shí)為全測驗(yàn)的一半。這種方法等于在同一時(shí)間實(shí)施了兩個(gè)等值測驗(yàn)。

第一節(jié)信度的概述還有一種替代實(shí)施兩個(gè)半測驗(yàn)的方法,就是把總時(shí)間四等分,算出每段時(shí)間的分?jǐn)?shù)。這種方法簡便易行,施測時(shí)每當(dāng)主試發(fā)出事先安排的信號,就要測驗(yàn)參加進(jìn)在他們正在做的項(xiàng)目上打個(gè)記號。然后,把第一段和第四段時(shí)間內(nèi)答對的項(xiàng)目數(shù)相加,得出一個(gè)半測驗(yàn)分?jǐn)?shù);把第二段和第三段時(shí)間內(nèi)答對的項(xiàng)目數(shù)相加,得出另一個(gè)半測驗(yàn)分?jǐn)?shù)。四段時(shí)間如此相加,往往可以平衡練習(xí)、疲勞和其他因素的累積效應(yīng)。特別是當(dāng)項(xiàng)目難度水平前后一致,而不是逐漸增加時(shí),這種方法尤其令人滿意。第一節(jié)信度的概述2.信度的報(bào)告(1)任何一個(gè)信度系數(shù)是針對引起測驗(yàn)誤差的特定因素而言的。有多少種影響測驗(yàn)分?jǐn)?shù)的條件,就有多少種測驗(yàn)信度,因此,報(bào)告信度時(shí)應(yīng)該詳細(xì)說明測試樣本的特性和所報(bào)告的信度類型。在信度報(bào)告時(shí)只是報(bào)告信度系數(shù),而缺乏說明估算系數(shù)的方法細(xì)節(jié),推導(dǎo)系數(shù)時(shí)所用的被試群體的特征,以及獲取數(shù)據(jù)當(dāng)時(shí)的施測條件,等等,這種信度報(bào)告是不合格的。

第一節(jié)信度的概述(2)沒有一個(gè)單一的、最優(yōu)的方法來量化信度,沒有一個(gè)單獨(dú)的指數(shù)能恰當(dāng)?shù)乇磉_(dá)所有的相關(guān)事實(shí),沒有一個(gè)單獨(dú)的研究方法在所有的情形下都是最佳選擇,且測驗(yàn)編制者也不應(yīng)局限于將某一種方法運(yùn)用到任何一種測量手段上去。所以,測驗(yàn)編制者在報(bào)告測驗(yàn)信度時(shí),可以從多方面予以報(bào)告。

第一節(jié)信度的概述(3)提供詳細(xì)的信度分析報(bào)告,讓了解相關(guān)知識的人能夠?qū)Y(jié)果進(jìn)行評定,并能夠重復(fù)信度分析的過程。

例如,簡單說一句“某測驗(yàn)的信度是0.92”是不能接受的。較恰當(dāng)?shù)恼f法是“某測驗(yàn)的信度系數(shù)為0.92,該數(shù)值是通過計(jì)算一份能力測驗(yàn)間隔兩周兩次測試成績的相關(guān)系數(shù)得出的。數(shù)據(jù)來源是從某市隨機(jī)抽取的500名小學(xué)5年級的學(xué)生施測……”。第一節(jié)信度的概述五、信度的標(biāo)準(zhǔn)與作用1.信度是評價(jià)測驗(yàn)質(zhì)量的重要指標(biāo)之一。測驗(yàn)類型

信度系數(shù)

低中高學(xué)業(yè)成就測驗(yàn)0.660.920.98學(xué)術(shù)能力測驗(yàn)0.560.900.97特殊能力傾向測驗(yàn)0.260.880.96人格測驗(yàn)0.460.850.97興趣測驗(yàn)0.420.840.93態(tài)度測驗(yàn)0.470.790.98注:表中數(shù)據(jù)來源,LewisR.Aiken:Psychologicaltestingandassessment(eighthedition),AllynandBacon,Inc,1994.第一節(jié)信度的概述2.信度是測量過程中所存在的隨機(jī)誤差大小的反映。第一節(jié)信度的概述例如,我們已知高考文科試卷的總信度rXX

=0.965,文科考生總分的標(biāo)準(zhǔn)差為53.42,那么,文科考試成績的標(biāo)準(zhǔn)誤為:3.信度可以用來解釋個(gè)人測驗(yàn)分?jǐn)?shù)的意義——測量標(biāo)準(zhǔn)誤。如果某生的考試成績?yōu)?95分,在置信度為0.95時(shí),其真分?jǐn)?shù)的置信區(qū)間為:4.信度可以幫助進(jìn)行不同測驗(yàn)分?jǐn)?shù)的比較。第一節(jié)信度的概述考察兩個(gè)分?jǐn)?shù)的差異是否可靠,是否真有差異的問題。比如,某人的物理成績是否真的優(yōu)于化學(xué)?某人的數(shù)學(xué)技能本學(xué)期是否真有進(jìn)步?某人在韋氏智力量表上操作智商與言語智商的差異是否真有顯著意義等。

當(dāng)兩測驗(yàn)的方差相等時(shí),差異分?jǐn)?shù)的信度系數(shù)可用如下公式求出:式中,rXXdiff是差異分?jǐn)?shù)的信度系數(shù);rXX和rYY是兩個(gè)測驗(yàn)各自的信度系數(shù);rXY是兩測驗(yàn)間的相關(guān)系數(shù)。4.信度可以幫助進(jìn)行不同測驗(yàn)分?jǐn)?shù)的比較。第一節(jié)信度的概述差異分?jǐn)?shù)的測量標(biāo)準(zhǔn)誤可用如下公式求出:式中,SEdiff是差異分?jǐn)?shù)的測量標(biāo)準(zhǔn)誤;rXX和rYY是兩個(gè)測驗(yàn)各自的信度系數(shù);SD是兩測驗(yàn)間使用的相同的標(biāo)準(zhǔn)差。在比較分?jǐn)?shù)之前,必須將兩個(gè)測驗(yàn)分?jǐn)?shù)轉(zhuǎn)為具有相同量表的標(biāo)準(zhǔn)分?jǐn)?shù)。第一節(jié)信度的概述例如,在韋氏成人智力量表中,言語和操作分測驗(yàn)的信度為0.97和0.93,而它們的智商的平均數(shù)為100,標(biāo)準(zhǔn)差為15,故言語和操作智商差數(shù)的標(biāo)準(zhǔn)誤為:因?yàn)?.74×1.96=9.29,因此,言語和操作智商相差10分時(shí),在0.05水平上,我們說存在顯著差異。若要在0.01水平上作出差異顯著的結(jié)論,就要相差13分。?測驗(yàn)分?jǐn)?shù)的比較與平均數(shù)差異顯著性檢驗(yàn)是一回事嗎?第二節(jié)信度的種類與評估方法一、重測信度1.含義同一個(gè)測量工具在兩個(gè)不同時(shí)間對同一組被試施測所得結(jié)果的一致性程度。重測信度主要考察了一個(gè)測量工具是否能夠保證在不同時(shí)間測量結(jié)果的一致性,他反映了測量工具的結(jié)果受到時(shí)間間隔因素影響的大小。一般來說,重測的時(shí)間間隔越短,那么各種施測情境的變化就越小,重測信度系數(shù)就會越大。重測信度系數(shù)較大時(shí),說明該測量工具前、后兩次的測量結(jié)果比較一致。結(jié)果具有較好的跨時(shí)間上的穩(wěn)定性。第二節(jié)測驗(yàn)信度的種類與評估方法2.評估方法重測信度的大小可以通過計(jì)算測量工具的重測系數(shù)(test-retestcoefficient)或叫穩(wěn)定性系數(shù)(coefficientofstability)來標(biāo)志。具體來說,就是求取同一組被試在兩個(gè)不同時(shí)間施測同一個(gè)測量工具所得結(jié)果分?jǐn)?shù)的相關(guān)系數(shù)。第二節(jié)測驗(yàn)信度的種類與評估方法3.應(yīng)用條件測量工具所測量的個(gè)體心理特質(zhì)在時(shí)間上應(yīng)該是相對穩(wěn)定的。測量工具所測量的個(gè)體心理特質(zhì)應(yīng)該不存在明顯的練習(xí)效應(yīng)和遺忘效應(yīng)。在兩次施測間隔期間不應(yīng)該進(jìn)行專門的訓(xùn)練和培訓(xùn),以保證重測信度反映的是隨機(jī)因素的影響效應(yīng)。第二節(jié)測驗(yàn)信度的種類與評估方法4.使用重測信度時(shí)需要注意的問題兩次施測時(shí)間間隔的長短會影響重測信度系數(shù)估計(jì)值的大小,因此,在報(bào)告重測信度系數(shù)時(shí)應(yīng)該報(bào)告間隔的時(shí)間長度。應(yīng)該根據(jù)已有的相關(guān)研究結(jié)論考慮所測心理特質(zhì)本身的穩(wěn)定性程度,以確定前后兩次施測時(shí)間的間隔究竟應(yīng)該多長比較合適時(shí),不應(yīng)該隨便選擇間隔時(shí)間的長短。第二節(jié)測驗(yàn)信度的種類與評估方法二、復(fù)本信度1.含義兩個(gè)平行的測驗(yàn)(復(fù)本測驗(yàn))測量同一批被試所得結(jié)果的一致性程度。復(fù)本信度反映了由于題目的不同以及時(shí)間間隔所導(dǎo)致的測量誤差。平行測驗(yàn)或復(fù)本測驗(yàn)指的是兩個(gè)在題目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語、時(shí)限以及所用的例題、公式和測驗(yàn)等其他方面都相同或相似的測驗(yàn)。也就是用不同的題目測量同樣的內(nèi)容而且其測驗(yàn)結(jié)果的平均值和標(biāo)準(zhǔn)差都相同的兩個(gè)測驗(yàn)。第二節(jié)測驗(yàn)信度的種類與評估方法2.評估方法復(fù)本信度的估計(jì)過程就是計(jì)算同一批被試在兩個(gè)平行的復(fù)本測驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù),也叫作等價(jià)系數(shù)(coefficientofequivalence)。測試設(shè)計(jì):同時(shí)測試和延時(shí)測試。同時(shí)測試是在同一個(gè)時(shí)間段內(nèi)進(jìn)行測試,而延時(shí)測試則是在兩個(gè)時(shí)間段進(jìn)行測試,同時(shí)測試可能會存在作答疲勞的效應(yīng),而延時(shí)測試則可能會存在學(xué)習(xí)或培訓(xùn)效應(yīng)。第二節(jié)測驗(yàn)信度的種類與評估方法3.應(yīng)用條件要構(gòu)造出兩份或兩份以上真正平行的測驗(yàn);計(jì)算復(fù)本信度需要對同一批被試測試兩份平行測驗(yàn),這就需要掌握一個(gè)合理的時(shí)間安排。應(yīng)該盡量在測試結(jié)果報(bào)告中,詳盡地說明兩次測試的時(shí)間間隔、測試順序安排、測試過程中被試的有關(guān)測驗(yàn)經(jīng)歷等。第二節(jié)測驗(yàn)信度的種類與評估方法三、內(nèi)部一致性信度1.含義內(nèi)部一致性信度主要評價(jià)了測驗(yàn)各隨機(jī)組成部分之間是否測量了相同的心理特質(zhì),因此,它反映的是題目內(nèi)容的抽樣一致性程度。具體估計(jì)方法主要包括分半信度評估法、庫德-理查森信度評估法、克龍巴赫Alpha系數(shù)評估法。與重測信度和復(fù)本信度不同,在估計(jì)測驗(yàn)的內(nèi)部一致性信度時(shí),只要用同一測驗(yàn)對一批被試測試一次。第二節(jié)測驗(yàn)信度的種類與評估方法2.分半信度含義我們總是可以把一個(gè)測驗(yàn)的所有題目隨機(jī)地劃分成對半的兩個(gè)部分,然后估計(jì)所有被試在這兩個(gè)部分題目上得分的一致性程度,這樣得到的測驗(yàn)一致性估計(jì)稱為分半信度。分半信度評價(jià)了測驗(yàn)兩個(gè)隨機(jī)組成部分的題目是否測量了相同的心理特質(zhì)。第二節(jié)測驗(yàn)信度的種類與評估方法2.分半信度評估方法計(jì)算出被試在測驗(yàn)兩個(gè)隨機(jī)組成部分的題目上得分之間的相關(guān)系數(shù)。由于在用分半測驗(yàn)得分計(jì)算相關(guān)系數(shù)時(shí),測驗(yàn)題量被縮短,信度系數(shù)需要通過以下這個(gè)公式對分半相關(guān)系數(shù)進(jìn)行矯正而得到。為兩個(gè)分半測驗(yàn)之間的相關(guān)系數(shù),為完整長度測驗(yàn)的信度系數(shù)估計(jì)值。第二節(jié)測驗(yàn)信度的種類與評估方法2.分半信度評估方法另外一個(gè)估計(jì)分半信度系數(shù)的方法是Rulon公式,他只需要計(jì)算所有被試在兩部分測驗(yàn)上得分之差的方差以及總分方差:式中,為完整測驗(yàn)的信度估計(jì)值,為被試在兩部分測驗(yàn)上得分之差的方差,為完整測驗(yàn)總分方差。

Rulon公式中分子方差反映了由于題目不同等條件帶來的誤差方差,他與總方差之比反映了誤差方差在總方差中所占的比例。第二節(jié)測驗(yàn)信度的種類與評估方法2.分半信度使用時(shí)需注意的問題在估計(jì)測驗(yàn)的分半信度時(shí),雖然要求把一個(gè)測驗(yàn)的所有題目隨機(jī)地劃分成對半的兩個(gè)部分,但是在實(shí)踐中對測驗(yàn)分半時(shí),為了盡量減少無關(guān)因素的影響,通常需要考慮題型、題分、題目測試先后順序等因素的平衡問題,比如按照題目順序奇偶分半就是一個(gè)經(jīng)常選擇的方法第二節(jié)測驗(yàn)信度的種類與評估方法3.庫德-理查森信度含義在估計(jì)分半信度時(shí),把一個(gè)測驗(yàn)的題目分成兩半的方式是非常多的。而每種分半方式得到的信度估計(jì)值總會存在一些差異,但我們無法知道究竟哪種分半結(jié)果所得到的信度估計(jì)值是最合適的。估計(jì)所有可能的分半信度系數(shù)的平均數(shù),作為完整測驗(yàn)的內(nèi)部一致性最佳估計(jì)值。第二節(jié)測驗(yàn)信度的種類與評估方法3.庫德-理查森信度評估方法:所有分半信度系數(shù)的平均數(shù)的估計(jì)方法。第二節(jié)測驗(yàn)信度的種類與評估方法3.庫德-理查森信度使用條件Kuder-Richardson信度系數(shù)的估計(jì)只能針對1、0記分題型,對于其他題型需要使用更加一般化的估計(jì)方法。K-R21公式假設(shè)測驗(yàn)中所有項(xiàng)目的難度是相同的。Kuder-Richardson信度反映的是項(xiàng)目間一致性程度,他會嚴(yán)重地受到測驗(yàn)所測行為特質(zhì)的同質(zhì)性程度的影響。第二節(jié)測驗(yàn)信度的種類與評估方法4.Cronbach’sAlpha系數(shù)含義是一種比Kuder-Richardson方法更加一般化的信度估計(jì)方法,它可以針對各種記分方式的題型進(jìn)行估計(jì)。第二節(jié)測驗(yàn)信度的種類與評估方法4.Cronbach’sAlpha系數(shù)評估方法第二節(jié)測驗(yàn)信度的種類與評估方法公式中,k是測驗(yàn)題目個(gè)數(shù),是被試在題目i上得分的方差,是被試測驗(yàn)總分方差。4.Cronbach’sAlpha系數(shù)使用條件可以估計(jì)各種記分方式的測驗(yàn)內(nèi)部一致性信度系數(shù),是更一般化的測驗(yàn)內(nèi)部一致性信度系數(shù)估計(jì)方法。第二節(jié)測驗(yàn)信度的種類與評估方法四、評分者信度1.含義在評價(jià)通過主觀評分方式得到的分?jǐn)?shù)時(shí),我們必須了解不同的評分者在評價(jià)被試作答反應(yīng)時(shí)給的分?jǐn)?shù)值的一致性程度(信度)。一般的客觀型題目在評分時(shí)很少出現(xiàn)誤差,然而,對于諸如作文測驗(yàn)、語言類測驗(yàn)、以及其他的評價(jià)性測驗(yàn)(如人格特質(zhì)評級、投射測驗(yàn)評分等),這些測驗(yàn)類型的評分過程就顯得非常主觀。第二節(jié)測驗(yàn)信度的種類與評估方法2.評估方法兩個(gè)評分者時(shí):計(jì)算這兩個(gè)評分者評定分?jǐn)?shù)之間的相關(guān)系數(shù)。多個(gè)評價(jià)者評價(jià)同一批被試:計(jì)算和諧系數(shù)。第二節(jié)測驗(yàn)信度的種類與評估方法五、信度系數(shù)及其估計(jì)方法小結(jié)1.測試次數(shù)和測試卷份數(shù)與信度系數(shù)估計(jì)方法第二節(jié)測驗(yàn)信度的種類與評估方法測試次數(shù)測試卷份數(shù)1份2份1次分半信度Kuder-Richardson信度Alpha系數(shù)復(fù)本信度(同時(shí)測試)2次重測信度復(fù)本信度(延時(shí)測試)2.各種信度估計(jì)方法的誤差方差來源第二節(jié)測驗(yàn)信度的種類與評估方法信度估計(jì)方法誤差方差來源重測信度復(fù)本信度(同時(shí)測試)復(fù)本信度(延時(shí)測試)分半信度Kuder-Richardson

和Alpha系數(shù)評分者信度時(shí)間間隔題目內(nèi)容時(shí)間間隔與題目內(nèi)容題目內(nèi)容題目內(nèi)容與心理行為特質(zhì)的同質(zhì)性評分者間差異第三節(jié)測量的隨機(jī)誤差控制一、影響測量信度的因素影響測量信度的因素施測間隔的時(shí)間被試主試施測情境測量工具第三節(jié)測量的隨機(jī)誤差控制二、提高測驗(yàn)信度的常用方法提高測驗(yàn)信度的常用方法規(guī)范施測程序、統(tǒng)一施測環(huán)境適當(dāng)增加測驗(yàn)的長度控制試題的難度分布努力提高每道題的區(qū)分度維持測驗(yàn)的同質(zhì)性努力提高測驗(yàn)在被試中各個(gè)同質(zhì)亞團(tuán)體上的信度保證被試有充裕的作答時(shí)間嚴(yán)格控制評分誤差第三節(jié)測量的隨機(jī)誤差控制提高信度的方法——適當(dāng)增加測驗(yàn)的長度為什么增加測驗(yàn)的長度,會提高信度?測驗(yàn)長度的增加與信度的提高不是等比例的提高信度的方法——適當(dāng)增加測驗(yàn)的長度增加測驗(yàn)長度與信度提高之間關(guān)系的公式:例:有一包含10題的測驗(yàn),其信度系數(shù)為0.30,若把測驗(yàn)增加到原測驗(yàn)長度的3倍,那么新測驗(yàn)的信度系數(shù)應(yīng)該是多少?例:原測驗(yàn)共10題,信度系數(shù)為0.30,如要把測驗(yàn)信度系數(shù)提高到0.94,需要把原測驗(yàn)延長多少倍?增加多少題?返回第四節(jié)評分者信度及

評分誤差的控制一、評分誤差存在的嚴(yán)重性嚴(yán)重到什么程度?歷史教授的答案被評閱為“不及格”高考作文《一幅漫畫的啟示》,67位評閱者,6至25分都有,最高分與最低分相差19分。1984年,高考作文評分調(diào)查,438位老師,4篇作文,。最高得分為41.25,最低分為20.75,標(biāo)準(zhǔn)差為2.98。1985年,對1984年的四篇作文再研究,347位老師(有部分1985年參加研究的老師),最高得分為42.5,最低分為24.75,標(biāo)準(zhǔn)差為3.3。第四節(jié)評分者信度及評分誤差控制二、評分者信度定義:多個(gè)評分者對同一批答卷評分結(jié)果的一致性程度。估計(jì)方法:①兩位評分者評同一批試卷;②三位或三位以上評分者評同一批試卷第四節(jié)評分者信度及評分誤差控制兩位評分者評同一批試卷的評分者信度例:甲、乙兩位教師評閱10份試卷,他們對每一試卷各自所評分?jǐn)?shù)如下表,問這兩位教師評分的一致性如何?返回試卷得分D=甲-乙等級等級之差甲評分乙評分甲乙A94931110B9092-222.5-0.5C8692-63.52.51D8670163.573.5E8682-10541F7076-665.50.5G6865379-2H6676-1085.52.5I6468-4981J6160110100多位評分者評同一批試卷的評分者信度例:六位教師各自評閱相同的5篇作文,每位教師給每一篇作文都評了等級(共5等)并列入下表,問這六位教師評分的一致性如何?返回作文評分者12345A35241B35241C34152D35142E35241F35241∑182910258三、評分誤差產(chǎn)生的原因試題原因評分者原因?qū)I(yè)知識水平不夠評判能力不夠個(gè)性傾向心理狀態(tài)客觀效應(yīng)“名片”、“光環(huán)”、“對比”、“先后”環(huán)境、組織管理的原因第四節(jié)評分者信度及評分誤差控制四、控制評分誤差的方法控制試題作答反應(yīng)方向與范圍預(yù)先制訂好評分細(xì)則閱卷人員要選擇、要培訓(xùn)流水作業(yè)分因素評分組織復(fù)查要求評分者自覺防止各種客觀效應(yīng)的影響大規(guī)模閱卷可考慮采用統(tǒng)計(jì)手段控制第四節(jié)評分者信度及評分誤差控制測量效度與系統(tǒng)誤差控制心理測量學(xué)測量效度與系統(tǒng)誤差控制測量效度概述1測量工具效度驗(yàn)證的方法2測量的系統(tǒng)誤差控制3心理測量學(xué)測量效度與系統(tǒng)誤差控制測量效度概述1心理測量學(xué)測量效度概述

什么是效度測量工具測量了他所希望測量的心理特質(zhì)或行為特征的效果和程度。效度總是與一定的測量目標(biāo)相聯(lián)系的。我們稱為某測量工具進(jìn)行效度驗(yàn)證的過程為效度證據(jù)的獲取過程,簡稱為效度驗(yàn)證。心理測量學(xué)測量效度概述效度與信度的關(guān)系信度研究的是測量結(jié)果的穩(wěn)定性問題,效度研究的是測量結(jié)果的準(zhǔn)確性問題。測量的信度只受到隨機(jī)誤差或非系統(tǒng)測量誤差的影響,而測量效度會同時(shí)受到隨機(jī)誤差和系統(tǒng)測量誤差的影響。一個(gè)測量工具可能是非常穩(wěn)定(信度高),但卻是無效的,因?yàn)樗c測量的目標(biāo)之間產(chǎn)生了系統(tǒng)性的偏差;當(dāng)然,一個(gè)完全不穩(wěn)定的測量工具也不可能是有效的。信度是效度的必要條件,但不是充分條件。心理測量學(xué)測量效度與系統(tǒng)誤差控制測量工具效度驗(yàn)證的方法2心理測量學(xué)測量工具效度驗(yàn)證的方法根據(jù)測量目標(biāo)的不同,對測量工具進(jìn)行效度驗(yàn)證的方法主要有三種:基于所測內(nèi)容的效度驗(yàn)證方法——內(nèi)容效度基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法——結(jié)構(gòu)效度基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法——效標(biāo)關(guān)聯(lián)效度心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測內(nèi)容的效度驗(yàn)證方法含義就是要對測量工具本身的具體內(nèi)容進(jìn)行系統(tǒng)性的查驗(yàn),以確定這些內(nèi)容是不是測量目標(biāo)特質(zhì)或行為領(lǐng)域的一個(gè)有代表性的樣本。內(nèi)容效度需要注意的兩個(gè)問題:測量工具測量的是否正是調(diào)查人員想要測量的那種行為;測量工具是否提供了相關(guān)行為的適當(dāng)樣品。主要應(yīng)用學(xué)業(yè)成就測驗(yàn)、職業(yè)資格測驗(yàn),還如人員選拔與安置中的工作樣本測驗(yàn)。心理測量學(xué)心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測內(nèi)容的效度驗(yàn)證方法專家判斷:確定測量目標(biāo)的全域范圍及各部分內(nèi)容權(quán)重。確定一批有經(jīng)驗(yàn)的領(lǐng)域?qū)<遥谏钊肱嘤?xùn)的基礎(chǔ)上,要求他們按照已確定的測量全域范圍及各部分內(nèi)容權(quán)重,初步分析測試題目的代表性,并對題目測量的被試作答的內(nèi)部心理過程進(jìn)行初步分析。進(jìn)行實(shí)測,根據(jù)測試數(shù)據(jù)分析和被試作答過程分析,全面驗(yàn)證測量工具的效度。心理測量學(xué)其他方法還有:心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測內(nèi)容的效度驗(yàn)證方法關(guān)于測量工具的表面效度嚴(yán)格來說,表面效度并不符合效度的定義,因?yàn)樗从车牟皇菍?shí)際要測量的目標(biāo)是什么,或?qū)δ繕?biāo)測量的程度如何,而反映的是,測量工具從表面上看測量了什么。表面效度關(guān)心的是測量的友好性和與公眾的和諧關(guān)系。表面效度的高低,取決于測驗(yàn)的目的和性質(zhì)。智力測驗(yàn)VS人格測驗(yàn)心理測量學(xué)測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效標(biāo):它是獨(dú)立于測量工具并可以從實(shí)踐中獲得的被試的行為特征表現(xiàn),用于驗(yàn)證測量工具的有效性。例如,用百米成績預(yù)測跳遠(yuǎn)成績,用焦慮量表預(yù)測某運(yùn)動員賽前焦慮水平等。根據(jù)測量工具與效標(biāo)兩者結(jié)果獲得的時(shí)間間隔的不同,基于效標(biāo)關(guān)聯(lián)性的效度證據(jù)采集可以有同時(shí)性設(shè)計(jì)(同時(shí)效度)與預(yù)測性設(shè)計(jì)(預(yù)測效度)兩種方法。心理測量學(xué)測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的預(yù)測性設(shè)計(jì)方法含義:驗(yàn)證現(xiàn)有測量評價(jià)結(jié)果與將來才可能獲取的效標(biāo)評價(jià)結(jié)果之間的關(guān)聯(lián)程度。主要應(yīng)用:人員選拔、安置類型的測量工具心理測量學(xué)測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的預(yù)測性設(shè)計(jì)方法首先,獲取被試在當(dāng)前測量工具上的評價(jià)結(jié)果,如測驗(yàn)分?jǐn)?shù)、等級評定;然后,間隔一定的時(shí)間,采集被試在預(yù)測目標(biāo)(效標(biāo))上的評價(jià)結(jié)果;最后,分析以上這兩個(gè)評價(jià)結(jié)果之間的關(guān)聯(lián)性程度,這種關(guān)聯(lián)性程度的分析方法常用的有以下幾種:相關(guān)分析區(qū)分能力分析命中率分析心理測量學(xué)高校自主招生能否選拔真正優(yōu)秀的學(xué)子自主招生指部分高校在統(tǒng)一高考的基礎(chǔ)上,拿出一定比例的招生名額,通過高校自主選拔考試,選拔出具有一定學(xué)科特長和創(chuàng)新潛質(zhì)的優(yōu)秀畢業(yè)生。人大完善招生制度自主招生各環(huán)節(jié)均建立評委庫近日,中國人民大學(xué)在本科招生網(wǎng)增設(shè)了公開公示的專欄,第一時(shí)間在網(wǎng)上公示了高水平運(yùn)動員、藝術(shù)特長生資格生名單與其專業(yè)成績、所享優(yōu)惠政策等信息,并公布了學(xué)校最新修訂的《中國人民大學(xué)本科生招生信息公開公示辦法》等制度和管理辦法。心理測量學(xué)測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的同時(shí)性設(shè)計(jì)方法含義:對同時(shí)獲得的測量工具評價(jià)結(jié)果與效標(biāo)評價(jià)結(jié)果之間的關(guān)聯(lián)性程度進(jìn)行分析。主要應(yīng)用經(jīng)常用于評價(jià)測量工具診斷被試當(dāng)前心理特質(zhì)狀態(tài)的效果。在許多情形下,效度證據(jù)采集的同時(shí)性設(shè)計(jì)方法會替代預(yù)測性設(shè)計(jì)方法。評估方法心理測量學(xué)測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法的影響因素群體的一致性或同質(zhì)性程度:應(yīng)該盡量擴(kuò)大被試群體的異質(zhì)性,避免低估測驗(yàn)的真實(shí)效度。測驗(yàn)長度:一般來說,測驗(yàn)長度越長,測試結(jié)果越穩(wěn)定,效度系數(shù)會傾向于越高。效標(biāo)污染心理測量學(xué)測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法估計(jì)標(biāo)準(zhǔn)誤指的是測量工具實(shí)際測量的結(jié)果與預(yù)先設(shè)定的測量目標(biāo)之間相互偏離的程度,而效度驗(yàn)證的過程就是要考察這種偏離程度的大小。從實(shí)際應(yīng)用范圍及計(jì)算過程的便利性角度看,估計(jì)標(biāo)準(zhǔn)誤的實(shí)際應(yīng)用更多的是基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法中。心理測量學(xué)測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法估計(jì)標(biāo)準(zhǔn)誤是表現(xiàn)為相關(guān)系數(shù)的效度系數(shù);是效標(biāo)評定分?jǐn)?shù)的標(biāo)準(zhǔn)差。心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法含義:對測量工具測量了心理學(xué)中某種特質(zhì)或特質(zhì)結(jié)構(gòu)的程度進(jìn)行驗(yàn)證的方法。主要應(yīng)用:各種心理測驗(yàn),如智力測驗(yàn)、人格測驗(yàn)、焦慮測驗(yàn)、成就動機(jī)測驗(yàn)等。心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法評估方法專家判斷分析法主要依靠專家的主觀專業(yè)經(jīng)驗(yàn)。盡量減少專家主觀隨意性的影響。德爾菲法。心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法評估方法測驗(yàn)內(nèi)部一致性分析法基于所測心理結(jié)構(gòu)的效度驗(yàn)證的一個(gè)重要證據(jù)來源。這個(gè)方法的實(shí)質(zhì)是,測驗(yàn)總分本身是用于評價(jià)所測心理結(jié)構(gòu)的效度最好的效標(biāo)。相關(guān)分析法:求取每個(gè)項(xiàng)目與測驗(yàn)總分之間的相關(guān)系數(shù),如果項(xiàng)目—測驗(yàn)相關(guān)顯著,表明該項(xiàng)目與總測驗(yàn)的結(jié)構(gòu)一致。心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法評估方法測驗(yàn)內(nèi)部一致性分析法對照組比較法:按照被試的測驗(yàn)總分,選出一個(gè)高分組被試和一個(gè)低分組被試,然后,比較高分組被試與低分組被試在各個(gè)項(xiàng)目上的作答表現(xiàn),如果高分組被試的通過比例顯著大于低分組被試的通過比例,表明該項(xiàng)目與總測驗(yàn)的結(jié)構(gòu)是一致的。心理測量學(xué)基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法評估方法測驗(yàn)內(nèi)部一致性分析法很明顯,測驗(yàn)內(nèi)部一致性證據(jù)保證的是測驗(yàn)結(jié)構(gòu)的同質(zhì)性或單一性。測驗(yàn)內(nèi)部一致性證據(jù)的作用是有限的,因?yàn)樗吘篃o法證明該測驗(yàn)究竟測量了什么結(jié)構(gòu)。測量工具效度驗(yàn)證的方法心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法評估方法與現(xiàn)有研究結(jié)論一致性的分析法通過分析新開發(fā)測量工具測試結(jié)果是否與已有研究結(jié)論一致。在許多傳統(tǒng)智力測驗(yàn)中,成長發(fā)展性變化證據(jù)是測驗(yàn)效度的一個(gè)重要證據(jù)。心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法評估方法與其他測量工具的相關(guān)分析法求取新開發(fā)測量工具與另一個(gè)已經(jīng)被公認(rèn)為有效的測量工具之間的相關(guān)關(guān)系,是證明新開發(fā)測量工具測量了相同內(nèi)容結(jié)構(gòu)的一個(gè)有效證據(jù)。求取新開發(fā)測量工具與另一個(gè)測量工具之間的相關(guān)關(guān)系,有時(shí)候也被用于證明該測量工具沒有受到其他無關(guān)心理因素的影響。心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法其他評估方法因素分析法因素分析方法是基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法中幾乎最為常用的一種方法,他很適合用于鑒別測量工具所測的心理特質(zhì)結(jié)構(gòu)。實(shí)際上,因素分析方法是一種分析觀察數(shù)據(jù)之間相關(guān)矩陣的統(tǒng)計(jì)分析技術(shù)。心理測量學(xué)心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法其他評估方法聚合與區(qū)分效度驗(yàn)證分析法為了驗(yàn)證測量工具所測的心理結(jié)構(gòu),我們不僅必須提供關(guān)于它與另外一個(gè)理論上應(yīng)該存在高相關(guān)的測量工具之間存在高相關(guān)的實(shí)際證據(jù),同時(shí),也需要提供關(guān)于它與另外的無關(guān)變量之間不存在顯著相關(guān)的證據(jù)。多特質(zhì)—多方法矩陣分析法心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法其他評估方法實(shí)驗(yàn)介入分析法通過實(shí)驗(yàn)的方法考察某些重要變量的介入是否對被試測量分?jǐn)?shù)產(chǎn)生顯著影響。心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法其他評估方法結(jié)構(gòu)方程建模分析法除了鑒別測量的潛在結(jié)構(gòu)之外,對這些潛在特質(zhì)結(jié)構(gòu)本身之間的關(guān)系以及它們之間的影響路徑進(jìn)行考察,同樣是非常重要的。分析潛在特質(zhì)結(jié)構(gòu)之間的關(guān)系及其與效標(biāo)變量之間的路徑,有利于我們更深入理解所測特質(zhì)的作用機(jī)制。這種分析過程可以用結(jié)構(gòu)方程建模的方式進(jìn)行。心理測量學(xué)廣告品牌態(tài)度的影響因素模型心理測量學(xué)測量工具效度驗(yàn)證的方法基于所測心理結(jié)構(gòu)的效度驗(yàn)證方法其他評估方法尋求當(dāng)代認(rèn)知心理學(xué)證據(jù)的分析方法基于信息加工理論的研究方法為我們深入理解人類問題解決的加工過程提供了更豐富的證據(jù)。認(rèn)知加工模型讓我們了解完成某種認(rèn)知任務(wù)的智能過程、這個(gè)過程的組織方式、涉及的知識內(nèi)容、這些知識在記憶中的表征形式及其提取模式,這些研究無疑會讓我們對人類心理特質(zhì)結(jié)構(gòu)的認(rèn)知更加深入。心理測量學(xué)測量效度與系統(tǒng)誤差控制測量的系統(tǒng)誤差控制3心理測量學(xué)測量的系統(tǒng)誤差控制影響測量工具有效性的因素測量的心理特質(zhì)本身的特點(diǎn)有些心理特質(zhì)至今研究不夠深入,概念界定還不清晰。有些心理特質(zhì)本身不太穩(wěn)定。測量工具的建構(gòu)過程建構(gòu)過程應(yīng)遵循嚴(yán)謹(jǐn)?shù)膽B(tài)度才能建構(gòu)出優(yōu)良的測量工具,避免出現(xiàn)系統(tǒng)偏差。心理測量學(xué)測量的系統(tǒng)誤差控制影響測量工具有效性的因素測量工具本身的信度信度是效度的必要條件。效度驗(yàn)證時(shí)的被試群體相同的一個(gè)測量工具,可能會因?yàn)闇y量對象特性的不同而測量到不同的心理特質(zhì)結(jié)構(gòu)。作為用相關(guān)系數(shù)表示的效度系數(shù),希望參與效度驗(yàn)證的被試群體越異質(zhì)越好。心理測量學(xué)測量的系統(tǒng)誤差控制影響測量工具有效性的因素效標(biāo)的選取效標(biāo)本身的信度及其有效性是非常關(guān)鍵的。其他因素測驗(yàn)形式、測驗(yàn)長度、測試過程的組織、評價(jià)者的經(jīng)驗(yàn)、記分方式、訪談中主試的經(jīng)驗(yàn)等。心理測量學(xué)測驗(yàn)題目的性能與題目編制心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心引子

心理測量的工具是測驗(yàn),而題目則是構(gòu)成測驗(yàn)的基石,因此研究題目的性能及其編制至關(guān)重要,它直接影響測量工具(即測驗(yàn))的信度及效度,進(jìn)而影響測量的準(zhǔn)確性。在實(shí)際工作中,人們應(yīng)如何來編制測驗(yàn)題目?如何評價(jià)測驗(yàn)題目質(zhì)量的好差呢?本章將對這些問題做出回答。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心測驗(yàn)題目性能與題目編制測驗(yàn)題目類型、功能與題目編制1測驗(yàn)題目的難度與難度分布控制2測驗(yàn)題目的區(qū)分度與區(qū)分度的提高3測驗(yàn)題目的猜測度與猜測控制4選擇題的選項(xiàng)分析與選項(xiàng)修改5題目功能差異與測量偏差控制6測驗(yàn)題目的性能與題目編制測驗(yàn)題目的類型、功能與編制

第一節(jié)心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心一、測驗(yàn)題目類型題目主要可分為客觀題和主觀題兩大類??陀^題一般有標(biāo)準(zhǔn)唯一的答案,被試的作答只有與標(biāo)準(zhǔn)答案完全一致才視為答對,否則視為答錯(cuò)。主觀題無標(biāo)準(zhǔn)唯一答案,只有一個(gè)參考答案,被試的作答與參考答案相近或基本一致就可視為答對。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心客觀題主要包括選擇題(含自陳式選擇題)、填空題、是非判斷題、匹配題、行為情景判斷題等。主觀題主要包括名詞解釋、簡答題、計(jì)算題、證明題、論述題、案例分析題、作文題等。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心單項(xiàng)選擇題多項(xiàng)選擇題自陳式選擇題是非判斷題名詞解釋題簡答題計(jì)算題證明題論述題案例分析題組合題行為情景判斷題心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心二、選擇題1、定義:選擇題指給出題干及備選項(xiàng),要求被試根據(jù)題干從備選項(xiàng)中選出正確選項(xiàng)的題目。單項(xiàng)選擇題指只有唯一正確選項(xiàng)的選擇題。2、特點(diǎn)功能:①評分標(biāo)準(zhǔn)明確,評分客觀,有利于減少評分帶來的評分誤差。②有利于對基礎(chǔ)知識和基本技能進(jìn)行考查。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心③選擇題適合考查較低層次的能力,如識記能力、較低的理解能力等,而不宜考查較高層次的能力,如綜合能力、創(chuàng)造性和獨(dú)立思維能力。④選擇題的命題技術(shù)要求較高,尤其是干擾項(xiàng)的設(shè)置。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心3、選擇題編制題干要描述清楚。應(yīng)讓答題者明白問題是什么,希望答題者解決什么。題干中應(yīng)盡量避免出現(xiàn)與考核內(nèi)容無關(guān)的材料。設(shè)問應(yīng)盡量正向,盡量少出現(xiàn)如“下面哪個(gè)是不對的?”的設(shè)問。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心題干文字的字體應(yīng)盡量一致,以減輕考生的閱讀負(fù)擔(dān)。備選項(xiàng)應(yīng)避免出現(xiàn)邏輯上的包含關(guān)系。備選項(xiàng)的長度、結(jié)構(gòu)、語言表達(dá)要盡量一致。增加干擾項(xiàng)的迷惑性。干擾項(xiàng)的設(shè)置應(yīng)能反應(yīng)考生缺乏特定的知識或技能。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心三、填空題1、特點(diǎn)功能:①考查的能力層次范圍比較廣,主要考核識記和理解能力。②填空題要求考生把問題的最后答案或結(jié)論正確無誤地表達(dá)出來,在一定程度上是對考生的嚴(yán)謹(jǐn)、嚴(yán)密、認(rèn)真、細(xì)致的工作作風(fēng)和科學(xué)態(tài)度的檢查。③評分簡單,誤差也相對要小。④填空題只要求考生寫出最后答案,而不必寫出解題的具體過程。因此,從試卷上看不出考生的推理、分析等思考過程。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心2、填空題編制試題的空格處應(yīng)考查有意義的關(guān)鍵性內(nèi)容或詞語。每小題的空格數(shù)不宜過多,填寫的字?jǐn)?shù)也不能太多??崭癫糠纸y(tǒng)一用下劃線表示,長度應(yīng)能滿足答題需要若空格處考核計(jì)算能力并要求填寫數(shù)字,應(yīng)在空格后標(biāo)明數(shù)字的單位。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心三、論述題與計(jì)算題1、定義:論述題指對某一問題或議題進(jìn)行綜合論述的題目。它用于考查被試分析、綜合、評價(jià)直至創(chuàng)新、創(chuàng)造等高層次能力。計(jì)算題指主要是通過計(jì)算或運(yùn)算來解答的題目。計(jì)算題內(nèi)容量有大有小,常常用于考查被試的應(yīng)用能力。一般要求給出條件完備無冗余,答案唯一。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心2、特點(diǎn)功能:

①論述題有利于考生獨(dú)立地、創(chuàng)造性地解題。試題的能力考查涉及的知識面可以比較大,而且要求考生通過分析去找出所涉及的知識并找出它們的內(nèi)在聯(lián)系。試題從定性分析到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論