版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
測量的誤差及其檢驗(yàn)第1頁,課件共172頁,創(chuàng)作于2023年2月[教學(xué)目的與要求](1)了解測量誤差的種類與來源(2)掌握信度的定義、意義及其估計(jì)方法(3)掌握效度的定義、意義及其估計(jì)方法第2頁,課件共172頁,創(chuàng)作于2023年2月第一節(jié)測量的誤差一、誤差的定義和種類二、誤差的來源三、真分?jǐn)?shù)第3頁,課件共172頁,創(chuàng)作于2023年2月一、誤差的定義和種類(一)誤差的定義誤差是在測量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)果。有二層含義:1、誤差是由與測量目的無關(guān)的因素引起的;2、誤差是不準(zhǔn)確或不一致的測量結(jié)果。第4頁,課件共172頁,創(chuàng)作于2023年2月第5頁,課件共172頁,創(chuàng)作于2023年2月(二)誤差的種類1、隨機(jī)誤差:與測量目的無關(guān)的偶然因素引起的變化無規(guī)律的誤差,這種誤差的大小和方向是隨機(jī)的。既影響測量的準(zhǔn)確性又影響一致性。2、系統(tǒng)誤差:與測量目的無關(guān)的因素引起的恒定的有規(guī)律的誤差,它穩(wěn)定地存在于每一次測量中。只影響測量的準(zhǔn)確性。第6頁,課件共172頁,創(chuàng)作于2023年2月二、誤差的來源在心理測量中,常見的誤差來源于三個(gè)方面:測驗(yàn)自身;施測過程;受測者本身。
第7頁,課件共172頁,創(chuàng)作于2023年2月(一)測驗(yàn)自身引起的誤差主要來源于測驗(yàn)的編制過程,其中項(xiàng)目取樣影響最大。
測驗(yàn)題目少或樣本缺乏代表性測驗(yàn)復(fù)本不等值題目用詞模棱兩可反應(yīng)步驟說明不清題目過難引起猜測時(shí)間短促倉促作答等第8頁,課件共172頁,創(chuàng)作于2023年2月(二)施測過程引起的誤差1、測試環(huán)境2、測試時(shí)間3、主試因素4、意外干擾5、評分記分(評的客觀,記得準(zhǔn)確)第9頁,課件共172頁,創(chuàng)作于2023年2月小資料:對于論文題、問答題要多少人評分,平均分?jǐn)?shù)才能相對穩(wěn)定和客觀呢?國外有人做過專門研究,結(jié)果如下:哲學(xué)論文127人,作文78人,物理16人,數(shù)學(xué)13人。第10頁,課件共172頁,創(chuàng)作于2023年2月(三)被試引起的誤差
既使一個(gè)測驗(yàn)經(jīng)過精心編制,題目取樣具有代表性,又有標(biāo)準(zhǔn)化的施測和記分程序,由于受測者本身的變化,仍然會給測驗(yàn)分?jǐn)?shù)帶來誤差,這種誤差是最難控制的。第11頁,課件共172頁,創(chuàng)作于2023年2月1、應(yīng)試動(dòng)機(jī)被試對測驗(yàn)的動(dòng)機(jī)不同,會影響其作答態(tài)度,注意力、持久性、反應(yīng)速度等,從而影響測驗(yàn)成績。2、測驗(yàn)焦慮測驗(yàn)焦慮是指受測者在應(yīng)試前和測試中出現(xiàn)的一種緊張的、不愉快的情緒體驗(yàn)。中等程度的焦慮最有利于被試的發(fā)揮第12頁,課件共172頁,創(chuàng)作于2023年2月測驗(yàn)焦慮影響因素
1.能力高的人,測驗(yàn)焦慮一般較低,而對自己能力沒有把握的人,測驗(yàn)焦慮較高
2.抱負(fù)水平過高,求勝心切的人,測驗(yàn)焦慮較高;
3,具有某種人格特點(diǎn),如缺乏自信、患得患失、情緒不穩(wěn)定的人易產(chǎn)生測驗(yàn)焦慮;
4.測驗(yàn)成績與被試的關(guān)系重大,或被試受到的壓力過大,容易使其產(chǎn)生測驗(yàn)焦慮;
5.經(jīng)常接受測驗(yàn)的人焦慮較低,而對測驗(yàn)程序不熟悉,尤其是測驗(yàn)中采取了新的題目形式或?qū)嵤┏绦驎黾訙y驗(yàn)焦慮。6,被試不了解測驗(yàn)?zāi)康?,指?dǎo)語不清會增加被試的焦慮。
第13頁,課件共172頁,創(chuàng)作于2023年2月3、測驗(yàn)經(jīng)驗(yàn)任何一種新的項(xiàng)目形式,由于被試比較陌生,就可能使測驗(yàn)成績受到影響。如果提供足夠的演示和練習(xí),測驗(yàn)成績就會提高。相反,有些被試測驗(yàn)經(jīng)驗(yàn)較多,掌握了答題技巧,成為了“測驗(yàn)油子”。4、練習(xí)效應(yīng)任何一個(gè)測驗(yàn)在重復(fù)使用時(shí),都會有練習(xí)效應(yīng)而使成績提高。第14頁,課件共172頁,創(chuàng)作于2023年2月練習(xí)效應(yīng)教育背景較差、經(jīng)驗(yàn)較少或智力較高者,其受練習(xí)效應(yīng)的影響較大著重速度的測驗(yàn)練習(xí)效應(yīng)較為明顯重復(fù)實(shí)施相同的測驗(yàn),受練習(xí)效應(yīng)影響的程度要大于復(fù)本的測驗(yàn)兩次測驗(yàn)時(shí)距越大,練習(xí)效應(yīng)越小,三個(gè)月以上可以忽略一般的練習(xí)效應(yīng),約在1/5標(biāo)準(zhǔn)差以下第15頁,課件共172頁,創(chuàng)作于2023年2月5、反應(yīng)傾向(反應(yīng)定勢)反應(yīng)定勢是指獨(dú)立于測驗(yàn)內(nèi)容的反應(yīng)傾向。即由于每個(gè)人回答問題的習(xí)慣不同,而使能力相同的被試得到不同的測驗(yàn)分?jǐn)?shù)。
6、生理變因指生病、疲勞、失眠等生理因素以及在智力、情緒、體力等方面的生物節(jié)律也會影響測驗(yàn)成績而帶來誤差。第16頁,課件共172頁,創(chuàng)作于2023年2月常見的反應(yīng)定勢求“快”與求“精確”的反應(yīng)定勢喜好正面敘述的反應(yīng)定勢喜好特殊位置的反應(yīng)定勢喜好較長選項(xiàng)的反應(yīng)定勢猜測的反應(yīng)定勢第17頁,課件共172頁,創(chuàng)作于2023年2月三、真分?jǐn)?shù)
(一)含義理論定義:是指測量沒有誤差時(shí)所得到的真值。真分?jǐn)?shù)是一個(gè)在理論上構(gòu)想出來的抽象概念。操作定義:是無數(shù)次測量結(jié)果的平均值。第18頁,課件共172頁,創(chuàng)作于2023年2月(二)數(shù)學(xué)模型及其假設(shè)1、經(jīng)典測量理論的基本思想把任何一個(gè)人在一個(gè)測驗(yàn)上的成績都看作是真分?jǐn)?shù)和測量誤差的和,這是經(jīng)典測量理論的基本思想。即:
X=T+EX:實(shí)得分?jǐn)?shù)或觀測分?jǐn)?shù)T:假設(shè)的真分?jǐn)?shù)E:測量誤差第19頁,課件共172頁,創(chuàng)作于2023年2月注意:測量誤差E指的是引起測量不一致的變因所產(chǎn)生的效應(yīng),即指隨機(jī)誤差,不包括系統(tǒng)誤差。系統(tǒng)誤差不引起分?jǐn)?shù)的改變,因此包含在真值中。第20頁,課件共172頁,創(chuàng)作于2023年2月關(guān)于測量誤差E有以下假設(shè):(1)如果對一個(gè)人測量無數(shù)次或同一測驗(yàn)施測于無限大的人群,其平均誤差為0,即;(2)真分?jǐn)?shù)和測量誤差是相互獨(dú)立的即;(3)誤差分?jǐn)?shù)和實(shí)得分?jǐn)?shù)的相關(guān)為0,即。第21頁,課件共172頁,創(chuàng)作于2023年2月2、引申:(1)對于一個(gè)團(tuán)體來說,實(shí)得分?jǐn)?shù)的變異數(shù)等于其真分?jǐn)?shù)的變異數(shù)與誤差變異數(shù)之和。
SX2=ST2+SE2(2)真分?jǐn)?shù)的變異數(shù)可以分成兩部分:與測量目的有關(guān)的變異SV2(有效變異)和與測量目的無關(guān)的但卻穩(wěn)定的變異SI2,即:
ST2=SV2+SI2第22頁,課件共172頁,創(chuàng)作于2023年2月(3)一次測驗(yàn)中,一個(gè)團(tuán)體的實(shí)得分?jǐn)?shù)的變異性是由與測量目的有關(guān)的變異數(shù)SV2
、穩(wěn)定的但出自無關(guān)來源的變異數(shù)SI2和隨機(jī)誤差的變異數(shù)SE2所決定的。即:
SX2=SV2+SI2+SE2第23頁,課件共172頁,創(chuàng)作于2023年2月SV2SI2SE2SX2ST2
第24頁,課件共172頁,創(chuàng)作于2023年2月第二節(jié)信度一、什么是信度二、信度的類型及估計(jì)方法三、信度的應(yīng)用四、影響信度的因素第25頁,課件共172頁,創(chuàng)作于2023年2月一、什么是信度定義:指的是測量結(jié)果的穩(wěn)定性程度(或叫可靠性、一致性)。思考:信度受隨機(jī)誤差的影響還是受系統(tǒng)誤差的影響?第26頁,課件共172頁,創(chuàng)作于2023年2月在測量學(xué)中,信度被定義為:一組測量分?jǐn)?shù)的真分?jǐn)?shù)變異數(shù)(方差)與總變異數(shù)(總方差、實(shí)得分?jǐn)?shù)的方差)的比率,或者是真實(shí)分?jǐn)?shù)方差占總方差的百分比。計(jì)算公式:rxx=ST2/SX2rxx也被稱為信度系數(shù)。第27頁,課件共172頁,創(chuàng)作于2023年2月該定義有兩點(diǎn)要注意:1、信度指的是一組測驗(yàn)分?jǐn)?shù)或一列測量的特性,而不是個(gè)人分?jǐn)?shù)的特性。2、信度是一個(gè)理論上構(gòu)想的概念,只能根據(jù)一組實(shí)得分?jǐn)?shù)作出估計(jì)。第28頁,課件共172頁,創(chuàng)作于2023年2月信度系數(shù)rxx實(shí)際是真正分?jǐn)?shù)與實(shí)得分?jǐn)?shù)之間的決定系數(shù)。可以解釋為在實(shí)得分?jǐn)?shù)的變異數(shù)中有多少比例是由真分?jǐn)?shù)的變異決定的。例如:當(dāng)rxx
=0.9時(shí),怎么解釋?rxx
=1?rxx=0?第29頁,課件共172頁,創(chuàng)作于2023年2月對信度系數(shù)也要注意三點(diǎn):1)在不同情況下,對不同樣本,采用不同方法會得到不同的信度系數(shù),因此一個(gè)測驗(yàn)可能不止一個(gè)信度系數(shù)。2)信度系數(shù)只是對測量分?jǐn)?shù)不一致性程度的估計(jì),并沒有指出不一致的原因。3)獲得較高的信度系數(shù)并不是心理測量追求的最終目的,它只是邁向目標(biāo)的第一步,是使測驗(yàn)有效的一個(gè)必要條件。
第30頁,課件共172頁,創(chuàng)作于2023年2月二、信度的類型及估計(jì)方法信度是個(gè)理論上構(gòu)想的概念,在實(shí)際應(yīng)用時(shí),通常以同一樣本所得的兩組資料的相關(guān),作為測量一致性的指標(biāo)。由于測驗(yàn)分?jǐn)?shù)的誤差來源不同,估計(jì)信度的方法也不同,故每一種信度系數(shù)只能說明信度的不同方面,因而具有不同的意義。第31頁,課件共172頁,創(chuàng)作于2023年2月(一)重測信度(再測信度)(二)復(fù)本信度(三)分半信度(四)同質(zhì)性信度(五)評分者信度第32頁,課件共172頁,創(chuàng)作于2023年2月(一)重測信度(再測信度)1、含義與計(jì)算用同一個(gè)測驗(yàn),在同樣條件下對同一組被試前后兩次施測,求兩次得分間的相關(guān)系數(shù)。它反映的是兩次測驗(yàn)的結(jié)果有無變化,也就是測驗(yàn)分?jǐn)?shù)的穩(wěn)定程度,所以又稱穩(wěn)定性系數(shù)。計(jì)算公式為:第33頁,課件共172頁,創(chuàng)作于2023年2月例題:假設(shè)有一份主觀幸福感調(diào)查表,先后兩次施測于10名學(xué)生,時(shí)間間隔為半年,結(jié)果如表所示,求該測驗(yàn)的重測信度。(為了便于理解和計(jì)算,本章估計(jì)信度的例子都是小樣組,實(shí)際應(yīng)用時(shí)應(yīng)采用大樣組。)表1某幸福感調(diào)查表的兩次測試結(jié)果
被試測驗(yàn)12345678910X116151313111010987X21616141211911867第34頁,課件共172頁,創(chuàng)作于2023年2月解:用計(jì)算器算出:S1=2.82S2=3.38
把以上數(shù)據(jù)代入公式第35頁,課件共172頁,創(chuàng)作于2023年2月2、使用的前提條件(1)所測量的心理特性必須是穩(wěn)定的。(2)遺忘和練習(xí)的效果基本上相互抵消。(3)在時(shí)間間隔中沒有學(xué)習(xí)另外的與測驗(yàn)有關(guān)的東西,或者說每人學(xué)習(xí)其他東西的程度都一樣。第36頁,課件共172頁,創(chuàng)作于2023年2月3、使用時(shí)的注意要點(diǎn)
(1)兩次測驗(yàn)的時(shí)間間隔要適當(dāng)。(2)再測法適用于速度測驗(yàn)和人格測驗(yàn)。(3)應(yīng)注意提高被試的積極性。提問:重測法的誤差主要是來源于什么?第37頁,課件共172頁,創(chuàng)作于2023年2月4、優(yōu)缺點(diǎn)缺點(diǎn):(1)易受練習(xí)和記憶的影響。(2)如果兩次施測時(shí)間間隔較長,由于在此期間受到被試學(xué)習(xí)、成熟的影響,都會使兩次測驗(yàn)結(jié)果不相同。(3)同一被試對一個(gè)測驗(yàn)先后兩次作答,對測驗(yàn)的興趣不同、身心狀況的變化,影響測驗(yàn)結(jié)果。(4)兩次施測的條件不同,也是產(chǎn)生測量誤差的因素。第38頁,課件共172頁,創(chuàng)作于2023年2月優(yōu)點(diǎn):(1)能提供有關(guān)測驗(yàn)結(jié)果是否隨著時(shí)間而變異的資料,可作為預(yù)測受測者將來行為表現(xiàn)的依據(jù);(2)首測和再測只需要一套測驗(yàn)題目,省時(shí)、省力;(3)同一套題目無論施測幾次,所測的屬性是完全相同的。第39頁,課件共172頁,創(chuàng)作于2023年2月(二)復(fù)本信度
1、含義與計(jì)算含義:根據(jù)一組被試在兩個(gè)平行(等值)測驗(yàn)上的得分計(jì)算的相關(guān)系數(shù)即為復(fù)本信度。其計(jì)算方法與再測法相同。第40頁,課件共172頁,創(chuàng)作于2023年2月例題:假設(shè)用A、B兩型創(chuàng)造力復(fù)本測驗(yàn)對初中一年級10個(gè)學(xué)生施測,計(jì)算該測驗(yàn)的復(fù)本信度。結(jié)果見表2。
被試測驗(yàn)12345678910X120191918171614131210X22020181615171211139表2某創(chuàng)造力復(fù)本測驗(yàn)測試結(jié)果第41頁,課件共172頁,創(chuàng)作于2023年2月解:先用計(jì)算器計(jì)算得出以下值:把以上數(shù)據(jù)代入公式第42頁,課件共172頁,創(chuàng)作于2023年2月2、使用的前提條件:(1)要兩份或兩份以上真正等值的測驗(yàn),必須是真正的復(fù)本,否則所得的信度就成了歪曲的估計(jì)。(2)被試要有條件接受兩個(gè)測驗(yàn)。主要取決于時(shí)間、經(jīng)費(fèi)等幾方面。第43頁,課件共172頁,創(chuàng)作于2023年2月3、連續(xù)施測和間隔施測(1)連續(xù)施測同時(shí)施測的復(fù)本信度叫等值性系數(shù)。提問:同時(shí)施測的復(fù)本信度的誤差主要來源于什么?第44頁,課件共172頁,創(chuàng)作于2023年2月(2)間隔施測相距一段時(shí)間分兩次施測得到的信度叫做穩(wěn)定性與等值性系數(shù)。提問:間隔施測的復(fù)本信度的誤差主要來源于什么?第45頁,課件共172頁,創(chuàng)作于2023年2月4、復(fù)本信度局限性①如果測量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能完全消除這種影響;②由于第二個(gè)測驗(yàn)只改變了題目的內(nèi)容,已經(jīng)掌握的解題原則,可以很容易地遷移到同類問題。③對于許多測驗(yàn)來說,建立復(fù)本是十分困難的。第46頁,課件共172頁,創(chuàng)作于2023年2月(三)分半信度
1、含義含義:按正常的程序?qū)嵤y驗(yàn),然后將全部項(xiàng)目分成相等的兩半,根據(jù)各人在這兩半測驗(yàn)的分?jǐn)?shù)計(jì)算其相關(guān)系數(shù)。由于只需對一個(gè)測驗(yàn)進(jìn)行一次施測,考察的是兩半題目之間的一致性,所以這種信度系數(shù)有時(shí)也被稱為內(nèi)部一致性系數(shù)。第47頁,課件共172頁,創(chuàng)作于2023年2月2、計(jì)算提問:怎樣對測驗(yàn)進(jìn)行分半?進(jìn)行奇偶分半時(shí),要注意的問題是:怎樣安排互相有牽連的題目。在這種情況下整個(gè)一組的題目應(yīng)放到同一半。第48頁,課件共172頁,創(chuàng)作于2023年2月(1)兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)相等(方差齊性)先計(jì)算兩半測驗(yàn)的積差相關(guān)系數(shù),再進(jìn)行斯皮爾曼-布朗公式校正:rhh為兩半分?jǐn)?shù)的相關(guān)系數(shù);rxx為測驗(yàn)在原長度時(shí)的信度估計(jì)提問:為什么求得的分半信度要用斯皮爾曼-布朗公式校正?第49頁,課件共172頁,創(chuàng)作于2023年2月(2)兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)不等(方差不齊)當(dāng)兩半測驗(yàn)不等值時(shí),可采用下列公式的兩種之一,直接求得測驗(yàn)的信度系數(shù):①弗朗那根公式:Sa2
和Sb2表示兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)SX2表示測驗(yàn)總分的變異數(shù)第50頁,課件共172頁,創(chuàng)作于2023年2月②盧倫公式:Sd2為兩半測驗(yàn)分?jǐn)?shù)之差的變異數(shù);Sx2為測驗(yàn)總分的變異數(shù);r為信度值。提問:怎樣理解盧倫公式?第51頁,課件共172頁,創(chuàng)作于2023年2月
例:有一個(gè)由100題構(gòu)成的量表施測于10個(gè)高三學(xué)生。測驗(yàn)一次后,應(yīng)試者即畢業(yè)離?!,F(xiàn)在怎樣評價(jià)測驗(yàn)結(jié)果的信度?第52頁,課件共172頁,創(chuàng)作于2023年2月
被試測驗(yàn)12345678910X138373841403638394035X237373639393438393936解:因不能再次測驗(yàn),只能求分半信度。步驟:(1)計(jì)算出每個(gè)應(yīng)試者的奇數(shù)題總分(X1)和偶數(shù)題總分(X2),見表:第53頁,課件共172頁,創(chuàng)作于2023年2月解:用計(jì)算器求得(也可以用計(jì)算機(jī)做):(1)斯皮爾曼-布朗公式(平均數(shù)和標(biāo)準(zhǔn)差差異顯著性檢驗(yàn)略)第54頁,課件共172頁,創(chuàng)作于2023年2月(2)弗朗那根公式:
第55頁,課件共172頁,創(chuàng)作于2023年2月(3)盧倫公式:
第56頁,課件共172頁,創(chuàng)作于2023年2月3、使用的前提條件及范圍(1)分半信度通常是只能施測一次或沒有復(fù)本的情況下使用。(2)由于將一個(gè)測驗(yàn)分成兩半的方法很多,所以,同一測驗(yàn)通常會有多個(gè)分半信度值。(3)當(dāng)試卷中有任選題時(shí)不宜用分半法,速度測驗(yàn)也不宜用分半法。第57頁,課件共172頁,創(chuàng)作于2023年2月(四)同質(zhì)性信度
1、含義同質(zhì)性也指內(nèi)部一致性,指測驗(yàn)內(nèi)部所有題目間的一致性。題目的一致性有兩層含義:其一是指所有題目都測的是同一種心理特質(zhì);其二是指所有題目之間都具有較高的正相關(guān)??傊?,同質(zhì)性信度就是一個(gè)測驗(yàn)所測內(nèi)容或特質(zhì)的相同程度。第58頁,課件共172頁,創(chuàng)作于2023年2月2、測量同質(zhì)性的基本公式:K:構(gòu)成測驗(yàn)的題目數(shù)
:項(xiàng)目間相關(guān)系數(shù)的平均數(shù)
:同質(zhì)性性度值
提問:這個(gè)公式說明什么?第59頁,課件共172頁,創(chuàng)作于2023年2月3、庫德-理查遜公式:適用于客觀性試題(0、1記分)K-R20公式:
K:構(gòu)成測驗(yàn)的題目數(shù)Pi:通過第i題的人數(shù)比例qi:未通過第i題的人數(shù)比例Sx2:測驗(yàn)總分的變異數(shù)第60頁,課件共172頁,創(chuàng)作于2023年2月K-R21公式:適用于各項(xiàng)目難度相近的情況
K:構(gòu)成測驗(yàn)的題目數(shù)
:測驗(yàn)總分的平均數(shù)Sx2:測驗(yàn)總分的變異數(shù)第61頁,課件共172頁,創(chuàng)作于2023年2月4、克倫巴赫系數(shù):適用于多重記分測驗(yàn)K:構(gòu)成測驗(yàn)的題目數(shù)Si2:某一題目分?jǐn)?shù)的變異數(shù)Sx2:測驗(yàn)總分的變異數(shù)第62頁,課件共172頁,創(chuàng)作于2023年2月題號被試Si2
ABCDE1711811113.042697891.3636106892.5648116836.965711811113.046711811113.044062415452例:有一種包含6個(gè)論文式題目的測驗(yàn),對5個(gè)應(yīng)試者施行,得分見下表,試求該測驗(yàn)的信度。第63頁,課件共172頁,創(chuàng)作于2023年2月解:(1)求每題各被試得分的方差Si2
、方差和(2)求測驗(yàn)總分的變異數(shù)即各被試得分的方差(即求40、62、41、54、52的方差),Sx
2
=68.96(3)代入公式求信度系數(shù)
第64頁,課件共172頁,創(chuàng)作于2023年2月4、注意:①用庫德-理查遜公式和克倫巴赫系數(shù)所求得的信度通常比分半信度低。②上面這些公式不適用于速度性測驗(yàn)。提問:同質(zhì)性信度的誤差主要來源于什么?第65頁,課件共172頁,創(chuàng)作于2023年2月(五)評分者信度1、含義指的是多個(gè)評分者給同一批人的答卷進(jìn)行評分的一致性程度。是用于測量不同評分者之間所產(chǎn)生的誤差。第66頁,課件共172頁,創(chuàng)作于2023年2月2、方法與計(jì)算方法:隨機(jī)抽取相當(dāng)份數(shù)的試卷,由兩個(gè)或多個(gè)評分者按評分標(biāo)準(zhǔn)打分,然后求其間的相關(guān)。(1)兩個(gè)評分者采用皮爾遜積差相關(guān)或等級相關(guān)。一般要求經(jīng)過訓(xùn)練的成對評分者之間的一致性程度達(dá)到0.90以上,才認(rèn)為評分是標(biāo)準(zhǔn)客觀的。第67頁,課件共172頁,創(chuàng)作于2023年2月(2)多個(gè)評分者評多個(gè)對象,并用等級法計(jì)分時(shí),可以用肯德爾和諧系數(shù):W:和諧系數(shù)K:評分者的人數(shù)N:被評對象數(shù)Ri:每一對象被評的等級總和。第68頁,課件共172頁,創(chuàng)作于2023年2月
論文專家123456A241563B341562C351462Ri813314187例:假設(shè)有三位專家給六篇論文評等級,結(jié)果如表所示,試計(jì)算此次評分者的評分者信度。第69頁,課件共172頁,創(chuàng)作于2023年2月第70頁,課件共172頁,創(chuàng)作于2023年2月提問:評分者信度的誤差主要來源于什么?第71頁,課件共172頁,創(chuàng)作于2023年2月以上介紹的各種信度估計(jì)方法都是對測驗(yàn)的一致性進(jìn)行估計(jì),但由于誤差來源不同,它們的研究側(cè)面各不相同,說明的是信度的不同方面。這些方法具有不同的意義,每一種信度系數(shù)不能代替其他信度系數(shù)。第72頁,課件共172頁,創(chuàng)作于2023年2月估計(jì)信度的方法與測驗(yàn)復(fù)本的數(shù)目
以及施測次數(shù)的關(guān)系所需要施測的次數(shù)所需要復(fù)本的數(shù)目一二一分半信度同質(zhì)性信度評分者信度復(fù)本信度(連續(xù)施測)二再測信度復(fù)本信度(間隔施測)第73頁,課件共172頁,創(chuàng)作于2023年2月各種信度系數(shù)相應(yīng)誤差變異的來源信度系數(shù)的類型誤差變異的來源再測信度復(fù)本信度(連續(xù)施測)復(fù)本信度(間隔施測)分半信度同質(zhì)性信度評分者信度時(shí)間取樣內(nèi)容取樣時(shí)間與內(nèi)容取樣內(nèi)容取樣內(nèi)容的異質(zhì)性評分者間的差異第74頁,課件共172頁,創(chuàng)作于2023年2月提問:在理論上,哪種方法得到的信度系數(shù)最高?哪種最低?第75頁,課件共172頁,創(chuàng)作于2023年2月實(shí)際上,有多少種誤差來源,便有多少種估計(jì)信度的方法。一個(gè)測驗(yàn)?zāi)姆N誤差大,便應(yīng)該用哪種誤差估計(jì)。有時(shí)一個(gè)測驗(yàn)需要幾種信度系數(shù),這樣我們就能把總分?jǐn)?shù)的變異數(shù)分成不同的分支。第76頁,課件共172頁,創(chuàng)作于2023年2月假設(shè)對100個(gè)六年級學(xué)生以兩個(gè)月的時(shí)間間隔先后施測一個(gè)創(chuàng)造力測驗(yàn)的A、B復(fù)本,所得到的等值性與穩(wěn)定性系數(shù)為0.70。我們還根據(jù)被試對每個(gè)復(fù)本的反應(yīng)計(jì)算出分半信度為0.80(先計(jì)算每個(gè)復(fù)本的分半相關(guān)系數(shù),將二者平均后用斯皮爾曼-布朗公式校正)。同時(shí),我們讓另一個(gè)評分者隨機(jī)抽取50份卷另外評分,得到的評分者信度為0.92。那么,這個(gè)測量的總誤差變異是多少?真實(shí)的變異是多少?第77頁,課件共172頁,創(chuàng)作于2023年2月一個(gè)假想測驗(yàn)的誤差變異來源分析信度類型誤差變異量誤差變異來源復(fù)本信度(間隔施測)1-0.70=0.30時(shí)間與內(nèi)容取樣分半信度1-0.80=0.20內(nèi)容取樣上述二者差異0.30-0.20=0.10時(shí)間取樣評分者信度1-0.92=0.08評分者差異誤差變異總和0.20+0.10+0.08=0.38真實(shí)變異1-0.38=0.62第78頁,課件共172頁,創(chuàng)作于2023年2月一個(gè)假想測驗(yàn)的誤差變異來源分析真實(shí)變異誤差變異時(shí)間上的穩(wěn)定性,復(fù)本之間的一致性,評分者之間的一致性內(nèi)容取樣誤差時(shí)間取樣誤差評分者間差異62%20%10%8%第79頁,課件共172頁,創(chuàng)作于2023年2月注意:信度雖然是測驗(yàn)的特性,但不能籠統(tǒng)地說某個(gè)測驗(yàn)的信度有多高。只能說在特定的條件下,用于特定的團(tuán)體,采用特定的方法所得到的某個(gè)測驗(yàn)的信度系數(shù)是多少。總之,信度總是與特定的情境有關(guān)的。第80頁,課件共172頁,創(chuàng)作于2023年2月三、信度的應(yīng)用(一)評價(jià)測驗(yàn)(二)解釋分?jǐn)?shù)第81頁,課件共172頁,創(chuàng)作于2023年2月(一)評價(jià)測驗(yàn)一般能力與成就測驗(yàn)的信度系數(shù)在0.90以上,有的可以達(dá)0.95,性格、興趣、價(jià)值觀等人格測驗(yàn)的信度系數(shù),通常在0.80到0.85或更高些。
第82頁,課件共172頁,創(chuàng)作于2023年2月(二)解釋分?jǐn)?shù)1、個(gè)人測驗(yàn)分?jǐn)?shù)的誤差用一組被試兩次施測的結(jié)果來估計(jì)測量誤差的變異數(shù)。此時(shí),個(gè)人在兩次測驗(yàn)中的分?jǐn)?shù)差異就是測量誤差,由此可制成誤差分?jǐn)?shù)的分布。這個(gè)分布的標(biāo)準(zhǔn)差就是測量的標(biāo)準(zhǔn)誤,是表示測量誤差大小的指標(biāo)。
提問:測量的標(biāo)準(zhǔn)誤與信度間有什么關(guān)系?第83頁,課件共172頁,創(chuàng)作于2023年2月測量的標(biāo)準(zhǔn)誤實(shí)際上是在一組測量分?jǐn)?shù)中誤差分布的標(biāo)準(zhǔn)差,可以像其它標(biāo)準(zhǔn)差一樣地解釋。我們可以根據(jù)標(biāo)準(zhǔn)誤從每個(gè)人的實(shí)得分?jǐn)?shù)估計(jì)出真分?jǐn)?shù)的可能范圍,即確定出在不同或然率水準(zhǔn)上真分?jǐn)?shù)的置信區(qū)間。人們一般采用95%的或然率水準(zhǔn),其置信區(qū)間為:
(X-1.96SE)≤T≤(X+1.96SE)
第84頁,課件共172頁,創(chuàng)作于2023年2月例題:在一次測驗(yàn)中有些學(xué)生得80分,如果再測一次他們的分?jǐn)?shù)將改變多少?已知該次測驗(yàn)的標(biāo)準(zhǔn)差為5,信度系數(shù)為0.84。第85頁,課件共172頁,創(chuàng)作于2023年2月注意:(1)SE對真分?jǐn)?shù)做的是區(qū)間估計(jì),不可能由此得到一個(gè)確切的點(diǎn)。(2)置信水平確定后,估計(jì)的精度主要取決于SE,SE越小,范圍越小,估計(jì)就越精確。(3)真分?jǐn)?shù)不能等同于真正能力或心理特質(zhì),當(dāng)系統(tǒng)誤差對施測分?jǐn)?shù)產(chǎn)生影響時(shí),用此方法估計(jì)出的真分?jǐn)?shù)并非代表被試的真正能力或特質(zhì),因此我們應(yīng)該選擇效度較高的量表,減小系統(tǒng)誤差。第86頁,課件共172頁,創(chuàng)作于2023年2月2、兩種測驗(yàn)分?jǐn)?shù)的比較為了說明個(gè)人在兩種測驗(yàn)上表現(xiàn)的優(yōu)劣,我們可用“差異的標(biāo)準(zhǔn)誤”來檢驗(yàn)其差異的顯著性,常用的公式如下:如果兩種分?jǐn)?shù)的差異達(dá)到或超過.05的顯著水平,始能認(rèn)為二者真有差異。第87頁,課件共172頁,創(chuàng)作于2023年2月例題:某被試在韋氏成人智力測驗(yàn)中言語智商為102,操作智商為108。已知兩個(gè)分?jǐn)?shù)都是以100為平均數(shù),15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語測驗(yàn)和操作測驗(yàn)的分半信度分別為0.97和0.93。問其操作智商是否顯著高于言語智商呢?第88頁,課件共172頁,創(chuàng)作于2023年2月四、標(biāo)準(zhǔn)參照測驗(yàn)的信度估計(jì)思考題:為什么以上介紹的估計(jì)信度的方法不適用于標(biāo)準(zhǔn)參照測驗(yàn)?第89頁,課件共172頁,創(chuàng)作于2023年2月1、對相關(guān)法信度系數(shù)進(jìn)行校正利文斯頓公式:第90頁,課件共172頁,創(chuàng)作于2023年2月2、用決策的一致性作為信度指標(biāo)林德曼與梅倫達(dá)的一致性公式:C為一致性,n為在兩次施測中均未達(dá)標(biāo)的人數(shù),b為在兩次施測中均已達(dá)標(biāo)的人數(shù),f為只在第一次施測中達(dá)標(biāo)的人數(shù),s為只在第二次施測中達(dá)標(biāo)的人數(shù),v為f或s中較小的值。第91頁,課件共172頁,創(chuàng)作于2023年2月五、影響信度的因素(一)被試的樣本當(dāng)一個(gè)測驗(yàn)用于比常模團(tuán)體更為同質(zhì)的團(tuán)體時(shí),要重新確定測量的信度:第92頁,課件共172頁,創(chuàng)作于2023年2月例題:一個(gè)測驗(yàn)應(yīng)用于全體小學(xué)生團(tuán)體的樣本(常模團(tuán)體),其分?jǐn)?shù)的標(biāo)準(zhǔn)差為10,信度系數(shù)為0.90,假如將此測驗(yàn)應(yīng)用于小學(xué)五年級,其分?jǐn)?shù)標(biāo)準(zhǔn)差為5。其信度系數(shù)應(yīng)為多少?第93頁,課件共172頁,創(chuàng)作于2023年2月(二)測驗(yàn)的長度測驗(yàn)的長度也是影響信度系數(shù)的一個(gè)因素。這是因?yàn)椋?、測驗(yàn)越長,測驗(yàn)的測題取樣或內(nèi)容取樣越有代表性,可以更好地反映被試的真實(shí)水平。2、測驗(yàn)的項(xiàng)目越多,在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以相互抵消。第94頁,課件共172頁,創(chuàng)作于2023年2月增加測驗(yàn)長度的效果可以用斯皮爾曼-布朗公式的通式來計(jì)算:第95頁,課件共172頁,創(chuàng)作于2023年2月例題1:假設(shè)有一個(gè)包括10個(gè)題目的測驗(yàn),信度為0.50,若把測驗(yàn)增加到50個(gè)題目,其信度將增加到多少?例題2:一個(gè)包含50個(gè)題目的測驗(yàn)信度是0.75,欲將信度提高到0.90,需要增加多少題目?第96頁,課件共172頁,創(chuàng)作于2023年2月注意:只有當(dāng)新題目與原題目選自同一總體,即與原題目具有同質(zhì)性時(shí),增長測驗(yàn)才能改進(jìn)信度。第97頁,課件共172頁,創(chuàng)作于2023年2月(三)測驗(yàn)的難度難度對信度的影響只存在于某些測驗(yàn)中,如智力測驗(yàn)、成就測驗(yàn)、能力傾向測驗(yàn)等。提問:從理論上講,測驗(yàn)處于什么難度時(shí),所得的信度系數(shù)最大?為什么?第98頁,課件共172頁,創(chuàng)作于2023年2月當(dāng)測驗(yàn)過難而且題目允許猜測時(shí),被試會對許多題目作隨機(jī)反應(yīng)——瞎猜,這樣我們就無法對其分?jǐn)?shù)置信。洛德提出了在學(xué)績測驗(yàn)中,為了保證其可靠性,各類選擇題的理想平均難度為:五選題:0.70四選題:0.74三選題:0.77是非題:0.85第99頁,課件共172頁,創(chuàng)作于2023年2月第三節(jié)測量的效度一、什么是效度二、效度和信度的關(guān)系三、效度的類型及評估方法四、標(biāo)準(zhǔn)參照測驗(yàn)的效度五、影響效度的因素六、對各種效度系數(shù)的要求第100頁,課件共172頁,創(chuàng)作于2023年2月一、什么是效度定義:效度指的是測量的有效性和正確性,即一個(gè)測驗(yàn)?zāi)軌驕y量出其所要測量的東西的程度。
效度和信度一樣,也是一個(gè)相對的概念。這種相對性表現(xiàn)在兩個(gè)方面:①效度是相對于一定的測量目的而言的。②效度只有程度上的差異。第101頁,課件共172頁,創(chuàng)作于2023年2月在測量學(xué)中,效度被定義為:在一組測量中,與測量目的有關(guān)的變異(或稱有效變異)與實(shí)得變異數(shù)(總變異)的比率。即:一個(gè)測驗(yàn)的效度表明:在一組測驗(yàn)分?jǐn)?shù)中,有多大比例的變異數(shù)是由測驗(yàn)所要測量的變因引起的。第102頁,課件共172頁,創(chuàng)作于2023年2月該定義有兩點(diǎn)要注意:1、和信度一樣,效度也是指的是一組測驗(yàn)分?jǐn)?shù)或一列測量的特性,而不是個(gè)人分?jǐn)?shù)的特性。2、由于有效變異是一個(gè)理論值,無法測量,所以效度和信度一樣是一個(gè)理論上構(gòu)想的概念,第103頁,課件共172頁,創(chuàng)作于2023年2月SV2SI2SE2SX2ST2
二、效度和信度的關(guān)系思考:效度受隨機(jī)誤差的影響還是受系統(tǒng)誤差的影響?第104頁,課件共172頁,創(chuàng)作于2023年2月(一)信度是效度的必要而非充分條件。(二)效度是受信度制約的。第105頁,課件共172頁,創(chuàng)作于2023年2月三、效度的類型及評估方法(一)內(nèi)容效度(二)構(gòu)想效度(三)效標(biāo)效度
第106頁,課件共172頁,創(chuàng)作于2023年2月(一)內(nèi)容效度1、定義:指項(xiàng)目對欲測的內(nèi)容或行為范圍取樣的適當(dāng)程度。第107頁,課件共172頁,創(chuàng)作于2023年2月一個(gè)測驗(yàn)要具備較好的內(nèi)容效度必須滿足的條件:(1)要確定好內(nèi)容范圍,并使測驗(yàn)的全部項(xiàng)目均在此范圍內(nèi)。(2)測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。代表性取樣,就是選出的項(xiàng)目能包含所測的內(nèi)容范圍的主要方面,并且使各部分項(xiàng)目所占比例適當(dāng)。第108頁,課件共172頁,創(chuàng)作于2023年2月2、內(nèi)容效度的評估方法(1)專家判斷法請有關(guān)專家對測驗(yàn)題目與原定內(nèi)容范圍的符合性做出判斷。這是一種定性分析的方法。第109頁,課件共172頁,創(chuàng)作于2023年2月步驟:①定義好內(nèi)容總體。②劃分細(xì)綱目,并根據(jù)重要性規(guī)定好各綱目的比例,對內(nèi)容范圍作盡可能詳盡的描述。③確定每個(gè)題目所測的內(nèi)容與技能,并與測驗(yàn)編制者所列的雙向細(xì)目表對照,逐題地將自己的分類與編制者的分類作比較。④制定評定量表,對測驗(yàn)作出總的評定。第110頁,課件共172頁,創(chuàng)作于2023年2月(2)復(fù)本法克倫巴赫認(rèn)為,內(nèi)容效度可由一組被試在取自同樣內(nèi)容范圍的兩個(gè)測驗(yàn)復(fù)本上得分的相關(guān)來作數(shù)量上的估計(jì)。(3)再測法先將測驗(yàn)施測于某個(gè)團(tuán)體,該團(tuán)體對測驗(yàn)所包括的內(nèi)容僅具有最少量的知識,因而得分很低。然后,讓這個(gè)團(tuán)體參與者有關(guān)材料的學(xué)習(xí)和訓(xùn)練,結(jié)束后將測驗(yàn)再測一次。第111頁,課件共172頁,創(chuàng)作于2023年2月(4)經(jīng)驗(yàn)法檢查不同年級的學(xué)生在測驗(yàn)上的得分和在每個(gè)題目上的反應(yīng)情況。測驗(yàn)總分和題目通過率隨著年級而增高,就是測驗(yàn)具有內(nèi)容效度的證據(jù)。第112頁,課件共172頁,創(chuàng)作于2023年2月3、內(nèi)容效度的局限思考:內(nèi)容效度的主要缺點(diǎn)是什么?內(nèi)容效度缺乏可靠的數(shù)量指標(biāo),因而妨礙了各測驗(yàn)間的相互比較。第113頁,課件共172頁,創(chuàng)作于2023年2月4、內(nèi)容效度的應(yīng)用(1)是編制任何測驗(yàn)應(yīng)加以考慮的基本方面。(2)對標(biāo)準(zhǔn)參照測驗(yàn)更為重要。(3)內(nèi)容效度也適用于某些對員工選拔和分類的職業(yè)測驗(yàn)。(4)內(nèi)容效度對于能力傾向測驗(yàn)和人格測驗(yàn)一般是不適用的。第114頁,課件共172頁,創(chuàng)作于2023年2月(5)在實(shí)際應(yīng)用中,注意內(nèi)容效度容易和表面效度混淆。表面效度就是外行人從表面看這個(gè)測驗(yàn)是否有效。表面效度不是效度的客觀指標(biāo),它雖然不能保證測量的正確性,但能對被試的動(dòng)機(jī)產(chǎn)生影響,因而也會影響到效度。第115頁,課件共172頁,創(chuàng)作于2023年2月(二)構(gòu)想效度1、定義構(gòu)想——心理學(xué)理論所涉及的抽象而屬假設(shè)性的概念或特質(zhì),它們往往用某種操作來定義并用測驗(yàn)來測量。構(gòu)想效度——測驗(yàn)對某一理論或特質(zhì)測量的程度,也叫結(jié)構(gòu)效度或構(gòu)思效度。第116頁,課件共172頁,創(chuàng)作于2023年2月2、確定構(gòu)想效度的基本步驟(1)從某一理論出發(fā),提出關(guān)于某一心理特質(zhì)的假設(shè)。(2)根據(jù)假設(shè)設(shè)計(jì)和編制測驗(yàn)并進(jìn)行施測。(3)對測驗(yàn)的結(jié)果采用相關(guān)或因素分析等方法進(jìn)行分析,驗(yàn)證與理論假設(shè)的相符程度。注意:構(gòu)想效度是由累積的證據(jù)來評價(jià)的,因而不可能有單一的效度指標(biāo)。第117頁,課件共172頁,創(chuàng)作于2023年2月
3、確定構(gòu)想效度的方法
有關(guān)構(gòu)想效度的資料可以用很多方法從不同來源去搜集,歸納起來有以下幾種:測驗(yàn)內(nèi)法測驗(yàn)間法效標(biāo)關(guān)聯(lián)法實(shí)驗(yàn)操作法第118頁,課件共172頁,創(chuàng)作于2023年2月(1)測驗(yàn)內(nèi)法這類方法主要是研究測驗(yàn)內(nèi)部構(gòu)造,如測驗(yàn)內(nèi)容、對題目作反應(yīng)的過程、以及測驗(yàn)的同質(zhì)性等等來分析測驗(yàn)的構(gòu)想效度。第119頁,課件共172頁,創(chuàng)作于2023年2月①確定測驗(yàn)的內(nèi)容效度測驗(yàn)的內(nèi)容效度有時(shí)可以作為測驗(yàn)的構(gòu)想效度的證據(jù)。對測驗(yàn)所取樣的內(nèi)容或行為范圍確定后,就可利用這些資料來定義測驗(yàn)所要測的構(gòu)想的性質(zhì)。第120頁,課件共172頁,創(chuàng)作于2023年2月②分析被試對題目做反應(yīng)的過程通過觀察被試的操作,詢問他如何處理題目,以及必要的統(tǒng)計(jì)分析,可發(fā)現(xiàn)哪些變量影響了反應(yīng),因而可確定測驗(yàn)是否測量了所要測的特質(zhì)。第121頁,課件共172頁,創(chuàng)作于2023年2月③考察測驗(yàn)的同質(zhì)性這種方法是以測驗(yàn)的內(nèi)在一致性系數(shù)(如K-R20,K-R21,以及系數(shù)等)為指標(biāo),判斷測驗(yàn)測的是單一特質(zhì)還是多種特質(zhì),從而確定測驗(yàn)構(gòu)想效度的高低。從測驗(yàn)的一致性可以為構(gòu)想效度提供證據(jù)。第122頁,課件共172頁,創(chuàng)作于2023年2月(2)測驗(yàn)間法通過研究幾個(gè)測驗(yàn)間的相互關(guān)系,找出它們的共同特點(diǎn),進(jìn)而推斷出所測的共同特質(zhì)是什么,便可確定這些測驗(yàn)是否有構(gòu)想效度。第123頁,課件共172頁,創(chuàng)作于2023年2月①相容效度計(jì)算被試在新測驗(yàn)上的分?jǐn)?shù)與另一個(gè)效度已知的同類測驗(yàn)上的分?jǐn)?shù)之間的相關(guān)。假如相關(guān)高,說明這兩個(gè)測驗(yàn)測的是相同特質(zhì)。由于相關(guān)系數(shù)的平方代表兩組測驗(yàn)分?jǐn)?shù)所共有的變異數(shù)比例,所以這種方法所確定的效度稱為相容效度。第124頁,課件共172頁,創(chuàng)作于2023年2月②區(qū)分效度一個(gè)有效的測驗(yàn)不僅應(yīng)與其他測量同一構(gòu)想的測驗(yàn)有較高的相關(guān),而且還應(yīng)與測量不同構(gòu)想的測驗(yàn)具有低相關(guān)。用這種方法確定的效度叫做區(qū)分效度。第125頁,課件共172頁,創(chuàng)作于2023年2月③因素效度通過對一組測驗(yàn)進(jìn)行因素分析,可以找到影響測驗(yàn)分?jǐn)?shù)的共同因素。每個(gè)測驗(yàn)與各因素的相關(guān),稱做是測驗(yàn)的因素效度。而在測驗(yàn)分?jǐn)?shù)的總變異數(shù)中來自有關(guān)因素的比例,便可作為構(gòu)想效度的指標(biāo)。第126頁,課件共172頁,創(chuàng)作于2023年2月(3)效標(biāo)關(guān)聯(lián)法通過考察一個(gè)測驗(yàn)的效標(biāo)效度來了解該測驗(yàn)的構(gòu)想效度。第127頁,課件共172頁,創(chuàng)作于2023年2月第一種方法:我們可以根據(jù)效標(biāo)選取不同的被試,組成對照組,然后比較兩組被試的測驗(yàn)成績,看測驗(yàn)分?jǐn)?shù)能否把他們區(qū)分開來,如果能把他們區(qū)分開來,就說明這個(gè)測驗(yàn)測量的是所要測的構(gòu)想。
第128頁,課件共172頁,創(chuàng)作于2023年2月第二種方法:我們可以根據(jù)測驗(yàn)分?jǐn)?shù)把被試分成高分組和低分組,然后比較兩組被試的行為特點(diǎn)。如果這些特征與定義的構(gòu)想相符,就說明該測驗(yàn)具有構(gòu)想效度。第129頁,課件共172頁,創(chuàng)作于2023年2月(4)實(shí)驗(yàn)操作法通過實(shí)驗(yàn)操作控制某些條件,觀察其對測驗(yàn)分?jǐn)?shù)的影響,也可以獲得構(gòu)想效度的信息。
如:我們假設(shè)將“考試焦慮”定義為“當(dāng)考試結(jié)果對個(gè)體有重大意義時(shí)的一種害怕失敗的緊張情緒”,這是一個(gè)構(gòu)想?,F(xiàn)在有一個(gè)焦慮測驗(yàn),我們想考察一下這個(gè)測驗(yàn)對測量考試焦慮是否有構(gòu)想效度,為此可以設(shè)計(jì)以下幾種實(shí)驗(yàn)情境:第130頁,課件共172頁,創(chuàng)作于2023年2月第一種:在一場決定前途命運(yùn)的重要考試之前施測焦慮測驗(yàn),將其分?jǐn)?shù)與平時(shí)接受焦慮測驗(yàn)的分?jǐn)?shù)比較。第二種:舉行兩種考試,使被試相信一場考試關(guān)系重大,一場考試無關(guān)緊要,然后將考試結(jié)果與焦慮測驗(yàn)分?jǐn)?shù)比較。第三種:搜集被試在經(jīng)歷一場重大考試時(shí)的生理心理參數(shù)(如脈搏、血壓等)作為焦慮的指標(biāo),將其與焦慮測驗(yàn)分?jǐn)?shù)比較。第131頁,課件共172頁,創(chuàng)作于2023年2月4、對構(gòu)想效度的評價(jià)(1)缺點(diǎn)①有些構(gòu)想概念模糊,沒有一致的定義。②確定效度時(shí)沒有明確的操作步驟和程序。③沒有單一的數(shù)量指標(biāo)來描述有效的程度。第132頁,課件共172頁,創(chuàng)作于2023年2月(2)優(yōu)點(diǎn)構(gòu)想效度促使研究者把著眼點(diǎn)放在提出假設(shè)上、檢驗(yàn)假設(shè)上,使得測驗(yàn)成為理論研究的重要工具,而不再只是實(shí)際決策的輔助工具,從而使測驗(yàn)有了更廣闊的發(fā)展情景。第133頁,課件共172頁,創(chuàng)作于2023年2月(三)效標(biāo)效度1、定義被預(yù)測的行為是衡量測驗(yàn)是否有效的參照標(biāo)準(zhǔn),就是效標(biāo)。效標(biāo)效度就是考查測驗(yàn)分?jǐn)?shù)(預(yù)測源)與效標(biāo)的關(guān)系,看測驗(yàn)對我們感興趣的行為預(yù)測得如何。因?yàn)樾?biāo)效度需要有實(shí)際證據(jù),所以又叫實(shí)證效度。第134頁,課件共172頁,創(chuàng)作于2023年2月2、分類①同時(shí)效度,即測驗(yàn)分?jǐn)?shù)與效標(biāo)資料同時(shí)獲得。這種效度通常與心理特征的評估及診斷有關(guān)。②預(yù)測效度,效標(biāo)資料需過一段時(shí)間才可以搜集到。這種效度對人員的選拔和安置工作非常重要?!澳橙顺晒α藛幔俊?/p>
“某人得精神病了嗎?”
“某人會成功嗎?”
“某人會得精神病嗎?”
第135頁,課件共172頁,創(chuàng)作于2023年2月3、效標(biāo)和效標(biāo)測量(1)效標(biāo)——衡量測驗(yàn)有效性的參照標(biāo)準(zhǔn),指的是可以直接而且獨(dú)立測量的我們感興趣的行為,就是要預(yù)測的行為。第136頁,課件共172頁,創(chuàng)作于2023年2月(2)常用的效標(biāo)①學(xué)業(yè)成就②等級評定③臨床診斷④特殊訓(xùn)練的成績⑤實(shí)際工作表現(xiàn)⑥對團(tuán)體的區(qū)分第137頁,課件共172頁,創(chuàng)作于2023年2月(3)效標(biāo)測量效標(biāo)可以分為兩個(gè)層次:其一是理論水平的觀念效標(biāo);其二是操作定義水平的效標(biāo)測量。觀念效標(biāo)是一個(gè)概念,效標(biāo)測量是對觀念效標(biāo)的數(shù)量化。第138頁,課件共172頁,創(chuàng)作于2023年2月效標(biāo)測量必須具備以下幾個(gè)條件:①有效性效標(biāo)測量必須要能真正反映觀念效標(biāo),即效標(biāo)測量本身必須有效。②可靠性效標(biāo)測量還必須穩(wěn)定可靠,也就是具有較高的信度。第139頁,課件共172頁,創(chuàng)作于2023年2月③客觀性當(dāng)效標(biāo)測量是主觀評定時(shí),可能受到評定者主觀印象和成見的影響而引起偏差。因此,采用判斷性的效標(biāo)測量,必須控制偏見,盡量使評定過程客觀。效標(biāo)污染,是指個(gè)人的效標(biāo)成績由于評定者知道其測驗(yàn)分?jǐn)?shù)而受到影響的情況。④實(shí)用性在保證有效性的前提下,最佳的效標(biāo)測量應(yīng)該是用法簡單、省時(shí)、花費(fèi)少,也就是經(jīng)濟(jì)實(shí)用。第140頁,課件共172頁,創(chuàng)作于2023年2月4、效標(biāo)效度的估計(jì)方法效標(biāo)效度是通過考察測驗(yàn)分?jǐn)?shù)與效標(biāo)的經(jīng)驗(yàn)關(guān)系確定的,一般都可以通過統(tǒng)計(jì)分析得到一個(gè)數(shù)量指標(biāo),因此有人又叫它統(tǒng)計(jì)效度。具體有以下幾種估計(jì)方法:(1)相關(guān)法(2)分組法(3)預(yù)期表法(4)命中率法(5)功利率法第141頁,課件共172頁,創(chuàng)作于2023年2月(1)相關(guān)法確定效標(biāo)效度最常用的方法是計(jì)算測驗(yàn)分?jǐn)?shù)與效標(biāo)測量的相關(guān),所得到的數(shù)量指標(biāo)叫做效度系數(shù)。
第142頁,課件共172頁,創(chuàng)作于2023年2月①積差相關(guān)當(dāng)測驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)都是正態(tài)連續(xù)變量,且兩種存在線性相關(guān)時(shí)。第143頁,課件共172頁,創(chuàng)作于2023年2月
被試1
2
34
5
6
7
8
9
10測驗(yàn)分?jǐn)?shù)X銷售數(shù)Y30
34
3247
20
24
27
25
22
162.53.8
3
4
0.7
1
2.2
3.5
2.8
1.2例題:假如有10名男性經(jīng)職業(yè)興趣測驗(yàn)而被選定作為推銷員,其測驗(yàn)分?jǐn)?shù)見下表,而第二行是經(jīng)過若干年后他們某段時(shí)間內(nèi)銷售金額總量(以萬元為單位)。試求該測驗(yàn)的預(yù)測效度。第144頁,課件共172頁,創(chuàng)作于2023年2月②二列相關(guān)當(dāng)測驗(yàn)分?jǐn)?shù)和效標(biāo)的總體分布均為正態(tài),測驗(yàn)分?jǐn)?shù)為連續(xù)變量,效標(biāo)測量被人為地分成兩類。第145頁,課件共172頁,創(chuàng)作于2023年2月例題:352名被試參加一項(xiàng)智力測驗(yàn),其中重點(diǎn)中學(xué)學(xué)生66名,IQ平均數(shù)為114;一般中學(xué)學(xué)生286名,IQ平均數(shù)為96。全體被試的IQ標(biāo)準(zhǔn)差為14.53。試求該智力測驗(yàn)的效標(biāo)效度。第146頁,課件共172頁,創(chuàng)作于2023年2月③點(diǎn)二列相關(guān)測驗(yàn)分?jǐn)?shù)是正態(tài)變量,且是連續(xù)變量,效標(biāo)測量是二分名義變量(以是否達(dá)到某一標(biāo)準(zhǔn)表示)。第147頁,課件共172頁,創(chuàng)作于2023年2月④多系列相關(guān)多系列相關(guān)適用的情況是,測驗(yàn)分?jǐn)?shù)和效標(biāo)的總體分布均為正態(tài),測驗(yàn)分?jǐn)?shù)為連續(xù)變量,效標(biāo)測量被人為地分成多種類別。若效標(biāo)測量被分成三類,就稱為三列相關(guān),若被人為地分成四類,就稱為四列相關(guān)。第148頁,課件共172頁,創(chuàng)作于2023年2月例:對某班學(xué)生進(jìn)行學(xué)習(xí)能力測驗(yàn),并讓班主任對學(xué)生進(jìn)行成績評定,以此為學(xué)習(xí)能力測驗(yàn)的效標(biāo)。學(xué)習(xí)能力測驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)差為10分,教師評定情況如下,D等20人,C等30人,B等30人,A等20人。其中D等學(xué)生的學(xué)習(xí)能力測驗(yàn)平均分?jǐn)?shù)為30分,C等學(xué)生的學(xué)習(xí)能力測驗(yàn)平均分?jǐn)?shù)為45分,B等學(xué)生的學(xué)習(xí)能力測驗(yàn)平均分?jǐn)?shù)為55分,A等學(xué)生的學(xué)習(xí)能力測驗(yàn)平均分?jǐn)?shù)為70分。試分析該能力測驗(yàn)的效度。第149頁,課件共172頁,創(chuàng)作于2023年2月求這類相關(guān)可用賈斯朋(jaspen)多系列相關(guān)公式計(jì)算:Pi為效標(biāo)屬于不同等級的人數(shù)占總?cè)藬?shù)的百分比,Xi為與不同等級對應(yīng)的測驗(yàn)分?jǐn)?shù)的平均數(shù),St為測驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,yi為效標(biāo)的每一個(gè)等級所對應(yīng)的下限的正態(tài)曲線的高度,yk為上限所對應(yīng)的正態(tài)曲線的高度。第150頁,課件共172頁,創(chuàng)作于2023年2月相關(guān)法的優(yōu)點(diǎn):①提供了一個(gè)統(tǒng)計(jì)指標(biāo)以總結(jié)預(yù)測源和效標(biāo)間的關(guān)系;②可利用回歸方程來預(yù)測每個(gè)人的效標(biāo)分?jǐn)?shù)。缺點(diǎn):①假如預(yù)測源和效標(biāo)的關(guān)系不是直線性的,則必須采用特殊的相關(guān)方法;②測驗(yàn)結(jié)果不能提供有關(guān)取舍正確性的指標(biāo)。第151頁,課件共172頁,創(chuàng)作于2023年2月(2)分組法是檢驗(yàn)測驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)測量所定義的團(tuán)體。和為成功組與不成功組的平均測驗(yàn)分?jǐn)?shù);Ss和Su為兩組測驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)差;Ns和Nu為兩組的人數(shù)。第152頁,課件共172頁,創(chuàng)作于2023年2月注意:組間平均數(shù)差異在統(tǒng)計(jì)上的顯著性取決于團(tuán)體的大小。為避免這一缺點(diǎn),還要計(jì)算這兩個(gè)分布的重疊量。重疊量可用兩個(gè)指標(biāo)來表示:①每一組內(nèi)得分超過或低于另一組平均數(shù)的人次百分比;②兩組分?jǐn)?shù)分布共同區(qū)的百分比。重疊量越大,說明兩組差異越小。第153頁,課件共172頁,創(chuàng)作于2023年2月(3)預(yù)期表法預(yù)期表法是將測驗(yàn)源分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)制成雙維圖,并將每個(gè)變量按水平分成若干個(gè)檔次,然后列出每個(gè)檔次上的人數(shù)百分比。第154頁,課件共172頁,創(chuàng)作于2023年2月(4)命中率法是當(dāng)測驗(yàn)用來做取舍的依據(jù)時(shí),其有效性的指標(biāo)就是正確決定的比例。第155頁,課件共172頁,創(chuàng)作于2023年2月
失敗(-)
成功(+)
成功(+)A(失誤)B(命中)
失?。?)C(命中)D(失誤)效
標(biāo)
成
績
測 驗(yàn)
預(yù)
測
命中表命中率的計(jì)算有兩種方法:一是計(jì)算總命中率,另一種是計(jì)算正命中率:第156頁,課件共172頁,創(chuàng)作于2023年2月例:假設(shè)用某種測驗(yàn)選拔員工100人,經(jīng)過一段時(shí)間的工作檢驗(yàn),得到以下四組數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 年會活動(dòng)總結(jié)范文15篇
- 志愿者服務(wù)心得體會(15篇)
- 法治社會+學(xué)案 高中政治統(tǒng)編版必修三政治與法治
- 初級會計(jì)實(shí)務(wù)-《初級會計(jì)實(shí)務(wù)》預(yù)測試卷263
- 初級會計(jì)經(jīng)濟(jì)法基礎(chǔ)-初級會計(jì)《經(jīng)濟(jì)法基礎(chǔ)》??荚嚲?10
- 二氧化硅殼層微膠囊的制備及其復(fù)合材料自潤滑性能研究
- 二零二五年度個(gè)人離婚子女撫養(yǎng)權(quán)協(xié)議范本4篇
- 二零二五年度健康產(chǎn)業(yè)養(yǎng)生顧問勞動(dòng)合同2篇
- 二零二五年度凈水設(shè)備售后技術(shù)支持與用戶滿意度提升協(xié)議3篇
- 軟件行業(yè)美工工作總結(jié)
- 2024年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招數(shù)學(xué)歷年參考題庫含答案解析
- 上海鐵路局招聘筆試沖刺題2025
- 國旗班指揮刀訓(xùn)練動(dòng)作要領(lǐng)
- 植物芳香油的提取 植物有效成分的提取教學(xué)課件
- 肖像繪畫市場發(fā)展現(xiàn)狀調(diào)查及供需格局分析預(yù)測報(bào)告
- 2021-2022學(xué)年遼寧省重點(diǎn)高中協(xié)作校高一上學(xué)期期末語文試題
- 同等學(xué)力英語申碩考試詞匯(第六版大綱)電子版
- 墓地個(gè)人協(xié)議合同模板
- 2023年北京自然博物館招考聘用筆試參考題庫附答案詳解
- 土方轉(zhuǎn)運(yùn)方案
- (11.3.1)-10.3蒸汽壓縮制冷循環(huán)
評論
0/150
提交評論