版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
測(cè)量的信度信度(reliability):測(cè)量結(jié)果的穩(wěn)定性程度。定義1:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)得變異數(shù)的比率定義2:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)相關(guān)系數(shù)的平方定義3:一個(gè)測(cè)驗(yàn)與任一個(gè)平行測(cè)驗(yàn)的相關(guān)系數(shù)信度的作用1、評(píng)價(jià)測(cè)驗(yàn)的好壞,反映隨機(jī)誤差的大小。注:系統(tǒng)誤差與信度無(wú)關(guān)。2、解釋個(gè)人測(cè)驗(yàn)的分?jǐn)?shù),X–1.96SE≤T≤X+1.96SE,標(biāo)準(zhǔn)誤SE=,Sx:所得分?jǐn)?shù)標(biāo)準(zhǔn)差,rxx:測(cè)驗(yàn)信度。3、比較兩種測(cè)驗(yàn),差異的標(biāo)準(zhǔn)誤SEd=S:相同尺度標(biāo)準(zhǔn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx,rYY:兩個(gè)測(cè)驗(yàn)的信度。信度系數(shù)的估計(jì)重測(cè)信度:同一個(gè)測(cè)驗(yàn)對(duì)同一組被試施測(cè)兩次,兩次測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)。前提:測(cè)量的心理特質(zhì)必須穩(wěn)定,遺忘與練習(xí)效果基本抵消,兩次施測(cè)間隔期間被試沒(méi)有更多的學(xué)習(xí)或訓(xùn)練。優(yōu)缺點(diǎn):能提供測(cè)驗(yàn)結(jié)果是否隨時(shí)間變化,預(yù)測(cè)被試將來(lái)行為的依據(jù)。容易受練習(xí)、記憶的影響。副本信度:同一組被試在兩個(gè)平行測(cè)驗(yàn)上得分的相關(guān)系數(shù)。同時(shí)施測(cè):等值性系數(shù)前后施測(cè):穩(wěn)定性與等值性系數(shù)前提:兩份測(cè)驗(yàn)在題目?jī)?nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語(yǔ)、完成時(shí)間等相似。在時(shí)間、成本上要有條件做兩個(gè)測(cè)驗(yàn)。優(yōu)缺點(diǎn):只能減少而不能完全排除練習(xí)、記憶的影響。平行測(cè)驗(yàn)難找。分半信度:將一個(gè)測(cè)驗(yàn)分成相等的兩半,被試在這兩半測(cè)驗(yàn)得分的相關(guān)系數(shù)。計(jì)算時(shí)注意校正:兩半方差同質(zhì):斯皮爾曼-布朗公式:r=2rhh/(1+rhh),rhh:兩半分?jǐn)?shù)間的相關(guān)系數(shù)。兩半方差不同質(zhì):弗朗那根(Flanagan)公式:盧侖(Rulon)公式:Sa2、Sb2:兩半測(cè)驗(yàn)的方差,Sd2:兩測(cè)驗(yàn)分?jǐn)?shù)差的方差前提:一次施測(cè),沒(méi)有副本,測(cè)驗(yàn)可分成兩半。特點(diǎn):同一測(cè)驗(yàn)可以有多個(gè)分半信度值。同質(zhì)性信度:測(cè)驗(yàn)內(nèi)部所有題目的一致性程度。評(píng)分者信度:多個(gè)評(píng)分者給同一批被試評(píng)分的一致性程度。肯德?tīng)柡椭C系數(shù)信度的影響因素被試越異質(zhì),信度越高rn=ro:原被試信度,So2:原被試方差,Sn2:新被試方差
信度的影響因素條目數(shù)適當(dāng)增加,信度提高rkk=K:測(cè)驗(yàn)改變后長(zhǎng)度與原長(zhǎng)度之比,rxx:原測(cè)驗(yàn)信度,rkk:新測(cè)驗(yàn)信度團(tuán)體平均水平太高或太低,信度降低主試不按規(guī)定施測(cè),評(píng)分標(biāo)準(zhǔn)不一,信度降低測(cè)試情境測(cè)驗(yàn)條目越多,信度越高,時(shí)間過(guò)長(zhǎng),信度降低,難度過(guò)大或過(guò)易,信度降低兩次測(cè)驗(yàn)間隔時(shí)間越短,信度越高信度改進(jìn)適當(dāng)增加測(cè)驗(yàn)長(zhǎng)度難度接近正態(tài)分布,控制在中等水平提高項(xiàng)目區(qū)分度選取恰當(dāng)?shù)谋辉噲F(tuán)體主試、評(píng)分者、場(chǎng)地歷年真題(華東師大2002)某測(cè)驗(yàn)的被試為2—5年級(jí)的小學(xué)生,已知信度是0.85,標(biāo)準(zhǔn)差為10,現(xiàn)欲知道僅用于4年級(jí)時(shí)信度是多少,4年級(jí)的標(biāo)準(zhǔn)差是5。歷年真題(華南師大2001)已知某量表的分半信度為0.63,請(qǐng)算出原長(zhǎng)度的信度系數(shù)。 解:rkk==1.26/1.63=0.77歷年真題將測(cè)驗(yàn)對(duì)等分半后,兩半測(cè)驗(yàn)得分的相關(guān)系數(shù)為0.60,校正后該測(cè)驗(yàn)的分半信度是(B)(2007,全國(guó)統(tǒng)考) A.0.70B.0.75C.0.80D.0.85什么是測(cè)驗(yàn)的信度?影響信度的主要因素有哪些?(2007,全國(guó)統(tǒng)考) 答:(1)信度是測(cè)量結(jié)果的穩(wěn)定性或一致性程度。 (2)影響因素:被試、主試、施測(cè)情境、測(cè)量工具、施測(cè)時(shí)間間隔、評(píng)分計(jì)分測(cè)量的信度與效度本章提要:信度的概念與估計(jì)方法提高信度的方法效度及其與信度的關(guān)系效度的種類與估計(jì)方法提高效度的方法第一節(jié)測(cè)量信度一、什么是信度1.信度的描述定義信度(reliability)是指測(cè)量結(jié)果的穩(wěn)定性和可靠性程度。2.信度的測(cè)量學(xué)定義(操作性定義)3.誤差方差與信度的關(guān)系二、信度的估計(jì)方法(一)重測(cè)信度(test-retestreliability)1.含義與計(jì)算重測(cè)信度是指用同一量表對(duì)同一組被試測(cè)試兩次所得結(jié)果的一致程度,其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的積差相關(guān)系數(shù)。即:2.重測(cè)信度使用的條件(1)所測(cè)量的心理特質(zhì)必須是穩(wěn)定的(2)遺忘和練習(xí)的效果基本上相互抵消(3)在兩次測(cè)試時(shí)間間隔內(nèi),被試在所要測(cè)查的心理特質(zhì)方面沒(méi)有其他的學(xué)習(xí)和練習(xí)3.計(jì)算重測(cè)信度應(yīng)注意的問(wèn)題(1)兩次測(cè)驗(yàn)時(shí)間間隔要適當(dāng)(2)應(yīng)提高被試的積極性(3)適宜于人格測(cè)驗(yàn)與速度測(cè)驗(yàn),不適合于智力等難度測(cè)驗(yàn)(二)復(fù)本信度(Alternate-formreliability)1.含義與計(jì)算是指兩個(gè)平行測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致程度,其大小等于同一組被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的積差相關(guān)系數(shù)。計(jì)算公式同重測(cè)信度。兩個(gè)復(fù)本測(cè)驗(yàn)實(shí)施的時(shí)間不同,復(fù)本信度所表達(dá)的含義略有不同。(1)等值性系數(shù)如果兩個(gè)復(fù)本測(cè)驗(yàn)是同時(shí)連續(xù)測(cè)試的,則稱這種復(fù)本信度為等值性系數(shù)。等值性系數(shù)的大小主要反映著兩個(gè)復(fù)本測(cè)驗(yàn)的題目差別帶來(lái)的變異情況。(2)穩(wěn)定性與等值性系數(shù)如果兩個(gè)復(fù)本測(cè)驗(yàn)是相距一段時(shí)間分兩次測(cè)試,則稱這種復(fù)本信度為穩(wěn)定性與等值性系數(shù)。此時(shí)兩個(gè)題目間的差別、兩次施測(cè)情境、被試特質(zhì)水平等方面的差別都會(huì)成為測(cè)驗(yàn)結(jié)果不一致的原因。2.復(fù)本信度使用的條件(1)兩個(gè)測(cè)驗(yàn)必須在項(xiàng)目的內(nèi)容、形式、數(shù)量、難易、時(shí)限、指導(dǎo)語(yǔ)等方面相同或相似。(2)兩次測(cè)驗(yàn)的時(shí)間間隔要適當(dāng)。局限:(1)復(fù)本法只能減少而不能排除練習(xí)和記憶效應(yīng)。(2)對(duì)于許多測(cè)驗(yàn)來(lái)說(shuō)要建立復(fù)本是非常困難的。(三)分半信度(Split-halfreliability)1.含義與計(jì)算是指將一個(gè)測(cè)驗(yàn)分成對(duì)等的兩半后,所有被試在這兩半上得分的一致性。分半信度信度與等值性系數(shù)的解釋一樣,即可以把對(duì)等的兩半測(cè)驗(yàn)看成是最短時(shí)距內(nèi)施測(cè)的兩個(gè)平行測(cè)驗(yàn)。分半信度描述的是兩半題目間的一致性,所以也叫內(nèi)部一致性系數(shù)。注意題目分半的方法:按題號(hào)奇偶性分半、按題目難度分半、按題目?jī)?nèi)容分半等。計(jì)算方法與復(fù)本信度類似,但被試在兩半測(cè)驗(yàn)上得分的相關(guān)系數(shù)只是半個(gè)測(cè)驗(yàn)的信度,所以必須用斯皮爾曼—布朗公式加以校正:2.使用的前提條件和范圍分半信度通常是在只能施測(cè)一次或沒(méi)有復(fù)本的情況下使用。其中使用斯皮爾曼—布朗公式時(shí)要求全體被試在兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等。當(dāng)測(cè)驗(yàn)無(wú)法分成對(duì)等的兩半時(shí),無(wú)法使用。(四)同質(zhì)性信度(Homogeneityreliability)1.含義同質(zhì)性信度也叫內(nèi)部一致性系數(shù),它是測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度。這里的一致性有兩種含義:一是所有題目都測(cè)的是同一種心理特質(zhì),二是所有題目得分之間都具有較高的正相關(guān)。同質(zhì)性信度就是一個(gè)測(cè)驗(yàn)所測(cè)內(nèi)容或特質(zhì)的相同程度。實(shí)際上α系數(shù)是所有可能分半信度的平均值,但它是測(cè)驗(yàn)信度的一個(gè)下界值,即α系數(shù)值大,測(cè)量信度必然高,但α系數(shù)值小,卻不能判斷測(cè)量信度不高。例題:某態(tài)度量表共7道題目,100個(gè)被試在各題上得分的方差分別是0.81,0.82,0.80,0.86,0.88,0.79,0.89,測(cè)驗(yàn)總分的方差是26.00,計(jì)算該測(cè)量的信度。(五)評(píng)分者信度(Scorerreliability)1.含義與計(jì)算評(píng)分者信度指的是多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度。對(duì)于主觀試題,不同的評(píng)分者給出的分?jǐn)?shù)是不等的,這樣會(huì)造成誤差,如何降低評(píng)分者信度是心理測(cè)量的重要任務(wù)之一。當(dāng)評(píng)分者人數(shù)為2時(shí),評(píng)分者信度等于兩個(gè)評(píng)分者給同一批被試答卷所給分?jǐn)?shù)的相關(guān)系數(shù)。如果是多個(gè)評(píng)分者,評(píng)分者信度采用肯德?tīng)柡椭C系數(shù)進(jìn)行估計(jì)。三、信度的作用(一)評(píng)價(jià)測(cè)驗(yàn)信度是測(cè)量過(guò)程中所存在的隨機(jī)誤差大小的反映。信度低,測(cè)量隨機(jī)誤差大,測(cè)量結(jié)果就會(huì)與真分?jǐn)?shù)發(fā)生較大偏離。信度是衡量一個(gè)測(cè)驗(yàn)好壞的重要指標(biāo)之一,測(cè)驗(yàn)的信度達(dá)到多少才可以接受呢?一般來(lái)講,能力與成就測(cè)驗(yàn)的信度應(yīng)該在0.90以上,人格測(cè)量信度系數(shù)應(yīng)該在0.80以上。測(cè)量中的系統(tǒng)誤差與信度無(wú)關(guān)。(二)解釋分?jǐn)?shù)1.解釋個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的意義從理論上講,一個(gè)人的真分?jǐn)?shù)本來(lái)是用同一測(cè)驗(yàn)對(duì)他反復(fù)施測(cè)所得的平均值,其誤差則是這些實(shí)測(cè)值的標(biāo)準(zhǔn)差。但實(shí)際上,這是做不到的。實(shí)際的做法是用一個(gè)團(tuán)體(人數(shù)足夠多)兩次施測(cè)得結(jié)果來(lái)代替對(duì)同一個(gè)人的反復(fù)施測(cè),以估計(jì)測(cè)量誤差的變異數(shù)。此時(shí)每個(gè)人兩次測(cè)量的分?jǐn)?shù)之差構(gòu)成一個(gè)新的分布,這個(gè)分布的標(biāo)準(zhǔn)差就是測(cè)量的標(biāo)準(zhǔn)誤,它是此次測(cè)量中誤差大小的客觀指標(biāo),有了這一指標(biāo),就可以對(duì)團(tuán)體中任何一個(gè)人的測(cè)驗(yàn)成績(jī)做出恰當(dāng)?shù)慕忉尅?.不同測(cè)驗(yàn)分?jǐn)?shù)的比較四、影響測(cè)量信度的主要因素測(cè)量信度是測(cè)量過(guò)程中隨機(jī)誤差大小的反映,隨機(jī)誤差大,信度就低,隨機(jī)誤差小,信度就高。因此,在測(cè)量過(guò)程中凡是能引起測(cè)量隨機(jī)誤差的因素都會(huì)影響測(cè)量信度。影響信度的幾種主要因素為:(一)被試方面就單個(gè)被試而言,其身心健康狀況、應(yīng)試動(dòng)機(jī)、注意水平、作答態(tài)度等會(huì)影響測(cè)量信度。就團(tuán)體而言,團(tuán)體的異質(zhì)程度與分?jǐn)?shù)的分布密切相關(guān),一個(gè)團(tuán)體越是異質(zhì),其分?jǐn)?shù)分布范圍越大,計(jì)算出來(lái)的信度系數(shù)值越高,這樣會(huì)高估真正的信度值。當(dāng)團(tuán)體內(nèi)部水平相差不大(同質(zhì))時(shí),其得分分布必然會(huì)狹窄,以相關(guān)為基礎(chǔ)計(jì)算出來(lái)的信度值必然小,可能會(huì)低估真正的信度值。此外若團(tuán)體的平均數(shù)太高或太低,同樣使測(cè)驗(yàn)的總分分布變窄,低估測(cè)驗(yàn)的真正信度。(二)主試者方面就主試者而言,若不按指導(dǎo)手冊(cè)中的規(guī)定施測(cè),或故意制造緊張氣氛,或給考生一定的暗示、協(xié)助等,測(cè)量信度會(huì)大大降低。就閱卷評(píng)分者而言,若評(píng)分標(biāo)準(zhǔn)掌握不一,或前后標(biāo)準(zhǔn)不統(tǒng)一,甚至隨心所欲,則也會(huì)降低測(cè)量信度。(三)施測(cè)情境方面實(shí)施測(cè)驗(yàn)時(shí),環(huán)境是否安靜,光線和通風(fēng)狀況是否良好,所需設(shè)備是否齊全,桌面是否合乎要求等都可能影響到測(cè)量信度。(四)測(cè)量工具方面測(cè)量的取樣、測(cè)驗(yàn)的長(zhǎng)度、難度等是影響測(cè)量信度的主要因素或關(guān)鍵因素。一般來(lái)說(shuō),測(cè)驗(yàn)越長(zhǎng),信度值越高。這是因?yàn)椋簻y(cè)驗(yàn)加長(zhǎng),能夠改進(jìn)項(xiàng)目取樣的代表性,從而能夠更好地反映受測(cè)者的真實(shí)水平。測(cè)驗(yàn)的項(xiàng)目越多,每個(gè)項(xiàng)目上得隨機(jī)誤差會(huì)相互抵消。測(cè)驗(yàn)太難或太容易,都會(huì)降低測(cè)驗(yàn)的信度。(五)兩次施測(cè)之間的時(shí)間間隔計(jì)算重測(cè)信度、穩(wěn)定性與等值性系數(shù)時(shí),兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度值可能會(huì)越大;兩次測(cè)驗(yàn)相隔時(shí)間越長(zhǎng),其信度值可能會(huì)越小。五、提高測(cè)量信度的常用方法(一)適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度增加新項(xiàng)目必須與原試卷中的所有項(xiàng)目同質(zhì),新增項(xiàng)目必須適度。(二)使測(cè)驗(yàn)中題目的難度接近正態(tài)分布,并控制在中等難度(三)努力提高測(cè)驗(yàn)試題的區(qū)分度(四)選取適當(dāng)?shù)谋辉噲F(tuán)體(五)主試者嚴(yán)格按照要求去做同學(xué)好!仔細(xì)思考這些問(wèn)題幫助我們更好理解本次課的內(nèi)容。為什么我們對(duì)特殊兒童測(cè)量的結(jié)果有差異?為什么我們不能每次對(duì)特殊兒童測(cè)量精確?為什么我們用不同的量表就有不同的結(jié)果?為什么有時(shí)間測(cè)量的結(jié)果與實(shí)際情況不符?為什么我們需要規(guī)定所有測(cè)驗(yàn)的都標(biāo)準(zhǔn)化?為什么我們規(guī)定給定測(cè)量結(jié)果一個(gè)區(qū)間值?誤差是由測(cè)量中與目的無(wú)關(guān)的因素引起的不準(zhǔn)確或不一致的效應(yīng)。由于各種原因,使我們對(duì)特殊兒童進(jìn)行測(cè)量時(shí)產(chǎn)生了測(cè)量誤差,使我們不能準(zhǔn)確地、穩(wěn)定地、全面地反映該特殊的本質(zhì)心理特征。
這種情況是無(wú)法完全避免的,只能采用數(shù)學(xué)的方法把它消去。
這種無(wú)法去除的東西,我們稱之為“誤差”。測(cè)驗(yàn)中隨機(jī)誤差、系統(tǒng)誤差、過(guò)失誤差總是錯(cuò)綜復(fù)雜地存在著,因而造成了測(cè)驗(yàn)數(shù)據(jù)的波動(dòng)性或變異性,使我們不能準(zhǔn)確測(cè)量。測(cè)量誤差可分為三類:隨機(jī)誤差是由于測(cè)驗(yàn)中的一些偶然因素引起,而又不容易控制的誤差。系統(tǒng)誤差就是觀測(cè)過(guò)程中服從確定規(guī)律性的誤差。由于測(cè)驗(yàn)條件不同,造成不同的有一定規(guī)律性的誤差。過(guò)失誤差。明顯歪曲實(shí)驗(yàn)結(jié)果的誤差成為過(guò)失誤差,它是由于實(shí)驗(yàn)觀測(cè)過(guò)程中的過(guò)失造成的。為控制各種誤差,為此必須要了解誤差的來(lái)源。測(cè)量的誤差來(lái)源:測(cè)驗(yàn)內(nèi)部測(cè)驗(yàn)內(nèi)部的誤差主要來(lái)源于題目取樣。施測(cè)過(guò)程物理環(huán)境主試者方面、意外干擾評(píng)分計(jì)分。受測(cè)者本身應(yīng)試動(dòng)機(jī)測(cè)驗(yàn)焦慮學(xué)習(xí)、發(fā)展與教育測(cè)驗(yàn)經(jīng)驗(yàn)練習(xí)效應(yīng)反應(yīng)方式生理變化真分?jǐn)?shù)是一個(gè)非常重要的概念。測(cè)驗(yàn)真分?jǐn)?shù):真分?jǐn)?shù)的操作定義是:經(jīng)過(guò)無(wú)數(shù)次測(cè)量所得的平均值。用公式表示:X=T+EX為實(shí)得分?jǐn)?shù)或觀測(cè)分?jǐn)?shù),T是假設(shè)的真分?jǐn)?shù),E是測(cè)量誤差。這是在一個(gè)特定人身上實(shí)得分?jǐn)?shù)、真分?jǐn)?shù)和測(cè)量誤差之間的關(guān)系。測(cè)量誤差的性質(zhì):1.誤差可能是正的,也可能是負(fù)的。2.如果對(duì)一個(gè)人測(cè)量無(wú)數(shù)次,其平均誤差為0;3.真分?jǐn)?shù)和測(cè)量誤差是相互獨(dú)立的;4.誤差分?jǐn)?shù)和實(shí)得分?jǐn)?shù)的相關(guān)為0。一組測(cè)驗(yàn)分?jǐn)?shù)之間的變異性是由與測(cè)量目的有關(guān)的變異數(shù)、穩(wěn)定的但是出自無(wú)關(guān)來(lái)源的變異數(shù)和測(cè)量誤差變異數(shù)所決定的。在一個(gè)團(tuán)體中,由于每個(gè)人的誤差都是隨機(jī)的,方向不同,只要團(tuán)體足夠大,其誤差便會(huì)相互抵消。==一個(gè)團(tuán)體的平均真分?jǐn)?shù)該團(tuán)體中所有被試實(shí)得分?jǐn)?shù)的平均值測(cè)驗(yàn)的信度與效度分析——測(cè)驗(yàn)的信度同學(xué)好!上課前我們來(lái)思考幾個(gè)問(wèn)題。如何減少對(duì)特殊兒童檢測(cè)的誤差?在檢測(cè)中誤差有什么明顯的特征?檢測(cè)結(jié)果分?jǐn)?shù)變化太大怎么處理?檢測(cè)結(jié)果與實(shí)際情況有差距怎辦?信度:指測(cè)量工具的穩(wěn)定性、一致性。不要理解成可信程度。測(cè)驗(yàn)的信度:定義指的是測(cè)量結(jié)果的穩(wěn)定性程度(或叫可靠性)。也指同一被試在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn))重復(fù)測(cè)量,所得結(jié)果的一致程度。理論定義傳統(tǒng)的信度理論認(rèn)為,每一個(gè)測(cè)驗(yàn)的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E)兩個(gè)部份構(gòu)成的。公式為:X=T+E操作定義一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)變異數(shù)(方差ST2)與總變異數(shù)(總方差、實(shí)得分?jǐn)?shù)的方差SX2)的比率,或者是真實(shí)分?jǐn)?shù)方差占總方差的的百分比。rxx=ST2/SX2你理解了三者之間的關(guān)系了嗎。信度的指標(biāo):信度系數(shù)真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值,公式是:rxx=ST/SX=ptx2信度指數(shù)真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值。信度指數(shù)的平方就是信度系數(shù)。標(biāo)準(zhǔn)誤個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。測(cè)量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系。用一組被試兩次測(cè)量結(jié)果來(lái)代替同一個(gè)人反復(fù)實(shí)測(cè)。共有4種解釋,都非常重要。信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋:解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)比較信度可以接受的水平解釋個(gè)人分?jǐn)?shù)的意義比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異信度系數(shù)可以解釋為總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的,也就是測(cè)驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾。一般的能力測(cè)驗(yàn)和成就測(cè)驗(yàn)的信度系數(shù)都在0.90以上;人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn)的信度一般在0.80-0.85。一是估計(jì)真實(shí)分?jǐn)?shù)的范圍;二是了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形。評(píng)價(jià)兩個(gè)不同測(cè)驗(yàn)的分?jǐn)?shù)是否有明顯差異。比較包括兩個(gè)人不同分?jǐn)?shù)的差別和同一被試在兩個(gè)測(cè)驗(yàn)上的差別。這個(gè)例題是估計(jì)真實(shí)分?jǐn)?shù)的范圍!例題一:假設(shè)在一個(gè)智力測(cè)驗(yàn)中某個(gè)被試的IQ為100,這是否反映了他的真實(shí)水平?如果再測(cè)一次他的分?jǐn)?shù)將改變多少?已知該智力測(cè)驗(yàn)的標(biāo)準(zhǔn)差是15,信度系數(shù)為0.89,則其IQ的測(cè)量標(biāo)準(zhǔn)誤和可能范圍分別是多少?題解:SE=15=5.0Q=100±1.96x5=100±9.8≈90~110我們可以說(shuō)這個(gè)被試的真實(shí)IQ有95%的可能性落在90與110之間。即若再測(cè)一次,他的智商低于90、高于110的可能性不超過(guò)5%。這個(gè)例題是評(píng)價(jià)兩個(gè)不同測(cè)驗(yàn)的分?jǐn)?shù)是否有明顯差異!例題二:某被試在韋氏成人智力測(cè)驗(yàn)中言語(yǔ)智商為102,操作智商為108。已知兩個(gè)分?jǐn)?shù)都是以100為平均數(shù),15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語(yǔ)測(cè)驗(yàn)和操作測(cè)驗(yàn)的分半信度分別為0.97和0.93。問(wèn)其操作智商是否顯著高于言語(yǔ)智商呢?題解:首先計(jì)算出差異分?jǐn)?shù)的標(biāo)準(zhǔn)誤:在統(tǒng)計(jì)上,經(jīng)常要求兩個(gè)分?jǐn)?shù)的差異程度達(dá)到0.05的顯著水平,才能承認(rèn)不是誤差的影響。因此,將差異標(biāo)準(zhǔn)誤(4.74)乘以1.96,結(jié)果為9.29,這表明個(gè)體在韋氏測(cè)驗(yàn)兩個(gè)得分的差異高于大約10分,才能達(dá)到0.05顯著水平。上述被試的分?jǐn)?shù)差異(108-102=6<10)是不顯著的。下課了!請(qǐng)您及時(shí)復(fù)習(xí)。特殊兒童檢測(cè)信度信度(reliability)一、什么是信度定義:指的是測(cè)量結(jié)果的穩(wěn)定性程度(或叫可靠性)。也指同一被試在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn))重復(fù)測(cè)量,所得結(jié)果的一致程度。1、理論定義:傳統(tǒng)的信度理論認(rèn)為,每一個(gè)測(cè)驗(yàn)的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E)兩個(gè)部份構(gòu)成的,公式為:X=T+E討論一組測(cè)驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差導(dǎo)出具體分?jǐn)?shù),公式:(測(cè)驗(yàn)實(shí)得分?jǐn)?shù)的方差)=(測(cè)驗(yàn)真分?jǐn)?shù)的方差)+(測(cè)驗(yàn)誤差的方差)信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋(一)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān):信度系數(shù)可以解釋為總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的,也就是測(cè)驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾。(二)比較信度可以接受的水平:一般的能力測(cè)驗(yàn)和成就測(cè)驗(yàn)的信度系數(shù)都在0.90以上;人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn)的信度一般在0.80-0.85。一般原則是:當(dāng)<0.70時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人作出評(píng)價(jià)或預(yù)測(cè),而且不能作團(tuán)體比較;當(dāng)0.70≤<0.85時(shí),可用于團(tuán)體比較;當(dāng)≥0.85時(shí),才能用來(lái)鑒別或預(yù)測(cè)個(gè)人成績(jī)或作為。(三)解釋個(gè)人分?jǐn)?shù)的意義:從信度可以解釋個(gè)人分?jǐn)?shù)的意義,這是測(cè)量標(biāo)準(zhǔn)誤的應(yīng)用。它有兩個(gè)作用:一是估計(jì)真實(shí)分?jǐn)?shù)的范圍;二是了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形。(四)比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異:測(cè)量標(biāo)準(zhǔn)誤和測(cè)驗(yàn)信度在評(píng)價(jià)兩個(gè)不同測(cè)驗(yàn)的分?jǐn)?shù)是否有明顯差異時(shí)也非常重要。這種比較包括兩個(gè)人不同分?jǐn)?shù)的差別和同一被試在兩個(gè)測(cè)驗(yàn)上的差別。信度的類型及估計(jì)方法(一)重測(cè)信度(再測(cè)信度)(test-retestreliabity)1、含義與計(jì)算:又稱穩(wěn)定性系數(shù)。他的計(jì)算方法是采用重測(cè)法,即使用同一測(cè)驗(yàn),在同樣條件下對(duì)同一組被試前后施測(cè)兩次測(cè)驗(yàn),求兩次得分間的相關(guān)系數(shù)。(二)復(fù)本信度
(Alternate-formreliability)1、含義與計(jì)算:含義:又稱等值性系數(shù)。它是以兩個(gè)平行或復(fù)本的測(cè)驗(yàn)(等值但題目不同)來(lái)測(cè)量同一群體,然后求得被試在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù),這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測(cè)驗(yàn)在內(nèi)容上的等值性,故稱等值性系數(shù)。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測(cè)驗(yàn)的選擇。(三)分半信度(split-halfreliability)1、含義與計(jì)算指采用分半法估計(jì)所得的信度系數(shù)。這種方法估計(jì)信度系數(shù)只需一種測(cè)驗(yàn)形式,實(shí)施一次測(cè)驗(yàn)。通常是在測(cè)驗(yàn)實(shí)施后將測(cè)驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。常見(jiàn)的是將測(cè)題按其序列號(hào)的奇偶分,這種分法的前提是:測(cè)題并非隨機(jī)排列,而是按某種順序(如難度)排列;如果隨機(jī)排列的題目,則必須是所有題目平等的(要么難度相等,要么性質(zhì)一樣);如果測(cè)驗(yàn)有多個(gè)分量表,應(yīng)該在分量表內(nèi)部排好順序,再把各分量表分兩半組合起來(lái)求相關(guān)。2、計(jì)算(1)兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等(方差齊性)先計(jì)算兩半測(cè)驗(yàn)的積差相關(guān)系數(shù),再進(jìn)行校正。常用的修正公式是:斯皮爾曼-布朗公式:(2)兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)不等(方差不齊),可采用:弗朗那根公式或盧倫公式中的任一一個(gè)。(四)同質(zhì)性信度
(homogeneityreliability)1、含義:指測(cè)驗(yàn)內(nèi)部所有題目間的一致性。題目的一致性有兩層含義:其一是指所有題目都測(cè)的是同一種心理特質(zhì);其二是指所有題目之間都具有較高的正相關(guān)??傊|(zhì)性信度就是一個(gè)測(cè)驗(yàn)所測(cè)內(nèi)容或特質(zhì)的相同程度。2、測(cè)量同質(zhì)性的基本公式:3、庫(kù)德-理查遜公式:
適用于客觀性試題(0、1記分)3、克倫巴赫系數(shù)(多重記分測(cè)驗(yàn))(五)評(píng)分者信度(scorerreliability)1、含義與計(jì)算:指的是多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度。是用于測(cè)量不同評(píng)分者之間所產(chǎn)生的誤差。式中W為和諧系數(shù),K為評(píng)分者的人數(shù),N為被評(píng)對(duì)象數(shù),RI為每一對(duì)象被評(píng)的等級(jí)總和。這是一個(gè)統(tǒng)計(jì)表,記住之后就能有效控制誤差!一.各種信度系數(shù)相應(yīng)誤差方差的來(lái)源內(nèi)容取樣時(shí)間和內(nèi)容取樣內(nèi)容取樣內(nèi)容的異質(zhì)性評(píng)分者之間的差異復(fù)本信度(連續(xù)施測(cè))
復(fù)本信度(間隔施測(cè))分半信度同質(zhì)性信度評(píng)分者信度時(shí)間取樣重測(cè)信度信度系數(shù)類型誤差方差來(lái)源樣本團(tuán)體的特征對(duì)測(cè)驗(yàn)結(jié)果的影響很大!二.影響信度的因素(一)樣本團(tuán)體的特征分?jǐn)?shù)分布當(dāng)分布范圍增大時(shí),其信度估計(jì)就較高;當(dāng)分布范圍減小時(shí),相關(guān)系數(shù)隨之下降,信度值則較低。異質(zhì)性若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往往會(huì)高估測(cè)驗(yàn)的信度,相反則會(huì)低估測(cè)驗(yàn)的信度。平均水平對(duì)于不同水平的團(tuán)體,題目具有不同的難度,每個(gè)題目在難度上的微小差異累計(jì)起來(lái)便會(huì)影響信度。所以我們應(yīng)該選擇測(cè)驗(yàn)長(zhǎng)度比較大的測(cè)驗(yàn)!二.影響信度的因素(二)測(cè)驗(yàn)的長(zhǎng)度代表性測(cè)驗(yàn)越長(zhǎng),測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣越有代表性。猜測(cè)性測(cè)驗(yàn)越長(zhǎng),被試的猜測(cè)因素影響就越小。隨機(jī)性測(cè)驗(yàn)的項(xiàng)目越多,在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以相互抵消。所以我們應(yīng)該選擇測(cè)驗(yàn)長(zhǎng)度比較大的測(cè)驗(yàn)!二.影響信度的因素(三)測(cè)驗(yàn)的難度難度對(duì)信度的影響只存在于某些測(cè)驗(yàn)中,如智力測(cè)驗(yàn)、成就測(cè)驗(yàn)、
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度門(mén)店合伙人激勵(lì)機(jī)制服務(wù)合同4篇
- 2025年度二零二五農(nóng)行個(gè)人二手房交易貸款合同2篇
- 2025年度綠色建筑節(jié)能改造工程合同(二零二五版)4篇
- 二零二五年度商業(yè)門(mén)面租賃合同范本-@-1
- 2025年度綠色生態(tài)餐廳檔口租賃合同樣本4篇
- 2025年度城市軌道交通鋼管材料供應(yīng)與承包合同協(xié)議書(shū)范本
- 2025版南海區(qū)創(chuàng)新創(chuàng)業(yè)人才居住就業(yè)支持合同4篇
- 2025版門(mén)面租賃合同消防安全及責(zé)任承擔(dān)4篇
- 二零二五年度外賣(mài)送餐服務(wù)合同書(shū)(含增值服務(wù))
- 二零二五年度年薪制工資與員工晉升合同模板
- 衛(wèi)生服務(wù)個(gè)人基本信息表
- 醫(yī)學(xué)脂質(zhì)的構(gòu)成功能及分析專題課件
- 高技能人才培養(yǎng)的策略創(chuàng)新與實(shí)踐路徑
- 廣東省湛江市廉江市2023-2024學(xué)年八年級(jí)上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 2024年湖北省知名中小學(xué)教聯(lián)體聯(lián)盟中考語(yǔ)文一模試卷
- 安徽省蕪湖市2023-2024學(xué)年高一上學(xué)期期末考試 生物 含解析
- 交叉口同向可變車(chē)道動(dòng)態(tài)控制與信號(hào)配時(shí)優(yōu)化研究
- 燃?xì)庑袠I(yè)有限空間作業(yè)安全管理制度
- 數(shù)列練習(xí)題(含答案)基礎(chǔ)知識(shí)點(diǎn)
- 人教版(2024新版)七年級(jí)上冊(cè)英語(yǔ)期中+期末學(xué)業(yè)質(zhì)量測(cè)試卷 2套(含答案)
- 通用電子嘉賓禮薄
評(píng)論
0/150
提交評(píng)論