心理測量第三講_第1頁
心理測量第三講_第2頁
心理測量第三講_第3頁
心理測量第三講_第4頁
心理測量第三講_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、測驗的信度測驗的信度主講:劉潤香v如果一個秤今天和明天秤的結(jié)果不一樣,我們就不會相信這個秤,認為這個秤有問題v類似的,如果一個心理測驗多次測量的結(jié)果不穩(wěn)定或者不一致,那么也不會有人去用這個測驗。信度的概念信度的概念v一般定義:一般定義:信度:即測驗的可靠性,指的是測驗所得結(jié)信度:即測驗的可靠性,指的是測驗所得結(jié)果的一致程度。它是衡量測驗質(zhì)量好壞的最果的一致程度。它是衡量測驗質(zhì)量好壞的最基本指標?;局笜?。信度的指標v信度系數(shù)rxxv信度指數(shù)rxTv測量標準誤SE信度系數(shù)信度系數(shù)經(jīng)典測量理論的假設(shè):經(jīng)典測量理論的假設(shè):X=T+E.X為實得分數(shù),為實得分數(shù),T為真實分數(shù),為真實分數(shù),E為隨機誤差分

2、數(shù)。為隨機誤差分數(shù)??梢赞D(zhuǎn)換為:可以轉(zhuǎn)換為:S2x=S2T+S2E.信度定義:信度是一組測驗分數(shù)的真分數(shù)方差與信度定義:信度是一組測驗分數(shù)的真分數(shù)方差與總方差(實得分數(shù)方差)的比率,即總方差(實得分數(shù)方差)的比率,即rxx=S2T/ S2x= 1-S2E/ S2x編號測量身高X真實身高T測量誤差E116516612171170131791812416016335158160261631612信度指數(shù)信度指數(shù)vr2xT=S2T/ S2x,rxT即為信度的第一種表示信度指即為信度的第一種表示信度指數(shù)。但這里數(shù)。但這里S2T無法求取。無法求取。v對同一被試反復(fù)施測無數(shù)次,或用無數(shù)個相等對同一被試反復(fù)

3、施測無數(shù)次,或用無數(shù)個相等的測驗對同一被試反復(fù)施測無數(shù)次,從而一個的測驗對同一被試反復(fù)施測無數(shù)次,從而一個被試可以得到無數(shù)個分數(shù),這無數(shù)個分數(shù)的平被試可以得到無數(shù)個分數(shù),這無數(shù)個分數(shù)的平均值為真實分數(shù)均值為真實分數(shù)T,標準差即為測量的誤差方,標準差即為測量的誤差方差,它也是信度的第二種表示。這里對一個被差,它也是信度的第二種表示。這里對一個被試能不能反復(fù)施測無數(shù)次?試能不能反復(fù)施測無數(shù)次?測量標準誤vSE=Sx(1- rxx)1/2v測量的標準誤與信度之間有互為消長的關(guān)系:測量的標準誤與信度之間有互為消長的關(guān)系:信度越高,標準誤越??;信度越低,標準誤信度越高,標準誤越?。恍哦仍降?,標準誤越大越

4、大 信度評估的方法信度評估的方法v根據(jù)反映測驗誤差的不同來源,可分:根據(jù)反映測驗誤差的不同來源,可分:重測信度重測信度考察跨時間的一致性??疾炜鐣r間的一致性。復(fù)本信度復(fù)本信度考察跨內(nèi)容的等值性。考察跨內(nèi)容的等值性。內(nèi)部一致性內(nèi)部一致性考察題目的同質(zhì)性??疾祛}目的同質(zhì)性。評分者信度評分者信度考察評分的一致性??疾煸u分的一致性。v注意:注意:信度估計方法不只上面幾種,實際上有多少信度估計方法不只上面幾種,實際上有多少誤差來源,便有多少估計信度的方法。原則誤差來源,便有多少估計信度的方法。原則上一個測驗?zāi)姆N誤差大,便采用哪種估計方上一個測驗?zāi)姆N誤差大,便采用哪種估計方法,有時甚至需要有幾種信度系數(shù)。

5、法,有時甚至需要有幾種信度系數(shù)。重測信度重測信度v定義:即使用同一測驗,在同樣條件下對同一定義:即使用同一測驗,在同樣條件下對同一組被試者前后施測兩次,求兩次得分間的相關(guān)組被試者前后施測兩次,求兩次得分間的相關(guān)系數(shù),又稱穩(wěn)定性系數(shù)系數(shù),又稱穩(wěn)定性系數(shù) 。v計算方法:重測法。計算方法:重測法。A1 A2,求,求r12。v使用條件:使用條件:(1)所測心理特質(zhì)是穩(wěn)定的(氣質(zhì)、性格、興)所測心理特質(zhì)是穩(wěn)定的(氣質(zhì)、性格、興趣、態(tài)度);趣、態(tài)度);(2)遺忘和練習(xí)效應(yīng)基本抵消;)遺忘和練習(xí)效應(yīng)基本抵消;(3)兩次施測間隔內(nèi),被試沒有得到更多的學(xué))兩次施測間隔內(nèi),被試沒有得到更多的學(xué)習(xí)、練習(xí)(動態(tài)測驗)

6、習(xí)、練習(xí)(動態(tài)測驗)2-4周周v注意事項:注意事項:(1)報告重測信度要報告兩次施測間隔時)報告重測信度要報告兩次施測間隔時間。間。(2)兩次測量之間最適宜的時距:隨測驗)兩次測量之間最適宜的時距:隨測驗的目的、性質(zhì)和被試特點而異,一般是的目的、性質(zhì)和被試特點而異,一般是兩周到四周為宜,間隔時間最好不超過兩周到四周為宜,間隔時間最好不超過六個月。(不能太短,使得記憶或練習(xí)六個月。(不能太短,使得記憶或練習(xí)效應(yīng)得以消退;不能過長,以避免被試效應(yīng)得以消退;不能過長,以避免被試心理狀態(tài)受到成熟、歷史性變化的影響)心理狀態(tài)受到成熟、歷史性變化的影響)復(fù)本信度復(fù)本信度v等值性系數(shù):等值性系數(shù):A B(反

7、映測驗內(nèi)容(反映測驗內(nèi)容引起的誤差)引起的誤差)定義:是以兩個等值但題目不同的測驗(復(fù)定義:是以兩個等值但題目不同的測驗(復(fù)本)來測量同一群體,然后求得被試在兩個本)來測量同一群體,然后求得被試在兩個測驗上得分的相關(guān)系數(shù)。測驗上得分的相關(guān)系數(shù)。施測方法:將被試隨機分成兩半,一半被試施測方法:將被試隨機分成兩半,一半被試先做先做A,再做,再做B;另一半先做;另一半先做B,再做,再做A,合,合并兩個并兩個A和和B的數(shù)據(jù)求相關(guān)。的數(shù)據(jù)求相關(guān)。v穩(wěn)定性與等值性系數(shù)。穩(wěn)定性與等值性系數(shù)。A B兩個復(fù)本的施測相隔一段時間。兩個復(fù)本的施測相隔一段時間。v計算:類同重測信度,兩次測驗上得分的積差相關(guān)系數(shù)。v使

8、用條件:(1)編制兩份平行測驗(很難編)(2)被試有條件接受兩次測驗v注意事項:(1)穩(wěn)定等值性系數(shù)需報告施測間隔時間(2)依然存在練習(xí)/記憶效應(yīng)(如:同一類型的題,解題策略相同)PS:重測信度和復(fù)本信度都不適合難度測驗。分半信度v分半信度:分半信度:1/2A 1/2A定義定義v指在測驗實施后,將測驗按奇偶性分成兩半,并指在測驗實施后,將測驗按奇偶性分成兩半,并分別計算每位被試在兩半測驗上的得分,求出這分別計算每位被試在兩半測驗上的得分,求出這兩半分數(shù)兩半分數(shù)的相關(guān)系數(shù)。屬于內(nèi)部一致性系數(shù)中的的相關(guān)系數(shù)。屬于內(nèi)部一致性系數(shù)中的一種,反映的是兩半測驗間的一致性。一種,反映的是兩半測驗間的一致性。

9、校正校正v原因:測驗長度變短,易低估測驗的信度;原因:測驗長度變短,易低估測驗的信度;v公式:公式: rxx=2rhh/(1+rhh)v使用前提:測驗?zāi)鼙环殖蓛砂耄ㄈ缯Z文、韋氏智力測驗就很難分半)v注意事項:(1)一個測驗往往有多種分半方法,因此也對應(yīng)有多種分半信度,在報告分半信度時需說明分半的方法。(2)常用的分半方法有奇偶分半、難度分半、內(nèi)容分半、時間分半(常用于速度測驗)同質(zhì)性信度v同質(zhì)性信度同質(zhì)性信度主要代表測驗內(nèi)部主要代表測驗內(nèi)部所有題目所有題目間的一致性。正間的一致性。正相關(guān)高,測驗為同質(zhì)的;低正相關(guān)或為負相相關(guān)高,測驗為同質(zhì)的;低正相關(guān)或為負相關(guān)時,測驗為異質(zhì)。也屬于內(nèi)部一致性系

10、數(shù)關(guān)時,測驗為異質(zhì)。也屬于內(nèi)部一致性系數(shù)中的一種,其實質(zhì)是所有分半信度的平均值。中的一種,其實質(zhì)是所有分半信度的平均值。如果測驗由許多分測驗組成,則要求分測驗如果測驗由許多分測驗組成,則要求分測驗內(nèi)部同質(zhì),分測驗之間異質(zhì)。內(nèi)部同質(zhì),分測驗之間異質(zhì)。評分者信度評分者信度v適用:用于測量不同評分者之間所產(chǎn)生的誤適用:用于測量不同評分者之間所產(chǎn)生的誤差。差。v兩個評分者之間的信度:有若干份試卷,每兩個評分者之間的信度:有若干份試卷,每份試卷由兩人評分,然后根據(jù)每份試卷的兩份試卷由兩人評分,然后根據(jù)每份試卷的兩個分數(shù)求相關(guān)。(如果受過訓(xùn)練的評分者,個分數(shù)求相關(guān)。(如果受過訓(xùn)練的評分者,其評分一致性應(yīng)達

11、其評分一致性應(yīng)達0.90以上)以上)v多個評分者之間的信度:如果采用等級評分,多個評分者之間的信度:如果采用等級評分,可采用可采用W系數(shù)計算評分者信度。系數(shù)計算評分者信度。應(yīng)注意的問題應(yīng)注意的問題v有多少誤差來源就有多少信度估計方法。有多少誤差來源就有多少信度估計方法。v應(yīng)根據(jù)情況采用不同的信度指標,原則上一應(yīng)根據(jù)情況采用不同的信度指標,原則上一個測驗?zāi)姆N誤差大,便用哪種誤差估計。個測驗?zāi)姆N誤差大,便用哪種誤差估計。v一個測驗往往要計算多種信度系數(shù)。一個測驗往往要計算多種信度系數(shù)。例子v復(fù)本信度又稱等值性系數(shù)。它是以兩個等值但復(fù)本信度又稱等值性系數(shù)。它是以兩個等值但題目不同的測驗(復(fù)本)來測量

12、同一群體,然題目不同的測驗(復(fù)本)來測量同一群體,然后求得被試者在兩個測驗上得分的相關(guān)系數(shù)。后求得被試者在兩個測驗上得分的相關(guān)系數(shù)。復(fù)本信度反映的是測驗在(復(fù)本信度反映的是測驗在( )上的等值性。)上的等值性。(A)時間)時間 (B)題目)題目 (C)評分)評分 (D)內(nèi)容)內(nèi)容v一般要求在成對的受過訓(xùn)練的評分者之間平均一般要求在成對的受過訓(xùn)練的評分者之間平均一致性達到一致性達到( )以上,才認為評分是客以上,才認為評分是客 觀的。觀的。 (A) 0.70 (B) 0.80(C) 0.90 (D)l .00信度與測驗分數(shù)的解釋信度與測驗分數(shù)的解釋v解釋真實分數(shù)與實得分數(shù)的相關(guān)程度解釋真實分數(shù)與

13、實得分數(shù)的相關(guān)程度rxx=S2T/ S2x rxx0,10,1rxx=0=0, S2E= = S2x rxx=1=1, S2T= = S2xv確定信度可以接受的水平確定信度可以接受的水平兩個原則:兩個原則:vrxx0.70時,測驗不能用于團體比較和對個人進時,測驗不能用于團體比較和對個人進行評價和預(yù)測。行評價和預(yù)測。0.70rxx0.85時,測驗?zāi)苡糜跁r,測驗?zāi)苡糜趫F體比較。團體比較。rxx0.85時,能用于鑒別或預(yù)測個人時,能用于鑒別或預(yù)測個人成績或作為。成績或作為。v新編測驗的信度應(yīng)高于原有同類測驗或相似測驗。新編測驗的信度應(yīng)高于原有同類測驗或相似測驗。能力或成就測驗:能力或成就測驗: r

14、xx0.90(甚至甚至0.95)人格測驗:人格測驗: rxx0.80,0.850.80,0.85或更高或更高PS:信度高并不是心理測驗追求的最高目標,只是使測驗有效的一個必要條件。v解釋個人分數(shù)的意義解釋個人分數(shù)的意義測量標準誤的作用:測量標準誤的作用:v估計真實分數(shù)的范圍;估計真實分數(shù)的范圍;v了解實得分數(shù)再測時可能的變化情形。了解實得分數(shù)再測時可能的變化情形。真分數(shù)的估計,或再測時實得分數(shù)的變化范真分數(shù)的估計,或再測時實得分數(shù)的變化范圍計算:圍計算:v根據(jù)根據(jù)SE=Sx(1- rxx)1/2,求,求SE。v如果已知或然水平,一般為如果已知或然水平,一般為95%。v則真分數(shù)的置信區(qū)間或再測時

15、則真分數(shù)的置信區(qū)間或再測時X的變化范圍是:的變化范圍是:X-1.96SE 1.96 ,則差異顯著;反之,則差異,則差異顯著;反之,則差異不顯著。不顯著。不同測驗分數(shù)的差異比較舉例v某被試在韋氏成人智力測驗中言語智商為100,操作智商為105,已知兩個分數(shù)都是以100為平均數(shù),15為標準差的標準分數(shù),假設(shè)言語分量表和操作分量表的分半信度為0.87和0.88,問言語智商和操作智商是否存在顯著性差異。舉例v“大約有大約有95%的可能性真分數(shù)落在所得分數(shù)的可能性真分數(shù)落在所得分數(shù)+1.96SE的范圍內(nèi),或有的范圍內(nèi),或有5%的可能性落在范的可能性落在范圍之外圍之外”的描述,其置信區(qū)間為(的描述,其置信

16、區(qū)間為( )。)。(A)X-1.96SEXTX+1.97SE (B)X-1.96SEXT(C)X+1.96SEXT (D)X-1.96SE XTX+1.96SE 影響信度的因素影響信度的因素v樣本特征樣本特征樣本團體內(nèi)的異質(zhì)性(指水平的差異):異樣本團體內(nèi)的異質(zhì)性(指水平的差異):異質(zhì)高,則信度高。質(zhì)高,則信度高。樣本團體間平均能力水平:團體的不同水平,樣本團體間平均能力水平:團體的不同水平,導(dǎo)致題目的難度不同,從而影響信度的高低。導(dǎo)致題目的難度不同,從而影響信度的高低。在智力測驗中,對年幼者或能力水平低者,在智力測驗中,對年幼者或能力水平低者,不適宜使用選擇題測驗。不適宜使用選擇題測驗。在編

17、制測驗時,應(yīng)將常模團體分為更同質(zhì)的在編制測驗時,應(yīng)將常模團體分為更同質(zhì)的亞團體,分別報告其信度。亞團體,分別報告其信度。v測驗長度測驗長度測驗越長,測驗的測量取樣或內(nèi)容取樣就越測驗越長,測驗的測量取樣或內(nèi)容取樣就越有代表性;測驗越長,被試猜測因素的影響有代表性;測驗越長,被試猜測因素的影響就越小。就越小。增加測驗長度的效果遵循報酬遞減率原則,增加測驗長度的效果遵循報酬遞減率原則,因此增加測驗長度要適當。因此增加測驗長度要適當。斯皮爾曼斯皮爾曼皮朗公式的導(dǎo)出公式(皮朗公式的導(dǎo)出公式(rXX為原為原測驗信度):測驗信度):)1 ()1 (kkxxxxkkrrrrkv測驗難度測驗難度難度對信度的影響只存在最高作為測驗中。難度對信度的影響只存在最高作為測驗中。難度與信度之間不是簡單的對應(yīng)關(guān)系。難度與信度之間不是簡單的對應(yīng)關(guān)系。難度為難度為0.5只適合于簡答題。選擇題的難度只適合于簡答題。選擇題的難度應(yīng)偏高。應(yīng)偏高。洛德提出,在學(xué)績測驗中各類選擇題的理想洛德提出,在學(xué)績測驗中各類選擇題的理想平均難度值為:五擇一為平均難度值為:五擇一為0.70,四擇一為,四擇一為0.74,三擇一為,三擇一為0.77,是非題為,是非題為0.85。v時間間隔時間間隔只對重測信度和重測復(fù)本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論