信度完整版本_第1頁
信度完整版本_第2頁
信度完整版本_第3頁
信度完整版本_第4頁
信度完整版本_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信度一、信度的概念二、信度的統(tǒng)計定義四、信度與測驗分數(shù)的解釋三、信度的統(tǒng)計方法五、影響信度的因素一、信度的概念

信度(reliability)指的是測量結(jié)果的穩(wěn)定性程度。換句話說,若能用同一測量工具反復測量某人的同一心理特質(zhì),則其多次測量的結(jié)果間的一致性程度就叫信度。有時也叫測量的可靠性。例如:比較鋼尺與具有彈性的皮尺測量長度的信度。各種類型的測量,無論是物理測量還是教育與心理測量,先后向同一對象施測后,所測得的值很難做到絕對一致。當然,教育測量由于對象的特殊性,出現(xiàn)測量誤差的可能性更大,如施測環(huán)境、完成時限、主被試關(guān)系、被試的情緒等等,都會造成所得測值的不規(guī)則隨機起伏。二、信度的統(tǒng)計定義(一)真分數(shù)理論(二)信度的統(tǒng)計定義(一)真分數(shù)理論

我們不妨把測驗實施過程中直接的得到的分數(shù),叫做觀察分數(shù),記為X;把被試在所測特質(zhì)上客觀具有的水平值,叫一般真分數(shù),記為T;那么,觀測分數(shù)與一般真分數(shù)的差就是測量誤差,記為E。這樣,三者的關(guān)系就可以表示為:X=T+E

由X=T+E可以推出:S2X=S2T+S2E

S2X表示觀察分數(shù)的方差;S2T表示真分數(shù)的方差;S2E表示誤差分數(shù)的方差(二)信度的統(tǒng)計定義第一,信度是一個被測團體的真分數(shù)方差與觀察分數(shù)方差之比,即:rxx=第二,信度是一個被試團體的真分數(shù)與觀察分數(shù)的相關(guān)系數(shù)的平方,即:

rxx=第三,信度是一個被試團體在測驗X(A卷)上的觀察分數(shù)與在測驗X的任意一個平行測驗X’(B卷)上的觀察分數(shù)的相關(guān)系數(shù)。即:rxx=(一)重測信度(二)復本信度(三)同質(zhì)性信度(四)評分者信度三、信度的估計方法

(一)重測信度1、定義重測信度,也稱穩(wěn)定系數(shù),是指用同一個量表(測驗或評價表)對同一組被試施測兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測驗上所得分數(shù)的相關(guān)系數(shù)。2、使用的前提條件(1)所測量的心理特性必須是穩(wěn)定的。(2)遺忘和練習的效果基本上互相抵消。(3)在兩次施測的間隔時期內(nèi),被試的心理特質(zhì)方面沒有獲得更多的學習和訓練。3、優(yōu)缺點(1)優(yōu)點能夠提供測驗是否隨時間而變異的資料,可作為被試將來行為表現(xiàn)的依據(jù)。(2)缺點易受練習和記憶的影響。如果兩次施測間隔的時間太短,則記憶猶新,練習的影響較大,夸大穩(wěn)定性;如果間隔的時間太長,則身心發(fā)展與學習經(jīng)驗的積累等足以改變分數(shù)的意義,而使相關(guān)減低,降低穩(wěn)定性。最適宜的時距隨測驗的目的、性質(zhì)和被試特點而異,一般是兩周到四周為宜,時間間隔最好不超過六個月。

(二)復本信度1、定義復本信度,又稱等值系數(shù),指的是兩個平行測驗測量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個復本測驗上所得分數(shù)的相關(guān)系數(shù)。實施復本測驗,有兩種方式:一種是在同一個時間連續(xù)施測,另一種是間隔一段時間后施測。前者主要可以反映出測驗內(nèi)容造成的誤差的多少,也就是說可以反映出兩個測驗是否是真正的平行測驗,所以這種復本信度稱作等值性系數(shù)。而后者所得到的復本信度,不僅反映出測驗內(nèi)容的抽樣誤差,而且也反映了被試本身狀況的改變,這種同時兼顧試題抽樣與時間影響的信度,稱作等值穩(wěn)定性系數(shù)。2、使用的前提條件(1)構(gòu)造出兩份或兩份以上真正平行的測驗。復本測驗必須在題目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導語、時限以及所用的例題、公式和測驗等其它方面都相同或相似。(2)被試有條件接受兩個測驗。例如,時間、經(jīng)費等。3、優(yōu)缺點(1)優(yōu)點能夠避免重測信度的一些問題,如記憶效果、學習效應等。(2)缺點其一,如果測量的行為易受練習的影響,則復本信度只能減少而不能完全消除這種影響;其二,由于第二個測驗只改變了題目的內(nèi)容,已經(jīng)掌握的解題原則,可以很容易地遷移到同類問題;最后,對許多測驗來說,建立復本是非常困難的。1、分半信度2、庫德——理查遜信度3、克龍巴赫α系數(shù)(三)同質(zhì)性信度

同質(zhì)性信度也叫內(nèi)部一致性信度,它是指測驗內(nèi)部所有題目間的一致性程度。這里題目間的一致性含有兩層意思:其一是指所有題目測的是同一種心理特質(zhì);其二是指所有題目得分之間都具有較高的正相關(guān)。估計同質(zhì)性信度的方法主要有以下幾種方法:1、分半信度(1)定義分半信度是指將一個測驗分成對等的兩半后,所有被試在這兩半上所得分數(shù)的一致性程度。它反映了測驗內(nèi)兩半題目間的一致性,所以屬于同質(zhì)性信度。但是,也可以將分半信度和等值性系數(shù)一樣解釋,即把對等兩半測驗看成是在最短時間距離內(nèi)施測的兩個平行測驗。1、分半信度(2)計算A.如果兩半測驗的變異數(shù)相等(即方差齊性),則用斯皮爾曼—布朗公式加以校正:rxx為整個測驗的信度系數(shù),rhh為兩個“半測驗”上得分的相關(guān)系數(shù)B.如果兩半測驗的變異數(shù)不相等,則使用弗朗拉根公式或盧侖公式弗朗拉根公式:rxx=2(1-)式中S2a和S2b分別是兩個分半測驗的方差,S2x表示總得分的方差盧侖公式:rxx=1-Sd2是兩半測驗分數(shù)之差的方差,S2x表示總得分的方差1、分半信度(3)使用的前提條件及范圍A.分半信度通常在只能施測一次或沒有復本的情況下使用。B.將一個測驗分成兩半的方法很多,所以,同一測驗通常會有多個分半信度。C.分半的方法:按題號的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等。2、庫德——理查遜信度

該方法適合于測驗題目全部為二分計分題的測驗的內(nèi)部一致性信度分析。庫德——理查遜公式有好幾個,其中常用的有KR20和KR21公式。(1)KR20公式KR20=式中KR20為測驗的信度;K為題目數(shù);pi和qi分別表示答對和答錯第i題得被試人數(shù)比例;S2x為測驗總分的方差。(2)KR21公式

KR21=式中KR21為測驗的信度;是全體被試測驗總分的方差;其它符號的含義同上3、克龍巴赫系數(shù)

當測驗題型較多,并非都是二分計分題時,估計測驗信度可采用克龍巴赫系數(shù),其計算公式為:=(1-)

S2i表示所有被試在第i題上得分的方差,S2x表示所有被試各自總分的方差,K為題目數(shù)。(四)評分者信度1、定義

評分者信度指的是多個評分者給同一批人的答卷進行評分的一致性程度。用于測量不同評分者產(chǎn)生的誤差。2、計算(1)當評分者為兩人時評分者信度等于兩個評分者給同一批被試的答卷所評分數(shù)的相關(guān)系數(shù)。2、計算(2)當評分者人數(shù)多于兩人時評分者信度可用肯德爾和諧系數(shù)進行估計。肯德爾和諧系數(shù)是表示多列等級變量相關(guān)程度的一種方法。這種資料的獲得一般采用等級評定的方法,即讓K個評價者對N個被試的試卷(或作品)進行等級評定,每個評價者都能對N份試卷(或作品)排出一個等級順序,這樣就可以得到K列等級順序變量。其計算公式為:W=

式中,W為肯德爾和諧系數(shù);K為評價者的人數(shù);N為被評價的試卷(或作品)個數(shù);S為每一個評價對象的K個等級之和的離均差平方和,即S=,Ri為第i個被評價對象的K個等級之和。嚴格地講,W值是否達到顯著性水平,需要做統(tǒng)計假設(shè)檢驗。(一)解釋真實分數(shù)與實得分數(shù)的相關(guān)(三)解釋個人分數(shù)的意義四、信度與測驗分數(shù)的解釋(二)確定信度可以接受的水平(四)比較不同測驗分數(shù)的差異(一)解釋真實分數(shù)與實得分數(shù)的相關(guān)

信度系數(shù)可以解釋為總方差中有多少比例是由真實分數(shù)的方差決定的,也就是說,測驗的總變異中真分數(shù)造成的變異占百分之幾。信度系數(shù)的分布從0-1的正數(shù)范圍,代表了從缺乏信度到完全可信的所有情況。(二)確定信度可以接受的水平

一般能力測驗和成就測驗的信度系數(shù)都在0.90以上。人格測驗、興趣、態(tài)度、價值觀等測驗的信度一般都在0.80-0.85。一般原則是:☆當rXX<0.70時,測驗不能用于對個人作出評價或預測,而且也不能做團體比較;☆當0.70≤rXX<0.85時,可用于團體比較;☆當rXX≥0.85時,才能用來鑒別或預測個人成績或行為。另一原則是:新編的測驗信度應高于原有的同類測驗或相似測驗。(三)解釋個人分數(shù)的意義作用:1、估計真實分數(shù)的范圍;

2、了解真實分數(shù)再測時可能的變化情形。

X-1.96SE≤XT≤X+1.96SE

其中SE為測量的標準誤(測量標準誤是指測驗中所得測值偏離真分數(shù)的程度),SX是所得分數(shù)的標準差,rXX為測驗的信度系數(shù)。例題例題:在一個智力測驗中,某個被試的IQ為100,這是否反映了他的真實水平?如果再測一次他的分數(shù)將改變多少?已知該智力測驗的標準差為15,信度系數(shù)為0.84,則其IQ的測量標準誤和可能范圍分別為:我們可以說,這個被試的真實IQ有95%的可能性落在88-112之間。即若再測一次,他的智商低于88、高于112的可能性不超過5%。(四)比較不同測驗分數(shù)的差異差異分數(shù)的標準誤:SEd=S式中SEd為差異的標準誤,S代表兩個測驗使用的標準差,這個標準差要求相同,因為只有在兩個分數(shù)具有相同的單位時才可以比較。(四)比較不同測驗分數(shù)的差異例題;某被試在韋式成人智力測驗中言語智商為102,操作智商為110。已知兩個分數(shù)都是以100為平均數(shù),15為標準差的標準分數(shù)。假設(shè)言語測驗和操作測驗的分半信度分別為0.87和0.88。問其操作智商是否顯著高于言語智商?在統(tǒng)計上,經(jīng)常要求兩個平均分數(shù)的差異程度達到0.05的顯著性水平,才承認不是誤差的影響。因此,將差異標準誤7.5乘以1.96,結(jié)果為14.7,這表明個體在韋氏測驗兩半部分的差異高于大約15分,才能達到0.05水平。上述被試的差異分數(shù)是8,所以是不顯著的。(一)樣本的特征(三)測驗的難度五、影響信度的因素(二)測驗的長度(一)樣本的特征

影響信度估計的一個重要因素是被試樣本的情況。團體的異質(zhì)程度與分數(shù)的分布有關(guān),一個團體越是異質(zhì),其分數(shù)分布的范圍也就越大,信度系數(shù)也就越高。由于信度系數(shù)與樣本團體的異質(zhì)性有關(guān),因此我們在使用測驗時,不能認為當該測驗在一個團體中有較高的信度時,在另一個團體中也具有較高的信度。此時,往往需要重新確定測量的信度。(二)測驗的長度

一般來說

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論