心理測量學 測驗的信度_第1頁
心理測量學 測驗的信度_第2頁
心理測量學 測驗的信度_第3頁
心理測量學 測驗的信度_第4頁
心理測量學 測驗的信度_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三節(jié)測驗的信度測量的誤差及其來源測量的信度補:測量的誤差及其來源◆誤差的定義◆誤差的種類◆誤差的來源測量結(jié)果測量因素1、誤差的定義與測量目的無關(guān)不準確或不一致考研題誤差:與測驗?zāi)康臒o關(guān)的因素所導(dǎo)致的測驗結(jié)果不一致或不準確的現(xiàn)象.2、誤差的種類

系統(tǒng)誤差隨機誤差隨機誤差與系統(tǒng)誤差的比較類型產(chǎn)生原因特點效能指標隨機誤差不易控制的偶然因素方向和大小上完全隨機影響準確性影響一致性信度系統(tǒng)誤差恒定、有規(guī)律的因素穩(wěn)定地存在于每次測量中不影響一致性效度經(jīng)典測驗理論信度概念信度的評估方法信度系數(shù)的應(yīng)用影響信度的因素成熟標志20世紀50年代Gulliksen《心理測驗理論》三大支柱基本假設(shè)信度效度一、經(jīng)典測驗理論ClassicalTestTheory(CTT)考研題基本假設(shè)與真分數(shù)1、真分數(shù)觀測分數(shù)誤差分數(shù)真分數(shù)測驗所得未加工理論定義真正特質(zhì)水平操作定義無數(shù)次測量結(jié)果的均值經(jīng)典測驗理論(CTT)假定:

觀察分數(shù)(X)與真分數(shù)(T)之間是一種線性關(guān)系,并只相差一個隨機誤差(E)。即:X=T+E(1)如果對一個人測量無數(shù)次,其誤差之和為0,平均誤差為0。(2)

誤差與真分數(shù)相互獨立,相關(guān)為0。(3)一個團體的平均真分數(shù)等于該團體中所有被試實得分數(shù)的平均值。(4)對于一個團體來說,實得分數(shù)、真分數(shù)、和測量誤差之間有如下關(guān)系:關(guān)于測量誤差還有如下假設(shè):隨機誤差

在一次測驗中,一個團體的實測分數(shù)的變異數(shù)是由與測量目的有關(guān)的變異數(shù)、穩(wěn)定但出自無關(guān)來源的變異數(shù)和偶然但出自無關(guān)來源的變異數(shù)所決定的。二、信度的定義真分數(shù)方差與觀測分數(shù)方差的比值信度指的是測量結(jié)果的穩(wěn)定性程度(或一致性程度)。信度是反映測量中隨機誤差大小的指標。三、信度評估的方法信度重測信度復(fù)本信度內(nèi)部一致性信度評分者信度分半信度同質(zhì)性信度(一)重測信度(Test-retestreliability)含義同一測驗同組對象前后測2次相關(guān)系數(shù)穩(wěn)定性程序誤差時間太短練習效應(yīng)記憶效應(yīng)A卷一定時距A卷太長身心變化第一,所測的心理特性必須是穩(wěn)定的。第二,遺忘和練習的效果基本上相互抵消。第三,所測心理特質(zhì)在兩次施測的間隔時間內(nèi)沒有獲得更多的學習和訓(xùn)練。第四,報告結(jié)果時要報告兩次測驗的間隔及有關(guān)經(jīng)歷.使用條件

優(yōu)點省力、省時測量屬性相同提供隨時間變化的資料

不足時間間隔長短評價★時間間隔越長,重測信度越低;★時間間隔視測驗?zāi)康?、性質(zhì)、被試特點而定;★年幼兒童,間隔要小;年長成人,間隔可長;★智力測驗間隔不能太短,成就測驗不能太長;★一般以2-4周為宜,智力測驗的間隔時間一般在6個月左右。(二)復(fù)本信度(Alternate-form

raliability)含義兩等值測驗最短時間內(nèi)對同組對象施測結(jié)果r等值性程序誤差內(nèi)容取樣A卷最短時距B卷復(fù)本等值的條件●各測驗測量的是同一種心理特質(zhì);●各測驗具有相同的內(nèi)容和形式;●各測驗的題目不應(yīng)重復(fù);●各測驗題目數(shù)量相等;各測驗難度和區(qū)分度大體相同;●各測驗的分數(shù)分布(標準差和平均數(shù))大體相同;●復(fù)本編制好后,應(yīng)再測一次,以確保等值。第一,前提是有復(fù)本測驗。第二,被試有條件接受兩個測驗(時間和經(jīng)費等)。第三,報告結(jié)果時要報告兩次測驗的間隔及有關(guān)經(jīng)歷.使用條件優(yōu)點代表性增強,信度更準一定程度避免練習、記憶效應(yīng)不足編制復(fù)本難影響積極性觸類旁通評價重測信度與復(fù)本信度有何異同?小結(jié)與問題重測信度復(fù)本信度內(nèi)部一致性跨時間一致性跨形式一致性試題之間有何關(guān)系?(三)內(nèi)部一致性信度含義測驗各題間一致性題目一致性分半信度類型同質(zhì)性信度1、分半信度(Split-halfraliablity)分半方法奇偶題分半分析程序兩半相關(guān):rhh校正:rnn難易:低

高分半條件兩半相似:M、S項目組間相關(guān)分布常態(tài)校正方法斯皮爾曼-布朗公式方差相等時弗拉南根公式盧尤公式方差不等時使用條件測驗只能施測一次或沒有復(fù)本的情況下使用.當一個測驗無法分成對等的兩半時不宜使用.2、同質(zhì)信度(Homogeneityraliability)同質(zhì)性題目間的內(nèi)部一致性類型庫-理信度克龍巴赫系數(shù)各類題型二值記分(四)評分者信度(Scorerraliability)含義評分者評分的一致性方法2評分者2個以上者rXY肯德爾和諧系數(shù)附:確定信度的可接受水平測驗類型最低標準標準化測驗人格測驗非標準化測驗0.900.80-0.850.60-0.85典型測驗的一般標準典型測驗的信度高低水平測驗類型低中高成套成就測驗學術(shù)能力測驗成套傾向性測驗客觀人格測驗興趣問卷態(tài)度量表.66.92.98.56.90.97.26.88.96.46.85.97.42.84.93.47.79.98各種信度系數(shù)相應(yīng)誤差變異的來源信度系數(shù)的類型誤差變異的來源再測信度復(fù)本信度(連續(xù)施測)復(fù)本信度(間隔施測)分半信度同質(zhì)性信度評分者信度時間取樣內(nèi)容取樣時間與內(nèi)容取樣內(nèi)容取樣內(nèi)容的一致性評分者間的差異友情提示實際上,有多少種誤差的來源,就有多少種信度估計的方法。一般來說,一個測驗?zāi)姆N誤差大,就應(yīng)該用哪種誤差估計。有時一個測驗需要幾種信度估計。操作演練假設(shè)對100個六年級學生以兩個月的時間間隔先后施測一個創(chuàng)造力測驗的A/B兩個復(fù)本,所得的等值與穩(wěn)定性系數(shù)為0.70。我們還根據(jù)被試對每個復(fù)本的反應(yīng)計算出分半信度為0.80.同時,我們將另一個評分者隨機抽取50份卷子另外評分,得到評分者信度為0.92。然后,我們對這這三種方法所產(chǎn)生的誤差變異進行分析。一個假想測驗的變異數(shù)分析信度類型誤差變異數(shù)誤差變異來源復(fù)本信度(間隔)1-0.70=0.30時間和內(nèi)容取樣分半信度1-0.80=0.20內(nèi)容取樣上述兩者差異0.30-0.20=0.10時間取樣評分者信度1-0.92=0.08評分者差異誤差變異總和0.20+0.10+0.08=0.38真實變異1-0.38=0.62四、信度系數(shù)的應(yīng)用1、評價測驗2、解釋分數(shù)(1)個人測驗分數(shù)的誤差

(X-1.96SE)≥T≤(X+1.96SE)(2)兩種測驗分數(shù)的比較(差異的標準誤)所得結(jié)果與1.9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論