心理測量學(xué)真分?jǐn)?shù)與信度和效度[教育類別]_第1頁
心理測量學(xué)真分?jǐn)?shù)與信度和效度[教育類別]_第2頁
心理測量學(xué)真分?jǐn)?shù)與信度和效度[教育類別]_第3頁
心理測量學(xué)真分?jǐn)?shù)與信度和效度[教育類別]_第4頁
心理測量學(xué)真分?jǐn)?shù)與信度和效度[教育類別]_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、真分?jǐn)?shù)與信度/效度 上傳 劉景波(snr5aliu) 目的 僅用于學(xué)習(xí)交流 1培訓(xùn)類 心理測量的誤差種類 誤差定義,誤差是由測量中與目的無關(guān)的因 素引起的不準(zhǔn)確或不一致的效應(yīng)。 心理學(xué)研究中的誤差按其性質(zhì)可分為三類, 隨機誤差系統(tǒng)誤差過失誤差 (恒定誤差) 2培訓(xùn)類 心理學(xué)研究中的三類誤差 n 隨機誤差隨機誤差 又稱偶然誤差。由實驗中一些偶然因素引起又不可控制的誤差。隨機又稱偶然誤差。由實驗中一些偶然因素引起又不可控制的誤差。隨機 誤差產(chǎn)生的原因十分復(fù)雜誤差產(chǎn)生的原因十分復(fù)雜,但其存在是絕對的。但其存在是絕對的。 隨著實驗觀測次數(shù)的增加隨著實驗觀測次數(shù)的增加,隨機誤差的變化會呈現(xiàn)一定的規(guī)律性隨

2、機誤差的變化會呈現(xiàn)一定的規(guī)律性 它總是圍繞被觀測的真正值它總是圍繞被觀測的真正值(又稱真分?jǐn)?shù)又稱真分?jǐn)?shù),一般用多次觀測的平均值來表一般用多次觀測的平均值來表 示,真正值是無法測量到的示,真正值是無法測量到的)波動波動,隨機誤差的算術(shù)平均數(shù)隨著觀測次數(shù)隨機誤差的算術(shù)平均數(shù)隨著觀測次數(shù) 的增加而逐漸減少以至于趨近于零。的增加而逐漸減少以至于趨近于零。 n 系統(tǒng)誤差系統(tǒng)誤差 就是觀測過程中服從確定規(guī)律性的誤差。由于實驗條件不同就是觀測過程中服從確定規(guī)律性的誤差。由于實驗條件不同,造成不造成不 同的有一定規(guī)律性的誤差屬于這類誤差。心理學(xué)實驗中同的有一定規(guī)律性的誤差屬于這類誤差。心理學(xué)實驗中,不同的實驗

3、方法、不同的實驗方法、 不同的被試樣本等都會對實驗結(jié)果產(chǎn)生規(guī)律性的影響。這類誤差不能通不同的被試樣本等都會對實驗結(jié)果產(chǎn)生規(guī)律性的影響。這類誤差不能通 過增加實驗次數(shù)消除。如果需要可以通過實驗設(shè)計加以消除過增加實驗次數(shù)消除。如果需要可以通過實驗設(shè)計加以消除,這一問題我這一問題我 們將在后邊的變量處理和實驗設(shè)計中討論。們將在后邊的變量處理和實驗設(shè)計中討論。 n 過失誤差過失誤差 一般把明顯歪曲實驗結(jié)果的誤差成為過失誤差一般把明顯歪曲實驗結(jié)果的誤差成為過失誤差,它是由于實驗觀測過它是由于實驗觀測過 程中的過失造成的。這些錯誤有測錯、傳錯、記錯、儀器失靈、取樣錯程中的過失造成的。這些錯誤有測錯、傳錯、

4、記錯、儀器失靈、取樣錯 誤。在實驗數(shù)據(jù)整理過程中必須鑒別、舍棄這些含有過失誤差的數(shù)據(jù)誤。在實驗數(shù)據(jù)整理過程中必須鑒別、舍棄這些含有過失誤差的數(shù)據(jù)(又又 稱異常點稱異常點),否則會嚴(yán)重影響實驗結(jié)果的準(zhǔn)確性否則會嚴(yán)重影響實驗結(jié)果的準(zhǔn)確性,得出不正確的結(jié)論。得出不正確的結(jié)論。 3培訓(xùn)類 心理測量誤差的三方面來源 在心理測量中,常見的誤差來源于三個方 面: 測驗內(nèi)部,施測過程,受測者本身。 4培訓(xùn)類 1測驗內(nèi)部引起的誤差 測驗內(nèi)部的誤差主要來源于題目取樣: 、當(dāng)測驗題目較少或取樣缺乏代表性時,被試 的反應(yīng)受機遇影響較大(譬如一次考試碰巧準(zhǔn)備到 或沒有準(zhǔn)備到某題);當(dāng)幾個測驗復(fù)本不等值時, 接受不同的題

5、目,就會獲得不同的分?jǐn)?shù)。 、除題目取樣不當(dāng)可引起誤差外,其他一些因 素,如題目用詞的模棱兩可,對反應(yīng)步驟說得不清 楚;題目過難引起猜測;時限短使被試倉促做答等, 也可能成為誤差的來源。 5培訓(xùn)類 2由施測過程引起的誤差 在三種誤差來源中,與施測過程有關(guān)的誤差可能是最容易控制和檢驗的。測驗的標(biāo)準(zhǔn) 化水平越來越高,大部分施測條件能夠得到控制。但由于心理現(xiàn)象的復(fù)雜性,許多意想不 到的偶然因素仍可能影響測驗分?jǐn)?shù),使人防不勝防。 、物理環(huán)境 施測現(xiàn)場的溫度、光線、聲音、桌面好壞、空間闊窄等皆具有影響。 、主試者方面 主試者的年齡、性別、外表,施測時的言談舉止、表情動作等均能影響測驗結(jié)果。倘 若不存在按照

6、規(guī)定實施測驗,如制造緊張氣氛,給予特別協(xié)助貨暗示,以及計時錯誤等, 都會帶來較大誤差。特別是當(dāng)測驗具有復(fù)雜步驟和說明,或測驗題目本身是模糊不確定的 形式時;當(dāng)主試者在安排測驗條件上有較多余地(例如個別實施)測時;當(dāng)測驗是對幼兒、 有情緒困擾者以及對測驗程序不熟悉的人施測時,主試者的影響更大。 、意外干擾 在測驗環(huán)境復(fù)雜,特別是當(dāng)受試人數(shù)較多時,容易發(fā)生出乎意料的干擾或分心事件。 例如:停電、有人生病、有人作弊、計時表停了、臨時發(fā)現(xiàn)題目或作答紙張印刷不清或裝 訂錯誤等,無論哪種情況都會引起不安和擾亂,導(dǎo)致成績不準(zhǔn)確、不一致。 、評分計分 評分不客觀以及計算登記分?jǐn)?shù)出錯也是常見的誤差。一般選擇題的

7、評分教為客觀。而 問答題、論文題等自由反應(yīng)型的題目,評分標(biāo)準(zhǔn)很難掌握,加之閱卷者的偏好個不相同, 因而難以保證分?jǐn)?shù)的一致性。不僅各教師間有此差異,即使是同一教師一次評許多卷,受 情緒疲勞、外界干擾、卷面整潔、考試前后位置引起的對比效應(yīng)以及對學(xué)生成見的影響, 標(biāo)準(zhǔn)也可能不統(tǒng)一,甚至同一張試卷隔一段事件再評,前后給分也可能不一致。至于學(xué)校 間、地區(qū)間的差別就更大了。 為了控制與施測過程有關(guān)的誤差,主試者必須嚴(yán)格遵循標(biāo)準(zhǔn)化程序施測和評分,不得 任意改動和發(fā)揮,同時要機智地處理各種意外情況。 6培訓(xùn)類 真分?jǐn)?shù)理論 真分?jǐn)?shù)是一個在理論上構(gòu)想出來的概念真分?jǐn)?shù)是一個在理論上構(gòu)想出來的概念 真分?jǐn)?shù)真分?jǐn)?shù):一個

8、測量工具在沒有測量誤差時,所得到的真正值。:一個測量工具在沒有測量誤差時,所得到的真正值。 真分?jǐn)?shù)的操作定義真分?jǐn)?shù)的操作定義:經(jīng)過無數(shù)次測量所得的平均值。:經(jīng)過無數(shù)次測量所得的平均值。 真分?jǐn)?shù)的定義表明,一個人在一個測驗上所得的分?jǐn)?shù),是他真分?jǐn)?shù)的定義表明,一個人在一個測驗上所得的分?jǐn)?shù),是他 的真分?jǐn)?shù)的函數(shù),也是測量誤差的函數(shù),用公式表示如下:的真分?jǐn)?shù)的函數(shù),也是測量誤差的函數(shù),用公式表示如下: X=T+E 這里這里X為實得分?jǐn)?shù)或觀測分?jǐn)?shù),為實得分?jǐn)?shù)或觀測分?jǐn)?shù),T是假設(shè)的真分?jǐn)?shù),是假設(shè)的真分?jǐn)?shù),E 是測量誤差。是測量誤差。 7培訓(xùn)類 X=T+E 這里X為實得分?jǐn)?shù)或觀測分?jǐn)?shù), T是假設(shè)的真分?jǐn)?shù),E

9、是測量誤差。 E僅指隨機誤差,不包括系統(tǒng)誤差(I),后 者不引起分?jǐn)?shù)的改變,因而包含在真值中。 即,T=V+I V I E X 圖 4-8 實得分?jǐn)?shù)、真分?jǐn)?shù)和誤差的關(guān)系 T 8培訓(xùn)類 誤差與真分?jǐn)?shù)、和實得分?jǐn)?shù)的關(guān)系 在公式在公式3-1中,中,E可能是正的,也可能是負(fù)的。這就是說,一個人的實得可能是正的,也可能是負(fù)的。這就是說,一個人的實得 分?jǐn)?shù)可能大于真實量,也可能小于真實量,總是圍繞著真值上下波動。分?jǐn)?shù)可能大于真實量,也可能小于真實量,總是圍繞著真值上下波動。 關(guān)于測量誤差(關(guān)于測量誤差(E)有以下假設(shè):)有以下假設(shè): (1)如果對一個人測量無數(shù)次,其平均誤差為)如果對一個人測量無數(shù)次,其平

10、均誤差為0, 即即E0 (2)真分?jǐn)?shù)和測量誤差是相互獨立的,)真分?jǐn)?shù)和測量誤差是相互獨立的, 即即 rTE0 (3)誤差分?jǐn)?shù)和實得分?jǐn)?shù)的相關(guān)為)誤差分?jǐn)?shù)和實得分?jǐn)?shù)的相關(guān)為0, 即即 rXE0 9培訓(xùn)類 真分?jǐn)?shù)理論 與 信度 效度 10培訓(xùn)類 實得分?jǐn)?shù)(X)中的變異 (SX2)實得分?jǐn)?shù)變異實得分?jǐn)?shù)變異 (ST2)真分?jǐn)?shù)的變異真分?jǐn)?shù)的變異 (SV2)有效變異數(shù)有效變異數(shù) (SE2)隨機誤差變異隨機誤差變異 (SI2)系統(tǒng)誤差變異系統(tǒng)誤差變異 (ST2SX2)測驗的信度測驗的信度 (SV2SX2)測驗的效度測驗的效度 11培訓(xùn)類 效度和效度的定義 信度信度在心理測量理論中被定義為在心理測量理論中被定

11、義為: 在一列測量數(shù)據(jù)中,在一列測量數(shù)據(jù)中,真分?jǐn)?shù)真分?jǐn)?shù)變異變異( 2 T )在在總變異總變異( 2 X )中中 占占的的比例比例。真分?jǐn)?shù)變異在總變異中占的比例越大,說明隨機誤真分?jǐn)?shù)變異在總變異中占的比例越大,說明隨機誤 差對差對測量結(jié)果的測量結(jié)果的影響越小,則測量工具的信度越高影響越小,則測量工具的信度越高。 2 2 X T XX r 效度在心理測量理論中被定義為效度在心理測量理論中被定義為: 在一列測量數(shù)據(jù)中,與測量目的有在一列測量數(shù)據(jù)中,與測量目的有關(guān)的真實變異關(guān)的真實變異( 2 V )與與 總變異的比率??傋儺惖谋嚷省?2 2 X V XY r 一個測驗的效度表明,在一組測驗分?jǐn)?shù)中,有

12、多一個測驗的效度表明,在一組測驗分?jǐn)?shù)中,有多大大比例的變比例的變 異是異是由由測驗所要測量的因素引起的。測驗所要測量的因素引起的。 12培訓(xùn)類 信度和效度的關(guān)系 信度信度(S(ST T2 2S SX X2 2) ) 當(dāng)隨機誤差的變異當(dāng)隨機誤差的變異(SE2)減減 少時,真分?jǐn)?shù)的變異少時,真分?jǐn)?shù)的變異(ST2)增加,測增加,測 驗的信度隨之提高。驗的信度隨之提高。 效度效度( (SV2 S SX X2 2) ) n信度的提高只給有效變異信度的提高只給有效變異 數(shù)數(shù)(SV2)的增加提供可能。的增加提供可能。 n至于是否能提高效度,還至于是否能提高效度,還 要看系統(tǒng)誤差要看系統(tǒng)誤差(SI2)的大小。

13、的大小。 n可見,信度高不一定效度可見,信度高不一定效度 高。但一個測驗要想效度高,高。但一個測驗要想效度高, 真分?jǐn)?shù)的變異必須占較大的真分?jǐn)?shù)的變異必須占較大的 比重,即測驗的信度必須高。比重,即測驗的信度必須高。 13培訓(xùn)類 信度效度關(guān)系的數(shù)學(xué)表達 xxxy rr rXY表示實得效度系數(shù)表示實得效度系數(shù)(程序程序X 得分與外部效標(biāo)得分與外部效標(biāo)Y分?jǐn)?shù)之間的相分?jǐn)?shù)之間的相 關(guān)關(guān)),rXX表示測量程序的信度。表示測量程序的信度。 式中顯示:信度是效度的極限值式中顯示:信度是效度的極限值 或或上限上限。換言之,由于測量的不。換言之,由于測量的不 可信而降低了效度??尚哦档土诵Ф?。 yy xy x

14、t r r r 但是,在一些效標(biāo)或預(yù)測因子中存在 某種程度的不可信是不可避免的。 當(dāng)效標(biāo)的信度已知,可以用左面的 公式在統(tǒng)計上對這種不可信進行校 正: 14培訓(xùn)類 3信度指數(shù)和信度系數(shù)信度指數(shù)和信度系數(shù) 信度信度指數(shù)指數(shù)(reliability index) :) :在心理測量理論中,在心理測量理論中,某某一一測測 驗的驗的真真分?jǐn)?shù)與實得分?jǐn)?shù)間的相關(guān)系數(shù)為測驗的信度指數(shù)。分?jǐn)?shù)與實得分?jǐn)?shù)間的相關(guān)系數(shù)為測驗的信度指數(shù)。變異變異 數(shù)與總變數(shù)與總變異數(shù)(實得變異)的比率。即異數(shù)(實得變異)的比率。即: TX XT N xt r 根據(jù)真分?jǐn)?shù)和誤差的性質(zhì),可推導(dǎo)出根據(jù)真分?jǐn)?shù)和誤差的性質(zhì),可推導(dǎo)出 X T

15、XT r 式中:式中: XT r 代表信度代表信度指數(shù)指數(shù); T 真分?jǐn)?shù)的標(biāo)準(zhǔn)差;真分?jǐn)?shù)的標(biāo)準(zhǔn)差; X 實得分?jǐn)?shù)實得分?jǐn)?shù)(觀測分?jǐn)?shù)觀測分?jǐn)?shù))的標(biāo)準(zhǔn)差。的標(biāo)準(zhǔn)差。 15培訓(xùn)類 信度系數(shù)信度系數(shù)(reliability coefficient) :可定義為平行測驗分?jǐn)?shù)) :可定義為平行測驗分?jǐn)?shù) 之間的相關(guān)系數(shù)。 如果用之間的相關(guān)系數(shù)。 如果用 1 x和和 2 x分別表示一組受測者在兩套平行分別表示一組受測者在兩套平行 測驗中所得的離差分?jǐn)?shù),則:測驗中所得的離差分?jǐn)?shù),則: 21 21 21 XX XX N xx r 根據(jù)真分?jǐn)?shù)和誤差的性質(zhì),可推導(dǎo)出根據(jù)真分?jǐn)?shù)和誤差的性質(zhì),可推導(dǎo)出 2 2 21 X

16、T XX r 則則 2 21 XTXX rr 2 T 代表真分?jǐn)?shù)的變異;代表真分?jǐn)?shù)的變異; 2 X 代表實得分?jǐn)?shù)的變異, 即代表實得分?jǐn)?shù)的變異, 即 總變異??傋儺?。 由此,由此,我們可以看出,信度系數(shù)可以用數(shù)學(xué)語言定義為:真我們可以看出,信度系數(shù)可以用數(shù)學(xué)語言定義為:真 分?jǐn)?shù)方差與觀測分?jǐn)?shù)方差的比率分?jǐn)?shù)方差與觀測分?jǐn)?shù)方差的比率,或者是信度指數(shù)的平方?;蛘呤切哦戎笖?shù)的平方。 16培訓(xùn)類 4 4信度信度信息的解釋信息的解釋 要解釋信度信息,須作以下區(qū)別:要解釋信度信息,須作以下區(qū)別: (1) 21X X r 觀測分?jǐn)?shù)變異中可歸因于受測者真分?jǐn)?shù)觀測分?jǐn)?shù)變異中可歸因于受測者真分?jǐn)?shù) 中變動的比例部分中

17、變動的比例部分 (2)( 21X X r )2一份平行測驗上所得的觀測分?jǐn)?shù)變異一份平行測驗上所得的觀測分?jǐn)?shù)變異 中能用另一份平行測驗的觀測分?jǐn)?shù)的變異預(yù)測的比中能用另一份平行測驗的觀測分?jǐn)?shù)的變異預(yù)測的比例部分例部分 (3) XT r 真分?jǐn)?shù)和觀測分?jǐn)?shù)的相關(guān)真分?jǐn)?shù)和觀測分?jǐn)?shù)的相關(guān) 17培訓(xùn)類 假設(shè)一份測驗手冊報告信度系數(shù)假設(shè)一份測驗手冊報告信度系數(shù)2 1X X r = =0 0.81.81,那么那么 我們我們可以作如下可以作如下解釋解釋: 第一,觀測分?jǐn)?shù)方差的第一,觀測分?jǐn)?shù)方差的 8l歸因于該受測者組的真分?jǐn)?shù)歸因于該受測者組的真分?jǐn)?shù) 的方差的方差(即,(即, 2 T =0.81 2 X ) ;)

18、;如果觀測分?jǐn)?shù)的標(biāo)準(zhǔn)差為如果觀測分?jǐn)?shù)的標(biāo)準(zhǔn)差為 4, 我們可以預(yù)測,不可觀測的真分?jǐn)?shù)分布的標(biāo)準(zhǔn)差應(yīng)該為我們可以預(yù)測,不可觀測的真分?jǐn)?shù)分布的標(biāo)準(zhǔn)差應(yīng)該為 T =1681. 0 =3.6。 第二,我們可以說,第二次測驗觀測分?jǐn)?shù)的方差的第二,我們可以說,第二次測驗觀測分?jǐn)?shù)的方差的 65 的部分能夠用第一次測驗的觀測分?jǐn)?shù)方差預(yù)測的部分能夠用第一次測驗的觀測分?jǐn)?shù)方差預(yù)測(即,(即, 0.812) 。 第三,第三,我們可以認(rèn)為,對這些受測者來說這些觀測分?jǐn)?shù)我們可以認(rèn)為,對這些受測者來說這些觀測分?jǐn)?shù) 和真分?jǐn)?shù)之間的相關(guān)為和真分?jǐn)?shù)之間的相關(guān)為 81. 0 或或 0.90。 2 2 X T XX r 式中:式中:XX r 代表信度代表信度指數(shù)指數(shù); 2 T 代表真分?jǐn)?shù)的變異;代表真分?jǐn)?shù)的變異; 2 X 代表實得分?jǐn)?shù)的變異,即總變異。代表實得分?jǐn)?shù)的變異,即總變異。 18培訓(xùn)類 需要注意的是,真分?jǐn)?shù)是不能直接測量的,因此,需要注意的是,真分?jǐn)?shù)是不能直接測量的,因此,心理心理 測驗的測驗的信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論