測驗信度效度_第1頁
測驗信度效度_第2頁
測驗信度效度_第3頁
測驗信度效度_第4頁
測驗信度效度_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、心理測驗客觀性的常用指標(biāo) 11、信度: reliability 2、 效度;validity3、 項目分析(難度和鑒別力)21、信度 指測驗結(jié)果的可靠程度。只有測驗結(jié)果接近或等于實際真值,或多次測驗結(jié)果十分接近,就可以認(rèn)為測驗結(jié)果是可靠的。 科學(xué)的東西必須能夠重復(fù),兩次測驗的結(jié)果必須具有一定的一致性,差異比較小,信度問題實質(zhì)是一組被試兩次測驗結(jié)果的一致性問題。測驗的可靠性,是指對某一群體而言,不是針對某一個被試而言。 信度高低可以用相關(guān)系數(shù)來表示。3 信度的作用和意義作用:1)解釋預(yù)測個人分?jǐn)?shù)的意義 2)解釋真實分?jǐn)?shù)與實得分?jǐn)?shù)間的關(guān)系 3)確定測驗好壞的一個指標(biāo);最理想 r=1.00意義:1)

2、信度系統(tǒng)為樣本測驗分?jǐn)?shù)的總方差中有多少比例是真分?jǐn)?shù)方差,也就是測驗的總變異中真分?jǐn)?shù)造成的變異占百分之幾2)測量的標(biāo)準(zhǔn)誤是有多大可能性真實分?jǐn)?shù)在某一分?jǐn)?shù)范圍內(nèi)。并且可以預(yù)測實得分?jǐn)?shù)再測時可能的變化情況。4 信度估計方法 (1)重測信度 考慮誤差來源是時間取樣,主要針對時間變量,采集數(shù)據(jù)方法是對同一組被試間隔一定的時間相同的測驗重復(fù)測試一次,計算方法是積差相關(guān)法,求得首測與再測這兩次測驗的相關(guān) 。時間間隔選擇依測驗性質(zhì)和目的而定。 不是所有測驗都可以計算重測信度,如:智力測驗,成就測驗;重測信度只反映了隨機誤差的影響,而不是反映被試心理特點的長期變化。5(2)復(fù)本信度 又叫等值性系統(tǒng),考慮誤差來源

3、是內(nèi)容取樣,采集數(shù)據(jù)方法:給被試施測兩個內(nèi)容等值但題目不同的測驗,即:一個測驗有平行的兩個版本測驗A、B,先作A式測驗,在最短時間內(nèi)再作測驗B式,求兩組數(shù)值的相關(guān),計算積差相關(guān)法。 復(fù)本信度的高低反映兩個互為復(fù)本的測驗等價的程度,而不是反映一個測驗本身受隨機誤差影響的大小,關(guān)鍵取決于復(fù)本測驗的選擇。6(3)分半信度(內(nèi)在一致性信度) 劈半信度或折半信度,如智力測驗,成就測驗,是一種將測驗分成等值的兩半來求相關(guān)系統(tǒng)的信度??疾煲粋€測驗內(nèi)容兩伴題目測量的是否同一個心理特點或行為。采集數(shù)據(jù)方法:一次測驗結(jié)束后,將測驗按一定標(biāo)準(zhǔn)分為等值的兩半,分別計算每位被試在兩半測驗上的分?jǐn)?shù),求出相關(guān)系數(shù),計算用積

4、差相關(guān)法。 常用的方法是將一個測驗分裂為兩個假定相等而獨立的部分,然后計算這兩部分的得分相關(guān)系數(shù)(如奇偶項),之后再用斯皮爾曼布朗公式(2r/1+r)估計整個測驗的信度。7(4)同質(zhì)性信度 同質(zhì)性信度:考慮測驗內(nèi)容是否異質(zhì),同質(zhì)性是測同一種心理行質(zhì)或行為,測驗所有題目間性質(zhì)的一致性,同質(zhì)性是測驗單一特質(zhì)的必要條件。判別標(biāo)準(zhǔn):題目間呈高正相關(guān)。數(shù)據(jù)采集方法:施測一次測驗,算出所有題的得分,求出各題目的相關(guān), 同質(zhì)性信度也是一種構(gòu)思效度,或叫結(jié)構(gòu)效度。8(5)評分者信度 評分信度:考慮測驗隨機誤差來源是評分者間的差別,由評分者造成,用積差相關(guān)法求得不同評分者所評 分值間的相關(guān)。 2個評分者用斯皮爾

5、曼等級相關(guān)法,3人以上用肯德爾和諧系統(tǒng)。9影響信度的因素 1) 樣本特征:樣本團體得分分布的影響,樣本越分散信度越高;樣本團體異質(zhì)性的影響,異質(zhì)性越高信度越高;樣本團體平均能力水平的影響,平均能力越低信度越高2) 測驗的長度:測驗越長題目越多,測驗的內(nèi)容取樣就越有代表性;測驗越長被試的猜測因素影響越小,信度就高。3) 測驗的難度:測驗難度對信度有間接影響。對于人格測驗、興趣、態(tài)度、價值觀等測驗,不存在難度問題。從理論上說,只有難度水平為50%時,才能使測驗分?jǐn)?shù)分布范圍最大,求得的信度也最高。4) 測量的時間間隔:時間間隔只對重測信度和不同時測量的復(fù)本有影響,時間越短信度值越高。102、 效度

6、它表示一個測驗實際測量出所測特性或功能的真實性程度,或它指一個測驗真正確實地測量到它所欲測量的東西的程度。含義:1)測驗測量什么? 2)測驗對測量目標(biāo)的測量精確度和真實性是多少? 同一測驗中其它條件相同時,效度必然低于信度。往往效度比信度更重要。11 鑒別一個測驗的好壞,首要的指標(biāo)就是效度。 效度是針對測驗?zāi)康亩缘?。不同測驗有不同的目的。比如智力測驗,如果用來測驗智力就可能是高效的,用來測驗性格則肯定是無效的。所以在使用心理測驗時必須明白測驗的目的。12效度估計方法 (1)內(nèi)容效度 表示測驗所選的題目(測題)符合所欲測驗內(nèi)容的程度。是測驗題目對有關(guān)內(nèi)容或行為總體取樣的適當(dāng)性程度。能力傾向和人

7、格測驗不適合作內(nèi)容效度確定內(nèi)容效度的方法: 邏輯法:專家判斷,專家對測驗題目進(jìn)行考核,看測驗是否能夠測出所要測的內(nèi)容; 經(jīng)驗法:經(jīng)驗判斷,通過實踐檢查測驗?zāi)芊駵y出欲測的內(nèi)容。 統(tǒng)計法:統(tǒng)計分析,通過統(tǒng)計學(xué)對項目進(jìn)行分析。13(2)結(jié)構(gòu)效度 也叫構(gòu)想效度,表示測驗實際測量出所欲測量的心理結(jié)構(gòu)或特征的程度。用一個結(jié)構(gòu)框架去衡量效度。構(gòu)思效度無單一指標(biāo),由各方面證據(jù)累積直接來作出評價。 確定方法:測驗內(nèi)部方法,測驗間方法,效標(biāo)效度研究,實驗和觀察法驗證 14(3)效標(biāo)關(guān)聯(lián)效度 又稱效標(biāo)效度,實證效度或準(zhǔn)則關(guān)聯(lián)效度。它是測驗分?jǐn)?shù)與作為效標(biāo)的另一獨立測驗結(jié)果之間的一致性程度;或測驗總分?jǐn)?shù)與外在標(biāo)準(zhǔn)之間的

8、相關(guān)程度,反映的是用測驗預(yù)測個體在某種情境下行為表現(xiàn)如何的有效性程度。 同時效度:效標(biāo)資料與測驗分?jǐn)?shù)同時獲得。主要用來查明新編測驗的效度。 預(yù)測效度:效標(biāo)分?jǐn)?shù)在測驗之后相當(dāng)長時間獲得。主要用來評價測驗的預(yù)測能力。反映從測驗分?jǐn)?shù)預(yù)測任何效標(biāo)情境或一段時間后被試的行為表現(xiàn)程度 常用效標(biāo):學(xué)業(yè)成就,臨床診斷,實際工作表現(xiàn),特殊訓(xùn)練成績,效標(biāo)團體比較,先前有效測驗,等級評定。15(4)表面效度 它是一個測驗看起來好像是測量所要測的東西的程度,不是效度,不反映測驗正測量的東西,只是外行人的一種評價。16影響效度的因素 1) 測驗本身因素,包括:測驗題目質(zhì)量,測驗長度,測驗實施中的干擾,被試因素,增加測驗

9、誤差,降低測驗效應(yīng)。 2) 測驗施測的樣本性質(zhì),樣本同質(zhì)性越高,效度越低。不同團體對同一測驗反應(yīng)可能不同;同一測驗,效度團體性質(zhì)不同;樣本團體的異質(zhì)性 3) 效標(biāo)的性質(zhì):若其它條件一樣,所測量的行為或心理特質(zhì)與效標(biāo)行為或特質(zhì)越相似,效度系統(tǒng)就越高17信度和效度的關(guān)系 St2=Sco2+Ssp2+Se2 St2 :總分變差。 Sco2 :由所測量的心理特性引起的主要變差。 Ssp2 :由與所測量的特性無關(guān)的其它個別性質(zhì)所造成的變差(系統(tǒng)誤差引起的變差)。 Se2 :誤差變異。 rtt=(Sco2+Ssp2) / St2 ; Val= Sco2 / St218信度和效度的關(guān)系說明:相同:信度和效度

10、是以相關(guān)系統(tǒng)來表示的不同:涉及的誤差不同,信度僅考慮偶然的隨機誤差占測驗總變異的比例;效度則還包括與測驗無關(guān)但穩(wěn)定的測量誤差聯(lián)系:1)信度是效度的必要而非充分條件,信度越高,效度不一定越高2)效度是受信度制約的,在同一個測驗里其信度必然高于效度,至少相等。193、項目分析(難度和鑒別力) 測驗的好壞與項目(測題)的選擇有很大的關(guān)系,好的測題是鑒別力高并且難度適宜的項目。項目分析三內(nèi)容1) 誘答分析:每個項目只有一個正確答案其余均為誘答。2) 難度分析:通過率:回答某個項目的樣本中,正確回答該項目的人數(shù)P=R/N*100。3) 鑒別力分析:鑒別力是對于所測量的心理特性的區(qū)分能力。20(1)項目難度 項目難度是衡量測題難易水平的數(shù)量指標(biāo)。估計項目難度的方法通常是以被試通過每個項目的百分比來決定的,如果一個項目通過百分比太高或太低,說明該項目太易或太難,一般情況下這兩個項目應(yīng)該刪除。 通過率:回答某個項目的樣本中,正確回答該項目的人數(shù)P=R/N*100, 項目的平均難度接近0.50,各項目難度在0.50

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論