版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、心理測(cè)量學(xué),感悟測(cè)量,測(cè)量無處不在,城市夜晚燈光亮度與GDP,科學(xué)家發(fā)現(xiàn)可以通過太空拍攝城市夜間燈光亮度,來反映全球各國(guó)經(jīng)濟(jì)的發(fā)展水平。,這是一張衛(wèi)星合成圖。一些國(guó)家經(jīng)濟(jì)增長(zhǎng)迅速,建了更多的基礎(chǔ)設(shè)施(如街道照明),而人們晚上也會(huì)打開更多的燈。這表明,從太空中看到的夜間燈光強(qiáng)度與一個(gè)國(guó)家的國(guó)內(nèi)生產(chǎn)總值存在關(guān)聯(lián)。在某些相關(guān)經(jīng)濟(jì)數(shù)據(jù)極少或存在誤導(dǎo)的地區(qū),這種經(jīng)濟(jì)情況評(píng)估方式會(huì)大有用武之地。,這是北美地區(qū)夜間燈光的分布情況。北美是世界上最富裕的地區(qū)之一。,西歐的夜晚同樣是燈火通明,這張圖顯示的是南美海岸、哥倫比亞北部和委內(nèi)瑞拉的人口稠密地區(qū)。不難看出,內(nèi)陸地區(qū)燈光強(qiáng)度相對(duì)很弱。,亞洲既有發(fā)達(dá)國(guó)家,也有
2、發(fā)展中國(guó)家,中印兩國(guó)經(jīng)濟(jì)的快速增長(zhǎng)尤其引人注意。這張圖上,還可以看到日本稠密的燈光覆蓋情況。對(duì)比最明顯的是南北朝鮮。,2012年中國(guó)家庭金融調(diào)查與研究中心發(fā)布一份中國(guó)家庭金融調(diào)查報(bào)告稱,中國(guó)家庭資產(chǎn)平均為121.69萬元,城市家庭平均為247.60萬元;中國(guó)家庭自有住房擁有率為89.68%,遠(yuǎn)超世界60%左右的水平,甚至高過美國(guó)和日本;2011年中國(guó)城市戶均擁有住房為1.22套。,事實(shí)上這一報(bào)告的出爐,引起了人們的議論。與人們對(duì)人均GDP的反應(yīng)一樣,首先認(rèn)為數(shù)據(jù)準(zhǔn)確度不高;其次,驚呼自己拖了國(guó)家的后腿。,這一數(shù)據(jù)與我們的現(xiàn)實(shí)感受符合嗎?,為什么人們的感受與數(shù)據(jù)存在差距呢?,一個(gè)原因可能數(shù)據(jù)的準(zhǔn)
3、確性上確實(shí)存在偏差;另一個(gè)可能的原因在于求平均。比如你的隔壁住了一位富翁,資產(chǎn)1000萬,你身無分文,但平均資產(chǎn)都是500萬,瞬間變成了富翁,“心”如何測(cè)量?,心理小測(cè)驗(yàn)1,假如你的戀人在一個(gè)孤立的小島上,小島沒有陸地之間沒有橋,請(qǐng)你選擇到去小島的方式。 A 劃船過去 B 坐烏龜過去 C 不過去 D 游泳過去 請(qǐng)?jiān)诩埳蠈懴履愕拇鸢福?此測(cè)驗(yàn)是性取向測(cè)驗(yàn)。 劃船過去正常的異性戀 坐烏龜過去性變態(tài) 不過去性冷淡 游泳過去同性戀,心理小測(cè)驗(yàn)2,請(qǐng)你回憶自己洗澡的順序,選擇你最后清洗的部位: A 頭發(fā) B 面部 C 隱私部位 D 腿 請(qǐng)?jiān)诩埳蠈懴履愕拇鸢福?此測(cè)驗(yàn)是一項(xiàng)自信測(cè)驗(yàn)。 最后清洗的部位即為你
4、最不自信的部位!,剛才的兩個(gè)測(cè)驗(yàn)科學(xué)嗎? 這兩個(gè)測(cè)驗(yàn)是“三無產(chǎn)品”,且施測(cè)過程缺乏科學(xué)性。,科學(xué)心理測(cè)量學(xué)的主要內(nèi)容,第一節(jié) 概述 第二節(jié) 測(cè)驗(yàn)的常模 第三節(jié) 測(cè)驗(yàn)的信度 第四節(jié) 測(cè)驗(yàn)的效度 第五節(jié) 項(xiàng)目分析 第六節(jié) 測(cè)驗(yàn)編制的一般程序 第七節(jié) 心理測(cè)驗(yàn)的使用,第一節(jié) 概述,第一單元 測(cè)量與測(cè)量量表 第二單元 心理測(cè)驗(yàn)的基本概念 第三單元 心理測(cè)驗(yàn)的分類 第四單元 糾正錯(cuò)誤的測(cè)驗(yàn)觀 第五單元 心理測(cè)驗(yàn)在心理咨詢中的應(yīng)用 第六單元 心理測(cè)驗(yàn)的發(fā)展史,第一單元 測(cè)量與測(cè)量量表,一、什么是測(cè)量 二、測(cè)量要素 三、測(cè)量量表,一、什么是測(cè)量,測(cè)量就是依據(jù)一定的法則用數(shù)字對(duì)事物加以確定。 三個(gè)主要的元素:
5、(1)事物;(2)數(shù)字;(3)法則。,1.所謂“事物”,指的是我們要測(cè)量的對(duì)象,更準(zhǔn)確地說,就是引起我們興趣的事物的屬性或特征。 2.所謂“數(shù)字”,是代表某一事物或事物某一屬性的量。數(shù)字的特性: 區(qū)分性1與2 等級(jí)性或位次性3 2 1 等距性 321、 211 可加性 3.所謂“法則”,代表的是測(cè)量所依據(jù)的規(guī)則和方法,測(cè)量三元素,二、測(cè)量要素,(一)參照點(diǎn) 參照點(diǎn)就是確定事物的量時(shí),計(jì)算的起點(diǎn)。 參照點(diǎn)有兩種: 絕對(duì)零點(diǎn):重量,長(zhǎng)度 人定的參照點(diǎn),即相對(duì)零點(diǎn):智力,新生兒能說他沒有智力嗎? (二)單位 好的單位必須具備兩個(gè)條件: 確定的意義:所有人理解的意義都一樣 相同的價(jià)值:相鄰單位之間的差
6、別是相等的 心理測(cè)驗(yàn)對(duì)象往往難以滿足這兩個(gè)條件,思考:1.小明考試得了60分,說明了什么? 2.小明考試得了60分,班里排名第三說明了什么? 3.小明考試得了60分,班里排名第三,班里共5人,說明了什么?,三、測(cè)量量表,測(cè)量的本質(zhì)是根據(jù)某一法則將事物數(shù)量化,即在一個(gè)定有單位和參照點(diǎn)的連續(xù)體上把事物的屬性表現(xiàn)出來,這個(gè)連續(xù)體稱為量表。 由于制定量表的單位和參照點(diǎn)不同,量表的種類也不同。,四類量表(斯蒂文斯),(一)命名量表(和,或) 是最低水平量表,只用數(shù)字來代表事物或把事物歸類,具體分為兩種: (1)代號(hào)用數(shù)字代表個(gè)別事物,如編號(hào)、學(xué)號(hào) (2)類別用數(shù)字代表具有某一屬性的事物的全體,即用數(shù)字代
7、表某一群體 命名量表,數(shù)字反映差別(代號(hào))與類別(分類),不能數(shù)量化分析,不能做加減乘除運(yùn)算 (二)順序量表(,) 反映差別并對(duì)事物分類,也反映事物某方面屬性的程度,如名次、級(jí)別、喜好程度等 順序量表無相等單位和絕對(duì)零點(diǎn),僅表示等級(jí),(三)等距量表 反映差別并對(duì)事物分類;反映先后、大小和強(qiáng)度等;有相等的單位(能加減);沒有絕對(duì)的零點(diǎn)(不能乘除) 等距量表的數(shù)值加、減一個(gè)常數(shù)不影響等距關(guān)系。因此,一個(gè)量表上的數(shù)值可以轉(zhuǎn)換為另一個(gè)具有不同單位的量表上的數(shù)值,而且?guī)讉€(gè)不同單位的數(shù)值可以轉(zhuǎn)換到一個(gè)量表上便于比較。 (四)等比量表 反映差別并對(duì)事物分類;反映先后、大小和強(qiáng)度等;有相等的單位;有絕對(duì)的零點(diǎn)
8、 可以加減乘除。,心理測(cè)量是在順序量表上進(jìn)行的并且可以將順序量表轉(zhuǎn)化為等距量表,這些說法合理嗎?,我比你聰明一百倍! 我心理比你健康一百倍? 青海西寧夏天平均溫度是15度,陜西西安夏天平均溫度是30度,西安的炎熱度是西寧的兩倍。,第二單元 心理測(cè)驗(yàn)的基本概念,一、心理測(cè)驗(yàn)的定義 二、心理測(cè)驗(yàn)的性質(zhì),一、心理測(cè)驗(yàn)的定義,所謂心理測(cè)驗(yàn),就是依據(jù)心理學(xué)理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對(duì)于貫穿在人的全部行為活動(dòng)中的心理特點(diǎn)做出推論和數(shù)量化分析的一種科學(xué)手段。,1.心理測(cè)量的對(duì)象是人的行為(不是對(duì)心理的直接測(cè)量) 2.心理測(cè)量往往只是對(duì)少數(shù)人經(jīng)過慎重選擇的行為樣本進(jìn)行觀察,來間
9、接推知受測(cè)者的心理特征。(心理測(cè)驗(yàn)出現(xiàn)偏差的原因) 3.測(cè)驗(yàn)條件對(duì)所有的受測(cè)者都必須相同(測(cè)驗(yàn)的編制、印刷、施測(cè)、評(píng)分標(biāo)準(zhǔn)化) 4.原始分?jǐn)?shù)不具有意義,須與常模比較(85分屬于高分還是低分?),二、心理測(cè)驗(yàn)的性質(zhì),(一)間接性 (二)相對(duì)性 (三)客觀性,心理測(cè)驗(yàn)的間接性,研究者無法直接測(cè)量人的心理,只能測(cè)量人的外顯行為,也就是說,只能通過一個(gè)人對(duì)測(cè)驗(yàn)題目的反應(yīng)來推論他的心理特質(zhì)。,心理測(cè)驗(yàn)的相對(duì)性,人的心理與行為沒有絕對(duì)標(biāo)準(zhǔn),只有一個(gè)連續(xù)的行為序列。心理測(cè)驗(yàn)就是確定個(gè)人處在行為序列的什么位置。 連續(xù)序列是由某一個(gè)團(tuán)體或一群人的某類行為特點(diǎn)或心理特征構(gòu)成,所以每個(gè)人被測(cè)得的結(jié)果都是與所在團(tuán)體或
10、大多數(shù)人群的行為相比較而言。,心理測(cè)驗(yàn)的客觀性,所測(cè)量的對(duì)象(心理)是客觀存在的; 心理測(cè)驗(yàn)是標(biāo)準(zhǔn)化的測(cè)驗(yàn): 測(cè)驗(yàn)用的項(xiàng)目或作業(yè)、施測(cè)說明、施測(cè)者的言語態(tài)度及施測(cè)時(shí)的環(huán)境等,要要求標(biāo)準(zhǔn)化,測(cè)驗(yàn)的刺激是客觀的。 測(cè)驗(yàn)評(píng)分記分的原則和手續(xù)也要經(jīng)過標(biāo)準(zhǔn)化,使反應(yīng)的量化是客觀的。 最后,分?jǐn)?shù)轉(zhuǎn)換和解釋標(biāo)準(zhǔn)化,對(duì)結(jié)果的推論是客觀的。,第三單元 心理測(cè)驗(yàn)的分類,按測(cè)驗(yàn)的功能分類 按測(cè)驗(yàn)材料的性質(zhì)分類 按測(cè)驗(yàn)材料的嚴(yán)謹(jǐn)程度分類 按測(cè)驗(yàn)的方式分類 按測(cè)驗(yàn)的要求分類,一、按測(cè)驗(yàn)的功能分類,(一)智力測(cè)驗(yàn) 測(cè)量人的一般智力水平 (二)特殊能力測(cè)驗(yàn) 測(cè)量個(gè)人的特殊潛在能力,如繪畫、寫作、機(jī)械等 (三)人格測(cè)驗(yàn) 測(cè)量
11、人的性格、氣質(zhì)、興趣、態(tài)度、動(dòng)機(jī)等。測(cè)驗(yàn)方法包括問卷法和投射法 艾森克人格問卷EPQ 卡特爾16種人格因素16PF 明尼蘇達(dá)多項(xiàng)人格問卷MMPI,二、按測(cè)驗(yàn)的性質(zhì)分類,(一)文字測(cè)驗(yàn) 文字測(cè)驗(yàn)所用的是文字材料,以言語提出刺激,受測(cè)者用言語作反應(yīng)。團(tuán)體測(cè)驗(yàn)多采用此種方式編制,施測(cè)方便 缺點(diǎn):受測(cè)者文化程度影響測(cè)驗(yàn)結(jié)果 (二)操作測(cè)驗(yàn) 也稱非文字測(cè)驗(yàn)。測(cè)驗(yàn)題項(xiàng)多屬于對(duì)圖形、實(shí)物、工具、模型的辨認(rèn)和操作,不受文化程度影響,可用于幼兒或文盲。如,瑞文和韋克斯勒,三、按測(cè)驗(yàn)材科的嚴(yán)謹(jǐn)程度分類,(一)客觀測(cè)驗(yàn) 測(cè)驗(yàn)中句子、圖形意義明確,明確界定,不需想象、猜測(cè)和遐想。絕大多數(shù)都屬于客觀測(cè)驗(yàn)。 (二)投射測(cè)
12、驗(yàn)羅夏墨跡、房樹人 測(cè)驗(yàn)沒有明確意義,問題模糊,對(duì)受測(cè)者反應(yīng)沒有明確界定。由受測(cè)者想象使之賦予意義,以此投射出受測(cè)者的思想、情感和經(jīng)驗(yàn)。,四、按測(cè)驗(yàn)的方式分類,(一)個(gè)別測(cè)驗(yàn) 測(cè)驗(yàn)以一對(duì)一的形式進(jìn)行。 優(yōu)點(diǎn):主測(cè)對(duì)受測(cè)言、行有仔細(xì)觀察,結(jié)果可靠。 缺點(diǎn):不能在短時(shí)間內(nèi)收集到大量資料,程序復(fù)雜,主測(cè)需接受嚴(yán)格訓(xùn)練,專業(yè)化程度高 (二)團(tuán)體測(cè)驗(yàn) 一個(gè)或幾個(gè)主測(cè)對(duì)較多的受測(cè)者同時(shí)進(jìn)行測(cè)驗(yàn)。 優(yōu)點(diǎn):時(shí)間經(jīng)濟(jì),主測(cè)不需要接受嚴(yán)格專業(yè)訓(xùn)練 缺點(diǎn):對(duì)受測(cè)者不能作切實(shí)控制,結(jié)果不及個(gè)別測(cè)驗(yàn),臨床上使用較少。 團(tuán)體測(cè)驗(yàn)可以用來個(gè)別測(cè)驗(yàn),但是個(gè)別測(cè)驗(yàn)一般不能用來團(tuán)體測(cè)驗(yàn),五、按測(cè)驗(yàn)的要求分類,(一)最高作為測(cè)驗(yàn)(
13、智力測(cè)驗(yàn)、成就測(cè)驗(yàn)) 要求受測(cè)者盡可能的作出做好的回答,與認(rèn)知過程有關(guān),有正確答案。 (二)典型行為測(cè)驗(yàn)(人格測(cè)驗(yàn)) 要求受測(cè)者按通常的習(xí)慣方式作出反應(yīng),沒有正確答案。,第四單元 糾正錯(cuò)誤的測(cè)驗(yàn)觀,錯(cuò)誤的測(cè)驗(yàn)觀 正確的測(cè)驗(yàn)觀,一、錯(cuò)誤的測(cè)驗(yàn)觀,(一)測(cè)驗(yàn)萬能論 認(rèn)為測(cè)驗(yàn)可以解決一切問題,迷信測(cè)驗(yàn),測(cè)驗(yàn)分?jǐn)?shù)絕對(duì)化 “福勒效應(yīng)” (二)測(cè)驗(yàn)無用論 人格測(cè)驗(yàn)侵犯隱私;測(cè)驗(yàn)為宿命論、種族歧視提供依據(jù);測(cè)驗(yàn)存在偏差。因此反對(duì)使用測(cè)驗(yàn) (三)心理測(cè)驗(yàn)即智力測(cè)驗(yàn) 心理測(cè)驗(yàn)=智力測(cè)驗(yàn)=智商=遺傳決定論,二、正確的測(cè)驗(yàn)觀,(一)心理測(cè)驗(yàn)是重要的心理學(xué)研究方法之一,是決策的輔助工具 心理測(cè)驗(yàn)僅僅是研究方法的一種,
14、是一種工具,對(duì)心理學(xué)研究與部門決策有一定的參考價(jià)值。 (二)心理測(cè)驗(yàn)作為研究方法和測(cè)量工具尚不完善 心理測(cè)驗(yàn)的理論基礎(chǔ)不夠堅(jiān)實(shí),因而作為方法與工具的測(cè)驗(yàn)尚不完善。,第五單元 心理測(cè)驗(yàn)在心理咨詢中的應(yīng)用,心理咨詢有效性的前提是對(duì)求助者的心理特性、問題有正確的評(píng)估和診斷。 目前,在心理門診中運(yùn)用較多的大致有三類心理測(cè)驗(yàn),即智力測(cè)驗(yàn)、人格測(cè)驗(yàn)以及心理評(píng)定量表。,智力測(cè)驗(yàn):韋氏成人、韋氏兒童、韋氏幼兒、瑞文智力障礙的診斷 人格測(cè)驗(yàn):EPQ,16PF,MMPI了解人格特性,尤其是MMPI能夠了解人格異常 心理評(píng)定量表:精神病評(píng)定量表、躁狂狀態(tài)評(píng)定量表、抑郁量表、焦慮量表、恐怖量表等。評(píng)分簡(jiǎn)便,以了解心理
15、障礙的存在與否及程度,并反映病情演變。(一般來說,這類量表僅僅作為診斷的參照,而不是唯一的依據(jù)),第六單元 心理測(cè)驗(yàn)的發(fā)展史,科學(xué)心理測(cè)驗(yàn)的產(chǎn)生和發(fā)展 現(xiàn)代心理測(cè)驗(yàn)在我國(guó)的發(fā)展,心理測(cè)量學(xué)歷史較短,但思想與實(shí)踐源遠(yuǎn)流長(zhǎng)。 始于漢代、興于隋唐的科舉制度被公認(rèn)為世界上最早的心理測(cè)量的實(shí)踐。 科學(xué)的心理測(cè)量于工業(yè)革命成功后的19世紀(jì)的歐洲發(fā)展起來的。,一、科學(xué)心理測(cè)驗(yàn)的產(chǎn)生與發(fā)展,高爾頓(FGalton)“怪誕心理學(xué)”第一人(19世紀(jì)80年代的十年) 提出人的不同氣質(zhì)特點(diǎn)和智能是按身體特點(diǎn)的不同而遺傳的。(遺傳決定論者) 為了研究差異的遺傳性,便設(shè)計(jì)了測(cè)量差異的方法。 為心理測(cè)驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ)。他
16、第一個(gè)提出了相關(guān)的概念,并由學(xué)生皮爾遜發(fā)展創(chuàng)立了積差相關(guān)法。,卡特爾(19世紀(jì)90年代十年),卡特爾是對(duì)心理測(cè)驗(yàn)發(fā)展做出巨大貢獻(xiàn)美國(guó)心理學(xué)家。 1890年,卡特爾在心理雜志上發(fā)表心理測(cè)驗(yàn)與測(cè)量一文,這是心理測(cè)驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。 倡導(dǎo)心理學(xué)的科學(xué)化“心理學(xué)若不立足于實(shí)驗(yàn)與測(cè)量上,決不能夠有自然科學(xué)之準(zhǔn)確性?!?倡導(dǎo)心理學(xué)的客觀化“心理測(cè)驗(yàn)如果有一個(gè)普遍的標(biāo)準(zhǔn),則其科學(xué)的與實(shí)用的價(jià)值都可以增加。” 主張測(cè)驗(yàn)手續(xù)和考試方法應(yīng)有統(tǒng)一規(guī)定,并要有常模以便比較。,比內(nèi)(ABinet)(20世紀(jì)頭十年) 1905年,與助手西蒙制定了世界上第一個(gè)正式的心理測(cè)驗(yàn),用于診斷和發(fā)現(xiàn)智力發(fā)展落后兒童,20世
17、紀(jì)以后,心理測(cè)驗(yàn)主要有以下幾個(gè)方面的發(fā)展: 1操作測(cè)驗(yàn)的發(fā)展:使未受過教育的兒童能夠接受測(cè)驗(yàn),且反應(yīng)了心理學(xué)界對(duì)操作能力的重視 2團(tuán)體智力測(cè)驗(yàn)的發(fā)展:始于推孟的學(xué)生奧蒂斯所編制的陸軍甲種和乙種智力測(cè)驗(yàn) 3能力傾向測(cè)驗(yàn)的發(fā)展:因素分析的盛行,成為分析心理品質(zhì)的內(nèi)部結(jié)構(gòu)的重要工具。普通能力傾向(智力)多元化發(fā)展,以韋克斯勒的智力量表為代表 4人格測(cè)驗(yàn)的發(fā)展:先驅(qū)是克雷丕林,羅夏測(cè)驗(yàn)是投射測(cè)驗(yàn)的開端,20世紀(jì)40年代以后,人格測(cè)驗(yàn)增多,二、現(xiàn)代心理測(cè)驗(yàn)在我國(guó)的發(fā)展,我國(guó)近代心理測(cè)驗(yàn)源于1914年前后,20世紀(jì)二三十年代兩次修訂比內(nèi)西蒙量表,此后,處于停滯。1979年后蓬勃發(fā)展。 近些年來我國(guó)的心理學(xué)
18、家正在致力于測(cè)驗(yàn)本土化.,第二節(jié) 測(cè)驗(yàn)的常模,第一單元 常模團(tuán)體 第二單元 常模的類型 第三單元 常模分?jǐn)?shù)的表示方法,什么是常模?,思考: 1.85分算高分還是低分? 2.來自不同省份的大一新生比較高考分?jǐn)?shù),意義大嗎?,建立心理測(cè)量的思維,關(guān)注心理常模!,第一單元 常模團(tuán)體,一、常模團(tuán)體的性質(zhì) 常模團(tuán)體是由具有某種共同特征的人所組成的一個(gè)群體,或者是該群體的一個(gè)樣本。 由于個(gè)人的等級(jí)會(huì)隨著用作比較的群體不同而有很大變化,因此必須確定合理的常模群體,對(duì)于測(cè)驗(yàn)編制者來說:常模的選擇主要是基于對(duì)測(cè)驗(yàn)將要施測(cè)的總體的認(rèn)識(shí),常模團(tuán)體必須能夠代表該總體。 常模的選擇包括: 確定一般總體: 確定目標(biāo)總體:計(jì)
19、劃實(shí)施的對(duì)象 確定樣本:根據(jù)總體的性質(zhì)確定有代表性的樣本 對(duì)于測(cè)驗(yàn)使用者來說:由于同一測(cè)驗(yàn)同時(shí)存在多個(gè)常模團(tuán)體,分?jǐn)?shù)的轉(zhuǎn)化與解釋時(shí)需選擇合適的常模團(tuán)體,二、常模團(tuán)體的條件,(一)群體的構(gòu)成必須明確界定 確定常模團(tuán)體時(shí)必須清楚說明所要測(cè)量的群體的性質(zhì)與特征。尤其是群體過大時(shí),群體內(nèi)部出現(xiàn)許多小團(tuán)體,他們?cè)跍y(cè)驗(yàn)上存在差異,因此對(duì)每個(gè)團(tuán)體建立常模。例如EPQ就分性別建立常模,韋氏成人量表分城市和農(nóng)村等 (二)常模團(tuán)體必須是所測(cè)群體的代表性樣本 所測(cè)群體較小,則全測(cè);若較大,一定要選擇有代表性的樣本作為常模,現(xiàn)實(shí)中往往因?yàn)槟硞€(gè)群體取樣容易,造成常模團(tuán)體取樣存在偏差。,(三)樣本的大小要適當(dāng) 在實(shí)際工作
20、中,應(yīng)從經(jīng)濟(jì)的或?qū)嵱玫目赡苄院蜏p少誤差這兩個(gè)方面來綜合考慮樣本的大小。 一般最低不小于30或100個(gè)。全國(guó)性常模,一般應(yīng)有20003000人為宜。 樣本大小適當(dāng)?shù)年P(guān)鍵是樣本要有代表性。不是“大”就好 (四)標(biāo)準(zhǔn)化樣組是一定時(shí)空的產(chǎn)物隨時(shí)間而須修訂 在選擇合適常模時(shí),要注意選擇較為新近的常模。,三、取樣的方法,取樣即從目標(biāo)人群中選擇有代表性的樣本。 抽樣方法: 簡(jiǎn)單隨機(jī)抽樣 系統(tǒng)抽樣 分組抽樣 分層抽樣,(一)簡(jiǎn)單隨機(jī)抽樣,按照隨機(jī)表順序選擇被試構(gòu)成樣本 1.隨機(jī)表:按照隨機(jī)表順序選擇受測(cè)者構(gòu)成樣本 2.編號(hào)后隨機(jī)抽?。簩⒊闃臃秶拿咳诉M(jìn)行編號(hào),再隨機(jī)選擇 避免了由于標(biāo)記、姓名、性別或其他社會(huì)贊
21、許性偏見造成抽樣誤差,首先將總體中各單位按一定順序排列,根據(jù)樣本容量要求確定抽選間隔,然后隨機(jī)確定起點(diǎn),每隔一定的間隔抽取一個(gè)單位的一種抽樣方式。 系統(tǒng)抽樣要求目標(biāo)總體無序可排,也無等級(jí)結(jié)構(gòu)存在。 系統(tǒng)抽樣法的關(guān)鍵是計(jì)算組距。,(二)系統(tǒng)抽樣(等距抽樣),將已編好號(hào)碼的個(gè)體排成順序,然后每隔若干個(gè)號(hào)碼抽取 一個(gè)。,(三)分組抽樣,適用情況:總體數(shù)目較大,無法進(jìn)行編好,且群體多樣性 做法:先將群體進(jìn)行分組,再在組內(nèi)進(jìn)行隨機(jī)取樣。,(四)分層抽樣,最常使用的抽樣方法。 中國(guó)人的主觀幸福感,可以完全隨機(jī)抽嗎? 步驟:將目標(biāo)總體按某種變量分成若干層次,再?gòu)母鲗哟沃须S機(jī)抽取若干受測(cè)者,最后把各層的受測(cè)者
22、組合成常模樣本。 優(yōu)點(diǎn):避免簡(jiǎn)單隨機(jī)抽樣中樣本集中于某種特性或缺少某種特性,使層次間差異顯著,層次內(nèi)一致性高,增加了樣本代表性 分類:分層比例抽樣與分層非比例抽樣,四、常模分?jǐn)?shù)與常模,(一)常模分?jǐn)?shù) 常模分?jǐn)?shù)就是施測(cè)常模樣本被試后,將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。 由原始分?jǐn)?shù)構(gòu)成的分布轉(zhuǎn)換而來的分?jǐn)?shù),叫導(dǎo)出分?jǐn)?shù) 原始分?jǐn)?shù)是在測(cè)驗(yàn)中直接獲得的分?jǐn)?shù),不能反映被試之間的差異,地位。 導(dǎo)出分?jǐn)?shù)具有一定的參照點(diǎn)和單位,它實(shí)際是一個(gè)有意義的測(cè)驗(yàn)量表,它與原始分?jǐn)?shù)等值。(有意義 等單位 帶參照點(diǎn)),(二)常模,常模分?jǐn)?shù)構(gòu)成的分布,就是通常所說的常模, 它由標(biāo)準(zhǔn)化樣本測(cè)試結(jié)果計(jì)算而來,是心理測(cè)
23、驗(yàn)用于比較與解釋測(cè)驗(yàn)結(jié)果的參照分?jǐn)?shù)標(biāo)準(zhǔn)。 按照樣本大小來源分:全國(guó)常模、區(qū)域常模和特殊常模; 按照具體應(yīng)用標(biāo)準(zhǔn)與分?jǐn)?shù)特征分:百分位常模和標(biāo)準(zhǔn)分常模,第二單元 常模的類型,發(fā)展常模 百分位常模 標(biāo)準(zhǔn)分常模 智商及其意義,一、發(fā)展常模,人的許多心理特質(zhì)是隨著時(shí)間以有規(guī)律的方式發(fā)展的,所以可將個(gè)人的成績(jī)與各種發(fā)展水平的人的平均成績(jī)相比較,確定個(gè)體的發(fā)展水平。 根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模,亦稱年齡量表。 在年齡量表中,個(gè)人的分?jǐn)?shù)指出他的行為在按正常途徑發(fā)展方面處于什么樣的發(fā)展水平。,常見的發(fā)展常模,(一)發(fā)展順序量表 (二)智力年齡 (三)年級(jí)當(dāng)量,(一)發(fā)展順序量表,最直觀的發(fā)展常模。
24、 因?yàn)樗嬖V人們多大的兒童具備什么能力或行為就表明其發(fā)育正常,相應(yīng)能力或行為早于某年齡出現(xiàn),說明發(fā)育超前,否則即為發(fā)育滯后。 優(yōu)點(diǎn):這種常模對(duì)兒童家長(zhǎng)來說最易于理解,并可以監(jiān)察兒童的生長(zhǎng)發(fā)育情況。 最早的一個(gè)范例是格塞爾發(fā)展程序表(見363) 皮亞杰最著名的工作就是對(duì)守恒概念的研究。 兒童獲得不同守恒形式的年齡是不一樣的,5歲掌握的是質(zhì)量守恒,6歲掌握重量守恒,7歲容量守恒。,比內(nèi)-西蒙量表中首先使用智力年齡的概念。 在比內(nèi)-西蒙量表式的年齡量表中,每個(gè)題目放在大部分兒童都能成功地完成的那個(gè)年齡水平,從而把題目分成若干年齡組。 例如,某題若被大多數(shù)7歲兒童通過,則該題放在7歲水平,5歲兒童大多
25、數(shù)能回答的題目則放在5歲水平。如果為每個(gè)年齡水平都編制一些適當(dāng)?shù)念}目,便可得到一個(gè)評(píng)價(jià)兒童智力發(fā)展水平的年齡量表。 一個(gè)兒童在年齡量表上所得的分?jǐn)?shù),就是最能代表他的智力水平的年齡。這種分?jǐn)?shù)叫做智力年齡,簡(jiǎn)稱智齡。,(二)智力年齡,智齡是年齡量表上衡量智力的單位。 計(jì)算方法:將兒童測(cè)驗(yàn)分?jǐn)?shù)與各年齡組兒童對(duì)比,便可得到年齡分?jǐn)?shù)。 基礎(chǔ)年齡+附加月份=智齡 不對(duì)題目進(jìn)行年齡分組,將正確題數(shù)當(dāng)做測(cè)驗(yàn)原始分?jǐn)?shù),將標(biāo)準(zhǔn)化樣本中每個(gè)年齡組平均原始分?jǐn)?shù)作為年齡常模,通過將原始分?jǐn)?shù)與年齡常模比較,得出智齡 解釋:智齡高于實(shí)際年齡聰明; 智齡低于實(shí)際年齡愚笨 智齡等于實(shí)際年齡一般,(三)年級(jí)當(dāng)量 年級(jí)當(dāng)量實(shí)際上就
26、是年級(jí)量表,測(cè)驗(yàn)結(jié)果說明屬于哪一年級(jí)的水平,在教育成就測(cè)驗(yàn)中最常用。 將被試的測(cè)驗(yàn)成績(jī)與某一年級(jí)的學(xué)生的平均分?jǐn)?shù)作比較,而說成相當(dāng)于某一年級(jí)水平。 年級(jí)量表單位為10個(gè)月,10個(gè)月為一個(gè)年級(jí),二、百分位常模,百分位常模包括百分等級(jí)和百分點(diǎn)、四分位數(shù)和十分位數(shù)。,(一)百分等級(jí),應(yīng)用最廣的導(dǎo)出分?jǐn)?shù)。一個(gè)原始分?jǐn)?shù)的百分等級(jí)是指在一個(gè)群體的測(cè)驗(yàn)分?jǐn)?shù)中,得分低于這個(gè)分?jǐn)?shù)的人數(shù)百分比。 例如,某人得分82,經(jīng)換算百分等級(jí)為75,即表示參加該項(xiàng)測(cè)驗(yàn)的人得分低于82分的占全體被試的75%,并說明超過他的成績(jī)82分的人僅有25%。 百分等級(jí)取值越大,成績(jī)?cè)絻?yōu)秀,(二)百分點(diǎn)(百分位數(shù)),在分?jǐn)?shù)量表上,相對(duì)于某
27、一百分等級(jí)的分?jǐn)?shù)點(diǎn)就叫百分點(diǎn)或百分位數(shù)。即處于某一百分比例的人對(duì)應(yīng)的測(cè)驗(yàn)分?jǐn)?shù)是多少。 例如,在招聘、招生中,分?jǐn)?shù)線的劃定 實(shí)際應(yīng)用過程,可以由原始分?jǐn)?shù)計(jì)算百分等級(jí),也可由百分等級(jí)確定原始分?jǐn)?shù)。這種雙向方式編制的原始分?jǐn)?shù)與百分等級(jí)對(duì)照表,就是百分位常模。,(三)四分位數(shù)和十分位數(shù),四分位數(shù)是將量表分成四等份,相當(dāng)于百分等級(jí)的25%、50%和75%對(duì)應(yīng)的三個(gè)點(diǎn)分成的四段。 十分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝螅?個(gè)點(diǎn)將全部數(shù)據(jù)分為10等份,與9個(gè)分割點(diǎn)上相對(duì)應(yīng)的數(shù)據(jù)稱為十分位數(shù)。,三、標(biāo)準(zhǔn)分常模,標(biāo)準(zhǔn)分?jǐn)?shù)常模是將原始分?jǐn)?shù)與平均分?jǐn)?shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表。 標(biāo)準(zhǔn)分?jǐn)?shù)是一種具
28、有相等單位的量數(shù)(以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位),具有可加性,它由符號(hào)與絕對(duì)值兩部分組成,正負(fù)號(hào)表示原始分?jǐn)?shù)在平均數(shù)之下或之上,絕對(duì)值表示原始分?jǐn)?shù)與平均數(shù)的距離。 標(biāo)準(zhǔn)分?jǐn)?shù)可以通過線性轉(zhuǎn)換,也可以通過非線性轉(zhuǎn)換得到,(一)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù),(公式5-1) 其中X為任一原始分?jǐn)?shù), 為樣本平均數(shù),SD為樣本標(biāo)準(zhǔn)差。 由于z分?jǐn)?shù)易出現(xiàn)小數(shù)點(diǎn)和負(fù)數(shù),計(jì)算不方便,所以將其轉(zhuǎn)化: Z=A+Bz (公式5-2) 加上一個(gè)常數(shù)(A)是為了去掉負(fù)值,乘以一個(gè)常數(shù)(B)是為了使單位變小從而去掉小數(shù)點(diǎn)。,常見的標(biāo)準(zhǔn)分?jǐn)?shù)有:z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分?jǐn)?shù)、離差智商(IQ)等。,當(dāng)以50為平均數(shù)(即加上一個(gè)常
29、數(shù)50),以10為標(biāo)準(zhǔn)差(乘以一個(gè)常數(shù)10)來表示時(shí),通常叫做T分?jǐn)?shù),即: T50+10 (公式5-3),T分?jǐn)?shù),標(biāo)準(zhǔn)九分、十分、二十分,標(biāo)準(zhǔn)九分=5+2 標(biāo)準(zhǔn)十分=5.5+1.5 標(biāo)準(zhǔn)二十分=10+3 使用最廣、影響最大的離差智商以100為平均數(shù),以15為標(biāo)準(zhǔn)差,(二)非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù),當(dāng)原始分?jǐn)?shù)不是常態(tài)分部時(shí),可通過非線性轉(zhuǎn)換使之常態(tài)化。 步驟: 1.對(duì)每個(gè)原始分?jǐn)?shù)計(jì)算累積百分比; 2.在常態(tài)曲線面積表中,求出對(duì)應(yīng)于該百分比的Z分?jǐn)?shù),四、智商及其意義,比內(nèi)-西蒙用心理年齡表示智力高低。若心理年齡高于其生理年齡,則智力較一般兒童高,若心理年齡低于其生理年齡,則智力較一般兒童低。 但在使用
30、中發(fā)現(xiàn),單純用心理年齡來表示智力高低的方法缺乏不同年齡兒童間的可比性, 于是提出了比率智商和離差智商表示智力高低,(一)比率智商,推孟修訂的斯坦福-比內(nèi)量表,以比率智商表示測(cè)驗(yàn)結(jié)果。比率智商(IQ)被定義為心理年齡(MA)與實(shí)足年齡(CA)之比。 (公式5-3) 由于個(gè)體心理年齡與實(shí)足年齡并不同步增長(zhǎng),所以比率智商并不適合于年齡較大的被試。,(二)離差智商,韋克斯勒提出離差智商。它是以年齡組為樣本計(jì)算而得的標(biāo)準(zhǔn)分?jǐn)?shù),它表示的是個(gè)體智力在年齡組中所處的位置,因而是表示智力高低的一種理想的指標(biāo)。 韋克斯勒將離差智商的平均數(shù)定為100,標(biāo)準(zhǔn)差定為15。 (公式5-4),離差智商,實(shí)際應(yīng)用過程,將原始
31、分?jǐn)?shù)與IQ值的對(duì)應(yīng)關(guān)系計(jì)算出來作為常模表,使用時(shí)可以直接按年齡查出智商。 離差智商的提出影響巨大,許多測(cè)驗(yàn)都采用離差智商。1960年的S-B,使用平均分為100,標(biāo)準(zhǔn)差為16的標(biāo)準(zhǔn)分?jǐn)?shù)量表。,需要注意:從不同測(cè)驗(yàn)獲得離差智商只有當(dāng)標(biāo)準(zhǔn)差相同或接近時(shí)才能比較,標(biāo)準(zhǔn)差不同,分?jǐn)?shù)意義也不同。(詳見367),幾種導(dǎo)出分?jǐn)?shù)間的相互關(guān)系,正負(fù)一個(gè)標(biāo)準(zhǔn)差 的面積為68.27%; 正負(fù)1.96個(gè)標(biāo)準(zhǔn)差的面積為95.45%; 正負(fù)2.58個(gè)標(biāo)準(zhǔn)差的面積為99.73%。,第三單元 常模分?jǐn)?shù)的表示方法,一、轉(zhuǎn)換表法最簡(jiǎn)單、最基本 也叫常模表,是一種最簡(jiǎn)單、最基本且最常用的呈現(xiàn)常模資料的方法,它由原始分?jǐn)?shù)、相應(yīng)的導(dǎo)出
32、分?jǐn)?shù)和對(duì)常模團(tuán)體的有關(guān)具體描述三個(gè)要素構(gòu)成。 分為簡(jiǎn)單轉(zhuǎn)換表與復(fù)雜轉(zhuǎn)換表。前者將單項(xiàng)測(cè)驗(yàn)的原始分?jǐn)?shù)轉(zhuǎn)化成一種或幾種導(dǎo)出分?jǐn)?shù);后者指包括幾個(gè)分測(cè)驗(yàn)或幾種常模團(tuán)體的原始分?jǐn)?shù)與導(dǎo)出分?jǐn)?shù)的對(duì)應(yīng)關(guān)系。 二、剖析圖 將測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來。,常模轉(zhuǎn)換表,剖面圖,第三節(jié) 測(cè)驗(yàn)的信度,第一單元 信度的概念 第二單元 信度評(píng)估的方法 第三單元 信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋 第四單元 影響信度的因素,第一單元 信度的概念,一、信度的定義 信度是指同一被試者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn))重復(fù)測(cè)量,所得結(jié)果的一致程度。,信度只受隨機(jī)誤差的影響。 X=T+E E= Er + Es,二、信度的指標(biāo),1
33、.信度系數(shù):同一受測(cè)者樣本所得到的兩組資料的相關(guān),實(shí)際上就是相關(guān)系數(shù): 0r1 2.信度指數(shù):信度指數(shù)的平方就是信度系數(shù) 3.測(cè)量標(biāo)準(zhǔn)誤信度系數(shù)表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,但未指出個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。理論上,若對(duì)被試無數(shù)次施測(cè)即可得到個(gè)人真分?jǐn)?shù)(多次觀測(cè)分?jǐn)?shù)的平均數(shù)),標(biāo)準(zhǔn)差則為測(cè)量誤差的大小。,但實(shí)際上不能施測(cè)無數(shù)次,僅能以同一組被試兩次施測(cè)結(jié)果來代替對(duì)同一個(gè)人的反復(fù)施測(cè),于是有了信度另一個(gè)指標(biāo)標(biāo)準(zhǔn)誤(SE)。(個(gè)人在兩次測(cè)驗(yàn)中分?jǐn)?shù)的差異就是測(cè)驗(yàn)誤差,測(cè)驗(yàn)誤差分?jǐn)?shù)形成一個(gè)分布,這個(gè)分布的標(biāo)準(zhǔn)差即為標(biāo)準(zhǔn)誤) SE為測(cè)量的標(biāo)準(zhǔn)誤,SX為所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx 為測(cè)驗(yàn)的信度系數(shù)。
34、 可以發(fā)現(xiàn):標(biāo)準(zhǔn)誤與信度互為消長(zhǎng)的關(guān)系信度越高,標(biāo)準(zhǔn)誤越小;信度越低,標(biāo)準(zhǔn)誤越大,第二單元 信度評(píng)估的方法,對(duì)信度的評(píng)估方法是沒有通用法則的,因?yàn)椴煌男哦确从硿y(cè)驗(yàn)誤差的不同來源,故每一種信度系數(shù)只能說明信度的不同方面,因而具有不同的意義。 重測(cè)信度 復(fù)本信度 內(nèi)部一致性信度 評(píng)分者信度,一、重測(cè)信度(穩(wěn)定性系數(shù)),使用同一測(cè)驗(yàn),在同樣條件下對(duì)同一組被試者前后施測(cè)兩次測(cè)驗(yàn),求兩次得分間的相關(guān)系數(shù)。(重測(cè)法) 重測(cè)信度的提出的原因:多數(shù)心理特征具有相對(duì)的穩(wěn)定性,短時(shí)間不會(huì)變化很大 一般是兩周到四周較宜,間隔時(shí)間最好不超過六個(gè)月。 優(yōu)點(diǎn):提供測(cè)驗(yàn)跨時(shí)間的穩(wěn)定性 缺點(diǎn):受練習(xí)與記憶,身心發(fā)展變化的影
35、響,二、復(fù)本信度,以兩個(gè)等值但題目不同的測(cè)驗(yàn)(復(fù)本)來測(cè)量同一群體,然后求得被試者在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù) 復(fù)本信度反映的是測(cè)驗(yàn)在內(nèi)容上的等值性,故又稱等值性系數(shù)。 施測(cè)過程中需要采用AB/BA施測(cè)順序來平衡順序效應(yīng) 若副本先后施測(cè),存在時(shí)間間隔,具有了重測(cè)信度的特征,稱重測(cè)復(fù)本信度或穩(wěn)定性等值系數(shù)。 優(yōu)點(diǎn):避免了一定的記憶、學(xué)習(xí)效應(yīng)(應(yīng)用較為廣泛) 缺點(diǎn):練習(xí)能夠減少但不能消除;易產(chǎn)生遷移作用;復(fù)本建立困難,三、內(nèi)部一致性信度,重測(cè)信度和復(fù)本信度主要考察了測(cè)驗(yàn)跨時(shí)間的一致性(穩(wěn)定性)和跨形式的一致性(等值性),而內(nèi)部一致性信度系數(shù)主要反映的是題目之間的關(guān)系,表示測(cè)驗(yàn)?zāi)軌驕y(cè)量相同內(nèi)容或特質(zhì)的
36、程度。 分半信度 同質(zhì)性信度,(一)分半信度,采用分半法估計(jì)信度系數(shù)。 實(shí)際做法:測(cè)驗(yàn)完成后,把測(cè)驗(yàn)項(xiàng)目按奇偶分為兩半,計(jì)算相關(guān),這個(gè)相關(guān)系數(shù)就代表了兩半測(cè)驗(yàn)內(nèi)容取樣的一致程度。 缺點(diǎn):低估信度系數(shù)(測(cè)驗(yàn)長(zhǎng)度影響使然),代表測(cè)驗(yàn)內(nèi)部所有題目間的一致性。 當(dāng)各個(gè)測(cè)題的得分有較高的正相關(guān)時(shí),不論題目的內(nèi)容和形式如何,則測(cè)驗(yàn)為同質(zhì)的。相反,即使所有題目看起來好像測(cè)量同一特質(zhì),但相關(guān)很低或?yàn)樨?fù)相關(guān)時(shí),則測(cè)驗(yàn)為異質(zhì)的。,(二)同質(zhì)性信度,四、評(píng)分者信度,目的: 用于測(cè)量不同評(píng)分者之間產(chǎn)生的誤差。 程序: 隨機(jī)抽取若干份測(cè)驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)
37、分者信度。 一般要求在成對(duì)的受過訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。,第三單元 信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋,解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān) 確定信度可以接受的水平 解釋個(gè)人分?jǐn)?shù)的意義 比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異,一、解釋真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān),信度系數(shù)可以解釋為測(cè)驗(yàn)的總變異中,真分?jǐn)?shù)造成的變異占百分之幾。 若rxx0.9,則表示觀測(cè)分?jǐn)?shù)中90%的變異由真分?jǐn)?shù)造成,10%為誤差。 在極端的情況下,如有rxx1.00,則表示完全沒有測(cè)量誤差,所有的變異均來自真實(shí)分?jǐn)?shù);若有rxx0,則所有的變異和差別都反映的是測(cè)量誤差。,二、確定信度可以接受的水平,多高的信度水平才是可以接受的? 能力
38、、成就測(cè)驗(yàn)信度系數(shù)0.9以上,甚至0.95;人格、興趣測(cè)驗(yàn)信度0.80.85 一般原則是: 當(dāng)rxx0.70時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人做出評(píng)價(jià)或預(yù)測(cè),而且不能作團(tuán)體比較; 當(dāng)0.70rxx 0.85時(shí),可用于團(tuán)體比較; 當(dāng)rxx0.85時(shí),才能用來鑒別或預(yù)測(cè)個(gè)人成績(jī)或作為。 注意哪里有“=”,三、解釋個(gè)人分?jǐn)?shù)的意義,通過標(biāo)準(zhǔn)誤去解釋分?jǐn)?shù)意義。具體來說兩個(gè)作用: 其一是估計(jì)真實(shí)分?jǐn)?shù)的范圍; 從實(shí)得觀測(cè)分?jǐn)?shù)推測(cè)得到真分?jǐn)?shù),即確定置信區(qū)間:X-1.96SEXTX+1.96SE(有等號(hào)) X-2.58SEXTX+2.58SE(有等號(hào)) 其二是了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形。 案例見書本375,四、比較不
39、同測(cè)驗(yàn)分?jǐn)?shù)的差異,測(cè)量標(biāo)準(zhǔn)誤和測(cè)驗(yàn)信度在評(píng)價(jià)兩個(gè)不同測(cè)驗(yàn)的分?jǐn)?shù)是否有明顯差異時(shí)也非常重要。 這種比較包括:兩個(gè)人不同分?jǐn)?shù)的差別;同一被試在兩個(gè)測(cè)驗(yàn)上的差別。這就是差異分?jǐn)?shù)標(biāo)準(zhǔn)誤問題: SEd=S(2-rxx-ryy)1/2 s相同時(shí),兩個(gè)分?jǐn)?shù)才能比較 案例見書本375,第四單元 影響信度的因素,一、樣本特征 二、測(cè)驗(yàn)長(zhǎng)度 三、測(cè)驗(yàn)難度 四、時(shí)間間隔,一、樣本特征,信度常用信度系數(shù)來表示,信度系數(shù)就是相關(guān)系數(shù),相關(guān)系數(shù)受樣本是否異質(zhì)及樣本團(tuán)體平均能力水平的影響。 (一)樣本團(tuán)體異質(zhì)性的影響 (二)樣本團(tuán)體平均能力水平的影響,樣本團(tuán)體異質(zhì)性的影響,任何相關(guān)系數(shù)都要受到團(tuán)體中分?jǐn)?shù)分布的范圍所影響,而
40、分?jǐn)?shù)范圍與樣本團(tuán)體的異質(zhì)程度有關(guān)。若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往往會(huì)高估測(cè)驗(yàn)的信度,相反則會(huì)低估測(cè)驗(yàn)的信度。 同質(zhì)團(tuán)體,受測(cè)者水平接近,兩次測(cè)驗(yàn)成績(jī)受隨機(jī)誤差影響;異質(zhì)團(tuán)體受隨機(jī)誤差影響較小。,樣本團(tuán)體平均能力水平的影響,測(cè)驗(yàn)的信度還受取樣不同團(tuán)體間平均能力水平的不同而不同。這是因?yàn)?,?duì)于不同水平的團(tuán)體,題目具有不同的難度,每個(gè)題目在難度上的微小差異累計(jì)起來便會(huì)影響信度。 因此報(bào)告信度系數(shù)時(shí),需要對(duì)建立信度系數(shù)的團(tuán)體進(jìn)行描述。,二、測(cè)驗(yàn)長(zhǎng)度,測(cè)驗(yàn)長(zhǎng)度,亦即測(cè)驗(yàn)的數(shù)量,也是影響信度系數(shù)的一個(gè)因素。一般來說,在一個(gè)測(cè)驗(yàn)中增加同質(zhì)的題目,可以使信度提高。 第一,測(cè)驗(yàn)越長(zhǎng),測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取
41、樣就越有代表性。 第二,測(cè)驗(yàn)越長(zhǎng),被試的猜測(cè)因素影響就越小。 不過 測(cè)驗(yàn)過長(zhǎng)有時(shí)會(huì)引起被試的疲勞和反感而降低可靠性。,三、測(cè)驗(yàn)難度,難度對(duì)信度的影響,只存在于某些測(cè)驗(yàn)中。如智力測(cè)驗(yàn)、成就測(cè)驗(yàn)、能力傾向測(cè)驗(yàn)等,對(duì)于人格測(cè)驗(yàn)、興趣測(cè)驗(yàn)、態(tài)度量表等不存在難度問題,因?yàn)檫@些測(cè)驗(yàn)的題目沒有正確或錯(cuò)誤答案之分。 在實(shí)際情況下,如果某個(gè)測(cè)驗(yàn)難度水平針對(duì)特定的團(tuán)體可能會(huì)顯得太難、太易,使得分?jǐn)?shù)分布范圍縮小,信度水平降低。(難度水平使測(cè)驗(yàn)分?jǐn)?shù)分布范圍較大時(shí),測(cè)驗(yàn)信度最高,通常平均難度水平為0.5),四、時(shí)間間隔,以再測(cè)法或復(fù)本法求信度,兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大;間隔時(shí)間越久,其他變因介入的可能性越大
42、,受外界的影響也越大,信度系數(shù)便越低。,第四節(jié) 測(cè)驗(yàn)的效度,第一單元 效度的概念 第二單元 效度評(píng)估的方法 第三單元 效度的功能 第四單元 影響效度的因素,一、效度的定義(概念定義與操作性定義的符合程度),效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者簡(jiǎn)單地說是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。 也稱為測(cè)驗(yàn)有效性,指一套測(cè)驗(yàn)對(duì)應(yīng)該測(cè)試的內(nèi)容所測(cè)的程度,即一套測(cè)試是否達(dá)到了它預(yù)定的目的以及是否測(cè)量了他要測(cè)量的內(nèi)容。 在測(cè)驗(yàn)理論中,效度被定義為在一組測(cè)量中,與測(cè)量目標(biāo)有關(guān)的真實(shí)方差(或稱有效方差)與總方差的比率。,測(cè)驗(yàn)效度受隨機(jī)誤差和系統(tǒng)誤差的影響。 可信的測(cè)驗(yàn)未必有效,而有效的測(cè)驗(yàn)必定可信。,二
43、、效度的性質(zhì),(一)效度具有相對(duì)性 在評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮其目的與功能。不能籠統(tǒng)說,測(cè)驗(yàn)有效還是無效,而應(yīng)該說對(duì)測(cè)什么有效還是無效。 (二)效度具有連續(xù)性 測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。因此,我們?cè)u(píng)價(jià)一個(gè)測(cè)驗(yàn)時(shí),不應(yīng)該說“有效”或“無效”,而應(yīng)該用效度較高或較低來評(píng)價(jià)。(例用ipad稱體重,高效嗎?) 另外,效度是針對(duì)測(cè)驗(yàn)結(jié)果的,即測(cè)驗(yàn)效度是“測(cè)驗(yàn)結(jié)果”的有效性程度。,信度和效度的關(guān)系,一、信度是效度的必要而非充分條件 二、效度是受信度制約的,第二單元 效度評(píng)估的方法,美國(guó)心理學(xué)會(huì)在1974年所發(fā)行的教育與心理測(cè)量之標(biāo)準(zhǔn)一書中將效度分為三
44、大類: 內(nèi)容效度 構(gòu)想效度 效標(biāo)效度,測(cè)量的效度就是測(cè)量結(jié)果達(dá)到測(cè)量目的的程度,所以測(cè)量效度的估計(jì)很大程度上取決于人們對(duì)測(cè)量目的的解釋。目前常見的解釋角度有三種:用測(cè)量的內(nèi)容說明目的;用心理學(xué)某種理論結(jié)構(gòu)說明目的;用工作實(shí)效說明目的,一、內(nèi)容效度(測(cè)驗(yàn)的代表性和覆蓋性),(一)什么是內(nèi)容效度 內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。,內(nèi)容效度是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到的內(nèi)容與所要測(cè)量的內(nèi)容之間的吻合程度。例如判斷高中物理試卷的內(nèi)容效度,我們需要分析題目是否涵蓋了力、電、光、熱以及原子物理五方面內(nèi)容,并且沒有化學(xué)和地理其他題目摻入。,編制較
45、高的內(nèi)容效度心理測(cè)驗(yàn)需要注意: 第一,對(duì)所測(cè)量的心理特性有明確的概念; 第二,測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。 需要注意的是,要求內(nèi)容效度的測(cè)驗(yàn)不一定要求測(cè)驗(yàn)同質(zhì),具體情況應(yīng)隨實(shí)際情況而定。,內(nèi)容效度與表面效度,表面效度是由外行對(duì)測(cè)驗(yàn)作表面上的檢查確定的,它不反映測(cè)驗(yàn)實(shí)際測(cè)量的東西,只是指測(cè)驗(yàn)表面上看來好像是測(cè)量所要測(cè)的東西; 內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)而建立的。 最高行為測(cè)驗(yàn)要求較高表面效度 典型行為測(cè)驗(yàn)要求較低表面效度,在編制“領(lǐng)導(dǎo)能力測(cè)驗(yàn)”時(shí)編寫了這么三個(gè)問題: a我愿指揮別人不愿別人指揮我。 b我喜歡聽古典音樂。 c人們經(jīng)常征求我的意見。 通
46、過預(yù)測(cè)發(fā)現(xiàn),領(lǐng)導(dǎo)干部對(duì)a、b作肯定回答的人數(shù)比例明顯地高于一般群眾,對(duì)c作肯定回答的人數(shù)比例與一般群眾差不多。 從區(qū)分能力來看,c題應(yīng)被淘汰。但是,若從表面上看,a、c兩題都有表面效度,b題沒有表面效度。 這個(gè)例子說明,對(duì)于一個(gè)具體的測(cè)量目標(biāo)來說,有表面效度的題目不見得真正有效,沒有表面效度的題目也可能有效,因此,表面效度不是確定內(nèi)容效度的客觀指標(biāo)。,(二)內(nèi)容效度的評(píng)估方法,1專家判斷法 2統(tǒng)計(jì)分析法 3經(jīng)驗(yàn)推測(cè)法,1專家判斷法,請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容的符合性做出判斷,看測(cè)驗(yàn)的題目是否代表規(guī)定的內(nèi)容。 又稱“邏輯效度”(logical validity)。,增加專家評(píng)定客觀性的步驟:
47、,1.定義好測(cè)驗(yàn)內(nèi)容的總體范圍,描述有關(guān)知識(shí)與技能及所用材料的來源; 2.編制雙向細(xì)目表 3.制定評(píng)定量表來測(cè)量測(cè)驗(yàn)的整個(gè)效度 最后由每位評(píng)判者在評(píng)定量表上做出判斷,從而獲得測(cè)驗(yàn)內(nèi)容效度的證據(jù)。,2統(tǒng)計(jì)分析法,重測(cè)信度(再測(cè)法):訓(xùn)練前與訓(xùn)練后 評(píng)分者一致性信度:多個(gè)評(píng)分者之間的一致程度 復(fù)本信度:復(fù)本求相關(guān)相關(guān)低則至少一個(gè)測(cè)驗(yàn)缺乏效度,3經(jīng)驗(yàn)推測(cè)法,即通過實(shí)踐來檢驗(yàn)效度。 如兒童發(fā)展量表是否有效,經(jīng)過對(duì)不同年齡階段的兒童進(jìn)行調(diào)查,然后分析其結(jié)果。若通過率是隨著年齡的增加而增加,就可以推測(cè)該測(cè)驗(yàn)有內(nèi)容效度。,(三)內(nèi)容效度的特性,內(nèi)容效度與所有效度的性質(zhì)一樣,不是普遍適用的,而是根據(jù)具體情況分
48、析得來。 如果測(cè)驗(yàn)分析者和測(cè)驗(yàn)使用者定義的內(nèi)容范圍相同,則編制者報(bào)告的內(nèi)容效度對(duì)使用者而言是有意義的,否則就沒有意義。 內(nèi)容效度也有時(shí)間特定性,適合過去總體的代表性測(cè)驗(yàn)未必符合現(xiàn)在的總體。,二、構(gòu)想效度,(一)什么是構(gòu)想效度 (二)構(gòu)想效度的估計(jì)方法,(一)什么是構(gòu)想效度,構(gòu)思效度,或結(jié)構(gòu)效度。主要涉及心理學(xué)的理論概念問題。 指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果能否證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。,建立構(gòu)想效度的步驟:,欲建立構(gòu)想效度,必需先從某一構(gòu)想的理論出發(fā),提出關(guān)于某一心理特質(zhì)的假設(shè),然后設(shè)計(jì)和編制測(cè)驗(yàn)并進(jìn)行施測(cè),最后對(duì)結(jié)果采用相關(guān)或因素分析進(jìn)行分
49、析,驗(yàn)證理論假設(shè)的符合程度。,(二)構(gòu)想效度的估計(jì)方法,1對(duì)測(cè)驗(yàn)本身的分析(測(cè)驗(yàn)內(nèi)部尋找證據(jù)) (1)內(nèi)容效度:分析內(nèi)容效度即可得出結(jié)構(gòu)效度 (2)內(nèi)部一致性信度:測(cè)驗(yàn)是單一特質(zhì)還是多種特質(zhì) (3)被試對(duì)題目的反應(yīng)特點(diǎn):若有證據(jù)表明某一題目的作答除了反映著所要測(cè)的特質(zhì)之外還反映著其他因素的影響,則構(gòu)想效度受到影響。,2測(cè)驗(yàn)間的相互比較(測(cè)驗(yàn)之間尋找證據(jù)) (1)相容效度:待研究效度測(cè)驗(yàn)與同一成熟測(cè)驗(yàn)求相關(guān) (2)區(qū)分效度:待研究效度測(cè)驗(yàn)與其他異質(zhì)測(cè)驗(yàn)求相關(guān) (3)因素分析法:因素分析因子與構(gòu)想符合程度,3效標(biāo)效度的研究證明 實(shí)測(cè)成績(jī)能否真正將個(gè)體分類:選取不同的被試構(gòu)成對(duì)照組,施測(cè)后比較兩組的
50、分?jǐn)?shù),若二者分?jǐn)?shù)將兩組截然分開,則構(gòu)想效度不錯(cuò)。 分析心理特質(zhì)的發(fā)展變化,如智力隨年齡而發(fā)展,若測(cè)驗(yàn)?zāi)芊磻?yīng)這一規(guī)律則,結(jié)構(gòu)效度高 4實(shí)驗(yàn)法和觀察法證實(shí) 訓(xùn)練前后測(cè)驗(yàn)分?jǐn)?shù)的變化,三、效標(biāo)效度,(一)什么是效標(biāo)效度 (二)效標(biāo)效度的估計(jì)方法,(一)什么是效標(biāo)效度(實(shí)證效度),效標(biāo)效度反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效程度。(實(shí)證效度) 被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。 根據(jù)效標(biāo)資料是否與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得,又可分為同時(shí)效度和預(yù)測(cè)效度兩類,前者在于診斷現(xiàn)狀;后者在于預(yù)測(cè)未來。,一個(gè)測(cè)驗(yàn)是否有效,以實(shí)踐的效果來作為檢驗(yàn)標(biāo)準(zhǔn),檢驗(yàn)一個(gè)測(cè)驗(yàn)的效標(biāo)效度時(shí),關(guān)鍵在于找到合適的效標(biāo),一個(gè)好的效
51、標(biāo)必須具備以下條件: (1)效標(biāo)必須能最有效地反映測(cè)驗(yàn)的目標(biāo),即效標(biāo)測(cè)量本身必須有效; (2)效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素而變化; (3)效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來表示; (4)效標(biāo)測(cè)量的方法簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。,(二)效標(biāo)效度的評(píng)估方法,1相關(guān)法 2區(qū)分法 3命中率法,1相關(guān)法,相關(guān)法是評(píng)估效標(biāo)效度最常用的方法,它是求測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料間的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。 計(jì)算效度系數(shù)最常用的是積差相關(guān)法(連續(xù)變量、二列(兩個(gè)變量都為連續(xù)變量,一個(gè)人為劃分為二分變量)、點(diǎn)二列相關(guān)(一個(gè)是真正的二分變量,另一個(gè)是連續(xù)變量)、賈斯朋多系列相關(guān)(測(cè)驗(yàn)分?jǐn)?shù)為連
52、續(xù)變量,效標(biāo)資料為等級(jí)評(píng)定),2區(qū)分法,區(qū)分法是檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。 某政府機(jī)關(guān)通過測(cè)驗(yàn)錄用了一批公務(wù)員,經(jīng)半年試用期后,根據(jù)他們的實(shí)際工作成績(jī),將這批公務(wù)員區(qū)分為稱職和不稱職兩組,然后回過頭來檢查這兩組人在測(cè)驗(yàn)上的分?jǐn)?shù)是否有顯著差異,如果差異顯著,說明這個(gè)測(cè)驗(yàn)在錄用公務(wù)員的選拔性測(cè)驗(yàn)中是有效的。 具體做法是分析高分組與低分組分布的重疊量:一種是計(jì)算每一組內(nèi)得分超過(低于)另一組平均數(shù)的人數(shù)百分比;一種是計(jì)算兩組共同分布的百分比(詳見書本384),3命中率法,命中率法是當(dāng)測(cè)驗(yàn)用來做取舍的依據(jù)時(shí),用其正確決定的比例作為效度指標(biāo)的一種方法。 使用命中率法,可將測(cè)
53、驗(yàn)分?jǐn)?shù)和效標(biāo)資料分為兩類。在測(cè)驗(yàn)分?jǐn)?shù)方面是確定一個(gè)臨界分?jǐn)?shù)(即分?jǐn)?shù)線),高于臨界分?jǐn)?shù)者預(yù)測(cè)其成功,低于臨界分?jǐn)?shù)者預(yù)測(cè)其失?。辉谛?biāo)資料方面根據(jù)實(shí)際工作或?qū)W習(xí)成績(jī),確定一個(gè)合格標(biāo)準(zhǔn),標(biāo)準(zhǔn)之上與之下。,根據(jù)測(cè)驗(yàn)分?jǐn)?shù)與實(shí)際工作情況,可以分為四種情況:,命中率計(jì)算: 總命中率=命中/(命中+失誤) 正命中率=測(cè)驗(yàn)與效標(biāo)皆成功人數(shù)/測(cè)驗(yàn)成功人數(shù) 分?jǐn)?shù)線越高,正命中率越高;否則越低。,第三單元 效度的功能,一、預(yù)測(cè)誤差 效度系數(shù)的實(shí)際意義常以決定系數(shù)來表示。決定系數(shù)即為效度系數(shù)的平方,表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比例。 另一種表達(dá)方法,估計(jì)的標(biāo)準(zhǔn)誤,指所有具有某一測(cè)驗(yàn)分?jǐn)?shù)的受測(cè)者其效標(biāo)分?jǐn)?shù)
54、分布的標(biāo)準(zhǔn)差,即預(yù)測(cè)誤差大小的估計(jì)值(見385) 表示預(yù)測(cè)誤差大小的估計(jì)值。測(cè)驗(yàn)效度完美(為1),估計(jì)標(biāo)準(zhǔn)誤為0,二、預(yù)測(cè)效標(biāo)分?jǐn)?shù) 若X、Y呈直線相關(guān),可利用回歸方程從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)分?jǐn)?shù) 三、預(yù)測(cè)效度指數(shù)E=100(1-K) E值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差 例如,效度系數(shù)為0.8,K=0.6,E=0.4,這表明預(yù)測(cè)誤差僅為隨機(jī)猜測(cè)所產(chǎn)生誤差的60%,即減少了40%誤差。,第四單元 影響效度的因素,一、測(cè)驗(yàn)本身的因素 二、測(cè)驗(yàn)實(shí)施中的干擾因表 三、樣本團(tuán)體的性質(zhì) 四、效標(biāo)的性質(zhì),一、測(cè)驗(yàn)本身的因素,1測(cè)驗(yàn)材料必須對(duì)整個(gè)內(nèi)容具有代表性; 2測(cè)題設(shè)計(jì)時(shí)應(yīng)盡量避免容易引起誤差的題型(如
55、是非題); 3測(cè)題難度要適中,具有較高的區(qū)分度; 4測(cè)驗(yàn)長(zhǎng)度要恰當(dāng),即要有一定的測(cè)題量; 5測(cè)題的排列按先易后難順序。,二、測(cè)驗(yàn)實(shí)施中的干擾因表,(一)主試的影響因素 測(cè)驗(yàn)實(shí)施過程、評(píng)分標(biāo)準(zhǔn)化與否。 效標(biāo)與測(cè)驗(yàn)時(shí)間間隔越長(zhǎng),效度降低 測(cè)驗(yàn)情境 (二)被試的影響因素 興趣、態(tài)度、情緒等,三、樣本團(tuán)體的性質(zhì),(一)樣本團(tuán)體的異質(zhì)性 如果其他條件相同,樣本團(tuán)體越同質(zhì),分?jǐn)?shù)分布范圍越小,測(cè)驗(yàn)效度就越低 選拔測(cè)驗(yàn)和選拔標(biāo)準(zhǔn)的增高,導(dǎo)致樣本團(tuán)體同質(zhì)性增大,效度降低 (二)干涉變量 性別、年齡、教育水平、智力、動(dòng)機(jī)等,四、效標(biāo)的性質(zhì),效標(biāo)效度以測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)系數(shù)來表示,效標(biāo)性質(zhì)影響效度評(píng)價(jià)。 效標(biāo)
56、測(cè)量的可靠性即效標(biāo)測(cè)量的信度,第五節(jié) 項(xiàng)目分析,測(cè)驗(yàn)的項(xiàng)目分析包括定性分析和定量分析兩個(gè)方面。 定性分析包括考慮內(nèi)容效度,題目編寫的恰當(dāng)性和有效性等; 定量分析主要是指對(duì)題目難度和區(qū)分度等進(jìn)行分析。,第一單元 項(xiàng)目的難度,一、定義,難度(difficulty),顧名思義,是指項(xiàng)目的難易程度。 難度的指標(biāo)通常以通過率表示,即以答對(duì)或通過該題的人數(shù)百分比來表示: (公式5-31) 通過人數(shù)越多(即P值越大),難度越低;,二、項(xiàng)目難度的估計(jì)方法,(1)二值記分的測(cè)題:答對(duì)的百分比(或比率) P值越大,則難度越小。,(2)不是二值記分 (3)分組計(jì)分項(xiàng)目,三、難度水平的確定主要目的在于篩選項(xiàng)目,(一)
57、項(xiàng)目的難度取決于測(cè)驗(yàn)?zāi)康?、性質(zhì)與形式 標(biāo)準(zhǔn)測(cè)驗(yàn),為了測(cè)量個(gè)體差異。P接近0.5最大程度上提供個(gè)體差異信息 選拔診斷測(cè)驗(yàn),選擇難度接近錄取率的項(xiàng)目。 對(duì)于選擇題來說,P應(yīng)大于概率水平:是非題難度應(yīng)為0.75;四擇一,難度0.63,(二)測(cè)驗(yàn)的難度 取決于項(xiàng)目難度,通過測(cè)驗(yàn)分?jǐn)?shù)分布對(duì)難度進(jìn)行檢驗(yàn) 如果被試樣本具有代表性,對(duì)于中等難度的測(cè)驗(yàn),其測(cè)驗(yàn)總分應(yīng)該接近常態(tài)分配。 正偏態(tài)難度大;負(fù)偏態(tài)測(cè)驗(yàn)過易,第二單元 項(xiàng)目的區(qū)分度,一、定義,項(xiàng)目區(qū)分度,也叫鑒別力,是指測(cè)驗(yàn)項(xiàng)目對(duì)被試的心理特性的區(qū)分能力。是評(píng)價(jià)項(xiàng)目質(zhì)量和篩選項(xiàng)目的主要指標(biāo)。 水平高者得高分,水平低者得低分區(qū)分度高 區(qū)分度D取值范圍為-1+1
58、之間,D為正值,則積極區(qū)分;D為負(fù)值,為消極區(qū)分;D為0,則無區(qū)分。 D值越大,區(qū)分效果越好。,二、計(jì)算方法,(一)鑒別指數(shù) 按測(cè)驗(yàn)總分高低排列答卷 確定高分組與低分組,每組取答卷總數(shù)的27% 分別計(jì)算高分組與低分組在該項(xiàng)目上的通過率 高分組通過率-低分組通過率得項(xiàng)目鑒別指數(shù) 據(jù)項(xiàng)目鑒別指數(shù)進(jìn)行項(xiàng)目取舍 D=PH-PL 0.4以上,很好 0.3-0.39,良好,修改后更好 0.2-029 尚可,仍需修改 0.19以下,差,必須淘汰,(二)相關(guān)法 鑒別指數(shù)易于理解,計(jì)算方便,但結(jié)果不精確,因此采用相關(guān)法。以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)或測(cè)驗(yàn)總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)。 計(jì)算區(qū)分度最常用的方法是相關(guān)法
59、1點(diǎn)二列相關(guān): 2二列相關(guān): 3相關(guān)法: 相關(guān)越高表明項(xiàng)目越有區(qū)分功能,三、區(qū)分度與難度的關(guān)系,一般來說,較難的項(xiàng)目對(duì)高水平的被試區(qū)分度高,較易的項(xiàng)目對(duì)水平低的被試區(qū)分度高,中等難度的項(xiàng)目對(duì)中等水平的被試區(qū)分度高。 若項(xiàng)目通過率為1,則D=? 0 若項(xiàng)目通過率為0,則D=? 0 若項(xiàng)目通過率為0.5,則D=? 1 難度越接近0.5,區(qū)分度越接近1 ;平均難度水平為0.5,第六節(jié) 測(cè)驗(yàn)編制的一般程序,第一單元 測(cè)驗(yàn)的目標(biāo)分析 第二單元 測(cè)題的編寫 第三單元 測(cè)驗(yàn)的編排和組織,編制心理與教育測(cè)驗(yàn)的基本程序,一、確定測(cè)驗(yàn)?zāi)康?二、制定編題計(jì)劃 三、編輯測(cè)驗(yàn)項(xiàng)目 四、預(yù)測(cè)與分析 五、合成測(cè)驗(yàn) 六、測(cè)驗(yàn)
60、標(biāo)準(zhǔn)化 七、鑒定測(cè)驗(yàn) 八、編寫測(cè)驗(yàn)說明書,第一單元 測(cè)驗(yàn)的目標(biāo)分析,一、測(cè)驗(yàn)的對(duì)象 二、測(cè)驗(yàn)的用途 三、測(cè)驗(yàn)的目標(biāo),一、測(cè)驗(yàn)的對(duì)象,明確測(cè)驗(yàn)對(duì)象,明確測(cè)量哪些個(gè)人和團(tuán)體。通常以年齡、性別、職業(yè)、受教育程度、經(jīng)濟(jì)狀況、民族、文化背景等指標(biāo)來區(qū)分測(cè)量對(duì)象。,二、測(cè)驗(yàn)的用途,所編出的測(cè)驗(yàn)是要對(duì)被試做描述,還是做診斷,亦或是選拔和預(yù)測(cè), (一)顯示性測(cè)驗(yàn) 顯示性測(cè)驗(yàn)是指測(cè)驗(yàn)題目和所要測(cè)量的心理特征相似的測(cè)驗(yàn)。 (二)預(yù)測(cè)性測(cè)驗(yàn),三、測(cè)驗(yàn)的目標(biāo),心理測(cè)驗(yàn)的目標(biāo)是指編制的測(cè)驗(yàn)是測(cè)什么的,即用來測(cè)量什么樣的心理變量或行為特征。 (一)工作分析 對(duì)所預(yù)測(cè)的行為活動(dòng)作具體分析 確定哪些心理特征和行為可以使要預(yù)測(cè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 意識(shí)形態(tài)知識(shí)培訓(xùn)課件
- 二零二五年度商業(yè)秘密保護(hù)協(xié)議5篇
- 二零二五年度城市綜合體開發(fā)商離婚協(xié)議與綜合體運(yùn)營(yíng)與維護(hù)合同3篇
- 二零二五年度建筑工程施工合同培訓(xùn)教程匯編3篇
- 二零二五年度城市綠化工程承包勞務(wù)合同2篇
- 電動(dòng)機(jī)基礎(chǔ)知識(shí)培訓(xùn)課件
- 水稻除草劑知識(shí)培訓(xùn)課件
- 面包師公共知識(shí)培訓(xùn)課件
- Unit3 It's a pineapple.Lesson13(說課稿)-2024-2025學(xué)年人教精通版英語四年級(jí)上冊(cè)
- 福建省龍巖市新羅區(qū)2024-2025學(xué)年四年級(jí)上學(xué)期期末數(shù)學(xué)試題參考答案
- 2024年度吉林省國(guó)家電網(wǎng)招聘之法學(xué)類典型題匯編及答案
- 山東省臨沂市2023-2024學(xué)年高一上學(xué)期1月期末考試 物理 含答案
- 2024年世界職業(yè)院校技能大賽中職組“嬰幼兒保育組”賽項(xiàng)考試題庫-下(多選、判斷題)
- 2023年福建公務(wù)員錄用考試《行測(cè)》真題卷及答案解析
- 中華人民共和國(guó)學(xué)前教育法
- 辯論英文課件教學(xué)課件
- 銑工高級(jí)工測(cè)試題(含答案)
- 送貨員崗位勞動(dòng)合同模板
- 2024年自然資源部所屬事業(yè)單位招聘(208人)歷年高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 《建筑施工安全檢查標(biāo)準(zhǔn)》JGJ59-2019
- 廣東茂名市選聘市屬國(guó)有企業(yè)招聘筆試題庫2024
評(píng)論
0/150
提交評(píng)論