心理測量學(xué)課件_第1頁
心理測量學(xué)課件_第2頁
心理測量學(xué)課件_第3頁
心理測量學(xué)課件_第4頁
心理測量學(xué)課件_第5頁
已閱讀5頁,還剩319頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

心理測量學(xué)第一節(jié)概述

測量與測量量表心理測驗的基本概念心理測驗的分類糾正錯誤的測驗觀心理測驗在心理咨詢中的應(yīng)用心理測驗的發(fā)展史第一單元測量與測量量表元素一、什么是測量對象——工具——結(jié)果——事物(屬性)法則數(shù)字(區(qū)分,等級,等距,可加)定義:法則→事物(屬性)→數(shù)量化確定物理、社會和心理測量共性單位(事物標(biāo)準(zhǔn)量名稱)意義明確單位等距參照點(量的計算起點)絕對零點相對零點全無人為二、測量要素

三、測量量表按標(biāo)準(zhǔn)化樣本中大量測驗結(jié)果制定的、有一定單位和參照點的、

標(biāo)度由低到高排列的連續(xù)體。含義種類

基本特征

功能

運算

舉例命名屬性、類別分類或描述性別、民族職業(yè)、?順序無相等單位無絕對零點1+等級不能+-×÷品德、能力、愛好?等距有相等單位無絕對零點2+差異決策和比較可+-溫度、成績分數(shù)?比率有相等單位有絕對零點3+比值決策和比較可+-×÷身高、體重、投資?不同水平的量表第二單元心理測驗的基本概念一、心理測驗的定義法則事物數(shù)字心理學(xué)理論操作程序代表性行為推論數(shù)量化分析二、心理測驗的性質(zhì)間接性外部行為—→心理特質(zhì)行為樣本含義:反映被試行為特征的一組代表性行為相對性——比較而言解釋測驗分數(shù)的參照標(biāo)準(zhǔn)常??陀^性——標(biāo)準(zhǔn)化含義:反映被試行為特征的一組代表性行為。標(biāo)準(zhǔn)化含義:編制和實施等所遵循的一套標(biāo)準(zhǔn)程序。目的:測量結(jié)果的準(zhǔn)確性和客觀性。標(biāo)準(zhǔn)化測驗材料測驗實施評分記分分數(shù)解釋客觀性——試卷試題信度效度難度區(qū)分度評價測驗的指標(biāo)第三單元

心理測驗的分類

一、測驗功能智力測驗:一般能力水平特殊能力測驗:潛能或發(fā)展傾向人格測驗:非認知性的特征二、測驗材料的性質(zhì)文字測驗操作測驗(圖形,儀器,工具,實物)三、測驗材料的嚴謹程度客觀測驗投射測驗呈現(xiàn)的刺激詞句、圖形等意義明確,可直接理解刺激無明確意義被試反應(yīng)無明確規(guī)定四、測驗的方式個別測驗團體測驗五、測驗要求最高行為測驗認知測驗(智力測驗,成就測驗)典型行為測驗人格測驗第四單元糾正錯誤的測驗觀錯誤觀測驗萬能論測驗無用論正確觀重要的研究方法之一——輔助工具尚不完善第五單元

心理測驗在心理咨詢中的應(yīng)用

智力測驗吳天敏:中國比內(nèi)智力量表龔耀先韋氏成人智力量表(WAIS-RC)韋氏兒童智力量表(C-WISC)韋氏幼兒智力量表(C-WYCSI)林傳鼎:韋氏兒童量表(WISC-CR)張厚粲:瑞文標(biāo)準(zhǔn)型測驗(SPM)李丹:聯(lián)合型瑞文測驗(CRT)

人格測驗艾森克人格問卷(EPQ)卡特爾16項人格因素問卷(16PF)明尼蘇達多項人格調(diào)查表(MMPI)

心理評定量表精神病評定量表躁狂狀態(tài)評定量表抑郁量表,焦慮量表,恐怖量表

案例二明尼蘇達多相人格問卷(MMPI)

背景:1942年首發(fā)。新版MMPI-2,1989年發(fā)行。新版

MMPI-A用于青少年。設(shè)計:標(biāo)準(zhǔn)記分鍵,個人回答模式與已被診斷歸入某一臨床人群者比較。出自8個臨床量表分數(shù)加男子氣—

女子氣和社交內(nèi)向性及三個效度量表。題目:原版550題,“是”,“否”或“不肯定”回答。新版替換了約100題。計分:分數(shù)剖析圖。現(xiàn)測驗解釋按高分模式,產(chǎn)生編碼描述不同的剖析圖。有電腦測驗解釋。應(yīng)用:臨床評估,為臨床篩選設(shè)計。子版本:加州心理問卷從中抽取一半題目,用于正常人;

5000多已發(fā)表研究用了MMPI。第六單元心理測驗的發(fā)展史歷史時期先驗期時間:20世紀以前特點:重實用,缺理論,主觀性強科學(xué)期時間:20世紀初~至今階段經(jīng)典測驗理論:50′前現(xiàn)代測驗理論:50′后特點測驗理論形成測驗工作系統(tǒng)化一、中國古代的心理測驗思想1.測驗思想

孔子

孟子中人、中人以上、中人以下“中人以上可以語上也、中人以下不可語上也”權(quán),然后知輕重;度,然后知短長。物皆然,心為甚,王者度之。

劉劭“觀其感變,以審常度”?!皯?yīng)贊”

劉勰思《人物志》J.K.Shryock《人類能力的研究》使左物畫方,右的畫圓,無一時俱成《新論·專學(xué)篇》由心不兩用則物不并運也。

民間七巧板九連環(huán)等顏氏家訓(xùn)《風(fēng)操篇》周歲試兒

描述性,不定量,分類的;心理特點與道德觀念相結(jié)合;2.科舉考試3千年前六藝取士及隋唐科舉制起源特點

二、科學(xué)心理測驗的產(chǎn)生與發(fā)展原因社會需要個別差異研究實驗心理學(xué)鑒別智殘和精神障礙專才訓(xùn)練和職業(yè)指導(dǎo)早期嘗試E.G.Boring(美)19世紀80年代是高爾頓的十年,90年代是卡特爾的十年,20世紀頭十年是比奈的十年高爾頓的10年

F.Galton,英,1822測驗運動首倡者第1個使用智力測驗者;第1個大量系統(tǒng)測量個別差異者;1884-1890,“人類測量實驗室”,測9337人。應(yīng)用評定量表和問卷法的先驅(qū);統(tǒng)計學(xué)家、生物學(xué)家、業(yè)余心理學(xué)家;優(yōu)生學(xué)的創(chuàng)始人;首次提出“測驗”和“心理測驗”術(shù)語(《人的能力研究》,1883)反應(yīng)時間,拉力和擰力,吹氣的力量,身高,體重,臂長,呼吸力量,肺活量,視力和聽力的靈敏度,色彩分辨能力,判斷長度的能力“人體測量研究室”測量內(nèi)容卡特爾的10年CattellJ.M.,美,1861實驗心理與測驗運動結(jié)合;“心理測驗”首次在心理學(xué)文獻出現(xiàn)(《心理測驗與測量》);創(chuàng)立心理測驗公司;培養(yǎng)優(yōu)秀學(xué)生:桑代克,佛朗茲等;握力,動作速度,觸覺兩點閾,重量辨別,聲音反應(yīng)時,痛感受性說出四種混雜顏色名稱的速度,時間判斷力,平分線段的精確性復(fù)述聽過一次字母數(shù)目的能力卡特爾智力測驗內(nèi)容1891-1901:成績與人體測驗無明顯相關(guān),各測驗間相關(guān)性也極差。二、科學(xué)期1.比奈的10年A.Binet,法,1857-19111898年,《個性心理學(xué)中的測量》,近代思想1903年,《智力的實驗研究》,廣義智力概念;1905年,B-S量表;第一個正式智力量表。(一)經(jīng)典測驗理論階段2.測驗的發(fā)展特點20’—狂熱,40’—頂峰,50’—平穩(wěn)操作測驗的發(fā)展團體智力測驗發(fā)展Otis陸軍甲種測驗(1917)Otis陸軍乙種測驗(1927)能力傾向測驗標(biāo)準(zhǔn)化成就測驗斯坦福成就測驗(1923)美國教育測驗中心(ETS,1947)成立;人格測驗的發(fā)展先驅(qū)—E.Kraepelin20世紀40年代后三、現(xiàn)代心理測驗在我國的發(fā)展時間:1914年前后修訂:智力測驗1979年后修訂智力、人格種類測驗編制本土化的智力、人格等測驗國內(nèi)參考書目戴忠恒《心理與教育測量》江蘇,87《教育測量》余嘉元《教育測量》王孝玲華東師大,88)《心理測量》鄭日昌湖南,88凌文輇,濱治世《心理測驗法》科學(xué),88凌文輇,方利略.心理與行為的測量.02

常模團體常模的類型常模分數(shù)的表示方法第一單元常模團體

一、常模團體的性質(zhì)

常模團體共同特征的人或總體的代表性樣本常模的選擇

確定一定總體確定目標(biāo)總體抽取研究樣本大學(xué)生湖南大學(xué)生文理科大學(xué)生常模團體的成員成就測驗和能力傾向測驗?zāi)壳暗臐撛诘母偁幷邚V泛的能力測驗和人格測驗同齡或同等教育水平者此外,性別、年齡、教育水平、職業(yè)、社經(jīng)地位、種族等也可作為常模團體的標(biāo)準(zhǔn)。二、常模團體的條件

群體明確性別、年齡、教育水平、職業(yè)、社經(jīng)地位、種族、地理地域

代表性樣本——案例樣本大小適當(dāng)一般標(biāo)準(zhǔn):最低不少于30或100。全國常模:一般2000~3000。時空性代表性樣本抽取——智力測驗第1層第2層要求年齡姓別地域民族職業(yè)城鄉(xiāng)教育各年齡階段各姓別組各地區(qū)各民族各類職業(yè)城市和鄉(xiāng)村教育水平16~64各年齡組男女人數(shù)相等西部、中部、東部…白人、黑人、西班牙…工程師、教師、管理者…5000人以上為城市高中、大學(xué)、碩士…三、取樣的方法

(一)簡單隨機抽樣隨機原則——總體——樣本操作方法抽簽法——有放回抽樣和無放回抽樣

隨機數(shù)字表特點:機會均等,操作簡便局限性總體較分散—→樣本也較分散總體個體差異較大—→樣本容量要大樣本容量較小—→分布不均勻(二)系統(tǒng)抽樣以某個隨機數(shù)字為起點,間隔一定單位抽取樣本。抽樣間隔:特點樣本分布均勻,抽樣誤差較小不足有系統(tǒng)誤差,隨機性較差改進與簡單隨機抽樣結(jié)合使用(三)分層抽樣標(biāo)志—→總體—→若干層次—→樣本分層比例抽樣

如用50名學(xué)生數(shù)學(xué)推理平均成績估計500名學(xué)生平均成績。設(shè)在數(shù)學(xué)成就測驗中100人為優(yōu),320人為中,80人差,求每一層容量???cè)萘棵繉涌側(cè)萘繕颖救萘糠謱臃潜壤闃犹攸c分布較均勻:各層都有被抽取的機會,抽樣誤差更小,代表性更強在總體分布不均勻時,該方法效果更好

(四)分組抽樣(整群抽樣)以“群”抽樣單位抽樣特點組織形式簡便易行,不會打亂學(xué)?;騿挝坏恼V刃虿蛔銟颖痉植疾痪鶆颍闃诱`差較大改進方法適當(dāng)擴大樣本容量,減小抽樣誤差與分層抽樣法或其他方法配合使用常模分數(shù)原始分數(shù)

導(dǎo)出分數(shù)。導(dǎo)出分數(shù)用相應(yīng)數(shù)學(xué)模型對原始分進行轉(zhuǎn)換所得分數(shù)具有一定的參照點和單位——測驗量表分四、常模分數(shù)與常模

(一)常模分數(shù)原始分數(shù)轉(zhuǎn)化的目的個體間差異個人的某種心理特質(zhì)處于常模團體中的相對地位個體內(nèi)差異提供相同尺度量數(shù)使個人在2種以上測驗的結(jié)果可相互比較案例:WAIS-CR:言語分量表分測驗原始分數(shù)量表分IQ知識2716城市:137農(nóng)村:130領(lǐng)悟2818算術(shù)1614相似性2013數(shù)字廣度1817詞匯7415合計—93一28歲被試WAIS測驗結(jié)果(二)常模(norm)常模

解釋測驗結(jié)果的參照依據(jù)常模分數(shù)構(gòu)成的分布標(biāo)準(zhǔn)化測驗必須有常模一般常模與特殊常模一般常模:測驗手冊的常模特殊常模:非典型團體的常模二者可結(jié)合使用第二單元常模的類型

適用范圍全國常模區(qū)域常模特殊群體常模解釋方式發(fā)展常模百分常模標(biāo)準(zhǔn)分數(shù)常?!?/p>

一、發(fā)展常模定義特質(zhì)按正常途徑發(fā)展所處的發(fā)展水平類型發(fā)展順序常模年級常模年齡常模(一)發(fā)展順序常模定義在嬰幼兒行為發(fā)展觀察中建立的量表發(fā)展變化與年齡相聯(lián)系葛塞爾(1947)嬰兒早期行為發(fā)展順序量表特點最早的量表嬰幼兒智力發(fā)展量表葛塞爾發(fā)展量表(1940,4周~5歲)麥利爾-帕爾默量表(1歲半~6歲)卡特爾嬰幼兒評定量表(1973,3天~4周)貝利嬰兒發(fā)展是表(1933,1969,2~30月)麥卡錫兒童能力量表(1972,2歲半~8歲半)考夫曼兒童成套評估測驗(1983,2.5~12.5)丹佛發(fā)展篩選測驗(1967,初生~6歲)中國0~3歲小兒精神檢查表(茅于燕)中國3~6歲兒童發(fā)展量表(1985,張厚粲)葛塞爾嬰兒感覺運動發(fā)展順序周行為表現(xiàn)4控制眼睛運動,能追隨一個對象看等16能使頭保持平衡28能用手抓握并玩弄東西40能控制軀干、聳立和爬52能控制腿和腳的運動、站立和行走皮亞杰兒童守恒概念發(fā)展守恒概念年齡質(zhì)量守恒5重量長度6容量長度7(二)年齡常模定義個體在某個年齡組的平均操作水平智力年齡mentalage通過率指標(biāo)確定方法題目年齡水平平均數(shù)例如:某兒童6歲在B-S量表中,通過6歲組全部題目,通過7歲組4題,8歲組3題,9歲組1題,則智齡為(三)年級常模定義某年級全體學(xué)生典型水平的一個分數(shù)年級水平平均數(shù)教育成就測驗指標(biāo)應(yīng)用一剛升入4年級的學(xué)生,其閱讀水平為4.4,計算水平為3.8.(四)年齡與年級常模的評價年齡常模優(yōu)點易理解易解釋不足不穩(wěn)定不適于成人年級常模局限性適于一般課程,不適于高中以上解釋較難常被誤用為標(biāo)準(zhǔn)二、百分位常模

百分等級(perceptilerank)四分位數(shù)(quartile)十分位數(shù)(deciles)百分位數(shù)(perceptile)(一)百分等級方式以X與PR對照表的方式呈現(xiàn)定義一群分數(shù)中低于某分數(shù)者所占的百分比分析方法個體分數(shù)各組分數(shù)計算公式個體分數(shù)各組分數(shù)某團體共100人,試問第15名的百分等級是多少?若團體人數(shù)分別為50人,40人,20人時,其百分等級是多少?若團體人數(shù)為200,500,1000呢?(二)百分位數(shù)(點)例5-3:高考選得分高于15%的被試。已知最高分為695,其PR為100;最低分103,PR為1。求其分數(shù)的最低限是多少?求相當(dāng)于85%的測驗分數(shù)分析百分等級與百分位數(shù)的關(guān)系

百分位數(shù):已知_________,求________。

百分等級:已知_________,求________。百分等級分數(shù)分數(shù)百分等級(三)四分位數(shù)和十分位數(shù)百分位數(shù)任一百分位數(shù)值四分位數(shù)四分之一或四分之三等位置上的數(shù)值十分位數(shù)十分之一等位置上的數(shù)值(四)百分位常模的評價優(yōu)點局限易計算易解釋不受原始分分布形態(tài)影響單位不等距無法比較不同被試間分數(shù)差異的數(shù)量三、標(biāo)準(zhǔn)分數(shù)

(一)標(biāo)準(zhǔn)分數(shù)的定義

定義以標(biāo)準(zhǔn)差所表示的原始分數(shù)(X)與平均數(shù)的偏差公式z分數(shù)某研究者得到以下兩組成績:分組測驗成績(X)甲組54637274828899乙組67717376798284

試問:

①兩組分數(shù)的分布是否一樣?為什么?表2-2兩組學(xué)生測驗得分表∑XM5327653276②哪個均數(shù)的代表性更好?為什么?數(shù)據(jù)的基本分布特征及量數(shù)集中趨勢——集中量數(shù)——平均數(shù)描述一組數(shù)據(jù)向中間某一值靠攏的量數(shù)離中趨勢——差異量數(shù)——標(biāo)準(zhǔn)差描述一組數(shù)據(jù)離中趨勢的量數(shù)標(biāo)準(zhǔn)差的意義與計算含義表示一組數(shù)據(jù)的平均距離符號:S或SD(Standarddeviation)公式定義式:計算式:離均差(離差)理解練習(xí)試估計49和51分的平均數(shù)和標(biāo)準(zhǔn)差。分析結(jié)果(二)標(biāo)準(zhǔn)分數(shù)的實質(zhì)把單位不等距和缺乏明確參照點的分數(shù)轉(zhuǎn)換成以標(biāo)準(zhǔn)差為單位,以均數(shù)為參照點的量表分數(shù)。-5

-4

-3

-2

-1

01

2

3

4

5

99.73%(三)常見標(biāo)準(zhǔn)分數(shù)z分數(shù)Z分數(shù)正態(tài)化的標(biāo)準(zhǔn)分數(shù)T分數(shù)標(biāo)準(zhǔn)九分離差智商(IQ)(四)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分數(shù)

1、z分數(shù)z分數(shù)是最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分數(shù)特點以M為0點,S為1的量表表示;絕對值表示:X與M的距離正負號表示:X在M上下的位置分布形狀與X分布形狀相同正態(tài)偏態(tài)2、Z分數(shù)應(yīng)用普通學(xué)科測驗普通分類測驗美大學(xué)入學(xué)考試

線性轉(zhuǎn)換標(biāo)準(zhǔn)分(五)正態(tài)化的標(biāo)準(zhǔn)分數(shù)

1.意義X分布正態(tài),Z與曲線下面積有特定關(guān)系直接作正態(tài)轉(zhuǎn)換正態(tài)化標(biāo)準(zhǔn)分X分布非正態(tài)時的正態(tài)轉(zhuǎn)換X→PR→Z→T2.T標(biāo)準(zhǔn)分數(shù)定義經(jīng)正態(tài)化的一種標(biāo)準(zhǔn)分數(shù)轉(zhuǎn)換公式(W.A.McCall,1939)3.標(biāo)準(zhǔn)九分均數(shù):5標(biāo)準(zhǔn)差:2最高分:9最低分:1

除1和9,其余分數(shù)包含0.5個σ標(biāo)準(zhǔn)九與S、Pm的對應(yīng)關(guān)系標(biāo)準(zhǔn)九標(biāo)準(zhǔn)差范圍百分位數(shù)范圍9+1.75以上96~998+1.25~+1.7589~957+0.75~+1.7577~886+0.25~+0.7560~765-0.25~+0.2541~594-0.75~-0.2524~403-1.25~-0.7512~232-1.75~-1.255~111-1.75以下1~44.標(biāo)準(zhǔn)十分和標(biāo)準(zhǔn)二十分標(biāo)準(zhǔn)十分平均數(shù):5標(biāo)準(zhǔn)差:1.5標(biāo)準(zhǔn)二十分平均數(shù):10標(biāo)準(zhǔn)差:3量表分:四、智商及其意義

(一)比率智商

斯坦福-比內(nèi)量表修訂者:推孟時間:1916智商計算心理年齡實際年齡一兒童實際年齡7歲,S-B測驗的心理年齡為8歲,則其智商為(二)離差智商

韋氏離差智商編制者:韋克斯勒公式:IQ=15Z+100分析從不同測驗獲得的IQ,其S不同只有當(dāng)S相同或接近時才可比較S-B離差智商(1960)IQ=16Z+100IQ分組S=12S=14S=16S=18130以上0.71.63.15.1120-1294.36.37.58.5110-11915.216.015.815.4100-10929.826.123.621.090-9929.826.123.621.080-8915.216.015.815.470-794.36.37.58.570以下0.71.63.15.1S不同時:IQ水平的百分比韋氏智力測驗構(gòu)架評估多種認知能力的測驗組合分測驗的量表分:IQ=3Z+10言語、操作和全量表:IQ=15Z+100量表構(gòu)成全量表言語操作常識類同算術(shù)詞匯記憶廣度填圖積木拼圖譯碼排序理解迷律第三單元常模分數(shù)的表示方法轉(zhuǎn)化表由X、導(dǎo)出分數(shù)和對常模團體的具體描述等三要素構(gòu)成的表格。

剖面圖

一、轉(zhuǎn)換表或常模表簡單轉(zhuǎn)換表把單項測驗X轉(zhuǎn)換成一種或幾種導(dǎo)分數(shù)。復(fù)雜轉(zhuǎn)換表多個分測驗或各種常模團體的X與導(dǎo)出分數(shù)的對應(yīng)關(guān)系。1、簡單轉(zhuǎn)換表范例X分組PRT分數(shù)75-7999.4(99)7570-7496.6(97)6865-6990.8(91)6360-6481.8(82)5955-5966.6(67)5450-5443.8(44)48某測驗X的PR和T轉(zhuǎn)化表2、復(fù)雜轉(zhuǎn)化表大學(xué)生戈登人格問卷的百分等級分數(shù)男性

謹慎獨創(chuàng)人際活力女性謹慎獨創(chuàng)人際活力38373635343399999899989799989795989796929795999998999897989796999796959896949397分數(shù)大學(xué)生中學(xué)生工人干部383736353433

9998979699989998969389999897959188不同團體戈登問卷“謹慎性”PR常模轉(zhuǎn)化表(二)剖面圖

以圖形方式表示測驗分數(shù)的轉(zhuǎn)換關(guān)系特點直觀性IQ各分量表分的PR及質(zhì)的描述分量表分百分等級質(zhì)的描述教育描述1999189817971696159514911384127511631050937825716695542312111強處弱處資質(zhì)優(yōu)異優(yōu)秀中上中等或平均中下愚笨白癡資質(zhì)優(yōu)異中等或平均中上中下學(xué)習(xí)遲緩智能不足信度概念信度的評估方法信度與測驗分數(shù)的解釋影響信度的因素成熟標(biāo)志20世紀50年代古利科遜《心理測驗理論》三大支柱基本假設(shè)信度效度第一單元信度的概念一、經(jīng)典測驗理論ClassicalTestTheory(CTT)(一)測量誤差1、定義與測量目的無關(guān)不準(zhǔn)確測量效應(yīng)測量因素測量結(jié)果或不一致2、誤差的種類

系統(tǒng)誤差隨機誤差隨機誤差與系統(tǒng)誤差的比較類型產(chǎn)生原因結(jié)果表現(xiàn)(結(jié)果不一致)特點指標(biāo)同異隨機誤差…偶然因素不易控制方向和大小上完全隨機穩(wěn)定性準(zhǔn)確性信度系統(tǒng)誤差…因素恒定、規(guī)律穩(wěn)定地存在于每次測量中正確性效度3、誤差來源三層面模式測量工具測試對象施測過程(二)基本假設(shè)與真分數(shù)1、分數(shù)觀測分數(shù)誤差分數(shù)真分數(shù)測驗所得未加工無誤差理論上真正特質(zhì)水平操作上多個平等測驗的平均數(shù)2、基本假設(shè)例2-1:某一物理測量結(jié)果(單位:微)物質(zhì)編號實測重量X真正重量T誤差EA12102B1920-1C2730-3D41401E51501∑1501500

S2

203.22003.2SE--1.8M30300定義T與X關(guān)系數(shù)學(xué)模型X=T+ET=X-E二、信度的概念S2T,S2E

,S2X的關(guān)系與信度S2XS2XS2TS2ES2TS2E(一)信度的定義

1、理論定義真分數(shù)方差與觀測分數(shù)方差的比值或2、操作定義兩組測驗分數(shù)之間的相關(guān)系數(shù)測量工具或結(jié)果的一致性(穩(wěn)定性)程度3、rXX值與測驗誤差的關(guān)系r=0.50r=0.75r=0.90S2ES2TS2TS2TS2ES2E(二)信度的指標(biāo)

1、信度系數(shù)與信度指數(shù)信度系數(shù)同一群人幾次測驗結(jié)果一致性信度系數(shù)的平方根信度指數(shù)緣由:rXX只反映X與T的符合程度未反映個體測驗分數(shù)的變異2、測驗標(biāo)準(zhǔn)誤測驗中個體真分數(shù)的指標(biāo)理論上:一個個體多次測驗結(jié)果分布的變異實際上:一組個體兩次測驗結(jié)果分布的變異測量標(biāo)準(zhǔn)誤測量誤差分數(shù)分布的標(biāo)準(zhǔn)差用途衡量測量值(X)與測量對象真值(T)的偏離程度的一種指標(biāo)用來估計個人的真分數(shù)個人分數(shù)的誤差個體測驗分數(shù)重測時的變化公式實得分數(shù)標(biāo)準(zhǔn)差

個人分數(shù)的誤差

rXX越大:變化的可能性越小

rXX=1:完全不變化第二單元信度評估的方法信度重測信度復(fù)本信度內(nèi)部一致性信度評分者信度分半信度同質(zhì)性信度重測復(fù)本信度一、重測信度含義同一測驗同組對象前后測2次相關(guān)系數(shù)穩(wěn)定性程序誤差時間太短練習(xí)效應(yīng)記憶效應(yīng)A卷一定時距A卷太長身心變化

優(yōu)點省力、省時測量屬性相同提供隨時間變化的資料

不足適用范圍異質(zhì)性運動技能速度時間間隔長短評價二、復(fù)本信度含義兩等值測驗最短時間內(nèi)對同組對象施測結(jié)果r等值性程序誤差內(nèi)容取樣A卷最短時距B卷

優(yōu)點代表性增強,信度更準(zhǔn)避免練習(xí)、記憶效應(yīng)

不足編制復(fù)本難影響積極性觸類旁通評價三、重測復(fù)本信度含義兩等值測驗一定時間內(nèi)對同組對象施測結(jié)果r等值性穩(wěn)定性程序誤差內(nèi)容取樣時間A卷一定時距B卷重測信度與復(fù)本信度有何異同?重測復(fù)本信度與重測、復(fù)本信度誰得估計更嚴格,為何?小結(jié)與問題重測信度復(fù)本信度內(nèi)部一致性跨時間一致性跨形式一致性試題之間有何關(guān)系三、內(nèi)部一致性信度含義測驗各題間一致性題目一致性行為變量異質(zhì)性分半信度類型內(nèi)容取樣同質(zhì)性信度(一)分半信度1、分半條件與程序分半方法奇偶題分半分析程序兩半相關(guān):rhh校正:rnn難易:低

高分半條件兩半相似:M、S項目組間相關(guān)分布形態(tài)內(nèi)容2、校正方法斯皮爾曼-布朗公式方差相等時弗拉南根公式盧尤公式方差不等時(二)同質(zhì)信度同質(zhì)性題目間的內(nèi)部一致性類型庫-理信度克龍巴赫

系數(shù)0、1題型K-R20難度不同k-R21難度相近各類題型四、評分者信度(一)含義與方法含義評分者評分的一致性方法2評分者2個以上者rXYrρ肯德爾和諧系數(shù)(二)肯德爾和諧系數(shù)K個評價者評N個被評者或作品1、應(yīng)用范圍和W系數(shù)應(yīng)用1個評價者先后K次評N個被評者或作品W范圍0~1第三單元信度與測驗分數(shù)的解釋真分數(shù)與實得分數(shù)相關(guān)的解釋信度系數(shù)和信度指數(shù)測量標(biāo)準(zhǔn)誤信度的評價直接解釋一、真分數(shù)與實得分數(shù)相關(guān)的解釋rXX間接解釋信度系數(shù)決定系數(shù)∵r2XT=ST2/SX2=rXX∴rXX為各方差的百分比S2X分為各S2E和S2T∵誤差源不同信度估計法不同rXX=0.90(一)信度系數(shù)和指數(shù)

例2-13:設(shè)有兩平等的創(chuàng)造力測驗(A和B)。現(xiàn):

1)間隔兩月施測100人,其信度為0.70;

2)兩卷分半信度校正值為0.80;

3)第2個評分者隨機抽50份,信度0.92;試問:

1)真分數(shù)的方差是多少?

2)各種信度的誤差是多少?間接解釋范例信度類型rXX重測復(fù)本0.70分半信度0.80評分者信度0.92總誤差方差真分數(shù)方差分析結(jié)果

誤差源時間、內(nèi)容內(nèi)容取樣評分者差異

兩者之差誤差的方差時間取樣1-0.70=0.31-0.80=0.20.3-0.2=0.10.2+0.1+0.08=0.381-0.38=0.621-0.92=0.08X與T的接近程度信度指數(shù)rXX=0.90(二)測量標(biāo)準(zhǔn)誤用途衡量測量值(X)與測量對象真值(T)的偏離程度的一種指標(biāo)用來估計個人的真分數(shù)個人分數(shù)的誤差

rXX越大:變化的可能性越小

rXX=1:完全不變化

例2-14:某測驗信度0.89,S為15,其測量標(biāo)準(zhǔn)誤是多少?表2-12用rXX與SX估計測量標(biāo)準(zhǔn)誤

信度

S0.950.900.850.800.750.70306.79.511.613.415.016.4286.38.910.812.514.015.8265.88.210.111.613.014.2245.47.89.310.712.013.1224.97.08.59.811.012.0204.56.37.78.910.011.0184.05.77.08.09.09.9163.65.16.27.28.08.8143.14.45.46.37.07.7122.73.84.65.46.06.6102.23.23.94.55.05.581.82.53.13.64.04.461.31.92.32.73.03.340.91.31.51.82.02.220.40.60.80.91.01.1

優(yōu)點解釋個人分數(shù)時,可指出其誤差的范圍不受群體異質(zhì)性的影響

局限不同測驗間的信度無法比較標(biāo)準(zhǔn)誤因信度計算法不同而不同“不論高低分,SEe相等”的假設(shè)不完全成立二、確定信度可接受水平測驗類型最低標(biāo)準(zhǔn)標(biāo)準(zhǔn)化測驗人格測驗非標(biāo)準(zhǔn)化測驗0.900.80-0.850.60-0.85典型測驗的一般標(biāo)準(zhǔn)典型測驗的信度高低水平測驗類型

低中高成套成就測驗學(xué)術(shù)能力測驗成套傾向性測驗客觀人格測驗興趣問卷態(tài)度量表.66.92.98.56.90.97.26.88.96.46.85.97.42.84.93.47.79.98三、解釋個人分數(shù)的意義公式——個體真分數(shù)估計例如:某班一次標(biāo)準(zhǔn)化成就測驗(rxx=0.80)中的SE為5,某生的測驗分80。試問該生測驗的真分數(shù)是多少?置信度D=.95置信區(qū)間

分析結(jié)果

表2-9某生測驗真分數(shù)的信度區(qū)間SEe數(shù)目置信水平置信區(qū)間168.2680±5(75~85)295.4580±10(70~90)399.9380±15(85~95)1.969580±9.8(70.2~89.8)2.589980±12.9(67.1~92.9)四、比較不同測驗分數(shù)的差異

例如,某生在韋氏成人智測中,語言IQ為102,操作IQ為106。且知言語與操作的分半信度各為0.96和0.93。問該生操作能力是否顯著優(yōu)于言語能力?分析結(jié)果結(jié)論差異未達1個標(biāo)準(zhǔn)誤操作IQ并不高于語言IQ差異顯著性:

本例:(106-102=4)第四單元影響信度的因素

測驗長度樣本特征測驗難度時間間隔

一、測驗長度含義測驗試題的數(shù)量特點測驗越長,試題取樣越恰當(dāng),測驗越長,猜測性越小長度與信度的關(guān)系

例2-16:某測驗有40題,信度0.65,若增至120題,信度會是多少?

例2-17:某測驗有30題,信度0.75,試問要達到多少題才能使信度達到0.90?特點樣本越異質(zhì),分數(shù)分布越廣,S↑,r↑,測驗越可靠二、樣本特征

(一)樣本團體異質(zhì)性的影響分析信度相關(guān)散布圖計算散布圖整段范圍低高

(二)樣本團體平均能力水平的影響

例如,S-B量表,不同年齡和難度水平信度值從0.83~0.98。顯然,每個信度都要求對建立信度的團體進行描述。選擇測驗時應(yīng)注意取樣團體的變異性和能力水平建立信度的團體與欲測團體是否一致趨勢分別對非常同質(zhì)團體建立標(biāo)準(zhǔn)化樣本??紤]年齡、性別、年級、職業(yè)和相似性等,選擇適合其所在測驗團體性質(zhì)的信度系數(shù)和測驗。一般趨勢難度分布越廣,信度越高難度與題型簡答題:P=0.5時,X為0~100,信度最高。選擇題的理想難度三、測驗難度滿分值理論概率

例2-22:在100個正誤題測驗中,滿分為100,其理想難度是多少?例2-23:在100個五擇一測驗中,滿分為100,其理想難度是多少?分析結(jié)果例2-22例2-23學(xué)績測驗選擇題的理想平均難度(洛德)五擇一:0.70四擇一:0.74三擇一:0.77是非題:0.85智力的時間變化

間隔期信度系數(shù)同日或次日0.90~0.951年0.852~2.5年0.805年0.75~0.809年0.78四、時間間隔S-B隔六年,rXX的變化年齡的時間變化年齡越低,信度越低

第一次第二次rXX4100.739150.8711170.92理論假設(shè):T=X-E;S2T=S2X

-S2E信度:測量結(jié)果的穩(wěn)定性類型重測、復(fù)本、重測復(fù)本內(nèi)部一致性:分半、同質(zhì)性評分者本章小結(jié)

(Validity)效度的概念效度評估的方法效度的功能影響效度的因素第一單元效度的概念效度的定義效度的性質(zhì)一、效度的定義

(一)理論定義信度S2X=S2T+S2E效度S2X=S2V+S2I+S2E隨機誤差有效方差S2V系統(tǒng)誤差S2I與測驗?zāi)康挠嘘P(guān)的有效SV2和實得SX2

的比值效度效度定義測到欲測東西的程度效度效度定義(二)操作定義(三)信度與效度的關(guān)系信度是效度的必要條件非充分條件S2E↓,S2T↑,rxx↑信度高,給S2V增加提供可能能否提高效度,再看S2I大小信度高不一定效度高效度要高,S2V須占較大比重,S2T↑效度高,信度必高ST2信效度關(guān)系SV2SI2SE2SV2SI2SE2SV2SI2SE2ST2SX2ST2SX2ST2rxyrxx

rxyrxx

rxyrxx

↑↓↑↑↓↓相對性無普遍性:針對某種特殊用途而言只有程度不同,無所謂全有或全無連續(xù)性評價上:無“全有”或“全無”二、效度的性質(zhì)第二單元效度評估的方法

弗蘭士(J.W.French)和米希貝爾(W.B.Michbel):1966美國心理學(xué)會(1974,1985,1999):StandardsforEducationalandsychologicalTests內(nèi)容效度結(jié)構(gòu)效度效標(biāo)關(guān)聯(lián)效度

一、內(nèi)容效度意義方法特點應(yīng)用評價(contentvalidity)一、內(nèi)容效度

(一)意義定義:測驗對欲測內(nèi)容的覆蓋程度作用:探討測題取樣的恰當(dāng)性條件內(nèi)容范圍明確取樣有代表性成就測驗內(nèi)容效度的要素教學(xué)目標(biāo)教材內(nèi)容

測驗內(nèi)容

測驗?zāi)繕?biāo)知識技能解釋(概念)(計算)(其它)方差標(biāo)準(zhǔn)差8257103515合計186022合計4060100表3-1差異量測驗的雙向細目表含義專家按測題和假設(shè)內(nèi)容范圍作出的符合度判斷即邏輯效度作法與程序確定總體范圍編制雙向細目表;制定評定量表;(二)評估方法1、專家判斷法局限無良好的數(shù)量指標(biāo)描述這種符合性的程度;不同專家對同一測驗內(nèi)容效度的判斷可能不一致;不同專家對內(nèi)容范圍會有不同的理解2、經(jīng)驗推測法檢查不同年級被試總分與每題分數(shù)變化情況若隨年級增高總分和每題通過率也升高,可推論該測驗基本測量了教學(xué)內(nèi)容和目標(biāo)檢查不同年齡兒童測驗分數(shù)的變化情況是否隨年齡增長而增加信度指標(biāo)評分者信度復(fù)本信度r高:內(nèi)容效度r低:至少一個缺乏內(nèi)容效度再測度度經(jīng)驗法3、統(tǒng)計分析法(三)特性特定性:測驗編制者與使用者的關(guān)系與表面效度(facevalidity)混淆

一個測驗看上去適合欲測目的的程度,而非實際適合欲測目的的程度。

測驗在使用者或被試主觀上感覺有效的程度。

編制測驗應(yīng)適當(dāng)考慮表面效度。二、構(gòu)想效度定義確定步驟估計方法(constructvalidity)二、構(gòu)想效度

(一)定義構(gòu)想(理論,結(jié)構(gòu))解釋行為的理論框架或心理特質(zhì)的抽象概念。結(jié)構(gòu)效度心理學(xué)理論所能解釋的程度測驗在多大程度上測量了所要測的理論構(gòu)想(二)確定步驟提出理論提出假設(shè)檢驗假設(shè)解釋被試的測驗表現(xiàn)測驗成績的假設(shè)邏輯和實證檢驗方法關(guān)于情緒穩(wěn)定性的假設(shè)測驗分數(shù)和心理學(xué)家的評價有某種程度的相關(guān)精神病人和正常人的測驗分數(shù)是有區(qū)別的;測驗分數(shù)和同伴的評價有一定的關(guān)系;測驗分數(shù)與IQ沒有什么關(guān)系;測驗分數(shù)和性別沒有關(guān)系;關(guān)于智力的假設(shè)智力隨年齡而增長;智力與學(xué)業(yè)成績有密切關(guān)系;智商是相對穩(wěn)定的;智力受遺傳的影響關(guān)于創(chuàng)造力的假設(shè)測驗分數(shù)與根據(jù)創(chuàng)造力的心理學(xué)理論觀察被試行為所作出的判斷有相關(guān);具有創(chuàng)造力的個體行為與其他人不同;(三)估計方法

1、對測驗本身的分析測驗內(nèi)方法測驗間方法效標(biāo)關(guān)聯(lián)效度實驗操作概化能力的研究(三)估計方法

1.對測驗本身的分析——測驗內(nèi)方法研究測驗內(nèi)部構(gòu)造分析測驗的結(jié)構(gòu)效度。具體方法內(nèi)容效度法內(nèi)部一致性法分析解題的心理過程

1)內(nèi)容效度法確定取樣內(nèi)容范圍后,利用這些資料定義測驗欲測的結(jié)構(gòu)性質(zhì)韋氏智力測驗言語:常識、理解、算術(shù)、相似性、詞匯、記憶廣度操作:譯碼、填圖、積木圖案、圖片排列、圖形拼湊內(nèi)容范圍的描述見到老師、小朋友是否主動打招呼?愿意自己獨自玩,還是與其他孩子一起玩?語言較多還是較少,見生人時是否害羞?是否大方?做游戲時,與人交往時,能與人合得來嗎?獨生子女合群性測驗卡特爾16PF16個特質(zhì),187個題目樂群性,聰慧性,穩(wěn)定性,持續(xù)性,興奮性,有恒性,敢為性,敏感性,懷疑性,幻想性,世故性,憂慮性,實驗性,獨立性,自律性,緊張性分測驗間關(guān)系的分析:特質(zhì)間相互獨立分測驗內(nèi)項目關(guān)系的分析:項目相互聯(lián)系2)內(nèi)部一致性法目的推斷測驗是否測量單一特質(zhì)方法極端組比較法(extreme-groupmethod)二列相關(guān)法:求題目與總分的相關(guān)分測驗與總分的相關(guān)2.測驗間的相互比較——測驗間方法含義同時考慮幾個測驗間的關(guān)聯(lián),考察是否測同一結(jié)構(gòu)。常用方法相容效度區(qū)分效度因素分析其它方法

1)相容效度concurrentvalidity含義測相同結(jié)構(gòu)的各種測驗間應(yīng)有較高的相關(guān)。求一個新編測驗與另一已知結(jié)構(gòu)測驗間的相關(guān)。2)區(qū)分效度含義某一特定測驗的分數(shù)與已知測量不同結(jié)構(gòu)的測驗分數(shù)無關(guān)會聚效度某一特定測驗的分數(shù)與測同一結(jié)構(gòu)的其他測驗的分數(shù)有關(guān)相關(guān)高說明新測驗的效度有問題3)因素分析意義找出變量間內(nèi)在本質(zhì)聯(lián)系的一種多元統(tǒng)計方法。通過縮減變量的方法,用反映變量本質(zhì)聯(lián)系的少數(shù)幾個基本因素(或公共因素)來說明先前需要用較多變量才能說明的原因或特性。基本原理總變異=共同因素+特殊因素+誤差兩個變量之間的相關(guān)等于它們共同因素負荷的交互乘積之和。

Cronbach對Loger-Thorndike

智力測驗的因素分析結(jié)果分測驗1.圖形分類2.數(shù)字序列3.圖形分析4.句子填充5.詞語分析6.算術(shù)推理7.詞匯特征值總方差%

因素負荷

AB共同性(h2)0.4610.5870.5570.3830.7050.6440.4630.6880.6870.816-0.0500.6680.8430.0970.7200.6200.2570.4500.870-0.0470.7593.0911.3944.485442064語詞非語詞(美)霍爾津格(Holzinger)和斯溫福德(Swineford)的因素分析取樣:芝加哥效區(qū)被試:145名7~8年級學(xué)生內(nèi)容:實施24個心理測驗結(jié)果:4個基本因素圖——詞測驗的功能不明顯。24個心理測驗的因素歸類詞語速度推理記憶1.一般知識段落理解2.句子填空3.詞匯分類4.詞義解釋5.加法6.編碼7.計數(shù)8.點子9.直-曲10.算術(shù)問題11.視知覺15.數(shù)字游戲12.體積16.問題推理13.面積17.系列填空14.打旗18.演繹推理19.詞匯識別20.數(shù)字識別21.圖形識別22.實物-數(shù)23.圖-詞24.數(shù)-圖3、效標(biāo)效度的研究證明測驗

效標(biāo)效標(biāo)效度資料:提供與結(jié)構(gòu)效度有關(guān)的信息??疾靀能否區(qū)分不同團體的人。4、實驗法和觀察法的證實考察實驗變量對X的影響比較實驗處理:前后分數(shù)的差異搜集某些變異上的證據(jù)。三、效標(biāo)效度criterion-relatedvalidity定義效標(biāo)估計方法(一)定義測驗分與外在獨立效標(biāo)的關(guān)系。在特定條件下測驗對被試操作行為所作預(yù)測的有效性符號:rxy。又稱統(tǒng)計效度或?qū)嵶C效度。(二)效標(biāo)或標(biāo)準(zhǔn)

1.定義衡量測驗效度的外在標(biāo)準(zhǔn)。做預(yù)測所依據(jù)的標(biāo)準(zhǔn)。檢驗效度的參照標(biāo)準(zhǔn)。測驗所要測的或要預(yù)測的行為特質(zhì)。將X與隔一定時期后同組對象的成績求相關(guān)。檢查新編測驗的效度。2.良好效標(biāo)的選擇依據(jù)反映測驗的目標(biāo)較高的信度可客觀地測量測量方法簡單,省時省力,經(jīng)濟實用各類測驗的可用效標(biāo)測驗類型常見效標(biāo)成就學(xué)年平均分,教師評定結(jié)果,學(xué)習(xí)量,知識應(yīng)用力,評判知識的批判力,自學(xué)能力…智力學(xué)科成績,教師評定結(jié)果,學(xué)生總成績能力傾向特殊課程或訓(xùn)練成績,工作或?qū)W習(xí)成績職業(yè)興趣從業(yè)者的實際成績或工作表現(xiàn)人格主試主觀標(biāo)準(zhǔn),被試以后行為,臨床資料3、效標(biāo)效度的類型

1.同時效度含義根據(jù)測驗分區(qū)分已有的狀態(tài)或預(yù)測已知的效標(biāo)表現(xiàn)來評估測驗效度的方法。對同組對象求新編測驗得分與現(xiàn)有測驗得分(效標(biāo)值)之間的相關(guān)。應(yīng)用:效標(biāo)分和新編測驗分能同時得到。度量指標(biāo):測驗分與效標(biāo)分的相關(guān)系數(shù)2.預(yù)測效度定義根據(jù)測驗分數(shù)預(yù)測其在效標(biāo)上將來成績來考察測驗效度的方法。一個測驗對被試心理特質(zhì)或未來績效所作預(yù)測的準(zhǔn)確程度。應(yīng)用:測驗分與效標(biāo)分不能同時得到。度量指標(biāo):測驗分與效標(biāo)分的相關(guān)系數(shù)(三)估計方法

1、相關(guān)法效度系數(shù)組的分類預(yù)期表命中率功利率(三)估計方法

1.相關(guān)法效度系數(shù)測驗分(新編)與效標(biāo)分的相關(guān)系數(shù)符號rXY或val.相關(guān)方法描述多列數(shù)據(jù)相關(guān)程度與相關(guān)方向的統(tǒng)計方法。計算方法積差相關(guān)法二列相關(guān)、點二列相關(guān),多系列相關(guān)等2、區(qū)分法——t檢驗?zāi)康模罕容^高低分組的差異高分組和低分組25%-33%,特別是27%例如:團體高分組的平均數(shù)為6.05,標(biāo)準(zhǔn)差為2.02;低分組的平均數(shù)為4.25,標(biāo)準(zhǔn)差為1.3。試問兩組的平均數(shù)有無顯著差異?評價缺點組間均數(shù)差異顯著性取決于團體大小。處理方法求兩組分布的重疊量:指標(biāo)一組內(nèi)均數(shù)超過另一組均數(shù)的百分率;兩組分數(shù)分布共同區(qū)域的百分率;結(jié)果報告:均數(shù)、標(biāo)準(zhǔn)差、重迭量、檢驗值3.命中率法含義:正確決策的比例用途人才選拔方法正確決策的結(jié)果正確接受正確拒絕

業(yè)績Y012345678910能力傾向測驗分(X)12345678910112152231469211352412633212524151211213373822錯誤接受正確拒絕正確接受錯誤拒絕結(jié)果正確決策正確接受正確拒絕383371第三單元效度的功能預(yù)測誤差預(yù)測效標(biāo)分數(shù)預(yù)測效率指數(shù)一、預(yù)測誤差

(一)決定系數(shù)效度系數(shù)決定系數(shù):r2正確預(yù)測或解釋效標(biāo)的方差占總方差的比例。(二)估計標(biāo)準(zhǔn)誤含義效度分數(shù)(Y)分布的標(biāo)準(zhǔn)差:預(yù)測誤差大小的估計值。公式:誤差為0,預(yù)測完全準(zhǔn)確:全為誤差,預(yù)測完全不準(zhǔn)

二、預(yù)測效標(biāo)分數(shù)線性回歸方程變量X和Y呈現(xiàn)直線相關(guān)方程預(yù)測的效標(biāo)分數(shù)測驗分數(shù)截距:糾正平均數(shù)的差異斜率:回歸系數(shù)三、預(yù)測效率指數(shù)預(yù)測標(biāo)準(zhǔn)誤無關(guān)系數(shù)(K)預(yù)測效率指數(shù)例如,某測驗的效度系數(shù)為0.80,其預(yù)測效率指數(shù)是多少?第四單元影響效度的因素

測驗組成測驗實施樣本團體的性質(zhì)效標(biāo)的性質(zhì)一、測驗本身的因素

(一)影響因素試題性質(zhì)測驗取材、測驗長度、試題難度和鑒別力及編排方式。增加新試題對信度的影響大于效度;測驗長度與信度和效度的關(guān)系題數(shù)與原測驗題數(shù)之比信度效度1010.3000.4002020.4620.4963030.5620.5486060.7200.619120120.8370.688240240.9110.697480480.9540.713(二)提高方法取材代表性避免易引起誤差的題型(如是非題)難度適中長度恰當(dāng)先易后難排序二、測驗實施

(一)主試的影響主試測驗情境的控制按測驗手冊各項規(guī)定實施測驗。施測過程場地布置材料準(zhǔn)備作答方式說明時間的限制等二、測驗實施

(一)主試的影響主試是否按測驗手冊各項規(guī)定實施測驗指導(dǎo)語是否統(tǒng)一正確時限是否一致評分是否合理測驗情境的控制場地布置材料準(zhǔn)備作答方式說明時間的限制等(二)被試影響因素人格興趣、動機、情緒、態(tài)度身心健康狀況作答真實性是否充分合作與盡力三、樣本團體的性質(zhì)

(一)異質(zhì)性特點越異質(zhì),分數(shù)分布越廣,效度越高;越同質(zhì),分數(shù)分布越窄,效度越低;影響因素只以選拔上的被試為樣本進行效度研究選拔標(biāo)準(zhǔn)太高(二)干涉變量

1、干涉變量的含義相同測驗對不同團體的測量功能不同;干涉變量因性質(zhì)不同(性別、興趣、職業(yè)、年齡等)使不同團體具有不同的預(yù)測能力。2、對干涉變量的確定提出者吉塞利(E.E.Ghiselli,美)測量學(xué)家具體方法確定是否存在干涉變量D=個人預(yù)測效標(biāo)分-實際效標(biāo)分找出干涉變量選擇不同對照組分別計算效度對亞團體的進一步分析四、效標(biāo)的性質(zhì)效標(biāo)本身的性質(zhì)——效標(biāo)可靠性相同條件下:測量行為與效標(biāo)行為相似,效度越高。效標(biāo)與測驗分的關(guān)系——關(guān)系線性兩變量不呈線性關(guān)系兩變量呈線性關(guān)系,但分布不均勻效標(biāo)的性質(zhì)效標(biāo)本身的性質(zhì)相同條件下:測量行為與效標(biāo)行為相似,效度越高。效標(biāo)與測驗分數(shù)的關(guān)系類型兩變量不呈線性關(guān)系;兩變量呈線性關(guān)系,但分布不均勻;第一單元難度分析通過率或正答率試題的難易程度以全體被試答對或通過該題百分比表示對知識和能力水平的適合程度的指標(biāo)。與測驗效率的關(guān)系難度適當(dāng)是構(gòu)成優(yōu)良測驗的必要條件。

一、定義1、定義式二、計算方法(一)0、1記分的項目通過人數(shù)參測人數(shù)含義以高低分組平均通過率表示的難度2、極端分組法步驟高、低分組通過率平均通過率例4-1:200人參加某項測驗,在一填空題上高分組48人通過,低分組23人通過。試問該題的難度值是多少?例4-2:在100名學(xué)生中,高分組與低分組各有27人。其中高分組答對第一題的有20人,低分組答對第一題的有10人。試問該題的難度是多少?3、選擇題的校正原通過率備選答案數(shù)目例4-3:某題有5個選項,該題通過的人數(shù)為0.75,試問校正后的通過率是多少?(二)非0、1記分項目某題的平均得分該題的滿分值例4-4:某試卷中一論述題為20分,10名參加測驗者得分為10、18、14、8、18、3、14、10、9、8。試問該題的難度是多少?三、難度水平的確定依據(jù)測驗?zāi)康男再|(zhì)試題形式內(nèi)容試題難度水平測驗難度水平(一)測題的難度

1、基本要求一般原則

各種測驗的難度標(biāo)準(zhǔn)化測驗:0.30~0.70;一般測驗:

極難(P﹤.1)→極易P﹥.9)選拔和診斷測驗:接近錄取率效標(biāo)參照測驗:有時不考慮難度

2.選擇題難度的確定一般:>概率水平P=概率水平:過難或題意不清,猜測性;P﹤概率水平:無意義,質(zhì)量問題;概率水平正誤試題:P=0.75四擇一題:P=0.63(二)測驗的難度依據(jù)取決于構(gòu)成測驗的試題難度一般原則標(biāo)準(zhǔn)化測驗:正態(tài)分布效標(biāo)參照測驗:允許偏態(tài)分布

低高

圖4-1正偏態(tài)分布圖難度大低高

圖4-2

負偏態(tài)分布圖

難度大第二單元項目的區(qū)分度

一、定義目的區(qū)分優(yōu)劣(Good-Poor)定義測題對所測心理特質(zhì)的區(qū)分程度或鑒別能力二、計算方法

(一)鑒別指數(shù)含義高、低分組通過率之差:步驟按測驗總分高低排序試卷確定高低分組:每組占27%分別計算各組的通過率代入鑒別指數(shù)公式

例4-7:100人參加某項測驗,對其中四道題做對的人數(shù)分布如表所求,試問這些試題的區(qū)分度分別是多少?題做對人數(shù)

目高分組低分組12724212136842212結(jié)果題做對人數(shù)

目高分組低分組12724212136842212

通過百分比高分組低分組1.000.890.440.040.220.300.810.44D0.110.40-0.080.37測題鑒別指數(shù)與評價標(biāo)準(zhǔn)區(qū)分度(D)評價0.40以上0.30-0.390.20-0.290.19以下非常良好良好,如能改進則更佳尚可,仍需再改進劣,必須淘汰或加以修改提出者美國測驗學(xué)家:伊貝爾(L.Ebel)(二)相關(guān)法某一測題分與效標(biāo)成績或測驗總分的相關(guān)具體方法點二列相關(guān)——客觀題二列相關(guān)——主觀題Φ相關(guān)變量點二列相關(guān)二列相關(guān)Φ相關(guān)一列連續(xù)變量二分名稱一列二分名稱二分名稱(人為的)二分名稱點二列相關(guān)、二列相關(guān)和Φ相關(guān)三、區(qū)分度與難度的關(guān)系難度是區(qū)分度的必要條件難度愈接近.50,試題區(qū)別作用愈大。較難項目,對高水平被試區(qū)分能力高較易項目,對低水平被試區(qū)分能力高中等項目,對中等水平被試區(qū)分能力高P與D最大值的關(guān)系P最大鑒別值1.000.00.900.20.800.40.700.60.600.80.501.00.400.80.300.60.200.40.100.20.000.00P、D與答案分析實例例4-12:有人計劃編制一套上海市中學(xué)幾何學(xué)科測驗,按預(yù)定題數(shù)加倍制定測題再以項目分析法選擇最適當(dāng)?shù)臏y題。現(xiàn)從上海初三全域抽取代表性樣本370人為預(yù)測對象接受測驗。按學(xué)生總分高低順序排列,抽取最高和最低的試卷各27%為高低分組?,F(xiàn)從中選出4個選擇題,經(jīng)過項目分析獲得以下結(jié)果。題組選答人數(shù)號別ABCD未答1高分組592120

低分組2250121602高分組581015161

低分組2621153623高分組1715282812

低分組25111934114高分組14414365

低分組15610285正確答案BADC抽取代表性樣本(370人),預(yù)測;按總分高低排序,確定高低分組(27%)求兩組的通過率及平均通過率;求鑒別力指數(shù)和相關(guān)系數(shù);比較高低分組的難度和區(qū)分度及不同答案的反應(yīng);根據(jù)分析結(jié)果,篩選試題或修改試題;分析程序題組選答人數(shù)號別ABCD未答1高分組592120

低分組225012160

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論