心理與教育測量重點(diǎn)總結(jié)_第1頁
心理與教育測量重點(diǎn)總結(jié)_第2頁
心理與教育測量重點(diǎn)總結(jié)_第3頁
心理與教育測量重點(diǎn)總結(jié)_第4頁
心理與教育測量重點(diǎn)總結(jié)_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

心理與教育測量

第一章心理與教育測量概論

(一) 一般測量概論

測量:依據(jù)一定的法則使用量尺對事物的屬性進(jìn)行定量描述的過程。

測量的基本要素:

(1) 參照點(diǎn):

絕對參照點(diǎn):以絕對的零點(diǎn)作為測量的起點(diǎn),如長度測量

相對參照點(diǎn):以人為確定的零點(diǎn)為測量的起點(diǎn),如對地勢高度的測量。

(2) 測量的單位:

要有確定的意義,即對同一單位,所有人的理解都是相同的。

要有相等的價值,即第一個單位與第二個單位之間的距離等于第二個單位與第三個單位之間的距離。

測量的量表:能夠使事物的特征數(shù)量化的數(shù)字的連續(xù)體。

陳名量表--用數(shù)字代表事物的成分或用數(shù)字對事物經(jīng)行分類,但該類數(shù)字沒有數(shù)量的意義??杉?xì)分為兩種形式,一是命名量表(用數(shù)字指代個別事物,如用數(shù)字給運(yùn)動員編號)二是類別量表(用數(shù)字指代事物的種類,如用1、2、3分別代表不同的職業(yè)類型)。其適用的統(tǒng)計方法有百分比、次數(shù)、眾數(shù)和卡方檢驗(yàn)。

順序量表--其中的數(shù)字不僅能夠指代類別,而且能夠表明不同類別的大小、等級或事物具有某種特征的程度,它既沒有相等距離的單位,也沒有固定的測量原點(diǎn)。適用的統(tǒng)計方法有中位數(shù)、百分位數(shù)、等級相關(guān)系數(shù)和肯德爾和諧系數(shù)等。

等距量表--不僅能夠指代事物的類別和等級,而且具有相等距離的測量單位。沒有絕對的零點(diǎn),適用的統(tǒng)計方法有平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)、等級相關(guān)系數(shù)以及t檢驗(yàn)和F檢驗(yàn)。

比率量表--具有類別、等級和等距的特征外,還具有絕對的零點(diǎn)或固定的原點(diǎn)。適用的統(tǒng)計方法除了與等距量表相同外,還與幾何平均數(shù)、變異系數(shù)相同。

(二) 心理與教育測量的性質(zhì)

心理與教育測量的定義:依據(jù)一定的心理學(xué)和教育學(xué)理論在測驗(yàn)上對人的心理特質(zhì)和教育成就進(jìn)行定量描述的過程。

心理與教育測量的量表屬于順序量表的原因:

從所使用的參照點(diǎn)來說,教育測量和心理測量領(lǐng)域的參照點(diǎn)均為相對零點(diǎn)。

從所使用的單位來說,教育與心理測量的單位遠(yuǎn)沒有其他測量的單位成熟和完善。

標(biāo)準(zhǔn)化需具備的條件:①測驗(yàn)內(nèi)容的標(biāo)準(zhǔn)化②施測條件的標(biāo)準(zhǔn)化③評分規(guī)則的標(biāo)準(zhǔn)化④測驗(yàn)常模的標(biāo)準(zhǔn)化

心理與教育測驗(yàn)的種類:

(1) ①常模參照測驗(yàn)--以常模為參照編制的測驗(yàn)(如高考只有百分之幾的人可以進(jìn)入重點(diǎn)大學(xué))

②標(biāo)準(zhǔn)參照測驗(yàn)(目標(biāo)參照測驗(yàn))--以標(biāo)準(zhǔn)為參照編制的測驗(yàn)(如,視力測驗(yàn)、考駕照)

(2) ①智力測驗(yàn)--測量個人的智力(一般認(rèn)知能力)水平的高低

能力傾向測驗(yàn)--測量個人的潛在才能,預(yù)測個人的能力發(fā)展傾向

成就測驗(yàn)--測量個人在接受教育后的學(xué)業(yè)成

(3) ①個別測驗(yàn)--同一主試在同一時間只能測量一個被試

②團(tuán)體測驗(yàn)--同一主試在同一時間內(nèi)能夠測量許多被試

(4) ①難度測驗(yàn)--識別個人能夠達(dá)到的最高水平

②速度測驗(yàn)--識別個人做題的最快速度

第二章心理與教育測量簡史

高爾頓:把統(tǒng)計方法應(yīng)用到對個別差異資料的分析之中

卡特爾:

首次提出“心理測驗(yàn)”這個術(shù)語

認(rèn)為心理學(xué)只有立足于實(shí)驗(yàn)與測量,才能達(dá)到如同自然科學(xué)一樣的準(zhǔn)確性

認(rèn)為心理測驗(yàn)只有建立普遍的統(tǒng)一標(biāo)準(zhǔn),并與常模相比較,才能充分地實(shí)現(xiàn)其科學(xué)價值和實(shí)用價值

比內(nèi):

1903年,《智力的實(shí)驗(yàn)研究》問世,提出了智力的定義,認(rèn)為智力是高級心理過程,包括推理、判斷以及運(yùn)用已知知識解決新問題的能力

1904年與其助手西蒙合作完成了世界上第一個智力測驗(yàn)量表----比內(nèi)--西蒙量表,因此成為了心理測驗(yàn)的鼻祖

智力測驗(yàn)的發(fā)展:

最著名的的是推孟于1916年修訂的斯坦福--比內(nèi)量表。其中影響最為深遠(yuǎn)的變動是推孟采用了比率智商的概念來表示智力水平的高低

第一個團(tuán)體測驗(yàn)--陸軍甲種測驗(yàn)和陸軍乙種測驗(yàn)

30年代后,瑞文相繼編制了瑞文標(biāo)準(zhǔn)推理測驗(yàn)、瑞文彩色推理測驗(yàn)、瑞文高級推理測驗(yàn)

韋克斯勒舍棄了比率智商,而用離差智商代之,從而克服了比率智商的局限;他編制的智力量表分為言語量表和操作量表兩部分

能力傾向測驗(yàn)的發(fā)展:最初被稱為“學(xué)業(yè)能力傾向測驗(yàn)”,后來進(jìn)一步擴(kuò)展到職業(yè)咨詢、工業(yè)部門及軍事領(lǐng)域的人才選拔和安置工作領(lǐng)域。在編制成套能力傾向測驗(yàn)的過程中,因素分析方法起了重要的作用。

成就測驗(yàn)的發(fā)展:

20世紀(jì)初,桑代克編制了第一個標(biāo)準(zhǔn)化的教育成就測驗(yàn)。因此而被公推為教育測量的鼻祖。

1923年,凱利、魯奇和推孟合作編制了第一個成套成就測驗(yàn)----斯坦福成就測驗(yàn)

20世紀(jì)30年代后期,在美國出現(xiàn)了跨州、跨區(qū)域乃至全國的測驗(yàn)程序

人格測驗(yàn)的發(fā)展:

20世紀(jì)初葉,出現(xiàn)了自陳人格問卷。伍德沃斯用自陳問卷法編制了適用于診斷士兵神經(jīng)癥的個人資料調(diào)查表;卡特爾編制了卡特爾16種人格問卷;埃森克編制成埃森克人格問卷;美國明尼蘇達(dá)大學(xué)的哈撒韋和莫墾利編制成明尼蘇達(dá)多項(xiàng)人格調(diào)查表。

另一種技術(shù)是投射測驗(yàn)。羅夏克墨跡測驗(yàn);哈羅爾編制了以團(tuán)體方式實(shí)施的墨跡測驗(yàn)。

第三章經(jīng)典測驗(yàn)理論的基本假設(shè)

心理特質(zhì):表現(xiàn)在一個人身上所特有的相對穩(wěn)定的行為方式

測量誤差:

(1) 含義:在測量過程中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的一種不準(zhǔn)確或不一致的測量效應(yīng)

(2) 種類:

隨機(jī)誤差--由與測量目的無關(guān)的偶然因素引起的而又不易控制的誤差,其方向和大小的變化完全是隨機(jī)的。例如在進(jìn)行手槍射擊時,新手往往很難控制手臂的輕微擺動。

系統(tǒng)誤差--由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)。例如,在設(shè)計過程中,盡管射擊手非常優(yōu)秀,每次結(jié)果都很一致,但若是槍的準(zhǔn)心有點(diǎn)兒毛病,則其射擊結(jié)果將會有穩(wěn)定的偏差。

(3) 來源:①測量工具:心理測量量表是否穩(wěn)定、是否真正測到了我們所要測的東西是測量工具造

成誤差的兩種主要原因。

測量對象:主要原因是受測者的真正水平是否得到真正發(fā)揮。

施測過程:主要是一些偶然因素(恒定因素較易控制)

真分?jǐn)?shù):

(1) 概念:反映被試某種心理特質(zhì)真正水平的那個數(shù)值稱作該特質(zhì)的真分?jǐn)?shù)(簡稱T分?jǐn)?shù)),真分?jǐn)?shù)是一

個在理論上構(gòu)想出來的抽象概念,在實(shí)際測量中是很難得到的。

(2) 數(shù)學(xué)模型:觀察分?jǐn)?shù)(記為X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差一個隨機(jī)誤差(記之

為E)o即X=T+E

(3) 假設(shè):①若一個人的某種心理特質(zhì)可以用平行的測驗(yàn)反復(fù)測量足夠多次,則其觀察分?jǐn)?shù)的平均值會

接近于真分?jǐn)?shù)。

真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零。

各平行測驗(yàn)上的誤差分?jǐn)?shù)之間相關(guān)為零。

(4) 推導(dǎo):S2x=S2t+S2e即在一次測量中,被試觀察分?jǐn)?shù)的方差等于其真分?jǐn)?shù)方差與誤差分?jǐn)?shù)方差之

和。

第四章測量信度

概念:測量結(jié)果的穩(wěn)定性程度。也是一致性,可靠性。

定義:①信度(信度系數(shù))是一個被測團(tuán)體的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)的變異數(shù)之比,

即s=S^/S2XXY TX

信度是一個被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方。

即rXY=p2xT

信度是一個測驗(yàn)x(A卷)與它的任意一個“平行測驗(yàn)”x’(B卷)的相關(guān)系數(shù),

即rXY=Pxx,

作用:

(1) 信度是測量過程中所存在的隨機(jī)誤差大小的反映

(2) 信度可以用來解釋個人測驗(yàn)分?jǐn)?shù)的意義

標(biāo)準(zhǔn)誤:每個人兩次測量的分?jǐn)?shù)之差可以構(gòu)成一個新的分布,這個分布的標(biāo)準(zhǔn)差就是測量的標(biāo)準(zhǔn)誤,

它是此次測量中誤差大小的客觀指標(biāo),有了這一指標(biāo),我們就可以對團(tuán)體中任何一個人的測驗(yàn)成績做出恰當(dāng)?shù)慕忉尅?/p>

公式: SE=SXv1-rxx,(Se是標(biāo)準(zhǔn)誤,Sx是實(shí)得分標(biāo)準(zhǔn)差,rxx,是信度)

置信區(qū)間:當(dāng)測驗(yàn)滿足經(jīng)典測驗(yàn)理論的三大假設(shè)時,根據(jù)以上估計的測量標(biāo)準(zhǔn)誤便可用以下方法構(gòu)

建測驗(yàn)真分?jǐn)?shù)估計的置信區(qū)間:

公式:x-ZCSEWTWx+ZCSE(x是被試的觀測分?jǐn)?shù),Se為測量標(biāo)準(zhǔn)誤,ZC是對應(yīng)于某個統(tǒng)計檢驗(yàn)顯著性水平的標(biāo)準(zhǔn)正態(tài)分布下的臨界值)

注:例題參考P52最上面。

信度的估計方法:

(1)重測信度:

定義--用同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度。其大小等于同一組被試在兩次

£(X-X)(y-y)

測驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù): r='£(X-X)2(y-y)2 (X和是-第

XX:

一次測量的實(shí)得分?jǐn)?shù)及實(shí)得分?jǐn)?shù)的平均值;y和y是第二次測量的實(shí)得分?jǐn)?shù)及實(shí)得分?jǐn)?shù)的平均值,

XX是重測信度。公式不要求記,但要會用)

使用的前提--A所測量的心理特性必須是穩(wěn)定的

B遺忘和練習(xí)的效果基本上相互抵消

C在兩次實(shí)測的間隔期內(nèi),被試在所要測查的心理特質(zhì)方面沒有獲得更多的學(xué)習(xí)和訓(xùn)練

誤差來源------A測驗(yàn)本身

B被試方面(個體差異)

C偶發(fā)因素干擾

優(yōu)缺點(diǎn) A能提供測驗(yàn)結(jié)果是否隨時間而變化的資料,可作為預(yù)測被試特定行為的依據(jù)。

B易受練習(xí)和記憶的影響

意義 A反應(yīng)的是在測驗(yàn)時間上的等值性

B適用于速度測驗(yàn)與人格測驗(yàn),不適用于難度測驗(yàn)

(2) 復(fù)本信度:

定義---A復(fù)本信度--指兩個平行的測驗(yàn)測量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被

試在兩個副本測驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。(同上面)

B等值性系數(shù)--兩個復(fù)本測驗(yàn)是同時連續(xù)施測的。

C穩(wěn)定性與等值性系數(shù)--兩個復(fù)本測驗(yàn)相距一段時間分兩次施測。

D平衡設(shè)計--為低效施測的順序效應(yīng),隨機(jī)地選出一半被試先做A卷后再做B卷,另一半被試先做B卷再做A卷。

使用的前提--A首先要構(gòu)造出兩份或兩份以上真正平行的測驗(yàn)(即A、B卷)

B被試要有條件接受兩個測驗(yàn)。

誤差來源---A測驗(yàn)的兩種形式是否等值(是否是平行測驗(yàn))

B被試情緒波動,動機(jī)變化等測驗(yàn)情景變化、偶發(fā)因素干擾。

優(yōu)缺點(diǎn)------A代表性強(qiáng),信度準(zhǔn),避免練習(xí)、記憶效應(yīng)

B編制復(fù)本難,影響積極性,被試容易觸類旁通

意義 A反應(yīng)的是在測驗(yàn)內(nèi)容上的等值性

(3) 分半信度:

定義--將一個測驗(yàn)分成對等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。由于描述的是兩半題目間的一致性,所以有時也稱內(nèi)部一致性系數(shù)。

計算--A方法與復(fù)本信度的類似,但是被試在兩半測驗(yàn)上的得分的相關(guān)系數(shù)只是半個測驗(yàn)的信度,所

以還要用斯皮爾曼-布朗公式矯正:

2r r r一工,*

0=訂廠(\是兩個分?jǐn)?shù)間的相關(guān)系數(shù),hh是整個測驗(yàn)的信度值)hh

B上式只有在兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)(即總體方差)相等時才能使用,否則,就用下面的弗朗那根公式或盧倫公式。

r=2(1-S:S)(Sa和Sb分別表示所有被試在兩半測驗(yàn)上的得分的

XX S2

X

變異數(shù),S;表示全體被試在整個測驗(yàn)上總得分的變異數(shù))

q2

r=1-S2/S2(qd表示同一組被試在兩半測驗(yàn)上得分之差的變異數(shù),

xx dx

其他與上式相同)

使用前提---A在只能施測一次或沒有復(fù)本的情況下使用

B當(dāng)一個測驗(yàn)無法分成對等的兩半時,不宜使用

C常用的分半方法有奇偶分半、按題目難度分半等

注:速度測驗(yàn)不適合分半信度

(4)同質(zhì)性信度:

定義-A-也叫做內(nèi)部一致性系數(shù),是指測驗(yàn)內(nèi)部所有題目間的一致性程度。所謂一致性,是指所有題

目測的都是同一種心理特質(zhì)以及所有題目得分之間都具有較高的正相關(guān)。

B-如果一個測驗(yàn)的同質(zhì)性信度不高,則說明結(jié)果可能是幾種心理特質(zhì)的綜合反映,所以結(jié)果不好解釋。一種好辦的方法就是把一個異質(zhì)的測驗(yàn)分解成多個具有同質(zhì)性的測驗(yàn),再根據(jù)被試在分測驗(yàn)上的得分分別做出解釋。

C-同質(zhì)性高才是測驗(yàn)測的單一特質(zhì)的充分條件。即一些表面上看起來是測量同一種心理特質(zhì)的題目,如果其題目間不具有較高的正相關(guān),則不能認(rèn)為它們具有同質(zhì)性。

計算--克龍巴赫a系數(shù):

K£S2 S2 S2

A公式:a=k=(1-二7工)(K是題目數(shù),七是所有被試在第i題上的分?jǐn)?shù)變異,七是測驗(yàn)

K-1S2

x

總分的變異)

B適用范圍:不要求測驗(yàn)題目僅是(0、1)記分,可以處理任何測驗(yàn)的內(nèi)部一致性系數(shù)的計算問題,此外,a值還是所有可能的分半信度的平均值,它只是測量信度下界的一個估計值

C計算過程和例子:參考P58

(5)評分者信度:

定義--多個評分者給同一批人的答卷進(jìn)行評分的一致性程度。(通常要求成對的受過訓(xùn)練的評分者之間平均一致性達(dá)到0.9以上,才算公平。)

計算--當(dāng)評分者人數(shù)多于兩個時,評分者信度可用肯德爾和諧系數(shù)進(jìn)行估計:

12

£儻R)

(K是評分者人數(shù),N是被評的對象數(shù),Ri是第i個被評對象

乙R2-―N^K2N3-N)

的水平等級之和)

B若評分中有相同等級出現(xiàn),

個數(shù))

例題及計算方法:參考P60

影響測量信度的因素:

(1) 被試方面:①單個被試--身心健康狀況、應(yīng)試動機(jī)、注意力、耐心、求勝心、態(tài)度

②被試團(tuán)體--整個團(tuán)體內(nèi)部水平的離散程度以及團(tuán)體的平均水平

(2) 主試方面:①就施測者而言,不按指導(dǎo)手冊規(guī)定施測

②就閱讀評分者而言,評分標(biāo)準(zhǔn)掌握不一

(3) 施測情境:考場環(huán)境、設(shè)備是否良好、空間寬窄是否恰當(dāng)?shù)鹊?/p>

(4) 測量工具:①試題取樣--利用斯皮爾曼-布朗公式可以預(yù)測試題長度與信度的關(guān)系:

公式:P,=1+31) (K為改變后的測驗(yàn)長度與原來長度之比,「如為原測驗(yàn)的

XX'

信度,P次'為測驗(yàn)長度增加為K倍后的測驗(yàn)信度)

試題之間的同質(zhì)性程度

試題的難度

(5) 兩次施測的間隔時間:間隔時間越短,信度值越大,反之亦然。

提高測量信度的方法:

(1) 適當(dāng)增加測驗(yàn)的長度:①新增項(xiàng)目必須與試卷中原有的項(xiàng)目同質(zhì)

②新增項(xiàng)目的數(shù)量必須適度

(2) 使測驗(yàn)中所有的試題的難度接近正態(tài)分布,并控制在中等水平

(3) 努力提高測驗(yàn)試題的區(qū)分度

(4) 選取恰當(dāng)?shù)谋辉噲F(tuán)體

(5) 主試者要嚴(yán)格執(zhí)行實(shí)測規(guī)程,評分者要嚴(yán)格按標(biāo)準(zhǔn)給分。

第五章測量效度

概念:指一個測驗(yàn)或量表實(shí)際能測出其所要測的心理特質(zhì)的程度。準(zhǔn)確性+有效性。

定義:(1)效度是一個相對的概念:①效度是相對于一定的測量目的而言的

②心理測量只能達(dá)到某種程度上的準(zhǔn)確

(2) 效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映

(3) 判斷一個測量是否有效要從多方面搜集證據(jù):在測量理論中,效度被定義為在一列測量中,與測量目的有關(guān)的真實(shí)變異數(shù)(由所要測量的變因引起的有效變異)與總變異數(shù)(實(shí)得變異

r2 S 2r ― S2 S2

數(shù))的比率,通常用xy表示,其定義為:r2—V(xy是效度系數(shù),V是有效變異數(shù),X是

XXS2

X

總變異數(shù))

與信度的關(guān)系:

信度高是效度高的必要而非充分條件,即效度高一定信度高,反之不一定。(比如,用標(biāo)準(zhǔn)米尺來量身高是有效也是可信的,但是如果用英文來考一批母語為中文孩子的數(shù)學(xué),雖然多次測量的結(jié)果可能很一致(即信度高),但是它的測量效度未必高,因?yàn)榭忌挠⑽乃綍绊憯?shù)學(xué)水平的發(fā)揮。)

測驗(yàn)的效度受它的信度制約。信度總是大于效度的。

效度的評估:

(1)內(nèi)容效度:

定義--指一個測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。

測量內(nèi)容包括--A欲測的知識范圍

B該范圍內(nèi)各知識點(diǎn)所要求掌握的程度

適用與不適用:A適用于成就測驗(yàn)和某些用于選拔和分類的職業(yè)測驗(yàn)

B不適用于能力傾向測驗(yàn)和人格測驗(yàn)

與表面效度不同:表面效度不能算是一種效度,它不反應(yīng)測驗(yàn)實(shí)際測量的東西,它是外行人對某

個測驗(yàn)從表面上好像是測某種心理特質(zhì)的一種現(xiàn)象。當(dāng)外行人認(rèn)為某測驗(yàn)?zāi)苡行У販y得某種心理特質(zhì)時,該測驗(yàn)就被認(rèn)為有較高的表面效度。一般來說,最佳行為測驗(yàn)(答案有正誤之分、主試與被試目的一致,如高考)往往表面效度高,其他測驗(yàn)則希望表面效度低。

確定方法:A邏輯分析法--a明確欲測內(nèi)容的范圍,包括知識范圍和能力要求兩個方面。

b確定每個題目所要測的內(nèi)容,并與雙向細(xì)目表(考試藍(lán)圖)對照c制定評定量表,對整個測驗(yàn)的有效性做出總的評價

B統(tǒng)計分析法--從同一個教學(xué)內(nèi)容總體中抽取兩套獨(dú)立的平行測驗(yàn),用著兩個測驗(yàn)來測同一批被試,求其相關(guān)

C再測法--在被試學(xué)習(xí)某種知識之前做一次測驗(yàn),在學(xué)過該知識后再做同樣的測驗(yàn)

(2)結(jié)構(gòu)效度:

定義:一個測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說它是指測驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。(也就是測驗(yàn)結(jié)果是否能夠證實(shí)或解釋某一理論、術(shù)語或構(gòu)想,其解釋的程度如何)

特點(diǎn):A結(jié)構(gòu)效度的大小首先取決于事先假定的心理特質(zhì)理論

B當(dāng)實(shí)際測量的資料無法證實(shí)我們的理論假設(shè)時,并不一定就表明該測驗(yàn)結(jié)構(gòu)效度不高C不可能有單一的數(shù)量指標(biāo)來描述結(jié)構(gòu)效度。主要應(yīng)用于智力測驗(yàn)和人格測驗(yàn)

估計方法:

A測驗(yàn)內(nèi)部尋找證據(jù)法--a考查該測驗(yàn)的內(nèi)容效度

b分析被試的答題過程

c計算測驗(yàn)的同質(zhì)性信度

B測驗(yàn)之間尋找證據(jù)法--a相容效度法-考查新編測驗(yàn)與某個已知的能有效測量相同特質(zhì)的舊測驗(yàn)之間的相關(guān),若相關(guān)高,則新測驗(yàn)有較高效度。

b區(qū)分效度法-考查新編測驗(yàn)與某個已知的能有效測量不同特質(zhì)的舊測驗(yàn)之間的相關(guān),若相關(guān)高,則新測驗(yàn)效度不高。

c因素分析法-通過對一組測驗(yàn)進(jìn)行因素分析,找出影響測驗(yàn)的共同因素,每個測驗(yàn)在共同因素上的負(fù)荷量(即測驗(yàn)與各因素的相關(guān))就是測驗(yàn)的因素效度,測驗(yàn)分?jǐn)?shù)總變異中來自有關(guān)因素的比例就是該測驗(yàn)結(jié)構(gòu)效度的指標(biāo)。

C考查測驗(yàn)的實(shí)證效度法-a根據(jù)校標(biāo)把人分成兩類,考查其得分的差異。(如,一組被公認(rèn)性格外向的人在測驗(yàn)中得分高,一組被公認(rèn)性格內(nèi)向的人在測驗(yàn)中得分低,則說明測驗(yàn)?zāi)軈^(qū)分人的內(nèi)外向特征,進(jìn)而說明該測驗(yàn)在測量人的性格內(nèi)外向方面有較高的結(jié)構(gòu)效度)

b根據(jù)測驗(yàn)得分把人分成高分組和低分組,考查這兩組人在所測特質(zhì)方面是否確有差異。若差異顯著,則結(jié)構(gòu)效度高。

D多種特質(zhì)--多種方法矩陣法:參考P74例子

E因素分析法--探索性因素分析和驗(yàn)證性因素分析

(3)實(shí)證效度:

概念:一個測驗(yàn)對于特定情境中的個體的行為進(jìn)行估計的有效性。即一個測驗(yàn)是否有效,應(yīng)該以實(shí)

踐的效果作為檢驗(yàn)的標(biāo)準(zhǔn)。也叫,校標(biāo)關(guān)聯(lián)效度。

分類:A同時效度-校標(biāo)資料與測驗(yàn)分?jǐn)?shù)同時搜集的

B預(yù)測效度-校標(biāo)資料是在測驗(yàn)之后根據(jù)實(shí)際工作成績來確定的

校標(biāo):A概念-衡量一個測驗(yàn)是否有效的外在標(biāo)準(zhǔn),它是獨(dú)立于測驗(yàn)并可以從實(shí)踐中直接獲得我們所

感興趣的行為。但我們所感興趣的行為往往是一個觀念上的東西(觀念校標(biāo))它必須用一個數(shù)字或等級來表達(dá)(效標(biāo)測量)

B特性--多樣性、復(fù)雜性、特殊性和時間性。所以如果效標(biāo)測量想要較好地體現(xiàn)觀念校標(biāo),效標(biāo)測量本身就必須是有效的、可靠的、客觀和實(shí)用。

C常用校標(biāo)--學(xué)業(yè)成就、等級評定、臨床診斷、專門的訓(xùn)練成績。

確定方法:明確觀念校標(biāo)一確定校標(biāo)測量一考查測驗(yàn)分?jǐn)?shù)與校標(biāo)測量的關(guān)系

A相關(guān)法-計算測驗(yàn)分?jǐn)?shù)與校標(biāo)測量的相關(guān)系數(shù)

B區(qū)分法-被試接受測驗(yàn)后,讓他們工作一段時間,再根據(jù)工作成績(校標(biāo)測量)的好壞分成兩組。再回頭分析這兩組被試原先接受測驗(yàn)的分?jǐn)?shù)差異,若差異顯著,則說明測驗(yàn)的效度較高。

C命中率--a正命中率-被測驗(yàn)選出來的人真正被選對的人數(shù)的比率

b負(fù)命中率-測驗(yàn)所淘汰的人中真正應(yīng)該被淘汰的人數(shù)的比率

c總命中率-測驗(yàn)選對了的人數(shù)和被淘汰了的人數(shù)之和與總?cè)藬?shù)之比

D其他---a基礎(chǔ)率-符合篩選要求的群體在整個人群總體中所占的比率

b靈敏度-所有真正符合要求的人能被測驗(yàn)鑒別出來的人數(shù)的比率

c確認(rèn)度-所有不合要求的人能被測驗(yàn)真正淘汰的人數(shù)的比率

d當(dāng)基礎(chǔ)率較低時,選用靈敏度高的測驗(yàn)才能比較有效。當(dāng)基礎(chǔ)率很高時,選用確認(rèn)度高的測量工具比較有效。

e功利率-使用測驗(yàn)所帶來的好處應(yīng)大大高于使用測驗(yàn)所耗費(fèi)的時間、精力和經(jīng)費(fèi)。

影響效度的因素:A測驗(yàn)的構(gòu)成

B測驗(yàn)的實(shí)測過程

C接受測驗(yàn)的被試

D所選校標(biāo)的性質(zhì)

E測量的信度

提高效度的方法:A精心編制測驗(yàn)量表,避免出現(xiàn)較大的系統(tǒng)誤差

B妥善組織測驗(yàn),控制隨機(jī)誤差

C創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情境,讓每個被試都能發(fā)揮正常水平

D選好正確的校標(biāo),定好恰當(dāng)?shù)男?biāo)測量,正確使用有關(guān)公式。

第六章測驗(yàn)的項(xiàng)目分析

測驗(yàn)項(xiàng)目的難度

(1) 概念:被試完成測驗(yàn)項(xiàng)目任務(wù)時所遇到的困難程度

(2) 計算:

二分法記分項(xiàng)目的難度(結(jié)果只有對或錯)

A通過率:不考慮被試作答是否因?yàn)椴聹y成功的機(jī)遇:

P=R(P是項(xiàng)目難度,N是全體被試數(shù),R為答對該項(xiàng)目的人數(shù))

N

B極端分組法:被試人數(shù)較多時,將被試依照測驗(yàn)總分分為三組,總分最高的27%為高分組(),總分最低的27%為低分組,分別計算高低分組的通過率,再求難度。

P=PH^PL或P=1f害+g」(Ph、PL分別表示高低分組的通過率;七、RL分別表示

2 2"N N)

高低分組通過該項(xiàng)目的人數(shù);Nh、Nl分別表示高低分組的人數(shù))

非二分法記分項(xiàng)目的難度(結(jié)果從滿分至零多種可能)

八 X G 十, , 、十,斗

P=—(X是被試在某一項(xiàng)目上的平均得分,Xma是該項(xiàng)目的滿分)

max

(3)難度水平的確定:取決于測驗(yàn)的目的與測驗(yàn)的性質(zhì)

一般的標(biāo)準(zhǔn)化常模參照測驗(yàn):難度值應(yīng)盡量接近0.50

標(biāo)準(zhǔn)參照測驗(yàn):A如果測驗(yàn)?zāi)康氖菫榱私獗辉噷δ撤矫嬷R技能的掌握情況,則可以不必過多地

考慮難度,只要教育者認(rèn)為是重要的內(nèi)容就可以選用。

B如果測驗(yàn)?zāi)康氖菫榱诉x拔和錄用人員,就應(yīng)該講項(xiàng)目的難度控制在接近錄取率左右

測驗(yàn)性質(zhì)不同:速度測驗(yàn)難度不宜太高,難度測驗(yàn)則在0.50左右。

測驗(yàn)的區(qū)分度

(1) 概念:指測驗(yàn)項(xiàng)目對被試心理品質(zhì)水平差異的區(qū)分能力

(2) 范圍:介于-1.00至+1.00之間。D為正值則為積極區(qū)分,負(fù)值為小雞區(qū)分,0為無區(qū)分

(3) 計算:

項(xiàng)目鑒別指數(shù)法

A鑒別指數(shù)的計算:當(dāng)測驗(yàn)總分是連續(xù)變量時,從分?jǐn)?shù)分布的兩端選出高低分組(同上面的分法一

樣),計算高低分組的通過率,兩者之差就是鑒別指數(shù)。D=Ph-Pl

B極端組的劃分:取27%的高分段被試組成高分組,27%的低分段被試組成低分組,其余的46%不作分析。若團(tuán)體人數(shù)較少(少于100)則用50%的規(guī)則。

相關(guān)法(知道什么樣的數(shù)據(jù)用什么樣的方法,公式和例題參考P91-95)

A點(diǎn)二列相關(guān)系數(shù):適用項(xiàng)目是0、1記分(或二分變量),而校標(biāo)或測驗(yàn)總分是連續(xù)變量的數(shù)量資料。什么是校標(biāo)分?jǐn)?shù)

B二列相關(guān):適用于連續(xù)的測量變量,但其中一個變量因?yàn)槟撤N原因被人為地分成兩類。例如一個測驗(yàn)的項(xiàng)目分?jǐn)?shù)是連續(xù)的,但測驗(yàn)總分被分為及格或不及格兩類。

C"fai”(不知道怎么打出那個字母)相關(guān):適用于兩個變量是二點(diǎn)分配的資料,即兩個變量都是二分名義變量。

D積差相關(guān):當(dāng)項(xiàng)目分?jǐn)?shù)服從正態(tài)分布時,用項(xiàng)目得分與校標(biāo)分?jǐn)?shù)求積差相關(guān)系數(shù),得到項(xiàng)目的區(qū)分度。

(4) 與難度的關(guān)系:難度D越接近于0.50,項(xiàng)目的潛在區(qū)分度越大。而難度D越接近于1.00或0,項(xiàng)目

的潛在區(qū)分度越小。(參考P96表格)

(5) 相對性:A不同的計算方法,所得區(qū)分度值不同

B樣本容量大小影響相關(guān)法區(qū)分度值的大小

C分組標(biāo)準(zhǔn)影響鑒別指數(shù)值(D)

D被試樣本的同質(zhì)性程度影響區(qū)分度值的大小

第七章測驗(yàn)常模

分?jǐn)?shù)轉(zhuǎn)換

(1) 原始分?jǐn)?shù):被試在接受測驗(yàn)后,根據(jù)測驗(yàn)的記分標(biāo)準(zhǔn),對照被試的反應(yīng)所計算出來的測驗(yàn)分?jǐn)?shù)。

(2) 導(dǎo)出分?jǐn)?shù):在原始分?jǐn)?shù)轉(zhuǎn)換的基礎(chǔ)上,按照一定的規(guī)則,經(jīng)過統(tǒng)計處理后獲得的具有一定參考點(diǎn)和單位,且可以相互比較的分?jǐn)?shù)量表或符號系統(tǒng)。

(3) 為何轉(zhuǎn)換:原始分?jǐn)?shù)一般不能直接反映出被試之間的差異狀況,不能體現(xiàn)出被試相互比較后所處的地位,也不能說明被試在其他等值測驗(yàn)上應(yīng)獲得什么樣的分?jǐn)?shù)。所以,為了使原始分?jǐn)?shù)本身具有意義,使不同測驗(yàn)的分?jǐn)?shù)可以相互比較,須將原始分?jǐn)?shù)轉(zhuǎn)換成導(dǎo)出分?jǐn)?shù)。

百分等級分?jǐn)?shù)

(1) 概念:在一個群體的測驗(yàn)分?jǐn)?shù)中,得分低于這個分?jǐn)?shù)的人數(shù)的百分比。

(2) 計算與評價:參考書本P106-108不是重點(diǎn)。

標(biāo)準(zhǔn)分?jǐn)?shù)

(1) 概念:一種具有相等單位的量數(shù),又稱Z分?jǐn)?shù)。它是將原始分?jǐn)?shù)與團(tuán)體的平均數(shù)之差除以標(biāo)準(zhǔn)差所得的商數(shù),是以標(biāo)準(zhǔn)差為單位度量原始分?jǐn)?shù)離開其平均數(shù)的分?jǐn)?shù)至上多少個標(biāo)準(zhǔn)差,或是在平均數(shù)之下多少個標(biāo)準(zhǔn)差。

(2) 計算及評估:參考書本P109-110.

T分?jǐn)?shù)

(1) 概念:由標(biāo)準(zhǔn)分?jǐn)?shù)轉(zhuǎn)換而來,將Z分?jǐn)?shù)擴(kuò)大10倍(以消除小數(shù))再加上50(消除負(fù)號)。T在[0,100]之間,平均數(shù)為50,標(biāo)準(zhǔn)差是10。T=10xZ+50

(2) 評價:①具有等單位的特點(diǎn),便于進(jìn)一步統(tǒng)計分析工作

在正態(tài)分布下,可以利用正態(tài)分布表將各種導(dǎo)出分?jǐn)?shù)與百分等級分?jǐn)?shù)作換算

在正態(tài)分布下,運(yùn)用某種變式分?jǐn)?shù)可以將幾個測驗(yàn)上的分?jǐn)?shù)作直接比較

分?jǐn)?shù)過于抽象,不易理解

在非正態(tài)分布下,分布形態(tài)不同的變式分?jǐn)?shù),仍然不可以作相互比較及求和

常模編制

(1) 常模概念:根據(jù)標(biāo)準(zhǔn)化樣本的測驗(yàn)分?jǐn)?shù)經(jīng)過統(tǒng)計處理而建立起來的具有參照點(diǎn)和單位的測驗(yàn)量表

(2) 確定常模團(tuán)體的注意事項(xiàng):①群體構(gòu)成的界限必須明確

常模團(tuán)體必須是所測群體的一個代表性樣本

取樣過程必須明確且有詳盡的描述

樣本大小要適當(dāng)

常模團(tuán)體必須是近時的

注意一般常模與特殊常模的結(jié)合

第八章心理與教育測驗(yàn)的編制與實(shí)施

基本程序

(1) 確定測驗(yàn)?zāi)康模孩倜鞔_測量對象②明確測量目標(biāo)③明確測量用途

(2) 制定編題計劃

(3) 編輯測驗(yàn)項(xiàng)目:①收集測驗(yàn)資料②選擇項(xiàng)目形式③編寫測驗(yàn)項(xiàng)目

(4) 預(yù)測與項(xiàng)目分析:①預(yù)測②項(xiàng)目分析

(5) 合成測驗(yàn):①測驗(yàn)項(xiàng)目的選擇

②測驗(yàn)項(xiàng)目的編排:總的原則是由易到難。常見排列方式如下:

A并列直進(jìn)式--將整個測驗(yàn)按測驗(yàn)項(xiàng)目材料的性質(zhì)歸為若干分測驗(yàn),在同一分測驗(yàn)的測驗(yàn)項(xiàng)目中,由易到難排列

B混合螺旋式--將各類測驗(yàn)項(xiàng)目依難度分成若干不同的層次,再將不同性質(zhì)的測驗(yàn)項(xiàng)目語義組合,做交叉式排列,難度漸次升進(jìn)。

編制復(fù)本

(6) 測驗(yàn)標(biāo)準(zhǔn)化:指測驗(yàn)的編制、施測、評分以及解釋測驗(yàn)分?jǐn)?shù)的程序的一致性。

測驗(yàn)內(nèi)容標(biāo)準(zhǔn)化

施測過程標(biāo)準(zhǔn)化

測驗(yàn)評分標(biāo)準(zhǔn)化:不同評分者的一致性達(dá)到90%以上

測驗(yàn)分?jǐn)?shù)的解釋標(biāo)準(zhǔn)化

(7) 鑒定測驗(yàn):①信度-指測驗(yàn)的可靠性,即用同一測驗(yàn)多次測量同一團(tuán)體,所得測驗(yàn)結(jié)果之間具有一致

效度--指測驗(yàn)的有效性,即一個測驗(yàn)在多大程度上能夠測得它所要測得的東西。

測驗(yàn)量表與常模

(8) 編寫測驗(yàn)說明書

第十一章學(xué)績測驗(yàn)

整一章都沒有說到有重點(diǎn),所以。。。自己看吧。

第十二章能力測驗(yàn)(上)

智力的心理測量學(xué)理論

(1) 智力二因素論:斯皮爾曼發(fā)現(xiàn)一系列心理能力測驗(yàn)之間存在普通的正相關(guān),他利用因素分析方法,將這些相關(guān)歸因于一種一般因素或共同因素的作用。他稱這種因素為G因素,并從三個方面對它定義:經(jīng)驗(yàn)的領(lǐng)會、關(guān)系推斷和相關(guān)推理。他認(rèn)為G因素對于同一個體是穩(wěn)定的,它滲透于所有與智力行為有關(guān)的任務(wù)重,是一切心智活動的主題,個體間智力的差異就決定于個體擁有G因素量的多寡。由于測驗(yàn)間并非完全相關(guān),因而出于統(tǒng)計上相關(guān)分析的需要,他提出還存在特殊因素(S因素),由此構(gòu)成了他的智力二因素論。但他始終強(qiáng)調(diào)G因素才是智力的核心,而S因素只有在某些特殊情況下才會表現(xiàn)出來。

(2) 智力多因素論:瑟斯頓利用多重因素分析法提出

(3) 智力層次理論:弗農(nóng)提出智力三層次模型

智力的可變性:①隨年齡成熟而發(fā)展(記住智力成長曲線p218)

A智力發(fā)展在十二三歲以前呈直線上升趨勢,13歲后開始減慢

B一般智力高者發(fā)展速度快停止年齡晚,低者發(fā)展速度慢停止年齡早

C一般人的智力在16~18歲達(dá)到頂峰,近期研究結(jié)果又推遲至25歲

個體智力測驗(yàn):

(1) 比內(nèi)量表:①比內(nèi)?西蒙量表:診斷異常兒童智力,于1905年編制的世界上第一個智力量表

②斯坦福?比內(nèi)量表:最富盛名

(2) 韋克斯勒量表:①應(yīng)用最廣泛的智力量表

有成人、兒童、幼兒三個量表

成人智力量表的結(jié)構(gòu)包括言語量表和操作量表

團(tuán)體智力測驗(yàn):

(1)陸軍測驗(yàn):①第一個團(tuán)體智力測驗(yàn)

陸軍甲種測驗(yàn)--文字測驗(yàn)

陸軍乙種測驗(yàn)--非文字測驗(yàn)

(2)瑞文推理測驗(yàn):是非文字型的圖形測驗(yàn),具有跨文化一致性,優(yōu)點(diǎn)在于測驗(yàn)對象不受文化、種族與語言等條件的限制,適用的年齡范圍也很廣,而且不排除一些生理缺陷者。

第十三章能力測驗(yàn)(下)

能力傾向測驗(yàn):需知道哪些是能力傾向測驗(yàn)。如學(xué)術(shù)能力傾向測驗(yàn)SAT)、分辨能力傾向測驗(yàn)(DAT)、

一般能力傾向成套測驗(yàn)(GATB)、行政職業(yè)能力傾向測驗(yàn)等等。

吉爾福特的基本觀點(diǎn):

智力操作中存在聚合與發(fā)散兩種不同類型的思維

發(fā)散思維在行為上表現(xiàn)出流暢性、變通性、獨(dú)特性這三種特性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論