版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
教育測量與評價——測量的質(zhì)量指標(biāo)辯遲伐斤戍虜擴督縣爽跑姚章集嗚雇飲輝悼顆公熔敷蝦究食菱推櫻曙統(tǒng)缽教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)教育測量與評價——測量的質(zhì)量指標(biāo)辯遲伐斤戍虜擴督縣爽跑姚章集1教育測量的質(zhì)量指標(biāo)衡量教育測量的質(zhì)量,可采用四個指標(biāo):信度主要對整個測量而言。效度難度主要對測量的項目而言。區(qū)分度廳教雄短附尤胺姚皮鮮柵卑劊尸試圣痹盞憑絡(luò)凍賺薪枯頓恒儡顛瞻棍證羞教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)教育測量的質(zhì)量指標(biāo)衡量教育測量的質(zhì)量,可采用四個指標(biāo):廳教雄2一、信度概述(一)什么是信度信度是指測量結(jié)果的穩(wěn)定性或可靠性程度。一般地說,一個好的測量必須具有較高的信度,也就是說,一個好的測量工具,只要遵守操作規(guī)則,其結(jié)果就不應(yīng)隨工具的使用者或使用時間等方面的變化而發(fā)生較大的變化。必須從以下兩個方面去理解測量的信度:信度指實測值(X)和真值(T)相差的程度;信度指兩次重復(fù)測量或等值測量之間的關(guān)聯(lián)程度。署客駕墓皮烘蟬進茫枝機汕抗慌吃檄靠命征家場的廄去薪勵叉俱更撥粳盯教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)一、信度概述(一)什么是信度署客駕墓皮烘蟬進茫枝機汕抗慌吃檄3(二)信度的估計方法1、重復(fù)信度(再測信度)指的是同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度。其大小等于同一組被試在兩次測驗上所得分?jǐn)?shù)的相關(guān)系數(shù),一般采用皮爾遜積差相關(guān)的公式來計算。弓藉濫白淌旨泄炳識臍凋廁珠晰壓爾勛刀摻墑鹼杠唯愈炸拉婆幽測屋去褪教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(二)信度的估計方法1、重復(fù)信度(再測信度)弓藉濫白淌旨泄炳4例一用一個算術(shù)四則的速度測驗12個小學(xué)生,得分記為X,為了考察測量結(jié)果的可靠性,于3個月后再測一次,得分記為Y,問測驗結(jié)果是否可靠?學(xué)生序號123456789101112X202021222323232425262627Y202121202323252526262729弧騾錯臻拳眉繕芋禹遍遙浪歌睹待迅搓捐瘸勛弟湃再洼絮戊胞歉洽妹手售教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例一用一個算術(shù)四則的速度測驗12個小學(xué)生,得分記為X,為了考5在使用重測法計算穩(wěn)定性系數(shù)時,應(yīng)注意以下問題:1、信度的取值范圍為[0,1],當(dāng)信度值較大時,說明前后兩次測量結(jié)果比較一致;2、兩次測驗之間的時間間隔要適宜。應(yīng)由測驗的性質(zhì)、測題類型、測題數(shù)量和被試特點所決定;3、重測法適用于速度測驗而不適用于難度測驗;4、應(yīng)注意提高被試者的積極性。級否鉑橫昨鵲寧袍耙諾福弓帆囤掏倫遵脆吏柒掃血矯唾嗎江吧闌抓豎轍中教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)在使用重測法計算穩(wěn)定性系數(shù)時,應(yīng)注意以下問題:1、信度的取值62、復(fù)本信度指的是兩個平等的測驗測量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個復(fù)本測驗上所得分?jǐn)?shù)的相關(guān)系數(shù)。所謂復(fù)本測驗是指在性質(zhì)、內(nèi)容、題型、題數(shù)、難度等方面都一致(或相等)的兩份或多份測驗。隴官因腑震錢番項咀凋道圃蔑事港錫純示誕藤傻繁液瞅猴敲莫楷冕搐否岳教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、復(fù)本信度指的是兩個平等的測驗測量同一批被試所得結(jié)果的一致7例二以A、B兩型英語復(fù)本測驗對初中三年級10個學(xué)生施測,為避免由測驗施測順序所造成的誤差,其中5個學(xué)生先做A型測驗,休息15分鐘后,再做B型測驗;而另5個學(xué)生先做B型測驗,休息15分鐘后,再做A型測驗。10個學(xué)生A型測驗結(jié)果記為X,B型測驗結(jié)果記為Y,其測驗的復(fù)本信度如何?學(xué)生序號12345678910X19191817161515141312Y20171818171513151212遲彬猛潭以滾杜碩戊撐迸壟找咽貶貍揀哺溝筷德檸姨知罪黃窩間儲贈曬釩教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例二以A、B兩型英語復(fù)本測驗對初中三年級10個學(xué)生施測,為避8復(fù)本信度的優(yōu)缺點表現(xiàn):優(yōu)點:1、測驗的兩個復(fù)本,如果在不同的時間使用,其信度既可以反映在不同時間的穩(wěn)定性,又可以反映對于不同測題的一致性;2、兩個復(fù)本在同時使用時,可以避免再測信息的一些缺點,如首測時再測在記憶、練習(xí)、效果的影響,間隔期間獲得新知識的影響,兩次施測的環(huán)境不同和被試主觀狀態(tài)不同的影響,以及為了應(yīng)付測驗所作訓(xùn)練的影響等。鄧冉際仔讕哼倚滴棋廉饋半怕刀凰凋讀星疫險棗咨很掩沂虧嘯葦另晰艱國教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)復(fù)本信度的優(yōu)缺點表現(xiàn):優(yōu)點:鄧冉際仔讕哼倚滴棋廉饋半怕刀凰凋9缺點:1、編制兩個完全相等的測驗是很困難的,如果兩個復(fù)本過分相似,則變成再測形式,而過分不相似,又使等值的條件不存在;2、兩個復(fù)本測驗有可能在某種程度上測量了不同的性質(zhì),這就會低估測驗的信度;3、被試同時接受性質(zhì)相似的兩個測驗,可能減少完成測驗的積極性;4、雖然兩個復(fù)本測驗的題目材料不同,但被試一旦掌握了解題的某一模式,就能觸類旁通,有可能失去復(fù)本的意義。杜囊隨弱陣慣爸碰難抉駁鮑輕芝宇寒?;蟮空}柱些打獲嶺瑯愈腳政沃艾教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)缺點:1、編制兩個完全相等的測驗是很困難的,如果兩個復(fù)本過分103、折半信度(分半信度)就是將測驗分半,再求被試在每一半測驗上所得分?jǐn)?shù)的相關(guān)系數(shù)。首先根據(jù)內(nèi)容、形式、題數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、難度、測題間相關(guān)以及分布形態(tài)相等的原則,將試題分成兩半,或者將從易到難排列的測題,按照測題序號,奇數(shù)測題為一組,偶數(shù)測題為一組,分成兩半;然后計算每個被試在兩個分半測驗分?jǐn)?shù)的積差相關(guān)系數(shù),再用斯皮爾曼—布朗公式加以校正。斯皮爾曼—布朗公式為瑟洱晦緯嵌弊躬夾篇違刻瞳悼噴巋竟滅尖窄擒撤副窘譚踩拎宣捅莖邀矗休教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)3、折半信度(分半信度)就是將測驗分半,再求被試在每一半測驗11例三對初中一年級學(xué)生進行地理成績測驗,每答對1題得1分,答錯1題得0分,其測驗結(jié)果如下表,試估計該測驗的折半信度?學(xué)生序號題序12345611000002000100310100041100105100100611101171111018110110901100110111111議稱餡鞘默之拐物燃它尼烈喘襟慧摩林鉀附撂妖奪漬皂虎筋斤擋甲晦匯鄂教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例三對初中一年級學(xué)生進行地理成績測驗,每答對1題得1分,答錯12(三)提高信度的方法1、影響測量信度的主要因素(1)被試方面(2)主試方面(3)施測情境方面(4)測量工具方面(5)兩次施測的間隔時間方面撒提函瓤業(yè)狄盆乓稈嗆會騰蓮很瓣翻壓暢臃飄浚汁粟收查凌大灑琺鞏譽績教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(三)提高信度的方法1、影響測量信度的主要因素撒提函瓤業(yè)狄盆132、提高測量信度的常用方法(1)適當(dāng)增加測驗的長度(2)測驗的難度要適中(3)測驗的內(nèi)容應(yīng)盡量同質(zhì)(4)測驗的程序應(yīng)統(tǒng)一(5)測驗的時間要充分(6)測驗的評分要盡量做到客觀化,減少評分誤差炳撕松牲質(zhì)癰套灶落欠餃苞莎嶼著浩條熾閱盂低廂琢港啡吮困哇租捎棚子教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、提高測量信度的常用方法(1)適當(dāng)增加測驗的長度炳撕松牲質(zhì)14二、效度的概念(一)什么是效度效度是指測量結(jié)果的準(zhǔn)確性和有效性的程度。也可以說是測量是否達到了預(yù)期的目的。1、效度是一個相對的概念。(1)測量的效度是相對一定的測量目的而言的(2)測量的效度是相對測量的結(jié)果而言的2、一種測量的效度只是高或低的問題測量結(jié)果總是有一定效度的,只是效度高低不同罷了。廢蓬么淵邀打煽趾棧戎臺宗鍛癱土辰枚南雅迭內(nèi)絞煮綜夏槍蓋血孽盛面較教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)二、效度的概念(一)什么是效度廢蓬么淵邀打煽趾棧戎臺宗鍛癱土15(二)效度的估計效度估計就是多方尋找證據(jù)來證明一個測驗的有效性程度的過程。1、內(nèi)容效度就是指測驗內(nèi)容對所要測量的內(nèi)容的代表性程度。也就是說,測驗的內(nèi)容范圍、材料與所要測量的內(nèi)容范圍、教育目標(biāo)是否相符合;測驗中測題所引起的行為是否是所要測量的屬性的明確反應(yīng);測驗的結(jié)果是否是一個有代表性的行為樣本。為了使測驗的內(nèi)容具有有效性,成為所欲測量內(nèi)容的一個具有代表性的行為樣本,在編制測驗時,就要考慮建立內(nèi)容效度的問題。嶼酒刑琳締搏陀嘶莽柯晤暢殼左態(tài)藐猴瓢呢丫柵湊芥近概湃燼挺袒比醚眩教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(二)效度的估計效度估計就是多方尋找證據(jù)來證明一個測驗的有效162、內(nèi)容效度的估計(1)邏輯分析法其工作思路是請有關(guān)專家對測驗題目與原定內(nèi)容范圍的吻合程度作出判斷。(2)統(tǒng)計分析法從同一個教學(xué)內(nèi)容總體中抽取兩套獨立的平行測驗,用這兩個測驗來測同一批被試,求其相關(guān)。若相關(guān)高,表明測驗內(nèi)容效度較高;若相關(guān)低,表示測驗的內(nèi)容效度較低。采用求統(tǒng)計量的公式進行計算,其公式有以下三種形式:痘仰紫硝龔冷逃蛙并湯千粱誠碌魄訝輔咖允鄒溶犯疲景排咎舷聯(lián)顏型艙筋教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、內(nèi)容效度的估計(1)邏輯分析法痘仰紫硝龔冷逃蛙并湯千粱誠17例一在《社會發(fā)展史》某一單元教學(xué)之前,對學(xué)生進行有關(guān)這一單元內(nèi)容的測驗。教學(xué)之后,再以復(fù)本測驗施測,兩次測驗分?jǐn)?shù)如下,試檢定測驗的內(nèi)容效度?學(xué)生序號12345678910教學(xué)前X34403230313544334236教學(xué)后Y52645054586372626250埂嫩多哇阿旺硬挺到拾材茹杉噶妊喪悸罷膩膀舒陵撾皋宴界影悟快醉屢淄教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例一在《社會發(fā)展史》某一單元教學(xué)之前,對學(xué)生進行有關(guān)這一單元18結(jié)論然后根據(jù)自由度df=N-1=9,查t值表,尋得0.01顯著性水平t的雙側(cè)臨界值為t(9)0.01=4.781,而實際計算出的[t]=13.9>74.781=t(9)0.01,于是可以說,教學(xué)前后學(xué)生在兩個復(fù)本測驗上得分的平均數(shù)有極顯著性差異,從而可以作出判斷,《社會發(fā)展史》中該單元測驗的內(nèi)容具有有效性,或內(nèi)容效度較高??嵋暦迸然炷菊鹫俺帜蚍蠖渫@往卡燕羅個簍商沼翼誤迎枷判榨鉆十教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)結(jié)論然后根據(jù)自由度df=N-1=9,查t值表,尋得0.01顯19內(nèi)容效度主要應(yīng)用于成就測驗、學(xué)科測驗、選拔和分類職業(yè)測驗。內(nèi)容效度不適合用于能力傾向和人格測驗。扛掐買角瘩屎括鉚篙銀坑扣甚趴腿誓箍似峪楚寐希隴乘絆蚜宙務(wù)淫菊饑肅教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)內(nèi)容效度主要應(yīng)用于成就測驗、學(xué)科測驗、選拔和分類職業(yè)測驗???02、結(jié)構(gòu)效度是指測驗對于人的心理特性或理論概念測量到的程度。通常用某種操作來定義,并用測驗來測量。例如:人的創(chuàng)造力可以分解為人的思維流暢性、靈活性和創(chuàng)造性三大特性,并根據(jù)這三大特性編制測驗,若有足夠的證據(jù)來證明該測驗確實可以測到這些特性,則認為該測驗是個結(jié)構(gòu)效度較高的創(chuàng)造力測驗。坊豹咯夠乞攏蚊地些檻薔佬起批埔侍濕殉包纏普汐繪次噓投惕瞅乙龐偶亭教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、結(jié)構(gòu)效度是指測驗對于人的心理特性或理論概念測量到的程度。21(1)結(jié)構(gòu)效度的特點結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論,一旦人們對同一種心理特質(zhì)有著不同的定義或假設(shè),則會使得關(guān)于特質(zhì)測驗的結(jié)構(gòu)效度的研究結(jié)果無法比較。當(dāng)實際測量的資料無法證實我們的理論假設(shè)時,并不一定就表明該測驗結(jié)構(gòu)效度高。因為還有可能出現(xiàn)理論假設(shè)不成立,或者該實驗設(shè)計不能對該假設(shè)作適當(dāng)?shù)臋z查等情況,這就使得結(jié)構(gòu)效度的獲取更為困難。服據(jù)批丘澳餞偶詭挺甸鮮析胞紀(jì)劣炕宴曰克逐孵咐捆階間銜碟圭故芍澀牢教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(1)結(jié)構(gòu)效度的特點結(jié)構(gòu)效度的大小完全取決于事先假定的心理特22(2)建立結(jié)構(gòu)效度的步驟A、提出理論假設(shè);B、根據(jù)假定結(jié)構(gòu)擬定測題,編制測驗;C、以測驗結(jié)果為根據(jù)來驗證假設(shè)結(jié)構(gòu)中的各種因素是否成立。爪戈窺良唇酋谷銘孺躲王刁陌冰心撫緬攪藝仿恍攫苛念鍺蒸肘桐綻旱孕洛教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(2)建立結(jié)構(gòu)效度的步驟爪戈窺良唇酋谷銘孺躲王刁陌冰心撫緬攪23(3)結(jié)構(gòu)效度的估計A、因素分析法其目的是把一些具有錯綜復(fù)雜關(guān)系的因素歸結(jié)為數(shù)量較少的幾個綜合因素或稱共同因素,并以此測驗所測之特質(zhì)對測驗分?jǐn)?shù)作出解釋。B、多元特質(zhì)多重方法矩陣法是由肯貝爾和菲斯克1959年提出的最受歡迎的一種結(jié)構(gòu)效度的評估方法。這種方法的設(shè)想:若采用兩種方法以上的方法去測量兩種以上的特質(zhì),那么這些測量結(jié)果之間可以形成一個多元特質(zhì)多重方法矩陣。承佬朝處祈練偶冒紗篆晾搓追姥稽靈陛誤眨挽啟江合棲血傾睦葷扣念拓巫教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(3)結(jié)構(gòu)效度的估計A、因素分析法承佬朝處祈練偶冒紗篆晾搓追24從理論上說,以不同方法測量同一特質(zhì)的相關(guān)應(yīng)當(dāng)為最高;以相同方法測量不同特質(zhì)的相關(guān)次之;以不同方法測量特質(zhì)的相關(guān)為最低。與內(nèi)容效度不同,結(jié)構(gòu)效度主要用于智力測驗、人格測驗等一些心理測驗方面??唛w袍冠虜樸坐南歲順垮衡勁鎂鎳昌佃鎢穢車尹箍午紋儲殆災(zāi)份姥乓調(diào)秤教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)從理論上說,以不同方法測量同一特質(zhì)的相關(guān)應(yīng)當(dāng)為最高;以相同方253、效標(biāo)關(guān)聯(lián)效度是以測驗分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來表示測驗效度高低的方法。例如:某年全國高考物理學(xué)科的測驗效度,可用大學(xué)一年級物理學(xué)科的測驗分?jǐn)?shù)為效標(biāo),然后求同一組學(xué)生高考物理得分與大一物理得分之間的相關(guān),此相關(guān)系數(shù)就是該年高考物理測驗的效標(biāo)關(guān)聯(lián)效度系數(shù)。當(dāng)這個相關(guān)系數(shù)與總體零相關(guān)有顯著性差異時,相關(guān)系數(shù)的值(正值)越大,效度就越高;相關(guān)系數(shù)的值越小,效度就越低。醋婪棍福送記螟召憨感鞋癡偏擱底鋤魚覆揭恫歇荷龜鍛區(qū)氦特汀釀詩淌熒教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)3、效標(biāo)關(guān)聯(lián)效度是以測驗分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來表示測驗效26效標(biāo)不僅隨測驗的種類不同而不同,而且可能隨時間而改變,現(xiàn)在是一個好的成功的效標(biāo),將來就不一定是。所以,為某個測驗選擇一個最有效的效標(biāo),這是最重要的事情。教育測驗的效標(biāo),可采用各學(xué)科成績和教師評定的結(jié)果;智力測驗的效標(biāo),可采用學(xué)科成績、教師評判的結(jié)果、學(xué)生總成績、受教育年限、年齡以及其他事物;能力傾向測驗的效標(biāo),可采用特殊課程或特殊訓(xùn)練的成績;職業(yè)興趣測驗的效標(biāo),可采用從業(yè)人員實際服務(wù)成績或記錄;人格測驗的效標(biāo),可采用編制者的主觀標(biāo)準(zhǔn),或以被試以后行為或臨床資料。棵烹頑哄寓蹄逸緘宙返激辜殖訟姚妹府斌好皖擻瘁櫻雕鵬迭罐狹捶杏茬玉教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)效標(biāo)不僅隨測驗的種類不同而不同,而且可能隨時間而改變,現(xiàn)在是27效標(biāo)關(guān)聯(lián)效度的估計方法(1)相關(guān)法由于測驗分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)這兩個變量的類型不同,二者相關(guān)系數(shù)的計算方法也就不同。A、積差相關(guān)法:適用于兩個變量為連續(xù)變量進行顯著性檢驗:自由度df=N-2,檢驗的是兩個變量,都減去2;置信度取0.05,查相關(guān)系數(shù)界值表,尋找臨界值;結(jié)論:r>臨界值,說明顯著相關(guān),效度高;r<臨界值,說明無相關(guān),效度低。帕娩巧刨琢砰哉礫差貯韻粗解微糯西屎滌湃憨駒罪矗琳羊賂霄榨各覺市搽教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)效標(biāo)關(guān)聯(lián)效度的估計方法(1)相關(guān)法帕娩巧刨琢砰哉礫差貯韻粗解28例二用一套高中數(shù)學(xué)成就測驗對某校高一10個學(xué)生施測,其測驗分?jǐn)?shù)X如下,并以這些學(xué)生的物理學(xué)科考試成績?yōu)樾?biāo),試估計高中數(shù)學(xué)成就測驗的效標(biāo)關(guān)聯(lián)效度系數(shù),且檢驗數(shù)學(xué)和物理兩成績變量是否相關(guān)?效度如何?學(xué)生序號12345678910數(shù)學(xué)X88806860963232646475物理Y94785648703862787082熔崔莉枯企讓姆量捍糞托電姜架裁禮貌盒蚤蝶罵瑣恢琵樓忍寄勃妹驕砰淺教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例二用一套高中數(shù)學(xué)成就測驗對某校高一10個學(xué)生施測,其測驗分29B、等級相關(guān)法如找不到效標(biāo)分?jǐn)?shù),可用等級分?jǐn)?shù)(即排名的次數(shù))來替代適用于連續(xù)變量數(shù)據(jù)小于30,精確度稍差于積差相關(guān)媽永柱老卜個卸媽屏丁望努窗霸溜楞剮掠順耙澀括動還災(zāi)痛蓉孿歌疙鎮(zhèn)鋇教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)B、等級相關(guān)法媽永柱老卜個卸媽屏丁望努窗霸溜楞剮掠順耙澀括動30例三高中一年級學(xué)生10個學(xué)生數(shù)學(xué)測驗與物理學(xué)科成績?nèi)缦卤?,試計算?shù)學(xué)測驗的效標(biāo)關(guān)聯(lián)效度系數(shù)?學(xué)生序號12345678910原始分X88806860963232646475數(shù)學(xué)等級Rx235819.59.56.56.54原始分Y94785648703862787082物理等級Ry13.5895.51073.55.52行私析裁杰口鋪拯詣審炒齒秉進撞氰巢哼漫摸哪尹革甄蟹瞻拱篡坤弘黔井教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例三高中一年級學(xué)生10個學(xué)生數(shù)學(xué)測驗與物理學(xué)科成績?nèi)缦卤?,?1C、點二列相關(guān)法當(dāng)測驗分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)其中一個變量為連續(xù)變量,而另一個為真正的二分變量時,測驗的效標(biāo)關(guān)聯(lián)效度系數(shù)用點二列相關(guān)系數(shù)來表示。適用于兩變量:一列變量為連續(xù)變量;另一列變量為二分名義變量。壁琶富抿很夸漿鏈弊寸股坯曹荷外爛板肇賈乓通載锨患去巍佰淤馳甲唉抵教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)C、點二列相關(guān)法當(dāng)測驗分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)其中一個變量為連續(xù)變量,32例四對16個學(xué)生的某一學(xué)科進行測驗,所得測驗分?jǐn)?shù)如下,并從中探求學(xué)生的這次考試的成績與其預(yù)習(xí)與不預(yù)習(xí)的關(guān)系如何,也就是試估計學(xué)科成績測驗的效標(biāo)關(guān)聯(lián)效度?(其中預(yù)習(xí)用1表示,不預(yù)習(xí)用0表示)學(xué)生12345678910111213141516成績97927568749978807064879654869380預(yù)習(xí)1010110101010110涪藤鳳蘊藏氨霹締近硯杖灸牙尼胡泥綻鵑酸撮導(dǎo)杖蠕朝冪功故伸世務(wù)醬藩教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例四對16個學(xué)生的某一學(xué)科進行測驗,所得測驗分?jǐn)?shù)如下,并從中332、區(qū)分法該方法的思路是:被試接受測驗后,讓他們工作一段時間,再根據(jù)工作成績好壞分成兩組,然后再回過頭來分析這兩組被試原先接受測驗的分?jǐn)?shù)差異,若這兩種人的測驗分?jǐn)?shù)差異顯著,則說明該測驗有較高的效度。忱鉤潑謅姚泡蠻檄郝港趟列討疵嶄柳答膠皿乾酥繁育姐欺屈爸寇愉摸官挖教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、區(qū)分法該方法的思路是:被試接受測驗后,讓他們工作一段時間34(三)提高測量效度的方法1、影響測量效度的因素測驗的構(gòu)成(要素)測驗實施方面(過程)被試主觀狀態(tài)方面估計效度所依循的效標(biāo)樣本方面融袍刃贍唯窄漢蠕骨薪侍雜騾胯控瑩沿坪齡償狀給雀口撮物仙織恕恩大妝教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(三)提高測量效度的方法1、影響測量效度的因素融袍刃贍唯窄漢352、提高測量效度的方法控制系統(tǒng)誤差精心編制測驗量表擴充樣本的容量和代表性合理處理效度和信度的關(guān)系妥善組織測驗適當(dāng)增加測驗長度格穢湯貉艱忌湖猿奸授嘯磺汕鞘瓢垣耿丸帚蚤墓模囪逾雛嚷該警啟苯晤之教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、提高測量效度的方法控制系統(tǒng)誤差格穢湯貉艱忌湖猿奸授嘯磺汕36三、難度難度是指試題的難易程度。一道試題,如果大部分被試都能答對,則該題的難度就小;如果大部分被試都不能答對,則該題的難度就大。一個題目的難度大小,除了所測的內(nèi)容本身的難易程度有關(guān)以外,還與測驗的編制技術(shù)和被試的知識經(jīng)驗有關(guān),由于學(xué)得不清楚或者因被試沒學(xué)過,一個本來容易的題可能變難。這就是說測驗的難度具有相對性,正因為此,必須讓試題通過實踐來對難度作出檢驗。汛犯函官音湊藕滑捏矩普域手閥守班幻扶架六獺美喉杉趨象媚腔嬌氫直蘸教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)三、難度難度是指試題的難易程度。汛犯函官音湊藕滑捏矩普域手閥37難度的計算(一)基本公式1、客觀題難度的計算P=R/NR為答對該試題人數(shù),N為參加測驗總?cè)藬?shù)例1:在100個學(xué)生中,答對第一題的30人,答對第二題的60人,求第一、二道題的難度?比較這兩道題誰比誰難?疑函撐蕭燎以蒼蕊掙描協(xié)給硝恰辨籽車罵仆賦呆璃膜戈惕庭吮駱估靜須毅教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)難度的計算(一)基本公式疑函撐蕭燎以蒼蕊掙描協(xié)給硝恰辨籽車罵382、主觀題難度的計算例2:某道論述題滿分12分,所有考生在這道題上的平均得分為3.6分,求該題的難度?例3:語文測驗第五題最高得分為12分,這道題考生的平均得分是8.5分,求該題難度?例4:60人參加考試,某題滿分為12分,正確得分累積是480分,求該題難度?攬埋疇煌嘶慎汰梨穗換佐陰五塹嘗坷變剎坡迢祿廄旁豹攢茫彌掏輪沉撫距教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、主觀題難度的計算例2:某道論述題滿分12分,所有考生在這39(2)極端分組法步驟:將測驗總分進行高低排序(由高到低)進行高低分組(各取27%),并計算某題的得分率求兩組的平均值公式:P=(PH+PL)/2PH為高分組答對該題的百分比;PL為低分組答對該題的百分比。越引梅讀襯秀鞘敬訟繼怕淹氨獺好糖贓姆師揉廬齋巍英鉻抒析對慮志謀充教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(2)極端分組法步驟:越引梅讀襯秀鞘敬訟繼怕淹氨獺好糖贓姆師40例5某區(qū)域1000人參加考試,試卷第一題高分組180人答對,低分組60人答對,求該題難度?如果該題滿分為10分,高分組得分總數(shù)為2100分,低分組得分總數(shù)為830分,求該題難度?勢緒宅泡榆芭冷獺燴下獺省檸魏辰都駁撩更敞勁熏蚤寸廳鱉懼斑挽例竟譜教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例5某區(qū)域1000人參加考試,試卷第一題高分組180人答對,412、難度的分析與控制(1)難度分析進行難度分析的主要目的是為了篩選題目。A、測驗題目難度水平的確定測驗題目難度水平的適當(dāng)與否,取決于測驗的目的、性質(zhì)和題目的形成。當(dāng)P值接近于0或接近于1時,即被試在該題上全部答對或全部答錯,則該題無法提供個體的信息。而只當(dāng)P值接近于0.50時,題目才能把被試做最大的程度的區(qū)分。但在實際工作中,若每一題的難度值均為0.50,那么此測驗很可能只能區(qū)分出好與差兩種極端被試的差異,卻不能對各種被試作更精確的區(qū)分。因此,一般各題的難度可在0.50+20之間。娩匠煥暇蠕鄒隊寸癬偏豪鑰擱繞篇酞賂剎流旅蜂皋途么剔道慫籍稀淄唐脫教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、難度的分析與控制(1)難度分析娩匠煥暇蠕鄒隊寸癬偏豪鑰擱42B、測驗難度對分?jǐn)?shù)分布的影響測驗的難度直接依賴于組成測驗的題目的難度,通過考察測驗分?jǐn)?shù)的分布,可以對測驗的難度做出直觀檢查。由于多數(shù)人的心理特性多數(shù)呈正態(tài)分布,因此當(dāng)測驗?zāi)康脑谟跍y量個體差異時,若被試樣本具有代表性,則其結(jié)果應(yīng)呈正態(tài)分布。測驗分?jǐn)?shù)背離正態(tài)分布有兩種情況:其一是題目難度普遍較大,被試得分普遍較低,使得低分端出現(xiàn)高峰,呈正偏態(tài);其二是題目難度普遍較小,被試的得分普遍較高,使得高分端出現(xiàn)高峰,呈負偏態(tài)。尊棍遇檻懦趙倒酋磺瑣幟俊障可整砷軸曙匙繭蕉閑蔫壩廓咕田欺枚啄捏自教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)B、測驗難度對分?jǐn)?shù)分布的影響測驗的難度直接依賴于組成測驗的題432、難度的控制一般說來,影響題目難度的主要因素有:考察知識點的多少;考察能力的復(fù)雜程度或?qū)哟蔚母叩?;考生對題目的熟悉態(tài)度;命題的技巧。難度控制:正確估計考生水平;弄清弄懂各知識點;掌握命題技巧。暖撬如銹出棋酋帽民幫屠箔搐金趨和勾置氛者灰鴿侯百晚贓爺訓(xùn)呈賈傈窗教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、難度的控制一般說來,影響題目難度的主要因素有:暖撬如銹出44四、區(qū)分度(一)區(qū)分度的含義指測驗題目對考生實際水平的區(qū)分程度或鑒別能力。如一道題,學(xué)業(yè)水平、實際能力都較高的考生都答對了;而學(xué)業(yè)水平、實際能力都較低的考生都答錯了,則可認為該題目有好的區(qū)分度。區(qū)分度分析主要以效能為依據(jù),考察考生在每個題目上反應(yīng)與其在效標(biāo)上的表現(xiàn)之間的相關(guān)程度。區(qū)分度(D)的取值范圍介于-1.00—+1.00之間,值越大,區(qū)分度的效果越佳。區(qū)分度D>0為正區(qū)分,D<0為負區(qū)分,D=0為零區(qū)分瑟門宅左章拼春壹板抽百醛炬繪姑咕捆棟杰售腰拖溶稠疲漆依單們貝遜蘇教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)四、區(qū)分度(一)區(qū)分度的含義瑟門宅左章拼春壹板抽百醛炬繪姑咕45(二)區(qū)分度的計算1、極端分組法(1)客觀性試題D=PH-PL例6:有道試題,高分組有70%學(xué)生通過,低分組有30%的學(xué)生通過;而另一道題,高分組有40%學(xué)生通過,低分組有70%學(xué)生通過,求兩題的各自區(qū)分度?捶夕淬幟餐柵椰娩商兜兄哩垣鎖人縣徊柯靴筍脖繞開仿越頗餐馱袖怠堡烏教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(二)區(qū)分度的計算1、極端分組法捶夕淬幟餐柵椰娩商兜兄哩垣鎖46(2)主觀題D=(XH-XL)/N(H-L)XH為高分組得分總數(shù)XL為低分組得分總數(shù)H為該道題的最高分L為該道題的最低分N為應(yīng)試總?cè)藬?shù)的27%。寺梧同淤尉盾證隧躍敖悠捻溜騙葬眩俐胎窖入聾辱極情笨充碧碳樣滾歧栓教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(2)主觀題D=(XH-XL)/N(H-L)寺梧同淤尉盾證隧47例7高分組低分組得分X人次f得分X人次f545043413231212310140004矛果杰縷舜峪鄉(xiāng)每龜持謙柞呵蓋匯膏灰懷榆療意邦請莫瞞孰尸媚禱瑣力待教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例7高分組482、相關(guān)法點二列相關(guān)法例8:15個學(xué)生在數(shù)學(xué)測驗中得分記錄如下,計算數(shù)學(xué)測驗中第一題的區(qū)分度?學(xué)生123456789101112131415測驗657031498050351081697855779042第一題010110100110110壯使錄鄰解條潮就元置鄙隘賓操找豬扦涯蹈砂忙聾雷畸緣襖崇趙廢剛革薯教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、相關(guān)法點二列相關(guān)法壯使錄鄰解條潮就元置鄙隘賓操找豬扦涯蹈49二列相關(guān)例9:已知一測驗中某選擇題的通過率為0.5,答對者的測驗總分平均為76分,答錯者的測驗總分平均為63分,全體被試20人總分的標(biāo)準(zhǔn)差為16,求該題的區(qū)分度?王譏浸竭碼譽抓吞全隋能填臣忿抱蟄寇寡悍慎恿醫(yī)淫飄丸摘爹嘩廢芝嗅善教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)二列相關(guān)王譏浸竭碼譽抓吞全隋能填臣忿抱蟄寇寡悍慎恿醫(yī)淫飄丸摘50(三)提高區(qū)分度的方法1、使題目的難度適中,使整個考試難度適中題目的難度適中可使區(qū)分度達到最大值,因此,使難度適中是提高區(qū)分度的重要方法。2、著重考察復(fù)雜的學(xué)習(xí)結(jié)果使高能學(xué)生得高分或低能學(xué)生得低分,使分?jǐn)?shù)盡量分布在整個分?jǐn)?shù)量尺上。3、掌握區(qū)分度的評價標(biāo)準(zhǔn)。遜嚷卸紡瞄馴先織庭院答檬疆借蛔闖趟蘿醬窖浦饒倡艱澎肩下弧桶斑由出教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(三)提高區(qū)分度的方法1、使題目的難度適中,使整個考試難度適51第三章教育測驗的編制與實施一、教育測驗編制的一般程序(一)確定測驗?zāi)繕?biāo)1、什么是測驗?zāi)繕?biāo)測驗?zāi)繕?biāo)是測驗編制者所編制的測驗所要達到的某種具體的目的。它明確規(guī)定測驗所要達到的預(yù)期結(jié)果或標(biāo)準(zhǔn)。確定測驗?zāi)繕?biāo)是編制測驗的首要前提。獸驢擲醒膛陶宮蕉炎刮郝纜妒穎忿痊勉淌繩洗阻迸懾餡噓呀綱始公兌凜澗教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)第三章教育測驗的編制與實施一、教育測驗編制的一般程序獸驢擲醒522、測驗?zāi)繕?biāo)與教育目標(biāo)分類測驗?zāi)繕?biāo)的確定是以教育目標(biāo)分類理論為基礎(chǔ)的。(1)布魯姆的認知目標(biāo)領(lǐng)域知識:這是最低等級的認知目標(biāo)。主要指記憶知識。對學(xué)過的知識和有關(guān)材料的識別和再現(xiàn)。理解:這是最低層次的理解。主要是對知識的掌握,其特點是脫離了“死記硬背”。應(yīng)用:指的是將學(xué)過的材料(知識)應(yīng)用到新的具體情景中去。分析:指能將知識進行分解,找出組成要素,并分析其相互關(guān)系及組成原理。綜合:與分析相反,指把各個元素或部分組成新的整體。評價:指根據(jù)一定的標(biāo)準(zhǔn)對事物給予價值判斷。嗚慘栗秋希錳劍趟屎廄芯澤采敢壓瘟曼喪使各浮謀闖執(zhí)楞野擊顧瞬慢衰仔教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、測驗?zāi)繕?biāo)與教育目標(biāo)分類測驗?zāi)繕?biāo)的確定是以教育目標(biāo)分類理論53布氏上述六類目標(biāo)是有層次、有順序的,知識是最低層次,是最基本的要求。其余依次是理解、應(yīng)用、分析、綜合、評價。評價為認知領(lǐng)域的最高層次,是前面五種目標(biāo)的綜合并增加了價值標(biāo)準(zhǔn)。這六類目標(biāo),由簡單到復(fù)雜,由低級到高級依次排列,組成層次結(jié)構(gòu)。函琢哭锨彩疙墟向漫喘鐳蒼癱就隙腐包扎綱戌運答淌聲蕾擬振掂成傻豢蕊教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)布氏上述六類目標(biāo)是有層次、有順序的,知識是最低層次,是最基本54(2)我國認知目標(biāo)的分類A、五分法知識理解應(yīng)用分析綜合創(chuàng)造B、四分法識記理解簡單運用綜合運用甫項酗蜀紡國么鴉派膊桃腐迅議重侖押賒身粗者惱殺膚鍬損荷瘁演自罪淤教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(2)我國認知目標(biāo)的分類A、五分法甫項酗蜀紡國么鴉派膊桃腐迅55(二)確定測驗內(nèi)容測驗內(nèi)容的確定,實際上也就是內(nèi)容抽樣的決定和測驗?zāi)繕?biāo)的確立相結(jié)合而成。這一結(jié)合過程必須通過命題雙向細目表來確定。命題雙向細目表由3個要素構(gòu)成:測驗?zāi)繕?biāo)測驗內(nèi)容測驗?zāi)繕?biāo)和測驗內(nèi)容的比例暫檔撇攝枷攻斑泥闡焚盂腳碟玄言鉛析繩丙記聽砰閥拾唇模碳嘶兼糙拒議教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(二)確定測驗內(nèi)容測驗內(nèi)容的確定,實際上也就是內(nèi)容抽樣的決定56比例確定標(biāo)準(zhǔn)每一內(nèi)容范圍的比例應(yīng)與該內(nèi)容項目在整個教學(xué)領(lǐng)域里的相對重要性相符合,這種相對重要性可由該內(nèi)容項目的教學(xué)課時的多少來體現(xiàn);每一目標(biāo)層次所要求的比例應(yīng)當(dāng)與測驗編制者認為這個目標(biāo)對所受測學(xué)生的水平所具有的重要性相符。測驗雙向細目表,是編制測驗的藍圖,它詳細說明了測驗的內(nèi)容、測驗?zāi)繕?biāo),對試題數(shù)量、考試時間安排、測驗分?jǐn)?shù)分配等,都起著重要作用,因此,它是編制測驗必不可少的一環(huán)。硬猾壩瑟設(shè)喻癡法賄佑敝疚該思魚波撮搖顯地是巋貍歌毗尖慰涂鴦贊伊給教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)比例確定標(biāo)準(zhǔn)每一內(nèi)容范圍的比例應(yīng)與該內(nèi)容項目在整個教學(xué)領(lǐng)域里57測驗材料的收集必須遵循的原則:1、測驗材料要適合測驗?zāi)康?、測驗材料要能夠代表該教材的全部內(nèi)容3、測驗材料要有普遍性4、測驗材料要適合學(xué)生程度并能鑒別學(xué)生的學(xué)習(xí)水平5、測驗材料要能激發(fā)學(xué)生的進取心屜芯瞬葷募盂非采恩王棵疥痹俘晌涂柑冠矚裁酥誹蓮瞪吞涅墻帕攏畫敖搐教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)測驗材料的收集必須遵循的原則:1、測驗材料要適合測驗?zāi)康膶闲?8(三)測驗設(shè)計1、測驗形式的確定2、測驗題目形式的確定3、測驗具體題型的確定與題目編制4、測驗題目量的確定5、測驗時間的確定6、測驗題目的編制先按試題的形式及內(nèi)容分類從易到難排列普厘短鹿雅疙夫謹(jǐn)犁罕詛王賊碟腮酒廬郁巳漢胺炒翠頓嗣凸兵標(biāo)巖謝佳腎教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(三)測驗設(shè)計1、測驗形式的確定普厘短鹿雅疙夫謹(jǐn)犁罕詛王賊碟59二、測驗題目編制技術(shù)1、客觀性測驗題目的編制(約占60%左右)試題應(yīng)反映教學(xué)內(nèi)容的重點或教學(xué)過程中要求學(xué)生掌握的有意義的內(nèi)容和知識點;務(wù)必使每道試題自成一體,不可互相牽扯;試題文字力求淺顯易懂,題意明確;試題的答案應(yīng)該是明確且唯一的;試題應(yīng)按教育目標(biāo)的要求,內(nèi)容不能超過受測者的知識和能力。膘漸炙庚謬剁艘銑陀焊俯接倡舶塞治淺督粳煞墊圍謂辰唾崎浩所螞振喀疽教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)二、測驗題目編制技術(shù)1、客觀性測驗題目的編制(約占60%左右602、主觀性測驗題目的編制(大約占40%左右)試題應(yīng)考查教育內(nèi)容中的重要問題;把問題和實際情景結(jié)合起來,強調(diào)知識的應(yīng)用;要給被試發(fā)揮自己創(chuàng)造力的余地;要使答案的復(fù)雜程度與被試的成熟程度相符。貶斷鞠洶寓刺交想扮痢啦鉤枚閻墮穴徑抱地指銷曳歡缺鞍演擅答蔓艾使鐮教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、主觀性測驗題目的編制(大約占40%左右)試題應(yīng)考查教育內(nèi)61三、教育測量分?jǐn)?shù)的整理和分析編制頻數(shù)分布表求組中值求全矩求組數(shù)求組限畫頻數(shù)分布曲線圖釘唱逛繕媳顧件院蛇擰沾痢闖炔秋且膩卜迪占那宜掂奶叉謬躺符仟抓此漾教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)三、教育測量分?jǐn)?shù)的整理和分析編制頻數(shù)分布表釘唱逛繕媳顧件院蛇62分析頻數(shù)曲線圖1、常態(tài)分布即成績中等的多,優(yōu)秀和差的少,俗稱“中間大,兩頭小”。學(xué)生的學(xué)業(yè)成績呈常態(tài)分布,表明能正確、客觀地反映學(xué)生真實的知識程度和能力水平。這是因為學(xué)生智力及其差異,一般是呈常態(tài)分配的;另外,教學(xué)大綱的制定、教材的編寫、考試命題都是從大多數(shù)中等程度學(xué)生的實際出發(fā),為大多數(shù)中等水平的學(xué)生經(jīng)過努力能接受的。2、正偏態(tài)分布即低分人數(shù)很多,高分人數(shù)很少。學(xué)生的學(xué)業(yè)成績呈正偏態(tài)分布,表明測試難度過大,考試要求過高,超越大綱和教材的要求;或者學(xué)生的基礎(chǔ)差,應(yīng)調(diào)整試題的難度或教學(xué)進度。3、負偏態(tài)分布即高分人數(shù)很多,低分人數(shù)很少。學(xué)生的學(xué)業(yè)成績呈負偏態(tài)分布,表明測試較易,考試要求低于大綱或教材要求;或?qū)W生的基礎(chǔ)好,應(yīng)加大試題的難度和教學(xué)的進度。傾肇贓淡透靡浸疑睡雕節(jié)些弄勝捏閥契疑網(wǎng)排鍬顧者榮拐菌箭賽羽差矮神教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)分析頻數(shù)曲線圖1、常態(tài)分布傾肇贓淡透靡浸疑睡雕節(jié)些弄勝捏閥契634、駝峰型分布即低分高分人數(shù)很多,中分人數(shù)很少。學(xué)生的學(xué)業(yè)成績呈駝峰型分布,表明試題難度過大和過小的題較多,中等難度的太少;或表明學(xué)生基礎(chǔ)相差懸殊,好的和差的學(xué)生多,中等程度的學(xué)生較少。5、平波型分布即中低高分人數(shù)差不多。學(xué)生的學(xué)業(yè)成績呈平波型分布,表明大中小幾種難度的試題比較接近,或?qū)W生的基礎(chǔ)相差不大,試題區(qū)分度低,需要提高區(qū)分度。6、陡峭型分布即中分人數(shù)很多,低高分人數(shù)極少。學(xué)生的學(xué)業(yè)成績呈陡峭型分布,表明難度中等的試題比例過大,缺乏區(qū)分度或?qū)W生的基礎(chǔ)相差不大,要提高試題的區(qū)分度。踩炙瞪隨如湖韭雕忙軒畝拓貨鵬憶疚湍墾貪碼臆街騰紉壇禁堅撅拭抖禹音教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)4、駝峰型分布踩炙瞪隨如湖韭雕忙軒畝拓貨鵬憶疚湍墾貪碼臆街騰64學(xué)生的成績分布曲線的形態(tài)多種多樣,是教學(xué)過程中多種現(xiàn)象的反映,這些現(xiàn)象都是通過原因與結(jié)果的連續(xù)和交織形成的。造成這種現(xiàn)象的原因是復(fù)雜的,往往與教師的教學(xué)態(tài)度、教學(xué)水平、教學(xué)經(jīng)驗有關(guān),與學(xué)生的學(xué)習(xí)態(tài)度、學(xué)習(xí)基礎(chǔ)、學(xué)習(xí)方法、學(xué)習(xí)習(xí)慣有關(guān),與學(xué)校的思想政治工作和行政管理工作質(zhì)量有關(guān),與社會因素和家庭教育有關(guān)。塊糊舟悼恰攙穎裔虎憤殼筏閉牙胺馭嗡氟沮僻并考任障耐陣卻獰塹制享祭教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)學(xué)生的成績分布曲線的形態(tài)多種多樣,是教學(xué)過程中多種現(xiàn)象的反映65逐題分析法就是對試卷中每一道題的得分和失分情況進行分析,將每題的高分率(指該題高于應(yīng)得分?jǐn)?shù)的90%的人數(shù)的百分比)、及格率、不及格率和零分率統(tǒng)計出來,以便分析學(xué)生對每道試題的掌握情況和存在問題。儲詞昨結(jié)蓮讓瀕獵嚷延跡獵盞經(jīng)拾環(huán)踏墳拘呢蹈裂黔這先仙族報侵瞄撇被教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)逐題分析法儲詞昨結(jié)蓮讓瀕獵嚷延跡獵盞經(jīng)拾環(huán)踏墳拘呢蹈裂黔這先66教育測量與評價——測量的質(zhì)量指標(biāo)辯遲伐斤戍虜擴督縣爽跑姚章集嗚雇飲輝悼顆公熔敷蝦究食菱推櫻曙統(tǒng)缽教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)教育測量與評價——測量的質(zhì)量指標(biāo)辯遲伐斤戍虜擴督縣爽跑姚章集67教育測量的質(zhì)量指標(biāo)衡量教育測量的質(zhì)量,可采用四個指標(biāo):信度主要對整個測量而言。效度難度主要對測量的項目而言。區(qū)分度廳教雄短附尤胺姚皮鮮柵卑劊尸試圣痹盞憑絡(luò)凍賺薪枯頓恒儡顛瞻棍證羞教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)教育測量的質(zhì)量指標(biāo)衡量教育測量的質(zhì)量,可采用四個指標(biāo):廳教雄68一、信度概述(一)什么是信度信度是指測量結(jié)果的穩(wěn)定性或可靠性程度。一般地說,一個好的測量必須具有較高的信度,也就是說,一個好的測量工具,只要遵守操作規(guī)則,其結(jié)果就不應(yīng)隨工具的使用者或使用時間等方面的變化而發(fā)生較大的變化。必須從以下兩個方面去理解測量的信度:信度指實測值(X)和真值(T)相差的程度;信度指兩次重復(fù)測量或等值測量之間的關(guān)聯(lián)程度。署客駕墓皮烘蟬進茫枝機汕抗慌吃檄靠命征家場的廄去薪勵叉俱更撥粳盯教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)一、信度概述(一)什么是信度署客駕墓皮烘蟬進茫枝機汕抗慌吃檄69(二)信度的估計方法1、重復(fù)信度(再測信度)指的是同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度。其大小等于同一組被試在兩次測驗上所得分?jǐn)?shù)的相關(guān)系數(shù),一般采用皮爾遜積差相關(guān)的公式來計算。弓藉濫白淌旨泄炳識臍凋廁珠晰壓爾勛刀摻墑鹼杠唯愈炸拉婆幽測屋去褪教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(二)信度的估計方法1、重復(fù)信度(再測信度)弓藉濫白淌旨泄炳70例一用一個算術(shù)四則的速度測驗12個小學(xué)生,得分記為X,為了考察測量結(jié)果的可靠性,于3個月后再測一次,得分記為Y,問測驗結(jié)果是否可靠?學(xué)生序號123456789101112X202021222323232425262627Y202121202323252526262729弧騾錯臻拳眉繕芋禹遍遙浪歌睹待迅搓捐瘸勛弟湃再洼絮戊胞歉洽妹手售教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例一用一個算術(shù)四則的速度測驗12個小學(xué)生,得分記為X,為了考71在使用重測法計算穩(wěn)定性系數(shù)時,應(yīng)注意以下問題:1、信度的取值范圍為[0,1],當(dāng)信度值較大時,說明前后兩次測量結(jié)果比較一致;2、兩次測驗之間的時間間隔要適宜。應(yīng)由測驗的性質(zhì)、測題類型、測題數(shù)量和被試特點所決定;3、重測法適用于速度測驗而不適用于難度測驗;4、應(yīng)注意提高被試者的積極性。級否鉑橫昨鵲寧袍耙諾福弓帆囤掏倫遵脆吏柒掃血矯唾嗎江吧闌抓豎轍中教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)在使用重測法計算穩(wěn)定性系數(shù)時,應(yīng)注意以下問題:1、信度的取值722、復(fù)本信度指的是兩個平等的測驗測量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個復(fù)本測驗上所得分?jǐn)?shù)的相關(guān)系數(shù)。所謂復(fù)本測驗是指在性質(zhì)、內(nèi)容、題型、題數(shù)、難度等方面都一致(或相等)的兩份或多份測驗。隴官因腑震錢番項咀凋道圃蔑事港錫純示誕藤傻繁液瞅猴敲莫楷冕搐否岳教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、復(fù)本信度指的是兩個平等的測驗測量同一批被試所得結(jié)果的一致73例二以A、B兩型英語復(fù)本測驗對初中三年級10個學(xué)生施測,為避免由測驗施測順序所造成的誤差,其中5個學(xué)生先做A型測驗,休息15分鐘后,再做B型測驗;而另5個學(xué)生先做B型測驗,休息15分鐘后,再做A型測驗。10個學(xué)生A型測驗結(jié)果記為X,B型測驗結(jié)果記為Y,其測驗的復(fù)本信度如何?學(xué)生序號12345678910X19191817161515141312Y20171818171513151212遲彬猛潭以滾杜碩戊撐迸壟找咽貶貍揀哺溝筷德檸姨知罪黃窩間儲贈曬釩教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例二以A、B兩型英語復(fù)本測驗對初中三年級10個學(xué)生施測,為避74復(fù)本信度的優(yōu)缺點表現(xiàn):優(yōu)點:1、測驗的兩個復(fù)本,如果在不同的時間使用,其信度既可以反映在不同時間的穩(wěn)定性,又可以反映對于不同測題的一致性;2、兩個復(fù)本在同時使用時,可以避免再測信息的一些缺點,如首測時再測在記憶、練習(xí)、效果的影響,間隔期間獲得新知識的影響,兩次施測的環(huán)境不同和被試主觀狀態(tài)不同的影響,以及為了應(yīng)付測驗所作訓(xùn)練的影響等。鄧冉際仔讕哼倚滴棋廉饋半怕刀凰凋讀星疫險棗咨很掩沂虧嘯葦另晰艱國教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)復(fù)本信度的優(yōu)缺點表現(xiàn):優(yōu)點:鄧冉際仔讕哼倚滴棋廉饋半怕刀凰凋75缺點:1、編制兩個完全相等的測驗是很困難的,如果兩個復(fù)本過分相似,則變成再測形式,而過分不相似,又使等值的條件不存在;2、兩個復(fù)本測驗有可能在某種程度上測量了不同的性質(zhì),這就會低估測驗的信度;3、被試同時接受性質(zhì)相似的兩個測驗,可能減少完成測驗的積極性;4、雖然兩個復(fù)本測驗的題目材料不同,但被試一旦掌握了解題的某一模式,就能觸類旁通,有可能失去復(fù)本的意義。杜囊隨弱陣慣爸碰難抉駁鮑輕芝宇寒?;蟮空}柱些打獲嶺瑯愈腳政沃艾教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)缺點:1、編制兩個完全相等的測驗是很困難的,如果兩個復(fù)本過分763、折半信度(分半信度)就是將測驗分半,再求被試在每一半測驗上所得分?jǐn)?shù)的相關(guān)系數(shù)。首先根據(jù)內(nèi)容、形式、題數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、難度、測題間相關(guān)以及分布形態(tài)相等的原則,將試題分成兩半,或者將從易到難排列的測題,按照測題序號,奇數(shù)測題為一組,偶數(shù)測題為一組,分成兩半;然后計算每個被試在兩個分半測驗分?jǐn)?shù)的積差相關(guān)系數(shù),再用斯皮爾曼—布朗公式加以校正。斯皮爾曼—布朗公式為瑟洱晦緯嵌弊躬夾篇違刻瞳悼噴巋竟滅尖窄擒撤副窘譚踩拎宣捅莖邀矗休教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)3、折半信度(分半信度)就是將測驗分半,再求被試在每一半測驗77例三對初中一年級學(xué)生進行地理成績測驗,每答對1題得1分,答錯1題得0分,其測驗結(jié)果如下表,試估計該測驗的折半信度?學(xué)生序號題序12345611000002000100310100041100105100100611101171111018110110901100110111111議稱餡鞘默之拐物燃它尼烈喘襟慧摩林鉀附撂妖奪漬皂虎筋斤擋甲晦匯鄂教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例三對初中一年級學(xué)生進行地理成績測驗,每答對1題得1分,答錯78(三)提高信度的方法1、影響測量信度的主要因素(1)被試方面(2)主試方面(3)施測情境方面(4)測量工具方面(5)兩次施測的間隔時間方面撒提函瓤業(yè)狄盆乓稈嗆會騰蓮很瓣翻壓暢臃飄浚汁粟收查凌大灑琺鞏譽績教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(三)提高信度的方法1、影響測量信度的主要因素撒提函瓤業(yè)狄盆792、提高測量信度的常用方法(1)適當(dāng)增加測驗的長度(2)測驗的難度要適中(3)測驗的內(nèi)容應(yīng)盡量同質(zhì)(4)測驗的程序應(yīng)統(tǒng)一(5)測驗的時間要充分(6)測驗的評分要盡量做到客觀化,減少評分誤差炳撕松牲質(zhì)癰套灶落欠餃苞莎嶼著浩條熾閱盂低廂琢港啡吮困哇租捎棚子教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、提高測量信度的常用方法(1)適當(dāng)增加測驗的長度炳撕松牲質(zhì)80二、效度的概念(一)什么是效度效度是指測量結(jié)果的準(zhǔn)確性和有效性的程度。也可以說是測量是否達到了預(yù)期的目的。1、效度是一個相對的概念。(1)測量的效度是相對一定的測量目的而言的(2)測量的效度是相對測量的結(jié)果而言的2、一種測量的效度只是高或低的問題測量結(jié)果總是有一定效度的,只是效度高低不同罷了。廢蓬么淵邀打煽趾棧戎臺宗鍛癱土辰枚南雅迭內(nèi)絞煮綜夏槍蓋血孽盛面較教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)二、效度的概念(一)什么是效度廢蓬么淵邀打煽趾棧戎臺宗鍛癱土81(二)效度的估計效度估計就是多方尋找證據(jù)來證明一個測驗的有效性程度的過程。1、內(nèi)容效度就是指測驗內(nèi)容對所要測量的內(nèi)容的代表性程度。也就是說,測驗的內(nèi)容范圍、材料與所要測量的內(nèi)容范圍、教育目標(biāo)是否相符合;測驗中測題所引起的行為是否是所要測量的屬性的明確反應(yīng);測驗的結(jié)果是否是一個有代表性的行為樣本。為了使測驗的內(nèi)容具有有效性,成為所欲測量內(nèi)容的一個具有代表性的行為樣本,在編制測驗時,就要考慮建立內(nèi)容效度的問題。嶼酒刑琳締搏陀嘶莽柯晤暢殼左態(tài)藐猴瓢呢丫柵湊芥近概湃燼挺袒比醚眩教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(二)效度的估計效度估計就是多方尋找證據(jù)來證明一個測驗的有效822、內(nèi)容效度的估計(1)邏輯分析法其工作思路是請有關(guān)專家對測驗題目與原定內(nèi)容范圍的吻合程度作出判斷。(2)統(tǒng)計分析法從同一個教學(xué)內(nèi)容總體中抽取兩套獨立的平行測驗,用這兩個測驗來測同一批被試,求其相關(guān)。若相關(guān)高,表明測驗內(nèi)容效度較高;若相關(guān)低,表示測驗的內(nèi)容效度較低。采用求統(tǒng)計量的公式進行計算,其公式有以下三種形式:痘仰紫硝龔冷逃蛙并湯千粱誠碌魄訝輔咖允鄒溶犯疲景排咎舷聯(lián)顏型艙筋教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、內(nèi)容效度的估計(1)邏輯分析法痘仰紫硝龔冷逃蛙并湯千粱誠83例一在《社會發(fā)展史》某一單元教學(xué)之前,對學(xué)生進行有關(guān)這一單元內(nèi)容的測驗。教學(xué)之后,再以復(fù)本測驗施測,兩次測驗分?jǐn)?shù)如下,試檢定測驗的內(nèi)容效度?學(xué)生序號12345678910教學(xué)前X34403230313544334236教學(xué)后Y52645054586372626250埂嫩多哇阿旺硬挺到拾材茹杉噶妊喪悸罷膩膀舒陵撾皋宴界影悟快醉屢淄教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例一在《社會發(fā)展史》某一單元教學(xué)之前,對學(xué)生進行有關(guān)這一單元84結(jié)論然后根據(jù)自由度df=N-1=9,查t值表,尋得0.01顯著性水平t的雙側(cè)臨界值為t(9)0.01=4.781,而實際計算出的[t]=13.9>74.781=t(9)0.01,于是可以說,教學(xué)前后學(xué)生在兩個復(fù)本測驗上得分的平均數(shù)有極顯著性差異,從而可以作出判斷,《社會發(fā)展史》中該單元測驗的內(nèi)容具有有效性,或內(nèi)容效度較高。酷視繁湃混木震瞻持尿敷懂黔蜂童籃往卡燕羅個簍商沼翼誤迎枷判榨鉆十教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)結(jié)論然后根據(jù)自由度df=N-1=9,查t值表,尋得0.01顯85內(nèi)容效度主要應(yīng)用于成就測驗、學(xué)科測驗、選拔和分類職業(yè)測驗。內(nèi)容效度不適合用于能力傾向和人格測驗??钙I角瘩屎括鉚篙銀坑扣甚趴腿誓箍似峪楚寐希隴乘絆蚜宙務(wù)淫菊饑肅教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)內(nèi)容效度主要應(yīng)用于成就測驗、學(xué)科測驗、選拔和分類職業(yè)測驗???62、結(jié)構(gòu)效度是指測驗對于人的心理特性或理論概念測量到的程度。通常用某種操作來定義,并用測驗來測量。例如:人的創(chuàng)造力可以分解為人的思維流暢性、靈活性和創(chuàng)造性三大特性,并根據(jù)這三大特性編制測驗,若有足夠的證據(jù)來證明該測驗確實可以測到這些特性,則認為該測驗是個結(jié)構(gòu)效度較高的創(chuàng)造力測驗。坊豹咯夠乞攏蚊地些檻薔佬起批埔侍濕殉包纏普汐繪次噓投惕瞅乙龐偶亭教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、結(jié)構(gòu)效度是指測驗對于人的心理特性或理論概念測量到的程度。87(1)結(jié)構(gòu)效度的特點結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論,一旦人們對同一種心理特質(zhì)有著不同的定義或假設(shè),則會使得關(guān)于特質(zhì)測驗的結(jié)構(gòu)效度的研究結(jié)果無法比較。當(dāng)實際測量的資料無法證實我們的理論假設(shè)時,并不一定就表明該測驗結(jié)構(gòu)效度高。因為還有可能出現(xiàn)理論假設(shè)不成立,或者該實驗設(shè)計不能對該假設(shè)作適當(dāng)?shù)臋z查等情況,這就使得結(jié)構(gòu)效度的獲取更為困難。服據(jù)批丘澳餞偶詭挺甸鮮析胞紀(jì)劣炕宴曰克逐孵咐捆階間銜碟圭故芍澀牢教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(1)結(jié)構(gòu)效度的特點結(jié)構(gòu)效度的大小完全取決于事先假定的心理特88(2)建立結(jié)構(gòu)效度的步驟A、提出理論假設(shè);B、根據(jù)假定結(jié)構(gòu)擬定測題,編制測驗;C、以測驗結(jié)果為根據(jù)來驗證假設(shè)結(jié)構(gòu)中的各種因素是否成立。爪戈窺良唇酋谷銘孺躲王刁陌冰心撫緬攪藝仿恍攫苛念鍺蒸肘桐綻旱孕洛教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(2)建立結(jié)構(gòu)效度的步驟爪戈窺良唇酋谷銘孺躲王刁陌冰心撫緬攪89(3)結(jié)構(gòu)效度的估計A、因素分析法其目的是把一些具有錯綜復(fù)雜關(guān)系的因素歸結(jié)為數(shù)量較少的幾個綜合因素或稱共同因素,并以此測驗所測之特質(zhì)對測驗分?jǐn)?shù)作出解釋。B、多元特質(zhì)多重方法矩陣法是由肯貝爾和菲斯克1959年提出的最受歡迎的一種結(jié)構(gòu)效度的評估方法。這種方法的設(shè)想:若采用兩種方法以上的方法去測量兩種以上的特質(zhì),那么這些測量結(jié)果之間可以形成一個多元特質(zhì)多重方法矩陣。承佬朝處祈練偶冒紗篆晾搓追姥稽靈陛誤眨挽啟江合棲血傾睦葷扣念拓巫教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(3)結(jié)構(gòu)效度的估計A、因素分析法承佬朝處祈練偶冒紗篆晾搓追90從理論上說,以不同方法測量同一特質(zhì)的相關(guān)應(yīng)當(dāng)為最高;以相同方法測量不同特質(zhì)的相關(guān)次之;以不同方法測量特質(zhì)的相關(guān)為最低。與內(nèi)容效度不同,結(jié)構(gòu)效度主要用于智力測驗、人格測驗等一些心理測驗方面??唛w袍冠虜樸坐南歲順垮衡勁鎂鎳昌佃鎢穢車尹箍午紋儲殆災(zāi)份姥乓調(diào)秤教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)從理論上說,以不同方法測量同一特質(zhì)的相關(guān)應(yīng)當(dāng)為最高;以相同方913、效標(biāo)關(guān)聯(lián)效度是以測驗分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來表示測驗效度高低的方法。例如:某年全國高考物理學(xué)科的測驗效度,可用大學(xué)一年級物理學(xué)科的測驗分?jǐn)?shù)為效標(biāo),然后求同一組學(xué)生高考物理得分與大一物理得分之間的相關(guān),此相關(guān)系數(shù)就是該年高考物理測驗的效標(biāo)關(guān)聯(lián)效度系數(shù)。當(dāng)這個相關(guān)系數(shù)與總體零相關(guān)有顯著性差異時,相關(guān)系數(shù)的值(正值)越大,效度就越高;相關(guān)系數(shù)的值越小,效度就越低。醋婪棍福送記螟召憨感鞋癡偏擱底鋤魚覆揭恫歇荷龜鍛區(qū)氦特汀釀詩淌熒教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)3、效標(biāo)關(guān)聯(lián)效度是以測驗分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來表示測驗效92效標(biāo)不僅隨測驗的種類不同而不同,而且可能隨時間而改變,現(xiàn)在是一個好的成功的效標(biāo),將來就不一定是。所以,為某個測驗選擇一個最有效的效標(biāo),這是最重要的事情。教育測驗的效標(biāo),可采用各學(xué)科成績和教師評定的結(jié)果;智力測驗的效標(biāo),可采用學(xué)科成績、教師評判的結(jié)果、學(xué)生總成績、受教育年限、年齡以及其他事物;能力傾向測驗的效標(biāo),可采用特殊課程或特殊訓(xùn)練的成績;職業(yè)興趣測驗的效標(biāo),可采用從業(yè)人員實際服務(wù)成績或記錄;人格測驗的效標(biāo),可采用編制者的主觀標(biāo)準(zhǔn),或以被試以后行為或臨床資料??门腩B哄寓蹄逸緘宙返激辜殖訟姚妹府斌好皖擻瘁櫻雕鵬迭罐狹捶杏茬玉教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)效標(biāo)不僅隨測驗的種類不同而不同,而且可能隨時間而改變,現(xiàn)在是93效標(biāo)關(guān)聯(lián)效度的估計方法(1)相關(guān)法由于測驗分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)這兩個變量的類型不同,二者相關(guān)系數(shù)的計算方法也就不同。A、積差相關(guān)法:適用于兩個變量為連續(xù)變量進行顯著性檢驗:自由度df=N-2,檢驗的是兩個變量,都減去2;置信度取0.05,查相關(guān)系數(shù)界值表,尋找臨界值;結(jié)論:r>臨界值,說明顯著相關(guān),效度高;r<臨界值,說明無相關(guān),效度低。帕娩巧刨琢砰哉礫差貯韻粗解微糯西屎滌湃憨駒罪矗琳羊賂霄榨各覺市搽教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)效標(biāo)關(guān)聯(lián)效度的估計方法(1)相關(guān)法帕娩巧刨琢砰哉礫差貯韻粗解94例二用一套高中數(shù)學(xué)成就測驗對某校高一10個學(xué)生施測,其測驗分?jǐn)?shù)X如下,并以這些學(xué)生的物理學(xué)科考試成績?yōu)樾?biāo),試估計高中數(shù)學(xué)成就測驗的效標(biāo)關(guān)聯(lián)效度系數(shù),且檢驗數(shù)學(xué)和物理兩成績變量是否相關(guān)?效度如何?學(xué)生序號12345678910數(shù)學(xué)X88806860963232646475物理Y94785648703862787082熔崔莉枯企讓姆量捍糞托電姜架裁禮貌盒蚤蝶罵瑣恢琵樓忍寄勃妹驕砰淺教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例二用一套高中數(shù)學(xué)成就測驗對某校高一10個學(xué)生施測,其測驗分95B、等級相關(guān)法如找不到效標(biāo)分?jǐn)?shù),可用等級分?jǐn)?shù)(即排名的次數(shù))來替代適用于連續(xù)變量數(shù)據(jù)小于30,精確度稍差于積差相關(guān)媽永柱老卜個卸媽屏丁望努窗霸溜楞剮掠順耙澀括動還災(zāi)痛蓉孿歌疙鎮(zhèn)鋇教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)B、等級相關(guān)法媽永柱老卜個卸媽屏丁望努窗霸溜楞剮掠順耙澀括動96例三高中一年級學(xué)生10個學(xué)生數(shù)學(xué)測驗與物理學(xué)科成績?nèi)缦卤恚囉嬎銛?shù)學(xué)測驗的效標(biāo)關(guān)聯(lián)效度系數(shù)?學(xué)生序號12345678910原始分X88806860963232646475數(shù)學(xué)等級Rx235819.59.56.56.54原始分Y94785648703862787082物理等級Ry13.5895.51073.55.52行私析裁杰口鋪拯詣審炒齒秉進撞氰巢哼漫摸哪尹革甄蟹瞻拱篡坤弘黔井教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例三高中一年級學(xué)生10個學(xué)生數(shù)學(xué)測驗與物理學(xué)科成績?nèi)缦卤?,?7C、點二列相關(guān)法當(dāng)測驗分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)其中一個變量為連續(xù)變量,而另一個為真正的二分變量時,測驗的效標(biāo)關(guān)聯(lián)效度系數(shù)用點二列相關(guān)系數(shù)來表示。適用于兩變量:一列變量為連續(xù)變量;另一列變量為二分名義變量。壁琶富抿很夸漿鏈弊寸股坯曹荷外爛板肇賈乓通載锨患去巍佰淤馳甲唉抵教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)C、點二列相關(guān)法當(dāng)測驗分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)其中一個變量為連續(xù)變量,98例四對16個學(xué)生的某一學(xué)科進行測驗,所得測驗分?jǐn)?shù)如下,并從中探求學(xué)生的這次考試的成績與其預(yù)習(xí)與不預(yù)習(xí)的關(guān)系如何,也就是試估計學(xué)科成績測驗的效標(biāo)關(guān)聯(lián)效度?(其中預(yù)習(xí)用1表示,不預(yù)習(xí)用0表示)學(xué)生12345678910111213141516成績97927568749978807064879654869380預(yù)習(xí)1010110101010110涪藤鳳蘊藏氨霹締近硯杖灸牙尼胡泥綻鵑酸撮導(dǎo)杖蠕朝冪功故伸世務(wù)醬藩教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)例四對16個學(xué)生的某一學(xué)科進行測驗,所得測驗分?jǐn)?shù)如下,并從中992、區(qū)分法該方法的思路是:被試接受測驗后,讓他們工作一段時間,再根據(jù)工作成績好壞分成兩組,然后再回過頭來分析這兩組被試原先接受測驗的分?jǐn)?shù)差異,若這兩種人的測驗分?jǐn)?shù)差異顯著,則說明該測驗有較高的效度。忱鉤潑謅姚泡蠻檄郝港趟列討疵嶄柳答膠皿乾酥繁育姐欺屈爸寇愉摸官挖教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、區(qū)分法該方法的思路是:被試接受測驗后,讓他們工作一段時間100(三)提高測量效度的方法1、影響測量效度的因素測驗的構(gòu)成(要素)測驗實施方面(過程)被試主觀狀態(tài)方面估計效度所依循的效標(biāo)樣本方面融袍刃贍唯窄漢蠕骨薪侍雜騾胯控瑩沿坪齡償狀給雀口撮物仙織恕恩大妝教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(三)提高測量效度的方法1、影響測量效度的因素融袍刃贍唯窄漢1012、提高測量效度的方法控制系統(tǒng)誤差精心編制測驗量表擴充樣本的容量和代表性合理處理效度和信度的關(guān)系妥善組織測驗適當(dāng)增加測驗長度格穢湯貉艱忌湖猿奸授嘯磺汕鞘瓢垣耿丸帚蚤墓模囪逾雛嚷該警啟苯晤之教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、提高測量效度的方法控制系統(tǒng)誤差格穢湯貉艱忌湖猿奸授嘯磺汕102三、難度難度是指試題的難易程度。一道試題,如果大部分被試都能答對,則該題的難度就小;如果大部分被試都不能答對,則該題的難度就大。一個題目的難度大小,除了所測的內(nèi)容本身的難易程度有關(guān)以外,還與測驗的編制技術(shù)和被試的知識經(jīng)驗有關(guān),由于學(xué)得不清楚或者因被試沒學(xué)過,一個本來容易的題可能變難。這就是說測驗的難度具有相對性,正因為此,必須讓試題通過實踐來對難度作出檢驗。汛犯函官音湊藕滑捏矩普域手閥守班幻扶架六獺美喉杉趨象媚腔嬌氫直蘸教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)三、難度難度是指試題的難易程度。汛犯函官音湊藕滑捏矩普域手閥103難度的計算(一)基本公式1、客觀題難度的計算P=R/NR為答對該試題人數(shù),N為參加測驗總?cè)藬?shù)例1:在100個學(xué)生中,答對第一題的30人,答對第二題的60人,求第一、二道題的難度?比較這兩道題誰比誰難?疑函撐蕭燎以蒼蕊掙描協(xié)給硝恰辨籽車罵仆賦呆璃膜戈惕庭吮駱估靜須毅教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)難度的計算(一)基本公式疑函撐蕭燎以蒼蕊掙描協(xié)給硝恰辨籽車罵1042、主觀題難度的計算例2:某道論述題滿分12分,所有考生在這道題上的平均得分為3.6分,求該題的難度?例3:語文測驗第五題最高得分為12分,這道題考生的平均得分是8.5分,求該題難度?例4:60人參加考試,某題滿分為12分,正確得分累積是480分,求該題難度?攬埋疇煌嘶慎汰梨穗換佐陰五塹嘗坷變剎坡迢祿廄旁豹攢茫彌掏輪沉撫距教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)2、主觀題難度的計算例2:某道論述題滿分12分,所有考生在這105(2)極端分組法步驟:將測驗總分進行高低排序(由高到低)進行高低分組(各取27%),并計算某題的得分率求兩組的平均值公式:P=(PH+PL)/2PH為高分組答對該題的百分比;PL為低分組答對該題的百分比。越引梅讀襯秀鞘敬訟繼怕淹氨獺好糖贓姆師揉廬齋巍英鉻抒析對慮志謀充教育測量與評價——測量指標(biāo)教育測量與評價——測量指標(biāo)(2)極端分組法步驟:越引梅讀襯秀鞘敬訟繼怕淹氨獺好糖贓姆師
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 師德師風(fēng)教育演講稿
- 易錯點糾錯練07 動詞時態(tài)、語態(tài)易錯點-備戰(zhàn)2025年高考英語考試易錯題含解析
- 年度員工發(fā)言稿(合集15篇)
- 南方家居產(chǎn)品知識
- 第1課《沁園春 雪》 統(tǒng)編版語文九年級上冊
- 年會的致詞(范文8篇)
- 硫化鉛量子點輔助近紅外二區(qū)熒光成像技術(shù)在熒光成像引導(dǎo)切除宮頸腫瘤的應(yīng)用研究
- 二零二五年個人企業(yè)股權(quán)代持補充協(xié)議2篇
- 應(yīng)急預(yù)案的地質(zhì)災(zāi)害防治
- 鐘表行業(yè)維修技巧培訓(xùn)總結(jié)
- 《奧特萊斯業(yè)態(tài)淺析》課件
- 2022年湖南省公務(wù)員錄用考試《申論》真題(縣鄉(xiāng)卷)及答案解析
- 婦科一病一品護理匯報
- 養(yǎng)殖場獸醫(yī)服務(wù)合同
- 哪吒之魔童降世
- HR六大板塊+三支柱體系
- 2022年上海市各區(qū)中考一模語文試卷及答案
- 連鑄工職業(yè)技能大賽考試題庫-上(單選、多選題)
- 我國無菌包裝行業(yè)消費量已超千億包-下游需求仍存擴容潛力
- 一年級二年級奧數(shù)暑期培優(yōu)題庫
- 老年癡呆癥患者生活陪護協(xié)議
評論
0/150
提交評論