版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、教育科學(xué)研究方法揚(yáng)州大學(xué)教育科學(xué)學(xué)院郭兆明guozhaom教育科學(xué)研究方法教育研究的過程(第三編)教育研究方法的類型(第二編)教育研究的過程(第三編)課題的選擇(第八章)研究方案的設(shè)計(jì)(第九章)資料的整理與成果的表述(第十章)第八章 研究課題的選擇發(fā)現(xiàn)研究問題檢索相關(guān)文獻(xiàn)確立研究課題發(fā)現(xiàn)研究問題實(shí)際需要前人的研究實(shí)際需要(討論)數(shù)學(xué)(閱讀)學(xué)習(xí)不良學(xué)生的認(rèn)知特點(diǎn)及其干預(yù)研究盧仲衡的自學(xué)輔導(dǎo)實(shí)驗(yàn)法顧冷沅青浦?jǐn)?shù)學(xué)教學(xué)改革布盧姆的教學(xué)評價(jià)的新突破80年代以來師范生素質(zhì)的發(fā)展趨勢研究高職院校學(xué)生職業(yè)性向測試分析研究前人的研究“一步評價(jià)”技術(shù)研究樣例學(xué)習(xí)的研究(1)單個(gè)樣例的研究(子目標(biāo),無具體目標(biāo))(
2、2)多個(gè)樣例的研究(樣例個(gè)數(shù)、樣例呈現(xiàn)方式)(3)樣例學(xué)習(xí)與問題解決的比較檢索相關(guān)文獻(xiàn)文獻(xiàn)檢索在教育科研中的作用教育文獻(xiàn)的種類及主要分布文獻(xiàn)檢索的過程和主要方法文獻(xiàn)檢索在教育科研中的作用避免重復(fù)勞動(dòng),提高科學(xué)研究的效益做好文獻(xiàn)綜述教育文獻(xiàn)的種類及主要分布書籍報(bào)刊網(wǎng)絡(luò)媒體(中國知網(wǎng),CNKI)文獻(xiàn)檢索的過程和方法過程(主題、關(guān)鍵詞、作者、來源)方法(按時(shí)間查、按照引文查)確立研究課題確立研究課題的思維策略論證研究課題的主要問題確立研究課題的思維策略分析課題的研究價(jià)值(結(jié)合項(xiàng)目申報(bào))(1)理論價(jià)值(2)實(shí)踐價(jià)值考察研究人員的主觀條件考慮研究的客觀條件 在選擇課題時(shí),要盡量避免:(1)范圍太大,無從
3、下手;(2)在現(xiàn)有條件下,難度較大,資料缺乏;(3)屬于經(jīng)驗(yàn)感想之談,而不是科研題目。論證研究課題的主要問題研究問題的性質(zhì)(理論研究、應(yīng)用研究)研究的目的和意義(研究價(jià)值)國內(nèi)外相關(guān)研究現(xiàn)狀、可能有所突破之處。研究的可能性、基本條件研究的步驟及成果形式第九章 教育研究方案的設(shè)計(jì)制定研究方案的主要注意事項(xiàng):(1)陳述研究課題(2)論述研究的目的和意義(3)闡述研究假設(shè)和依據(jù)(4)闡述研究內(nèi)容(5)確定研究對象(6)選擇抽樣方法(7)選擇研究方法和工具(8)制定行動(dòng)計(jì)劃第十章 教育研究的資料整理與成果表述研究成果的的基本格式(1)題目(20字以內(nèi))(2)摘要和關(guān)鍵詞(3)主體【引言、方法、結(jié)果、討
4、論(定量研究)】(4)參考文獻(xiàn)第二編 教育研究方法的類型教育研究的實(shí)證方法(第四章)1、問卷調(diào)查法2、教育測量法3、教育實(shí)驗(yàn)法4、內(nèi)容分析法教育研究的質(zhì)性方法(第五章)1、訪談?wù){(diào)查法2、敘事研究法第四章 教育研究的實(shí)證方法問卷調(diào)查法教育測量法教育實(shí)驗(yàn)法內(nèi)容分析法問卷調(diào)查法界定特點(diǎn)步驟案例研究【問卷舉例(SCL90,職業(yè)興趣、16PF,開發(fā)者問卷)】界定是研究者用嚴(yán)格設(shè)計(jì)的問卷,通過書面語言與被調(diào)查者進(jìn)行交流,來收集研究對象關(guān)于教育問題或教育現(xiàn)象的信息和資料的方法。特點(diǎn)調(diào)查工具標(biāo)準(zhǔn)化調(diào)查過程標(biāo)準(zhǔn)化調(diào)查結(jié)果標(biāo)準(zhǔn)化研究效率高步驟設(shè)計(jì)前的探索設(shè)計(jì)問卷的結(jié)構(gòu)設(shè)計(jì)問卷初稿試用和修改問卷發(fā)放和回收問卷(回收
5、率應(yīng)不低于70)分析調(diào)查結(jié)果設(shè)計(jì)問卷初稿選擇調(diào)查類型選擇問題形式斟酌問題表述設(shè)計(jì)規(guī)范答案關(guān)注問題數(shù)量(時(shí)間控制)合理排列問題選擇調(diào)查類型就調(diào)查內(nèi)容而言,選擇綜合調(diào)查或?qū)n}調(diào)查。就調(diào)查目的而言,選擇常模調(diào)查或比較調(diào)查就調(diào)查范圍而言,選擇普遍調(diào)查或抽樣調(diào)查選擇問題形式填空式是否式多項(xiàng)單選式多項(xiàng)限選式表格式(答題紙)或量表式(P83)排序式(P83)案例研究中小學(xué)生家庭作業(yè)心理現(xiàn)狀的調(diào)查分析上海市中小學(xué)生家庭教育現(xiàn)狀的調(diào)查分析五年制師范生心理健康狀況SCL90的調(diào)查分析小學(xué)數(shù)學(xué)作業(yè)批改的現(xiàn)狀的調(diào)查分析中小學(xué)生閑暇生活狀況的調(diào)查分析物理教師課堂教學(xué)行為的調(diào)查分析教育測量法界定特點(diǎn)步驟個(gè)案研究界定教育測
6、量法:根據(jù)某種規(guī)則,以數(shù)量化的形式描述教育現(xiàn)象的某種屬性。特點(diǎn)以測驗(yàn)為工具對研究對象進(jìn)行測試,從而獲得數(shù)量化的結(jié)果,并通過進(jìn)一步分析獲得相關(guān)結(jié)論。例如,了解學(xué)生的知識和能力發(fā)展情況。編制測驗(yàn)的步驟確定測驗(yàn)?zāi)康拇_定測驗(yàn)內(nèi)容確定測驗(yàn)形式篩選題目(難度、區(qū)分度)標(biāo)準(zhǔn)化過程鑒定測驗(yàn)(信度、效度)編寫測驗(yàn)指導(dǎo)書項(xiàng)目分析 第一單元 項(xiàng)目難度 第二單元 項(xiàng)目區(qū)分度 第一單元 項(xiàng)目難度 項(xiàng)目難度的定義 項(xiàng)目難度的計(jì)算方法 難度水平的確定 項(xiàng)目難度的定義 項(xiàng)目難度(difficulty)是指題目的難度?!咀ⅰ浚?)在非能力測驗(yàn)(如人格測驗(yàn))中,類似的指標(biāo)是“通俗性”,即取自相同總體的樣本中,能在答案方向上回答該
7、題的人數(shù),其計(jì)算方法與難度相同。(2)難度的指標(biāo)通常以通過率表示,以答對(通過)該題的人數(shù)百分比來表示: P(R/N)100,P表示項(xiàng)目難度,N表示全體被試數(shù),R為答對(通過)該項(xiàng)目的人數(shù)。從公式可以發(fā)現(xiàn):難度越大,P值越小。 計(jì)算方法 二分法計(jì)分項(xiàng)目 非二分記分的項(xiàng)目 二分法計(jì)分項(xiàng)目 心理測驗(yàn)的項(xiàng)目大多為選擇題,通過計(jì)1分,錯(cuò)誤計(jì)0分。1、當(dāng)被試較少時(shí),對這類題目可以直接使用公式P(R/N)100計(jì)算難度。2、當(dāng)被試較多時(shí),則可根據(jù)測驗(yàn)總成績將被試分成三組:分?jǐn)?shù)最高的27被試分為高分組,分?jǐn)?shù)最低27被試為低分組,中間46的被試為中間組。分別計(jì)算高分組和低分組的通過率,以兩組通過率的平均值作為
8、每一題的難度。其公式為: P(PHPL)/2 式中P表示難度,PH和PL分別代表高分組和低分組通過率。非二分記分的項(xiàng)目 當(dāng)測驗(yàn)項(xiàng)目為問答題或不能用二分法記分的形式時(shí),一般用下面的公式計(jì)算難度。 難度水平的確定 項(xiàng)目難度 測驗(yàn)的難度 項(xiàng)目難度 進(jìn)行難度分析的主要目的是為了篩選項(xiàng)目,項(xiàng)目的難度多高合適,取決于測驗(yàn)的目的、性質(zhì)以及項(xiàng)目的形式。 測驗(yàn)?zāi)康?準(zhǔn)確測量個(gè)體的差異。 在選擇題目時(shí),最好使試題的平均難度接近0.50,而各題難度在0.500.20之間。注:(1)若P0或1時(shí); (2)P0.5時(shí),舉一個(gè)極端的例子,假如某測驗(yàn)各試題間的相關(guān)系數(shù)均為1,難度均為0.50,那么就有可能使50的被試答對所
9、有的題目得滿分;另外50的被試無法通過任何試題得0分) 測驗(yàn)的性質(zhì) 當(dāng)測驗(yàn)用于選拔或診斷時(shí),應(yīng)該比較多地選擇難度值接近錄取率的項(xiàng)目。(1)若測驗(yàn)是要選拔少數(shù)最優(yōu)秀的被試,測驗(yàn)就應(yīng)該有相當(dāng)高的難度,P值就應(yīng)該小。例如,如果錄取率為20,那么題目難度最好確定為20,使得恰好20的優(yōu)秀被試通過;(2)假如測驗(yàn)是要診斷出少數(shù)較差的被試,則測驗(yàn)難度應(yīng)該小,P值應(yīng)該高,使得只有少數(shù)被試不能通過。 測驗(yàn)的形式 對于選擇題來說,P值一般應(yīng)該大于概率水平。例如,對于是非題,其難度值應(yīng)該為0.75最為合適;而對于四選一的題目,其難度值約為0.63時(shí)最為適宜。 測驗(yàn)的難度 通過考察測驗(yàn)分?jǐn)?shù)的頻數(shù)分布,可以對測驗(yàn)的難
10、度作出直觀檢驗(yàn)(常態(tài)分布,偏態(tài)分布:正偏態(tài)分布、負(fù)偏態(tài)分布)。(1)如果被試的取樣具有代表性,對于中等難度的測驗(yàn),其測驗(yàn)總分應(yīng)該接近常態(tài)分布。如果得分多數(shù)偏高或偏低,則分別為“負(fù)偏態(tài)分布”和“正偏態(tài)分布”。(2)正偏態(tài)分布,即大多數(shù)得分集中在低端,說明編制的測驗(yàn)對于所要研究的樣本團(tuán)體來說偏難,因此,必須增加足夠數(shù)量的較容易的項(xiàng)目;(3)負(fù)偏態(tài)分布,即大多數(shù)得分集中在高分端,說明測驗(yàn)過容易,必須增加足夠數(shù)量的有高難度的項(xiàng)目。 第二單元 項(xiàng)目區(qū)分度 項(xiàng)目區(qū)分度的定義 項(xiàng)目區(qū)分度的計(jì)算方法 區(qū)分度與難度的關(guān)系 項(xiàng)目區(qū)分度的定義 項(xiàng)目區(qū)分度(item discrimination),也叫鑒別力,是指測
11、驗(yàn)項(xiàng)目對被試的心理特性的區(qū)分能力。 項(xiàng)目區(qū)分度的計(jì)算方法 鑒別指數(shù) 相關(guān)法 鑒別指數(shù) 1按測驗(yàn)總分高低排列答卷;2確定高分組與低分組,每一組取答卷總數(shù)的27;3分別計(jì)算高分組與低分組在該項(xiàng)目上的通過率或得分率。4按下列公式估計(jì)出項(xiàng)目的鑒別指數(shù):DPHPL,式中D為鑒別指數(shù),PH為高分組在該項(xiàng)目上的通過率或得分率,PL為低分組在該項(xiàng)目上的通過率或得分率?!咀ⅰ扛叻纸M若在該測驗(yàn)上的得分率高于低分組,則D0,D越大,說明該項(xiàng)目區(qū)分兩種不同水平的程度越高。若D0,則反映高水平組在該項(xiàng)目上的得分率反而低于低水平組,說明有問題。 1965年,美國測驗(yàn)專家(L.Ebel)根據(jù)長期的經(jīng)驗(yàn)提出用鑒別指數(shù)評價(jià)項(xiàng)目
12、性能的標(biāo)準(zhǔn),鑒別指數(shù)D項(xiàng)目評價(jià)040以上0300.390.20-0.290.19以下很好良好,修改會(huì)更佳尚可,但需修改差,必須淘汰相關(guān)法 計(jì)算區(qū)分度最常用的方法是相關(guān)法,即以某一項(xiàng)目分?jǐn)?shù)與效標(biāo)成績或測驗(yàn)總分的相關(guān)作為該項(xiàng)目區(qū)分度的指標(biāo)。相關(guān)越高,表明項(xiàng)目越具有區(qū)分的功能。區(qū)分度與難度的關(guān)系 難度和區(qū)分度是相對的,是針對一定團(tuán)體而言的,絕對的難度和區(qū)分度是不存在的。一般來說,較難的項(xiàng)目對高水平的被試區(qū)分度高,較易的項(xiàng)目對水平低的被試區(qū)分度高,中等難度的項(xiàng)目對中等水平的被試區(qū)分度高。由于人的大多數(shù)心理特性呈常態(tài)分布,所以項(xiàng)目難度的分布也以常態(tài)分布好,即特別難與特別易的項(xiàng)目少一些,接近中等的項(xiàng)目多一
13、些,而所有項(xiàng)目的平均難度為0.50,這樣不僅能夠保證多數(shù)項(xiàng)目具有較高的區(qū)分度,而且可以保證整個(gè)測驗(yàn)對被試具有較高的區(qū)分能力。 測驗(yàn)的信度 信度的概念 信度評估的方法 信度的概念 信度的定義 信度(reliability)指的是測量結(jié)果的穩(wěn)定性程度。注: (1)若能用統(tǒng)一測量工具反復(fù)測量某人的同一心理特質(zhì),則其多次測量的結(jié)果間的一致性程度就叫信度。有時(shí)也叫測量的可靠性。 (2)例如:比較鋼尺與具有彈性的皮尺測量長度的信度。第二單元 信度評估的方法 (1)重測信度(2)復(fù)本信度 (3)內(nèi)部一致性系數(shù)(4)評分者信度 重測信度 含義和計(jì)算 使用的前提條件 優(yōu)點(diǎn)、缺點(diǎn) 注意點(diǎn) 使用重測信度的量表舉例
14、定義和計(jì)算 重測信度(1)含義:是指同一量表對同一組被試兩次所得結(jié)果的一致性程度。(2)計(jì)算:大小等于同一組被試在兩次測驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。注:(1)此測驗(yàn)主要測量測驗(yàn)跨時(shí)間的穩(wěn)定性,所以,又稱穩(wěn)定性系數(shù)。 (2)當(dāng)信度較大時(shí),說明前后兩次測量的結(jié)果比較一致,測量工具比較穩(wěn)定,被試的心理特質(zhì)受被試狀態(tài)和環(huán)境變化的影響較小。 使用的前提條件 (1)所測量的心理特性必須是穩(wěn)定的。例如,成人的人格測驗(yàn)就可以;但兒童的成就測驗(yàn)就不行(例如,剛?cè)雽W(xué)兒童的識字量)。(2)遺忘和練習(xí)的效果基本上互相抵消。智力測驗(yàn)的間隔時(shí)間一般在6個(gè)月左右。(3)在兩次施測的間隔時(shí)期內(nèi),被試的心理特質(zhì)方面沒有獲
15、得更多的學(xué)習(xí)和訓(xùn)練。 優(yōu)、缺點(diǎn) 優(yōu)點(diǎn):能夠提供測驗(yàn)是否隨時(shí)間而變異的資料,可作為被試將來行為表現(xiàn)的依據(jù)。缺點(diǎn):易受練習(xí)和記憶的影響。(1)如果兩次施測間隔的時(shí)間太短,則記憶猶新,練習(xí)的影響較大;(2)如果間隔的時(shí)間太長,則身心發(fā)展與學(xué)習(xí)經(jīng)驗(yàn)的積累等足以改變分?jǐn)?shù)的意義,而使得相關(guān)減低。最適宜的時(shí)距隨測驗(yàn)的目的、性質(zhì)和被試特點(diǎn)而異,一般是兩周到四周為宜,時(shí)間間隔最好不超過六個(gè)月。 注意點(diǎn): 同一量表,隨著第二次測量的時(shí)間不同,它可以有不同的重測信度。因此,在報(bào)告重測信度時(shí),應(yīng)說明兩次施測的間隔,以及在此期間被試的有關(guān)經(jīng)歷。例如,韋氏兒童智力量表手冊中國修訂版(CWISC)中,就報(bào)告了兩次測驗(yàn)的時(shí)間
16、間隔(27周)以及兩次的相關(guān)系數(shù)(城市:0.59-0.86,農(nóng)村:0.59-0.81)。 使用重測信度的量表舉例 MMPI:臨床量表在相隔兩周重測,其值在0.580.92之間。CPI:加州心理調(diào)查表的重測信度各量表分別為0.380.77,平均0.66.SB4(斯坦福比奈量表第四版)瑞文:三個(gè)版本的一些重測信度研究結(jié)果不一,正常成人為0.800.93。 復(fù)本信度 含義與計(jì)算 使用的前提條件 優(yōu)、缺點(diǎn) 注意點(diǎn) 使用復(fù)本信度的量表舉例 含義與計(jì)算 復(fù)本信度(1)含義:指兩個(gè)平行的測驗(yàn)測量同一組被試所得結(jié)果的一致性程度。(2)計(jì)算:大小等于同一組被試在兩個(gè)復(fù)本測驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。它是研
17、究測驗(yàn)跨形式的一致性(等值性)。復(fù)本信度的分類:(1)等值性系數(shù)(同時(shí));(2)穩(wěn)定性與等值性系數(shù)(不同時(shí))。 等值性系數(shù)定義:如果兩個(gè)復(fù)本測驗(yàn)是同時(shí)連續(xù)施測的,則這種復(fù)本信度稱為等值性系數(shù)。大?。悍从硟蓚€(gè)復(fù)本測驗(yàn)的題目差別所帶來的變異情況。穩(wěn)定性與等值性系數(shù)定義:如果兩個(gè)復(fù)本測驗(yàn)是相距一段時(shí)間分兩次施測的,則這種復(fù)本信度稱為穩(wěn)定性與等值性系數(shù)。它既考慮了測驗(yàn)在時(shí)間上的穩(wěn)定性,也考慮了不同題目樣本反應(yīng)的一致性。大?。号c其它信度系數(shù)相比,此種復(fù)本信度最小,也就是說,穩(wěn)定性與等值性系數(shù)是對信度的最嚴(yán)格的檢驗(yàn),其值最低。使用的前提條件 條件1:構(gòu)造出兩份或兩份以上真正平行的測驗(yàn)。注:復(fù)本測驗(yàn)必須在題
18、目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語、時(shí)限以及所用的例題、公式和測驗(yàn)等其它方面都相同或相似。條件2:被試有條件接受兩個(gè)測驗(yàn)。例如,時(shí)間、經(jīng)費(fèi)等。 優(yōu)、缺點(diǎn)優(yōu)點(diǎn):能夠避免重測信度的一些問題,如記憶、學(xué)習(xí)等。 缺點(diǎn):(1)如果測量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能完全消除這種影響;由于第二個(gè)測驗(yàn)只改變了題目的內(nèi)容,已經(jīng)掌握的解題原則,可以很容易地遷移到同類問題。(2)對許多測驗(yàn)來說,建立復(fù)本是非常困難的。 注意點(diǎn) :第二次測驗(yàn)仍會(huì)受到練習(xí)和記憶等因素的影響、一些解題的策略等技能也會(huì)產(chǎn)生也會(huì)產(chǎn)生遷移。對于穩(wěn)定性與等值性系數(shù),在報(bào)告結(jié)果時(shí),也需要報(bào)告兩次施測的間隔,以及在此間隔內(nèi)被試的
19、有關(guān)經(jīng)歷。 使用復(fù)本信度的量表舉例 成就測驗(yàn)的A、B卷。 內(nèi)部一致性系數(shù)內(nèi)部一致性系數(shù)主要反映的是題目之間的關(guān)系,表示測驗(yàn)?zāi)軌驕y量相同內(nèi)容或特質(zhì)的程度。 (1)分半信度 (2)同質(zhì)性信度 分半信度 含義 計(jì)算 使用的前提條件及范圍 使用分半信度的量表舉例 含義 分半信度是指將兩個(gè)測驗(yàn)分成對等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。這種方法估計(jì)信度系數(shù)只需一種測驗(yàn)形式,實(shí)施一次測驗(yàn)。通常是在測驗(yàn)實(shí)施后將測驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計(jì)算每位被試在兩半測驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。這個(gè)相關(guān)系數(shù)就代表了兩個(gè)半測驗(yàn)內(nèi)容取樣的一致性程度,因而屬于內(nèi)部一致性系數(shù)。 計(jì)算 先求半測
20、驗(yàn)的信度(皮爾遜積差相關(guān)系數(shù)) (1)如果兩半測驗(yàn)的變異數(shù)相等,則使用斯皮爾曼布朗公式:式中rhh表示一半分?jǐn)?shù)的相關(guān)系數(shù),rxx為測驗(yàn)原長度的信度估計(jì)值。 (2)如果兩半測驗(yàn)的變異數(shù)不相等,則使用弗朗拉根(Flanagan)公式或盧侖公式使用的前提條件及范圍: (1)分半信度通常在只能施測一次或沒有復(fù)本的情況下使用。(2)將一個(gè)測驗(yàn)分成兩半的方法很多,所以,同一測驗(yàn)通常會(huì)有多個(gè)分半信度。分半的方法有:按題號的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等。 使用分半信度的量表舉例 (1)CPI的分半相關(guān)系數(shù)為0.63-0.86,平均為0.78.(2)瑞文彩色本的分半信度在0.65-0.94,
21、年輕受試者較低。標(biāo)準(zhǔn)本的分半相關(guān)信度為0.86,也是年輕者較低。(3)韋克斯勒三套智力量表(WAPPSIR,WISC3,WAISR)言語量表:分半信度在0.86-0.97操作量表:分半信度在0.85-0.94全量表:分半信度在0.90-0.98(4)SB4:內(nèi)在一致性系數(shù)均在0.9-0.99之間。 同質(zhì)性信度 含義 計(jì)算 使用同質(zhì)性信度的量表舉例 含義 同質(zhì)性信度是指測驗(yàn)內(nèi)部所有題目間的一致性程度。題目間的一致性:(1)所有題目都測的是同一種心理特質(zhì);(2)所有題目得分之間具有較高的正相關(guān)。當(dāng)一個(gè)測驗(yàn)具有較高的同質(zhì)性信度時(shí),說明測驗(yàn)主要測的是某一單一心理特質(zhì),實(shí)測結(jié)果是該特質(zhì)水平的反映。如果一
22、個(gè)測驗(yàn)的同質(zhì)性信度不高,則說明測驗(yàn)結(jié)果可能是幾種心理特質(zhì)的綜合反映(應(yīng)采用分測驗(yàn))。 計(jì)算同質(zhì)性信度KR20KR21克倫巴赫系數(shù)(1)KR20公式 庫德和理查德遜于1937年提出,僅適用于0、1記分測驗(yàn)。(2)KR21 庫德和理查德遜于1937年提出,僅適用于0、1記分測驗(yàn)。此公式只有當(dāng)所有題目的難度接近時(shí)才可使用。不需逐題計(jì)算通過率。 (3)克龍巴赫系數(shù) 此公式是由克龍巴赫(Cronbach)提出的,它不要求測驗(yàn)題目僅是0、1記分,可以處理任何測驗(yàn)的內(nèi)部一致性系數(shù)的計(jì)算問題。 例 題某態(tài)度量表共7題,100個(gè)被試在各題上得分的方差分別是0.81,0.82,0.79,0.83,0.85,0.7
23、6,0.77,測驗(yàn)總分的方差是14.00,此時(shí)測量的值為? 使用同質(zhì)性信度的量表舉例 (1)諾森伯格(Rosenberg,1985)自尊量表:克龍巴赫系數(shù)為0.77-0.88。(2)SB4的KR20,各測驗(yàn)各年齡中數(shù)平均值為0.73-0.98 評分者信度 含義 計(jì)算 含義 評分者信度是指多個(gè)評分者給同一組人的答卷進(jìn)行評分的一致性程度。用于測量不同評分者產(chǎn)生的誤差。一般要求在成對的受過訓(xùn)練的評分者之間平均一致性達(dá)0.90以上,才認(rèn)為評分是客觀的。 計(jì)算 當(dāng)評分者為兩人時(shí),評分者信度等于兩個(gè)評分者的積差相關(guān)或等級相關(guān)系數(shù)。當(dāng)多個(gè)評分者評定多個(gè)對象,評分者信度等于兩個(gè)評分者的肯德爾和諧系數(shù)進(jìn)行估計(jì)。
24、 效 度 第一單元:效度的概念 第二單元:效度評估的方法 第一單元 效度的概念效度的定義 效度的性質(zhì) 效度的定義 效度是指所測量的與所要測量的心理特點(diǎn)之間符合的程度。效度是科學(xué)測量工具最重要的必備條件,一個(gè)測驗(yàn)若無效度,則無論具有其它任何優(yōu)點(diǎn),一律無法發(fā)揮其真正的功能。因此,選用測量工具時(shí)首先要看效度。 效度的性質(zhì) 效度具有相對性 效度具有連續(xù)性 效度的相對性 任何測驗(yàn)的效度是對一定的目標(biāo)來說的,或者說測驗(yàn)只有用于與測驗(yàn)?zāi)繕?biāo)一致的目的和場合才會(huì)有效。因此,不能籠統(tǒng)地說某測驗(yàn)有效,而應(yīng)該說它對測量什么有沒有效。 效度的連續(xù)性 測驗(yàn)效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無
25、”的區(qū)別。因此,評價(jià)一個(gè)測驗(yàn)時(shí),不應(yīng)該說“有效”或“無效,而應(yīng)該說效度較高或效度較低。當(dāng)然,效度是指“測量結(jié)果”的有效程度。 第二單元 效度評估的方法 (1)內(nèi)容效度(2)構(gòu)想效度(結(jié)構(gòu)效度)(3)效標(biāo)效度 內(nèi)容效度 內(nèi)容效度的定義內(nèi)容效度的評估方法內(nèi)容效度與表面效度 內(nèi)容效度的定義 內(nèi)容效度是指項(xiàng)目對欲測的內(nèi)容取樣的適當(dāng)程度。由于這種測驗(yàn)的效度主要與測驗(yàn)內(nèi)容有關(guān),所以稱內(nèi)容效度。注:人們要測定“憂慮性”,就要對這個(gè)概念有個(gè)明確的內(nèi)容范圍,然后從臨床觀察、病人自述、醫(yī)生筆記以及文獻(xiàn)報(bào)道中了解具有憂慮性的人具有哪些行為特點(diǎn),從而編制“憂慮性”測驗(yàn)。 內(nèi)容效度的評估方法 專家判斷法 (P65,雙向
26、細(xì)目表)構(gòu)想效度(結(jié)構(gòu)效度) 構(gòu)想效度的概念構(gòu)想效度的估計(jì)方法 構(gòu)想效度的概念指測驗(yàn)對理論上結(jié)構(gòu)的測量程度。 構(gòu)想效度的估計(jì)方法 測驗(yàn)內(nèi)法 測驗(yàn)間的相互比較 測驗(yàn)內(nèi)法這類方法主要是通過研究測驗(yàn)的內(nèi)部結(jié)構(gòu)(如測驗(yàn)的內(nèi)容以及題目間的關(guān)系等)來分析測驗(yàn)的結(jié)構(gòu)效度。 (1)確定測驗(yàn)的內(nèi)容效度 (2)考察測驗(yàn)的同質(zhì)性(同質(zhì)性信度) 確定測驗(yàn)的內(nèi)容效度 通過確定測驗(yàn)取樣的內(nèi)容范圍,我們就可以利用這些資料來定義測驗(yàn)所測的結(jié)構(gòu)的性質(zhì)。通過確定測量的內(nèi)容效度便為結(jié)構(gòu)效度提供了有關(guān)證據(jù)。例如:在編制語文能力測驗(yàn)時(shí),我們將內(nèi)容總體描述為對詞匯下定義、對語言進(jìn)行類比推理以及在文章篇句中正確運(yùn)用文字的能力,這在實(shí)際上給
27、“語文能力”的結(jié)構(gòu)下了定義。 考察測驗(yàn)的同質(zhì)性通過對被試在項(xiàng)目上的反應(yīng)與總分的相關(guān)計(jì)算,以及分半系數(shù)、系數(shù)、KR20、KR21等指標(biāo)的計(jì)算,可以推算出測驗(yàn)所測的是單一特質(zhì)還是多種特質(zhì),從而確定測驗(yàn)是否具有結(jié)構(gòu)效度。 測驗(yàn)間的相互比較 相容效度 區(qū)分效度 因素效度 相容效度 計(jì)算被試在新舊(已有效度證據(jù)的成熟測驗(yàn))兩個(gè)同類測驗(yàn)上的分?jǐn)?shù)之間的相關(guān)。 區(qū)分效度 看它是否與測量不同結(jié)構(gòu)的測驗(yàn)是否具有較低的相關(guān),用此方法確定的效度叫區(qū)分效度。例如,數(shù)學(xué)推理能力測驗(yàn)與閱讀能力測驗(yàn)。 因素效度 建立結(jié)構(gòu)效度最常用的方法是:通過對一組測驗(yàn)進(jìn)行因素分析,找到影響測驗(yàn)分?jǐn)?shù)的共同因素,這種因素可能就是我們要測量的心
28、理特質(zhì)(構(gòu)思)。 效標(biāo)效度 效標(biāo)效度的定義 效標(biāo)效度的評估方法 效標(biāo)效度的定義 衡量測驗(yàn)有效性的一個(gè)重要方法是根據(jù)測驗(yàn)所作出的預(yù)測是否能證實(shí),如果一個(gè)測驗(yàn)的預(yù)測與將來實(shí)際發(fā)生的事情非常接近,那么這就是一個(gè)好測驗(yàn)。例如,用大學(xué)入學(xué)考試來預(yù)測被試入學(xué)后的學(xué)習(xí),如果預(yù)測準(zhǔn)確性高,便說明這是一個(gè)好測驗(yàn)。 效標(biāo)效度的定義效標(biāo):被預(yù)測的行為是衡量測驗(yàn)是否有效的標(biāo)準(zhǔn)。效標(biāo)效度:就是考查測驗(yàn)分?jǐn)?shù)與效標(biāo)的關(guān)系,看測驗(yàn)對我們感興趣的行為預(yù)測得如何。因?yàn)樾?biāo)效度需要在實(shí)踐中檢驗(yàn),所以,又稱實(shí)證效度。 效標(biāo)效度的分類1、同時(shí)效度:與用來診斷現(xiàn)狀的測驗(yàn)有關(guān)。例如,智力測驗(yàn)以學(xué)生當(dāng)時(shí)的學(xué)業(yè)成績?yōu)樾?biāo),由于學(xué)業(yè)成績是現(xiàn)成的
29、,所以這種效度稱為同時(shí)效度。2、預(yù)測效度:與預(yù)測將來結(jié)果的測驗(yàn)有關(guān)。例如,大學(xué)入學(xué)考試可用學(xué)生入學(xué)后的學(xué)習(xí)成績作效標(biāo),因?yàn)樾?biāo)資料是在考試以后間隔一段時(shí)間后才能獲得,所以高考的效度則是一種預(yù)測效度。 注:此種效度對人員的選拔和安置工作非常重要。常用的效標(biāo)是專業(yè)訓(xùn)練的成績、實(shí)際工作的表現(xiàn)等。 效標(biāo)效度的評估方法 相關(guān)法 區(qū)分法(分組法) 命中率法 相關(guān)法 確定效標(biāo)效度最常用的方法是計(jì)算測驗(yàn)分?jǐn)?shù)與效標(biāo)測量的相關(guān)。根據(jù)變量的性質(zhì)不同,可分別采用積差相關(guān)法、等級相關(guān)法、二列相關(guān)法等。當(dāng)測驗(yàn)分?jǐn)?shù)為連續(xù)性變量,效標(biāo)資料為等級評定時(shí),可用賈斯朋(Juspen)多系列相關(guān)公式計(jì)算。 區(qū)分法(分組法) 區(qū)分法:
30、是檢驗(yàn)測驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。例如,在大學(xué)里,我們根據(jù)教師評定,把學(xué)生分為合格與不合格兩組,然后回過頭去查他們的高考分?jǐn)?shù),若兩組在高考分?jǐn)?shù)上有顯著差異,那就可以認(rèn)為高考是有效的,否則就認(rèn)為是無效的。 命中率法使用命中率法,可將測驗(yàn)分?jǐn)?shù)和效標(biāo)資料分成兩類。在測驗(yàn)分?jǐn)?shù)方面是確定一個(gè)臨界分?jǐn)?shù)(即分?jǐn)?shù)線),高于臨界分?jǐn)?shù)者預(yù)測其成功,低于臨界分?jǐn)?shù)者預(yù)測其失?。辉谛?biāo)資料方面是根據(jù)實(shí)際工作或?qū)W習(xí)成績,確定一個(gè)合格標(biāo)準(zhǔn),在標(biāo)準(zhǔn)之上者為成功,在標(biāo)準(zhǔn)之下者為失敗。 這樣便會(huì)有四種情況:(1)預(yù)測成功而實(shí)際也成功(B);(2)預(yù)測成功而實(shí)際上失?。ˋ);(3)預(yù)測失敗而實(shí)際上成功(D)
31、;(4)預(yù)測失敗事實(shí)上也失?。–)。我們稱正確預(yù)測的為命中;不正確預(yù)測的為失誤。 表55 測驗(yàn)命中與失誤的四種情況測驗(yàn)預(yù)測失敗成功成功(A)失誤(B)命中失敗(C)命中(D)失誤兩個(gè)指標(biāo) 總命中率 正命中率 教育實(shí)驗(yàn)法界定特點(diǎn)步驟案例研究界定根據(jù)一定的理論假設(shè),有計(jì)劃地控制教育活動(dòng)的某些因素,以引起其它因素朝著有利于提高教育效果的方向轉(zhuǎn)變,然后檢驗(yàn)假設(shè),并由此揭示教育活動(dòng)規(guī)律的綜合性研究活動(dòng)。教育實(shí)驗(yàn)法的步驟形成實(shí)驗(yàn)假說界定實(shí)驗(yàn)變量選擇實(shí)驗(yàn)?zāi)J酱_定實(shí)驗(yàn)對象制定實(shí)驗(yàn)方案實(shí)施實(shí)驗(yàn)評價(jià)實(shí)驗(yàn)結(jié)果界定實(shí)驗(yàn)變量確定和分解應(yīng)變量選擇和設(shè)計(jì)自變量確定需要控制的干擾變量選擇實(shí)驗(yàn)?zāi)J絾我蛩卦O(shè)計(jì)(1)單組單因素前后
32、測實(shí)驗(yàn)(2)單因素隨機(jī)實(shí)驗(yàn)(3)單因素隨機(jī)匹配實(shí)驗(yàn)(4)協(xié)方差設(shè)計(jì)兩因素設(shè)計(jì)案例研究盧仲衡的自學(xué)輔導(dǎo)法實(shí)驗(yàn)樣例學(xué)習(xí)(個(gè)數(shù),變異性、呈現(xiàn)方式)數(shù)學(xué)學(xué)習(xí)不良的個(gè)案研究個(gè)案研究問題提出方法(1)被試選擇(2)實(shí)驗(yàn)材料(3)實(shí)驗(yàn)程序:基線、處理、概括、維持結(jié)果分析與討論舉例:認(rèn)知策略訓(xùn)練對學(xué)習(xí)不良學(xué)生應(yīng)用題解決成績的影響被試6個(gè)學(xué)生1519歲被選擇于LD群體中。總IQ在85115(WISCR,1975,Wais,1955)。所有6個(gè)學(xué)生還滿足另外幾個(gè)條件。WISCR或WAIS的算術(shù)子測試低于平均數(shù)的1個(gè)標(biāo)準(zhǔn)差。閱讀水平至少4年級水平。此外,每個(gè)被試完成10個(gè)隨機(jī)的2步數(shù)學(xué)應(yīng)用題40分,或低于40分。
33、材料材料包括策略的掛圖(圖2)和19個(gè)測試(2步應(yīng)用題)、1個(gè)測試(三步應(yīng)用題)、練習(xí)題(每個(gè)類型),記錄測試分?jǐn)?shù)和時(shí)間的圖形。測試問題從220題的2步應(yīng)用題和50題的3步應(yīng)用題隨機(jī)選出。10個(gè)2步問題組成被試選擇測試和每個(gè)因變量測試(在基線、處理、維持和重新訓(xùn)練階段)。概括測驗(yàn)包括10個(gè)3步問題。項(xiàng)目不返回試題庫。每個(gè)測量中,問題的次序是隨機(jī)的。在策略獲得和策略運(yùn)用練習(xí)階段,應(yīng)用題的次序也是隨機(jī)的。 程序在課堂教學(xué)中接受策略訓(xùn)練。策略訓(xùn)練者是研究者之一。教學(xué)和測試都在課堂上。多基線設(shè)計(jì)的實(shí)驗(yàn)條件包括基線、處理、概括和保持、重新訓(xùn)練。 基線在基線期間,記錄測試的時(shí)間和分?jǐn)?shù)?;€數(shù)據(jù)繼續(xù)收集,直
34、到穩(wěn)定的基線是明顯的(對每一組的第一個(gè)學(xué)生)。當(dāng)繼續(xù)收集剩下來的兩個(gè)學(xué)生的基線數(shù)據(jù)時(shí),給第一個(gè)學(xué)生干預(yù)。當(dāng)上升趨勢明顯,至少10個(gè)項(xiàng)目中至少7個(gè)正確反應(yīng)的成績穩(wěn)定時(shí),策略訓(xùn)練給第二個(gè)被試。在這個(gè)階段,繼續(xù)收集每組第三個(gè)被試的基線數(shù)據(jù)。對第三個(gè)被試來說,相似的程序。 處理 處理包括策略獲得階段、策略運(yùn)用練習(xí)階段和測試階段,在測試階段期間收集因變量測量數(shù)據(jù)。 策略獲得階段策略獲得訓(xùn)練進(jìn)行了3課時(shí)(每課時(shí)50分鐘)。訓(xùn)練中使用的步驟包括訓(xùn)練策略模型(Deschler,1981)中的6步獲得步驟。獲得步驟包括:(1)分析現(xiàn)在的學(xué)習(xí)習(xí)慣;(2)描述新策略;(3)模仿新策略;(4)復(fù)述新策略(5)學(xué)生練習(xí)
35、;(6)在獲得階段的正確反饋。圖2呈現(xiàn)了訓(xùn)練程序總結(jié)。 8步數(shù)學(xué)應(yīng)用題的問題解決策略: 大聲閱讀問題:教師大聲讀題,解釋學(xué)生不懂的詞語。大聲復(fù)述陳述重要信息(特別是數(shù)字);(2)大聲重復(fù)問題部分;利用自我提問技術(shù):題目問什么?我正在尋找什么?轉(zhuǎn)化:畫一個(gè)圖形陳述問題:大聲說“我知道了,我想求”。強(qiáng)調(diào)題目中的重要信息。假設(shè):大聲說“如果我,那么”,“需要多少步驟”寫下運(yùn)算符號估計(jì):寫下估計(jì)的答案計(jì)算自我檢查:(1)參照問題,檢查每一步,決定運(yùn)算符號的正確性;(2)檢查計(jì)算的正確性;(3)運(yùn)用自我提問技術(shù)問自己是否理解答案的意思。 策略獲得訓(xùn)練概要(圖2)第一階段(1)討論基線分?jǐn)?shù)、被試解決問題的
36、方法、界定提高多少作為教學(xué)的目標(biāo)(2)描述訓(xùn)練的形式(3)向被試閱讀策略,回答被試提出的問題(4)使用樣例模仿策略的使用(5)使用隨機(jī)選擇的問題模仿策略的使用(6)當(dāng)被試解決問題時(shí),提供正確的反饋(7)當(dāng)被試復(fù)述策略時(shí),提供正確的反饋 第二階段(1)復(fù)習(xí)策略步驟(2)被試一邊說步驟,一邊解決問題(3)監(jiān)控被試策略的復(fù)述(4)重復(fù)(2)(5)重復(fù)(3) 第三階段(1)監(jiān)控被試的策略復(fù)述(2)當(dāng)被試一邊說步驟,一邊解決問題時(shí),提供正確的反饋。(3)重復(fù)(1)(4)重復(fù)(2)(5)策略步驟言語表達(dá)的測試。 圖3 數(shù)學(xué)應(yīng)用題解決的步驟1、大聲閱讀問題2、復(fù)述(1)重要信息;(2)大聲重復(fù)問題部分;(3
37、)題目問什么?我正在尋找什么?3、轉(zhuǎn)化:畫一個(gè)圖形4、陳述問題:我知道了,我想求。5、假設(shè):(1)如果我,那么,(2)需要多少步驟?6、估計(jì):寫下估計(jì)答案7、計(jì)算8、自我檢查:(1)檢查每一步運(yùn)算符號;(2)檢查計(jì)算;(3)理解答案的意思。策略練習(xí)階段要求被試在策略步驟的言語表達(dá)達(dá)到100的正確標(biāo)準(zhǔn)(圖3列舉了要求記憶的信息)。達(dá)到這個(gè)目標(biāo)后,策略運(yùn)用階段開始,在測試前一天,練習(xí)階段開始。包括策略步驟的言語表達(dá)和使用策略練習(xí)解決數(shù)學(xué)應(yīng)用題。在練習(xí)期間,列出步驟的圖形可以得到。及時(shí)的正確反饋被提供。如果學(xué)生在2個(gè)或者3個(gè)測試中,保持7分或者更好成績,練習(xí)階段結(jié)束。如果學(xué)生分?jǐn)?shù)低于7,練習(xí)階段恢復(fù)
38、。測試階段測試階段收集因變量。每個(gè)測試包含10個(gè)2步數(shù)學(xué)應(yīng)用題,使用與基線條件下相同的程序。此外,提示學(xué)生使用策略。不能得到圖3。測試時(shí)間被記錄。沒有完成的測試第二天完成。測試分?jǐn)?shù)測試完成后告訴被試。數(shù)據(jù)包括每個(gè)測試正確的數(shù)目,完成每個(gè)測試的時(shí)間,收集這些數(shù)據(jù)作圖。成績提高的標(biāo)準(zhǔn)是在連續(xù)4次測試中至少都正確7題。通常,70只是一個(gè)平均水平。在連續(xù)四個(gè)測試中都高于7個(gè)的維持成績表明成績的可接受性。 概括在最后一個(gè)處理測試的第二天,一個(gè)包含10個(gè)題目的3步數(shù)學(xué)應(yīng)用題決定策略是否概括到更復(fù)雜的數(shù)學(xué)應(yīng)用題中去了。5條正確作為作為可接受的標(biāo)準(zhǔn)。 維持概括測試2周后,一個(gè)包含10個(gè)2步數(shù)學(xué)應(yīng)用題的測試,決定維持的水平。如果學(xué)生不能完成至少7個(gè)正確回答,被試被重新訓(xùn)練到策略記憶達(dá)到100的水平,提供練習(xí)階段,重新測試。當(dāng)在一個(gè)測試中達(dá)到至少7個(gè)的正確率,實(shí)驗(yàn)結(jié)束。為了考察更大的維持水平,3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程管理人員合同(2篇)
- 2025年度個(gè)人房產(chǎn)租賃合同解除協(xié)議范本4篇
- 二零二五年度面包烘焙原料種植基地訂購合同4篇
- 2025年度合伙企業(yè)股份轉(zhuǎn)讓及管理服務(wù)協(xié)議3篇
- 二零二五年度苗圃苗木病蟲害防治藥劑研發(fā)與供應(yīng)合同4篇
- 2025年度個(gè)人購房綠色家居設(shè)計(jì)合同4篇
- 2025年度個(gè)人房屋維修基金借款合同模板4篇
- 車間有機(jī)廢氣課程設(shè)計(jì)
- 部編人教版語文七下《天上的街市》公開課獲獎(jiǎng)教學(xué)設(shè)計(jì)
- 餐廳系統(tǒng)uml課程設(shè)計(jì)
- 軟件項(xiàng)目應(yīng)急措施及方案
- 2025河北邯鄲經(jīng)開國控資產(chǎn)運(yùn)營管理限公司招聘專業(yè)技術(shù)人才5名高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年民法典知識競賽考試題庫及答案(共50題)
- 2025老年公寓合同管理制度
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級上冊 期末綜合卷(含答案)
- 2024中國汽車后市場年度發(fā)展報(bào)告
- 鈑金設(shè)備操作培訓(xùn)
- 感染性腹瀉的護(hù)理查房
- 天津市部分區(qū)2023-2024學(xué)年高二上學(xué)期期末考試 物理 含解析
- 水利工程招標(biāo)文件樣本
- 第17課 西晉的短暫統(tǒng)一和北方各族的內(nèi)遷(說課稿)-2024-2025學(xué)年七年級歷史上冊素養(yǎng)提升說課稿(統(tǒng)編版2024)
評論
0/150
提交評論