教育測量與評價第三版PPT完整全套教學課件_第1頁
教育測量與評價第三版PPT完整全套教學課件_第2頁
教育測量與評價第三版PPT完整全套教學課件_第3頁
教育測量與評價第三版PPT完整全套教學課件_第4頁
教育測量與評價第三版PPT完整全套教學課件_第5頁
已閱讀5頁,還剩752頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

教育測量與評價第三版第1章教育測量與評價的學科發(fā)展.pptx第2章教育測量與評價的類型和功能.pptx第3章教育測量與評價的質量特性.pptx第4章編制教育測驗的1般原理與方法.pptx第5章制定教育評價表的1般方法和步驟.pptx第6章教育測驗的常模及其建立方法.pptx第7章教育測驗的標準及其建立方法.pptx第8章學生課業(yè)發(fā)展的測量與評價.pptx第9章學生智能發(fā)展的測量與評價.pptx第10章學生人格心理發(fā)展的測量與評價.pptx第11章學生思想品德發(fā)展的測量與評價.pptx第12章學生體育發(fā)展的測量與評價.pptx第13章現代教育測量與評價的發(fā)展趨勢.pptx全套可編輯PPT課件第一章教育測量與評價的學科發(fā)展第一節(jié)教育測量與評價的基本問題1第二節(jié)教育測量與評價的發(fā)展歷史2第三節(jié)教育測量與評價的學科地位和作用3CONTENTS/1.定義教育測量和教育評價。2.認識教育測量與教育評價之間的關系。3.辨析教育測量、教育評價、教育評估、教育測驗若干概念的區(qū)別與聯(lián)系。4.了解教育測量與評價的主要發(fā)展歷程。5.認識教育測量與評價的學科地位及社會價值。6.了解基礎教育課程改革精神及對教育測量與評價的要求。7.認識教育測量與評價對教師職業(yè)專業(yè)化的重要性。8.認識古代科舉考試制度與傳統(tǒng)文化發(fā)展的關系。9.了解國際教育測量與評價學科領域的一些名人、名言、名著。學習目的第一節(jié)教育測量與評價的基本問題第一節(jié)教育測量與評價的基本問題一、教育測量與評價的含義(一)測量的含義與要素1.測量的含義所謂測量,從廣義上講,就是根據某些法則與程序,用數字對事物在量上的規(guī)定性予以確定和描述的過程。第一節(jié)教育測量與評價的基本問題2.測量的要素①

必須依據某些科學原理和法則,發(fā)展出合適的量具或制定出科學的測量方案。②

必須有意義相對明確的測量單位。③

用數字對事物在量上的規(guī)定性予以確定,就需要有一個測量或計算的起點,這個起點叫參照點。測量的量具、測量的單位和測量的參照點,是測量的三個基本要素或三個基本條件。量具單位參照點第一節(jié)教育測量與評價的基本問題一、教育測量與評價的含義(二)教育測量的含義與特點1.教育測量的概念教育測量,就是針對學校教育影響下學生各方面的發(fā)展,側重從量的規(guī)定性上予以確定和描述的過程。教育測量是為了了解學生的發(fā)展,尤其是為評定學習成績而進行的測量活動。教育測量關注學校的教學效果,而教學效果是教與學雙方共同作用的結果。教育測量關注學生的發(fā)展,而學生的發(fā)展是多方面的。第一節(jié)教育測量與評價的基本問題2.教育測量的特點教育測量屬于精神特性的測量。這種測量活動也要滿足一般測量的三個基本條件,即測量的單位、測量的工具和測量的參照點。教育測量的特點:(1)間接性和推斷性(2)測量對象的模糊性和測量誤差的不可避免性(3)量表具有多樣性,結果具有相對抽象性第一節(jié)教育測量與評價的基本問題二、教育評價的基本問題1.評價的含義評價泛指衡量、判斷人物或事物的價值。評價活動的過程是對人物或事物的價值進行分析、衡量和判斷的過程。在評價過程中,無論是事實判斷還是價值判斷,都需要以事實為依據,通過收集多方面的資料證據,對人類社會活動的效果、物質產品和精神產品的質量及價值等作出判斷。第一節(jié)教育測量與評價的基本問題2.教育評價的概念①格蘭朗德認為,評價是為了確定學生達到教學目標的程度,收集、分析和解釋信息的(課堂)系統(tǒng)過程;評價包括對學生的定量描述(測量)和定性描述(非測量)兩方面。根據格蘭朗德的觀點,評價總是包括對測量結果需求程度的價值判斷(例如,瑪麗學習數學取得了長足的進步)。一個完整的評價計劃將包括測量和非測量兩種方法,用公式加以形象地表達,即:評價=測量(定量描述)+非測量(定性描述)+價值判斷第一節(jié)教育測量與評價的基本問題②斯塔費爾比姆等人認為,“評價是一種劃定、獲取和提供敘述性和判斷性信息的過程。這些信息涉及研究對象的目標、設計、實施和影響的價值及優(yōu)缺點,以便指導如何決策、滿足教學效能核定的需要,并增加對研究對象的了解”。斯塔費爾比姆還說過一句在世界上有影響力的話,他說:“評價最重要的意圖不是為了證明,而是為了改進?!雹勖绹逃u價標準聯(lián)合委員會曾對“評價”給出一個簡明的定義,“評價是對某些現象的價值如優(yōu)缺點的系統(tǒng)調查,是為教育決策提供依據的過程”。④泰勒指出:“評價過程在本質上是確定課程和教學大綱在實際上實現教育目標的程度的過程。第一節(jié)教育測量與評價的基本問題⑤布盧姆在其《教育評價》一書中對“評價”這個概念做了兩種不同的解釋。第一種解釋在本質上是針對“教育評價”來說的,他說:“據我看來,評價乃是系統(tǒng)收集證據用以確定學習者實際上是否發(fā)生了某些變化,確定學生個體變化的數量或程度。”第二種解釋實際上是針對教育目標分類來說的,他把教育目標分成認知、情感和動作技能三大領域,又把認知領域的教育目標分成知識、領會、應用、分析、綜合、評價這六個能力層次或學習水平。對此,布盧姆指出:“評價是為了某個目的而進行的,對各種想法、作品、解答、方法、資料等的價值作出判斷的活動。評價涉及應用準則和規(guī)格來估量各種具體事物的準確性、有效性、經濟性和令人滿意的程度。判斷可以是定量的,也可以是定性的;準則可以由學生決定,也可以向他們規(guī)定?!钡谝还?jié)教育測量與評價的基本問題縱觀上述對“評價”一詞的描述,不難發(fā)現如下幾點:第一,強調以教育目標為標準的價值判斷過程。第二,強調用多種方法(測量和非測量)系統(tǒng)收集資料與信息。第三,教育評價的內容既可以是教育計劃,也可以是課程;既可以是學生的學習結果,也可以是某種教育現象、教學活動、教育目的或教育程序。第四,強調為學生發(fā)展和教育決策服務。第五,不同時期、不同學者所提出的教育評價概念的側重點有所不同。第一節(jié)教育測量與評價的基本問題三、教育評價相關概念辨析1.教育測量與教育評價測量與評價既有聯(lián)系又有區(qū)別。從句法意義上講,測量是按照一定的法則和程序,對事物或現象在量上的規(guī)定性加以確定和描述的過程。教育測量則是針對教育效果或者針對學生各方面的發(fā)展予以測量和描述的過程,旨在獲得有一定說服力的數量事實,是一種以量化為主要特征的事實判斷。而教育評價是根據一定的標準,對教育事物或現象的價值進行系統(tǒng)的調查,在獲取足夠多資料事實的(定性資料與定量資料)基礎上,作出價值分析和價值判斷。因此,教育評價最根本的特征是作出價值判斷。而教育測量過程的完結,在給出數量事實的描述與判斷之后,不一定都要作出價值判斷。第一節(jié)教育測量與評價的基本問題從這個意義上說,教育測量可以為教育評價提供價值判斷的基本數量事實,教育測量是教育評價的基礎;而教育評價往往是教育測量過程的延續(xù),是對測量結果的解釋與應用,并朝著價值判斷與釋放教育功能的方向拓展。因此,教育測量與教育評價既有區(qū)別又有聯(lián)系。但在一些情況下,兩者是一致的,許多教育測量本身就含有價值判斷。國內外一些教育測量方面的教科書,有的用“教育測量與評價”作書名,有的仍用“教育測量”,還有的用“教育評價”作書名,正說明了這一點。第一節(jié)教育測量與評價的基本問題2.教育評價與教育評估有些學者認為教育評價和教育評估這兩個概念意義不一樣,“評價”即評定價值,而“評估”并不表示價值。因此,建議在教育實踐活動中使用“評價”這個概念,不要使用“評估”這個概念。另一些學者則認為,“教育評估與教育評價通常沒有嚴格的區(qū)別。但是被評的事物往往都是相當復雜的,不可能用純客觀的標準加以測定,而且在‘評’的過程中已經加入了主觀因素,評的結果不可能是絕對客觀的,而有主觀推測、估量和估價的主觀判斷成分。對教育的評定更是如此,因為這是對精神的度量,很難是純客觀的。所以‘教育評估’比‘教育評價’更確切”。第一節(jié)教育測量與評價的基本問題實際上,教育評價與教育評估這兩個概念既有聯(lián)系又有區(qū)別。第一,根據《Collins漢英雙解詞典》,教育評價和教育評估的英語表示不同,前者通常用“educationalevaluation”表示,而后者通常用“educationalassessment”表示。既然英語詞源不同,那么,其意義則多少有所差別。國內有些文獻以及有些人把“assessment”譯成“評價”,嚴格說來是不夠準確的。第二,從目前國內出版的有關教育評估或教育評價的著作來看,無論是主張用“教育評價”這個概念,還是主張用“教育評估”這個概念,研究者都把這些學科的起源追溯到教育測量運動、美國著名的“八年研究”及其相應的人物(如泰勒等人)。既然教育測量、教育評價、教育評估源出一處,那么,它們必有相通與交叉之處。第一節(jié)教育測量與評價的基本問題第三,考究“評估”一詞,含有“評判”“評量”“估測”估算”等意思,因而也就包括對事物的質量、價值、程度、數值等進行估測判斷。教育評估和教育評價是兩個相近的詞語,它們在內容上有交叉,也有區(qū)別。教育評估可能有價值判斷,也可能沒有價值判斷。當教育評估過程含有價值判斷時,它和教育評價是一樣的;當教育評估過程沒有包含價值判斷時,它和教育評價就有一定的差別。假如教育評估的重點是對教育現象在數量上作出測量或估算,此時,教育評估與教育測量就可能處于同一層次的意義上。第一節(jié)教育測量與評價的基本問題第四,從概念及習慣用語上講,所謂教育評估,如同美國國家評估委員會主任迪肯所說,評估就是“由一個組織或機構對這所學校或學科是否符合某一事先確定的質量標準作出鑒定的過程”。因此,把“教育評估”概念用于產量評估、資產評估、房地產評估、實驗室建設評估、辦學水平評估、課堂教學水平評估、人的心理評估等,這些說法是比較符合“評估”一詞的本意的。第一節(jié)教育測量與評價的基本問題3.教育測驗與考試測驗是測量的工具,用它能引起人的有代表性的行為,以便對人的行為特性或心理特性進行測量與評價。因此,測驗一詞往往是教育測驗或心理測驗的簡稱。教育測驗是教育測量的一個工具,在教育評價或教育評估過程中常被用來收集資料(如有關態(tài)度測驗、民意問卷測驗、學科成就測驗等)。考試有廣義與狹義之分,“廣義的考試,泛指人類社會一切測度和甄別人的身心各個方面之群體或個體差異的活動。狹義的考試,則指由主試根據一定社會的要求,在一定場所,采取一定的方式方法,選擇適當的內容,對應試者的德、學、才、識、體諸多方面或某方面所進行的有組織、有目的的測度或甄別的活動”。第一節(jié)教育測量與評價的基本問題考試也是一種教育測驗。測驗的概念比考試的概念更廣泛,教育測驗包含教育考試。測驗或考試皆是教育測量與評價的一種工具。在某些情境下,教育測驗活動或教育考試活動本身就是一種教育評價(評估)活動。第二節(jié)教育測量與評價的發(fā)展歷史第二節(jié)教育測量與評價的發(fā)展歷史一、中國是考試制度的發(fā)源地中國是考試的故鄉(xiāng),是考試制度的發(fā)源地。這不僅有記述甚詳、卷帙浩瀚的文獻典籍為證,而且早已成為舉世公認的事實。據有關文獻記載,我國在進入“文明時代”之后,學校即已出現。《孟子》一書中說到:“夏曰校,殷曰序,周曰庠,學則三代共之,皆所以明人倫也。”這里的校、序、庠都是指學校。在我國最早的教育專著《學記》中,記載了距今三千多年的西周時期的教育制度和考試制度,其曰:“古之教者,家有塾,黨有庠,術有序,國有學。比年入學,中年考校,一年視離經辨志,三年視敬業(yè)樂群,五年視博習親師,七年視論學取友,謂之小成;九年知類通達,強立而不返,謂之大成?!钡诙?jié)教育測量與評價的發(fā)展歷史可見,早在三千多年前的西周社會,學校教育就初步建立了考試評價的內容、標準和程序的框架。西周社會發(fā)展具有重教、尚賢、選士、授官等特點,孕育出早期的考試評價制度,它對后來的學??荚嚒⒂萌丝荚?,特別是對科舉考試制度的建立,產生了重要而深遠的影響。春秋戰(zhàn)國時期是我國社會處于大變革、大動蕩的時代,原來的“考?!比喂僦贫纫仓饾u被破壞。就教育而言,學在官府也漸被打破,私家講學之風盛行。兩漢時期,我國的考試制度正式建立。漢代的“察舉制”,是一種承前啟后的任官制。所謂“察舉”,就是察其賢能,舉以授官。由此而產生所謂“對策”和“射策”兩種策試(考試)方法。第二節(jié)教育測量與評價的發(fā)展歷史魏晉南北朝時期,由于長期戰(zhàn)亂,疆土分裂,政局不穩(wěn),以致文教不興。學校考試制度與方法也沒有什么重要發(fā)展。只是這一時期,在任官制度上,淡化了“察舉”制,實行“九品官人法”即九品中正制,其特點是以中正為中心,論品定級,選拔和升降官吏。第二節(jié)教育測量與評價的發(fā)展歷史二、中國科舉制度的世界地位中國古代科舉考試制度對世界教育、政治、文化,尤其是考試制度產生過重大的影響。所謂科舉制度,就是“開科取士”的制度,即國家設立許多科目,通過定期的統(tǒng)一考試以選拔人才的一種制度。科舉制度始于隋煬帝大業(yè)二年(606年),直到清光緒二十九年(1903年)舉行最后一科進士考試后宣告結束??婆e考試制度在我國歷史上紛紛揚揚、斷斷續(xù)續(xù)綿延了將近1300年。唐承隋制,并對科舉制度大加發(fā)揚光大,使科舉制度日趨完備。唐高祖李淵即位便開科取士,到太子登基,便成定制。第二節(jié)教育測量與評價的發(fā)展歷史唐代的科舉考試,其考生通常有三類,一是“生徒”,即國子學、太學及各地學校的學生,只要經過學??荚嚭细瘢梢灾苯拥缴袝⒓印笆≡嚒?。二是不在校的讀書人,通過向所在郡縣報考,稱為“鄉(xiāng)貢”。“鄉(xiāng)貢”考試合格后再到尚書省參加“省試”。被送去參加省試的考生,可稱為“舉人”。三是有某種專長的知名人士,經人推薦給朝廷后,由皇帝特意下詔考試?!笆≡嚒笨贾羞M士后,還須經過吏部考試,稱為“選試”,經過審查,“選試”合格后,才能奏請皇帝授予官職。進士及第的第一名稱為“狀元”。第二節(jié)教育測量與評價的發(fā)展歷史宋代朝廷選官的主要途徑仍然是科舉取士,但與唐朝相比,宋代科舉制度有了明顯的發(fā)展和完善。元代的科舉制度一波三折,斷斷續(xù)續(xù)。明代科舉考試再度興盛,實行四級考試制度,即院試、鄉(xiāng)試、會試和殿試。清朝科舉,基本上沿用明代舊制。由于種種原因,科舉制度最終在清朝后期壽終正寢??婆e制度在中國歷史上延續(xù)了近1300年,它簡直就是一部內容極其豐富的歷史百科全書,對我國社會各個方面產生了重要的影響,對人才選拔和評價制度以及中華文化發(fā)展起過重要的作用。我國歷史上許多文化名人都與科舉考試制度有著千絲萬縷的聯(lián)系。第二節(jié)教育測量與評價的發(fā)展歷史科舉制度作為一種考試和人才選拔制度,不僅對我國古代政治、文化、教育、軍事起到了重要的促進作用,而且對民族的融合和國家的統(tǒng)一起到了一定的作用??婆e制度也對世界文化發(fā)展和考試制度的建立起到過重要的影響。它曾經對西方文官考試制度的建立和現代教育測量與評價的發(fā)展起到重要的作用。第二節(jié)教育測量與評價的發(fā)展歷史三、教育測量學科的誕生對教育測量科學的建立有直接影響的,是歐美國家一些學者為追求學校成績評定客觀化與標準化而開展的理論研究和實踐探索。早在1864年,英國一位名叫費舍的教師,有心廣泛地收集學生的書法、拼寫、算術、文法、作文、歷史、自然、圖畫等不同水平的作業(yè)樣本,然后選擇有代表性的樣本匯編成冊,并為每個水平的作業(yè)樣本評定一種分數,以示優(yōu)劣,形成《作業(yè)量表集》,作為教師以后評定學生各科成績的參照標準。第二節(jié)教育測量與評價的發(fā)展歷史美國學者賴斯也主張用統(tǒng)一的測驗去考查、比較、評定各校學生的成績。他從1894年開始,用若干年時間編制了算術、拼寫、語言等測驗,曾有數萬名的學生接受過他的測驗。據此,賴斯開展了一些相關的教育研究項目,在會議上或刊物上發(fā)表研究論文,引起許多對教育測量感興趣的學者的重視。還有來自英國的個別差異研究、德國的實驗心理學研究、法國的異常心理及智力測驗研究、美國本土化的智力測驗研究等一些研究力量,共同對教育測量學科的誕生起著孕育和催生的作用。美國心理學家桑代克有幸集歐美各國的研究與思想為一身,于1904年出版了聞名于世的論著《精神與社會測量導論》,首次較系統(tǒng)地介紹了教育統(tǒng)計方法及編制測驗的基本原理。第二節(jié)教育測量與評價的發(fā)展歷史在桑代克的《精神與社會測量導論》這本書中,他提出了一個著名的假設。他說:“無論什么東西,只要存在的,總存在于數量之中。”后來,美國另一位教育測驗專家麥柯爾接著說:“任何東西,存在于數量中的,都可以被測量?!庇谑?,人們把“凡存在的東西必有數量”“凡有數量的東西都可測量”這兩句話,看成是構成一切測驗和量化評價的公理。第二節(jié)教育測量與評價的發(fā)展歷史四、教育測量運動的蓬勃開展20世紀初,在桑代克的影響下,美國的教育測量運動轟轟烈烈地開展起來。首先,專家們編制了大量的教育測驗。從測驗的品種與內容看,有算術測驗、書法測驗、學科測驗、智力測驗、個性測驗、興趣測驗等,涉及學生各個方面的發(fā)展。從數量方面來看,從1909年桑代克編制了書法量表以后到1928年期間,美國已有各種不同的教育與心理測驗三千余種。從測驗結構來看,不僅有單一的測驗,而且還有成套的測驗。尤其是學科測驗,有各個年級、各個科目、各種層次水平的測驗。第二節(jié)教育測量與評價的發(fā)展歷史實際上,心理測驗與教育測驗的發(fā)展相互影響,并在學校教育背景下不斷地融合。早在20世紀初,心理測驗就已走上標準化與客觀化的路程。法國的比納等人在1905年創(chuàng)編并發(fā)表了世界上第一個標準化智力測驗。這不僅為兒童智力的早期診斷,特別是為篩選弱智兒童提供了一個客觀的診斷工具,而且標準化智力測驗的思想與方法,對發(fā)展其他的心理測驗具有思想啟發(fā)與方法論的重要作用。同時,它對20世紀初教育測驗和考試標準化也有直接的推動作用。第二節(jié)教育測量與評價的發(fā)展歷史五、美國的“八年研究”是教育評價的催生劑1930年,美國成年人中有25%的人失業(yè),大批青年人找不到工作流浪街頭。還有許多人為避免在社會上閑蕩,紛紛涌向高級中學,盡管他們并沒有多少上大學的興趣。這樣就使美國高中學生人數大量增加。然而,當時美國高中課程內容狹窄,教學與考試的教科書主義傾向嚴重,高中教育不能滿足社會發(fā)展的需要,也無法引起年輕人的興趣。于是,中學課程現狀與失業(yè)青年需要之間產生了尖銳的矛盾。許多人要求重新修訂高中課程方案與教學大綱,以滿足社會的需要。為了解決高中課程及教學問題,美國進步主義教育協(xié)會負責人艾欽(W.M.Aikin)于1933—1940年期間領導了一項長達八年之久的中學課程改革運動,這就是美國教育史上著名的“八年研究”。第二節(jié)教育測量與評價的發(fā)展歷史“八年研究”的基本原則是:其一,應當幫助學生學習什么,即在教育計劃中,應當幫助學生發(fā)展哪些思維、感覺和行動的方式。其二,為了幫助學生達到教育目標,應當提供什么學習經驗,即怎樣幫助學生學習預期的東西。其三,怎樣組織學習經驗,以使這些經驗的累積效果最大,即怎樣的學習順序和學習經驗的整體計劃會有助于學生內化他們所學之物,并將其應用于適當的環(huán)境。其四,怎樣評價方案效果,即隨后采取什么步驟,以不斷檢查期望的學習活動所發(fā)生的變化。第二節(jié)教育測量與評價的發(fā)展歷史美國的“八年研究”對傳統(tǒng)的教育測驗提出一些批評,認為:其一,傳統(tǒng)測驗是片斷的,不能全部了解知識之過程和人格之發(fā)展。其二,測驗只是關注客觀的信度,但對于質的妥當性已不足以說明。其三,測驗是教科書主義,測驗內容關注記誦教材中的知識,是片面的,不能反映學生的全面發(fā)展。其四,對測量或考試的過分依賴必然養(yǎng)成個人主義與被動式的學習態(tài)度等。第二節(jié)教育測量與評價的發(fā)展歷史六、教育測量與評價理論的發(fā)展1.測驗的統(tǒng)計模型為教育測量學科發(fā)展提供了強有力的理論支持早在20世紀40年代前后,歐美等國家的一些測驗統(tǒng)計理論專家就開展了測驗的統(tǒng)計數學模型的研究,提出了測驗信度與效度、項目的難度與區(qū)分度等指標及其經典的統(tǒng)計分析方法,為測驗研究提供了理論模型及統(tǒng)計分析方法,進一步豐富了教育測量的學科內容,并在20世紀50年代前后形成了經典測驗統(tǒng)計理論體系。從20世紀60年代以來,除了經典測驗理論進一步拓展外,還創(chuàng)立了多種現代測驗理論,其中項目反應理論、概括力理論或稱概化理論以及認知診斷測驗理論是近段時期在世界上比較有影響的幾種測驗理論。第二節(jié)教育測量與評價的發(fā)展歷史2.教育目標分類學促進教育測量與教育評價的學科整合20世紀中葉以后,在泰勒的行為目標評價理論的影響下,美國的布盧姆、克拉斯沃爾、哈羅和辛普森等人相繼完成了認知領域、情感領域和動作技能領域的教育目標分類,在世界上產生了廣泛的影響。教育目標分類研究成果,一方面使課程標準建立、課程編制和課程評價之間有了一個相互聯(lián)系的、操作性強的、共同參照的教育目標(行為目標)分類框架,另一方面,它使課堂“教、學及考試評價”三者之間能夠相互促進、相互聯(lián)系、相互融合,促進了教育測量學科和教育評價學科的發(fā)展與整合。第二節(jié)教育測量與評價的發(fā)展歷史3.教育評價學科內容的發(fā)展20世紀40年代到60年代期間,教育評價理論基本上是先以泰勒的“目標中心模式”、后以布盧姆提升的“目標分類模式”為核心。這一時期的教育評價是典型的“目標取向”,關注教育目標及其描述,在評價課程與學生行為變化時,重點在于衡量教育結果和教育目標之間的一致性,也開始重視對教育目標和學習結果進行“質的分析”。20世紀60年代后期以來,教育評價理論與實踐主要有三個特征:其一,不同的教育評價理論流派紛呈。除了泰勒評價模式、布盧姆評價模式外,世界各地教育評價學者陸續(xù)提出了多種模式,如CIPP模式、目的游離評價模式、對手評價模式、應答評價模式、解釋性評價模式、教育鑒賞和教育評論評價模式、反思性評價模式、發(fā)展性評價模式、增值評價模式以及元評價模式等。第二節(jié)教育測量與評價的發(fā)展歷史其二,教育評價活動更具有人文關懷精神,教育評價活動更加關注診斷功能和改進建議,通過自我反思和自我評價,促進被評價對象往高階發(fā)展,或者說往高水平發(fā)展。其三,教育評價的實踐已經超出泰勒原先對評價的定義范疇,教育評價活動已經和教育評估、教育督導、教育調查等概念相聯(lián)系,除了對課程、教學、教師與學生進行評價外,涉及學校辦學的各個層面,或者說涉及所有影響學生發(fā)展變化的因素,從而為改進教育決策提供更可靠的依據。第三節(jié)教育測量與評價的學科地位和作用第三節(jié)教育測量與評價的學科地位和作用一、教育測量與評價是現代教育科學研究的三大領域之一20世紀教育科學研究發(fā)展迅速,形成一個龐大的教育科學體系。在教育科學體系中,有許多已經成為研究對象相對明確、研究內容相對獨立、研究成果相對完整的學科分支。這些學科分支主要有教育學、教學論、課程論、教育心理學、教育史、比較教育、教育統(tǒng)計學、教育測量學、教育評價學、教育管理學、教育哲學、教育社會學、教育經濟學、教育科學研究方法、教育實驗設計、教育技術學、教育評估與督導、教育生態(tài)學等。第三節(jié)教育測量與評價的學科地位和作用在美國,對教育測量與評價的理論研究更是轟轟烈烈,其聲勢與規(guī)模超過教育科學體系中其他一些研究領域,主要表現在如下幾個方面:第一,創(chuàng)辦了大量有關教育測量與評價方面的研究雜志,如《教育測量研究》《教育測量評論》《評價研究》《教育評價與政策分析》《評價與方案計劃》《評價信息》《教育評價技術》《教育評價新趨勢》《現代測量理論模型研究》等,對教育測驗、教育測量模型、教育評價和元評價的研究活動可謂十分活躍。第二,出版了大量有關教育測量與評價的學術著作與教科書,如:《教育測量》《心理測量》《心理與教育測量年鑒》《教育評價》《教育方案、計劃評價》《測驗統(tǒng)計理論》《教育目標分類》等。第三節(jié)教育測量與評價的學科地位和作用第三,許多學術團體都加盟了對教育評價的研究,成立了一些全國性的教育評價協(xié)會,如全國教育測量委員會、全國教育進展評估中心、全國教育評價聯(lián)合會等,有組織地開展教育測量、教育評價等方面的協(xié)作研究活動,在全美乃至全世界都有較大的影響。除美國外,世界上許多國家如加拿大、日本、英國、澳大利亞、瑞典、比利時等都十分重視開展教育測量與評價研究,并取得了大量成果。在開展教育評價的國際交流與協(xié)作過程中,最有影響的要數“國際教育評估協(xié)會”和“國際教育成就評價協(xié)會”(簡稱IEA)。第三節(jié)教育測量與評價的學科地位和作用IAEA于1975年在瑞士日內瓦成立,當時有18個國家參加,其宗旨是幫助世界各地的教育機構通過發(fā)展和應用評價技術來提高教育質量和促進教育機會均等。IEA是個研究積極性強、組織較規(guī)范、活動較頻繁的國際性教育成就評價組織機構。IEA組織的宗旨是開展和促進教育的多國研究,尤其是對基礎教育的質量進行比較研究,探討共同的問題。第三節(jié)教育測量與評價的學科地位和作用課堂討論題在學科專業(yè)分類中,“教育測量與評價”放在哪一個類別中比較合適?第三節(jié)教育測量與評價的學科地位和作用二、教育測量與評價在教育改革中具有重要的作用1.教育改革常常以教育測量與評價的改革作為突破口教育本身是一個系統(tǒng)。學校教育考試制度和評價制度是教育制度的一個組成部分,但教育考試和教育評價具有很強的導向功能。從英國國家考試制度及其課程改革、澳大利亞國家考試制度及教育改革、美國的教育測量運動及“八年研究”中的課程與教育評價制度改革、還有我國一九四九年以來的考試制度改革來看,考試評價制度改革不僅作為教育改革的一項重要內容,而且有時還作為教育改革的突破口。因此,教育測量與評價在教育改革中常常處于突出的位置,起著重要的作用。第三節(jié)教育測量與評價的學科地位和作用2.考試與評價改革成為基礎教育新課程改革的重要內容教育目標的多樣性,必然要求教育測量與評價方法、手段的多樣化和科學化。中共中央、國務院1999年在《關于深化教育改革全面推進素質教育的決定》中多處講到考試、評估、評價的改革問題。全面推進素質教育,需要加快考試制度、考試方法、考試內容、評價方法和評價制度方面的改革,提高教育測量與評價的科學化水平。由于基礎教育在整個教育結構和提高國民素質中具有特殊的作用,因此,基礎教育課程及其考試評價改革尤為緊迫。第三節(jié)教育測量與評價的學科地位和作用如同2001年國務院在《關于基礎教育改革與發(fā)展的決定》中所強調的那樣:“基礎教育是科教興國的奠基工程,對提高中華民族素質、培養(yǎng)各級各類人才,促進社會主義現代化建設具有全局性、基礎性和先導性作用。保持教育適度超前發(fā)展,必須把基礎教育擺在優(yōu)先地位并作為基礎設施建設和教育事業(yè)發(fā)展的重點領域,切實予以保障?!睘榱素瀼刂泄仓醒搿鴦赵骸蛾P于深化教育改革全面推進素質教育的決定》和國務院《關于基礎教育改革與發(fā)展的決定》,教育部決定要大力推進基礎教育課程改革,調整和改革基礎教育的課程體系、結構、內容,構建符合素質教育要求的新的基礎教育課程體系。第三節(jié)教育測量與評價的學科地位和作用研究性學習專題為什么說教育測量與評價是所有成功教學的基礎,也是有效教學的基礎?第三節(jié)教育測量與評價的學科地位和作用三、教育測量與評價是教師的專業(yè)素養(yǎng)和能力1.正確評價學生的發(fā)展是教師職業(yè)能力的重要組成部分在教書育人的過程中,教師需要作出一系列決策和判斷,需要對學生的性向、能傾、成就、態(tài)度、興趣、潛能及發(fā)展等進行較全面的了解,這就需要采用教育測量與評價,以彌補教師非正式觀察之不足。教育測量與評價的技術手段不再是唯一的書面考試,而是涉及測量與非測量的一整套評價技術。測量與評價的內容,不再是應該牢記和不該死記硬背的內容,而是涉及更廣泛的教育目標。既然學生的發(fā)展是生動活潑的、多樣性的,那么,測量與評價的方法及其結論也應當是豐富多彩的、多樣化的、個別化的。第三節(jié)教育測量與評價的學科地位和作用測量與評價的目的,不再局限于給學生分等級排名次,而是對學生的發(fā)展和潛能進行系統(tǒng)的調查,發(fā)現學生的優(yōu)點與長處,指出學生的缺點與不足,更重要的是促進學生確立信心,認識自己的相對優(yōu)勢與弱勢,明確自己的努力方向。測量與評價的指導思想是為了創(chuàng)造適合學生發(fā)展的教育環(huán)境,而不僅僅是為了選拔適合精英教育的學生。因此,現代教育測量與評價的思想方法對于教師創(chuàng)造性地教學、因材施教、提高教學質量具有重要的作用。教育測量與評價的知識是教師必備的專業(yè)知識,評價學生的能力是教師職業(yè)能力的重要組成部分。在教育教學過程中,科學運用教育測量與評價的有關技術方法,是所有成功教學的基礎。第三節(jié)教育測量與評價的學科地位和作用2.國外教師教育普遍開設“教育測量與評價”類課程德國文化教育部在1994年對師范教育培養(yǎng)目標及課程計劃作出調整,要求師范生“具有扎實的文化基礎,系統(tǒng)的教學和教育方面的知識與能力;能承擔分析學生的個性特征,正確評價學生,指導與幫助學生等工作;能夠開展教學改革和教學研究,富有創(chuàng)造性地開展教學活動”等。其課程由通識學科、教育學科、執(zhí)教學科和教育實踐課四個板塊組成,學分比例大體上分別占30%、20%、35%和15%。德國“全國教育與教養(yǎng)工作者聯(lián)合會”建議教育學科的比重至少占1/3的學分,突出培養(yǎng)教師的專業(yè)教學技能。德國教師教育專業(yè)課程包括教育學、心理學、教學論、教育社會學、教育人類學、教育哲學、教育統(tǒng)計學、教育評價學、教育史學、教育經濟學、比較教育學、教學實習等。第三節(jié)教育測量與評價的學科地位和作用美國政府與各州教育當局聯(lián)手,建立嚴格的、高標準的、多層次的教師資格證書制度,要求教師努力“具有豐富的文化底蘊,養(yǎng)成學者的性格特點;有高度發(fā)展的口頭表達和書面表達的技能;發(fā)展理解以及處理信息符號方面的技能;理解人與自然環(huán)境、人與社會環(huán)境之間的關系;善于選擇和應用靈活的教學策略,以講授不斷發(fā)展變化的教材內容;還要學會正確評價學生發(fā)展進步等方面的能力”。其課程計劃,包括通識教育、學科專業(yè)教育和教育教學理論與實踐三大部分,并且各占1/3的學習時間。美國教師教育專業(yè)課程包括教育史、教育社會學、教育哲學、課程與教學、心理學與發(fā)展科學、教學法、教育測驗與評價、統(tǒng)計學在教育中的應用、教育實驗設計、教育技術、學習理論、學科教育理論、臨床教育實踐和教育實習等。第三節(jié)教育測量與評價的學科地位和作用英國國家課程包括四個方面:一是科目,包括三門核心科目和七門基礎科目;二是成績目標,具體分解為十個成績層次,規(guī)定從5歲到16歲,各階段應達到的知識、技能和理解水平;三是教學大綱,具體規(guī)定各科目內容以及各階段需要掌握的知識與技能等;四是評定計劃安排,在7歲、11歲、14歲和16歲四個關鍵階段進行統(tǒng)一測驗和學業(yè)評定,教師要綜合校外統(tǒng)考和校內多方面的成績記錄,對學生的發(fā)展寫出書面評定報告。英國教師教育專業(yè)課程包括心理學、教育原理、教育史、教育心理學、兒童發(fā)展、課程研究、教育測驗與評定、教學評估、比較教育、職業(yè)教育與指導、學科教材教法、教育管理、教育實習等。第三節(jié)教育測量與評價的學科地位和作用韓國向來有尊師重教的傳統(tǒng),教師地位高。韓國曾經制定了《提高教員地位特別法》,保障教師特別優(yōu)待的經濟報酬和社會地位,其中甚至還有規(guī)定“教員的不逮捕特權”。韓國的教師教育專業(yè)化水平不斷提高,其教師教育專業(yè)課程包括教育學概論、教育哲學、教育史、教學原理、教育統(tǒng)計(Ⅰ)、教育統(tǒng)計(Ⅱ)、教育評價、課程研究、教育社會學、教育行政學、終身教育論、比較教育、教育與心理檢測方法、教育研究方法、教育實習等。第三節(jié)教育測量與評價的學科地位和作用日本政府的中央教育審議會以及教育職員養(yǎng)成審議會等部門對從事專門性職業(yè)的教師提出素質要求:具有作為教育者的使命感,深刻理解學生的成長及身心發(fā)展,具備有關學科的專業(yè)知識,富有教養(yǎng)和具備實際的綜合性指導能力等。日本的教師教育專業(yè)課程包括教育觀念與教育史、教育基本原理、課程與教學論、教育心理學、道德教育研究、心理測定、教育評價、學科教學法、教育法學、學校管理、比較教育、教育實習等。第三節(jié)教育測量與評價的學科地位和作用新加坡教師教育專業(yè)課程包括教與學的基礎、學習過程與評價、影響學生學習的社會因素、教學傳媒與計算機、班級管理與動機激發(fā)、教育指導與協(xié)商技術、問題學生的教育、學科教學方法研究、教育實踐等。第三節(jié)教育測量與評價的學科地位和作用在我國,早在20世紀30年代,幾乎所有的師范學生都要學習教育統(tǒng)計與測驗。后來由于戰(zhàn)爭和國際政治斗爭等因素的影響,師范院校停止開設這類課程。直到改革開放后,國內才首先在高等師范院校教育系和心理系等少數專業(yè)中恢復教育統(tǒng)計學、教育測量學等課程。而教育評價的課程則更落后,不但教材建設不盡如人意,而且到目前為止,許多學校還只將其列為選修課,甚至不開設。因此,與國外相比,我國師范教育課程結構中不僅教育理論課程比重偏小,而且除了教育系與心理系等少數專業(yè)外,絕大多數師范專業(yè)的學生沒有學習教育統(tǒng)計、教育測量與評價的基本知識和技能,這不符合國際師范教育的趨勢,也不利于教師知識結構的優(yōu)化,同時也給學校教育帶來許多負面影響,加重學生的學習困難和負擔。這應當引起有關部門的重視。練習與思考題1.教育測量與教育評價有什么聯(lián)系與區(qū)別?2.教育評價與教育評估有什么聯(lián)系與區(qū)別?3.為什么說考試的量表水平通常是順序量表?4.有哪些教育測量與評價方面的名言值得我們深思?5.怎樣使用教育測量與評價這個概念?6.為什么說教育測量與評價在教育中有重要的作用?7.為什么說教育測量與評價是教師必備的知識技能修養(yǎng)?8.基礎教育課程深化改革中對考試評價制度改革提出了哪些新要求?歡迎提問!第二章教育測量與評價的類型和功能第一節(jié)教育測量與評價的主要類型1第二節(jié)教育測量與評價的主要功能2CONTENTS/1.按不同分類標準對教育測量與評價進行分類。2.了解形成性、診斷性和總結性測驗(評價)之間的區(qū)別和聯(lián)系。3.初步了解常模參照測驗和標準參照測驗的意義與區(qū)別。4.認識潛力參照測量與評價的意義和特點。5.認識最佳行為評價和典型行為評價的意義與區(qū)別。6.初步領會計算機自適應測驗的理念。7.能夠闡述教育測量與評價在實現教育判斷方面的功能。8.能夠闡述教育測量與評價在改進教師教學方面的功能。9.能夠闡述教育測量與評價在促進學生學習方面的功能。10.能夠闡述教育測量與評價在行使教育管理方面的功能。學習目的第一節(jié)教育測量與評價的主要類型第一節(jié)教育測量與評價的主要類型一、按測量與評價在教學中運用的時機分類1.形成性測量與評價形成性測量與評價是在教學過程中經常實施的,在性質上大致相當于現在的中小學單元測驗。形成性測量與評價的目的,對教師而言是藉此獲得教學過程中連續(xù)性的反饋,了解學生的學習效果、學習歷程、學習特點、學習困難等信息,作為隨時修正自己教學的參考。第一節(jié)教育測量與評價的主要類型2.診斷性測量與評價診斷性測量與評價是對經常表現出學習困難的學生所作的測量與評價,它的目的是對個人的問題行為及其原因進行診斷。診斷性測量與評價多半是在形成性測量與評價之后實施。形成性測量與評價是在教學過程中實施的,實施之后如發(fā)現學生有學習困難的情形,即隨時給予個別輔導,在輔導中幫助學生改善方法或習慣,從而克服學習困難,并跟上班級教學的進度。第一節(jié)教育測量與評價的主要類型3.終結性測量與評價終結性測量與評價用于教學結束后,在性質上相當于現在學校中所舉行的期末考試。終結性測量與評價的目的有兩個:其一是在教學目標之下,檢查學生一學期的學業(yè)達到了什么程度,從而判斷教學效果的得失。其二是根據終結性測量與評價的結果,評定學生的學業(yè)成就,并將評定結果通知學生家長或記入檔案。第一節(jié)教育測量與評價的主要類型二、按解釋測量結果或評價結果時的參照點分類1.常模參照測量與評價常模參照測量與評價是將被試水平與測驗常模相比較,以評價被試在團體中的相對地位的一種測量與評價類型。測驗常模是一個與被試同類的團體在相同行為上的分數結構模式。也就是說,常模參照測量與評價對學生學習成就的解釋是一種相對評價。由于命題標準、試題難易和評分寬嚴的不同,有時單憑卷面分數本身不能客觀地評價學生的成就與能力的高低。學生在試卷上得到的分數要跟他所在團體的常模比較后,才能顯示該生的實力。第一節(jié)教育測量與評價的主要類型2.標準參照測量與評價標準參照測量與評價是將被試的表現與既定的教育目標或行為標準相比較,以評價被試在多大程度上達到該標準。由于這種測量與評價常常和教育目標連在一起,故也稱目標參照測量與評價。學校的教學測量與評價,主要目的是為了確定學生達到教學目標的程度,考查學生對知識技能的掌握程度,因此,一般都采用標準參照測量和評價的方法。第一節(jié)教育測量與評價的主要類型3.潛力參照測量與評價潛力參照測量與評價,是將被試的實際水平與其自身潛在水平(潛力)相比較,以評價被試有無充分發(fā)揮自身潛力為目的。例如,同班同學一人考了70分,另一個同學考了80分,老師卻表揚了考70分的同學,而警示了考80分的同學。之所以如此,就是因為老師對學生的評價是參照學生潛力而言的???0分的同學本應考得更好,而考70分的同學已經很努力了,其當前實際水平已達到或接近該生的“最近發(fā)展區(qū)”。課堂討論題有人認為,用相對位置或相對分數來描述與評價學生的學習情況是不符合素質教育思想的。這樣,常模參照測量與評價方法在新一輪基礎教育課程改革中還有存在的價值嗎?你怎么看待這些問題?第一節(jié)教育測量與評價的主要類型第一節(jié)教育測量與評價的主要類型三、按測量與評價被試行為表現的性質分類1.最佳行為測量與評價最佳行為測量與評價以測量被試的最佳行為表現為目的。凡是以成就或能力的高低作為評價基礎的,都屬于最佳行為測量與評價。學校教學后的考試與升學考試,在性質上都屬于最佳行為測量。此種測量與評價之所以稱為“最佳行為”,是因為在這種以能力為基礎的評價情境下,被試都將有強烈的求勝動機,面對問題全力以赴,希望自己有最佳的表現。學生們在學科成就測驗上得到的分數,均可視為他們的最佳行為表現。第一節(jié)教育測量與評價的主要類型2.典型行為測量與評價典型行為測量與評價的目的不在測量與評價被試能力的高低,而是測量與評價其是否具備某種(或某些)典型行為。換言之,典型行為測量與評價所關心的不是被試能不能盡其所能地表現出其最佳水平,而是要求被試按通常的習慣方式作出反應(即典型行為)。態(tài)度、情感、人格、興趣測量等,都屬于典型行為測量。這些測量過程,希望被試以其平常的典型狀況來回答,無所謂正確與錯誤之分。在重視學生個性發(fā)展和全人教育的理念下,典型行為測量與評價方法具有特殊意義。第一節(jié)教育測量與評價的主要類型四、按測量與評價的內容分類1.智力測量與評價智力測量與評價的目的在于測量被試的智力并對被試的智力發(fā)展水平和特點作出評價。用于智力測量與評價的標準量具,常見的有“斯坦?!燃{智力量表”“韋克斯勒智力量表”“瑞文推理測驗”等。第一節(jié)教育測量與評價的主要類型2.能力傾向測量與評價能力傾向測量與評價的目的在于測量并評價個人的潛在才能,預測個人的能力發(fā)展傾向。能力傾向測量與評價一般可分為兩種:一種是關于一般能力傾向的測量與評價,旨在探測與評價個人多方面的潛能;另一種是特殊能力傾向測量與評價,旨在探測個人某方面的特殊潛在能力,如音樂能力傾向、機械能力傾向、美術能力傾向等。第一節(jié)教育測量與評價的主要類型3.成就測量與評價成就測量與評價的目的在于測量并評價個人在接受教育或訓練后的成就。常見的有兩種類型:一是學科成就測驗,旨在測量與評價被試在某一科目上的學習成就;二是綜合成就測驗,旨在測量與評價被試在多個學科或綜合學科上的學習成就。第一節(jié)教育測量與評價的主要類型4.人格測量與評價人格測量與評價也稱為個性測量與評價,其目的在于測量與評價被試的人格心理特征,諸如氣質、性格、興趣、態(tài)度、動機、適應性等方面的心理特征。由于人格的概念十分寬泛,因此,人格測量與評價所涉及的內容層面也很多,人格測量與評價方法也是豐富多彩的。為了更好地把“因材施教”的原則落到實處,教育者應當掌握測量與評價人格的一些基本原理和方法。本書在第十章中,將進一步討論人格測量與評價這個專題。第一節(jié)教育測量與評價的主要類型五、教育測量與評價的其他分類(一)按同時測量人數可分為個別測量與評價和團體測量與評價1.個別測量與評價個別測量與評價是指同一主試在同一時間內只能測量一個被試,“斯坦?!燃{量表”“韋克斯勒智力量表”“羅夏墨跡測驗”“主題統(tǒng)覺測驗”等一些著名的心理測驗,都屬于個別測驗。第一節(jié)教育測量與評價的主要類型這種形式的測量與評價,主試對被試的行為反應有較多的觀察和控制機會,能與被試有更多的交流機會,這可以讓主試獲得更多的信息,建立較融洽的主被試合作關系,有利于測量與評價的進行。對于一些特殊的被試,如幼兒、文盲等,只能采用個別測量與評價的辦法。但是個別測量費時、費力,特別是主試必須經過嚴格的訓練才能勝任。這是它的不足之處。第一節(jié)教育測量與評價的主要類型2.團體測量與評價團體測量與評價是指在同一時間內由一位主試測量許多位被試?!叭鹞耐评頊y驗”“陸軍甲種、乙種團體智力測驗”以及絕大多數自陳人格問卷都屬于團體測量與評價。這種形式的測量與評價突出的優(yōu)點是節(jié)省時間,可以在短期內收集到大量的測量數據,所以在教育、人事選拔、團體比較中被廣泛使用。其不足是由于同一時間內接受測量的被試多,不易有效地控制被試的行為,容易產生測量誤差,從而影響測量的信度和效度。第一節(jié)教育測量與評價的主要類型(二)按測驗材料可分為文字測驗和非文字測驗1.文字測驗文字測驗的內容是以文字的形式表現的,被試也用文字作答,也常稱為“紙筆測驗”,是最為常見的一種測量與評價類型。這種測量與評價實施較方便,團體測量與評價大多采用此種形式,學校中的大多數學業(yè)成就測驗都屬于文字測驗。文字測驗容易受被試文化程度、閱讀能力等方面因素的影響,也會受到主試語言、語音等因素的影響,因而,對不同教育背景下的被試,測量與評價的有效性將受到一定程度的影響。第一節(jié)教育測量與評價的主要類型2.非文字測驗非文字測驗的內容是通過圖形、儀器、工具、實物、模型等形式表現的,被試通過指認、手工操作向主試提供答案,所以也稱為操作測驗。這種形式的測量與評價不受或較少受文化背景的影響與限制,因此,可用于幼兒或不識字的被試,也有利于對不同文化背景下的被試進行跨文化的研究。在設計“文化公平測驗”時常采用這種方式。第一節(jié)教育測量與評價的主要類型(三)按量具的標準化程度可分為標準化測驗和非標準化測驗1.標準化測驗標準化測驗是指嚴格按照教育測量學或心理測量學要求的測驗編制程序而編成的一種測驗。通常標準化測驗都具有一定的編制程序,包括試題的抽樣,難度、區(qū)分度指標分析,明確的施測指導語和施測程序,計分標準,解釋分數的常模,以及信度、效度等指標資料。對于考試過程而言,標準化考試一般包括命題標準化、施測過程標準化、評分閱卷標準化和分數報告與解釋標準化等四個環(huán)節(jié)。第一節(jié)教育測量與評價的主要類型2.非標準化測驗這類測驗的編制相對自由,沒有嚴格按照測驗編制程序進行。教師自編測驗常由教師依照自己的教學需要和教學目標而自行編制,是一種非標準化的測驗。教師自編測驗的編制程序(如試題的編擬、實施、計分和解釋等)沒有經過標準的步驟,缺乏嚴謹一致的信度和效度指標,更沒有提供解釋分數的常模,所以相對而言不夠嚴謹。但是,它能滿足教師在教學情境下使用,符合教學的需求。第二節(jié)教育測量與評價的主要功能第二節(jié)教育測量與評價的主要功能一、實現教育判斷的功能1.測量評定的功能古今中外,教育測量與評價活動的直接目的是為了客觀地評定學生的學習成績,或者是為了給應試者的行為表現評定一個成績(分數或等級)。教育測量與評價具有測量評定的功能,是因為這種判斷過程不是主觀隨意的,而是按照某些科學準則和程序對人的行為表現作出較為客觀的測量與評價。可以確定地說,評定的功能使得教育測量與評價能夠滿足教育過程中人們的基本需要。第二節(jié)教育測量與評價的主要功能2.事實判斷的功能學生在學校教育影響下,由于個人素質和努力程度的不同,其學習情況、發(fā)展情況也就不同。若要實事求是地刻畫和描述學生的學習情況與發(fā)展狀態(tài),人們通常利用測量和非測量的種種方法,系統(tǒng)地收集資料,在此基礎上可以對被測對象或被評對象的某種屬性、行為表現等作出符合事實的判斷。基于這些比較客觀的測評事實,教育工作者可以作出相應的教育決策和判斷。判斷結果可以量化的分數出現,也可以采用定性描述的形式出現。第二節(jié)教育測量與評價的主要功能3.價值判斷的功能雖然某些事實判斷過程也蘊涵著價值判斷的成分,但事實判斷就整體來看,它與價值判斷有明顯的差別。價值判斷過程,是把事實判斷的結果同外部的某種價值體系或價值標準聯(lián)系在一起,對事物或人的屬性作出價值分析、價值判斷和價值描述。價值判斷往往是建立在事實判斷的基礎上,事實判斷更多地具有寫實性,而價值判斷往往也具有社會性。第二節(jié)教育測量與評價的主要功能4.問題診斷的功能教育測量與評價在實現其事實判斷功能和價值判斷功能的同時,還具有問題診斷功能。如對學生學習困難的診斷,對學生心理問題的診斷,對兒童智力發(fā)展的診斷,對教師教學問題的診斷,對課程設置、課程計劃、課程實施的診斷,對教育管理機制的診斷,對辦學問題的診斷等。由于教育測量與評價具有問題診斷的功能,因此,在教育過程中,人們常利用各種測驗、各種評價表以及考試等手段,大量地收集資料,經由這些資料的分析,充分發(fā)揮和最大限度地實現教育測量與評價的診斷功能。第二節(jié)教育測量與評價的主要功能5.區(qū)分選拔的功能人類的個別差異是客觀存在的。在學校教育過程中,減少學生之間的個別差異量,是教育的刻意追求,但要消滅人的個別差異是不可能的。教育與心理測驗是判斷個別差異的科學工具。在教育與社會活動中,由于資源的有限性或者由于存在競爭,因此,許多情況下必須作出區(qū)分與選拔的人事決策。為了做到一定的客觀性、公正性和科學性,利用精心設計的教育測量與評價方案,可以較好地實現選拔的人事決策??茖W的教育測量與評價方案,具有區(qū)分選拔的功能。第二節(jié)教育測量與評價的主要功能二、改進教師教學的功能1.了解學生的起點行為摸清學生的學習和發(fā)展狀況是因材施教的前提。任何一次成功的教育活動,如果不是建立在尊重學生已有的學習和發(fā)展狀況的基礎上是不可思議的。在教學或教育前,教師可以先針對學生實施一次測量,用來評價學生在學習之前已具有的背景知識,以了解每個學生的學習基礎和特點,并作為有效教學的起點。第二節(jié)教育測量與評價的主要功能2.作為改進教學的參考根據教育測量與評價的結果,教師可以明了自己在教學上的缺失,判斷教材的可用性,判斷教學方法的有效性以及教學效果的優(yōu)良性。例如,教學過程中,有哪些教學方法或教材的選擇、組織、聯(lián)系不當,是否需要調整或改變教學策略;有哪些概念和內容講解得不夠到位,學生存在學習錯誤或一知半解的狀態(tài),等等。總之,教育測量與評價的結果,可以為教師改進教學提供有用的信息。第二節(jié)教育測量與評價的主要功能3.作為補救教與學的依據對測量結果的分析,可以讓教師了解學生的學習類型,如果該測量過程是經過特殊設計,含有診斷不尋常反應、錯誤概念和反應心向等不正確選項的話,在對測量結果分析之后,更能進一步提供給教師診斷學生在認知結構上哪些地方有缺失的信息,這些信息可以作為教師實施補救教學的參考。測量后的試題分析的信息,可以提供給教師關于所編制測驗的統(tǒng)計特征(如難度、區(qū)分度等),根據這些信息,教師能夠進一步找出不良試題所在,以確保教師所編制的試題均屬于性能優(yōu)良的試題,并且可以被保留在題庫內,供日后編制新測驗或復本測驗使用。第二節(jié)教育測量與評價的主要功能4.確保教學目標的達到教育測量與評價的最終目的在于確保教學目標的達到。根據測量與評價的結果,教師可以知道目前的教學情況離目標有多遠,是否需要修正目標或改變教學策略,是否需要改換教材及教法等。比如,在單元、期中、期末學習后,為了檢驗教育工作的好壞,便少不了全面了解學生對學習內容的掌握情況,這是檢查前一段工作的效果,也是進一步進行教育工作的基礎。研究性學習專題學校教師自編課堂成就測驗發(fā)揮了哪些功能?還有哪些重要功能沒有發(fā)揮?如何更好地發(fā)揮這些功能?第二節(jié)教育測量與評價的主要功能第二節(jié)教育測量與評價的主要功能三、促進學生學習的功能1.明確目標,增加學習動力學校教育過程通過實施有效的教育成就測驗,能通過以下幾個方面直接影響學生的學習:其一,有了測驗和考試,就有一種壓力和目標,在一定意義上為學生提供了短期的學習目標;其二,重要的教育考試和評價活動,通常事先公布考試和評價方案,這可以讓學生更加明確所要學習的內容和努力的方向;其三,通過實施教育測量與評價,可以向學生反饋有關學習進步和行為評價方面的信息。第二節(jié)教育測量與評價的主要功能2.了解自我,調整學習計劃通過教育測量與評價,學生個體都有不同的體驗和感受,學生在得到自我教育和反思的同時,也就得到了歷練和成長。另外,教育測量與評價可以提供反饋信息,讓學生了解自己在學習上的優(yōu)缺點,有哪些錯誤的概念需要更正,以及有哪些技能已達到熟練程度等,以促進自我了解、自我認可,幫助學生自己作出最佳的學習決策或制定出最佳的學習計劃等。第二節(jié)教育測量與評價的主要功能四、行使教育管理的功能1.對教師的管理測量與評價在對教師的管理中所起的作用具體體現在這幾個方面:一是教師的資格評定,即教師的專業(yè)知識水平是否達到基本要求,專業(yè)知識包括文化知識和教育心理學方面的知識;二是教師的教學藝術水平的評定,即對教師的教學能力進行評定;三是教師管理水平的評定,即對教師在班級管理方面的能力進行評定;四是教師的個性評定,其中教師的資格和教學藝術水平的評定是其核心內容。第二節(jié)教育測量與評價的主要功能2.對學生的管理教育測量與評價具有一定的導向性和威懾性。學校教育過程通過實施教育測量與評價,有助于對學生的管理,把學生的精力和關注點聚集在學習和準備接受測量與評價的任務上來。學校若沒有考試與評價制度,學生就沒有目標和壓力,教育人員也就無法客觀地判斷學生發(fā)展的個別差異,也就不能實現公平、公正和維護正常的教育秩序。第二節(jié)教育測量與評價的主要功能3.對教育目標和質量的管理教育測量與評價是根據教育目標進行的,它通過對現狀與目標之間的差距進行判斷,能有效地促進被測量與評價的對象不斷接近預定的目標。因此,通過評價目標與指標體系的引導,可以為學校指明辦學的方向,為教師與學生指明教與學的目標。同時,國家政府有關部門通過教育測量與評價可以實現對各地教育質量和教育水平的監(jiān)測控制。第二節(jié)教育測量與評價的主要功能4.對教育過程的管理利用教育測量與評價,我們可以全面地掌握教育的各種情況,及時發(fā)現教育過程中存在的問題,對教育教學任務完成的數量與質量進行控制,為促進、提高教育活動的有效性提供科學的依據。第二節(jié)教育測量與評價的主要功能5.對學校的管理教育管理體制改革不僅要轉變教育觀念,還要改進教育管理方法。比如,可建立對學校的教育評價制度和辦學狀態(tài)信息監(jiān)測制度,實現宏觀管理。在這個教育管理體制變革過程中,教育測量與評價發(fā)揮著直接和間接的管理作用。練習與思考題1.教育測量與評價有什么功能?我們應該如何對待教育測量與評價?2.什么是常模參照測量與評價?什么是標準參照測量與評價?3.什么是形成性測量與評價?形成性測量與評價的使用有何重要意義?4.什么是診斷性測量與評價?診斷性測量與評價的使用有何重要意義?5.什么是終結性測量與評價?終結性測量與評價的使用有何重要意義?6.通過對教育測量與評價功能及其類型的了解,反思所在學校的教學考試起到了什么作用。歡迎提問!第三章教育測量與評價的質量特性第四節(jié)教育測量與評價中題目(項目)的區(qū)分度4第三節(jié)教育測量與評價中題目(項目)的難度3CONTENTS/第二節(jié)教育測量與評價的效度2第一節(jié)教育測量與評價的信度1第五節(jié)教育測量與評價方案的可用性5學完本章后,你應當能夠:1.解釋信度。2.解釋效度。3.解釋難度。4.解釋區(qū)分度。5.依據不同情況采用恰當的方法計算測驗的信度。6.依據不同情況選用恰當的方法對測驗的效度進行評價。7.計算測驗題目的難度、區(qū)分度。8.反思教育測量與評價方案的可用性。學習目的第一節(jié)教育測量與評價的信度第一節(jié)教育測量與評價的信度一、信度的意義信度,簡單地說就是測量結果的可信程度。例如,量一個物體的長度,人們用標準的鋼尺和彈性很大的橡皮尺子分別去測量,顯然用鋼尺去量的可信程度更高。因為它測量的結果更接近物體的實際長度,每次量的結果出入不會太大。而橡皮尺子的測量結果不可信,因其彈性大,所以每次的測量結果都會因拉力不同而有較大的出入,與物體的實際長度有較大差異。由此可見,信度指的是測量結果的穩(wěn)定性程度,記為rxx。也就是說,如果用同一測量工具反復測量同一種特質對象,則多次測量結果間的一致性程度就叫信度。第一節(jié)教育測量與評價的信度二、信度的統(tǒng)計定義我們不妨把測驗實施過程中直接得到的分數,叫做觀察分數,記為X;把被試在所測特質上客觀具有的水平值,叫一般真分數(簡稱真分數),記為T;那么,觀察分數與一般真分數的差就是測量誤差,記為E。這樣,三者的關系可以表示為:X=T+E可以設想,誤差分數的取值大小和正負方向是隨機出現的,因此,其平均數為零,而且它與真分數之間是相互獨立的。也就是說,誤差分數的出現、大小、方向都與真分數無關。根據這一假設,由公式X=T+E便可推導出公式:第一節(jié)教育測量與評價的信度式中,σ2X表示觀察分數的方差;σ2T表示真分數的方差;σ2E表示誤差分數的方差。根據公式(3-2)可以給出信度的統(tǒng)計定義:第一,信度是一個被測團體的真分數方差與觀察分數方差之比,即:由此可見,測驗的信度一般在0和1之間取值,rxx越接近1,測驗的信度越高。第二,信度是一個被試團體的真分數與觀察分數的相關系數的平方。即:第一節(jié)教育測量與評價的信度第三,信度是一個被試團體在測驗X(A卷)上的觀察分數與在測驗X的任意一個“平行測驗”X′(B卷)上的觀察分數的相關系數。即:以上三個統(tǒng)計定義是等價的定義,其中第一個是原始的、基本的統(tǒng)計定義,從其出發(fā)可以推導出另外兩個定義公式。不過,第一和第二個定義只具有理論意義,只有第三個定義才具有實際操作的意義。第一節(jié)教育測量與評價的信度三、信度的估計方法(一)重測信度重測信度指的是用同一個量表(測驗或評價表)對同一組被試施測兩次所得結果的一致性程度,其大小等于同一組被試在兩次測驗上所得分數的相關系數。依據測試結果分數的形式是連續(xù)變量還是二分變量等,可采用不同的相關分析方法。最常用的是積差相關計算公式:第一節(jié)教育測量與評價的信度式中,n為被試的數量;是每個被試兩次考試所得分數乘積之連加和;是每個被試第一次考試分數之連加和;是每個被試第二次考試分數之連加和;是兩組成績求連加和之后的乘積;是每個被試第一次考試分數平方后的連加和;是每個被試第二次考試分數平方后的連加和。第一節(jié)教育測量與評價的信度(二)復本信度所謂復本測驗是指在試題格式、題數、難度、指導語說明、施測要求等方面都相當,并且都用來測量相同潛在特質或屬性,但試題又是不相同的測驗。復本測驗也稱作平行測驗。復本信度指的是兩個平行測驗測量同一批被試所得結果的一致性程度,其大小等于同一批被試在兩個復本測驗上所得分數的相關系數。依據測試結果分數的形式,是連續(xù)變量還是二分變量等,可采用不同的相關系數計算公式。實施復本測驗有兩種方式:一種是在同一個時間連續(xù)施測,另一種是間隔一段時間后施測。第一節(jié)教育測量與評價的信度(三)同質性信度同質性信度也叫內部一致性信度,它是指測驗內部所有題目間的一致性程度。這里題目間的一致性含有兩層意思:其一是指所有題目測的是同一種心理特質;其二是指所有題目得分之間都具有較高的正相關。同質性信度基于的假設是:當一個測驗具有較高的同質性信度時,說明測驗主要測的是某一單個心理特質,由于眾多的題目測試了同一心理特質,那么實測結果就是該特質水平的反映。第一節(jié)教育測量與評價的信度1.分半信度分半信度指的是將一個測驗分成對等的兩半后,所有被試在這兩半上所得分數的一致性程度。它反映了測驗內兩半題目間的一致性,所以屬于同質性信度。但是,也可以將分半信度和等值性系數一樣解釋,即把對等的兩半測驗看成是在最短時間距離內施測的兩個平行測驗。計算分半信度的方法并不難,而比較困難的是如何將測驗分成相等的兩半。分半的方法很多,如按題號的奇偶分半、按題目的難度分半、按題目的內容分半等。所以,同一個測驗通常會有多個分半信度值。不論如何分半,一般在分半后都應考察分半的情況,看是否需要作適當調整,其最終的目標是分成對等的兩半。第一節(jié)教育測量與評價的信度分半信度的計算方法和等值復本信度的方法類似,只不過分半信度計算的是兩個“半測驗”上得分的相關系數,只是半個測驗的信度,還必須用斯皮爾曼—布朗公式加以校正:

式中,rxx為整個測驗的信度系數;rhh為兩個“半測驗”上得分的相關系數。第一節(jié)教育測量與評價的信度(1)弗朗那根(Flanagan)公式

式中,和分別表示所有被試在兩個半測驗上得分的方差;表示所有被試在整個測驗上的總得分的方差。(2)盧侖(Rulon)公式式中,表示同一組被試在兩個半測驗上得分之差的方差。2.庫德—理查遜信度該方法適合于測驗題目全部為二分記分題的測驗的內部一致性信度分析。庫德—理查遜公式有好幾個,其中常用的有和公式。(1)KR20公式式中,為測驗的信度;K為題目數;pi和qi分別表示答對和答錯第i題的被試人數比例;為測驗總分的方差。第一節(jié)教育測量與評價的信度(2)KR21公式式中,KR21為測驗的信度;是全體被試測驗總分的平均數第一節(jié)教育測量與評價的信度3.克龍巴赫α系數當測驗題型較多,并非都是二分記分題時,估計測驗信度可采用克龍巴赫α系數。其計算公式為:式中,表示所有被試在第i題上得分的方差,表示所有被試各自總分的方差,K為題目數。第一節(jié)教育測量與評價的信度四、標準參照測驗的信度分析1.百分比一致性指標百分比一致性指標是指同一測驗或兩平行測驗先后兩次施測,其對被試的分類結果一致的比例。其計算方法如表3-5所示:第一節(jié)教育測量與評價的信度2.κ一致性系數κ一致性系數,是指實際被評定為一致的百分比與在理論上被評定為一致的最大可能次數百分比的比率。采用表3-5中的資料與符號,其計算公式如下:式中,PA為百分比一致性指標;PC為理論上可能被評定為一致的百分比期望值,其計算公式如下:第一節(jié)教育測量與評價的信度五、測量標準誤與測驗信度的關系測量標準誤是指測驗中所得測值偏離真分數的程度,記為SE。顯然,它與測驗信度系數之間存在著必然聯(lián)系,這種關系可定量地表示如下:式中,SE為測量的標準誤,Sx為觀察分數的標準差,rxx是測量的信度系數。測量標準誤是反映測量結果精確性和可靠性的又一指標,同時也是人們正確解釋測驗分數的科學依據。第一節(jié)教育測量與評價的信度六、評分者信度1.評分者信度的含義評分者信度指的是多個評分者給同一批人的答卷進行評分的一致性程度。在教育與心理測量工作中,客觀題的評分很少出現誤差,但主觀題的評分常常存在誤差,有時誤差甚至較大。例如有人在1983年高考作文試卷中抽取一名考生的作文《一幅漫畫的啟示》,連同教育部規(guī)定的評分標準,復印后寄給近百名中學教師評分。收回的67位教師的評分統(tǒng)計表明,這篇作文所評分數從6分到25分之間,分數達17種之多,最高分與最低分相差19分。因此,應重視對評分者信度的研究。第一節(jié)教育測量與評價的信度2.評分者信度的計算當評分者人數為兩人時,評分者信度等于兩個評分者給同一批被試的答卷所評分數的相關系數。依據數據形式,可采用不同的相關系數計算方法。當評分者人數多于兩人時,評分者信度可用肯德爾和諧系數進行估計。肯德爾和諧系數是表示多列等級變量相關程度的一種方法。這種資料的獲得一般采用等級評定的方法,即讓K個評價者對N個被試的試卷(或作品)進行等級評定,每個評價者都能對N份試卷(或作品)排出一個等級順序,這樣就可得到K列等級順序變量。第一節(jié)教育測量與評價的信度其計算公式為:式中,W為肯德爾和諧系數,K為評價者的人數,N為被評價的試卷(或作品)個數,S為每一個被評價對象的K個等級之和的離均差平方和,即:式中,Ri為第i個被評價對象的K個等級之和。第一節(jié)教育測量與評價的信度第二節(jié)教育測量與評價的效度一、效度的意義效度,顧名思義,就是一次測量的有效程度。嚴格地說,效度是指一個測驗或量表實際能測出其所要測量的特性的程度。測驗或量表就是測量使用的工具。如果一次測量能測出其所要測的特性,那么我們就認為這個測驗或量表是有效的。任何測量都存在效度問題。物理測量工具也存在效度問題,比如,用尺子來測量一個人的體重,就不如用秤來測量一個人的體重有效。但是,由于物理測量基本是直接測量,工具的有效或無效是一個相對容易判明的問題,所以,在物理測量中,效度問題雖然客觀上也是一個重要的問題,但并不十分引人注目。教育和心理測量卻不同,它們是間接測量,所測量的是被試內部的心理特性,測量工具是否真正測到了這些特性,絕非一目了然的事情。第二節(jié)教育測量與評價的效度要正確理解效度的概念,應特別注意以下幾點:1.效度始終是針對一定測量目的而言的一般來說,一項測量活動總是針對一定目的而實施的,其有效性如何,也就是要看它能達到最初目的的程度。也就是說,測量效度是針對某種特殊用途而言的,不具有普遍性。如果一個測驗被應用于多個方面,那么它就有多個效度,其中有的方面顯得效度高,有的方面或許就比較低。這種同一測驗針對多個目的而使用的情況十分多見,比如,同一學業(yè)成就測驗既可作選拔用,也可在一定情況下作診斷用;同一人格測驗既可用來鑒別被試的個性特征,有時也可用來診斷是否有精神病癥狀等。因此,同一測驗針對不同目的,其效度是不同的。第二節(jié)教育測量與評價的效度2.效度只有程度上的差異由于教育與心理測量的間接性,使得其測量過程不可能百分之百的準確。不過,由于某個量表的編制總是針對一定目的的行為,所以在正常情況下,測量不會“完全有效”或“完全無效”。例如,為了測量學生的語文水平,總是用分辨錯別字、造句、作文之類的試題,不會用數學題目。因此,學生語文水平的高低總能在測量結果中反映出一些,不會毫無反映,即總會有一定效度,效度不會為零。第二節(jié)教育測量與評價的效度3.效度是針對測量結果而言的測量的效度如何,只有在實際測過之后才能表現出來。即使測量工具(測驗題本)質量很好,如果施測過程不規(guī)范,也會導致測量結果的誤差增大。只有當測量結果真實,正確反映了要測量的特性,才能認為這種測量是較為有效的或效度較高的。測量效度實質上就是測驗所測到的結果與測量編制者想要測的心理特性之間的一致性程度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論