體育測量與評價-第二章-體育測量與評價的基礎(chǔ)理論課件

上傳人：x*** IP屬地：貴州上傳時間：2022-11-25 格式：PPT 頁數(shù)：242 大?。?019.05KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩237頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

第二章體育測量與評價的基礎(chǔ)理論第二章體育測量與評價的基礎(chǔ)理論1第一節(jié)體育測量的基礎(chǔ)理論體育測量是體育教學(xué)、運動訓(xùn)練和體育科研的重要基礎(chǔ)。只有實施科學(xué)的測量，才能獲得準確而可靠的數(shù)據(jù)，并通過分析和研究，得出科學(xué)的結(jié)論。為了收集準確的資料，獲得可靠的信息，達到測量的目的，必須在體育測量的理論指導(dǎo)下實施測量。第一節(jié)體育測量的基礎(chǔ)理論體育測量是2一、體育測量的基本概念

（一）測量測量（史蒂文斯）：是根據(jù)法則給事物賦予數(shù)量。即用一定的法則給事物屬性指派數(shù)字或符號的過程。體育測量：是指依照一定的法則，對體育領(lǐng)域中事物的屬性或特征賦予數(shù)量的過程。包括物理量測量和非物理量測量。（內(nèi)容和形式多樣）

A:物理量測量：身高、體重、跳高高度、跳遠遠度、血壓等；

B:非物理量測量：有氧工作能力、技戰(zhàn)術(shù)水平、疲勞程度、心理素質(zhì)、身體素質(zhì)等。測驗：為了某種測量目的所進行的一系列測量構(gòu)成的系統(tǒng)。一、體育測量的基本概念

（一）測量測量（史蒂文斯）：是根據(jù)法3（二）測量的要素測量的要素：待測屬性或特征、法則和數(shù)字符號。A.待測屬性或特征：由于測量的目的就是反映事物的屬性或特征，它是測量的第一要素。舉例：100米、立定跳遠、靈敏性、心理素質(zhì)、技戰(zhàn)術(shù)水平、意志品質(zhì)等。B.法則：能有效衡量事物屬性的規(guī)則和尺度，或是能顯示事物屬性的程序。舉例：身高的測量、心理素質(zhì)的測量（二）測量的要素4心理素質(zhì)的測量（包含認識能力、情緒和情感品質(zhì)、意志品質(zhì)、氣質(zhì)和性格等。如測量智力量表：比奈－西蒙智力量表，韋克斯勒成人智力量表，瑞文智力量表等）。C.數(shù)字符號：數(shù)字的含義與測量內(nèi)容相關(guān)。心理素質(zhì)的測量（包含認識能力、情緒和情感品質(zhì)、意志品質(zhì)、氣質(zhì)5（三）測量量表測量量表：是指測量所獲得數(shù)據(jù)屬性的表述規(guī)則（反映表示測量結(jié)果的數(shù)字符號的性質(zhì)和類型）。這種規(guī)則由實數(shù)列的諸特性所決定的，這些特性包括：

A.順序：兩個或兩個以上的實數(shù)有次序之分、大小之分；B.距離：兩個實數(shù)之間的差距可以描述；C.原點：對應(yīng)于零位數(shù)的那一點（絕對零點和相對零點）。（三）測量量表6測量量表的分類1、名稱量表不含實數(shù)列的任一特性，即無順序、無距離、無原點。是各種測量尺度中含信息量最少、最低級的一種測量尺度。（如運動員的號碼）2、有序量表有序量表含有實數(shù)列的順序特性，但無距離、無原點。其信息量比名稱量表要豐富，屬于低等級的測量尺度。（比賽名次）測量量表的分類73、等距量表等距量表含有實數(shù)列的順序、距離特性，但無原點。等距量表又較有序量表含信息量多，屬高等級的測量尺度。（角度、高度）4、比例量表比例量表具有實數(shù)列順序、距離、原點的全部特性。其含信息量最多，屬于最高級量表。（運動水平、進步率、進步度）3、等距量表8四種測量尺度的特征、功能和適用的統(tǒng)計分析方法表：特點基本功能數(shù)字特征適用的統(tǒng)計方法名稱量表分類、標記＝≠百分比，卡方檢驗，列聯(lián)相關(guān)系數(shù)有序量表順序可按照次序排列＞＜中位數(shù)，百分位數(shù)，等級相關(guān)，非參數(shù)檢驗等距量表距離差距的確定與比較＋－算術(shù)平均數(shù)，標準差，積差相關(guān)，參數(shù)檢驗比例量表原點比值的確定與比較×÷幾何均數(shù)四種測量尺度的特征、功能和適用的統(tǒng)計分析方法表：特點基本功能9（五）測量的類型：不同的分類標準A.按測量方法分類：直接測量和間接測量。B.按測量屬性分類：物理量測量和非物理量測量。C.按測量的組織形式分類：連續(xù)性測量和橫斷面測量。（六）體育測驗的類型1、按測試者人數(shù)分類（1）單個測試者的測驗：以一個測試者的測量值作為受試者的測驗值。如身高、體重等測驗。（2）多個測試者的測驗：多個測試者同時對某個受試者進行測量，以多個測試者測量結(jié)果的綜合值作為受試者的測驗值。（五）測量的類型：不同的分類標準102、按重復(fù)測量次數(shù)分類在體育測量中，測量次數(shù)的確定和測量結(jié)果取值方式有以下幾種情況：（1）測一次受試者需要承受極限生理負荷完成的測驗。如一般耐力測驗，一般只測一次。

對于瞬時性、損傷性和操作難度大的測驗，如運動后即刻脈搏、血壓、血乳酸、肌肉活檢及其它生理生化指標的測驗。一般只測一次。

對于測量誤差很小，可靠性較高的測驗，如形態(tài)測量中的身高、體重等，一般只測一次。2、按重復(fù)測量次數(shù)分類在體育測量中，測量次數(shù)的確定和測量結(jié)果11（2）可以測2-3次或多次。持續(xù)時間短的大強度非極限負荷的最大能力測驗，如立定跳遠、投擲和靈敏性等測驗。（3）重復(fù)次數(shù)較多的測驗對于負荷小，但測量結(jié)果波動大，敏感和易受干擾的測量驗，如反應(yīng)時或感知覺測驗，為減少隨機誤差，重復(fù)測量的最佳次數(shù)為30次。觀測值可取測驗的平均值或總和，如果除去測驗中的最高和最低的成績，取其余測驗成績的平均值作為觀測值則更好。（2）可以測2-3次或多次。12（七）測量誤差定義：是指與測量目的無關(guān)的變因產(chǎn)生效應(yīng)，所引起的觀測值與真值之間的差異。誤差的分類：1.隨機誤差2.系統(tǒng)誤差3.過失誤差4.抽樣誤差（七）測量誤差定義：是指與測量目的無關(guān)的變因產(chǎn)生效應(yīng)，所引起131隨機誤差隨機誤差又稱為偶然誤差，指在測量中由一些主觀或客觀偶然因素引起，又不易控制的測量誤差。隨機誤差隨著測量次數(shù)的增加，其變化會呈現(xiàn)一定規(guī)律性。它總是圍繞被測量的真值波動（真值以重復(fù)測試的均值為代表）。推論：除標準化測試外，增加測量次數(shù)也是減少隨機誤差的有效辦法。1隨機誤差隨機誤差又稱為偶然誤差，指在測量中由一些主觀或142系統(tǒng)誤差系統(tǒng)誤差，是指在測量中，由于儀器未校正至測試要求，或?qū)y量條件掌握過寬或過嚴，而使測量結(jié)果出現(xiàn)規(guī)律性的偏大或偏小。后果：使數(shù)據(jù)統(tǒng)計結(jié)果偏離方向。消除辦法：嚴格執(zhí)行標準化測量，隨時檢查，及時發(fā)現(xiàn)并糾正錯誤。另外，通過增加測量次數(shù)，也可以將由于測量方法掌握過寬或過嚴而產(chǎn)生的系統(tǒng)誤差轉(zhuǎn)化為隨機誤差，使其降低到最低程度。2系統(tǒng)誤差系統(tǒng)誤差，是指在測量中，由于儀器未校正至測試要求153過失誤差過失誤差，指在測量中由于測試者過失所造成的誤差，如測錯、讀錯、記錯。這類誤差只要認真負責，加強測試者的責任心，并加強測試現(xiàn)場的監(jiān)督檢查，嚴格管理并執(zhí)行驗收制度。在最后資料整理過程中再進一步檢查、鑒別、舍棄，就會避免或減少由于過失誤差而得出錯誤統(tǒng)計結(jié)論。3過失誤差過失誤差，指在測量中由于測試者過失所造成的誤差，164抽樣誤差抽樣誤差是由于抽樣的原因而引起樣本統(tǒng)計量與總體參數(shù)之間的差異。測量中雖嚴格遵守抽樣原則，但不論用何種方法抽樣，從總體中抽取樣本進行研究，樣本統(tǒng)計量與總體參數(shù)都不會完全一致，這是因為個體之間差異是客觀存在的，即使采取隨機抽樣仍然無法避免樣本統(tǒng)計量與總體參數(shù)之間的差異。4抽樣誤差抽樣誤差是由于抽樣的原因而引起樣本統(tǒng)計量與總體參17

經(jīng)典測量理論的基本假設(shè)：真值的含義：“實測值”（簡稱X）：測量對象的某種測量內(nèi)容（或特征）經(jīng)測量后表現(xiàn)為一個數(shù)值。也稱“觀測值”、“觀測數(shù)”、“測量所得的值”、“實測分數(shù)”、“觀察分數(shù)”、“原始觀測數(shù)”等?！罢嬷怠?，也稱“真分數(shù)”（簡稱T）：反映測量對象（或受試者）某種特征的真正水平（或能力）的那個數(shù)據(jù)。T和X的關(guān)系怎樣？經(jīng)典測量理論的基本假設(shè)：18

測量誤差可以使用下式表示：

E＝X－T（2－1）式中：E－表示誤差；X－表示測量結(jié)果；T－表示真值。所有的被測事物或現(xiàn)象在特定的條件下，理論上都有一個對應(yīng)的客觀、實際值存在，我們稱之為“理論真值”。它只是個理想的概念，這在誤差理論研究中非常重要。為了進一步理解體育測量的誤差，可人為地把體育測量過程分為三個子過程。測量誤差可以使用下式表示：191.測量過程的分解

測量的目的在于了解被測事物或現(xiàn)象的真值。根據(jù)測量真值的近似可知性和體育測量的推測過程的基本特點，可把測量過程分解位以下過程：式中：X－指標測量值；T1－現(xiàn)象真值；T2指標真值；T－待測真值。（1）第I過程：由測量值推測現(xiàn)象真值的過程。（2）第II過程：由現(xiàn)象真值推測指標真值的測量過程。（3）第III過程：由指標真值推測屬性的過程。1.測量過程的分解測量的目的在于了解被測事物或現(xiàn)象202.測量誤差的分解

公式（2－1）給出了總測量誤差，即由測量值推測真值存在的誤差。依據(jù)測量過程的分解，可以將總誤差分解為測試者誤差、受試者誤差和指標誤差三部分。誤差的來源1.測試者2.受試者3.指標誤差2.測量誤差的分解公式（2－1）給出了總測量誤差21測試者誤差在第I過程中，現(xiàn)象真值（T）是確定的，而測量值（X）與之有差異，很明顯，誤差來源是測試者。第I過程中的測量誤差稱為測試者的誤差。誤差來源于測試者，（包括測試者測量方法的正確，對測量的重視程度，測量條件等。），這類誤差稱為測試者誤差。測試者誤差在第I過程中，現(xiàn)象真值（T）是確定的，而測量值（X22受試者誤差：在第II過程中，相對于T1來說，T2是確定的。該過程的誤差表現(xiàn)為現(xiàn)象真值與指標真值之間的差異。造成這種誤差的原因有受試者本身、測量方法以及測試條件等多方面，但該誤差最終是通過受試者表現(xiàn)出來的，所以該過程的誤差稱為受試者誤差。受試者誤差：在第II過程中，相對于T1來說，T2是確定的。該23指標誤差：第III過程是通過指標真值去推測屬性的過程，其誤差大小主要決定于指標能否真實地反映測試屬性。如果測量指標中含有非待測屬性的因素較多，那么該過程的測量誤差較大。所以，這一過程的誤差主要來源于測量指標，又被稱為指標誤差。指標誤差：第III過程是通過指標真值去推測屬性的過程，其誤差24以上所述為一般性的測量過程和測量誤差的分解，在實際應(yīng)用中，具體到某一次測驗，可能沒有三個過程，測量誤差也可能不需要考慮三部分。例如，標槍我們一般不考慮測試者誤差，而主要考慮受試者誤差；而體操、武術(shù)等主管評分項目的比賽中，人們往往關(guān)心的是測試者的誤差。以上所述為一般性的測量過程和測量誤差的分解，在實際應(yīng)用中，具25產(chǎn)生誤差的原因：主觀原因是造成誤差的主要原因

受試者的具體情況：生理、心理狀態(tài)和配合程度；測試人員狀態(tài)：熟練程度、知識水平、責任心；測量方法：測量方法自身所產(chǎn)生的誤差；測試環(huán)境：溫度、海拔、天氣等；測試工具和儀器精度或不正確使用；抽樣誤差中樣本含量、抽樣方法、樣本量的代表性。產(chǎn)生誤差的原因：主觀原因是造成誤差的主要原因受試者的具體情26數(shù)學(xué)模型及其假設(shè)經(jīng)典測量理論假定，實測值（X）與真值（T）之間是一種線性關(guān)系，并只相差一個隨機誤差（E）：X=T+E

1.測試者誤差——客觀性2.受試者誤差——可靠性3.指標誤差——有效性數(shù)學(xué)模型及其假設(shè)27二、體育測量的客觀性

一、客觀性概述

測量的客觀性（又稱評價的可靠性）：是指同一測試者或兩個以上(含兩個)的測試者對同一受試者測量結(jié)果的一致性程度?？陀^性是間接衡量第I過程中測量誤差（測試者誤差）大小的一種量度。所謂間接衡量是指不同測試者對同一受試對象同時測量，通過測量結(jié)果的一致程度來衡量測試者誤差大小。

二、體育測量的客觀性一、客觀性概述28直觀上看，如果測試者誤差小，那么由不同的測試者對同一受試者實施測量時，會得出極為接近的測量結(jié)果，即所有測量值應(yīng)具有較高的一致性；反之，如果不同測試者測量結(jié)果的一致程度低，則說明測試者的測量誤差大。如果某一項測驗的測試者誤差小，則該測驗的客觀性高；反之，測驗的客觀性低。體育中主要用于主觀評分類的運動項目。例如體操或武術(shù)等測試中，數(shù)個裁判員對同一運動員進行評分，若他們所評的分數(shù)很接近，說明評分的客觀性較高，反之則低。直觀上看，如果測試者誤差小，那么由不同的測試29測驗的客觀性定義

設(shè)從測驗總體中隨機抽取一名測試者（或若干名測試者）和一個受試對象，測驗值為X，根據(jù)誤差理論和測量過程的分解，測驗的第I過程誤差模型為：

X＝T1＋e1（2－3）式中，T1－受試對象表現(xiàn)的現(xiàn)象值；e1－測試者造成的誤差；e1和T1相互獨立。從而：測驗的客觀性定義設(shè)從測驗總體中隨機抽取一名測試者30（2－4）可見，客觀系數(shù)是一個相對數(shù)，反映測試者的測量誤差相對于個體差異的大小，若測量誤差相對較大，則客觀系數(shù)較小，反之亦反?？陀^性系數(shù)介于0和1之間。公式（2－5）定義的客觀性系數(shù)是測驗關(guān)于全體測試者和受試對象的客觀性系數(shù)，即關(guān)于測驗總體的客觀性系數(shù)，稱之為測驗的總體客觀性，也稱測驗的客觀性，一般總是未知的，實際應(yīng)用中需要通過樣本進行檢驗。

31測驗的總體

在體育測量中，測驗本身對測試者和測試對象都有一定的要求，我們稱滿足測驗要求的所有測試者和測試對象構(gòu)成的全體稱為測驗的總體，記為（A、B），其中A代表測試者，B代表測試對象。明確了測驗的總體，也就明確了測驗的適用范圍。測驗的總體在體育測量中，測驗本身對測試者和測試對32二、客觀性的分類1、多人測量客觀性：兩名或兩名以上的測試者對同一受試者測量結(jié)果的一致性程度。原因：對測量尺度掌握不一樣。提高方法：提高測試者測試水平、規(guī)定測試細則及嚴格控制測試條件等方法。

二、客觀性的分類1、多人測量客觀性：兩名或兩名以上的測試者對332、一人測量客觀性同一測試者對同樣事物多次重復(fù)測量結(jié)果的一致性程度。對同一項包含主觀因素較多的測量來說，難以在每次測量時，都保證尺度一致。如對同一人的技術(shù)錄像多次評分時另外，同一人對不同受試者實施同樣測量時，也存在客觀問題。2、一人測量客觀性34三、客觀性的檢驗方法

單個測試者的測驗抽取若干名測試者對同一受試者進行測量，以便對測試者的誤差做出估計。常用檢驗方法有兩種：（1）一致性系數(shù)（W系數(shù)）法：測量值為受試者的成績等級（名次）。W=12S/m2(n3-n)

W:為客觀性系數(shù);m:為測試者人數(shù);n:為受試者人數(shù);S:為受試者名次之和的離均差平方和。（2）方差分析法

R=1-MS內(nèi)/MS總?cè)?、客觀性的檢驗方法

單個測試者的測驗35多個測試者的測驗（主觀評分項目比賽）（1）裂半相關(guān)法（2）方差分析法

R=1-MS內(nèi)/MS間客觀性常用于一些主觀評分類項目，如體操、跳水、花樣滑冰等體育比賽中。多個測試者的測驗（主觀評分項目比賽）36

四、影響客觀性的因素

1、測試者水平2、測試者的人數(shù)級3、測試尺度：應(yīng)盡可能明確規(guī)定測試細節(jié)并且將其具體化，盡量減少測量中的主觀因素，實施標準化測量以提高測量的客觀性。4、測驗的規(guī)范性、標準化程度5、測量的指標特征：在條件允許的情況下，應(yīng)盡量選擇可以定量測量的指標。

四、影響客觀性的因素

1、測試者水平37三、體育測量的可靠性

(一)可靠性概述測量的可靠性(信度)在相同測量條件下，對同一批受試者使用相同測量手段，重復(fù)測量結(jié)果的一致性程度。(狹義的操作定義)。一般定義：測驗結(jié)果的一貫性、一致性、再現(xiàn)性、穩(wěn)定性。間接衡量第Ⅱ過程中測量誤差（受試者誤差）大小的一種量度。

三、體育測量的可靠性(一)可靠性概述38測量中常用R表示可靠性系數(shù)。例：某同學(xué)的身高為178cm(真實值---以重復(fù)測量的均值為代表)，第一次測量所得身高為177cm，第二次測量所得身高為179cm，測量值與真實值中間的差值即為誤差值。X=T+E；其中(X—實測值;T—測量的真值;E—測量誤差值)可靠性系數(shù)的范圍（0，1）越接近1則可靠性越高有些可靠性高的測量，如身高、體重等，這類指標只要保持與原測量條件一致，多次重復(fù)測量結(jié)果一致性程度較高。測量中常用R表示可靠性系數(shù)。39然而，有些指標，如VO2max，即使進行最嚴格的標準化和規(guī)范化測量，使用最精密的量具和儀器，由最有經(jīng)驗的測試人員進行測試，其測量結(jié)果還會存在—定的誤差。這種誤差的大小，在很大程度上決定了測量的可靠性。從“最嚴格的標準化和規(guī)范化測量，使用最精密的量具和儀器，由最有經(jīng)驗的測試人員進行測試，其測量結(jié)果還會存在—定的誤差?！笨梢耘袛喑觯号c測試人員無關(guān)，如果存在誤差，那么就應(yīng)當是受試者自身造成的。因此，可靠性就是衡量第II過程的測量誤差（受試者誤差）大小的一個客觀性指標，有嚴格的統(tǒng)計學(xué)定義。然而，有些指標，如VO2max，即使進行最嚴格的標準化和規(guī)范40根據(jù)可靠性數(shù)學(xué)理論，對一名受試者進行任何一次測量的結(jié)果（實測值），都是兩個量的和，即被測量的真值與由于不能被控制的受試者狀態(tài)變化和隨機誤差而引起的誤差之和，這就是可靠性的理論依據(jù)，可用下面公式表示：

(x)＝x(T)＋x

(e)

式中xi為某次測量的實測值；x為被測量的真值；x為由不能被控制的受試者狀態(tài)變化和隨機誤差而引起的誤差。根據(jù)可靠性數(shù)學(xué)理論，對一名受試者進行任何41可靠性高低，是用可靠性系數(shù)（或稱信度系數(shù)）進行描述的?？煽考禂?shù)（ii），即真值方差與實測值方差之比?？煽啃韵禂?shù)可用下面公式表示：

從上式可以看出，假如沒有測量誤差，即＝0，則可靠性系數(shù)ii就等于1。隨著測量誤差的增大，可靠性系數(shù)值也就越小。因此，可以認為，測量的可靠性在很大程度上取決于測量誤差的大小。測量誤差越小，可靠性越高?？煽啃愿叩?，是用可靠性系數(shù)（或稱信度系數(shù)）進行描42（二）體育測驗的可靠性檢驗

1、頻數(shù)等于1的測驗（1）兩次重復(fù)測驗（2）多次重復(fù)測驗：方差分析法R=1-MS內(nèi)/MS總2、頻數(shù)大于1的測驗：方差分析法R=1-MS內(nèi)/MS間（二）體育測驗的可靠性檢驗

1、頻數(shù)等于1的測驗43（三）可靠性的分類測量的可靠性，人們習(xí)慣于將它分為3類：即

一致可靠性穩(wěn)定可靠性等價可靠性。（三）可靠性的分類測量的可靠性，人們習(xí)441、一致性可靠性一致可靠性指同一天內(nèi)，測試者對同一批受試者重復(fù)測量結(jié)果的一致程度。受試者人數(shù)較少時，在相同條件下進行重復(fù)測量。用測量－再測量結(jié)果的相關(guān)系數(shù)估價其內(nèi)部一致性程度。大群體測量時，采用按人數(shù)比例隨機抽樣的方法，實施重復(fù)測量檢驗其可靠性。1、一致性可靠性一致可靠性指同一天內(nèi)，測試者對同一批受試者重452、穩(wěn)定可靠性穩(wěn)定可靠性指兩天或數(shù)天內(nèi)，測試者對同一批受試者重復(fù)測量結(jié)果的一致程度。如果被測事物屬性相對穩(wěn)定，即使間隔一定時間再測，結(jié)果應(yīng)當也一致的；若測量結(jié)果差異很大，說明這些指標信度不高，不可靠。在估價測量的穩(wěn)定可靠性時，應(yīng)注意根據(jù)不同測量指標，確定適宜的不同測量間隔時間，以避免因過長或過短的測量間隔時間而高估或低估測量穩(wěn)定可靠性。如運動即刻的血乳酸值和幾天之后的值。2、穩(wěn)定可靠性穩(wěn)定可靠性指兩天或數(shù)天內(nèi)，測試者對同一批受試者463、等價可靠性等價可靠性指在不同的測量時間，對受試者實施難度相同，而方式或題目不同的同質(zhì)測量結(jié)果的一致程度。等價可靠性常用于對受試者的理論知識測驗。另外在教學(xué)訓(xùn)練中也常用于檢查學(xué)員技術(shù)掌握程度，或進行性格、智力等心理方面的測量。3、等價可靠性等價可靠性指在不同的測量時間，對受試者實施難度47（四）影響可靠性的因素影響可靠性的因素主要來自測量的隨機誤差和抽樣誤差。1、測量誤差影響可靠性的因素較多，但測量誤差是影響可靠性的直接因素。測量誤差越大則可靠性越低；反之，則可靠性越高。①測試者；②受試者；③測試儀器；④測試方法；⑤測試環(huán)境；⑥抽樣誤差：抽樣方法、樣本量、樣本代表性。（四）影響可靠性的因素482、受試者個體差異和受試群體的能力水平同一種測量手段，用于個體差異不同的群體時，個體差異較大的群體，估價出的信度系數(shù)較高，個體差異較小的群體信度系數(shù)較低。在某種能力水平上信度高的測驗，對于其它能力水平的群體信度未必就高。例如：適應(yīng)能力問卷在本科文化程度人群中使用重測信度可以，但用于小學(xué)文化程度的人群信度未必夠。2、受試者個體差異和受試群體的能力水平493、重復(fù)測量的間隔時間重測信度、復(fù)本信度中，重復(fù)測量間隔時間越長，估價出的信度系數(shù)越低4、測量的長度（組數(shù)、次數(shù)）重測信度、復(fù)本信度中重復(fù)測量的次數(shù)，評分者信度中的評分者人數(shù)，內(nèi)部一致性信度中的題目數(shù)統(tǒng)稱為測驗的長度，長度越長信度越高，但長度增加的同時測量工作量增加，其它影響影響測量結(jié)果的因素也增加。5、測量指標的類型穩(wěn)定性高、不易變化的指標重測信度高；定性評分項目中，受主觀因素影響小的指標評分者信度高；3、重復(fù)測量的間隔時間506、測試細則測試細則詳細準確的測量重測信度高；評分規(guī)則詳細準確的評分者信度高7、估價可靠性時使用的方法如果同時可以使用幾種方法估價信度系數(shù)，可能計算結(jié)果會稍有不同。8、測試人員的人數(shù)、水平、責任心等對評分者信度影響較大6、測試細則51可靠性程度的一般判斷標準：

可靠性程度的一般判斷標準：52（五）提高可靠性的方法

①嚴格實施標準化的測量程序。包括測量儀器設(shè)備的標準化，測量方法的標準化，測量實施的標準化。這樣可以減少隨機誤差和系統(tǒng)誤差。②適當增加測量的長度。在運動技術(shù)測量當中，增加測量或測驗的次數(shù)，在體育社會、教育心理測量中，適當增加題目的數(shù)量。③適當?shù)卦黾悠叫袦y驗項目，可以增加對信度的檢驗，獲得更豐富的信息。④適當增加樣本含量，并提高抽樣的科學(xué)性（使樣本具有代表性），這樣可以減少抽樣誤差。（五）提高可靠性的方法

①嚴格實施標準化的測量程序。包括測53⑤測驗的難度要適中，使受試者表現(xiàn)出應(yīng)有的成績差異。⑥在選取受試者群體時，要兼顧他們的水平差異（最好接近正態(tài)）。⑦提高測試人員的責任心、業(yè)務(wù)素質(zhì)和測量技巧，以減少過失誤差、系統(tǒng)誤差和隨機誤差。⑧在有些測量中，要對受試者進行必要的宣傳鼓動，誘發(fā)其正確的動機和興趣，使之事先對測量方法、要求有所了解，更好地配合測試。尤其在機能測驗和運動能力測驗中，以及在量表測試過程中，正確的動機、認真的態(tài)度、全力以赴的作風(fēng)將直接關(guān)系到測量結(jié)果的準確與可靠。

⑤測驗的難度要適中，使受試者表現(xiàn)出應(yīng)有的成績差異。54⑨重復(fù)測量時要考慮間隔時間的長短，以及要保證兩次測驗的獨立性（完整性）。⑩要注意測量時間和環(huán)境的選擇。如不要在大型賽事（如校運會）和重大節(jié)日（如國慶節(jié)）前后安排測試；測試要求適當充裕的時間；要注意考試環(huán)境的選擇和控制（如噪音太大、考場紀律混亂等）。除了對可靠性進行定量的檢驗外，還可以通過其它途徑對信度檢驗進行補充和修正，例如：受試者的平時表現(xiàn)、出勤、作業(yè)、回答問題等是否與測試結(jié)果有特別大的出入等等。⑨重復(fù)測量時要考慮間隔時間的長短，以及要保證兩次測驗的獨立性55四、體育測量的有效性

（一）有效性概述

測量的有效性（又稱效度）：是指所選擇的測量手段在測量欲測量屬性時的準確性程度，即為所測量的屬性與欲測屬性之間的一致性程度。欲測屬性：常是一個模糊不可直接測量而得到的。四、體育測量的有效性（一）有效性概述56有效性的兩層含義：1、測量結(jié)果與測量目的的一致性（測量是否能測出原打算要量的屬性）2、測量的準確度（測量結(jié)果的可靠性）現(xiàn)在測量與原打算測量之間的相關(guān)性和可靠性；效度系數(shù)r，-1≤r≤1

如30m繞桿跑，多次重復(fù)測量成績非常接近，作為一項靈敏性測量指標，可靠性高，有效性亦高，但如果作為速度指標，雖可靠性高，但有效性不及30m跑。有效性的兩層含義：57有效性與可靠性的關(guān)系可靠性是有效性的必要條件，即要想有效性高，可靠性必需高；有效性是可靠性的充分條件，即有效性高，可靠性一定高。同一測驗的信度系數(shù)高于其效度系數(shù)。有效性與可靠性的關(guān)系58（二）有效性的分類

1、內(nèi)容有效性①所選擇的測量內(nèi)容反映總體屬性的準確程度。常用于理論知識的測驗。②考察內(nèi)容效度的前提是：要有定義較完整的總體屬性的內(nèi)容范圍。③確定內(nèi)容效度的方法：A.專家調(diào)查：一定數(shù)量專家邏輯分析的結(jié)果，也稱邏輯效度。B.統(tǒng)計分析—相關(guān)計算：一項測驗與公認有較好內(nèi)容效度的測驗的相關(guān)越高，說明內(nèi)容效度越好。如高中畢業(yè)前的摸底測驗，其內(nèi)容效度可與高考成績比較。（二）有效性的分類

1、內(nèi)容有效性59內(nèi)容有效性，是指測驗項目和指標的內(nèi)容能有效地代表總體屬性的準確程度，即測驗的內(nèi)容與擬測屬性的一致性程度。用有限的幾個測量中代表總體內(nèi)容是比較困難的，特別是一些心理測量，有時很難判斷其內(nèi)容是否能反映總體屬性。韋克斯勒成人智力量表中國修訂本（WAIS-RC）內(nèi)容有效性，是指測驗項目和指標的內(nèi)容能有效地代表總體屬性的準602、結(jié)構(gòu)有效性①一組測量所包含的各種屬性與總體屬性的各種擬測成分在結(jié)構(gòu)上的一致性程度。即可以實際操作的測驗與理論上的構(gòu)想的符合程度。常用于心理與運動能力的成套測驗。②確定構(gòu)想效度的方法A因素分析：探索性和實證性因素分析B相關(guān)計算：與已有的構(gòu)想效度較好的測驗的相關(guān)C聚合效度和區(qū)分效度2、結(jié)構(gòu)有效性61結(jié)構(gòu)有效性，指一組測量所包含的各種屬性與總體屬性各種擬測成分在結(jié)構(gòu)上的一致性程度。如籃球運動技能由投籃、傳球、運球組成。結(jié)構(gòu)有效性的擬測屬性是一種綜合的、整體的屬性，而實際測量出來的只是構(gòu)成總體屬性的各個成分或特征。結(jié)構(gòu)有效性，指一組測量所包含的各種屬性與總體屬性各種擬測成分62結(jié)構(gòu)有效性與內(nèi)容有效性有時很容易混淆，它們在要求達到測量目的的這一點上是相同的，但在使用時有區(qū)別。結(jié)構(gòu)有效性常用于心理測量與運動能力成套測驗，特別是編制運動技術(shù)測驗時經(jīng)常使用，而內(nèi)容有效性則常常用于理論知識測驗（如文化考試）。結(jié)構(gòu)有效性與內(nèi)容有效性有時很容易混淆，它們在要求達到測量目的633、效標有效性(criterionrelatedvalidity)。①所選擇的測量與效標之間的關(guān)聯(lián)一致性程度。②效標：即檢驗效度的標準，是指已被證明具有高有效性，可以作為參照標準的指標。效標有定量和定性兩類。3、效標有效性(criterionrelatedvali64③體育測量中常用的效標：A、可定量測量的專項成績：如100米、跳遠的成績；B、比賽的名次或運動等級；C、具有數(shù)量特征的量：100米跑的步頻和步幅，跳遠的助跑速度；D、合成效標：如體質(zhì)評價總分、成套測驗總分。E、標準的實驗室結(jié)果：如水下稱重法測得的身體成分、用氣體分析儀和電動跑臺測得的最大吸氧量。③體育測量中常用的效標：65效標有效性指所選擇的測量與效標之間的關(guān)聯(lián)一致性程度。效標：指已被檢驗證明能夠作為參考標準，并被證明是一項有效性高的測量。如果兩者之間的相關(guān)程度高，說明所選擇的測量的效標有效性高。效標有效性指所選擇的測量與效標之間的關(guān)聯(lián)一致性程度。66許多測量指標在使用之前不知其是否有效，或從邏輯分析推斷其有效，卻不知道其有效性高低，此時就要選擇適宜效標，經(jīng)測量后計算與效標之間的相關(guān)程度如何，如果相關(guān)程度高，說明效標有效性高，反之則低。往往用一些指標價格昂貴，條件限制挺大，盡量尋找一些經(jīng)濟、適用、可行的指標來代替，選來作為大面積群體測量適用。這就需要先驗證該指標的效標有效性。許多測量指標在使用之前不知其是否有效，或從邏輯分析推斷其有效67（三）有效性的檢驗1、邏輯分析法：---專家調(diào)查法邏輯分析法對估價內(nèi)容有效性和結(jié)構(gòu)有效性是最為適宜的。2、相關(guān)法常用于效標有效性的計算：等級相關(guān)法、積差相關(guān)法（三）有效性的檢驗68（四）影響有效性的因素1、受試群體特征：年齡、性別、能力的個體差異等；2、樣本含量及其代表性：擴大樣本含量，測量的可靠性提高，有效性也隨之提高。應(yīng)堅持隨機抽樣原則，以提高樣本的代表性；3、測量的可靠性：可靠性是有效性的必要前提，即有效性的測量必須是可靠的，所以要想提高測量的有效性，首先要保證測量的可靠性。（四）影響有效性的因素1、受試群體特征：年齡、性別、能力的個694、效標的選擇：對于同一項測量手段，選擇不同的效標，計算出來的效標有效性就不相同：例某一測試所選擇的效標缺乏有效性和可靠性，這樣所選擇的這種測試方法就不能很好的評價實測項目的指標。5、測量的難度與區(qū)分度：測量難度適中時，區(qū)分度最高，有效性也會提高。例：某種測驗?zāi)馨巡煌芰λ降氖茉囌邊^(qū)分出來，那么這種測驗的有效性就高；反之則有效性就低。4、效標的選擇：對于同一項測量手段，選擇不同的效標，計算出來70六、體育測驗的編制與實施

（一）、體育測驗編制的基本原則

1.科學(xué)性原則科學(xué)性原則是指所編制的測驗或所選擇的測驗手段必須符合測量的有效性、可靠性和客觀性。2.可比性原則可比性原則是要求編制者按測量與評價的理論和測量的有關(guān)規(guī)定來編制規(guī)范化的測驗。盡量采用已有的、國際或國內(nèi)通用的標準化測量。六、體育測驗的編制與實施（一）、體育測驗編制的基本原則713.適用性原則測驗的編制必須符合受試對象的實際情況，全面地考慮受試者的年齡、性別、形態(tài)、機能和運動能力、普通人或運動員等方面的特點。還要考慮客觀條件和實際情況，如當?shù)氐牡乩憝h(huán)境、文化傳統(tǒng)、教育水平、經(jīng)濟狀況、場地設(shè)備以及測試者的具體情況。

一般來說，難度適中的測驗具有較大的鑒別性。4、相關(guān)、獨立性原則條件：編制成套測試。相關(guān)性：各個測驗與總體屬性的相關(guān)關(guān)系；獨立性：各個測驗指標應(yīng)具有的單一屬性和獨立性。3.適用性原則72（二）體育測驗編制的基本程序

1、確定測驗?zāi)康暮蛿M測屬性

編制測驗，首先要考慮的是測驗的目的，亦即測驗編制者要解決什么問題。它是整個編制的核心，必須首先確立。它將決定測驗對象和測驗指標的選擇、組織工作安排、儀器和經(jīng)費等一系列問題。目的一般不宜定得過多，以解決一兩個具體問題為宜。（二）體育測驗編制的基本程序1、確定測驗?zāi)康暮蛿M測屬性732、選擇有效的測驗手段A、分析擬測屬性及其結(jié)構(gòu)成分

測驗?zāi)康拇_定后，則要分析擬測屬性的概念、內(nèi)容、結(jié)構(gòu)、內(nèi)在聯(lián)系和外部特征等，然后用定性和定量的方法去選擇相應(yīng)的測驗指標。B、選擇有效的測驗手段：①定性分析；②定量分析定性分析選擇測量指標，是基于理論和經(jīng)驗，運用邏輯判斷、分析、比較的方法選擇測驗指標。定量分析選擇測量指標，是在定性分析的基礎(chǔ)上，運用數(shù)理統(tǒng)計的方法和手段，對待定的測驗指標做定量分析后進行選擇的。常用的數(shù)理統(tǒng)計方法有回歸分析、聚類分析、主成分分析等。2、選擇有效的測驗手段定性分析選擇測量指標，是基于理論和經(jīng)驗743、預(yù)備測驗

為使所確立的測驗更能體現(xiàn)科學(xué)性及符合測量的實際情況，我們可以在小范圍內(nèi)或抽取小樣本對測驗進行試驗。這種試驗的目的是：

A、檢驗測驗的有效性、可靠性和客觀性，并確立其系數(shù)；B、檢查所編制或選擇測驗的可行性和實用性；C、根據(jù)試驗情況和出現(xiàn)的問題，對測驗做進一步的修改使之趨于完善。經(jīng)過預(yù)備試驗后，精選測驗指標，剔除測量值不穩(wěn)定、有效性和可靠性低或測驗結(jié)果呈極度偏態(tài)的指標。3、預(yù)備測驗754、科學(xué)性檢驗：“三性”檢驗科學(xué)性檢驗是指對測量進行“三性”檢驗。如待定測驗指標的“三性”達到了使用標準便可選用，否則要另行選擇。另外，還應(yīng)對篩選出來的各個指標進行相關(guān)程度的檢驗，如某兩項指標的相關(guān)程度高且效標的相關(guān)程度又很接近，說明這兩項指標屬同質(zhì)測驗，要剔除其中一項?？傊?，最后確定的指標，互相之間的相關(guān)程度要低（獨立性），與屬性的相關(guān)程度要高（相關(guān)性）。4、科學(xué)性檢驗：“三性”檢驗科學(xué)性檢驗是指對測量進行“三性”765、編寫測驗實施細則A、測驗?zāi)康?；B、受試者的年齡與性別；C、測驗的“三性”；D、測驗場地和設(shè)備；E、測驗的方法和要求；F、記錄、評分的方法和要求；G、測驗的安全措施。I、測驗的注意事項5、編寫測驗實施細則77（三）測驗編制的程序

在實行多項測驗或群體測驗時，要考慮測驗程序的編排問題。測驗程序是指實施測驗的先后次序，它是根據(jù)測驗時間、測驗項目、測驗內(nèi)容、測驗人數(shù)、測驗難易度和強度、測驗條件（場地、設(shè)備）和測試人員等方面的情況而進行編排的。

編排測驗程序的原則是：第一，省時，便于組織實施；第二，保證前后測驗之間不會產(chǎn)生不良影響。（三）測驗編制的程序在實行多項測驗或群體78在體育測驗實踐中，測驗程序的編排通常采用以下三種方法：

1.逐一測驗編排法2.連續(xù)測驗編排法3.循環(huán)測驗編排法在體育測驗實踐中，測驗程序的編排通常采用以下三種方79（四）有關(guān)體育測驗編制的幾個問題1、測驗對象：用于評價的測驗樣本數(shù)，全國性標準應(yīng)≥1000，地區(qū)性標準應(yīng)≥200；用于診斷的測驗樣本數(shù)，通常應(yīng)≥30；用于測量三性測驗的樣本數(shù)，通常應(yīng)≥100，但在嚴格控制測量條件的情況下，也可采用小樣本數(shù)（20-30）方案進行。2、測驗形式：A、從測量目的來分：教學(xué)性測驗是為教學(xué)訓(xùn)練提供有效依據(jù)的簡單、具體的測驗；研究性測驗是為科研專門設(shè)計的詳細、周密、完整的測驗。B、從測驗項目來分：單項測驗、成套測驗C、從測驗手段來分：計時型測驗、計數(shù)型測驗、丈量型測驗、專家評分測驗、操作儀器測驗、理論測驗、臨場觀測D、從時間延續(xù)長短來分：橫向測驗、縱向測驗（四）有關(guān)體育測驗編制的幾個問題1、測驗對象：用于評價的測驗80

有一些機能領(lǐng)域的測驗項目（指標），不只是一項而是有多項組成。這樣由多項指標來測定某個同一機能領(lǐng)域的測驗，稱成套測驗，又稱組合測驗或系列測驗等，它主要用于測量體育范疇中某一方面或某些行為（或現(xiàn)象）的綜合屬性，并同樣具有診斷、評價和預(yù)測等功能。成套測驗：是指由若干單項測驗組成的一種有特征的、具有完整屬性的測驗，通常又稱“組合測驗”或“系列測驗”。（五）成套測驗有一些機能領(lǐng)域的測驗項目（指標），不只811、成套測驗的特點：

成套測驗的總體屬性常常難以直接測量獲得，一般只是測量構(gòu)成其總體屬性的各個測驗項目（各個指標），把它們的測量觀測值綜合起來以對總體屬性進行估價。特點：A、總體屬性與其結(jié)構(gòu)成分（各單項測驗）間具有高相關(guān)性。B、各結(jié)構(gòu)成分間具有高獨立性。C、評價具有高綜合性，是在確定各結(jié)構(gòu)成分權(quán)重、分值轉(zhuǎn)換及評價法基礎(chǔ)上的綜合評價。1、成套測驗的特點：822、成套測驗的編制“測驗編制的基本程序”一致，注意各組測驗之間的關(guān)聯(lián)先后。成套測驗的有效性、可靠性和客觀性檢驗包括項目的難易度檢驗、項目的區(qū)分度檢驗、項目間的相關(guān)分析。（1）項目的難易度檢驗：受試者在測驗中的成功率表示；

項目的難易度，可用受試者在該項測驗中的成功率表示，成功率愈高，難度愈小，當然亦可用失敗率表示，失敗率愈高，難度愈大。例2.10：2、成套測驗的編制83（2）項目區(qū)分度檢驗：所謂項目的區(qū)分度，是指該項目的測驗成績，能夠區(qū)分受試者不同能力水平的程度。

設(shè)成套測驗總分的上位25％與下位25％的人為“上位群”及“下位群”，而且“上位群”在某項測驗中的失敗者（不合格者）為W上，“下位群”在同一個測驗中的失敗者為W下，

則︱W上－W下︱的值越大，該項目的區(qū)分度越好。若受試者人數(shù)為N，則上、下位群的人數(shù)為：N上＝N下=0.25N則W上與W下的最大值分別為：W上＝N上，W下＝N下,而最小值均為0。顯然，區(qū)分度的最大值，只有當“上位群”全部成功，而“下位群”全部失敗時才會得到。從而，可得到計算區(qū)分度指數(shù)的公式：d＝︱W上－W下︱/0.25N（課本50例2.11）一般認為，區(qū)分度指數(shù)至少應(yīng)達到0.20。（2）項目區(qū)分度檢驗：所謂項目的區(qū)分度，是指該項目的測驗成績84（3）項目間的相關(guān)分析：

理想的成套測驗，要求各項目之間的相關(guān)程度要低，若項目間呈高度相關(guān)，則意味著這些項目所代表的是共同屬性，因而只采用其中的一項也不影響測量的效果。項目之間的相關(guān)程度可計算每兩項目間的積差相關(guān)系數(shù)或等級相關(guān)系數(shù)。（3）項目間的相關(guān)分析：853、成套測驗編制的注意事項（1）成套測驗編制必須遵循前面所談到的測驗編制基本原則和程序，并著重對成套測驗的有效性、可靠性和客觀性進行分析和研究。（2）成套測驗以3-5個項目組合為宜；（3）編制成套測驗時，必須要考慮綜合評價的問題。3、成套測驗編制的注意事項86（五）體育測試的實施

按照測驗的實施過程，體育測驗的組織實施過程分為三個階段。（五）體育測試的實施按照測驗的實施過程，體育測驗的組871.測驗前的準備工作

在測驗計劃確立后及測驗實施前，應(yīng)作如下準備工作：I．組建測試隊伍；II．組織測試者認真學(xué)習(xí)測驗計劃、測試細則，明確分工；III．測試實習(xí)；IV．準備測驗場地、設(shè)備和儀器；V．準備成績記錄的表格或測試卡片及其用具。1.測驗前的準備工作在測驗計劃確立后及測驗實施前882.測試工作的進行I．向受試者說明有關(guān)事項；II．準備活動；III．測驗前的練習(xí)；IV．必要的提示；V．思想鼓動。2.測試工作的進行I．向受試者說明有關(guān)事項；893.測試后的工作I．放松活動；II．整理測驗場地、設(shè)備及儀器；III．檢查所記錄的測驗成績；V．按原計劃及時分析處理測量資料。3.測試后的工作I．放松活動；90第二節(jié)體育評價的基礎(chǔ)理論

體育測量是將一些可以測得的物理量和非物理量轉(zhuǎn)換為數(shù)值或符號，進行資料匯集、信息收集的過程。評價則是對所獲得信息進行加工處理，通過科學(xué)地分析進而作出價值判斷，且賦予被測量事物或現(xiàn)象某種意義。所以說，測量是基礎(chǔ)，是前提；評價是結(jié)果，是目的。二者緊密聯(lián)系，不可分割。第二節(jié)體育評價的基礎(chǔ)理論體育測量是將一91一、體育評價的基礎(chǔ)知識（一）體育評價的概念評價是指評定事物的屬性或特征的價值。目的是在正確地解釋事物現(xiàn)狀的基礎(chǔ)上，為改善現(xiàn)狀和實現(xiàn)理想的目標而制定決策提供判斷依據(jù)。體育評價是指依據(jù)一定的標準，判斷體育測量結(jié)果，并賦予其價值或意義的過程。一、體育評價的基礎(chǔ)知識（一）體育評價的概念921、比較標準：是借助于標準化測量程序和統(tǒng)計方法，以及一定的評價量表而制訂的規(guī)范化的評價標準。現(xiàn)狀、大樣本測試。2、理想標準：（優(yōu)化標準）是指個體或群體經(jīng)過努力可能達到的標準。可用于個體或群體已具備的能力水平與應(yīng)達到的能力水平進行比較。例：父母身高推測子女未來身高。3、個體標準：（特色標準）根據(jù)個體在不同時期、不同狀態(tài)下的測量結(jié)果制訂的標準。體育評價的標準1、比較標準：是借助于標準化測量程序和統(tǒng)計方法，以及一定的評93比較標準是用于個體與個體之間，群體與群體之間現(xiàn)實水平進行比較的評價標準，理想標準是用于個體或群體己具備的能力和水平與可能達到的能力和水平進行比較的評價標準；個體標準則用于對同一個人不同時期，不同狀態(tài)之下的指標進行比較的評價標準。所以說，評價的目的任務(wù)不同，所使用的評價標準也不同。在實際應(yīng)用中，有時根據(jù)需要還可把以上三種標準結(jié)合使用。比較標準是用于個體與個體之間，群體與群體之間現(xiàn)實水平進行比較94（二）體育評價的基本形式

在體育實踐中，根據(jù)診斷目的，體育評價有三種基本形式：

1.診斷性評價診斷性評價，又稱初始評價，是指在教學(xué)和訓(xùn)練開始前的評價。其主要目的是為了解學(xué)生的身體、能力、技能等狀況及初始水平，做到心中有數(shù)，并且可根據(jù)初始狀況、水平進行分組教學(xué)與訓(xùn)練，以達到因材施教、獲得最佳效果的目的。（二）體育評價的基本形式在體育實踐中，根據(jù)診斷目的，體952.形成性評價形成性評價，又稱階段性評價。教學(xué)和訓(xùn)練是分階段進行的，在確定整個教學(xué)和訓(xùn)練總目標的同時，也要確定若干個階段性目標。形成性評價，就是把某一教學(xué)或訓(xùn)練的總目標分解稱若干個階段目標，并在教學(xué)和訓(xùn)練過程中隨時檢查評定階段目標完成的情況，以便及時反饋有關(guān)計劃的完成情況，并為最終達到教學(xué)和訓(xùn)練總目標而不斷地調(diào)整、改善、控制整個教學(xué)和訓(xùn)練過程。故形成性評價是科學(xué)地控制、調(diào)整、改進教學(xué)與訓(xùn)練的中心環(huán)節(jié)。2.形成性評價形成性評價，又稱階963.終結(jié)性評價終結(jié)性評價，又稱終末性評價。是指在教學(xué)、訓(xùn)練過程的最后（如學(xué)期、學(xué)年末或訓(xùn)練周期末）進行的評價。它主要對學(xué)生體能、機能、成績和身體能力的提高及體質(zhì)的增強、個體的進步等方面進行評價，確定個體在集體中的位置以及進行不同群體間的相互比較。通過終結(jié)性評價可以獲得全面的反饋信息，以檢查教學(xué)或訓(xùn)練方法、手段的效果，總結(jié)經(jīng)驗，發(fā)現(xiàn)問題，為確定下一階段教學(xué)和訓(xùn)練的目標提供科學(xué)的依據(jù)。3.終結(jié)性評價終結(jié)性評價，又稱97二、體育評價量表及常用評價方法有了評價標準以后，如何對個體或群體進行評價，則需要制定一種標尺，即制定評價量表。評價量表是指能辨別事物屬性、特征價值的一種標尺，它是用統(tǒng)計方法把測量獲得的實測值轉(zhuǎn)換為一組導(dǎo)出數(shù)據(jù)所組成的參照標準。在體育測量中，常見的評價量表主要有兩種：分值量表和等級量表。二、體育評價量表及常用評價方法有了評價標準以后，如何對個體或98（一）分值量表是以分值對事物的屬性或特征進行評價的量表。1、標準分評分量表2、百分位評分量表3、累進評分量表（一）分值量表是以分值對事物的屬性或特征進行評價的量表。991、標準分量表

標準分量表是以標準差為單位劃分評價等級或分數(shù)區(qū)間值的一種評價量表。三個特點：以標準差為單位劃分評價等級的間距，成績的遞增或遞減的間距是相等的。適用方便、廣泛，在正態(tài)分布表上容易查出某個成績范圍內(nèi)的人數(shù)占總?cè)藬?shù)的百分比。在多指標、計量單位不一的綜合評價中，它可以把原始測量值全部換成標準分（是相對分值），可以相互比較，并能進行算術(shù)運算，這就更加顯示其優(yōu)越性。1、標準分量表標準分量表是以標準差為100（1）Z分量表

Z分量表是一種最基本的標準分量表，它把平均數(shù)定為0分，相差1個標準差為1分。Z分的計算公式為：田賽：徑賽：式中：X－實測值（成績）；－平均值；S－標準差由于原始數(shù)據(jù)服從正態(tài)分布，故X分一般在－3～+3之間。一般轉(zhuǎn)化為T分量表。（1）Z分量表Z分量表是一種最基本的標準分量表101（2）T分量表

為了是Z分全變?yōu)檎龜?shù)，可將Z分的計算公式做簡單變換，便得到T分計算公式：田賽：

徑賽：

即有：T＝10Z+50

（2）T分量表為了是Z分全變?yōu)檎龜?shù)，可將Z分的計102（3）標準分量表

標準分量表：T分的滿分為100分，如果滿分取值一般化的值，如20分、25分、50分等，則應(yīng)該制定一般化的量表。設(shè)滿分為A，考慮到原始成績的范圍為（,），則相差1個單位，標準分相差為：顯然的，分數(shù)相差1分，則該項成績應(yīng)該相差：（3）標準分量表標準分量表：T分的滿分為100分103例：測得某市10歲男生立定跳遠成績，經(jīng)計算，＝149.7cm，S＝15.3cm，試制定該市10歲男生的立定跳遠成績的標準分評分表（滿分為20分和100分）例：測得某市10歲男生立定跳遠成績，經(jīng)計算，＝149.7c104A：20分制標準量表制定方法解：當A＝20時根據(jù)將＝149.7cm定在10分位置上，則可以制表。A：20分制標準量表制定方法解：當A＝20時105得分成績得分成績20919818717616515414313212111010149.7得分成績得分成績2091981871761651541431106得分成績得分成績20919818717616515414313212111154.3010149.7得分成績得分成績2091981871761651541431107得分成績得分成績209145.119818717616515414313212111154.3010149.7得分成績得分成績209145.119818717616515108得分成績得分成績20195.79145.119191.18140.518186.57135.917181.96131.316177.35126.715172.74122.114168.13117.513163.52112.112158.91108.311154.30103.710149.7得分成績得分成績20195.79145.119191.181109A：100分制標準量表制定方法解：當A＝100時根據(jù)將＝149.7cm定在50分位置上，則可以制表。A：100分制標準量表制定方法解：當A＝100時110得分成績得分成績49149.7-0.91851149.7+0.91850149.7得分成績得分成績49149.7-0.91851149.7+0111得分成績得分成績10045149.7-0.918×5954090358530802575207015651060555149.7+0.918×5＝154.29050149.7得分成績得分成績10045149.7-0.918×59540112得分成績得分成績10045954090358530802575207015651060555154.3050149.7得分成績得分成績1004595409035853080257113得分成績得分成績10045145.1954090358530802575207015651060555154.3050149.7得分成績得分成績10045145.1954090358530114得分成績得分成績100195.745145.195191.140140.590186.535135.985181.930131.380177.325126.775172.720122.170168.115117.565163.510112.160158.95108.355154.30103.750149.7得分成績得分成績100195.745145.195191.11152.百分位評分量表

百分位評分量表，是以百分位數(shù)為單位劃分評價等級或分數(shù)區(qū)間值的一種評價量表。這種評價量表有如下特點：對資料的分布沒有特殊要求：適合于正態(tài)以及非正態(tài)分布的資料；量表的分數(shù)直接反映了相應(yīng)的成績在群體中所處的位置；百分位數(shù)只是一種序數(shù)，不能進行算術(shù)運算。中等成績分值偏高，兩端成績分值偏低.2.百分位評分量表百分位評分量表，是以百分位數(shù)為單位劃116

將樣本數(shù)據(jù)由小到大排序（田賽），然后再100等分，如果成績X對應(yīng)的H等分位置，則X的位置百分為H。比如：共有n＝250人，某人的成績排序號為150，則其位置百分為這種量表的分數(shù)直接反映了相應(yīng)的成績在群體中的位置所處的位置。告訴我們比此成績低的人數(shù)百分比。一般用于生長發(fā)育的評價和群眾性鍛煉效果的評價。將樣本數(shù)據(jù)由小到大排序（田賽），然后再100等分，如果117

百分位數(shù)是指位置百分所對應(yīng)的原始數(shù)據(jù)，若X的位置百分為H，則H的百分位數(shù)為X，記為PH。所以，求百分位數(shù)是位置百分的逆運算。其公式可以表示為：式中：L－PH所在組的組下限；fx－組頻數(shù)；i－組距；n－總?cè)藬?shù)；C－PH所在組上一組的累積頻數(shù)。百分位數(shù)是指位置百分所對應(yīng)的原始數(shù)據(jù)，若X的位置百分為1183.累進評分量表累進評分量表是根據(jù)累進計分法制定的評價表，其主要特征是能使分值增加的幅度與成績提高的難度相適應(yīng)。一般來說，水平越高，成績每提高0.1s的難度也愈大，所以相應(yīng)增加的分值也就應(yīng)愈高。對優(yōu)秀運動員有利，對成績差的人明顯不利，因而它不適合對群眾性體育鍛煉進行評價。3.累進評分量表累進評分量表是根據(jù)累進計分法制定的評價表，其119（二）等級評分量表等級評價量表一般定為五個等級：上等、中上等、中等、中下等、下等或稱優(yōu)、良、中、下差。常用離差法、百分位法制定等級評價量表，對于多指標也實用回歸法制定等級量表。（二）等級評分量表等級評價量表一般定為五個等級：上等、中上等120作業(yè)：1、怎樣選擇測驗指標？2、簡單敘述測驗編排的基本程序。3、測驗的編制有哪些基本原則？4、體育評價的作用與意義是什么？5、評價的基本形式有幾種？6、評價的類型有哪幾類？各類評價的目的是什么？作業(yè)：121第二章體育測量與評價的基礎(chǔ)理論第二章體育測量與評價的基礎(chǔ)理論122第一節(jié)體育測量的基礎(chǔ)理論體育測量是體育教學(xué)、運動訓(xùn)練和體育科研的重要基礎(chǔ)。只有實施科學(xué)的測量，才能獲得準確而可靠的數(shù)據(jù)，并通過分析和研究，得出科學(xué)的結(jié)論。為了收集準確的資料，獲得可靠的信息，達到測量的目的，必須在體育測量的理論指導(dǎo)下實施測量。第一節(jié)體育測量的基礎(chǔ)理論體育測量是123一、體育測量的基本概念

A:物理量測量：身高、體重、跳高高度、跳遠遠度、血壓等；

（一）測量測量（史蒂文斯）：是根據(jù)法124（二）測量的要素測量的要素：待測屬性或特征、法則和數(shù)字符號。A.待測屬性或特征：由于測量的目的就是反映事物的屬性或特征，它是測量的第一要素。舉例：100米、立定跳遠、靈敏性、心理素質(zhì)、技戰(zhàn)術(shù)水平、意志品質(zhì)等。B.法則：能有效衡量事物屬性的規(guī)則和尺度，或是能顯示事物屬性的程序。舉例：身高的測量、心理素質(zhì)的測量（二）測量的要素125心理素質(zhì)的測量（包含認識能力、情緒和情感品質(zhì)、意志品質(zhì)、氣質(zhì)和性格等。如測量智力量表：比奈－西蒙智力量表，韋克斯勒成人智力量表，瑞文智力量表等）。C.數(shù)字符號：數(shù)字的含義與測量內(nèi)容相關(guān)。心理素質(zhì)的測量（包含認識能力、情緒和情感品質(zhì)、意志品質(zhì)、氣質(zhì)126（三）測量量表測量量表：是指測量所獲得數(shù)據(jù)屬性的表述規(guī)則（反映表示測量結(jié)果的數(shù)字符號的性質(zhì)和類型）。這種規(guī)則由實數(shù)列的諸特性所決定的，這些特性包括：

A.順序：兩個或兩個以上的實數(shù)有次序之分、大小之分；B.距離：兩個實數(shù)之間的差距可以描述；C.原點：對應(yīng)于零位數(shù)的那一點（絕對零點和相對零點）。（三）測量量表127測量量表的分類1、名稱量表不含實數(shù)列的任一特性，即無順序、無距離、無原點。是各種測量尺度中含信息量最少、最低級的一種測量尺度。（如運動員的號碼）2、有序量表有序量表含有實數(shù)列的順序特性，但無距離、無原點。其信息量比名稱量表要豐富，屬于低等級的測量尺度。（比賽名次）測量量表的分類1283、等距量表等距量表含有實數(shù)列的順序、距離特性，但無原點。等距量表又較有序量表含信息量多，屬高等級的測量尺度。（角度、高度）4、比例量表比例量表具有實數(shù)列順序、距離、原點的全部特性。其含信息量最多，屬于最高級量表。（運動水平、進步率、進步度）3、等距量表129四種測量尺度的特征、功能和適用的統(tǒng)計分析方法表：特點基本功能數(shù)字特征適用的統(tǒng)計方法名稱量表分類、標記＝≠百分比，卡方檢驗，列聯(lián)相關(guān)系數(shù)有序量表順序可按照次序排列＞＜中位數(shù)，百分位數(shù)，等級相關(guān)，非參數(shù)檢驗等距量表距離差距的確定與比較＋－算術(shù)平均數(shù)，標準差，積差相關(guān)，參數(shù)檢驗比例量表原點比值的確定與比較×÷幾何均數(shù)四種測量尺度的特征、功能和適用的統(tǒng)計分析方法表：特點基本功能130（五）測量的類型：不同的分類標準A.按測量方法分類：直接測量和間接測量。B.按測量屬性分類：物理量測量和非物理量測量。C.按測量的組織形式分類：連續(xù)性測量和橫斷面測量。（六）體育測驗的類型1、按測試者人數(shù)分類（1）單個測試者的測驗：以一個測試者的測量值作為受試者的測驗值。如身高、體重等測驗。（2）多個測試者的測驗：多個測試者同時對某個受試者進行測量，以多個測試者測量結(jié)果的綜合值作為受試者的測驗值。（五）測量的類型：不同的分類標準1312、按重復(fù)測量次數(shù)分類在體育測量中，測量次數(shù)的確定和測量結(jié)果取值方式有以下幾種情況：（1）測一次受試者需要承受極限生理負荷完成的測驗。如一般耐力測驗，一般只測一次。

對于瞬時性、損傷性和操作難度大的測驗，如運動后即刻脈搏、血壓、血乳酸、肌肉活檢及其它生理生化指標的測驗。一般只測一次。

對于測量誤差很小，可靠性較高的測驗，如形態(tài)測量中的身高、體重等，一般只測一次。2、按重復(fù)測量次數(shù)分類在體育測量中，測量次數(shù)的確定和測量結(jié)果132（2）可以測2-3次或多次。持續(xù)時間短的大強度非極限負荷的最大能力測驗，如立定跳遠、投擲和靈敏性等測驗。（3）重復(fù)次數(shù)較多的測驗對于負荷小，但測量結(jié)果波動大，敏感和易受干擾的測量驗，如反應(yīng)時或感知覺測驗，為減少隨機誤差，重復(fù)測量的最佳次數(shù)為30次。觀測值可取測驗的平均值或總和，如果除去測驗中的最高和最低的成績，取其余測驗成績的平均值作為觀測值則更好。（2）可以測2-3次或多次。133（七）測量誤差定義：是指與測量目的無關(guān)的變因產(chǎn)生效應(yīng)，所引起的觀測值與真值之間的差異。誤差的分類：1.隨機誤差2.系統(tǒng)誤差3.過失誤差4.抽樣誤差（七）測量誤差定義：是指與測量目的無關(guān)的變因產(chǎn)生效應(yīng)，所引起1341隨機誤差隨機誤差又稱為偶然誤差，指在測量中由一些主觀或客觀偶然因素引起，又不易控制的測量誤差。隨機誤差隨著測量次數(shù)的增加，其變化會呈現(xiàn)一定規(guī)律性。它總是圍繞被測量的真值波動（真值以重復(fù)測試的均值為代表）。推論：除標準化測試外，增加測量次數(shù)也是減少隨機誤差的有效辦法。1隨機誤差隨機誤差又稱為偶然誤差，指在測量中由一些主觀或1352系統(tǒng)誤差系統(tǒng)誤差，是指在測量中，由于儀器未校正至測試要求，或?qū)y量條件掌握過寬或過嚴，而使測量結(jié)果出現(xiàn)規(guī)律性的偏大或偏小。后果：使數(shù)據(jù)統(tǒng)計結(jié)果偏離方向。消除辦法：嚴格執(zhí)行標準化測量，隨時檢查，及時發(fā)現(xiàn)并糾正錯誤。另外，通過增加測量次數(shù)，也可以將由于測量方法掌握過寬或過嚴而產(chǎn)生的系統(tǒng)誤差轉(zhuǎn)化為隨機誤差，使其降低到最低程度。2系統(tǒng)誤差系統(tǒng)誤差，是指在測量中，由于儀器未校正至測試要求1363過失誤差過失誤差，指在測量中由于測試者過失所造成的誤差，如測錯、讀錯、記錯。這類誤差只要認真負責，加強測試者的責任心，并加強測試現(xiàn)場的監(jiān)督檢查，嚴格管理并執(zhí)行驗收制度。在最后資料整理過程中再進一步檢查、鑒別、舍棄，就會避免或減少由于過失誤差而得出錯誤統(tǒng)計結(jié)論。3過失誤差過失誤差，指在測量中由于測試者過失所造成的誤差，1374抽樣誤差抽樣誤差是由于抽樣的原因而引起樣本統(tǒng)計量與總體參數(shù)之間的差異。測量中雖嚴格遵守抽樣原則，但不論用何種方法抽樣，從總體中抽取樣本進行研究，樣本統(tǒng)計量與總體參數(shù)都不會完全一致，這是因為個體之間差異是客觀存在的，即使采取隨機抽樣仍然無法避免樣本統(tǒng)計量與總體參數(shù)之間的差異。4抽樣誤差抽樣誤差是由于抽樣的原因而引起樣本統(tǒng)計量與總體參138

經(jīng)典測量理論的基本假設(shè)：真值的含義：“實測值”（簡稱X）：測量對象的某種測量內(nèi)容（或特征）經(jīng)測量后表現(xiàn)為一個數(shù)值。也稱“觀測值”、“觀測數(shù)”、“測量所得的值”、“實測分數(shù)”、“觀察分數(shù)”、“原始觀測數(shù)”等。“真值”，也稱“真分數(shù)”（簡稱T）：反映測量對象（或受試者）某種特征的真正水平（或能力）的那個數(shù)據(jù)。T和X的關(guān)系怎樣？經(jīng)典測量理論的基本假設(shè)：139

測量誤差可以使用下式表示：

公式（2－1）給出了總測量誤差，即由測量值推測真值存在的誤差。依據(jù)測量過程的分解，可以將總誤差分解為測試者誤差、受試者誤差和指標誤差三部分。誤差的來源1.測試者2.受試者3.指標誤差2.測量誤差的分解公式（2－1）給出了總測量誤差142測試者誤差在第I過程中，現(xiàn)象真值（T）是確定的，而測量值（X）與之有差異，很明顯，誤差來源是測試者。第I過程中的測量誤差稱為測試者的誤差。誤差來源于測試者，（包括測試者測量方法的正確，對測量的重視程度，測量條件等。），這類誤差稱為測試者誤差。測試者誤差在第I過程中，現(xiàn)象真值（T）是確定的，而測量值（X143受試者誤差：在第II過程中，相對于T1來說，T2是確定的。該過程的誤差表現(xiàn)為現(xiàn)象真值與指標真值之間的差異。造成這種誤差的原因有受試者本身、測量方法以及測試條件等多方面，但該誤差最終是通過受試者表現(xiàn)出來的，所以該過程的誤差稱為受試者誤差。受試者誤差：在第II過程中，相對于T1來說，T2是確定的。該144指標誤差：第III過程是通過指標真值去推測屬性的過程，其誤差大小主要決定于指標能否真實地反映測試屬性。如果測量指標中含有非待測屬性的因素較多，那么該過程的測量誤差較大。所以，這一過程的誤差主要來源于測量指標，又被稱為指標誤差。指標誤差：第III過程是通過指標真值去推測屬性的過程，其誤差145以上所述為一般性的測量過程和測量誤差的分解，在實際應(yīng)用中，具體到某一次測驗，可能沒有三個過程，測量誤差也可能不需要考慮三部分。例如，標槍我們一般不考慮測試者誤差，而主要考慮受試者誤差；而體操、武術(shù)等主管評分項目的比賽中，人們往往關(guān)心的是測試者的誤差。以上所述為一般性的測量過程和測量誤差的分解，在實際應(yīng)用中，具146產(chǎn)生誤差的原因：主觀原因是造成誤差的主要原因

受試者的具體情況：生理、心理狀態(tài)和配合程度；測試人員狀態(tài)：熟練程度、知識水平、責任心；測量方法：測量方法自身所產(chǎn)生的誤差；測試環(huán)境：溫度、海拔、天氣等；測試工具和儀器精度或不正確使用；抽樣誤差中樣本含量、抽樣方法、樣本量的代表性。產(chǎn)生誤差的原因：主觀原因是造成誤差的主要原因受試者的具體情147數(shù)學(xué)模型及其假設(shè)經(jīng)典測量理論假定，實測值（X）與真值（T）之間是一種線性關(guān)系，并只相差一個隨機誤差（E）：

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

體育測量與評價-第二章-體育測量與評價的基礎(chǔ)理論課件

文檔簡介

溫馨提示

最新文檔

評論

體育測量與評價-第二章-體育測量與評價的基礎(chǔ)理論課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔