用主成分分析模型構(gòu)造綜合評(píng)價(jià)指數(shù).doc_第1頁
用主成分分析模型構(gòu)造綜合評(píng)價(jià)指數(shù).doc_第2頁
用主成分分析模型構(gòu)造綜合評(píng)價(jià)指數(shù).doc_第3頁
用主成分分析模型構(gòu)造綜合評(píng)價(jià)指數(shù).doc_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

用主成分分析模型構(gòu)造中學(xué)考試綜合評(píng)價(jià)指數(shù) 摘要 在中學(xué)考試的綜合評(píng)價(jià)中,使用較多的指標(biāo)進(jìn)行描述使分析復(fù)雜化,難以對(duì)眾多指標(biāo)的影響作出正確的判斷,需要少量幾個(gè)“綜合評(píng)價(jià)指標(biāo)”。通過簡(jiǎn)單加權(quán)的合成方法,難以得到科學(xué)的結(jié)果。主成分分析是一種多元統(tǒng)計(jì)方法,可以將眾多指標(biāo)簡(jiǎn)化濃縮為少量幾個(gè)甚至一個(gè)綜合評(píng)價(jià)指標(biāo),使簡(jiǎn)化的指標(biāo)既能基本包括全部指標(biāo)具有的信息,又使指標(biāo)之間相互無關(guān),較好地解決了這一課題。關(guān)鍵詞 考試評(píng)價(jià);主成分分析;數(shù)學(xué)模型;計(jì)算步驟,指數(shù)構(gòu)造方法一、問題的提出在中學(xué)考試評(píng)價(jià)中,通常使用各學(xué)科的“平均分”、“優(yōu)秀率”、“及格率”和“低分率”等指標(biāo)。考慮到成績(jī)的分布狀況(“優(yōu)秀率”與“及格率”之間的差距偏大,可能失去部分信息量),某些地區(qū)還使用了“良好率”指標(biāo)。這樣,k個(gè)學(xué)科的考試評(píng)價(jià)的p項(xiàng)指標(biāo)將多達(dá)kp個(gè)。在對(duì)考試進(jìn)行綜合的評(píng)價(jià)時(shí),使用較多的指標(biāo)進(jìn)行描述不僅會(huì)增加評(píng)價(jià)的工作量,而且會(huì)因評(píng)價(jià)指標(biāo)間的相關(guān)性造成評(píng)價(jià)信息重疊,相互干擾,其結(jié)果使分析復(fù)雜化,難以對(duì)眾多指標(biāo)的影響作出正確的判斷。因此,需要少數(shù)幾個(gè)甚至一個(gè)“綜合評(píng)價(jià)指標(biāo)”來代替眾多的且相互之間具有相關(guān)關(guān)系的指標(biāo),同時(shí)又需要不失去原有指標(biāo)具有的信息量,這是考試評(píng)價(jià)中具有現(xiàn)實(shí)意義的課題。某些地區(qū)采用一種“降維”的方法,較成功地把kp維指標(biāo)降為p維指標(biāo),即在使用“總分平均分”的同時(shí),用“科平均率”取代各科的“率”(計(jì)算方法見備注1)。如何把p維指標(biāo)再合成為一個(gè)“綜合評(píng)價(jià)指標(biāo)”?采用一些簡(jiǎn)單加權(quán)的合成方法時(shí),由于對(duì)各指標(biāo)的影響不容易作出正確的定量化的判斷,及權(quán)數(shù)產(chǎn)生的科學(xué)性等問題,往往難以得到令人信服的科學(xué)的結(jié)果。主成分分析是一種多元統(tǒng)計(jì)方法,可以將眾多指標(biāo)簡(jiǎn)化濃縮為少數(shù)幾個(gè)甚至一個(gè)綜合評(píng)價(jià)指標(biāo),使簡(jiǎn)化的指標(biāo)既能基本包括全部指標(biāo)具有的信息,又使指標(biāo)之間相互無關(guān)。較好地解決了這一課題。二、主成分分析的數(shù)學(xué)模型= (X1,X2,Xp) (式11)設(shè)有n個(gè)樣品,每個(gè)樣品觀測(cè)p個(gè)指標(biāo)(變量):X1,X2,Xp, 得到原始數(shù)據(jù)矩陣:(i = 1,2,p)其中用數(shù)據(jù)矩陣X的p個(gè)列向量(即p個(gè)指標(biāo)向量)作線形組合(即綜合指標(biāo)向量)為:(i = 1,2,p)上述方程組要求:且系數(shù)ij由下列原則決定:、Fi與Fj(ij,i,j=1,p)不相關(guān);、F1是X1,X2,Xp的一切線性組合(系數(shù)滿足上述方程組)中方差最大的,F(xiàn)2是與F1不相關(guān)的X1,X2,Xp的一切線性組合中方差最大的,F(xiàn)p是是與F1,F(xiàn)2,F(xiàn)p-1都不相關(guān)的X1,X2,Xp的一切線性組合中方差最大的。這樣決定的綜合變量F1,F(xiàn)2,F(xiàn)p分別稱為原變量的第一,第二,第p主成分,其中F1的方差在總方差中占的比例最大,其余主成分F2,F(xiàn)3,F(xiàn)p的方差依次遞減。在實(shí)際工作中挑選前幾個(gè)甚至一個(gè)最大主成分F1,就能夠基本包括全部指標(biāo)所具有的信息,達(dá)到了將眾多指標(biāo)簡(jiǎn)化濃縮為少數(shù)幾個(gè)甚至一個(gè)綜合評(píng)價(jià)指標(biāo)的目的。三、主成分分析的計(jì)算步驟及實(shí)例求解滿足上述要求的方程組系數(shù)ij的運(yùn)算,在數(shù)學(xué)上可以變?yōu)榍蠓匠探M中的系數(shù)向量,即矩陣的特征值及其相應(yīng)的單位特征向量的問題。建立模型時(shí),首先將原始數(shù)據(jù)寫成矩陣,如(式11)。注意:原始數(shù)據(jù)矩陣X的p個(gè)指標(biāo)需要有一定的聯(lián)系,而且為正相關(guān)(如果為負(fù)相關(guān),需要進(jìn)行相應(yīng)的轉(zhuǎn)化)。1、將原始數(shù)據(jù)標(biāo)準(zhǔn)化。2、建立變量的相關(guān)系數(shù)矩陣:R =(rij)pp 不妨設(shè)R=XX3、求R的特征值12p 0 及其相應(yīng)的單位特征向量:4、寫出主成分: Fi = a1iX1 + a2iX2 + + aPiXP i = 1, ,p5、計(jì)算第j個(gè)主成分(特征值)的方差貢獻(xiàn)率及前幾個(gè)主成分的累計(jì)方差貢獻(xiàn)率。選取累計(jì)貢獻(xiàn)率大于某值(如定為90%、95%、99%等)的前幾個(gè)主成分。6、對(duì)選取的主成分進(jìn)行解釋或分析。主成分分析計(jì)算過程舉例:對(duì)青島市中考的5項(xiàng)指標(biāo)作主成分分析,原始數(shù)據(jù)如附表1:由于“低分率”指標(biāo)與其他指標(biāo)之間呈顯著的“負(fù)相關(guān)”,直接代入必然產(chǎn)生嚴(yán)重的干擾,故實(shí)際寫入矩陣時(shí)該指標(biāo)以“100% - 低分率”的形式出現(xiàn)。第一步、將原始數(shù)據(jù)標(biāo)準(zhǔn)化。第二步、建立變量的相關(guān)系數(shù)矩陣R如下:X1X2X3X4X5X11.0000.8850.9420.9790.989X20.8851.0000.9660.9330.818X30.9420.9661.0000.9830.889X40.9790.9330.9831.0000.949X50.9890.8180.8890.9491.000表1、相關(guān)系數(shù)矩陣R第三步、求特征值、特征向量和方差貢獻(xiàn)率主成分特征根方差貢獻(xiàn)率累計(jì)貢獻(xiàn)率14.735094.7094.7020.22984.6099.3030.02870.5799.8740.00510.1099.9750.00130.03100.00表2、特征根和方差貢獻(xiàn)率從表2看,前2個(gè)特征值累計(jì)貢獻(xiàn)率已達(dá)99.30%,說明前2個(gè)主成分包括了全部指標(biāo)具有的99.30%的信息,我們?nèi)∏?個(gè)特征值,并計(jì)算出相應(yīng)的特征向量。第一特征向量第二特征向量0.4530120.3363460.434557-0.6421300.451546-0.3209310.4576400.0089460.4388760.609478表3、單位特征向量第四步、寫出主成分:第一主成分 F1 = 0.453012X1 + 0.434557X2 + 0.451546X3 +0.457640X4 + 0.438876X5第二主成分 F2 = 0.336346X1 - 0.642130X2 - 0.320931X3 + 0.008946X4 + 0.609478X5 第五步、分析。從第一主成分F1的各項(xiàng)指標(biāo)的系數(shù)大小基本相當(dāng)可見:這5個(gè)指標(biāo)對(duì)F1的作用也基本相當(dāng)?!傲己寐省敝笜?biāo)的系數(shù)(0.451546)甚至略大于“優(yōu)秀率”指標(biāo)的系數(shù)(0.434557)。從第二主成分F2的各項(xiàng)指標(biāo)的系數(shù)分析可見:“低分率”指標(biāo)(0.609478)對(duì)F2的作用最大。本例說明把“良好率”和“低分率”納入指標(biāo)考核的體系是有必要的(某些地區(qū)未采用這2個(gè)指標(biāo))。四、構(gòu)造綜合評(píng)價(jià)指數(shù)的方法 方法一:利用主成分F1, ,F(xiàn)m作線性組合,并以每個(gè)主成分Fi的方差貢獻(xiàn)率i作為權(quán)數(shù)構(gòu)造一個(gè)綜合評(píng)價(jià)函數(shù): y = a1F1 + amFm y也稱為評(píng)估指數(shù),可以依據(jù)對(duì)每個(gè)樣品計(jì)算出的y值大小進(jìn)行排序或分類劃級(jí)。在上述例子中,青島市中考指標(biāo)主成分分析的綜合評(píng)價(jià)函數(shù)可以表述為: y = 4.7350 F1 + 0.2298 F2方法二:只用第一主成分F1作綜合評(píng)價(jià)指數(shù)。在本例中,第1個(gè)特征值累計(jì)貢獻(xiàn)率已達(dá)94.70%,說明第一主成分已經(jīng)基本包括了主要指標(biāo)具有的信息。當(dāng)主成分特征向量的各分量符號(hào)不一致時(shí)(如本例第二主成分F2),只用F1作綜合評(píng)價(jià)指數(shù)是適宜的。青島市中考指標(biāo)主成分分析的結(jié)果見附表1。該表中分別列出了“第一主成分F1指數(shù)”和“綜合評(píng)估指數(shù)”的數(shù)值、標(biāo)準(zhǔn)分值Z及其排序名次。用一個(gè)權(quán)數(shù)陣而得出去乘當(dāng)原來的指標(biāo)X1,XP 的重要程度存在較大差異時(shí),可以對(duì)原來指標(biāo)輔以加權(quán)“加權(quán)主成分分析”,相當(dāng)于:其中 m = m1 + + mp =1,然后對(duì)y值作主成分分析。五、用計(jì)算機(jī)軟件自動(dòng)實(shí)現(xiàn)主成分分析的過程掌握主成分分析的數(shù)學(xué)模型需要一定的高等代數(shù)如矩陣運(yùn)算的基礎(chǔ)知識(shí);進(jìn)行實(shí)際計(jì)算的工作量十分繁雜;以通用的Excel軟件不可能實(shí)現(xiàn)其計(jì)算過程;等等,都限制了該方法在基層教研部門的普及應(yīng)用,甚至在國(guó)內(nèi)中心城市教研室中的應(yīng)用也尚不普遍。曾見有關(guān)文獻(xiàn)介紹“陜西省高中會(huì)考綜合評(píng)價(jià)的主成分分析模型及應(yīng)用”的經(jīng)驗(yàn)。用計(jì)算機(jī)軟件實(shí)現(xiàn)主成分分析綜合評(píng)價(jià)的過程,并在基層教研部門甚至重點(diǎn)中學(xué)進(jìn)行普及應(yīng)用具有重要的意義。筆者設(shè)計(jì)的大中型城市教研室成績(jī)匯總、統(tǒng)計(jì)分析系統(tǒng)GSAS 軟件設(shè)有“主成分分析綜合評(píng)價(jià)”模塊,可完成數(shù)據(jù)采集、負(fù)相關(guān)轉(zhuǎn)化、標(biāo)準(zhǔn)化、計(jì)算分析、構(gòu)造評(píng)價(jià)指數(shù)和排序的全部過程,主要功能有:1、選擇評(píng)估對(duì)象??蛇x擇“全部地區(qū)”(以市、縣、區(qū)為單位評(píng)估),也可選擇“全部學(xué)?!被颉澳车貐^(qū)學(xué)校”(以學(xué)校為單位評(píng)估),也可以在軟件的“學(xué)校版” 內(nèi)運(yùn)行,即在校內(nèi)以班級(jí)為單位評(píng)估等。2、選擇評(píng)估科目??蛇x擇“匯總指標(biāo)”,對(duì)考試進(jìn)行評(píng)估,也可選擇“單科指標(biāo)”,對(duì)某個(gè)科目評(píng)估。3、加權(quán)主成分分析。模塊具有“權(quán)數(shù)”設(shè)置的條件。例如某次考試為了強(qiáng)調(diào)“及格率”在整體評(píng)價(jià)目標(biāo)中的作用,可加大該指標(biāo)的權(quán)數(shù),而相應(yīng)減小其他指標(biāo)的權(quán)數(shù)。如果想把“考試評(píng)價(jià)”擴(kuò)展為更廣義的“教學(xué)評(píng)價(jià)”,在評(píng)價(jià)指標(biāo)體系中加入“鞏固率”(實(shí)際考試人數(shù)/在冊(cè)學(xué)生人數(shù))、“科平差生轉(zhuǎn)化率”、等指標(biāo),也是完全可以實(shí)現(xiàn)的。參考文獻(xiàn)、于秀林 任雪松編著多元統(tǒng)計(jì)分析中國(guó)統(tǒng)計(jì)出版社2003年4月、劉新平 劉存?zhèn)b編著教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論科學(xué)出版社 2003年6月、王漢瀾主編 教育評(píng)價(jià)學(xué) 河南大學(xué)出版社 1995年版 附表1、青島市中考指標(biāo)主成分分析統(tǒng)計(jì)表學(xué)校總分平均分科平優(yōu)秀率科平良好率科平及格率科平低分率第1主成分指數(shù)第1主成分指數(shù)Z第1主成分指數(shù)名次綜合評(píng)價(jià)指數(shù)綜合評(píng)價(jià)指數(shù)Z綜合評(píng)價(jià)指數(shù)名次育才444.9440.6268.4384.444.393.8561.77213.6091.7511超銀439.7439.7267.4884.384.123.7421.72023.5041.7002育文436.934.7668.6685.474.273.5311.63233.3221.612326中425.4738.3163.1378.618.443.0991.42442.8921.4034求真425.1732.9459.5179.824.752.8521.31152.6881.3055育賢422.5629.8561.5380.515.722.7291.25462.5801.2526智榮422.1932.2259.878.436.822.6941.23872.5361.2317長(zhǎng)泰421.9131.458.1578.386.282.6091.19982.4621.1958志成416.929.8257.3877.917.072.4221.11392.2891.111939中412.5930.7355.7274.499.12.2131.017102.0831.01110新興404.8825.9851.971.989.251.6980.780111.6140.78311七中396.8326.9850.0468.9310.671.4860.683121.4060.68212濱海396.8623.8451.770.4511.421.4020.644131.3360.6481347中386.9224.1247.1966.8613.211.0210.469140.9710.4711459中380.5625.748.1364.7516.230.9240.425150.8650.4201549中302.929.5425.5739.3134.94-2.643-1.21452-2.491-1.2095227中283.676.5218.3932.7938.86-3.513-1.61553-3.312-1.6075364中273.758.6220.7232.7242.51-3.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論