




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、畢畢 業(yè)業(yè) 論論 文文題題 目目 主成分分析法在 SPSS 中的操作及在 學生成績評價中的應用 學學 院院 數(shù)學科學學院 專專 業(yè)業(yè) 數(shù)學與應用數(shù)學 班班 級級 數(shù)學 1302 班 學學 生生 朱越文 學學 號號 20130921154 指導教師指導教師 邢順來 二一七年五月二十日濟南大學畢業(yè)論文I摘 要主成分分析也稱主分量分析,是用降維的思想,把分析中較多的相關因素生成少數(shù)幾個無關綜合因素的一種方法。在多元統(tǒng)計方法中,主成分分析是一種基本的統(tǒng)計方法。它不單將多指標轉化為較少的綜合指標,并且能給出比較客觀的權重。在本文中,首先對主成分分析的基本原理、基本模型、幾何意義和求解主成分的方法進行介紹
2、。再依賴 SPSS 軟件實現(xiàn)主成分分析方法在成績分析的應用。本文采用的數(shù)據(jù)是濟南大學 2013 屆數(shù)學科學學院 1302 班的成績,對 SPSS 得出的結果進行分析評價,分析得出大學四年開設的所有課程主要與 11 個主成分因子有關,再對這 11 個因子進一步歸類,得出大學生考研與這 11 類主成分因子歸納出的 8 類因子有很大的關聯(lián)性,并依據(jù)結果再進行評價。使得教師根據(jù)這種分析方法,能夠給學生在大一到大三期間明確需要補漏的方向,從而提高學生的考研成功率。關鍵詞:主成分分析;SPSS;綜合指標;多元統(tǒng)計 濟南大學畢業(yè)論文IIABSTRACT Principal component analysi
3、s, is an analysis of ways to reduce the number of indicators into a few comprehensive indicators. Many of the revaluation methods of human factors, the principal component analysis as a basic statistical method, not only multi-indicators into less comprehensive indicators, and can give a more object
4、ive weight. In this paper, we first introduce the basic principle, basic model, geometric meaning and principal component method of principal component analysis. And the rely on SPSS software to achieve the application of principal component analysis in performance analysis. The data used in this pa
5、per are the results of 1302 classes of 2013 School of Mathematical Sciences in Jinan University. The results obtained from SPSS are analyzed and evaluated. All the courses offered by four years are mainly related to 11 principal component factors. The factors are further classified, and it is conclu
6、ded that the college entrance examination is of great relevance to the 7 factors of the 11 principal component factors, and the results are evaluated according to the results. So that teachers based on this analysis method, to the students clearly need to trap the direction of the students, so as to
7、 improve the success rate of students PubMed.Key words: Principal component analysis; SPSS; comprehensive index; multivariate statistics濟南大學畢業(yè)論文III目 錄摘要.IABSTRACT. . . . .II1 前言. . . .11.1 研究的背景和意義.11.2 研究的歷史和現(xiàn)狀.11.2.1 主成分評價的歷史.11.2.2 主成分評價的現(xiàn)狀.21.3 本文的結構安排.22 主成分分析.32.1 數(shù)學模型和幾何意義.32.1.1 數(shù)學模型.32.1.2
8、幾何意義.42.2 基本原理.62.2.1 基本定義和性質(zhì).62.2.1 總體主成分.62.2.1 樣本主成分.6 2.3 基本算法和步驟 .93 求解主成分.123.1 總體主成分.123.1.1 從協(xié)方差矩陣求解主成分.123.1.2 從相關陣求解主成分.123.2 樣本主成分.124 SPSS 軟件的簡單介紹.155 學生成績分析評價.175.1 主成分分析在 SPSS 中的具體操作步驟.175.2 對 SPSS 的輸出結果進行說明.185.3 對 SPSS 得出的數(shù)據(jù)進行分析評價.275.4 對分析結果要改進的地方進行說明.31結論. .33參考文獻.34致謝.35濟南大學畢業(yè)論文11
9、 前言1.1 研究的背景和意義 Karl Pearson 早在 1901 年就提出了“主成分”這一觀點,但僅僅只針對于非隨機變量,Harold Hotelling 基于此,在 1933 年把它延拓到了隨機變量這一領域8。 在多種研究領域中,經(jīng)常選取幾個因素進行分析,就是為了避免丟失重要的信息。在多元統(tǒng)計中這些“因素”也叫“變量”。比方說超市的業(yè)績時,會考察到很多因素,比如說收入、支出、進貨數(shù)量、進貨質(zhì)量、利潤等。全部都列舉出來的話,會有很多因素4。在考察問題時,若是要考慮很多因素,不只是會增加計算量那么簡單,將原本就簡單的問題變得不那么簡單,更甚者會使本來就有相關性的因素造成更多的信息重疊,這
10、會使得最后統(tǒng)計的結果的解釋能力變?nèi)?11?;貧w分析的時候,它的成效就因為研究的因素之間存在的多重共線性的問題而受到質(zhì)疑。所以人們想讓這些存在高度相關的變量有所“改變”,使原來因素中的絕大部分的信息能用極少的幾個無關的新的因素來表示,再對新的因素進行分析,從而能夠解決問題。對這幾個新變量再進行剖析時,在一定概率上可能再得到一個新的總指標,依這樣的方法分類,題目可能會解決了14。主成分分析(PCA)是旨在用降維的思想來解決問題的,也就是會使問題從高維降到低維來處理,正是解決上述文字情況的一類方法。它是一類最佳的能保證信息喪失最少,并能將有關的因素轉變生成較少的無關的因素的一種綜合的多元統(tǒng)計分析的方
11、法。在分析中,“主成分”就是轉變生成的新的指標 8。“主成分”是原始變量的一種線性無關組合。這這樣子解決問題時,只需要考慮轉變生成的新的指標就可以了,既能抓住首要矛盾,又不遺漏信息,使得新變量之間線性無關,更容易讓我們分析解決問題 14?;?SPSS 的主成分分析評價在很多方面都得到應用,例如對河流水質(zhì)評價的應用、對學生成績評價的應用、對公路客運量預測的應用、對工業(yè)經(jīng)濟效益的研究等等。而本文便是對學生平時成績進行分析評價11。1.2 研究的歷史和現(xiàn)狀1.2.11.2.1 主成分分析的歷史 主成分分析,首先是由英國生物統(tǒng)計學家的皮爾生(Karl Pearson)從非隨機變量引入的,爾后又由美國
12、的數(shù)理統(tǒng)計學家赫特林(Harold Hotelling)于 1933 年將這類方法推行到隨機向量。主成分分析從開始就為研究評價提供了有力的理論支持13。濟南大學畢業(yè)論文21.2.21.2.2 主成分分析的現(xiàn)狀在我國,南開大學的邱東教授為主成分分析做出了巨大貢獻,他對主成分分析進行了長期的研究。在此基礎上,還有許多專家學者也致力于對主成分分析的理論探究,有白雪梅、孟生旺等,并且在研究過程中,主成分分析綜合評價問題應用到了許多領域,例如在醫(yī)學、教育和環(huán)境等方面17。1.3 本文的結構安排本文整體結構分為五大章,概括如下:第一章:介紹了主成分分析的探究背景和意義,歷史及其現(xiàn)狀。第二章:先詳細介紹了主
13、成分分析的基本原理,又對主成分分析的數(shù)學模型及其幾何意義進行說明。 第三章:介紹如何求解主成分。第四章:對 SPSS 軟件進行簡單介紹。第五章:是基于主成分分析方法,利用 SPSS 軟件對學生的成績進行分析,對得出的結果評價。并對本文存在的不足進行說明。 濟南大學畢業(yè)論文32 主成分分析2.1 數(shù)學模型和幾何意義2.1.1 數(shù)學模型 主成分分析是一種旨在將多個變量用線性變換的方法來選出少數(shù)幾個的主要變量的多元統(tǒng)計分析方式。它是借助一個正交變換,將原本相干的隨機變量轉換成新的不相干變量8。在代數(shù)上這個角度來看,是將原隨機變量的協(xié)方差矩陣轉換成了對角陣;在幾何上這個角度來看,是將原坐標系轉化成新的
14、正交坐標系,使其指向樣本點散布最開的p個方向,從而實現(xiàn)對多維變量的一種降維7。在主成分分析中,特征值的提取依據(jù)的是最小均方誤差提取法6。 主成分分析的數(shù)學模型為:其中,是 p 個主成分。pzzz,21 那么主成分分析的基本分析步驟如下:(1)先對原有變量進行坐標變換,可得:ppppppppppxuxuxuzxuxuxuzxuxuxuz22112222121212121111其中:jijiiiiipkkkUxDUzzUxDUxDUzuuu)(),cov()()()var(1222221(2)提取系統(tǒng)中的主成分是第一主成分,它滿足的條件為:1zppppppppppXuXuXuzXuXuXuzXuX
15、uXuz22112222121212121111濟南大學畢業(yè)論文4)var(max)var(1111xuzuu是第二主成分,它滿足的條件為:2z)var(max)var(10),cov(22221XUzuuzz以此類推,得到其他的主成分。2.1.2 幾何意義 個指標,則品觀察個樣品,其中每一個樣問題中,有假定在我們探討的實際pn個個點。假設最終選取了維空間的個樣品便是維空間,這個指標將組成這mnpnpp。 。)()(。21nm。pm,y,yyYm主上就是用降維的思維空間來處理,這實際維空間問題轉換到么主成分分析就是把mp想8。相關關系,這就,并且這兩個變量之間和我們假設只有兩個變量21。xx個
16、樣則這組成的一個二維平面,和重疊信息。再由變量就意味著這兩個變量有nxx21品點在這個二維平面中分布的情況猶同橢圓狀。1y1x2x2y圖(1)濟南大學畢業(yè)論文5軸的方向都有很大軸方向還是個樣品點不管是沿著)可以看出這由圖(211xxn。來表現(xiàn)其中的離散水平的方差定量的表示可以的方差和的離散性,觀測變量21xx有非數(shù)據(jù)所包羅的信息將會中的任何一個,則原始和那么,假如只是考察21xx常大的損失。但如果細察橢圓的長短軸,就會發(fā)現(xiàn):在長軸的方向,有較大數(shù)據(jù)變化,取橢圓的短標軸取橢圓的長軸方向,坐小。那么坐標軸但是短軸方向變化卻很21yy軸方向,這就相當于做在平面上做一個坐標變換,也就是將原來的坐標軸依
17、逆時針方 8。21yy 和角度后,獲得新坐標軸向旋轉由旋轉變換公式cossinsincos212211xxyxxy矩陣形式為:的一個線性組合,它的、是原始變量、其中,2121xxyyXLxxyy2121cossinsincos是正交矩陣,它滿足:知識可知,是旋轉交換陣,由代數(shù)上式中,LLILLLL,1 的信息軸上,這對數(shù)據(jù)所保羅在數(shù)據(jù)信息大部分都集中經(jīng)過旋轉變換后,原來1y波動可以用個點的波動(上這)可以看出,二維平面圖(起到一個濃縮作用。從n1軸也就是短軸上的波,但在軸也就是長軸上的波動現(xiàn)在方差表現(xiàn))大部分是體21yy軸上的波考慮比較扁平,我們可以僅相差較大,那么橢圓就動卻很小。如果長短軸1
18、y空間來解問題就可以轉化到一維這樣一來,二維的空間軸上的波動可以忽略。動,2y濟南大學畢業(yè)論文6變量關系也不大。一個變量而不考慮問題時,即使僅考慮決。也就是在研究某些21yy大量分析表明,長短軸相差越大,橢圓越變平,降維也會越合理12。 關性(圖形中表現(xiàn)為的信息外,還具有不相,除了起著濃縮包含在,2121xxyy正交),這就使在探討復雜問題的時候避開了信息重疊時的虛假性。 探討多維變量構成的空間時,它們會構成一個高維橢球,不能直接觀察。每個變量都對應有一個坐標軸,則有幾個變量就有幾個坐標軸。首先要先把橢球的各個軸都找出來,再把最長的幾個軸作為新變量,這樣,主成分分析的降維也就完成了。 通過上述
19、分析可以得出,主成分分析的過程其實就是坐標系旋轉的過程,各個主成分與原來變量的線性關系其實就是新的坐標系與原始坐標系的變換關系10。在新的坐標系中,第一主成分所對應的坐標軸得方向是原始數(shù)據(jù)中波動最大的方向,依次是第二主成分所對的坐標軸方向,以此類推8。2.2 基本原理2.2.1 基本定義和性質(zhì)2.2.1.12.2.1.1 主成分的基本定義 個指標對應有個樣品,其中每個樣品際問題中,設有假定在我們所探討的實pn。設隨機變量為個隨機變量的問題,記個指標看成是,我們將這),(21pxxxXpp個指標問題,轉化要將這。那么主成分分析就是,它的協(xié)方差矩陣是均值是pX的新指標就的線性變換,那么產(chǎn)生問題。先
20、實現(xiàn)對個指標的一種線性組合為探討這Xp 學模型為:。那么主成分分析的數(shù)是主成分,記成pyyy,21XlxlxlxlyXlxlxlxlyXlxlxlxlyppppppppppp2211222221122112211111濟南大學畢業(yè)論文7則由上式,可得pjllyjjj, 2 , 1,)var(pkjllyykjkj, 2 , 1,),cov(,同時使得組合,即的而主成分是那些不相關)(0),cov(,21kjyyyyykjp組滿足這樣條件的中的方差盡可能大,但pkjkjyyypkjllyy, 2 , 1,),cov(21也滿足條件,但,機常數(shù)合若干個。因為對于隨jcyc pjllccyjjj,
21、2 , 1,)var(2會隨 c 的增大而無限增大,問題將變得沒有實際意義9。一種相對簡便的方法是僅考慮為單位長度上的一種系數(shù)向量,滿足jlpjllllljpjjjj, 2 , 1, 1, 122221即于是,我們給出主成分的下述定義5。定義 1 第的第為我們稱線性組合pppjjjjjxxxxlxlxlXly,212211個主成分。如果其系數(shù)向量滿足下列條件:), 2 , 1(pjj,即減,重要程度依次遞減)主成分的方差依次遞(最大;)最大方差條件:(;)正交條件:(;)正則條件:(4)var(3, 1, 2 , 1, 0211jjjkjjjllyjkjkllll)var()var()var(
22、21XlXlXlp 在實際探討中,常常只選取前面幾個方差最大的主成分作為原始變量進一步分析15。2.2.1.22.2.1.2 主成分的性質(zhì) 性質(zhì)(1) 主成分的協(xié)方差矩陣是對角陣,其對角線元素為特征根,p21,濟南大學畢業(yè)論文8即。p21varLLY)(證明:由于為的特征根,而是對應的特征向量,所以有。又因為jjljjjll , 2 , 1, 0)ycov(kjkjpkjllllllykjkkkjkj,。pjllllyjjjjjj, 2 , 1,)var(j所以,主成分的協(xié)方差陣是對角陣,且對角線元素為的特征根9。性質(zhì)(2) 協(xié)方差陣和的對角線元素之和(跡)相等,即)()(11trtrjpjj
23、jpj證明:,即。)()()()(trLLtrLLtrtrjpjjjpj11上述的性質(zhì)(2)說明主成分分析并未使總方差的大小發(fā)生改變。但主成分分析的目的是為了削減指標的個數(shù),所以一般是不會取 p 個主成分,而是僅留個)(pmm主成分,這就必定導致總方差的削減。若是忽略這后個主成分的方差在總方差p-m中所占的比例很小,那么不會給總方差帶來很大的影響11。 定義 2 把叫作第 j 個主成分的貢獻率,把稱為前 m 個主ipij1/jyipiimi11/成分的累計貢獻率8。myyy,21 根據(jù)問題的要求,可選取 m 個成分使得累計貢獻率能夠達到 75%85%。即只要用前 m 個主成分就能夠基本的反映個
24、體間差異,這樣既不會遺漏太多信息,又能夠達到削減指標的目的。m 個選擇可以借助 SPSS 中的碎石圖(Scree Plot)。 性質(zhì)(3) jjijil/)y,(xij證明:令為單位向量,第 j 個元素為 1,則,)0 , 0 , 1 , 0 , 0(jeXexjj濟南大學畢業(yè)論文9ijiijiiijijijijijllelelelXeXlXeyx)var(),cov(),(cov又因為,于是jjjiixy)var(,)var(jjijiijjijiijijijllyxyxyx)var()var(),(cov),( 定義 3 第 i 個主成分與原始變量它們之間的相關系數(shù)稱為因子載荷量。iyjx
25、 因子載荷量反映了原指標與主成分的關系的緊密程度,它為主成分解釋提jxiy供了相當重要的依據(jù)。在解釋主成分的含義或是第 j 個原始變量對第 i 個主成分的重要性時,可以根據(jù)因子負荷量絕對值的大小來說明。它的絕對值越靠近 1,表明與主成分的關系越緊密,對的解釋越重要;它的絕對值越靠近 0,表明jxiyjxiy與主成分的關系越疏遠,對的解釋越不重要14。jxiyjxiy定義 4 這 m 個主成分,它對原始變量的貢獻率為:m21,yyyjx2121j1),(ijimijjijmimlyx( 它反映了前 m 個主成分所能提取原始變量信息的比率,據(jù)此我們可以判斷提jx取的主成分解釋原始變量的能力。特別地
26、,時,也就是說 p 個主jxpm 1j)(p成分對的貢獻率為 1,這時不會造成信息的損失。若僅選個主成分,那jx)(pmm么它的貢獻率必然會小于 18。2.3 基本算法和步驟 1. 計算數(shù)據(jù)形成的相關陣 11。 2. 根據(jù)探討問題時是采用協(xié)方差陣求主成分,還是采用相關陣求主成分,是用所選定的初始變量的特征來判斷的。濟南大學畢業(yè)論文10 3. 求解協(xié)方差陣或相關陣的主成分的標準化的特征向量和特征根12。 4. 確定主成分個數(shù)。 可以遵循以下幾條原則16: (1)主成分的累計貢獻率。一般來說,在累計貢獻率達到 75%85%時就可以了。 (2)特征根。因為主成分的方差與特征根相等,則特征根可以看成是
27、主成分影響力度大小的指標??梢詢H保留那些能解釋至少的主成分,若是根據(jù)相關陣去求p1主成分,要保留大于 1 的那些特征根所對應的主成分。這種方法也缺少理論支持,盡少盲目使用。 (3)碎石圖。碎石圖的橫坐標是主成分,縱坐標是特征根。在 SPSS 中提供了這類方法。 (4)綜合判斷。大量的實踐證明,如果是根據(jù)累計貢獻率來確定主成分時,主成分個數(shù)往往偏多,而如果是采用特征根來確定主成分時,主成分個數(shù)又偏低。所以,先用碎石圖,觀察碎石圖比較平緩的時候所對應的主成分的個數(shù),再結合特征根和累計貢獻率,來確定主成分的數(shù)量。 (5)寫出主成分的表達式,計算各樣品的主成分得分。 若從原 p 個指標提取了 m 各主
28、成分,則ppmmmmppppxlxlxlyxlxlxlyxlxlxly22112222112212211111將這 n 個樣品的原始變量值代入上式,可以得到每一個樣品的主成分得分,進行后續(xù)的統(tǒng)計分析5。即后續(xù)的統(tǒng)計分析將不再使用原始的變量,而是采用提取的主成分。其基本流程圖為:濟南大學畢業(yè)論文11求相關矩陣 R求 R 的特征值和特征向量是否使用 PCA 模型否采用其他分析方法篩選整理原始數(shù)據(jù)原始數(shù)據(jù)的無量綱處理求解主成分是濟南大學畢業(yè)論文123 求解主成分3.1 總體主成分總體主成分3.1.1 從協(xié)方差矩陣出發(fā)求解主成分從協(xié)方差矩陣出發(fā)求解主成分設 p 維隨機向量的協(xié)方差矩陣為,則),(21p
29、xxxXpppppppp)(x),x(x),x(x),x(x)(x),x(x),x(x),x(x)(x2122221112112112122121211varcovcovcovvarcovcovcovvar的 p 個特征值是,其對應的 p 個單位化特征向量是。并p21plll,21設為 X 的主成分,則。)y,y,y(21pYLLXLY)()(varvar 引理 設 A 是 n 階對稱陣,其特征根為,對應的單位化特征n21向量為,則nlll,2111,2, 1,0supixxijxlAxxj且當時,二次型達到上確界。1ilxAxx 由定義 1 得:第一主成分,滿足時,最大;第二主成Xly111
30、11ll)(Xl1var分,滿足在及=0 即時,最大;Xly22122ll),cov(21XlXl021ll)(Xl2var第 j 個主成分,滿足在及即時,Xlyjj1jjll)(0),cov(jkXlXlkj0kjll最大;第 p 個主成分,滿足在及)(XlivarXlypp1ppll即時,最大。由引理可知,求)。p。,(kX)X,l(lkp1210cov0kpll)var(Xlp的主成分便是求協(xié)方差矩陣的特征根及對應的單位化特征向量6。),(21pxxxX3.1.2 從相關矩陣出發(fā)求解主成分從相關矩陣出發(fā)求解主成分 上述的3.1.13.1.1 是根據(jù)原始變量的協(xié)方差陣來求解主成分的,但這樣
31、的結果很容濟南大學畢業(yè)論文13易受原始的 p 個變量的計量單位和它量綱的影響。因為不同的量綱會導致各變量取值分散水平差異較大,這時總體方差主要容易受方差較大的變量的控制,而主成分分析是優(yōu)先考慮方差較大的變量,這會使它在主成分中所占的地位不同。為了減少由單位的不同及量綱的不同所帶來的一些不合理的影響,常常將各原始變量作標準化處理。令標準化變換后的變量為pjxxExzjjjj, 2 , 1,)var()( 此時向量的協(xié)方差陣是相關系數(shù)陣?;谙?,(21pzzzZppjixx),(關矩陣來求解主成分以及根據(jù)協(xié)方差陣來求解主成分是相似的。主成分也具有前面所述的各種性質(zhì),不同的是在形式上更為簡單7?,F(xiàn)
32、將對用的各種性質(zhì)總結如下: (1)主成分的協(xié)方差陣是對角陣 ,它的對角線元素是相關系數(shù)陣的特征根;p,21 (2);jpjpRtrtr1)()( (3)第 j 個主成分的貢獻率是,前 m 個主成分的累積方差貢獻率是;pj/pipj/1 (4);ijiijlyx),( (5)。2121) j (),(ijimiijmimlyx3.23.2 樣本主成分樣本主成分 上述的 3.13.1 中研究的是總體主成分,但在實際研究中,總體的協(xié)方差陣以及相關陣通常是未知的,需要通過樣本數(shù)據(jù)來估計,然后進行主成分分析15。設有n 個樣品,每個樣品觀察 p 個指標。設,則樣本數(shù)據(jù)可表示為8:),(21ipiiixx
33、xX),(211111nnpnpXXXxxxxX則總體協(xié)方差陣和相關陣分別可以用樣本協(xié)方差陣 S 和樣本相關陣 R 來估計)(11)(1XXXXnsSkknkppij濟南大學畢業(yè)論文14jjiiijijppijsssrrR,)(其中,。kinkijkjikinkijxnxxxxxns111, )(11以 S 替代,以 R 替代,依照總體主成分的求解方法可以求出樣本主成分。事實上,利用樣本數(shù)據(jù)來求解主成分的過程即求樣本相關陣的特征向量和特征根或樣本協(xié)方差的過程17。 若記標準后的變量為 Z。作標準化變換jjkjkjnknkjjkjjsxxzxnsxnx,)(11,12112 則標準化后的樣本協(xié)方
34、差陣 S 與相關陣 R 相同,且ZZnR11 利用標準化后得到的樣本數(shù)據(jù)來求解主成分就會變得更加簡便。濟南大學畢業(yè)論文154 對 SPSS 軟件的簡單介紹 SPSS 是當今世界上最優(yōu)秀的統(tǒng)計軟件之一,SPSS 的全稱為(Statistical Package for Social Science),也就是社會科學統(tǒng)計軟件4。它具有操作簡便、統(tǒng)計方法先進成熟,并且與其他軟件交互性好的特點,所以在自然科學、醫(yī)療衛(wèi)生、經(jīng)濟管理等方面被廣泛應用。自 1968 年以來,經(jīng)歷多次改革的 SPSS,現(xiàn)在的最新版本是 SPSS 24.0。IBM 公司于 2009 年把 SPSS 收購,現(xiàn)更名為 IBM SPS
35、S5。最新的 SPSS 又增加了一些新的功能模塊,使它的功能變得更加強大,操作上也更加突出它的個性化,也更好地適應了不同用戶對數(shù)據(jù)分析這方面的需求6。 因它是使用的圖形交互用戶界面,它的操作簡單且界面友好,使用戶僅通過菜單便能完成大部分的操作,而且它支持各種格式的數(shù)據(jù)軟件,并提供了多種應用軟件的接口。所以在本文的數(shù)據(jù)分析中,SPSS 是一種較方便的分析數(shù)據(jù)軟件。除了本文的主成分分析,在 SPSS 中還包含很多其他的分析方法,例如:描述性統(tǒng)計分析、方差分析、回歸分析、相關分析等4。SPSS 軟件不僅操作方便簡單友好,而且它也易學易用、易于閱讀。在對數(shù)據(jù)處理分析時,不再忙于編程和統(tǒng)計,而可以將時間
36、和精力集中在各種市場研究方法、社會研究方法、營銷業(yè)務等問題上。由于它的簡單易學,一般稍有基礎的學者學習幾天便可以用 SPSS 去做簡單的數(shù)據(jù)分析處理。但是若想真正地應用好 SPSS,要求研究使用者要掌握基本的數(shù)理統(tǒng)計知識,并能運用此軟件多進行實踐,在實際操作中掌握和了解得出的統(tǒng)計結果的實際意義。一般說來,SPSS 可以幫助數(shù)學基礎不夠的使用者來運用現(xiàn)代統(tǒng)計技術。操作者僅需考慮是采用哪種統(tǒng)計方法,并初步了解對分析結果的解釋,而不需要它具體的運算過程,就可以在參考使用手冊的基礎下完成對數(shù)據(jù)的定量分析。在 SPSS 軟件中采用 EXCEL 表格的方式錄入,是比較常用的數(shù)據(jù)接口,它能方便的從其他的數(shù)據(jù)
37、庫中錄入數(shù)據(jù)。在 SPSS 界面中包含很多常用和較成熟的統(tǒng)計方法,可以滿足非統(tǒng)計專業(yè)人士處理數(shù)據(jù)的需要。SPSS 的功能也很全面。它提供了數(shù)據(jù)的獲取、數(shù)據(jù)的準備和管理、數(shù)據(jù)的分析、結果報告這一整個的數(shù)據(jù)分析的完整步驟,所以它基本包括了數(shù)據(jù)分析的整個步驟,特別適合制作研究報告的相關圖表、設計調(diào)查方案、對數(shù)據(jù)進行統(tǒng)計分析4。并且,它也具有一整套對數(shù)據(jù)輸入、統(tǒng)計分析、編輯、圖形制作、表格等功能,僅僅在SPSS Base 中就包含了從簡單到復雜的多元統(tǒng)計法,例如生存分析、非參數(shù)檢驗、探索性分析、列聯(lián)表分析、統(tǒng)計描述、偏相關、秩相關、二維相關、一元方差分析、協(xié)方差分析、因子分析、判別分析、聚類分析等常見
38、的分析方法。對于較常見的統(tǒng)計方法,在輸出對話框中就能完成絕大部分 SPSS 的命令語句。同時在此軟件中,能打開多個數(shù)據(jù)集和多格式的數(shù)據(jù)文件。例如 EXCEL、Acces、Dbase、SAS 等。結果也可以保存為 word、html、PPT、txt 等 7 種圖形文件。濟南大學畢業(yè)論文16在本文中,是對數(shù)據(jù)進行主成分分析,所以利用 SPSS 是最簡便的處理方法,因它的好用好學好操作,更容易進行分析評價。濟南大學畢業(yè)論文175 學生成績分析評價5.1 主成分分析在 SPSS 中的具體操作步驟 在 SPSS 中用降維的因子分析(自 SPSS 22.0 改版以來,主成分分析并到了因子分析中),此次的數(shù)
39、據(jù)分析是采用的濟南大學數(shù)學科學學院 2013 屆數(shù)學與應用數(shù)學1302 班學生大一至大四的成績。下面是對主成分分析再 SPSS 軟件中的操作進行具體說明2: (1)在菜單中選擇分析降維因子分析。 (2)將研究的 44 個課程變量導入變量框。 (3)在因子分析的描述統(tǒng)計對話框中依次在因子分析對話框中的描述-提取-旋轉-得分中選擇相應的命令。如圖所示:圖(2) 圖(3)圖(4) 圖(5)濟南大學畢業(yè)論文18圖(6) 圖(7)圖(8) (4)則依次在 SPSS 的輸出結構中得到公因子方差,總方差解釋表,碎石圖,成分矩陣,旋轉后的成分矩陣,成分轉換矩陣,旋轉后的空間組建圖,成分的分析矩陣,成分協(xié)方差矩
40、陣8。5.2 對 SPSS 的輸出結果進行說明 (1)輸出了公因子方差表。因為變量之間的相關程度不同,所以需要建立相關因子。濟南大學畢業(yè)論文19圖(9) 圖(10) (2)輸出總方差解釋表,在表里的初始特征值就是這 44 個數(shù)據(jù)相關性矩陣的特征值。前 11 個成分特征值已占總方差的 86%,而后面的特征值的貢獻也越來越少。濟南大學畢業(yè)論文20圖(11)圖(12) (3)輸出碎石組件圖圖(13) (4)輸出成分矩陣。濟南大學畢業(yè)論文21圖(14)圖(15) 在圖(14)、(15)中的每一列代表的每個主成分作為原始變量組合的比例。由圖知,第一、第二、第三.第十一個主成分與原始變量之間的關系,其線性
41、表達式為:濟南大學畢業(yè)論文2244434241403938373635343332313029282726252423222120191817161514131211109876543211259. 055. 0760. 0795. 0687. 0387. 0339. 0441. 0686. 0676. 0661. 0384. 0610. 0064. 0763. 0383. 0736. 0558. 0647. 0044. 0325. 0707. 0804. 0821. 0705. 0654. 0803. 0795. 0772. 0511. 0831. 0765. 0827. 0255. 031
42、9. 0754. 0868. 0873. 0787. 0761. 0863. 0824. 0759. 0573. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxy44434241403938373635343332313029282726252423222120191817161514131211109876543212010. 0549. 0226. 0211. 0316. 0346. 0429. 0487. 0558. 0195. 0246. 0477. 0010. 0402. 0128. 0291. 0187. 0094. 0000. 060
43、7. 0212. 0271. 0074. 0230. 0042. 0099. 0096. 0036. 0095. 0019. 0275. 0034. 0178. 0437. 0092. 0056. 0099. 0187. 0267. 0399. 0020. 0014. 0190. 0348. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxy44434241403938373635343332313029282726252423222120191817161514131211109876543213065. 0364. 0173. 0071. 001
44、9. 0664. 0447. 0493. 0066. 0269. 0282. 0200. 0331. 0218. 0171. 0336. 0180. 0305. 0122. 0130. 0349. 0124. 0040. 0168. 0047. 0345. 0086. 0036. 0256. 0241. 0179. 0202. 0003. 0464. 0258. 0029. 0079. 0149. 0225. 0194. 0179. 0408. 0389. 0122. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxy (5)輸出成分旋轉矩陣,說明了
45、44 個課程變量與得出的主成分因子之間的關系:1110987654321511109876543214111098765432131110987654321211109876543211253. 0111. 0056. 0198. 0061. 0110. 0034. 0138. 0504. 0236. 0633. 0012. 0186. 0098. 0021. 0130. 0076. 0028. 0129. 0190. 0118. 0878. 0106. 0005. 0193. 0011. 0028. 0010. 0184. 0178. 0288. 0046. 0814. 0030. 0101
46、. 0472. 0137. 0101. 0078. 0197. 0129. 0167. 0064. 0749. 0372. 0258. 0442. 0173. 0062. 0001. 0367. 0093. 0183. 0329. 0374. 0fffffffffffxfffffffffffxfffffffffffxfffffffffffxfffffffffffx 第一因子主要和數(shù)學分析 1、高等代數(shù) 1、數(shù)學分析 2、數(shù)學分析 3、高等代數(shù)2、概率論與數(shù)理統(tǒng)計、復變函數(shù)、常微分方程、近世代數(shù)、實變函數(shù)、數(shù)理方程、模糊數(shù)學有很強的正相關。因此可以將第一因子命名為“計算因子”。 第二因子主要和大
47、學英語 1、大學英語 2、大學英語 3、大學英語 4 有很強的正相關。因此可以將第二因子命名為“英語因子”。 第三因子主要和毛澤東思想和中國特色社會主義、思想道德修養(yǎng)與法律基礎、馬克思主義基本原理概論有很強的正相關。因此可以把第三因子命名為“政治因子”濟南大學畢業(yè)論文23。 第四因子主要和大學物理 F、多媒體技術及應用、數(shù)學模型有很強的正相關。因此可以把第四因子命名為“實踐應用因子”。 第五因子主要和點集拓撲學、解析幾何、泛函分析、微分幾何有很強的正相關。因此可以將第五因子命名為“空間證明因子”。 第六因子主要和書寫技能、教師專業(yè)發(fā)展基礎、教學教育學、中外教育史有很強的正相關。因此可以講第六因
48、子命名為“教師專業(yè)技能因子”。 第七因子主要和算法與程序設計、數(shù)值分析有很強的正相關。因此可以將第七因子命名為“編程因子”。 第八因子主要和課程與教學論、現(xiàn)代教育技術應用、教師心理健康有很強的正相關。因此將第八因子命名為“教學基礎技能因子”。 第九因子主要和教師語言、心理學、教育學有很強的正相關。因此將第九因子命名為“教師基礎知識因子”。 第十因子主要和教師心理學、班級管理、教育法律與法規(guī)、中學生心理輔導與學習方法、形式與政策有關。因此可以將第十因子命名為“教師外在儲備知識因子”。 第十一因子與分析代數(shù)續(xù)有關。將第十一因子命名為“分析代數(shù)因子”。這一因子在后續(xù)評價中可以不做考慮。因為這一因子只
49、與一門課程有關,且這一課程是大四僅開設的一個半月的課程,與大學生的考研的相關性不大。 (6)輸出旋轉后的空間組件圖。 濟南大學畢業(yè)論文24圖(16) (7)輸出成分得分系數(shù)表圖(17)濟南大學畢業(yè)論文25圖(18) 由圖(17)、(18)可以得出每個學生所對應的每個因子之間的關系10。得出它們間的關系表達式為444342414039383736353433323130292827262524232221209181716151411321111098765432110.060-0.130.068-0.1550.0740.017-0.067-0.027-0.0870.0070.050-0.080
50、-0.076-0.0200.1160.0240.0090.069-0.0870.019-0.0380.094-0.0630.009-0.107-0.095-0.1220.0090.0510.132-0.1470.0250.098077. 0037. 0012. 0035. 0009. 0147. 0061. 0179. 0114. 0098. 044. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf444342414039383736353433323130292827262524232221201918171615141312111098765
51、43212058. 0026. 0028. 0051. 0092. 0273. 0215. 0301. 0187. 0035. 0028. 0009. 0007. 0118. 0075. 0114. 0091. 0034. 0050. 0047. 0009. 0016. 0024. 0029. 0006. 0036. 0004. 0016. 0017. 0169. 0027. 0027. 0054. 0036. 0080. 0028. 0035. 0021. 0069. 0018. 0001. 0061. 0031. 0078. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
52、xxxxxxxxxxxxxxf4443424140393837363534333231302928272625242322212019181716151413121109876543213128. 0027. 0047. 0092. 0040. 0064. 0038. 0003. 0052. 0342. 0027. 0377. 0005. 0033. 0081. 0009. 0056. 0037. 0030. 0057. 0143. 0003. 0003. 0069. 0162. 0056. 0057. 0060. 0101. 0211. 0127. 0101. 0163. 0051. 002
53、8. 0149. 0082. 0073. 0118. 0142. 0014. 0045. 0029. 00.008xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf濟南大學畢業(yè)論文261111111111111111111111111111111111109876543214050. 0091. 0051. 0091. 0135. 0091. 0085. 0147. 0097. 0070. 0004. 0073. 0015. 0053. 0204. 0055. 0103. 0034. 0000. 0056. 0078. 0255. 0060. 0134.
54、 0317. 0029. 0117. 0296. 0014. 0172. 0054. 0336. 0093. 0103. 0029. 0183. 0057. 0105. 0023. 0056. 0103. 0052. 0056. 0006. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf44434241403938373635343332313029282726252423222120191817161514131211109876543215034. 0166. 0267. 0071. 0238. 0012. 0162. 0092. 0144.
55、 0011. 0109. 0027. 0035. 0045. 0070. 0105. 0044. 0011. 0106. 0058. 0173. 0076. 0169. 0202. 0061. 0368. 0092. 0055. 0067. 0038. 0013. 0135. 0056. 0042. 0004. 0014. 0048. 0075. 0059. 0069. 0127. 0007. 0055. 0186. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf052. 0228. 0035. 0034. 0019. 0072. 0123. 0
56、011. 0008. 0023. 0059. 0100. 0004. 0029. 0027. 0268. 0038. 0048. 0205. 0045. 0152. 0197. 0039. 0076. 0006. 0001. 0068. 0062. 00072. 0152. 0002. 0007. 0035. 0439. 0044. 0045. 0047. 0083. 0091. 0080. 0009. 0033. 0031. 0021. 0111111111111111111111111111111111109876543216xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
57、xxxxxxxxxxxf44434241403938373635343332313029282726252423222120191817161514131211109876543217122. 0140. 0099. 0143. 0057. 0088. 0165. 0054. 0130. 0078. 0392. 0028. 0429. 0067. 0076. 0213. 0121. 0193. 0148. 0061. 0061. 0036. 0100. 0027. 0071. 0019. 0087. 0016. 0073. 0155. 0046. 0039. 0063. 0089. 0060.
58、 0123. 0064. 0032. 0033. 0041. 0032. 0065. 0011. 0098. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf44434241403938373635343332313029282726252423222120191817161514131211109876543218069. 0054. 0069. 0019. 0047. 0019. 0085. 0050. 0020. 0044. 0006. 0002. 0040. 0365. 0071. 0191. 0027. 0004. 0062. 0369.
59、 0302. 0034. 0011. 0073. 0015. 0082. 0047. 0013. 0004. 0029. 0032. 0043. 0040. 0024. 0068. 0055. 0048. 0005. 0041. 0047. 0013. 0008. 0087. 0070 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf44434241403938373635343332313029282726252423222120191817161514131211109876543219027. 0037. 0026. 0063. 0149. 00
60、60. 0064. 0139. 0010. 0028. 0042. 0019. 0028. 0069. 0017. 0147. 0056. 0091. 0016. 0080. 0140. 0089. 0117. 0084. 0018. 0132. 0113. 0088. 0105. 0064. 0002. 0046. 0016. 0131. 0436. 0120. 0056. 0038. 0058. 0050. 0073. 0033. 0192. 0232. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf444342414039383736353
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 通信行業(yè)智能化光傳輸網(wǎng)絡覆蓋與升級方案
- 通訊設備通訊設備技術創(chuàng)新與市場拓展策略研究
- 多式聯(lián)運下城市配送智能化改造方案
- 三農(nóng)村旅游產(chǎn)業(yè)規(guī)劃方案
- 餐飲業(yè)食品安全追溯系統(tǒng)解決方案
- 三農(nóng)產(chǎn)品深加工與綜合利用技術手冊
- 化工工藝流程優(yōu)化與設計試題及答案
- 吉安市城投公司及下屬子公司2024年公開招聘線下及實操筆試參考題庫附帶答案詳解
- 贛州2025年江西贛南醫(yī)科大學高層次人才招聘50人筆試歷年參考題庫附帶答案詳解
- 貴州2025年中共貴州省委辦公廳所屬事業(yè)單位招聘15人筆試歷年參考題庫附帶答案詳解
- 2024年江蘇食品藥品職業(yè)技術學院單招職業(yè)技能測試題庫及答案解析
- 活動招商合同
- 標準化法及相關知識課件
- 新視野大學英語(第四版)讀寫教程1(思政智慧版)課件 Unit 6 Winning is not everything Section B
- 意識障礙診療規(guī)范2023版
- 儀表檢修規(guī)程
- 2023年10月自考03706思想道德修養(yǎng)與法律基礎試題及答案含評分標準
- 工廠組織架構圖
- 全國IP地址段中國IP地址段各省IP段IP段最全
- 中醫(yī)養(yǎng)生技術ppt
評論
0/150
提交評論