多元統(tǒng)計分析課程設計報告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第1頁
多元統(tǒng)計分析課程設計報告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第2頁
多元統(tǒng)計分析課程設計報告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第3頁
多元統(tǒng)計分析課程設計報告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第4頁
多元統(tǒng)計分析課程設計報告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 -9-目 錄目 錄i一、問題分析11.1 問題重述11.2 問題分析1二、主成分分析方法基本原理22.1 主成分分析基本思想22.2 主成分分析的數(shù)學模型22.3 主成分分析的計算步驟3三、問題求解5四、結果分析74.1 相關系數(shù)矩陣74.2 協(xié)方差陣8五、總 結9六、課程設計心得體會9參考文獻10一、問題分析1.1 問題重述49位女性在空腹情況下三個不同時刻的血糖含量(用表示)和攝入等量食糖一小時后的三個時刻的血糖含量(用小表示)的觀測值(單位:mg/100ml).問題:分別從樣本協(xié)方差陣s和樣本相關系數(shù)矩陣r出發(fā)做主成分分析,求主成分的貢獻率和各個主成分. 在兩種情況下,你認為應保留幾個

2、主成分?其意義如何解釋?就此而言,你認為基于s和r的分析那個結果更為合理?1.2 問題分析我們根據(jù)主成分分析的基本思想,設法將原來眾多的具有一定相關性的指標,重新組合成一組新的互不相關的綜合指標來代替原來指標。通常數(shù)學上的處理就是將原來個指標作線性組合,作為新的綜合指標。然后,在所有的線性組合中分別從樣本協(xié)方差陣s和樣本相關系數(shù)矩陣r出發(fā)做主成分分析,計算出各個主成分,進而代表原來個指標的信息。進一步,建立主成分分析的數(shù)學模型。最后利用sas統(tǒng)計軟件來求解出各個主成分和各主成分的貢獻率。二、主成分分析方法基本原理2.1 主成分分析基本思想主成分分析是數(shù)學上對數(shù)據(jù)降維的一種方法。其基本思想是設法

3、將原來眾多的具有一定相關性的指標(比如個指標),重新組合成一組新的互不相關的綜合指標來代替原來指標。通常數(shù)學上的處理就是將原來個指標作線性組合,作為新的綜合指標。但是這種線性組合,如果不加限制,則可以有很多,應該如何去選取呢?在所有的線性組合中所選取的應該是方差最大的,故稱為第一主成分。如果第一主成分不足以代表原來個指標的信息,再考慮選取即選第二個線性組合。為了有效地反映原有信息,已有的信息就不需要再出現(xiàn)在中,用數(shù)學語言表達就是要求。稱為第二主成分,依此類推可以構造出第三、第四、第個主成分。2.2 主成分分析的數(shù)學模型設有個樣品(多元觀測值),每個樣品觀測項指標(變量):,得到原始數(shù)據(jù)資料陣:

4、其中.用數(shù)據(jù)矩陣的個列向量(即個指標向量)作線性組合,得綜合指標向量:簡寫成:為了加以限制,對組合系數(shù)作如下要求:即:為單位向量:,且由下列原則決定:1) 與互不相關,即,其中是的協(xié)方差陣。2) 是的一切線性組合(系數(shù)滿足上述要求)中方差最大的,即: ,其中是與不相關的一切線性組合中方差最大的,是與,都不相關的的一切線性組合中方差最大的。 滿足上述要求的綜合指標向量就是主成分,這個主成分從原始指標所提供的信息總量中所提取的信息量依次遞減,每一個主成分所提取的信息量用方差來度量,主成分方差的貢獻就等于原指標相關系數(shù)矩陣相應的特征值,每一個主成分的組合系數(shù):就是相應特征值所對應的單位特征向量。方差

5、的貢獻率為 其中,越大,說明相應的主成分反映綜合信息的能力越強。2.3 主成分分析的計算步驟(1) 計算協(xié)方差矩陣計算樣品數(shù)據(jù)的協(xié)方差矩陣:其中, (2) 求出的特征值及相應的特征向量求出協(xié)方差矩陣的特征值及相應的正交化單位特征向量:則的第個主成分為(3) 選擇主成分 在已確定的全部個主成分中合理選擇個來實現(xiàn)最終的評價分析。一般用方差貢獻率解釋主成分所反映的信息量的大小,的確定以累計貢獻率達到足夠大(一般在85%以上)為原則。(4) 計算主成分得分計算個樣品在個主成分上的得分: (5) 標準化實際應用時,指標的量綱往往不同,所以在主成分計算之前應先消除量綱的影響。消除數(shù)據(jù)的量綱有很多方法,常用

6、方法是將原始數(shù)據(jù)標準化,即做如下數(shù)據(jù)變換:其中, , ,標準化后的數(shù)據(jù)陣記為,其中每個列向量(標準化變量)的均值為0,標準差為1,數(shù)據(jù)無量綱。標準化后變量的協(xié)方差矩陣(covariance matrix),即原變量的相關系數(shù)矩陣(correlation matrix)此時個樣品在個主成分上的得分應為:三、問題求解1. 使用“分析家”做主成分分析的步驟1) 在“分析家”中打開數(shù)據(jù)集mylib.xydj; 2) 選擇菜單“statistics(統(tǒng)計)”®“multivariate(多元分析)”®“principal components(主成分分析)”,打開“principal

7、 components”對話框; 3) 在對話框中輸入主成分分析的變量,如圖所示。圖6-1 多元分析對話框 3) 單擊“method”按鈕,在打開的對話框中可以選擇計算協(xié)方差矩陣的特征值或是計算相關系數(shù)矩陣的特征值。系統(tǒng)默認計算相關系數(shù)矩陣的特征值和特征向量,單擊“ok”按鈕返回。 4) 單擊“output”按鈕,在打開的對話框(圖左)中包括“descriptive statistics”選項、“bivariate plots”選項以及各種多元分析的選項。選中“principal component analysis”復選框,單擊下面的“principal component options”

8、按鈕,打開“principal component options”對話框,選中“eigenvectors”復選框,取消“correlations(structure)”復選框,如圖右所示。四、結果分析4.1 相關系數(shù)矩陣變量的簡單統(tǒng)計量相關系數(shù)關系矩陣相關系數(shù)關系矩陣的特征值特征向量主成分分析:,其中,4.2 協(xié)方差陣協(xié)方差矩陣特征值特征向量主成分分析:,其中,五、總 結本次課程設計,我們運用sas統(tǒng)計軟件,來分析“女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析”,我們從樣本協(xié)方差陣s和樣本相關系數(shù)矩陣r出發(fā)來做主成分分析,進一步來求出主成分的貢獻率和各個主成分的模型. 同時,在應用軟件操作時,

9、我們求解出了相應的協(xié)方差系數(shù)矩陣,特征值以及特征向量,從而寫出了主成分的模型和各個主成分的貢獻率。與此同時,我們亦討論了在從樣本協(xié)方差陣s和樣本相關系數(shù)矩陣r出發(fā)來做主成分分析的這兩種情況下,我們應保留的主成分是什么。 六、課程設計心得體會通過本次課程設計,使我們對多元統(tǒng)計分析的主成分分析有了進一步了解。主成分分析是將多指標化為少數(shù)幾個綜和指標的一種統(tǒng)計分析方法。在實際問題中,研究多指標的問題是經(jīng)常遇到的問題,多元統(tǒng)計分析處理的是多變量(多指標)問題。由于變量個數(shù)太多,并且彼此之間存在著一定的相關性,因而使得所觀測到的數(shù)據(jù)在一定程度上反應的信息有所重疊,而且變量較多時,在高位空間上研究樣本的分布規(guī)律比較復雜,勢必增加分析問題的復雜性。從而,人們想用較少的綜合變量來代替較多的變量;而這幾個綜合變量又能反映原來變量的信息,并且彼此之間互不相關,利用降維的思想,產(chǎn)生了主成分分析。同時,讓我對sas統(tǒng)計軟件有了一定的了解,對其一些基本思想有了一些理論根據(jù),明白了其中些許的規(guī)則。 參考文獻1 方開泰編著實用多元統(tǒng)計分析上海:華東

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論