![鄭州大學-機器學習 主成分分析_第1頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y958.jpg)
![鄭州大學-機器學習 主成分分析_第2頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y9582.jpg)
![鄭州大學-機器學習 主成分分析_第3頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y9583.jpg)
![鄭州大學-機器學習 主成分分析_第4頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y9584.jpg)
![鄭州大學-機器學習 主成分分析_第5頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y9585.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
PRINCIPALCOMPONENTANALYSIS主成分分析匯報人:秦文靜朱曼產生背景在研究工作中,我們常常針對我們關注的研究對象,收集大量有關他的特征屬性,從而對其進行觀測和分析。比如,對一組城市進行研究的時候,我們可以從人口、GDP、面積、年降水量、年平均溫度、人均壽命、人均工資、人均受教育年份、性別比例、宗教人口、汽車保有量、人均住房面積等等收集相關數據。理論上,我們收集越多的特征屬性就越方便我們全方面的對事物進行細致的研究,對深層次的規(guī)律進行探尋。但實際上,隨著樣本特征屬性數量的增多,我們需要分析處理的數據量也是直線上升的。同時,樣本的特征屬性之間還存在著相關性:比如GDP與汽車保有量之間,人均工資與人均受教育年份都是存在著某種關聯的。01總體主成分分析利用正交變換,把用線性相關變量表示的數據轉換為有線性無關變量表示。線性無關的變量稱主成分。無監(jiān)督學習01點擊輸入您在損失很少信息的前提下的具體內容用簡潔的語言文字進行闡述,精準的詞匯表達勝過長篇大論的文字表述添加標題從無標注數據中學習預測模型的機器學習問題,本質是學習數據中的統(tǒng)計規(guī)律或潛在結構。02降維思想在損失很少信息的前提下,把多個指標轉化為幾個綜合指標的多元統(tǒng)計方法,主成分的個數通常小于原始變量的個數將訓練數據中的樣本從高維空間轉換到低維空間基本思想規(guī)范化通過正交變換變成由若干個線性無關的新變量表示的數據正交變換選擇方差最大的方向(第一主成分)作為新坐標系的第一坐標軸,之后選擇與第一坐標軸正交且方差次之的方向(第二主成分)作為新坐標系的第二坐標軸。方差最大使得數據每一變量平均值為0方差為1基本思想
基本思想基本思想
如何選取坐標軸(主成分)主成分分析的基本思想是在保留原始變量盡可能多的信息的前提下達到降維的目的,從而簡化問題的復雜性。而對多維隨機變量而言,其協(xié)方差矩陣就是對各變量離散程度的反映,我們所說的保留原始變量盡可能多的信息,也就是指生成的較少的綜合變量的方差盡可能地接近原始變量方差的總合定義和導出定義和導出定義和導出
定義和導出主要性質
主要性質采用拉格朗日乘子法求主成分首先來求第一主成分
主要性質
主要性質主要性質主要性質主要性質主要性質主要性質主要性質
主要性質
主要性質
主要性質
主要性質
主成分的個數主成分的個數主成分的個數
主成分的個數主成分的個數主成分的個數主成分的個數主成分個數的篩選依據累計方差貢獻率:當前k個主成分的方差貢獻率達到某一特定值(一般85%以上)就可以保留前k個主成分。
主成分的個數規(guī)范化變量的總體主成分規(guī)范化變量的總體主成分規(guī)范化變量的總體主成分基本步驟1.對原來的k個指標標準化,以消除變量在數量級和量綱上的影響2.根據標準化后的數據矩陣求出協(xié)方差或相關矩陣3.求出協(xié)方差矩陣的特征值和對應的特征向量4.確定主成分實例實例規(guī)范化實例主成分分析適用于變量之間存在較強相關性的數據,如果變量之間的相關性較弱的話,并不能起到很好的降維作用,通常認為當大多數變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 消防中隊長助理申請書
- 申請生活補助申請書
- 2020-2025年中國煙草精油行業(yè)發(fā)展趨勢預測及投資戰(zhàn)略咨詢報告
- 勞動委員的申請書
- 電力行業(yè)工程項目中的成本控制與優(yōu)化策略
- 構建可持續(xù)商業(yè)模式加強綠色經濟發(fā)展
- 2025年乳酸菌素顆粒行業(yè)深度研究分析報告
- 公司資金申請書
- 電機控制器在環(huán)保領域的應用與前景展望
- 2025年中國頭枕顯示器連接線行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 2025年酒店總經理崗位職責與薪酬協(xié)議
- 綠色能源項目融資計劃書范文
- 大樹扶正施工方案
- 2024年全國職業(yè)院校技能大賽中職組(母嬰照護賽項)考試題庫(含答案)
- 課題申報參考:全齡友好視角下的社區(qū)語言景觀評估及空間優(yōu)化研究
- 五年級下冊語文四大名著常考知識點
- 2024年上海普陀區(qū)司法局招聘人民調解員考試真題
- 光伏發(fā)電項目施工組織設計方案及技術措施
- 駕照考試題庫及答案(完整版)
- 2025年1月日歷表(含農歷-周數-方便記事備忘)
- 2025中國鐵塔公司社會招聘85人高頻重點提升(共500題)附帶答案詳解
評論
0/150
提交評論