



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
案列分析:觀察數(shù)據(jù)類型,檢查缺失值。打開數(shù)據(jù)觀察可以得到數(shù)據(jù)類型是數(shù)值型,沒有缺失值。然后分析各變量之間的共線性。把數(shù)據(jù)導(dǎo)入DATAHOOP平臺,展示分析中的相關(guān)系數(shù)分析,得到各變量的相關(guān)系數(shù)矩陣如下:人均GDP(元)財(cái)政收入(萬元)固定資產(chǎn)投資(億元)年末總?cè)丝冢ㄈf人)居民消費(fèi)水平(元/人)社會消費(fèi)品零售總額(億元)人均GDP(元)10.66960.3623-0.09130.96690.4358財(cái)政收入(萬元)0.669610.83180.55960.69330.9236固定資產(chǎn)投資(億元)0.36230.831810.78320.32710.9317年末總?cè)丝冢ㄈf人)-0.09130.55960.78321-0.06640.7713居民消費(fèi)水平(元/人)0.96690.69330.3271-0.066410.442社會消費(fèi)品零售總額(億元)0.43580.92360.93170.77130.4421相關(guān)系數(shù)矩陣可以達(dá)到有很多的系數(shù)超過了0.85,說明具有多重共線性,就不能應(yīng)運(yùn)比值替換法來消除共線性。所以我們選擇降維的方法來消除共線性,用主成分分析來降維。把變量添加到X軸區(qū)域,選擇展示分析中的PCA(主成分分析),其中PCA分析的參數(shù)要標(biāo)準(zhǔn)化,主成分的個(gè)數(shù)不選,我們做出來各變量的貢獻(xiàn)率的排序如下:PC_1PC_2PC_3PC_4PC_5PC_6貝獻(xiàn)率0.66050.29520.02130.01590.00430.0028ffl、J_~T^.擊n累計(jì)貝獻(xiàn)率0.66050.95570.9770.99290.99721上表為方差貢獻(xiàn)率,它是隨著因子的增加累計(jì)增加。我們選取累計(jì)增加貢獻(xiàn)率大于0.8的因子,可以得到主成分為2個(gè)。PC_1和PC_2因子的累計(jì)貢獻(xiàn)率為0.9557,然后在DATAHOOP的PCA分析方法中主成分的個(gè)數(shù)選擇為2,得到這2個(gè)因子的主成分矩陣:設(shè)人均GDP(元)、財(cái)政收入(萬元)、固定資產(chǎn)投資(億元)、年末總?cè)丝冢ㄈf人)、居民消費(fèi)水平(元/人)、社會消費(fèi)品零售總額(億元)分別為X1、x2、x3、X4、關(guān)、羌,則PC_1和PC_2為匕、Y2,由主成分矩陣可以有主成分模型:
匕=0.3367X1+0.4905X2+0.4503%3+0.3179%4+0.3384%5+0.4772%6匕=0.544^1+0.0416Y2—0.264*-0.547X:+0.542%5-0.1978%6PC_1PC_2人均GDP(元)0.33670.5446財(cái)政收入(萬元)0.49050.0416固定資產(chǎn)投資(億元)0.4503-0.264年末總?cè)丝冢ㄈf人)0.3179-0.547居民消費(fèi)水平(元/人)0.33840.542社會消費(fèi)品零售總額(億元)0.4772-0.1978我們根據(jù)主成分模型方程可以得到PC_1和PC_2的真實(shí)值。但我們不需要得到真實(shí)值我們就得到的數(shù)據(jù)進(jìn)行聚類。PC_1PC_2PC_1PC_22.10753.39310.0178-0.7736-0.10052.4813-0.1021-0.90260.7062-1.13745.0198-0.9606-0.7876-0.0675-1.0181-0.6024-0.70090.409-2.22310.64060.9297-0.1079-1.12570.0383-0.99480.19420.4563-1.6507-0.7523-0.0752-1.8166-0.54753.2574.2228-1.1616-0.60853.8955-0.9438-2.65640.43512.86920.4643-1.0675-0.3847-0.4441-1.0515-1.9495-0.12390.02910.465-2.39590.5996-1.0556-0.5581-2.27220.7063.8604-1.8869-1.63960.27951.1156|-1.9459得到的因子我們放到新的表格中,利用DATAHOOP進(jìn)行K-Means聚類。其中我們不知道分成多少類,我們從3開始進(jìn)行聚類,這里我們不選擇標(biāo)準(zhǔn)化。因?yàn)榫垲惓蔀閮深愂菦]有意義的,開始從3開始比較平均系數(shù)輪廓,選取最大的一個(gè)進(jìn)行最合適的分類。分為3類時(shí)的輪廓系數(shù)為0.5975;分為4類時(shí)的輪廓系數(shù)為0.4712;分為5類時(shí)的輪廓系數(shù)為0.4465;我們通過觀察分為3類時(shí)的平
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 平移旋轉(zhuǎn)軸對稱(教學(xué)設(shè)計(jì))-2024-2025學(xué)年四年級下冊數(shù)學(xué)蘇教版
- 12家鄉(xiāng)的喜與憂(教學(xué)設(shè)計(jì))-統(tǒng)編版道德與法治四年級下冊
- 辦公樓裝修改造項(xiàng)目經(jīng)濟(jì)效益分析
- 2025年貝瓷餐具項(xiàng)目合作計(jì)劃書
- 2025年度企業(yè)員工家屬食宿優(yōu)惠服務(wù)協(xié)議
- 2025-2030年中國茶咖啡堿行業(yè)深度研究分析報(bào)告
- 2025年度知識產(chǎn)權(quán)戰(zhàn)略規(guī)劃與執(zhí)行顧問聘用協(xié)議
- 廣告行業(yè)合作居間協(xié)議
- 三月桃花水教案15篇
- 倉儲物流中心經(jīng)典裝修合同
- 《婦幼保健學(xué)》課件-第一章 緒論
- 10S505 柔性接口給水管道支墩
- 移動寬帶注銷委托書模板需要a4紙
- 初一下冊期末模擬物理質(zhì)量檢測試卷解析1
- 《教育向美而生-》讀書分享課件
- 中海地產(chǎn)總部-員工考核手冊
- 左卡尼汀在減輕高原反應(yīng)中的應(yīng)用
- 《烹飪美學(xué)》課件-項(xiàng)目二 烹飪色彩
- 青海省西寧市選調(diào)生考試(行政職業(yè)能力測驗(yàn))綜合能力測試題匯編
- 2024年上海民航職業(yè)技術(shù)學(xué)院高職單招歷年職業(yè)技能測驗(yàn)高頻考點(diǎn)試題含答案解析
- 夏枯草口服液相關(guān)項(xiàng)目實(shí)施方案
評論
0/150
提交評論