統(tǒng)計(jì)學(xué) 第十章 多元統(tǒng)計(jì)分析_第1頁(yè)
統(tǒng)計(jì)學(xué) 第十章 多元統(tǒng)計(jì)分析_第2頁(yè)
統(tǒng)計(jì)學(xué) 第十章 多元統(tǒng)計(jì)分析_第3頁(yè)
統(tǒng)計(jì)學(xué) 第十章 多元統(tǒng)計(jì)分析_第4頁(yè)
統(tǒng)計(jì)學(xué) 第十章 多元統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章多元統(tǒng)計(jì)分析 2 3 3 4 4 5 5 9 9 多元統(tǒng)計(jì)分析(multivariatestatisticalanalysis)是研究多個(gè)隨機(jī)變量之間的相互依賴關(guān)系以及在二維空間,n個(gè)樣本點(diǎn)的變量信息若用離差平方和來(lái)表示,則變量的信息總量為總方差對(duì)于每個(gè)變量的離差平方和,它們的取值可能出現(xiàn)各種情況:(1)如(xi1-x1)2和之間相差懸殊,如取值之比為10:1,說(shuō)明變量x1在方差總yi1,yi2),上式說(shuō)明新變量y繼承了原變量x的全部信息,并且要求和y2=-sinθx1+cosθx2系數(shù)滿足的要求是:(cosθ)2+(sinθ)2=1;(-sinθ)2+(cosθ)2=1;cosθ(-sinθ)+sinθcosθ=0其中xij是第i個(gè)樣本點(diǎn)第j個(gè)指標(biāo)的觀測(cè)值。如前所述,通過(guò)主成分變換得到的線性組合可以表示為y1=u11x1+u12x2+.......+u1pxpy2=u21x1+u22x2+......+u2pxpyp=up1x1+up2x2+......+uppxp數(shù)據(jù)標(biāo)準(zhǔn)化,以消除量綱對(duì)結(jié)果的影響。標(biāo)準(zhǔn)化的常用公式為:zxi=標(biāo)準(zhǔn)化后的數(shù)據(jù)均值,相應(yīng)的單位特征向量為:(ui1ui2…uip)’,那么相應(yīng)的主成分就是:yi=ui1zx1+ui2zx2+......+uipzxp。 4.96 4.88 4.60 4.56 率率λ1=2.424λ2=1.943λ3=0.973λ4=0.405λ5=0.179λ6=0.075y1y2y3=0.589zx1+0.256zx2-0.183zx3-0.315zx4+0.556zx5-0.382zx6=0.219zx1+0.048zx2+0.965zx3-0.065zx4+0.049zx5-0.112zx6教師:如果單純依靠手工計(jì)算,計(jì)算量相當(dāng)?shù)卮?。我們可以嘗試使用Excel中的小插件新能力等都是不可直接觀測(cè)到的變量(潛在變量),而利稅總額、勞動(dòng)生產(chǎn)率等都是顯在變量。因子分析(FactorAnalysis)是利用少數(shù)幾個(gè)潛在變量或公共因子去解釋多個(gè)顯在變量或可觀測(cè)變量中存在的復(fù)雜系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分析方法。因子分析的概念起源于20世紀(jì)初Karl11111221pp1x=aF+aF++aF+e22112222pp2x=aF+aF++aF+epp11p22pppph2=a2+a2++a211112......1qh2=a2+a2++a222122......2q,h2=a2+a2++pp1p2......2apq222g1=a11+a21+......+ap1222g2=a12+a22+......+ap2222gq=a1q+a2q+......+apqpp1構(gòu)成的矩陣有A表示,即1.用公式對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化4.根據(jù)A=求因子載荷矩陣A;對(duì)象,試求1)正交因子模型2)各個(gè)變量的共同度以及特殊因子方差3)每個(gè)因子的方差貢獻(xiàn)率以及三個(gè)因子的累計(jì)方差貢獻(xiàn)率4)說(shuō)明三個(gè)因子的意義。||-0.0710.0111|0.7450.706-0.237-0.154|0.7450.706-0.237-0.154根據(jù)R-λI=0及(R-λI)U=0求得累計(jì)方差貢獻(xiàn)率達(dá)81.1.2.31x=0917F+1.1.2.313.1.2.33x=-0285F3.1.2.33x4=-0.491F1+0.735F2-0.064F3+e4x5=0.865F1+0.424F2-0.048F3+e56.1.2.36x=-0595F+6.1.2.36————足夠的說(shuō)服力。聚類分析是應(yīng)用最廣泛的分類技術(shù),它把性質(zhì)相近的個(gè)體歸為一類,是研究“物以類聚”絕對(duì)距離:dij=Σxik-xjk切比雪夫距離:dij=xik-xjk(xki-xi)(xkj-xj)i,j=1,Λ,p先將所有的樣本各自算作一類,將最近的兩個(gè)樣本點(diǎn)首先聚類,再將這個(gè)類和其他類中最靠近的結(jié)重心法:兩類的重心分別為xl,xm,則dlm=dx1x2類),然后計(jì)算各樣本點(diǎn)之間的距離,并將距離最近的兩個(gè)樣本點(diǎn)并成一類;選擇并計(jì)算類與類之間的距12456789124567891458914589樣本x,依據(jù)這個(gè)準(zhǔn)則就能判別它是來(lái)自哪一類別,而且要求其錯(cuò)判率最小歇爾判別函數(shù)為-1X(證明略),將兩類均值及待判樣本x的各項(xiàng)指標(biāo)代入判別函數(shù)可f(次/年)1222222122222【解】馬氏距離的計(jì)算公式為:dij=-x1-x2-x3-x4-x5-x612|||20.391|-0.124||L-1.7530.4812.1910.4500.353-1.569|d2(x,k)=(x-x(k))9S-1(x-x(k))222Multivariatestatisticalanalysisisa“mixPrincipalcomponentanalyDiscriminationanalysis(DA).Aprincipalcomponentanalysisisconcernedwithexplainingthevariance-covariancesofasetofvariablesthroughafewlinearcombinationsofthesevariabarerequiredtoreproducethetotalsystemvariability,oftenmuchofthisvariabilitycanbeaccountedforbyasmallnumberkoftheprincipalcomponents.Ifthisisso,thereisalmostasmuchinformationinthekcomponentsasthereareintheoriginalpvariables.Thecanthenreplacetheinitialpvariables,andtheoriginaldataset,consistingofnmeasurementsovariables,isreducedtoadatasetconsistingofnmeasurementsonkprincipalcomponents.Theessentialpurposeoffactoranamanyvariablesintermsofafewunderlying,bgroupedbytheircorrecorrelatedamongthemselvesgroup.Thenitisconceivablethateachgroupofvariablesrepreseorfactor,thatisresponsiblefortheobservedcorThebasicobjectiveinclusteranalysisanalysisisaprimitivetechniqueinthatnoassumptionsaremadeconcerningthenumberofdistance.AgglomerativehierarchicagroupsaremergedaccordingtotheirsDiscriminationisamultivariateteobservationsandwithallocatingnewobservationstopreviouslydefinedKeywords:multivariatestatisticalanalysis,principalcomponentanalysis,Clusteranalysis,discriminationanA.各行元素之和B.各行元素平方和C.各列元素之和D.各列元素D.主成分的方差等于第k個(gè)主成分與第j個(gè)變量樣本間的相關(guān)系數(shù)2.因子分析中,第j個(gè)因子的方差貢獻(xiàn)率。B.在距離判別中,計(jì)算待判樣本與各類的距離,判斷12345678192345678AlliedChemical,DuPont,UnionCA.Y1=0.4636X1-0.2411X2+0.6126X3B.Y1=2.8562X1+0.8090X2+0.5401X3+0.451C.Y1=0.4636X1+0.4571X2+0.47X3+0.D.Y1=0.8635X1+0.8236X2+0.7469X3+0.8882(2)第一個(gè)主成分與AlliedChemA.2.8562B.0.4636C.0.8635D.0.A.84.107%B.90.209%C.90.1A.F1=0.7834X1+0.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論