




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多統(tǒng)分重宿版第講多統(tǒng)方及用多統(tǒng)方分(變、型、變等多統(tǒng)分應(yīng)選擇題:①數(shù)據(jù)或結(jié)構(gòu)性簡化運(yùn)用的方法有:多元回歸分析,聚類分析,主成分分析,因子分析②類和組合運(yùn)用的方法有:判別分析,聚類分析,主成分分析③變量之間的相關(guān)關(guān)系運(yùn)用的方法有元回歸成分分析子析,④預(yù)測與決策運(yùn)用的方法有:多元回歸,判別分析,聚類分析因果模型因變量數(shù):元回歸,判別分析⑤橫貫數(shù)據(jù)相依模型變量測度:子分析,聚類分析多統(tǒng)分方選擇題:①多元統(tǒng)計(jì)方法的分類)測量數(shù)據(jù)的來源分為:橫貫數(shù)據(jù)(同一時(shí)間不同案例的觀測數(shù)據(jù)觀數(shù)(同樣案例在不同時(shí)間的多次觀測數(shù)據(jù))變量的測度等數(shù)類型為非測量型)變量,數(shù)值型(測量型)變量按分析模型的屬性分為因果模型相模型4)按模型中因變量的數(shù)量分為:單因變量模型,多因變量模型,多層因果模型第講計(jì)均、差、關(guān);互立第講主分義應(yīng)及本想主分質(zhì)主分析步主分義何主成分分析就將原來的多個(gè)指(變量線組成幾個(gè)新的相互無關(guān)的綜合指成的綜合指標(biāo)盡可能多地反映原來的指標(biāo)信息。主分析應(yīng)1)數(shù)據(jù)的壓縮、結(jié)構(gòu)的簡化樣品的綜合評價(jià),排序主分析述—想①1把給定的一組變量通線性變換,轉(zhuǎn)換為一組不相關(guān)的變量Y1Y2這變換中保持變量的總(,X2,的差之和)不變,同時(shí),使Y1具有最大方差,稱為第一主成分Y2具有次大方差,稱為第二主成分。依次類推,原來有P個(gè)量,就可以轉(zhuǎn)換出個(gè)成分3)實(shí)際應(yīng)用中,為了簡化問題,通常找能夠反映原個(gè)量的絕大部分
k***k***方差的()主成分。主分質(zhì))性質(zhì):成分的協(xié)方差矩陣是對角陣)性質(zhì):主成分的總方差等于原始變量的總方差3)質(zhì):成分Yk與始量Xi的關(guān)系數(shù)為√()并之為因子負(fù)荷量(或因子載荷量σii主分析具步①將原始數(shù)據(jù)標(biāo)準(zhǔn)化;②建立變量的相關(guān)系數(shù)陣;③求的特征根為相的特征向量為T1
*,L*④累積方差貢獻(xiàn)率確p定主成分的個(gè)數(shù)(寫主成分為YT),iLmii第講因分定,子荷計(jì)義因分模及設(shè),子轉(zhuǎn)因分定:因子分析就是通過對多個(gè)變量的相關(guān)系數(shù)矩陣的研究,出同時(shí)影響或支配所有變量的共性因子的多元統(tǒng)計(jì)方法。因載統(tǒng)意:1.因子載荷
a
ij
的統(tǒng)計(jì)意義對于因子模型XFFFFii11i22ijjim
i
i1,2,L,我們可以得到,
X
i與
F
j
的協(xié)方差為:X,)ijikk
i
)j==
Cov()Cov(ikkjij
i
)j如果對
X
i作標(biāo)準(zhǔn)化處理,
X
i的準(zhǔn)差為
,且
F
j
的標(biāo)準(zhǔn)差為1,此rFi
j
Cov()ijDX)D(F)ij
)aijij
()
jjX那么從面的分析,我們知道于標(biāo)準(zhǔn)化后的
X
i,ij
是
X
i
F
j
的相關(guān)系數(shù),它一方面表示
X
i
F
j
的依賴程度,絕對值越大,密切程度越高;另一方面也反映了變量
X
i對共因子
F
j
的相對重要性。了解這一點(diǎn)對我們理解抽象的因子含義有非常重要的作用。2.變量共同度
2i
的統(tǒng)計(jì)意義設(shè)因子載荷矩陣為A,第i元素的平方和,即m2a2iijj
i,
(為變量
X
i的同度。由因子模型,知(X)(F)D(F)2D(F)D()ii1i2imiai
i2
im
D(
i
)2i
i
()這里應(yīng)該注意式說明變量
X
2i的差由兩部分組成:第一部分為共同度i
,它描述了全部公共因子對變量
X
i的方差所作的貢獻(xiàn),反映了公共因子對變量
X
i的影響程度。第二部分為特殊因子
i
對變量
X
i的差的貢獻(xiàn),通常稱為個(gè)性方差。如果對
X
i作標(biāo)準(zhǔn)化處理,有12i
i
(3、公因子
F
j
的方差貢獻(xiàn)
j
的統(tǒng)計(jì)意義設(shè)因子載荷矩陣為A,第列素的平方和,即p22jiji
j1,2,L,為公共因子
F
j
對的獻(xiàn)
j
表示同一公共因子
F
j
對各變量所提供的方差貢獻(xiàn)之總和,它是衡量每一個(gè)公共因子相對重要性的一個(gè)尺度。
p因分模及設(shè)數(shù)學(xué)模型:每一個(gè)變量都可以表示成公共因子的線性函數(shù)與特殊因子之和,即:…+aim*Fm+i…,p)式中的F1稱公共因子i稱為Xi的殊因子。該模型可用矩陣表示為X=AF+,且滿足)p(2)Cov(F,)=0,公共因子與特殊因子是不相關(guān)的)DF=D(F)=0,0,0...1
=Im,即個(gè)公共因子不相關(guān)且方差為)=D(
1,0...0
,即各個(gè)特殊因子不相關(guān),方差不要求相等。因旋因子旋轉(zhuǎn)的目的:初始因子的綜合性太強(qiáng),難以找出因子的實(shí)際意義,因此需要通過坐標(biāo)旋轉(zhuǎn),使因子負(fù)荷兩極分化,么接近于0,要么接近,從而降低因子的綜合性,使其實(shí)際意義凸現(xiàn)出來,以便于解釋因子。因子旋轉(zhuǎn)的基本方法:一類是正交旋轉(zhuǎn)(保持因子間的正交性3種常用最大方差旋轉(zhuǎn)類斜交旋轉(zhuǎn)(因子間不一定正交)公共因子提取個(gè)數(shù)選特征值大于等于的子(主成分)作初始因子,通過求響應(yīng)的標(biāo)準(zhǔn)化正交特征向量來計(jì)算因子載碎圖刪去特征值變平緩的那些因子()計(jì)方差貢獻(xiàn)率大于85%第講聚類,統(tǒng)類K-均值聚思及驟系聚方,似性度法聚類:據(jù)分類的對象可將聚類分析分為:系統(tǒng)Q型R型(即樣品聚類與變量聚類)
系聚、均值聚思及驟①系聚類的基本思想:距離相的樣本(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。②聚類過程及步驟:假設(shè)總共有n個(gè)品(或變量一將每個(gè)樣品(或變量)獨(dú)自聚成一類,共有類;第二步根據(jù)所確定的樣品(或變量”公式,把距離較近的兩個(gè)樣或變量聚為一類其它的樣或變量仍自聚為一類,共聚成n-1類三步距近的兩個(gè)類進(jìn)一步聚成一類聚n-2類,以上步驟一直進(jìn)行下去,最后將所有的樣品(或變量)全聚成一類。最后可以畫譜系圖分析。③快速聚類的基本思想,步驟為均法,逐步聚類,迭代聚類思想是將每一個(gè)樣品分配給最近中心(均值)的類中,具體的算法步驟如下)所有的樣品分成個(gè)初始類距離將某個(gè)樣品劃入離中心最近的類,并對獲得樣品與失去樣品的類,重新計(jì)算重心坐標(biāo))重復(fù)步驟,直到所有的樣品都不能再分配時(shí)為止。系聚方:最短距離法(單連接長距離法(完全連接間離法,類平均法(組間平均連接法變類平均法重心,可變法離差平方和法相性度法不樣本相似性度量:距離測度里包括:明氏,馬氏,和蘭式不同變量相似度的度量:包括:夾角余弦,相關(guān)系數(shù)。第講判分及判方思,別析設(shè)件距判別貝斯別系判分定:一種進(jìn)行統(tǒng)計(jì)判別和分組的技術(shù)手段。它可以就一定數(shù)案例的一個(gè)分組變量和相應(yīng)的其他多元變量的已知信息,確定分組與其他多元變量之間的數(shù)量關(guān)系,建立判別函(discriminantFunction。后便可以利用這一數(shù)量關(guān)系對其他已知多元變量信息、但未知分組類型所屬的案例進(jìn)行判別分組。
122R122R各別法想①離判別:求新樣品到G的距離與到G的離之差,如果其值為正,屬于G;則X屬G
1②Bayes判:由于個(gè)體
,G,G12
出現(xiàn)的先驗(yàn)概率分別為
,,,q2
k
,則用規(guī)則來行判別所造成的平均損失為qr(i,R)ii
iij
C(ji)(ji)
()所謂Bayes判別法則,就是要選擇(R)失達(dá)到極小。
,R,R12
,使得4.12)式表示的總平均損③判的基本思想和步驟:從K個(gè)總體中抽取具有p個(gè)標(biāo)的樣品觀測數(shù)據(jù),借助方差分析的思想構(gòu)造一個(gè)線性判別函數(shù)
中數(shù)1,2
p’定的原則是使得總體之間區(qū)別最大,而每個(gè)總體內(nèi)部的離差最小。有了線性判別函數(shù)后,對于一個(gè)新的樣品,將它的個(gè)指標(biāo)值代入線性判別函數(shù)式中求出值,然后根據(jù)判別一定的規(guī)則,就可判別新的樣品屬于哪個(gè)總體。判分假條:別分析的假設(shè)之一,是每一個(gè)判別變量(解釋變量)不能是其他判別變量的線性組合。即不存在多重共線性問題。判別分析的假設(shè)之二,是各組變量的協(xié)方差矩陣相等。判別分析最簡單和最常用的形式是采用線性判別函數(shù),它們是判別變量的簡單線性組合。在各組協(xié)方差矩陣相等的假設(shè)條件下,可以使用很簡單的公式來計(jì)算判別函數(shù)和進(jìn)行顯著性檢驗(yàn)。判別分析的假設(shè)之三,是各判別變量之間具有多元正態(tài)分布,即每個(gè)變量對于所有其他變量的固定值有正態(tài)分布。在這種條件下可以精確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。當(dāng)違背該假設(shè)時(shí),計(jì)算的概率將非常不準(zhǔn)確。距判與葉判關(guān):距離判別中兩個(gè)總體的距離判別規(guī)則為
XG,1XG2
如如
XX)
,貝
G葉斯判別規(guī)則為:xG,
當(dāng))d當(dāng)(x)
,二者唯一差別僅在于閥值點(diǎn),從某種意義上講,距離判別是貝葉斯判別的特殊情形。題型及分?jǐn)?shù):一判對并正,)二不項(xiàng)擇題,分)三簡題題,分六四主分本想統(tǒng)聚均值聚類基本思想及過程分及費(fèi)希爾基本思想,比較聚類與回歸、判別,因子分析及因子旋轉(zhuǎn)聚與歸判:判別與回歸:聯(lián)系:都是根據(jù)已有數(shù)據(jù)判別未來趨勢。區(qū)別:多元回歸的因變量是數(shù)值型變量,且自變量可是變;判別分析的因量是類別型變量,而自變量不是0-1變②判別與聚類:聚類析:類別未知,利用樣本確定分組數(shù)及所屬類別;判別分析:類別數(shù)及意義已知,還能“預(yù)測”新樣本所屬類別;聚類中加進(jìn)一個(gè)變量需要對類進(jìn)行更新算與其他類的距離別對新樣本進(jìn)行判別后,不更新所屬的類。四計(jì)題題,分計(jì)樣本均值、協(xié)差陣、相關(guān)陣五分題題,分(四二1)主成分分析的SPSS實(shí)分析(主成分個(gè)數(shù)確定,主成分表達(dá)式,主成分分析步驟)2)因子析的SPSS實(shí)例分(因子分析模型,公因子的解釋命名分析二一3)聚類析的SPSS實(shí)例分分類數(shù)確定聚類果命名分析點(diǎn)及改進(jìn)策略)分?jǐn)?shù)定①樹狀圖,確定原則是組內(nèi)距離小,組間距離大。
②聚合系數(shù)圖:在曲線開始變得平緩的點(diǎn)選擇合適的分類樹①任何類都必須在鄰近各類中是突出的,即各類重心間的距離必須大②各類所包含的元素都不要過分地多③分類數(shù)目應(yīng)符合使用的目的④若采用幾種不同的聚類法,則在各自的聚類圖上應(yīng)發(fā)現(xiàn)相同的類⑤對聚類過程中聚合系數(shù)分類數(shù)的變化(曲線)進(jìn)行分析,可以輔助確定合理的分類數(shù)聚分的點(diǎn)層次聚類法的結(jié)果容易受奇異值的影響,而快速聚類法受奇異值、相似測度和不適合的聚類變量的影響較小。層次聚類法可以得到一系列的聚類數(shù),而快速聚類只能得到指定類數(shù)的聚類數(shù)。層次聚類法在數(shù)據(jù)比較多時(shí)計(jì)算量比較大,需要占據(jù)非常大的計(jì)算機(jī)內(nèi)存空間,而快速聚類法計(jì)算量較小。層次聚類法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廊坊會計(jì)考試試題及答案
- 考試試題中考數(shù)學(xué)及答案
- 中學(xué)邏輯考試試題及答案
- 單位駕駛員考試試題及答案
- 2025商品交易合同協(xié)議書
- 環(huán)境科學(xué)概論考試試題及答案
- 北京小學(xué)信息考試試題及答案
- 大學(xué)動力電池考試試題及答案
- 2025至2031年中國搬運(yùn)電動車行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025年地理高考復(fù)習(xí) 微專題 地貌演化過程(講義)(解析版)
- 《軍隊(duì)政治工作手冊》出版
- 2023年科技特長生招生考試試卷word
- GB/T 6283-2008化工產(chǎn)品中水分含量的測定卡爾·費(fèi)休法(通用方法)
- 液化天然氣接收站安全管理規(guī)定
- GB/T 23468-2009墜落防護(hù)裝備安全使用規(guī)范
- 影像診斷與手術(shù)后符合率統(tǒng)計(jì)表
- 2023年北京亦莊國際投資發(fā)展有限公司招聘筆試題庫及答案解析
- ansys電磁場分析經(jīng)典教程
- 美國數(shù)學(xué)競賽AMC8講座課件
- 2020年國家義務(wù)教育質(zhì)量測查德育科目模塊一模擬試題含參考答案
- 導(dǎo)管固定-PPT課件
評論
0/150
提交評論