


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、仁多元分析研究的是多個(gè)隨機(jī)變量及其相互關(guān)系的統(tǒng)計(jì)總體。2多元統(tǒng)計(jì)中常用的統(tǒng)計(jì)量有:樣本均值、樣 本方差、樣本協(xié)方差和樣本相關(guān)系數(shù)。3 協(xié)方差和相關(guān)系數(shù)僅僅是變量間離散程度的 一種度量,并不能刻畫變量間可能存在的關(guān)聯(lián)程 度。4 人們通過各種實(shí)踐,發(fā)現(xiàn)變量之間的相互關(guān)系可以分成相關(guān)和不相關(guān)兩種類型。5 總離差平方和可以分解為回歸離差平方和和剩余離差平方和兩個(gè)部分,各自的自由度為 p和n-p-1 ,其中回歸離差平方和在總離差平方和中所占比重越大,則線性回歸效果越顯著。7 偏相關(guān)系數(shù)是指多元回歸分析中,當(dāng)其他變 量固定后,給定的兩個(gè)變量之間的的相關(guān)系數(shù)。8 . Spss中回歸方程的建模方法有一元線形回
2、 歸、多元線形回歸、嶺回歸、多對(duì)多線形回歸等。9 主成分分析是通過適當(dāng)?shù)淖兞刻鎿Q,使新變 量成為原變量的綜合變量,并尋求相關(guān)性的一種 方法。10 -主成分分析的基本思想是: 設(shè)法將原來眾 多具有一定相關(guān)性(比如P個(gè)指標(biāo)),重 新組合成一組新的互相無關(guān)的綜合指標(biāo) 來代替原來的指標(biāo)。11 主成分的協(xié)方差矩陣為對(duì)角矩陣。12 主成分表達(dá)式的系數(shù)向量是相關(guān)系數(shù)矩陣的特征向量。13 原始變量協(xié)方差矩陣的特征根的統(tǒng)計(jì)含義是原始數(shù)據(jù)的相關(guān)系數(shù)。14 原始數(shù)據(jù)經(jīng)過標(biāo)準(zhǔn)化處理,轉(zhuǎn)化為均值為0 ,方差為1 的標(biāo)準(zhǔn)值,且其協(xié)方差矩陣與相 關(guān)系數(shù)矩陣相等。15 樣本主成分的總方差等于1 。16 .變量按相關(guān)程度為,在
3、相關(guān)性很強(qiáng)程度下, 主成分分析的效果較好。仃在經(jīng)濟(jì)指標(biāo)綜合評(píng)價(jià)中,應(yīng)用主成分分析法,則評(píng)價(jià)函數(shù)中的權(quán)數(shù)為方差貢獻(xiàn)度。19.因子分析是把每個(gè)原始變量分解為兩部分因素,一部分是公共因子,另一部分為特殊因子。20變量共同度是指因子載荷矩陣中第i行元素的平方和。21 公共因子方差與特殊因子方差之和為1。22 -聚類分析是建立一種分類方法,它將一批樣哂或變量按照它們?cè)谛再|(zhì)上的親疏程度進(jìn)行科學(xué)的分 類。23. Q型聚類法是按樣品進(jìn)行聚類,R型聚類法是按變量進(jìn)行聚類。24 - R型聚類統(tǒng)計(jì)量通常采用具有代表性的變量。25 -在聚類分析中需要對(duì)原始數(shù)據(jù)進(jìn)行無量綱化處理,以消除不同量綱或數(shù)量級(jí)的影響,達(dá)到數(shù)據(jù)間
4、 可同度量的目的。 常用的無量綱化方法有以下幾種: 中心化變換、規(guī)格化變換、標(biāo)準(zhǔn)化變換、對(duì)數(shù)變換。26 .六種Q型聚類方法分別為最短距離法、最長(zhǎng)距 離法、中間距離法、重心法、類平均法、可變類平 均法28判別分析是要解決在研究對(duì)象已分成若干類的 情況下,確定新的觀測(cè)數(shù)據(jù)屬于已知類別中哪一類 的多元統(tǒng)計(jì)方法。29用判別分析方法處理問題時(shí),通常以判別函數(shù)作為衡量新樣本點(diǎn)與各已知組別接近程度的指標(biāo)。30.進(jìn)行判別分析時(shí),通常指定一種判別規(guī)則,用 來判定新樣本的歸屬,常見的判別準(zhǔn)則有 Fisher準(zhǔn) 則、貝葉斯準(zhǔn)則。33 - Fisher判別法就是要找一個(gè)由p個(gè)變量組成的線性判別函數(shù),使得各自組內(nèi)點(diǎn)的離
5、差盡可能接近, 而不同組間點(diǎn)的盡可能疏遠(yuǎn)。簡(jiǎn)述多元統(tǒng)計(jì)分析的作用。能夠簡(jiǎn)化數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu);能夠進(jìn)行分類和 組合;能夠研究指標(biāo)之間的依存關(guān)系;進(jìn)行預(yù)測(cè); 進(jìn)行假設(shè)檢驗(yàn)。簡(jiǎn)述逐步回歸分析萬法的基本原理。原理是從一個(gè)自變量出發(fā),依照自變量對(duì)因變 量的影響顯著性大小,從大到小逐個(gè)弓I入回歸方 程,同時(shí),在逐個(gè)自變量選入回歸方程的過程中, 如果發(fā)現(xiàn)先前被弓I入的自變量在其后由于某些自 變量的弓I入而失去其重要性時(shí),可以從回歸方程中 隨時(shí)予以剔除。弓I入一個(gè)變量或剔除一個(gè)變量,為 逐步回歸的一步,每步都要進(jìn)行顯著性檢驗(yàn),以便 保證每次弓I入變量前回歸方程中只包括顯著性變 量,這個(gè)過程反復(fù)進(jìn)行,直到既無不顯
6、著變量從回 歸方程中剔除,又無顯著變量需要選入回歸方程時(shí) 為止。提取樣本主成分的原則。Fi于F不相關(guān)。(2) F1是X ,X 2Xp的一切線 性組合中方差最大的,F(xiàn)2是與F1不相關(guān)的X1 ,X2Xp 一切線性組合中方差最大。Fp是與F1 , Fp-1不相關(guān)的X1 ,X 1.Xp 一切線性組合中方差最大。思考主成分分析法的應(yīng)用。首先,主成分分析可以用于系統(tǒng)評(píng)估;其次, 在經(jīng)濟(jì)統(tǒng)計(jì)研究中,除了經(jīng)濟(jì)效益的綜合評(píng)價(jià)研究 外,對(duì)不同地區(qū)經(jīng)濟(jì)發(fā)展水平的評(píng)價(jià)研究,不同地 區(qū)經(jīng)濟(jì)發(fā)展競(jìng)爭(zhēng)力的評(píng)價(jià)研究,人民生活水平、生活質(zhì)量的評(píng)價(jià)研究,等等都可以用主成分分析方法BAYES判別法和FISHER判別法的比較進(jìn)行研究
7、;另外,主成分分析除了用于系統(tǒng)評(píng)估 研究領(lǐng)域外,還可以與回歸分析結(jié)合,進(jìn)行主成 分回歸分析,以及利用主成分分析進(jìn)行挑選變 量,選擇變量子集合的研究。簡(jiǎn)述囚子分析的基本思想。因子分析是通過變量(或樣品)的相關(guān)系數(shù) 矩陣內(nèi)部結(jié)構(gòu)的研究, 找出存在于所有變量 (或 樣品)中具有共性的因素, 并綜合為少數(shù)幾個(gè)新 變量,把原始變量表示成少數(shù)幾個(gè)綜合變量的線 性組合,以再現(xiàn)原始變量與綜合變量之間的相關(guān) 關(guān)系。其中,這里的少數(shù)幾個(gè)綜合變量一般是不 可觀測(cè)指標(biāo),通常稱為公共因子。簡(jiǎn)述系統(tǒng)聚類法的基本思想及王要步驟。聚類分析是將樣品或變量按照它們?cè)谛再|(zhì)上的親疏程度進(jìn)行分類的多元統(tǒng)計(jì)分析方法。聚類分析時(shí),用來描述
8、樣品或變量的親疏程度通常 有兩個(gè)途徑,一是把每個(gè)樣品或變量看成是多維 空間上的一個(gè)點(diǎn),在多維坐標(biāo)中,定義點(diǎn)與點(diǎn), 類和類之間的距離,用點(diǎn)與點(diǎn)間距離來描述樣品 或變量之間的親疏程度;另一個(gè)是計(jì)算樣品或變 量的相似系數(shù),用相似系數(shù)來描述樣品或變量之 間的親疏程度簡(jiǎn)述系統(tǒng)聚類分析法。是在樣品距離的基礎(chǔ)上定義類與類的距離, 首先將n個(gè)樣品自成一類,然后每次將具有最 小距離的兩個(gè)類合并,合并后再重新計(jì)算類與類 之間的距離,再并類,這個(gè)過程一直持續(xù)到所有 的樣品都?xì)w為一類為止。這種聚類方法稱為系統(tǒng) 聚類法。根據(jù)并類過程所做的樣品并類過程圖稱 為聚類譜系圖。16 簡(jiǎn)述聚類分析和判別分析的區(qū)別和聯(lián)系。 一 |
9、區(qū)別:判別分析與聚類分析不同。判別分析 是在已知研究對(duì)象分成若干類型(或組別)并已 取得各種類型的一批已知樣品的觀測(cè)數(shù)據(jù), 在此 基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別式,然后對(duì)未知類型 的樣品進(jìn)行判別分類。聚類分析,并對(duì)于一批合定 樣品要?jiǎng)澐值念愋褪孪炔恢?,正需要聚類分析?綜合確定類型的。聯(lián)系:判別分析與聚類分析往往聯(lián)合使用,往往是專職能部門類分析,再進(jìn)行判別新樣品屬于哪 一類。建立判別式判別。判別分析的基本步驟。步驟:(1)選擇自變量或組變量,并計(jì)算各組 單變量描述的計(jì)量,對(duì)判別分析所要求的前提能定 進(jìn)行統(tǒng)計(jì)檢驗(yàn);(2)推導(dǎo)判別系數(shù)組出標(biāo)準(zhǔn)化或未標(biāo)準(zhǔn)化的典則判別函數(shù)系數(shù),并進(jìn)行安著性檢驗(yàn);(3)建
10、立 Fisher判別模型,根據(jù) Bayes規(guī)則和Fisher規(guī)則進(jìn)行判別組合;4)進(jìn)行樣本回判分析,對(duì)判別系數(shù)的結(jié)果進(jìn)行分析;(5)輸出結(jié)果,根據(jù)實(shí)際情況分析出結(jié)果,做出結(jié)論。Fisher判別:又稱典則判別,該方法的基本思想是投影,即將原來在R維空間的自變量組合投影到維度較低的 D維空間上去,然后在 D維空間再進(jìn)行分類。其優(yōu)勢(shì)在于對(duì)分布和方差沒有什么限制,應(yīng)用范圍廣泛。Bayes判別:就是利用經(jīng)驗(yàn)信息,基本思想是認(rèn) 為所有D個(gè)類別都是空間中互斥的子城,每個(gè)觀測(cè) 都是空間中的一點(diǎn)。其優(yōu)點(diǎn)在于進(jìn)行多類別判別, 但是它要求總體呈多元正態(tài)分布。距離判別法基本思想 :根據(jù)已知分類的數(shù)據(jù),計(jì)算 樣品與各類
11、之間的“距離”,根據(jù)樣品到類之間的“距 離”大小判別,樣品到那個(gè)類的“距離”最小,判 樣品屬于哪個(gè)類。Fisher判別法的基本思想|:從多個(gè)總體(類)抽取 一定的樣本,借助方差分析的思想,建立p個(gè)指標(biāo)的線性判別函數(shù),把待判樣品代入線性判別函數(shù), 然后與臨界值比較,就可判樣品屬于哪個(gè)類。Bayes判別法的基本思想:對(duì)多個(gè)總體(類)要求 有一定的認(rèn)識(shí),禾U用借Bayes公式計(jì)算樣品到每個(gè) 總體(類)的概率,比較概率的大小,樣品到那個(gè) 總體(類)的概率最大,就判樣品屬于哪個(gè)總體(類)。因子分析的基本思想 :把每個(gè)研究變量分解為幾個(gè)影響因素變量,將每個(gè)原始變量分解成兩部分因素,一部分是由所有變量共同具
12、有的少數(shù)幾個(gè)公共因子組成的,另一部分是 每個(gè)變量獨(dú)自具有的因素,即特殊因子。聯(lián)系:(1)因子分析是主成分分析的推廣,是主 成分分析的逆問題。(2)二者都是以降維為目 的,都是從協(xié)方差矩陣或相關(guān)系數(shù)矩陣出發(fā)。區(qū)別:(1)主成分分析模型是原始變量的線性組 合,是將原始變量加以綜合、歸納,僅僅是變量變 換;而因子分析是將原始變量加以分解,描述原始 變量協(xié)方差矩陣結(jié)構(gòu)的模型;只有當(dāng)提取的公因子個(gè)數(shù)等于原始變量個(gè)數(shù)時(shí),因子分析才對(duì)應(yīng)變量變 換。(2)主成分分析,中每個(gè)主成分對(duì)應(yīng)的系數(shù)是 唯一確定的;因子分析中每個(gè)因子的相應(yīng)系數(shù)即因 子載荷不是唯一的。(3)因子分析中因子載荷的不 唯一性有利于對(duì)公因子進(jìn)行
13、有效解釋;而主成分分 析對(duì)提取的主成分的解釋能力有限。因子分析的基本步驟|(1)因子分析的前提條件鑒定(2)因子提取(3)因子旋轉(zhuǎn)(4)計(jì)算因子得分主成分分析概念及兒何意義概念(思想):主成分分析就是設(shè)法將原來指標(biāo) 重新組合成一組新的互相無關(guān)的幾個(gè)綜合指標(biāo)來 代替原來指標(biāo)。同時(shí)根據(jù)實(shí)際需要從中可取幾個(gè)較少的綜合指標(biāo)盡可能多地反映原來的指標(biāo)的信息幾何意義:1,,n).檢驗(yàn)主成分分析的過程也就是坐標(biāo)旋轉(zhuǎn)的過程,各主成分表達(dá)式就是新坐標(biāo)系與原坐標(biāo)系的轉(zhuǎn)換 關(guān)系,新坐標(biāo)系中各坐標(biāo)軸的方向就是原始數(shù)據(jù) 方差最大的方向。(1) H0:卩0 (卩0為已知向量),H1:卩工卩0(2)取檢驗(yàn)統(tǒng)計(jì)量(3)按傳統(tǒng)的
14、檢驗(yàn)方法,對(duì)給定的顯著水平a ,查臨界值表得入a是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo),具體地找出一些能夠度量樣品或指標(biāo)之間相似程度的統(tǒng) 計(jì)量,然后利用統(tǒng)計(jì)量將樣品或指標(biāo)進(jìn)行歸類。 把相似的樣品或指標(biāo)歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標(biāo))聚合完畢. 典型相天基本思想和王成分分析非常相似。首先在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。然后選取和最初挑選的這對(duì)線性組合不相關(guān)的線性組合, 使其配對(duì),并選取相關(guān)系數(shù)最大的一對(duì),如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢 為此。被選出的線性組合配對(duì)稱為典型變量,它們的相關(guān)系數(shù)稱為典型相關(guān)系數(shù)。典型相關(guān)系數(shù)度
15、量了這兩組變量之間聯(lián)系的強(qiáng)度。簡(jiǎn)述典型相關(guān)分析的分析方法和典型變量選取 具體冥施步驟(4) 由樣本值計(jì)算 X及T20值,若T20 Xa ,則否定H否則H相容.(1) 計(jì)算相關(guān)系數(shù)陣 R(2) 求典型相關(guān)系數(shù)及典型變量(3) 典型相關(guān)系數(shù)的顯著性檢驗(yàn)(1) 兩個(gè)總體的距離判別法:這兩個(gè)總體、G分別抽取m和n2個(gè)樣品,每個(gè)樣品測(cè)量p個(gè)指標(biāo),計(jì)算X 到 G、G 總體的距離。X G D (X , G) 0對(duì)一切j工I ;待判 若有一個(gè) W=0。當(dāng)?shù)?刀(2刀(k)互不相等時(shí):X G,若 W(X) 0對(duì)一切j工I ;待判 若有一個(gè) W/=0L已知時(shí)均值向量的檢驗(yàn)(1 )寫出檢驗(yàn)假設(shè), H:卩=卩0 H 典型相關(guān)分析是研究?jī)山M變量之間相關(guān)關(guān) 系的統(tǒng)計(jì)方法:卩工卩0 (2)檢 驗(yàn)統(tǒng)計(jì)量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 5歲小孩常見病與護(hù)理
- 投行法律培訓(xùn)
- 端午邀約活動(dòng)課件
- 護(hù)理新生培訓(xùn)
- 早產(chǎn)的病因及護(hù)理
- 名著導(dǎo)讀艾青詩選
- 礦業(yè)采礦培訓(xùn)課件
- 新時(shí)代教育評(píng)價(jià)改革總體方案
- 腫瘤并發(fā)癥感染
- 銀行風(fēng)險(xiǎn)案例培訓(xùn)
- 2024年河南焦作中考生物試題及答案1
- 醫(yī)院培訓(xùn)課件:《導(dǎo)管相關(guān)靜脈血栓形成專家共識(shí)》
- 帆船理論培訓(xùn)課程設(shè)計(jì)
- 《有機(jī)化學(xué)》課程說課
- 2024直驅(qū)透平有機(jī)朗肯循環(huán)低溫余熱發(fā)電機(jī)組技術(shù)規(guī)范
- 銀行案防工作專題會(huì)上發(fā)言材料范文
- 原紙購銷授權(quán)書
- 閱讀社團(tuán)備課
- 2023-2024學(xué)年四川省德陽市七年級(jí)(下)期末數(shù)學(xué)試卷(含解析)
- 2024年中華人民共和國(guó)企業(yè)所得稅年度納稅申報(bào)表(帶公式)20240301更新
- FZ∕T 54007-2019 錦綸6彈力絲行業(yè)標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論