




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第 1 章 多元正態(tài)分布1、在數(shù)據(jù)處理時,為什么通常要進行標(biāo)準(zhǔn)化處理?數(shù)據(jù)的標(biāo)準(zhǔn)化是將數(shù)據(jù)按比例縮放, 使之落入一個小的特定區(qū)間。 在某些比 較和評價的指標(biāo)處理中經(jīng)常會用到, 去除數(shù)據(jù)的單位限制, 將其轉(zhuǎn)化為無量綱的 純數(shù)值,便于不同單位或量級的指標(biāo)能夠進行比較和加權(quán)。其中最典型的就是 0-1 標(biāo)準(zhǔn)化和 Z 標(biāo)準(zhǔn)化。2、歐氏距離與馬氏距離的優(yōu)缺點是什么? 歐氏距離也稱歐幾里得度量、歐幾里得度量,是一個通常采用的距離定義, 它是在 m維空間中兩個點之間的真實距離。 在二維和三維空間中的歐氏距離的就 是兩點之間的距離。缺點:就大部分統(tǒng)計問題而言, 歐氏距離是不能令人滿意的。 每個坐標(biāo)對歐 氏距離的
2、貢獻是同等的。 當(dāng)坐標(biāo)表示測量值時, 它們往往帶有大小不等的隨機波 動,在這種情況下, 合理的方法是對坐標(biāo)加權(quán), 使變化較大的坐標(biāo)比變化較小的 坐標(biāo)有較小的權(quán)系數(shù), 這就產(chǎn)生了各種距離。 當(dāng)各個分量為不同性質(zhì)的量時,“距 離”的大小與指標(biāo)的單位有關(guān)。 它將樣品的不同屬性之間的差別等同看待, 這一 點有時不能滿足實際要求。沒有考慮到總體變異對距離遠近的影響。馬氏距離表示數(shù)據(jù)的協(xié)方差距離。 為兩個服從同一分布并且其協(xié)方差矩陣為 的隨機變量與的差異程度 : 如果協(xié)方差矩陣為單位矩陣 , 那么馬氏距離就簡化 為歐氏距離 , 如果協(xié)方差矩陣為對角陣 , 則其也可稱為正規(guī)化的歐氏距離。優(yōu)點:它不受量綱的影
3、響,兩點之間的馬氏距離與原始數(shù)據(jù)的測量單位無關(guān)。 由標(biāo)準(zhǔn)化數(shù)據(jù)和中心化數(shù)據(jù)計算出的二點之間的馬氏距離相同。 馬氏距離還可以 排除變量之間的相關(guān)性的干擾。缺點:夸大了變化微小的變量的作用。 受協(xié)方差矩陣不穩(wěn)定的影響, 馬氏距 離并不總是能順利計算出。3、當(dāng)變量 X1 和 X2方向上的變差相等,且與互相獨立時,采用歐氏距離與統(tǒng)計 距離是否一致?統(tǒng)計距離區(qū)別于歐式距離, 此距離要依賴樣本的方差和協(xié)方差, 能夠體現(xiàn)各 變量在變差大小上的不同, 以及優(yōu)勢存在的相關(guān)性, 還要求距離與各變量所用的 單位無關(guān)。如果各變量之間相互獨立 , 即觀測變量的協(xié)方差矩陣是對角矩陣 , 則 馬氏距離就退化為用各個觀測指標(biāo)
4、的標(biāo)準(zhǔn)差的倒數(shù)作為權(quán)數(shù)的加權(quán)歐氏距離。4、如果正態(tài)隨機向量 X (X1,X2,L X p) 的協(xié)方差陣 為對角陣,證明 X的分量 是相互獨立的隨機變量。解: 因為 X(X1,X2,L Xp) 的密度函數(shù)為f (x1,., xp )p1 1/2 1 12 exp 2(x ) (x )又由于 1O2 p2 2 21 2 L p121122 O12 p2122L1/2exp1(x ) 2122O( x )1p exp1 ( x121)2211 ( x23)21 (x p2pi1i 2 exp(xii)22 i2f ( x1 ).f (xp)則其分量是相互獨立5. y1和 y2是相互獨立的隨機變量,且
5、y1 N(0,1),y2 N(3,4)a)求 y12 的分布b)如果 yy1(y23) / 2,寫出 y y 關(guān)于 y1與 y 2的表達式,并寫出yy 的分則 f ( x1 ,., xp )布。(c)如果 yy1 且y N( , ),寫出 yy 關(guān)于y 1與y 2的表達式,并y21寫出 y 1 y 的分布。 解:(a)由于y1 N(0,1),所以y1 (2 1)。(b)由于 y1 N(0,1),y2 N( 3,4);所以y2 2 3 N( 0,1);故yy y12 (y22 3)2,且yy (2 2)第 2章 均值向量和協(xié)方差陣的檢驗1、略2、試談 Wilks 統(tǒng)計量在多元方差分析中的重要意義
6、。3、題目此略多元均值檢驗 ,從題意知道,容量為 9 的樣本 ,總體協(xié)方差未知假設(shè) H0:0 , H1 :0 (n=9 p=5)檢驗統(tǒng)計量 /(n-1)T2 n(X 0)S1(X 0)服從 P,n-1的T 2分布統(tǒng)計量 T2 實際上是樣本均值與已知總體均值之間的馬氏距離再乘以n*(n-1)這個值越大,相等的可能性越小,備擇假設(shè)成立時,T2 有變大的趨勢,所以拒絕域選擇 T 2值較大的右側(cè)部分,也可以轉(zhuǎn)變?yōu)?F 統(tǒng)計量零假設(shè)的拒絕區(qū)域 (n-p)/(n-1)*p* T2 Fp,n p( )1/10* T 2 F5,4(5)0=( 6212.01 32.87 2972 9.5 15.78)樣本均值
7、( 4208.78 35.12 1965.89 12.21 27.79)(樣本均值 - 0) =(-2003.23 2.25 -1006.11 2.71 12.01)協(xié)方差矩陣 (降維因子分析抽取 )Inter-Item Covariance Matrix人均GDP( 元)三產(chǎn)比重( % )人均消費 (元)人口增長 (%)文盲半文盲( %)人均GDP( 元)1020190.840582.460331693.531-599.784-6356.325三產(chǎn)比重( % )582.46019.480-105.4646.62543.697人均消費 (元)331693.531-105.464125364.3
8、21-213.634-3130.038人口增長 (%)-599.7846.625-213.6346.09925.410文盲半文盲( %)-6356.32543.697-3130.03825.410196.884協(xié)方差的逆矩陣1.88034E-05 -0.000440368 -6.09781E-05 0.00279921 -0.000625893-0.00044037 0.207023949 -0.000210374 -0.0237044-0.06044981-6.0978E-05-0.0002103740.00022733-0.01050190.0030474740.002799208-0.0
9、23704352-0.0105018810.85288927-0.18139981-0.00062589-0.060449810.003047474-0.18139980.070148804計算: 邊遠及少數(shù)民族聚居區(qū)社會經(jīng)濟發(fā)展水平的指標(biāo)數(shù)據(jù) .xlsT 2 =9* (-2003.23 2.25 -1006.11 2.71 12.01)*s-1* (-2003.23 2.25 -1006.11 2.71 12.01)=9*50.11793817=451,06144353F 統(tǒng)計量 =45.26.2 拒絕零假設(shè),邊緣及少數(shù)民族聚居區(qū)的社會經(jīng)濟發(fā)展水平與 全國平均水平有顯著差異。4、略第 3 章
10、 聚類分析1. 、聚類分析的基本思想和功能是什么? 聚類分析的基本思想是研究的樣品或指標(biāo)之間存著程度不同的相似性, 于是 根據(jù)一批樣品的多個觀測指標(biāo), 具體找出一些能夠度量樣品或指標(biāo)之間的相似程 度的統(tǒng)計量, 以這些統(tǒng)計量作為劃分類型的依據(jù), 把一些相似程度較大的樣品聚 合為一類, 把另外一些彼此之間相似程度較大的樣品又聚合為另外一類, 直到把 所有的樣品聚合完畢, 形成一個有小到大的分類系統(tǒng), 最后再把整個分類系統(tǒng)畫 成一張分群圖, 用它把所有樣品間的親疏關(guān)系表示出來。 功能是把相似的研究對 象歸類。2、試述系統(tǒng)聚類法的原理和具體步驟。 系統(tǒng)聚類是將每個樣品分成若干類的方法, 其基本思想是先
11、將各個樣品各看 成一類,然后規(guī)定類與類之間的距離, 選擇距離最小的一對合并成新的一類, 計 算新類與其他類之間的距離, 再將距離最近的兩類合并, 這樣每次減少一類, 直 至所有的樣品合為一類為止。具體步驟:1、對數(shù)據(jù)進行變換處理;(不是必須的, 當(dāng)數(shù)量級相差很大或指標(biāo)變量具有不同 單位時是必要的)2、構(gòu)造 n 個類,每個類只包含一個樣本;3、計算 n 個樣本兩兩間的距離 ijd ;4、合并距離最近的兩類為一新類;5、計算新類與當(dāng)前各類的距離,若類的個數(shù)等于 1,轉(zhuǎn)到 6;否則回 4;6、畫聚類圖;7、決定類的個數(shù),從而得出分類結(jié)果。3、試述 K- 均值聚類的方法原理。K-均值法是一種非譜系聚類
12、法, 把每個樣品聚集到其最近形心 (均值)類中, 它是把樣品聚集成 K 個類的集合,類的個數(shù) k 可以預(yù)先給定或者在聚類過程中 確定,該方法應(yīng)用于比系統(tǒng)聚類法大得多的數(shù)據(jù)組。步驟是把樣品分為 K 個初 始類,進行修改, 逐個分派樣品到期最近均值的類中 (通常采用標(biāo)準(zhǔn)化數(shù)據(jù)或非標(biāo)準(zhǔn)化數(shù)據(jù)計算歐氏距離) 重新計算接受新樣品的類和失去樣品的類的形心。 重 復(fù)這一步直到各類無元素進出。4、試述模糊聚類的思想方法。模糊聚類分析是根據(jù)客觀事物間的特征、 親疏程度、 相似性,通過建立模糊 相似關(guān)系對客觀事物進行聚類的分析方法, 實質(zhì)是根據(jù)研究對象本身的屬性構(gòu)造 模糊矩陣, 在此基礎(chǔ)上根據(jù)一定的隸屬度來確定其
13、分類關(guān)系。 基本思想是要把需 要識別的事物與模板進行模糊比較, 從而得到所屬的類別。 簡單地說, 模糊聚類 事先不知道具體的分類類別, 而模糊識別是在已知分類的情況下進行的。 模糊聚 類分析廣泛應(yīng)用在氣象預(yù)報、地質(zhì)、農(nóng)業(yè)、林業(yè)等方面。它有兩種基本方法:系統(tǒng)聚類法和逐步聚類法。該方法多用于定性變量的分類。5、略第 4 章 判別分析1、應(yīng)用判別分析應(yīng)該具備什么樣的條件? 答:判別分析最基本的要求是, 分組類型在兩組以上, 每組案例的規(guī)模必須至少 在一個以上,解釋變量必須是可測量的,才能夠計算其平均值和方差。 對于判別分析有三個假設(shè):(1)每一個判別變量不能是其他判別變量的線性組合。有時一個判別變量
14、與另 外的判別變量高度相關(guān),或與其的線性組合高度相關(guān),也就是多重共線性。(2)各組變量的協(xié)方差矩陣相等。判別分析最簡單和最常用的的形式是采用現(xiàn) 行判別函數(shù), 他們是判別變量的簡單線性組合, 在各組協(xié)方差矩陣相等的假設(shè)條 件下,可以使用很簡單的公式來計算判別函數(shù)和進行顯著性檢驗。(3)各判別變量之間具有多元正態(tài)分布,即每個變量對于所有其他變量的固定 值有正態(tài)分布,在這種條件下可以精確計算顯著性檢驗值和分組歸屬的概率。2、試述貝葉斯判別法的思路。 答:貝葉斯判別法的思路是先假定對研究的對象已有一定的認(rèn)識, 常用先驗概率 分布來描述這種認(rèn)識, 然后我們?nèi)〉靡粋€樣本, 用樣本來修正已有的認(rèn)識 (先驗
15、概率分布),得到后驗概率分布,各種統(tǒng)計推斷都通過后驗概率分布來進行。將 貝葉斯判別方法用于判別分析,就得到貝葉斯判別。3、試述費歇判別法的基本思想。 答:費歇判別法的基本思想是將高維數(shù)據(jù)點投影到低維空間上來, 然而利用方差 分析的思想選出一個最優(yōu)的投影方向。 因此,嚴(yán)格的說費歇判別分析本身不是一 種判別方法, 只是利用費歇統(tǒng)計量進行數(shù)據(jù)預(yù)處理的方法, 以使更有利于用判別 分析方法解決問題。 為了有利于判別, 我們選擇投影方向 a應(yīng)使投影后的 k個一元 總體能盡量分開 (同一總體中的樣品的投影值盡量靠近) 。k要做到這一點, 只要 投影后的 k個一元總體均值有顯著差異,即可利用方差分析的方法使組
16、間平方和 盡可能的大。則選取投影方向 a使 (a)達極大即可。4、什么是逐步判別分析? 答:具有篩選變量能力的判別方法稱為逐步判別分析法。 逐步判別分析法就是先 從所有因子中挑選一個具有最顯著判別能力的因子, 然后再挑選第二個因子, 這 因子是在第一因子的基礎(chǔ)上具有最顯著判別能力的因子, 即第一個和第二個因子 聯(lián)合起來有顯著判別能力的因子; 接著挑選第三個因子, 這因子是在第一、 第二 因子的基礎(chǔ)上具有最顯著判別能力的因子。 由于因子之間的相互關(guān)系, 當(dāng)引進了 新的因子之后, 會使原來已引入的因子失去顯著判別能力。 因此,在引入第三個 因子之后就要先檢驗已經(jīng)引入的因子是否還具有顯著判別能力,
17、如果有就要剔除 這個不顯著的因子;接著再繼續(xù)引入,直到再沒有顯著能力的因子可剔除為止, 最后利用已選中的變量建立判別函數(shù)。5、簡要敘述判別分析的步驟及流程 答:(1)研究問題:選擇對象, 評估一個多元問題各組的差異, 將觀測個體歸類, 確定組與組之間的判別函數(shù)。(2)設(shè)計要點:選擇解釋變量,樣本量的考慮,建立分析樣本的保留樣本。(3)假定:解釋變量的正態(tài)性,線性關(guān)系,解釋變量間不存在多重共線性,協(xié) 方差陣相等。(4)估計判別函數(shù):聯(lián)立估計或逐步估計,判別函數(shù)的顯著性。(5)使用分類矩陣評估預(yù)測的精度:確定最優(yōu)臨界得分,確定準(zhǔn)則來評估判對 比率,預(yù)測精確的統(tǒng)計顯著性。(6)判別函數(shù)的解釋:需要多
18、少個函數(shù)。評價單個函數(shù)主要從判別權(quán)重、判別 載荷、偏 F 值幾個方面;評價兩個以上的判別函數(shù), 分為評價判別的函數(shù)和評價 合并的函數(shù)。(7)判別結(jié)果的驗證:分開樣本或交叉驗證,刻畫組間的差異。6、略第 5 章 主成分分析1、主成分的基本思想是什么?在對某一事物進行實證研究時, 為更全面、 準(zhǔn)確地反映事物的特征及其發(fā)展 規(guī)律,往往考慮與其有關(guān)的多個指標(biāo), 在多元統(tǒng)計中也稱為變量。 一方避免遺漏 重要信息而考慮盡可能多的指標(biāo)看, 另一方面考慮指標(biāo)的增多, 又難以避免信息 重疊。希望涉及的變量少,而得到的信息量有較多。主成分的基本思想是研究如何通過原來的少數(shù)幾個線性組合來解釋原來變 量絕大多數(shù)信息的
19、一種多元統(tǒng)計方法。 研究某一問題涉及的眾多變量之間有一定 的相關(guān)性, 必然存在著支配作用的公共因素。 通過對原始變量相關(guān)矩陣或協(xié)方差 矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研究,利用原始變量的線性組合形成幾個無關(guān)的綜合指標(biāo) (主成分)來代替原來的指標(biāo)。 通常數(shù)學(xué)上的處理就是將原來 P 個指標(biāo)作線性組 合,作為新的綜合指標(biāo)。最經(jīng)典的做法就是用 F1(選取的第一個線性組合,即 第一個綜合指標(biāo))的方差來表達,即 Var( F1)越大,表示 F1 包含的信息越多。 因此在所有的線性組合中選取的 F1應(yīng)該是方差最大的,故稱 F1 為第一主成分, 如果第一主成分不足以代表原來 P個指標(biāo)的信息,再考慮選取 F2 即選第二個線
20、性組合,為了有效地反映原來信息, F1已有的信息就不需要再出現(xiàn)在 F2 中,用 數(shù)學(xué)語言表達就是要求 Cov(F1,F(xiàn)2)=0 則稱 F2 為第二主成分,依此類推可以 構(gòu)造出第三、第四,第 P 個主成分。2、主成分在應(yīng)用中的主要作用是什么? 作用:利用原始變量的線性組合形成幾個綜合指標(biāo)(主成分) ,在保留原始變量 主要信息的前提下起到降維與簡化問題的作用, 使得在研究復(fù)雜問題時更容易抓 住主要矛盾。通過主成分分析, 可以從事物之間錯綜復(fù)雜的關(guān)系中找出一些主要 成分,從而能有效利用大量數(shù)據(jù)進行定量分析, 解釋變量之間的內(nèi)在關(guān)系, 得到 對事物特征及其發(fā)展規(guī)律的一些深層次的啟發(fā), 把研究工作引向深
21、入。 主成分分 析能降低所研究的數(shù)據(jù)空間的維數(shù),有時可通過因子載荷 aij 的結(jié)論,弄清 X 變 量間的某些關(guān)系, 多維數(shù)據(jù)的一種圖形表示方法, 用主成分分析篩選變量, 可以 用較少的計算量來選擇,獲得選擇最佳變量子集合的效果。3. 由協(xié)方差陣出發(fā)和由相關(guān)陣出發(fā)求主成分有什么不同?( 1)由協(xié)方差陣出發(fā)設(shè)隨即向量 X=(X1,X2,X3, Xp)的協(xié)方差矩陣為, 1 2 p為的特征值, 1,2, p為矩陣 A 各特征值對應(yīng)的標(biāo)準(zhǔn)正交特 征向量,則第 i 個主成分為 Yi= 1i*X1+ 2i*X2+ +pi*Xp,i=1,2, ,p 此時 VAR (Yi)= i ,(,), 我們把 X1,X2
22、,X3, Xp 的協(xié)方差矩陣 的非零特征根 1 2 p 0 向量對應(yīng)的標(biāo)準(zhǔn)化特征向量 1,2, p 分別作為系數(shù)向量, Y1= 1*X, Y2=2*X, , Yp=p*X 分別稱為隨即向量 X 的第一主成分,第二主成 分第 p主成分。 Y 的分量 Y1,Y2, Yp依次是 X 的第一主成分、第 二主成分第 p主成分的充分必要條件是: (1)Y=P*X ,即P為 p階正交陣, (2)Y的分量之間互不相關(guān),即 D(Y)=diag( 1, 2, p),(3)Y 的 p個分 量是按方差由大到小排列,即 1 2 p。(2)由相關(guān)陣出發(fā)對原始變量 X 進行標(biāo)準(zhǔn)化,Z=( 1/2)-1*(X- ) cov(
23、Z)=R 原始變量的相關(guān)矩陣實際上就是對原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣, 因此,有相 關(guān)矩陣求主成分的過程與主成分個數(shù)的確定準(zhǔn)則實際上是與由協(xié)方差矩陣出發(fā) 求主成分的過程與主成分個數(shù)的確定準(zhǔn)則相一致的。 ,i i 分別表示相關(guān)陣 R 的特征根值與對應(yīng)的標(biāo)準(zhǔn)正交特征向量, 此時,求得的主成分與原始變量的關(guān)系 式為:Yi=i*Z=i*(1/2)-1*(X- )在實際研究中 ,有時單個指標(biāo)的方差對研究目的起關(guān)鍵作用 ,為了達到研究 目的,此時用協(xié)方差矩陣進行主成分分析恰到好處。 有些數(shù)據(jù)涉及到指標(biāo)的不同 度量尺度使指標(biāo)方差之間不具有可比性 ,對于這類數(shù)據(jù)用協(xié)方差矩陣進行主成分 分析也有不妥。 相關(guān)系數(shù)
24、矩陣計算主成分其優(yōu)勢效應(yīng)僅體現(xiàn)在相關(guān)性大、 相關(guān)指 標(biāo)數(shù)多的一類指標(biāo)上。 避免單個指標(biāo)方差對主成分分析產(chǎn)生的負(fù)面影響, 自然會 想到把單個指標(biāo)的方差從協(xié)方差矩陣中剝離,而相關(guān)系數(shù)矩陣恰好能達到此目 的。4、略第 6 章 因子分析1、因子分析與主成分分析有什么本質(zhì)不同? 答:( 1)因子分析把諸多變量看成由對每一個變量都有作用的一些公共因子和 一些僅對某一個變量有作用的特殊因子線性組合而成, 因此,我們的目的就是要 從數(shù)據(jù)中探查能對變量起解釋作用的公共因子和特殊因子, 以及公共因子和特殊 因子的線性組合。 主成分分析則簡單一些, 它只是從空間生成的角度尋找能解釋 諸多變量絕大部分變異的幾組彼此不
25、相關(guān)的新變量 (2)因子分析中,把變量表示成各因子的線性組合,而主成分分析中,把主成 分表示成各變量的線性組合 (3)主成分分析中不需要有一些專門假設(shè),因子分析則需要一些假設(shè),因子分 析的假設(shè)包括: 各個因子之間不相關(guān), 特殊因子之間不相關(guān), 公共因子和特殊因 子之間不相關(guān)。(4)在因子分析中,提取主因子的方法不僅有主成分法,還有極大似然法等, 基于這些不同算法得到的結(jié)果一般也不同。而主成分分析只能用主成分法提取。(5)主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征根唯一時,主成 分一般是固定;而因子分析中,因子不是固定的,可以旋轉(zhuǎn)得到不同的因子。(6)在因子分析中,因子個數(shù)需要分析者指定
26、,結(jié)果隨指定的因子數(shù)不同而不 同。在主成分分析中, 主成分的數(shù)量是一定的, 一般有幾個變量就有幾個主成分。(7)與主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解 釋方面更加有優(yōu)勢。 而如果想把現(xiàn)有的變量變成少數(shù)幾個新的變量 (新的變量幾 乎帶有原來所有變量的信息)來進行后續(xù)的分析,則可以使用主成分分析。2、因子載荷 aij 的統(tǒng)計定義是什么?它在實際問題的分析中的作用是什么? 答:(1)因子載荷 aij的統(tǒng)計定義:是原始變量 Xi與公共因子 F j的協(xié)方差, Xi與 Fj(i 1,2,., p; j 1,2,., m)都是均值為 0,方差為 1的變量,因此 aij同時也是 Xi
27、 與 Fj 的相關(guān)系數(shù)。(2)記 g2j a12j a22j . a2pj(j 1,2,.,m),則g2j表示的是公共因子 Fj對于 X 的 每一分量 Xi(i 1,2,., p)所提供的方差的總和, 稱為公共因子 F j對原始變量 X 的 方貢獻,它是衡量公共因子相對重要性的指標(biāo)。 g2j 越大,表明公共因子 F j 對 Xi 的貢獻越大,或者說對 X 的影響作用就越大。如果因子載荷矩陣對 A 的所有的 g2j( j 1,2,.,m)都計算出來,并按大小排序,就可以依此提煉出最有影響的公共 因子。3、略第 7 章 對應(yīng)分析1、試述對應(yīng)分析的思想方法及特點。思想 :對應(yīng)分析又稱為相應(yīng)分析,也稱
28、 RQ分析。是因子分子基礎(chǔ)發(fā)展起來的 一種多元統(tǒng)計分析方法。 它主要通過分析定性變量構(gòu)成的列聯(lián)表來揭示變量之間 的關(guān)系。當(dāng)我們對同一觀測數(shù)據(jù)施加 R和 Q型因子分析, 并分別保留兩個公共因 子,則是對應(yīng)分析的初步。 對應(yīng)分析的基本思想是將一個聯(lián)列表的行和列中各 元素的比例結(jié)構(gòu)以點的形式在較低維的空間中表示出來。 它最大特點是能把眾多 的樣品和眾多的變量同時作到同一張圖解上, 將樣品的大類及其屬性在圖上直觀 而又明了地表示出來, 具有直觀性。 另外,它還省去了因子選擇和因子軸旋轉(zhuǎn)等 復(fù)雜的數(shù)學(xué)運算及中間過程, 可以從因子載荷圖上對樣品進行直觀的分類, 而且 能夠指示分類的主要參數(shù)(主因子)以及分
29、類的依據(jù),是一種直觀、簡單、方便 的多元統(tǒng)計方法。 特點:對應(yīng)分析的基本思想是將一個聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點的 形式在較低維的空間中表示出來。 它最大特點是能把眾多的樣品和眾多的變量同 時作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來, 具有直觀性。 另外,它還省去了因子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運算及中間 過程,可以從因子載荷圖上對樣品進行直觀的分類, 而且能夠指示分類的主要參 數(shù)(主因子)以及分類的依據(jù),是一種直觀、簡單、方便的多元統(tǒng)計方法。2、試述對應(yīng)分析中總慣量的意義。2 總慣量不僅反映了行剖面集定義的各點與其重心加權(quán)距離的總和 , 同時與 x2 2統(tǒng)
30、計量僅相差一個常數(shù) ,而 x2統(tǒng)計量反映了列聯(lián)表橫聯(lián)與縱聯(lián)的相關(guān)關(guān)系 ,因此 總慣量也反映了兩個屬性變量各狀態(tài)之間的相關(guān)關(guān)系。 對應(yīng)分析就是在對總慣量 信息損失最小的前提下,簡化數(shù)據(jù)結(jié)構(gòu)以反映兩屬性變量之間的相關(guān)關(guān)系。3、略第 8 章 典型相關(guān)分析1、試述典型相關(guān)分析的統(tǒng)計思想及該方法在研究實際問題中的作用。答: 典型相關(guān)分析是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計方法。用 于揭示兩組變 量之間的內(nèi)在聯(lián)系。 典型相關(guān)分析的目的是識別并量化兩組變 量之間的聯(lián)系。 將兩組變量相 關(guān)關(guān)系的分析轉(zhuǎn)化為一組變量的線性組合與另 一組變量線性組合之間的相關(guān)關(guān)系?;舅枷耄? 1)在每組變量中找出變量的線性組合, 使得兩組的線性組合之間具有最大的 相關(guān)系數(shù)。 即:X ( X1, X2, , , X p) 、X ( X1, X2, , , Xq) 是兩組 相互關(guān)聯(lián)的隨機變量, 分別在兩組變量中選取若干有代表性的綜合變量 Ui 、Vi , 使是原變量的線性組合。Uia1X1 a2 X 2 aP X P aXVi b1Y1 b2 Y2 bq Y q b Y在D(a X ) D(b X)1的條件下,使得 (a X , b X) 達到最大。(2)選取和最初挑選的這對線性組合不相關(guān)的線性組
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 優(yōu)化資源配置的方案計劃
- 制定銷售策略實現(xiàn)業(yè)績目標(biāo)計劃
- 學(xué)生日常管理與規(guī)范計劃
- 學(xué)校美術(shù)教學(xué)年度計劃
- 保安工作中的團隊協(xié)作機制研究計劃
- 《貴州錦福礦業(yè)(福泉)有限公司貴州省福泉市白馬山鋁土礦(新建)礦產(chǎn)資源綠色開發(fā)利用方案(三合一)》評審意見
- 四川恒鼎實業(yè)有限公司大河溝煤礦礦山地質(zhì)環(huán)境保護與土地復(fù)墾方案情況
- 2025數(shù)字化鄉(xiāng)村文旅發(fā)展報告
- 2025年汕尾貨運從業(yè)資格證考試一共多少題
- 2025年濮陽b2貨運資格證全題
- DZ∕T 0211-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 重晶石、毒重石、螢石、硼(正式版)
- 人體成分分析適應(yīng)癥禁忌癥
- 普通高中英語課程標(biāo)準(zhǔn)試題與答案(2017年版2020年修訂)
- DB3502-Z 5010-2018海綿城市建設(shè)工程施工與質(zhì)量驗收標(biāo)準(zhǔn)
- 2024年內(nèi)蒙古巴彥淖爾市交通投資集團有限公司招聘筆試參考題庫含答案解析
- 春季行車安全行駛安全知識培訓(xùn)
- 產(chǎn)品制造工藝總方案
- T-ZJASE 024-2023 呼吸閥定期校驗規(guī)則
- 新生兒藥物過敏
- 工作場所有害因素職業(yè)接觸限值-第2部分-物理因素
- 2024年度醫(yī)院醫(yī)學(xué)檢驗學(xué)專業(yè)進修回顧課件
評論
0/150
提交評論