聚類分析與單因素方差分析簡介ppt課件_第1頁
聚類分析與單因素方差分析簡介ppt課件_第2頁
聚類分析與單因素方差分析簡介ppt課件_第3頁
聚類分析與單因素方差分析簡介ppt課件_第4頁
聚類分析與單因素方差分析簡介ppt課件_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 聚類分析與聚類分析與方差分析方差分析: :一、聚類分析一、聚類分析(cluster analysis): :1、聚類分析、聚類分析(Cluster Analysis)簡介簡介聚類分析是直接比較各事物之間的性質(zhì),將聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類的分析技術(shù)。入不同的類的分析技術(shù)。現(xiàn)實現(xiàn)實情形情形QQ分組分組衣物放置衣物放置朋友,同學(xué)朋友,同學(xué)網(wǎng)友網(wǎng)友有助于有助于快速判快速判斷斷: :2、聚類對象、聚類對象聚類的目的聚類的目的待分析對象待分析對象根據(jù)親疏程度根據(jù)親疏程度分類分類提取特征指標(biāo)提取特征指標(biāo)Q型

2、聚類:對樣本進行分類型聚類:對樣本進行分類R型聚類:對指標(biāo)型聚類:對指標(biāo)(變量變量)進行分類進行分類兩種兩種聚類聚類: :Q型聚類:對樣本進行分類型聚類:對樣本進行分類作用:作用:能利用多個變量對樣本進行分類;能利用多個變量對樣本進行分類;分類結(jié)果直觀,聚類譜系圖能明確、清楚分類結(jié)果直觀,聚類譜系圖能明確、清楚地表達其數(shù)值分類結(jié)果;地表達其數(shù)值分類結(jié)果;所得結(jié)果比傳統(tǒng)的定性分類方法更細致、所得結(jié)果比傳統(tǒng)的定性分類方法更細致、全面、合理。全面、合理。: :R型聚類:對指標(biāo)型聚類:對指標(biāo)(變量變量)進行分類進行分類作用:作用:了解變量間及變量組合間的親疏關(guān)系;了解變量間及變量組合間的親疏關(guān)系;根據(jù)

3、變量的聚類結(jié)果及它們之間的關(guān)系,根據(jù)變量的聚類結(jié)果及它們之間的關(guān)系,選擇主要變量進行回歸分析或選擇主要變量進行回歸分析或Q型聚類型聚類分析。分析。: :3、聚類過程與方法、聚類過程與方法構(gòu)造關(guān)系矩陣構(gòu)造關(guān)系矩陣數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理確定最佳分類確定最佳分類標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化親疏關(guān)系的描述親疏關(guān)系的描述聚類聚類根據(jù)不同方法進行分類根據(jù)不同方法進行分類類別數(shù)類別數(shù)1234: :例例1、下表給出了、下表給出了1982年全國年全國28個省、市、自個省、市、自治區(qū)農(nóng)民家庭收支情況這里節(jié)選治區(qū)農(nóng)民家庭收支情況這里節(jié)選6個地區(qū),個地區(qū),全部數(shù)據(jù)見附全部數(shù)據(jù)見附1.),), 有六個指標(biāo),利用調(diào)查資有六個指標(biāo),利用調(diào)查

4、資料進行聚類分析,為經(jīng)濟發(fā)展決策提供依據(jù)。料進行聚類分析,為經(jīng)濟發(fā)展決策提供依據(jù)。地區(qū)地區(qū) 食品食品 衣著衣著 燃料燃料住房住房 生活用品生活用品文化生活文化生活北京北京196449.760.5449.019.04上海上海2213913115.6550.825.89廣東廣東1832118423712四川四川138211118164.4貴州貴州122221314124.6云南云南124208.914163思考思考1:指標(biāo)單位若不同,應(yīng)如何處理?:指標(biāo)單位若不同,應(yīng)如何處理?思考思考2:如何衡量樣本的相似性?:如何衡量樣本的相似性?: :思考思考1 1:指標(biāo)單位若不同,應(yīng)如何處理?:指標(biāo)單位若不同

5、,應(yīng)如何處理?思考思考2 2:如何衡量樣本的相似性?:如何衡量樣本的相似性?若指標(biāo)單位不同,應(yīng)消除量綱的影響若指標(biāo)單位不同,應(yīng)消除量綱的影響例如可采用辦法:標(biāo)準(zhǔn)分數(shù)例如可采用辦法:標(biāo)準(zhǔn)分數(shù)(z score)直觀:直觀: 間隔間隔 夾角夾角 夾角余弦夾角余弦為簡化,取兩個為簡化,取兩個指標(biāo),做平面圖指標(biāo),做平面圖: :思考思考2 2:如何衡量樣本的相似性?:如何衡量樣本的相似性?直觀:直觀: 相關(guān)系數(shù)相關(guān)系數(shù) 夾角余弦夾角余弦所有指標(biāo)一起考慮,如何處理?所有指標(biāo)一起考慮,如何處理?分類思想:分類思想: 間隔或相似度相近的劃分為同一類。間隔或相似度相近的劃分為同一類。: :為了便于后面的說明,作如

6、下假設(shè):為了便于后面的說明,作如下假設(shè): nmnmxxxxX1111均值表示為均值表示為 niijjxnx11標(biāo)準(zhǔn)差表示為標(biāo)準(zhǔn)差表示為 nijijjxxnS1211所有樣本表示為所有樣本表示為極差表示為極差表示為ijniijnijxxR 11minmax: :(1數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理 Z Scores:標(biāo)準(zhǔn)化變換:標(biāo)準(zhǔn)化變換 mjniSSSxxxjjjjijij, 2 , 1, 2 , 1000*若若若若 指標(biāo)變量的量綱不同或數(shù)量級相差很大,指標(biāo)變量的量綱不同或數(shù)量級相差很大,為了使這些數(shù)據(jù)能放到一起加以比較,常為了使這些數(shù)據(jù)能放到一起加以比較,常需做變換。需做變換。 下面給出兩種常見數(shù)據(jù)預(yù)處

7、理方法。下面給出兩種常見數(shù)據(jù)預(yù)處理方法。: : Range 0 to 1(極差正規(guī)化變換極差正規(guī)化變換 / 規(guī)格化變換規(guī)格化變換)作用:變換后的數(shù)據(jù)最小為作用:變換后的數(shù)據(jù)最小為0,最大為,最大為1,其,其余在區(qū)間余在區(qū)間0,1內(nèi),極差為內(nèi),極差為1,無量綱。,無量綱。 mjniRRRxxxjjjijniijij, 2 , 1, 2 , 105 . 00min1*若若若若作用:變換后的數(shù)據(jù)均值為作用:變換后的數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為1,消去了量綱的影響;當(dāng)抽樣樣本改變時,它消去了量綱的影響;當(dāng)抽樣樣本改變時,它仍能保持相對穩(wěn)定性。這是最常用的方法。仍能保持相對穩(wěn)定性。這是最常用的方法。

8、: :3、聚類過程與方法、聚類過程與方法構(gòu)造關(guān)系矩陣構(gòu)造關(guān)系矩陣數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理確定最佳分類確定最佳分類標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化親疏關(guān)系的描述親疏關(guān)系的描述聚類聚類根據(jù)不同方法進行分類根據(jù)不同方法進行分類類別數(shù)類別數(shù)1234: :(2構(gòu)造關(guān)系矩陣構(gòu)造關(guān)系矩陣 描述變量或樣本的親疏程度的數(shù)量指標(biāo)描述變量或樣本的親疏程度的數(shù)量指標(biāo)有兩種:有兩種:相似系數(shù)相似系數(shù)性質(zhì)越接近的樣品,相似系性質(zhì)越接近的樣品,相似系數(shù)越接近于數(shù)越接近于1或或-1;彼此無關(guān)的樣品相似系;彼此無關(guān)的樣品相似系數(shù)則接近于數(shù)則接近于0,聚類時相似的樣品聚為一類,聚類時相似的樣品聚為一類間隔間隔將每一個樣品看作將每一個樣品看作m維空間的一

9、個維空間的一個點,在這點,在這m維空間中定義距離,距離較近的維空間中定義距離,距離較近的點歸為一類。點歸為一類。相似系數(shù)與距離有相似系數(shù)與距離有40多種,但常用的只是多種,但常用的只是少數(shù)少數(shù): :構(gòu)造關(guān)系矩陣的常用測度構(gòu)造關(guān)系矩陣的常用測度 1. Euclidean distance:歐氏距離:歐氏距離(二階(二階Minkowski距離)距離) iiiyxyxd2)(),( *Squared Eucidean distance:平方歐氏距離:平方歐氏距離 iiiyxyxd2)(),(: :構(gòu)造關(guān)系矩陣的常用測度構(gòu)造關(guān)系矩陣的常用測度 2. Block:絕對值距離一階:絕對值距離一階Minko

10、wski度量)度量)(又稱(又稱Manhattan度量或網(wǎng)格度量、度量或網(wǎng)格度量、 馬馬氏距離、廣義歐氏距離)氏距離、廣義歐氏距離) iiiyxyxd),(1: :構(gòu)造關(guān)系矩陣的常用測度構(gòu)造關(guān)系矩陣的常用測度 3. Cosine:夾角余弦:夾角余弦(相似性測度相似性測度) iiiiiiiyxyxyx22),cos(: :構(gòu)造關(guān)系矩陣的常用測度構(gòu)造關(guān)系矩陣的常用測度 4. Pearson correlation:皮爾遜相關(guān)系數(shù):皮爾遜相關(guān)系數(shù) (簡單相關(guān)系數(shù))(簡單相關(guān)系數(shù)) niiniiniiiyyxxyyxxr12121: :3、聚類過程與方法、聚類過程與方法構(gòu)造關(guān)系矩陣構(gòu)造關(guān)系矩陣數(shù)據(jù)預(yù)處

11、理數(shù)據(jù)預(yù)處理確定最佳分類確定最佳分類標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化親疏關(guān)系的描述親疏關(guān)系的描述聚類聚類根據(jù)不同方法進行分類根據(jù)不同方法進行分類類別數(shù)類別數(shù)1234: :(3選擇聚類方法選擇聚類方法 確定了樣品或變量間的距離或相似系數(shù)確定了樣品或變量間的距離或相似系數(shù)后,就要對樣品或變量進行分類。后,就要對樣品或變量進行分類。 分類的一種方法是系統(tǒng)聚類法又稱譜分類的一種方法是系統(tǒng)聚類法又稱譜系聚類);另一種方法是調(diào)優(yōu)法如動態(tài)系聚類);另一種方法是調(diào)優(yōu)法如動態(tài)聚類法就屬于這種類型)。此外還有模糊聚類法就屬于這種類型)。此外還有模糊聚類、圖論聚類、聚類預(yù)報等多種方法。聚類、圖論聚類、聚類預(yù)報等多種方法。 我們主要介紹

12、系統(tǒng)聚類法我們主要介紹系統(tǒng)聚類法(實際應(yīng)用中使實際應(yīng)用中使用最多用最多)。: :系統(tǒng)聚類法的基本思想系統(tǒng)聚類法的基本思想a) 令令n個樣品自成一類,計算出相似性測度;個樣品自成一類,計算出相似性測度;b) 此時類間距離與樣品間距離是等價的,此時類間距離與樣品間距離是等價的,把測度最小的兩個類合并;把測度最小的兩個類合并;c) 然后按照某種聚類方法計算類間的距離,然后按照某種聚類方法計算類間的距離,再按最小距離準(zhǔn)則并類;再按最小距離準(zhǔn)則并類;d) 這樣每次減少一類,持續(xù)下去直到所有這樣每次減少一類,持續(xù)下去直到所有樣品都歸為一類為止。樣品都歸為一類為止。e) 聚類過程可做成聚類譜系圖聚類過程可做

13、成聚類譜系圖(Hierarchical diagram)。: :常見類間距離的計算方法常見類間距離的計算方法a) Between-groups linkage 組間平均距離連接法組間平均距離連接法用用D(p,q)表示類表示類p和類和類q之間的距離之間的距離 方法簡述:將兩個類所有的樣本對樣本對的方法簡述:將兩個類所有的樣本對樣本對的兩個成員分屬于不同的類的平均距離作為兩類兩個成員分屬于不同的類的平均距離作為兩類的距離,合并距離最近或相關(guān)系數(shù)最大的兩類。的距離,合并距離最近或相關(guān)系數(shù)最大的兩類。此方法利用了兩個類中所有的樣本信息。此方法利用了兩個類中所有的樣本信息。 : :a) Between-

14、groups linkage 組間平均距離連接法組間平均距離連接法特點:非最大距離,也非最小距離特點:非最大距離,也非最小距離 pqGiGjijdjiqpD1),(考慮:除了用平均值作為特征值外,還考慮:除了用平均值作為特征值外,還可采用什么特征值?可采用什么特征值?: :b) Nearest neighbor 最近鄰法最短距離法)最近鄰法最短距離法)方法簡述:用兩類中所有樣本對的距離的最小方法簡述:用兩類中所有樣本對的距離的最小值作為兩類的距離,合并最近或最相似的兩項。值作為兩類的距離,合并最近或最相似的兩項。特點:樣品有鏈接聚合的趨勢,這是其缺點,特點:樣品有鏈接聚合的趨勢,這是其缺點,不

15、適合一般數(shù)據(jù)的分類處理,除去特殊數(shù)據(jù)外,不適合一般數(shù)據(jù)的分類處理,除去特殊數(shù)據(jù)外,不提倡用這種方法。不提倡用這種方法。: :c) Furthest neighbor 最遠鄰法最長距離法)最遠鄰法最長距離法)方法簡述:用兩類之間最遠點的距離代表兩類方法簡述:用兩類之間最遠點的距離代表兩類之間的距離,也稱之為完全連接法。之間的距離,也稱之為完全連接法。d) Median clustering 中位數(shù)法中位數(shù)法方法簡述:以用兩類中所有樣本對的距離中位方法簡述:以用兩類中所有樣本對的距離中位數(shù)作為兩類間的距離。數(shù)作為兩類間的距離。特點:圖形將出現(xiàn)遞轉(zhuǎn),譜系樹狀圖很難跟蹤,特點:圖形將出現(xiàn)遞轉(zhuǎn),譜系樹狀

16、圖很難跟蹤,因而這個方法幾乎不被人們采用。因而這個方法幾乎不被人們采用。: :e) Centroid clustering 重心聚類法重心聚類法方法簡述:兩類間的距離定義為兩類重心之間方法簡述:兩類間的距離定義為兩類重心之間的距離,對樣品分類而言,每一類中心就是屬的距離,對樣品分類而言,每一類中心就是屬于該類樣品的均值。于該類樣品的均值。特點:該距離隨聚類地進行不斷縮小。該法的特點:該距離隨聚類地進行不斷縮小。該法的譜系樹狀圖很難跟蹤,且符號改變頻繁,計算譜系樹狀圖很難跟蹤,且符號改變頻繁,計算較煩。較煩。: :f) Within-groups linkage 組內(nèi)平均連接法組內(nèi)平均連接法方法

17、簡述:兩類合并為一類后,合并后的類中方法簡述:兩類合并為一類后,合并后的類中所有項之間的平均距離最小所有項之間的平均距離最小,包括兩個類之間的包括兩個類之間的樣本對以及兩個類內(nèi)的樣本對。樣本對以及兩個類內(nèi)的樣本對。: :f) Wards method 離差平方和法離差平方和法方法簡述:基于方差分析思想,如果分類合理,方法簡述:基于方差分析思想,如果分類合理,則同類樣品間離差平方和應(yīng)當(dāng)較小,類與類間則同類樣品間離差平方和應(yīng)當(dāng)較小,類與類間離差平方和應(yīng)當(dāng)較大。離差平方和應(yīng)當(dāng)較大。特點:實際應(yīng)用中分類效果較好,應(yīng)用較廣;特點:實際應(yīng)用中分類效果較好,應(yīng)用較廣;要求樣品間的距離必須是歐氏距離。要求樣品

18、間的距離必須是歐氏距離。: :續(xù)例續(xù)例1、對、對1982年年6個地區(qū)農(nóng)民家庭收支情況,個地區(qū)農(nóng)民家庭收支情況,進行聚類分析。進行聚類分析。地區(qū)地區(qū) 食品食品 衣著衣著 燃料燃料住房住房生活用品生活用品 文化生活文化生活北京北京 196449.760.5449.019.04上海上海 2213913115.6550.825.89廣東廣東 1832118423712四川四川 138211118164.4貴州貴州 122221314124.6云南云南 124208.914163 這里這里6個變量都以元為單位,量綱相同且個變量都以元為單位,量綱相同且數(shù)量級相差不大,可以不用做標(biāo)準(zhǔn)化處理。數(shù)量級相差不大,

19、可以不用做標(biāo)準(zhǔn)化處理。: :方法:方法:樣本間距離樣本間距離采用平方歐氏距離;采用平方歐氏距離;類間距離類間距離 采用組間平均距離連接法采用組間平均距離連接法此時,距離越小越相似!此時,距離越小越相似!5 5、6 6最相似最相似: :類間距離類間距離采用組間平均距離連接法采用組間平均距離連接法5.貴州貴州6.云南云南4.四川四川293.04219.37均值均值256.205: :類間距離類間距離采用組間平均距離連接法采用組間平均距離連接法圖表閱讀說明:圖表閱讀說明: 以以stage 2為例為例地區(qū)地區(qū)5在在stage 1中出現(xiàn)過中出現(xiàn)過;stage 2這里的類,下一次將在第這里的類,下一次將在

20、第5步再次步再次參與聚類,銜接地區(qū)是地區(qū)參與聚類,銜接地區(qū)是地區(qū)4: :類似進行下去,可得聚類譜系圖樹狀圖)類似進行下去,可得聚類譜系圖樹狀圖): :3、聚類過程與方法、聚類過程與方法構(gòu)造關(guān)系矩陣構(gòu)造關(guān)系矩陣數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理確定最佳分類確定最佳分類標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化親疏關(guān)系的描述親疏關(guān)系的描述聚類聚類根據(jù)不同方法進行分類根據(jù)不同方法進行分類類別數(shù)類別數(shù)1234: :(4譜系分類的確定譜系分類的確定經(jīng)過系統(tǒng)聚類法處理后,得到聚類樹狀譜經(jīng)過系統(tǒng)聚類法處理后,得到聚類樹狀譜系圖,系圖,Demirmen(1972)提出了應(yīng)根據(jù)研究提出了應(yīng)根據(jù)研究的目的來確定適當(dāng)?shù)姆诸惙椒?,并提出了的目的來確定適當(dāng)?shù)姆诸?/p>

21、方法,并提出了一些根據(jù)譜系圖來分類的準(zhǔn)則:一些根據(jù)譜系圖來分類的準(zhǔn)則:任何類都必須在臨近各類中是突出的,即任何類都必須在臨近各類中是突出的,即各類重心間距離必須極大各類重心間距離必須極大確定的類中,各類所包含的元素都不要過確定的類中,各類所包含的元素都不要過分地多分地多分類的數(shù)目必須符合實用目的分類的數(shù)目必須符合實用目的若采用幾種不同的聚類方法處理,則在各若采用幾種不同的聚類方法處理,則在各自的聚類圖中應(yīng)發(fā)現(xiàn)相同的類自的聚類圖中應(yīng)發(fā)現(xiàn)相同的類: :28個地區(qū)聚類圖個地區(qū)聚類圖: :二、方差分析二、方差分析(ANOVA) (Analysis of Variance): :1、方差分析、方差分析(

22、ANOVA)引例引例例例2、某電器公司用四種不同配料方案生產(chǎn)出四、某電器公司用四種不同配料方案生產(chǎn)出四批元件,在每一批元件中取出若干個分別裝在批元件,在每一批元件中取出若干個分別裝在整機中作壽命試驗,得到如下數(shù)據(jù)整機中作壽命試驗,得到如下數(shù)據(jù)(單位:小時單位:小時)元元件件A11600161016501680170017201800A215801640164017001750A314601550160016201640166017401820A4151015201530157016001680 考察用不同的配料方案所生產(chǎn)的元件,其使考察用不同的配料方案所生產(chǎn)的元件,其使用壽命有沒有顯著差異?用

23、壽命有沒有顯著差異?方差分析示例方差分析示例: :思考思考1:這類分析有何作用?:這類分析有何作用? 找出影響較大的因素,進行優(yōu)化。找出影響較大的因素,進行優(yōu)化。思考思考2:如何找出影響因素?:如何找出影響因素? 可先嘗試探索性分析,如下圖可先嘗試探索性分析,如下圖: :思考思考3:產(chǎn)生數(shù)據(jù)差異的原因?:產(chǎn)生數(shù)據(jù)差異的原因?數(shù)據(jù)差異數(shù)據(jù)差異配料不同思考思考4:同一配料方案下:同一配料方案下(條件相同條件相同),壽命仍有,壽命仍有差異的原因?差異的原因?即 條件不同隨機因素數(shù)據(jù)差異數(shù)據(jù)差異配料不同隨機因素條件誤差隨機誤差誤差分解: :條件誤差隨機誤差條件變化對考察指標(biāo)條件變化對考察指標(biāo)(元件壽命

24、元件壽命)影響不顯著影響不顯著條件誤差隨機誤差條件變化對考察指標(biāo)條件變化對考察指標(biāo)(元件壽命元件壽命)有有 顯著影響顯著影響方差分析的基本思想:方差分析的基本思想:數(shù)據(jù)差異數(shù)據(jù)差異條件誤差隨機誤差誤差分解: :2、單因素方差分析、單因素方差分析 只考察一個因素的變化對試驗指標(biāo)的影響,只考察一個因素的變化對試驗指標(biāo)的影響,稱為單因素方差分析。稱為單因素方差分析。 通常,在單因子試驗中,記因子為通常,在單因子試驗中,記因子為 A, 設(shè)其有設(shè)其有s個水平,記為個水平,記為A1, A2, As。 在每一水平下考察的指標(biāo)可以看成一個總體在每一水平下考察的指標(biāo)可以看成一個總體 ,現(xiàn)有現(xiàn)有 s 個水平,故有

25、個水平,故有 s個總體,個總體, 假定:假定: 每一總體均為正態(tài)總體,記為每一總體均為正態(tài)總體,記為 N(i , i 2),i1, 2, s ; 各總體的方差相同各總體的方差相同: 1 2= 22= s2 = 2 ;: : 從每一總體中抽取的樣本是相互獨立的,從每一總體中抽取的樣本是相互獨立的, 即所有的試驗結(jié)果即所有的試驗結(jié)果 xij 都相互獨立。都相互獨立。 要比較各水平下的均值是否相同要比較各水平下的均值是否相同, 即要對如下的一個假設(shè)進行檢驗即要對如下的一個假設(shè)進行檢驗: H0 :1 =2 =s (2.1) 備擇假設(shè)為備擇假設(shè)為H1 :1, 2, , s 不全相等不全相等 在不會引起誤

26、解的情況下,在不會引起誤解的情況下, H1 通常可省略不通??墒÷圆粚?。寫。: :離差平方和分解離差平方和分解單因素方差分析中可將試驗數(shù)據(jù)列成如下形式:單因素方差分析中可將試驗數(shù)據(jù)列成如下形式:因子水平因子水平 試試 驗驗 數(shù)數(shù) 據(jù)據(jù) 和和 平均平均 A1x11 x12 x1n1 T1A2x21 x22 x2n2T2Asxs1 xs2 xsnsTsT1x2xsxx樣本組樣本組均值均值樣本總樣本總均值均值: :數(shù)據(jù)間是有差異的。數(shù)據(jù)數(shù)據(jù)間是有差異的。數(shù)據(jù) 與總平均與總平均 間的偏間的偏差可用差可用 表示,它可分解為二個偏差之和表示,它可分解為二個偏差之和ijxxxxij xxxxxxiiijij

27、 組內(nèi)離差組內(nèi)離差(偏向偏向)組間離差組間離差(偏向偏向)反映組內(nèi)數(shù)據(jù)與組反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機誤差內(nèi)平均的隨機誤差反映第反映第i個水平的個水平的效應(yīng)效應(yīng): : 在統(tǒng)計學(xué)中,常用離差平方和來度量若干在統(tǒng)計學(xué)中,常用離差平方和來度量若干個數(shù)據(jù)分散的程度,記個數(shù)據(jù)分散的程度,記 sinjijTixxS112 sinjiijEixxS112 siiisinjiAxxnxxSi12112總離差平方和總離差平方和組內(nèi)離差平方和組內(nèi)離差平方和組間離差平方和組間離差平方和可證:可證:AETSSS 離差平方和分解離差平方和分解: :由抽樣分布定理:由抽樣分布定理: 1122 nST 方差分析由來:方差分析由來:統(tǒng)計量由方差統(tǒng)計量由方差之比構(gòu)造之比構(gòu)造離差平方和的統(tǒng)計性質(zhì)及顯著性檢驗離差平方和的統(tǒng)計性質(zhì)及顯著性檢驗 snSE 221 1122 sSA snSSEE 1 sSSAAEASSF snsFSSFEA , 1: : snsFSSFEA , 1分析:分析:若因素若因素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論