應(yīng)用統(tǒng)計學(xué)對應(yīng)分析等_第1頁
應(yīng)用統(tǒng)計學(xué)對應(yīng)分析等_第2頁
應(yīng)用統(tǒng)計學(xué)對應(yīng)分析等_第3頁
應(yīng)用統(tǒng)計學(xué)對應(yīng)分析等_第4頁
應(yīng)用統(tǒng)計學(xué)對應(yīng)分析等_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

應(yīng)用統(tǒng)計學(xué)對應(yīng)分析等第1頁,課件共19頁,創(chuàng)作于2023年2月當(dāng)屬性變量A和B的狀態(tài)較多時,很難透過列聯(lián)表作出判斷。怎樣簡化列聯(lián)表的結(jié)構(gòu)?利用降維的思想。如因子分析和主成分分析。但因子分析的缺陷是在于無法同時進行R型因子分析和Q型因子分析。怎么辦?精細建模:對數(shù)線性模型直觀展示:對應(yīng)分析第2頁,課件共19頁,創(chuàng)作于2023年2月***對應(yīng)分析的基本理論1、什么是對應(yīng)分析?對應(yīng)分析是利用“降維”的方法,以兩變量的交叉列聯(lián)表為研究對象,通過圖形的方式,直接揭示變量之間以及變量的不同類別之間的聯(lián)系,特別適合于多分類屬性變量研究的一種多元統(tǒng)計分析方法。2、對應(yīng)分析的基本思想:

首先,編制兩品質(zhì)型變量的交叉列聯(lián)表,將交叉列聯(lián)表中的每個數(shù)據(jù)單元看成兩變量在相應(yīng)類別上的對應(yīng)點;然后,對應(yīng)分析將變量及變量之間的聯(lián)系同時反映在一張二維或三維的散點圖上,并使聯(lián)系密切的類別點較集中,聯(lián)系疏遠的類別點較分散;最后,通過觀察對應(yīng)分布圖就能直觀地把握變量類別之間的聯(lián)系第3頁,課件共19頁,創(chuàng)作于2023年2月方法特點是多維圖示分析技術(shù)之一,結(jié)果直觀、簡單與因子分析有關(guān)

分類資料的典型相關(guān)分析用于展示兩個/多個分類變量各類間的關(guān)系高收入、黑人、男性傾向于反對開戰(zhàn)研究較多分類變量間關(guān)系時較佳各個變量的類別較多時較佳均為四類以上局限性不能進行變量間相關(guān)關(guān)系的檢驗仍然只是一種統(tǒng)計描述方法解決方案的所需維度需要研究者決定對極端值敏感

對于小樣本不推薦使用第4頁,課件共19頁,創(chuàng)作于2023年2月3、方法優(yōu)點:

可以在一張二維圖上同時表示出兩類屬性變量的各種狀態(tài),以直觀描述原始數(shù)據(jù)結(jié)構(gòu)。4、關(guān)鍵問題:如何將多個類別點表示在低維空間中,以便于直接觀察如何確定各類別點的坐標,以易于鑒別類別間聯(lián)系的強弱第5頁,課件共19頁,創(chuàng)作于2023年2月原理以列聯(lián)表為分析基礎(chǔ),計算基于H0假設(shè)的單元格殘差將每行看成是一條記錄,基于列變量相關(guān)系數(shù)陣進行因子分析,計算出列變量各類別的負荷值將每列看成是一條記錄,基于行變量相關(guān)系數(shù)陣進編制交叉列聯(lián)表并計算概率矩陣P根據(jù)P矩陣確定數(shù)據(jù)點坐標行變量和列變量的分類降維處理步驟第6頁,課件共19頁,創(chuàng)作于2023年2月對應(yīng)分析圖的閱讀每個維度可能代表了一種特征

實際上就是一個提取出的主成分,但由于分類變量的信息較少,可能找不到合理的解釋1.考察同一變量的區(qū)分度:

如果同一變量不同類別在某個方向上靠得較近,則說明這些類別在該維度上區(qū)別不大。2.考察不同變量的類別聯(lián)系:

一般而言,落在從圖形原點(0,0)處出發(fā)相同方位上大致相同區(qū)域內(nèi)的不同變量的分類點彼此有聯(lián)系。散點間距離越近,說明關(guān)聯(lián)傾向越明顯;散點離原點越遠,也說明關(guān)聯(lián)傾向越明顯。第7頁,課件共19頁,創(chuàng)作于2023年2月典型相關(guān)分析canonicalcorrelationanalysis現(xiàn)實中:如雞蛋、豬肉的價格(作為第一組變量)和相應(yīng)產(chǎn)品的銷量(第二組變量)有相關(guān)關(guān)系。如投資性變量(勞力投入、財力投入、固定資產(chǎn)投資等)與國民收入(工農(nóng)業(yè)收入、建筑業(yè)收入、等)具有相關(guān)關(guān)系。如何研究兩組變量之間的相關(guān)關(guān)系?設(shè)兩組變量用X1,X2….,XP以及Y1,Y2…YP表示。(1)分別研究Xi和Yj之間的相關(guān)關(guān)系,列出相關(guān)系數(shù)表。其缺陷:當(dāng)兩組變量較多時,處理較煩瑣,不易抓住問題的實質(zhì)。(2)采用主成分分析的方法,每組變量分別提取主成分,再通過主成分之間的關(guān)系反映兩組變量之間的關(guān)系。第8頁,課件共19頁,創(chuàng)作于2023年2月例:雞蛋、豬肉的價格用X1和X2表示;雞蛋、豬肉的銷量用Y1和Y2表示。構(gòu)造第一組和第二組變量的線性組合:F1=a11X1+a12X2Z1=a11Y1+a12Y2滿足F1和Z1的相關(guān)性最大化。

典型相關(guān)分析第9頁,課件共19頁,創(chuàng)作于2023年2月1、什么是典型相關(guān)分析?

典型相關(guān)分析是研究兩組變量之間相關(guān)關(guān)系的多元統(tǒng)計分析方法.它借用主成分分析降維的思想,分別對兩組變量提取主成分,且使兩組變量提取的主成分之間的相關(guān)程度達到最大,而從同一組內(nèi)部提取的各主成分之間互不相關(guān),用從兩組之間分別提取的主成分的相關(guān)性來描述兩組變量整體的線性相關(guān)關(guān)系.第10頁,課件共19頁,創(chuàng)作于2023年2月典型相關(guān)關(guān)系研究兩組變量之間整體的線性相關(guān)關(guān)系,它是將每一組變量作為一個整體來進行研究而不是分析每一組變量內(nèi)部的各個變量.所研究的兩組變量可以是一組為自變量,而另一組變量為因變量;兩組變量也可以是同等的地位,但典型相關(guān)關(guān)系要求兩組變量都至少是間隔尺度.MANOVAledhednetWITHarticomman/DISCRIMALLALPHA(1)/PRINT=SIG(EIGENDIM).第11頁,課件共19頁,創(chuàng)作于2023年2月信度分析信度分析用于探索研究事物間的相似性用于評價問卷這種測量工具的穩(wěn)定性或可靠性,具體來說就是用問卷對同一事物進行重復(fù)測量時,所得結(jié)果的一致性程度。內(nèi)在信度:調(diào)查表中的一組問題(或整個調(diào)查表)是否測量的是同一個概念,也就是這些問題之間的內(nèi)在一致性如何。? 最常用的內(nèi)在信度系數(shù)為克朗巴哈α系數(shù)和折半信度。外在信度:在不同時間進行測量時調(diào)查表結(jié)果的一致性程度。最常用的外在信度指標是重測信度,即用同一問卷在不同時間對同一對象進行重復(fù)測量,然后計算一致程度。信度分類第12頁,課件共19頁,創(chuàng)作于2023年2月信度的判斷標準沒有統(tǒng)一的標準,通常:信度系數(shù)如果在0.9以上,則該測驗或量表的信度甚佳;信度系數(shù)在0.8以上都是可接受的;如果在0.7以上,則該量表應(yīng)進行較大修訂,但仍不失其價值;如果低于0.7,問卷的測量效果非常差!注意:在大型量表中,往往一組問題用來集中測量某一方面的信息。此時信度分析應(yīng)當(dāng)按問題組來進行,即測量同一信息的一組問題間信度如何,而不是直接測量整個量表的信度。第13頁,課件共19頁,創(chuàng)作于2023年2月重測信度特別適用于事實性量表。相關(guān)分析得到的相關(guān)系數(shù)也就是重測信度系數(shù),一般要求達到0.7以上。缺點對同一樣本進行重復(fù)測定不一定可行;其被調(diào)查者的情況可能隨時間發(fā)生變化;重復(fù)測定可能會受前一次測定的影響。多數(shù)學(xué)者認為重測間隔一般以2~4周為宜。第14頁,課件共19頁,創(chuàng)作于2023年2月折半信度在不可能進行重復(fù)調(diào)查的情況下,將題目分為兩半,然后計算兩部分各自的信度,以及之間的相關(guān)性,以此為標準來衡量整個量表的信度,相關(guān)性高則意味著信度好,而相應(yīng)的信度指標就是折半信度。題目的分半方法有很多種,SPSS采取的是前后分半的方式,如果項目個數(shù)為奇數(shù)的,則前一半多一個。第15頁,課件共19頁,創(chuàng)作于2023年2月評分者信度考察不同評分人之間對實際得分的影響。所以在數(shù)據(jù)格式上我們分析的就是每一行,即每一位評分者對得分的影響,而不是每一列的影響。Ftest:適用于題目分值為連續(xù)性測量尺度。Friedmanchi-square:適用于分值不呈正態(tài)或為有序分類時。Cochranchi-square:適用于題目分值為二分類/無序分類時。第16頁,課件共19頁,創(chuàng)作于2023年2月定性數(shù)據(jù)的分析

對定性變量間關(guān)系的描述可用交叉列聯(lián)表。但交叉列聯(lián)表存在以下缺陷:

(1)不能充分分析多變量交互效應(yīng),不能有效分析多變量之間的關(guān)聯(lián)。(2)在進行兩個變量之間的關(guān)聯(lián)分析時缺乏對其他變量影響的有效控制。(3)不能準確定量描述一個變量對另一個變量的作用幅度。如何避免以上缺陷,充分揭示出定性變量之間的復(fù)雜關(guān)系?第17頁,課件共19頁,創(chuàng)作于2023年2月

(1)對數(shù)線性模型將概率取對數(shù)后分解處理:第18頁,課件共19頁,創(chuàng)作于2023年2月其優(yōu)點是可以把方差分析和線性模型方法相結(jié)合,估計模型中各個參數(shù),而這些參數(shù)值使各個變量的效應(yīng)和變量間的交互作用效應(yīng)得以數(shù)量化。

(2)Logist

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論