高級心理統(tǒng)計(jì)課件_第1頁
高級心理統(tǒng)計(jì)課件_第2頁
高級心理統(tǒng)計(jì)課件_第3頁
高級心理統(tǒng)計(jì)課件_第4頁
高級心理統(tǒng)計(jì)課件_第5頁
已閱讀5頁,還剩432頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多元回歸分析多元回歸分析的一般目的和描述一元回歸分析:只有一個引數(shù),只能處理兩個變數(shù)之間的關(guān)係多元回歸分析:考察多個變數(shù)對一個變數(shù)的影響1多元回歸分析vs多元相關(guān)分析多元回歸分析主要回答的問題多元回歸分析主要回答四大類問題:(1)驗(yàn)證引數(shù)對因變數(shù)的影響;(2)檢驗(yàn)單個或一組引數(shù)的重要性;(3)建立預(yù)測模型;(4)分析引數(shù)之間的交互作用。2多元回歸分析主要回答的問題可細(xì)化為是個方面:第一,考察因變數(shù)和多個引數(shù)之間關(guān)係的強(qiáng)度。第二,考察已有引數(shù)的重要性。第三??疾煸黾右龜?shù)的必要性。第四,在統(tǒng)計(jì)上預(yù)先控制協(xié)變數(shù)的影響。第五,基於假設(shè)的需要定義變數(shù)影響順序。第六,比較多組引數(shù)的重要性。第七,尋找最佳的預(yù)測模型。第八,在新樣本上預(yù)測因變數(shù)分?jǐn)?shù)。第九,重新定義引數(shù)以解釋非線性關(guān)係。第十,同時處理分類引數(shù)和連續(xù)引數(shù)對因變數(shù)的影響。2多元回歸分析的假設(shè)及模型33.1使用多元回歸分析的前提假設(shè)(1)存在兩個或兩個以上的引數(shù)及一個因變數(shù);(2)因變數(shù)服從正態(tài)分佈;(3)引數(shù)與因變數(shù)之間呈線性關(guān)係;(4)所有變數(shù)的觀測必須是彼此獨(dú)立的。多元回歸分析的假設(shè)及模型33.2多元回歸方程的建立多元回歸分析的假設(shè)及模型33.3多元回歸方程的參數(shù)估計(jì)最小二乘法根據(jù)最佳擬合的原則,最小二乘法要求估計(jì)得到的參數(shù)滿足殘差平方和最小求出參數(shù)使殘差平方和

取得最小值多元回歸分析的類型44.1標(biāo)準(zhǔn)多元回歸(standardmultipleregression)又稱為同時回歸(simultaneousregression)所有引數(shù)同時進(jìn)入回歸方程僅度量了每個引數(shù)進(jìn)入方程後增加的預(yù)測因變數(shù)的貢獻(xiàn)標(biāo)準(zhǔn)多元回歸在計(jì)算單個引數(shù)的貢獻(xiàn)時,該引數(shù)與其它所有引數(shù)共同解釋的部分都被排除,僅計(jì)算剩餘的可解釋的部分所有重疊的部分將不計(jì)入任何引數(shù)的貢獻(xiàn)多元回歸分析的類型44.2序列回歸(sequentialregression)又稱分層回歸(hierarchicalregression)引數(shù)將根據(jù)研究者指定的順序進(jìn)入回歸方程由於存在前後順序,衡量一個(或一組)引數(shù)的貢獻(xiàn)時,與其它變數(shù)共同解釋的部分會歸為先進(jìn)入的變數(shù)。多元回歸分析的類型44.3統(tǒng)計(jì)回歸(statisticalregression)完全以統(tǒng)計(jì)標(biāo)準(zhǔn)決定進(jìn)入引數(shù)進(jìn)入回歸方程的順序,沒有考慮變數(shù)的意義和理論解釋的問題,是一種帶有爭議的回歸類型。一個變數(shù)會進(jìn)入或被排除出方程完全根據(jù)該樣本下計(jì)算出的統(tǒng)計(jì)指標(biāo),一些細(xì)微的差異將會對衡量變數(shù)重要性造成較大的影響。多元回歸分析的類型44.4三種回歸的比較標(biāo)準(zhǔn)回歸會剔除所有引數(shù)的重疊部分,可以體現(xiàn)出每個引數(shù)的單獨(dú)貢獻(xiàn)。序列回歸可以在某些變數(shù)進(jìn)入方程的前提下探討另一些變數(shù)的貢獻(xiàn)。統(tǒng)計(jì)回歸可以辨別具有多重共線性的變數(shù),將為未來的研究剔除某些明顯冗餘的變數(shù)。多元回歸分析中引數(shù)的重要性55.1多元測定係數(shù)回歸平方和(regressionsumofsquares)總平方和(totalsumofsquares)多元回歸分析中引數(shù)的重要性55.2調(diào)整的多元測定係數(shù)多元回歸分析中引數(shù)的重要性55.3偏相關(guān)係數(shù)偏相關(guān)(partialcorrelation)指的是控制其他引數(shù)後Y和X的相關(guān),它等於從Y和X中都除去其他預(yù)測變數(shù)的影響之後,Y和X中剩餘部分的簡單相關(guān)。將偏相關(guān)係數(shù)平方後便可以得到偏測定係數(shù)(coefficientofpartialdetermination)偏測定係數(shù)是在控制其他引數(shù)的條件下,單一引數(shù)對因變數(shù)的邊際解釋力。多元回歸分析中引數(shù)的重要性55.4半偏相關(guān)係數(shù)半偏相關(guān)(semi-partialcorrelation)又稱部分相關(guān)(partcorrelation)多元回歸分析中引數(shù)的重要性5多元回歸分析中引數(shù)的重要性55.5標(biāo)準(zhǔn)化回歸係數(shù)因?yàn)闃?biāo)準(zhǔn)化的Z變數(shù)是無量綱的變數(shù),所以此時的回歸係數(shù)就稱為標(biāo)準(zhǔn)化的回歸係數(shù)(standardizedregressioncoefficient)。多元回歸分析中的統(tǒng)計(jì)檢驗(yàn)66.1回歸方程的顯著性檢驗(yàn)多元回歸分析中的統(tǒng)計(jì)檢驗(yàn)66.2新加入變數(shù)的顯著性檢驗(yàn)

多元回歸分析中的統(tǒng)計(jì)檢驗(yàn)66.3回歸係數(shù)的顯著性檢驗(yàn)多元回歸分析中的一些值得注意的問題77.1樣本量樣本量與一系列問題有關(guān),包括要求的檢驗(yàn)力,α水準(zhǔn),引數(shù)個數(shù)、預(yù)期的效應(yīng)量以及結(jié)果的泛化性等。當(dāng)樣本量非常大時,幾乎所有回歸係數(shù)都將顯著地不等於0,即使不能很好預(yù)測因變數(shù)的引數(shù)也是如此。多元回歸分析中的一些值得注意的問題77.2異常值模式異常的個案可以對回歸係數(shù)的估計(jì)精度產(chǎn)生巨大影響。單變數(shù)檢測的常用方式有Z分?jǐn)?shù)和盒式圖等雙變數(shù)下的散點(diǎn)圖多變量下的馬氏距離等在回歸的過程中可以同時檢測異常值最為常用的方法是殘差分析多元回歸分析中的一些值得注意的問題77.3多重共線性如果兩個引數(shù)之間的相關(guān)係數(shù)很高,或者一個引數(shù)可以由其他引數(shù)線性表示,即認(rèn)為存在多重共線性問題。共線性現(xiàn)象的不良影響(1)回歸係數(shù)的置信區(qū)間變寬,係數(shù)變得不穩(wěn)定,由樣本推到總體的泛化性變差;(2)回歸係數(shù)不能很好地反映單個引數(shù)對因變數(shù)的獨(dú)立影響;(3)使變數(shù)的偏測定係數(shù)變??;(4)當(dāng)方程用於預(yù)測時,回歸結(jié)果變得不可靠。多元回歸分析中的一些值得注意的問題77.3多重共線性常用的指標(biāo)及其標(biāo)準(zhǔn):(1)容忍度(Tolerance)(2)方差膨脹因數(shù)(VarianceInflateFactor,VIF)(3)條件指數(shù)(ConditionIndex,CI)消除多重共線性影響的補(bǔ)救辦法:(1)去掉與y相關(guān)程度低、而與其它引數(shù)高度相關(guān)的引數(shù);(2)根據(jù)容忍度或VIF刪除變數(shù),去掉可以被其餘引數(shù)線性表示的變數(shù);(3)增加樣本量;(4)採用新的樣本數(shù)據(jù);(5)合併變數(shù)(6)換用其他形式的回歸(7)變數(shù)轉(zhuǎn)換多元回歸分析中的一些值得注意的問題77.4殘差分析多元回歸分析假設(shè)殘差具有正態(tài)性,線性和方差同質(zhì)性,同時假設(shè)誤差具有獨(dú)立性。殘差的正態(tài)性假設(shè)指的是殘差在每個因變數(shù)的預(yù)測分?jǐn)?shù)下都呈正態(tài)分佈。線性假設(shè)指的是殘差與預(yù)測分?jǐn)?shù)呈直線關(guān)係。方差同質(zhì)性假設(shè)在所有預(yù)測分?jǐn)?shù)下殘差的方差相同。誤差的獨(dú)立性假設(shè)意味著每次觀測的結(jié)果都不應(yīng)受其他觀測的影響。通常的驗(yàn)證方法是畫出殘差的散點(diǎn)圖,進(jìn)行殘差分析,其中橫軸表示因變數(shù)的預(yù)測值,縱軸表示殘差。多元回歸分析中的一些值得注意的問題77.5分類引數(shù)的虛擬編碼如果研究的引數(shù)是分類變數(shù),並希望將分類引數(shù)納入回歸,則需要對分類變數(shù)進(jìn)行虛擬編碼(dummycoding)。假設(shè)該引數(shù)有K個類別,則需要構(gòu)造K-1個新變數(shù)。將其中一個類別指定為對照類別,將對照類別在K-1個新變數(shù)上全部編碼為0,其餘K-1個類別依次在K-1個新變數(shù)上編碼為1。如果將虛無編碼中對參考類別的編碼換為-1而不是0,形成的編碼方式稱為效應(yīng)編碼(effectcoding)。另一種常用的編碼方式稱為對照編碼(contrastcoding),對照編碼的一個優(yōu)點(diǎn)在於編碼後生成的新變數(shù)相互正交。多元回歸分析中的一些值得注意的問題77.5分類引數(shù)的虛擬編碼回歸分析的局限性8回歸分析旨在揭示變數(shù)之間的關(guān)係,但並不能做出因果推斷。研究變數(shù)的選取同樣應(yīng)該借助理論而不能僅靠統(tǒng)計(jì)?;貧w分析假設(shè)引數(shù)的測量沒有殘差,然而在絕大部分心理學(xué)研究中都幾乎不存在如此理想的情況。應(yīng)用案例及SPSS操作99.1標(biāo)準(zhǔn)多元回歸案例《高級心理統(tǒng)計(jì)》P76-82。9.2序列回歸案例《高級心理統(tǒng)計(jì)》P82-85。關(guān)鍵術(shù)語多元回歸分析

標(biāo)準(zhǔn)多元回歸序列回歸

統(tǒng)計(jì)回歸偏回歸係數(shù)

多元測定係數(shù)偏相關(guān)係數(shù)

半偏相關(guān)係數(shù)多重共線性

殘差分析邏輯回歸

LogisticRegression1.Logistic回歸分析概述用於處理因變數(shù)為離散的二分變數(shù)的問題,也可以進(jìn)一步擴(kuò)展為多分類Logistic回歸。logistic回歸分析中並不直接對二分結(jié)果變數(shù)進(jìn)行回歸分析,而是將其轉(zhuǎn)換到logit尺度下,引入發(fā)生比(事件發(fā)生的概率/事件不發(fā)生的概率)的概念,再對發(fā)生比取自然對數(shù)(ln)作為因變數(shù),探究引數(shù)的線性組合對轉(zhuǎn)換後的因變數(shù)的影響。1.Logistic回歸分析概述Logistic回歸的優(yōu)勢:對預(yù)測變數(shù)的分佈和類型沒有特定假設(shè),預(yù)測變數(shù)可以是連續(xù)變數(shù)、分類變數(shù)等;尤其適用於引數(shù)對因變數(shù)的影響具有收益遞減規(guī)律或非線性的情況,即當(dāng)引數(shù)處於取值範(fàn)圍的兩端時,其值的變化對因變數(shù)的影響較??;當(dāng)引數(shù)處於取值範(fàn)圍的中間部分時,其值的變化對於因變數(shù)的影響較大的情況。2.主要回答的問題能否根據(jù)一系列的預(yù)測變數(shù)來預(yù)測個案在結(jié)果變數(shù)的類別?各預(yù)測變數(shù)的效果如何?預(yù)測變數(shù)之間是否存在交互作用?個案的分類結(jié)果是否準(zhǔn)確?預(yù)測變數(shù)的效應(yīng)值多大?3.前提假設(shè)與模型一、模型假設(shè)連續(xù)預(yù)測變數(shù)與經(jīng)過logit轉(zhuǎn)換後的結(jié)果變數(shù)之間存在線性關(guān)係;結(jié)果變數(shù)應(yīng)為二分變數(shù);預(yù)測變數(shù)可以是連續(xù)變數(shù)、離散變數(shù),如果是分類變數(shù),採用虛擬編碼;每次觀測相互獨(dú)立、殘差均值為0。3.前提假設(shè)與模型3.前提假設(shè)與模型Logistic曲線我們以0.5作為截點(diǎn),將事件發(fā)生概率大於0.5的結(jié)果變數(shù)賦值為1(事件發(fā)生),否則賦值為0(事件未發(fā)生)。3.前提假設(shè)與模型3.前提假設(shè)與模型5.模型評價負(fù)2倍對數(shù)似然值(-2LL):反映了假設(shè)擬合模型為實(shí)際情境時觀察到特定樣本的概率,其值處於0和1之間。其值越大,表明回歸方程的似然值越小,則擬合越差。將截距模型(不包含任何預(yù)測變數(shù))與含有預(yù)測變數(shù)的logistic模型的-2LL進(jìn)行比較,如果前者顯著高於後者,那麼可以證明含有預(yù)測變數(shù)的模型顯著改善了模型的擬合情況,即預(yù)測變數(shù)可以顯著改善模型的擬合情況。顯著性的檢驗(yàn)採用卡方檢驗(yàn)。注意樣本量的影響。偽測定係數(shù)(pseudo-R2):預(yù)測準(zhǔn)確性:分類表(classificationtable)4.注意事項(xiàng)第一,樣本量大小。第二,個案與變數(shù)的比例。第三,預(yù)測變數(shù)的多重共線性。第四,分類結(jié)果中的異常值。5.案例及SPSS操作本章的應(yīng)用案例是模擬生成的,因此其分析結(jié)果不能推論到實(shí)際之中,我們僅以此為例演示logistic回歸分析過程。本案例數(shù)據(jù)檔參見“4_1logistic.sav”詳見《高級心理統(tǒng)計(jì)》P92-P97關(guān)鍵術(shù)語二分變數(shù)分類表發(fā)生比對數(shù)發(fā)生比優(yōu)勢比logistic曲線logit轉(zhuǎn)換logit模型發(fā)生比模型logistic回歸係數(shù)logistic回歸係數(shù)冪值對數(shù)似然函數(shù)偽測定係數(shù)wald檢驗(yàn)內(nèi)容小結(jié)1.對於因變數(shù)為二分變數(shù)的情境,傳統(tǒng)多元回歸的方法不再適用,logistic回歸則適用於此情境。2.通過對發(fā)生比取自然對數(shù)來進(jìn)行l(wèi)ogit轉(zhuǎn)換,從而將二分結(jié)果變數(shù)轉(zhuǎn)移到連續(xù)的量尺上,使之與引數(shù)之間形成線性可加的關(guān)係。3.logistic回歸方程由於對結(jié)果變數(shù)進(jìn)行了轉(zhuǎn)換,其對回歸係數(shù)的解釋比傳統(tǒng)多元回歸方程的解釋更加複雜。通常採用回歸係數(shù)的冪值,即EXP(B)來反映預(yù)測變數(shù)對結(jié)果變數(shù)發(fā)生比的影響。用Waldtest對回歸係數(shù)的顯著性進(jìn)行檢驗(yàn)。4.用-2LL和偽測定係數(shù)對logistic回歸方程進(jìn)行整體檢驗(yàn)和擬合優(yōu)度的評價。判別分析

discriminantanalysis1.判別分析一般目的和描述判別分析(discriminantanalysis)又稱作鑒別分析、區(qū)分分析,在教育心理評價方面有廣泛應(yīng)用。判別分析是一種根據(jù)已知屬於不同類別的樣本為標(biāo)準(zhǔn),結(jié)合所觀測的不同樣本的若干項(xiàng)不同的觀測指標(biāo)數(shù)據(jù),建立一個或幾個線性組合(即判別函數(shù),discriminantfunction),據(jù)此將待判別的事物加以分類的一種多元統(tǒng)計(jì)方法2.判別分析主要回答的問題判別分析大致可以回答以下幾個問題:(1)能否根據(jù)一系列觀測指標(biāo)變數(shù)有效區(qū)分不同的類別?(2)究竟有多少個顯著的判別函數(shù)?(3)使用哪種線性方程來對新的個案進(jìn)行分組?(4)所選擇的一系列觀測指標(biāo)與不同類別的關(guān)聯(lián)程度有多大?3.判別分析假設(shè)條件及模型判別分析的假設(shè)條件樣本量各組別樣本量不同對判別分析結(jié)果的影響不會很大;但是如果在分組過程中,你希望判別為不同組別的先驗(yàn)概率不同,那麼樣本量會對此產(chǎn)生影響。3.判別分析假設(shè)條件及模型判別分析的假設(shè)條件觀測指標(biāo)變數(shù)的多元正態(tài)分佈在判別分析中,假定各觀測指標(biāo)變數(shù)滿足多元正態(tài)分佈,即觀測指標(biāo)變數(shù)的得分是從一個總體中獨(dú)立隨機(jī)抽樣,任何觀測指標(biāo)變數(shù)的線性組合的抽樣分佈都是正態(tài)分佈的。3.判別分析假設(shè)條件及模型判別分析的假設(shè)條件各類別方差-協(xié)方差齊性一般來說,當(dāng)樣本量較大、各類別樣本量均衡的時候,違反方差齊性的假設(shè)並不會對判別函數(shù)的顯著性造成太大的影響;但是當(dāng)樣本量較小各組別樣本量不均衡的時候,估計(jì)判別函數(shù)的顯著性的判斷會受到較大的影響,很可能造成偏差。3.判別分析假設(shè)條件及模型判別分析的假設(shè)條件多重共線性如果觀測指標(biāo)變數(shù)有高相關(guān),那麼類似於多元回歸很可能會出現(xiàn)多重共線性。3.判別分析假設(shè)條件及模型判別分析的基本模型判別函數(shù)判別函數(shù)表示分組變數(shù)與滿足條件假設(shè)的觀測指標(biāo)變數(shù)之間的關(guān)係。和多元線性回歸方程形式類似,判別函數(shù)的因變數(shù)為不同判別函數(shù)的得分,此得分並不是分組變數(shù)的編碼值,而是通過對觀測指標(biāo)變數(shù)進(jìn)行座標(biāo)旋轉(zhuǎn)而得到的間距測度變數(shù),其作用在於最大化組間差異、最小化組內(nèi)差異。3.判別分析假設(shè)條件及模型判別分析的基本模型分類函數(shù)判別函數(shù)反映了預(yù)測指標(biāo)變數(shù)和判別值之間的關(guān)係,而分類函數(shù)則解決如何將個案劃分到不同的類別的問題4.判別分析的主要類型建立判別函數(shù)的方法(1)在標(biāo)準(zhǔn)判別分析(standarddiscriminantanalysis)中,所有選擇的預(yù)測變數(shù)都將進(jìn)入方程之中,變數(shù)之間共同對於組間方差的解釋將不屬於任何一個變數(shù)。4.判別分析的主要類型建立判別函數(shù)的方法(2)在序列判別分析(sequentialdiscriminantanalysis)中,研究者可以根據(jù)已有研究或假設(shè)對預(yù)測變數(shù)進(jìn)入方程的順序進(jìn)行設(shè)定。4.判別分析的主要類型建立判別函數(shù)的方法(3)在統(tǒng)計(jì)判別分析(statisticaldiscriminantanalysis)中,當(dāng)研究者對於預(yù)測變數(shù)進(jìn)入方程的順序沒有特定要求,那麼可以通過統(tǒng)計(jì)標(biāo)準(zhǔn)來確定進(jìn)入順序4.判別分析的主要類型對個案進(jìn)行分類的方法(1)距離判別距離判別的基本思想是:在P維空間中,對已知的K個總體G1,G2,…,GK來說,在每個總體內(nèi)部,由於所有元素同屬一個總體,元素與元素之間的距離相對較短,而對於異質(zhì)總體的元素來說,其間的距離應(yīng)該相對較長一些。4.判別分析的主要類型對個案進(jìn)行分類的方法(2)貝葉斯判別。貝葉斯判別是在判別分析中充分利用先驗(yàn)概率資訊的一種判別方法。4.判別分析的主要類型對個案進(jìn)行分類的方法(3)Fisher判別Fisher判別通過尋找一個將P維空間的點(diǎn)降為一維數(shù)值的線性函數(shù),然後利用這個線性函數(shù)把P維空間中已知類別總體以及未知類別歸屬的空間點(diǎn)都轉(zhuǎn)換為一維數(shù)據(jù),再根據(jù)它們之間的疏密情況把未知?dú)w屬的點(diǎn)判為相應(yīng)的總體。5.判別分析的參數(shù)及解釋判別係數(shù)判別係數(shù)又稱為函數(shù)係數(shù)、判別權(quán)重,反映了各預(yù)測變數(shù)對於判別函數(shù)的作用,可以分為標(biāo)準(zhǔn)化和非標(biāo)準(zhǔn)化兩種。

5.判別分析的參數(shù)及解釋結(jié)構(gòu)係數(shù)在判別分析中結(jié)構(gòu)係數(shù)又稱為判別負(fù)載,反映了各觀測指標(biāo)變數(shù)與判別函數(shù)值之間的相關(guān)係數(shù)。

5.判別分析的參數(shù)及解釋分組的矩心分組的矩心是每個類別判別函數(shù)值的均值,它描述了以判別函數(shù)為軸,每個類別的中心所在的位置。

5.判別分析的參數(shù)及解釋特徵根每個判別函數(shù)都會對應(yīng)一個特徵根,其數(shù)值等於組間差異與組內(nèi)差異的比例。特徵根反映了該判別函數(shù)的判別能力,越大說明判別能力越佳。

5.判別分析的參數(shù)及解釋典型相關(guān)係數(shù)典型相關(guān)係數(shù)的計(jì)算公式如下:

5.判別分析的參數(shù)及解釋W(xué)ilks’Lambda參數(shù)Wilks’Lambda

反映的是組內(nèi)平方和占總平方和的比例,其值越小,則表明組內(nèi)平方和占總平方和的比例越小,對應(yīng)的組間平方和占總平方和的比例越大。

6.判別分析應(yīng)用案例及SPSS操作本例數(shù)據(jù)包含ID、numeracy(計(jì)算能力)、reasoning(推理能力)、spacial(空間能力)、GROUP(類別)變數(shù)。其中,ID表示個案編號,GROUP為分組變數(shù),一共有三個組別(優(yōu)秀、良好、不及格),對應(yīng)變數(shù)值為1、2、3,隨機(jī)挑選了9個個案的分組變數(shù)為缺失值。其餘變數(shù)為預(yù)測變數(shù),均為1-10點(diǎn)評分。操作步驟詳見《高級心理統(tǒng)計(jì)》P104~P110關(guān)鍵術(shù)語分組變數(shù)判別變數(shù)判別函數(shù)分類函數(shù)分類函數(shù)值標(biāo)準(zhǔn)判別序列判別統(tǒng)計(jì)判別距離判別貝葉斯判別Fisher判別判別係數(shù)結(jié)構(gòu)係數(shù)分組矩心特徵根典型相關(guān)係數(shù)Wilks’Lambda聚類分析1.一般目的和描述聚類分析是將所觀測的事物或觀測事物的指標(biāo)進(jìn)行分類的一種統(tǒng)計(jì)分析方法,它的目的是辨認(rèn)在某些特徵上相似的事物,並將這些事物按照這些特徵劃分為幾個類,使得同一類中的事物具有較高的同質(zhì)性,不同類中的事物具有較大的異質(zhì)性。聚類分析的對象有兩個方面,一個方面是對樣品也即個案或被試聚類(稱Q型聚類),另一個方面是對指標(biāo)也即變數(shù)進(jìn)行聚類(稱R型聚類)。2.主要回答的問題如何測量變之間的相似性或個體之間的距離如何將相似的事物或變數(shù)聚為一類如何描述和解釋所聚成的各類3.模型及原理距離每個樣品(案例)有p個指標(biāo)(變數(shù)),故每個樣品可以看成p維空間中的一個點(diǎn),n個樣品組成p維空間中的n個點(diǎn),用距離來度量樣品之間接近的程度。距離測度應(yīng)滿足下列四個條件:1)dij

0;2)dij=dji,即距離具有對稱性;3)dijdik+dkj,即三角不等式,任意一邊小於其他兩邊之和;4)如果dij0,則ij3.模型及原理距離3.模型及原理相似係數(shù)3.模型及原理相似係數(shù)選擇原則要考慮所選擇的距離/相似係數(shù)公式在實(shí)際應(yīng)用中有明確的意義。要綜合考慮對樣本觀測數(shù)據(jù)的預(yù)處理和將要採用聚類分析方法。要考慮研究對象的特點(diǎn)及計(jì)算量的大小。3.模型及原理變數(shù)的標(biāo)準(zhǔn)化中心化變換變數(shù)的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化變換中心化變換變數(shù)的標(biāo)準(zhǔn)化極差正規(guī)化變換中心化變換變數(shù)的標(biāo)準(zhǔn)化對數(shù)變換中心化變換4.聚類分析的主要類型根據(jù)聚類分析的對象劃分樣品聚類(稱Q型聚類)指標(biāo)聚類(稱R型聚類)根據(jù)聚類分析的原理劃分層次聚類法(HierarchicalCluster)非層次聚類法(NonhierarchicalCluster)或K平均數(shù)法(K—meansmethods)4.1層次聚類1、聚集法:首先把每個案例各自看成一類,先把距離最近的兩類合併,然後重新計(jì)算類與類之間的距離,再把距離最近的兩類合併,每一步減少一類,這個過程一直持續(xù)到所有案例歸為一類為止。2、分解法:與聚集法相反,首先把所有的案例看成一類,然後把最不相似的案例分為兩類,每一步增加一類,直到每個案例都成為一類為止。4.1層次聚類(1)最短距離法(SingleLinkage)類與類之間的距離定義為一個類中的所有案例與另一類中的所有案例之間的距離最小者。(2)最長距離法(CompleteLinkage)與最短距離法相反,類與類之間的距離定義為兩類中離得最遠(yuǎn)的兩個案例之間的距離。4.1層次聚類(3)中間距離法4.1層次聚類(4)重心法4.1層次聚類(5)類平均法4.1層次聚類(6)可變類平均法4.1層次聚類(7)可變法4.1層次聚類(7)離差平方和法4.2非層次聚類K平均數(shù)法的計(jì)算步驟如下:(1)指定要形成的聚類個數(shù),對樣本點(diǎn)進(jìn)行初始分類並計(jì)算每一個初始分類的重心;(2)調(diào)整分類,計(jì)算每個樣本點(diǎn)到各類重心的距離,把每個樣本點(diǎn)歸到距離重心最近的那個類;(3)重新計(jì)算每個類的重心;(4)重複第(2)和第(3)步,直到?jīng)]有樣本點(diǎn)可以再調(diào)整為止5.值得注意的問題5.1分類數(shù)目的確定和結(jié)果解釋類間差異與類內(nèi)差異相比,類間差異顯著大於類內(nèi)差異所分出的各類有明確的含義;若選用不同的方法進(jìn)行聚類,應(yīng)該得到較多相同的類;確定的類中,每類所包含的元素的個數(shù)不應(yīng)太多。5.值得注意的問題5.2聚類分析與其他多元分析方法的聯(lián)繫聚類分析與因素分析研究使用的目的不同,因素分析是從眾多的測量指標(biāo)中尋求潛在變數(shù),即決定諸多指標(biāo)之間存在相關(guān)的潛變數(shù)因素是什麼,而聚類分析,只尋求指標(biāo)是有哪些不同的類別。假設(shè)不同,不管哪種因素分析模型,都假設(shè)原有的觀測指標(biāo)可以用新的因素取代,而聚類只是尋求其中一個有代表性的指標(biāo)代替原來的眾多指標(biāo)。計(jì)算方法不同,求解因素的方法與聚類的計(jì)算思路與方法有很大差異。5.值得注意的問題5.2聚類分析與其他多元分析方法的聯(lián)繫聚類分析與回歸分析回歸分析是從諸多引數(shù)(因)中尋求與因變數(shù)(果)之間變數(shù)關(guān)係的統(tǒng)計(jì)分析的方法。聯(lián)繫,當(dāng)回歸分析中進(jìn)入的引數(shù)太多時,為了減少引數(shù)的數(shù)目,簡化回歸計(jì)算,可以先用聚類分析,從各指標(biāo)類別中選取有代表性的指標(biāo),用這些少數(shù)有代表性的指標(biāo)進(jìn)行回歸分析,可大大減少引數(shù)的數(shù)目,簡化回歸分析中的的計(jì)算,特別是當(dāng)引數(shù)很多的情況下,此種方法的優(yōu)點(diǎn)就顯現(xiàn)出來了。6.案例及SPSS操作一、應(yīng)用案例及SPSS操作層次聚類K-平均值聚類詳見課本P121-128關(guān)鍵術(shù)語聚類分析層次聚類法非層次聚類法K平均數(shù)法內(nèi)容小結(jié)聚類分析是將所觀測的事物或觀測事物的指標(biāo)進(jìn)行分類的一種統(tǒng)計(jì)分析方法,它的目的是辨認(rèn)在某些特徵上相似的事物,並將這些事物按照這些特徵劃分為幾類,使得同一類中的事物具有較高的同質(zhì)性,不同類中的事物具有較大的異質(zhì)性。根據(jù)聚類分析的對象,可以將聚類分析分為對樣品進(jìn)行聚類的Q型聚類和對指標(biāo)進(jìn)行聚類的R型聚類。根據(jù)聚類方法原理,可以將聚類分析分為層次聚類法和非層次聚類法。聚類分析主要應(yīng)用於探索性的研究,其分析的結(jié)果可以提供多個可能的解,選擇最終的解需要研究者的主觀判斷和後續(xù)的分析。探索性因素分析

ExploratoryFactorAnalysis1.探索性因素分析的一般目的和描述一種用來定義變數(shù)的潛在結(jié)構(gòu)的分析技術(shù)考查多個變數(shù)之間的相互關(guān)係並用它們共同的潛在維度來解釋這些變數(shù)這些潛在維度稱為因素(factors)同時考慮所有變數(shù)以及變數(shù)之間的相互關(guān)係1探索性因素分析的一般目的和描述語言能力

語文數(shù)學(xué)英語科學(xué)1906089552459066100388668570488779556…………………………理科思維2.因素分析的模型、假設(shè)及基本步驟模型及原理基本概念前提假設(shè)基本步驟xi=ai1fi1+ai2fi2+…+aimfim+ui(i=1,2,…,k)2.1模型及原理觀測數(shù)據(jù)公因數(shù)特殊因數(shù)因數(shù)載荷2.1模型及原理x1f1f2x2xkfm…………u1u2uk……a11a21ak1a12a22ak2a1ma2makm2.1模型及原理觀測變數(shù)的方差可以分為三部分觀測變量方差公因子方差Commonvariance特殊因子方差Specificvariance誤差方差Errorvariance抽取的方差未抽取的方差2.2基本概念因素載荷觀測變數(shù)依賴公因數(shù)的分量當(dāng)公因數(shù)間完全不相關(guān)時,因數(shù)載荷=觀測變數(shù)與因數(shù)之間的相關(guān)係數(shù)xi=ai1fi1+ai2fi2+…+aimfim+ui(i=1,2,…,k)2.2基本概念共同度觀測變數(shù)方差中由公因數(shù)解釋的比例當(dāng)公因數(shù)間不相關(guān)時,公因數(shù)方差等於和該變數(shù)有關(guān)的因數(shù)載荷的平方和hi2

=ai12

+ai22

+…+aim2eg.x1=0.95*f1+0.22*f2+u1h12

=0.9509作用:如果用公因數(shù)替代觀測變數(shù)後,原來每個變數(shù)的資訊被保留的程度2.2基本概念特徵根每個公因數(shù)對數(shù)據(jù)變異的解釋能力;該因數(shù)所解釋的總方差計(jì)算:與該因數(shù)有關(guān)的因數(shù)載荷的平方和x1=0.95*f1+0.22*f2+u1x2=0.45*f1+0.52*f2+u2x3=0.15*f1+0.92*f2+u3因數(shù)f1的貢獻(xiàn)=0.952+0.452+0.152=1.12752.2基本概念貢獻(xiàn)度指各因素的特徵值在總的公共因素方差(或總的特徵值)中所占的比例。貢獻(xiàn)率反映了該因素對所有觀測變數(shù)變異的貢獻(xiàn)程度。貢獻(xiàn)率大,說明該因素的影響大、重要性大或權(quán)重大。因?yàn)槊恳粋€變數(shù)的方差都被標(biāo)準(zhǔn)化為1,所以總的公共因素方差之和為n,n為變數(shù)個數(shù),貢獻(xiàn)率則可表示為λ/n。2.3前提假設(shè)因素分析的目的是簡化數(shù)據(jù)或者找出基本的數(shù)據(jù)結(jié)構(gòu),因此使用因素分析的前提假設(shè)包括理論假設(shè)與統(tǒng)計(jì)假設(shè)。理論假設(shè)是指所選的一組變數(shù)中,確實(shí)存在某種潛在結(jié)構(gòu)。統(tǒng)計(jì)假設(shè)是指,觀測變數(shù)之間應(yīng)該有較強(qiáng)的相關(guān)關(guān)係。如果變數(shù)之間的相關(guān)程度很小,則它們不可能共用公共因素。所以,在計(jì)算出相關(guān)矩陣後,需要對相關(guān)矩陣進(jìn)行檢驗(yàn)。如果相關(guān)矩陣中的大部分相關(guān)係數(shù)都小於0.3,則不適合做因素分析。SPSS軟體提供了三個統(tǒng)計(jì)量來判斷觀測數(shù)據(jù)是否適合做因素分析。

(1)變數(shù)間相關(guān)矩陣(2)反映像相關(guān)矩陣(3)KMO測度和Bartlett球形檢驗(yàn)2.4基本步驟第一步:明確探索性因素分析的目的。第二步:設(shè)計(jì)探索性因素分析。第三步:檢驗(yàn)探索性因素分析的前提假設(shè)。第四步:抽取因素。第五步:解釋因素。第六步:探索性因素分析的效度驗(yàn)證。第七步:探索性因素分析的結(jié)果處理。根據(jù)探索性因素分析的目的、原理、方法,其基本步驟可以分為七個過程(Hair,Black,Babin,&Anderson,2010)。2.4基本步驟明確因素分析目的因素分析設(shè)計(jì)判斷數(shù)據(jù)是否符合因素分析假設(shè)抽取因數(shù)並計(jì)算模型擬合程度因數(shù)解釋和命名效度檢驗(yàn)因素分析結(jié)果的其他用途3.探索性因素分析前的準(zhǔn)備明確目的設(shè)計(jì)分析檢驗(yàn)假設(shè)分析是探索性的還是驗(yàn)證的?數(shù)據(jù)總結(jié)and/or數(shù)據(jù)簡化?3.1明確目的3.1明確目的因數(shù)分析分類探索性因素分析驗(yàn)證性因素分析是否有理論依據(jù),可以對潛在結(jié)構(gòu)做出假設(shè)?3.1明確目的因素分析目的數(shù)據(jù)匯總:生成潛在維度,從而用比原始數(shù)據(jù)更少的變數(shù)去描述數(shù)據(jù)數(shù)據(jù)縮減:在數(shù)據(jù)匯總的基礎(chǔ)上,給每個潛在維度賦予分值從而代替原始數(shù)據(jù)語言能力

語文數(shù)學(xué)英語科學(xué)1906089552469066100388668570488779556…………………………理科思維語言能力理科思維89.557569586689165…………Stage1Stage2驗(yàn)證性探索性結(jié)構(gòu)方程模型選擇因數(shù)分析的類型分析單元:變數(shù)/個案?研究問題探索性/驗(yàn)證性?因數(shù)分析目的:數(shù)據(jù)匯總&識別結(jié)構(gòu)數(shù)據(jù)簡化3.1明確目的3.2設(shè)計(jì)分析數(shù)據(jù)計(jì)算方法:R分析:針對變數(shù)的因素分析Q分析:針對個案的因素分析通常的因素分析都是R分析Q分析≠聚類分析3.2設(shè)計(jì)分析Q分析≠聚類分析Q分析:反應(yīng)模式相似性聚類分析:因數(shù)水準(zhǔn)相似性3.2設(shè)計(jì)分析1.確定數(shù)據(jù)計(jì)算方法:R分析vs.

Q分析2.變數(shù)個數(shù)及屬性:潛在維度個數(shù)和每個維度下變數(shù)個數(shù)都要合理數(shù)據(jù)類型應(yīng)為連續(xù)變數(shù)可以有少量虛擬變數(shù)3.必需的樣本量:一般情況≥100;至少≥50如果為了識別潛在結(jié)構(gòu),最好一個因數(shù)有5個(或以上)變數(shù)樣本量和變數(shù)數(shù)之比至少為5:1,最好為10:1Stage1Stage2研究問題探索性/驗(yàn)證性?因數(shù)分析目的:數(shù)據(jù)匯總&識別結(jié)構(gòu)數(shù)據(jù)簡化驗(yàn)證性探索性結(jié)構(gòu)方程模型選擇因數(shù)分析的類型分析單元:變數(shù)/個案?研究設(shè)計(jì)加入哪些變數(shù)變數(shù)是如何測量的樣本量個案Q分析,聚類分析變數(shù)R分析3.2設(shè)計(jì)分析3.3檢驗(yàn)假設(shè)所選的一組變數(shù)中,確實(shí)存在某種潛在結(jié)構(gòu)樣本是同質(zhì)的,有相同的潛在結(jié)構(gòu)例如:理論問題X2X1X3X4X5X6F1F2男性X2X1X3X4X5X6F1F2女性3.3檢驗(yàn)假設(shè)不要求正態(tài)性、方差齊性、線性識別變數(shù)的內(nèi)部相關(guān)→某種程度的共線性實(shí)踐問題相關(guān)MSA值Bartlett球形度檢驗(yàn)KMO值3.3檢驗(yàn)假設(shè)整體檢驗(yàn)變數(shù)間相關(guān):如果所有或大部分相關(guān)小於0.3,則不適合做EFABartlett球形檢驗(yàn):顯著,說明變數(shù)間存在足夠的相關(guān)KMO檢驗(yàn):0~1,應(yīng)大於0.50,值越大越適合進(jìn)行EFA對單個變數(shù)的檢驗(yàn)MSA值:反映像相關(guān)矩陣(anti-imagecorrelationmatrix),單個變數(shù)的MSA值應(yīng)大於0.50,否則應(yīng)被剔除3.3檢驗(yàn)假設(shè)研究問題探索性/驗(yàn)證性?因數(shù)分析目的:數(shù)據(jù)匯總&識別結(jié)構(gòu)數(shù)據(jù)簡化Stage1驗(yàn)證性探索性結(jié)構(gòu)方程模型選擇因數(shù)分析的類型分析單元:變數(shù)/個案?Stage2研究設(shè)計(jì)加入哪些變數(shù)變數(shù)是如何測量的樣本量前提假設(shè)對正態(tài)性、方差齊性、線性的統(tǒng)計(jì)考慮樣本同質(zhì)性概念上的聯(lián)繫Stage3Stage43.3檢驗(yàn)假設(shè)個案Q分析,聚類分析變數(shù)R分析4.因素的抽取和旋轉(zhuǎn)選擇抽取因素的方法公共因素?cái)?shù)目的確定因素旋轉(zhuǎn)解釋因素4.1選擇抽取因素的方法主軸因素法

最小二乘法極大似然法Alpha因數(shù)提取法映像分析法最大相關(guān)法形心心素法參照析因迭代法複相關(guān)平方法提取因數(shù)全分量模型公共因素模型4.1選擇抽取因素的方法主成分分析法從原始變數(shù)的總體方差變異出發(fā),儘量使原始變數(shù)的方差能夠被主成分所解釋公因數(shù)分析法重在解釋變數(shù)的相關(guān)性,確定內(nèi)在結(jié)構(gòu),而對於變數(shù)的方差的解釋相對不太重視當(dāng)研究的目的重在確定結(jié)構(gòu)時,可以使用此方法4.2公共因素?cái)?shù)目的確定決定因數(shù)個數(shù)先驗(yàn)標(biāo)準(zhǔn):結(jié)合前人研究結(jié)果因數(shù)的特徵根大於1因數(shù)的變異總解釋率大於60%

(取決於具體研究)碎石圖拐點(diǎn)被試不同質(zhì)時應(yīng)抽取更多的因數(shù)前提假設(shè)對正態(tài)性、方差齊性、線性的統(tǒng)計(jì)考慮樣本同質(zhì)性概念上的聯(lián)繫Stage3選擇因素分析方法要分析的是總方差還是共同方差?總方差主成分分析共同方差共因數(shù)分析設(shè)定因數(shù)矩陣決定因數(shù)個數(shù)Stage4Stage5Stage24.2公共因素?cái)?shù)目的確定4.3因素旋轉(zhuǎn)因數(shù)旋轉(zhuǎn)的原因:未旋轉(zhuǎn)時,基於因數(shù)解釋方差的多少來抽取因數(shù),第一個因數(shù)解釋的變異最多,越往後解釋的變異越少重新分佈每個因數(shù)上的方差,從而達(dá)到更簡單更有意義的因數(shù)模式因數(shù)旋轉(zhuǎn)的類型:正交旋轉(zhuǎn):旋轉(zhuǎn)軸保持90度斜交旋轉(zhuǎn):旋轉(zhuǎn)軸不保持90度因數(shù)旋轉(zhuǎn)的原理:改變坐標(biāo)軸的位置,重新分配各個因數(shù)所解釋的方差的比例,使得各個變數(shù)在盡可能少的因數(shù)上有較高載荷4.3因素旋轉(zhuǎn)正交旋轉(zhuǎn)默認(rèn)各因數(shù)之間不存在相關(guān)正交旋轉(zhuǎn)使用最為廣泛目的為數(shù)據(jù)簡化時使用正交旋轉(zhuǎn)4.3因素旋轉(zhuǎn)斜交旋轉(zhuǎn)允許因數(shù)之間存在相關(guān)比正交旋轉(zhuǎn)更加靈活目的為得到有理論意義的因數(shù)和結(jié)構(gòu)時使用斜交旋轉(zhuǎn)4.3因素旋轉(zhuǎn)正交斜交4.3因素旋轉(zhuǎn)4.4解釋因素因數(shù)載荷多大才算顯著:至少大於0.30一般應(yīng)該大於0.40在預(yù)設(shè)檢驗(yàn)力水準(zhǔn)下,樣本量會影響統(tǒng)計(jì)顯著性樣本量增大,判斷載荷顯著的臨界值水準(zhǔn)降低(更小的載荷就有可能顯著)1.檢查載荷矩陣2.找到每個變數(shù)在所有因數(shù)中最高的載荷3.評估變數(shù)的共同度4.是否需要重設(shè)模型5.因數(shù)命名因數(shù)矩陣解釋步驟4.4解釋因素因數(shù)載荷

載荷顯著需要的樣本量* .30 350 .35 250 .40 200 .45 150 .50 120 .55 100 .60 85 .65 70 .70 60 .75 50*顯著是基於0.05的顯著性水準(zhǔn),80%的檢驗(yàn)力,假定標(biāo)準(zhǔn)誤是一般相關(guān)係數(shù)標(biāo)準(zhǔn)誤的兩倍4.4解釋因素變數(shù)數(shù)量增加,達(dá)到顯著的載荷臨界值減小→更小的載荷就可能顯著因數(shù)數(shù)量增加,達(dá)到顯著的載荷臨界值增大→更大的載荷才可能顯著交叉載荷的變數(shù)通常要刪除,除非有理論支持或目的只是簡化數(shù)據(jù)。當(dāng)所有變數(shù)都只在某一個因數(shù)上有高載荷時,得到的結(jié)構(gòu)最優(yōu)4.4解釋因素1.檢查載荷矩陣2.找到每個變數(shù)在所有因數(shù)中最高的載荷3.評估變數(shù)的共同度4.是否需要重設(shè)模型5.因數(shù)命名因數(shù)矩陣解釋步驟4.4解釋因素1.檢查載荷矩陣2.找到每個變數(shù)在所有因數(shù)中最高的載荷3.評估變數(shù)的共同度4.是否需要重設(shè)模型5.因數(shù)命名共同度通常應(yīng)該達(dá)到0.50以上才能被接受因數(shù)矩陣解釋步驟4.4解釋因素1.檢查載荷矩陣2.找到每個變數(shù)在所有因數(shù)中最高的載荷3.評估變數(shù)的共同度4.是否需要重設(shè)模型5.因數(shù)命名刪除了變數(shù)使用了不同的旋轉(zhuǎn)方法需要抽取不同數(shù)量的因數(shù)改變抽取因數(shù)的方法因數(shù)矩陣解釋步驟:4.4解釋因素1.檢查載荷矩陣2.找到每個變數(shù)在所有因數(shù)中最高的載荷3.評估變數(shù)的共同度4.出現(xiàn)以下情況需要重設(shè)模型5.因數(shù)命名因數(shù)命名是基於對因數(shù)載荷的解釋因數(shù)命名時,應(yīng)主要考慮每個因數(shù)中載荷最顯著的變數(shù),旋轉(zhuǎn)方式的選擇會影響對因數(shù)載荷的解釋:正交旋轉(zhuǎn)時因數(shù)之間無相關(guān),斜交旋轉(zhuǎn)時因數(shù)之間有相關(guān)因數(shù)矩陣解釋步驟:選擇因素分析方法要分析的是總方差還是共同方差?總方差主成分分析共同方差共因數(shù)分析設(shè)定因數(shù)矩陣決定因數(shù)個數(shù)Stage4Stage5解釋旋轉(zhuǎn)的因數(shù)矩陣是否有顯著的載荷?因數(shù)是否能命名?共同度是否足夠大?正交方法VARIMAXEQUIMAXQUARTIMAX斜交方法ObliminPromaxOrthoblique選擇旋轉(zhuǎn)方法因數(shù)之間應(yīng)該有相關(guān)(斜交)還是不相關(guān)(正交)?因數(shù)模型重新設(shè)定是否刪除了變數(shù)?是否想改變因數(shù)個數(shù)?是否想用另一種旋轉(zhuǎn)方法?是否Stage6否是4.4解釋因素5.探索性因素分析的應(yīng)用效度驗(yàn)證結(jié)果處理5.1效度驗(yàn)證評估結(jié)果的可重複性比較探索性因素分析和對探索性因素分析的結(jié)果進(jìn)行驗(yàn)證性因素分析評估因數(shù)結(jié)構(gòu)穩(wěn)定性穩(wěn)定性高度依賴於樣本量和每個變數(shù)的觀測數(shù)量檢查有影響的觀測值分別在包含和不包含有影響的觀測值時,運(yùn)行因數(shù)模型,找到異常值5.2結(jié)果處理如何將因數(shù)分析的結(jié)果用到其他分析中?選擇代表性變量(surrogatevariable)用因子中載荷最高的變量,代表該因子優(yōu)點(diǎn):已操作,好解釋缺點(diǎn):1)并不能代表一個因子的所有方面2)易受測量誤差的影響合成維度分(summatedscale)對所有在同一因子上載荷高的變量,加和或求均值優(yōu)點(diǎn):1)減少了測量誤差2)代表一個概念的多個方面3)不同研究中可重復(fù)缺點(diǎn):1)只包含了高載荷變量,2)不一定正交3)要求先分析信效度計(jì)算因素得分(factorscore)根據(jù)所有變量在因子上的載荷合成優(yōu)點(diǎn):1)代表了所有加載于因子上的變量2)數(shù)據(jù)簡化的最好方式3)默認(rèn)正交,避免多重共線性造成的復(fù)雜問題缺點(diǎn):1)更難解釋2)不同研究很難重復(fù)5.2結(jié)果處理Stage6因數(shù)矩陣的效度檢驗(yàn)拆分/多個樣本對子樣本分別進(jìn)行分析找到有影響的個案選擇代表性變數(shù)計(jì)算因素得分合成維度分Stage7Stage66.探索性因素分析中一些值得注意的問題樣本量的問題缺失值的問題抽取因素?cái)?shù)充分性的問題因素的重要性及其內(nèi)部一致性的問題6.1樣本量的問題一般認(rèn)為,當(dāng)樣本量的數(shù)量小於50時,是不適合進(jìn)行因素分析的,因此,有研究者提出樣本量最好在100以上。例如,Comrey和Lee(1992)就提出了樣本量的參考標(biāo)準(zhǔn),樣本量為50時,因素分析的結(jié)果會很差,100時較差,300時較好,500時非常好,1000時特別好。其實(shí),經(jīng)驗(yàn)的法則是,樣本量的數(shù)量應(yīng)當(dāng)至少為要分析的變數(shù)數(shù)量的5倍,更被普遍認(rèn)可的標(biāo)準(zhǔn)是10倍及以上,甚至有的研究者提出20倍的要求。6.2缺失值的問題當(dāng)數(shù)據(jù)中存在缺失值時,回顧之前學(xué)習(xí)的知識,需要識別數(shù)據(jù)的缺失機(jī)制,同時對缺失值進(jìn)行處理。處理的方式包括忽略、刪除缺失被試、估計(jì)缺失值等。如果研究者在非隨機(jī)缺失的情況下採取了刪除缺失被試的方法,就要考慮刪除後的樣本量是否足夠,以及刪除被試是否會造成有偏的估計(jì)結(jié)果。如果採用回歸等方式插補(bǔ)缺失值,就要考慮這種方式是否會造成模型過度擬合數(shù)據(jù),使得相關(guān)偏高,從而產(chǎn)生出一些不存在的因素。6.3抽取因素充分性的問題在探索性因素分析中,如果抽取的因素?cái)?shù)量越多,模型的擬合程度就越高,可以解釋的方差比例就越大,但是,模型的複雜性就會增強(qiáng)。最極端的情況,如果抽取的因素?cái)?shù)等於變數(shù)的數(shù)量,那麼模型的擬合程度應(yīng)該最好,而這樣的模型也失去了降維的意義。因此,探索性因素分析中對因素?cái)?shù)量的選取體現(xiàn)了對模型擬合程度與模型簡潔性的平衡。6.4

因素的重要性及其內(nèi)部一致性的問題因素的重要性因素的重要性是由旋轉(zhuǎn)後,每個因素解釋方差或協(xié)方差的比例來衡量的。在旋轉(zhuǎn)前後,每個因素解釋的方差或協(xié)方差的比例是不同的,這裏需要使用旋轉(zhuǎn)後的結(jié)果。因素的內(nèi)部一致性因素的內(nèi)部一致性是用因素分多重相關(guān)的平方來確定的(Tabachnick&Fidell,2001)。多重相關(guān)係數(shù)是某個因素分與其他因素分之間線性相關(guān)程度的指標(biāo)(Allison,1999)。該值一般在0到1之間,值越大,說明因素內(nèi)部一致性越強(qiáng),因素越穩(wěn)定。如果因素分多重相關(guān)的平方較高(如,大於0.7),意味著觀測變數(shù)能夠解釋因素分的變異。如果因素分多重相關(guān)的平方大於1,說明整個分析結(jié)果需要重新考量。6.4

因素的重要性及其內(nèi)部一致性的問題因素解釋的問題為了解釋因素,就必須瞭解每個因素所有有載荷的變數(shù)。通過正交旋轉(zhuǎn)和斜交旋轉(zhuǎn),都可以得到因素載荷矩陣,但是,這兩種旋轉(zhuǎn)方式下,載荷的意義是不同的。正交旋轉(zhuǎn)之後,因素載荷矩陣中的數(shù)值表示變數(shù)和因素的相關(guān)。研究者可以確定一個標(biāo)準(zhǔn)(例如,0.3),高於這個標(biāo)準(zhǔn)的相關(guān)才是有意義的。然後,可以選擇所有與某個因素的相關(guān)有意義的變數(shù),試著對這些變數(shù)的潛在共同點(diǎn)加以概括。斜交旋轉(zhuǎn)之後,載荷不再是變數(shù)和因素的相關(guān),只是測量了它們之間的關(guān)係。因?yàn)橐蛩刂g是相關(guān)的,所以一個變數(shù)和一個因素的相關(guān)可能並不是因?yàn)樗鼈冎苯拥南嚓P(guān),而是通過因素之間的相關(guān)達(dá)到的。6.5探索性因素分析的局限性在理論方面首先,研究者在選擇因素時面臨著雙重困境。研究者為了證明某個假設(shè),總是想盡可能多的保留有與研究主題有關(guān)聯(lián)的因素,如果一旦遺漏了重要的因素,將會扭曲所測量的因素之間的關(guān)係,從而得到有偏差的結(jié)果。其次,有的變數(shù)會存在有交叉載荷的問題。在探索性因素分析中,我們當(dāng)然希望每個變數(shù)都只測量一個因素。但是有時,一個變數(shù)與多個因素都有相關(guān),這個變數(shù)在這幾個因素上就存在交叉載荷。這樣會對整個數(shù)據(jù)結(jié)構(gòu)的確定和因素的解釋帶來一定的困難。最後,探索性因素分析有時對樣本的異質(zhì)性很敏感。一方面,不同類型的群體在同樣的變數(shù)上可能得到不同的因素分析結(jié)果。另一方面,即使對於相同的樣本,隨著時間的推移,潛在的因素結(jié)構(gòu)也可能會發(fā)生改變。因此,如果不能排除這些異質(zhì)性的影響,就應(yīng)當(dāng)對不同的樣本分別分析。6.5探索性因素分析的局限性在實(shí)踐方面首先,儘管探索性因素分析對變數(shù)的數(shù)據(jù)分佈沒有嚴(yán)格假設(shè),但是,數(shù)據(jù)的分佈的確會影響分析結(jié)果的準(zhǔn)確性。如果變數(shù)之間滿足多元正態(tài)分佈,並且兩兩之間的關(guān)係是線性的,那麼分析結(jié)果的有效性較高。反之,數(shù)據(jù)的偏態(tài)分佈和變數(shù)之間的非線性關(guān)係將會降低分析結(jié)果的可靠性。其次,如果數(shù)據(jù)中包含一個變數(shù)或多個變數(shù)上的奇異值,那麼這些奇異值將會對因素分析的解有較大的影響。最後,相關(guān)矩陣得到高相關(guān),也不一定意味著存在潛在因素。有時候,這些相關(guān)僅代表兩個變數(shù)之間的關(guān)係,而沒有反映潛在因素對多個變數(shù)的同時影響。因此,對所有變數(shù)計(jì)算兩兩之間的偏相關(guān)也很重要,這樣能夠得到除去其他變數(shù)的影響後,兩兩變數(shù)之間單獨(dú)的關(guān)聯(lián)。如果數(shù)據(jù)背後有潛在因素存在,那麼兩兩變數(shù)得到的二列相關(guān)就應(yīng)該較高,而偏相關(guān)較低。SPSS和SAS中都可以輸出偏相關(guān)矩陣。7應(yīng)用案例及SPSS操作一個關(guān)於幽默風(fēng)格的問卷:分析目的及設(shè)計(jì)數(shù)據(jù)整理前提假設(shè)檢驗(yàn)第一次探索性因素分析因素?cái)?shù)固定為5的探索性因素分析因素?cái)?shù)固定為4的探索性因素分析刪除Q22後的探索性因素分析刪除Q22、Q28後的探索性因素分析操作步驟詳見《高級心理統(tǒng)計(jì)》P149~P1647應(yīng)用案例及Mplus操作一個關(guān)於幽默風(fēng)格的問卷:第一次探索性因素分析刪除Q28後的探索性因素分析刪除Q28、Q22後的探索性因素分析操作步驟詳見《高級心理統(tǒng)計(jì)》P164~P171關(guān)鍵術(shù)語探索性因素分析因素載荷公共因素方差特徵根貢獻(xiàn)率全分量模型公共因素模型因素旋轉(zhuǎn)正交旋轉(zhuǎn)斜交旋轉(zhuǎn)因素得分內(nèi)容要點(diǎn)1、因素分析(FactorAnalysis)是一種將描述某一事物的多個可觀測的“變數(shù)”縮減成描述該事物的少數(shù)幾個不可觀測的“潛變數(shù)”(又稱潛在因素)的統(tǒng)計(jì)技術(shù)。因素分析具體可以分為探索性因素分析(exploratoryfactoranalysis,EFA)和驗(yàn)證性因素分析(confirmatoryfactoranalysis,CFA)兩大類。2、因素分析的基本模型是將觀察到的數(shù)據(jù)表示成幾個潛在因素的線性組合。探索性因素分析的基本模型可以分為兩類:全分量模型和公共因素模型。3、探索性因素分析的基本假設(shè)是,所選擇的變數(shù)確實(shí)存在潛在的相關(guān)結(jié)構(gòu)。相關(guān)矩陣、Anti-image相關(guān)矩陣、Bartlett球形檢驗(yàn)和KMO測度就可以對變數(shù)相關(guān)的假設(shè)進(jìn)行統(tǒng)計(jì)檢驗(yàn)。4、一般來說,可以結(jié)合先驗(yàn)的標(biāo)準(zhǔn)、特徵值原則、碎石檢驗(yàn)準(zhǔn)則、因素累積解釋方差的比例標(biāo)準(zhǔn)來確定公共因素的數(shù)量。5、因素旋轉(zhuǎn)可以重新分配各個因素所解釋的方差的比例,使因素結(jié)構(gòu)簡單並易於解釋。因素旋轉(zhuǎn)的方式有兩種,一種是正交旋轉(zhuǎn),另一種是斜交旋轉(zhuǎn)。斜交旋轉(zhuǎn)比正交旋轉(zhuǎn)更具有一般性,它假設(shè)因素之間有相關(guān)。6、在實(shí)際中,可以通過使用變數(shù)替代、合成維度分或者使用因素得分的方式將探索性因素分析的結(jié)果應(yīng)用到後續(xù)分析中。驗(yàn)證性因素分析1.驗(yàn)證性因素分析與探索性因素分析比較探索性因素分析(1)所有的公共因素都相關(guān)(或都無關(guān))。(2)所有的公共因素都直接影響所有的觀測變數(shù)。(3)特殊因素之間相互獨(dú)立。(4)公共因素和特殊因素相互獨(dú)立。驗(yàn)證性因素分析(1)公共因素之間可以相關(guān)也可以無關(guān)。(2)觀測變數(shù)可以只受某一個或幾個公共因素的影響而不必受所有公共因素的影響。(3)特殊因素之間可以有相關(guān),還可以出現(xiàn)不存在誤差因素的觀測變數(shù)。(4)公共因素和特殊因素之間相互獨(dú)立。1.驗(yàn)證性因素分析與探索性因素分析比較探索性因素分析(5)觀測變數(shù)與潛在變數(shù)之間的關(guān)係不是事先假定的。(6)潛在變數(shù)的個數(shù)不是在分析前確定的。(7)模型複雜,通常是不可識別的。驗(yàn)證性因素分析(5)觀測變數(shù)與潛變數(shù)之間的關(guān)係事先假定的;(6)潛在變數(shù)的個數(shù)在數(shù)據(jù)分析前確定的;(7)模型通常要求是可識別的。圖示2.驗(yàn)證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

X1

觀測變數(shù)潛變數(shù)潛變數(shù)(或特殊因數(shù))對觀測變數(shù)的影響特殊因數(shù)潛變數(shù)之間的相關(guān)2.驗(yàn)證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13

2.驗(yàn)證性因素分析的圖示、模型及基本步驟模型導(dǎo)出協(xié)方差矩陣測量模型中誤差項(xiàng)之間的協(xié)方差矩陣觀測變數(shù)之間的協(xié)方差矩陣觀測變數(shù)X相應(yīng)於ξ的載荷陣潛變數(shù)之間的協(xié)方差矩陣模型的估計(jì):求解協(xié)方差方程中的各個參數(shù)的估計(jì)值,以便使模型更好地重新產(chǎn)生觀測變數(shù)的協(xié)方差矩陣。2.驗(yàn)證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13觀測變數(shù)之間的協(xié)方差矩陣:X1,X2,…,X9變數(shù)之間的協(xié)方差矩陣總體協(xié)方差矩陣用∑表示具體應(yīng)用中根據(jù)實(shí)際數(shù)據(jù)計(jì)算樣本協(xié)方差矩陣S是結(jié)構(gòu)方程模型中的輸入部分2.驗(yàn)證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13因素載荷矩陣:由理論假設(shè)的模型確定因素載荷矩陣的結(jié)構(gòu)和需要估計(jì)的參數(shù),用Λx表示是驗(yàn)證性因素分析需要估計(jì)的部分2.驗(yàn)證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13潛變數(shù)協(xié)方差矩陣:由理論假設(shè)的模型確定協(xié)方差矩陣的結(jié)構(gòu)和需要估計(jì)的參數(shù),用Ф表示是驗(yàn)證性因素分析需要估計(jì)的部分2.驗(yàn)證性因素分析的圖示、模型及基本步驟X1X2X3X4X5X6X7X8X9

λ11λ21λ31λ42λ52λ62λ73λ83λ93φ12φ23φ13

2.驗(yàn)證性因素分析的圖示、模型及基本步驟基本步驟第一步:設(shè)定驗(yàn)證性因素分析模型。第二步:判斷驗(yàn)證性因素分析模型是否能識別。第三步:驗(yàn)證性因素分析的參數(shù)估計(jì)。第四步:驗(yàn)證性因素分析的模型評價。第五步:驗(yàn)證性因素分析的模型修正。第六步:驗(yàn)證性因素分析的模型應(yīng)用。3.驗(yàn)證性因素分析模型的確定和識別模型確定驗(yàn)證性因素分析模型的定義往是基於不同理論和研究者觀點(diǎn)提出。模型1:自我概念(Self-Concept,簡寫為SC)有四個維度,分別為整體自我概念(GSC)、學(xué)業(yè)自我概念(ASC)、英語自我概念(ESC)、數(shù)學(xué)自我概念(MSC)。模型2:自我概念有兩個維度,GSC和ASC。模型3:另有研究者指出,自我概念為單維度結(jié)構(gòu),只有GSC一個維度。3.1模型確定模型1:自我概念(Self-Concept,簡寫為SC)有四個維度,分別為整體自我概念(GSC)、學(xué)業(yè)自我概念(ASC)、英語自我概念(ESC)、數(shù)學(xué)自我概念(MSC)。測驗(yàn)題目與因素之間的關(guān)係為:題目T1-T4測量GSC、題目T5-T8測量ASC、題目T9-T12測量ESC、題目T13-T16測量MSC;每個題目只測量一個維度,不存在交叉載荷。四個維度GSC、ASC、ESC和MSC之間兩兩相關(guān)。特殊因素之間相互獨(dú)立。3.1模型確定模型1:自我概念(Self-Concept,簡寫為SC)有四個維度,分別為整體自我概念(GSC)、學(xué)業(yè)自我概念(ASC)、英語自我概念(ESC)、數(shù)學(xué)自我概念(MSC)。T1T2T3T4T5T6T7T8T9T10T11T12T13T14T15T16GSCASCESCMSC3.1模型確定模型2:自我概念有兩個維度,GSC和ASC。測驗(yàn)題目與因素之間的關(guān)係為:題目T1-T4測量GSC、題目T5-T16測量ASC;每個題目只測量一個維度,不存在交叉載荷。兩個維度GSC和ASC相關(guān)。特殊因素之間相互獨(dú)立。3.1模型確定模型2:自我概念有兩個維度,GSC和ASC。T1T2T3T4T5T6T7T8T9T10T11T12T13T14T15T16GSCASC3.1模型確定模型3:自我概念為單維度結(jié)構(gòu),只有GSC一個維度。測驗(yàn)題目與因素之間的關(guān)係為:題目T1-T16測量GSC。特殊因素之間相互獨(dú)立。T1T2T3T4T5T6T7T8T9T10T11T12T13T14T15T16GSC3.2模型識別模型識別是指求出參數(shù)的唯一解,即模型的協(xié)方差方程中自由估計(jì)的參數(shù)有唯一滿足方程的值3.2模型識別不可識別不可識別是指模型中方程式的個數(shù)小於要估計(jì)的參數(shù)的個數(shù),使參數(shù)有多個解??梢宰R別的情況恰好識別恰好識別是指模型中方程式的個數(shù)等於要估計(jì)的參數(shù)的個數(shù),每個參數(shù)都能求得唯一解。超識別超識別是指模型中方程式的個數(shù)大於要估計(jì)的參數(shù)的個數(shù),一個待識別的參數(shù)可以用一個以上的已知量表示時,該參數(shù)可取不同值。3.2模型識別識別的必要條件T準(zhǔn)則:模型中自由參數(shù)的個數(shù)不能超過協(xié)方差矩陣的元素?cái)?shù)。3.2模型識別

3.2模型識別

3.2模型識別複雜模型識別的充分條件對於每一個因素,至少需要滿足下列條件之一:(1)至少含有三個測量指標(biāo)變數(shù),其測量誤差之間不存在相關(guān);(2)至少含有兩個測量指標(biāo)變數(shù),其測量誤差之間不存在相關(guān),且滿足下列條件之一:(a)這兩個指標(biāo)的測量誤差不與測量另一個因素的第三個指標(biāo)的測量誤差項(xiàng)相關(guān);(b)限定這兩個指標(biāo)的因素載荷相等3.2模型識別複雜模型識別的充要條件對於任意的兩個因素,至少存在兩個指標(biāo)變數(shù),它們來自不同的因素,其測量誤差之間不存在相關(guān)。除了上述因素載荷中關(guān)於測量誤差相關(guān)的約定,對於有交叉載荷的每個因素,必須至少有一個指標(biāo)不存在交叉載荷(即只在一個因素上有載荷),並且與含有交叉載荷的指標(biāo)變數(shù)的測量誤差不相關(guān)4.驗(yàn)證性因素分析中的數(shù)據(jù)收集和參數(shù)估計(jì)測量的量尺在進(jìn)行驗(yàn)證性因素分析中,所使用的數(shù)據(jù)類型最好是順序數(shù)據(jù)、等距數(shù)據(jù)或比率數(shù)據(jù)。驗(yàn)證性因素分析可以處理包含不同計(jì)分點(diǎn)的數(shù)據(jù)。4.驗(yàn)證性因素分析中的數(shù)據(jù)收集和參數(shù)估計(jì)設(shè)定潛變數(shù)量尺設(shè)定潛變數(shù)量尺的方法有兩種:一是對每個潛變數(shù),固定一條路徑的因素載荷為1;二是固定潛變數(shù)的方差為1。4.驗(yàn)證性因素分析中的數(shù)據(jù)收集和參數(shù)估計(jì)X1X2X3X4X5X6X7X8X9

X1X2X3X4X5X6X7X8X9

1111111111111111111111114.2參數(shù)估計(jì)在驗(yàn)證性因素分析中的參數(shù)估計(jì)的方法有:未加權(quán)最小二乘法(ULS)廣義最小二乘估計(jì)(GLS)極大似然估計(jì)(ML)工具變數(shù)法(IV)兩階段最小平方法(TSLS)加權(quán)最小平方法(WLS)對角加權(quán)最小平方(DWLS)貝葉斯估計(jì)方法(BAYES)5.驗(yàn)證性因素分析中的模型評價與修正模型評價絕對擬合指數(shù)(AbsoluteIndex)這些指數(shù)比較的是觀測的與期望的方差和協(xié)方差,即測量絕對的模型擬合。擬合優(yōu)度卡方統(tǒng)計(jì)量擬合優(yōu)度指數(shù)(GFI)和調(diào)整的擬合優(yōu)度指數(shù)(AGFI)近似誤差均方根(RMSEA)5.驗(yàn)證性因素分析中的模型評價與修正模型評價相對擬合指數(shù)(RelativeIndex)這些指數(shù)比較了一個模型與另一個模型的相對擬合。比較擬合指數(shù)CFI遞增擬合指數(shù)IFI標(biāo)準(zhǔn)擬合指數(shù)NFI非標(biāo)準(zhǔn)擬合指數(shù)NNFI/TLI5.驗(yàn)證性因素分析中的模型評價與修正模型修正如果模型不能很好地?cái)M合數(shù)據(jù),就需要對模型進(jìn)行修正和再次設(shè)定。對於模型的選取應(yīng)該遵循省儉原則,省儉原則是指當(dāng)兩個模型同樣吻合數(shù)據(jù)時,應(yīng)當(dāng)取兩個模型中比較簡單的一個。模型的修正可以根據(jù):

①因素載荷值的大小,考慮刪除載荷小的題目;

②考察有交叉載荷的題目,考慮刪除;

③結(jié)合修正指數(shù)的情況,進(jìn)行模型的修改。5.驗(yàn)證性因素分析中的模型評價與修正模型修正修正指數(shù):是當(dāng)模型與數(shù)據(jù)擬合不好的時候,基於數(shù)據(jù)提出的一種模型擬合改進(jìn)的方法和指標(biāo)。該值表示,如果估計(jì)這條路徑,模型擬合的整體卡方值會減小的數(shù)值。嵌套模型比較

然後,可以對差值進(jìn)行卡方顯著性檢驗(yàn)。

6.驗(yàn)證性因素分析模型的應(yīng)用效度檢驗(yàn)結(jié)構(gòu)效度總的來看,各項(xiàng)擬合指數(shù)都較好,說明測驗(yàn)具有較好的結(jié)構(gòu)效度,反之,說明測驗(yàn)工具有待進(jìn)一步修訂或理論構(gòu)想有待於進(jìn)一步完善。區(qū)分效度區(qū)分效度是指不同的潛變數(shù)之間存在區(qū)別的程度。如果潛變數(shù)的區(qū)分效度高,說明這個潛變數(shù)是獨(dú)特的,它包含了其他潛變數(shù)不能測量的東西。6.驗(yàn)證性因素分析模型的應(yīng)用信度檢驗(yàn)信度可以定義為公共因素與觀測變數(shù)相關(guān)的平方,它表示在一個觀測變數(shù)的總方差中,能夠由公共因素所解釋的方差的比例。構(gòu)想信度:潛變數(shù)所有觀測變數(shù)載荷的標(biāo)準(zhǔn)化平方和,除以它與誤差方差的和。6.驗(yàn)證性因素分析模型的應(yīng)用等價性檢驗(yàn)測量等價性指的是,應(yīng)用量表進(jìn)行測量時,當(dāng)觀測變數(shù)和潛在特質(zhì)之間的關(guān)係在相比較的各個組之間等同時,就稱該量表具備測量等價性。模型1:因素模式相同模型(configuralmodel)模型2:因素載荷等價模型模型3:截距等價模型模型4:誤差的方差協(xié)方差矩陣等價模型模型5:潛變數(shù)的方差協(xié)方差矩陣等價模型模型6:潛變數(shù)均值等價模型7.驗(yàn)證性因素分析應(yīng)用案例及Mplus操作《高級心理統(tǒng)計(jì)》P190-199《高級心理統(tǒng)計(jì)》P200-2088.等價性檢驗(yàn)應(yīng)用案例及Mplus操作關(guān)鍵術(shù)語驗(yàn)證性因素分析潛變數(shù)觀測變數(shù)T準(zhǔn)則三指標(biāo)準(zhǔn)則二指標(biāo)準(zhǔn)則嵌套模型測量等價性因素模式相同模型因素載荷等價模型路徑分析

PathAnalysis1.一般目的和描述路徑分析是研究因果關(guān)係的一種統(tǒng)計(jì)方法,用於解釋一組變數(shù)之間的相關(guān)關(guān)係以及它們之間如何相互影響。路徑分析是一種“證實(shí)性技術(shù)”,而不是探索性技術(shù)。2.主要解決的問題2.1多元回歸的局限性多元回歸只是把所有的引數(shù)放在同樣的位置,來看待一整組引數(shù)對因變數(shù)的解釋和預(yù)測程度,無法分析和評價各個引數(shù)之間的關(guān)係。回歸分析兼具有預(yù)測和解釋兩種功能,當(dāng)研究的側(cè)重點(diǎn)是預(yù)測的時候,研究人員更重視的是全部引數(shù)的變化在多大程度上解釋了因變數(shù)的變化。當(dāng)研究的側(cè)重點(diǎn)是解釋時,研究人員更希望瞭解的是引數(shù)是如何影響因變數(shù)的以及作用程度如何。在回歸模型中,可以通過偏回歸係數(shù)等結(jié)果來瞭解相關(guān)資訊。當(dāng)研究人員將引數(shù)之間的相互作用考慮進(jìn)來之後,引數(shù)除了對因變數(shù)有直接作用外,還可能通過其他變數(shù)對因變數(shù)產(chǎn)生間接作用。2.主要解決的問題2.2

路徑分析的研究問題路徑分析中X2、X4對X5的總效應(yīng)和間接效應(yīng):在回歸方程模型中:X2對X5的回歸係數(shù)是0.16,X4對X5的回歸係數(shù)是0.393.模型和原理3.1基本概念3.2前提條件3.3模型的表示3.4基本步驟3.1基本概念3.2前提條件為了得到X影響Y(X→Y)的推論,還需要滿足以下所有條件:存在時間先後順序,即X在時間上先於Y;指定正確的因果方向,即指定X影響Y,而不是X和Y相關(guān)影響;X和Y之間的關(guān)係不是虛假相關(guān),不會隨著第三變數(shù)被控制為常數(shù)後就消失。3.3模型的表示

3.3模型的表示

3.4基本步驟模型假設(shè)。根據(jù)充分的理論依據(jù)或?qū)嵺`證據(jù),對變數(shù)之間的因果關(guān)係進(jìn)行指定;確定模型是否可識別。即電腦能否對模型參數(shù)進(jìn)行估計(jì)得到唯一參數(shù)結(jié)果變數(shù)準(zhǔn)備。根據(jù)所設(shè)定的模型,收集模型中所需要的變數(shù)數(shù)據(jù),並進(jìn)行數(shù)據(jù)清理;模型估計(jì)。選擇特定的電腦軟體根據(jù)設(shè)定的模型進(jìn)行數(shù)據(jù)分析和參數(shù)估計(jì),對估計(jì)結(jié)果進(jìn)行模型擬合度評估、考慮等價可替換模型等方面的分析;進(jìn)行模型評價和修正。在統(tǒng)計(jì)檢驗(yàn)、理論假設(shè)與實(shí)際觀察三者的綜合考慮下不斷對模型進(jìn)行修正,以期得到與實(shí)際數(shù)據(jù)擬合度最高的最佳模型。結(jié)果解釋與應(yīng)用。根據(jù)最終得到的估計(jì)結(jié)果對實(shí)際問題進(jìn)行分析和解釋。4.模型的分類和識別4.1路徑模型分類遞歸模型:因果關(guān)係結(jié)構(gòu)中全部為單向鏈條關(guān)係,無回饋?zhàn)饔玫穆窂侥P汀7沁f歸模型:變數(shù)之間存在多個方向的因果作用的路徑模型。非遞歸模型中的回饋回路可以分為間接回饋回路(圖a)、直接回饋回路(圖b)兩種類型

(a)間接回饋回路

(b)直接回饋回路4.模型的分類和識別飽和模型:在一個模型中,所有變數(shù)之間都有單向路徑或者表示相關(guān)的雙箭頭弧線所連接,也就是假設(shè)所有變數(shù)間都是有關(guān)系的,這種模型稱為飽和模型。那麼觀測值的數(shù)目為v(v-1)/2+v=v(v+1)/2(所有觀測變數(shù)方差和協(xié)方差的總數(shù)目)。飽和的遞歸模型是恰好識別的模型。非飽和模型:如果從飽和模型中剔除若干路徑,也就是說假設(shè)這些路徑係數(shù)為0,所形成的新模型則稱為非飽和模型。非飽和模型通常是超識別的模型,因此也可以說模型檢驗(yàn)通常是對非飽和模型的檢驗(yàn)。4.模型的分類和識別非遞歸模型的識別:遞歸模型都是可識別的,飽和的遞歸模型是恰好識別的模型。因此實(shí)際上並不存在檢驗(yàn)遞歸模型是否可識別的問題。因此在路徑分析中,模型能否識別主要是針對非遞歸模型而言的。階條件:必要條件。Ev≥p-1,p為內(nèi)源變數(shù)總數(shù),Ev是某個內(nèi)源變數(shù)沒有直接效應(yīng)的變數(shù)數(shù)目;秩條件:充要條件,內(nèi)源變數(shù)的方程餘子式Ci的秩等於p-1,證明這個方程可識別。大於是超識別。4.模型的分類和識別注意事項(xiàng):1.對參數(shù)所施加的約束包括:(1)B被設(shè)定為一個對角線上元素為0的矩陣;(2)每個殘差與其對應(yīng)的內(nèi)源變數(shù)之間載荷限定為1,即殘差的均值和方差被限定到對應(yīng)內(nèi)源變數(shù)相同量尺上。2.階條件和秩條件適用於除了上述兩種基本約束條件外,對B,Γ,ψ矩陣未加額外約束的情況。3.對不可識別模型加一些限定條件使得模型達(dá)到識別。一般可以通過以下操作:(1)增加外源變數(shù)(2)設(shè)置工作變數(shù)4.模型的分類和識別注意事項(xiàng):4.應(yīng)注意的是:第一,如果外源變數(shù)間存在高相關(guān),就不能輕易地將一個變數(shù)從方程中刪除,理想的情況是工具變數(shù)與其他外源變數(shù)是獨(dú)立的,因此找到一個好的工具變數(shù)往往並不容易。第二,相互間有因果關(guān)係的內(nèi)源變數(shù)不能有同一個工具變數(shù)。5.求參數(shù)解的方法:模型類型是否識別可用方法遞歸模型可識別極大似然估計(jì)、線性代數(shù)、最小二乘法非遞歸模型可識別極大似然估計(jì)、未加權(quán)最小二乘法、兩階段最小二乘法、廣義最小二乘法5.效應(yīng)分解及計(jì)算

5.效應(yīng)分解及計(jì)算5.1效應(yīng)分解的方法:路徑回溯方法1)根據(jù)研究需要選擇要進(jìn)行效應(yīng)分解的一對變數(shù)。2)由誰開始:當(dāng)我們選定了要分解的一對變數(shù)之後,就需要確定路徑回溯的起始點(diǎn)。3)按照規(guī)則進(jìn)行回溯。Duncan法則5.效應(yīng)分解及計(jì)算5.2計(jì)算實(shí)例:遞歸模型5.效應(yīng)分解及計(jì)算5.2計(jì)算實(shí)例:遞歸模型5.效應(yīng)分解及計(jì)算5.3注意事項(xiàng):非遞歸模型雖然迴圈回路的數(shù)目是無限的,但是所有效應(yīng)值的和會趨近於一個常數(shù)。對迴圈回路中變數(shù)的自身效應(yīng)進(jìn)行分解和計(jì)算,橫向數(shù)據(jù)需要滿足平衡性。通過橫向

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論