版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
心理學(xué)研究方法導(dǎo)論
ResearchMethodsinPsychology中卷
研究的基本類型與方法第十一章
測(cè)驗(yàn)研究凡是存在的,都是可以測(cè)量的。一、測(cè)驗(yàn)研究的概念與意義三國(guó)時(shí)期有一個(gè)神童叫曹沖(公元196-208年),他是曹操的兒子。有一次,吳國(guó)孫權(quán)送給曹操一只大象,曹操十分高興。大象運(yùn)到許昌時(shí),曹操帶領(lǐng)文武百官和服的小兒子曹沖一同前去觀看。所有的人以前都沒(méi)有見(jiàn)過(guò)大象,覺(jué)得非常新奇。大象又高又大,腿就有大殿的柱子一般粗,人過(guò)去一比,高度還夠不到大象的肚子。曹操于是對(duì)大家說(shuō):“這只大象真大,但是它到底有多重呢?誰(shuí)有辦法將稱它一稱?”當(dāng)時(shí)并沒(méi)有現(xiàn)代的計(jì)量工具,要稱幾噸重的大象,簡(jiǎn)直不可思議。大臣們議論紛紛。有的說(shuō):“造一桿很大的秤來(lái)稱。”有的說(shuō):“把大象它殺了,切成塊兒來(lái)稱。”大臣們沒(méi)有一個(gè)人能夠想到合適的辦法。這時(shí),人群里走出一個(gè)小孩,就是曹沖,他對(duì)曹操說(shuō):“我有個(gè)方法,可以稱大象?!辈懿傩χf(shuō):“你小小年紀(jì),有什么方法?”曹沖把辦法說(shuō)了。曹操聽(tīng)了連連叫好,吩咐左右立刻準(zhǔn)備稱象,然后率領(lǐng)大臣們來(lái)到河邊,觀看曹沖如何稱象。河里停著一只大船,曹沖叫人把象牽到船上,等船身穩(wěn)定了,曹沖說(shuō):“在船齊水面的地方劃一道記號(hào)?!庇浱?hào)劃好了以后,曹沖又叫人把大象牽上岸去。這時(shí)候大船空著,大船往上浮起。曹沖再叫人把大大小小的石頭,一塊一塊地往船上裝,船身于是漸漸往下沉。等船身沉到剛才劃的記號(hào)一樣齊時(shí),曹沖說(shuō)停止裝石頭。大臣們開(kāi)始還搞不清楚這個(gè)小孩玩什么把戲,這里才明白過(guò)來(lái),一個(gè)個(gè)不由得連聲稱贊是個(gè)好辦法。因?yàn)椋灰汛锸^的重量稱一下,累加起來(lái),就可以知道大象有多重了。第一個(gè)問(wèn)題:為什么要稱大象?其一,稱大象可以增加對(duì)大象的知識(shí)。由于曹操和他的大臣們對(duì)從來(lái)沒(méi)有見(jiàn)到過(guò)的大象充滿好奇,他們?yōu)榱诉M(jìn)一步了解大象,增加關(guān)于大象的知識(shí),所以,一當(dāng)曹操提出要稱一稱大象有多重,眾人都覺(jué)得有意思。用數(shù)量的方式去測(cè)量我們想了解的對(duì)象,顯然是一種增加對(duì)所關(guān)注的對(duì)象的知識(shí)的有意義的做法。對(duì)人類心理現(xiàn)象來(lái)說(shuō),同樣如此,用數(shù)量的方式去測(cè)量我們想了解的心理現(xiàn)象,可以增加我們對(duì)人類心理的知識(shí)。測(cè)量不僅可以用來(lái)比較、判斷、確認(rèn);更可以用來(lái)探索未知。其二,之所以要測(cè)量大象,還反映了人類的一種求知的本能。人類有這樣一種探索的本能,而且喜歡采用測(cè)量的方式去精確地了解和探索事物與現(xiàn)象。第二個(gè)問(wèn)題:小曹沖“以舟稱象”的意義何在?第一,“以舟稱象”說(shuō)明了一個(gè)測(cè)量的基本命題,這就是所謂“凡是存在的都是可以測(cè)量的”。因?yàn)榉彩谴嬖诘臇|西,都是可以賦值的,既然都可以賦值,那么,就都可以進(jìn)行數(shù)量化的計(jì)算,可以進(jìn)行測(cè)量。第二,“以舟稱象”引申出一個(gè)所謂間接測(cè)量的概念。不能夠直接測(cè)量的東西,并不意味著不可以間接測(cè)量。當(dāng)時(shí)沒(méi)有合適的秤來(lái)稱這只幾噸重的大象,也沒(méi)有能夠制造出那么大的秤來(lái);當(dāng)然,如某位大臣所說(shuō),將大象割為一塊塊,更是不可取。然而,間接測(cè)量的方法卻被一個(gè)小孩發(fā)明。小曹沖“以舟稱象”的做法,成功地解決了這個(gè)難題。心理現(xiàn)象在很多場(chǎng)合或時(shí)間里,都是難以測(cè)量的,但是,心理學(xué)家們通過(guò)間接測(cè)量,仍然可以達(dá)到目的。對(duì)心理現(xiàn)象的測(cè)量往往不能像用秤來(lái)稱大象那樣進(jìn)行直接測(cè)量,倒更像“以舟稱象”的做法。用腦電那樣的生理指標(biāo)(如平均誘發(fā)電位)難以確切測(cè)量人類的智力;直接詢問(wèn)被試的反應(yīng),也難以確切了解被試的真實(shí)心理。但是,通過(guò)一個(gè)人對(duì)一些模糊刺激(如墨跡圖、圖片等)的投射反應(yīng),我們倒可以間接地推論其知覺(jué)、動(dòng)機(jī)、情緒、人格。通過(guò)被試在問(wèn)卷上的反應(yīng),將其反應(yīng)與常模樣本的常態(tài)反應(yīng)進(jìn)行比較,這樣也可以間接地客觀地推論其心理。心理測(cè)驗(yàn)研究方法就是通過(guò)對(duì)行為樣本的的標(biāo)準(zhǔn)化的度量,從而對(duì)人的心理作出客觀評(píng)估這樣一種研究方法。例如韋克斯勒成人智力測(cè)驗(yàn)(WIAS),明尼蘇達(dá)多相人格測(cè)驗(yàn)(MMPI)。測(cè)驗(yàn)研究方法的幾個(gè)特征:抽取行為樣本標(biāo)準(zhǔn)化工具化評(píng)估雖然實(shí)驗(yàn)研究與測(cè)驗(yàn)研究同屬實(shí)證主義范式,同為科學(xué)心理學(xué)的兩大基石,同樣追求研究的客觀性和科學(xué)性,同樣追求真理,但是以上四個(gè)特點(diǎn)明顯地與實(shí)驗(yàn)研究不同,可以將將二者清楚地區(qū)分開(kāi)來(lái)。心理學(xué)的實(shí)驗(yàn)研究并不抽取行為樣本;并不進(jìn)行標(biāo)準(zhǔn)化的工作;也不要將研究工具化;實(shí)驗(yàn)研究只要根據(jù)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行推論,而不要進(jìn)行評(píng)估,不要診斷與預(yù)測(cè)。樣本
測(cè)驗(yàn)研究與實(shí)驗(yàn)研究對(duì)樣本的依賴性是非常強(qiáng)的。測(cè)驗(yàn)研究一定要根據(jù)總體的情況來(lái)計(jì)劃抽取具有足夠代表性的并且相應(yīng)數(shù)量的樣本;測(cè)驗(yàn)研究中的常模樣本則更需要精確計(jì)劃抽取樣本。實(shí)驗(yàn)研究同樣要注重樣本。研究情境
測(cè)驗(yàn)研究與實(shí)驗(yàn)研究對(duì)研究情境的依賴同樣也是非常強(qiáng)的。測(cè)驗(yàn)研究中,要有一個(gè)“標(biāo)準(zhǔn)化”的測(cè)驗(yàn)情境。實(shí)驗(yàn)研究對(duì)研究情境的要求更高,這表現(xiàn)在對(duì)實(shí)驗(yàn)室的設(shè)計(jì)、對(duì)儀器的要求、以及對(duì)實(shí)驗(yàn)處理的安排上。相反,個(gè)案研究、扎根研究、觀察研究基本上是在自然的、日常的生活條件下進(jìn)行,不需要對(duì)研究情境進(jìn)行刻意的設(shè)計(jì)、安排與控制。測(cè)驗(yàn)研究的優(yōu)點(diǎn)生態(tài)效度更高
測(cè)驗(yàn)研究與實(shí)驗(yàn)研究相比,可能其生態(tài)效度更高。實(shí)驗(yàn)研究囿于實(shí)驗(yàn)室情境,其研究的結(jié)論要推論到實(shí)驗(yàn)室以外的情境時(shí),總是面臨一定的風(fēng)險(xiǎn)。測(cè)驗(yàn)研究特別重視取樣,必須充分考慮到研究總體的情況,樣本必須具有足夠的代表性;測(cè)驗(yàn)研究的推論可以更具生態(tài)性,也就是說(shuō),一方面測(cè)驗(yàn)研究的總體一般都較大,另一方面測(cè)驗(yàn)研究要求從總體中取樣有較好的代表性,這樣就保證了測(cè)驗(yàn)研究的結(jié)論能夠適宜地推論于這一總體,因而具有較高的生態(tài)性??深A(yù)測(cè)性
根據(jù)心理測(cè)驗(yàn)的結(jié)果,我們一般都可以對(duì)被試以后的情況作出預(yù)測(cè)。工具性(量表化)
心理測(cè)驗(yàn)可以形成量表,發(fā)展成一種研究工具。這種量表同時(shí)就是一種技術(shù)產(chǎn)品。這可謂是測(cè)驗(yàn)研究最大的優(yōu)點(diǎn)。這一優(yōu)點(diǎn)是實(shí)驗(yàn)研究、現(xiàn)場(chǎng)研究、個(gè)案研究、扎根研究以及觀察研究都無(wú)可比擬的。在進(jìn)行智力研究的時(shí)候,不能不使用智力測(cè)驗(yàn)量表工具;進(jìn)行心理咨詢與治療的時(shí)候,不能不使用一些臨床心理測(cè)驗(yàn),如MMPI、各種抑郁測(cè)驗(yàn)、焦慮測(cè)驗(yàn)、強(qiáng)迫測(cè)驗(yàn)等。甚至在進(jìn)行實(shí)驗(yàn)研究的時(shí)候,前測(cè)與后測(cè)中還得使用心理測(cè)驗(yàn)。而且,心理測(cè)驗(yàn)的局限文化背景的限制
心理測(cè)驗(yàn)的編制與使用都會(huì)受到文化背景的影響。在編制時(shí),編制者往往都是基于自己文化的背景、框架、理念來(lái)選擇變量和編制測(cè)驗(yàn)題目的。心理測(cè)驗(yàn)必須考慮對(duì)不同文化的適應(yīng)性。從文化適應(yīng)、文化公平的角度對(duì)心理測(cè)驗(yàn)提出的批評(píng)也是最多的。標(biāo)定效應(yīng)(Labelingeffect)
標(biāo)定效應(yīng)無(wú)疑既有積極的作用,也有消極的影響。當(dāng)將一個(gè)被試客觀地診斷為高智商、高創(chuàng)造性、高自我效能等,或客觀地診斷為較重的躁狂障礙,這些診斷(即標(biāo)定)可能有助于這個(gè)被試更加清晰地認(rèn)識(shí)自我;或提高其自知力,促進(jìn)其預(yù)防障礙復(fù)發(fā)的免疫力,這些作用是積極的。但是,對(duì)心理測(cè)驗(yàn)的批評(píng)更多是集中在標(biāo)定效應(yīng)的消極作用上。心理測(cè)驗(yàn)的意義心理測(cè)驗(yàn)是科學(xué)心理學(xué)的“基石”
心理測(cè)驗(yàn)是心理學(xué)研究的“橋梁”和“編譯器”
。心理測(cè)驗(yàn)是心理的“尺度”和“標(biāo)準(zhǔn)”
。
二、經(jīng)典測(cè)量理論心理學(xué)的經(jīng)典測(cè)量理論又稱古典測(cè)量理論,即最早出現(xiàn)且在今天仍然應(yīng)用廣泛的心理測(cè)量理論。雖然今天涌現(xiàn)出許多新的現(xiàn)代心理測(cè)量理論,但是,這并不意味著經(jīng)典測(cè)量理論已經(jīng)過(guò)時(shí),只是表明心理測(cè)量理論還有繼續(xù)發(fā)展的廣闊空間。概括起來(lái)說(shuō),經(jīng)典測(cè)量理論包括三方面的重要內(nèi)容:一是真分?jǐn)?shù)假說(shuō),真分?jǐn)?shù)的數(shù)學(xué)模型從數(shù)學(xué)上奠定了經(jīng)典測(cè)量理論的基礎(chǔ)。二是建立在樣本基礎(chǔ)上的互為客觀理論,這一理論從概率統(tǒng)計(jì)和哲學(xué)上形成了經(jīng)典測(cè)量理論的基本信念、信仰與架構(gòu)。三是具體的信度、效度和常模理論,信度、效度和常模是經(jīng)典測(cè)量理論的基本要素、基本內(nèi)容,有如經(jīng)典測(cè)量理論的血肉。信度效度常模三.概化理論1963年,克倫巴赫(L.J.Cronbach)、格拉塞(G.C.Gleser)和拉吉拉特姆(N.Rajaratnam)最早提出的概化理論思想(Cronbach、Gleser、Rajaratnam,1963,1972),雖然在他們之前就已經(jīng)出現(xiàn)了相應(yīng)的公式算法與討論。美國(guó)衣阿華大學(xué)的布瑞南(RobertL.Brennan)在1983年出版了《概化理論綱要》并于1992年修訂再版(Brennan,1983,1992),2001年又出版了《概化理論》一書(shū),全面討論了概化理論的新進(jìn)展(Brennan,2001);布瑞南更開(kāi)發(fā)了概化理論的電腦計(jì)算程序GENOVA、mGENOVA,大大推進(jìn)了概化理論的應(yīng)用。概化理論的優(yōu)點(diǎn)能夠解決經(jīng)典測(cè)量理論信度方法難以解決的難題能夠更全面地評(píng)估測(cè)量信度能夠?qū)σ环N測(cè)量進(jìn)行各種推論能夠解決經(jīng)典測(cè)量理論信度方法難以解決的難題經(jīng)典測(cè)量理論的信度方法適合于N個(gè)被試有兩次測(cè)驗(yàn)結(jié)果(重測(cè)信度、復(fù)本信度)、或?qū)個(gè)被試的一次測(cè)驗(yàn)分解為兩半(分半信度)、或N個(gè)被試的J個(gè)測(cè)驗(yàn)項(xiàng)目(內(nèi)部一致性信度)的測(cè)驗(yàn)情境。雖然肯德?tīng)柡椭C系數(shù)能夠檢驗(yàn)N個(gè)評(píng)分者評(píng)價(jià)J個(gè)測(cè)驗(yàn)項(xiàng)目的信度,但是比較簡(jiǎn)單(如將等距變量和比率變量簡(jiǎn)化為等級(jí)變量),也不夠靈活。而概化理論可以解決更復(fù)雜的信度估計(jì)問(wèn)題。例如,N個(gè)評(píng)分者在H個(gè)階段評(píng)價(jià)J個(gè)測(cè)驗(yàn)項(xiàng)目的信度估計(jì),等等。能夠更全面地評(píng)估測(cè)量信度概化理論運(yùn)用方差分析的方法,估計(jì)測(cè)量的各種變異及其來(lái)源,考察各種變異的方差分量,根據(jù)測(cè)量目標(biāo)在總變異中所占的比重來(lái)評(píng)估測(cè)量的信度。測(cè)量所占的比重愈大,信度(概化系數(shù)和可靠性系數(shù))愈高。因此,它適合于更復(fù)雜的測(cè)驗(yàn)情境,如N個(gè)評(píng)分者對(duì)I個(gè)被試進(jìn)行J個(gè)項(xiàng)目的評(píng)價(jià)等等。這種信度評(píng)估方法更復(fù)雜、更靈活、更實(shí)用、更精確。能夠?qū)σ环N測(cè)量進(jìn)行各種推論概化理論在評(píng)估一種測(cè)驗(yàn)的信度時(shí),可以根據(jù)測(cè)量的目的,推論它在各種范圍的測(cè)量信度。例如可以通過(guò)變換不同數(shù)量的評(píng)分者、使用不同數(shù)量的測(cè)驗(yàn)項(xiàng)目、在不同的測(cè)量條件下評(píng)價(jià)該測(cè)驗(yàn)的多種信度。所以,概化理論對(duì)測(cè)量信度的研究是一個(gè)非常重要的進(jìn)展與貢獻(xiàn)。G研究與D研究概化理論的分析過(guò)程分為兩部分,首先進(jìn)行概化研究(generalizabilitystudy,簡(jiǎn)稱G研究),然后再進(jìn)行決策研究(decisionstudy,簡(jiǎn)稱D研究)。在G研究中,主要是通過(guò)方差分析,將測(cè)量目標(biāo)、測(cè)量的各個(gè)側(cè)面(facet)的變異及其交互效應(yīng)全部估計(jì)出來(lái)。在D研究中,根據(jù)G研究估計(jì)在這些所有測(cè)量條件下進(jìn)行測(cè)量的總體,即測(cè)量的概化全域。例如,研究者設(shè)計(jì)了一種結(jié)構(gòu)化面試的測(cè)驗(yàn),測(cè)量的目標(biāo)是被試的能力水平,測(cè)量的側(cè)面包括試題、評(píng)分者(考官),由所有這些測(cè)量條件構(gòu)成的總體即概化全域。然后考察在所有這些測(cè)量條件下可接受的觀測(cè)全域。不同的D研究設(shè)計(jì)將有不同的觀測(cè)全域。例如,使用不同數(shù)量的評(píng)分者,或使用不同數(shù)量的面試題。評(píng)估信度的指數(shù)即概化全域與觀測(cè)全域之比。有兩種指數(shù),一是概化系數(shù),另一是可靠性指數(shù)。在常模參照測(cè)驗(yàn)中,主要考慮概化系數(shù)。概化系數(shù)
為:其中,
為測(cè)量目標(biāo)的變異,構(gòu)成了概化全域;
為觀測(cè)全域。
為相對(duì)誤差的變異。相對(duì)誤差的變異等于所有與測(cè)量目標(biāo)(p)有關(guān)的交互效應(yīng)的總和。在非常模參照測(cè)驗(yàn)中,應(yīng)當(dāng)考慮可靠性指數(shù)??煽啃韵禂?shù)
為:
其中,
為全部誤差的變異,即隨機(jī)誤差與系統(tǒng)誤差的所有變異。單側(cè)面設(shè)計(jì)的概化理論所謂單側(cè)面設(shè)計(jì)指的是只有一個(gè)測(cè)量側(cè)面的設(shè)計(jì)。例如,10個(gè)被試做了20個(gè)題目的測(cè)驗(yàn),測(cè)量目標(biāo)即被試(p),測(cè)量側(cè)面則是題目(i)。只有題目這一個(gè)側(cè)面,即單側(cè)面設(shè)計(jì)。又如,1個(gè)評(píng)分者給20個(gè)被試評(píng)分,在這一設(shè)計(jì)中,也是只有評(píng)分者一個(gè)側(cè)面。如果測(cè)量目標(biāo)(p)與測(cè)量側(cè)面(i)每個(gè)水平都要一一對(duì)應(yīng)或結(jié)合,則這種設(shè)計(jì)稱之為交叉(cross)設(shè)計(jì),用符號(hào)×表示,即p×i。例如,所有的被試都要做所有的測(cè)驗(yàn)題目。如果不同的被試(p)做不同的題目(i),則這種設(shè)計(jì)稱之為嵌套(nest)設(shè)計(jì),用符號(hào)“:”表示,即i:p。即題目i嵌套于被試p中。如果測(cè)量目標(biāo)(p)是從總體中隨機(jī)抽取的,測(cè)量側(cè)面(i)也是從總體中隨機(jī)抽取的,則測(cè)量目標(biāo)(p)與測(cè)量側(cè)面(i)都是隨機(jī)設(shè)計(jì)。如果不是從總體中隨機(jī)抽取的,則為固定設(shè)計(jì)。單側(cè)面交叉設(shè)計(jì)(p×i)這一設(shè)計(jì)方案中測(cè)量目標(biāo)(p)與測(cè)量側(cè)面(i)是交叉的(p×i)(見(jiàn)圖11.5)。因此,有3個(gè)變異來(lái)源,3個(gè)變異要做估計(jì):即p、i、p×i。我們不妨通過(guò)一個(gè)實(shí)例來(lái)進(jìn)行討論。例如,10個(gè)被試每人都做同樣的8道題,這樣被試(p)與題目(i)是交叉的(p×i),如果被試是從一總體隨機(jī)選取的,測(cè)驗(yàn)題也是從一題庫(kù)隨機(jī)選取的。這便是一種隨機(jī)的單側(cè)面交叉設(shè)計(jì)。原始數(shù)據(jù)列在表11.4。我們可以編寫(xiě)GENOVA的程序單,在D研究中考慮采用8題、10題、20題和30題的測(cè)量條件。圖11.5單側(cè)面交叉設(shè)計(jì)圖示表11.410個(gè)被試做同樣8個(gè)題目的測(cè)驗(yàn)(p×i)被試I1I2I3I4I5I6I7I81232352752857251383422784534436364725855864536857246137645743618433232459322257211912332412表11.6單側(cè)面交叉設(shè)計(jì)(p×i)實(shí)例的方差分析SVSSdfMS方差分量被試(p)68.4597.60560.4730題目(i)22.7573.25000pi248.75633.82143.8214D研究估計(jì)了在測(cè)驗(yàn)題目為8題、10題、20題和30題的測(cè)量條件下的概化系數(shù)
與可靠性指數(shù)
(表11.7)。例如,在同樣是8道題的測(cè)量條件下,相對(duì)誤差的方差為3.8214/8=0.4777,期望觀測(cè)分?jǐn)?shù)=0.4730+0.4777=0.9507。而可靠性指數(shù)的期望觀測(cè)分?jǐn)?shù)=0.4730+0+0.4777=0.9507;在20道題的測(cè)量條件下,相對(duì)誤差的方差為3.8214/20=0.1911,期望觀測(cè)分?jǐn)?shù)=0.4730+0.1911=0.6641。而可靠性指數(shù)的期望觀測(cè)分?jǐn)?shù)同樣等于0.6641。表11.7單側(cè)面交叉設(shè)計(jì)(p×i)實(shí)例的概化系數(shù)與可靠性指數(shù)pi全域分?jǐn)?shù)期望觀測(cè)分?jǐn)?shù)概化系數(shù)可靠性指數(shù)1080.47300.95070.49760.497610100.47300.85820.55310.553110200.47300.66410.71230.712310300.47300.60040.78780.7878單側(cè)面嵌套設(shè)計(jì)(i:P)在這一設(shè)計(jì)中,測(cè)量側(cè)面(i)嵌套在測(cè)量目標(biāo)(p)中(i:p)(圖11.6)。因此,在這一設(shè)計(jì)中有2個(gè)變異來(lái)源,有2個(gè)變異分估計(jì),即p和i:p。由于i是嵌套在p中,所以沒(méi)有i的主效應(yīng)。我們?nèi)砸员?1.4中的數(shù)據(jù)為例,假設(shè)10個(gè)被試做不同的8道題,如此則題目嵌套進(jìn)被試中。表11.9單側(cè)面嵌套設(shè)計(jì)(I:P)實(shí)例的方差分析SVSSdfMS方差分量被試(p)68.4597.60560.4802i:p263.50703.76433.7643表11.10單側(cè)面嵌套設(shè)計(jì)(I:P)實(shí)例的概化系數(shù)與可靠性指數(shù)pi全域分?jǐn)?shù)期望觀測(cè)分?jǐn)?shù)概化系數(shù)可靠性指數(shù)1080.48020.95070.50510.505110100.48020.85650.56060.560610200.48020.66840.71840.718410300.48020.60560.79280.7928雙側(cè)面設(shè)計(jì)的概化理論所謂雙側(cè)面設(shè)計(jì)指的是有兩個(gè)測(cè)量側(cè)面的設(shè)計(jì)。假設(shè)被試能力水平為測(cè)量目標(biāo)(p),測(cè)驗(yàn)題目為一個(gè)測(cè)量側(cè)面(i),而這些題目被試回答后要評(píng)分者評(píng)分(r),這樣一來(lái),就有測(cè)驗(yàn)題目與評(píng)分者兩個(gè)測(cè)量側(cè)面,這樣的設(shè)計(jì)就是雙側(cè)面設(shè)計(jì)。雙側(cè)面是交叉還是嵌套的,是隨機(jī)還是固定的,導(dǎo)致了雙側(cè)面設(shè)計(jì)的復(fù)雜性。其中有一條原則,除非是固定的側(cè)面,隨機(jī)的側(cè)面不能與被試交叉或嵌套,因?yàn)檫@樣沒(méi)有意義。雙側(cè)面交叉設(shè)計(jì)p×i×r這一設(shè)計(jì)方案中測(cè)量目標(biāo)(p)與測(cè)量側(cè)面(i)和(r)是交叉的(p×i×r)(見(jiàn)圖11.7)。因此,將有7個(gè)變異來(lái)源,7個(gè)變異要做估計(jì):即p、i、r、pi、pr、ir、pir。假設(shè)10個(gè)被試每人要做3道題,3道題由3位評(píng)分者評(píng)分。原始數(shù)據(jù)見(jiàn)表11.14。表11.14雙側(cè)面交叉設(shè)計(jì)的原始數(shù)據(jù)被試r1r2r3i1i2i3i1i2i3i1i2i318757855952744122464385535176544615436815835861865664336077377646766848734372564986556248510441343291表11.16雙側(cè)面交叉設(shè)計(jì)(p×i×r)
實(shí)例的方差分析SVSSdfMS方差分量p88.666798.96300.7025r28.0889214.04440.1167i115.6222257.81111.5624pr36.8000182.04440.0667pi43.9333182.44070.1988ri41.3778410.34440.8500pri66.4000361.84441.8444D研究中考慮兩種情況,一是當(dāng)題目是3題時(shí),評(píng)分者3、4、5個(gè)時(shí);二是當(dāng)評(píng)分者是3人時(shí),題目為3、10、20時(shí)。表11.17和表11.18說(shuō)明,當(dāng)題目增加到10、20時(shí),概化系數(shù)由3題時(shí)的0.7054,增加到0.8715,0.9178。而增加評(píng)分者沒(méi)有太大的變化。表11.17雙側(cè)面交叉設(shè)計(jì)(p×i×r)實(shí)例的概化系數(shù)與可靠性指數(shù)(1)pri全域分?jǐn)?shù)期望觀測(cè)分?jǐn)?shù)概化系數(shù)可靠性指數(shù)10330.70250.99590.70540.4257103100.70250.80610.87150.6823103200.70250.76540.91780.7835表11.17雙側(cè)面交叉設(shè)計(jì)(p×i×r)實(shí)例的概化系數(shù)與可靠性指數(shù)(2)pri全域分?jǐn)?shù)期望觀測(cè)分?jǐn)?shù)概化系數(shù)可靠性指數(shù)10330.70250.99590.70540.425710430.70250.93910.74800.682310530.70250.90500.77620.7835雙側(cè)面嵌套設(shè)計(jì)p×(i:r)這一設(shè)計(jì)方案中測(cè)量側(cè)面(i)是嵌套到測(cè)量側(cè)面(r)中的,并且與測(cè)量目標(biāo)(p)交叉,即p×(i:r)(見(jiàn)圖11.8)。因此,有5個(gè)變異來(lái)源,5個(gè)變異要做估計(jì):即p、r、pr、pi:r、i:r。如果表11.14中的數(shù)據(jù)是嵌套設(shè)計(jì)的話,那就是3位評(píng)分者要評(píng)各自不同的3題。表11.19雙側(cè)面嵌套設(shè)計(jì)的數(shù)據(jù)被試r1r2r3i1i2i3i4i5i6i7i8i918757855952744122464385535176544615436815835861865664336077377646766848734372564986556248510441343291表11.16雙側(cè)面嵌套設(shè)計(jì)p×(i:r)
實(shí)例的方差分析SVSSdfMS方差分量p88.666798.96300.7687r28.0889214.04440i:r157.0000626.16672.4124pr36.8000182.04440.0004Pi:r110.3333542.04322.0432表11.17雙側(cè)面嵌套設(shè)計(jì)p×(i:r)實(shí)例的概化系數(shù)與可靠性指數(shù)(1)pri全域分?jǐn)?shù)期望觀測(cè)分?jǐn)?shù)概化系數(shù)可靠性指數(shù)10340.76870.93910.81860.674210350.76870.90510.84940.7212103100.76870.83700.91850.8380pri全域分?jǐn)?shù)期望觀測(cè)分?jǐn)?shù)概化系數(shù)可靠性指數(shù)10540.76870.87100.88260.775310550.76870.85050.90380.8117105100.76870.80970.94940.8960多元概化理論一元概化理論討論只有一個(gè)測(cè)量目標(biāo)和全域分?jǐn)?shù)的設(shè)計(jì),而多元概化理論討論不只一個(gè)測(cè)量目標(biāo)和全域分?jǐn)?shù),而是有兩個(gè)以上測(cè)量目標(biāo)和全域分?jǐn)?shù)的設(shè)計(jì)。在心理測(cè)量等領(lǐng)域,往往要評(píng)價(jià)被試的多個(gè)能力、特質(zhì)和水平。例如明尼蘇達(dá)多相人格調(diào)查(MMPI)就要用10個(gè)臨床量表(實(shí)際上在今天MMPI已經(jīng)發(fā)展到了約800個(gè)分量表)去評(píng)價(jià)被試的10個(gè)方面的人格特征與臨床障礙表現(xiàn)。加利福尼亞心理調(diào)查表(CPI)則要用23個(gè)分量表,評(píng)價(jià)被試的23種人格。這樣多元的測(cè)量信度問(wèn)題,一元概化理論不能妥善解決,只有運(yùn)用多元概化理論才能得到解決。我們編制的《應(yīng)對(duì)效能問(wèn)卷》共有17題,克倫巴赫α系數(shù)為0.86,分半信度0.79。相隔兩個(gè)月63個(gè)被試的重測(cè)信度為0.71(童輝杰,2005)。問(wèn)卷有3個(gè)分量表,即勝任力、自信程度和認(rèn)知水平。進(jìn)行多元概化分析,1836個(gè)被試,3個(gè)分量表的題量分別是:勝任力3個(gè)、自信程度9個(gè),認(rèn)知水平5個(gè),是p×i設(shè)計(jì)。計(jì)算的結(jié)果:整個(gè)問(wèn)卷的全域總分的概化系數(shù)是0.8121,可靠性系數(shù)是0.8075。見(jiàn)表11.19-20。如果考慮進(jìn)一步改良這一問(wèn)卷,我們還可以來(lái)看看3個(gè)分量表如何增加題目并且提高相應(yīng)的信度。表11.19《應(yīng)對(duì)效能問(wèn)卷》G研究的方差協(xié)方差效應(yīng)勝任力自信程度認(rèn)知水平p1.307350.356800.183710.114182.115030.463220.058080.107551.14691i1.75236252.1038669.23682pi0.500770.446760.34216注:對(duì)角線是方差,對(duì)角線下面是協(xié)方差,上面是相關(guān)系數(shù)。表11.20應(yīng)對(duì)效能問(wèn)卷多元概化理論分析的指數(shù)勝任力
自信程度
認(rèn)知水平全域分?jǐn)?shù)方差(ScoreVar)相對(duì)誤差方差(RelErrorVar)絕對(duì)誤差方差(AbsErrorVar)0.268860.185360.160950.166920.049640.068430.167150.064870.07594概化系數(shù)(GenCoefficient)可靠性系數(shù)(Phi)0.616960.788770.701670.616640.740760.67944全域總分方差分量(CompositeUniverseScoreVariance)全域總分相對(duì)誤差分量(CompositeRelativeErrorVariance)全域總分絕對(duì)誤差分量(CompositeAbsoluteErrorVariance)全域總分的概化系數(shù)(CompositeGeneralizabilityCoefficient)全域總分的可靠性系數(shù)(CompositePhi)0.135110.025030.029960.843690.81852表11.21《應(yīng)對(duì)效能問(wèn)卷》D研究
不同題目量的測(cè)量信度估計(jì)勝任力自信程度認(rèn)知水平總分題目量395概化系數(shù)0.616960.788770.701670.84369可靠性系數(shù)0.616640.740760.679440.81852題目量101510概化系數(shù)0.842990.861560.824680.91497可靠性系數(shù)0.842810.826460.809130.90261題目量152015概化系數(shù)0.889540.892450.875870.93863可靠性系數(shù)0.889410.863940.864100.92986題目量202520概化系數(shù)0.914810.912070.903920.95201可靠性系數(shù)0.914700.888110.894490.94522在表11.21中,可以看到雖然該問(wèn)卷的測(cè)量信度是可以接受的,但是,勝任力與認(rèn)知水平分量表如果能增加10題的題量時(shí)信度更高??偟目磥?lái),各個(gè)分量表的題量要在20多題時(shí),測(cè)量信度更理想。不妨再來(lái)看看另一個(gè)著名的人格測(cè)驗(yàn)《艾森克人格問(wèn)卷》(EPQ)的測(cè)量信度。mGENOVA軟件的程序清單見(jiàn)表11.25,使用83個(gè)大學(xué)生被試,結(jié)果是4個(gè)分量表的全域總分的概化系數(shù)是0.48025,可靠性系數(shù)是0.42254。總的信度之所以低,可能是因?yàn)榉至勘鞵和L信度較低。這2個(gè)分量表的概化系數(shù)只有0.4-0.5左右,而N、E量表則有0.8多。見(jiàn)表11.26。表11.26EPQ多元概化理論分析的指數(shù)P分E分N分L分全域分?jǐn)?shù)方差相對(duì)誤差方差絕對(duì)誤差方差0.003960.045540.031910.009440.005540.008630.007660.008260.007330.009810.009140.01196概化系數(shù)可靠性系數(shù)0.416630.840650.806370.533200.350440.822750.777370.44098全域總分方差分量全域總分相對(duì)誤差分量全域總分絕對(duì)誤差分量全域總分的概化系數(shù)全域總分的可靠性系數(shù)0.001720.001870.002360.480250.42254表11.27EPQ的D研究
(不同題目量的測(cè)量信度估計(jì))PENL題目量28262925概化系數(shù)0.465080.867230.834220.58810可靠性系數(shù)0.396430.851790.808400.49649題目量33313430概化系數(shù)0.506100.886200.855070.63145可靠性系數(shù)0.436330.872650.831840.54197題目量43414440概化系數(shù)0.571770.911500.884190.69554可靠性系數(shù)0.502160.900620.864890.61206在表11.27中,可以看到當(dāng)各個(gè)分量表在增加5題、再加5題、再加10題的情況下概化系數(shù)和可靠性系數(shù)的變化??梢?jiàn)P量表和L量表要增加10題以上的題量才有可能改善測(cè)量信度。四.結(jié)構(gòu)方程建模結(jié)構(gòu)方程建模(StructuralEquationModeling,SEM)是心理測(cè)量學(xué)與計(jì)量經(jīng)濟(jì)學(xué)等學(xué)科研究方法結(jié)合的結(jié)晶。最早的研究在20世紀(jì)60年代出現(xiàn),90年代得到很快發(fā)展。其發(fā)展在近年來(lái)愈來(lái)愈倍受關(guān)注,廣泛應(yīng)用于心理學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)等領(lǐng)域,并代表了統(tǒng)計(jì)學(xué)和心理測(cè)量學(xué)的一種嶄新的發(fā)展方向。安娜斯塔西認(rèn)為這是“理論、實(shí)驗(yàn)、統(tǒng)計(jì)三結(jié)合的一種有前途的方法(安娜斯塔西,2001,p174)”,克利弗則稱結(jié)構(gòu)方程建模是一場(chǎng)“統(tǒng)計(jì)的革命”(Cliff,1983)。結(jié)構(gòu)方程模型的概念在結(jié)構(gòu)方程建模中,首先要計(jì)算出樣本變量的協(xié)方差矩陣;并根據(jù)理論模型的假設(shè)進(jìn)一步估計(jì)出一個(gè)引申的協(xié)方差矩陣。所以,協(xié)方差矩陣是一個(gè)核心概念。例如,假設(shè)a,b,c三個(gè)變量的樣本協(xié)方差矩陣S為:在這個(gè)協(xié)方差矩陣中,只有對(duì)角線上是方差。協(xié)方差是兩個(gè)變量的線性關(guān)系。協(xié)方差是兩個(gè)變量的線性關(guān)系,公式為:協(xié)方差與相關(guān)系數(shù)的關(guān)系表現(xiàn)在:協(xié)方差等于兩個(gè)變量的相關(guān)系數(shù)乘兩個(gè)變量的標(biāo)準(zhǔn)差:
由于結(jié)構(gòu)方程建模主要是一種驗(yàn)證性的技術(shù),所以首先要根據(jù)理論與以前的研究預(yù)先設(shè)立一個(gè)初始的模型。一般是用路徑圖(pathdiagram)將初始模型畫(huà)出來(lái)。路徑圖應(yīng)當(dāng)遵循的規(guī)定是,方型和矩形表示觀測(cè)變量;圓型和橢圓型表示潛變量。變量之間的關(guān)系用連線表示,沒(méi)有連線表示沒(méi)有直接聯(lián)系。單箭頭表示兩個(gè)變量之間存在因果關(guān)系,箭頭從原因變量指向結(jié)果變量;雙箭頭表示兩個(gè)變量之間有相關(guān)或雙向的關(guān)系。在潛變量中,又有兩種區(qū)分。一是外生或外源潛變量(exogenouslatentvariable),其影響因素在模型之外,即ξ變量;另一是內(nèi)生或內(nèi)源潛變量(endogenouslatentvariable),其影響因素在模型之內(nèi),即η變量。λ(Lambda
)x和λy是因子負(fù)荷系數(shù),β和γ(Gamma)是路徑系數(shù)。δ(Delta
)和ε(Epsilon
)分別是觀測(cè)變量x和y的測(cè)量誤差。ζ(Zeta)為潛變量的測(cè)量誤差。Φ(Fai)是外源潛變量的方差協(xié)方差。一般結(jié)構(gòu)方程由三個(gè)矩陣方程表達(dá):η=Bη+Γξ+ζy=Λyη+εx=Λxξ+δ總共有8個(gè)參數(shù)矩陣要估計(jì)。即:B、Γ、Λy、Λx、Ф、Ψ、Θδ、Θε。B和Γ是結(jié)構(gòu)路徑系數(shù)矩陣,Λy和Λx是因子負(fù)荷矩陣,Ф是外源潛變量的方差協(xié)方差矩陣,Ψ是結(jié)構(gòu)方程殘差ζ的方差協(xié)方差矩陣,Θδ和Θε是觀測(cè)變量誤差方差協(xié)方差矩陣。η(eta);Γγ(Gamma);ξ(gzai);ζ(Zeta);Λ(Lambda);ε(Epsilon);δ(Delta)Φ(Fai);Ψ(psai)結(jié)構(gòu)方程模型:包括測(cè)量模型(因子模型),結(jié)構(gòu)模型(回歸模型)。假設(shè):
a.測(cè)量模型誤差項(xiàng)均值為0;
b.結(jié)構(gòu)模型誤差項(xiàng)均值為0;
c.誤差項(xiàng)與因子不相關(guān);
d.二模型的誤差項(xiàng)不相關(guān)。結(jié)構(gòu)方程建模的優(yōu)勢(shì)對(duì)潛變量和測(cè)量誤差的估計(jì)因素分析的優(yōu)點(diǎn)驗(yàn)證的功能AMOS的操作步驟(1)建構(gòu)初始模型(2)讀取數(shù)據(jù)(3)執(zhí)行分析(設(shè)置output)(4)比較模型,同一數(shù)據(jù)可固定誤差方差,比較二者相減后的2、df是否顯著。模型輸出的結(jié)果未標(biāo)準(zhǔn)化的系數(shù)標(biāo)準(zhǔn)化的系數(shù)
模型的識(shí)別與估計(jì)模型的識(shí)別指判斷模型中每一個(gè)自由參數(shù)能不能由觀測(cè)數(shù)據(jù)求得唯一解。一個(gè)自由參數(shù)不能以樣本方差協(xié)方差的代數(shù)函數(shù)來(lái)表達(dá),就不能識(shí)別。不能識(shí)別的模型中至少有一個(gè)不能識(shí)別的參數(shù)。模型不能識(shí)別,則所有的參數(shù)都不能估計(jì)。如果一個(gè)自由參數(shù)至少可以由觀測(cè)變量的方差協(xié)方差矩陣的一個(gè)功多個(gè)元素的代數(shù)函數(shù)來(lái)表達(dá),這個(gè)參數(shù)就是可識(shí)別的。參數(shù)可由一個(gè)以上不同函數(shù)表達(dá),這個(gè)參數(shù)就是過(guò)度識(shí)別的。識(shí)別模型有兩種:過(guò)度識(shí)別模型(overidentifiedmodel)。當(dāng)一個(gè)模型中每個(gè)參數(shù)都是識(shí)別的并且至少有一個(gè)參數(shù)是過(guò)度識(shí)別的,這個(gè)模型就是過(guò)度識(shí)別模型。實(shí)際上在建模中受重視的是過(guò)度識(shí)別模型。在這種模型中,自由參數(shù)數(shù)目少于觀測(cè)變量中方差協(xié)方差的總數(shù)。觀測(cè)變量中方差協(xié)方差的總數(shù)等于(p+q)(p+q+1)/2。P為觀測(cè)變量中y的數(shù)目;q為觀測(cè)變量x的數(shù)目。除2表示只考慮對(duì)角線上一半的協(xié)方差。自由參數(shù)指因子負(fù)荷、路徑系數(shù)、潛變量和誤差的方差、潛變量之間與誤差之間的協(xié)方差的總數(shù)。恰好識(shí)別模型(just-identifiedmodel)。當(dāng)一個(gè)模型中每個(gè)參數(shù)都是識(shí)別的,并且沒(méi)有一個(gè)參數(shù)是過(guò)度識(shí)別的,這個(gè)模型就是恰好識(shí)別的。由于恰好識(shí)別模型完全擬合觀測(cè)數(shù)據(jù),卡方值和自由度永遠(yuǎn)為0,自由參數(shù)數(shù)目等于觀測(cè)變量中方差協(xié)方差的總數(shù),所以無(wú)法檢驗(yàn)擬合優(yōu)度。解決模型不識(shí)別的問(wèn)題有幾種辦法。其一,盡量減少自由參數(shù),增加觀測(cè)變量中方差協(xié)方差的數(shù)目。其二,固定一些參數(shù)。如將某潛變量的某因子負(fù)荷設(shè)定為1,或?qū)⒃摑撟兞康姆讲钤O(shè)定為1;或?qū)⒛陈窂较禂?shù)設(shè)定為0(表示無(wú)影響)。其三,限制參數(shù)。將一些參數(shù)設(shè)定為相等,如將兩個(gè)在以前的研究中表明相同的潛變量的路徑系數(shù)設(shè)定為相等。這些做法可以減少自由參數(shù)的數(shù)目,從而可能使模型識(shí)別。模型的估計(jì)是根據(jù)樣本的數(shù)據(jù)推導(dǎo)出一個(gè)引申的(implied)方差協(xié)方差矩陣∑,使其中每一元素都盡可能接近樣本中觀測(cè)變量的方差協(xié)方差的相應(yīng)元素。如果∑非常接近S,說(shuō)明模型正確。常用的估計(jì)方法是最大似然法(maximumlikehood,ML)和廣義最小二乘法(generalizedleastsquares,GLS)。此二法的前提是,觀測(cè)變量須為連續(xù)變量,具有多元正態(tài)分布。如果不是連續(xù)變量,或偏態(tài),會(huì)導(dǎo)致很差的估計(jì)、不正確的標(biāo)準(zhǔn)誤、以及偏高的卡方值。識(shí)別的法則:t-法則:t≤(p+q)(p+q+1)/2兩步法則:先看測(cè)量模型是否可識(shí)別,再看結(jié)構(gòu)模型是否識(shí)別。模型的參數(shù)估計(jì)模型的估計(jì)是根據(jù)樣本的數(shù)據(jù)推導(dǎo)出一個(gè)引申的(implied)方差協(xié)方差矩陣∑,使其中每一元素都盡可能接近樣本中觀測(cè)變量的方差協(xié)方差的相應(yīng)元素S。如果∑非常接近S,說(shuō)明模型正確。以AMOS軟件為例,有5種參數(shù)估計(jì)的方法,茲列于表11.30。常用的估計(jì)方法是最大似然法(maximumlikehood,ML)和廣義最小二乘法(generalizedleastsquares,GLS)。樣本大(如500以上),觀測(cè)變量須為連續(xù)變量,具有多元正態(tài)分布,適合用最大似然法(ML)。但是如果不是連續(xù)變量,或偏態(tài),會(huì)導(dǎo)致很差的估計(jì)、不正確的標(biāo)準(zhǔn)誤、以及偏高的卡方值。樣本大(比ML小時(shí),如500以下估計(jì)效果比ML佳),觀測(cè)變量不符合多元正態(tài)分布的假設(shè),則適合用廣義最小二乘法(GLS)。此外,如未加權(quán)最小二乘法(unweightedleastsquares,ULS),適合觀測(cè)變量不符合多元正態(tài)分布的假設(shè)的情況使用。當(dāng)所有觀測(cè)變量的單位相同時(shí),ULS估計(jì)效果最好。自由尺度最小二乘法(Scale-freeleastsquares,SFLS),當(dāng)觀測(cè)變量不符合多元正態(tài)分布的假設(shè)時(shí)使用。漸近分配自由法(Asymptoticallydistribution-free,ADF),也是當(dāng)觀測(cè)變量不符合多元正態(tài)分布的假設(shè)時(shí)使用,但是要大樣本(2500以上)。小樣本的情況下,有兩種方法可以使用。其一是利用AMOS提供的適合小樣本的貝葉斯估計(jì)(Bayesianestimation)。具體操作方法是首先從分析屬性(Analysisproperties)選取“Estimatemeansandintercepts”,然后再在菜單的Analyze選擇BayesianEstimation,便可開(kāi)啟“BayesianSEM”對(duì)話框,執(zhí)行計(jì)算程序(吳明隆,2008,p45)。其二是使用Yuan和Bentler發(fā)展的T統(tǒng)計(jì)量。Yuan和Bentler發(fā)現(xiàn),通過(guò)修正漸近分配自由法(Asymptoticallydistribution-free,ADF),當(dāng)樣本規(guī)模為60-120時(shí),也可以得到穩(wěn)定的估計(jì)結(jié)果(Bentler&Yuan,1999)。表11.30AMOS軟件中5種參數(shù)估計(jì)方法參數(shù)估計(jì)方法適用的情況最大似然法(maximumlikehood,ML)樣本大(500以上),觀測(cè)變量須為連續(xù)變量,具有多元正態(tài)分布廣義最小二乘法(generalizedleastsquares,GLS)樣本可以比ML?。ㄈ?00以下),觀測(cè)變量不符合多元正態(tài)分布的假設(shè)未加權(quán)最小二乘法(unweightedleastsquares,ULS)觀測(cè)變量不符合多元正態(tài)分布的假設(shè)。所有觀測(cè)變量的單位相同時(shí),效果最好。自由尺度最小二乘法(Scale-freeleastsquares,SFLS)觀測(cè)變量不符合多元正態(tài)分布的假設(shè)。漸近分配自由法(Asymptoticallydistribution-free,ADF)觀測(cè)變量不符合多元正態(tài)分布的假設(shè)。但是要大樣本(2500以上)。樣本容量問(wèn)題最起碼樣本量要大于100;如果用最大似然法(ML),則最起碼要大于200。人數(shù)/變量數(shù)>10~15;人數(shù)10倍或15倍于變量。人數(shù)是自由參數(shù)的5倍以上。模型的評(píng)價(jià)模型的評(píng)價(jià)實(shí)際上包括兩方面,一方面是對(duì)模型的擬合情況進(jìn)行檢驗(yàn)與評(píng)價(jià),檢驗(yàn)?zāi)P褪欠衲軌驍M合樣本數(shù)據(jù),要運(yùn)用很多擬合指數(shù)來(lái)做判斷;另一方面是對(duì)模型內(nèi)部的系數(shù)進(jìn)行評(píng)價(jià)。下面對(duì)兩方面的評(píng)價(jià)分述之。擬合指數(shù)一、絕對(duì)擬合指數(shù)A.基于擬合函數(shù)(Fitfuncation)的指數(shù)(受樣本量影響,樣本量大時(shí)導(dǎo)致顯著而誤判;參數(shù)過(guò)多時(shí)可能容易接受錯(cuò)誤模型)a、2;樣本矩陣S→再生矩陣∑愈相同,2愈小,擬合愈好。擬合優(yōu)度的卡方值為擬合函數(shù)值與樣本規(guī)模減1的乘積。公式為:X2=(n-1)F;其中F是擬合函數(shù)。在此,與傳統(tǒng)的統(tǒng)計(jì)檢驗(yàn)相反,卡方值愈小,說(shuō)明擬合愈好。由于卡方值與樣本規(guī)模有關(guān),即(n–1)乘以擬合函數(shù)F,所以,樣本愈大,卡方值就愈大。這樣,就有可能當(dāng)引申的方差協(xié)方差矩陣與觀測(cè)的方差協(xié)方差矩陣之間差別不大時(shí),由于樣本規(guī)模增加而拒絕一個(gè)模型。b.df;df=元素個(gè)數(shù)(變量p(p+1)/2)-要估計(jì)的參數(shù)
c.P;
d.2/df;(2以下:擬合好;2-5,可接受)B、基于離中參數(shù)(NCP=2-df)的指數(shù)(要可減少樣本量的影響)
a.DK=(2-df)(N-1)此值愈小愈好。
b.PDK同上。
c.Mc=exp[-DK/2]=exp|-(2-df)/[2(N-1)](基本不受樣本影響,大于0.85模型擬合好)C、近似誤差指數(shù)
RMR(殘差均方根);下限為0,無(wú)上限;SRMR(標(biāo)準(zhǔn)化殘差均方根);小于0.08模型可以接受。RMSEA(近似誤差均方根,rootmeanerrorofapproximation);受樣本影響不大,是較為理想的指數(shù)。低于0.05模型擬合非常好;低于0.01模型擬合極其出色;低于0.1可以接受。D、擬合優(yōu)度指數(shù)(GFI和AGFI可能會(huì)較高;有*號(hào)的指數(shù)更好)GFI;擬合優(yōu)度指數(shù)(goodness-of-fitindex,GFI):GFI=1–F[S,∑(Θ)]/[S,∑(0)];GFI考察觀測(cè)變量的方差協(xié)方差矩陣S與引申的方差協(xié)方差矩陣的匹配,如果∑=S,則GFI=1,說(shuō)明模型完全擬合。一般0.9以上說(shuō)明模型擬合。GFI*;AGFI;調(diào)整的擬合優(yōu)度指數(shù)(adjustedgoodness-of-fitindex,AGFI):AGFI=1–[[(p+q)(p+q+1)/2]/df](1-GFI);該指數(shù)通過(guò)參數(shù)估計(jì)的總數(shù)進(jìn)行調(diào)整。估計(jì)的參數(shù)比觀測(cè)數(shù)據(jù)的方差協(xié)方差總數(shù)越少,AGFI越接近GFI。GFI和AGFI都不是對(duì)模型擬合度作正常的統(tǒng)計(jì)檢驗(yàn),只是模型是否適當(dāng)?shù)闹笜?biāo)。0.9以上說(shuō)明模型擬合觀測(cè)數(shù)據(jù)AGFI*;E、信息指數(shù)(指數(shù)愈小,模型擬合愈好。對(duì)某個(gè)樣本,比較多個(gè)模型,找出參數(shù)比較穩(wěn)定的模型。)ECVI;用單樣本計(jì)算交互效度指數(shù)。AIC;比較不同模型擬合同一樣本的數(shù)據(jù),依優(yōu)劣排序。SC;反映模型的復(fù)雜程度。CK;反映模型的復(fù)雜程度。
二、相對(duì)擬合指數(shù)NNFI;會(huì)超出0-1范圍,0.9以上擬合好,推薦使用。NFI;受N影響,N小時(shí),低估擬合度。規(guī)范擬合指數(shù)(normedfitindex,NFI):NFI=(X2indep–X2model)/X2indep;NFI考察設(shè)定模型的卡方值與獨(dú)立模型的卡方值相比的縮小比例,從而可以看到設(shè)定模型在擬合上的改善。RNI,取值可超出0-1范圍。CFI;使RNI取值在0-1范圍,不受N影響,敏感反映模型誤設(shè)。三、簡(jiǎn)約擬合指數(shù)(懲罰參數(shù)多的模型,用省儉比dft(理論模型df)/dfn(虛模a型df)乘擬合指數(shù)如GFI、NFI等。高則簡(jiǎn)約)PRNI;PGFI;PNFI;PGFI;非遞歸模型會(huì)計(jì)算穩(wěn)定性指數(shù)(-1—1之間穩(wěn)定,超出不穩(wěn)定。)模型內(nèi)部系數(shù)的評(píng)價(jià)一個(gè)模型如果擬合指數(shù)都比較理想的話,接下來(lái)就應(yīng)該考察這個(gè)模型內(nèi)部的系數(shù)究竟怎樣。一般從下面幾個(gè)方面去評(píng)價(jià):1.因素負(fù)荷水平有多高。一般認(rèn)為,因素負(fù)荷水平0.32以下屬于差,0.32為不好,0.45為一般,0.55為好,0.63為很好,0.71為優(yōu)秀(邱晧政,林碧芳,2009,p101)。以0.55為臨界值,因?yàn)檫@樣可以解釋30%的變異(0.552)。2.變量的決定系數(shù)有多高。決定系數(shù)R2應(yīng)當(dāng)大于0.5。3.組合信度有多高。潛變量的組合信度類似于內(nèi)部一致性系數(shù),應(yīng)當(dāng)大于0.6為宜。組合信度的計(jì)算公式為:式中,為因素負(fù)荷的總和,為各觀測(cè)變量殘差方差的總和。如果殘差間有相關(guān)時(shí),則要加入殘差相關(guān)的計(jì)算。
4.潛變量平均變異抽取量多高。潛變量平均變異抽取量反映潛變量被一組觀測(cè)變量有效估計(jì)的聚斂程度(邱晧政,林碧芳,2009,p105;吳明隆,2008,p92)。大于0.5為臨界值。表11.33模型內(nèi)部評(píng)價(jià)指標(biāo)與標(biāo)準(zhǔn)模型內(nèi)評(píng)價(jià)指標(biāo)評(píng)價(jià)標(biāo)準(zhǔn)因素負(fù)荷水平>0.55變量決定系數(shù)>0.5潛變量組合信度>0.6潛變量平均變異抽取量>0.5模型的檢驗(yàn)與修正1.首先應(yīng)當(dāng)認(rèn)真檢查參數(shù)是否恰當(dāng),是否違反估計(jì)的規(guī)則??赡苡羞@樣6種錯(cuò)誤,如果出現(xiàn)這些錯(cuò)誤,則可能模型設(shè)置、模型識(shí)別、數(shù)據(jù)中存在問(wèn)題,必須加以解決后才能去檢驗(yàn)擬合指數(shù)。(1)方差或標(biāo)準(zhǔn)誤出現(xiàn)負(fù)值,應(yīng)當(dāng)修正。(2)標(biāo)準(zhǔn)化系數(shù)或估計(jì)值、相關(guān)系數(shù)或決定系數(shù)大于1。(3)協(xié)方差矩陣不是正定矩陣,AMOS報(bào)告警告信息。(4)太大或太小的標(biāo)準(zhǔn)誤。
(5)參數(shù)的臨界值CR不顯著,可以考慮剔除。在output中選擇“C.R.fordifferences”。如果表中兩參數(shù)小于1.96,表明二者相同,可通過(guò)用相同的標(biāo)識(shí)限定為相同參數(shù)。(6)檢驗(yàn)決定系數(shù)R2,低則考慮剔除。(7)標(biāo)準(zhǔn)化殘差的絕對(duì)值大于2.58。2.檢驗(yàn)擬合指數(shù),調(diào)整模型。(1)減少自由參數(shù)(對(duì)不顯著的參數(shù),固定其值為0);(2)增加自由參數(shù)(根據(jù)MI)。不過(guò)在減少2的同時(shí)會(huì)使模型更加復(fù)雜;(3)變動(dòng)自由參數(shù)。
(4)對(duì)測(cè)量模型部分,考慮增減因子負(fù)荷、增減因子之間的協(xié)方差、增減誤差之間的協(xié)方差。但是不能“胡亂”相關(guān)。
(5)對(duì)結(jié)構(gòu)模型部分,考慮增減內(nèi)生變量、增減外生變量、增減路徑系數(shù)、修正誤差的協(xié)方差。關(guān)于交叉效度的問(wèn)題由于結(jié)構(gòu)方程模型是驗(yàn)證性研究,所以對(duì)交叉效度很重視。這就是說(shuō),檢驗(yàn)?zāi)P偷暮侠硇裕荒堋白哉f(shuō)自話”,用同樣的樣本說(shuō)話。有兩種情況要考慮,一是在同樣的總體內(nèi)檢驗(yàn)?zāi)P偷男Ф?,如果樣本量大的話,可以將樣本劈半進(jìn)行交叉檢驗(yàn)。我們常見(jiàn)的驗(yàn)證性因素分析常常這樣做。另一種情況是在不同的總體內(nèi)檢驗(yàn)?zāi)P偷目鐦颖拘Ф?,這時(shí)必須重新從另外一個(gè)總體抽取樣本進(jìn)行比較,才能檢驗(yàn)交叉效度。關(guān)于驗(yàn)證性因素分析關(guān)于驗(yàn)證性因素分析,以下幾點(diǎn)內(nèi)容是要注意的。首先,驗(yàn)證性因素有以下幾個(gè)假設(shè):1.誤差項(xiàng)的均值為0;2.誤差項(xiàng)與因子不相關(guān);3.誤差項(xiàng)不相關(guān)(非必須的)。3.三變量法則:(1)每個(gè)因子至少有三個(gè)觀測(cè)變量;(2)每個(gè)觀測(cè)變量只測(cè)量一個(gè)潛變量;(3)誤差之間不相關(guān)。4.二變量法則:(1)每個(gè)因子至少有二個(gè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)家樂(lè)旅游餐飲服務(wù)承包合同5篇
- 二零二五年度不銹鋼欄桿工程節(jié)能設(shè)計(jì)與施工合同2篇
- 2025年度車(chē)輛事故修復(fù)后保養(yǎng)與性能恢復(fù)合同4篇
- 2025年度企業(yè)員工打架事件預(yù)防與干預(yù)協(xié)議書(shū)3篇
- 二零二五年度寵物寄養(yǎng)服務(wù)合同寵物領(lǐng)養(yǎng)與救助合作3篇
- 2025住建部下發(fā)新的合同文本
- 2025年度個(gè)人與公司租賃合同租賃物轉(zhuǎn)租及轉(zhuǎn)借限制3篇
- 二零二五年度環(huán)保型托盤(pán)租賃與可持續(xù)發(fā)展協(xié)議2篇
- 2025年度電梯行業(yè)市場(chǎng)調(diào)研與咨詢服務(wù)合同7篇
- 二零二四年度壓力鍋銷售返利及獎(jiǎng)勵(lì)合同3篇
- 道路瀝青工程施工方案
- 2025年度正規(guī)離婚協(xié)議書(shū)電子版下載服務(wù)
- 《田口方法的導(dǎo)入》課件
- 春節(jié)后安全生產(chǎn)開(kāi)工第一課
- 內(nèi)陸?zhàn)B殖與水產(chǎn)品市場(chǎng)營(yíng)銷策略考核試卷
- 電力電纜工程施工組織設(shè)計(jì)
- 醫(yī)生給病人免責(zé)協(xié)議書(shū)(2篇)
- 票據(jù)業(yè)務(wù)居間合同模板
- 承包鋼板水泥庫(kù)合同范本(2篇)
- 鋰離子電池健康評(píng)估及剩余使用壽命預(yù)測(cè)方法研究
- 體育文化園賽馬場(chǎng)項(xiàng)目概念規(guī)劃設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論