10-15課張文彤老師spss講義_第1頁
10-15課張文彤老師spss講義_第2頁
10-15課張文彤老師spss講義_第3頁
10-15課張文彤老師spss講義_第4頁
10-15課張文彤老師spss講義_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

SPSS系列培訓之:

均數(shù)間的比較--t檢驗@文彤老師均數(shù)間的比較假設檢驗原理入門單樣本t檢驗兩樣本t檢驗配對t檢驗SPSS統(tǒng)計分析系列培訓2分析前的準備工作運用統(tǒng)計知識根據(jù)研究設計和資料的性質(zhì)正確選擇分析過程。初步的統(tǒng)計描述〔集中趨勢、離散趨勢〕和統(tǒng)計分析〔資料的正態(tài)性、方差齊性〕。Descriptivestatistics菜單CompareMeansmeansSPSS統(tǒng)計分析系列培訓3連續(xù)性變量統(tǒng)計描述的常見指標集中趨勢均數(shù)P50離散趨勢標準差/方差四分位數(shù)間距分布特征異常值及其他SPSS統(tǒng)計分析系列培訓4假設檢驗原理入門為什么要做檢驗通過獲得隨機樣本來實施抽樣研究的例子很多,但此時研究中直接獲取的只是樣本的情況,而研究者關心的并不僅僅是樣本,更希望了解相應的總體特征。參數(shù)估計:推估樣本所在的總體特征假設檢驗:對提出的一些總體假設進行分析判斷,做出統(tǒng)計決策。SPSS統(tǒng)計分析系列培訓6假設檢驗原理分析實例某產(chǎn)品的口味測試中,歷史數(shù)據(jù)說明滿意度均數(shù)如果低于7.4分,那么該產(chǎn)品根本無市場價值〔可近似認為7.4分是總體均數(shù)〕,現(xiàn)有新產(chǎn)品進行了30例樣本的測試,滿意度均數(shù)為6.8,標準差為0.21,是否需要進一步測試?現(xiàn)有的樣本均數(shù)和總體均數(shù)不同,其差異可能有兩個方面的原因造成。樣本來自總體,現(xiàn)有差異為抽樣誤差樣本所來自的總體與總體不同,存在本質(zhì)差異為識別這兩種可能,應當對其做假設檢驗SPSS統(tǒng)計分析系列培訓7生活中隱含的假設檢驗擲骰子,猜到點數(shù)為勝其實大家都明白如果篩子沒問題,那么六個點的出現(xiàn)概率應當相等〔均為1/6,這就是一個事先假設〕,我們只是看每次具體的試驗中誰的運氣好今天一共下了600次注,竟然一共只猜中了一次雖然平均應當贏約100次,但今天忘了查皇歷,不宜搏彩,運氣實在太差骰子有鬼,擲骰子的人可以人為控制結(jié)局,從而利用這種能力使自己得到了更多的收益。雖然第一種解釋是可能的,但我們認為在篩子公平的前提假設下出現(xiàn)如此結(jié)果實在是太不可能了〔概率小到不應當被我們一次就碰上〕,因此我們認為骰子實際上不均勻SPSS統(tǒng)計分析系列培訓8假設檢驗原理根底:小概率原理,即一般認為小概率事件在一次隨機抽樣中不會發(fā)生。最經(jīng)典的小概率事件:瞎貓碰到死耗子根本思想:先建立一個關于樣本所屬總體的假設,考察在假設條件下隨機樣本的特征信息是否屬小概率事件,假設為小概率事件,那么疑心假設成立有悖于該樣本所提供特征信息,因此拒絕假設事實上,小概率事件在隨機抽樣中還是可能發(fā)生的,只是發(fā)生的概率很小。假設正好碰上了,那么假設檢驗的結(jié)論就是錯誤的。當然,犯這種錯誤的概率很小SPSS統(tǒng)計分析系列培訓9假設檢驗的根本步驟一、建立假設根據(jù)統(tǒng)計推斷的目的而提出的對總體特征的假設。統(tǒng)計學中的假設有兩方面的內(nèi)容:一是檢驗假設(hypothesistobetested),亦稱原假設或無效假設(nullhypothesis),記為H0;二是與H0相對立的備擇假設(alternativehypothesis),記為H1。后者的意義在于當H0被拒絕時供采用。兩者是互斥的,非此即彼。H0:

=

0,

H1:

0;H0:

=7.4,

H1:

≠7.4。SPSS統(tǒng)計分析系列培訓10假設檢驗的根本步驟二、確定檢驗水準實際上就是確定拒絕H0時的最大允許誤差的概率。檢驗水準(sizeoftest),常用

表示,是指檢驗假設H0本來是成立的,而根據(jù)樣本信息拒絕H0的可能性大小的度量,換言之,

是拒絕了實際上成立的H0的概率。常用的檢驗水準為

=0.05,其意義是:在所設H0的總體中隨機抽得一個樣本,其均數(shù)比手頭樣本均數(shù)更偏離總體均數(shù)的概率不超過5%SPSS統(tǒng)計分析系列培訓11假設檢驗的根本步驟三、計算檢驗統(tǒng)計量和P值實際上在此之前還有一步叫做進行試驗,所需的樣本數(shù)據(jù)即從此得來統(tǒng)計量只是工具,概率值才是目的,它可以客觀衡量樣本對假設總體偏離程度從H0假設的總體中抽出現(xiàn)有樣本〔及更極端情況〕的概率,即P值例如600次贏100次是H0假設的情況,只贏1次就是現(xiàn)有樣本情況,更極端的情況就是連一次也沒有贏SPSS統(tǒng)計分析系列培訓12假設檢驗的根本步驟三、計算檢驗統(tǒng)計量和P值檢驗統(tǒng)計量的特點該統(tǒng)計量應當服從某種分布,從而可以計算出P值各種檢驗方法所利用的分布及計算原理不同,從而檢驗統(tǒng)計量也不同初學者往往本末倒置,很認真地在學工具,卻忘記了統(tǒng)計學的本質(zhì)是思維方式SPSS統(tǒng)計分析系列培訓13假設檢驗的根本步驟四、得出推斷結(jié)論按照事先確定的檢驗水準界定上面得到的P值,并按小概率原理認定對H0的取舍,作出推斷結(jié)論假設P≤基于H0假設的總體情況出現(xiàn)了小概率事件那么拒絕H0,接受H1,可以認為樣本與總體的差異不僅僅是抽樣誤差造成的,可能存在本質(zhì)上的差異,屬“非偶然的(significant)”,因此,可以認為兩者的差異有統(tǒng)計學意義。進一步根據(jù)樣本信息引申,得出實用性的結(jié)論SPSS統(tǒng)計分析系列培訓14假設檢驗的根本步驟四、得出推斷結(jié)論假設P>基于H0出現(xiàn)了很常見的事件那么樣本與總體間的差異尚不能排除純粹由抽樣誤差造成,可能確實屬“偶然的(non-significant)”,故尚不能拒絕H0因此,認為兩者的差異無統(tǒng)計學意義,但這并不意味著可以接受H0。SPSS統(tǒng)計分析系列培訓15關于擲篩子的假設檢驗建立假設H0:篩子均勻,pi=1/6 H1:篩子不均勻確定檢驗水準

=0.05進行試驗,計算檢驗統(tǒng)計量和P值相應的試驗結(jié)果在H0下對應的概率為1/600略多一點得出推斷結(jié)論基于H0出現(xiàn)了小概率事件,結(jié)果有非常非常顯著的統(tǒng)計學意義,你出老千!SPSS統(tǒng)計分析系列培訓16假設檢驗應注意的問題結(jié)論不能絕對化本身就保存了犯錯誤的可能性樣本量導致的檢驗效能問題樣本量太小,導致檢驗效能缺乏,從而無法檢出可能存在的差異樣本量太大,得出的有統(tǒng)計學意義的結(jié)論可能根本就沒有實際意義SPSS統(tǒng)計分析系列培訓17單樣本t檢驗統(tǒng)計理論復習推斷樣本是否來自某總體,即要檢驗樣本所在總體的均數(shù)是否等于的總體均數(shù)為了答復該問題,統(tǒng)計學上采用了小概率反證法的原理:我們有如下兩種假設:H0:樣本均數(shù)與總體均數(shù)的差異完全是抽樣誤差造成H1:樣本均數(shù)與總體均數(shù)的差異除由抽樣誤差造成外,也反映了兩個總體均數(shù)確實存在的差異SPSS統(tǒng)計分析系列培訓19統(tǒng)計理論復習先假設H0成立,即一切都是抽樣誤差造成的。在這個前提下,我們的樣本是從均數(shù)的大總體中抽出來的。顯然,樣本均數(shù)和假設總體均數(shù)之差就代表了偏離假設的程度但此差異所對應的概率究竟是大還是小?僅看這一個數(shù)字很難做出判斷。因為這還和數(shù)據(jù)的離散程度有關,為此我們需要找到某種方式對這一差值進行標準化SPSS統(tǒng)計分析系列培訓20統(tǒng)計理論復習顯然,標準化的根本方式就是將差值除以表示樣本均數(shù)離散程度的指標在單樣本的情況下,樣本的均數(shù)服從t分布這個被標化的差值,就是本次檢驗中所謂的統(tǒng)計量由于該統(tǒng)計量服從t分布,可利用該分布得到相應的概率值,故而此處的方法被稱為為單樣本t檢驗。最終求得的P值表示從假設總體中抽出當前樣本均數(shù)〔及更極端情況〕的概率總和SPSS統(tǒng)計分析系列培訓21統(tǒng)計理論復習如果該P值太小,成為了我們所定義的小概率事件〔小于等于α水準〕,那么我們疑心所做的假設不成立,從而拒絕H0。根本信念:小概率事件在一次實驗中不可能發(fā)生反之,我們就不能拒絕H0,但一般也不太好說去接受他。SPSS統(tǒng)計分析系列培訓22分析實例消費者信心指數(shù)以100作為基準值,現(xiàn)希望比較2007年12月的總消費者信心指數(shù)是否與基準值有差異SPSS統(tǒng)計分析系列培訓23方法的適用條件因為有中心極限定理,一般均數(shù)的抽樣分布都不會有問題,真正會限制該方法使用的是均數(shù)是否能夠代表相應數(shù)據(jù)的集中趨勢。也就是說,只要數(shù)據(jù)分布不是強烈的偏態(tài),一般而言單樣本t檢驗都是適用的?;谟嬎憬y(tǒng)計學的新工具:Boostrap抽樣SPSS統(tǒng)計分析系列培訓24完全隨機的兩樣本t檢驗完全隨機的兩樣本t檢驗目的:推斷兩個樣本是否來自相同的總體,更具體地說,是要檢驗兩樣本所代表的總體均數(shù)是否相等。檢驗假設無效假設H0:備擇假設H1:檢驗水準=0.05SPSS統(tǒng)計分析系列培訓26完全隨機的兩樣本t檢驗統(tǒng)計理論復習和上面單樣本的t檢驗的原理相同,我們也采用了小概率反證法,首先假設H0:兩樣本來自同一總體。當該總體服從正態(tài)分布時,我們就可以采用兩樣本t檢驗來計算從該總體中抽得這樣兩個樣本〔及更加極端情況〕的概率為多少,從而做出統(tǒng)計推斷。SPSS統(tǒng)計分析系列培訓27完全隨機的兩樣本t檢驗統(tǒng)計理論復習由于H0假設的是兩樣本來自同一總體,分析目的只涉及到均值,因此兩樣本t檢驗在推導過程中除了要求總體服從正態(tài)分布外,還要求兩樣本各自所在總體方差相同。應用條件不被滿足情況較輕時可以采用校正t檢驗的結(jié)果否那么應使用變量變換使之滿足條件或采用非參數(shù)檢驗過程SPSS統(tǒng)計分析系列培訓28分析實例現(xiàn)希望評價2007年4月第一次調(diào)查時不同收入人群的消費者信心指數(shù)是否存在差異分析:數(shù)據(jù)為定量資料,設計為成組設計,目的是兩樣本均數(shù)的比較。正態(tài)性:可作直方圖等。方差齊性:系統(tǒng)在t檢驗結(jié)果中自動給出。SPSS統(tǒng)計分析系列培訓29分析實例結(jié)論方差齊性檢驗的結(jié)果T檢驗的結(jié)果方差齊性檢驗兩樣本均數(shù)的t檢驗F值P值t值自由度P值均數(shù)差合并標準誤可信區(qū)間下限上限方差齊方差不齊SPSS統(tǒng)計分析系列培訓30適用條件獨立性:對結(jié)果的影響較大,但一般沒問題正態(tài)性:有一定的耐受能力,可以通過直方圖等進行觀察,偏的不厲害就行注意應當要分組考察方差齊性:相對而言對結(jié)論的影響較大,需要進行方差齊性檢驗SPSS統(tǒng)計分析系列培訓31配對t檢驗統(tǒng)計理論復習配對設計的兩種情況對同一個受試對象處理前后的比較將受試對象按情況相近者配對〔或者自身進行配對〕,分別給予兩種處理,以觀察兩種處理效果有無差異。配對設計的特點在配對設計得到的樣本數(shù)據(jù)中,每對數(shù)據(jù)之間都有一定的相關,如果采用成組的t檢驗就無法利用這種關系,浪費了大量統(tǒng)計信息對于這種情況,統(tǒng)計學上的解決方法是求出每對的差值,通過檢驗該差值總體均數(shù)是否為0,就可以得知兩種處理有無差異。SPSS統(tǒng)計分析系列培訓33根本思路H0:兩總體均值無顯著差異,差值序列均值u0=0構(gòu)造統(tǒng)計量:同單樣本均值檢驗D=X-u0S為差值序列的標準差實質(zhì)是先求出每對測量值的差值;然后檢驗差值序列的均值是否與0有顯著差異.SPSS統(tǒng)計分析系列培訓34統(tǒng)計理論復習如果差值的均值與0有顯著差異,那么認為兩總體均值存在顯著差異;否那么,與0無顯著差異,那么認為兩總體均值不存在顯著差異功能實際上和單樣本t檢驗重復,但數(shù)據(jù)輸入格式不同和方差分析結(jié)果等價SPSS統(tǒng)計分析系列培訓35分析實例用某藥治療10名高血壓病人,對每一病人治療前、后的舒張壓〔mmHg〕進行了測量,結(jié)果如下,問該藥有無降壓作用?數(shù)據(jù)見文件pairedt.sav。這是一個典型的個體自身治療前后的配對設計,應當采用配對設計差值的t檢驗來進行分析。按照配對t檢驗對數(shù)據(jù)格式的要求,這里在輸入數(shù)據(jù)時應當每個變量〔一列〕代表一個組,而每條記錄〔一行〕代表一對數(shù)據(jù)。SPSS統(tǒng)計分析系列培訓36兩個變量同時被選中后輸送到變量框SPSS統(tǒng)計分析系列培訓37對子間的差異均數(shù)標準差標準誤可信區(qū)間下限上限T值自由度P值SPSS統(tǒng)計分析系列培訓38SPSS系列培訓之:

方差分析模型入門@文彤老師模型表達式入門假設現(xiàn)在希望描述某個人群的月收入狀況,那么根據(jù)統(tǒng)計學知識,均數(shù)能夠表示集中趨勢,標準差能夠表示離散趨勢,那么任何一位受訪者i的月收入Xi該如何表達?顯然,這里的的εi應當服從正態(tài)分布,其均數(shù)為0,標準差為相應總體標準差在只有樣本信息時,樣本均數(shù)和標準差就是上述參數(shù)的最正確估計值SPSS統(tǒng)計分析系列培訓40模型表達式入門現(xiàn)在希望比較三種職業(yè)的月收入有無差異,這三類職業(yè)分別是醫(yī)生、律師和軟件工程師如果我們?nèi)匀幌M軌驅(qū)γ恳粋€個體的數(shù)據(jù)加以表達,應當如何做?SPSS統(tǒng)計分析系列培訓41模型表達式入門:單因素方差分析控制因素觀測變量三個水平SPSS統(tǒng)計分析系列培訓42模型表達式入門將上面三個式子可以合并如下:為了進一步分析的方便,一般都會尋找一個均數(shù)的參照水平,將其余組的平均水平與之相比顯然,這樣的組合會有許多種,因此模型在實際分析的時候往往會加上一些限制條件,比方假設參照水平是最后一個組的均數(shù),這被稱為擬合的約束條件SPSS統(tǒng)計分析系列培訓43模型表達式入門由于在常見的研究中,我們更關心各組均數(shù)的差異,對于標準差的差異那么比較無視,因此在最初的方差分析模型中,往往將不同組的εij假設為服從相同的正態(tài)分布〔就是說相同〕注意:在后來開展的混合效應模型和多水平模型中,各組間離散程度的差異也進入了研究視野,此時模型不一定會參加此限制SPSS統(tǒng)計分析系列培訓44模型表達式入門如果職業(yè)1和職業(yè)2的平均收入不相等,那么應當有α1≠α2H0:α1=α2如果三種職業(yè)的平均收入無差異,那么應當有α1=α2=α3=0,此時如果采用適當?shù)膮⒄账剑陀蠬0:αi=0,H1:至少有一個αi≠0SPSS統(tǒng)計分析系列培訓45案例:膠合板磨損深度的比較現(xiàn)希望比較四種膠合板的耐磨性,分別從這四個品牌的膠合板中抽取了5個樣品,在相同的轉(zhuǎn)速下磨損相同時間,測量其被磨損的深度(mm),現(xiàn)希望對此進行分析,數(shù)據(jù)見veneer.sav方差齊性檢驗模型參數(shù)估計值與設計矩陣SPSS統(tǒng)計分析系列培訓46兩兩比較方法LSD法:實際上就是t檢驗的變形,只是在變異和自由度的計算上利用了整個樣本信息,因此仍然存在放大一類錯誤的問題Scheffe法:當各組人數(shù)不相等,或者想進行復雜的比較時,用此法較為穩(wěn)妥。但它相比照較保守SPSS統(tǒng)計分析系列培訓47兩兩比較方法S-N-K法:是運用最廣泛的一種兩兩比較方法。它采用StudentRange分布進行所有各組均值間的配比照較。該方法保證在H0真正成立時總的α水準等于實際設定值,即控制了一類錯誤方差不齊時的兩兩比較方法:一般認為是Games-Howell法稍好一些,但最好直接使用非參數(shù)檢驗方法SPSS統(tǒng)計分析系列培訓48兩兩比較方法的選擇多組兩兩比較否是事先方案?各組例數(shù)相等?否(探索性研究)是(證實性研究)否是Bonferroni法(LSD)法Scheffe法Tukey法SPSS統(tǒng)計分析系列培訓49多因素方差分析模型目的:在同時考慮假設干個控制因素的情況下,分別分析它們的改變是否造成觀察變量的顯著變動SPSS統(tǒng)計分析系列培訓50模型表達式入門如果只研究職業(yè)的影響如果只研究性別的影響同時考慮職業(yè)和性別對收入的影響SPSS統(tǒng)計分析系列培訓51方差分析模型常用術語因素〔Factor〕因素是可能對因變量有影響的變量,一般來說,因素會有不止一個水平,而分析的目的就是考察或比較各個水平對因變量的影響是否相同。水平〔Level〕因素的不同取值等級稱作水平,例如性別有男、女兩個水平。SPSS統(tǒng)計分析系列培訓52方差分析模型常用術語單元〔Cell〕單元亦稱試驗單位〔ExperimentalUnit〕,指各因素的水平之間的每種組合。指各因素各個水平的組合,例如在研究性別〔二水平〕、血型〔四水平〕對成年人身高的影響時,該設計最多可以有2*4=8個單元。注意在一些特殊的試驗設計中,可能有的單元在樣本中并不會出現(xiàn),如拉丁方設計。SPSS統(tǒng)計分析系列培訓53方差分析模型常用術語元素〔Element〕指用于測量因變量值的觀察單位,比方研究職業(yè)與收入間的關系,月收入是從每一位受訪者處得到,那么每位受訪者就是試驗的元素一個單元格內(nèi)可以有多個元素,也可以只有一個,甚至于沒有元素。這主要在一些特殊的設計方案中出現(xiàn),如正交設計SPSS統(tǒng)計分析系列培訓54方差分析模型常用術語均衡〔Balance〕如果在一個實驗設計中任一因素各水平在所有單元格中出現(xiàn)的次數(shù)相同,且每個單元格內(nèi)的元素數(shù)均相同,那么該試驗是均衡的,否那么,就被稱為不均衡。不均衡的實驗設計在分析時較為復雜,需要對方差分析模型作特別設置才能得到正確的分析結(jié)果。SPSS統(tǒng)計分析系列培訓55方差分析模型常用術語固定因素〔FixedFactor〕指的是該因素在樣本中所有可能的水平都出現(xiàn)了。從樣本的分析結(jié)果中就可以得知所有水平的狀況,無需進行外推。絕大多數(shù)情況下,研究者所真正關心的因素都是固定因素。性別:只有兩種療法:只有三種SPSS統(tǒng)計分析系列培訓56方差分析模型常用術語隨機因素〔RandomFactor〕該因素所有可能的取值在樣本中沒有都出現(xiàn),目前在樣本中的這些水平是從總體中隨機抽樣而來,如果我們重復本研究,那么可能得到的因素水平會和現(xiàn)在完全不同!這時,研究者顯然希望得到的是一個能夠“泛化”,即對所有可能出現(xiàn)的水平均適用的結(jié)果。這不可防止的存在誤差,需要估計誤差的大小,因此被稱為隨機因素。SPSS統(tǒng)計分析系列培訓57方差分析模型常用術語協(xié)變量〔Covariates〕指對因變量可能有影響,需要在分析時對其作用加以控制的連續(xù)性變量實際上,可以簡單的把因素和協(xié)變量分別理解為分類自變量和連續(xù)性自變量當模型中存在協(xié)變量時,一般是通過找出它與因變量的回歸關系來控制其影響SPSS統(tǒng)計分析系列培訓58方差分析模型常用術語交互作用〔Interaction〕如果一個因素的效應大小在另一個因素不同水平下明顯不同,那么稱為兩因素間存在交互作用。當存在交互作用時,單純研究某個因素的作用是沒有意義的,必須分另一個因素的不同水平研究該因素的作用大小。SPSS統(tǒng)計分析系列培訓59效應的檢驗方法無論模型結(jié)構(gòu)多復雜,假設檢驗都是基于變異分解的原理進行的,都是F檢驗。根據(jù)變異分解式,可以將總的樣本離均差平方和分解成各個局部,隨后各個離均差平方和除以自由度可得到均方,進而將各效應的均方和誤差均方相比較,就得到了F統(tǒng)計量SPSS統(tǒng)計分析系列培訓60方差分析模型的檢驗層次對總模型進行檢驗對模型中各交互效應、主效應進行檢驗交互項有統(tǒng)計學意義:分解為各種水平的組合情況進行檢驗交互項無統(tǒng)計學意義:進行主效應各水平的兩兩比較SPSS統(tǒng)計分析系列培訓61方差分析模型的適用條件從模型表達式出發(fā)得到的提示各樣本的獨立性:只有各樣本為相互獨立的隨機樣本,才能保證變異的可加性〔可分解性〕正態(tài)性:即個單元格內(nèi)的所有觀察值系從正態(tài)總體中抽樣得出方差齊:各個單元格中的數(shù)據(jù)離散程度均相同,即各單元格方差齊SPSS統(tǒng)計分析系列培訓62方差分析模型的適用條件實際運用在多因素方差分析中,由于個因素水平組合下來每個單元格內(nèi)的樣本量可能非常少,這樣直接進行正態(tài)性、方差齊檢驗的話檢驗效能很低,實際上沒什么用因此真正常見的做法是進行建模后的殘差分析SPSS統(tǒng)計分析系列培訓63SPSS系列培訓之:

卡方檢驗--兩個定性變量之間的關系@文彤老師統(tǒng)計學回憶χ2檢驗是用途很廣的一種假設檢驗方法,主要用于分類資料統(tǒng)計推斷,包括:兩個率或兩個構(gòu)成比比較的卡方檢驗;多個率或多個構(gòu)成比比較的卡方檢驗以及分類資料的相關分析等它最根本的無效假設是:H0:觀察頻數(shù)與期望頻數(shù)沒有差異其原理為考察基于H0的理論頻數(shù)分布和實際頻數(shù)分布間的差異大小,據(jù)此求出相應的P值。SPSS統(tǒng)計分析系列培訓65Crosstabs過程分析實例在CCSS的分析報告中,所有受訪家庭會按照家庭年收入被分為低收入家庭和中高收入家庭兩類,現(xiàn)希望考察不同收入級別的家庭其轎車擁有率是否相同。SPSS統(tǒng)計分析系列培訓66方法原理理論頻數(shù)基于H0成立,兩樣本所在總體無差異的前提下計算出各單元格的理論頻數(shù)來SPSS統(tǒng)計分析系列培訓67方法原理殘差設A代表某個類別的觀察頻數(shù),E代表基于H0計算出的期望頻數(shù),A與E之差被稱為殘差殘差可以表示某一個類別觀察值和理論值的偏離程度,但殘差有正有負,相加后會彼此抵消,總和仍然為0。為此可以將殘差平方后求和,以表示樣本總的偏離無效假設的程度SPSS統(tǒng)計分析系列培訓68方法原理另一方面,殘差大小是一個相對的概念,相對于期望頻數(shù)為10時,20的殘差非常大;可相對于期望頻數(shù)為1000時20就很小了。因此又將殘差平方除以期望頻數(shù)再求和,以標準化觀察頻數(shù)與期望頻數(shù)的差異。這就是我們所說的卡方統(tǒng)計量,在1900年由英國統(tǒng)計學家Pearson首次提出,其公式為:SPSS統(tǒng)計分析系列培訓69方法原理從卡方的計算公式可見,當觀察頻數(shù)與期望頻數(shù)完全一致時,卡方值為0;觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小,卡方值越??;反之,觀察頻數(shù)與期望頻數(shù)差異越大,兩者之間的差異越大,卡方值越大。當然,卡方值的大小也和自由度有關SPSS統(tǒng)計分析系列培訓70方法原理卡方分布顯然,卡方值的大小不僅與A、E之差有關,還與單元格數(shù)〔自由度〕有關SPSS統(tǒng)計分析系列培訓71結(jié)果解釋列出的檢驗結(jié)果SPSS統(tǒng)計分析系列培訓72四格表

2值的校正英國統(tǒng)計學家Yates認為,2分布是一種連續(xù)型分布,而四格表資料是分類資料,屬離散型分布,由此計算的2值的抽樣分布也應當是不連續(xù)的,當樣本量較小時,兩者間的差異不可忽略,應進行連續(xù)性校正〔在每個單元格的殘差中都減去0.5〕假設n>40,此時有1<T5時,需計算Yates連續(xù)性校正2值T<1,或n<40時,應改用Fisher確切概率法直接計算概率SPSS統(tǒng)計分析系列培訓73Crosstabs過程如何閱讀卡方檢驗結(jié)果教科書的看法當n≥40且所有T≥5時,用普通的卡方檢驗,假設所得P約等于Alpha,改用確切概率法;當n≥40但有1≤T<5時,用校正的卡方檢驗;當n<40或有T<1時,不能用卡方檢驗,改用確切概率法。實際的做法一律向下看齊SPSS統(tǒng)計分析系列培訓74配對卡方檢驗分析實例某公司期望擴展業(yè)務,增開幾家分店,但對開店地址不太確定。于是選了20個地址,請兩位資深參謀分別對20個地址作了一個評價,把它們評為好、中、差三個等級,以便確定應對哪些地址進行更進一步調(diào)查,那么這兩位資深參謀的評價結(jié)果是否一致?SPSS統(tǒng)計分析系列培訓75配對卡方檢驗方法原理顯然,本例對同一個個體有兩次不同的測量,從設計的角度上講可以被理解為自身配對設計按照配對設計的思路進行分析,那么首先應當求出各對的差值,然后考察樣本中差值的分布是否按照H0假設的情況對稱分布按此分析思路,最終可整理出如前所列的配對交叉表SPSS統(tǒng)計分析系列培訓76方法原理注意主對角線上兩種檢驗方法的結(jié)論相同,對問題的解答不會有任何奉獻非主對角線上的單元格才代表了檢驗方法間的差異假設檢驗步驟如下〔以四格表為例〕:H0:B=CH1:BCSPSS統(tǒng)計分析系列培訓77方法原理SPSS統(tǒng)計分析系列培訓78分層卡方檢驗進一步控制城市的影響,在控制城市影響的前提下得到更準確的家庭收入分級和轎車擁有情況的關聯(lián)程度測量指標。層間差異的檢驗條件獨立性的檢驗SPSS統(tǒng)計分析系列培訓79SPSS系列培訓之:

相關分析@文彤老師相關分析任意多個變量都可以考慮相關問題任意測量尺度的變量都可以測量相關強度常用術語直線相關兩變量呈線性共同增大呈線性一增一減曲線相關兩變量存在相關趨勢并非線性,而是呈各種可能的曲線趨勢正相關與負相關完全相關SPSS統(tǒng)計分析系列培訓81相關分析Bivariate過程進行兩個/多個變量間的參數(shù)/非參數(shù)相關分析如果是多個變量,那么給出兩兩相關的分析結(jié)果Partial過程對其他變量進行控制輸出控制其他變量影響后的相關系數(shù)SPSS統(tǒng)計分析系列培訓82相關分析Distances過程對同一變量內(nèi)部各觀察單位間的數(shù)值或各個不同變量間進行相似性或不相似性〔距離〕分析前者可用于檢測觀測值的接近程度后者那么常用于考察各變量的內(nèi)在聯(lián)系和結(jié)構(gòu)一般不單獨使用,而是作為MDS的預分析過程典型相關分析SPSS統(tǒng)計分析系列培訓83相關分析Bivariate過程案例:考察信心指數(shù)值和年齡的相關性散點圖非參數(shù)相關系數(shù)SPSS統(tǒng)計分析系列培訓84相關分析Partial過程在控制家庭收入QS9對總信心指數(shù)影響的前提下,考察總信心指數(shù)值和年齡的相關性。SPSS統(tǒng)計分析系列培訓85SPSS系列培訓之:

回歸分析@文彤老師相關分析和回歸分析的關系SPSS統(tǒng)計分析系列培訓87回歸分析概述研究一個連續(xù)性變量〔因變量〕的取值隨著其它變量〔自變量〕的數(shù)值變化而變化的趨勢通過回歸方程解釋兩變量之間的關系顯的更為精確,可以計算出自變量改變一個單位時因變量平均改變的單位數(shù)量,這是相關分析無法做到的除了描述兩變量的關系以外,通過回歸方程還可以進行預測和控制,這在實際工作中尤為重要SPSS統(tǒng)計分析系列培訓88回歸分析概述回歸分析假定自變量對因變量的影響強度是始終保持不變的,如公式所示:對于因變量的預測值可以被分解成兩局部:常量〔constant〕:x取值為零時y的平均估計量,可以被看成是一個基線水平回歸局部:它刻畫因變量Y的取值中,由因變量Y與自變量X的線性關系所決定的局部,即可以由X直接估計的局部SPSS統(tǒng)計分析系列培訓89回歸分析概述?:y的估計值〔所估計的平均水平〕,表示給定自變量的取值時,根據(jù)公式算得的y的估計值a:常數(shù)項,表示自變量取值均為0時因變量的平均水平,即回歸直線在y軸上的截距多數(shù)情況下沒有實際意義,研究者也不關心b:回歸系數(shù),在多變量回歸中也稱偏回歸系數(shù)。自變量x改變一個單位,y估計值的改變量。即回歸直線的斜率SPSS統(tǒng)計分析系列培訓90回歸分析概述估計值和每一個實測值之間的差被稱為殘差。它刻畫了因變量y除了自變量x以外的其它所有未進入該模型,或未知但可能與y有關的隨機和非隨機因素共同引起的變異,即不能由x直接估計的局部。為了方程可以得到估計,我們往往假定i服從正態(tài)分布N(0,σ2)。SPSS統(tǒng)計分析系列培訓91案例:銷量影響因素分析某專門面向年輕人制作肖像的公司方案在國內(nèi)再開設幾家分店,收集了目前已開設的分店的銷售數(shù)據(jù)(Y,萬元)及分店所在城市的16歲以下人數(shù)(X1,萬人)、人均可支配收入(X2,元),數(shù)據(jù)見reg.sav。試進行統(tǒng)計分析。實際上擬合的模型如下:SPSS統(tǒng)計分析系列培訓92模型適用條件線性趨勢獨立性正態(tài)性方差齊性如果只是探討自變量與因變量間的關系,那么后兩個條件可以適當放寬樣本量根據(jù)經(jīng)驗,記錄數(shù)應當在希望分析的自變量數(shù)的20倍以上為宜實質(zhì)上樣本量和模型的決定系數(shù)有關,可通過迭代的方法進行計算SPSS統(tǒng)計分析系列培訓93常用指標偏回歸系數(shù)相應的自變量上升一個單位時,因變量取值的變動情況,即自變量對因變量的影響程度。標化偏回歸系數(shù):量綱問題決定系數(shù)相應的相關系數(shù)的平方,用R2表示,它反映因變量y的全部變異中能夠通過回歸關系被自變量解釋的比例。SPSS統(tǒng)計分析系列培訓94線性回歸模型簡介分析步驟做出散點圖,觀察變量間的趨勢SPSS統(tǒng)計分析系列培訓95線性回歸模型簡介分析步驟考察數(shù)據(jù)的分布,進行必要的預處理。即分析變量的正態(tài)性、方差齊等問題進行直線回歸分析殘差分析殘差間是否獨立〔Durbin-Watson檢驗〕殘差分布是否為正態(tài)〔圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論