




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2012年9月閆笑非Tel-mail:yanxiaofei@QQ:744379659應(yīng)用統(tǒng)計(jì)應(yīng)
用
統(tǒng)
計(jì)
學(xué)
AppliedStatistics個(gè)人基本信息
閆笑非,男,1961年生人,先后畢業(yè)于吉林大學(xué)和中國人民大學(xué),分別獲得理學(xué)學(xué)士學(xué)位和工商管理碩士學(xué)位。
曾任北京石油化工學(xué)院經(jīng)濟(jì)管理學(xué)院副院長,北京石油化工學(xué)院教學(xué)評(píng)估與研究中心主任現(xiàn)任北京石油化工學(xué)院人文社科學(xué)院院長,教授,碩士生導(dǎo)師中國市場(chǎng)學(xué)會(huì)理事中國戰(zhàn)略發(fā)展學(xué)研究會(huì)企業(yè)戰(zhàn)略專業(yè)委員會(huì)資深會(huì)員
北京市中青年骨干教師(2006年)主要從事:管理科學(xué)與工程,特別是能源經(jīng)濟(jì)、石油經(jīng)濟(jì)研究。2012年9月近年主要學(xué)術(shù)成果出版論著三部《技術(shù)經(jīng)濟(jì)與管理》被評(píng)為2006年北京市高等教育精品教材;專著《世界石油化工市場(chǎng)行情》由中石化出版社,于2008年出版發(fā)行。在國內(nèi)外發(fā)表論文60余篇,其中13篇被EI收錄,9篇被ISPT收錄。2012年9月2008年5月警惕過多地檢驗(yàn)。你對(duì)數(shù)據(jù)越苛求,數(shù)據(jù)會(huì)越多地向你供認(rèn),但在威逼下得到的供詞,在科學(xué)詢查的法庭上是不容許的。
StephenM.Stigler統(tǒng)計(jì)名言2008年5月怎樣解決下面的問題?來自不同地區(qū)的大學(xué)生每個(gè)月的平均生活費(fèi)支出是否不同呢?家電的品牌對(duì)它們的銷售量是否有顯著影響呢?不同的路段和不同的時(shí)段對(duì)行車時(shí)間有影響嗎?超市的位置和它的銷售額有關(guān)系嗎?不同的小麥品種產(chǎn)量有差異嗎?5.1方差分析解決什么問題?5.2考慮一個(gè)分類變量的影響
5.3考慮兩個(gè)分類變量的影響5.4試驗(yàn)設(shè)計(jì)初步
第5章分類變量對(duì)數(shù)值變量的影響
5.1.1比較均值是否相同
5.1.2從誤差分析入手
5.1.3在什么樣的前提下分析?5.1方差分析解決什么問題?為什么不做兩兩比較?
1、設(shè)有四個(gè)總體的均值分別為m1、
m2、m3
、m4
,要檢驗(yàn)四個(gè)總體的均值是否相等,每次檢驗(yàn)兩個(gè)的作法共需要進(jìn)行6次不同的檢驗(yàn),每次檢驗(yàn)犯第一類錯(cuò)誤的概率為,連續(xù)作6次檢驗(yàn)犯第Ⅰ類錯(cuò)誤的概率增加到1-(1-)6=0.265,大于0.05,相應(yīng)的置信水平會(huì)降低到0.956=0.735。
2、一般來說,隨著增加個(gè)體顯著性檢驗(yàn)的次數(shù),偶然因素導(dǎo)致差別的可能性也會(huì)增加(并非均值真的存在差別)。
3、方差分析方法則是同時(shí)考慮所有的樣本,因此,排除了錯(cuò)誤累積的概率,從而避免拒絕一個(gè)真實(shí)的原假設(shè)。5.1.1比較均值是否相同什么是方差分析?(analysisofvariance)
消費(fèi)者對(duì)四個(gè)行業(yè)的投訴次數(shù)行業(yè)觀測(cè)值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在4個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如下表什么是方差分析?(例題分析)分析4個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對(duì)“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個(gè)行業(yè)被投訴次數(shù)的均值是否相等若它們的均值相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異2008年5月方差分析解決什么問題?(例題分析)【例】確定超市的位置和競(jìng)爭者的數(shù)量對(duì)銷售額是否有顯著影響,獲得的年銷售額數(shù)據(jù)(單位:萬元)如下表因子水平樣本數(shù)據(jù)2008年5月什么是方差分析(ANOVA)?比較多個(gè)總體均值是否相等。例如,不同位置的超市銷售額均值是否一樣;研究分類自變量(因子factor)對(duì)數(shù)值因變量(觀測(cè)結(jié)果)的影響。例如,“超市位置”是一個(gè)分類自變量,“競(jìng)爭者數(shù)量”也是一個(gè)分類自變量;兩個(gè)或多個(gè)水平(level)或分類。例如,3個(gè)超市位置,4種競(jìng)爭者一個(gè)數(shù)值型因變量,銷售額考慮一個(gè)因子對(duì)觀測(cè)數(shù)據(jù)的影響稱為單因素方差分析(one-wayanalysisofvariance)
;考慮兩個(gè)因子對(duì)觀測(cè)數(shù)據(jù)的影響稱為雙因素方差分析(two-wayanalysisofvariance)方差分析中的有關(guān)術(shù)語因素或因子(factor)所要檢驗(yàn)的對(duì)象分析行業(yè)對(duì)投訴次數(shù)的影響,行業(yè)是要檢驗(yàn)的因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)觀察值在每個(gè)因素水平下得到的樣本數(shù)據(jù)每個(gè)行業(yè)被投訴的次數(shù)方差分析中的有關(guān)術(shù)語試驗(yàn)這里只涉及一個(gè)因素,因此稱為單因素4水平的試驗(yàn)總體因素的每一個(gè)水平可以看作是一個(gè)總體零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是4個(gè)總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這4個(gè)總體中抽取的樣本數(shù)據(jù)方差分析的基本思想和原理
(圖形分析—散點(diǎn)圖)
零售業(yè)旅游業(yè)航空公司家電制造方差分析的基本思想和原理
(圖形分析—Mean/SD/1.96*SD箱線圖)從散點(diǎn)圖上可以看出不同行業(yè)被投訴的次數(shù)有明顯差異同一個(gè)行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理
(圖形分析)散點(diǎn)圖觀察不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異可能是由于抽樣的隨機(jī)性造成的需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差這個(gè)名字也表示:它是通過對(duì)數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來源方差分析的基本思想和原理方差分析的基本思想和原理(兩類誤差)
1、隨機(jī)誤差
因素的同一水平(總體)下,樣本各觀察值之間的差異
比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)之間的差異
這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差
2、系統(tǒng)誤差
因素的不同水平(不同總體)之間觀察值的差異
比如,不同行業(yè)之間的被投訴次數(shù)之間的差異
這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差
5.1.2從誤差分析入手方差分析的基本思想和原理
(誤差分解)總誤差(total),反應(yīng)全部觀測(cè)數(shù)據(jù)的誤差大小組內(nèi)平方和(withingroups)因素的同一水平下數(shù)據(jù)誤差的平方和,反應(yīng)樣本數(shù)據(jù)內(nèi)部各觀察值之間的差異比如,零售業(yè)被投訴次數(shù)的誤差平方和,同一位置下不同超市之間銷售額的差異的差異反映隨機(jī)因素的影響,只包含隨機(jī)誤差3.組間平方和(betweengroups)因素的不同水平之間數(shù)據(jù)誤差的平方和比如,4個(gè)行業(yè)被投訴次數(shù)之間的誤差平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差2008年5月誤差表示(平方和—SS)數(shù)據(jù)的誤差用平方和(sumofsquares)表示組內(nèi)平方和(sumofsquaresforerror)誤差平方和或殘差平方和,記為SS殘差
不同因子(不同位置超市)的組內(nèi)誤差平方和組間平方和(sumofsquaresforfactor)因子平方和,記為SS因子不同因子(不同位置超市)的組間誤差平方和總平方和(sumofsquaresfortotal)
反映全部數(shù)據(jù)誤差大小的平方和,記為SST誤差間的關(guān)系:SST=SS因子+SS殘差2008年5月誤差度量(均方—MS)用均方(meansquare)表示誤差大小,以消除觀測(cè)數(shù)據(jù)的多少對(duì)平方和的影響用平方和除以相應(yīng)的自由度均方也稱方差(variance)
組間均方也稱組間方差(between-groupsvariance),反映各因子間誤差的大小MS因子=SS因子÷自由度(因子個(gè)數(shù)-1)組內(nèi)均方也稱組內(nèi)方差(within-groupsvariance)
,反映隨機(jī)誤差的大小MS殘差=SS殘差÷自由度(數(shù)據(jù)個(gè)數(shù)-因子個(gè)數(shù))方差分析的基本思想和原理
(均方—MS)若原假設(shè)成立,組間均方與組內(nèi)均方的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1若原假設(shè)不成立,組間均方會(huì)大于組內(nèi)均方,它們之間的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說不同水平之間存在著顯著差異,即自變量對(duì)因變量有影響判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,也就是檢驗(yàn)被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對(duì)投訴次數(shù)有顯著影響2008年5月誤差分析(F-檢驗(yàn))將組間均方與組內(nèi)均方進(jìn)行比較,分析差異是否顯著F=(MS因子÷MS殘差)~F(因子自由度,殘差自由度)用F分布作出決策,給定的顯著性水平
若F>F(或P<)
,則拒絕原假設(shè)H0
,表明均值之間的差異顯著,因素對(duì)觀察值有顯著影響2008年5月誤差分析
(F分布與拒絕域)如果均值相等,F(xiàn)=MS因子/MS殘差
1aF分布F
(k-1,n-k)0拒絕H0不拒絕H0F方差分析的基本假定
1、每個(gè)總體都應(yīng)服從正態(tài)分布
對(duì)于因素的每一個(gè)水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本
比如,每個(gè)行業(yè)被投訴的次數(shù)必須服從正態(tài)分布
2、各個(gè)總體的方差必須相同,比如,4個(gè)行業(yè)被投訴次數(shù)的方差都相等,這一假設(shè)也被稱為方差齊性(homogeneityvariance)
3、觀察值是獨(dú)立的。比如,每個(gè)行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立。
5.1.3在什么條件下進(jìn)行分析?方差分析中的基本假定在上述假定條件下,判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的4個(gè)正態(tài)總體的均值是否相等如果4個(gè)總體的均值相等,可以期望4個(gè)樣本的均值也會(huì)很接近4個(gè)樣本的均值越接近,推斷4個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分2008年5月方差分析中基本假定原假設(shè)成立的情形。如果原假設(shè)成立,H0:
m1=m2=m3=m4,即4個(gè)行業(yè)被投訴次數(shù)的均值都相等,意味著每個(gè)樣本都來自均值為
、方差為
2的同一正態(tài)總體
xf(x)
1
2
3
=4方差分析中的基本假定
若備擇假設(shè)成立,即H1:
mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的4個(gè)樣本分別來自均值不同的4個(gè)正態(tài)總體
Xf(X)
3
1
2
4
2008年5月方差分析中基本假定
原假設(shè)不成立的極端情形xf(x)
3
1
2問題的一般提法設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別用
1,
2,,
k
表示要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè):H0:
1
2
…
k
H1:
1,
2,,
k
不全相等設(shè)
1為零售業(yè)被投訴次數(shù)的均值,
2為旅游業(yè)被投訴次數(shù)的均值,
3為航空公司被投訴次數(shù)的均值,
4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為H0:
1
2
3
4
H1:
1,
2,
3,
4
不全相等5.2.1只考慮一個(gè)因子5.2.2關(guān)系有多強(qiáng)?5.2考慮一個(gè)分類自變量的影響5.2.1只考慮一個(gè)因子(one-wayanalysisofvariance)單因素方差分析的數(shù)據(jù)結(jié)構(gòu)觀察值(j)因素(A)i
水平A1水平A2
…水平Ak12::n
x11
x21
…
xk1x12
x22
…
xk2::
:
:::
:
:x1n
x2n
…
xkn分析步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策提出假設(shè)一般提法H0
:m1=m2=…=
mk
自變量對(duì)因變量沒有顯著影響
H1:m1
,m2
,…
,mk不全相等自變量對(duì)因變量有顯著影響
注意:拒絕原假設(shè),只表明至少有兩個(gè)總體的均值不相等,并不意味著所有的均值都不相等構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值誤差平方和均方(MS)
構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算水平的均值)假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù)計(jì)算公式為式中:ni為第i個(gè)總體的樣本觀察值個(gè)數(shù)
xij為第i個(gè)總體的第j個(gè)觀察值
構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個(gè)數(shù)計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(例題分析)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算總誤差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計(jì)算公式為
前例的計(jì)算結(jié)果
SST=(57-47.869565)2+…+(58-47.869565)2=115.9295構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算組間平方和SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計(jì)算公式為
前例的計(jì)算結(jié)果SSA=1456.608696構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算組內(nèi)平方和SSE)每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個(gè)樣本各觀察值的離散狀況該平方和反映的是隨機(jī)誤差的大小計(jì)算公式為
前例的計(jì)算結(jié)果SSE=2708構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(三個(gè)平方和的關(guān)系)
總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSA+SSE
前例的計(jì)算結(jié)果
4164.608696=1456.608696+2708構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算均方MS)各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對(duì)誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差由誤差平方和除以相應(yīng)的自由度求得三個(gè)平方和對(duì)應(yīng)的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個(gè)數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù)SSE的自由度為n-k構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算均方MS)組間方差:SSA的均方,記為MSA,計(jì)算公式為組內(nèi)方差:SSE的均方,記為MSE,計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(計(jì)算檢驗(yàn)統(tǒng)計(jì)量F)將MSA和MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即2008年5月構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量
(F分布與拒絕域)如果均值相等,F(xiàn)=MS因子/MS殘差
1aF分布F
(k-1,n-k)0拒絕H0不拒絕H0F統(tǒng)計(jì)決策
將統(tǒng)計(jì)量的值F與給定的顯著性水平
的臨界值F
進(jìn)行比較,作出對(duì)原假設(shè)H0的決策根據(jù)給定的顯著性水平
,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F
若F>F
,則拒絕原假設(shè)H0
,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對(duì)觀察值有顯著影響若F<F
,則不拒絕原假設(shè)H0
,無證據(jù)表明所檢驗(yàn)的因素對(duì)觀察值有顯著影響2008年5月提出假設(shè)并進(jìn)行檢驗(yàn)設(shè)
1為商業(yè)區(qū)超市銷售額的均值,
2為居民小區(qū)超市銷售額的均值,
3為寫字樓超市銷售額的均值,提出的假設(shè)為H0:
1
2
3
H1:
1,
2,
3
不全相等計(jì)算檢驗(yàn)統(tǒng)計(jì)量計(jì)算P值,作出決策2008年5月單因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值組間(因素影響)SSAk-1MSAMSAMSE組內(nèi)(誤差)SSEn-kMSE總和SSTn-1單因素方差分析
(例題分析)2008年5月用Excel進(jìn)行方差分析
(Excel分析步驟)
第1步:選擇“工具”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在分析工具中選擇【單因素方差分析】
,然后選擇【確定】第4步:當(dāng)對(duì)話框出現(xiàn)時(shí)
在【輸入?yún)^(qū)域
】方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在【】方框內(nèi)鍵入0.05(可根據(jù)需要確定)
在【輸出選項(xiàng)
】中選擇輸出區(qū)域
用Excel進(jìn)行方差分析2008年5月用SPSS進(jìn)行方差分析
(單因素方差分析)
用SPSS進(jìn)行方差分析第1步:選擇【Analyze】
【CompareMeans】
【One-Way-ANOVA】進(jìn)入主對(duì)話框第2步:在主對(duì)話框中將因變量(投訴次數(shù))選入【DependentList】,將自變量(行業(yè))選入【Factor)】第3步:(需要多重比較時(shí))點(diǎn)擊【Post-Hoc】從中選擇一種方法,如LSD;(需要均值圖時(shí))在【Options】下選中【Meansplot】,(需要相關(guān)統(tǒng)計(jì)量時(shí))
選擇【Descriptive】,點(diǎn)擊【Continue】回到主對(duì)話框。點(diǎn)擊【OK】5.2.2關(guān)系有多強(qiáng)?變量間關(guān)系的強(qiáng)度用自變量平方和(SS因子)占總平方和(SST)的比例大小來反映自變量平方和占總平方和的比例記為R2,即其平方根R就可以用來測(cè)量兩個(gè)變量之間的關(guān)系強(qiáng)度
關(guān)系強(qiáng)度的測(cè)量
拒絕原假設(shè)表明因素(自變量)與觀測(cè)值之間有顯著關(guān)系組間平方和(SSA)度量了自變量(行業(yè))對(duì)因變量(投訴次數(shù))的影響效應(yīng)只要組間平方和SSA不等于0,就表明兩個(gè)變量之間有關(guān)系(只是是否顯著的問題);當(dāng)組間平方和比組內(nèi)平方和(SSE)大,而且大到一定程度時(shí),就意味著兩個(gè)變量之間的關(guān)系顯著,大得越多,表明它們之間的關(guān)系就越強(qiáng)。反之,就意味著兩個(gè)變量之間的關(guān)系不顯著,小得越多,表明它們之間的關(guān)系就越弱;關(guān)系強(qiáng)度的測(cè)量
(例題分析)
R=0.591404結(jié)論行業(yè)(自變量)對(duì)投訴次數(shù)(因變量)的影響效應(yīng)占總效應(yīng)的34.9759%,而殘差效應(yīng)則占65.0241%。即行業(yè)對(duì)投訴次數(shù)差異解釋的比例達(dá)到近35%,而其他因素(殘差變量)所解釋的比例近65%以上
R=0.591404,表明行業(yè)與投訴次數(shù)之間有中等以上的關(guān)系
多重比較的意義通過對(duì)總體均值之間的配對(duì)比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異可采用Fisher提出的最小顯著差異方法,簡寫為LSDLSD方法是對(duì)檢驗(yàn)兩個(gè)總體均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來代替)而得到的多重比較的步驟提出假設(shè)H0:mi=mj(第i個(gè)總體的均值等于第j個(gè)總體的均值)H1:mi
mj(第i個(gè)總體的均值不等于第j個(gè)總體的均值)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量:計(jì)算LSD決策:若,拒絕H0;若
,不拒絕H0多重比較分析
(例題分析)第1步:提出假設(shè)檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:檢驗(yàn)5:檢驗(yàn)6:方差分析中的多重比較
(例題分析)第2步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:檢驗(yàn)5:檢驗(yàn)6:方差分析中的多重比較
(例題分析)第3步:計(jì)算LSD檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:檢驗(yàn)5:檢驗(yàn)6:方差分析中的多重比較
(例題分析)第4步:作出決策不能認(rèn)為零售業(yè)與旅游業(yè)均值之間有顯著差異
不能認(rèn)為零售業(yè)與航空公司均值之間有顯著差異不能認(rèn)為零售業(yè)與家電業(yè)均值之間有顯著差異不能認(rèn)為旅游業(yè)與航空業(yè)均值之間有顯著差異不能認(rèn)為旅游業(yè)與家電業(yè)均值之間有顯著差異航空業(yè)與家電業(yè)均值有顯著差異
5.3.1不考慮交互作用
5.3.2考慮交互作用5.3考慮兩個(gè)分類自變量的影響(two-wayanalysisofvariance)2008年5月考慮兩個(gè)分類變量的影響
(two-wayanalysisofvariance)
分析兩個(gè)因素(行因素Row和列因素Column)對(duì)試驗(yàn)結(jié)果的影響如果兩個(gè)因素對(duì)試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素對(duì)試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個(gè)因素的搭配還會(huì)對(duì)結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析
(Two-factorwithreplication)5.3.1不考慮交互作用(無重復(fù)雙因素分析)雙因素方差分析的基本假定每個(gè)總體都服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來自正態(tài)分布總體的簡單隨機(jī)樣本各個(gè)總體的方差必須相同對(duì)于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨(dú)立的數(shù)據(jù)結(jié)構(gòu)
是行因素的第i個(gè)水平下各觀察值的平均值
是列因素的第j個(gè)水平下各觀察值的平均值
是全部kr個(gè)樣本數(shù)據(jù)的總平均值數(shù)據(jù)結(jié)構(gòu)
誤差分解
計(jì)算平方和(SS)總誤差平方和行因素誤差平方和列因素誤差平方和隨機(jī)誤差項(xiàng)平方和誤差分解
總誤差平方和(SST)被分解成3部分,行因素平方和(SSR)、列因素平方和(SSC)、誤差項(xiàng)平方和(SSE)之間的關(guān)系SST=SSR+SSC+SSE分析步驟(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量)
計(jì)算均方(MS)誤差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是總誤差平方和SST的自由度為kr-1行因素平方和SSR的自由度為k-1列因素平方和SSC的自由度為r-1誤差項(xiàng)平方和SSE的自由度為(k-1)×(r-1)
分析步驟(構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量)
計(jì)算均方(MS)行因素的均方,記為MSR,計(jì)算公式為列因素的均方,記為MSC
,計(jì)算公式為誤差項(xiàng)的均方,記為MSE
,計(jì)算公式為2008年5月構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量——檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)行因子檢驗(yàn)列因子決策
若FR>F
(或P<
)
,拒絕H0
若FC>F
(或P<
)
,拒絕H0雙因素方差分析表(基本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值行因素SSRk-1MSRMSRMSE列因素SSCr-1MSCMSCMSE誤差SSE(k-1)(r-1)MSE總和SSTkr-12008年5月雙因素方差分析(不考慮交作用)
(例題分析)不同品牌的彩電在5個(gè)地區(qū)的銷售量數(shù)據(jù)品牌因素地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有4個(gè)品牌的彩電在5個(gè)地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)(地區(qū)因素)對(duì)銷售量的影響,對(duì)每個(gè)品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對(duì)彩電的銷售量是否有顯著影響?(=0.05)
雙因素方差分析(例題分析)
提出假設(shè)對(duì)品牌因素提出的假設(shè)為H0:m1=m2=m3=m4(品牌對(duì)銷售量無顯著影響)H1:mi
(i=1,2,…,4)
不全相等(有顯著影響)對(duì)地區(qū)因素提出的假設(shè)為H0:m1=m2=m3=m4=m5(地區(qū)對(duì)銷售量無顯著影響)H1:mj
(j=1,2,…,5)
不全相等(有顯著影響)
用Excel進(jìn)行無重復(fù)雙因素分析雙因素方差分析
(例題分析)
結(jié)論:
FR=18.10777>F
=3.4903,拒絕原假設(shè)H0,說明彩電的品牌對(duì)銷售量有顯著影響
FC=2.100846<F
=3.2592,不拒絕原假設(shè)H0,無證據(jù)表明銷售地區(qū)對(duì)彩電的銷售量有顯著影響雙因素方差分析
(關(guān)系強(qiáng)度的測(cè)量)行平方和(SSR)度量了品牌這個(gè)自變量對(duì)因變量(銷售量)的影響效應(yīng)列平方和(SSC)度量了地區(qū)這個(gè)自變量對(duì)因變量(銷售量)的影響效應(yīng)這兩個(gè)平方和加在一起則度量了兩個(gè)自變量對(duì)因變量的聯(lián)合效應(yīng)聯(lián)合效應(yīng)與總平方和的比值定義為R2其平方根R反映了這兩個(gè)自變量合起來與因變量之間的關(guān)系強(qiáng)度雙因素方差分析
(關(guān)系強(qiáng)度的測(cè)量)
例題分析品牌因素和地區(qū)因素合起來總共解釋了銷售量差異的83.94%其他因素(殘差變量)只解釋了銷售量差異的16.06%R=0.9162,表明品牌和地區(qū)兩個(gè)因素合起來與銷售量之間有較強(qiáng)的關(guān)系5.3.2考慮交互作用的雙因素方差分析(可重復(fù)雙因素分析)可重復(fù)雙因素分析(例題)【例】城市道路交通管理部門為研究不同的路段和不同的時(shí)間段對(duì)行車時(shí)間的影響,讓一名交通警察分別在兩個(gè)路段和高峰期與非高峰期親自駕車進(jìn)行試驗(yàn),通過試驗(yàn)共獲得了20個(gè)行車時(shí)間(單位:min)的數(shù)據(jù),如下表。試分析路段、時(shí)段以及路段和時(shí)段的交互作用對(duì)行車時(shí)間的影響交互作用的圖示(interaction)路段與時(shí)段對(duì)行車時(shí)間的影響交互作用無交互作用行車時(shí)間路段1路段2高峰期非高峰期行車時(shí)間路段1路段2高峰期非高峰期可重復(fù)雙因素分析
(平方和的計(jì)算)設(shè):
為對(duì)應(yīng)于行因素的第i個(gè)水平和列因素的第j個(gè)水平的第l行的觀察值
為行因素的第i個(gè)水平的樣本均值
為列因素的第j個(gè)水平的樣本均值
對(duì)應(yīng)于行因素的第i個(gè)水平和列因素的第j個(gè)水平組合的樣本均值
為全部n個(gè)觀察值的總均值
可重復(fù)雙因素分析
(平方和的計(jì)算)總平方和:行變量平方和:列變量平方和:交互作用平方和:誤差項(xiàng)平方和:SST=SSR+SSC+SSRC+SSE2008年5月誤差分解總誤差平方和(SST)被分解成4部分行因子平方和(SSR);列因子平方和(SSC);交互作用平方和(SSRC);殘差平方和(SSE)各平方和的關(guān)系相應(yīng)的均方行因子均方(MSR)列因子均方(MSC)
交互作用均方(MSRC)殘差均方(MSE)SST=SSR+SSC+SSRC+SSE可重復(fù)雙因素方差分析表
(基本結(jié)構(gòu))誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值行因素SSRk-1MSRFR列因素SSCr-1MSCFC交互作用SSRC(k-1)(r-1)MSRCFRC誤差SSEKr(m-1)MSE總和SSTn-1m為樣本的行數(shù)2008年5月檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)行因子檢驗(yàn)列因子檢驗(yàn)交互作用決策
若FR>F
(或P<
)
,拒絕H0
若FC>F
(或P<
)
,拒絕H0若FRC>F
(或P<
)
,拒絕H02008年5月考慮交互作用可重復(fù)雙因素分析
(Excel檢驗(yàn))第1步:選擇“工具”下拉菜單,并選擇【數(shù)據(jù)分析】選項(xiàng)第2步:在分析工具中選擇【方差分析:可重復(fù)雙因素分析】,然后選擇【確定】第3步:當(dāng)對(duì)話框出現(xiàn)時(shí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)生英語匯報(bào)課件模板
- 文庫發(fā)布:安全課件
- 車輛掛靠與品牌推廣營銷合同
- 公共車庫資產(chǎn)抵押融資合同范本
- 房貸合同編號(hào)查詢及使用規(guī)范指南
- 食品質(zhì)量跟蹤服務(wù)合同范本確保食品安全
- 房地產(chǎn)銷售代理授權(quán)合同
- 互聯(lián)網(wǎng)公司財(cái)務(wù)記賬代理與風(fēng)險(xiǎn)控制合同
- 硬盤陣列芯片行業(yè)分析:RAID控制器芯片是最大的細(xì)分占56%的市場(chǎng)份額
- 房屋租賃合同(2025年完整版)
- 2025年 汕頭市公安局警務(wù)輔助人員招聘考試筆試試卷附答案
- 腦出血的護(hù)理查房
- 天津大學(xué)強(qiáng)基計(jì)劃校測(cè)面試題
- 2025年大學(xué)思想政治理論課程考試試卷及答案
- 合同的內(nèi)容講課件
- 2025年農(nóng)村經(jīng)濟(jì)與管理考試試題及答案
- 夏季安全生產(chǎn)試題及答案
- 心身疾病病例分享
- 2025年北京高考化學(xué)試卷試題真題及答案詳解(精校打印版)
- 陜西省專業(yè)技術(shù)人員繼續(xù)教育2025公需課《黨的二十屆三中全會(huì)精神解讀與高質(zhì)量發(fā)展》20學(xué)時(shí)題庫及答案
- 2025至2030中國汽車輪轂行業(yè)發(fā)展分析及發(fā)展前景與投資報(bào)告
評(píng)論
0/150
提交評(píng)論