版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)的參數(shù)檢驗(yàn)和方差分析詳解演示文稿zf現(xiàn)在是1頁(yè)\一共有96頁(yè)\編輯于星期六優(yōu)選數(shù)據(jù)的參數(shù)檢驗(yàn)和方差分析zf現(xiàn)在是2頁(yè)\一共有96頁(yè)\編輯于星期六假設(shè)檢驗(yàn)的基本問(wèn)題假設(shè)檢驗(yàn)的基本原理
小概率事件原理小概率思想是指小概率事件(P<0.01或P<0.05等)在一次試驗(yàn)中基本上不會(huì)發(fā)生。利用反證法思想,先提出假設(shè)H0,再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè)不成立;反之,則認(rèn)為假設(shè)成立。zf3現(xiàn)在是3頁(yè)\一共有96頁(yè)\編輯于星期六假設(shè)檢驗(yàn)的步驟
(1)提出一個(gè)原假設(shè)和備擇假設(shè)(2)確定檢驗(yàn)統(tǒng)計(jì)量(3)確定顯著性水平α(4)確立置信區(qū)間(5)結(jié)論zf4現(xiàn)在是4頁(yè)\一共有96頁(yè)\編輯于星期六例:現(xiàn)對(duì)某地區(qū)成年女性的平均身高進(jìn)行檢驗(yàn),看是否達(dá)到160
cm。隨機(jī)抽樣了50個(gè)樣本,抽樣樣本均值為162。(1)提出零假設(shè)(nullhypothesis)和備擇假設(shè)(alternativehypothesis)
H0:u=160cmH1:u160cm如何對(duì)此假設(shè)進(jìn)行檢驗(yàn)?zāi)??通過(guò)隨機(jī)抽樣,從樣本資料中找充分證據(jù)去拒絕或接受H0zf5現(xiàn)在是5頁(yè)\一共有96頁(yè)\編輯于星期六(2)設(shè)定顯著性水平α
(如:設(shè)α=0.05)(3)確定檢驗(yàn)統(tǒng)計(jì)量:即選擇適當(dāng)?shù)慕y(tǒng)計(jì)量,并在原假設(shè)H0成立的條件下確定該統(tǒng)計(jì)量的分布。
如:t、Z統(tǒng)計(jì)量(4)確定置信區(qū)間
假定此例為:(157,163)(5)結(jié)論
假定此例中計(jì)算得到t=1.92,以及t=1.92實(shí)現(xiàn)的可能性P值為0.06。在0.05水平下t分布表中的t值為1.96統(tǒng)計(jì)軟件輸出p-值的位置,有的用“p-value”,有的用significant的縮寫(xiě)“Sig”zf6現(xiàn)在是6頁(yè)\一共有96頁(yè)\編輯于星期六依據(jù)t=1.92<t分布表中的t值為1.96,接受H0,拒絕H1;依據(jù)t=1.92實(shí)現(xiàn)的可能性P值為0.06﹥顯著性水平α的0.05,也可得到‘接受H0,拒絕H1’的結(jié)論;依據(jù)樣本均值162落在(157,163)這一置信區(qū)間,仍可得到‘接受H0,拒絕H1’的結(jié)論。接受H1并不表示H1為真,只是表示樣本資料并沒(méi)有充分證據(jù)可以拒絕H1,也可能會(huì)發(fā)生‘拒絕正確零假設(shè)的錯(cuò)誤,即第一類(lèi)錯(cuò)誤’接受H0并不表示H0為真,只是表示樣本資料并沒(méi)有充分證據(jù)可以拒絕H0,也可能會(huì)發(fā)生‘備選假設(shè)正確時(shí)反而說(shuō)零假設(shè)正確的錯(cuò)誤,即第二類(lèi)錯(cuò)誤’zf7現(xiàn)在是7頁(yè)\一共有96頁(yè)\編輯于星期六此例中備擇假設(shè)H1:u160cm的假設(shè)稱(chēng)為雙尾檢驗(yàn)(Two-tailedTest
);如果備選假設(shè)為H1:u>160cm或者u<160cm
則稱(chēng)為單尾檢驗(yàn)(One-tailedTest)。其中u>160cm為右尾檢定(Upper-tailedTest
);
u<160cm為左尾檢定(Lower-tailedTest
)
實(shí)際中選擇何種備選假設(shè),需根據(jù)檢驗(yàn)的需要決定。需要注意的是:計(jì)算機(jī)輸出結(jié)果中的p值是雙尾檢驗(yàn)的概率。如果備選假設(shè)選擇的是單尾檢驗(yàn),則要將計(jì)算機(jī)給的p值除以2,即取p值的一半。注意:zf8現(xiàn)在是8頁(yè)\一共有96頁(yè)\編輯于星期六1參數(shù)檢驗(yàn)單樣本的t檢驗(yàn)(One-SampleTTest)兩獨(dú)立樣本的t檢驗(yàn)(IndependentTwo-SampleTTest)兩配對(duì)樣本的檢驗(yàn)(Pair-SampleTTest)zf9現(xiàn)在是9頁(yè)\一共有96頁(yè)\編輯于星期六1.1單樣本t檢驗(yàn)-根據(jù)樣本對(duì)其總體均值大小進(jìn)行檢驗(yàn)假設(shè)從總體取出一容量為n的樣本,得到均值和標(biāo)準(zhǔn)差s,現(xiàn)要透過(guò)樣本推斷總體均值是否與某給定值(理論值或標(biāo)準(zhǔn)值)有無(wú)差別進(jìn)行檢驗(yàn).記
數(shù)據(jù)服從正態(tài)分布zf10現(xiàn)在是10頁(yè)\一共有96頁(yè)\編輯于星期六總體方差已知,用統(tǒng)計(jì)量
當(dāng)零假設(shè)成立,則統(tǒng)計(jì)量服從正態(tài)分布。檢驗(yàn)的拒絕域?yàn)榭傮w方差未知
用樣本方差代替總體方差,用統(tǒng)計(jì)量:
當(dāng)零假設(shè)成立,則統(tǒng)計(jì)量服從正態(tài)分布。檢驗(yàn)的拒絕域?yàn)閦f11現(xiàn)在是11頁(yè)\一共有96頁(yè)\編輯于星期六zf12現(xiàn)在是12頁(yè)\一共有96頁(yè)\編輯于星期六例1:如果你買(mǎi)了一包標(biāo)有500g重的一包紅糖,你覺(jué)得份量不足。于是你找到監(jiān)督部門(mén);當(dāng)然他們會(huì)覺(jué)得一包份量不夠可能是隨機(jī)的。于是監(jiān)督部門(mén)就去商店稱(chēng)了50包紅糖(數(shù)據(jù)在sugar.sav);其中均值(平均重量)是498.35g;這的確比500g少,但這是否能夠說(shuō)明廠家生產(chǎn)的這批紅糖平均起來(lái)不夠份量呢?于是需要統(tǒng)計(jì)檢驗(yàn)。
zf13現(xiàn)在是13頁(yè)\一共有96頁(yè)\編輯于星期六首先,可以畫(huà)出這些重量的直方圖(圖1)判斷樣本是否服從正態(tài)分布zf14現(xiàn)在是14頁(yè)\一共有96頁(yè)\編輯于星期六提出假設(shè)由于廠家聲稱(chēng)每袋500g(標(biāo)明重量),因此零假設(shè)為總體均值等于500g(被懷疑對(duì)象總是放在零假設(shè));而且由于樣本均值少于500g(這是懷疑的根據(jù)),把備選假設(shè)定為總體均值少于500g(這種備選假設(shè)為單向不等式的檢驗(yàn)為單尾檢驗(yàn),)。即,H0:u=500H1:u小于500zf15現(xiàn)在是15頁(yè)\一共有96頁(yè)\編輯于星期六SPSS處理數(shù)據(jù):
分析(Analyze)—比較均值(Comparemean)—單樣本t檢驗(yàn)(OneSampleTTest)
zf16現(xiàn)在是16頁(yè)\一共有96頁(yè)\編輯于星期六Spss輸出結(jié)果:t=-2.696(也稱(chēng)為t值),同時(shí)得到p-值為0.005(由于計(jì)算機(jī)輸出的為雙尾檢驗(yàn)的p-值,比單尾的大一倍,應(yīng)該0.010除以2)在0.5%的條件下,紅糖標(biāo)記重量為500g是不能接受的,實(shí)際上平均起來(lái)要少于500g。zf17現(xiàn)在是17頁(yè)\一共有96頁(yè)\編輯于星期六依據(jù)調(diào)查數(shù)據(jù),推斷儲(chǔ)戶總體一次存(取)款金額是否為2000元。案例分析:居民儲(chǔ)蓄調(diào)查數(shù)據(jù)zf18現(xiàn)在是18頁(yè)\一共有96頁(yè)\編輯于星期六依據(jù)調(diào)查數(shù)據(jù)對(duì)我國(guó)目前保險(xiǎn)公司從業(yè)人員受高等教育的程度和年輕化程度進(jìn)行推斷。問(wèn)題1:保險(xiǎn)公司具有高等教育水平的員工比例的平均值低于0.8。案例分析:保險(xiǎn)公司人員構(gòu)成調(diào)查數(shù)據(jù)zf19現(xiàn)在是19頁(yè)\一共有96頁(yè)\編輯于星期六問(wèn)題2:保險(xiǎn)公司年輕人比例的平均值與0.5無(wú)顯著差異。zf20現(xiàn)在是20頁(yè)\一共有96頁(yè)\編輯于星期六例3:
某汽車(chē)生產(chǎn)廠商要求其生產(chǎn)的汽車(chē)剎車(chē)直徑為322毫米。其中有8個(gè)生產(chǎn)車(chē)間。質(zhì)量監(jiān)控中心樣本。(數(shù)據(jù)見(jiàn)
brakes.sav)究竟該廠商生產(chǎn)的剎車(chē)是否達(dá)標(biāo)?其中哪些車(chē)間的剎車(chē)達(dá)標(biāo)?哪些車(chē)間的剎車(chē)不達(dá)標(biāo)?zf21現(xiàn)在是21頁(yè)\一共有96頁(yè)\編輯于星期六(1)數(shù)據(jù)拆分:數(shù)據(jù)(data)—拆分文件(splitfiles)zf22現(xiàn)在是22頁(yè)\一共有96頁(yè)\編輯于星期六(2)單樣本T檢驗(yàn)的SPSS操作:
分析(Analyze)—比較均值(Comparemean)—單樣本t檢驗(yàn)(One-SampleTTest)
彈出新對(duì)話框zf23現(xiàn)在是23頁(yè)\一共有96頁(yè)\編輯于星期六選擇檢測(cè)變量設(shè)定檢測(cè)值選擇檢測(cè)變量:DiscBrakeDiameter(mm).
設(shè)定檢測(cè)值:322點(diǎn)擊
Options.
zf24現(xiàn)在是24頁(yè)\一共有96頁(yè)\編輯于星期六置信水平設(shè)置
缺失值處理
設(shè)置置信水平,如90%.
設(shè)置缺失值的處理.點(diǎn)擊
Continue.
再在點(diǎn)擊
“One-SampleTTest”對(duì)話框點(diǎn)擊
OK.當(dāng)計(jì)算時(shí)涉及的變量有缺失值,則剔除在該變量上為缺失的樣本剔除所有在任意變量上有缺失值的樣本zf25現(xiàn)在是25頁(yè)\一共有96頁(yè)\編輯于星期六(3)結(jié)果分析:
one-samplestatistic描述性統(tǒng)計(jì):每個(gè)車(chē)間的樣本大小,汽車(chē)剎車(chē)直徑的均值、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤。各車(chē)間生產(chǎn)的剎車(chē)直徑都在322毫米左右。zf26現(xiàn)在是26頁(yè)\一共有96頁(yè)\編輯于星期六
One-samplettest依據(jù)此表,我們可做出怎樣的結(jié)論?zf27現(xiàn)在是27頁(yè)\一共有96頁(yè)\編輯于星期六目的是推斷兩個(gè)樣本分別代表的總體均數(shù)是否相等。其假設(shè)一般為:H0:μ1=μ2,即兩樣本來(lái)自的總體均數(shù)相等.H1:μ1>μ2或μ1<μ2,即兩樣本來(lái)自的總體均數(shù)不相等.1.2兩樣本的t檢驗(yàn)———根據(jù)來(lái)自?xún)蓚€(gè)總體的獨(dú)立樣本對(duì)其總體均值的檢驗(yàn)
觀測(cè)樣本獨(dú)立且是服從正態(tài)分布的隨機(jī)樣本zf28現(xiàn)在是28頁(yè)\一共有96頁(yè)\編輯于星期六與已知時(shí)
構(gòu)造統(tǒng)計(jì)量
與未知但相等時(shí)
構(gòu)造統(tǒng)計(jì)量計(jì)算t統(tǒng)計(jì)量時(shí)是用兩樣本均數(shù)差值的絕對(duì)值除以?xún)蓸颖揪鶖?shù)差值的標(biāo)準(zhǔn)誤zf29現(xiàn)在是29頁(yè)\一共有96頁(yè)\編輯于星期六zf30現(xiàn)在是30頁(yè)\一共有96頁(yè)\編輯于星期六例4:為檢測(cè)某種藥物對(duì)攻擊性情緒的影響,對(duì)100名服藥者和150名非服藥者進(jìn)行心理測(cè)試,得到相應(yīng)的某指標(biāo)。相應(yīng)的假設(shè)檢驗(yàn)問(wèn)題為:H0:μ1=μ2
H1:μ1大于μ2
μ1
為第一組的總體均值,而μ2為第二組的總體均值。用SPSS處理數(shù)據(jù):
分析(Analyze)—比較均值(Comparemean)—兩獨(dú)立樣本t檢驗(yàn)(Independent-SamplesTTest)
zf31現(xiàn)在是31頁(yè)\一共有96頁(yè)\編輯于星期六SPSS輸出結(jié)果:注意:這個(gè)輸出的前面三列(Levene‘sTestforEqualityofVariances)為檢驗(yàn)這兩個(gè)樣本所代表的總體之方差是否相等(零假設(shè)為相等)。如果顯著,即在Sig列中的該Levene檢驗(yàn)p-值很小(這里是0.008),說(shuō)明兩總體的方差相等被拒絕。就應(yīng)該看兩總體方差不等的結(jié)果,即最后一行的t檢驗(yàn)輸出(p-值=0.347/2);否則看上面一行的結(jié)果。因?yàn)榭傮w方差相同時(shí)使用的檢驗(yàn)統(tǒng)計(jì)量與方差不同時(shí)使用的不一樣
zf32現(xiàn)在是32頁(yè)\一共有96頁(yè)\編輯于星期六結(jié)論:通過(guò)計(jì)算,t統(tǒng)計(jì)量等于0.942,p值為0.1735(輸出中的雙尾檢驗(yàn)p值0.347的一半)。因此無(wú)法拒絕零假設(shè),即服藥與未服藥的攻擊性情緒無(wú)差異。zf33現(xiàn)在是33頁(yè)\一共有96頁(yè)\編輯于星期六例5:
某商場(chǎng)的營(yíng)銷(xiāo)部擬對(duì)某種信用卡購(gòu)物促銷(xiāo)方式及效果進(jìn)行評(píng)估。隨機(jī)抽取了500名持卡消費(fèi)者。信用卡購(gòu)物促銷(xiāo)方式之一:過(guò)去三個(gè)月消費(fèi)實(shí)施降低利率的方式;方式之二:采取標(biāo)準(zhǔn)的信用卡購(gòu)物方式。(兩種方式各有250名消費(fèi)者)。(見(jiàn)數(shù)據(jù)文件:creditpromo.sav
)zf34現(xiàn)在是34頁(yè)\一共有96頁(yè)\編輯于星期六(1)分析的下拉菜單中選擇:
分析(Analyze)—比較均值(Comparemean)—兩獨(dú)立樣本t檢驗(yàn)(Independent-SamplesTTest)彈出對(duì)話框
SPSS操作過(guò)程:zf35現(xiàn)在是35頁(yè)\一共有96頁(yè)\編輯于星期六選擇檢測(cè)變量分組變量選擇分組取值定義選擇檢測(cè)變量:$spentduringpromotionalperiod.
選擇分組變量:Typeofmailinsertreceived.點(diǎn)擊‘DefineGroups’對(duì)分組變量的取值進(jìn)行定義.
zf36現(xiàn)在是36頁(yè)\一共有96頁(yè)\編輯于星期六第一組的分組取值第二組的分組取值運(yùn)用分界點(diǎn)進(jìn)行分組zf37現(xiàn)在是37頁(yè)\一共有96頁(yè)\編輯于星期六(2)輸出結(jié)果及分析:
independent-samplesstatistic該表是‘描述性統(tǒng)計(jì)’表:不同消費(fèi)方式下樣本大小、消費(fèi)金額的均值、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤.該表可看出從樣本平均值來(lái)看,接受利率優(yōu)惠的消費(fèi)者的平均消費(fèi)要高出接受標(biāo)準(zhǔn)方式的消費(fèi)者有71美元.zf38現(xiàn)在是38頁(yè)\一共有96頁(yè)\編輯于星期六結(jié)論:因計(jì)算的T統(tǒng)計(jì)量為-2.26,sig值為0.024<<0.05,所以可得出接受新的信用卡購(gòu)物方式的消費(fèi)者消費(fèi)金額高出另一種購(gòu)物方式的71.11美元顯著異于0.超市應(yīng)盡力將新的信用卡購(gòu)物方式推廣.zf39現(xiàn)在是39頁(yè)\一共有96頁(yè)\編輯于星期六配對(duì)樣本的檢驗(yàn)(pairedsamples):(針對(duì)同樣的樣本)考察實(shí)驗(yàn)前后樣本均值有無(wú)差異。能夠很好地控制非實(shí)驗(yàn)因素對(duì)結(jié)果的影響。注意:該方法能夠很好地控制非實(shí)驗(yàn)因素對(duì)結(jié)果的影響;但同一樣本實(shí)驗(yàn)前后并不獨(dú)立。1.3配對(duì)樣本的t檢驗(yàn)——針對(duì)同樣的樣本實(shí)驗(yàn)前后均值的比較
怎么處理??要消除配對(duì)樣本相關(guān)性影響,處理方法:用配對(duì)樣本差值與總體均數(shù)“0”進(jìn)行比較,即推斷差數(shù)的總體均數(shù)是否為“0”。故其檢驗(yàn)過(guò)程與依據(jù)樣本均數(shù)推斷總體均數(shù)大小的t檢驗(yàn)類(lèi)似。配對(duì)樣本差值服從正態(tài)分布zf40現(xiàn)在是40頁(yè)\一共有96頁(yè)\編輯于星期六例6:某減肥茶生產(chǎn)商擬對(duì)其生產(chǎn)的新產(chǎn)品的減肥效果進(jìn)行檢驗(yàn),隨機(jī)抽取了50個(gè)人,考察了50個(gè)人減肥前的體重和減肥后的體重。注意:每一個(gè)人減肥后的重量都和自己減肥前的重量有關(guān)。但不同人之間卻是獨(dú)立的。令減肥前的重量均值為μ1,而減肥后的均值為μ2;這樣所要進(jìn)行的檢驗(yàn)為:H0:μ1=μ2
H1:μ1大于μ2zf41現(xiàn)在是41頁(yè)\一共有96頁(yè)\編輯于星期六也可以把同一樣本實(shí)驗(yàn)前后兩個(gè)觀測(cè)值逐個(gè)相減,形成一個(gè)由獨(dú)立觀測(cè)值組成的樣本;然后用單樣本檢驗(yàn)方法,看其均值是否為零。在相減之后公式和單樣本均值檢驗(yàn)無(wú)異。用SPSS處理數(shù)據(jù):分析(Analyze)—比較均值(Comparemean)—配對(duì)樣本t檢驗(yàn)(Paired-SamplesTTest)
zf42現(xiàn)在是42頁(yè)\一共有96頁(yè)\編輯于星期六Spss輸出結(jié)果得到雙尾p-值為0.002,這里的單尾p-值于是為0.001.
因此減肥后和減肥前相比,平均重量顯著要輕。SPSS輸出結(jié)果:減肥前后的體重高度相關(guān)zf43現(xiàn)在是43頁(yè)\一共有96頁(yè)\編輯于星期六例7:某藥物生產(chǎn)商欲評(píng)估某新藥對(duì)有心臟病家族病史的病人有無(wú)效果。隨機(jī)選取了16個(gè)病人,服藥后觀察了6個(gè)月。在這項(xiàng)研究中,著重考察了實(shí)驗(yàn)前后病人的‘weights’和‘triglyceridelevels’.(數(shù)據(jù)文件:dietstudy.sav.)zf44現(xiàn)在是44頁(yè)\一共有96頁(yè)\編輯于星期六(1)下拉菜單選項(xiàng):
Analyze—CompareMeans—Paired-SamplesTTest
彈出配對(duì)樣本對(duì)話框SPSS處理步驟zf45現(xiàn)在是45頁(yè)\一共有96頁(yè)\編輯于星期六選擇Triglyceride
和FinalTriglyceride
作為第一配對(duì)變量.
選擇Weight
和FinalWeight
作為第二配對(duì)變量.
點(diǎn)擊OK.
(置信水平選擇Option以系統(tǒng)默認(rèn)為準(zhǔn))zf46現(xiàn)在是46頁(yè)\一共有96頁(yè)\編輯于星期六(2)結(jié)論及分析:
paired-samplesstatistic均值樣本量標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤=標(biāo)準(zhǔn)差/從16個(gè)樣本的’triglyceridelevels’指標(biāo)看到服用新藥后,該指標(biāo)水平將下降14.06.
16個(gè)樣本的weight也平均下降8磅從標(biāo)準(zhǔn)差看服藥前后的weight相對(duì)指標(biāo)triglyceridelevels的變異度更大.
zf47現(xiàn)在是47頁(yè)\一共有96頁(yè)\編輯于星期六paired-samplescorrelation服藥前后triglyceridelevels指標(biāo)的相關(guān)系數(shù)為-0.286,(統(tǒng)計(jì)意義上)無(wú)顯著的相關(guān)關(guān)系:從總體看triglyceridelevels服藥后降低了,但16個(gè)樣本該指標(biāo)上的變化卻很不一致,有的沒(méi)變化,有的反而上升了。服藥前后weight指標(biāo)的相關(guān)系數(shù)為0.996,(統(tǒng)計(jì)意義上)有非常顯著的相關(guān)關(guān)系:所有的樣本weight都很一致地降低了。zf48現(xiàn)在是48頁(yè)\一共有96頁(yè)\編輯于星期六paired-samplestest該表是‘配對(duì)樣本t檢驗(yàn)’結(jié)果表,給出了‘實(shí)驗(yàn)前后triglyceride差值’和‘實(shí)驗(yàn)前后weight的差值’的均值、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤、置信區(qū)間、t統(tǒng)計(jì)量、自由度、sig值等結(jié)論:因?yàn)閷?shí)驗(yàn)前后triglyceridelevel
的t統(tǒng)計(jì)量為1.2;sig值0.1245(雙尾為0.249)>>0.05;所以,可得出新藥對(duì)triglyceridelevel
無(wú)影響。而實(shí)驗(yàn)前后weight的t統(tǒng)計(jì)量為11.2;sig值0.000<<0.05;所以,可認(rèn)為體重下降8.06絕非偶然,而是新藥起了作用。zf49現(xiàn)在是49頁(yè)\一共有96頁(yè)\編輯于星期六如何解決多元多總體的均值檢驗(yàn)?zf50現(xiàn)在是50頁(yè)\一共有96頁(yè)\編輯于星期六不同型號(hào)的計(jì)算機(jī)的平均維修時(shí)間是相同?2方差分析zf51現(xiàn)在是51頁(yè)\一共有96頁(yè)\編輯于星期六首先計(jì)算各樣本平均數(shù)若按兩個(gè)總體平均值比較的檢驗(yàn)法,把樣本平均數(shù)兩兩組成對(duì):
zf52現(xiàn)在是52頁(yè)\一共有96頁(yè)\編輯于星期六將這15對(duì)平均數(shù)一一進(jìn)行比較檢驗(yàn)——計(jì)算工作量太大即使每對(duì)都進(jìn)行了比較,并且都以0.95的置信度得出每對(duì)均值都相等的結(jié)論,但是由此要得出這6個(gè)型號(hào)的維修時(shí)間的均值都相等這一結(jié)論的置信度僅是——估計(jì)的精確性和檢驗(yàn)的靈敏度降低其他方法??zf53現(xiàn)在是53頁(yè)\一共有96頁(yè)\編輯于星期六方差分析(analysisofvariance,ANOVA):又稱(chēng)變異數(shù)分析或F檢驗(yàn),其目的是推斷兩組或多組資料的總體均數(shù)是否相同,檢驗(yàn)兩個(gè)或多個(gè)樣本均數(shù)的差異是否有統(tǒng)計(jì)學(xué)意義。方差分析中幾個(gè)重要概念:1)觀測(cè)因素或稱(chēng)為觀測(cè)變量如:考察農(nóng)作物產(chǎn)量的影響因素。農(nóng)作物產(chǎn)量就是觀測(cè)變量。2)控制因素或稱(chēng)控制變量:進(jìn)行試驗(yàn)(實(shí)驗(yàn))時(shí),我們稱(chēng)可控制的試驗(yàn)條件為因素(Factor)。其中因素變化的各個(gè)等級(jí)為水平(Level)。影響農(nóng)作物產(chǎn)量的因素,如品種、施肥量、土壤等。
zf54現(xiàn)在是54頁(yè)\一共有96頁(yè)\編輯于星期六如果在試驗(yàn)中只有一個(gè)因素在變化,其他可控制的條件不變,稱(chēng)它為單因素試驗(yàn);若試驗(yàn)中變化的因素有兩個(gè)或兩個(gè)以上,則稱(chēng)為雙因素或多因素試驗(yàn)。
方差分析就是從觀測(cè)變量的方差入手,研究諸多控制變量(因素)中哪些變量是對(duì)觀測(cè)變量有顯著影響的變量zf55現(xiàn)在是55頁(yè)\一共有96頁(yè)\編輯于星期六方差分析的基本原理
設(shè)有r個(gè)總體,各總體分別服從,假定各總體方差相等?,F(xiàn)從各總體隨機(jī)抽取樣本。透過(guò)各總體的樣本數(shù)據(jù)推斷r個(gè)總體的均值是否相等?
:至少有一組數(shù)據(jù)的平均值與其它組的平均值有顯著性差異。
zf56現(xiàn)在是56頁(yè)\一共有96頁(yè)\編輯于星期六分析的思路:用離差平方和(SS)描述所有樣本總的變異情況,將總變異分為兩個(gè)來(lái)源:(1)組內(nèi)變動(dòng)(withingroups),代表本組內(nèi)各樣本與該組平均值的離散程度,即水平內(nèi)部(組內(nèi))方差(2)組間變動(dòng)(betweengroups),代表各組平均值關(guān)于總平均值的離散程度。即水平之間(組間)方差即:SS總=SS組間+SS組內(nèi)zf57現(xiàn)在是57頁(yè)\一共有96頁(yè)\編輯于星期六消除各組樣本數(shù)不同的影響--離差平方和除以自由度(即均方差)。從而構(gòu)造統(tǒng)計(jì)量:方差分析的基本思想就是通過(guò)組內(nèi)方差與組間方差的比值構(gòu)造的F統(tǒng)計(jì)量,將其與給定顯著性水平、自由度下的F值相對(duì)比,判定各組均數(shù)間的差異有無(wú)統(tǒng)計(jì)學(xué)意義。零假設(shè)否定域:zf58現(xiàn)在是58頁(yè)\一共有96頁(yè)\編輯于星期六方差分析的應(yīng)用條件(1)可比性,若資料中各組均數(shù)本身不具可比性則不適用方差分析。(2)正態(tài)性,各組的觀察數(shù)據(jù),是從服從正態(tài)分布的總體中隨機(jī)抽取的樣本。即偏態(tài)分布資料不適用方差分析。對(duì)偏態(tài)分布的資料應(yīng)考慮用對(duì)數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等變量變換方法變?yōu)檎龖B(tài)或接近正態(tài)后再進(jìn)行方差分析。(3)方差齊性,各組的觀察數(shù)據(jù),是從具有相同方差的相互獨(dú)立的總體中抽取得到的。即若組間方差不齊則不適用方差分析。zf59現(xiàn)在是59頁(yè)\一共有96頁(yè)\編輯于星期六一元單因素方差分析:分析某一個(gè)因素A的不同水平是否對(duì)某一個(gè)觀測(cè)變量Y產(chǎn)生了顯著影響。一元多因素方差分析:分析某兩個(gè)或多個(gè)因素的不同水平是否對(duì)某一個(gè)觀測(cè)變量Y產(chǎn)生了顯著影響。2.1一元方差分析zf60現(xiàn)在是60頁(yè)\一共有96頁(yè)\編輯于星期六例1:某飲料生產(chǎn)企業(yè)研制出一種新型飲料.飲料的顏色共有四種:橘黃色、粉色、綠色和無(wú)色透明。這四種飲料的營(yíng)養(yǎng)含量、味道、價(jià)格、包裝等可能影響銷(xiāo)售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營(yíng)規(guī)模相仿的五家超市上收集了該種飲料的銷(xiāo)售情況。2.1.1一元單因素方差分析zf61現(xiàn)在是61頁(yè)\一共有96頁(yè)\編輯于星期六問(wèn)題:飲料的顏色是否對(duì)銷(xiāo)售量產(chǎn)生影響?zf62現(xiàn)在是62頁(yè)\一共有96頁(yè)\編輯于星期六其中:飲料的顏色即是影響因素(控制因素、變量)銷(xiāo)售量是觀測(cè)變量。在其他條件相同的情況下,上述問(wèn)題就歸結(jié)為一個(gè)檢驗(yàn)問(wèn)題,即:zf63現(xiàn)在是63頁(yè)\一共有96頁(yè)\編輯于星期六差異的產(chǎn)生來(lái)自?xún)蓚€(gè)方面:
一方面是由不同顏色的差異造成的,既不同的飲料顏色對(duì)銷(xiāo)售量產(chǎn)生了影響。用‘組間方差’表示另一方面是由于抽選樣本的隨機(jī)性而產(chǎn)生的差異,即各顏色內(nèi)的隨機(jī)誤差,如相同顏色的飲料在不同的商場(chǎng)銷(xiāo)售量也不同。用‘組內(nèi)方差’表示。一元單因素方差分析Spss選項(xiàng):分析(Analyze)—比較均值(CompareMean)—單因素ANOVA(One-WayANOVA)zf64現(xiàn)在是64頁(yè)\一共有96頁(yè)\編輯于星期六SPSS輸出結(jié)果:可看出F值為10.486,P值是0.000。推斷零假設(shè)不成立。表明顏色不同飲料的銷(xiāo)量也不同。zf65現(xiàn)在是65頁(yè)\一共有96頁(yè)\編輯于星期六如何用SPSS對(duì)方差分析的‘方差相等’要求進(jìn)行判定?(因正態(tài)分布的要求不是很?chē)?yán)格,分析忽略)Spss選項(xiàng):在One-WayANOVA中選擇Option,選定Homogeneity-of–variancezf66現(xiàn)在是66頁(yè)\一共有96頁(yè)\編輯于星期六進(jìn)一步考察:究竟是哪一個(gè)水平對(duì)觀察變量產(chǎn)生了顯著影響,即那種顏色的飲料對(duì)銷(xiāo)售量有顯著影響?運(yùn)用單因素方差分析的多重比較檢驗(yàn)SPSS窗口中PostHoc選項(xiàng)進(jìn)行選擇。
zf67現(xiàn)在是67頁(yè)\一共有96頁(yè)\編輯于星期六zf68現(xiàn)在是68頁(yè)\一共有96頁(yè)\編輯于星期六例2:為了迎合消費(fèi)者的需求,某音像公司擬推出一張新的DVD專(zhuān)輯.市場(chǎng)營(yíng)銷(xiāo)部分收集不同年齡的消費(fèi)者群體對(duì)新的DVD專(zhuān)輯的評(píng)價(jià)等相關(guān)數(shù)據(jù)信息。(見(jiàn)數(shù)據(jù)文件
dvdplayer.sav
)
從該數(shù)據(jù)文件我們想知道:
是否不同消費(fèi)者群體對(duì)DVD的評(píng)價(jià)不一樣呢?32-38歲與39-45歲兩個(gè)年齡段的消費(fèi)者全體對(duì)DVD的評(píng)價(jià)是否一樣呢?32歲以下與45歲以上的消費(fèi)者群體對(duì)DVD的評(píng)價(jià)是否一樣呢?
zf69現(xiàn)在是69頁(yè)\一共有96頁(yè)\編輯于星期六SPSS的處理過(guò)程:(1)一元單因素方差分析的菜單選擇:
分析(Analyze)
—比較均值(CompareMean)—單因素方差分析(One-WayANOVA)
彈出One-wayANOVA對(duì)話框zf70現(xiàn)在是70頁(yè)\一共有96頁(yè)\編輯于星期六選擇TotalDVDassessment
作為因變量.選擇
AgeGroup
作為影響因素.點(diǎn)擊選項(xiàng)‘Options’按鈕.
多重比較檢驗(yàn):兩兩比較看哪些水平之間存在均值差異.
先驗(yàn)比較檢驗(yàn):事先設(shè)定因變量在因素的不同不平下是否有差異.
描述性統(tǒng)計(jì)量、均值圖、缺失值的處理觀測(cè)變量(因變量)輸入框影響因素(自變量)輸入框彈出Option對(duì)話框zf71現(xiàn)在是71頁(yè)\一共有96頁(yè)\編輯于星期六統(tǒng)計(jì)量選擇描述性統(tǒng)計(jì).如:均值、方差等固定效應(yīng)、隨機(jī)效應(yīng)模型的標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、置信區(qū)間等方差同質(zhì)性(相等)檢驗(yàn)
當(dāng)F檢驗(yàn)方差相等不成立時(shí),用Brown-Forsythe統(tǒng)計(jì)量或Welch統(tǒng)計(jì)量檢驗(yàn)組間均值是否相等,比F檢驗(yàn)更可取。
選擇均值圖Meansplot.
點(diǎn)擊繼續(xù)Continue.
點(diǎn)擊一元單因素對(duì)話框中的兩兩比較‘PostHoc’.均值示意圖可直觀看出組間均值差異彈出雙重比較檢驗(yàn)對(duì)話框組均值示意圖缺失值處理zf72現(xiàn)在是72頁(yè)\一共有96頁(yè)\編輯于星期六假設(shè)組間方差相等時(shí)的多重比較檢驗(yàn)假設(shè)組間方差不等時(shí)的多重比較檢驗(yàn)確定顯著性水平選擇方差不等時(shí)的‘Tamhane'sT2’.
點(diǎn)擊‘繼續(xù)Continue’.
點(diǎn)擊一元單因素方差分析中的‘對(duì)比Contrasts’按鈕.
彈出Contrasts對(duì)話框zf73現(xiàn)在是73頁(yè)\一共有96頁(yè)\編輯于星期六第1組系數(shù)賦值為0,點(diǎn)擊
Add.
第二組系數(shù)賦值為0,點(diǎn)擊Add.緊接著,給第3和第4組系數(shù)賦值,要使兩系數(shù)和為0.給第3組賦值-1
,點(diǎn)擊Add.給第4組系數(shù)賦值為1.
給第5和第6組賦值為0.點(diǎn)擊Next進(jìn)入下一組先驗(yàn)對(duì)比檢驗(yàn).
首先,比較第3和第4個(gè)年齡段的消費(fèi)者群體;其他年齡段的忽略不考慮,賦值為0.零假設(shè)為:兩組無(wú)差異zf74現(xiàn)在是74頁(yè)\一共有96頁(yè)\編輯于星期六
其次,對(duì)第1、2兩個(gè)年齡段的消費(fèi)者與第5、6兩個(gè)年齡段的消費(fèi)者進(jìn)行先驗(yàn)對(duì)比。第3和4兩個(gè)年齡段的消費(fèi)者不考慮。
給第1組賦值.5,點(diǎn)擊Add.
給第2組賦值.5,點(diǎn)擊Add.
分別給第3和第4組賦值為0,點(diǎn)擊Add.
分別給第5和第6組賦值-.5,點(diǎn)擊Add.點(diǎn)擊Continue.點(diǎn)擊一元單因素對(duì)話框中的OK,輸出分析結(jié)果output.
zf75現(xiàn)在是75頁(yè)\一共有96頁(yè)\編輯于星期六(2)結(jié)果分析:方差齊性(相等)檢驗(yàn)
從上表可看出:各總體方差相等的零假設(shè)成立。因?yàn)榻y(tǒng)計(jì)量Levenestatistic為0.574,該統(tǒng)計(jì)量實(shí)現(xiàn)的可能性sig.值為0.720,說(shuō)明零假設(shè)發(fā)生可能性是很大的,我們沒(méi)有充分的理由拒絕它,由此接受零假設(shè)。zf76現(xiàn)在是76頁(yè)\一共有96頁(yè)\編輯于星期六差異表現(xiàn)如何,究竟來(lái)自哪兒?
由此表可看出,對(duì)DVD的評(píng)價(jià)的差異主要來(lái)自不同年齡的消費(fèi)者群體的組間差異,因?yàn)镕
統(tǒng)計(jì)量為4.601;同時(shí)依據(jù)sig值0.001,也可說(shuō)明我們最初的零假設(shè)‘不同年齡群體對(duì)DVD的評(píng)價(jià)無(wú)差異’發(fā)生的可能性為0.001,我們沒(méi)有充分理由接受它.方差分析表zf77現(xiàn)在是77頁(yè)\一共有96頁(yè)\編輯于星期六組均值示意圖
該圖給我們較為直觀的印象:32-45歲的消費(fèi)者對(duì)DVD的評(píng)價(jià)高于其他消費(fèi)者群體.
若要作更細(xì)致和精確的分析,可通過(guò)一元方差分析中的‘先驗(yàn)比較’和‘多重比較’來(lái)完成。
zf78現(xiàn)在是78頁(yè)\一共有96頁(yè)\編輯于星期六對(duì)比系數(shù)表
檢驗(yàn)32-38和39-45兩個(gè)群體對(duì)DVD的評(píng)價(jià)是否有差異,零假設(shè)認(rèn)為:二者無(wú)差異。其他年齡段的消費(fèi)者群體忽略不考慮,所以分別賦值為0;而32-38和39-45兩個(gè)群體分別賦值-1和1類(lèi)似地,若想對(duì)比32歲以下和45歲以上的消費(fèi)者群體對(duì)DVD的評(píng)價(jià)是否有差異,零假設(shè)認(rèn)為二者無(wú)差異,所以,分別給18-24、25-31賦值為.5,分別給46-52、53-59賦值為-.5,其他群體不考慮賦值為0。Thesignificancevaluesforthetestsofthefirstcontrastarebothlargerthan0.10.Thisindicatesthattheage39-45groupisnotsignificantlymorefavorabletowardtheDVDplayerthantheage32-38group.
Likewise,thesignificancevaluesforthetestsofthesecondcontrastarelargerthan0.10.Participantsunder32andover45havestatisticallyequivalentassessmentscores.
假設(shè)方差不等時(shí)的檢驗(yàn)結(jié)果假設(shè)方差相等時(shí)的檢驗(yàn)結(jié)果zf79現(xiàn)在是79頁(yè)\一共有96頁(yè)\編輯于星期六PostHocTests雙重假設(shè)檢驗(yàn)zf80現(xiàn)在是80頁(yè)\一共有96頁(yè)\編輯于星期六2.1.2一元多因素方差分析基本思想:研究?jī)蓚€(gè)或兩個(gè)以上因素(控制變量)是否對(duì)某個(gè)觀測(cè)變量產(chǎn)生顯著性影響。如:飲料銷(xiāo)售,除了關(guān)心飲料顏色之外,還想了解銷(xiāo)售地區(qū)、銷(xiāo)售策略是否影響銷(xiāo)售量?若把飲料的顏色看作影響銷(xiāo)售量的因素A,飲料的銷(xiāo)售地區(qū)看作影響因素B,銷(xiāo)售策略看作影響因素C。對(duì)因素A和因素B同時(shí)進(jìn)行分析,就屬于雙因素方差分析。對(duì)因素A、B以及C(或更多因素)同時(shí)進(jìn)行分析,就屬多因素方差分析。zf81現(xiàn)在是81頁(yè)\一共有96頁(yè)\編輯于星期六雙(多)因素方差分析有兩種類(lèi)型:1、無(wú)交互作用的雙(多)因素方差分析,它假定因素A和因素B的效應(yīng)是相互獨(dú)立的,不存在相互關(guān)系;2、有交互作用的雙(多)因素方差分析,它假定因素A和因素B的結(jié)合會(huì)產(chǎn)生出一種新的效應(yīng)(相互影響)。例如,若假定不同地區(qū)的消費(fèi)者對(duì)某種顏色有與其他地區(qū)消費(fèi)者不同的特殊偏愛(ài),這就是兩個(gè)因素結(jié)合后產(chǎn)生的新效應(yīng),屬于有交互作用的背景;否則,就是無(wú)交互作用的背景。
zf82現(xiàn)在是82頁(yè)\一共有96頁(yè)\編輯于星期六案例分析:廣告城市與銷(xiāo)售額數(shù)據(jù)目標(biāo):企業(yè)對(duì)不同廣告形式在不同地區(qū)的廣告效果(銷(xiāo)售額)進(jìn)行評(píng)估;zf83現(xiàn)在是83頁(yè)\一共有96頁(yè)\編輯于星期六例2:某雜貨店對(duì)其消費(fèi)者的購(gòu)買(mǎi)習(xí)慣作了一項(xiàng)問(wèn)卷調(diào)查。重要想關(guān)注:不同性別、不同的購(gòu)買(mǎi)習(xí)慣是否會(huì)影響到其在一個(gè)月內(nèi)的消費(fèi)金額。(數(shù)據(jù)見(jiàn):grocery_1month.sav)因變量dependentvariable:Amountspent自變量Independentvariables:gendershoppingstyle一元雙因素問(wèn)題zf84現(xiàn)在是84頁(yè)\一共有96頁(yè)\編輯于星期六(1)建立假設(shè):對(duì)于因素:gender
零假設(shè)H0:
備擇假設(shè)H1:對(duì)于因素:shoppingstyle
零假設(shè)H0:
備擇假設(shè)H1:交互影響因素:
零假設(shè)H0:
備擇假設(shè)H1:zf85現(xiàn)在是85頁(yè)\一共有96頁(yè)\編輯于星期六(2)一元多因素的SPSS處理過(guò)程:
菜單選擇:分析(Analyze)—一般線性模型(GeneralLinearModel)—單變量(Univariate)彈出univariate對(duì)話框zf86現(xiàn)在是86頁(yè)\一共有96頁(yè)\編輯于星期六因變量選擇固定因素隨機(jī)因素(協(xié)方差分析時(shí))協(xié)變量選擇(協(xié)方差分析時(shí))權(quán)數(shù)變量選擇模型選擇按鈕實(shí)現(xiàn)先驗(yàn)對(duì)比檢驗(yàn)和趨勢(shì)檢驗(yàn)圖形分析雙重比較檢驗(yàn)將分析結(jié)果以變量的形式存入SPSS數(shù)據(jù)編輯窗口中置信水平和描述性統(tǒng)計(jì)等選擇
Amountspentas作為因變量.
選擇
GenderandShoppingstyle
進(jìn)入固定因素框.
點(diǎn)擊‘Model’按鈕.
zf87現(xiàn)在是87頁(yè)\一共有96頁(yè)\編輯于星期六GenderShoppingstyleGenderShoppingstyle飽和模型(考慮交互效應(yīng)gender*Shoppingstyle)非飽和模型(不考慮交互效應(yīng),系統(tǒng)默認(rèn)模型)若選擇非飽和模型,則點(diǎn)擊custom.點(diǎn)擊作圖‘
Plots’進(jìn)入形象分析對(duì)話框.zf88現(xiàn)在是88頁(yè)\一共有96頁(yè)\編輯于星期六選擇style作為橫坐標(biāo)變量.
選擇gender
作為縱坐標(biāo)變量.點(diǎn)擊‘
Add’按鈕.點(diǎn)擊‘Continue.’按鈕再點(diǎn)擊‘
PostHoc’按鈕進(jìn)入雙重比較對(duì)話框.形象分析:用圖形直觀分析控制變量間是否存在交互作用zf89現(xiàn)在是89頁(yè)\一共有96頁(yè)\編輯于星期六假設(shè)方差相等雙重假設(shè)檢驗(yàn)假設(shè)方差不等選擇
style
作為雙重比較檢驗(yàn)的因素.
選擇方差相等中的Tukey
統(tǒng)計(jì)量選項(xiàng).
選擇方差不等中的Tamhane'sT2
統(tǒng)計(jì)量選項(xiàng).
點(diǎn)擊Continue.
再點(diǎn)擊Options.zf9
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024模特獨(dú)家拍攝合同保密協(xié)議及形象權(quán)授權(quán)2篇
- 《癌癥的分子診斷》課件
- 2024廣告制作與發(fā)布項(xiàng)目承包協(xié)議
- 2024政基礎(chǔ)設(shè)施工程勞務(wù)分包合同施工安全管理與應(yīng)急預(yù)案3篇
- 家用電燈知識(shí)培訓(xùn)課件
- 2025年度情侶分手心理輔導(dǎo)合同3篇
- 天然氣保險(xiǎn)知識(shí)培訓(xùn)課件
- 中國(guó)青年政治學(xué)院《信息可視化設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江中醫(yī)藥大學(xué)濱江學(xué)院《項(xiàng)目投資與融資》2023-2024學(xué)年第一學(xué)期期末試卷
- 美妝陳列知識(shí)培訓(xùn)課件
- 對(duì)外經(jīng)貿(mào)大學(xué)管理學(xué)原理復(fù)習(xí)大綱精品
- FSSC運(yùn)營(yíng)管理制度(培訓(xùn)管理辦法)
- 警察公安工作匯報(bào)ppt模板ppt通用模板課件
- 電動(dòng)平板車(chē)的使用和管理細(xì)則
- 河北省初中生綜合素質(zhì)評(píng)價(jià)實(shí)施
- 明天會(huì)更好歌詞完整版
- (完整)中考英語(yǔ)首字母填空高頻詞
- 影像科目標(biāo)責(zé)任書(shū)
- 智能蒙皮天線分布式設(shè)計(jì)研究
- 通風(fēng)與空調(diào)工程施工質(zhì)量驗(yàn)收資料填寫(xiě)示例
- 美能達(dá)a7相機(jī)中文說(shuō)明書(shū)
評(píng)論
0/150
提交評(píng)論