版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
本資料來源本資料來源統(tǒng)計(jì)分析軟件應(yīng)用統(tǒng)計(jì)分析軟件應(yīng)用第一章SPSS概述第一章SPSS概述
SPSS概述SPSS:StatisticalPackageforSocialScienceStatisticalProductandServiceSolutionsSPSS的發(fā)展:60年代:美國(guó)斯坦福大學(xué)三位研究生研制70年代:SPSS總部成立于芝加哥,推出SPSSX中小型機(jī)版80年代:SPSS公司(SPSS/PC+微機(jī)版1~3)90年代:SPSS公司(SPSSWINDOWS版5~14)SPSS概述SPSS:SPSS主要特點(diǎn)操作簡(jiǎn)便。絕大多數(shù)操作是通過菜單、按鈕、對(duì)話框完成的。無需計(jì)算機(jī)編程、需記憶大量命令和參數(shù)。分析方法豐富、分析結(jié)果清晰、直觀??梢灾苯幼x取其他軟件格式的數(shù)據(jù)文件,如:dbf、xls、sas等。最新版本采用分布式分析系統(tǒng),適應(yīng)互聯(lián)網(wǎng),支持動(dòng)態(tài)收集、分析數(shù)據(jù)和HTML報(bào)告與一般的辦公軟件直接兼容不方便SPSS主要特點(diǎn)操作簡(jiǎn)便。絕大多數(shù)操作是通過菜單、按鈕、對(duì)SPSS主要窗口:數(shù)據(jù)編輯窗口窗口標(biāo)題:dataeditor功能:對(duì)SPSS的數(shù)據(jù)文件進(jìn)行錄入、修改、管理等基本操作的窗口。組成:窗口主菜單、工具欄、數(shù)據(jù)編輯區(qū)、狀態(tài)顯示區(qū)特點(diǎn):SPSS運(yùn)行過程中自動(dòng)打開SPSS中各統(tǒng)計(jì)分析功能都是針對(duì)該窗口中的數(shù)據(jù)進(jìn)行的窗口中的數(shù)據(jù)文件以.sav存于磁盤上兩個(gè)視圖:數(shù)據(jù)視圖和變量視圖SPSS主要窗口:數(shù)據(jù)編輯窗口窗口標(biāo)題:dataeditoSPSS主要窗口:數(shù)據(jù)輸出窗口窗口標(biāo)題:viewer功能:SPSS統(tǒng)計(jì)分析報(bào)表及圖形的輸出的窗口。組成:窗口主菜單、工具欄、結(jié)果顯示區(qū)、狀態(tài)顯示區(qū)特點(diǎn):在進(jìn)行第一次分析時(shí)自動(dòng)打開,也可手工打開可以手工打開若干個(gè)可相互切換的viewer窗口;狀態(tài)欄上的!表示當(dāng)前輸出窗口輸出窗口可以關(guān)閉,窗口內(nèi)容以.SPO存于磁盤上兩個(gè)視圖:目錄視圖和內(nèi)容視圖SPSS主要窗口:數(shù)據(jù)輸出窗口窗口標(biāo)題:viewerSPSS主要窗口:數(shù)據(jù)輸出窗口駕馭數(shù)據(jù)出輸出窗口一般操作結(jié)果文件的打開和保存加密保存窗口元素的移動(dòng)和刪除標(biāo)準(zhǔn)的拖放式操作在大綱視圖中操作最方便結(jié)果的導(dǎo)出以純文本格式導(dǎo)出、以HTML格式導(dǎo)出如何在WORD中引用分析結(jié)果統(tǒng)計(jì)表格:拷貝或拷貝對(duì)象統(tǒng)計(jì)圖:拷貝對(duì)象表格的編輯表格狀態(tài)的確定單元格內(nèi)容編輯行列轉(zhuǎn)置Autofit表格樣式的變換SPSS主要窗口:數(shù)據(jù)輸出窗口駕馭數(shù)據(jù)出輸出窗口表格的編輯SPSS基本運(yùn)行方式完全窗口菜單方式:所有分析操作過程都是通過菜單和按鈕及對(duì)話框方式進(jìn)行的.是經(jīng)常使用的一種運(yùn)行方式,適用于一般分析和SPSS的初學(xué)者.SPSS基本運(yùn)行方式完全窗口菜單方式:SPSS基本運(yùn)行方式程序運(yùn)行方式:手工編寫SPSS命令程序一次性提交計(jì)算機(jī)運(yùn)行適用于大規(guī)模的分析工作和熟練的SPSS程序員.實(shí)現(xiàn)方法:(1)打開SYNTAX語句窗口并編寫和修改SPSS程序(2)點(diǎn)擊語句窗口中的RUN菜單項(xiàng),選擇運(yùn)行方式運(yùn)行SPSS基本運(yùn)行方式程序運(yùn)行方式:Syntax語句窗口窗口標(biāo)題:syntaxediter功能:編寫和修改SPSS程序的窗口.特點(diǎn):打開:FILE->NEW->SYNTAX或FILE->OPEN->.SPS擴(kuò)展名窗口中的程序以.SPS存于磁盤上菜單項(xiàng)RUN中提供四種程序執(zhí)行方式:All、Selection、Current、ToendSyntax語句窗口窗口標(biāo)題:syntaxediterSPSS基本運(yùn)行方式菜單程序混合運(yùn)行方式:先通過菜單選擇分析過程和參數(shù),不立即提交(OK)執(zhí)行,而是按動(dòng)PASTE按鈕.計(jì)算機(jī)自動(dòng)將用戶剛定義的分析過程和參數(shù)轉(zhuǎn)換成SPSS的命令,并顯示到SYNTAX語句窗口中.用戶可對(duì)其進(jìn)行必要的修改后再提交給計(jì)算機(jī)執(zhí)行.一般適用于熟練的SPSS程序員.SPSS基本運(yùn)行方式菜單程序混合運(yùn)行方式:利用SPSS進(jìn)行數(shù)據(jù)分析的步驟建立SPSS數(shù)據(jù)文件 定義數(shù)據(jù)文件結(jié)構(gòu) 錄入修改和編輯待分析數(shù)據(jù)數(shù)據(jù)的統(tǒng)計(jì)分析 統(tǒng)計(jì)分析之前的預(yù)處理 統(tǒng)計(jì)分析數(shù)據(jù)和分析結(jié)果的保存結(jié)果的說明和解釋利用SPSS進(jìn)行數(shù)據(jù)分析的步驟建立SPSS數(shù)據(jù)文件思考復(fù)習(xí)SPSS有哪兩個(gè)主要窗口?功能是什么?有哪些特點(diǎn)?SPSS有哪些運(yùn)行方式?特點(diǎn)是什么?思考復(fù)習(xí)SPSS有哪兩個(gè)主要窗口?功能是什么?有哪些特點(diǎn)?第二章SPSS數(shù)據(jù)文件的
建立和管理第二章SPSS數(shù)據(jù)文件的
建立和管理一份簡(jiǎn)單的調(diào)查問卷單項(xiàng)選擇題提供幾個(gè)備選擇答案,從其中選擇一個(gè)答案變量類型:分類數(shù)據(jù)、定序數(shù)據(jù)數(shù)據(jù)類型:字符型填空題變量類型:定距數(shù)據(jù)數(shù)據(jù)類型:數(shù)值型一份簡(jiǎn)單的調(diào)查問卷單項(xiàng)選擇題如何利用SPSS組織數(shù)據(jù)SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件年級(jí)性別 問題1…… 問題n1 1 ………. 42 2 ……… 2.……………文件結(jié)構(gòu)數(shù)據(jù)個(gè)案case變量名變量用字符或數(shù)字表示字符型數(shù)據(jù)SPSS數(shù)據(jù)文件一般只能通過SPSS軟件打開如何利用SPSS組織數(shù)據(jù)SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文一份簡(jiǎn)單的調(diào)查問卷多項(xiàng)選擇題提供幾個(gè)備選擇答案,從其中選擇多個(gè)答案如:在下列品牌中您信任哪些品牌?被診斷為高血要后你采取了以下哪些輔助治療手段?如:高考時(shí)報(bào)考學(xué)校(1)北京大學(xué)(2)清華大學(xué)(3)人民大學(xué)(4)北京理工大學(xué)(5)北京師范大學(xué)(6)北京外國(guó)語大學(xué)多項(xiàng)選擇題不能在SPSS中直接存儲(chǔ),因?yàn)镾PSS的一個(gè)變量只能有一個(gè)取值一份簡(jiǎn)單的調(diào)查問卷多項(xiàng)選擇題如何利用SPSS組織數(shù)據(jù)多項(xiàng)選擇題的處理方法思路:將一個(gè)問題定義成幾個(gè)變量,用這幾個(gè)變量來描述該問題的幾個(gè)可能被選擇的答案。編碼方式:多選項(xiàng)二分法(multipledichotomizemethod)多選項(xiàng)分類法(multiplecategorymethod)如何利用SPSS組織數(shù)據(jù)多項(xiàng)選擇題的處理方法多選項(xiàng)二分法將每個(gè)答案作為一個(gè)變量,每個(gè)變量只有兩個(gè)取值(0或1)。例如:如何利用SPSS組織數(shù)據(jù)多選項(xiàng)二分法如何利用SPSS組織數(shù)據(jù)多選項(xiàng)分類法:預(yù)先估計(jì)多選項(xiàng)問題可能被選擇的最多答案數(shù).為每個(gè)答案建立一個(gè)變量,取值為多選項(xiàng)問題的可選答案.例如:如何利用SPSS組織數(shù)據(jù)多選項(xiàng)分類法:如何利用SPSS組織數(shù)據(jù)頻數(shù)數(shù)據(jù):男女統(tǒng)計(jì)1023精算1220如何利用SPSS組織數(shù)據(jù)設(shè)置三個(gè)變量:專業(yè)方向、性別、人數(shù)頻數(shù)數(shù)據(jù):男女統(tǒng)計(jì)1023精算1220如何利用SPSS組織數(shù)SPSS數(shù)據(jù)文件的結(jié)構(gòu)(一)變量名(Variablename):
變量名是變量存取的唯一標(biāo)志。
起名規(guī)則:不多于8個(gè)字符組成不區(qū)分大小寫允許漢字作為變量名默認(rèn)變量名為VARn,如:var00001SPSS數(shù)據(jù)文件的結(jié)構(gòu)(一)變量名(VariablenamSPSS數(shù)據(jù)文件的結(jié)構(gòu)(二)變量的類型(type)和顯示寬度(width)1、數(shù)值型:標(biāo)準(zhǔn)數(shù)值型(Numeric):默認(rèn)類型8.2 如:12345678、12345.67、-1234.56帶逗號(hào)的數(shù)值型(Comma):從個(gè)位開始三位一個(gè)逗號(hào)8.2 如:1,234.56科學(xué)計(jì)數(shù)法(ScientificNotation):表示很大或很小的數(shù)據(jù)8.2 如:1.2E+05帶美元符號(hào)(Dollar):表示貨幣 格式很多,如:$12.30SPSS數(shù)據(jù)文件的結(jié)構(gòu)(二)變量的類型(type)和顯示寬度SPSS數(shù)據(jù)文件的結(jié)構(gòu)2、字符型(String):存儲(chǔ)字符數(shù)據(jù)8位 如:beijing處理時(shí)用雙引號(hào)擴(kuò)起來3、日期型(Date):存儲(chǔ)日期數(shù)據(jù) 格式很多,如:20-AUG-19994、其他:
如:圓點(diǎn)數(shù)值型(dot)、用戶自定義型(customer)注意:顯示寬度不影響數(shù)據(jù)的存儲(chǔ)SPSS數(shù)據(jù)文件的結(jié)構(gòu)2、字符型(String):存儲(chǔ)字SPSS數(shù)據(jù)文件的結(jié)構(gòu)(三)變量名標(biāo)簽(Variablelabel):
對(duì)變量名的一些解釋說明,增強(qiáng)分析結(jié)果的可視性??梢允÷浴#ㄋ模┳兞恐禈?biāo)簽(Valuelabel)
對(duì)變量所取值的一些解釋說明,增強(qiáng)分析結(jié)果的可視性??梢允÷?。 一般用于品質(zhì)數(shù)據(jù)如:1-男2-女、1-高2-中3-低SPSS數(shù)據(jù)文件的結(jié)構(gòu)(三)變量名標(biāo)簽(VariablelSPSS數(shù)據(jù)文件的結(jié)構(gòu)(五)變量列格式(ColumnFormat)對(duì)齊方式(TextAlignment)
左對(duì)齊(Left):字符型默認(rèn)。 右對(duì)齊(Right):數(shù)值型默認(rèn)。 居中對(duì)齊(Center)列寬度(ColumnWidth)
默認(rèn)值為變量的總長(zhǎng)度。SPSS數(shù)據(jù)文件的結(jié)構(gòu)(五)變量列格式(ColumnForSPSS數(shù)據(jù)文件的結(jié)構(gòu)(六)缺失值(MissingValues)1、什么是缺失值? 漏填數(shù)據(jù) 明顯錯(cuò)誤的數(shù)據(jù)2、對(duì)缺失值的一般處理
事先指定:指定某個(gè)特定值為缺失值(用戶缺失值) 其他處理方法,如:以均值、眾數(shù)替代等3、SPSS缺失值用戶缺失值系統(tǒng)缺失值:數(shù)值型:點(diǎn)(?)字符型:空SPSS數(shù)據(jù)文件的結(jié)構(gòu)(六)缺失值(MissingValuSPSS數(shù)據(jù)文件的結(jié)構(gòu)(七)變量計(jì)量尺度(Measurement)scale:定距數(shù)據(jù),一般為數(shù)值型數(shù)據(jù)。 如:收入、人數(shù)。ordinal:有固有順序的順序水準(zhǔn)的數(shù)值型或字符型數(shù)據(jù)。 如:職稱、年齡段nominal:無固有順序的名義水準(zhǔn)的數(shù)值型或字符型數(shù)據(jù)。 如:性別、民族SPSS數(shù)據(jù)文件的結(jié)構(gòu)(七)變量計(jì)量尺度(Measureme定義SPSS數(shù)據(jù)文件結(jié)構(gòu)操作方法:利用變量視圖如何查看變量定義的情況菜單選項(xiàng):
Utilities->Variables定義SPSS數(shù)據(jù)文件結(jié)構(gòu)操作方法:利用變量視圖SPSS數(shù)據(jù)的錄入與保存錄入時(shí)應(yīng)注意:黑框確定當(dāng)前數(shù)據(jù)單元錄入帶有變量值標(biāo)簽的數(shù)據(jù):手工輸入代碼,屏幕顯示變量值標(biāo)簽凍結(jié)第一列數(shù)據(jù)保存:操作保存格式:
(1)*.sav:SPSS數(shù)據(jù)文件(默認(rèn))。(2)*.dbf:dbase數(shù)據(jù)文件。(3)*.xls:Excel工作表文件。注意:有些信息會(huì)丟失SPSS數(shù)據(jù)的錄入與保存錄入時(shí)應(yīng)注意:SPSS數(shù)據(jù)的編輯(一)打開數(shù)據(jù)文件
菜單選項(xiàng):File->Open->.sav(二)數(shù)據(jù)定位按個(gè)案號(hào)碼定位菜單:Data->Gotocase->輸入樣本號(hào)按值定位光標(biāo)定位到某列變量上->Edit->Find...SPSS數(shù)據(jù)的編輯(一)打開數(shù)據(jù)文件SPSS數(shù)據(jù)的編輯(三)插入和刪除一個(gè)個(gè)案插入:data->insertcase刪除:選定待刪行,鼠標(biāo)右鍵找到Cut(四)插入和刪除一個(gè)變量插入:光標(biāo)定位到某列變量上->Data->InsertVariable(插到某列前)或鼠標(biāo)右鍵刪除:選定列,鼠標(biāo)右鍵Cut項(xiàng)SPSS數(shù)據(jù)的編輯(三)插入和刪除一個(gè)個(gè)案SPSS數(shù)據(jù)的編輯(五)數(shù)據(jù)移動(dòng)、復(fù)制和刪除定義源數(shù)據(jù)塊鼠標(biāo)右鍵:cutcopyclear確定目標(biāo)單元鼠標(biāo)右鍵:pasteSPSS數(shù)據(jù)的編輯(五)數(shù)據(jù)移動(dòng)、復(fù)制和刪除數(shù)據(jù)文件的合并目的:將兩個(gè)SPSS數(shù)據(jù)文件合并到一個(gè)數(shù)據(jù)文件中文件合并的方式:縱向合并橫向合并數(shù)據(jù)文件的合并目的:(一)縱向數(shù)據(jù)合并(1)含義:
將磁盤上的一個(gè)SPSS數(shù)據(jù)文件追加到當(dāng)前dataeditor窗口中的數(shù)據(jù)文件中。(2)前提:
兩個(gè)SPSS數(shù)據(jù)文件應(yīng)可以合并的內(nèi)容,且最好有相同的變量名和變量類型。(3)菜單選項(xiàng):
data->mergefile->addcases數(shù)據(jù)文件的合并(一)縱向數(shù)據(jù)合并數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并(二)橫向數(shù)據(jù)合并(1)含義:將磁盤上的一個(gè)SPSS數(shù)據(jù)文件中的若干個(gè)變量增加到當(dāng)前dataeditor窗口的數(shù)據(jù)文件中。(2)前提:
a.兩個(gè)數(shù)據(jù)文件必須有一個(gè)共同的變量名為關(guān)鍵字段---合并的依據(jù);
b.兩個(gè)數(shù)據(jù)文件應(yīng)事先按關(guān)鍵字段升序排序。數(shù)據(jù)文件的合并(二)橫向數(shù)據(jù)合并數(shù)據(jù)文件的合并(二)橫向數(shù)據(jù)合并(3)菜單選項(xiàng):
data->mergefile->addvariable(4)選項(xiàng)說明:mathcasesonkeyvariablesinsortedfiles:以關(guān)鍵字作為合并標(biāo)志。
Bothfilesprovidecases:合并后的文件的數(shù)據(jù)由兩個(gè)文件共同提供。Externalfileiskeyedtable:以dataeditor的數(shù)據(jù)為基礎(chǔ)。Workingdatafileiskeyedtable:以磁盤文件的數(shù)據(jù)為基礎(chǔ)。數(shù)據(jù)文件的合并(二)橫向數(shù)據(jù)合并與其他軟件數(shù)據(jù)共享共享dbf和xls格式文件
菜單選項(xiàng):Data->Open
(1)*.dbf:dbase數(shù)據(jù)文件。字段名、字段類型自動(dòng)轉(zhuǎn)成SPSS數(shù)據(jù)文件中的變量名和類型。一條記錄為一個(gè)個(gè)案。 (2)*.xls:Excel文件 (Readvariablename選項(xiàng))共享數(shù)據(jù)庫文件建立ODBC數(shù)據(jù)源
與其他軟件數(shù)據(jù)共享共享dbf和xls格式文件第三章SPSS數(shù)據(jù)文件的基本加工和處理第三章SPSS數(shù)據(jù)文件的基本加工和處理SPSS數(shù)據(jù)文件的基本加工和處理數(shù)據(jù)文件的整理
個(gè)案排序、個(gè)案選取數(shù)據(jù)加工變量計(jì)算、計(jì)數(shù)數(shù)據(jù)分組自動(dòng)分組、手工分組數(shù)據(jù)文件的其他處理功能指定加權(quán)變量SPSS數(shù)據(jù)文件的基本加工和處理數(shù)據(jù)文件的整理目的:將所有個(gè)案按照用戶指定的某一個(gè)或多個(gè)變量的變量值的升序或降序重新排列。菜單選項(xiàng):
data->sortcases注意: (1)Ascending:升序、Descending:降序。 (2)多重排序,選擇變量名的次序很關(guān)鍵。個(gè)案排序排序在數(shù)據(jù)分析中的作用?目的:個(gè)案排序排序在數(shù)據(jù)分析中的作用?個(gè)案選取目的:從現(xiàn)有數(shù)據(jù)中挑選出部分?jǐn)?shù)據(jù)。菜單選項(xiàng):data->selectcases選取個(gè)案的幾種不同方式(1)選擇符合一定條件的個(gè)案(Ifconditionissatisfied)(2)隨機(jī)選取個(gè)案(Randomsampleofcases) 近似選取、精確選取(3)選取某一區(qū)域內(nèi)的個(gè)案(Basedontimeorcaserange)(4)使用過濾變量(usefiltervariable)注意:以后的操作和分析都在該個(gè)案選取的基礎(chǔ)上進(jìn)行.個(gè)案選取在數(shù)據(jù)分析中的作用?個(gè)案選取目的:個(gè)案選取在數(shù)據(jù)分析中的作用?變量計(jì)算目的:產(chǎn)生新變量或?qū)υ兞窟M(jìn)行必要的轉(zhuǎn)換處理(如:預(yù)測(cè)問題產(chǎn)生比率數(shù)據(jù)偏態(tài)數(shù)據(jù)的正態(tài)處理時(shí)間序列的平穩(wěn)處理等)(1)含義:根據(jù)用戶給出的SPSS算術(shù)表達(dá)式,對(duì)所有或部分樣本數(shù)據(jù)進(jìn)行加工。(2)菜單選項(xiàng):
transform->computeif按鈕(3)SPSS算術(shù)表達(dá)式(NumericExpression):由算術(shù)運(yùn)算符(+、-、*、/、**)、SPSS函數(shù)以及SPSS變量名組成的式子。變量計(jì)算目的:產(chǎn)生新變量或?qū)υ兞窟M(jìn)行必要的轉(zhuǎn)換處理變量計(jì)算算術(shù)函數(shù)統(tǒng)計(jì)函數(shù)分布函數(shù)邏輯函數(shù)字符串函數(shù)缺失值函數(shù)日期時(shí)間函數(shù)其他函數(shù)(4)SPSS函數(shù)變量計(jì)算算術(shù)函數(shù)(4)SPSS函數(shù)算術(shù)函數(shù)Abs():求絕對(duì)值sqrt():求平方根rnd():四舍五入后取整trunc():截取小數(shù)部分取整mod():取余Ln():自然對(duì)數(shù)Lg10():以10為底的對(duì)數(shù)(4)SPSS函數(shù)變量計(jì)算算術(shù)函數(shù)(4)SPSS函數(shù)變量計(jì)算統(tǒng)計(jì)函數(shù):mean():均值sd():標(biāo)準(zhǔn)差sum():求總和cfvar():求變異系數(shù)max()min():求最大最小值(4)SPSS函數(shù)變量計(jì)算統(tǒng)計(jì)函數(shù):(4)SPSS函數(shù)變量計(jì)算分布函數(shù):normal():產(chǎn)生服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù)序列uniform():產(chǎn)生均勻分布的隨機(jī)數(shù)序列rv.():產(chǎn)生指定分布的隨機(jī)數(shù)序列,如:rv.t(10)cdf.():計(jì)算指定分布的累計(jì)概率值idf.():計(jì)算指定分布的臨界值(4)SPSS函數(shù)變量計(jì)算分布函數(shù):(4)SPSS函數(shù)變量計(jì)算邏輯函數(shù):range():判斷變量值是否在指定的區(qū)間內(nèi)any():判斷變量值是否為指定的若干值字符串函數(shù):index(S1,S2):判斷字符串S2在S1中首次出現(xiàn)的位置length():求字符串長(zhǎng)度lower()upcase():字符串的大小寫轉(zhuǎn)換lpad():用指定字符補(bǔ)齊字符串為指定長(zhǎng)度ltrim():壓縮字符串空格substr():取子串(4)SPSS函數(shù)變量計(jì)算邏輯函數(shù):(4)SPSS函數(shù)變量計(jì)算缺失值函數(shù)missing():判斷變量是否取系統(tǒng)或用戶缺失值sysmis():判斷變量是否取系統(tǒng)缺失值其他函數(shù):Lag():便于進(jìn)行差分計(jì)算(4)SPSS函數(shù)變量計(jì)算缺失值函數(shù)(4)SPSS函數(shù)變量計(jì)算變量轉(zhuǎn)換(5)SPSS條件表達(dá)式:條件表達(dá)式:由SPSS關(guān)系運(yùn)算符、邏輯運(yùn)算符、SPSS函數(shù)以及SPSS變量名組成的式子。
關(guān)系運(yùn)算符: >(大于)、<(小于)、=(等于)、~=(不等于)、>=(大于等于)、<=(小于等于)如:nl>32、sr<=700邏輯運(yùn)算符: &(AND):并且
|(OR):或者 ~(NOT):非如:(nl>32)and(sr<=700)(nl=32)|(sr<>700)notxb=1變量轉(zhuǎn)換(5)SPSS條件表達(dá)式:邏輯運(yùn)算符:計(jì)數(shù)(1)含義:對(duì)所有或部分個(gè)案,計(jì)算若干個(gè)變量中有幾個(gè)變量的值落在指定的區(qū)域內(nèi),并將結(jié)果存入新變量中。(2)菜單選項(xiàng):
transform->count->definevalue計(jì)數(shù)(1)含義:產(chǎn)生計(jì)數(shù)變量(3)指定區(qū)域的定義Value:指定一個(gè)值system-missing:系統(tǒng)缺失值system-orusermissing:系統(tǒng)或用戶缺失值rangethrough:指定一個(gè)閉區(qū)域,給出最大和最小值range:lowestthroughn:最小值到某個(gè)給定值range:nthroughhighest:某個(gè)給定值到最大值產(chǎn)生計(jì)數(shù)變量(3)指定區(qū)域的定義數(shù)據(jù)文件的分類匯總(1)含義:按指定的分類變量的變量值對(duì)個(gè)案分組;計(jì)算每組個(gè)案的匯總變量的基本統(tǒng)計(jì)量;將計(jì)算結(jié)果生成到一新文件中,即:在新文件中對(duì)應(yīng)分類變量的每一個(gè)分類值產(chǎn)生一個(gè)個(gè)案。原始數(shù)據(jù)按性別變量匯總數(shù)據(jù)數(shù)據(jù)文件的分類匯總(1)含義:原始數(shù)據(jù)按性別變量匯總數(shù)據(jù)數(shù)據(jù)文件的分類匯總(2)菜單選項(xiàng):
data->aggregate(3)說明:多重分組時(shí),變量名的選擇順序。生成的新文件名默認(rèn)為:aggr.sav??尚薷摹I傻男伦兞棵J(rèn)為原變量名后加_1。可修改。可以在新文件中存貯個(gè)分組個(gè)案數(shù).數(shù)據(jù)文件的分類匯總(2)菜單選項(xiàng): 數(shù)據(jù)分組目的:了解數(shù)據(jù)的總體分布狀況思路:指定按哪個(gè)變量分組,即:指定分組變量定義分組變量的分組區(qū)間(不重、不漏)指定一個(gè)存放分組結(jié)果的標(biāo)志變量分組方法:自動(dòng)分組手工分組數(shù)據(jù)分組數(shù)據(jù)分組(一)自動(dòng)分組單變量值分組(1)含義:分組變量值相同的個(gè)案分在同一組,同組中的標(biāo)志變量相同。標(biāo)志變量依照分組變量值的大小次序給定。(單變量分組,通常只適合于離散變量且變量值較少的情況)(2)菜單選項(xiàng):
transform->automaticrecode…分位值自動(dòng)分組(1)含義:將定距型變量按分位數(shù)要求自動(dòng)劃分成相應(yīng)類(2)菜單選項(xiàng):transform->categorizevariables數(shù)據(jù)分組(一)自動(dòng)分組數(shù)據(jù)分組(二)手工分組(組距分組)(1)含義:人工定義分組區(qū)域,對(duì)所有個(gè)案或符合一定條件的個(gè)案進(jìn)行等距或非等距分組。(2)方法:
分組結(jié)果存入原變量、分組結(jié)果存入新變量數(shù)據(jù)分組(二)手工分組(組距分組)數(shù)據(jù)分組(3)分組結(jié)果存入原變量:定義分組區(qū)域:定義某一區(qū)間的原變量值分組后所對(duì)應(yīng)的新值是什么.未定義的原變量值保持不變。菜單選項(xiàng):
transform->recode->intosamevariables…說明:可以指定對(duì)符合一定條件的個(gè)案進(jìn)行分組。
數(shù)據(jù)分組(3)分組結(jié)果存入原變量:數(shù)據(jù)分組(4)分組結(jié)果存入新變量:定義分組區(qū)域:定義某一區(qū)間的原變量值分組后所對(duì)應(yīng)的新值是什么.未定義的原變量值在新變量中為系統(tǒng)缺失值。菜單選項(xiàng):
transform->recode->intodifferentvariables…定義原變量分組后產(chǎn)生的相應(yīng)新變量(CHANGE鈕)可以指定對(duì)符合一定條件的個(gè)案進(jìn)行分組。單值區(qū)間可以實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換(問卷分析中的反向題重新計(jì)分)數(shù)據(jù)分組(4)分組結(jié)果存入新變量:問卷分析中的反向題重新計(jì)分舉例性格打分(內(nèi)向、一般、外向)1、與生人交往會(huì)“自來熟”(1)從不(2)偶爾(3)有時(shí)(4)經(jīng)常
2、與不熟悉的異性交往,會(huì)臉紅(1)從不(2)偶爾(3)有時(shí)(4)經(jīng)常3、在公眾場(chǎng)合下你會(huì)大聲發(fā)表自己的意見(1)從不(2)偶爾(3)有時(shí)(4)經(jīng)常極為內(nèi)向:3分較為內(nèi)向:6分較為外向:9分極為外向:12分
問卷分析中的反向題重新計(jì)分舉例性格打分(內(nèi)向、一般、外向)指定加權(quán)變量(1)含義:
指定某一變量為加權(quán)變量。如:平均蔬菜價(jià)格、男足打分(2)菜單選項(xiàng):
data->weightcase(3)說明如果取消加權(quán)變量應(yīng)重新定義:data->weightcasedonotweightcases指定加權(quán)變量(1)含義:作業(yè)根據(jù)給定的兩個(gè)關(guān)于學(xué)生成績(jī)的SPSS數(shù)據(jù)文件做如下處理:合并兩個(gè)數(shù)據(jù)文件(數(shù)據(jù)不一定是一一對(duì)應(yīng)的)計(jì)算每個(gè)同學(xué)的總成績(jī)、平均成績(jī)、標(biāo)準(zhǔn)差計(jì)算每個(gè)同學(xué)的得優(yōu)率和得良率根據(jù)得優(yōu)率排名將各門課程的成績(jī)按優(yōu)、良、中、及格和不及格重新分組分別計(jì)算男生和女生的各科的平均成績(jī)、標(biāo)準(zhǔn)差,并保存計(jì)算結(jié)果到SPSS數(shù)據(jù)文件。作業(yè)根據(jù)給定的兩個(gè)關(guān)于學(xué)生成績(jī)的SPSS數(shù)據(jù)文件做如下處理:第四章SPSS的基本統(tǒng)計(jì)分析第四章SPSS的基本統(tǒng)計(jì)分析基本統(tǒng)計(jì)分析頻數(shù)分析計(jì)算基本描述統(tǒng)計(jì)量(分布特征測(cè)度)圖形分析工具列聯(lián)分析基本統(tǒng)計(jì)分析頻數(shù)分析頻數(shù)分析目的 粗略把握變量值的分布狀況。例:研究被調(diào)查者的特征(如:性別、年齡、收入)研究被調(diào)查者對(duì)某個(gè)問題的總體看法(如:教學(xué)方式、選修課程)研究被調(diào)查者某方面的狀態(tài)(如:購(gòu)買家電的類型、居民月支出狀況)采用的方法計(jì)算頻分布表:包括計(jì)算頻數(shù)、百分比、累計(jì)百分比繪制統(tǒng)計(jì)圖形:條形圖、餅圖頻數(shù)分析目的頻數(shù)分析基本操作步驟(1)菜單選項(xiàng):analyze->descriptivestatistics->frequencies(2)選擇幾個(gè)待分析的變量到variables框.(3)chart選項(xiàng),選擇所需要的圖形頻數(shù)分析基本操作步驟頻數(shù)分析應(yīng)用舉例儲(chǔ)戶的職業(yè)分析特點(diǎn):定類數(shù)據(jù)頻數(shù)分布表輸出按頻數(shù)升降序輸出儲(chǔ)戶收入水平分析特點(diǎn):定序數(shù)據(jù)除使用頻數(shù)、百分比、總數(shù)外,還可以充分使用累計(jì)百分比頻數(shù)分析應(yīng)用舉例頻數(shù)分析頻數(shù)分析中的其他分析計(jì)算分位數(shù):適用于定距數(shù)據(jù)數(shù)據(jù)按升序排序后,找到若干個(gè)分位點(diǎn)上的變量值quartiles:計(jì)算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU)
cutpointsfornequalgroups:n等份percentile:自定義百分位點(diǎn)分位數(shù)的應(yīng)用在排除極端值影響的條件下,通過計(jì)算分位數(shù)差,比較兩組樣本數(shù)據(jù)的離散程度例:(QL=50,QU=80)和(QL=70,QU=75)的比較分位數(shù)、中位數(shù)、眾數(shù)的應(yīng)用舉例不同戶口所在地的儲(chǔ)戶取款金額比較利用分位數(shù)(不顯示頻數(shù)分析表)頻數(shù)分析頻數(shù)分析中的其他分析計(jì)算描述統(tǒng)計(jì)量目的精確把握變量的總體分布狀況,了解數(shù)據(jù)的集中趨勢(shì)、離散趨勢(shì)、對(duì)稱程度、陡峭程度?;痉椒ㄓ?jì)算基本描述統(tǒng)計(jì)量計(jì)算描述統(tǒng)計(jì)量目的計(jì)算描述統(tǒng)計(jì)量描述集中趨勢(shì)的統(tǒng)計(jì)量均值(mean):表示某變量所有變量值集中趨勢(shì)或平均水平的統(tǒng)計(jì)量。適用于定距數(shù)據(jù)。特點(diǎn):利用了全部數(shù)據(jù),易受極端值的影響。描述離散程度的統(tǒng)計(jì)量標(biāo)準(zhǔn)差(standarddeviation--StdDev):表示某變量的所有變量值離散程度的統(tǒng)計(jì)量。SPSS中計(jì)算的是樣本標(biāo)準(zhǔn)差。方差(variance):標(biāo)準(zhǔn)差的平方。SPSS中計(jì)算的是樣本方差。極差(range):最大值(maximum)—最小值(minimum)計(jì)算描述統(tǒng)計(jì)量描述集中趨勢(shì)的統(tǒng)計(jì)量計(jì)算描述統(tǒng)計(jì)量描述對(duì)稱程度的統(tǒng)計(jì)量
偏度(skewness):描述某變量分布形態(tài)的偏斜程度和方向的統(tǒng)計(jì)量.偏度為0表示對(duì)稱;大于0表示正偏差大(右偏),頻數(shù)最大的值比均值小,極值大于均值;小于0表示負(fù)偏差大(左偏)計(jì)算描述統(tǒng)計(jì)量描述對(duì)稱程度的統(tǒng)計(jì)量計(jì)算描述統(tǒng)計(jì)量描述陡峭程度的統(tǒng)計(jì)量峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。峭度為0表示與標(biāo)準(zhǔn)正態(tài)分布峭度相同。大于0表示比標(biāo)準(zhǔn)正態(tài)分布陡,尖峰。小于0表示比標(biāo)準(zhǔn)正態(tài)分布緩;平峰。計(jì)算描述統(tǒng)計(jì)量描述陡峭程度的統(tǒng)計(jì)量計(jì)算描述統(tǒng)計(jì)量其他統(tǒng)計(jì)量
標(biāo)準(zhǔn)誤差(standarderrorS.E):抽樣分布中的標(biāo)準(zhǔn)差,反映樣本誤差。
均值標(biāo)準(zhǔn)誤差(meansofS.E)中心極限定理認(rèn)為:樣本均值~N(u,2/n)反映樣本均值與總體真值間的平均離散程度樣本數(shù)越大,樣本均值的離散程度越小,對(duì)真值的估計(jì)越準(zhǔn)確計(jì)算描述統(tǒng)計(jì)量其他統(tǒng)計(jì)量計(jì)算描述統(tǒng)計(jì)量基本操作步驟(1)菜單選項(xiàng):analyze->descriptivestatistics->descripive(2)選擇將參加計(jì)算的數(shù)值型變量名到variables框。分析比較不同戶口所在地儲(chǔ)戶取款情況比較集中趨勢(shì)比較離散趨勢(shì)比較偏斜程度比較陡峭程度實(shí)現(xiàn)方式:數(shù)據(jù)拆分計(jì)算描述統(tǒng)計(jì)量基本操作步驟其他功能數(shù)據(jù)標(biāo)準(zhǔn)化處理新變量的均值為0,標(biāo)準(zhǔn)差為1;小于0表示在平均水平下,大于0反之.正態(tài)分布的數(shù)據(jù)標(biāo)準(zhǔn)化后呈標(biāo)準(zhǔn)正態(tài)分布(68.2%,95.4%,99.7%)savestandardizedvaluesasvariables選項(xiàng)將變量作標(biāo)準(zhǔn)化后,結(jié)果存入名為“Z+原變量名”的新變量中.數(shù)據(jù)標(biāo)準(zhǔn)化處理應(yīng)用舉例你能以較簡(jiǎn)便的方法快速找到取款數(shù)目出眾的儲(chǔ)戶嗎?計(jì)算描述統(tǒng)計(jì)量其他功能計(jì)算描述統(tǒng)計(jì)量基本統(tǒng)計(jì)分析的圖形工具以制作條形圖為例基本統(tǒng)計(jì)分析的圖形工具以制作條形圖為例以制作條形圖為例第一種模式下的三種圖形:用于某變量在各分類情況的比較基本統(tǒng)計(jì)分析的圖形工具以制作條形圖為例基本統(tǒng)計(jì)分析的圖形工具以制作條形圖為例第二種模式下的三種圖形:用于若干變量的統(tǒng)計(jì)量的比較基本統(tǒng)計(jì)分析的圖形工具以制作條形圖為例基本統(tǒng)計(jì)分析的圖形工具箱線圖(箱線圖中以四分位差的1.5倍為標(biāo)準(zhǔn)剔除值)基本統(tǒng)計(jì)分析的圖形工具箱線圖基本統(tǒng)計(jì)分析的圖形工具直方圖和P-P圖基本統(tǒng)計(jì)分析的圖形工具直方圖和P-P圖基本統(tǒng)計(jì)分析的圖形工具交叉分組下的頻數(shù)分析目的
了解不同變量在不同水平下的數(shù)據(jù)分布情況例:學(xué)習(xí)成績(jī)與性別有關(guān)聯(lián)嗎?(兩變量)例:職業(yè)、性別、愛逛商店有關(guān)聯(lián)嗎?(三變量)分析的主要步驟產(chǎn)生交叉列聯(lián)表分析列聯(lián)表中變量間的關(guān)系交叉分組下的頻數(shù)分析目的產(chǎn)生交叉列聯(lián)表基本操作步驟(1)菜單選項(xiàng):analyze->descriptivestatistics->
crosstabs(2)選擇一個(gè)變量作為行變量到row框.(3)選擇一個(gè)變量作為列變量到column框.(4)可選一個(gè)或多個(gè)變量作為控制變量到layer框.控制變量的層次設(shè)置:同層為水平數(shù)加;不同層為水平數(shù)積.(5)是否顯示各分組的棒圖(displayclusteredbarcharts)產(chǎn)生交叉列聯(lián)表基本操作步驟產(chǎn)生交叉列聯(lián)表應(yīng)用舉例戶口與收入水平有關(guān)聯(lián)嗎嗎?行變量:戶口;列變量:月收入不同戶口不同收入水平的儲(chǔ)戶對(duì)物價(jià)水平的看法一致嗎?行變量:收入水平;列變量:物價(jià)水平;控制變量:戶口產(chǎn)生交叉列聯(lián)表應(yīng)用舉例產(chǎn)生交叉列聯(lián)表應(yīng)用舉例不同戶口不同收入水平的儲(chǔ)戶對(duì)物價(jià)水平水平的看法一致嗎?產(chǎn)生交叉列聯(lián)表應(yīng)用舉例不同戶口不同收入水平的儲(chǔ)戶對(duì)物價(jià)水平水產(chǎn)生交叉列聯(lián)表進(jìn)一步計(jì)算
cells選項(xiàng):選擇在頻數(shù)分析表中輸出各種百分比.row:行百分比(Rowpct);column:列百分比(Colpct);total:總百分比(Totpct);
產(chǎn)生交叉列聯(lián)表進(jìn)一步計(jì)算分析列聯(lián)表中變量間的關(guān)系目的:
通過列聯(lián)表分析,檢驗(yàn)行列變量之間是否獨(dú)立。方法:
卡方檢驗(yàn):對(duì)品質(zhì)數(shù)據(jù)的相關(guān)性進(jìn)行度量分析列聯(lián)表中變量間的關(guān)系目的:分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)?zāi)挲g與工資收入交叉列聯(lián)表 低中高 青 4000 0 中 0500 0 老 00 600 低中高 青 00 500 中 0600 0老 4000 0
分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)基本步驟(1)H0:行列變量之間無關(guān)聯(lián)或相互獨(dú)立(2)構(gòu)造卡方統(tǒng)計(jì)量統(tǒng)計(jì)量服從(r-1)*(c-1)個(gè)自由度的卡方分布count:觀察(實(shí)際)頻數(shù)expectedcount:期望頻數(shù)(期望頻數(shù)反映的是H0成立情況下的數(shù)據(jù)分布特征)Residual:剩余(觀察頻數(shù)-期望頻數(shù))分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)基本步驟分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)基本步驟(3)計(jì)算卡方統(tǒng)計(jì)量的值,并得到該統(tǒng)計(jì)量值的概率P值(4)決策。概率P與顯著性水平比較,小于等于則拒絕H0,否則不能拒絕實(shí)現(xiàn)步驟statistics選項(xiàng)cells選項(xiàng)分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)基本步驟分析列聯(lián)表中變量間的關(guān)系應(yīng)用舉例戶口對(duì)平均收入水平的分布會(huì)產(chǎn)生影響嗎?獨(dú)立性檢驗(yàn):從一個(gè)總體中隨機(jī)抽樣。按某兩個(gè)屬性變量將樣本進(jìn)行分類不同行業(yè)人對(duì)的自己職業(yè)的選擇標(biāo)準(zhǔn)是否存在差異?一致性檢驗(yàn):從兩個(gè)總體中獨(dú)立抽樣,根據(jù)一個(gè)屬性變量將樣本進(jìn)行分類。制造業(yè)服務(wù)業(yè)物質(zhì)報(bào)酬10545穩(wěn)定性4035分析列聯(lián)表中變量間的關(guān)系應(yīng)用舉例分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)的要求:一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過20%,否則會(huì)夸大卡方值,容易得出拒絕結(jié)論,可以合并單元格。卡方值會(huì)受樣本數(shù)的影響分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)的要求:分析列聯(lián)表中變量間的關(guān)系行列變量相關(guān)性的其他測(cè)度指標(biāo)phi系數(shù):適用于2×2列聯(lián)表當(dāng)行列變量獨(dú)立時(shí):有:當(dāng)行列變量完全相關(guān)時(shí):有:越接近于1,相關(guān)性越強(qiáng)。越接近0,相關(guān)性越弱分析列聯(lián)表中變量間的關(guān)系行列變量相關(guān)性的其他測(cè)度指標(biāo)分析列聯(lián)表中變量間的關(guān)系行列變量相關(guān)性的其他測(cè)度指標(biāo)列聯(lián)C系數(shù)(contingencycoefficient),通常為[0,1),取值受到行列數(shù)的影響(見EXCEL)V系數(shù)[0,1]值越大表示行列變量的相關(guān)性越大分析列聯(lián)表中變量間的關(guān)系行列變量相關(guān)性的其他測(cè)度指標(biāo)多選項(xiàng)分析多選項(xiàng)分析的基本思路定義多選項(xiàng)變量集多選項(xiàng)頻數(shù)分析多選項(xiàng)交叉分組下的頻數(shù)分析多選項(xiàng)分析多選項(xiàng)分析的基本思路多選項(xiàng)分析定義多選項(xiàng)變量集目的:將已分解的變量定義為一個(gè)集合,便于進(jìn)行多選項(xiàng)分析菜單選項(xiàng):analyze->multipleresponse->definesets從原變量中選取被分解的變量(數(shù)值型)到variablesinsets框指定被分解的變量是按多選項(xiàng)二分法(dichotomize)分解還是按多選項(xiàng)分類法(categories)分解的為變量集命名。系統(tǒng)自動(dòng)在名字前加字符$.多選項(xiàng)分析定義多選項(xiàng)變量集多選項(xiàng)分析多選項(xiàng)頻數(shù)分析菜單選項(xiàng):analyze->multipleresponse->frequencies多選項(xiàng)交叉分析下的頻數(shù)分析菜單選項(xiàng):analyze->multipleresponse->crosstabs多選項(xiàng)分析多選項(xiàng)頻數(shù)分析多選項(xiàng)分析多選項(xiàng)分析實(shí)例分析居民的儲(chǔ)蓄目的采用多選項(xiàng)分類法組織數(shù)據(jù)在某次市場(chǎng)調(diào)查中收集了北京、上海和廣州三個(gè)城市的受訪者對(duì)幾種常見飲料的喜好情況,可選的飲料有茶、牛奶、咖啡、果汁、礦泉水。(數(shù)據(jù)是從原始數(shù)據(jù)庫中抽出的一小部分資料),作以下分析:采用二分法組織數(shù)據(jù)受訪人群中最受歡迎的飲料是哪種?男、女喜愛的飲料有無差異?三個(gè)城市的人群對(duì)飲料的喜好有無差異?多選項(xiàng)分析多選項(xiàng)分析實(shí)例
作業(yè)根據(jù)第三章的關(guān)于學(xué)生成績(jī)的合并后的SPSS數(shù)據(jù)文件做以下處理:對(duì)各門課程分組后,做頻數(shù)分析,繪制某兩門課程成績(jī)的直方圖繪制男女生構(gòu)成的餅圖分別計(jì)算男女生各門成績(jī)的基本描述統(tǒng)計(jì)量,并對(duì)數(shù)據(jù)的集中趨勢(shì)、離散程度和偏度加以比較(數(shù)字和圖形的對(duì)比)作業(yè)根據(jù)第三章的關(guān)于學(xué)生成績(jī)的合并后的SPSS數(shù)據(jù)文件做以第五章SPSS參數(shù)檢驗(yàn)第五章SPSS參數(shù)檢驗(yàn)假設(shè)檢驗(yàn)概述假設(shè)檢驗(yàn)是一種根據(jù)樣本數(shù)據(jù)來推斷總體的分布或均值、方差等總體統(tǒng)計(jì)參數(shù)的方法。根據(jù)樣本來推斷總體的原因:總體數(shù)據(jù)不可能全部收集到。如:質(zhì)量檢測(cè)問題收集到總體全部數(shù)據(jù)要耗費(fèi)大量的人力和財(cái)力假設(shè)檢驗(yàn)包括:參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)假設(shè)檢驗(yàn)概述假設(shè)檢驗(yàn)是一種根據(jù)樣本數(shù)據(jù)來推斷總體的分布或均值假設(shè)檢驗(yàn)的基本原理基本信念:利用小概率原理進(jìn)行反證明。小概率事件在一次實(shí)驗(yàn)中不可能發(fā)生。例如:對(duì)人民大學(xué)男生平均身高進(jìn)行推斷H0:平均身高為173樣本平均身高為178,由于存在抽樣誤差,不能直接拒絕H0。而需要考慮:在H0成立的條件下,一次抽樣得到平均身高為178的可能性有多大。如果可能性較大,是個(gè)大概率事件(與相比較),則不能認(rèn)為H0不正確。否則,如果可能性較小,是個(gè)小概率事件,但確實(shí)發(fā)生了,則只能認(rèn)為H0不正確。概率P值即為觀測(cè)結(jié)果或更極端現(xiàn)象在零假設(shè)成立時(shí)出現(xiàn)的概率假設(shè)檢驗(yàn)的基本原理基本信念:利用小概率原理進(jìn)行反證明。小概率假設(shè)檢驗(yàn)的基本步驟(1)根據(jù)檢驗(yàn)的目標(biāo),對(duì)待推斷的總體參數(shù)或分布作一個(gè)基本假設(shè)H0(2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,且該統(tǒng)計(jì)量服從某種已知分布.(3)利用收集到的樣本數(shù)據(jù)和基本假設(shè)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,并得到相應(yīng)的相伴概率P值,即:檢驗(yàn)統(tǒng)計(jì)量在某個(gè)特定的極端區(qū)域取值在H0成立時(shí)的概率.(4)如果概率P值小于用戶給定的顯著性水平a,則拒絕H0.否則,不拒絕H0.假設(shè)檢驗(yàn)的基本步驟(1)根據(jù)檢驗(yàn)的目標(biāo),對(duì)待推斷的總體參數(shù)或SPSS中的參數(shù)檢驗(yàn)方法單樣本t檢驗(yàn)兩獨(dú)立樣本t檢驗(yàn)兩配對(duì)樣本t檢驗(yàn)SPSS中的參數(shù)檢驗(yàn)方法SPSS單樣本t檢驗(yàn)(一)含義:檢驗(yàn)?zāi)匙兞康目傮w均值與指定的檢驗(yàn)值之間是否存在顯著差異。例如:周歲兒童的平均身高是否為75厘米(二)要求:樣本來自的總體服從正態(tài)分布為什么?SPSS單樣本t檢驗(yàn)(一)含義:為什么?SPSS單樣本t檢驗(yàn)(三)基本思路:H0:u=u0,總體均值與檢驗(yàn)值之間不存在顯著差異.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從樣本均值的分布出發(fā),即:~N(u0,σ2/n).于是:總體方差未知時(shí)構(gòu)造t統(tǒng)計(jì)量D=X-u0t統(tǒng)計(jì)量服從n-1個(gè)自由度的t分布計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P(絕對(duì)值大于等于的雙側(cè)概率)結(jié)論:P≤α,則拒絕H0,認(rèn)為總體均值與檢驗(yàn)值之間有顯著差異.P>α,不能拒絕H0.SPSS單樣本t檢驗(yàn)(三)基本思路:SPSS單樣本t檢驗(yàn)(四)基本操作步驟(1).菜單選項(xiàng):Analyze->comparemeans->one-samplesTtest(2).指定檢驗(yàn)值:在test后的框中輸入檢驗(yàn)值SPSS單樣本t檢驗(yàn)(四)基本操作步驟SPSS單樣本t檢驗(yàn)(五)option選項(xiàng)confidenceinterval:指定輸出-0的置信區(qū)間.默認(rèn)值為95%.Missingvalues:缺失值的處理(單樣本檢驗(yàn)時(shí)以下選項(xiàng)沒有差別)
excludecasesanalysisbyanalysis:當(dāng)分析時(shí)涉及到有缺失值變量時(shí)再剔除相應(yīng)的個(gè)案excludecaseslistwise:剔除所有含缺失值的個(gè)案后再分析SPSS單樣本t檢驗(yàn)(五)option選項(xiàng)SPSS單樣本t檢驗(yàn)(六)應(yīng)用舉例周歲兒童的平均身高為75厘米嗎?根據(jù)以前的大量調(diào)查,已知顧客對(duì)某產(chǎn)品的滿意度評(píng)分在72分左右,現(xiàn)該產(chǎn)品進(jìn)行了重新包裝,收集了一批顧客的滿意度評(píng)分,現(xiàn)在的評(píng)價(jià)是否顯著高于以前?SPSS單樣本t檢驗(yàn)(六)應(yīng)用舉例SPSS兩獨(dú)立樣本t檢驗(yàn)(一)含義:根據(jù)兩獨(dú)立樣本的數(shù)據(jù),對(duì)兩總體均值是否有顯著差異進(jìn)行推斷。例如:男生和女生的計(jì)算機(jī)平均成績(jī)有顯著差異嗎?(二)要求:兩樣本必須相互獨(dú)立,即:抽取其中一批樣本對(duì)抽取另一批樣本沒有任何影響.(如:北京周歲兒童與上海兒童的平均身高)兩總體服從正態(tài)分布為什么?SPSS兩獨(dú)立樣本t檢驗(yàn)(一)含義:為什么?SPSS兩獨(dú)立樣本t檢驗(yàn)(三)基本思路:H0:u1-u2=0,兩總體均值無顯著差異.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從兩樣本均值差的分布出發(fā),即:~N(u1-u2,σ2x1-x2).于是兩總體均方差未知時(shí)構(gòu)造t統(tǒng)計(jì)量:兩總體均值差的抽樣分布標(biāo)準(zhǔn)差:方差相等:用合并方差方差不等:計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P(絕對(duì)值大于等于該值的雙側(cè)概率)SPSS兩獨(dú)立樣本t檢驗(yàn)(三)基本思路:SPSS兩獨(dú)立樣本t檢驗(yàn)(三)基本思路:結(jié)論:方差齊性F檢驗(yàn)利用LeveneF檢驗(yàn)確定兩總體方差是否齊性.H0:兩總體方差無顯著差異.該檢驗(yàn)首先計(jì)算每個(gè)個(gè)案與所屬組均值之差并取絕對(duì)值.然后對(duì)其進(jìn)行單因素方差分析.SPSS兩獨(dú)立樣本t檢驗(yàn)(三)基本思路:SPSS兩獨(dú)立樣本t檢驗(yàn)(三)基本思路:結(jié)論:首先,如果F檢驗(yàn)的P≤α,則拒絕F檢驗(yàn)的H0,認(rèn)為方差不齊性;其次看Unequal行的t檢驗(yàn)概率.如果≤α,則拒絕t檢驗(yàn)的H0,認(rèn)為兩總體均值有顯著差異;如果>α,則不拒絕t檢驗(yàn)的H0.
首先,如果F檢驗(yàn)的P>α,則不能拒絕F檢驗(yàn)的H0,認(rèn)為方差齊性;其次看equal行的t檢驗(yàn)概率.其余同上SPSS兩獨(dú)立樣本t檢驗(yàn)(三)基本思路:SPSS兩獨(dú)立樣本t檢驗(yàn)(四)基本操作步驟(1).菜單選項(xiàng):analyze->comparemeans->independent-samplesT(2).選擇若干變量作為檢驗(yàn)變量到testvariables框(3).選擇代表不同總體的變量作為分組變量到groupingvariable框(4).定義分組變量的分組情況DefineGroups...:usespecifiedvalues:定義分組變量的分組標(biāo)志值分別是什么cutpoint:分組變量為連續(xù)變量.輸入一個(gè)數(shù)字,將大于等于該值的分成一組,小于該值的分成另一組.SPSS兩獨(dú)立樣本t檢驗(yàn)(四)基本操作步驟SPSS兩獨(dú)立樣本t檢驗(yàn)應(yīng)用舉例上海周歲兒童的平均身高與北京周歲兒童的平均身高有顯著差異嗎?某商場(chǎng)為某種產(chǎn)品進(jìn)行了促銷活動(dòng),請(qǐng)比較前后數(shù)日的銷售額,以確認(rèn)促銷活動(dòng)對(duì)銷量有無作用。A、B兩種減肥產(chǎn)品的作用有明顯差異嗎?隨機(jī)選了200名肥胖者服用A種減肥產(chǎn)品,其中:92人體重明顯減輕了;另隨機(jī)選了183名肥胖者服用B減肥產(chǎn)品,其中:161人體重明顯減輕了。SPSS兩獨(dú)立樣本t檢驗(yàn)應(yīng)用舉例SPSS兩配對(duì)樣本t檢驗(yàn)(一)含義:根據(jù)配對(duì)樣本對(duì)兩總體均值是否有顯著差異進(jìn)行推斷.例如:某種減肥茶是否有效(二)要求:兩樣本數(shù)據(jù)必須兩兩配對(duì),即:樣本個(gè)數(shù)相同,個(gè)案順序相同.如:減肥茶的效果、不同廣告形式對(duì)銷售額的影響.(控制了個(gè)案自身的影響)兩總體服從正態(tài)分布SPSS兩配對(duì)樣本t檢驗(yàn)(一)含義:SPSS兩配對(duì)樣本t檢驗(yàn)(三)基本思路H0:兩總體均值無顯著差異,差值序列的均值u0=0.構(gòu)造統(tǒng)計(jì)量:同單樣本均值檢驗(yàn)D=X-u0S為差值序列的標(biāo)準(zhǔn)差實(shí)質(zhì)是先求出每對(duì)測(cè)量值的差值;然后檢驗(yàn)差值序列的均值是否與0有顯著差異.如果差值的均值與0有顯著差異,則認(rèn)為兩總體均值存在顯著差異;否則,與0無顯著差異,則認(rèn)為兩總體均值不存在顯著差異.SPSS兩配對(duì)樣本t檢驗(yàn)(三)基本思路SPSS兩配對(duì)樣本t檢驗(yàn)(三)基本思路計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P(絕對(duì)值大于等于的雙側(cè)概率)結(jié)論:P≤α,則拒絕H0,認(rèn)為兩總體均值有顯著差異.P>α,不能拒絕H0.SPSS兩配對(duì)樣本t檢驗(yàn)(三)基本思路SPSS兩配對(duì)樣本t檢驗(yàn)(四)基本操作步驟(1).菜單選項(xiàng):analyze->comparemeans->paired-samplesT…(2).選擇一對(duì)或若干對(duì)配對(duì)變量作為檢測(cè)變量到pairedvariables框.(3)option選項(xiàng)
同獨(dú)立樣本的T檢驗(yàn)SPSS兩配對(duì)樣本t檢驗(yàn)(四)基本操作步驟SPSS兩配對(duì)樣本t檢驗(yàn)應(yīng)用舉例某種減肥茶真起到減肥作用了嗎?對(duì)促銷人員培訓(xùn)前和培訓(xùn)后銷售額的比較,以確認(rèn)業(yè)務(wù)培訓(xùn)有無效果。SPSS兩配對(duì)樣本t檢驗(yàn)應(yīng)用舉例作業(yè)一、給幼鼠以不同的飼料,研究每天鈣的留存量是否有顯著不同。以下兩種方法涉及實(shí)驗(yàn)樣本:方式1:同一鼠喂不同的飼料鼠號(hào)123456789飼料133.133.126.836.339.530.933.431.528.6飼料236.728.835.135.243.825.736.537.928.7方式2:甲組12只喂飼料1,乙組9只喂飼料2甲組:29.726.728.931.131.126.826.339.530.933.433.128.6乙組:28.728.329.332.231.130.036.236.830.0二、根據(jù)學(xué)生成績(jī)數(shù)據(jù),分析:是否有男女生平均成績(jī)存在明顯差異的課程判斷學(xué)生在哪些課程上的平均成績(jī)差別不明顯作業(yè)一、給幼鼠以不同的飼料,研究每天鈣的留存量是否有顯著不同第六章方差分析第六章方差分析方差分析概述一、問題的提出最優(yōu)方案的設(shè)計(jì)如何獲得最佳的產(chǎn)品銷售量哪些因素是影響銷售量的主要因素哪些因素的那種情況更利于提高銷售量哪些因素的組合更利于提高銷售量可以利用方差分析的方法來實(shí)現(xiàn)方差分析概述一、問題的提出方差分析概述二、方差分析目的:方差分析從分析數(shù)據(jù)的差異入手,分析哪些因素是影響數(shù)據(jù)差異的眾多因素中的主要因素.相關(guān)概念:(1)觀測(cè)變量:作為觀測(cè)的對(duì)象(如:畝產(chǎn)量、推銷量等).(2)控制因素:人為可以控制的因素(如:施肥量、品種、推銷策略、價(jià)格、包裝方式等),在方差分析中稱為控制因素.將控制變量的不同情況稱為控制變量的不同水平.(3)隨機(jī)因素:人為很難控制的因素(如:氣候、推銷人員的形象、抽樣誤差等),方差分析中主要指抽樣誤差。方差分析概述二、方差分析方差分析概述三、核心問題從數(shù)據(jù)差異角度看:觀測(cè)變量的數(shù)據(jù)差異=控制因素造成+隨機(jī)因素造成當(dāng)控制因素對(duì)實(shí)驗(yàn)結(jié)果有顯著影響時(shí),和隨機(jī)因素共同作用必然使觀測(cè)變量產(chǎn)生顯著變動(dòng);反之,觀測(cè)變量的變動(dòng)較小,將歸結(jié)為隨機(jī)性造成的(這里指抽樣誤差造成的).方差分析概述三、核心問題方差分析概述四、方差分析的類型單因素方差分析:只考慮一個(gè)控制因素的影響多因素方差分析:考慮兩個(gè)以上的控制因素和它們的交互作用對(duì)觀測(cè)變量的影響協(xié)方差分析:在盡量排除其他因素的影響下,分析單個(gè)或多個(gè)控制因素對(duì)觀測(cè)變量的影響.(引入?yún)f(xié)變量)方差分析概述四、方差分析的類型單因素方差分析(一)目的 檢驗(yàn)?zāi)骋粋€(gè)控制因素的改變是否會(huì)給觀察變量帶來顯著影響.
例如:應(yīng)用面很廣(科學(xué)試驗(yàn),社會(huì)經(jīng)濟(jì)問題)考察不同肥料對(duì)某農(nóng)作物畝產(chǎn)量是否有顯著差異.考察不同溫度下某化工產(chǎn)品的獲得率考察婦女生育率在不同地區(qū)是否有顯著差異.考察不同學(xué)歷是否對(duì)工資收入產(chǎn)生顯著影響.單因素方差分析(一)目的單因素方差分析(二)基本思路(1)入手點(diǎn):檢驗(yàn)控制變量的不同水平下,各總體的分布是否存在顯著差異,進(jìn)而判斷控制變量是否對(duì)觀測(cè)變量產(chǎn)生了顯著影響.(2)前提:各組樣本獨(dú)立不同水平下各總體服從方差相等的正態(tài)分布.(3)H0:不同水平下,各總體均值無顯著差異.即:不同水平下控制因素的影響不顯著.單因素方差分析(二)基本思路通過參數(shù)檢驗(yàn)可以解決兩兩總體均值的比較多個(gè)總體均值的檢驗(yàn)如何作?(如:北京、上海、廣州周歲兒童平均身高的比較)可以多次采用兩樣本t檢驗(yàn)方法實(shí)現(xiàn)產(chǎn)生的問題:犯第一類錯(cuò)誤的概率明顯增大例如:K個(gè)變量?jī)蓛蛇M(jìn)行t檢驗(yàn),需要作N=k!÷(2!×(k-2)!)次,如果為0.05,那么每次不犯錯(cuò)的概率為0.95。N次檢驗(yàn)均不犯錯(cuò)的概率為0.95N,而犯錯(cuò)的概率為1-0.95N,遠(yuǎn)遠(yuǎn)大于設(shè)定的0.05可以利用方差分析的方法來實(shí)現(xiàn)多個(gè)總體的均值比較單因素方差分析單因素方差分析單因素方差分析(二)基本思路(4)構(gòu)造F統(tǒng)計(jì)量因?yàn)?總變差=組間差異+組內(nèi)差異可證明:SST=SSA+SSE(設(shè):k個(gè)水平,每個(gè)水平有ni個(gè)數(shù)據(jù))考察平均的組間差異與平均的組內(nèi)差異的比值,于是:
~F(k-1,n-k)單因素方差分析(二)基本思路~F(k-1,n-k)單因素方差分析(二)基本思路(5)結(jié)論:F值較大,F值的概率p值小于或等于用戶給定的顯著性水平a,則拒絕H0,認(rèn)為不同水平下各總體均值有顯著差異;F值較小,F值的概率p值大于用戶給定的顯著性水平a,則不能拒絕H0,不可以認(rèn)為不同水平下各總體均值存在顯著差異.單因素方差分析(二)基本思路單因素方差分析(三)數(shù)學(xué)模型設(shè)控制變量A有k個(gè)水平,每個(gè)水平均有ni個(gè)數(shù)據(jù),在水平Ai下第j個(gè)數(shù)據(jù)xij可以分解為:xij=i+iji為水平Ai下的理論指標(biāo)值,ij為誤差,服從正態(tài)分布(0,σ2)i為水平Ai對(duì)試驗(yàn)結(jié)果產(chǎn)生的影響,稱為水平Ai的效應(yīng)。如果A對(duì)觀測(cè)變量沒有影響,則各水平的效應(yīng)全為0,否則不全為0。于是有:H0:α1=α2=α3=…=αk=0單因素方差分析(三)數(shù)學(xué)模型i為水平Ai對(duì)試驗(yàn)結(jié)果產(chǎn)生的影單因素方差分析(四)基本操作步驟(1)菜單選項(xiàng):analyze->comparemeans->one-wayANOVA(2)選擇一個(gè)或多個(gè)變量作為觀察變量到dependentlist框(3)選擇一個(gè)變量作為控制變量到factor框(4)option中的statistics項(xiàng):descriptive:輸出觀察變量不同水平下的描述統(tǒng)計(jì)量單因素方差分析(四)基本操作步驟單因素方差分析(五)應(yīng)用舉例不同推銷方式是否對(duì)推銷額有顯著影響觀測(cè)變量的數(shù)據(jù)安排控制變量可以定義成定類或定序變量觀察方差分析表,分析控制變量對(duì)觀測(cè)變量差異解釋的比例R2不同的施肥量是否對(duì)畝產(chǎn)量造成了顯著影響單因素方差分析(五)應(yīng)用舉例單因素方差分析(六)進(jìn)一步的分析前提的檢驗(yàn):各水平下方差齊性檢驗(yàn)實(shí)現(xiàn)方法:option中的statistics:Homogeneity-of-variance,檢驗(yàn)各水平下各總體方差是否齊性.H0:各水平下各總體方差無顯著差異.單因素方差分析(六)進(jìn)一步的分析單因素方差分析中的多重比較(一)目的
如果各總體均值存在差異,F檢驗(yàn)不能說明哪個(gè)水平造成了觀察變量的顯著差異.多重比較將對(duì)每個(gè)水平的均值逐對(duì)進(jìn)行比較檢驗(yàn).(二)幾種常用的多重比較方法LSD(LeastsignificantDifference)最小顯著性差異法T(Tukey)方法單因素方差分析中的多重比較(一)目的單因素方差分析中的多重比較---幾種常用的多重比較方法LSD(LeastsignificantDifference)最小顯著性差異法特點(diǎn):利用了全部樣本數(shù)據(jù),而不僅是所比較的兩組的數(shù)據(jù),且認(rèn)為各水平均是等方差的與其他方法相比,其檢驗(yàn)敏感度最高在一定程度上克服了放大犯一類錯(cuò)誤的問題各組方差相等單因素方差分析中的多重比較LSD(Leastsignifi單因素方差分析中的多重比較---幾種常用的多重比較方法T(Tukey)法特點(diǎn):利用了全部樣本數(shù)據(jù),而不僅是所比較的兩組的數(shù)據(jù),且認(rèn)為各水平均是等方差的q分布平緩些,克服了擴(kuò)大犯錯(cuò)的可能性,但不如LSD方法敏感適合各水平下樣本數(shù)均相同的情況,即:均衡試驗(yàn)單因素方差分析中的多重比較T(Tukey)法S-N-K(Student-Newman-Keul)方法:幫助對(duì)各水平進(jìn)行相似子集劃分首先計(jì)算dt各水平均值排序后計(jì)算相鄰兩水平下的樣本均值的差,大于dt為不相似子集,小于dt為同一相似子集如果所分組中包含的水平數(shù)小于等于2,則分組結(jié)束,否則繼續(xù)分組繼續(xù)分組計(jì)算dl,依據(jù)一統(tǒng)計(jì)量,考察這個(gè)最大距離是否足夠遠(yuǎn)。是則將其分出,否則留在本組內(nèi)適合于均衡試驗(yàn)情況單因素方差分析中的多重比較---幾種常用的多重比較方法S-N-K(Student-Newman-Keul)方法:幫單因素方差分析中的多重比較(三)實(shí)現(xiàn)方式
posthoc選項(xiàng)(四)應(yīng)用舉例哪兩種推銷方式對(duì)推銷額產(chǎn)生了顯著影響*表示在0.05的顯著性水平下I和J水平之間的均值存在顯著差異.那兩組施肥量對(duì)畝產(chǎn)量產(chǎn)生了顯著影響施肥量的決策單因素方差分析中的多重比較(三)實(shí)現(xiàn)方式單因素方差分析中的先驗(yàn)對(duì)比(一)目的先憑經(jīng)驗(yàn)確定各水平均值之間的對(duì)比系數(shù),然后判定這兩組均值的線性組合是否存在顯著差異.如:1/3(k1+k2+k3)=1/2(k4+k5)
H0:兩組均值的線性組合無顯著差異.(二)實(shí)現(xiàn)方式
Contrasts選項(xiàng),在Coefficients框中輸入每個(gè)水平均值的系數(shù)值和正負(fù)符號(hào).注意:輸入系數(shù)的順序與控制變量水平值的升序一一對(duì)應(yīng)系數(shù)的和為0單因素方差分析中的先驗(yàn)對(duì)比(一)目的單因素方差分析中的趨勢(shì)檢驗(yàn)(一)目的
將組間平方和分解成線性、二次、三次或更高次的多項(xiàng)式,檢驗(yàn)觀測(cè)變量是否隨控制變量呈不同次冪變化。(二)實(shí)現(xiàn)方式
Contrasts選項(xiàng),polynomial框(三)應(yīng)用舉例促銷方式與與銷售額的趨勢(shì)檢驗(yàn)(假設(shè)促銷方式具有定序性)單因素方差分析中的趨勢(shì)檢驗(yàn)(一)目的作業(yè)1、一名證券經(jīng)紀(jì)人收集到了某年三個(gè)公司的股票每股凈收益。試比較這三種不同類型的公司股票所掙的錢是否相同計(jì)算機(jī)公司:1.942.768.953.233.040.691.52藥品公司:7.891.652.591.09-1.702.303.10公用公司:2.264.662.221.77-0.152.102.89作業(yè)1、一名證券經(jīng)紀(jì)人收集到了某年三個(gè)公司的股票每股凈收益。作業(yè)2、有人調(diào)查過美國(guó)某年不同工種的工人每小時(shí)的收入。試檢驗(yàn)這四種工種的收入是否存在顯著的差異?并進(jìn)行多重比較.日用品8.9010.1510.009.659.99.85非日用品9.409.009.159.209.159.30建筑業(yè)11.4011.4011.8011.4510.8010.95零售業(yè)8.608.658.908.808.758.50作業(yè)2、有人調(diào)查過美國(guó)某年不同工種的工人每小時(shí)的收入。試檢驗(yàn)多因素方差分析(一)目的測(cè)試若干個(gè)控制因素的不同水平的交叉變化是否給觀察變量帶來了顯著影響.例如:多因素方差分析(一)目的多因素方差分析(二)基本思路認(rèn)為觀測(cè)變量的變動(dòng)是由各控制變量獨(dú)立作用、它們的交互作用、以及隨機(jī)因素造成的。以兩個(gè)控制變量的方差分析為例:
SST=SSA+SSB+SSAB+SSE
(maineffects)(N-way交互)(Residual) (explained)其中:SAB表示兩個(gè)控制變量交互影響帶來的變差多因素方差分析(二)基本思路多因素方差分析(二)基本思路SST=SSA+SSB+SSAB+SSEA有p個(gè)水平,B有q個(gè)水平,每組有r個(gè)樣本多因素方差分析(二)基本思路多因素方差分析(二)基本思路檢驗(yàn)方法統(tǒng)計(jì)量(F檢驗(yàn))多因素方差分析(二)基本思路多因素方差分析(二)基本思路結(jié)論依次查看各F值的概率p值.如果其相伴概率大于a,則不能拒絕H0,可以認(rèn)為相應(yīng)不同水平的控制變量或交互影響沒有造成均值的顯著差異;相反(三)說明多因素方差分析(二)基本思路多因素方差分析
---說明多因素方差分析中因素的劃分固定效應(yīng)因素:該因素的所有可能水平在樣本中都出現(xiàn)。針對(duì)該因素而言,從樣本的分析結(jié)果中就可以得知所有水平的狀況,無需外推如:性別,糖尿病有無:糖尿病,糖耐量異常,正常人:--固定效應(yīng)模型隨機(jī)效應(yīng)因素:人為無法對(duì)所有水平值進(jìn)行準(zhǔn)確控制和觀測(cè)。如:城市規(guī)模,教育水平等:隨機(jī)效應(yīng)模型---混合效應(yīng)模型多因素方差分析
---說明多因素方差分析中因素的劃分多因素方差分析
---說明交互作用,即:兩個(gè)或多個(gè)控制變量各水平之間搭配時(shí)對(duì)觀察變量的影響.即:如果一個(gè)因素所產(chǎn)生的效應(yīng)在另一個(gè)因素的不同水平下有明顯差異,則稱該這兩因素存在交互作用交互作用的理解舉例:飲食習(xí)慣、適量運(yùn)動(dòng)對(duì)減肥的作用;排球?qū)Φ亩魇趾椭鞴ナ謱?duì)贏球的作用交互作用的圖形觀察:
A1A2A1A2B125B125B2710B273當(dāng)A從A1變化到A2時(shí),A對(duì)觀測(cè)變量值的影響與B取什么觀測(cè)變量值均增加且幅度相同,水平有關(guān)與B1或B2無關(guān);同理B多因素方差分析
---說明交互作用,即:兩個(gè)或多個(gè)控制變量各多因素方差分析
---說明多因素方差分析的核心內(nèi)容:檢驗(yàn)在不同控制變量的不同交叉水平下,各交叉分組下樣本數(shù)據(jù)所來自的總體均值,有無顯著差異。進(jìn)而判斷多個(gè)因素是否對(duì)觀測(cè)變量產(chǎn)生了顯著影響H0:各交叉水平下的總體均值均無顯著差異.數(shù)學(xué)模型:以雙因素為例H0:ai=0;bi=0;(ab)ij=0多因素方差分析
---說明多因素方差分析的核心內(nèi)容:多因素方差分析
---說明多因素方差分析的前提:樣本獨(dú)立;各水平交互下的總體服從正態(tài)和方差齊性但第二個(gè)前提在實(shí)際中有時(shí)很難保證:無重復(fù)數(shù)據(jù)的多因素方差分析,如:交叉設(shè)計(jì)、正交設(shè)計(jì)等,單元格中無重復(fù)數(shù)據(jù)的多因素方差分析有重復(fù)數(shù)據(jù)的多因素方差分析:檢驗(yàn)是以單元格為基本單位的,通常樣本量是不充足的數(shù)據(jù)分布明顯偏態(tài),存在極端值比方差不齊更嚴(yán)重多因素方差分析
---說明多因素方差分析的前提:多因素方差分析(四)基本操作步驟A.菜單選項(xiàng):analyze->GeneralLinearmodel->UnivariateB.選擇觀察變量到dependent框C.選擇固定效應(yīng)因素fixfactor框D.選擇隨機(jī)效應(yīng)因素randomfactor框E.模型的定義Model選項(xiàng)(飽和模型和非飽和模型)多因素方差分析(四)基本操作步驟多因素方差分析(五)應(yīng)用舉例不同廣告形式和地區(qū)對(duì)銷售的影響分析注意數(shù)據(jù)的組織方式注意對(duì)結(jié)果的解釋,分析控制變量對(duì)觀測(cè)變量差異解釋的比例R2對(duì)交互作用的圖形觀察Plots選項(xiàng)預(yù)測(cè)值的保存及殘差分析Save和options選項(xiàng)(線性模型的體現(xiàn))多因素方差分析(五)應(yīng)用舉例多因素方差分析(五)應(yīng)用舉例進(jìn)一步分析:不同廣告形式的均值對(duì)比分析Contrast:單樣本均值檢驗(yàn),檢驗(yàn)值為:deviation:觀測(cè)變量的均值Simple:第一(最后)個(gè)水平的觀測(cè)變量均值Difference:前一水平的觀測(cè)變量的均值Helmert:后一水平的觀測(cè)變量的均值再例如:產(chǎn)品的不同包裝形式與不同地區(qū)對(duì)銷售的影響分析多因素方差分析(五)應(yīng)用舉例多因素方差分析(五)應(yīng)用舉例不同廣告形式和地區(qū)對(duì)銷售的非飽和模型Model選項(xiàng):飽和模型和非飽和模型默認(rèn)為飽和模型,即分析所有控制變量的主效應(yīng)和交互效應(yīng);可以指定只分析主效應(yīng),以及交互作用級(jí)別多因素方差分析(五)應(yīng)用舉例作業(yè)研究人員為研究抵制三種毒藥效果的4種處理方法。將48只動(dòng)物隨機(jī)指派入“處理—毒藥”組中,并記錄了每只動(dòng)物的生存小時(shí)數(shù)。請(qǐng)進(jìn)行雙因素方差分析毒藥甲毒藥乙毒藥丙處理A3.14.54.64.33.62.94.2.32.22.11.82.3處理B8.2118.87.29.26.14.912.43.03.73.82.9處理C4.34.56.37.64.43.53.14.02.32.52.42.2處理D4.57.1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鹽酸胚行業(yè)深度研究報(bào)告
- 綠色智慧產(chǎn)業(yè)園區(qū)建設(shè)項(xiàng)目可行性實(shí)施報(bào)告-圖文
- 印刷廠裝修安全協(xié)議
- 湖北文理學(xué)院理工學(xué)院《醫(yī)學(xué)心理學(xué)F》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年新型設(shè)備類采購(gòu)合同范本標(biāo)準(zhǔn)版3篇
- 2025年度高端軟件解決方案代理銷售合同3篇
- 2025年度藝術(shù)品買賣合同(含真?zhèn)舞b別、保養(yǎng))2篇
- 鹽城江蘇鹽城市教育局部分直屬事業(yè)單位招錄政府購(gòu)買服務(wù)用工3人筆試歷年參考題庫附帶答案詳解
- 濰坊山東濰坊壽光市侯鎮(zhèn)中心衛(wèi)生院招聘8人筆試歷年參考題庫附帶答案詳解
- 瀘州四川瀘州市國(guó)有土地上房屋征收補(bǔ)償中心(瀘州市物業(yè)管理中心)招聘編外人員筆試歷年參考題庫附帶答案詳解
- 100個(gè)超高難度繞口令大全
- 《鄭伯克段于鄢》-完整版課件
- (日文文書模板范例)請(qǐng)求書-請(qǐng)求書
- 土壤肥料全套課件
- 畢業(yè)生延期畢業(yè)申請(qǐng)表
- 學(xué)校6S管理制度
- 肽的健康作用及應(yīng)用課件
- T.C--M-ONE效果器使用手冊(cè)
- 8小時(shí)等效A聲級(jí)計(jì)算工具
- 人教版七年級(jí)下冊(cè)數(shù)學(xué)計(jì)算題300道
- 社會(huì)實(shí)踐登記表
評(píng)論
0/150
提交評(píng)論