統(tǒng)計(jì)制表樣本_第1頁(yè)
統(tǒng)計(jì)制表樣本_第2頁(yè)
統(tǒng)計(jì)制表樣本_第3頁(yè)
統(tǒng)計(jì)制表樣本_第4頁(yè)
統(tǒng)計(jì)制表樣本_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三講:資料記錄描述(一):記錄制表描述性記錄概述描述性記錄重要對(duì)記錄數(shù)據(jù)構(gòu)造和總體狀況進(jìn)行描述,普通并不進(jìn)一步理解記錄數(shù)據(jù)內(nèi)部規(guī)律。重要分三方面內(nèi)容:Reports(報(bào)表模塊)、DescriptiveStatistics(描述記錄)Tables(定制表格)。描述性記錄是記錄分析和記錄推斷基本,在后來(lái)每個(gè)過(guò)程中幾乎都會(huì)用到。本講將重要簡(jiǎn)介Reports與Tables模塊中記錄制表1、Reports該命令共包括了4個(gè)過(guò)程,分別是OLAPCubes(OnlineAnalyticalProcessing在線分析),CaseSummaries(案例摘要),ReportSummariesinRows(行摘要),ReportSummariesinColumns(列摘要)。OLAPCubes:所謂在線分析指是用迅速簡(jiǎn)樸方式對(duì)變量進(jìn)行描述,并生成一種多層表,顧客可以按照需要組織分組變量某個(gè)/某些特定水平組合輸出,這在使用類別較多分組變量時(shí)將會(huì)非常節(jié)約輸出空間。例如研究者要對(duì)汽車重量按照其產(chǎn)地以及汽缸數(shù)計(jì)算平均數(shù)以及原則差。該窗口右側(cè)為當(dāng)前數(shù)據(jù)中所有變量,summaryvariables為需要進(jìn)行分析變量(本例中為weight),如果同步選入各種變量,系統(tǒng)將在同一張表格內(nèi)一次對(duì)它們進(jìn)行分析;groupingvariables為分組變量(本例為origin與cylinder),但是請(qǐng)注意:OLAP過(guò)程不會(huì)同步輸出分組變量所有組合水平下分析成果,而是用多層表格形式體現(xiàn),在默認(rèn)狀況僅僅顯示共計(jì)狀況;同步origin與cylinder兩個(gè)變量均未缺失case才可進(jìn)入最后分析。Statistics子對(duì)話框中提供了幾種慣用記錄量,可依照研究目選取適當(dāng)數(shù)值描述指標(biāo):Differences子對(duì)話框用于計(jì)算不同匯總變量間、同一變量在各組間差值或比例:定義要所需要記錄描述項(xiàng)目后,點(diǎn)擊OK:上表為進(jìn)入分析記錄匯總,可見在所有406條記錄中,共有1條記錄由于有缺失值而未能入選。下表即為在線分析成果,可見總共405輛汽車總重量為1204910磅,均數(shù)為2975.09磅,原則差為843.546磅。注意該表僅僅是匯總成果,實(shí)際為一種多層表,請(qǐng)雙擊該表進(jìn)入編輯狀態(tài)后,可以按照產(chǎn)地和汽缸數(shù)取值不同進(jìn)行組合,得到不同weight平均值和原則差。如果研究者想進(jìn)一步理解歐洲車與日本車在車重差別,可以使用differences子對(duì)話框指定typeofdifferences為arithmeticdiffernce,differencesbetweengroupsofcases中g(shù)rouping為origin,category為2、minus為3,點(diǎn)擊pairs按鈕,OK即可得到下表:似乎和上表相比沒有任何差別,但是雙擊該表進(jìn)入編輯狀態(tài),在countryorigin下拉選項(xiàng)中多余了European-Japanese選項(xiàng),選取它即可。請(qǐng)注意該表中每一種指標(biāo)都是單獨(dú)計(jì)算。CaseSummaries:與OLAP過(guò)程可以產(chǎn)生自定義簡(jiǎn)潔分層表格不同是,該命令可以將指定分組變量所有組合所有列出。依然以上題為例,對(duì)車重按照產(chǎn)地與汽缸數(shù)分類記錄其平均數(shù)與原則差。該對(duì)話框與OLAP相似,將要分析weight移入variables中,cylinder與origin移入groupingvariables中;在statistics中選取需要指標(biāo),點(diǎn)擊OK即可。(最佳將displaycases前小勾去掉,使得成果輸出較為簡(jiǎn)潔)。ReportSummariesinRows該命令是專門用于生成復(fù)雜表格,并且其輸出格式為.txt格式。例如研究者想將系統(tǒng)自帶數(shù)據(jù)Breastcancersurvey觀測(cè)對(duì)象,按照淋巴結(jié)與否轉(zhuǎn)移、組織學(xué)分級(jí)分別記錄患者生存時(shí)間與腫瘤大小平均數(shù)、原則差;并記錄在不同組織學(xué)分級(jí)中,計(jì)算腫瘤大小超過(guò)1.5公分所占比例。如果通過(guò)前面簡(jiǎn)介命令,需要多步解決后才可以得到想要成果;但是通過(guò)該命令可以僅僅運(yùn)營(yíng)一次就得到想要成果。Datacolumns為需要對(duì)其進(jìn)行匯總變量,breakcolumns為分組變量分別點(diǎn)擊datacolumns中time與size,定義其format,窗口如下:同理也可以在breakcolumns中定義淋巴結(jié)轉(zhuǎn)移狀況、組織學(xué)分級(jí);此外可以定義如何對(duì)這兩個(gè)分組變量所相應(yīng)time和size進(jìn)行記錄描述:定義結(jié)束后直接點(diǎn)擊ok,系統(tǒng)運(yùn)營(yíng)后得出成果表格如下(節(jié)選),如果需要修改表格中數(shù)據(jù)可以直接雙擊該表格編輯。ReportSummariesinColumns該過(guò)程與reportsummariesinrows十分相似;但是輸出成果更快湊。例如上述例題,改用本命令:其操作環(huán)節(jié)同reportsummariesinrows,分別將time與size移入datacolumns,再將淋巴節(jié)轉(zhuǎn)移以及組織學(xué)分級(jí)移入breakcolumns;與reportsummariesinrows不同是在上述窗口中多了:inserttotal按鈕,以及summary按鈕被放在datacolumns框中。Inserttotal可以在輸出表格中加入一種名為total匯總變量。接著咱們可以對(duì)datacolumns中pathsize、time作匯總設(shè)定;點(diǎn)擊summary,分別設(shè)定size為超過(guò)1.5公分,time為取平均值:在format中設(shè)定其中文標(biāo)目以及對(duì)其方式:同樣對(duì)breakcolumns中兩個(gè)分組變量也做類似設(shè)定,完畢上述設(shè)定后點(diǎn)擊OK得到成果:*試對(duì)系統(tǒng)自帶文獻(xiàn)cars按不同產(chǎn)地和汽缸數(shù)計(jì)算汽車平均功率,以及加速至60mph所需時(shí)間均數(shù)以及原則差;并給出在不同產(chǎn)地中該項(xiàng)時(shí)間為20秒以上車型所占比例。*試對(duì)系統(tǒng)自帶文獻(xiàn)cars按不同產(chǎn)地和汽缸數(shù)計(jì)算汽車平均功率以及平均車重;并計(jì)算平均車重與平均輸出動(dòng)力比值。2、Tables上述Reports命令中匯總設(shè)立重要針對(duì)定量資料(從其statistics或summary選項(xiàng)中可以看出重要是計(jì)算平均數(shù)、原則差、最大值、最小值、偏度系數(shù)、峰度系數(shù)等專門針對(duì)計(jì)量資料記錄指標(biāo));而諸多時(shí)候咱們將要對(duì)分類變量進(jìn)行匯總并制定相應(yīng)表格,這時(shí)repots命令就無(wú)能為力了。Tables命令正是用于分類變量記錄匯總和分類變量記錄制表。BasicTables:該命令為最基本tables過(guò)程,但是已經(jīng)可以對(duì)分類資料/計(jì)量資料(兩者中選取一種)進(jìn)行各種復(fù)雜描述,只但是與tables中其她命令相比較為basic而已;此外它還具備一種特點(diǎn),可以按照研究者需要定做恰當(dāng)表格輸出。例如在某次高血壓調(diào)查中,收集了患者某些個(gè)人資料以及血壓控制狀況,詳見高血壓.sav。某研究者想按照不同性別、文化限度、和肥胖限度計(jì)算高血壓控制限度頻數(shù)分布;此外研究者僅僅想理解輕度肥胖、文化限度為初中及如下患者血壓控制限度。對(duì)話框中down為表格橫標(biāo)目,across為表格縱標(biāo)目;separatetables為分層變量(如果研究者僅僅想理解分組因素某個(gè)水平匯總狀況,從而簡(jiǎn)化輸出成果,可以考慮將原先down中某些變量移入separatetables中)。表格輸出編排方式有兩種:allcombination[nested]嵌套式表格、eachseparately[stacked]分列式表格。系統(tǒng)默以為嵌套式。Statistics對(duì)話框?yàn)楸砀裰袛?shù)據(jù)記錄方式,本例僅僅要理解頻數(shù)分布狀況,因此選取count。Total中,可以選取在表格中加入共計(jì)欄/列。接著咱們定義如下如果表格中浮現(xiàn)頻數(shù)為0時(shí)應(yīng)當(dāng)如何顯示,系統(tǒng)默以為空格;咱們選取填0。點(diǎn)擊ok系統(tǒng)運(yùn)營(yíng)成果如下,固然也可以選取輸出eachseparately[stacked]分列式表格:該表為嵌套式表格,所有分組變量依次進(jìn)入表格,后進(jìn)入嵌套在先進(jìn)入變量下一級(jí)。如果研究者僅僅想按照各分組變量單獨(dú)匯總成果,可以選取分列式表格輸出:表格中將分別按照性別、文化限度、肥胖限度各自輸出控制狀況頻數(shù)分布。此外研究者僅僅想理解輕度肥胖、文化限度為初中及如下患者血壓控制限度。則可以選取使用分層表:將肥胖限度與文化限度選入separatetables中,其她設(shè)立同前,點(diǎn)擊ok,系統(tǒng)將輸出如下表格:該表格為分層表,可以雙擊該表格,選取需要因素組合水平(本例中為輕度肥胖、文化限度為初中及如下),系統(tǒng)將給出針對(duì)性表格:GeneralTables:Basictables過(guò)程已經(jīng)為咱們提供了良好制表功能,但是還是有些局限性;例如:它只能分別對(duì)分類或計(jì)量資料作匯總,如果要同步對(duì)兩者進(jìn)行記錄則無(wú)能為力;它不支持對(duì)多選題數(shù)據(jù)進(jìn)行匯總。為此SPSS提供了比basictables過(guò)程更強(qiáng)大generaltables命令。例如針對(duì)同一高血壓療效調(diào)查,研究者但愿對(duì)不同文化限度與性別匯總下列信息:血壓控制頻數(shù)分布輸出患者年齡均數(shù)與原則差輸出非藥物控制辦法實(shí)行狀況(非藥物辦法有飲食、運(yùn)動(dòng)、情緒和其她四種選項(xiàng),一種患者也許同步選取其中各種),涉及頻數(shù)和構(gòu)成比。如果將上述三個(gè)問題一一拆解也許需要不少時(shí)間,并且容易在匯總過(guò)程中出錯(cuò)。使用generaltables過(guò)程可以一次性解決三個(gè)問題,并將三某些成果輸出在同一種表格中。對(duì)話框中rows為橫標(biāo)目,columns為縱標(biāo)目,multresponse選項(xiàng)框?yàn)槎噙x題定義框在本例題中可以將性別、文化限度選入rows中(固然選入columns中也可以)作為分組根據(jù);將血壓控制狀況、年齡、非藥物控制辦法(該變量存在于multresponse框中)選入columns中。但是在入選非藥物控制辦法之前,要對(duì)該選項(xiàng)作設(shè)定:先將setdefinition中method1至method4所有選上,移入variablesinset中。在下方variablesarecodedas可以定義變量集中變量取值:dichotomies表達(dá)變量采用二分法(即所謂二項(xiàng)分類),在之后countedvalues中填入入選變量值(例如本題中定義所有非藥物辦法中變量值為2表達(dá)有采用本辦法被系統(tǒng)選中);categories為多項(xiàng)分類法,如果采用本辦法最佳在分析開始前對(duì)變量進(jìn)行恰當(dāng)編排(例如在醫(yī)科大學(xué)研究生教誨過(guò)程中要開設(shè)20門選修課,現(xiàn)要分析研究生最喜歡3門選修課,如果將所有開設(shè)研究生課程一一列出,然后在每門課程變量取值中定義0為不喜歡,1為喜歡,則需要設(shè)定20個(gè)課程變量,而后再一一取值十分麻煩;可以考慮將每個(gè)同窗3次選取作為三個(gè)變量,錄入數(shù)據(jù)時(shí)直接輸入課程編碼即可,這種解決辦法就是多分類法)。在本例中由于不同觀測(cè)對(duì)象也許采用非藥物療法種類數(shù)不同,例如有采用兩種,有采用三種,有一種都不采用,因此本題采用對(duì)每個(gè)非藥物療法進(jìn)行二分類辦法進(jìn)行編碼。在multresponsesets中顯示多選題變量名,可以單擊該變量名進(jìn)行修改,修改后點(diǎn)擊save保存設(shè)立回到generaltables主對(duì)話框:接著要對(duì)匯總變量(年齡、血壓控制狀況以及非藥物療法采用狀況)進(jìn)行匯總記錄量設(shè)定。對(duì)于不同類型變量(計(jì)量或分類)必要先制定類型。Definescells用于分類變量(即血壓控制),Issummarized則用于計(jì)量資料(年齡);依照題意分別通過(guò)editstatistics設(shè)定匯總記錄量:定義后可以點(diǎn)擊OK系統(tǒng)輸出下列表格:該表格為分列式,即分組變量性別與文化限度分別并排列出;如果要得到嵌套式表格,必要將性別或文化限度中某個(gè)移入layers中,并在輸出成果中用pivotingtrays設(shè)定。先在成果輸出中用右鍵單擊——spsspivottableobject——open,在浮現(xiàn)窗口中選取pivot——pivotingtrays。系統(tǒng)將彈出如下對(duì)話框,其行與列含義與前面設(shè)立相似,將layers變量拖拽至column中即可。需要解釋是“比例%”;原先它含義為該數(shù)據(jù)占列共計(jì)比例;例如男性初中如下文化,調(diào)節(jié)飲食有11例,所占比例為31.4%(男性初中如下共有35人,其中有12人血壓控制狀況為缺失,因此從血壓控制狀況計(jì)算處共計(jì)人數(shù)只有7+6+10=23人;35人中采用調(diào)節(jié)飲食有11人,占該人群比例11/35=31.4%;由于同一種觀測(cè)對(duì)象也許同步選取兩種或各種辦法,因此該列比例之和超過(guò)100%)。MultipleResponseTables:該過(guò)程專門為多項(xiàng)選取題而設(shè)立。例如對(duì)上述例題咱們采用multipleresponsetables過(guò)程操作:變量放置同generaltables,與generaltables不同是在multipleresponse中系統(tǒng)已經(jīng)自動(dòng)定義好多選題,并已經(jīng)生成一種為nodrug變量;此外該過(guò)程默認(rèn)狀況下就已經(jīng)輸出嵌套式表格,省去generaltables中復(fù)雜轉(zhuǎn)換過(guò)程。但是該命令也有局限性之處,那就是它只可以用于分類變量(由于多項(xiàng)選取自身就是分類成果),對(duì)于定量變量例如年齡等不再合用。因此只要將性別與文化限度放入rows中,將血壓控制狀況與非藥物控制辦法放入columns中,點(diǎn)擊statistics設(shè)定記錄指標(biāo);在本例中僅僅需要計(jì)數(shù)(count)與行比例(row%);表格輸出是默認(rèn)是nesting(嵌套式),并且無(wú)論行或列均以嵌套方式輸出:如果覺得沒有必要對(duì)縱標(biāo)目(columns)也按照嵌套式輸出,則可以將nesting下columns前勾去掉,得到如下表格:TablesofFrequencies:該過(guò)程最大特點(diǎn)是在一張表格中為各種分類變量提供其頻數(shù)分布狀況,其功能較前面幾種

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論