版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、SPSS統(tǒng)計(jì)分析方法及應(yīng)用第三章第三章 SPSS 數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 1 數(shù)據(jù)的排序數(shù)據(jù)文件建立完成之后,為了方便統(tǒng)計(jì)分析,需要對(duì)數(shù)據(jù)進(jìn)行初步的處理,如對(duì)數(shù)據(jù)進(jìn)行排序,將一列數(shù)據(jù)擴(kuò)大一個(gè)倍數(shù),多列數(shù)據(jù)的求和等等。數(shù)據(jù)集中的數(shù)據(jù)是按照錄入的先后排列的,并沒(méi)有規(guī)律可言,不便于數(shù)據(jù)的分析。數(shù)據(jù)排序有什么好處呢?a) 數(shù)據(jù)的排序,有助于了解數(shù)據(jù)的取值狀況、變化規(guī)律、缺失值的個(gè)數(shù)等等。b) 數(shù)據(jù)的排序,方便的得到變量的最大值、最小值,最大值、最小值,計(jì)算出數(shù)據(jù)的全距全距,了解數(shù)據(jù)的離散程度離散程度。 1) 數(shù)據(jù)排序的目的2) 數(shù)據(jù)排序的規(guī)則c) 數(shù)據(jù)的排序,可以快速發(fā)現(xiàn)異常值異常值,以便及時(shí)對(duì)其進(jìn)
2、行處理。a) 排序分為升序升序與降序降序,可以同時(shí)對(duì)數(shù)據(jù)集中的多個(gè)變量進(jìn)行排序。b) 排序的規(guī)則是:按第一個(gè)變量排序,第一個(gè)變量相同時(shí)按第二個(gè)變量排序,余此類推。c) 排序?qū)?dǎo)致個(gè)案的位置位置改變,未排序的變量數(shù)據(jù)隨排序變量的位置同時(shí)位置同時(shí)改變。3) 數(shù)據(jù)排序的操作3) 數(shù)據(jù)排序例b) 選擇排序變量并移入 排序依據(jù)排序依據(jù)列表框中,指定該變量的數(shù)據(jù)是升序(Ascending)還是降序(Descending)的單選按鈕.c) 如果是多重排序,用同樣的方法指定第二、第三排序變量。按第一個(gè)變量先排序;第一個(gè)變量相同,按下一個(gè)變量排序;余類推。對(duì)居民儲(chǔ)蓄存款調(diào)查數(shù)據(jù),利用排序的方法找出城鎮(zhèn)居民和農(nóng)村
3、居民一次性存款的最大值和最小值。操作操作:戶口,升序;存款金額,升序。a) 選擇菜單數(shù)據(jù)數(shù)據(jù) 排序個(gè)案排序個(gè)案。這時(shí),數(shù)據(jù)集所有變量出現(xiàn)在排序?qū)υ捒蜃髠?cè)的列表中。2. 選擇個(gè)案(數(shù)據(jù)-選擇個(gè)案)在統(tǒng)計(jì)分析中,有時(shí)不需要對(duì)所有的觀測(cè)進(jìn)行分析,而可能只對(duì)某些特定的對(duì)象有興趣。利用SPSS的選擇個(gè)案命令可以實(shí)現(xiàn)這種樣本篩選的功能。以SPSS安裝配套數(shù)據(jù)文件居民儲(chǔ)蓄調(diào)查數(shù)據(jù)(存款)數(shù)據(jù)為例,我們只統(tǒng)計(jì)農(nóng)村居民的儲(chǔ)蓄情況。 使用篩選器變量:此時(shí)需要在下面選入一個(gè)篩選指示變量,該變量取值為非0的記錄將被選中,進(jìn)行之后的分析。 “過(guò)濾掉未選定的個(gè)案”:未選定的個(gè)案不包括在分析中,但保留在數(shù)據(jù)集中,使用該選項(xiàng)
4、會(huì)在數(shù)據(jù)文件中生成名為filter_$的變量,對(duì)于選定個(gè)案該變量的值為1,對(duì)于未選定個(gè)案該變量值為0,而相應(yīng)的未被選中的個(gè)案ID號(hào)處也會(huì)以反斜杠加以標(biāo)記。3. 加權(quán)個(gè)案(通常在做卡方檢驗(yàn)的時(shí)候用的比較多在默認(rèn)情況下,數(shù)據(jù)集中的每一行就是一條原始記錄,這在多數(shù)情況下沒(méi)有什么問(wèn)題,但有時(shí)卻很麻煩。如果所示的數(shù)據(jù):如果每一行就是一條原始記錄,需要輸入121行!這時(shí)候一般使用頻數(shù)格式錄入數(shù)據(jù),即相同取值的個(gè)案只錄入一次,另加一個(gè)頻數(shù)變量用于記錄該數(shù)值共出現(xiàn)了(1) 以頻數(shù)錄入的格式一般而言,下面兩種情形需要進(jìn)行該操作:多少次,這樣就需要在分析時(shí)使用“加權(quán)個(gè)案”對(duì)話框?qū)?shù)據(jù)指定為頻數(shù)格式(加下頁(yè))。觀察
5、其描述性統(tǒng)計(jì):點(diǎn)擊【數(shù)據(jù)】【加權(quán)個(gè)案】(2) 案例數(shù)據(jù)抽樣權(quán)重的確定例如:希望掌握菜市場(chǎng)某天蔬菜銷售的平均價(jià)格。如果僅使用各種蔬菜銷售單價(jià)的平均數(shù)作為平均價(jià)格就很不合理,還應(yīng)考慮到銷售量對(duì)平均價(jià)格的影響。因此,以蔬菜的銷售量為權(quán)數(shù)計(jì)算各種蔬菜銷售單價(jià)的加權(quán)平均數(shù),就能夠較準(zhǔn)確地反映平均價(jià)格的水平。 療法 有效 無(wú)效 合計(jì) 有效率(%) 物理療法組 199 7 206 96.60 藥物治療組 164 18 182 90.11 外用膏藥組 118 26 144 81.94 合計(jì) 481 51 532 90.41 例 某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見表
6、。問(wèn)三種療法的有效率有無(wú)差別? 三種療法有效率的比較加權(quán)個(gè)案用在卡方檢驗(yàn)上的案例SPSSSPSS操作過(guò)程(行操作過(guò)程(行列表卡方檢驗(yàn))列表卡方檢驗(yàn))建立數(shù)據(jù)文件數(shù)據(jù)格式:包括6行3列的頻數(shù)格式,3個(gè)變量分別為行變量、列變量和頻數(shù)變量。說(shuō)明頻數(shù)變量:數(shù)據(jù) 加權(quán)個(gè)案 x2檢驗(yàn):從菜單選擇 分析 描述統(tǒng)計(jì) 交叉表 結(jié)論:按結(jié)論:按=0.05=0.05檢驗(yàn)水準(zhǔn)拒絕檢驗(yàn)水準(zhǔn)拒絕H H0 0,接受,接受H H1 1,可以認(rèn)為三種,可以認(rèn)為三種療法治療周圍性面神經(jīng)麻痹的總體有效率有差別。療法治療周圍性面神經(jīng)麻痹的總體有效率有差別。 4. 數(shù)據(jù)的拆分(Split)在進(jìn)行統(tǒng)計(jì)分析時(shí),經(jīng)常要對(duì)文件中的觀測(cè)進(jìn)行分組
7、,然后按組分別進(jìn)行分析。例如要求按性別不同分組。又比如,省統(tǒng)計(jì)局每次的數(shù)據(jù)處理都是針對(duì)各個(gè)地級(jí)市的;學(xué)校對(duì)于學(xué)生數(shù)據(jù)的處理都是針對(duì)各個(gè)系的。以數(shù)據(jù)加工數(shù)據(jù)加工(職工數(shù)據(jù)職工數(shù)據(jù)).sav為例,我們需要看統(tǒng)計(jì)比較不同職稱的失業(yè)保險(xiǎn)情況(對(duì)之進(jìn)行統(tǒng)計(jì)性描述)。(1) 數(shù)據(jù)拆分的意義(2) 數(shù)據(jù)拆分的步驟選擇菜單【數(shù)據(jù)】【拆分文件】,如下圖所示 :在對(duì)話框的右上端有3個(gè)單選按鈕。a) 分析所有個(gè)案,不創(chuàng)建組分析所有個(gè)案,不創(chuàng)建組:默認(rèn)選項(xiàng),此選項(xiàng)也用于將拆分設(shè)置刪除。b) 比較組:比較組:將各組的結(jié)果在一個(gè)表輸出,以方便結(jié)論的比較對(duì)照比較對(duì)照。c) 按組分多個(gè)表輸出結(jié)果按組分多個(gè)表輸出結(jié)果。數(shù)據(jù)排序
8、狀態(tài)分組狀態(tài)的2個(gè)單選按鈕。a) 按分組變量排序文件:按分組變量排序文件:系統(tǒng)先按分組變量排序,然后進(jìn)行拆分。b) 文件已排序:文件已排序:已經(jīng)按分組變量進(jìn)行了排序,系統(tǒng)不需要再進(jìn)行排序,可直接進(jìn)行拆分。下面我們看各種設(shè)置的結(jié)果比較組不設(shè)置按組織輸出5 變量的計(jì)算在實(shí)際工作中,經(jīng)常要對(duì)變量進(jìn)行加工整理,產(chǎn)生新的變量和計(jì)算結(jié)果。比如計(jì)算一個(gè)變量的倍數(shù),計(jì)算幾個(gè)變量的和、差,計(jì)算變量的絕對(duì)值、平方等等。SPSS如何對(duì)變量進(jìn)行計(jì)算呢?對(duì)職工的基本情況的數(shù)據(jù)(41頁(yè))表2-5進(jìn)行處理,依據(jù)職稱級(jí)別計(jì)算實(shí)發(fā)工資,滿足:職稱14的工資分別上浮5%、3%、 2%、1%。用例子演示變量計(jì)算的基本操作變量計(jì)算的
9、基本操作(58頁(yè)頁(yè))。變量計(jì)算的例(58頁(yè))1) 進(jìn)入變量計(jì)算對(duì)話框首先將數(shù)據(jù)加工數(shù)據(jù)加工(職工數(shù)據(jù)職工數(shù)據(jù)).sav數(shù)據(jù)集打開。選擇菜單 變換變換 計(jì)算變量計(jì)算變量,彈出對(duì)話框:a) 在目標(biāo)變量目標(biāo)變量的編輯框中輸入變量的名稱,這時(shí)的變量可以是新變量,也可以是原有變量。b) 如果輸入的變量名在數(shù)據(jù)集中已經(jīng)存在,滿足條件個(gè)案的值將替換舊變量對(duì)應(yīng)的值,其它值不變。c) 新變量的數(shù)據(jù)類型默認(rèn)為數(shù)值型,點(diǎn)擊類型與標(biāo)簽類型與標(biāo)簽按鈕,在彈出的對(duì)話框中可以定義新變量的數(shù)據(jù)類型和標(biāo)簽。2) 定義結(jié)果變量對(duì)于我們的例子,新變定義量名 實(shí)發(fā)工資為:sfgz,選擇默認(rèn)數(shù)據(jù)類型。 (sr-bx)*系數(shù),系數(shù)因職稱
10、不同而不同,下圖是上浮5%的情況,其它情形相似。 確認(rèn)后sfgz中zc只有1的個(gè)案出現(xiàn)了工作調(diào)整的數(shù)據(jù),其它做系統(tǒng)缺失值處理,再確認(rèn)2、3、4時(shí)可將其補(bǔ)充。3) 算術(shù)表達(dá)式及運(yùn)算符的定義a)算術(shù)表達(dá)式的元素算術(shù)表達(dá)式的元素。變量可以從左側(cè)的變量列表中選擇;數(shù)字、運(yùn)算符號(hào)可以在軟鍵盤中選擇;函數(shù)可以從右側(cè)選擇,這些也都可以直接用鍵盤輸入。b)邏輯運(yùn)算符及意義邏輯運(yùn)算符及意義邏輯與:& 等價(jià)于 AND邏輯或: | 等價(jià)于 OR邏輯非: 等價(jià)于 NOT4) 條件語(yǔ)句編輯單擊 if 按鈕,進(jìn)入條件語(yǔ)句編輯框,有兩個(gè)單選按鈕。a) 包括所有個(gè)案包括所有個(gè)案 :對(duì)所有個(gè)案進(jìn)行計(jì)算,默認(rèn)選項(xiàng)。b) 如果個(gè)案
11、滿足條件則包括:如果個(gè)案滿足條件則包括:僅對(duì)滿足條件的個(gè)案進(jìn)行計(jì)算。選擇這一單選按鈕后,編輯框激活。c) 在這里可以輸入篩選條件。需要說(shuō)明的是,每次只能編輯一個(gè)篩選條件,不能同時(shí)編輯多個(gè)篩選條件。高級(jí)工程師對(duì)應(yīng)工資上浮5%,高級(jí)職稱的值等于1,在編輯框輸入條件表達(dá)式:zc=1。5) 條件語(yǔ)句編輯例這時(shí)高級(jí)工程師高級(jí)工程師的個(gè)案的sfgz變量都有了數(shù)據(jù),其它職稱個(gè)案的sfgz的值為缺失值。重復(fù)同樣的方法,分別設(shè)置:表達(dá)式 條件(sr-bx)*1.03 zc=2 工程師(sr-bx)*1.02 zc=3 助理工程師(sr-bx)*1.01 zc=4 無(wú)職稱這時(shí)變量sfgz所在的列將不再有缺失值。6
12、) 計(jì)算方法的不足對(duì)于滿足一定條件時(shí)變量的計(jì)算,無(wú)法一次將不同條件的表達(dá)式集中編寫,只能一個(gè)條件的表達(dá)式運(yùn)行一次。6. 計(jì)數(shù)在實(shí)際工作當(dāng)中,需要對(duì)調(diào)查問(wèn)卷的答案進(jìn)行分析。例例1:居民儲(chǔ)蓄調(diào)查居民儲(chǔ)蓄調(diào)查(存款存款).sav中有如下兩個(gè)指標(biāo):收入情況、未來(lái)收入情況收入情況、未來(lái)收入情況,取值分別為:1,增加;,增加;2,基本不變;基本不變;3,減少。,減少。如果想了解在每一個(gè)個(gè)案中,選3(減少)的變量有幾個(gè),如何用SPSS快速的給出答案?例子特點(diǎn):多個(gè)變量中多個(gè)變量中 ,取同一個(gè)值取同一個(gè)值的變量有多少個(gè)?的變量有多少個(gè)?例例2:高考成績(jī)高考成績(jī).sav :要統(tǒng)計(jì)出每一考生語(yǔ)文、英語(yǔ)、數(shù)學(xué)、物理
13、和化學(xué)5科成績(jī),落在某一區(qū)間(如70,79)的有幾科?例子特點(diǎn):多個(gè)變量,取值在多個(gè)變量,取值在同一個(gè)區(qū)間同一個(gè)區(qū)間的的有多少個(gè)個(gè)?1) 計(jì)數(shù)的功能計(jì)數(shù)是統(tǒng)計(jì)出在一個(gè)個(gè)案中,多個(gè)變量多個(gè)變量取同一個(gè)值同一個(gè)值或在同一個(gè)區(qū)間取值同一個(gè)區(qū)間取值的變量個(gè)數(shù)變量個(gè)數(shù)的方法。因此,處理這樣的問(wèn)題需要關(guān)注兩個(gè)問(wèn)題:A) 考察考察哪幾個(gè)哪幾個(gè)變量?變量?B) 同時(shí)同時(shí)取什么值,在取什么值,在哪一個(gè)哪一個(gè)區(qū)間取值?區(qū)間取值?選擇菜單選擇菜單 轉(zhuǎn)換轉(zhuǎn)換 計(jì)算個(gè)案內(nèi)值的出現(xiàn)次數(shù),計(jì)算個(gè)案內(nèi)值的出現(xiàn)次數(shù),進(jìn)入計(jì)數(shù)選擇對(duì)話框。出現(xiàn)計(jì)數(shù)設(shè)置對(duì)話框見圖3-6。以上問(wèn)題,如何通過(guò)SPSS軟件實(shí)現(xiàn)?2) 計(jì)數(shù)的步驟圖3-6
14、計(jì)數(shù)操作設(shè)置窗口 (2) 計(jì)數(shù)取某一值變量的個(gè)數(shù)計(jì)數(shù)變量用于存儲(chǔ)統(tǒng)計(jì)結(jié)果計(jì)數(shù)變量用于存儲(chǔ)統(tǒng)計(jì)結(jié)果。步驟如下:。步驟如下:a) 目標(biāo)變量:目標(biāo)變量:在下面的文本框填入目標(biāo)變量,用于存儲(chǔ)計(jì)數(shù)的值。操作操作:在文本框中輸入 Xb) 目標(biāo)標(biāo)簽?zāi)繕?biāo)標(biāo)簽 :在下面的文本框中輸入變量的標(biāo)簽,作為目標(biāo)變量的說(shuō)明,可選。操作操作:堪憂。c) 數(shù)字變量數(shù)字變量 :將要計(jì)數(shù)的變量移入。操作操作:收入情況、未來(lái)收入情況計(jì)數(shù)涉及的變量一般都取多個(gè)值,我們只關(guān)心多個(gè)變量 (1) 確定計(jì)數(shù)變量 A) 值值 點(diǎn)擊【 定義值定義值 】按鈕,確定變量取值的對(duì)話框,見圖在Value下邊的文本框中填入幾個(gè)變量都取的值,對(duì)于我們的例子
15、填入3,完成設(shè)置。同時(shí)同時(shí)取某一個(gè)值或在某一個(gè)區(qū)間取值變量的個(gè)數(shù)。例子例子:收入情況收入情況未來(lái)收入情況未來(lái)收入情況這兩個(gè)變量取3的有幾個(gè)?B) S系統(tǒng)缺失、系統(tǒng)缺失、 系統(tǒng)或用戶缺失。系統(tǒng)或用戶缺失。統(tǒng)計(jì)幾個(gè)變量同時(shí)取系統(tǒng)缺失值、用戶缺失值的個(gè)數(shù),很少用,略。統(tǒng)計(jì)多個(gè)變量中,在閉區(qū)間m,n中取值的變量個(gè)數(shù)。例如,例如,在高考成績(jī)高考成績(jī).sav數(shù)據(jù)集中,成績(jī)的5個(gè)變量都在區(qū)間70,79中取值的變量個(gè)數(shù)。這時(shí)m=70,n=79,完成設(shè)置后觀察生成變量的數(shù)據(jù)并進(jìn)行分析。C) 范圍范圍: 到到 。mn類似的,還可以統(tǒng)計(jì)于右半開區(qū)間n ,)中取值變量的個(gè)數(shù),例如例如:5門成績(jī)?nèi)〉昧家陨系拈T數(shù)。統(tǒng)計(jì)于
16、左半開區(qū)間(-,n中取值變量的個(gè)數(shù)。例如例如:5門成績(jī)中不及格的數(shù)量,這時(shí)的n=59。演示并觀察運(yùn)行的結(jié)果。D) 范圍范圍:從最低到值從最低到值nA) 按照哪個(gè)變量進(jìn)行分類(如:區(qū)域、性別)。B) 對(duì)哪個(gè)變量進(jìn)行匯總(如:職工工資、高考總分)。C) 計(jì)算哪些指標(biāo)(如:平均值、最大值和最小值)。經(jīng)濟(jì)工作者根據(jù)工資數(shù)據(jù),研究各縣市各縣市職工的生活水平差異,需要計(jì)算各縣市縣市工資的平均平均工資。 1) 分類匯總關(guān)注的問(wèn)題7. 分類匯總根據(jù)高考總分,分析學(xué)生智力水平是否和性別性別有關(guān),即按性別性別計(jì)算出高考總分的平均值、最高分和最低分。這兩個(gè)例子的計(jì)算有如下特點(diǎn):需要對(duì)數(shù)據(jù)進(jìn)行分類,計(jì)算出每一類每一類
17、的某一經(jīng)濟(jì)指標(biāo)。用SPSS如何實(shí)現(xiàn)呢? 2) 分類匯總的基本操作A) 打開匯總菜單打開匯總菜單點(diǎn)擊:數(shù)據(jù)點(diǎn)擊:數(shù)據(jù) 分類匯總分類匯總,彈出分類匯總對(duì)話框。B) 選擇分類變量選擇分類變量從左邊的變量列表框選擇分類變量到分組變量分組變量框中。操操作作:職業(yè)。C) 選擇匯總變量選擇匯總變量匯總變量匯總變量匯總變量模塊。例:利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù).sav數(shù)據(jù)集,分析職業(yè)職業(yè)與存存款數(shù)額款數(shù)額之間的關(guān)系。操作操作:存款金額D) 確定計(jì)算什么統(tǒng)計(jì)量確定計(jì)算什么統(tǒng)計(jì)量。點(diǎn)擊【 函數(shù)函數(shù) 】按鈕,彈出選擇對(duì)話框,可供選擇的統(tǒng)計(jì)量包括:均值、求和、最大值、最小值等20個(gè)選項(xiàng),默認(rèn)選項(xiàng)是均值,每次只能計(jì)算一個(gè)統(tǒng)計(jì)量
18、。默認(rèn)是均值。默認(rèn)是均值?!?變量名與標(biāo)簽變量名與標(biāo)簽 】按鈕為計(jì)算的統(tǒng)計(jì)量定制標(biāo)簽。操作操作:均值(注意觀察匯總變量的取值隨著選擇的改變而改變)E) 輸出每一類中包含的個(gè)案數(shù)。輸出每一類中包含的個(gè)案數(shù)。選擇框 個(gè)案數(shù)個(gè)案數(shù),若選擇將生成一個(gè)每一類每一類中所含個(gè)案數(shù)的變量,變量名為N_BREAK。 E) 指定計(jì)算的統(tǒng)計(jì)量保存到何處指定計(jì)算的統(tǒng)計(jì)量保存到何處。有3中選擇。a) 將統(tǒng)計(jì)量的計(jì)算結(jié)果存儲(chǔ)到當(dāng)前數(shù)據(jù)集當(dāng)前數(shù)據(jù)集。b) 創(chuàng)建一個(gè)只含指定統(tǒng)計(jì)量作為變量的新數(shù)據(jù)集。這時(shí)需在下面的文本框給出數(shù)據(jù)集的名字。c) 將計(jì)算的統(tǒng)計(jì)量存儲(chǔ)到一個(gè)默認(rèn)名稱為agg.sav,的新文件中。文件類型可以不是SPS
19、S的文件類型。F) 適用于適用于大型數(shù)據(jù)集選項(xiàng)。a) 文件已經(jīng)按分組變量排序:文件已經(jīng)按分組變量排序: 在計(jì)算分類統(tǒng)計(jì)量之前已經(jīng)關(guān)于分類變量排序。b) 在匯總之前排序文件:在匯總之前排序文件: 在執(zhí)行分類匯總前,系統(tǒng)先執(zhí)行關(guān)于分類變量排序。G) 多重分類匯總多重分類匯總分類變量可以多于一個(gè),這時(shí)的匯總稱為多重分類匯總。第一個(gè)分類變量稱為主分類變量。分類變量的指定順序決定了匯總的先后順序。例如,主分類變量是職業(yè),第二分類變量為年齡。略。通過(guò)分類統(tǒng)計(jì)可以看出,隨著職業(yè)的不同,存款數(shù)量的平均值也不同。查看數(shù)據(jù)集。8. 數(shù)據(jù)分組數(shù)據(jù)分組是根據(jù)統(tǒng)計(jì)研究的需要,按照一定的特征特征將總體區(qū)分為若干個(gè)性質(zhì)不同
20、而又存在聯(lián)系的部分部分的一種方法。這些部分部分稱為這一統(tǒng)計(jì)總體的組。數(shù)據(jù)分組對(duì)總體而言是“分”,即把總體劃分為性質(zhì)相異的若干組;對(duì)個(gè)體而言是 “合”,即把性質(zhì)相同的個(gè)體合為一組。1) 數(shù)據(jù)分組的意義(1) 為什么要數(shù)據(jù)分組(2) 數(shù)據(jù)分組的原則另一方面,差異很大時(shí)的兩個(gè)事物看成相同的類,將抹殺事物質(zhì)的區(qū)別與特征,混淆事物的優(yōu)劣,不能正確的評(píng)價(jià)出事物的好壞將不利于相關(guān)工作的開展。(3) 分類原則的總結(jié)一次性存款數(shù)量為1000元與1020元,雖然數(shù)量存在差異,未必有什么質(zhì)的差別??荚嚦煽?jī)84分與88分的學(xué)生,雖然分?jǐn)?shù)不同,但學(xué)生的基本素質(zhì)可能沒(méi)有本質(zhì)的差別。統(tǒng)計(jì)分組的原則,是保證組間各個(gè)單位具有差
21、異性差異性,組內(nèi)的各個(gè)單位具有同質(zhì)性同質(zhì)性。2) 組距分組(重賦值 Recode)對(duì)于定距變量定距變量,由于數(shù)值型變量的連續(xù)性與稠密性,為了研究的需要,有時(shí)需將數(shù)據(jù)進(jìn)行分組。分組既要體現(xiàn)出組之間的差異,又不能分組太多,需要需要確定合適的分組區(qū)間確定合適的分組區(qū)間。將變量的變化范圍依次分成若干個(gè)滿足包容性包容性和互斥性互斥性的數(shù)值區(qū)間。什么叫包容性與互斥性呢? (1) 組距分組的定義用文字表示的品質(zhì)變量品質(zhì)變量,如性別、職稱、民族等等,這樣的變量相當(dāng)于利用變量的不同取值,自然的進(jìn)行了分組。按照組距分組的定義,用組的區(qū)間作為組的名稱直觀,但如果組區(qū)間數(shù)值很大或很復(fù)雜,研究問(wèn)題不是很方便。將各個(gè)區(qū)間
22、重新賦予一個(gè)值作為組的名稱,這樣的分組將各個(gè)區(qū)間重新賦予一個(gè)值作為組的名稱,這樣的分組稱為組距分組,也稱為重賦值稱為組距分組,也稱為重賦值(Recode)每一個(gè)變量的值,必須屬于其中的某一組是包容性包容性;且只能屬于一組,不能同時(shí)屬于兩個(gè)以上的組是互斥性互斥性。人均收入戶數(shù)頻率人均收入戶數(shù)頻率400以下300.178011200600.33401800700.391201以上200.11例子:某個(gè)企業(yè)的職工小區(qū),人均可支配收入見下表。(2) 分組數(shù)目的確定(3) 組距的確定分組過(guò)多時(shí),容易將具有相同特征的數(shù)據(jù)分到了兩個(gè)組,使問(wèn)題復(fù)雜化;分組過(guò)少,會(huì)將具有不同特征的數(shù)據(jù)不同特征的數(shù)據(jù)歸為一組,淡
23、化了數(shù)據(jù)的差異。數(shù)據(jù)應(yīng)分成多少組,沒(méi)有統(tǒng)一的方法與模式,通常根據(jù)數(shù)據(jù)本身的特點(diǎn)、數(shù)據(jù)的個(gè)數(shù)及研究問(wèn)題的具體需要具體分析后確定。定義定義:組距:組距是數(shù)據(jù)的上限數(shù)據(jù)的上限(最大值)與數(shù)據(jù)的下限數(shù)據(jù)的下限(最小值)之差除以組數(shù)組數(shù),即組距式分組的特點(diǎn),平抑各組數(shù)據(jù)內(nèi)部?jī)?nèi)部的區(qū)別,突出各組之間之間的差異,以方便觀察數(shù)據(jù)的分布特征。(4) 組距分組的實(shí)現(xiàn)確定組數(shù)、組距的原則:組數(shù)一定是整數(shù)且不宜過(guò)多,組距一般是5或10的整數(shù)倍。例:數(shù)據(jù)加工(職工數(shù)據(jù)).sav數(shù)據(jù)集中工資最大值=1044,最小值=824,幅度=1044824=220。根據(jù)數(shù)據(jù)變化的幅度及確定組距的原則,取組距為50;根據(jù)數(shù)據(jù)的分布特點(diǎn)
24、,確定分組分為5組(開口組):850,851900,901950,9511000, 1001操作操作:數(shù)據(jù)加工(職工數(shù)據(jù)).sav 組距=(最大值-最小值) 組數(shù)A) 打開要分組的數(shù)據(jù)文件打開要分組的數(shù)據(jù)文件。菜單轉(zhuǎn)換轉(zhuǎn)換 重新編碼為不同變量重新編碼為不同變量:對(duì)數(shù)據(jù)進(jìn)行分組,對(duì)每個(gè)組的名稱重編碼重編碼存入一個(gè)不同的變量,這時(shí)彈出變量選擇設(shè)置窗口。在左邊變量的列表框中選擇分組變量,將其移入右邊的輸入變量輸入變量 輸出變量輸出變量列表框.例:sr(工資)在名稱名稱下面的文本框中,給出輸出變量的名字,用于存儲(chǔ)各個(gè)組的名字。B) 打開數(shù)據(jù)分組對(duì)話框打開數(shù)據(jù)分組對(duì)話框C) 選擇分組變量。選擇分組變量。
25、D) 為輸出變量命名。為輸出變量命名。E) 建立新舊組名的對(duì)應(yīng)關(guān)系。(點(diǎn)舊值和新值)建立新舊組名的對(duì)應(yīng)關(guān)系。(點(diǎn)舊值和新值)進(jìn)入條件表達(dá)式設(shè)置對(duì)話框,進(jìn)行條件表達(dá)式的設(shè)置。3個(gè)按鈕,對(duì)新值進(jìn)行設(shè)置并建立新舊值之間的對(duì)應(yīng)關(guān)系、對(duì)建立的關(guān)系進(jìn)行修改及將建立的關(guān)系刪除等操作。值設(shè)置完成后,可以通過(guò) 、 和添加更改刪除可在下面的標(biāo)簽的文本框?yàn)檩敵鲎兞慷x一個(gè)標(biāo)簽。點(diǎn)擊【 更改更改】按鈕完成輸出變量的定義。例:sF) 設(shè)置篩選條件設(shè)置篩選條件如果僅對(duì)符合一定條件的個(gè)案分組,單擊 按鈕如果如果 G) 總結(jié)總結(jié)說(shuō)明:a) 這里舉的例子是等距分組,從設(shè)置過(guò)程可以看出,也可以進(jìn)行非等距分組。b) 這里講解的是將離散型、連續(xù)型的變量的值分成若干組,將每一組構(gòu)成的區(qū)間和一個(gè)新變量的值新變量的值建立了關(guān)系,執(zhí)行的操作是: 重新編碼為不同變量重新編碼為不同變量。有時(shí)建立了新變量之后,舊的值已經(jīng)沒(méi)有用了,可以用新生成的變量將原數(shù)值替換掉,這時(shí)需要選擇的操作是: 重重新編碼為相同變量新編碼為相同變量,理論與方法基本相同。演示例子,建立每一個(gè)值與區(qū)間變量的關(guān)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度品牌形象廣告安裝及宣傳推廣合同范本3篇
- 二零二五年度多媒體教學(xué)設(shè)備集成銷售合同3篇
- 統(tǒng)編版語(yǔ)文九年級(jí)下冊(cè)第一課祖國(guó)啊我親愛(ài)的祖國(guó)練習(xí)題(含答案)
- 陜西省渭南市尚德中學(xué)2024-2025學(xué)年高一上學(xué)期第二次階段性語(yǔ)文試卷(含答案)
- 二十四節(jié)氣之大寒介紹
- Unit 13 My seven days(說(shuō)課稿)-2024-2025學(xué)年劍橋少兒英語(yǔ)二級(jí)上冊(cè)
- 二零二五年度報(bào)刊亭智能物流配送合作合同2篇
- 二零二五年度大數(shù)據(jù)房地產(chǎn)典當(dāng)服務(wù)協(xié)議3篇
- 二零二五年度勞動(dòng)合同違約責(zé)任與賠償細(xì)則合同3篇
- 新疆昌吉回族自治州(2024年-2025年小學(xué)六年級(jí)語(yǔ)文)統(tǒng)編版摸底考試(上學(xué)期)試卷及答案
- CQI-23模塑系統(tǒng)評(píng)估審核表-中英文
- 2024年大型游樂(lè)設(shè)施操作(Y2)特種作業(yè)取證(廣東)考試復(fù)習(xí)題庫(kù)(含答案)
- 【教案】Unit+4+My+Favourite+Subject大單元整體教學(xué)設(shè)計(jì)人教版英語(yǔ)七年級(jí)上冊(cè)
- 2024年省國(guó)資委選聘兼職外部董事人選高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 2024-2030年中國(guó)工控機(jī)行業(yè)需求狀況及發(fā)展趨勢(shì)分析研究報(bào)告
- 離職證明(標(biāo)準(zhǔn)模版)
- 遼寧省名校聯(lián)盟2024年高三9月份聯(lián)合考試 英語(yǔ)試卷(含答案詳解)
- JGJ181-2009T 房屋建筑與市政基礎(chǔ)設(shè)施工程檢測(cè)
- GB/T 20554-2024海帶
- 100以內(nèi)加減法混合題帶括號(hào)
- 《自然生態(tài)降解聚乙烯工業(yè)包裝膜》編制說(shuō)明
評(píng)論
0/150
提交評(píng)論