第二講單變量的統(tǒng)計描述_第1頁
第二講單變量的統(tǒng)計描述_第2頁
第二講單變量的統(tǒng)計描述_第3頁
第二講單變量的統(tǒng)計描述_第4頁
第二講單變量的統(tǒng)計描述_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二講單變量的統(tǒng)計描述變量層次的劃分A.定類層次;B.定序?qū)哟?C.定距層次變量的統(tǒng)計描述

A.分布統(tǒng)計表統(tǒng)計圖;B.集中趨勢測量法;C.離散趨勢測量法一、變量的層次1、定類變量定類變量是變量層次最低的,它的取值只有類別屬性之分,而無大小程度之分.如民族,婚姻等.2、定序變量定序變量的層次高于定類變量.它的取值除了有類別屬性之外,還有等級次序的差別.常見的如受教育程度,滿意度,社會經(jīng)濟(jì)地位等.3、定距變量定距變量的層次又高于定序變量.定距變量的取值,除了具有次序?qū)傩酝?取值之間的距離可以度量.如家庭住房面積,家庭人口數(shù)等.4、定比變量定比變量是將兩類相關(guān)的數(shù)加以對比,形成的相對數(shù),用以反映現(xiàn)象的構(gòu)成、比重、密度和速度等數(shù)量關(guān)系。例如將家庭人口數(shù)與家庭總支出對比計算家庭人均支出水平。

二、單變量的統(tǒng)計描述方法基本描述

集中趨勢離散趨勢定類層次

次數(shù)、比例、比率、表格、圖示

眾數(shù)異眾比率

定序?qū)哟?/p>

次數(shù)、比例、比率、表格、圖示、累計次數(shù)、累計百分比中位數(shù)四分位差

定距層次

次數(shù)、比例、比率、表格、圖示、累計次數(shù)、累計百分比、分組

均值標(biāo)準(zhǔn)差

(一)分布統(tǒng)計表統(tǒng)計圖1、分布統(tǒng)計學(xué)里的分布是指一個概念或變量,它的各種情況出現(xiàn)的次數(shù)或頻數(shù),也稱頻次分布。如住房產(chǎn)別包括12種情況,按被訪人的回答,可以得到12對數(shù)據(jù):(x1,n1),(x2,n2)…(x12,n12).括號中的第一項表示變量的可能選項,第二項表示所對應(yīng)的頻次。需要注意的是:(1)變量取值必須完備,只有這樣才能使被訪者一一無遺地進(jìn)行歸類。(2)變量取值必須互斥,這樣才能使每一個觀察值歸入一類,且僅僅歸入一類。2、統(tǒng)計表用表格形式來表示變量的分布。統(tǒng)計表必須具備的內(nèi)容有:表號(統(tǒng)計表x,x),表頭(包括標(biāo)題、時間、地點),標(biāo)識行(產(chǎn)別、頻數(shù)、頻率),主體行(第一項位置,按列填寫變量的不同選項;第二項位置,按列填寫變量取值相應(yīng)的頻次和百分比等等)。要寫明統(tǒng)計的總數(shù)。表尾需要寫清資料來源。定類變量的統(tǒng)計表

表1、天津市居民住房的產(chǎn)別分布(1997)產(chǎn)別次數(shù)百分比1、直管公產(chǎn)43143.12、單位產(chǎn)16916.93、自有資產(chǎn)13713.74、房改購全部產(chǎn)權(quán)18718.75、房改購部分產(chǎn)權(quán)525.26、合作產(chǎn)權(quán)20.27、軍產(chǎn)101.08、宗教產(chǎn)101.012、其他產(chǎn)20.2Total1000100.0教育fcfcf%C%C%一級685506812.4100.012.4二級9048215816.387.628.7三級10639226419.371.348.0四級19328645735.152.083.1五級939355016.916.9100.0總數(shù)550

100.0

定序變量統(tǒng)計表

表2某企業(yè)員工的教育水平

定距變量統(tǒng)計表

表3、天津市不同收入組居民的住房與收入現(xiàn)狀(1997)收入的十等份分組使用面積(平方米)居住面積(平方米)月租金(元)家庭月平均收入(元)128.4919.3417.68472.00233.6523.0426.28726.83336.3823.7122.90867.42432.4522.0224.571003.86536.1724.2924.211154.36638.9026.9226.961306.41740.0826.6429.951481.37842.2526.973.641673.79943.5826.8029.131995.301058.7034.6630.422955.38定距變量制表需要考慮的問題1、組數(shù)組數(shù)太少會掩蓋變量變動時頻次的變化,組數(shù)太多,會使每組內(nèi)頻次過少,看不出明顯的規(guī)律。一般根據(jù)理論和經(jīng)驗進(jìn)行分組。2、等距分組與非等距分組一般情況下采用等距分組,但研究一些特殊問題,如貧困問題,需要對低收入分得細(xì)一些。3、組限(classlimits)就是每組的范圍,包括上限和下限。對于離散型變量一般采取相鄰組限不重疊的原則,而對于連續(xù)型變量,可能出現(xiàn)相鄰組限重疊的情況,這時采取的原則就是“上組限不在內(nèi)”原則。4、分組步驟第一,搜集數(shù)據(jù);第二,在數(shù)據(jù)中找出最大值L,最小值S及極差值R;第三,把數(shù)據(jù)分組,如K組;第四,計算組距h;第五,計算組中值。3、統(tǒng)計圖定類變量:圓瓣圖;條形圖定序變量:條形圖定距變量:直方圖;折線圖(二)集中趨勢測量法(1)集中趨勢測量法(measuresofcentraltendency):就是找出一個數(shù)值來代表變量的資料分布,以反映資料的集結(jié)情況。該方法的意義,就是根據(jù)該代表值(或稱典型值)來估計或預(yù)測每個研究對象的數(shù)值。(2)運用該方法要舍去變量的某些信息,但由于所根據(jù)的數(shù)值最有代表性,所產(chǎn)生的誤差最小。(3)有三種方法供選擇集中值:一是根據(jù)頻次,哪個變量值具有的頻次最多,就選擇哪個變量值。二是根據(jù)居中。三是根據(jù)平均。表4、各種集中趨勢量度的比較

均值中位數(shù)眾數(shù)適用于定距數(shù)據(jù)適用于定序數(shù)據(jù)適用于定類數(shù)據(jù)計算時要用到全部數(shù)據(jù)只需中間數(shù)據(jù)可最快求出受極端值的影響對極端值不敏感有時對個別值的變動也很敏感分組變化時影響不大分組變化時有影響分組變化時影響較大眾值、中位值和均值的比較(1)三者設(shè)計的目的是相同的,都是希望一個數(shù)值來描述整體特征,以便簡化資料。(2)眾值僅使用了資料中最大頻次這一信息,因此,資料中信息的使用是不完善的。(3)雖然均值對資料的信息利用充分,但對嚴(yán)重偏態(tài)的分布,會失去它應(yīng)有的代表性。(4)對于對稱的圖形,三者位置重疊,當(dāng)圖形正偏或負(fù)偏時,均值變化最快,中位值次之,眾數(shù)不變。

(二)離散趨勢測量法(1)離散趨勢測量法(measurementsofdispersion),是要求出一個值來表示個案與個案之間的差異情況。(2)試比較以下兩個班次考試成績:甲:100,90,80,70,60,50,40

乙:85,80,75,70,65,60,55如果僅用集中趨勢測量法來測量兩個班的成績,兩班是相等的。但兩班的分布顯然有差異,需要考慮資料的分散特征。表5、各種離散趨勢量度的比較

標(biāo)準(zhǔn)差四分位差異眾比率適用于定距數(shù)據(jù)適用于定序數(shù)據(jù)適用于定類數(shù)據(jù)計算時用到全部數(shù)據(jù)只需要其中兩段的數(shù)據(jù)可最快求出受極端值的影響大對極端值不敏感有時對個別值的變動也很敏感(3)離異比率(異眾比率)(VariationRatio)離異比率就是非眾值的次數(shù)與全部樣本數(shù)目的比率。公式如下:

其中,N是全部樣本數(shù)目,f是眾值的次數(shù),二者之差就是非眾值的次數(shù)。顯然,非眾值的比例越小,眾值的代表性就越好,信息量越大。反之,非眾值所占的相對頻數(shù)越大,眾值的代表性越差,所提供的信息量也就越小。(4)四分位差(InterquartileRange)四分位差是定序以上變量度量分散程度的方法。計算方法是將樣本由低至高排列,然后分為四個等分(即每個等分包括25%的個案),則第一個四分位置的值(Q1)與第三個四分位置的值(Q3)的差異,就是四分位差(簡寫為Q)。公式為:Q=Q3-Q1。

25%25%25%25%

低Q1Q2Q3Q4高5、標(biāo)準(zhǔn)差定距變量可以利用全距,四分位差計算離散程度,但要損失大量的信息。分析定距變量的離散程度,最常用的方法是標(biāo)準(zhǔn)差(簡寫S),即將各數(shù)值與其均值差的平方和除以全部樣板數(shù)目,然后取其平方根,公式如下:S=還可以根據(jù)分組資料,公式為:

變量(X)72-1181864861316969-41657-16256=73.00506表6三群體住房“使用面積”集中和離散趨勢對比使用面積均值標(biāo)準(zhǔn)差變異系數(shù)租用公房戶34.9914.440.413原有私房戶41.2727.030.658房改中獲得私房戶48.0622.150.461單變量統(tǒng)計描述與SPSS統(tǒng)計軟件

1、頻數(shù)分析分析步驟:(1)單擊Analysis菜單,選擇Descriptivestatistics中的Frequencies選擇項,打開相應(yīng)的對話框。在左側(cè)的源變量框中選擇一個或多個變量,單擊向右箭頭按鈕,使其進(jìn)入Variable框中;(2)根據(jù)需要選擇相應(yīng)的選擇項

DisplayFrequencyTable選擇此項將顯示頻數(shù)分布表。選擇Statistics,打開統(tǒng)計量選擇對話框。在對話框中選擇輸出統(tǒng)計量。可選擇的統(tǒng)計量分四組,每組中的統(tǒng)計量可以同時選擇。A、PercentileValues百分位數(shù)組,可以選擇:

Quartiles:四分位數(shù),顯示25%、50%、75%的百分?jǐn)?shù);

Cutpointforequalgroups:將數(shù)據(jù)平分為所設(shè)定的相等等份,所選擇的數(shù)值范圍為2—100間的整數(shù)。例如,如果鍵入4,那么數(shù)據(jù)將會被四等分,即計算四分位數(shù)值。

Percentile(s):由用戶定義的百分位數(shù)。鍵入的范圍在0—100之間。單變量統(tǒng)計描述與SPSS統(tǒng)計軟件B、Dispersion離散趨勢組:

Std.deviation標(biāo)準(zhǔn)差

Variance方差

Range極值,最大值與最小值之差

Minimum最小值

Maximum最大值

S.E.Mean均值的標(biāo)準(zhǔn)誤C、CentralTendency集中趨勢組:

Mean算術(shù)平均數(shù)

Median中位數(shù)

Mode眾數(shù)

Sum算術(shù)和單變量統(tǒng)計描述與SPSS統(tǒng)計軟件D、Distribution分布參數(shù)組,可以選擇以上選擇項選擇完,單擊Continue確認(rèn)這些選擇,返回主對話框。Chart統(tǒng)計圖形單擊Chart按紐展開統(tǒng)計圖對話框,對圖形的類型及坐標(biāo)等進(jìn)行設(shè)置。FrequenciesFormat:設(shè)置頻數(shù)表輸出的格式,單擊Format按紐打開對話框Orderby排序組,在該組中選擇頻數(shù)表中變量排列順序。共四個選項:

AscendingValues按變量值的升序排列,這是默認(rèn)的排列方式。

DescendingValues按變量的降序排列

Ascendingcounts按頻數(shù)的升序排列

Descendingcounts按頻數(shù)的降序排列。單變量統(tǒng)計描述與SPSS統(tǒng)計軟件2、統(tǒng)計量的描述變量的描述統(tǒng)計量有平均值、標(biāo)準(zhǔn)差、最大值、最小值、方差、極值和平均數(shù)的標(biāo)準(zhǔn)誤。A、分析步驟單擊Analysis菜單,選擇Descriptivestatistics中的選擇項,打開對所選擇的每一個變量在數(shù)據(jù)框中產(chǎn)生其標(biāo)準(zhǔn)化值;DisplayLabel顯示變量的標(biāo)簽;在主對話框中單擊Option按紐,選擇所要描述的統(tǒng)計量與分布單擊OK按鈕提交系統(tǒng)執(zhí)行。B、數(shù)據(jù)分組對于定距層次的變量,有時需要先分組,然后在進(jìn)行統(tǒng)計分布和描述。分組方法如下:單擊Transform菜單,選擇recode中的intodifferentVariables選擇項。鍵入要分組的變量,并定義一個新變量名選擇OldandNewValues命令框定義組限,并賦予一個新值。三、二變量的統(tǒng)計描述1,交叉分組與列聯(lián)表交叉分組下的頻數(shù)、頻率分析的主要任務(wù)有兩個:第一、根據(jù)搜集到的樣本數(shù)據(jù)產(chǎn)生表2、表3的二維交叉列聯(lián)表;第二,在交叉列聯(lián)表的基礎(chǔ)上,分析和比較兩兩變量之間是否具有獨立性或相關(guān)性。2,考慮控制變量下的交叉分組與列聯(lián)表表7、不同收入組的住房類型(頻數(shù)表)獨用三間及以上獨用兩間獨用一間合計500元以下1172341500—10008164852571000—150018188542601500—200017100181352000—25

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論