單變量統(tǒng)計(jì)分析的應(yīng)用_第1頁(yè)
單變量統(tǒng)計(jì)分析的應(yīng)用_第2頁(yè)
單變量統(tǒng)計(jì)分析的應(yīng)用_第3頁(yè)
單變量統(tǒng)計(jì)分析的應(yīng)用_第4頁(yè)
單變量統(tǒng)計(jì)分析的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、單變量統(tǒng)計(jì)分析的應(yīng)用第1頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二 單變量統(tǒng)計(jì)分析可以分為:描述統(tǒng)計(jì)和推論統(tǒng)計(jì)。 單變量描述統(tǒng)計(jì)的目的 單變量推論統(tǒng)計(jì)的目的第2頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二一、頻數(shù)分布頻數(shù)分布適用于一切類型的數(shù)據(jù),一般涉及各個(gè)類別的頻數(shù)和百分比。第3頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二SPSS操作依次單擊:分析-描述統(tǒng)計(jì)-頻率,打開如圖所示的對(duì)話框第4頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二 單擊左側(cè)源變量窗口中要分析的變量,單擊中間的箭頭將其放在“變量”框中。選擇顯示頻率表格,才能在輸出結(jié)果中出現(xiàn)頻

2、數(shù)表,此項(xiàng)常默認(rèn)。圖表,主要用于各類圖。第5頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二單擊統(tǒng)計(jì)量,出現(xiàn)的各選項(xiàng)是頻數(shù)分析.此處各項(xiàng)頻數(shù)分析,在定類變量中往往不涉及,在其他類型變量中涉及。第6頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二各種圖形的制作有條形圖、餅狀圖、直方圖(主要用于定距數(shù)據(jù)分組)信息更豐富的圖形,可以:圖形-舊對(duì)話框。如復(fù)式條形圖第7頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二補(bǔ)充:定距數(shù)據(jù)分組與直方圖制作1.分組的步驟確定組數(shù),一般情況下不小于3不大于20.2.確定組距組距=最大值-最小值/組數(shù)組距往往取5或10的倍數(shù),分組的最小組限為組

3、距的倍數(shù)。第8頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二3.重新編碼變量轉(zhuǎn)換重新編碼為不同變量4.根據(jù)新的變量制圖。如1991數(shù)據(jù)中教育年限變量的直方圖。第9頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二第10頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二二、spss中多選題如何求頻數(shù)多重響應(yīng)分析第11頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二不定項(xiàng)多選(一)不定向多選題的編碼方式 二分變量編碼法(二分法)。 您上班通常采用以下哪些交通工具? A. 步行;B. 自行車;C. 電動(dòng)車;D. 公交車;E. 地鐵;F. 自駕車;G. 班車。 將多選題的

4、每個(gè)選項(xiàng)都定義為一個(gè)子變量,采用“01”編碼進(jìn)行處理,選中的賦值為“1”,未選中的賦值為“0”。 可見1991數(shù)據(jù)文件“健康”。第12頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二 這種方法分析數(shù)據(jù)更方便,是多選題編碼的通用方法。 其優(yōu)點(diǎn)是各選項(xiàng)之間相互獨(dú)立,編碼簡(jiǎn)單清楚,形成的數(shù)據(jù)文件格式統(tǒng)一,方便檢查。 但是這種編碼方式會(huì)明顯增加錄入工作量, 無論被訪者選擇了幾個(gè)答案,錄入人員都要對(duì)每個(gè)子變量進(jìn)行數(shù)據(jù)錄入,一定程度上增加了出現(xiàn)錄入錯(cuò)誤的風(fēng)險(xiǎn)。第13頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二(二)多重響應(yīng)分析分析多重響應(yīng)分析定義變量集二類法(如0=未選中,1=選中)如

5、1991數(shù)據(jù)文件中的22-30健康問題第14頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二第15頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二再點(diǎn)擊 多重響應(yīng)分析-頻率百分比:應(yīng)答次數(shù)占總次數(shù)的百分比如559次/805次=69.4%個(gè)案百分比:應(yīng)答次數(shù)占總?cè)藬?shù)的百分比選擇“需前往醫(yī)院就診”的有559人次,占總回答次數(shù)的805次的69.4%;第16頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二定項(xiàng)多選(一)編碼方法:多重分類法 定項(xiàng)多選題中被訪者可能提供的答案的數(shù)量是已知的且一般會(huì)少于備選項(xiàng)的個(gè)數(shù), 應(yīng)采用多重分類法來進(jìn)行編碼錄入。 a您上班更愿意選用以下哪些交通工

6、具(選擇最主要的3 項(xiàng)) 1.步行;2. 自行車;3. 電動(dòng)車;3. 公交車;6.地鐵;6. 自駕車;7. 班車。 根據(jù)題目限選的答案?jìng)€(gè)數(shù)設(shè)定相應(yīng)個(gè)數(shù)的子變量,如例中可以設(shè)定a1,a2 和a3,他們代表最終選出的3 個(gè)答案。 如果被訪者的選擇為1,3,4,這分別在a1,a2 和a3 三個(gè)變量中輸入1、3 和4。 可見1991數(shù)據(jù)文件中的40-43“問題”。第17頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二(二)多重響應(yīng)分析定義變量集類別(有效值的范圍)1991中的“問題1-問題4”第18頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二第19頁(yè),共45頁(yè),2022年,5月20

7、日,2點(diǎn)15分,星期二多選排序題(一)編碼 定義與選項(xiàng)個(gè)數(shù)相同的若干個(gè)變量,每個(gè)變量的取值做如下定義:0為未選,1為排第一位,2排第二位, 3排第三位,等。 見1991數(shù)據(jù)文件17-21“服從到幫助別人”第20頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二(二)分析 1.轉(zhuǎn)換-重新編碼為相同變量 第21頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二按順序給予權(quán)重,如1991數(shù)據(jù)中,對(duì)“服從到樂于幫助別人”排序,第一重要給5,第二重要給4,-,第五重要給1。第22頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)置,對(duì)全部二次編碼的數(shù)據(jù)進(jìn)行行列轉(zhuǎn)換,得到新

8、數(shù)據(jù)文件第23頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二彈出一個(gè)新的數(shù)據(jù)文件,計(jì)算新數(shù)據(jù)文件中的得分。點(diǎn)轉(zhuǎn)換計(jì)算變量,定義新變量。 即目標(biāo)變量(sum) 數(shù)字表達(dá)式sum(var001 to var1517)第24頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二得分最多的,即為最重要的。第25頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二三、集中趨勢(shì)和離散趨勢(shì)分析及spss應(yīng)用(一)集中趨勢(shì)定類變量:眾數(shù),一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。定序變量:中位數(shù),一組數(shù)據(jù)按值的大小順序排列后,處于中央位置的變量值。定距變量:均值,又稱為算數(shù)平均數(shù)第26頁(yè),共45頁(yè),20

9、22年,5月20日,2點(diǎn)15分,星期二數(shù)據(jù)的測(cè)量層次與集中趨勢(shì)測(cè)量值測(cè)量層次 定類 定序 定距 測(cè)量值 眾數(shù) 眾數(shù) 眾數(shù)測(cè)量值 中位數(shù) 中位數(shù) 均值第27頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二(二)離散趨勢(shì)定類變量:異眾比率非眾數(shù)的頻數(shù)占總頻數(shù)的比例。如,若異眾比率的值是66.7%,表示66.7的取值是眾數(shù)不能代表的,即眾數(shù)的代表性差。定序變量:四分位差數(shù)值越大,說明中間數(shù)據(jù)越分散,由于中位數(shù)代表數(shù)據(jù)的中間位置,因此四分位差在一定程度上說明了中位數(shù)的代表性。定距變量:全距、標(biāo)準(zhǔn)差與方差第28頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二(四)spss應(yīng)用分析描述統(tǒng)計(jì)

10、頻率,確定進(jìn)行描述分析的變量,選擇統(tǒng)計(jì)分析結(jié)果(在統(tǒng)計(jì)量里選)第29頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二第30頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二還可以求子總體的比較均值分析比較均值均值第31頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二 利用數(shù)據(jù)文件,計(jì)算教育眾數(shù)、中位數(shù)、四分位差、均值、標(biāo)準(zhǔn)差和方差。第32頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二離散系數(shù)標(biāo)準(zhǔn)差與均值的比值,用百分比表示 執(zhí)行“比率”命令,選擇相關(guān)指標(biāo)后,點(diǎn)“統(tǒng)計(jì)值”,然后選“cod” 如比較各省每戶家庭去年全年醫(yī)療費(fèi)占去年全年總收入比例的差異程度。第33頁(yè),

11、共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二第34頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二四、單變量總體均值和比例的區(qū)間估計(jì)(推論統(tǒng)計(jì))(一)總體均值的區(qū)間估計(jì)分析描述統(tǒng)計(jì)探索第35頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二大家再選“因子列表”,看又會(huì)出現(xiàn)什么結(jié)果。第36頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二(二)總體比例的區(qū)間估計(jì) 假設(shè)我們隨機(jī)抽取了一個(gè)樣本容量為n的樣本x1,x2,.xn,其中具有某個(gè)特征的個(gè)體有t個(gè),則樣本中具有該特征的比例為p=t/n(樣本比例).如果我們將總體看做0-1分布,即具有這種特征的個(gè)體取值為1,不具有這

12、種特征的個(gè)體取值為0,根據(jù)樣本中的觀測(cè)值,可以獲得具有該特征的個(gè)體的個(gè)數(shù)t=xi ,則具有該特征的個(gè)體的比例為p=t/n= xi /n(樣本比例).由于具有這種特征的個(gè)體取值為1,不具有這種特征的取值為0,可得樣本均值為xi /n.可見此處,樣本均值=樣本比例。 同理,總體中具有該特征的個(gè)體的比例就是總體的均值,因此可以把單總體比例的區(qū)間估計(jì)轉(zhuǎn)換成均值的區(qū)間估計(jì)。第37頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二數(shù)據(jù)文件中,試以95%的置信度估計(jì)該樣本來自總體中職業(yè)為“服務(wù)”的個(gè)體的比例的置信區(qū)間。1.先將多項(xiàng)問題轉(zhuǎn)化成01分布,非服務(wù)職業(yè)的個(gè)體為0,服務(wù)職業(yè)的個(gè)體為1.單擊“轉(zhuǎn)化

13、重新編碼為不同變量”2.單擊“分析探索”第38頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二第39頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二第40頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二第41頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二四、假設(shè)檢驗(yàn)(單變量推論統(tǒng)計(jì)) 要掌握課本上假設(shè)檢驗(yàn)的步驟 一般大樣本用Z檢驗(yàn),小樣本用t檢驗(yàn)。 樣本較大時(shí)候,t值分布接近于正態(tài)分布,t檢驗(yàn)法與Z檢驗(yàn)法的分別就不大了, Z檢驗(yàn)可以看做是t檢驗(yàn)的特例。因此,無論樣本大小如何,都可以用t檢驗(yàn)。 SPSS只提供了t檢驗(yàn)。第42頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二(一)總體均值的假設(shè)檢驗(yàn)分析比較均值單樣本T檢驗(yàn) 1991文件中, 樣本的教育年限均值 驗(yàn)證總體的受教育年限均值是否有變化第43頁(yè),共45頁(yè),2022年,5月20日,2點(diǎn)15分,星期二 若T值大于雙尾檢驗(yàn)值,則拒絕原假設(shè) 或者根據(jù)spss計(jì)算出的sig.水平,與常使用的顯著性水平進(jìn)行,進(jìn)而決定拒絕或假設(shè)原假設(shè).(這個(gè)最簡(jiǎn)單方便)H0=12.88,H112.88t=167.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論