SPSS統(tǒng)計軟件的操作與應(yīng)用.ppt_第1頁
SPSS統(tǒng)計軟件的操作與應(yīng)用.ppt_第2頁
SPSS統(tǒng)計軟件的操作與應(yīng)用.ppt_第3頁
SPSS統(tǒng)計軟件的操作與應(yīng)用.ppt_第4頁
SPSS統(tǒng)計軟件的操作與應(yīng)用.ppt_第5頁
已閱讀5頁,還剩126頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、SPSS社會統(tǒng)計軟件學習,MARKETING INVESTIGATION,李彬彬 王亮,統(tǒng)計學基本知識,統(tǒng)計學定義:它是關(guān)于收集分析表述和解釋統(tǒng)計數(shù)據(jù)的方法論科學 統(tǒng)計的功能:主要是信息咨詢和監(jiān)督 現(xiàn)代統(tǒng)計學分科:描述統(tǒng)計學與推斷統(tǒng)計學(統(tǒng)計方法構(gòu)成) 理論統(tǒng)計學與應(yīng)用統(tǒng)計學(方法研究與應(yīng)用) 基本概念 統(tǒng)計總體:是指客觀存在的,在同一性質(zhì)基礎(chǔ)上結(jié)合起來的許多個別單位 的整體,如上海地區(qū)的人口總數(shù) 樣本總體:在統(tǒng)計總體里,按照一定抽樣方法抽取的部分個體,這些個體客 觀地反映總體的特征,如合理抽樣100個學生樣本進行相關(guān)統(tǒng)計 指 標 :反映現(xiàn)象總體數(shù)量特征的概念,如樣本平均數(shù) 變 量: 統(tǒng)計總體

2、個單位所具有的共同特征。如年齡,性別,一 基本概念,二 統(tǒng)計數(shù)據(jù)分布特征的描述,1 統(tǒng)計變量集中趨勢的測定 2 統(tǒng)計變量離散程度的測定 3 變量分布偏度與峰度的描述,1 統(tǒng)計變量集中趨勢的測定 定義:統(tǒng)計數(shù)據(jù)的集中趨勢是指數(shù)據(jù)向其中心值靠近或集中的趨勢 測定集中趨勢的作用 1)反映總體各單位變量分布的集中趨勢和一般水平 2)比較同類現(xiàn)象在不同單位的發(fā)展水平 3)比較同類現(xiàn)象在不同時期的發(fā)展變化趨勢或規(guī)律 4)分析現(xiàn)象之間的依存關(guān)系 測量集中趨勢的度量:位置平均數(shù)和數(shù)值平均數(shù),位置平均數(shù) 眾數(shù)(Mode):總體中出現(xiàn)次數(shù)最多的那個變量值,眾數(shù)在描述數(shù)據(jù)集中趨勢方面有一定的意義。例如,制鞋廠可以根

3、據(jù)消費者所需鞋的尺碼的眾數(shù)來安排生產(chǎn)。 求某醫(yī)院當天出生新生兒的體重的眾數(shù),數(shù)據(jù)如表1-1所示。,中位數(shù)(Median):將總體中的數(shù)據(jù)按順序排列后,處于數(shù)列中點位置上的那個數(shù)據(jù)或變量值。它是一種位置代表值,所以不會受到極端數(shù)值的影響,具有較高的穩(wěn)健性。 如果N為奇數(shù),那么該數(shù)列的中位數(shù)就是位置 上的數(shù); 如果N為偶數(shù),中位數(shù)則是該數(shù)列中第 與第 +1位置上兩個數(shù)值的平均數(shù) 求某班級學生身高的中位數(shù),數(shù)據(jù)如表1-2所示。,四分位數(shù):將一組個案由小到大(或由大到?。┡判蚝?,用3個點將全部數(shù)據(jù)分為四等份,與3個點上相對應(yīng)的變量稱為四分位數(shù),分別記為Q1(第一四分位數(shù))、Q2(第二四分位數(shù))、Q3(

4、第三四分位數(shù))。其中,Q3到Q1之間的距離的一半又稱為四分位差,記為Q。四分位差越小,說明中間的數(shù)據(jù)越集中;四分位差越大,則意味著中間部分的數(shù)據(jù)越分散。,頻數(shù)(Frequency):一個變量在各個變量值上取值的個案數(shù)。如要了解學生某次考試的成績情況,需要計算出學生所有分數(shù)取值,以及每個分數(shù)取值有多少個人,這就需要用到頻數(shù)分析。 變量的頻數(shù)分析正是實現(xiàn)上述分析的最好手段,它可以使人們非常清楚地了解變量取值的分布情況。 例子 10個學生在某次數(shù)學、語文、化學考試中成績?nèi)绫?-3所示,試求學生在3門課程上的頻數(shù)分布。,數(shù)值平均數(shù) 算術(shù)平均數(shù)(mean):是表現(xiàn)數(shù)據(jù)的集中趨勢和代表性水品,基本形式為總

5、體標志總量比上總體單位總數(shù)。例如,學生某門學科的平均成績、公司員工的平均收入、某班級學生的平均身高等。 加權(quán)算術(shù)平均數(shù)(weighted mean):主要用于數(shù)據(jù)已經(jīng)分組,并編制出次數(shù)分布的條件下,這時必須先將各組標志值乘以相應(yīng)的次數(shù),得到各組的標志總量,然后再相加得到總體標志總量。,三個常用描述性度量比較,2 統(tǒng)計變量離散程度的測定 集中趨勢是統(tǒng)計總體數(shù)據(jù)特征之一,但由于個體的差異性,總體中的各數(shù)據(jù)還呈現(xiàn)相分散的離中趨勢,因此對數(shù)據(jù)的統(tǒng)計分析,除了要反映其分布的集中趨勢外,還要反映數(shù)據(jù)的離散程度,以到達對數(shù)據(jù)變動規(guī)律的全面描述。 定義:離散程度是度量統(tǒng)計分布離中趨勢的指標,同時反映了總體中各

6、個單位標志值的變異程度和平均數(shù)的代表水平。 測定變量離散程度的作用 1)反映現(xiàn)象總體中變量分布的離中趨勢 2)衡量均值的代表性 3)測定現(xiàn)象變動的均勻性或穩(wěn)定性程度 測量離中趨勢的度量:極差平均差四分位差方差標準差離散系數(shù)等,極差(range):又稱全距,離散程度的最簡單測度值,是最大和最小變量值之間的距離在相同樣本容量情況下的兩組數(shù)據(jù),全距大的一組數(shù)據(jù)要比全距小的一組數(shù)據(jù)更為分散。 例子,某地農(nóng)民人均年收入最高是8000元,最地是2600元一年,則該地區(qū)農(nóng)民收入的極差是8000-2600等于5400元 。,方差(variance):所有變量值與平均數(shù)偏差平方的平均值,它是測定離散程度最常用的

7、指標,離散程度最靈敏的指標。 標準差(standard deviation): 它是方差的平方根。它表示了一組數(shù)據(jù)關(guān)于平均數(shù)的平均離散程度。 方差和標準差越大,說明變量值之間的差異越大,距離平均數(shù)這個“中心”的離散趨勢越大。,四分位差(quartile deviation): 分位差是極差的一種改進,四分位差是在數(shù)列中剔除最大和最小各四分之一的數(shù)據(jù),是第一和第三個分位數(shù)之間距離的二分之一,表明中位數(shù)到這兩個四分位數(shù)的平均距離,是說明中位數(shù)代表性高低的測量值。 平均差(mean absolute deviation): 是分配數(shù)列中各單位標志值與其計算平均數(shù)之間離差絕對值的平均數(shù)。 離散系數(shù):適

8、用于比較不同現(xiàn)象或不同水平數(shù)據(jù)的變異程度的情況。,3 變量分布偏度與峰度的描述 集中趨勢和離中趨勢是數(shù)據(jù)分布的兩個重要特征,但是要全面了解數(shù)據(jù)分布的特點,還要知道數(shù)據(jù)分布的形態(tài)特征。 偏度:指分布不對稱的方向和程度。偏度指標為,=0 數(shù)列分布為正態(tài)分布 0數(shù)列分布正(右)偏分布 0數(shù)列分布負(左)偏分布,峰度:指分布圖形的尖峭程度或峰凸程度。峰度是分布集中趨勢高峰的形狀。用表示 當=0時,頻率分布的峰度為正態(tài)分布的峰度 當0時,頻率分布的峰度比正態(tài)分布的峰度要高尖態(tài)峰,表明集中趨勢顯著,離中趨勢低 當0時,頻率分布的峰度比正態(tài)分布的峰度要低平坦峰,表明離中趨勢顯著,集中趨勢低,小結(jié) 本節(jié)主要介

9、紹平均數(shù)、中位數(shù)、眾數(shù)、方差、百分位、頻數(shù)、峰度、偏度等統(tǒng)計學相關(guān)基本知識,基本統(tǒng)計知識是進行SPSS統(tǒng)計分析的基礎(chǔ)和前提。通過基本統(tǒng)計方法的學習,可以對要分析數(shù)據(jù)的總體特征有比較準確的把握,從而有助于選擇其他更為深入的統(tǒng)計分析方法。,希望大家課后多查閱相關(guān)資料書籍,以更好的運用SPSS社會學統(tǒng)計軟件!,歡迎你進入SPSS學習,SPSS簡介,一SPSS的產(chǎn)生、發(fā)展和應(yīng)用領(lǐng)域 二SPSS13.0的安裝、啟動和退出 三SPSS的窗口簡介 四SPSS13.0的Help系統(tǒng),一 SPSS的產(chǎn)生、發(fā)展和應(yīng)用領(lǐng)域,社會科學統(tǒng)計軟件包(Statistical Package for the Social S

10、cience,SPSS)是世界著名的統(tǒng)計分析軟件之一。 1968年,3位美國斯坦福大學的學生開發(fā)了最早的SPSS系統(tǒng),并基于這一系統(tǒng)于1975年在芝加哥合伙成立了SPSS公司。 SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等。 經(jīng)近40年的發(fā)展,在全球已擁有大量的用戶, SPSS主要應(yīng)用于農(nóng)業(yè)、工業(yè)、商業(yè)、醫(yī)學、交通運輸、公檢法、社會學、市場分析、股市行情、軍事地理、旅游業(yè)等多個領(lǐng)域和行業(yè),是世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計軟件。 SPSS的最新版本為19.0,主要開發(fā)為vista使用系統(tǒng),SPSS13.0的經(jīng)典版,穩(wěn)定性比較高。 總之,可以這么說,有需要數(shù)據(jù)分析的地方,就可以用到S

11、PSS,同學們要認真學。,請見演示,二 SPSS13.0的安裝、啟動和退出,三 SPSS的窗口簡介,SPSS主界面主要有兩個,一個是SPSS數(shù)據(jù)編輯窗口,另一個是SPSS輸出窗口。 數(shù)據(jù)編輯窗口由標題欄、菜單欄、工具欄、編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標簽頁和狀態(tài)欄組成,見下圖。,數(shù)據(jù)編輯窗口,1、菜單介紹 File:“文件”菜單用于新建SPSS 各種類型文件,打開一個已存在的文件,從文本文件或其它數(shù)據(jù)源讀入數(shù)據(jù)。 Edit:“編輯”菜單用于撤消操作、剪切、復(fù)制、粘貼、查找、改變SPSS 默認設(shè)置等。 View:運用“視圖”菜單顯示或隱藏狀態(tài)行、工具欄、網(wǎng)絡(luò)線、值標簽和改變字體。 Data:

12、運用“數(shù)據(jù)”菜單對SPSS 數(shù)據(jù)文件進行全局變化,例如定義變量,合并文件,轉(zhuǎn)置變量和記錄,或產(chǎn)生分析的觀測值子集等。 Transform:“轉(zhuǎn)換”菜單在數(shù)據(jù)文件中對所選擇的變量進行變換,并在已有變量值的基礎(chǔ)上計算新的變量。,Analyze:“分析”菜單在以前版本中為“統(tǒng)計(Statistics)”,可進行各種統(tǒng)計分析,包括各種統(tǒng)計過程(Procedure),如回歸分析、相關(guān)分析、因子分析等等。 Graphs:“圖表”菜單產(chǎn)生條形圖、餅圖、直方圖、散點圖和其它全顏色、高分辨率的圖形,以及動態(tài)的交互式圖形。有些統(tǒng)計過程也產(chǎn)生圖形,所有的圖形都可以編輯。 Utilities:“工具”菜單可以顯示數(shù)據(jù)

13、文件和變量的信息,定義子集,運行腳本程序,自定義SPSS 菜單等。 Window:“窗口”菜單用于選擇不同窗口和最小化所有窗口。 Help:“幫助”菜單包含SPSS 幫助主題、SPSS 教程、SPSS 公司主頁、統(tǒng)計教練等菜單項。,該窗口下方有兩個標簽:“Data View”(數(shù)據(jù)視圖)和“Variable View”(變量視圖)。,(1)一個列對應(yīng)一個變量,即每一列代表一個變量(Variable)或一個被觀測量的特征。例如問卷上的每一項就是一個變量。 (2)行是觀測,即每一行代表一個個體、一個觀測、一個樣品,在SPSS中稱為事件(Case)。例如,問卷上的每一個人就是一個觀測。,SPSS結(jié)果

14、輸出窗口名為Viewer,它是顯示和管理SPSS統(tǒng)計分析結(jié)果、報表及圖形的窗口。,SPSS結(jié)果輸出窗口,用鼠標雙擊結(jié)果輸出窗口中的圖形,進入圖形編輯窗口,可以對圖形進行定義編輯,圖形編輯窗口,四 SPSS13.0的Help系統(tǒng),在運行SPSS的任何時候,單擊“Help”菜單中的“topics”命令,會彈出幫助主題窗口。在其中選擇相關(guān)的命令,即可得到所需的各種幫助。 Help系統(tǒng)可以為不同級別的用戶提供不同階段的指導(dǎo),有如入門級用戶的tutorial”命令,實例學習“Case studies”過程,還有手把手的“Statistics Coach”的過程,小結(jié) SPSS是在當前社會經(jīng)濟分析中應(yīng)用最

15、廣泛的軟件之一。繼SPSS13.0之后,SPSS公司推出了最新的SPSS19.0,這是一個功能強大、設(shè)計人性化的統(tǒng)計學軟件。 SPSS的主界面有兩個,一個是SPSS數(shù)據(jù)編輯窗口,一個是SPSS結(jié)果輸出窗口,例外還有一個圖形編輯窗口。,下面讓我們進入主題吧!,數(shù)據(jù)輸入和整理,一 定義變量,SPSS對數(shù)據(jù)的處理是以變量為前提的,因此本節(jié)主要介紹定義變量、輸入數(shù)據(jù)和數(shù)據(jù)整理。,輸入數(shù)據(jù)前首先要定義變量。定義變量即要定義變量名、變量類型、變量長度(小數(shù)位數(shù))、變量標簽(或值標簽)和變量的格式。 單擊數(shù)據(jù)編輯窗口左下方的“Variable View”標簽或雙擊列的題頭(Var),進入如下圖所示的變量定義

16、視圖窗口,在此窗口中即可定義變量。,在上圖所示的窗口中每一行表示一個變量的定義信息,包括Name、Type、Width、Decimal、Label、Values、Missing、Columns、Align、Measure等。,1定義變量名(Name) SPSS默認的變量為Var00001、Var00002等,用戶也可以根據(jù)自己的需要來命名變量。SPSS變量的命名和一般的編程語言一樣,有一定的命名規(guī)則,具體內(nèi)容如下。, 變量名必須以字母、漢字或字符開頭,其他字符可以是任何字母、數(shù)字或_、#、$等符號。 變量最后一個字符不能是句號。 變量名總長度不能超過8個字符(即4個漢字)。 不能使用空白字符或

17、其他特殊字符(如“!”、“?”等)。 變量命名必須惟一,不能有兩個相同的變量名。 在SPSS中不區(qū)分大小寫。例如,HXH、hxh或Hxh對SPSS而言,均為同一變量名稱。圖2-3 定義變量類型對話框 SPSS的保留字(Reserved Keywords)不能作為變量的名稱,如ALL、AND、WITH、OR等。,2定義變量類型(Type),單擊Type相應(yīng)單元中的按鈕,彈出如圖2-3所示的對話框,在對話框中選擇合適的變量類型并單擊“OK”按鈕,即可定義變量類型。,SPSS的主要變量類型如下。 Numeric Comma(帶逗點的數(shù)值型)整數(shù)部分每三位數(shù)加一逗號,1,200,000 Dot(逗點作

18、小數(shù)點的數(shù)值型)可定義小數(shù),12345顯示12.345,00 Scientific notation(科學記數(shù)法)定義width為10,decimal places為 3,則1234567.89顯示為1.235+E006 Date Dollar Custom currency String,3變量長度(Width) 設(shè)置變量的長度,當變量為日期型時無效。,4變量小數(shù)點位數(shù)(Decimal) 變量小數(shù)點位數(shù)設(shè)置數(shù)值變量的小數(shù)點位數(shù),當變量為日期型時無效。,5變量標簽(Label) 變量標簽是對變量名的進一步描述,變量標簽可長達120 個字符,變量標簽對大小寫敏感,顯示時與輸入值完全一樣,需要時可

19、用變量標簽對變量名的含義加以解釋。,6變量值標簽(Values) 變量值標簽是對變量的每一個可能取值的進一步描述,當變量是定類或定序變量時,這是非常有用的。,7缺失值的定義方式(Missing) SPSS有兩類缺失值:系統(tǒng)缺失值和用戶缺失值。 單擊Missing相應(yīng)單元中的按鈕,在彈出的如下圖所示的對話框中可改變?nèi)笔е档亩x方式,在SPSS中有兩種定義缺失值的方式。 可以定義3個單獨的缺失值。 可以定義一個缺失值范圍和一個單獨的缺失值。 默認值為None,8變量的顯示寬度(Columns) 輸入變量的顯示寬度,默認為8。,9變量顯示的對齊方式(Align) 選擇變量值顯示時的對齊方式:Left

20、(左對齊)、Right(右對齊)、Center(居中對齊)。默認是右對齊。,10變量的測量尺度(Measure) 變量為定距變量或定比變量,則在Scale相應(yīng)單元的下拉列表中選擇Scale;如果變量為定序變量,則選擇Ordinal;如果變量為定類變量,則選擇Nominal, Scale的測量水平最高,能加減乘除, Ordinal能進行排序測量,只能比較大小或順序, Nominal只是一種類別代表,如性別, 測量尺度和變量類型一樣,都是對變量進行更準確的定義,其在數(shù)據(jù)分析中不是很明顯。 變量按測量精度可以分為 (1)定性變量。 (2)定序變量。 (3)定距變量。 (4)定比變量。,問卷錄入時注意

21、的幾個問題,(1)注意定義不同的數(shù)據(jù)類型Type 各色各樣的問卷題目的類型大致可以分為單選、多選、排序、開放題目四種類型,他們的變量的定義和處理的方法各有不同,我們詳細舉例介紹如下:,定義了所有變量后,單擊“Data View”標簽,即可在出現(xiàn)的數(shù)據(jù)視圖(編輯)窗中輸入數(shù)據(jù)。 數(shù)據(jù)錄入時可以逐行錄入,也可以逐列。 注意:在錄入帶有變量值標簽的數(shù)據(jù)時,用戶手工輸入的是實際的變量值,而屏幕上顯示的是與該變量對應(yīng)的變量值標簽。,二 數(shù)據(jù)的錄入和保存,在錄入數(shù)據(jù)時,應(yīng)及時保存數(shù)據(jù),防止數(shù)據(jù)的丟失,以便再次使用該數(shù)據(jù) 。 用戶確定盤符、路徑、文件名以及文件格式后單擊“Save”按鈕,即可保存為指定類型的

22、數(shù)據(jù)文件。SPSS支持的常見的數(shù)據(jù)文件,一般默認格式SPSS(*.sav),三 SPSS數(shù)據(jù)文件的整理,在建立和輸入好數(shù)據(jù)文件以后,往往還需要進行數(shù)據(jù)文件的加工、整理,經(jīng)過 整理以后的文件才能更好地滿足數(shù)據(jù)分析的要求。包括觀測量排序、數(shù)據(jù)文件轉(zhuǎn)置、數(shù)據(jù)文件合并、數(shù)據(jù)分類匯總、變量計算變量值排序等。一般在菜單Data和Transform中進行操作。 由于課程時間原因,這里就不贅述了,大家課下查閱相關(guān)資料自學。,變量名(Name),變量類型(Type),變量長度(Width),變量小數(shù)點位數(shù)(Decimal),變量標簽(Label),變量值標簽(Values),缺失值的定義(Missing),變量

23、的顯示寬度(Columns),變量的測量尺度(Measure),小結(jié)一下!,下一節(jié),是我們的重點。,常用數(shù)據(jù)分析方法,一 SPSS的統(tǒng)計圖形繪制 二 常用SPSS數(shù)據(jù)分析方法,一 SPSS的統(tǒng)計圖形繪制,統(tǒng)計圖是數(shù)據(jù)最直觀的表示,統(tǒng)計工作的服務(wù)對象多是非專業(yè)的人士。非專業(yè)人士通常不明白什么是相關(guān)分析、什么是回歸分析、什么是因子分析,等等。 下面我們先來介紹一下統(tǒng)計圖的繪制,主要包括:條形圖、線圖、面積圖、餅圖、高低圖、箱圖、直方圖、P-P圖、 Q-Q圖、散點圖等。,1條形圖:利用寬度相同的條形的長短或高低來表現(xiàn)統(tǒng)計數(shù)據(jù)大小或變動情況的統(tǒng)計圖。 條形圖分為簡單條圖、分組條圖、分段條圖,分組條圖-

24、性別對牛奶品牌的選擇,分段條圖-不同年齡對牛奶品牌的選擇,簡單條圖主要針對觀測量的描述,分組條圖更側(cè)重于刻畫各組之間的比較關(guān)系,而分段條圖則側(cè)重于刻畫各段與整體的關(guān)系。,2線圖:用線段的升降來說明現(xiàn)象變動情況的一種統(tǒng)計圖。 比較線線圖對話框和條圖非常相似,都是由定義圖形類型和定義圖形數(shù)據(jù)描述方式兩部分組成,其實不僅僅是條圖和線圖對話框類似,在SPSS中幾乎所有的圖形第一個對話框都是這樣的! 線圖分為簡單線圖,復(fù)式線圖,垂線圖。,3面積圖:用線段下的陰影面積來強調(diào)現(xiàn)象變化的統(tǒng)計圖。,4餅圖:是以整個圓的面積代表被研究現(xiàn)象的總體,按各組成部分占總體比重的大小把圓面積分割成若干扇形,用以表示現(xiàn)象的部

25、分對總體的比例關(guān)系的統(tǒng)計圖。 即餅圖表示部分與整體的關(guān)系。,5直方圖:是常用的描述觀測數(shù)據(jù)頻數(shù)分布的統(tǒng)計圖形,它由一組無間的矩形組成,每一矩形條的寬度表示數(shù)據(jù)范圍的間隔,其高度則表示落入給定間隔內(nèi)的觀測數(shù)據(jù)頻數(shù),利用直方圖可以直觀反映觀測變量的統(tǒng)計分布。,6 P-P圖和 Q-Q圖:用來檢驗數(shù)據(jù)是否服從某種分布。,在P-P圖中檢驗數(shù)據(jù)是否服從某種分布標準有兩個: 第一,看P-P圖上的數(shù)據(jù)點和直線的重合度 第二,看P-P去勢圖的點是否關(guān)于直線Y=0在較小的范圍上波動,7 散點圖:用來表示兩個或兩個以上變量之間的相互關(guān)系的圖形。 在統(tǒng)計數(shù)據(jù)分析中,要選擇恰當?shù)慕y(tǒng)計方法,通常都離不開散點圖,1描述性統(tǒng)

26、計分析(單變量描述和均值差異比較) 2相關(guān)分析與回歸分析(變量間的統(tǒng)計關(guān)系研究) 3其他數(shù)據(jù)分析方法,二 常用SPSS數(shù)據(jù)分析方法,1 變量描述性統(tǒng)計分析,描述性統(tǒng)計分析是基礎(chǔ)的統(tǒng)計分析過程。對于整理好的數(shù)據(jù),通過描述性統(tǒng)計分析,可以挖掘出很多統(tǒng)計量的特征。 常用的描述性統(tǒng)計方法主要包括如下: 頻數(shù)分布表分析(Frequencies過程) 最基礎(chǔ)的統(tǒng)計量分析(Descriptive過程) 探索性分析(Explore過程) 列聯(lián)表分析(Crosstabs過程),頻數(shù)分布表分析(Frequencies過程) 產(chǎn)生變量值的頻數(shù)分布表,并可計算描述性統(tǒng)計量和繪制相對應(yīng)的統(tǒng)計圖。 來獲得變量分布的直觀特

27、征,為進一步的復(fù)雜分析提供重要參考,最基礎(chǔ)的統(tǒng)計量分析(Descriptive過程) 主要用于輸出變量的各類描述性統(tǒng)計量的值,如要描述一個班級學生的身高,描述被試的收入情況。,顯示次序是多個變量輸入結(jié)果的排列順序,探索性分析(Explore過程) 定義:可對變量進行更為深入詳盡的描述性統(tǒng)計分析,它在一般描述性統(tǒng)計指標的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細致與全面,有助于用戶思考對數(shù)據(jù)進行進一步分析的方案。主要包括: (1)提供觀測數(shù)據(jù)可能存在的異常值。 (2)輸出觀測數(shù)據(jù)的描述統(tǒng)計量表與統(tǒng)計圖形。 (3)進行觀測數(shù)據(jù)的分布正態(tài)性檢驗。,20名10歲少兒的身高(cm)資料,數(shù)

28、據(jù)如下表所示,試作探索性分析。,在結(jié)果輸出窗口中將看到如下統(tǒng)計數(shù)據(jù)。 (1)首先輸出如下個案觀察量摘要表,如下表所示。,(3)接著輸出如下4個不同權(quán)重下作中心趨勢的粗略最大似然確定數(shù),,(4)再接著輸出百分位數(shù),也是分組后的百分位數(shù),如下表所示。,(5)分別輸出兩個組中的最大5個數(shù)和最小5個數(shù),并且包括這些值對應(yīng)的ID,如下表所示。,(6)輸出方差齊次性檢驗結(jié)果。,(7)系統(tǒng)還進行數(shù)據(jù)的莖葉情形描述。,(8)系統(tǒng)輸出箱圖,如下圖。,(10)輸出身高正態(tài)概率圖(Normal Q-Q Plot of身高),如下圖。,(11)輸出離散正態(tài)概率圖(Detrended Normal Q-Q Plot o

29、f身高),男孩身高和女孩身高如圖所示。橫坐標是身高,縱坐標是和正態(tài)分布的偏離。,列聯(lián)表分析(Crosstabs過程) 常用來作變量間交叉分組下的頻數(shù)分析,用以揭示變量間是否具有獨立性或具有一定的相關(guān)性。如想分析吸煙習慣和患病率的關(guān)系。,頻數(shù)分析注意的幾個問題,1 頻數(shù)分析:Frequencies過程可以做單變量的頻數(shù)分布圖;顯示數(shù)據(jù)文件中由用戶指定的變量的特定值發(fā)生的頻數(shù);獲得描述性統(tǒng)計量和描述性數(shù)值范圍的統(tǒng)計量。 適用范圍:單選題,排序題,多選題 2 描述分析:可以計算單變量的描述統(tǒng)計量,這些統(tǒng)計量有平均值,算術(shù)和,標準差,最大值,最小值,方差等。 適用范圍:選擇并排序題,開放性數(shù)值題,3

30、多響應(yīng)頻數(shù)分析:也是一種描述性統(tǒng)計方法 適用范圍:多選題的二分法 實現(xiàn):第一步在Multiple ResponseDefines Set 把一道多選題定義了的所有變量集合在一起,給新的變量取名,在Dichotomies Counted 中輸入1。 第二步在Multiple Response.Frequencies中作頻數(shù)分析。,4 交叉頻數(shù)分析:解決多變量的各水平組合的頻數(shù)分析的問題。 適用范圍:用于兩個或兩個以上變量進行交叉分類形成的列聯(lián)表,對變量之間的關(guān)聯(lián)性進行分析。比如要知道不同工作性質(zhì)的人上班適用交通工具的情況,可以通過交叉分析得到的一個二維頻數(shù)表則一目了然。 實現(xiàn):第一步根據(jù)分析的目

31、的來確定交叉分析的選項,確定控制變量和解釋變量(如上面的例子中不同工作的人是控制變量,適用交通工具是解釋變量。 第二步選擇Descriptive statisticsCrosstabs,均值描述:計算各類描述性統(tǒng)計量,并且分析方差分析結(jié)果。,1-2均值比較與方差分析,單樣本T檢驗(one-Sample T Test) 單樣本T檢驗是比較樣本均值和總體均值的T檢驗,如某一個鋼鐵含鐵量服從4.53的正態(tài)分布,試檢驗樣本是否服從4.53。,獨立兩樣本的T檢驗Independent-sample T Test 單樣本T檢驗是檢驗樣本均值和總體均值是否相當,二獨立兩樣本的T檢驗是檢驗兩個獨立樣本的均值是

32、否相當。如甲乙兩種藥的治療效果比較。,方差分析(ANOVA過程) 兩組的均值比較用T檢驗,為了進行兩組以上均數(shù)的比較,通??梢允褂梅讲罘治龇椒ā?在科學實驗和生產(chǎn)過程中,影響一事物的因素是多方面的。比如農(nóng)作物的產(chǎn)量受到品種、肥料、水份、氣候等影響,這些因素有的對產(chǎn)量的影響大,有的影響小。 方差分析就是采用數(shù)理統(tǒng)計方法對所有的結(jié)果進行分析,以鑒別各個因素對研究對象的某些特征值影響大小的一種有效方法。,單因素方差分析(One-way ANOVA過程) 單因素方差分析只考慮一個因素對研究對象的影響,此時其他因素都不變或者控制在一定范圍內(nèi)。,小結(jié),描述性統(tǒng)計主要有頻數(shù)分析、最基礎(chǔ)的統(tǒng)計量分析、探索性分

33、析、列聯(lián)表分析、均值描述、 T檢驗和方差分析等,均值描述和T檢驗是解決兩樣本均值的比較,方差分析是多個變量均值的比較。 描述性統(tǒng)計是進行其他統(tǒng)計分析的基礎(chǔ)和前提。利用這些基本統(tǒng)計方法,可以對要分析數(shù)據(jù)的總體特征有比較準確的把握,同時也為更深入的分析提供了依據(jù)。,2相關(guān)分析與回歸分析(變量間的統(tǒng)計關(guān)系研究),在實際統(tǒng)計中,常常要研究兩個及兩個以上變量的,比如,醫(yī)學統(tǒng)計中研究青少年年齡與身高的關(guān)系,經(jīng)濟學中研究利率與股票價格的關(guān)系等,研究這些關(guān)系主要通過相關(guān)分析和回歸分析。 變量和變量之間的關(guān)系可以分為確定關(guān)系和不確定關(guān)系。所謂確定關(guān)系是指變量之間可以用精確的函數(shù)來描述,而不精確關(guān)系是已知變量之間

34、存在著某種關(guān)系,但是這種關(guān)系不能用函數(shù)來表示。 相關(guān)分析就是研究變量之間的相互關(guān)系的密切程度和變化趨勢,并通過適當?shù)慕y(tǒng)計指標描述。 回歸分析是把變量之間的關(guān)系用函數(shù)關(guān)系表示出來。,2-1相關(guān)分析 相關(guān)分析主要分為:兩變量相關(guān)分析、偏相關(guān)分析、距離分析 兩變量相關(guān)分析:兩個連續(xù)變量之間的相關(guān)和兩個等級變量之間的秩相關(guān)。 偏相關(guān)分析:當兩個變量的取值受其他變量的影響,則采用偏相關(guān)分析的方法控制其他變量的影響,研究兩個變量之間的相關(guān)關(guān)系。 距離分析:主要分析同一變量內(nèi)觀測值之間或者多個變量之間的相似或不相似程度。,相關(guān)系數(shù),相關(guān)系數(shù)的取值范圍在1和+1之間,即1r+1。其中: 若0r1,表明變量之間

35、存在正相關(guān)關(guān)系,即兩個變量的相隨變動方向相同; 若1r0,表明變量之間存在負相關(guān)關(guān)系,即兩個變量的相隨變動方向相反;,對于定距變量的數(shù)據(jù),常通過Pearson相關(guān)系數(shù)值和相關(guān)系數(shù)的Sig的值來驗證。 對于定類變量和等級變量的數(shù)據(jù),通常使用Spearman和Kendall系數(shù)來表 示。 0.01Sig0.05,相關(guān)系數(shù)用“*”標記,表示相關(guān)性顯著,Sig0.01,相關(guān)系數(shù)用“*”標記,表示相關(guān)性高度顯著。,兩變量相關(guān)分析,偏相關(guān)分析 在實際問題中,兩變量的相關(guān)關(guān)系往往還要受到其他因素的影響,這些影響有時候會使相關(guān)分析的結(jié)果變得不那么可靠了,偏相關(guān)分析是指研究兩個變量之間的相關(guān)關(guān)系時,將與這兩個變

36、量有聯(lián)系的其他變量控制不變的統(tǒng)計方法。 根據(jù)控制變量的個數(shù),分為零階相關(guān)分析、一階相關(guān)分析、二階相關(guān)分析。零階相關(guān)分析指沒有相關(guān)變量的相關(guān)分析。一階相關(guān)分析是指有一個控制變量的相關(guān)分析。,例子:分析品牌傾向與教育程度的偏相關(guān)關(guān)系,選擇職業(yè)為控制變量,距離分析: 前面介紹的兩個樣本相關(guān)分析和偏相關(guān)分析都是研究兩樣本之間的相關(guān)關(guān)系。對于兩個變量,研究兩個變量的近似程度也十分重要。 距離分析就是研究變量是否近似的一種相關(guān)分析方法。例如,分析各個城市的日照數(shù)是否相似。這里不在介紹,感興趣的同學自己查資料研究。,2-2回歸分析 定義:用一變量作為自變量,另一個變量作為因變量,建立兩者之間的數(shù)學表達式,從

37、自變量去估計因變量的取值,這個過程叫著回歸分析。 回歸分析和相關(guān)分析的區(qū)別:相關(guān)分析只能大概描述出兩個變量之間的相關(guān)系數(shù),如正相關(guān)或負相關(guān),而回歸分析能夠通過數(shù)學表達式來定量描述變量之間的關(guān)系。 回歸分析的應(yīng)用:一般在生物統(tǒng)計和醫(yī)學統(tǒng)計上,如估計各類微量元素的攝入量對人體血紅蛋白含量的影響?;貧w分析能夠求出自變量和因變量之間的經(jīng)驗公式,所以回歸分析在數(shù)據(jù)挖掘上有預(yù)測和控制功能,譬如在商品流通領(lǐng)域,經(jīng)常使用回歸分析商品價格和商品需要量之間的關(guān)系,以便對商品的價格和需求量進行控制。,回歸分析的應(yīng)用:一般在生物統(tǒng)計和醫(yī)學統(tǒng)計上,如估計各類微量元素的攝入量對人體血紅蛋白含量的影響?;貧w分析能夠求出自變

38、量和因變量之間的經(jīng)驗公式,所以回歸分析在數(shù)據(jù)挖掘上有預(yù)測和控制功能,譬如在商品流通領(lǐng)域,經(jīng)常使用回歸分析商品價格和商品需要量之間的關(guān)系,以便對商品的價格和需求量進行控制。 分類:線性回歸、曲線擬合、二類變量Logistic回歸、非線性回歸 本課程里我們主要探討線性回歸,它主要包括一元線性回歸和多元線性回 歸,其他作為了解。,回歸分析的步驟: 1 對數(shù)據(jù)進行預(yù)處理,找到合適的變量進行分析,如研究某地區(qū)的商品房價格,則與之相關(guān)的變量有面積,地段,住宅風格等 2 做散點圖,觀察變量間的趨勢,初步選擇回歸分析方法 3 進行回歸分析,擬合自變量和因變量之間的公式 4 檢驗,線性回歸分析 根據(jù)自變量的個數(shù),將線性回歸分為一元線性回歸和多元線性回歸。 一元線性回歸:是回歸分析中處理兩個變量線性相關(guān)關(guān)系最簡單的數(shù)學模型。設(shè)變量Y與X有下述關(guān)系: y = a+bx+c,一元線性回歸的操作,多元線性回歸的操作,除了上面的描述性分析和相關(guān)分析,SPSS強大的功能還可以對問卷進行深入的分析,比較常用的有聚類分析、因子分析與對應(yīng)分析、非參數(shù)檢驗等,由于涉及到很專業(yè)的統(tǒng)計學知識,下面只對概念做個簡單的介紹。,3其他數(shù)據(jù)分析方法,聚類分析:就是把沒有分類的信息的資料按照相似程度歸類,并對這些分類進行比例分析,從而明確調(diào)研關(guān)心的全體,如按消費特征對被調(diào)查者

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論