




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
關(guān)于數(shù)據(jù)的計量尺度第1頁,講稿共58頁,2023年5月2日,星期三(1)定類尺度(NominalScale)也稱分類尺度例如:性別、民族、職業(yè)數(shù)據(jù)表現(xiàn)為“類別”各類之間無等級次序各類別可以用數(shù)字代碼表示根據(jù)定類尺度得到的數(shù)據(jù)為分類數(shù)據(jù)。第2頁,講稿共58頁,2023年5月2日,星期三(2)定序尺度(OrdinalScale)也稱順序尺度例如健康狀況、質(zhì)量等級可對等級、大小等排序未測量出類別之間的準確差值根據(jù)定序尺度得到的數(shù)據(jù)為順序數(shù)據(jù)。第3頁,講稿共58頁,2023年5月2日,星期三(3)定距尺度(IntervalScale)也稱間隔尺度例如年份、攝氏溫度數(shù)據(jù)表現(xiàn)為“數(shù)值”可以進行加減運算“0”是只是尺度上的一個點,不代表“不存在”根據(jù)定距尺度得到的數(shù)據(jù)為間距數(shù)據(jù)。第4頁,講稿共58頁,2023年5月2日,星期三(4)定比尺度(RatioScale)也稱比率尺度例如體重、身高數(shù)據(jù)表現(xiàn)為“數(shù)值”可以進行加減、乘除運算“0”表示“沒有”或“不存在”根據(jù)定比尺度得到的數(shù)據(jù)為比率數(shù)據(jù)。第5頁,講稿共58頁,2023年5月2日,星期三四種計量尺度的比較四種計量尺度的比較定類尺度定序尺度定距尺度定比尺度
分類(=,≠)
排序(<,>)
間距(+,-)
比值(×,÷)√√√√√√√√√√計量尺度數(shù)學特性第6頁,講稿共58頁,2023年5月2日,星期三四種計量尺度的比較1、四種尺度所包含的信息量是依次遞增的,級別由低到高。2、根據(jù)較高層次的計量尺度可以獲得較低層次的計量尺度。3、不同的尺度數(shù)據(jù)對應(yīng)著不同數(shù)據(jù)顯示方法和分析方法。第7頁,講稿共58頁,2023年5月2日,星期三8數(shù)據(jù)的基本類型第8頁,講稿共58頁,2023年5月2日,星期三9問卷題目的類型大致可以分為單選、多選、排序、開放題目四種類型,他們的變量的定義和處理的方法各有不同,詳細舉例介紹如下:第9頁,講稿共58頁,2023年5月2日,星期三3.2統(tǒng)計圖數(shù)據(jù)類型定性數(shù)據(jù)定量數(shù)據(jù)條形圖餅圖線圖莖葉圖箱線圖直方圖第10頁,講稿共58頁,2023年5月2日,星期三3.2.1線圖(LineChart)利用線形的升降起伏來表現(xiàn)描述的變量在一段時期內(nèi)的變動情況,主要用于顯示時間數(shù)列的數(shù)據(jù)。1996年-2003年城鄉(xiāng)居民人民幣儲蓄存款年底余額第11頁,講稿共58頁,2023年5月2日,星期三雙變項線形圖(延伸線)輸出結(jié)果雙變項線形圖(復(fù)線圖)輸出結(jié)果3.2.1線圖(LineChart)第12頁,講稿共58頁,2023年5月2日,星期三3.2.2條形圖(BarChart)用寬度相同的條形高度或長短來表示數(shù)據(jù)變動的圖形,條形的排列可以橫排,也可以縱排。條形圖有單式、復(fù)式等形式。2003年我國就業(yè)人員情況(萬人)第13頁,講稿共58頁,2023年5月2日,星期三3.2.3圓形圖(PieChart)也叫餅圖,它是用圓形及圓內(nèi)扇形的面積來表示數(shù)值大小的圖形。主要用于總體內(nèi)部的結(jié)構(gòu),各組成部分所占比例等。2003年我國國內(nèi)生產(chǎn)總值中各產(chǎn)業(yè)比重第14頁,講稿共58頁,2023年5月2日,星期三3.2.4直方圖(Histogram)用來反映定量變量的分布狀況。在統(tǒng)計分組的基礎(chǔ)上,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖。注意對不等距分組:縱軸必須表示為頻數(shù)密度。頻數(shù)密度=頻數(shù)/組距(面積之和=總頻數(shù))手工繪制直方圖時需要先對數(shù)據(jù)進行分組;用統(tǒng)計軟件spss作直方圖時統(tǒng)計軟件可以自動進行分組。第15頁,講稿共58頁,2023年5月2日,星期三直方圖(等距分組)某會計師事務(wù)所對20家公司進行年終審計所需時間(天)的頻數(shù)分布表審計時間(天)頻數(shù)10-15415-20820-25525-30230-351合計20第16頁,講稿共58頁,2023年5月2日,星期三直方圖(不等距分組)某會計師事務(wù)所對20家公司進行年終審計所需時間(天)的頻數(shù)分布表審計時間(天)頻數(shù)頻數(shù)密度10-1540.815-2081.620-255125-3530.3合計20-第17頁,講稿共58頁,2023年5月2日,星期三直方圖與條形圖的異同都是用來反映數(shù)據(jù)的分布狀況,適用于不同類型的數(shù)據(jù)。條形圖是用條形的高度表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的。直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義。直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列。第18頁,講稿共58頁,2023年5月2日,星期三主要用于顯示未分組的原始數(shù)據(jù)的分布。由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的。通常以數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉,樹葉上只保留一位數(shù)字。樹葉的豎列要對齊,以計算各組的次數(shù)。原始數(shù)據(jù):
24,26,24,21,27,27,30,41,32,38從小到大排序后的數(shù)據(jù):
21,24,24,26,27,27,30,32,38,413
0284
12
144677303.2.5莖葉圖(Stem-and-LeafDisplay)莖葉圖第19頁,講稿共58頁,2023年5月2日,星期三SPSSStatistics生成的一個莖葉圖40名教師的年齡的數(shù)據(jù):40,41,48,51,37,35,36,50,33,42,28,33,36,29,28,29,34,35,27,36,28,29,34,26,35,40,27,43,45,39,42,41,48,55,43,42,42,51,52,64Stem-and-LeafPlot
FrequencyStem&Leaf
9.00
2.677888999
4.00
3.3344
8.00
3.55566679
10.00
4.0011222233
3.00
4.588
4.00
5.0112
1.00
5.5
1.00Extremes(>=64)
Stemwidth:10.00
Eachleaf:1case(s)
第20頁,講稿共58頁,2023年5月2日,星期三常用的集中趨勢的測度指標:算術(shù)平均數(shù)中位數(shù)眾數(shù)集中趨勢:一組數(shù)據(jù)向其中心值靠攏的傾向和程度。集中趨勢測度:尋找數(shù)據(jù)水平的代表值或中心值。第21頁,講稿共58頁,2023年5月2日,星期三4.1.1算術(shù)平均數(shù)(均值,ArithmeticMean)總體均值常用表示。樣本均值常用表示。樣本均值的計算公式:簡單平均數(shù):加權(quán)平均數(shù)(分組數(shù)據(jù)):
4.1
集中趨勢的測定第22頁,講稿共58頁,2023年5月2日,星期三算術(shù)平均數(shù)的性質(zhì)1、 所有的定量數(shù)據(jù)都有算術(shù)平均數(shù)。2、計算算術(shù)平均數(shù)時使用了所有數(shù)據(jù)。3、一組數(shù)只有一個均值。4、各變量值與均值的離差之和等于零。張村有個張千萬,九個鄰居窮光蛋;統(tǒng)計平均算資產(chǎn),個個都是張百萬。
缺點:易受極端值的影響。第23頁,講稿共58頁,2023年5月2日,星期三一組數(shù)據(jù)按大小順序排列后,處在數(shù)列中點位置的數(shù)值。特點:對一組數(shù)據(jù)是唯一的。不受極端值的影響。主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)。4.1.2中位數(shù)(Median)
4.1
集中趨勢的測定第24頁,講稿共58頁,2023年5月2日,星期三根據(jù)原始數(shù)據(jù)計算中位數(shù)n為奇數(shù)時等于第(n+1)/2個數(shù)。n為偶數(shù)時等于第n/2和n/2+1個數(shù)的平均值1,2,5,9,11中位數(shù)=51,2,5,9,11,18中位數(shù)=(5+9)/2=7第25頁,講稿共58頁,2023年5月2日,星期三一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。主要特點:不受極端值的影響。有的數(shù)據(jù)無眾數(shù)或有多個眾數(shù)。對未分組定量資料很少使用。4.1.3眾數(shù)(Mode)
4.1
集中趨勢的測定第26頁,講稿共58頁,2023年5月2日,星期三眾數(shù)的不惟一性眾數(shù)無眾數(shù)眾數(shù)1眾數(shù)2第27頁,講稿共58頁,2023年5月2日,星期三眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系對稱分布
均值=中位數(shù)=眾數(shù)左偏分布均值
中位數(shù)
眾數(shù)<<右偏分布眾數(shù)
中位數(shù)均值<<第28頁,講稿共58頁,2023年5月2日,星期三反映各變量值遠離其中心值的程度(離散程度),從另一個側(cè)面說明了集中趨勢測度值的代表程度。常用指標:全距(極差)四分位距方差和標準差離散系數(shù)
4.2
離散程度的測定三個不同的曲線表示三個不同的總體,其均值相同,但離散趨勢不同。第29頁,講稿共58頁,2023年5月2日,星期三全距也稱極差,是一組數(shù)據(jù)的最大值與最小值之差。R=最大值—最小值組距分組數(shù)據(jù)可根據(jù)最高組上限-最低組下限計算。受極端值的影響。
全距=?2,5,6,7,8,9,10,12,15,16,204.2.1全距(Range)
4.2
離散程度的測定7891078910第30頁,講稿共58頁,2023年5月2日,星期三等于上四分位數(shù)與下四分位數(shù)之差反映了中間50%數(shù)據(jù)的離散程度,數(shù)值越小說明中間的數(shù)據(jù)越集中。不受極端值的影響??梢杂糜诤饬恐形粩?shù)的代表性。
2,5,6,7,8,9,10,12,15,16,20Q1=6,Q2=9,Q3=154.2.2四分位距(Inter-QuartileRange)
4.2
離散程度的測定第31頁,講稿共58頁,2023年5月2日,星期三方差是一組數(shù)據(jù)中各數(shù)值與其算術(shù)平均數(shù)離差平方的平均數(shù),標準差是方差正的平方根??傮w方差和樣本方差的符號不同,計算公式也不一樣。是反映定量數(shù)據(jù)離散程度的最常用的指標。4.2.3方差和標準差
4.2
離散程度的測定4681012x=8.3第32頁,講稿共58頁,2023年5月2日,星期三方差的計算公式總體方差
樣本方差未分組
數(shù)據(jù)分組數(shù)據(jù)樣本方差用(n-1)去除,從數(shù)學角度看是因為它是總體方差σ2的無偏估計量。第33頁,講稿共58頁,2023年5月2日,星期三標準差與其相應(yīng)的均值之比,表示為百分數(shù)。特點:反映了相對于均值的相對離散程度;可用于比較計量單位不同的數(shù)據(jù)的離散程度;計量單位相同時,如果兩組數(shù)據(jù)的均值相差懸殊,離散系數(shù)可能比標準差等絕對指標更有意義。4.2.4離散系數(shù)(CoefficientofVariation)
4.2
離散程度的測定第34頁,講稿共58頁,2023年5月2日,星期三偏態(tài)和峰度的類型偏態(tài)左偏分布右偏分布正態(tài)分布扁平分布峰態(tài)尖峰分布第35頁,講稿共58頁,2023年5月2日,星期三數(shù)據(jù)分布的不對稱性稱作偏態(tài)。偏態(tài)系數(shù)(SK)是對數(shù)據(jù)分布的不對稱性(偏斜程度)的測度。偏態(tài)系數(shù)有多種計算方法,在統(tǒng)計軟件中(如Excel等)通常采用以下公式:
4.3.1偏態(tài)及其測定(
Skewness)
4.3
分布形態(tài)的測定第36頁,講稿共58頁,2023年5月2日,星期三偏態(tài)系數(shù)的含義左偏分布(也稱負偏分布):偏態(tài)系數(shù)SK<0;偏態(tài)系數(shù)的絕對值越大,偏斜越嚴重數(shù)據(jù)向左邊延伸得更多右偏分布(也稱正偏分布):偏態(tài)系數(shù)SK>0;偏態(tài)系數(shù)的絕對值越大,偏斜越嚴重。數(shù)據(jù)向右邊延伸得更多對稱分布:偏態(tài)系數(shù)=0。
第37頁,講稿共58頁,2023年5月2日,星期三峰度:數(shù)據(jù)分布的扁平或尖峰程度。峰度系數(shù)(K):數(shù)據(jù)分布峰度的度量值,對數(shù)據(jù)分布尖峰或扁平程度的測度。統(tǒng)計軟件(如Excel等)中常用以下公式計算4.3.2峰度及其測定(Kurtosis)
4.3
分布形態(tài)的測定第38頁,講稿共58頁,2023年5月2日,星期三峰度系數(shù)的含義扁平分布尖峰分布峰度系數(shù)K<0,與正態(tài)分布相比該分布一般為扁平、瘦尾,肩部較胖。峰度系數(shù)K>0,與正態(tài)分布相比該分布一般為尖峰、肥尾,肩部較瘦。均值和方差相同的正態(tài)分布第39頁,講稿共58頁,2023年5月2日,星期三5.2.2相關(guān)系數(shù)的計算相關(guān)系數(shù)(CoefficientofCorrelation)是用來衡量變量之間相關(guān)程度的指標,根據(jù)變量的多少和屬性可以有多種不同的計算方法。衡量兩個定量變量之間線性相關(guān)程度的常用指標是皮爾遜(Pearson)相關(guān)系數(shù)。通常以ρ表示總體的相關(guān)系數(shù),以r表示樣本的相關(guān)系數(shù)。第40頁,講稿共58頁,2023年5月2日,星期三r的取值范圍為:-1≤r≤1;r越接近1,X與Y之間的線性關(guān)系越好;r=1為完全正相關(guān)關(guān)系;r=-1為完全負相關(guān)關(guān)系r=0,兩個變量之間不存在線性關(guān)系或不相關(guān)。一般可按三級劃分:|r|<0.4為低度線性相關(guān);0.4≤|r|<0.7為顯著性相關(guān);0.7≤|r|<1為高度線性相關(guān)。相關(guān)系數(shù)r的特征第41頁,講稿共58頁,2023年5月2日,星期三5.2.3相關(guān)系數(shù)的顯著性檢驗樣本相關(guān)系數(shù)r受到抽樣波動的影響,是一個隨機變量。相關(guān)系數(shù)非常高的樣本也有可能來自無相關(guān)關(guān)系的總體。為了排除這種情況,需要對相關(guān)系數(shù)進行假設(shè)檢驗。第42頁,講稿共58頁,2023年5月2日,星期三(1)MultipleR,又稱為相關(guān)系數(shù),它用來衡量變量x和y之間相關(guān)程度的大小。R為0.9968,表示二者之間的關(guān)系是強正相關(guān)。1.回歸統(tǒng)計表實驗任務(wù)二:使用Excel的分析工具庫進行回歸第43頁,講稿共58頁,2023年5月2日,星期三R的取值范圍為:-1≤R≤1;R越接近1,X與Y之間的線性關(guān)系越好;R=1為完全正相關(guān)關(guān)系;R=-1為完全負相關(guān)關(guān)系R=0,兩個變量之間不存在線性關(guān)系或不相關(guān)。一般可按三級劃分:|r|<0.4為低度線性相關(guān);0.4≤|r|<0.7為顯著性相關(guān);0.7≤|r|<1為高度線性相關(guān)。實驗任務(wù)二:使用Excel的分析工具庫進行回歸第44頁,講稿共58頁,2023年5月2日,星期三(2)RSquare(擬合優(yōu)度系數(shù)R2):用來說明用自變量解釋因變量變差的程度,以測量對因變量的擬合效果。擬合優(yōu)度系數(shù)為0.9936,表明用自變量可解釋因變量變差的99.36%。實驗任務(wù)二:使用Excel的分析工具庫進行回歸第45頁,講稿共58頁,2023年5月2日,星期三決定系數(shù)的取值R2的取值范圍是[0,1]。R2越接近于1,表明回歸平方和占總離差平方和的比例越大,回歸直線與各觀測點越接近,回歸直線的擬合程度就越好。在一元線性回歸中,相關(guān)系數(shù)r的平方等于判定系數(shù),符號與自變量x的系數(shù)一致。因此可以根據(jù)回歸結(jié)果求出相關(guān)系數(shù)。
所有的回歸程序都會給出R2的值.第46頁,講稿共58頁,2023年5月2日,星期三(3)AdjustedRSquare(調(diào)整的擬合優(yōu)度系數(shù)):僅用于多元回歸才有意義,它用于衡量加入獨立變量后模型的擬合程度。當有新的獨立變量加入后,即使這一變量同因變量之間不相關(guān),未經(jīng)修正的R2也要增大,修正的R2僅用于比較含有同一個因變量的各種模型。(4)標準誤差:又稱為標準回歸誤差或估計標準誤差,它用來衡量擬合程度的大小,也用于計算與回歸有關(guān)的其他統(tǒng)計量,此值越小,說明擬合程度越好。實驗任務(wù)二:使用Excel的分析工具庫進行回歸第47頁,講稿共58頁,2023年5月2日,星期三實驗任務(wù)二:使用Excel的分析工具庫進行回歸擬合優(yōu)度
1、決定系數(shù)
2、估計標準誤差顯著性檢驗
3、t檢驗
4、F檢驗第48頁,講稿共58頁,2023年5月2日,星期三季節(jié)指數(shù)乘法模型中的季節(jié)成分通過季節(jié)指數(shù)來反映。季節(jié)指數(shù)(季節(jié)比率):反映季節(jié)變動的相對數(shù)。1、月(或季)的指數(shù)之和等于1200%(或400%)。2、季節(jié)指數(shù)離100%越遠,季節(jié)變動程度越大,數(shù)據(jù)越遠離其趨勢值。第49頁,講稿共58頁,2023年5月2日,星期三因子分析因子分析在一定程度上可被視為主成分分析的深化和拓展。基本原理是將具有一定相關(guān)關(guān)系的多個變量綜合為數(shù)量較少的幾個因子,研究一種具有錯綜復(fù)雜關(guān)系的實測指標是如何受少數(shù)幾個內(nèi)在的獨立因子所支配的。第50頁,講稿共58頁,2023年5月2日,星期三SPSS因子分析操作6、單擊“得分”,選中“保存為變量”,“顯示因子得分系數(shù)矩陣”,單擊“繼續(xù)”;其余選項使用默認值。單擊“確定”。Displayfactorscorecoefficientmatrix第51頁,講稿共58頁,2023年5月2日,星期三因子分析結(jié)果分析除了“外貌”變量外其他變量的共同度都比較高。變量共同度表變量共同度:各變量中所含原始信息能被提取的公共因子所解釋的程度。變量的共同度越接近1,說明被變量公共因子解釋的程度越高,因子分析的效果越好。第52頁,講稿共58頁,2023年5月2日,星期三前4個因子的貢獻率為81.49%。旋轉(zhuǎn)之后各因子的方差貢獻率可能會發(fā)生變化!SPSS因子分析操作貢獻率第53頁,講稿共58頁,2023年5月2日,星期三旋轉(zhuǎn)前后的因子載荷矩陣旋轉(zhuǎn)成分矩陣,每行都有一個較大的值。
因子旋轉(zhuǎn)后1234簡歷格式.116.830.109-.136外貌.440.151.399.227研究能力.064.128.007.928興趣愛好.220.245.871-.0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東潮州衛(wèi)生健康職業(yè)學院《環(huán)境生態(tài)工程與設(shè)計》2023-2024學年第二學期期末試卷
- 山西省運城市運康中學2025年初三1月份階段模擬測試化學試題試卷含解析
- 2025年安徽省利辛縣重點達標名校初三下學期期中英語試題文試卷含答案
- 山東中醫(yī)藥高等??茖W?!稊?shù)字化建筑設(shè)計概論》2023-2024學年第二學期期末試卷
- 山東肥城市泰西中學2025屆高三第二次校模擬考試生物試題含解析
- 內(nèi)蒙古美術(shù)職業(yè)學院《醫(yī)療器械管理及法規(guī)》2023-2024學年第一學期期末試卷
- 2025年重慶市北岸區(qū)初三第一次調(diào)研考試(一模)物理試題含解析
- 重慶健康職業(yè)學院《信息檢索競賽》2023-2024學年第一學期期末試卷
- 蘇州工藝美術(shù)職業(yè)技術(shù)學院《小學生識字寫字教學》2023-2024學年第二學期期末試卷
- 北京舞蹈學院《就業(yè)指導(dǎo)-職業(yè)生涯規(guī)劃》2023-2024學年第二學期期末試卷
- 110kV立塔架線安全施工方案
- 完形填空-2025年安徽中考英語總復(fù)習專項訓(xùn)練(含解析)
- 20180510醫(yī)療機構(gòu)門急診醫(yī)院感染管理規(guī)范
- DL∕T 5210.2-2018 電力建設(shè)施工質(zhì)量驗收規(guī)程 第2部分:鍋爐機組
- 2024北京海淀區(qū)初二(下)期末物理及答案
- 基層醫(yī)療衛(wèi)生機構(gòu)6S管理標準1-1-5
- 2018容器支座第1部分:鞍式支座
- 重點關(guān)愛學生幫扶活動記錄表
- 江蘇省蘇州市2023-2024學年四年級下學期期中綜合測試數(shù)學試卷(蘇教版)
- 2024-2029年中國生鮮吸水墊行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報告
- 華大新高考聯(lián)盟2024屆高三3月教學質(zhì)量測評語文試題及答案
評論
0/150
提交評論