社會統(tǒng)計學(xué)復(fù)習(xí)串講_第1頁
社會統(tǒng)計學(xué)復(fù)習(xí)串講_第2頁
社會統(tǒng)計學(xué)復(fù)習(xí)串講_第3頁
社會統(tǒng)計學(xué)復(fù)習(xí)串講_第4頁
社會統(tǒng)計學(xué)復(fù)習(xí)串講_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

復(fù)習(xí)串講2一、社會統(tǒng)計學(xué)知識體系的邏輯兩條線索:單變量到多變量描述到推論統(tǒng)計方法描述統(tǒng)計推論統(tǒng)計參數(shù)估計假設(shè)檢驗描述統(tǒng)計一、測量層次二、數(shù)據(jù)的組織與展示三、集中趨勢與離散趨勢4一、四種測量層次的數(shù)學(xué)特性定類測量定序測量定距測量定比測量類別區(qū)分(=、≠)√√√√次序區(qū)分(>、<)√√√距離區(qū)分(+、-)√√比例區(qū)分(×、÷)√二、數(shù)據(jù)的組織與展示(一)定類數(shù)據(jù)的組織與展示(二)定序數(shù)據(jù)的組織與展示(三)定距數(shù)據(jù)的組織與展示(一)定類數(shù)據(jù)的組織與展示定類:表:頻數(shù)分布表

圖:條形圖餅圖

對比條形圖

項目1998199920002001(一)優(yōu)撫對象補助金額國家支出集體供給(二)農(nóng)村傳統(tǒng)救濟金額國家支出集體供給(三)城鄉(xiāng)各種福利院支出國家支出集體供給68.032.435.629.87.022.820.210.39.991.451.140.328.57.920.623.113.79.4

107.660.746.931.78.323.428.719.09.7

108.169.538.6

29.512.117.440.526.414.1合計118.0143.0168.0178.1蘇州科技學(xué)院7(二)定序數(shù)據(jù)的組織與展示表:累加頻次,簡寫為cf兩種形式:cf頻次從低到高向上累加(“小于該組上限的頻數(shù)和”)cf頻次從高到低向下累加(“大于該組下限的頻數(shù)和”)圖:條形圖累積頻數(shù)表(CF)向上累加——以變量數(shù)列首組的頻數(shù)為始點,逐個累計各組的頻數(shù),展示小于該組上限的頻數(shù)和。向下累加——以變量數(shù)列末組的頻數(shù)為始點,逐個累計各組的頻數(shù),展示大于該組下限的頻數(shù)和。受教育程度頻數(shù)百分比Cfcf初中高中、職高、技校大專大學(xué)本科研究生及以上1723786627524340.45.520.163.910.10.45.926.089.9100.0100.099.694.174.010.1總計4306100蘇州科技學(xué)院9(三)定距數(shù)據(jù)的組織與展示表:統(tǒng)計表組距、組數(shù)、組限圖:直方圖折線圖直方圖和條形圖的區(qū)別:條形圖的寬度無意義,用長度表示頻數(shù)或百分比;直方圖的寬度代表組距,面積代表頻數(shù)或百分比。直方圖的矩形是連續(xù)排列的,條形圖的矩形可以分開可以連續(xù)。三、集中趨勢與離散趨勢變量的測度離散程度集中趨勢眾數(shù)中位數(shù)均值方差和標準差四分位差異眾比率為了簡化資料,用眾值、中位值、均值來代表變量分布的集中趨勢;

但為了說明它們的所能代表集中趨勢的可靠程度,還需用變量的離散程度加以補充。(一)變量類型與集中趨勢測度值表

變量類型和所適用的集中趨勢測度值變量類型定類變量定序變量定距變量適用的測度值※眾數(shù)※中位數(shù)※均值—眾數(shù)眾數(shù)——中位數(shù)分布的形狀與

眾數(shù)、中位數(shù)和均值的關(guān)系對稱分布

均值=中位數(shù)=眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值高層次變量可以用低層次變量的測量方法但統(tǒng)計分析中,更多的是用均值。對于偏態(tài)的分布,應(yīng)使用中位值作為集中趨勢。只有單峰和基本對稱的圖形,用均值作為集中趨勢才是合理的。1.眾數(shù)MO(概念要點)集中趨勢的測度值之一出現(xiàn)次數(shù)最多的變量值不受極端值的影響可能沒有眾數(shù)或有幾個眾數(shù)主要用于定類變量,也可用于定序變量和定距變量2.中位值(概念要點)集中趨勢的測度值之一排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于定序變量,也可用定距變量,但不能用于定類變量中位值的計算公式(計算公式)未分組數(shù)據(jù)的計算公式分組數(shù)據(jù)的計算公式P973.均值(概念要點)1. 集中趨勢的測度值之一2. 最常用的測度值3. 一組數(shù)據(jù)的均衡點所在4. 易受極端值的影響5.用于定距變量,不能用于定類變量和定序變量均值(計算公式)設(shè)一組數(shù)據(jù)為:X1,X2,…,XN簡單均值的計算公式為設(shè)分組后的數(shù)據(jù)為:X1,X2,…,XK(組中值)相應(yīng)的頻數(shù)為:f1,f2,…,fi分組均值的計算公式為??===++++++=KiiKiiiNNNffXffffXfXfXX11212211LL&均值(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零

2.各變量值與均值的離差平方和最小——最小平方的性質(zhì)3、算術(shù)平均數(shù)受抽樣變動影響微小,通常它是總體資料集中趨勢的最佳度量;4、算術(shù)平均數(shù)受極端值的影響頗大,遇到這種情況時,就不宜用它代表集中趨勢了;5、分組資料如果遇到開放組距時,不經(jīng)過特殊處理將無法得到算術(shù)平均數(shù),一般不建議計算;6、用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù);調(diào)和平均數(shù)1. 集中趨勢的測度值之一2. 均值的另一種表現(xiàn)形式3. 易受極端值的影響4. 用于定比數(shù)據(jù)5.計算公式為原來只是計算時使用了不同的數(shù)據(jù)!(二)變量類型與離散趨勢測度值表

變量類型和所適用的離散趨勢測度值變量類型定類變量定序變量定距變量適用的測度值※異眾比率※四分位差※方差或標準差—異眾比率異眾比率——四分位差高層次變量可以用低層次變量的測量方法離散趨勢數(shù)據(jù)分布的另一個重要特征如果個案之間的差異很大,則集中趨勢的代表性就會很低從另一個側(cè)面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值1.定類數(shù)據(jù):異眾比率1.離散程度的測度值之一2.又稱離異比率或者質(zhì)異指數(shù)3.非眾數(shù)的頻數(shù)占總頻數(shù)的比率4. 計算公式為

5.用于衡量眾數(shù)的代表性;不屬于眾數(shù)的個案所占比例愈大,表示眾數(shù)的代表性愈小V=2.中位數(shù):四分位差、極差四分位差1. 上四分位數(shù)與下四分位數(shù)之差

Q

=Q75–Q252. 離散程度的測度值之一3. 反映了中間50%數(shù)據(jù)的離散程度4.不受極端值的影響5.用于衡量中位數(shù)的代表性(值越大,中位數(shù)的代表性越?。┧姆治恢担号判蚝筇幱?5%和75%位置上的值Q25Q50Q7525%25%25%25%Q1與Q3差異越大,表示有50%的個案越是遠離中位值,因此中位值的代表性就越差。定距數(shù)據(jù):極差1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布7891078910未分組數(shù)據(jù)R=max(Xi)-min(Xi).=組距分組數(shù)據(jù)R

最高組上限-最低組下限5.計算公式為定距數(shù)據(jù):方差和標準差1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異,具體意義表示以均值作為代表值時會引起的偏差或者錯誤。根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差4681012X=8.3相對離勢:離散系數(shù)凡是用相對數(shù)來表達的變異指標,統(tǒng)稱為相對離勢,主要有異眾比率、標準差系數(shù)、平均差系數(shù)和一些偏態(tài)系數(shù);比較具有不同單位的資料的參差程度;比較單位雖然相同而均值不相同的資料的參差程度;要想實現(xiàn)計量單位不同或者平均水平不一的對象之間的直接比較:絕對離勢/平均指標=相對離勢;全距系數(shù)、標準差系數(shù)全距系數(shù):全距與其算術(shù)平均數(shù)之比標準差系數(shù):數(shù)據(jù)的標準差與算術(shù)平均數(shù)之比;用百分比表示。例題:根據(jù)10個人的身高和體重資料,計算出平均身高為172.0厘米,平均體重為70.0千克,身高的標準差為4.98厘米,體重的標準差為4.77千克,問:身高和體重的離散程度的大???描述統(tǒng)計與推斷統(tǒng)計的關(guān)系反映客觀現(xiàn)象的數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進行估計和檢驗等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(統(tǒng)計數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計學(xué)探索現(xiàn)象數(shù)量規(guī)律性的過程抽樣分布:描述到推論的理論基礎(chǔ)(1)如果樣本相當大(n大于30,50),則抽樣分布接近正態(tài)分布;(2)抽樣分布的均值就是總體均值;(3)抽樣分布的標準差稱為標準誤差,是總體方差除以樣本大?。╪)的平方根;揚州大學(xué)32二、推論統(tǒng)計參數(shù)估計(parameter’sestimation)根據(jù)隨機樣本的統(tǒng)計值對總體之參數(shù)值進行邏輯:先看樣本情況,才問總體情況。類型:點估計參數(shù)估計假設(shè)檢驗

邏輯:先假設(shè)總體的情況,然后再抽樣和分析樣本的資料,進而驗證假設(shè)是否正確。類型:差異性檢驗、獨立性檢驗揚州大學(xué)33(一)參數(shù)估計點估計區(qū)間估計用一個數(shù)值來估計總體參數(shù)。用一個取值范圍(區(qū)間)來估計總體參數(shù)。揚州大學(xué)34大樣本總體均值區(qū)間估計的常用公式置信度為90%:置信度為95%:置信度為99%:統(tǒng)計量的選擇:z,t?分布,樣本容量,總體方差?總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似(n≥30)使用正態(tài)分布統(tǒng)計量Z正態(tài),小樣本,總體方差δ2未知用t值估計(二)假設(shè)檢驗按總體的對象個數(shù)分:單總體兩總體多總體按總體的內(nèi)容:均值成數(shù)方差是否相關(guān)1.一個總體的檢驗Z檢驗(一端與二端)t檢驗(一端與二端)Z檢驗(一端與二端)

2檢驗(一端與二端)均值一個總體比例方差單總體假設(shè)檢驗選擇統(tǒng)計量Z?

t

是正態(tài)分布還是非正態(tài)是大樣本還是小樣本總體方差已知還是未知2.兩個正態(tài)總體的參數(shù)檢驗兩個總體的檢驗Z

檢驗(大樣本)t

檢驗(小樣本)t

檢驗(小樣本)Z檢驗F

檢驗獨立樣本配對樣本均值比例方差一、兩個獨立樣本均值之差的檢驗(一)兩個總體均值之差的Z檢驗(12、22

已知)(二)兩個總體均值之差的Z檢驗

(12、22

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論