第一節(jié)-數(shù)據(jù)的分類和整理課件_第1頁
第一節(jié)-數(shù)據(jù)的分類和整理課件_第2頁
第一節(jié)-數(shù)據(jù)的分類和整理課件_第3頁
第一節(jié)-數(shù)據(jù)的分類和整理課件_第4頁
第一節(jié)-數(shù)據(jù)的分類和整理課件_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章數(shù)據(jù)的整理與統(tǒng)計描述第一節(jié).數(shù)據(jù)分類和整理第二節(jié).數(shù)據(jù)分布的統(tǒng)計特征描述第三節(jié).統(tǒng)計圖表數(shù)據(jù)也稱資料,是對客觀現(xiàn)象計量的結果。一、數(shù)據(jù)的分類

統(tǒng)計數(shù)據(jù)是利用統(tǒng)計方法進行分析的基礎,不同的統(tǒng)計數(shù)據(jù)應采用不同的統(tǒng)計分析方法。第一節(jié).數(shù)據(jù)分類和整理定類數(shù)據(jù)定序數(shù)據(jù)離散數(shù)據(jù)連續(xù)數(shù)據(jù)數(shù)據(jù)類型定性數(shù)據(jù)定量數(shù)據(jù)(例:性別、民族)(例:產(chǎn)品等級)(例:家庭人口)(例:體重、溫度)1、數(shù)據(jù)的類型定性數(shù)據(jù)

定性數(shù)據(jù)也稱品質數(shù)據(jù),是觀察或實驗結果不可以用數(shù)值大小表示只能用文字描述的數(shù)據(jù)資料,一般不帶有度量衡單位。特點:每個觀察結果或實驗結果之間沒有量的大小區(qū)別,表現(xiàn)為互不相容的類別或屬性。根據(jù)觀察結果是否有等級或順序,將定性數(shù)據(jù)分為定類數(shù)據(jù)和定序數(shù)據(jù)兩類。定類數(shù)據(jù)也稱名義數(shù)據(jù)、計數(shù)數(shù)據(jù):是對事物按照其屬性進行分類或分組的計量結果,其數(shù)據(jù)表現(xiàn)為文字型的無序類別,可以進行每一類別出現(xiàn)頻數(shù)的計算,沒有等級之分,也不能進行加減乘除的數(shù)學運算。(1)定類數(shù)據(jù)例如一個學校的學生按性別分為男、女兩類,或按民族分為漢族和少數(shù)民族兩類。這種分類把所考察的個體(學生)劃分為不同的類型,但各類型之間是平行的關系,不能區(qū)分優(yōu)劣或大小。定序數(shù)據(jù)也稱有序數(shù)據(jù)或等級數(shù)據(jù)。同樣是按事物屬性進行分類或分組,但可排序。即定序測度不僅可以劃分類型,而且還可以確定這些類別的優(yōu)劣或順序。即其數(shù)據(jù)表現(xiàn)為有序類別,可以進行類別的頻數(shù)計算和排序,同樣不能進行加減乘除的數(shù)學運算。例如可以把企業(yè)信譽分為好、較好、一般和較差四個類別;把某種藥物的療效分為無效、有效、顯效、痊愈等。顯然這些類別具有等級差異,但不能具體測定等級之間差異的大小。(2)定序數(shù)據(jù)定量數(shù)據(jù)

定量數(shù)據(jù),也稱數(shù)值數(shù)據(jù)或計量數(shù)據(jù),是觀察或實驗結果可以用數(shù)值大小表示的數(shù)據(jù)資料,一般帶有度量衡單位。特點:每個觀察值或實驗值之間有量的大小的區(qū)別,即可進行頻數(shù)計算和排序,又可進行加減乘除的數(shù)學運算。例如,收入就有實際的0作為起點,0表示沒有收入。假如甲收入600元,乙收入300元,可以說甲比乙多收入300元,也可以說甲收入是乙的兩倍。因此,定量測度可以進行加、減、乘、除運算。根據(jù)數(shù)據(jù)的分布情況,將定量數(shù)據(jù)分為離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù)兩類。三種數(shù)據(jù)的比較計量測度數(shù)學特性定類數(shù)據(jù)定序數(shù)據(jù)定量數(shù)據(jù)分類√√√排序√√間距√比值√注:定量數(shù)據(jù)與定性數(shù)據(jù)可相互轉換。3、兩類數(shù)據(jù)的轉換(1)定量數(shù)據(jù)的定性化轉換(2)定性數(shù)據(jù)的數(shù)量化轉換例如,作為定量數(shù)據(jù)的成年男子的血清膽固醇值,按是否小于6(mmol/L)劃分成血脂正常和異常兩類,就轉化為定性數(shù)據(jù)。(1)定量數(shù)據(jù)的定性化轉換例如,“1”表示“非常同意”,“2”表示“同意”,“3”表示“保持中立”,“4”表示“不同意”,“5”表示“非常不同意”。又如,用“1”表示“男性”,“0”表示“女性”。(2)定性數(shù)據(jù)的數(shù)量化轉換變量用以說明現(xiàn)象的某種屬性或特征。變量特點:是從一次觀察到下一次觀察會呈現(xiàn)出差別或變化,變量的具體取值稱為變量值。比如,商品銷售額可以是20萬元、30萬元、50萬元、……這些數(shù)字就是變量值。如“商品銷售額”、“受教育程度”、“產(chǎn)品的質量等級”等都是變量。2、變量及其類型定類變量定序變量離散變量連續(xù)變量變量類型定性變量定量變量(數(shù)值變量)(例:性別、民族)(例:產(chǎn)品等級)(例:家庭人口)(例:體重、溫度)二、數(shù)據(jù)資料的統(tǒng)計整理統(tǒng)計工作一般分為統(tǒng)計設計、收集資料、整理資料和分析資料四個階段,其中數(shù)據(jù)資料的統(tǒng)計整理就是根據(jù)統(tǒng)計研究的任務,對搜集到的數(shù)據(jù)資料進行科學的匯總和處理,使數(shù)據(jù)資料系統(tǒng)化,以反映研究總體的特征、規(guī)律和趨勢。數(shù)據(jù)資料整理和圖示通常包括下列步驟:(1)對數(shù)據(jù)資料進行審核和訂正;(2)對數(shù)據(jù)資料進行統(tǒng)計分組(分類);(3)進行統(tǒng)計匯總,計算各組頻數(shù),編制頻數(shù)分布表;(4)給出統(tǒng)計圖表或報告。注:在對數(shù)據(jù)進行統(tǒng)計整理時,應根據(jù)不同的數(shù)據(jù)類型進行處理,對定性數(shù)據(jù)(定類數(shù)據(jù)和定序數(shù)據(jù))主要作分類整理,對定量數(shù)據(jù)(數(shù)值數(shù)據(jù))主要作分組整理。頻數(shù):統(tǒng)計分組中落在各組(或類別)中的數(shù)據(jù)個數(shù)。頻率:各組(或類別)的數(shù)據(jù)個數(shù)占數(shù)據(jù)總個數(shù)的比例值。頻數(shù)分布表:各組觀察值(或類別)及其相應的頻數(shù)(或頻率)用表格形式按順序全部列出來。概念:累積頻數(shù)指把各類別的頻數(shù)逐項累加。累積頻率指把各類別的頻率逐項累加。

例1為研究廣告市場的狀況,一家廣告公司在某城市隨機抽?。玻埃叭司蛷V告問題做了郵寄問卷調查,其中的一個問題是:“您比較關心下列哪一類廣告?”⑴商品廣告⑵服務廣告⑶金融廣告⑷房地產(chǎn)廣告⑸招生招聘廣告⑹其他廣告1、定性數(shù)據(jù)的整理和圖示廣告類型人數(shù)(人)比例頻率(%)

商品廣告1120.56056.0

服務廣告510.25525.5

金融廣告90.0454.5

房地產(chǎn)廣告160.0808.0

招生招聘廣告100.0505.0

其他廣告20.0101.0

合計2001.000100.0某城市居民關注廣告類型的頻數(shù)分布某城市居民關注不同類型廣告的人數(shù)分布(條形圖)頻數(shù)(人)條形圖是用寬度相同的條形高度或長短來表示各類別頻數(shù)或頻率的圖形。圓形圖是用圓形及圓內扇形的面積來表示各

類別頻率的圖形。某城市居民關注不同類型廣告的人數(shù)的構成(餅圖)2、定量數(shù)據(jù)的整理和圖示分組方法單變量值分組組距分組等距分組異距分組數(shù)據(jù)的分組單變量值分組1、適用于離散變量且變量值較少

2、把每一變量值作為一組

例3某生產(chǎn)車間50名工人日加工零件數(shù)(單位:個)如下。試采用單變量值對數(shù)據(jù)進行分組。117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)107111911282108212021291110112111301112212241311113112341332114112431342115112521351117312621371118312731392某車間50名工人日加工零件數(shù)分組表1.適用連續(xù)變量或離散變量且變量值較多。2.把一個區(qū)間作為一組,區(qū)間長度可以相等也可以不相等。3.分組時應“不重不漏”。

組距分組按數(shù)據(jù)的個數(shù)n及數(shù)據(jù)本身的特點選擇組數(shù)K,通常當數(shù)據(jù)個數(shù)小于50時,可分為5-6組;當數(shù)據(jù)個數(shù)為100左右時,可分為6-10組;當數(shù)據(jù)個數(shù)超過500時,可分為10-15組。組距分組步驟:

1.確定組數(shù)也可按Sturges經(jīng)驗公式確定組數(shù):例如,當n=90時,組數(shù)數(shù)據(jù)的最大值與最小值之差稱為極差,用R表示,即

R=最大值-最小值2.確定各組的組距與組限各組取相同的組距。組中值=由組數(shù)和極差就可確定組距d,即把數(shù)據(jù)歸組后得頻數(shù)分布表.3.歸組按零件數(shù)分組(個)頻數(shù)(人)頻率(%)105~11036110~115510115~120816120~1251428125~1301020130~135612135~14048合計50100某車間50名工人日加工零件數(shù)分組表

(加工零件數(shù)最少107個,最多139個)某車間工人日加工零件數(shù)的直方圖105110115120125130135140日加工零件數(shù)(個)頻數(shù)(人)⑴.用橫軸表示組限,縱軸表示頻數(shù)或頻率⑵.各組以組距為寬,以頻數(shù)或頻率為高形成一個矩形,即為直方圖。1.直方圖——用矩形來表示頻數(shù)分布的圖形直方圖與條形圖的差別:⑴.條形圖用寬度表示類別,寬度都相等,而直方圖用寬度表示組距,寬度可以不相等。⑵.條形圖通常分開排列,而直方圖則是連續(xù)排

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論