第2章統(tǒng)計數(shù)據(jù)的收集與整理_第1頁
第2章統(tǒng)計數(shù)據(jù)的收集與整理_第2頁
第2章統(tǒng)計數(shù)據(jù)的收集與整理_第3頁
第2章統(tǒng)計數(shù)據(jù)的收集與整理_第4頁
第2章統(tǒng)計數(shù)據(jù)的收集與整理_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 第二章第二章 統(tǒng)計數(shù)據(jù)的收集與整理統(tǒng)計數(shù)據(jù)的收集與整理 一、數(shù)據(jù)的類型與計量一、數(shù)據(jù)的類型與計量二、統(tǒng)計數(shù)據(jù)的搜集二、統(tǒng)計數(shù)據(jù)的搜集三、三、統(tǒng)計數(shù)據(jù)的整理統(tǒng)計數(shù)據(jù)的整理第一節(jié)第一節(jié) 數(shù)據(jù)的計量與類型數(shù)據(jù)的計量與類型一、數(shù)據(jù)的計量尺度一、數(shù)據(jù)的計量尺度(Levels of Measurement) 統(tǒng)計數(shù)據(jù)統(tǒng)計數(shù)據(jù)是對客觀現(xiàn)象計量計量的結(jié)果。 Data are the facts and figures that are collected, analyzed, and summarized for presentation and interpretation. 按照對事物計量的精確精確程度

2、,可將所采用的計計量尺度量尺度由低級到高級分為四個層次四個層次: 定類尺度定類尺度(Nominal Level) 定序尺度定序尺度(Ordinal Level) 定距尺度定距尺度(Interval Level) 定比尺度定比尺度(Ratio Level) 定類尺度定類尺度(列名尺度列名尺度):按照事物的某種屬性屬性對其進行平行的分類或分組。 例例1:人口的性別(男、女);企業(yè)的所有制性質(zhì)(國有、集體、私營等) 特點特點: 1 1、定類尺度只測度測度了事物之間的類類別差別差,而對各類之間的其他差別卻無法從中得知,因此各類地位相同,順序可以任意改變; 2 2、對定類尺度的計量結(jié)果,可以且只能計算每

3、一類別中各元素個體出現(xiàn)的頻數(shù)(frequency)。 注意注意: 對事物進行分類時,必須符合窮盡窮盡(exhaustive)和互斥互斥(mutually exclusive)要求。 (一)定類尺度(一)定類尺度 定序尺度定序尺度(順序尺度)(順序尺度):是對事物之間等級等級或順順序序差別的一種測度。 例例2:產(chǎn)品等級(一等品、二等品) 考試成績(優(yōu)、良、中、可、差) 特點特點: 1、不僅可以測度類別差(分類),還可以測度次序差(比較優(yōu)劣或排序); 2、無法測出類別之間的準(zhǔn)確差值,因此該尺度的計量結(jié)果只能排序,不能進行算術(shù)運算。 (二)定序尺度(二)定序尺度 定距尺度定距尺度(間隔尺度):(間隔

4、尺度):是對事物類別或次序之間間距間距的測度。 例例3:100分制考試成績; 攝氏溫度對不同地區(qū)溫度的測量 特點特點: 1、不僅能將事物區(qū)分為不同類型并進行排序,而且可準(zhǔn)確指出類別之間的差距是多少; 2、定距尺度通常以自然或物理單位為計量尺度,因此測量結(jié)果往往表現(xiàn)為數(shù)值; 3、計量結(jié)果可以進行加減運算(加減運算有意義); 4、“0”是測量尺度上的一個測量點,并不代表“沒有” (三)定距尺度(三)定距尺度 定比尺度定比尺度(比率尺度):(比率尺度):是能夠測算兩個測度值之間比值比值的一種計量尺度。 例例4:職工月收入;企業(yè)產(chǎn)值;公制的距離、重量 特點:特點: 1 1、與定距尺度屬于同一層次,計量

5、結(jié)果也表現(xiàn)為數(shù)值; 2 2、除了具有其他三種計量尺度的全部特點外,還具有可計算兩個測度值之間比值的特點; 3 3、“0”表示“沒有”,即它有一固定的絕對“零點”,因此它可進行加、減、乘、除運算(而定距尺度只可進行加減運算) (四)定比尺度(四)定比尺度注意注意: 定距尺度中的“0”并不表示“沒有”,不是一個絕對的“零點”;而定比 尺度中的“0”表示“沒有”,是一個絕對的“零點”。 前者: 熱力學(xué)溫度中的0K; 后者: 攝氏溫度中的0度 1、高層次的計量尺度可以可以計量低層次計量尺度能夠計量的事物,但反之不行; 2、可將高層次計量尺度的計量結(jié)果轉(zhuǎn)換計量結(jié)果轉(zhuǎn)換為低層次計量尺度的計量結(jié)果,但不能反

6、過來。 Exercises: 指出下面變量的測量尺度: 學(xué)生住址距學(xué)校的距離; 學(xué)生某門課的一次測驗成績(5分制); 學(xué)生的出生地; 按年級分類的高校學(xué)生 每周學(xué)生學(xué)習(xí)的小時數(shù) 四種計量尺度的區(qū)別與聯(lián)系四種計量尺度的區(qū)別與聯(lián)系 統(tǒng)計數(shù)據(jù)是采用某種計量尺度對事物進行計量的結(jié)果。統(tǒng)計數(shù)據(jù)是采用某種計量尺度對事物進行計量的結(jié)果。 采用不同的計量尺度采用不同的計量尺度 不同類型的統(tǒng)計數(shù)據(jù):不同類型的統(tǒng)計數(shù)據(jù): 二、數(shù)據(jù)的類型二、數(shù)據(jù)的類型 定性數(shù)據(jù)(品質(zhì)數(shù)據(jù))(定性數(shù)據(jù)(品質(zhì)數(shù)據(jù))(Qualitative data):說明的是事物的品質(zhì)特征,不能用數(shù)值表示。(由定類尺度或定序尺度計量形成) 定量數(shù)據(jù)(

7、數(shù)量數(shù)據(jù))定量數(shù)據(jù)(數(shù)量數(shù)據(jù))(Quantitative data):說明的是事物的數(shù)量特征,能夠用數(shù)值表示。(定距尺度或定比尺度計量形成)定性數(shù)據(jù)定性數(shù)據(jù) 定量數(shù)據(jù)定量數(shù)據(jù) 對不同類型的數(shù)據(jù),采用的統(tǒng)計方法可能有所不同: 品質(zhì)數(shù)據(jù):組頻率; 數(shù)量數(shù)據(jù):更多注意:注意: 變量變量:表征個體特征的量; 變量值變量值:變量的具體表現(xiàn)統(tǒng)計數(shù)據(jù)品質(zhì)變量(品質(zhì)變量(qualitative variable):變量由品質(zhì)數(shù)據(jù)來記錄 如:性別(男、女);產(chǎn)品等級(一等、二等、三等)數(shù)量變量數(shù)量變量(數(shù)字變量)數(shù)字變量)(quantitative variable):變量由數(shù)量數(shù)據(jù)來記錄 如:年齡、產(chǎn)品產(chǎn)量、

8、零件尺寸數(shù)量變量數(shù)量變量離散變量離散變量(discrete variable)連續(xù)變量連續(xù)變量(continuous variable) 1、數(shù)量型統(tǒng)計數(shù)據(jù)兩種基本表現(xiàn)形式、數(shù)量型統(tǒng)計數(shù)據(jù)兩種基本表現(xiàn)形式: 絕對數(shù)絕對數(shù)、相對數(shù)相對數(shù) 三、統(tǒng)計數(shù)據(jù)的表現(xiàn)形式三、統(tǒng)計數(shù)據(jù)的表現(xiàn)形式 絕對數(shù)絕對數(shù)按其反映事物現(xiàn)象的時間狀況不同可分為: 時期數(shù)時期數(shù)和時點數(shù)時點數(shù)。 (1)絕對數(shù))絕對數(shù): 絕對數(shù)絕對數(shù)是統(tǒng)計數(shù)據(jù)的基本表現(xiàn)形式,表明事物(現(xiàn)象)的總體規(guī)?;蛞话闼?。 如:如:一地區(qū)的總?cè)丝?、GDP、商品零售額等 時期數(shù)時期數(shù)反映事物現(xiàn)象在一定時期內(nèi)一定時期內(nèi)的總量; 如:如:產(chǎn)量、產(chǎn)值、出生人口 時

9、點數(shù)時點數(shù)反映事物現(xiàn)象在某一瞬間時刻某一瞬間時刻上上的總量; 如:如:人口數(shù)、股票價格等 特點特點: 1、時期數(shù)可連續(xù)計數(shù),并可累計,時點數(shù)只能間斷計量,不能累計; 2、時期數(shù)形成時間序列數(shù)據(jù)時間序列數(shù)據(jù)(Time series data); 3、時點數(shù)形成截面數(shù)據(jù)截面數(shù)據(jù)(Cross-sectional data)。絕對統(tǒng)計數(shù)據(jù)的計量單位絕對統(tǒng)計數(shù)據(jù)的計量單位: 實物單位實物單位(噸、公里) 價值單位價值單位(元、萬元)、 復(fù)合單位復(fù)合單位(噸公里、元/人)(2)相對數(shù))相對數(shù) 相對數(shù)相對數(shù)是兩個絕對數(shù)的比值,反映事物的相對數(shù)量 相對數(shù)的表現(xiàn)形式相對數(shù)的表現(xiàn)形式: 比例比例、比率比率 比例比

10、例(Proportion) :一個總體中各個部分的數(shù)一個總體中各個部分的數(shù)量占總體數(shù)量的比重,通常反映總體的構(gòu)成或結(jié)構(gòu)量占總體數(shù)量的比重,通常反映總體的構(gòu)成或結(jié)構(gòu)。 例例5:一數(shù)量為N的總體被分為K個部分,各部分的數(shù)量分別為 Ni,則比例定義為:Ni/N。顯然有:121NNNNNNk 比率比率(Ration) :各不同類別的數(shù)量比值。各不同類別的數(shù)量比值。可以是同一總體中不同部分的數(shù)量對比 如:如:總?cè)丝谥校耗行?女性; GDP中:固定資產(chǎn)投資/居民消費 GDP中:三次產(chǎn)業(yè)增加值之比 可以是同一現(xiàn)象在不同時間或空間上的數(shù)量之比 如:如:不同年份GDP之比 經(jīng)濟增長率 不同地區(qū)GDP之比 兩個地

11、區(qū)經(jīng)濟水平差異百分數(shù)(百分數(shù)(Percentage):):將對比的基數(shù)抽象化將對比的基數(shù)抽象化為為100100而計算的相對數(shù)。而計算的相對數(shù)。第二節(jié)第二節(jié) 統(tǒng)計數(shù)據(jù)的搜集統(tǒng)計數(shù)據(jù)的搜集 一、統(tǒng)計數(shù)據(jù)的直接來源一、統(tǒng)計數(shù)據(jù)的直接來源 從數(shù)據(jù)本身的來源看 從使用者的角度看統(tǒng)計數(shù)據(jù)的來源直接調(diào)查或試驗直接調(diào)查和科學(xué)試驗(直接的統(tǒng)計數(shù)據(jù))別人的調(diào)查或試驗數(shù)據(jù)(間接的統(tǒng)計數(shù)據(jù)) 統(tǒng)計數(shù)據(jù)的直接來源:統(tǒng)計數(shù)據(jù)的直接來源: 專門組織的調(diào)查專門組織的調(diào)查(主要用來取得社會經(jīng)濟數(shù)據(jù)) 科學(xué)試驗科學(xué)試驗(主要用來取得自然科學(xué)數(shù)據(jù)) (一)統(tǒng)計調(diào)查方式(一)統(tǒng)計調(diào)查方式 1、普查:、普查: 為某一特定目的而專門組織

12、的一次性全面調(diào)查為某一特定目的而專門組織的一次性全面調(diào)查 如:如:人口普查、工業(yè)普查等 特點特點: (1)通常是周期性的或一次性的,涉及面廣、耗時、費力,一般需間隔較長時間; 如:如:1953、1964、1982、1990、2000(人口普查) 逢“0”年份:人口普查 逢“3”年份:第三產(chǎn)業(yè)普查 逢“5”年份:工業(yè)普查 取得社會經(jīng)濟數(shù)據(jù)的主要方式和方法:取得社會經(jīng)濟數(shù)據(jù)的主要方式和方法: (2)一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時間,以避免調(diào)查數(shù)據(jù)的重復(fù)或遺漏; (3)準(zhǔn)確性一般較高,較規(guī)范; (4)適用的對象較窄,只能調(diào)查一些最基本、最一般的現(xiàn)象。 如:如:第五次人口普查登記的標(biāo)準(zhǔn)時間是2000年1

13、1月1日零時 2、抽樣調(diào)查、抽樣調(diào)查 從調(diào)查對象的總體中隨機抽取一部分單位作為樣從調(diào)查對象的總體中隨機抽取一部分單位作為樣本進行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果推斷總體數(shù)量特征。本進行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果推斷總體數(shù)量特征。 特點特點: (1)經(jīng)濟性強經(jīng)濟性強:工作量小、可節(jié)省人、財、物力 (2)時效性高時效性高:可迅速、及時地獲得所需要的信息 (3)適應(yīng)面廣適應(yīng)面廣:可獲得更廣泛的信息,適用于各個領(lǐng)域、各種問題的調(diào)查; (4)準(zhǔn)確性高準(zhǔn)確性高:用工量小,從而工作可做得更細,誤差往往很小。 3、統(tǒng)計報表、統(tǒng)計報表 按國家有關(guān)法規(guī)規(guī)定,自上而下地統(tǒng)一布置,自下而上地按國家有關(guān)法規(guī)規(guī)定,自上而下地統(tǒng)一布

14、置,自下而上地逐級提供基本統(tǒng)計數(shù)據(jù)。逐級提供基本統(tǒng)計數(shù)據(jù)。 特點特點: 統(tǒng)一的表式、統(tǒng)一的指標(biāo)、統(tǒng)一的報送時間、統(tǒng)一的報送程序。 類型類型: (1)按報送調(diào)查范圍范圍分: 全面報表:全面報表:調(diào)查對象中的每一個單位都填報 非全面報表非全面報表:只要求調(diào)查對象中的一部分單位填報 (2)按報送時間間隔時間間隔分 日報、月報、季報、年報日報、月報、季報、年報 (3)按報送地域地域(機構(gòu))范圍分: 國家報表、地方報表、部門報表國家報表、地方報表、部門報表主主要要工工業(yè)業(yè)產(chǎn)產(chǎn)品品生生產(chǎn)產(chǎn)能能力力 200 年 XX 產(chǎn)品 XX 產(chǎn)品 XX 產(chǎn)品 省轄市名稱 能力 產(chǎn)量 能力 產(chǎn)量 能力 產(chǎn)量 1 2 1

15、2 1 2 單位負責(zé)人: 填表人: 報出日期: 4、重點調(diào)查、重點調(diào)查 從調(diào)查對象的全部單位中選擇少數(shù)重點單位進行從調(diào)查對象的全部單位中選擇少數(shù)重點單位進行調(diào)查(適用于調(diào)查(適用于“同類同類”中的中的“大戶大戶”)。)。 5、典型調(diào)查、典型調(diào)查 從調(diào)查對象的全部單位中選擇一個或幾個有代表從調(diào)查對象的全部單位中選擇一個或幾個有代表性的單位進行調(diào)查。(不一定針對性的單位進行調(diào)查。(不一定針對“大戶大戶”) 注意:注意: 重點調(diào)查重點調(diào)查、典型調(diào)查典型調(diào)查與與抽樣調(diào)查抽樣調(diào)查的的不同不同處在于:處在于: 1、抽樣調(diào)查是隨機抽取調(diào)查單位,不存在對調(diào)查對象選擇的主觀性,因此可以根據(jù)抽樣結(jié)果推斷總體的數(shù)量

16、特征; 2、重點調(diào)查和典型調(diào)查不是隨機取樣,具有一定的主觀性,因此調(diào)查結(jié)果不能推斷總體。 (二)數(shù)據(jù)的搜集方法(二)數(shù)據(jù)的搜集方法 1、訪問調(diào)查(派員調(diào)查):、訪問調(diào)查(派員調(diào)查):調(diào)查者與被調(diào)查者通過面對面的交談獲取調(diào)查資料; 2、郵寄調(diào)查:、郵寄調(diào)查:通過郵寄或其他方式將問卷送至被調(diào)查者,由被調(diào)查者填寫問卷并寄回或投放到指定收集點; 3、電話調(diào)查:、電話調(diào)查:調(diào)查者利用電話同受訪者進行語言交流以獲取信息; 4、座談會(集體訪談):、座談會(集體訪談):將受訪者集中在調(diào)查現(xiàn)場,使其對調(diào)查主題發(fā)表意見以獲取調(diào)查資料; 5、個別深度訪問:、個別深度訪問:一次只有一名受訪者參加的特殊的定性研究。

17、注意:注意: 座談會與個別深度訪問主要是定性方法,目的是獲取有關(guān)特定主題的定性資料,以研究問題的性質(zhì)和未來趨勢,不對研究總體數(shù)量特征進行推斷。 (三)調(diào)查方案設(shè)計(三)調(diào)查方案設(shè)計 調(diào)查方案調(diào)查方案是指導(dǎo)整個調(diào)查過程的綱領(lǐng)性文件,是指導(dǎo)整個調(diào)查過程的綱領(lǐng)性文件,大體包括大體包括調(diào)查目的調(diào)查目的、調(diào)查對象調(diào)查對象、調(diào)查項目調(diào)查項目和和調(diào)查調(diào)查表表等內(nèi)容。等內(nèi)容。 1、調(diào)查目的調(diào)查目的:回答“為什么調(diào)查”; 2、調(diào)查對象調(diào)查對象:回答“向誰調(diào)查”; 3、調(diào)查項目和調(diào)查表調(diào)查項目和調(diào)查表:回答“調(diào)查什么” 4、其他內(nèi)容其他內(nèi)容:明確調(diào)查所采用的方法、調(diào)查時間、調(diào)查組織和實施的細節(jié)人人 口口 普普 查

18、查 表表 本戶 省,市 縣 鄉(xiāng) 鎮(zhèn) 村 住址 自治區(qū) 市 街道 居委會 街巷 號姓名與戶主關(guān)系性別出生年月民族常住人口戶口登記狀 況文化程度行業(yè)職業(yè)就業(yè)狀況婚姻狀況生育子女總數(shù)123456789101112申報人: 普查員: 填報日期: 月 日 戶主簽名:佛羅里達州佛羅里達州Lobster Pot 飯店所用的顧客意見調(diào)查表:飯店所用的顧客意見調(diào)查表: We are happy you stopped by the Lobster Pot Restaurant and want to make sure you will come back. So, if you have a little t

19、ime, we will really appreciate it if you will fill out this card. Your comments and suggestions are extremely important to us. Thank you! Servers Name_ Excellent Good Satisfactory UnsatisfactoryFood Quality ? ? ? ? Friendly Service ? ? ? ? Prompt Service ? ? ? ? Cleanliness ? ? ? ? Management ? ? ?

20、? Comments_What Prompted your visit to us?_ 二、統(tǒng)計數(shù)據(jù)的間接來源二、統(tǒng)計數(shù)據(jù)的間接來源 統(tǒng)計數(shù)據(jù)的間接來源統(tǒng)計數(shù)據(jù)的間接來源是指通過其他渠道(非是指通過其他渠道(非自已直接調(diào)查或試驗)獲取別人調(diào)查或科學(xué)試驗自已直接調(diào)查或試驗)獲取別人調(diào)查或科學(xué)試驗的第二手數(shù)據(jù)。的第二手數(shù)據(jù)。 公開出版物(數(shù)據(jù)):公開出版物(數(shù)據(jù)):各類統(tǒng)計年鑒;報刊、雜志、廣播、電視傳媒等; 非公開出版物:非公開出版物:一些政府機構(gòu)、信息機構(gòu)調(diào)查但未公開的資料等。第三節(jié)第三節(jié) 統(tǒng)計數(shù)據(jù)的整理統(tǒng)計數(shù)據(jù)的整理 統(tǒng)計數(shù)據(jù)的整理(統(tǒng)計數(shù)據(jù)的整理(summarizing data)是是指對

21、所搜集的數(shù)據(jù)進行加工整理、使之系統(tǒng)指對所搜集的數(shù)據(jù)進行加工整理、使之系統(tǒng)化、條理化,以符合分析的需要。化、條理化,以符合分析的需要。 統(tǒng)計數(shù)據(jù)的整理統(tǒng)計數(shù)據(jù)的整理通常包括: 數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 分類分類或或分組分組 匯總匯總 一、數(shù)據(jù)的預(yù)處理一、數(shù)據(jù)的預(yù)處理 主要包括:數(shù)據(jù)的主要包括:數(shù)據(jù)的審核審核、篩選、排隊篩選、排隊 (一)數(shù)據(jù)的審核與篩選(一)數(shù)據(jù)的審核與篩選 1、審核、審核: 對 第一手資料第一手資料(直接調(diào)查或試驗取得):審核其完整性完整性與準(zhǔn)確性準(zhǔn)確性 完整性完整性審核:應(yīng)調(diào)查的單位或個體是否有遺漏;所調(diào)查的項目是否填齊全。 準(zhǔn)確性準(zhǔn)確性審核:內(nèi)容是否符合實際;計算是否正確。

22、 如:如:文化程度:小學(xué) 職業(yè):大學(xué)教師 2、篩選:、篩選: 篩選篩選包括: 剔除不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù);剔除不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù); 將符合特定條件的數(shù)據(jù)篩選出來。將符合特定條件的數(shù)據(jù)篩選出來。 對第二手資料第二手資料(獲取他人的資料):審核其完整性完整性、準(zhǔn)確性、適用性、時效性準(zhǔn)確性、適用性、時效性(二)數(shù)據(jù)的排序(二)數(shù)據(jù)的排序 數(shù)據(jù)排序數(shù)據(jù)排序是按一定順序?qū)?shù)據(jù)排列是按一定順序?qū)?shù)據(jù)排列。排序方式排序方式: 數(shù)字型數(shù)據(jù)數(shù)字型數(shù)據(jù)/字母型數(shù)據(jù)字母型數(shù)據(jù)升序或降序 漢字型數(shù)據(jù)漢字型數(shù)據(jù)多種排序目的排序目的: a、通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征趨勢或解決問題的線索;

23、b、有助于數(shù)據(jù)的檢查糾錯; c、為分組提供依據(jù)。 統(tǒng)計分組統(tǒng)計分組是將預(yù)處理過的數(shù)據(jù)按照某種特征或標(biāo)是將預(yù)處理過的數(shù)據(jù)按照某種特征或標(biāo)準(zhǔn)分成不同的組別。準(zhǔn)分成不同的組別。 統(tǒng)計分組標(biāo)志統(tǒng)計分組標(biāo)志:分組時所依據(jù)的特征或標(biāo)準(zhǔn),有品質(zhì)標(biāo)志品質(zhì)標(biāo)志和數(shù)量標(biāo)志數(shù)量標(biāo)志。 頻數(shù)分布表頻數(shù)分布表:對分組后的數(shù)據(jù),計算各組中數(shù)對分組后的數(shù)據(jù),計算各組中數(shù)據(jù)出現(xiàn)的次數(shù)或頻數(shù)所形成的匯總表。據(jù)出現(xiàn)的次數(shù)或頻數(shù)所形成的匯總表。 預(yù)處理數(shù)據(jù)分組計算頻數(shù)描述統(tǒng)計 二、數(shù)據(jù)分組與頻數(shù)分布二、數(shù)據(jù)分組與頻數(shù)分布 頻數(shù)分布頻數(shù)分布或次數(shù)分布次數(shù)分布(Frequency distribution):全部數(shù)據(jù)按其分組標(biāo)志在各組

24、內(nèi)的分布狀況。全部數(shù)據(jù)按其分組標(biāo)志在各組內(nèi)的分布狀況。 分布在各組內(nèi)的數(shù)據(jù)個數(shù)稱為頻數(shù)頻數(shù)或次數(shù)次數(shù)。 A frequency distribution is a tabular summary of a set of data showing the frequency (or number) of items in each of several nonoverlapping classes. 相對頻數(shù)相對頻數(shù)(Relative frequency)/頻率頻率/比重比重:各組頻數(shù)與全部頻數(shù)之和的比重。 The relative frequency of a class is the pro

25、portion of the total number of data items belonging to the class.(=Frequency of the class/n) 百分數(shù)頻數(shù)百分數(shù)頻數(shù)(Percentage frequency):is the relative frequency multiplied by 100. 概念:概念:頻數(shù)頻數(shù)/次數(shù)分布;相對頻數(shù);百分數(shù)頻數(shù)次數(shù)分布;相對頻數(shù);百分數(shù)頻數(shù) (一)品質(zhì)數(shù)據(jù)的分組與頻數(shù)分布一)品質(zhì)數(shù)據(jù)的分組與頻數(shù)分布Table, Data from a sample of 50 computer purchases(11/15,1

26、994)IBMIBMPackard BellCompaqIBMPackard BellGateway200Packard BellCompaqCompaqGateway200Packard BellIBMAppleCompaqIBMPackard BellAppleAppleCompaqGateway2000CompaqPackard BellCompaqCompaqApplePackard BellPackard BellAppleIBMIBMAppleAppleGateway2000Packard BellAppleAppleIBMAppleIBMPackard BellAppleComp

27、aqAppleCompaqPackard BellGateway200CompaqAppleCompaq 例例6: 50個計算機購買者所購買的不同品牌的機型數(shù)據(jù)個計算機購買者所購買的不同品牌的機型數(shù)據(jù) Table, Frequency Distribution/Relative and Percentage Frequency of Computer Purchases Company Frequency Relative Frequency Percentage Frequency Apple 13 0.26 26 Compaq 12 0.24 24 Gatewy2000 5 0.10 10

28、 IBM 9 0.18 18 Packard Bell 11 0.22 22 Total 50 1.00 100分組與求頻數(shù)分組與求頻數(shù) :The objective in developing a frequency distribution is to provide insights about the data that cannot be quickly obtained by looking only at the original data.分組計頻分組計頻基本步驟基本步驟: 確定組數(shù)確定組數(shù) 確定組距確定組距(按組)整理成分布頻數(shù)表整理成分布頻數(shù)表 例例7:一會計事務(wù)所對其20

29、家客戶(clients)年底帳目輯核(audits)時間(天)統(tǒng)計如下表: (二)數(shù)值數(shù)據(jù)的分組與頻數(shù)分布(二)數(shù)值數(shù)據(jù)的分組與頻數(shù)分布 可先先將數(shù)據(jù)進行排序排序,然后后根據(jù)需要分組分組; 對較少的數(shù)據(jù)也可不排序直接根據(jù)需要分組。Table Year-End Audit Times(in days) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13 第一步第一步,確定組數(shù)確定組數(shù)(Number of classes)。組數(shù)的確定一般視數(shù)據(jù)本身的特點及數(shù)據(jù)的多少而定。21010loglog1NK 經(jīng)驗上經(jīng)驗上以520之間為好,

30、尤其注意不要確定太多的組數(shù),使得每組包含的數(shù)據(jù)太少。 實際分組實際分組時常按斯特格斯(Sturges)提出的經(jīng)驗公式來確定組數(shù)K:其中N為數(shù)據(jù)的個數(shù)(總體單位數(shù)或樣本數(shù)),一般對結(jié)果取整數(shù)。 例例7中:中:K=1+lg20/lg2=1+4.32=5.32 5 第二步第二步,確定組距確定組距(Width of classes):組距組距是是一個組的上限與下限之差一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定: 組距組距=(最大值(最大值 - 最小值)最小值)/組數(shù)組數(shù) 例例7中,組距中,組距=(33-12)/5=4.2,可取整數(shù),可取整數(shù)5為最后為最后選定的組距。選定的

31、組距。 第三步第三步,確定各組組限確定各組組限(Class limits)并據(jù)此整并據(jù)此整理頻數(shù)分布表理頻數(shù)分布表。 1、分組所遵循的主要原則主要原則是“不重不漏不重不漏”(each data value belongs to one class and only one class)。因此, 最低組限最低組限(The lower class limit) 數(shù)據(jù)的最小值, 最大組限最大組限(The upper class limit) 數(shù)據(jù)的最大值; 另外另外,數(shù)據(jù)在每組中的歸屬習(xí)慣上采用“上組限上組限不在內(nèi)不在內(nèi)”。 注意:注意: 2、對離散型數(shù)據(jù)離散型數(shù)據(jù),可采用相鄰兩組組限間斷的辦可采用

32、相鄰兩組組限間斷的辦法解決法解決“不重不重”的問題的問題(如610,1115,1620等); 對連續(xù)型數(shù)據(jù)連續(xù)型數(shù)據(jù),往往采用相鄰兩組組限重疊,往往采用相鄰兩組組限重疊,根據(jù)根據(jù)“上限不在內(nèi)原則上限不在內(nèi)原則”解決解決“不重不重”問題問題(如5,10),10,15),15,20)等)。 例7是離散型數(shù)據(jù)(天),采用組限間斷方法,因此可得頻數(shù)分布表如下: Table, Frequency distribution, relative frequency and percent frequency distribution for the audit-time data Audit Frequen

33、cy Relative Percent Time(days) Frequency Frequency 1014 4 0.20 20 1519 8 0.40 40 2024 5 0.25 25 2529 2 0.10 10 3034 1 0.05 5 Total 20 1.00 100 1、在最大值與最小值與其他數(shù)據(jù)相差懸殊時,為避免空白組出現(xiàn),第一組和最后一組可采用“XXXX以下以下”及“XXXX以上以上”這樣的開口組開口組; 2、在組距分組時,如果各組組距相等則稱為等距等距分組分組,否則為不等距分組不等距分組。 不等距分組各組的頻數(shù)受組距大小不同的影響,因此需要計算頻數(shù)密度頻數(shù)密度(=頻數(shù)/

34、組距),才能準(zhǔn)確反映頻數(shù)分布的實際; 3、有時為了統(tǒng)計需要,需進一步計算累積頻數(shù)累積頻數(shù)(某數(shù)值以上或以下的頻之?dāng)?shù)和)。 注意:注意: 品質(zhì)數(shù)據(jù)品質(zhì)數(shù)據(jù)往往使用條形圖條形圖(Bar graphs)和餅狀圖餅狀圖(Pie Charts); 數(shù)值數(shù)據(jù)數(shù)值數(shù)據(jù)往往使用直方圖直方圖(Histograms)、折線圖折線圖(Polygon)、莖莖葉圖葉圖(Stem-and-leaf display) 。Fig1, Bar Graph of Computer Purchases三、次數(shù)分配的圖示和類型三、次數(shù)分配的圖示和類型02468101214A ppleCompaqGatew ay2000IBMP ac

35、kard BellFrequency 直方圖直方圖是用距形的寬度和高度來表示頻數(shù)分布的圖是用距形的寬度和高度來表示頻數(shù)分布的圖形(以橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率)。形(以橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率)。 (一)直方圖和折線圖(一)直方圖和折線圖Fig 2, Histogram for the Audit-Time Data 8 5 4 2 10 15 20 25 30 35注意:注意: 1、對于等距分組等距分組的數(shù)據(jù),可用距形的高度高度直接表示頻數(shù)的分布;對于不等距分不等距分組組的數(shù)據(jù),用距形的面積面積(而不是高度)表示各組的頻數(shù)分布。 2、從本質(zhì)上說,直方圖應(yīng)用頻數(shù)密度頻數(shù)密

36、度來繪制,這樣可使直方圖總面積為1。 折線圖折線圖也稱頻數(shù)多邊形圖頻數(shù)多邊形圖(polygon),是將直方是將直方圖頂部的中點(即組中值)用直線連接起來而成的圖頂部的中點(即組中值)用直線連接起來而成的圖形。圖形。 Fig 3, Frequency Polygon for the Audit-Time Data 8 5 4 2 10 15 20 25 30 35 1、折線圖的兩個終點要與橫軸相交折線圖的兩個終點要與橫軸相交(將第一個矩形頂部中點通過左豎邊中點連接到橫軸;將最后一個矩形頂部中點與其右豎邊中點連接到橫軸)。 2、折線圖下所圍成的面積與直方圖面積相等折線圖下所圍成的面積與直方圖面積相

37、等(為1),從而使二者表示的頻率分布是一致的。 折線圖折線圖也可用于表示累計頻數(shù)分布累計頻數(shù)分布,稱為累計頻數(shù)分布累計頻數(shù)分布折線圖折線圖。它是根據(jù)累計頻數(shù)繪制而成的,有向上累計向上累計和向下向下累計累計兩種圖形。 注意:注意:100100 莖葉圖莖葉圖是一種既給出數(shù)據(jù)的分布狀況,又能是一種既給出數(shù)據(jù)的分布狀況,又能顯示每一個原始數(shù)值的圖形。顯示每一個原始數(shù)值的圖形。 A stem-and-leaf display can be used to rank order data and provide an idea of the shape of the distribution of a s

38、et of quantitative data. 莖葉圖由兩部分組成莖葉圖由兩部分組成:莖莖(stem)與葉葉(leaf) 莖:莖:通常由每組數(shù)的高位數(shù)值(leading digits)形成,按組豎立在左邊; 葉:葉:通常由每組數(shù)的低位數(shù)值(last digits)形成,按組橫排在“莖”的右邊。 (二)莖葉圖(二)莖葉圖 Fig4是上述例中會計公司對其20個客戶年終財務(wù)審計所用時間的莖葉圖。 Fig 4, Stem-and-leaf display for the Audit-Time Data 1 2 3 4 4 5 5 6 7 8 8 8 9 2 0 1 2 2 3 7 8 3 3可知其對

39、大多數(shù)客戶的審計時間在1020天之間 上面莖葉顯得過于擁擠,尤其是第一行有太多數(shù),可將期擴展為Fig5的形式。 Fig5所表現(xiàn)的數(shù)據(jù)分布特征與Fig3的直方圖十分相似。但莖葉圖有明顯優(yōu)勢明顯優(yōu)勢: 1. The stem-and-leaf display is easier to construct; 2. The stem-and-leaf display provides more information because it shows the actual data values. Fig 5, Stem-and-leaf display for the Audit-Time Data

40、 1 2 3 4 4 1 5 5 6 7 8 8 8 9 2 0 1 2 2 3 2 7 8 3 3 (三)頻數(shù)分布的類型(三)頻數(shù)分布的類型 日常經(jīng)濟生活中,常見的頻數(shù)分布曲線主要有正態(tài)分布正態(tài)分布、偏態(tài)分布、偏態(tài)分布、J型分布、型分布、U型分布型分布等幾種類型等幾種類型。 其次還有雙峰型雙峰型、孤島型孤島型及鋸齒型鋸齒型等其他類型。 正偏(右偏) 負偏(左偏) (a) 正態(tài)分布 (b)偏態(tài)分布 正 J 型 反 J 型 (c)J 型分布 (d)U 型分布頻數(shù)分布的應(yīng)用:頻數(shù)分布的應(yīng)用: 例例8:80年代初,我國工業(yè)企業(yè)推行全面質(zhì)量管理,某床單廠廠長曾對其生產(chǎn)的某種規(guī)格的床單進行抽檢,并做了直

41、方圖。 按長度質(zhì)量標(biāo)準(zhǔn),合格的床單長度為215cm,容許誤差為3cm。對所抽取的100條床單進行統(tǒng)計,發(fā)現(xiàn)最長的達265cm,最短的為214cm,分組后的頻數(shù)分布表及直方圖如下: 孤島型 雙峰型 鋸齒型頻數(shù)分布表頻數(shù)分布表 床單長度分組(cm) 床單數(shù)(條) 213218 5 218223 8 223228 16 228233 32 233238 17 238243 12 243248 5 248253 0 253258 1 258263 3 263258 1 Total 100直方圖直方圖 32 212 218 16 17 12 8 5 5 3 1 1 213 218 223 228 233

42、 238 243 248 253 258 263 268 直方圖呈孤島型,說明直方圖呈孤島型,說明: 1、本質(zhì)上反映了兩個總體,該兩總體都遵從正態(tài)分布;其中95%的單位屬一總體,5%的單位屬另一總體。 2、根據(jù)長度質(zhì)量標(biāo)準(zhǔn),只有5%的床單在正常范圍(在212218cm之間),而95%的床單均大于218cm,顯然存在著對床單的長度“寧長勿短”的思想,因此造成浪費 (上述100條床單總長度達233m,如果按照215cm的標(biāo)準(zhǔn)長度,可裁成108床,若按212cm長度可裁成110床)。原因檢查:原因檢查: 為了提高生產(chǎn)水平,增加經(jīng)濟效益,廠長深入到裁剪長度工序了解情況,發(fā)現(xiàn): 床單的生產(chǎn)工序是在一大聯(lián)匹布上,印上印床單的生產(chǎn)工序是在一大聯(lián)匹布上,印上印花,由一位老女工手工量測并用剪刀裁剪?;ǎ梢晃焕吓な止ち繙y并用剪刀裁剪。 基本的做法是:基本的做法是:雙手拉著床單量兩下,然后下雙手拉著床單量兩下,然后下剪。在裁剪工序還有兩位女工,目測檢查所裁床單剪。在裁剪工序還有兩位女工,目測檢查所裁床單是否有殘次花色及其他疵點。是否有殘次花色及其他疵點。 工作時,總以為手扯的長度可能會短,于是再工作時,總以為手扯的長度可能會短,于是再目測一下,加一點長度再下剪;目測一下,加一點長度再下剪; 有時還會有一位檢查殘次的女工幫助裁剪,其有時還會有一位檢查殘次的女工幫助裁剪

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論