第-3-章-數(shù)據(jù)的整理與顯示1_第1頁
第-3-章-數(shù)據(jù)的整理與顯示1_第2頁
第-3-章-數(shù)據(jù)的整理與顯示1_第3頁
第-3-章-數(shù)據(jù)的整理與顯示1_第4頁
第-3-章-數(shù)據(jù)的整理與顯示1_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

合理使用統(tǒng)計表統(tǒng)計應(yīng)用把數(shù)據(jù)畫圖之后,要用用腦袋沃德(AbrahamWald)和許多統(tǒng)計學(xué)家一樣,在第二次世界大戰(zhàn)時也處理了戰(zhàn)爭與相關(guān)的問題。他發(fā)明的一些統(tǒng)計方法在戰(zhàn)時被視為軍事機密。以下是他提出的概念中較簡單的一種沃德被咨詢飛機上什么部位應(yīng)該加強鋼板時,開始研究從戰(zhàn)役中返航的軍機上受敵軍創(chuàng)傷的彈孔位置。他畫了飛機的輪廓,并且標(biāo)識出彈孔的位置。資料累積一段時間后,幾乎把機身各部位都填滿了。于是沃德建議,把剩下少數(shù)幾個沒有彈孔的部位補強。因為這些部位被擊中的飛機都沒有返航數(shù)據(jù)的預(yù)處理數(shù)據(jù)的審核檢查數(shù)據(jù)中的錯誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征一、數(shù)據(jù)審核數(shù)據(jù)審核—原始數(shù)據(jù)審核的內(nèi)容完整性審核應(yīng)調(diào)查的單位或個體是否有遺漏調(diào)查項目或指標(biāo)是否填寫齊全準(zhǔn)確性審核內(nèi)容是否真實反映客觀實際情況是否有錯誤:邏輯檢查、計算檢查數(shù)據(jù)的審核—二手?jǐn)?shù)據(jù)適用性審核數(shù)據(jù)的來源、口徑以及有關(guān)的背景材料數(shù)據(jù)是否符合自己分析研究的需要時效性審核最新的數(shù)據(jù)確認(rèn)是否要做進一步的加工整理二、數(shù)據(jù)篩選數(shù)據(jù)篩選數(shù)據(jù)篩選的內(nèi)容包括將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除數(shù)值型數(shù)據(jù)的排序遞增排序:x(1)<x(2)<…<x(n)遞減排序:x(1)>x(2)>…>x(n)數(shù)據(jù)排序

(方法)用Excel進行數(shù)據(jù)排序一、統(tǒng)計分組的概念及方法(一)統(tǒng)計分組的概念根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內(nèi)在特點,按照一定的標(biāo)志把被研究總體劃分為若干個性質(zhì)不同但又有聯(lián)系的組,稱為統(tǒng)計分組。(二)統(tǒng)計分組的方法1、按品質(zhì)標(biāo)志分組:按研究對象的某種屬性特征分組(1)簡單分組:人口按性別分組,企業(yè)按行業(yè)分組,學(xué)生按專業(yè)分組等等(2)復(fù)合分組:對總體按兩個或兩個以上的標(biāo)志進行的重疊式分組。例如,我國把社會經(jīng)濟部門分為第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè),第一產(chǎn)業(yè)又可分為農(nóng)、林、牧、漁業(yè)。復(fù)合分組表2、按數(shù)量標(biāo)志分組:按表現(xiàn)總體數(shù)量特征的標(biāo)志進行分組。例如,人口按年齡分組、企業(yè)按銷售額分組等(1)單項式分組:每組變量值是一個值(2)組距式分組:每組變量值是一個區(qū)間。某車間工人產(chǎn)量分組表某地區(qū)120家企業(yè)按利潤分組表二、頻數(shù)分布頻數(shù)分布的概念頻數(shù)(frequency):落在某一組中的數(shù)據(jù)個數(shù)頻數(shù)分布:把各個組及其相應(yīng)的頻數(shù)全部列出,并用表格形式表現(xiàn)出來,稱為頻數(shù)分布。比率(ratio):各組次數(shù)與總次數(shù)之比。百分比(percentage):將比率乘以100得到的值(一)品質(zhì)數(shù)據(jù)的頻數(shù)分布1、分類數(shù)據(jù)的頻數(shù)分布表(1)列出各類別1、分類數(shù)據(jù)整理—頻數(shù)分布表

2、順序數(shù)據(jù)的整理(1)累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級累加(2)累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加注意:數(shù)據(jù)源表中的首行必須有列標(biāo)題數(shù)據(jù)透視表

(用Excel創(chuàng)建數(shù)據(jù)透視表)第1步:在Excel工作表中建立數(shù)據(jù)清單第2步:選中數(shù)據(jù)清單中的任意單元格,并選擇【數(shù)據(jù)】菜單中的【數(shù)據(jù)透視表和數(shù)據(jù)透視圖】第3步:確定數(shù)據(jù)源區(qū)域第4步:在【向?qū)А?步驟之3】中選擇數(shù)據(jù)透視表的輸出位置。然后選擇【布局】第5步:在【向?qū)А季帧繉υ捒蛑?,依次將”分類變量“拖至左邊的“行”區(qū)域,上邊的“列”區(qū)域,將需要匯總的“變量”拖至“數(shù)據(jù)區(qū)域”第6步:然后單擊【確定】,自動返回【向?qū)А?步驟之3】對話框。然后單擊【完成】,即可輸出數(shù)據(jù)透視表分組方法1、單變量值分組(要點)1.將一個變量值作為一組2.適合于離散變量3.適合于變量值較少的情況單變量值分組(實例)117122124129124129117130122125123131125127122133126122118124121125123126133130127123118122122134127123125125120123127130126126128128124125123128124125單變量值分組表(實例)2、組距分組(要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量或變量值較多遵循“不重不漏”的原則可采用等距分組,或不等距分組組距分組步驟確定組數(shù):可以按Sturges提出的經(jīng)驗公式來確定組距分組(幾個概念)1.下限(lowlimit):一個組的最小值2.上限(upperlimit):一個組的最大值3.組距(classwidth):上限與下限之差4.組中值(classmidpoint):下限與上限之間的中點值頻數(shù)分布表的編制(例題分析)頻數(shù)分布表的編制步驟確定組數(shù):等距分組表(上下組限重疊)等距分組表(上下組限間斷)等距分組表(使用開口組)等距分組表(使用開口組)不等距分組等距分組與不等距分組(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征和規(guī)律不等距分組用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式繪制時,各類別可以放在縱軸,稱為條形圖(barChart),也可以放在橫軸,稱為柱形圖柱形圖(例題分析)條形圖(例題分析)對比條形圖分類變量在不同時間或不同空間上有多個取值對比分類變量的取值在不同時間或不同空間上的差異或變化趨勢對比條形圖(例題分析)(二)餅圖也稱圓形圖,是用圓形及圓內(nèi)扇形的面積來表示數(shù)值大小的圖形主要用于表示總體或樣本的結(jié)構(gòu)(三)環(huán)形圖環(huán)形圖中間有一個“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體的構(gòu)成情況環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列環(huán)形圖可用于結(jié)構(gòu)比較研究環(huán)形圖

(例題分析)直方圖用矩形的寬度和高度來表示頻數(shù)分布本質(zhì)上是用矩形的面積來表示頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖直方圖下的總面積等于1直方圖的繪制直方圖與條形圖的區(qū)別條形圖是用條形的長度表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示各組的頻數(shù)或百分比,寬度表示各組的組距,其高度與寬度均有意義直方圖的矩形是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示品質(zhì)數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)莖葉圖用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,圖形是由數(shù)字組成的高位數(shù)值作樹莖,個位數(shù)字作樹葉莖葉圖與直方圖的區(qū)別直方圖可觀察數(shù)據(jù)的分布狀況,但沒有具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)該箱線圖也稱為Median/Quart./Range箱線圖單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成)單批數(shù)據(jù)箱線圖(例題分析)分布的形狀與箱線圖多批數(shù)據(jù)箱線圖(例題分析)多批數(shù)據(jù)箱線圖(例題分析)多批數(shù)據(jù)箱線圖(例題分析)箱線圖—K線圖(上證指數(shù)K線圖)折線圖繪制折線圖時應(yīng)注意:時間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸圖形的長寬比例要適當(dāng),大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷折線圖(例題分析)折線圖(例題分析)兩個變量間的關(guān)系—二維散點圖展示兩個變量之間的關(guān)系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi,yi)在坐標(biāo)系中用一個點表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個點稱為散點,由坐標(biāo)及其散點形成的二維數(shù)據(jù)圖兩個變量間的關(guān)系—二維散點圖三個變量間的關(guān)系—氣泡圖顯示三個變量之間的關(guān)系圖中數(shù)據(jù)點的大小依賴于第三個變量多變量數(shù)據(jù)—雷達圖也稱為蜘蛛圖(spiderchart)顯示多個變量的圖示方法假定各變量的取值具有相同的正負(fù)號可用于研究多個樣本之間的相似程度多變量數(shù)據(jù)—雷達圖(例題分析)多變量數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論