統(tǒng)計學數(shù)據(jù)的圖表展示(共133張課件)_第1頁
統(tǒng)計學數(shù)據(jù)的圖表展示(共133張課件)_第2頁
統(tǒng)計學數(shù)據(jù)的圖表展示(共133張課件)_第3頁
統(tǒng)計學數(shù)據(jù)的圖表展示(共133張課件)_第4頁
統(tǒng)計學數(shù)據(jù)的圖表展示(共133張課件)_第5頁
已閱讀5頁,還剩128頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學數(shù)據(jù)的圖表展示不同原因引起的壽命損失

原因壽命減少天數(shù)

原因壽命減少天數(shù)未結(jié)婚(男性)慣用左手吸香煙(男性)未結(jié)婚(女性)30%超重20%超重吸香煙(女性)抽雪茄35003285225016001300900800300危險工作,事故交通事故飲酒濫用藥物一般工作,事故自然放射性喝咖啡醫(yī)療X——射線3002001309074886柱形圖帕累托圖3.1數(shù)據(jù)的預處理

DataPreparation3.1.1.數(shù)據(jù)的審核與篩選3.1.2數(shù)據(jù)的排序3.1.3數(shù)據(jù)透視表

數(shù)據(jù)的審核、篩選與排序數(shù)據(jù)的審核DataCheck發(fā)現(xiàn)數(shù)據(jù)中的錯誤數(shù)據(jù)的篩選DataFilter找出符合條件的數(shù)據(jù)數(shù)據(jù)排序DataRank發(fā)現(xiàn)數(shù)據(jù)的基本特征升序和降序3.1.1數(shù)據(jù)的審核

(原始數(shù)據(jù)Check—RawData

審核的內(nèi)容完整性審核檢查應調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標是否填寫齊全準確性審核檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際檢查數(shù)據(jù)是否有錯誤,計算是否正確等數(shù)據(jù)的審核

(原始數(shù)據(jù))

審核數(shù)據(jù)準確性的方法邏輯檢查從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項目或數(shù)字之間有無相互矛盾的現(xiàn)象主要用于對定類數(shù)據(jù)和定序數(shù)據(jù)的審核計算檢查檢查調(diào)查表中的各項數(shù)據(jù)在計算結(jié)果和計算方法上有無錯誤主要用于對定距和定比數(shù)據(jù)的審核數(shù)據(jù)的審核

(第二手數(shù)據(jù)SecondHandData

)適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定這些數(shù)據(jù)是否符合自己分析研究的需要時效性審核應盡可能使用最新的統(tǒng)計數(shù)據(jù)確認是否必要做進一步的加工整理3.1.2數(shù)據(jù)的篩選對審核過程中發(fā)現(xiàn)的錯誤應盡可能予以糾正當發(fā)現(xiàn)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補時,需要對數(shù)據(jù)進行篩選數(shù)據(jù)篩選的內(nèi)容包括:將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔出【例】學生四門課程的成績數(shù)據(jù)篩選表3-18名學生考試成績

第一步:選擇【工具】菜單,并選擇【篩選】,如果要篩選出給定條件的數(shù)據(jù),可使用【自動篩選】命令,如圖3-1所示:

這時會在第一行出現(xiàn)下拉鍵頭,用鼠標點擊箭頭會出現(xiàn)如圖3-2所示的結(jié)果

第二步:在下拉鍵頭方框內(nèi)選擇要篩選出的數(shù)據(jù)。比如,要篩選出統(tǒng)計成績?yōu)?5分的學生。選擇75,得到結(jié)果如圖2-3所示。要篩選出英語成績最高的前四個學生,可選擇【前4個】,并在對話框中輸入數(shù)據(jù)4,結(jié)果如圖3-4所示。單擊確定后即可得到相應的結(jié)果。圖3-3圖3-4

第三步:如果要選出四門課成績都大于70分的學生,由于設定的條件比較多,需要使用【高級篩選】命令,使用高級篩選命令時,必須建立條件區(qū)域。這時需要在數(shù)據(jù)清單上方至少留出三行作為條件區(qū)域。然后在【列表區(qū)域

】選出其中要篩選的數(shù)據(jù)清單,在【條件區(qū)域】中選擇匹配的條件。比如要篩選出四門課程成績均大于70分的學生,如圖3-5所示。單擊【確定】后出現(xiàn)的結(jié)果如圖3-6所示。圖3-5圖3-63.1.3數(shù)據(jù)的排序

按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成數(shù)據(jù)的排序定類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分定距和定比數(shù)據(jù)的排序遞增排序:設一組數(shù)據(jù)為X1,X2,…,XN,遞增排序后可表示為:X(1)<X(2)<…<X(N)遞減排序可表示為:X(1)>X(2)>…>X(N)3.1.4數(shù)據(jù)透視表

利用數(shù)據(jù)透視表可以利用Excel提供的數(shù)據(jù)透視表工具,對數(shù)據(jù)重要信息按使用者習慣分析要求進行匯總和作圖,形成一個符合需要的交叉表(列聯(lián)表)。在利用數(shù)據(jù)透視表時,數(shù)據(jù)源表中的首行必須有列標題。第一步:建立Excel數(shù)據(jù)清單,如表3-2表3-2

第二步:選中數(shù)據(jù)清單中的任意單元格,并選擇【數(shù)據(jù)】菜單中的【數(shù)據(jù)透視表和數(shù)據(jù)透視圖】,彈出對話框如圖3-7所示。然后根據(jù)需要選擇“數(shù)據(jù)源類型”和“報表類型”。這里我們選用【MicrosoftOfficeExcel數(shù)據(jù)列表或數(shù)據(jù)庫】和【數(shù)據(jù)透視表】,單擊下一步,探出對框如圖3-8所示圖3-7圖3-8

第三步:確定數(shù)據(jù)源區(qū)。本利的數(shù)據(jù)源區(qū)為$A$1:$F$31,如果在啟動想到之前單擊了數(shù)據(jù)源單元格,Excel會自動選定數(shù)據(jù)源區(qū)域。單擊下一步,探出的對話框如圖3-9所示。圖2-9

第四步:在上面的對話框中,選擇數(shù)據(jù)透視表的輸出位置,為方便起見可選擇【現(xiàn)有工作表】,并利用鼠標確定數(shù)據(jù)透視表的輸出位置,本例為原工作表的G1單元格,然后選擇【布局】,彈出的對話框如圖3-10所示。

圖2-10

第五步:在上面的【數(shù)據(jù)透視表和數(shù)據(jù)透視向?qū)А季帧繉υ捒蛑?,依次將“性別”和“買衣物首選因素”拖至左邊的“行”區(qū)域,將“家庭所在地”拖至上邊的“列”區(qū)域,將“平均月生活費”和“月平均衣物支出”拖至“數(shù)據(jù)”區(qū)域。如圖3-11所示。圖3-11根據(jù)需要建立【數(shù)據(jù)透視表和數(shù)據(jù)透視圖向?qū)А季帧?/p>

第六步:單擊【確定】,自動返回【數(shù)據(jù)透視表和數(shù)據(jù)透視圖向?qū)А?步驟之3】對話框。然后單擊【完成】,即可輸出數(shù)據(jù)透視表。結(jié)果如圖3-12所示。圖3-12根據(jù)需要建立的數(shù)據(jù)透視表3.2品質(zhì)數(shù)據(jù)的整理與顯示3.2.1生成頻數(shù)分布圖3.2.2定序數(shù)據(jù)的圖示分類數(shù)據(jù)的整理與顯示數(shù)據(jù)的整理與顯示

(基本問題)要弄清所面對的數(shù)據(jù)類型,因為不同類型的數(shù)據(jù),所采取的處理方式和方法是不同的對定類數(shù)據(jù)和定序數(shù)據(jù)主要是做分類整理對定距數(shù)據(jù)和定比數(shù)據(jù)則主要是做分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)1、基本過程(1). 列出各類別

(2).計算各類別的頻數(shù)(3).制作頻數(shù)分布表(4).用圖形顯示數(shù)據(jù)3.2.1分類數(shù)據(jù)的整理與顯示CategoricalDataOrganization

生成頻數(shù)分布圖1.Listallthecategories.列出所有分類。2.Calculatethefrequencyofeverycategory.

計算各類別的頻數(shù)。3.Makeafrequencydistributiontable.

編制頻數(shù)分布表。4.Graphicalpresentation.用圖形表現(xiàn)出來。

分類頻數(shù)比例百分比比率ABCDEProcedure程序:定類數(shù)據(jù)的整理

(可計算的指標)1.頻數(shù)(frequency):落在各類別中的數(shù)據(jù)個數(shù)2.比例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值3.百分比:將對比的基數(shù)作為100而計算的比值4.比率:不同類別數(shù)值的比值顧客性別及購買的飲料類型

表3-3不同類型的飲料和顧客性別的頻數(shù)分布表

表3-4也稱為列聯(lián)表或交叉表SPSS生成頻數(shù)分布表第一步:選擇【Analyze】【DescriptiveStatistics-Frequencies】進入主題對話框第二步:將“飲料類型”或“顧客性別”選入【Variable】;選中【DisplayFrequenciestables】。第三步:點擊【Statistics】或【Charts】并選擇相應的選項。點擊【OK】表3-5不同類型飲料的頻數(shù)分布表3-6不同性別顧客的頻數(shù)分布SPSS生成列聯(lián)表第一步:選擇【Analyze】【DescriptiveStatistics-Crosstabs】進入主題對話框第二步:將“飲料類型”選入【Rows】;“顧客性別”選入【Columns】(行列可互換)。第三步:點擊【Cells】,選擇相關(guān)內(nèi)容,或選其他相關(guān)選項。表3-7飲料類型和顧客性別的交叉列聯(lián)表表3-8飲料類型和顧客性別的交叉列聯(lián)表及其分析(2)比例(proportion)(3)百分比(percentage)(4)比率(ratio)2、分類數(shù)據(jù)的圖示(1)條形圖(barchart)用寬度相同的條形高度或長度表示數(shù)據(jù)多少的圖形??v置或橫置,縱置時稱為柱形圖(columnchart)(1)頻數(shù)(frequency)圖3-13【例】SPSS輸出效果(2)帕累托圖(Paretochart):按各類數(shù)據(jù)頻數(shù)多少排序后繪制的柱形圖。圖3-14圖3-14(3)餅圖:使用圓形或院內(nèi)扇形的角度來表示數(shù)值大小的圖形,主要用于表示一個樣本(或總體)個組成部分的數(shù)據(jù)占全部數(shù)據(jù)的比例。圖3-16定類數(shù)據(jù)整理—頻數(shù)分布表

(實例)【例3.4】為研究廣告市場的狀況,一家廣告公司在某城市隨機抽取200人就廣告問題做了郵寄問卷調(diào)查,其中的一個問題是“您比較關(guān)心下列哪一類廣告?”

1.商品廣告;2.服務廣告;3.金融廣告;4.房地產(chǎn)廣告;5.招生招聘廣告;6.其他廣告。表3-8某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)比例頻率(%)

商品廣告服務廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100定類數(shù)據(jù)的圖示—條形圖

(條形圖的制作)條形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動的圖形條形圖有單式、復式等形式在表示定類數(shù)據(jù)的分布時,是用條形圖的高度來表示各類別數(shù)據(jù)的頻數(shù)或頻率繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖定類數(shù)據(jù)的圖示—條形圖

(由Excel繪制的條形圖)人數(shù)(人)5191610211204080120

商品廣告

服務廣告

金融廣告

房地產(chǎn)廣告

招生招聘廣告

其他廣告廣告類型

圖3-1某城市居民關(guān)注不同類型廣告的人數(shù)分布定類數(shù)據(jù)的圖示—圓形圖

(圓形圖的制作)也稱餅圖,是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形主要用于表示總體中各組成部分所占的比例,對于研究結(jié)構(gòu)性問題十分有用在繪制圓形圖時,總體中各部分所占的百分比用園內(nèi)的各個扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應比例確定的例如,關(guān)注服務廣告的人數(shù)占總?cè)藬?shù)的百分比為25.5%,那么其扇形的中心角度就應為3600×25.5%=0,其余類推定類數(shù)據(jù)的圖示—圓形圖

(由Excel繪制的圓形圖)

其他廣告1.0%

房地產(chǎn)廣告8.0%

商品廣告56.0%

金融廣告4.5%

服務廣告25.5%

招生招聘廣告5.8%圖3-2某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成定類數(shù)據(jù)的圖示—環(huán)形圖

(環(huán)形圖doughnutchart的制作)環(huán)形圖中間有一個“空洞”,總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán)環(huán)形圖可用于進行比較研究環(huán)形圖可用于展示定類和定序的數(shù)據(jù)品質(zhì)數(shù)據(jù)的圖示—環(huán)形圖

(由Excel繪制的環(huán)形圖)8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

圖3-4甲乙兩城市家庭對住房狀況的評價順序(定序)數(shù)據(jù)的整理

(可計算的指標)1.累計頻數(shù)(cumulativefrequencies):將各類別的頻數(shù)逐級累加2.累計頻率(cumulativepercntages):將各類別的頻率(百分比)逐級累加

定序數(shù)據(jù)頻數(shù)分布表

(實例)【例3.5】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?

1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。

表3-10甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意不滿意一般滿意非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————定類數(shù)據(jù)的圖示—環(huán)形圖

(環(huán)形圖doughnutchart的制作)單變量值分組表

(實例)(4)比率(ratio)總體經(jīng)過分組,能夠突出組與組之間的差異而抽象掉組內(nèi)各單位之間的差異,使數(shù)據(jù)變得條理化,便于進一步分析研究。環(huán)形圖可用于進行比較研究在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖(Histogram)圖3-22簡單箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(實例)一、鑒別圖形優(yōu)劣的準則圖3-24不同分布的箱線圖Scatterdiagram遞減排序可表示為:X(1)>X(2)>…>X(N)Graphicalpresentation.5】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?定序數(shù)據(jù)頻數(shù)分布表

(實例)表3-11乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意不滿意一般滿意非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————定序數(shù)據(jù)的圖示—累計頻數(shù)分布圖

(由Excel繪制的累計頻數(shù)分布圖)243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向下累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向上累積圖3-19甲城市家庭對住房狀況評價的累積頻數(shù)分布3.3數(shù)值型數(shù)據(jù)的整理與顯示3.3.1.生成頻數(shù)分布表(數(shù)據(jù)的分組)3.3.2.定量數(shù)據(jù)的圖示頻數(shù)分布表的編制編制頻數(shù)分布表的步驟確定組數(shù)編制頻數(shù)分布表的步驟確定組距計算頻數(shù)編制表格頻數(shù)分布表的編制

(實例)【例3.6】某公司前5個月每天銷售量數(shù)據(jù)如下:(單位:臺)。試采用單變量值對數(shù)據(jù)進行分組。分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組

(要點)1.將一個變量值作為一組2.適合于離散變量3.適合于變量值較少的情況

單變量值分組表

(實例)頻數(shù)表(用SPSS制作)有效數(shù)據(jù)頻數(shù)頻率有效頻率累計頻率約2/3的人身高不超過165cm組距分組

(要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~將總體中所有單位按一定的標志分為性質(zhì)不同但又有聯(lián)系的若干部分的過程統(tǒng)計分組統(tǒng)計分組的作用:總體經(jīng)過分組,能夠突出組與組之間的差異而抽象掉組內(nèi)各單位之間的差異,使數(shù)據(jù)變得條理化,便于進一步分析研究。劃分社會經(jīng)濟現(xiàn)象的類型反映社會經(jīng)濟現(xiàn)象的內(nèi)部結(jié)構(gòu)和比例關(guān)系揭示社會經(jīng)濟現(xiàn)象之間的相互依存關(guān)系選擇分組標志確定分組體系總體單位歸類科學性:組間差異大,組內(nèi)差異小。完備性和互斥性:每個單位均能且只能歸到某個組中。統(tǒng)計分組的程序與原則對大學生月生活費支出情況進行分組研究:按家庭收入水平分組;按城鄉(xiāng)分組;按性別分組;按年齡分組。?統(tǒng)計分組的程序與原則對父母親下崗情況進行分組研究:

單親下崗;雙親下崗;雙親在崗。不符合科學性不符合完備性和互斥性城鄉(xiāng)區(qū)別離退休是否健在?統(tǒng)計分組的程序與原則分組體系指同時使用兩個以上標志分組時,分組標志的組合形式。各分組標志并列使用各分組標志交叉結(jié)合使用平行分組體系交叉分組體系平行分組體系對教師的分類按性別分類男性女性按職稱分類按年齡分類高級中級初級青年中年共計7組2+3+2交叉分組體系按性別分類按職稱分類按年齡分類男女高級中級初級青年中年共計12組2×3×2對教師的分類組距分組

(步驟)確定組數(shù):組數(shù)的確定應以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,可以按Sturges

提出的經(jīng)驗公式來確定組數(shù)K確定各組的組距:組距(ClassWidth)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即

組距=(最大值-最小值)÷組數(shù)

根據(jù)分組整理成頻數(shù)分布表

組距分組

(幾個概念)1.下限:一個組的最小值2.上限:一個組的最大值3.組距:上限與下限之差4.組中值:下限與上限之間的中點值下限值+上限值2組中值=等距分組表

(上下組限重疊)表3-13某電腦公司銷售量的頻數(shù)分布按零件數(shù)分組頻數(shù)(人)頻率(%)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~2404916272017108453.337.5013.3322.5016.6714.178.336.673.334.17合計120100等距分組表

(上下組限間斷)表3-14某電腦公司銷售量的頻數(shù)分布按零件數(shù)分組頻數(shù)(人)頻率(%)140~149150~159160~169170~179180~189190~199200~209210~219220~229230~2394916272017108453.337.5013.3322.5016.6714.178.336.673.334.17合計120100等距分組表

(使用開口組)表3-15某電腦公司銷售量的頻數(shù)分布按零件數(shù)分組頻數(shù)(人)頻率(%)150以下150~159160~169170~179180~189190~199200~209210~219220~229230以上4916272017108453.337.5013.3322.5016.6714.178.336.673.334.17合計120100組距分組與不等距分組

(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征和規(guī)律不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實際狀況數(shù)值型數(shù)據(jù)的圖示

用Excel作圖以下圖形均由計算機繪制!ExcelSTATISTICA分組數(shù)據(jù)—直方圖

(直方圖的制作)用矩形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用矩形的面積來表示各組的頻數(shù)分布在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖(Histogram)直方圖下的總面積等于1分組數(shù)據(jù)—直方圖

(直方圖的繪制)日加工零件數(shù)(個)圖3.-20某電腦公雖銷售量分布的直方圖我一眼就看出來了,大多數(shù)天的日銷售臺數(shù)在170~180之間!直方圖下的面積之和等于1頻數(shù)(臺)分組數(shù)據(jù)—直方圖

(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列分組數(shù)據(jù)—折線圖

(折線圖的制作)折線圖也稱頻數(shù)多邊形圖(Frequencypolygon)是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的1512963105110115120125130135140日加工零件數(shù)(個)頻數(shù)(人)折線圖下的面積與直方圖的面積相等!分組數(shù)據(jù)—折線圖

(折線圖的繪制)圖3-20某車間工人日加工零件數(shù)的折線圖未分組數(shù)據(jù)—莖葉圖

(莖葉圖的制作)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉對于n(20≤n≤300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過

L=[10×log10n

]5.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可大體上看出一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息樹莖樹葉1349數(shù)據(jù)個數(shù)491627莖葉圖類似橫置的直方圖未分組數(shù)據(jù)—莖葉圖

(莖葉圖的制作)圖3-211415023345689161718未分組數(shù)據(jù)—箱線圖

(箱線圖boxplot的制作)用于顯示未分組的原始數(shù)據(jù)或分組數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值圖3-22簡單箱線圖未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(實例)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150170180190200240圖3-23某電腦公司銷售量數(shù)據(jù)的箱線圖分布的形狀與箱線圖

對稱分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU圖3-24不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(實例)【例3.7】

從某大學經(jīng)濟管理專業(yè)二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結(jié)果如表3-8。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征表3-1611名學生各科的考試成績數(shù)據(jù)課程名稱學生編號1234567891011英語經(jīng)濟數(shù)學西方經(jīng)濟學市場營銷學財務管理基礎會計學統(tǒng)計學計算機應用基礎76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸對于沒有數(shù)字的表格單元,一般用“—”表示-20某電腦公雖銷售量分布的直方圖等距分組表

(上下組限間斷)試采用單變量值對數(shù)據(jù)進行分組。使用二維坐標展示兩個變量之間關(guān)系的一種未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(實例)11】為研究某條河流的污染程度,環(huán)保局分別在上游、中游和下游設立取樣點,每個取樣點化驗水中的五項污染指標,所得數(shù)據(jù)如表3-13。娛樂教育文化服務【例】學生四門課程的成績數(shù)據(jù)篩選(6)有對圖形的統(tǒng)計描述和文字說明表3-191997年城鄉(xiāng)居民家庭平均每人生活消費支出構(gòu)成%保健、交通和通訊、娛樂教育文化服務、居住、雜項商品和服務。數(shù)據(jù)的審核

(原始數(shù)據(jù))遞減排序可表示為:X(1)>X(2)>…>X(N)未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(由STATIATICA繪制的多批數(shù)據(jù)箱線圖)圖3-258門課程考試成績的箱線圖圖3-2611名學生8門課程考試成績的箱線圖Min-Max25%-75%Medianvalue455565758595105學生1學生2學生3學生4學生5學生6學生7學生8學生9學生10學生11未分組數(shù)據(jù)—箱線圖

(由STATIATICA繪制的多批數(shù)據(jù)箱線圖)時間序列數(shù)據(jù)—線圖

(線圖的制作)

繪制線圖時應注意以下幾點時間一般繪在橫軸,指標數(shù)據(jù)繪在縱軸圖形的長寬比例要適當,其長寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷時間序列數(shù)據(jù)—線圖

(實例)【例3.8】已知1991~1998年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表3-11。試繪制線圖¥

表3-171991~1998年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.67702.88472.2708.6784.0921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2時間序列數(shù)據(jù)

(由Excel繪制的線圖)(1)散點圖Scatterdiagram

使用二維坐標展示兩個變量之間關(guān)系的一種圖形,它用橫坐標軸代表變量x,縱軸代表y,每組數(shù)據(jù)(x,y)在坐標系中用一個點表示,n組數(shù)據(jù)形成n個點,由坐標及散點組成的二維數(shù)據(jù)圖稱為散圖。多變量的圖示例3.9小麥單位面積產(chǎn)量和溫度、降雨量之間的關(guān)系表3-18小麥產(chǎn)量與溫度和降雨量的關(guān)系圖3-28小麥產(chǎn)量與降雨量的散點圖圖3-29小麥產(chǎn)量和溫度之的散點圖(2)氣泡圖(bubblechart)

用于展示三個變量之間的關(guān)系,繪制時將一個變量放在橫軸,另一個變量放在縱軸,而第三個變量則用氣泡大小來表示。圖3-29小麥產(chǎn)量與降雨量和溫度的氣泡圖雷達圖(RadarChart)是顯示多個變量的常用圖示方法,也稱為蜘蛛圖(spidechart)在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時十分有用假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度(3)雷達圖

設有n組樣本S1,S2,…Sn,每個樣本測得P個變量X1,X2,Xp,要繪制這P個變量的雷達圖,其具體做法是多變量數(shù)據(jù)—雷達圖

(雷達圖的制作)

先做一個圓,然后將圓P等分,得到P個點,令這P個點分別對應P個變量,在將這P個點與圓心連線,得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示再將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一個雷達圖多變量數(shù)據(jù)—雷達圖

(實例)【例3.10】2003年我國城鄉(xiāng)居民家庭平均每人各項生活消費支出構(gòu)成數(shù)據(jù)如表3-12。試繪制雷達圖。今天的主食是面包表3-191997年城鄉(xiāng)居民家庭平均每人生活消費支出構(gòu)成%項目城鎮(zhèn)居民農(nóng)村居民

食品衣著家庭設備用品及服務醫(yī)療保健交通通訊娛樂教育文化服務居住雜項商品與服務37.129.796.307.3111.0814.3510.743.3045.595.674.205.968.3612.1315.872.21合計100100多變量數(shù)據(jù)—雷達圖

(由Excel繪制的雷達圖)多變量數(shù)據(jù)—雷達圖

(實例)【例3.11】為研究某條河流的污染程度,環(huán)保局分別在上游、中游和下游設立取樣點,每個取樣點化驗水中的五項污染指標,所得數(shù)據(jù)如表3-13。將各指標用雷達圖表示出來,并分析該河流的主要污染源。

表3-20不同樣本點的化驗指標指標1指標2指標3指標4指標5上游中游下游4.520.342.175.01.46.8483362081964111214635多變量數(shù)據(jù)—雷達圖

(由Excel繪制的對數(shù)坐標雷達圖)0.11101001000指標1指標2指標3指標4指標5上游中游下游圖3-31河流污染指標雷達圖

3.4合理使用圖表一.鑒別圖標優(yōu)劣的準則二.統(tǒng)計表數(shù)據(jù)類型及圖示

(小結(jié))數(shù)據(jù)類型與顯示數(shù)值型數(shù)據(jù)品質(zhì)數(shù)據(jù)分組數(shù)據(jù)總計表莖葉圖條形圖餅圖環(huán)形圖直方圖箱線圖折線圖原始數(shù)據(jù)時序數(shù)據(jù)線圖雷達圖多元數(shù)據(jù)散點圖氣泡圖頻數(shù)分布的類型對稱分布右偏分布左偏分布正J型分布反J型分布U型分布圖3-32幾種常見的頻數(shù)分布一、鑒別圖形優(yōu)劣的準則(1)顯示數(shù)據(jù)

(2)讓讀者注意力集中在圖形的內(nèi)容上,而不是制作圖形上(3)避免歪曲(4)強調(diào)數(shù)據(jù)之間的比較(5)服務于一個明確的目的(6)有對圖形的統(tǒng)計描述和文字說明好的圖形字應具有的特征鑒別圖形優(yōu)劣的準則(1)精心設計,有助于洞察問題的實質(zhì);(2)使復雜的觀點得到簡明、確切、高效的闡述;

(3)能在最短的時間內(nèi)以最少的筆墨給讀者提供最大量的信息;(4)應當是多維的;(5)應當表述數(shù)據(jù)的真實情況。數(shù)據(jù)表示中的錯誤

ErrorsinPresentingData1. 使用花哨(Junk)圖表2. 數(shù)據(jù)比較時沒有可靠的相對基準3. 壓縮縱軸 Compressingthe VerticalAxis4. 縱軸上無零點

NoZeroPointon theVerticalAxis花哨圖表

ChartJunk不準確的表示準確的表示最低工資最低工資0241960197019801990$花哨圖表

ChartJunk

在報紙、雜志上的圖表里通常都會加上花哨的圖標和符號以增加吸引力,這種做法常常會掩蓋或曲解數(shù)據(jù)應傳遞的準確信息實例1:“人民生活步步高”

?北京日報?1997年9月10日實例2:北大畫冊(英文版)2001 無相對基準

NoRelativeBasis準確的表示按年級統(tǒng)計的A按年級統(tǒng)計的A

不準確的表示0100200300大一大二大三大四頻數(shù)0%10%20%30%大一大二大三大四百分比無相對基準

NoRelativeBasis

通常百分比之間較為可比,而絕對數(shù)之間比較卻可能產(chǎn)生誤解。不適當?shù)膱D標也會影響數(shù)據(jù)比較的準確性。實例3:“LiquidGold:AustraliansareChangingtheWorldofWine,”

Time,November22,1999實例4:“工業(yè)生產(chǎn)增幅快”

《北京青年報》2000年9月12日壓縮縱軸

CompressingVerticalAxis季度銷售季度銷售不準確的表示0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論