第三章 第一節(jié) 數(shù)據(jù)的整理與顯示_第1頁(yè)
第三章 第一節(jié) 數(shù)據(jù)的整理與顯示_第2頁(yè)
第三章 第一節(jié) 數(shù)據(jù)的整理與顯示_第3頁(yè)
第三章 第一節(jié) 數(shù)據(jù)的整理與顯示_第4頁(yè)
第三章 第一節(jié) 數(shù)據(jù)的整理與顯示_第5頁(yè)
已閱讀5頁(yè),還剩88頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章 統(tǒng)計(jì)數(shù)據(jù)的概括性描述(mio sh)共九十三頁(yè)第三章 統(tǒng)計(jì)數(shù)據(jù)的概括性描述(mio sh)第一節(jié) 統(tǒng)計(jì)數(shù)據(jù)的整理與展示第二節(jié) 數(shù)據(jù)(shj)集位置的測(cè)度第三節(jié) 數(shù)據(jù)集離散程度的測(cè)度第四節(jié) 數(shù)據(jù)集的峰度與偏度共九十三頁(yè)學(xué)習(xí)(xux)目標(biāo)了解數(shù)據(jù)預(yù)處理的內(nèi)容和目的掌握分配(fnpi)數(shù)列的整理與顯示方法掌握數(shù)據(jù)集的位置測(cè)度的變量與方法掌握數(shù)據(jù)集的離散程度測(cè)度的變量與方法掌握數(shù)據(jù)集的分布形態(tài)測(cè)度的變量與方法共九十三頁(yè)案例(n l)與背景統(tǒng)計(jì)數(shù)據(jù)首先需要經(jīng)過(guò)預(yù)處理和整理,以便人們對(duì)數(shù)據(jù)分布的類型和特點(diǎn)有了一個(gè)大概的了解。但這種了解并不能幫助我們準(zhǔn)確地描述出統(tǒng)計(jì)數(shù)據(jù)的分布,還需要更深入的分析,找

2、到能反映數(shù)據(jù)分布特征的各個(gè)代表值。對(duì)統(tǒng)計(jì)數(shù)據(jù)分布的特征和規(guī)律,可以從本章(bn zhn)所介紹的三個(gè)方面進(jìn)行測(cè)度和描述:一是數(shù)據(jù)集位置的測(cè)度,反映各數(shù)據(jù)向其中心值靠攏或聚集的程度;二是數(shù)據(jù)集離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢(shì);三是數(shù)據(jù)集的峰度與偏度,反映數(shù)據(jù)分布的形狀。這三個(gè)方面從不同側(cè)面反映了數(shù)據(jù)分布特征。本章(bn zhn)將重點(diǎn)介紹這些代表值的計(jì)算方法、特點(diǎn)及其應(yīng)用。共九十三頁(yè)第一節(jié) 統(tǒng)計(jì)數(shù)據(jù)的整理(zhngl)與展示3.1.1 數(shù)據(jù)的預(yù)處理3.1.2 頻數(shù)(pn sh)分布表的編制與圖示共九十三頁(yè)3.1.1 數(shù)據(jù)(shj)的預(yù)處理數(shù)據(jù)的審核檢查數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)的篩選(shixun)

3、找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征共九十三頁(yè)數(shù)據(jù)(shj)審核原始數(shù)據(jù)(raw data) 審核的內(nèi)容完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫(xiě)齊全準(zhǔn)確性審核檢查數(shù)據(jù)是否真實(shí)反映客觀實(shí)際(shj)情況,內(nèi)容是否符合實(shí)際(shj)檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等共九十三頁(yè)數(shù)據(jù)(shj)的審核原始數(shù)據(jù)(raw data)審核數(shù)據(jù)準(zhǔn)確性的方法邏輯(lu j)檢查從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項(xiàng)目或數(shù)字之間有無(wú)相互矛盾的現(xiàn)象主要用于對(duì)分類和順序據(jù)的審核計(jì)算檢查檢查調(diào)查表中的各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法上有無(wú)錯(cuò)誤主要用于對(duì)數(shù)值型數(shù)據(jù)的

4、審核共九十三頁(yè)數(shù)據(jù)(shj)的審核二手?jǐn)?shù)據(jù)(second hand data)適用性審核弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否(sh fu)符合自己分析研究的需要時(shí)效性審核盡可能使用最新的數(shù)據(jù)確認(rèn)是否必要做進(jìn)一步的加工整理共九十三頁(yè)數(shù)據(jù)(shj)篩選(data filter)當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行篩選(shixun)數(shù)據(jù)篩選的內(nèi)容包括將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來(lái),而不符合特定條件的數(shù)據(jù)予以剔共九十三頁(yè)用SPSS進(jìn)行(jnxng)數(shù)據(jù)篩選 8名學(xué)生(xu she

5、ng)的考試成績(jī)數(shù)據(jù) 數(shù)據(jù)篩選(data filter)共九十三頁(yè)數(shù)據(jù)(shj)排序 (data rank)按一定(ydng)順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線索排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)在某些場(chǎng)合,排序本身就是分析的目的之一排序可借助于計(jì)算機(jī)完成共九十三頁(yè)數(shù)據(jù)排序(pi x) (方法)分類數(shù)據(jù)的排序字母(zm)型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫(huà)排序,其中也有筆畫(huà)多少的升序降序之分?jǐn)?shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,xn,遞增排序后可表示為:x(1)x(2)x(2)x

6、(n)共九十三頁(yè)3.1.2 頻數(shù)分布(fnb)表的編制與圖示頻數(shù)與頻數(shù)分布統(tǒng)計(jì)分組品質(zhì)數(shù)列的整理(zhngl)和顯示變量數(shù)列的整理和顯示頻數(shù)分布的類型共九十三頁(yè)1. 頻數(shù)(pn sh)與頻數(shù)(pn sh)分布頻數(shù)分布數(shù)列的概念在統(tǒng)計(jì)(tngj)分組的基礎(chǔ)上,將總體的所有單位按組歸類整理,并按一定順序排列,形成總體中各個(gè)單位在各組簡(jiǎn)的分布,又稱次數(shù)分配或分布數(shù)列。頻數(shù)(frequency) :又叫次數(shù),落在各類別中的數(shù)據(jù)(單位)個(gè)數(shù),記作 Fi 。 頻率(ratio) :又叫比率,各組次數(shù)(頻數(shù))與總次數(shù)(頻數(shù))之比。共九十三頁(yè)頻率分布(fnb)的性質(zhì):=110111NiNiiiNiiiFFFF

7、共九十三頁(yè)分配(fnpi)數(shù)列的種類品質(zhì)分配數(shù)列(屬性分布數(shù)列) :按品質(zhì)標(biāo)志分組形成的分配數(shù)列。變量分配數(shù)列(變量分布數(shù)列) :按數(shù)量(shling)標(biāo)志分組形成的分配數(shù)列。單項(xiàng)數(shù)列:總體按單項(xiàng)式分組而形成的變量數(shù)列,每個(gè)變量值是一個(gè)組,順序排列。 組距數(shù)列:總體按組距式分組而形成的變量數(shù)列,每個(gè)組是由若干個(gè)變量值形成的區(qū)間表示。 分配數(shù)列品質(zhì)數(shù)列變量數(shù)列單項(xiàng)數(shù)列組距數(shù)列共九十三頁(yè)2. 統(tǒng)計(jì)(tngj)分組統(tǒng)計(jì)分組概念:是根據(jù)統(tǒng)計(jì)研究(ynji)的目的,選擇某一主要標(biāo)志,將總體單位劃分為若干類型或組別,使組內(nèi)具有同質(zhì)性,組間具有差異性。統(tǒng)計(jì)分組作用劃分現(xiàn)象的類型揭示現(xiàn)象內(nèi)部結(jié)構(gòu)分析現(xiàn)象之間的

8、依存關(guān)系共九十三頁(yè)統(tǒng)計(jì)分組分組標(biāo)志(biozh)的選擇統(tǒng)計(jì)分組的關(guān)鍵問(wèn)題:如何選擇分組標(biāo)志和確定各組的界限。根據(jù)統(tǒng)計(jì)研究的目的來(lái)選擇在滿足研究目的的前提下,應(yīng)選擇本質(zhì)的、主要的,而不是非本質(zhì)的、次要(cyo)的標(biāo)志??紤]具體的歷史和經(jīng)濟(jì)條件。共九十三頁(yè)簡(jiǎn)單(jindn)分組、復(fù)合分組和分組體系根據(jù)采用的分組標(biāo)志的多少,可以(ky)分為:簡(jiǎn)單分組復(fù)合分組共九十三頁(yè)簡(jiǎn)單(jindn)分組又稱單一分組,是對(duì)被研究現(xiàn)象總體只按一個(gè)標(biāo)志進(jìn)行的分組。特點(diǎn):只能反映現(xiàn)象在某一標(biāo)志特征方面的差異情況。不能反映現(xiàn)象在其他標(biāo)志特征方面的差異,說(shuō)明問(wèn)題比較(bjio)簡(jiǎn)單明了。共九十三頁(yè)簡(jiǎn)單(jindn)分組按性別

9、分組男女按年齡分組06歲組717歲組1859歲組60歲以上組共九十三頁(yè)復(fù)合(fh)分組對(duì)同一總體選擇兩個(gè)或兩個(gè)以上標(biāo)志層疊起來(lái)進(jìn)行的分組。特點(diǎn):可以從幾個(gè)不同角度了解總體內(nèi)部的差別和關(guān)系,比簡(jiǎn)單分組能更全面、更深入地研究(ynji)問(wèn)題;分組的組數(shù)隨著分組標(biāo)志的增加而成倍地增加。因而在采用復(fù)合分組時(shí),選擇分組標(biāo)志的數(shù)量要適量,并且要考慮倒只有在總體包括的單位數(shù)較多的情況下,才宜于采用復(fù)合分組。 共九十三頁(yè)理科學(xué)生組高等學(xué)校學(xué)生總體男學(xué)生組女學(xué)生組男學(xué)生組女學(xué)生組本科學(xué)生組??茖W(xué)生組男學(xué)生組女學(xué)生組男學(xué)生組女學(xué)生組文科學(xué)生組本科學(xué)生組??茖W(xué)生組復(fù)合(fh)分組共九十三頁(yè)分組體系(tx)為了從不同

10、側(cè)面反映總體的特征,運(yùn)用(ynyng)幾個(gè)標(biāo)志對(duì)總體進(jìn)行分組,形成的一個(gè)完整的體系。分組體系有兩種不同的形式:平行分組體系:同一個(gè)總體的幾個(gè)簡(jiǎn)單分組按某一規(guī)定排列起來(lái)就構(gòu)成一個(gè)平行分組體系。復(fù)合分組體系:由復(fù)合分組形成的分組系列。共九十三頁(yè)3. 品質(zhì)(pnzh)分布數(shù)列的整理與顯示分類數(shù)據(jù)的整理(zhngl)順序數(shù)據(jù)的整理共九十三頁(yè)品質(zhì)分布(fnb)數(shù)列的整理列出各類別計(jì)算各類別的頻數(shù)制作(zhzu)頻數(shù)分布表用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE共九十三頁(yè)分類數(shù)據(jù)整理頻數(shù)分布表 (例題(lt)分析)【例3.1】一家市場(chǎng)調(diào)查公司為研究不同(b tn)品牌飲料的市場(chǎng)占有率,對(duì)隨機(jī)抽取的一

11、家超市進(jìn)行了調(diào)查。調(diào)查員在某天對(duì)50名顧客購(gòu)買飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購(gòu)買某一品牌的飲料,就將這一飲料的品牌名字記錄一次 。右邊就是記錄的原始數(shù)據(jù)用SPSS制作頻數(shù)分布表共九十三頁(yè)分類(fn li)數(shù)據(jù)的圖示條形圖(bar Chart)用寬度相同的條形的高度或長(zhǎng)短來(lái)表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式(xngsh)主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖共九十三頁(yè)分類數(shù)據(jù)(shj)的圖示條形圖 (例題分析)共九十三頁(yè)分類(fn li)數(shù)據(jù)的圖示餅圖(pie Chart)也稱圓形圖,是用圓形及園內(nèi)扇形的面積(min

12、j)來(lái)表示數(shù)值大小的圖形主要用于表示總體或樣本中各組成部分所占的比例,對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用繪制圓形圖時(shí),總體中各部分所占的百分比用園內(nèi)的各個(gè)扇形面積表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定的共九十三頁(yè)分類數(shù)據(jù)的圖示餅圖 (例題(lt)分析)共九十三頁(yè)順序(shnx)數(shù)據(jù)的整理累積頻數(shù)(pn sh)(cumulative frequencies):各類別頻數(shù)的逐級(jí)累加累積頻率(cumulative percentages):各類別頻率(百分比)的逐級(jí)累加共九十三頁(yè)順序(shnx)數(shù)據(jù)的頻數(shù)分布表(例題分析)【例3.2】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙

13、兩個(gè)(lin )城市各抽樣調(diào)查300戶,其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿意?1非常不滿意;2不滿意;3一般;4滿意;5非常滿意。 甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)累 計(jì)戶數(shù)(戶)百分比(%) 非常不滿意 不滿意 一般 滿意 非常滿意24108934530836311510241322252703008.044.075.090.0100.0合計(jì)300100.0共九十三頁(yè)順序數(shù)據(jù)的頻數(shù)分布(fnb)表 (例題分析)乙城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)累 計(jì)戶數(shù)(戶)百分比(%) 非常不滿意 不滿意 一般 滿意

14、 非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.0合計(jì)300100.0共九十三頁(yè)順序數(shù)據(jù)的圖示累計(jì)頻數(shù)(pn sh)分布圖 (例題分析)甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)(pn sh)分布共九十三頁(yè)環(huán)形(hun xn)圖(annular chart)環(huán)形圖中間有一個(gè)“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個(gè)總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)(du )總體的數(shù)據(jù)系列,每一個(gè)總體的數(shù)據(jù)系列為一個(gè)環(huán)環(huán)形圖可用于結(jié)構(gòu)比較研究 環(huán)形圖主要用于展示分類和順序數(shù)

15、據(jù)共九十三頁(yè)環(huán)形圖 (例題(lt)分析)8%36%31%15%7%33%26%21%13%10% 非常不滿意 不滿意 一般 滿意 非常滿意 甲乙兩城市家庭對(duì)住房狀況的評(píng)價(jià)共九十三頁(yè)4. 變量數(shù)列的整理(zhngl)與顯示 數(shù)據(jù)分組 累計(jì)(li j)頻數(shù)分布 數(shù)值型數(shù)據(jù)的圖示共九十三頁(yè)數(shù)據(jù)(shj)分組共九十三頁(yè)分組方法(fngf)分組方法(fngf)等距分組異距分組單變量值分組組距分組共九十三頁(yè)單變量值分組(要點(diǎn)(yodin)將一個(gè)變量值作為一組適合于離散(lsn)變量適合于變量值較少的情況共九十三頁(yè)組距分組 (要點(diǎn)(yodin)將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需

16、要遵循(zn xn)“不重不漏”的原則可采用等距分組,也可采用不等距分組共九十三頁(yè)等距分組(步驟(bzhu)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的(md)。在實(shí)際分組時(shí),可以按 Sturges 提出的經(jīng)驗(yàn)公式來(lái)確定組數(shù)K確定組距:組距(Class Width)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即 組距( 最大值 - 最小值) 組數(shù) 統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表 確定全距(極差):全部變量的最大之與最小值的距離 共九十三頁(yè)頻數(shù)分布表的編制(例題(lt)分析)【例3.3】某電腦公司2002年前四個(gè)月各天的銷售量數(shù)據(jù)(shj)(單位

17、:臺(tái))。試對(duì)數(shù)據(jù)(shj)進(jìn)行分組。 共九十三頁(yè)頻數(shù)分布表的編制(binzh)(步驟)確定組數(shù):根據(jù) Sturges 提出的經(jīng)驗(yàn)(jngyn)公式得組數(shù)K為:確定各組的組距: 組距( 237 - 141) 10=9.6 10用SPSS制作頻數(shù)分布表 共九十三頁(yè)組距分組與不等距分組(在表現(xiàn)頻數(shù)分布(fnb)上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對(duì)頻數(shù)來(lái)觀察頻數(shù)分布的特征不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對(duì)頻數(shù)的多少不能反映(fnyng)頻數(shù)分布的實(shí)際狀況需要用頻數(shù)密度反映頻數(shù)分布的實(shí)際狀況共九十三頁(yè)異距分組(幾個(gè)(j )概念)標(biāo)準(zhǔn)組距:數(shù)列中能被各組組距整

18、除的最大組距。常用數(shù)列中的最小組(xioz)距作為標(biāo)準(zhǔn)組距。共九十三頁(yè)異距分組 (例題(lt)分析)某廠工人年齡分布情況工人按年齡分組組距人數(shù)(人)標(biāo)準(zhǔn)組距人數(shù)次數(shù)密度15202025253030353545455055551051728407065101728407032.5103.45.68146.52合計(jì)230共九十三頁(yè)異距分組 (例題(lt)分析)共九十三頁(yè)異距分組 (例題(lt)分析)共九十三頁(yè)組限和組中值組限(class limit) :各組的上限界限值組下限(low limit) :一個(gè)組的最小值組上限(upper limit) :一個(gè)組的最大值閉口組:上限和下限都齊全(qqun

19、)的組開(kāi)口組:上限或下限有一個(gè)沒(méi)有的組共九十三頁(yè)組限的確定(qudng)組限確定有一個(gè)基本原則:即按這樣的組限分組后,標(biāo)志值在各組的變動(dòng)能反映事物的質(zhì)的變化。常用的組限表示方法:按連續(xù)變量分組,由于相鄰(xin ln)兩組的上限和下限常時(shí)同一數(shù)值,每組的界限會(huì)重疊,為避免計(jì)算各組次數(shù)時(shí)出現(xiàn)混亂,一般的原則是“上組限不在內(nèi),或下組限不在內(nèi)”。按離散變量分組,則相鄰的上限和現(xiàn)象通常是以兩個(gè)確定的不同整數(shù)值來(lái)表示,故相鄰兩組的上下限可以不重合。 共九十三頁(yè)等距分組表(上下(shngxi)組限重疊)共九十三頁(yè)等距分組表(上下(shngxi)組限間斷)共九十三頁(yè)等距分組表(使用(shyng)開(kāi)口組)共九

20、十三頁(yè)組中值(class midpoint) 組中值(class midpoint) :下限(xixin)與上限之間的中點(diǎn)值。下限值+上限值2組中值 =共九十三頁(yè)累計(jì)頻數(shù)(pn sh)分布共九十三頁(yè)累計(jì)頻數(shù)(pn sh)分布在頻數(shù)分布的基礎(chǔ)上將(shngjing)各組頻數(shù)逐一累計(jì),稱為頻數(shù)分布累計(jì)。向上累計(jì):從變量值最低組開(kāi)始向變量值高的組累計(jì),表明小與該組上限的頻數(shù)(頻率)一共有多少;向下累計(jì):從變量值最高組開(kāi)始向變量值低的組累計(jì),表明大與該組下限的頻數(shù)(頻率)一共有多少。特點(diǎn):同一數(shù)值的向上累計(jì)和向下累計(jì)次數(shù)之和等于總體總次數(shù)。 累計(jì)頻數(shù)分布圖:以變量值為橫坐標(biāo),累計(jì)頻數(shù)和頻率為縱坐標(biāo)。共

21、九十三頁(yè)累計(jì)頻數(shù)分布(fnb)(例題分析)141159166172177182188196203214143160167173177183189196203215144160168173178184189196205218149161168174178185189196206223150161168174178186190196207225152162170174179186190197208226153163171175179187191197209228153163171175179187192198210233154164172175180187194198210233155165172

22、175180187194200211234156165172176181188195201211234158165172176182188195202213237某電腦公司2002年前4個(gè)月的銷售量共九十三頁(yè)累計(jì)頻數(shù)分布(fnb)(例題分析)按銷售量分組(臺(tái))頻數(shù)(天)頻率(%)向上累積頻率(%)向下累積頻率(%)150以下43.333.33100.00 15016097.5010.8396.67 1601701613.3324.1789.171701802722.5046.6775.831801902016.6763.3355.331902001714.1777.5036.672002101

23、08.3385.8322.5021022086.6792.5014.1722023043.3395.837.50230以上54.17100.004.17合計(jì)120100100.00100.00共九十三頁(yè)累計(jì)(li j)頻數(shù)分布(例題分析)共九十三頁(yè)變量(binling)分布數(shù)列的圖示分組數(shù)據(jù)(shj)直方圖和折線圖共九十三頁(yè)分組數(shù)據(jù)(shj)直方圖(histogram)用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成(xngchng)了一個(gè)矩形,即直方圖直方圖下的總面積等于1共九十三頁(yè)分

24、組數(shù)據(jù)(shj)的圖示(直方圖的繪制)140150210直方圖下的面積之和等于1某電腦公司銷售量分布(fnb)的直方圖190200180160170頻數(shù)(天)25201510530220230240共九十三頁(yè)分組數(shù)據(jù)(shj)直方圖(直方圖與條形圖的區(qū)別)條形圖是用條形的長(zhǎng)度(橫置時(shí))表示(biosh)各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開(kāi)排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)共九十三頁(yè)分組數(shù)據(jù)(shj)折線

25、圖(frequency polygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線(zhxin)連接起來(lái),再把原來(lái)的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的共九十三頁(yè)分組數(shù)據(jù)(shj)的圖示(折線圖的繪制)折線圖與直方圖下的面積(min j)相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530共

26、九十三頁(yè)數(shù)值(shz)型數(shù)據(jù)的圖示未分組數(shù)據(jù)(shj)莖葉圖和箱線圖共九十三頁(yè)未分組數(shù)據(jù)(shj)莖葉圖(stem-and-leaf display)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖,低位數(shù)字作樹(shù)葉樹(shù)葉上只保留一位數(shù)字對(duì)于n(20 n 300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過(guò) L = 10 lg(n) 莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)(y )原始數(shù)值,保留了原始數(shù)據(jù)的信息共九十三頁(yè)未分組數(shù)據(jù)(shj)莖葉圖(例題分析)共九十三頁(yè)

27、未分組數(shù)據(jù)(shj)莖葉圖(擴(kuò)展的莖葉圖)共九十三頁(yè)未分組數(shù)據(jù)(shj)箱線圖(box plot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me 和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接(linji)兩個(gè)四分(位)數(shù)畫(huà)出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接(linji) 共九十三頁(yè)未分組數(shù)據(jù)(shj)單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡(jiǎn)單箱線圖共九十三頁(yè)未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(例題(lt)分析)最小值141最大值237中位數(shù)1

28、82下四分位數(shù)170.25上四分位數(shù)197140 150 160 170 180 190 200 210 220 230 240某電腦公司銷售量數(shù)據(jù)的箱線圖共九十三頁(yè)分布(fnb)的形狀與箱線圖 對(duì)稱分布QL中位數(shù) QU左偏分布QL中位數(shù) QU右偏分布QL 中位數(shù) QU不同(b tn)分布的箱線圖共九十三頁(yè)未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題(lt)分析)【例3.4】 從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門主要課程的考試成績(jī)進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績(jī)的批比較箱線圖,并分析(fnx)各科考試成績(jī)的分布特征11名學(xué)生各科的考試成績(jī)數(shù)據(jù)課程名稱學(xué)生編號(hào)1234567891

29、011英語(yǔ)經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場(chǎng)營(yíng)銷學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177共九十三頁(yè)未分組數(shù)據(jù)(shj)多批數(shù)據(jù)箱線圖(例題分析)8門課程考試成績(jī)的箱線圖共九十三頁(yè)11名學(xué)生(xu sheng)8門課程考試成績(jī)的箱線圖Min-Max25%-75%

30、Median value455565758595105學(xué)生(xu sheng)1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析)共九十三頁(yè)數(shù)值(shz)型數(shù)據(jù)的圖示時(shí)間(shjin)序列數(shù)據(jù)線圖共九十三頁(yè)時(shí)間(shjin)序列數(shù)據(jù)線圖(line plot) 繪制線圖時(shí)應(yīng)注意以下幾點(diǎn)時(shí)間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸圖形的長(zhǎng)寬比例要適當(dāng),其長(zhǎng)寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開(kāi)始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以(ky)采取折斷的符號(hào)將縱軸折斷共九十三頁(yè)時(shí)間序列數(shù)據(jù)(shj)線圖 (例題分析)【例3.5】已知

31、19912000年我國(guó)城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)(shj)如表。試?yán)L制線圖19912000年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.0708.6 784.0 921.61221.01577.71926.12091.12162.02210.32254.4共九十三頁(yè)時(shí)間序列數(shù)據(jù)(shj)線圖 (例題分析)共九十三頁(yè)數(shù)值(shz)型數(shù)據(jù)的圖示多變量數(shù)據(jù)(shj)雷達(dá)圖共九十三頁(yè)顯示多個(gè)變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時(shí)十分有用假定(jidng)各變量的取值具有相同的正負(fù)號(hào),總的絕對(duì)值與圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論