




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章統(tǒng)計(jì)整理【內(nèi)容提要】本章結(jié)合EXCEL的操作介紹了統(tǒng)計(jì)數(shù)據(jù)的整理過程。第一節(jié)介紹數(shù)據(jù)的預(yù)處理:審核、排序、篩選、分類匯總、數(shù)據(jù)透視表。第二節(jié)分別介紹分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)的整理與圖示方法。第三節(jié)介紹統(tǒng)計(jì)表的設(shè)計(jì)。1第一節(jié)數(shù)據(jù)預(yù)處理在對(duì)數(shù)據(jù)用圖表展示之前,需要對(duì)數(shù)據(jù)進(jìn)行初步的整理,即為數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理的內(nèi)容包括審核、排序、篩選、分類匯總、數(shù)據(jù)透視表等。2一、數(shù)據(jù)審核數(shù)據(jù)審核是指檢查數(shù)據(jù)是否滿足統(tǒng)計(jì)分析的要求。對(duì)于通過其他渠道收集的二手?jǐn)?shù)據(jù),主要是審核數(shù)據(jù)的適用性和時(shí)效性。對(duì)于通過調(diào)查取得的原始數(shù)據(jù)主要是判斷數(shù)據(jù)是否有錯(cuò)、是否完整,主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。3(一)完整性審核完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏,所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全等。在調(diào)查中由于受訪者未回答或是訪問員疏忽漏登調(diào)查項(xiàng)目造成數(shù)據(jù)不完整。如果在表格中,某一個(gè)數(shù)據(jù)采集時(shí)無法獲得,就會(huì)出現(xiàn)缺失值。缺失值是指在數(shù)據(jù)采集與整理過程中丟失的內(nèi)容。4根據(jù)插值的不同,有如下一些方法:1、隨機(jī)插值2、依概率插值3、就近插值4、分類插值缺失值處理插值方法5(二)準(zhǔn)確性審核準(zhǔn)確性審核是檢查數(shù)據(jù)是否有錯(cuò)誤,是否存在異常值(超過正常范圍的取值)。若發(fā)現(xiàn)存在異常值要進(jìn)行認(rèn)真鑒別,判斷異常數(shù)據(jù)的真假。通常從數(shù)據(jù)結(jié)構(gòu)是否符合常規(guī)邏輯判斷異常數(shù)據(jù)的存在,稱為邏輯校正。6二、排序按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問題的線索。排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)。7三、篩選數(shù)據(jù)篩選是根據(jù)需要將符合某種特定條件的數(shù)據(jù)篩選出來。在EXCEL中篩選分自動(dòng)篩選和高級(jí)篩選。8四、分類匯總分類匯總是按照要求分成不同的類別進(jìn)行統(tǒng)計(jì),可以按照一個(gè)分類變量分類統(tǒng)計(jì),也可以按兩個(gè)或多個(gè)變量分類統(tǒng)計(jì)。相應(yīng)的有一級(jí)分類匯總和二級(jí)分類匯總。9五、數(shù)據(jù)透視表數(shù)據(jù)透視表可以根據(jù)使用者的需要,方便地對(duì)數(shù)據(jù)進(jìn)行匯總和作圖,形成一張交叉表,并可實(shí)現(xiàn)查詢功能。10第二節(jié)數(shù)據(jù)的整理與展示數(shù)據(jù)經(jīng)過預(yù)處理之后,要經(jīng)過整理與展示。對(duì)于不同類型的數(shù)據(jù),所采取的處理方式和方法是不同的。從品質(zhì)數(shù)據(jù)(包括分類數(shù)據(jù)和順序數(shù)據(jù))到數(shù)值型數(shù)據(jù),數(shù)據(jù)由低級(jí)往高級(jí)方向發(fā)展。數(shù)據(jù)越高級(jí),適用的統(tǒng)計(jì)方法就越多。適用于低級(jí)數(shù)據(jù)的統(tǒng)計(jì)方法必然也適用與高級(jí)數(shù)據(jù),反之不成立。對(duì)品質(zhì)數(shù)據(jù)主要是做分類整理,對(duì)數(shù)值型數(shù)據(jù)主要是做分組整理。11一、數(shù)據(jù)的整理與展示在整理時(shí)除了要列出所分的類別外,還要計(jì)算出每一類別的頻數(shù)、頻率或比例、比率,同時(shí)選擇適當(dāng)?shù)膱D形進(jìn)行顯示,以便對(duì)數(shù)據(jù)及其特征有一個(gè)初步的了解。12(一)頻數(shù)與頻數(shù)分布1、頻數(shù)是指落在各類別中的數(shù)據(jù)個(gè)數(shù)。我們把各個(gè)類別及其相應(yīng)的頻數(shù)全部列出來就是頻數(shù)分布或稱次數(shù)分布。將頻數(shù)分布用表格的形式表現(xiàn)出來就是頻數(shù)分布表。13 (二)頻數(shù)分布表的制作在對(duì)分類數(shù)據(jù)整理時(shí),其中最要的一個(gè)環(huán)節(jié)是制作頻數(shù)分布表,把各個(gè)類別出現(xiàn)的頻數(shù)用表格形式表現(xiàn)出來。表3-7家電行業(yè)服務(wù)質(zhì)量評(píng)價(jià)等級(jí)頻數(shù)分布表評(píng)價(jià)等級(jí)頻數(shù)頻率A1414.00%B2121.00%C3232.00%D1818.00%E1515.00%合計(jì)100100.00%14(三)分類數(shù)據(jù)的圖示統(tǒng)計(jì)圖的類型有很多,多數(shù)統(tǒng)計(jì)圖除了可以繪制二維平面圖外,還可以繪制三維立體圖。圖形的制作均可由計(jì)算機(jī)來完成。這里首先介紹反映分類數(shù)據(jù)的圖示方法,其中包括條形圖(EXCEL中稱柱形圖)和餅圖。如果兩個(gè)總體或兩個(gè)樣本的分類相同且問題可比時(shí),還可以繪制圓環(huán)圖。151、條形圖條形圖是用寬度相同的條形的高度或長(zhǎng)短來表示數(shù)據(jù)變動(dòng)的圖形。條形圖可以橫置或縱置,縱置時(shí)也稱為柱形圖。條形圖有單式、復(fù)式等形式。16172、餅圖餅圖是用圓形及圓內(nèi)扇形的面積來表示數(shù)值大小的圖形,主要用于表示總體中各組成部分所占的比例,對(duì)于研究結(jié)構(gòu)性問題十分有用。在繪制餅圖時(shí),總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形面積表示,這些扇形的中心角度是按各部分百分比占360°的相應(yīng)比例確定的。例如評(píng)價(jià)等級(jí)為A占百分比為14%,那么其對(duì)應(yīng)的扇形的中心角度就應(yīng)為360°×14%=50.4°,其余類推。1819二、順序數(shù)據(jù)的數(shù)理與顯示前面介紹的分類數(shù)據(jù)的整理與顯示方法,如頻數(shù)、比例、百分比、比率、條形圖和圓形圖等,也都適用于對(duì)順序數(shù)據(jù)的整理與顯示。但有些方法適用于對(duì)順序數(shù)據(jù)的整理與顯示,卻不適用于分類數(shù)據(jù)。對(duì)于順序數(shù)據(jù),除了可使用上面的整理與顯示技術(shù)外,還可以計(jì)算累積頻數(shù)和累積頻率(百分比)。20(一)累積頻數(shù)和累積頻率1、累積頻數(shù)就是將各類別的頻數(shù)逐級(jí)累加起來。其方法有兩種:一是從類別順序的開始一方到類別順序的最后一方累加頻數(shù),稱為向上累積;二是從類別順序的最后一方到類別順序的開始一方累加頻數(shù),稱為向下累積。2、累積頻率或百分比是將各類別的百分比逐級(jí)累加起來,也有向上累積和向下累積兩種方法。211、累積頻數(shù)分布圖根據(jù)累積頻數(shù)或累積頻率,可以繪制累積頻數(shù)或頻率分布圖。22(a)向上累計(jì)累計(jì)戶數(shù)(戶)232、環(huán)形圖環(huán)形圖與圓形圖類似,但又有區(qū)別。環(huán)形圖中間有一個(gè)“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示。圓形圖只能顯示一個(gè)總體各部分所占的比例,而環(huán)形圖則可以同時(shí)繪制多個(gè)總體的數(shù)據(jù)系列,每一個(gè)總體的數(shù)據(jù)系列為一個(gè)環(huán)。因此環(huán)形圖可以顯示多個(gè)總體各部分所占的相應(yīng)比例,從而有利于進(jìn)行比較研究。2425三、數(shù)值型數(shù)據(jù)的整理與顯示以上所介紹的關(guān)于品質(zhì)數(shù)據(jù)(包括分類數(shù)據(jù)和順序數(shù)據(jù))的整理與圖示方法也適用于數(shù)值型數(shù)據(jù)。但數(shù)值型數(shù)據(jù)也有自身特有的整理與圖示方法。26(一)統(tǒng)計(jì)分組根據(jù)研究任務(wù)的要求和現(xiàn)象總體內(nèi)在的特點(diǎn),將統(tǒng)計(jì)總體按照一定的標(biāo)志劃分成若干組成部分。作用:p3927(二)分配數(shù)列將總體按某一標(biāo)志進(jìn)行分組,并按照一定順序排列出每個(gè)組的總體單位數(shù),這種數(shù)列稱為分配數(shù)列,也叫次數(shù)分布或次數(shù)分配。根據(jù)分組標(biāo)志的性質(zhì)不同可分為品質(zhì)數(shù)列與變量數(shù)列28以一個(gè)變量值代表一組。如:人口按年齡分組1歲一組,學(xué)生按報(bào)考科目分組等。這種分組適用于離散性變量,且變量值的個(gè)數(shù)較少的情況。以變量值變動(dòng)的一個(gè)區(qū)間作為一組,區(qū)間的距離稱為組距。適用于連續(xù)型變量和離散型變量的變量值較多的情況。單項(xiàng)式分組組距式分組29例如:家庭按兒童數(shù)分組企業(yè)按員工分組0300---4001400---5002500---60030等距分組各組組距均相等。如:10—20,20—30,30—40,等。組距為10。這種分組適用于均勻分布的總體。不等距分組各組組距不一定相等。如:10—20,20—50,50—60,60—70等。其中第二組與其它各組組距不同。這種分組適用于資料分布離差較大或特殊的研究目的。31分組方法等距分組異距分組單值式分組組距分組32全距就是全部數(shù)據(jù)中最大值與最小值之差。組限組限就是每一組兩端的數(shù)值。每一組的起點(diǎn)值稱為下限,每一組的終點(diǎn)值稱為上限。確定組限的方法有兩種:間斷式確定組限和重疊式確定組限。33按連續(xù)變量分組:相鄰兩組的上限和下限通常以一個(gè)數(shù)值來表示,(重疊式組限)為了避免計(jì)算總體單位分配數(shù)值的混亂,一般遵循“上組限不在內(nèi)”的原則。34按離散型變量分組:相鄰的兩組的上限與下限通常是以兩個(gè)確定的不同整數(shù)值來表示,故相鄰兩組的上下限不能重合。企業(yè)按工人數(shù)分組:100人一下,101-300人,301-500人,500人以上。35間斷式確定組限適用于離散變量:職工人數(shù)(人)99以下100—199200—299300—39936重疊式確定組限適用于連續(xù)變量:固定資產(chǎn)額(萬(wàn)元)50—6060—7070—80371、選擇分組標(biāo)志一批數(shù)據(jù)可以按不同的標(biāo)志進(jìn)行分組,選擇分組標(biāo)志要根據(jù)研究目的進(jìn)行。例如要研究受教育程度對(duì)收入的影響,則分組應(yīng)當(dāng)按學(xué)歷和月收入兩個(gè)標(biāo)志進(jìn)行,而沒有必要再使用身高、體重等標(biāo)志進(jìn)行分組。382、確定組數(shù)組數(shù)的確定主要受到研究目的影響,研究目的不同,對(duì)于分組的細(xì)化程度也會(huì)有所不同。組數(shù)的確定還受到樣本量的影響,樣本量較大時(shí),組數(shù)也可以更大一些,反之則組數(shù)應(yīng)當(dāng)小一些。若不確定分多少組,可以按Sturges提出的經(jīng)驗(yàn)公式來確定組數(shù)K:式中,n為數(shù)據(jù)的個(gè)數(shù)。393、確定組距組距是指每個(gè)組的范圍跨度。例如按年齡20-30歲分為一組,則該組的組距為10歲。各組的平均組距是受組數(shù)影響的,組數(shù)越多,組距越小,反之則越大。組距=(最大值-最小值)÷組數(shù)404、組限組限指組與組之間的界限,組限與組距是一對(duì)相互影響的關(guān)系,組距調(diào)整了,組限也就發(fā)生了變化,反之,組限一旦確定下來,組距也就確定了,組距等于組的上限與下限之差。415、組中值組中值是一個(gè)組中處于中間位置的值,往往用以代表一個(gè)組的平均狀況。對(duì)于缺上限或者缺下限的組,組中值的計(jì)算有幾種不同的情況(1)根據(jù)鄰近組組距推算42組中值的計(jì)算按工資分組組中值人數(shù)300元以下25010300—40035020400—60050025600元以上7001243(二)數(shù)值型數(shù)據(jù)的圖示在品質(zhì)數(shù)據(jù)的圖示中介紹的條形圖、餅圖、圓環(huán)圖及累積分布圖等都適用于顯示數(shù)值型數(shù)據(jù)。此外,對(duì)數(shù)值型數(shù)據(jù)還有其他圖示方法:莖葉圖、箱線圖、直方圖、折線圖、線圖、雷達(dá)圖、散點(diǎn)圖、氣泡圖等。441、莖葉圖莖葉圖用于展示未分組的數(shù)值型數(shù)據(jù),既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值。莖葉圖由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的。通過莖葉圖,可以看出數(shù)據(jù)的分布形狀及數(shù)據(jù)的離散狀況,比如,分布是否對(duì)稱,數(shù)據(jù)是否集中,是否極端值等等。45FrequencyStem&Leaf3.0014.1341.0014.95.0015.023344.0015.56898.0016.001123348.0016.5556788813.0017.011222223344414.0017.555566778889997.0018.001223413.0018.56677778889996.0019.00124411.0019.556666677885.0020.012335.0020.567896.0021.0011342.0021.581.0022.33.0022.5684.0023.33441.00Extremes(>=237)課本表3-10的銷售量數(shù)據(jù)利用SPSS作出的莖葉圖462、箱線圖箱線圖同莖葉圖一樣,也用于顯示未分組的原始數(shù)據(jù)的分布。它是由一組數(shù)據(jù)的5個(gè)特征值繪制而成,形狀類似一個(gè)箱子和兩條線段,因此得名。首先找出一組數(shù)據(jù)的5個(gè)特征值,也稱五數(shù)總括,即最大值、最小值、中位數(shù)和兩個(gè)四分位數(shù)(下四分位數(shù)和上四分位數(shù))。47483、直方圖直方圖用于顯示分組數(shù)據(jù)的分布情況,用矩形的寬度和高度來表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來表示各組的頻數(shù)分布。在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖。每一組的矩形面積與所有組的矩形面積總和的比值作為該組的頻率,所有組的頻率之和為1,因此直方圖下的總面積等于1(相對(duì)的面積)。49504、折線圖折線圖也稱頻數(shù)多邊形圖。在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(即組中值)用直線連續(xù)起來,再把原來的直方圖抹掉就是折線圖。需要注意,折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是將第一個(gè)矩形頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,51525、線圖統(tǒng)計(jì)繪圖中經(jīng)常使用線圖來展示隨時(shí)間推移而變化的一組數(shù)據(jù),即時(shí)間序列數(shù)據(jù)。在EXCEL中線圖稱指為折線圖,要注意不要和上述內(nèi)容中的統(tǒng)計(jì)意義上的折線圖混淆,它是在平面坐標(biāo)上用折線表現(xiàn)事物發(fā)展變化的規(guī)律和趨勢(shì)的統(tǒng)計(jì)圖。53546、雷達(dá)圖雷達(dá)圖是用于顯示多個(gè)變量的圖示方法,在對(duì)各變量進(jìn)行比較時(shí)十分有用。設(shè)有n組樣本S1,S2,…Sn,每個(gè)樣本測(cè)得P個(gè)變量X1,X2,Xp,要繪制這P個(gè)變量的雷達(dá)圖,其具體做法是:從平面中心O引出P條射線將平面分成P個(gè)相等的角;P條射線作為P條數(shù)軸,分別代表P個(gè)變量;連結(jié)各變量取值形成雷達(dá)圖。5556四、分布曲線數(shù)值型數(shù)據(jù)分組之后,以分組標(biāo)志為橫軸,次數(shù)或者頻率為縱軸,可以畫出次數(shù)分配的直方圖。將直方圖的頂端中點(diǎn)用折線連接,可以獲得次數(shù)分配的折線圖。折線圖的含義與直方圖是一致的,均反映不同組的次數(shù)分配情況,折線越高的地方,反映該組的次數(shù)越多,反之則越少。當(dāng)樣本量較大,組數(shù)較多、組距較小時(shí),折線圖會(huì)越來越平滑,直至成為一條曲線。這種曲線稱為頻數(shù)分布曲線。57(一)鐘形分布鐘形分布是社會(huì)經(jīng)濟(jì)現(xiàn)象中最常見的分布形式,具體表現(xiàn)為中間隆起,兩側(cè)逐漸降低。鐘形分布表明數(shù)據(jù)具有集中的趨勢(shì),大多數(shù)數(shù)據(jù)集中在中間,越往兩端,數(shù)據(jù)越少。在遠(yuǎn)離中心的位置,只有極少數(shù)的數(shù)據(jù)。鐘形分布的中間隆起部分稱為峰,兩側(cè)稱為尾。5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國(guó)冰棗烏龍茶數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 統(tǒng)編版二年級(jí)語(yǔ)文下冊(cè)期末達(dá)標(biāo)測(cè)試卷(全真練習(xí)二)(含答案)
- 北京市昌平區(qū)2024-2025學(xué)年高一上學(xué)期期末質(zhì)量抽測(cè)物理試卷(含答案)
- 規(guī)劃快題測(cè)試題及答案
- 高一英語(yǔ)衡水試題及答案
- 2022-2023學(xué)年廣東省廣州七中七年級(jí)(下)期中數(shù)學(xué)試卷(含答案)
- 2024甘肅省蘭州市中考英語(yǔ)真題【原卷版】
- 遺產(chǎn)繼承遺產(chǎn)轉(zhuǎn)讓合同(2篇)
- 采購(gòu)與分包責(zé)任清單合同(2篇)
- 2025年法律知識(shí)競(jìng)賽試題及答案
- 中國(guó)常見食物營(yíng)養(yǎng)成分表
- 光伏車棚方案
- 基于語(yǔ)文核心素養(yǎng)的初中語(yǔ)文綜合性學(xué)習(xí)教學(xué)策略研究
- 工藝部述職報(bào)告
- 廣東中考美術(shù)知識(shí)點(diǎn)
- 臨床科室科研用藥管理制度
- 多層光柵結(jié)構(gòu)的防偽技術(shù)研究
- 《國(guó)有企業(yè)采購(gòu)操作規(guī)范》【2023修訂版】
- 五年級(jí)語(yǔ)文下冊(cè)第五單元【教材解讀】-【單元先導(dǎo)課】
- DQ-廠房設(shè)施設(shè)計(jì)確認(rèn)方案
- 常用中藥飲片介紹PPT幻燈片
評(píng)論
0/150
提交評(píng)論