版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第三章統(tǒng)計數(shù)據(jù)的整理與顯示第一節(jié)數(shù)據(jù)的預(yù)處理第二節(jié)品質(zhì)數(shù)據(jù)的整理與顯示第三節(jié)變量數(shù)據(jù)的整理與顯示第四節(jié)統(tǒng)計表第一節(jié)數(shù)據(jù)的預(yù)處理1.數(shù)據(jù)的審核發(fā)現(xiàn)數(shù)據(jù)中的錯誤2.數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)3.數(shù)據(jù)排序發(fā)現(xiàn)數(shù)據(jù)的基本特征升序和降序數(shù)據(jù)審核—原始數(shù)據(jù)
(rawdata)審核的內(nèi)容1、完整性審核檢查應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標(biāo)是否填寫齊全2、準(zhǔn)確性審核檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際檢查數(shù)據(jù)是否有錯誤,計算是否正確等審核數(shù)據(jù)準(zhǔn)確性的方法1、邏輯檢查從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項目或數(shù)字之間有無相互矛盾的現(xiàn)象主要用于對分類和順序據(jù)的審核2、計算檢查檢查調(diào)查表中的各項數(shù)據(jù)在計算結(jié)果和計算方法上有無錯誤主要用于對數(shù)值型數(shù)據(jù)的審核二手?jǐn)?shù)據(jù)
適用性審核時效性審核數(shù)據(jù)篩選
(datafilter)數(shù)據(jù)篩選的內(nèi)容包括將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔下面舉例說明Excel進(jìn)行數(shù)據(jù)篩選的過程。表3-1
8名學(xué)生的考試成績數(shù)據(jù) 單位:分首先,選擇“數(shù)據(jù)”菜單,并選擇“自動篩選”命令。如圖3-1所示。圖3-1從“數(shù)據(jù)”菜單中選擇“篩選自動”
這時會在第一行(列標(biāo)題)出現(xiàn)下拉箭頭,用鼠標(biāo)點擊箭頭會出現(xiàn)如下結(jié)果,如圖3-2所示。圖3-2
圖3-3統(tǒng)計成績75分的學(xué)生圖3-4英語成績前三名的學(xué)生
圖3-5圖3-6數(shù)據(jù)排序
(datarank)1、按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索2、排序可借助于計算機(jī)完成統(tǒng)計分組
一、統(tǒng)計分組的概念
統(tǒng)計分組就是根據(jù)統(tǒng)計研究的需要,將統(tǒng)計總體按照一定的標(biāo)志區(qū)分為若干組成部分的一種統(tǒng)計方法。通過分組,可以劃分現(xiàn)象的類型、說明現(xiàn)象的內(nèi)部結(jié)構(gòu)、提示現(xiàn)象與現(xiàn)象之間的依存關(guān)系。二、統(tǒng)計分組的方法
按分組標(biāo)志性質(zhì)不同
1、按品質(zhì)標(biāo)志分組
2、按數(shù)量標(biāo)志分組按分組標(biāo)志個數(shù)不同
1、簡單分組
2、復(fù)合分組第二節(jié)品質(zhì)數(shù)據(jù)的整理與顯示
1.要弄清所面對的數(shù)據(jù)類型,因為不同類型的數(shù)據(jù),所采取的處理方式和方法是不同的
2.分類數(shù)據(jù)和順序數(shù)據(jù)稱為品質(zhì)數(shù)據(jù)
3.對分類數(shù)據(jù)和順序數(shù)據(jù)主要是做分類整理
一.分類數(shù)據(jù)的整理與顯示
分類數(shù)據(jù)的整理基本過程
用圖形顯示數(shù)據(jù)制作頻數(shù)分布表計算各類別的頻數(shù)列出各類別可計算的指標(biāo)頻數(shù)頻率落在各類別中的數(shù)據(jù)個數(shù)不同類別的頻數(shù)和總頻數(shù)的比值顧客購買飲料品牌的記錄下面通過一個具體的例子來說明如何使用Excel來制作定類數(shù)據(jù)的頻數(shù)分布。圖3-7從對話框“分析工具”列表中選擇“直方圖”第一步:在“工具”下拉菜單中單擊“數(shù)據(jù)分析”選項,從其對話框“分析工具”列表中選擇“直方圖”,回車打開其對話框(如圖3-7,圖3-8所示)。
圖3-8對話框的設(shè)置
頻數(shù)分布結(jié)果實例表3-1某城市居民關(guān)注廣告類型的頻數(shù)分布
廣告類型人數(shù)(人)頻率(%)商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告1125191610256.025.54.58.05.01.0分類數(shù)據(jù)的圖示—條形圖
(barChart)用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(columnchart)
柱形圖
條形圖
人數(shù)(人)5191610211204080120
商品廣告
服務(wù)廣告
金融廣告
房地產(chǎn)廣告
招生招聘廣告
其他廣告廣告類型
某城市居民關(guān)注不同類型廣告的人數(shù)分布對比條形圖
(side-by-sidebarchart)分類變量在不同時間或不同空間上有多個取值對比分類變量的取值在不同時間或不同空間上的差異或變化趨勢電腦品牌一季度二季度聯(lián)想256468IBM285397康柏247328戴爾563688對比條形圖
餅圖
(pieChart)也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題繪制圓形圖時,樣本或總體中各部分所占的百分比用圓內(nèi)的各個扇形角度表示,這些扇形的中心角度,按各部分?jǐn)?shù)據(jù)百分比乘以3600確定2.圓形圖(也稱餅圖)
其他廣告1.0%
房地產(chǎn)廣告8.0%
商品廣告56.0%
金融廣告4.5%
服務(wù)廣告25.5%
招生招聘廣告5.8%某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成餅圖
二.順序數(shù)據(jù)的整理與顯示
可計算的指標(biāo)1.累積頻數(shù):將各類別的頻數(shù)逐級累加2.累積頻率:將各類別的頻率(百分比)逐級累加【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?”
1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。
表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意2199786438
7.033.026.021.312.7
21120198262300
7.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————順序數(shù)據(jù)的圖示累計頻率分布圖243001322252700100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(shù)(戶)(b)向下累積環(huán)形圖
(doughnutchart)環(huán)形圖中間有一個“空洞”,樣本或總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示與餅圖類似,但又有區(qū)別餅圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個樣本或總體的數(shù)據(jù)系列,每一個樣本或總體的數(shù)據(jù)系列為一個環(huán)園環(huán)圖8%36%31%15%7%33%26%21%13%10%
非常不滿意
不滿意
一般
滿意
非常滿意
甲乙兩城市家庭對住房狀況的評價第三節(jié)變量數(shù)據(jù)的整理與顯示一.數(shù)據(jù)的分組二.次數(shù)分布的編制三.次數(shù)分布的圖形和類型一、統(tǒng)計分組
1、統(tǒng)計分組的概念:將總體按某一標(biāo)志劃分為若干性質(zhì)不同的部分稱統(tǒng)計分組。2、統(tǒng)計分組的作用:(1)劃分總體現(xiàn)象的類型。(2)研究總體現(xiàn)象的結(jié)構(gòu)和比例關(guān)系。(3)研究總體現(xiàn)象之間的依存關(guān)系。分組方法等距分組異距分組單變量值分組組距分組單變量值分組
(要點)1.將一個變量值作為一組2.適合于離散變量3.適合于變量值較少的情況組距分組
(要點)1、將變量值的一個區(qū)間作為一組2、適合于連續(xù)變量3、適合于變量值較多的情況4、需要遵循“不重不漏”的原則5、可采用等距分組,也可采用不等距分組~~~~~二、次數(shù)分布的編制在統(tǒng)計分組的基礎(chǔ)上,列出各組對應(yīng)的單位數(shù),形成總體單位數(shù)在各個組的分布,稱統(tǒng)計分布,又稱分配數(shù)列或次數(shù)分布。次數(shù)分布編制的步驟:變量值排序求出全距變量性質(zhì)變量值數(shù)目編制單項數(shù)列編制組距數(shù)列計數(shù)、合計設(shè)立組數(shù),確定組距制表組距分組
(步驟)1.確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,可以按Sturges
提出的經(jīng)驗公式來確定組數(shù)K確定組距:組距(ClassWidth)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即組距=(最大值-最小值)÷組數(shù)統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表組距分組
(幾個概念)1.下限(lowlimit)
:一個組的最小值2.上限(upperlimit)
:一個組的最大值3.組距(classwidth)
:上限與下限之差4.組中值(classmidpoint)
:下限與上限之間的中點值下限值+上限值2組中值=舉例:某班級入學(xué)年齡情況如下:21、18、21、19、19、20、19、19、17、20、19、18、21、17、18、19、18、20、20、17、19、20、21、22、18、18、19、19、19、19、19、19、20、19、20。年齡人數(shù)頻率(%)向下累計次數(shù)向上累計次數(shù)向下累計頻率向上累計頻率17181920212236147418.5717.1440.0020.0011.432.8635322612513923303435100.0091.4374.2534.2514.252.868.5725.7165.7185.7197.14100.00合計35100.00————————例如:某班級審計學(xué)考試成績情況如下:
86、61、77、69、90、85、81、81、91、80、80、83、83、91、80、80、63、72、82、73、79、71、78、82、85、82、72、87、74、84、81、68、63、78、70、74、76、89、76、94分?jǐn)?shù)人數(shù)頻率向下累計向上累計次數(shù)頻率次數(shù)頻率60-7070-8080-9090-10051318412.532.545.010.04035224100.087.555.010.0518364012.545.090.0100.0合計40100.0————————生產(chǎn)車間50名工人加工零件數(shù)
日產(chǎn)零件的頻數(shù)分布頻數(shù)分布表的編制
(例題分析)
【例】某電腦公司2002年前四個月各天的銷售量數(shù)據(jù)(單位:臺)。試對數(shù)據(jù)進(jìn)行分組等距分組表三.次數(shù)分布的圖形和類型直方圖:在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖頻數(shù)(人)1512963105110115120125130135140日加工零件數(shù)(個)直方圖下的面積之和等于1
某車間工人日加工零件數(shù)的直方圖折線圖:也稱頻數(shù)多邊形圖,是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉1512963105110115120125130135140日加工零件數(shù)(個)頻數(shù)(人)某車間工人日加工零件數(shù)的折線圖3、莖葉圖1、用于顯示未分組的原始數(shù)據(jù)的分布2、由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的3、以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉未分組數(shù)據(jù)—莖葉圖
(例題分析)未分組數(shù)據(jù)—箱線圖
(boxplot)1、用于顯示未分組的原始數(shù)據(jù)的分布2、箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成3、其繪制方法是:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me
和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖分布的形狀與箱線圖
對稱分布QL中位數(shù)
QU左偏分布QL中位數(shù)
QU右偏分布QL
中位數(shù)
QU不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】
從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場營銷學(xué)財務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)8門課程考試成績的箱線圖時間序列數(shù)據(jù)—線圖
(lineplot)繪制線圖時應(yīng)注意以下幾點1、時間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸2、圖形的長寬比例要適當(dāng),其長寬比例大致為10:73、一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷時間序列數(shù)據(jù)—線圖
(例題分析)【例】已知1991~2000年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線圖¥
$
1991~2000年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.0708.6784.0921.61221.01577.71926.12091.12162.02210.32254.4時間序列數(shù)據(jù)—線圖
(例題分析)顯示多個變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時十分有用假定各變量的取值具有相同的正負(fù)號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度多變量數(shù)據(jù)—雷達(dá)圖
(radarchart)多變量數(shù)據(jù)—雷達(dá)圖
(例題分析)【例】2000年我國城鄉(xiāng)居民家庭平均每人各項生活消費支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖。今天的主食是面包2000年城鄉(xiāng)居民家庭平均每人生活消費支出構(gòu)成(%)項目城鎮(zhèn)居民農(nóng)村居民
食品衣著家庭設(shè)備用品及服務(wù)醫(yī)療保健交通通訊娛樂教育文化服務(wù)居住雜項商品與服務(wù)39.1810.018.796.367.9012.5610.015.17
49.305.754.525.245.5811.1815.473.14多變量數(shù)據(jù)—雷達(dá)圖
(例題分析)頻數(shù)分布的類型對稱分布右偏分布左偏分布正J型分布反J型分布U型分布幾種常見的頻數(shù)分布四、統(tǒng)計表
1、統(tǒng)計表的概念、構(gòu)成
統(tǒng)計表是縱橫交叉的線條所繪制表現(xiàn)統(tǒng)計資料的一種表格形式。從形式上看,統(tǒng)計表是由總標(biāo)題,橫行標(biāo)題、縱欄標(biāo)題和指標(biāo)數(shù)值四部分組成;從內(nèi)容上看,統(tǒng)計表是由主詞和賓詞兩部分構(gòu)成。
1997~1998年城鎮(zhèn)居民家庭抽樣調(diào)查資料項目單位1997年
1998年
一、調(diào)查戶數(shù)二、平均每戶家庭人口數(shù)三、平均每戶就業(yè)人口
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人貴金屬交易融資合同范本民間版4篇
- 二零二五年度網(wǎng)絡(luò)安全股份公司成立股東數(shù)據(jù)安全協(xié)議3篇
- 2025版危險品運輸駕駛員勞動合同標(biāo)準(zhǔn)范本3篇
- 2025年高標(biāo)準(zhǔn)圍墻建設(shè)及維護(hù)服務(wù)合同細(xì)則3篇
- 二零二五年酒類企業(yè)產(chǎn)品追溯與防偽技術(shù)合作合同3篇
- 2024破樁勞務(wù)分包合同
- 2025年食堂承包合同補(bǔ)充協(xié)議強(qiáng)調(diào)食品安全與衛(wèi)生規(guī)范3篇
- 與物業(yè)公司合同范本(2024版)
- 鄭州科技學(xué)院《藝術(shù)考察與創(chuàng)新設(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年度戶外景觀門窗工程分包合同范本8篇
- 南通市2025屆高三第一次調(diào)研測試(一模)地理試卷(含答案 )
- 2025年上海市閔行區(qū)中考數(shù)學(xué)一模試卷
- IF鋼物理冶金原理與關(guān)鍵工藝技術(shù)1
- 銷售提成對賭協(xié)議書范本 3篇
- 勞務(wù)派遣招標(biāo)文件范本
- 信息安全意識培訓(xùn)課件
- Python試題庫(附參考答案)
- 碳排放管理員 (碳排放核查員) 理論知識考核要素細(xì)目表三級
- 2024年河北省中考數(shù)學(xué)試題(含答案解析)
- 小學(xué)二年級數(shù)學(xué)口算練習(xí)題1000道
- 納布啡在產(chǎn)科及分娩鎮(zhèn)痛的應(yīng)用
評論
0/150
提交評論