




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第 3 章 數(shù)據(jù)的整理與展示,第 3 章 數(shù)據(jù)整理與顯示,3.1 數(shù)據(jù)的整理 3.2 數(shù)據(jù)的顯示 3.3 Excel的應用,學習目標,了解數(shù)據(jù)預處理的內(nèi)容和目的 掌握分類和順序數(shù)據(jù)的整理與顯示方法 掌握數(shù)值型數(shù)據(jù)的整理與顯示方法 會用Excel制作各種統(tǒng)計圖和統(tǒng)計表 合理使用統(tǒng)計表,3.1 數(shù)據(jù)的整理,數(shù)據(jù)整理的步驟 數(shù)據(jù)篩選與排序 數(shù)據(jù)整理過程,數(shù)據(jù)整理的步驟,設計數(shù)據(jù)整理方案 對統(tǒng)計資料進行審核、篩選與排序 分組或分類、計算和匯總 編制統(tǒng)計表、繪制統(tǒng)計圖,數(shù)據(jù)篩選與排序,數(shù)據(jù)篩選 (data filter),當數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補時,需要對數(shù)據(jù)
2、進行篩選 數(shù)據(jù)篩選的內(nèi)容 將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除 將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔除,用Excel進行數(shù)據(jù)篩選,8名學生的考試成績數(shù)據(jù),數(shù)據(jù)篩選 (data filter),步驟(自動篩選1),步驟(自動篩選2),步驟(自動篩選3),結果:篩選出的統(tǒng)計學成績?yōu)?5分的數(shù)據(jù),步驟(自動篩選4),在前10個數(shù)據(jù)中篩選出英語成績?yōu)榍叭?步驟(高級篩選1),篩選出4門課程成績都大于70分的學生,步驟(高級篩選2),步驟(高級篩選3),數(shù)據(jù)排序 (data rank),按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索 排序有
3、助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù) 在某些場合,排序本身就是分析的目的之一 排序可借助于計算機完成,數(shù)據(jù)排序 (方法),分類數(shù)據(jù)的排序 字母型數(shù)據(jù),排序有升序降序之分,但習慣上用升序 漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分 數(shù)值型數(shù)據(jù)的排序 遞增排序:設一組數(shù)據(jù)為x1,x2,xn,遞增排序后可表示為:x(1)x(2)x(n),例子,例子,例子,按行排序,數(shù)據(jù)整理過程,數(shù)據(jù)的整理 (基本問題),要弄清所面對的數(shù)據(jù)類型,因為不同類型的數(shù)據(jù),所采取的處理方式和方法是不同的 對分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理 對數(shù)值型數(shù)據(jù)則主要是作分組
4、整理 適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù),分類數(shù)據(jù)的整理與圖示,分類數(shù)據(jù)的整理 (基本過程),1. 列出各類別,3. 制作頻數(shù)分布表 4. 用圖形顯示數(shù)據(jù),分類數(shù)據(jù)的整理 (可計算的統(tǒng)計量),頻數(shù)(frequency) :落在各類別中的數(shù)據(jù)個數(shù) 比例(proportion) :某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值 百分比(percentage) :將對比的基數(shù)作為100而計算的比值 比率(ratio) :不同類別數(shù)值的比值,分類數(shù)據(jù)頻數(shù)分布表,順序數(shù)據(jù)的整理與圖示,順序數(shù)據(jù)的整理 (可計算的統(tǒng)計量),1. 累積頻數(shù)(cumul
5、ative frequencies):各類別頻數(shù)的逐級累加 2. 累積頻率(cumulative percentages):各類別頻率(百分比)的逐級累加,順序數(shù)據(jù)的頻數(shù)分布表 (例題分析),【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意? 1非常不滿意;2不滿意;3一般;4滿意;5非常滿意。,順序數(shù)據(jù)的頻數(shù)分布表 (例題分析),數(shù)據(jù)分組,數(shù)據(jù)分組的作用,區(qū)分事物的性質(zhì) 例:將我國企業(yè)進行分組,就可以有效地區(qū)分它們在所有制方面的區(qū)別 研究統(tǒng)計總體的類型和結構 例企業(yè)根據(jù)職工文化程度不同分組,以便根據(jù)不同文化層次分
6、期分批培訓 反映現(xiàn)象之間的依存關系,可以看出流通費用率與流轉額之 間存在著比較密切的相關關系,分組方法,分組方法,單變量值分組 (要點),1. 將一個變量值作為一組 2. 適合于離散變量 3. 適合于變量值較少的情況,例子,單變量值數(shù)據(jù)排序,單變量值分組頻數(shù)分布表,組距分組 (要點),將變量值的一個區(qū)間作為一組 適合于連續(xù)變量 適合于變量值較多的情況 需要遵循“不重不漏”的原則 可采用等距分組,也可采用不等距分組,組距分組 (步驟),確定組數(shù):組數(shù)的確定應以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,可以按 Sturges 提出的經(jīng)驗公式來確定組數(shù)K,確定組距:組距(Class Widt
7、h)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即 組距( 最大值 - 最小值) 組數(shù),統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表,組距分組 (幾個概念),1. 下限(low limit) :一個組的最小值 2. 上限(upper limit) :一個組的最大值 3. 組距(class width) :上限與下限之差 4. 組中值(class midpoint) :下限與上限之間的中點值,頻數(shù)分布表的編制 (例題分析),【例】某生產(chǎn)車間50名工人日加工零件數(shù)(單位:個)。試對數(shù)據(jù)進行分組。,頻數(shù)分布表的編制 (步驟),確定組數(shù):根據(jù) Sturges 提出的經(jīng)驗公式得組數(shù)
8、K為:,確定各組的組距: 組距( 139 - 107) 74.6 5,3. 用Excel制作頻數(shù)分布表,等距分組表 (上下組限重疊),等距分組表 (上下組限間斷),組距分組與不等距分組 (在表現(xiàn)頻數(shù)分布上的差異),等距分組 各組頻數(shù)的分布不受組距大小的影響 可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征 不等距分組 各組頻數(shù)的分布受組距大小不同的影響 各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實際狀況 需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實際狀況,頻數(shù)分布的類型,鐘型分布 (Bell-shaped distribution),特征是“兩頭小、中間大”,其分布曲線宛如一口古鐘 圖(a)被稱為正
9、態(tài)分布圖(b)和(c)被稱為偏態(tài)分布,其中,圖(b)為正偏態(tài)分布圖(c)為負偏態(tài)分布 許多社會經(jīng)濟和自然現(xiàn)象總體的頻數(shù)分布都趨向于正態(tài)分布,(a) (b) (c),U型分布 (U-shaped distribution),U型分布的形狀跟鐘型分布相反,靠近中間的變量值頻數(shù)少,靠近兩端的變量值頻數(shù)多,形成“兩頭大、中間小”的U字型 例如,人口死亡率分布就是這種分布;人口總體中,幼兒和老年人死亡率高,而中青年死亡率低,J型分布 (J-shaped distribution),J型分布有兩種類型,一種是正J型分布,即頻數(shù)隨著變量值的增大而增多,如圖3.1.15(a)所示;另一種是反J型分布,如圖3.
10、1.15(b)所示。 例如,經(jīng)濟學中供給曲線隨著價格的提高,供給量以更快速度增加,呈現(xiàn)出正J型;而需求曲線則表現(xiàn)為隨著價格的提高,需求量以較快的速度減少,呈現(xiàn)為反J型,(a) (b),數(shù)據(jù)顯示,統(tǒng)計表的結構,行標題,數(shù)字資料,附加,表頭,列標題,合理安排統(tǒng)計表的結構 數(shù)據(jù)計量單位相同時,可放在表的右上角標明,不同時應放在每個指標后或單列出一列標明 表中的上下兩條橫線一般用粗線,其他線用細線 通常情況下,統(tǒng)計表的左右兩邊不封口 表中的數(shù)據(jù)一般是右對齊,有小數(shù)點時應以小數(shù)點對齊,而且小數(shù)點的位數(shù)應統(tǒng)一 對于沒有數(shù)字的表格單元,一般用“”表示 必要時可在表的下方加上注釋,統(tǒng)計表的設計,統(tǒng)計表的設計
11、(比較與選用),統(tǒng)計表的設計 (比較與選用),統(tǒng)計表的設計 (比較與選用),分類數(shù)據(jù)的圖示條形圖 (bar Chart),用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形 有單式條形圖、復式條形圖等形式 主要用于反映分類數(shù)據(jù)的頻數(shù)分布 繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖,分類數(shù)據(jù)的圖示條形圖 (例題分析),圖3.2.1類別數(shù)據(jù)條形圖,圖3.2.2離散型變量次數(shù)分布條形圖,分組數(shù)據(jù)直方圖 (histogram),用矩形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用矩形的面積來表示各組的頻數(shù)分布 在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)
12、就形成了一個矩形,即直方圖 直方圖下的總面積等于1,分組數(shù)據(jù)的圖示 (直方圖的繪制),某生產(chǎn)車間50名工人日加工零件頻數(shù)分布直方圖,我一眼就看出來了,加工零件在120125之間的人數(shù)最多!,分組數(shù)據(jù)直方圖 (直方圖與條形圖的區(qū)別),條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的 直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義 直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列 條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù),分組數(shù)據(jù)折線圖 (frequency polygon),折線圖
13、也稱頻數(shù)多邊形圖 是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉 折線圖的兩個終點要與橫軸相交,具體的做法是 第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸 折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的,分組數(shù)據(jù)的圖示 (折線圖的繪制),折線圖與直方圖 下的面積相等!,某生產(chǎn)車間50名工人日加工零件頻數(shù)分布直方圖,分類數(shù)據(jù)的圖示餅圖 (pie Chart),也稱圓形圖,是用圓形及圓內(nèi)扇形的面積來表示數(shù)值大小的圖形 主要用于表示總體或樣本中各組成部分所占的比例,對于研究結
14、構性問題十分有用 繪制圓形圖時,總體中各部分所占的百分比用圓內(nèi)的各個扇形面積表示,這些扇形的中心角度,是按各部分數(shù)據(jù)百分比占3600的相應比例確定的,分類數(shù)據(jù)的圖示餅圖 (例題分析),環(huán)形圖 (annular chart),環(huán)形圖中間有一個“空洞”,總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示 環(huán)形圖與圓形圖類似,但又有區(qū)別 圓形圖只能顯示一個總體各部分所占的比例 環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán) 環(huán)形圖可用于結構比較研究 環(huán)形圖主要用于展示分類和順序數(shù)據(jù),環(huán)形圖 (例題分析),線圖,乙城市累積頻數(shù)分布圖,散點圖,數(shù)據(jù)類型及圖示 (小結),Excel 應用,建立統(tǒng)計
15、表,輸入數(shù)據(jù)。首先進入Excel,選定準備向其中輸入數(shù)據(jù)的單元格,然后將文字、數(shù)字、時間、日期或公式輸入到單元格中,然后單擊編輯欄中的“”或按Enter鍵、Tab鍵以及方向鍵予以確認 簡單計算。在整理資料時若需要計算,可先在單元格中輸入公式以便進行計算。公式可由數(shù)值、單元格、函數(shù)及運算符組成。輸入公式的標志是在選定的單元格內(nèi)先輸入一個“=”,然后輸入公式的具體內(nèi)容。,繪制統(tǒng)計圖,利用圖表指南工具制作圖表。單擊“圖表指南”工具,選擇“建立新圖表” 在該對話框中選擇所要創(chuàng)建的圖表類型,再選擇圖表格式,并通過對話框提供的各個選項設定圖例、圖表標題、軸標題等細節(jié)。最終確定后單擊“完成”按鈕 利用圖表工
16、具欄制圖。具體做法是:在“視圖”菜單中選擇“工具”項,從中選擇“圖表”,出現(xiàn)圖表工具欄。此時,先在工作表中選擇區(qū)域,然后根據(jù)具體需要在圖表工具欄中選擇“圖表類型”,數(shù)據(jù)處理,進行分類匯總和合并計算等復雜的數(shù)據(jù)處理工作 實現(xiàn)資料內(nèi)容的增加、修改、刪除與查找 對數(shù)據(jù)進行排序 可以為各類數(shù)據(jù)的一些數(shù)據(jù)項進行統(tǒng)計匯總,例如,求和 利用“合并計算”可以將一個或多個工作簿中若干張結構相同的表進行表間的匯總,建立數(shù)據(jù)透視表,某 單 位 部 分 人 事 統(tǒng) 計 表,畫K線圖 (舉例說明),操作步驟: 1、點擊圖表向?qū)Вx擇股價圖以及子股價圖:成交量開盤盤高盤低收盤圖,如圖3.4.14所示。 2、點擊下一步,進入圖表向?qū)Р襟E2,輸入數(shù)據(jù)區(qū)域。 3、點擊下一步,進入圖表向?qū)Р襟E3圖表選項。點擊標題,在圖表標題欄內(nèi)輸入“K線圖”,在數(shù)值(Y)軸欄內(nèi)輸入“成交量”,在次數(shù)值(Y)軸欄內(nèi)輸入“股價”;點擊坐標軸,將主坐標軸的分類(X)軸選為分類;點擊圖例,去掉顯示圖例,點擊完成。 4、修飾草圖。雙擊主數(shù)值軸,在坐標軸格式對話框中,單擊刻度,將最大值設置為 “20000000”,并把顯示單位選擇成“百萬”,點擊完成;雙擊次主數(shù)值軸,在坐標軸格式對話框中,單擊數(shù)字,將小數(shù)位數(shù)設置為 “0”,點擊完成;雙擊分類軸,在坐標軸格式對話框中,單擊字體,將字號設置為 “8”,點擊完成。,5、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆四川省眉山一中辦學共同體化學高一下期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 供電公司外委管理辦法
- 虛擬展覽技術-洞察及研究
- DeepSeek與區(qū)塊鏈技術推動大灣區(qū)港群一體化發(fā)展
- 智慧教室材料管理辦法
- 養(yǎng)蜂管理辦法(試行)
- 村級資金使用管理辦法
- 公司內(nèi)部招待管理辦法
- 農(nóng)村便利設施管理辦法
- 探究《水滸傳》精彩章節(jié)
- 毀林毀草違規(guī)行為集中整治實施方案
- 日本2025年食品過敏原培訓
- 中新天津生態(tài)城教育系統(tǒng)招聘教職人員筆試真題2024
- GB/T 45817-2025消費品質(zhì)量分級陶瓷磚
- DB37∕T 5302-2024 既有城市橋梁現(xiàn)場檢測及承載能力評估技術標準
- 安徽省池州市貴池區(qū)2024-2025學年八年級下學期數(shù)學期末檢測試卷(含答案)
- 正畸接診標準化流程
- 中心靜脈壓(CVP)監(jiān)測與護理
- 酒店前臺接待禮儀與溝通技巧練習題
- 床上用品采購 投標方案
- 口腔工藝管理課件
評論
0/150
提交評論