EXCEL數(shù)據(jù)分析工具_(dá)第1頁(yè)
EXCEL數(shù)據(jù)分析工具_(dá)第2頁(yè)
EXCEL數(shù)據(jù)分析工具_(dá)第3頁(yè)
EXCEL數(shù)據(jù)分析工具_(dá)第4頁(yè)
EXCEL數(shù)據(jù)分析工具_(dá)第5頁(yè)
已閱讀5頁(yè),還剩187頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.1

數(shù)據(jù)1.2 Excel基礎(chǔ)1.3 屬性數(shù)據(jù)分析1.4 數(shù)據(jù)展示圖1.5 數(shù)值型數(shù)據(jù)分析第1章數(shù)據(jù)和數(shù)據(jù)分析依據(jù)數(shù)據(jù)的屬性:數(shù)值型:123.1萬(wàn)元、23.5℃、4700點(diǎn)……連續(xù)型數(shù)據(jù):溫度變更,如23.5℃、……離散型數(shù)據(jù):5個(gè)籃板、120個(gè)集裝箱、……屬性型:用文字、推斷等表示的數(shù)據(jù)天氣-晴、陰、雨;股市-升、降;CPI-高、中、低;質(zhì)量-好、中、差,……屬性型數(shù)據(jù)都是離散的。1.1數(shù)據(jù)第1章數(shù)據(jù)和數(shù)據(jù)分析商務(wù)數(shù)據(jù)的分類依據(jù)數(shù)據(jù)的變更不隨狀態(tài)變更、相對(duì)穩(wěn)定的數(shù)據(jù)稱為靜態(tài)數(shù)據(jù)。隨狀態(tài)變更的數(shù)據(jù)稱為動(dòng)態(tài)數(shù)據(jù)。 項(xiàng)目數(shù)據(jù)數(shù)據(jù)性質(zhì)姓名王大明靜態(tài)性別男靜態(tài)出生年月1970年4月靜態(tài)年齡37歲動(dòng)態(tài)出生地北京靜態(tài)學(xué)歷本科靜態(tài)身高176厘米靜態(tài)體重73公斤動(dòng)態(tài)年收入13萬(wàn)元?jiǎng)討B(tài)1.1數(shù)據(jù)商務(wù)數(shù)據(jù)的分類時(shí)間序列數(shù)據(jù)截面數(shù)據(jù)年份199619971998199920002001200220032004農(nóng)村居民家庭56.355.153.452.649.147.746.245.647.2城鎮(zhèn)居民家庭48.846.644.742.139.438.237.737.137.71996年~2004年農(nóng)村與城鎮(zhèn)家庭恩格爾系數(shù)(食品支出占家庭總支出的百分比,單位:%)依據(jù)時(shí)間前后發(fā)生的數(shù)據(jù)稱為時(shí)間序列數(shù)據(jù)。1.1數(shù)據(jù)2002~2006年某市旅游接待與收入狀況年份20022003200420052006人次(萬(wàn))490229526565620人均消費(fèi)(元)135138140145202收入總量(億元)6.633.97.398.212.5按時(shí)間劃分序號(hào)地區(qū)2007年經(jīng)濟(jì)指標(biāo)GDP(億元)人口(萬(wàn)人)

占地面積(平方千米)

1漢中

291.21379.36272462商洛

135.8

238.45192923安康

189.85

265.2523539陜南2007年經(jīng)濟(jì)指標(biāo):同一時(shí)間段發(fā)生的數(shù)據(jù)稱為截面數(shù)據(jù)。1.1數(shù)據(jù)截面數(shù)據(jù)定類數(shù)據(jù)(Categorical/NominalData)由不同類別組成的數(shù)據(jù)稱為定類數(shù)據(jù)。各類數(shù)據(jù)的類型和單位一般都不相同。不同類的數(shù)據(jù)之間有些可以運(yùn)算,有些則不能運(yùn)算。戶總數(shù)(萬(wàn)戶)總?cè)丝跀?shù)(萬(wàn)人)男(萬(wàn)人)女(萬(wàn)人)全市204.52651.68332.62319.06市區(qū)120.56401.59204.43197.16桐廬縣14.3239.4420.119.34淳安縣14.6545.1623.3521.81建德市17.2150.8226.3724.45富陽(yáng)市20.262.7832.0530.73臨安市17.5951.8926.3125.571.1數(shù)據(jù)按相互關(guān)系劃分定序數(shù)據(jù)(OrdinalData)城市重慶德陽(yáng)綿陽(yáng)達(dá)縣雅安西昌環(huán)境評(píng)價(jià)值(無(wú)量綱)0.98830.17320.31720.78850.37130.6037評(píng)價(jià)等級(jí)三級(jí)一級(jí)二級(jí)三級(jí)二級(jí)二級(jí)僅表明對(duì)象的排列次序的數(shù)據(jù)稱為定序數(shù)據(jù),定序數(shù)據(jù)之間的差或比值一般沒(méi)有意義。1.1數(shù)據(jù)定距數(shù)據(jù)(IntervalData)數(shù)據(jù)沒(méi)有確定的零值,沒(méi)有倍數(shù)、比例關(guān)系,只有相互之間的差距有實(shí)際意義。2008年中國(guó)城市金融中心指數(shù)(引自“中國(guó)城市競(jìng)爭(zhēng)力報(bào)告”)城市國(guó)際金融產(chǎn)業(yè)集聚金融業(yè)人才規(guī)模綜合分上海北京深圳天津南京杭州…西安10.7470.2470.3030.1850.0280.00610.7340.470.3010.3740.1870.31510.9410.690.6410.4930.4920.3961.1數(shù)據(jù)定比數(shù)據(jù)(RatioData)

定比數(shù)據(jù)具有明確的零點(diǎn),可以計(jì)算數(shù)據(jù)的比例。例如2008年美國(guó)的GDP是中國(guó)的4.15倍。國(guó)家GDP(億美元)人均(美元)1美國(guó)139800462802日本52900414803中國(guó)3370025204德國(guó)32800397105英國(guó)25700424306法國(guó)25200412007意大利20900359808西班拿大136004147010俄羅斯1140080301.1數(shù)據(jù)依據(jù)數(shù)據(jù)的連續(xù)性離散數(shù)據(jù)數(shù)據(jù)是整數(shù)或者若干可能的結(jié)果之一。例如顧客投訴的次數(shù),產(chǎn)品中不合格的個(gè)數(shù),天氣是晴天、陰天或下雨。連續(xù)數(shù)據(jù)數(shù)據(jù)是連續(xù)變量。例如產(chǎn)品的成本、利潤(rùn)、交貨時(shí)間等。1.1數(shù)據(jù)數(shù)據(jù)按類型劃分?jǐn)?shù)值數(shù)據(jù)屬性數(shù)據(jù)按相互關(guān)系劃分時(shí)序數(shù)據(jù)截面數(shù)據(jù)定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)連續(xù)數(shù)據(jù)離散數(shù)據(jù)按時(shí)間劃分靜態(tài)數(shù)據(jù)動(dòng)態(tài)數(shù)據(jù)按變化劃分1.1數(shù)據(jù)EXCEL軟件簡(jiǎn)介MicrosoftExcel是一個(gè)功能強(qiáng)大、運(yùn)用靈敏便利的電子表格軟件,也是最為流行的辦公自動(dòng)化軟件,本課程主要利用EXCEL的統(tǒng)計(jì)分析功能和豐富的統(tǒng)計(jì)圖表。1.2Excel基礎(chǔ)工作表和單元格單元格的格式數(shù)據(jù)輸入方法條件格式工具數(shù)據(jù)分列工具1.2Excel基礎(chǔ)主要內(nèi)容工作表和單元格1.2Excel基礎(chǔ)默認(rèn)的Excel工作薄由三張工作表組成。最多可以包括255張工作表;最多可以輸入256列。工作表和單元格1.2Excel基礎(chǔ)單元格是Excel工作表的基本元素。單元格可分為數(shù)據(jù)單元格和公式單元格。數(shù)據(jù)單元格=SUM(B$8:B$11)=SUM(C$8:C$11)=SUM(D$8:D$11)=$B$5*B8+$C$5*C8+$D$5*D8=$B$5*B9+$C$5*C9+$D$5*D9=$B$5*B10+$C$5*C10+$D$5*D10=$B$5*B11+$C$5*C11+$D$5*D11=SUM(F8:F11)工作表和單元格1.2Excel基礎(chǔ)公式單元格例1.1:

單元格的格式Excel單元格有多種格式,包括:“常規(guī)、數(shù)值、貨幣、日期、時(shí)間、百分比、分?jǐn)?shù)、科學(xué)計(jì)數(shù)、文本、特殊、自定義”等11種格式。1.2Excel基礎(chǔ)選定須要定義格式的單元格,打開(kāi)Excel菜單:格式\單元格,彈出單元格格式對(duì)話窗口:其中,“常規(guī)”和“文本”兩種格式?jīng)]有格式選項(xiàng),其他格式都有不同的選項(xiàng)。例如“數(shù)值”格式有小數(shù)位數(shù)、是否選用千分位分隔符、負(fù)數(shù)的顯示方式等選項(xiàng)。1.2Excel基礎(chǔ)

單元格的格式日期格式:可以把日期系列數(shù)顯示為定義的日期格式。日期系列數(shù)是從1起先的整數(shù),數(shù)字1表示1900年1月1日,2表示1900年1月2日等等。1.2Excel基礎(chǔ)

單元格的格式日期系列數(shù)和日期格式的轉(zhuǎn)換如下圖所示:=A2=A3=A201.2Excel基礎(chǔ)

單元格的格式不同的時(shí)間格式如下:1.2Excel基礎(chǔ)

單元格的格式數(shù)據(jù)輸入是數(shù)據(jù)分析和建模的第一步,接受正確的數(shù)據(jù)輸入方法可以提高數(shù)據(jù)輸入的效率、削減數(shù)據(jù)輸入的錯(cuò)誤。數(shù)據(jù)輸入方法1.2Excel基礎(chǔ)Excel數(shù)據(jù)輸入的方法有:干脆鍵盤(pán)輸入用自定義格式輸入輸入序列用“有效性”工具輸入用條件函數(shù)IF輸入用字符提取函數(shù)RIGHT、LEFT、MID輸入用查找函數(shù)VLOOKUP輸入干脆鍵盤(pán)輸入鍵盤(pán)輸入是Excel數(shù)據(jù)輸入最基本、最常用的輸入方法。鍵盤(pán)輸入遇到的常見(jiàn)問(wèn)題有:數(shù)值格式輸入的數(shù)字最大為15位,多于15位的數(shù)字將自動(dòng)轉(zhuǎn)換成科學(xué)計(jì)數(shù)格式。例如,常規(guī)或數(shù)值格式的單元格中輸入18位身份證號(hào)碼按回車確認(rèn)后,顯示為:3.3106E+17。因此,假如須要輸入15位以上的數(shù)字,須要將單元格定義為文本格式,或者在常規(guī)或數(shù)值格式單元格中,先輸入撇號(hào)’,然后輸入數(shù)字。數(shù)據(jù)輸入方法自定義格式輸入假如某些單元格中輸入的數(shù)據(jù)有相同的字符,例如,誕生于20世紀(jì)、誕生地為杭州市的身份證號(hào)碼前8個(gè)字符“33010619”,可以將須要輸入身份證號(hào)碼的單元格定義為“自定義@格式”如下:“33010619”@。這樣,輸入身份證號(hào)碼時(shí),只須要輸入后面10個(gè)字符,即可完整顯示身份證號(hào)碼。數(shù)據(jù)輸入方法以上“自定義@格式”的對(duì)話窗口如下:

數(shù)據(jù)輸入方法用自定義格式@輸入后的效果如下圖。其中黃色的單元格是用”33010619”@自定義格式。數(shù)據(jù)輸入方法輸入序列1,2,3,4,…;一,二,三,四,…;A,B,C,D,…;甲,乙,丙,丁,…;子,丑,寅,卯,等都是序列。數(shù)字序列的輸入方法:輸入數(shù)字序列的前兩個(gè)數(shù)字,拖動(dòng)單元格右下十字鈕。或用Excel菜單“編輯\填充\序列…”工具生成數(shù)據(jù)序列。數(shù)據(jù)輸入方法1.2Excel基礎(chǔ)其他序列的方法:打開(kāi)Excel菜單“工具\(yùn)選項(xiàng)\自定義序列”;在對(duì)話框中輸入一個(gè)序列,單擊“添加”;定義序列以后,就可以用數(shù)字序列一樣的方法輸入。具體過(guò)程如下:Excel菜單:“工具\(yùn)選項(xiàng)\自定義系列”對(duì)話窗口如下:數(shù)據(jù)輸入方法序列可以在對(duì)話窗口中干脆輸入,單擊“添加”后生成。如下圖:數(shù)據(jù)輸入方法也可以事先在Excel表中輸入序列,然后在對(duì)話窗口中選用“從單元格中導(dǎo)入序列”,選定$A$1:$A$7,單擊“導(dǎo)入”生成序列。這種方法比較適合生成較長(zhǎng)的序列。數(shù)據(jù)輸入方法1.2Excel基礎(chǔ)自定義序列后,只要輸入序列第一個(gè)值,拖動(dòng)單元格右下十字鈕,就可以輸入整個(gè)序列。如圖:數(shù)據(jù)輸入方法用“有效性”工具輸入Excel有效性工具是數(shù)據(jù)輸入的常用方法,它可以提高輸入效率,削減輸入錯(cuò)誤。打開(kāi)Excel菜單:“數(shù)據(jù)\有效性”,出現(xiàn)以下“數(shù)據(jù)有效性”對(duì)話窗口。其中有四個(gè)卡片:“設(shè)置”、“輸入信息”、“出錯(cuò)警告”和“輸入法模式”。數(shù)據(jù)輸入方法其中,“設(shè)置”卡片用來(lái)設(shè)置數(shù)據(jù)的有效性范圍。例如,數(shù)值型數(shù)據(jù)可以設(shè)置最小值和最大值、字符型數(shù)據(jù)可以設(shè)置字符長(zhǎng)度等。一旦輸入的數(shù)據(jù)在有效范圍以外,將會(huì)出現(xiàn)出錯(cuò)警告。例如,職工“誕生年月”的值應(yīng)當(dāng)在1949年(60歲)到1991年(18歲)之間;手機(jī)號(hào)碼應(yīng)當(dāng)為11位,固話號(hào)碼應(yīng)當(dāng)為8位,等等。數(shù)據(jù)輸入方法假如輸入的數(shù)據(jù)是職工誕生年月,在“允許”下拉菜單中選定“日期”,輸入“起先日期”和“結(jié)束”日期:數(shù)據(jù)輸入方法假如輸入的數(shù)據(jù)是職工身份證號(hào)碼,在“允許”下拉中選定“文本長(zhǎng)度”,“數(shù)據(jù)”下拉選定“等于”,“長(zhǎng)度”輸入18.數(shù)據(jù)輸入方法“輸入信息”卡片用于用戶定制選定輸入單元格時(shí)出現(xiàn)的提示信息。例如,對(duì)于輸入身份證號(hào)碼的單元格,提示信息如下:數(shù)據(jù)輸入方法當(dāng)選定輸入單元格時(shí),出現(xiàn)提示信息的效果如下:數(shù)據(jù)輸入方法數(shù)據(jù)有效性工具還可以定制輸入出錯(cuò)警告。定制輸入職工誕生日期的“出錯(cuò)警告”如下圖:數(shù)據(jù)輸入方法定制輸入職工身份證號(hào)碼的“出錯(cuò)警告”如下圖:數(shù)據(jù)輸入方法輸入的身份證號(hào)碼不足18位時(shí)出現(xiàn)的錯(cuò)誤警告。數(shù)據(jù)輸入方法有效性工具中,可以建立輸入項(xiàng)目的下拉菜單,特殊適合輸入定制的項(xiàng)目。先選定單元格C2:C17,然后打開(kāi)“允許”下拉菜單,選定“序列”。數(shù)據(jù)輸入方法在“來(lái)源”中,輸入定制項(xiàng)目單元格范圍E2:E13,單擊確定。將光標(biāo)置于選定的C2:C17的每一個(gè)單元格,都將出現(xiàn)下拉箭頭。數(shù)據(jù)輸入方法選定下拉菜單中的院校名稱,就可以便利地輸入所選內(nèi)容。數(shù)據(jù)輸入方法假如出現(xiàn)的條件有兩個(gè)以上,可用嵌套的IF函數(shù)實(shí)現(xiàn)。例如:假如獎(jiǎng)金發(fā)放金額由考核等級(jí)確定:AB1考核等級(jí)獎(jiǎng)金額度2A20003B10004C0設(shè)考核等級(jí)單元格為A2,計(jì)算獎(jiǎng)金額度的函數(shù)為: IF(A2=“A”,2000,IF(A2=“B”,1000,0))IF函數(shù)嵌套的層數(shù)最多為7層。由于多層嵌套的IF函數(shù)構(gòu)造比較困難,簡(jiǎn)潔出錯(cuò)。多個(gè)條件的狀況,還是舉薦用函數(shù)VLOOKUP來(lái)實(shí)現(xiàn)。數(shù)據(jù)輸入方法用字符提取函數(shù)RIGHT、LEFT、MID輸入(選讀)很多數(shù)據(jù)包含不同的信息,例如18位身份證號(hào)碼中就包含了誕生地、誕生日期、性別等信息。身份證中不同位置的數(shù)字對(duì)應(yīng)的信息如下:123456789101112131415161718出生地出生日期序號(hào)出生省出生市年份月份日期性別出生縣要從身份證號(hào)碼中提取相應(yīng)的信息,就須要用以上三個(gè)函數(shù)。數(shù)據(jù)輸入方法123456789101112131415161718出生地出生日期序號(hào)出生省出生市年份月份日期性別出生縣設(shè)身份證號(hào)碼單元格為A2,提取誕生省份: LEFT(A2,2)*10000提取誕生市: MID(A2,3,2)*100提取誕生縣: MID(A2,3,4)提取誕生日期:MID(A2,7,4)&”-”&MID(A2,11,2)&”-”&MID(A2,13,2)提取序號(hào): RIGHT(A2,4)提取性別: MOD(MID(A2,17,1),2) 返回值1為男性,0為女性數(shù)據(jù)輸入方法用查找函數(shù)VLOOKUP輸入(選讀)在表格或數(shù)值數(shù)組的首列查找指定的數(shù)值,并由此返回表格或數(shù)組當(dāng)前行中指定列處的數(shù)值。VLOOKUP中的“V”代表垂直。VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)lookup_value

為須要在數(shù)組第一列中查找的數(shù)值。col_index_num

為table_array中待返回的匹配值的列序號(hào)。range_lookup

為一邏輯值,指明函數(shù)VLOOKUP返回時(shí)是精確匹配還是近似匹配。假如為T(mén)RUE(1)或省略,則返回近似匹配值,也就是說(shuō),假如找不到精確匹配值,則返回小于lookup_value的最大數(shù)值;假如range_value為FALSE(0),函數(shù)VLOOKUP將返回精確匹配值。table_array

為須要在其中查找數(shù)據(jù)的數(shù)據(jù)表。對(duì)于非精確匹配查找,table_array的第一列必需排序,對(duì)于精確匹配查找,則不必排序。數(shù)據(jù)輸入方法=VLOOKUP(B3,$G$2:$G$6,2,0)=VLOOKUP(B2,$G$2:$G$6,2,0)=VLOOKUP(B13,$G$2:$G$6,2,0)用VLOOKUP函數(shù)可以實(shí)現(xiàn)多個(gè)條件數(shù)據(jù)的查找和輸入。數(shù)據(jù)輸入方法

VLOOKUP在計(jì)算個(gè)人所得稅中的應(yīng)用=(B13-B14)*VLOOKUP(B13-B14,A2:E10,4,1)-VLOOKUP(B13-B14,A2:E10,5,1)數(shù)據(jù)輸入方法“條件格式”工具是將符合確定的條件的單元格的格式(邊框、底色、文本格式、文本顏色等)變更為用戶定制的形式。條件格式常用于突出顯示某些單元格的內(nèi)容,也可以用于美化Excel表格。例如,在依據(jù)考核等級(jí)評(píng)定獎(jiǎng)金的Excel表中,將考核等級(jí)為A用紅色表示。選定“考核等級(jí)”B2:B13,打開(kāi)Excel菜單:“格式\條件格式”:條件格式工具1.2Excel基礎(chǔ)在“條件1”下拉菜單中選擇“單元格數(shù)值”,中間下拉菜單選擇“等于”,右側(cè)下拉菜單輸入“A”。然后單擊“格式”,選定文本字體和顏色。單擊“確定”。條件格式工具1.2Excel基礎(chǔ)得到效果如下:條件格式工具1.2Excel基礎(chǔ)在“條件格式”對(duì)話窗口中單擊“添加”,可以增加其次個(gè)條件?!皸l件格式”最多可以有三個(gè)條件。條件格式工具1.2Excel基礎(chǔ)設(shè)置兩個(gè)條件的“條件格式”產(chǎn)生的效果如下圖:假如設(shè)置的多個(gè)條件是相互沖突的,不會(huì)出現(xiàn)任何提示,所定義的格式也不會(huì)起作用。條件格式工具1.2Excel基礎(chǔ)并不是全部的Excel的數(shù)據(jù)都須要用鍵盤(pán)輸入,很多數(shù)據(jù)來(lái)自網(wǎng)絡(luò)或其他信息系統(tǒng),Excel讀入這些數(shù)據(jù)后,往往須要依據(jù)數(shù)據(jù)不同的屬性,將這些數(shù)據(jù)分為不同的列。Excel菜單:“數(shù)據(jù)\分列”的數(shù)據(jù)分列工具就可以完成這一工作。Excel讀入的數(shù)據(jù)有三種狀況:字段之間有空格、逗號(hào)、制表符等分割符。字段沒(méi)有任何分隔符,但每個(gè)字段的長(zhǎng)度是確定的。字段之間既沒(méi)有分隔符,字段的長(zhǎng)度也各不相同。對(duì)于前兩種狀況,Excel分列工具可以便利地實(shí)現(xiàn)分列。第三種狀況則須要用戶分析數(shù)據(jù)的特點(diǎn),在字段之間插入分隔符,然后再實(shí)現(xiàn)數(shù)據(jù)分列。數(shù)據(jù)分列工具1.2Excel基礎(chǔ)工作表和單元格單元格的格式數(shù)據(jù)輸入方法條件格式工具數(shù)據(jù)分列工具從網(wǎng)上搜素并下載“身份證號(hào)碼和地址比照表”如下:這個(gè)表只有一列,其中包括身份證號(hào)的前六位和相應(yīng)的地址,兩個(gè)字段之間有空格分隔。須要把身份證號(hào)和地址分為兩列。數(shù)據(jù)分列工具1.2Excel基礎(chǔ)打開(kāi)Excel菜單:“數(shù)據(jù)\分列”,彈出“文本分列向?qū)А保x擇“分隔符號(hào)”,單擊“下一步”。數(shù)據(jù)分列工具在“分隔符號(hào)”中選定“空格”,預(yù)覽中出現(xiàn)分列的演示。單擊“下一步”。數(shù)據(jù)分列工具設(shè)置數(shù)據(jù)的類型為“常規(guī)”,單擊“完成”。數(shù)據(jù)分列工具這樣就完成了數(shù)據(jù)分列。數(shù)據(jù)分列工具留意到這個(gè)數(shù)據(jù)的第一個(gè)字段“身份證號(hào)”是六個(gè)字符,因此也可以用“固定寬度”分列。選定“固定寬度”,單擊“下一步”。數(shù)據(jù)分列工具用戶可以用“拖動(dòng)分列線”自定義列寬。單擊“下一步”。數(shù)據(jù)分列工具同樣可以完成分列。數(shù)據(jù)分列工具

實(shí)際應(yīng)用中,所要分析的對(duì)象(公司、政府部門(mén)、人等)通常具有多個(gè)不同的屬性,例如,部門(mén)、姓名、性別、年齡、職務(wù)、職稱、專業(yè)等。在數(shù)據(jù)統(tǒng)計(jì)表中,這些數(shù)據(jù)稱為“屬性數(shù)據(jù)”。1.3屬性數(shù)據(jù)分析序號(hào)姓名性別生日專業(yè)部門(mén)職務(wù)職稱學(xué)歷月薪1鄧賽鵬男1954年1月7日計(jì)算機(jī)控制研究室副所長(zhǎng)高級(jí)工程師碩士78002吳起杭男1964年11月9日通信通信研究室工程師本科57003曹平原男1977年11月27日通信通信研究室工程師本科37004馬良男1980年1月1日計(jì)算機(jī)控制研究室助理工程師本科31005顧琳英女1962年3月31日管理控制研究室工程師本科59006馬大暉男1968年12月16日計(jì)算機(jī)控制研究室工程師碩士51007孫曉斌男1974年4月24日管理光電研究室工程師本科43008車大明男1969年10月28日通信通信研究室工程師本科50009侯顯耀男1976年6月2日計(jì)算機(jī)圖形研究室工程師本科3900第1章數(shù)據(jù)和數(shù)據(jù)分析1.1

數(shù)據(jù)1.2 Excel基礎(chǔ)1.3 屬性數(shù)據(jù)分析1.4 數(shù)據(jù)展示圖1.5 數(shù)值型數(shù)據(jù)分析

實(shí)際應(yīng)用中,所要分析的對(duì)象(公司、政府部門(mén)、人等)通常具有多個(gè)不同的屬性,例如,部門(mén)、姓名、性別、年齡、職務(wù)、職稱、專業(yè)等。在數(shù)據(jù)統(tǒng)計(jì)表中,這些數(shù)據(jù)稱為“屬性數(shù)據(jù)”。1.3屬性數(shù)據(jù)分析運(yùn)用數(shù)據(jù)透視表可以對(duì)屬性數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。1.3.1數(shù)據(jù)透視表1.3.2單變量屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析1.3.4數(shù)據(jù)透視表在問(wèn)卷調(diào)查中的應(yīng)用

數(shù)據(jù)透視表是Excel中的功能強(qiáng)大的工具。運(yùn)用數(shù)據(jù)透視表可以對(duì)大量數(shù)據(jù)進(jìn)行快速匯總,創(chuàng)建相應(yīng)的多維統(tǒng)計(jì)表格。1.3屬性數(shù)據(jù)分析1.3.1數(shù)據(jù)透視表1.3屬性數(shù)據(jù)分析1.3.1數(shù)據(jù)透視表例如:創(chuàng)建匯總統(tǒng)計(jì)表格

1.3屬性數(shù)據(jù)分析

1.3.2單變量屬性數(shù)據(jù)分析用途:對(duì)性別、職稱、品牌等單列屬性數(shù)據(jù)進(jìn)行分布統(tǒng)計(jì)。序號(hào)姓名性別生日專業(yè)部門(mén)職務(wù)職稱學(xué)歷月薪1鄧賽鵬男1954年1月7日計(jì)算機(jī)控制研究室副所長(zhǎng)高級(jí)工程師碩士78002吳起杭男1964年11月9日通信通信研究室工程師本科57003曹平原男1977年11月27日通信通信研究室工程師本科37004馬良男1980年1月1日計(jì)算機(jī)控制研究室助理工程師本科31005顧琳英女1962年3月31日管理控制研究室工程師本科59006馬大暉男1968年12月16日計(jì)算機(jī)控制研究室工程師碩士51007孫曉斌男1974年4月24日管理光電研究室工程師本科43008車大明男1969年10月28日通信通信研究室工程師本科50009侯顯耀男1976年6月2日計(jì)算機(jī)圖形研究室工程師本科39001.分析該探討所“男、女職工”的人數(shù)。步驟:1.打開(kāi)“數(shù)據(jù)”菜單;2.選擇“數(shù)據(jù)透視表”,按下一步;3.選擇“布局”;4.單擊變量“性別”,拖到“行”區(qū)域中;5.單擊變量“性別”,拖到“數(shù)據(jù)”區(qū)域中;6.雙擊“求和項(xiàng)”,在“匯總方式”中選擇“計(jì)數(shù)”;7.單擊“確定”。1.3.2單變量屬性數(shù)據(jù)分析1.3屬性數(shù)據(jù)分析示例:對(duì)濟(jì)南市飯店業(yè)進(jìn)行前景調(diào)查,問(wèn)卷數(shù)據(jù)如下表所示。要求統(tǒng)計(jì)出業(yè)主類型的分類人數(shù)。1.3屬性數(shù)據(jù)分析1.3.2單變量屬性數(shù)據(jù)分析分析探討所的“職稱結(jié)構(gòu)”。序號(hào)姓名性別生日專業(yè)部門(mén)職務(wù)職稱學(xué)歷月薪1鄧賽鵬男1954年1月7日計(jì)算機(jī)控制研究室副所長(zhǎng)高級(jí)工程師碩士78002吳起杭男1964年11月9日通信通信研究室工程師本科57003曹平原男1977年11月27日通信通信研究室工程師本科37004馬良男1980年1月1日計(jì)算機(jī)控制研究室助理工程師本科31005顧琳英女1962年3月31日管理控制研究室工程師本科59006馬大暉男1968年12月16日計(jì)算機(jī)控制研究室工程師碩士51007孫曉斌男1974年4月24日管理光電研究室工程師本科43008車大明男1969年10月28日通信通信研究室工程師本科50009侯顯耀男1976年6月2日計(jì)算機(jī)圖形研究室工程師本科39001.3屬性數(shù)據(jù)分析例1.2,打開(kāi)教學(xué)光盤(pán)中的“探討所員工資料”:1.3.2單變量屬性數(shù)據(jù)分析序號(hào)姓名性別生日專業(yè)部門(mén)職務(wù)職稱學(xué)歷月薪1鄧賽鵬男1954年1月7日計(jì)算機(jī)控制研究室副所長(zhǎng)高級(jí)工程師碩士78002吳起杭男1964年11月9日通信通信研究室工程師本科57003曹平原男1977年11月27日通信通信研究室工程師本科37004馬良男1980年1月1日計(jì)算機(jī)控制研究室助理工程師本科31005顧琳英女1962年3月31日管理控制研究室工程師本科59006馬大暉男1968年12月16日計(jì)算機(jī)控制研究室工程師碩士51007孫曉斌男1974年4月24日管理光電研究室工程師本科43008車大明男1969年10月28日通信通信研究室工程師本科50009侯顯耀男1976年6月2日計(jì)算機(jī)圖形研究室工程師本科3900分析各部門(mén)中“男、女職工”的人數(shù)。序號(hào)姓名性別生日專業(yè)部門(mén)職務(wù)職稱學(xué)歷月薪1鄧賽鵬男1954年1月7日計(jì)算機(jī)控制研究室副所長(zhǎng)高級(jí)工程師碩士78002吳起杭男1964年11月9日通信通信研究室工程師本科57003曹平原男1977年11月27日通信通信研究室工程師本科37004馬良男1980年1月1日計(jì)算機(jī)控制研究室助理工程師本科31005顧琳英女1962年3月31日管理控制研究室工程師本科59006馬大暉男1968年12月16日計(jì)算機(jī)控制研究室工程師碩士51007孫曉斌男1974年4月24日管理光電研究室工程師本科43008車大明男1969年10月28日通信通信研究室工程師本科50009侯顯耀男1976年6月2日計(jì)算機(jī)圖形研究室工程師本科39001.3屬性數(shù)據(jù)分析例1.2,打開(kāi)教學(xué)光盤(pán)中的“探討所員工資料”:1.3.3雙變量屬性數(shù)據(jù)分析—兩維表格(列聯(lián)表)用途:對(duì)性別、職稱等屬性數(shù)據(jù)進(jìn)行相關(guān)關(guān)系描述。1.3.1數(shù)據(jù)透視表1.3.2單變量屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析1.3.4數(shù)據(jù)透視表在問(wèn)卷調(diào)查中的應(yīng)用序號(hào)姓名性別生日專業(yè)部門(mén)職務(wù)職稱學(xué)歷月薪1鄧賽鵬男1954年1月7日計(jì)算機(jī)控制研究室副所長(zhǎng)高級(jí)工程師碩士78002吳起杭男1964年11月9日通信通信研究室工程師本科57003曹平原男1977年11月27日通信通信研究室工程師本科37004馬良男1980年1月1日計(jì)算機(jī)控制研究室助理工程師本科31005顧琳英女1962年3月31日管理控制研究室工程師本科59006馬大暉男1968年12月16日計(jì)算機(jī)控制研究室工程師碩士51007孫曉斌男1974年4月24日管理光電研究室工程師本科43008車大明男1969年10月28日通信通信研究室工程師本科50009侯顯耀男1976年6月2日計(jì)算機(jī)圖形研究室工程師本科3900數(shù)據(jù)透視表期望結(jié)果:二維列聯(lián)表1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析—兩維表格(列聯(lián)表)步驟:1.打開(kāi)“數(shù)據(jù)”菜單;2.選擇“數(shù)據(jù)透視表”,按下一步;3.選擇“版式”;4.單擊變量“部門(mén)”,拖到“行”區(qū)域中;5.單擊變量“性別”,拖到“列”區(qū)域中;5.單擊變量“姓名”,拖到“數(shù)據(jù)”區(qū)域中;6.雙擊“求和項(xiàng)”,在“匯總方式”中選擇“計(jì)數(shù)”;7.單擊“確定”。打開(kāi)菜單:“數(shù)據(jù)>數(shù)據(jù)透視表和數(shù)據(jù)透視圖”1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析選擇圖表類型:選擇數(shù)據(jù)區(qū)域:1.3屬性數(shù)據(jù)分析確定數(shù)據(jù)透視表生成的位置:1.3屬性數(shù)據(jù)分析接著,選擇“布局”:1.3.3雙變量屬性數(shù)據(jù)分析分別將“部門(mén)”拉到行區(qū)域、“性別”拉到列區(qū)域、“姓名”拉到數(shù)據(jù)區(qū)域。1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析得到數(shù)據(jù)透視表:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析接著:?jiǎn)螕簟安块T(mén)”單元格的下拉菜單,可以選擇統(tǒng)計(jì)的范圍。例如,“部門(mén)”中不包括“辦公室”:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析得到不包括部門(mén)“辦公室”的人數(shù)統(tǒng)計(jì):1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析為什么拉到數(shù)據(jù)區(qū)域的是“姓名”,數(shù)據(jù)區(qū)域出現(xiàn)的數(shù)字是“人數(shù)”?右鍵單擊數(shù)據(jù)區(qū)域,出現(xiàn)右鍵菜單,選定“字段屬性”:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析可以看到默認(rèn)的字段屬性為“計(jì)數(shù)”,因此數(shù)據(jù)字段出現(xiàn)的數(shù)字是人數(shù)。1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析2.分析“部門(mén)、職稱、性別、學(xué)歷”平均工資。序號(hào)姓名性別生日專業(yè)部門(mén)職務(wù)職稱學(xué)歷月薪1鄧賽鵬男1954年1月7日計(jì)算機(jī)控制研究室副所長(zhǎng)高級(jí)工程師碩士78002吳起杭男1964年11月9日通信通信研究室工程師本科57003曹平原男1977年11月27日通信通信研究室工程師本科37004馬良男1980年1月1日計(jì)算機(jī)控制研究室助理工程師本科31005顧琳英女1962年3月31日管理控制研究室工程師本科59006馬大暉男1968年12月16日計(jì)算機(jī)控制研究室工程師碩士51007孫曉斌男1974年4月24日管理光電研究室工程師本科43008車大明男1969年10月28日通信通信研究室工程師本科50009侯顯耀男1976年6月2日計(jì)算機(jī)圖形研究室工程師本科39001.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成三維表格在二維列聯(lián)表上,把“學(xué)歷”拉到“性別”下面,就可以產(chǎn)生三維列聯(lián)表:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成三維表格1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成三維表格或者,在二維列聯(lián)表上,把“職稱”拉到“部門(mén)”右邊,也可以產(chǎn)生三維列聯(lián)表:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成三維表格或者,在二維列聯(lián)表上,把“職稱”拉到“部門(mén)”右邊,也可以產(chǎn)生三維列聯(lián)表:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成三維表格

把“職稱”拉到“部門(mén)”右邊,把“學(xué)歷”拉到“性別”下面,就可以產(chǎn)生四維列聯(lián)表:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成四維表格1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析——生成四維表格

把“職稱”拉到“部門(mén)”右邊,把“學(xué)歷”拉到“性別”下面,把“姓名”拖出數(shù)據(jù)透視表外,把“月薪”拉進(jìn)數(shù)據(jù)區(qū)域,就可以產(chǎn)生數(shù)據(jù)區(qū)域?yàn)椤霸滦健钡乃木S列聯(lián)表:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成四維表格,且數(shù)據(jù)區(qū)域?yàn)椤霸滦健?/p>

把“職稱”拉到“部門(mén)”右邊,把“學(xué)歷”拉到“性別”下面,把“月薪”拉到數(shù)據(jù)區(qū)域,就可以產(chǎn)生數(shù)據(jù)區(qū)域?yàn)椤霸滦健钡乃木S列聯(lián)表:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成四維表格,且數(shù)據(jù)區(qū)域?yàn)椤霸滦健庇益I單擊數(shù)據(jù)區(qū)域,選擇“字段設(shè)置”,將數(shù)據(jù)區(qū)域的屬性定義為“平均工資”,則數(shù)據(jù)區(qū)域的數(shù)字是“合計(jì)工資”。同樣的方法,也可以求“最高工資”、“最低工資”或“求和”。1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析

——生成四維表格,且數(shù)據(jù)區(qū)域?yàn)椤霸滦健彼木S列聯(lián)表如下:1.3屬性數(shù)據(jù)分析1.3.3雙變量屬性數(shù)據(jù)分析——生成四維表格,且數(shù)據(jù)區(qū)域?yàn)椤霸滦健?.4數(shù)據(jù)展示圖1.1

數(shù)據(jù)1.2 Excel基礎(chǔ)1.3 屬性數(shù)據(jù)分析1.4 數(shù)據(jù)展示圖1.5 數(shù)值型數(shù)據(jù)分析Excel數(shù)據(jù)展示圖形有13種。柱形圖垂直柱狀組成的圖形稱為柱形圖,水平條狀組成的圖形稱為條形圖。1.4數(shù)據(jù)展示圖年份第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)20011.541184.875003.3153020021.611735.298023.6074820031.692816.127413.9188020042.076817.238724.37206例1.7創(chuàng)建我國(guó)2001-2004年第一、其次和第三產(chǎn)業(yè)產(chǎn)值數(shù)量的變更的柱形圖。1.打開(kāi)Excel表,單擊“插入圖標(biāo)”工具圖標(biāo),選擇圖表類型-柱形圖和子圖標(biāo)類型,點(diǎn)擊“下一步”。用圖表和曲線圖展示數(shù)據(jù)1.4數(shù)據(jù)展示圖圖表向?qū)?.從“數(shù)據(jù)區(qū)域”選擇目標(biāo)數(shù)據(jù),用鼠標(biāo)選定B4:D8,單擊“系列”卡片,點(diǎn)擊“下一步”。用圖表和曲線圖展示數(shù)據(jù)1.4數(shù)據(jù)展示圖3.在“系列”中,選擇輸入系列名稱,用鼠標(biāo)選定“分類(X)軸標(biāo)記”A5:A8,單擊“下一步”用圖表和曲線圖展示數(shù)據(jù)1.4數(shù)據(jù)展示圖4.輸入或修改“標(biāo)題”、“坐標(biāo)軸”、“網(wǎng)格線”、“圖例”、“數(shù)據(jù)標(biāo)記”、“數(shù)據(jù)表”等屬性,單擊“下一步”。用圖表和曲線圖展示數(shù)據(jù)1.4數(shù)據(jù)展示圖5.選擇圖表位置,單擊“完成”。用圖表和曲線圖展示數(shù)據(jù)1.4數(shù)據(jù)展示圖6.圖表完成。假如須要,可以雙擊圖表中任何一部分進(jìn)行修改。用圖表和曲線圖展示數(shù)據(jù)圖表區(qū)分類軸分類軸標(biāo)題數(shù)值軸圖例圖表標(biāo)題系列“第一產(chǎn)業(yè)”繪圖區(qū)數(shù)值軸主要網(wǎng)格線數(shù)值軸標(biāo)題系列“其次產(chǎn)業(yè)”系列“第三產(chǎn)業(yè)”1.4數(shù)據(jù)展示圖條形圖的制作是類似柱形圖。垂直柱狀組成的圖形稱為柱形圖,水平條狀組成的圖形稱為條形圖。例1.8:我國(guó)2001-2004年三次產(chǎn)業(yè)的條形圖如下:條形圖1.4數(shù)據(jù)展示圖例1.92004年我國(guó)三類產(chǎn)業(yè)產(chǎn)值餅圖

——餅圖常用來(lái)表示一項(xiàng)數(shù)據(jù)中各部分的比例。1.4數(shù)據(jù)展示圖年份第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)20042.07687.23874.3721折線圖——常用來(lái)表示數(shù)據(jù)隨時(shí)間或項(xiàng)目不同的變更。年份總量煤炭石油天然氣水電19785714440400.8112971.691828.611942.9019806027543518.5512476.931868.532411.0019857668258124.9613112.621687.003757.4219899693473766.7716575.712035.614555.9019909870375211.6916384.702072.765033.85199110378378978.8617746.892075.664981.58199210917082641.6919104.752074.235349.33199311599386646.7721110.732203.876031.64199412273792052.7521356.242332.006996.01………………例1.101978年-2004年我國(guó)能源消費(fèi)總量及組成(單位:萬(wàn)噸標(biāo)煤)1.4數(shù)據(jù)展示圖試創(chuàng)建“1978-2004年中國(guó)能源消費(fèi).xls”中的“總量”、“煤炭”、“石油”、“自然氣”、“水電”消費(fèi)量的折線圖。1.4數(shù)據(jù)展示圖折線圖例1.11原油消費(fèi)量和自然氣消費(fèi)量的散點(diǎn)圖散點(diǎn)圖——用于表示兩個(gè)變量數(shù)值之間的相關(guān)關(guān)系。1.4數(shù)據(jù)展示圖例1.12有兩家企業(yè)A和B,它們的資產(chǎn)屬性評(píng)估結(jié)果如下表:收益性安全性流動(dòng)性成長(zhǎng)性生產(chǎn)性企業(yè)10.70.80.80.60.9企業(yè)20.90.60.40.50.7雷達(dá)圖——用來(lái)表示兩組變量相應(yīng)數(shù)值的比較。1.4數(shù)據(jù)展示圖例1.132004年10省市的GDP和人均GDP數(shù)據(jù)。氣泡圖——可以對(duì)一組數(shù)據(jù)的三個(gè)指標(biāo)進(jìn)行展示和比較。1.4數(shù)據(jù)展示圖序號(hào)地區(qū)GDP(億元)人均GDP(元/人)1廣東16039197072山江11243239425河南881594706河北8769129187上海7450553078遼寧6873162979湖北63101050010福建605317218例1.132004年10省市的GDP和人均GDP數(shù)據(jù)。1.4數(shù)據(jù)展示圖氣泡的高度表示GDP總量的大小,氣泡的大小表示人均GDP的凹凸。數(shù)值型數(shù)據(jù)分析的主要內(nèi)容,包括:1.5.1.數(shù)值型單變量數(shù)據(jù)分析1.5.2.數(shù)值型雙變量數(shù)據(jù)分析1.5數(shù)值型數(shù)據(jù)分析Excel中的數(shù)值型數(shù)據(jù)統(tǒng)計(jì)功能有以下二種實(shí)現(xiàn)方法運(yùn)用Excel菜單的數(shù)據(jù)分析工具運(yùn)用Excel統(tǒng)計(jì)函數(shù)1.1

數(shù)據(jù)1.2 Excel基礎(chǔ)1.3 屬性數(shù)據(jù)分析1.4 數(shù)據(jù)展示圖1.5 數(shù)值型數(shù)據(jù)分析1.5數(shù)值型數(shù)據(jù)分析1.5.1.數(shù)值型單變量數(shù)據(jù)分析例某班《DMD》考試成果如下:808576786793889075666577748381708364966079868071試用相關(guān)統(tǒng)計(jì)量對(duì)成果進(jìn)行分析。

Excel有3種分析工具用來(lái)描述數(shù)值型單變量數(shù)據(jù):1.描述性統(tǒng)計(jì)2.直方圖3.排位和百分比排位1.5.1.數(shù)值型單變量數(shù)據(jù)分析描述性統(tǒng)計(jì)(數(shù)據(jù)的分布屬性)數(shù)據(jù)的分布屬性包括數(shù)據(jù)的集中屬性、數(shù)據(jù)的分散屬性以及數(shù)據(jù)頻數(shù)的形態(tài)三大類:數(shù)據(jù)集中屬性的指標(biāo)均值 Average中位數(shù) Median眾數(shù) Mode

數(shù)據(jù)的分散屬性的指標(biāo)極差 Range方差 Variance標(biāo)準(zhǔn)差 StandardDeviation標(biāo)準(zhǔn)誤 StandardError

數(shù)據(jù)頻數(shù)的分布形態(tài)指標(biāo)偏度 Skewness峰度 Kurtosis1.5.1.數(shù)值型單變量數(shù)據(jù)分析描述性統(tǒng)計(jì)(數(shù)據(jù)的分布屬性)數(shù)據(jù)的分布屬性包括數(shù)據(jù)的集中屬性、數(shù)據(jù)的分散屬性以及數(shù)據(jù)頻數(shù)的形態(tài)三大類:數(shù)據(jù)集中屬性的指標(biāo)均值 Average中位數(shù) Median眾數(shù) Mode

數(shù)據(jù)的分散屬性的指標(biāo)極差 Range方差 Variance標(biāo)準(zhǔn)差 StandardDeviation標(biāo)準(zhǔn)誤 StandardError

數(shù)據(jù)頻數(shù)的分布形態(tài)指標(biāo)偏度 Skewness峰度 Kurtosis1.5.1.數(shù)值型單變量數(shù)據(jù)分析Excel中的值型單變量數(shù)據(jù)統(tǒng)計(jì)功能有以下三種實(shí)現(xiàn)方法1.描述性統(tǒng)計(jì)2.直方圖3.排位和百分比排位

步驟:1)打開(kāi)“工具”菜單;2)選擇“數(shù)據(jù)分析”;3)選擇“描述統(tǒng)計(jì)”;4)依據(jù)對(duì)話框,選擇或輸入相關(guān)數(shù)據(jù)。C:\MyDocuments\模擬成果.xls描述性統(tǒng)計(jì)(數(shù)據(jù)的分布屬性)1.5.1.數(shù)值型單變量數(shù)據(jù)分析步驟:?jiǎn)螕簟肮ぞ摺?“數(shù)據(jù)分析”:描述性統(tǒng)計(jì)(數(shù)據(jù)的分布屬性)例某班《DMD》考試成果統(tǒng)計(jì)。打開(kāi)Excel菜單:“工具>數(shù)據(jù)分析>描述統(tǒng)計(jì)”:選擇“描述統(tǒng)計(jì)”,單擊“確定”。描述性統(tǒng)計(jì)(數(shù)據(jù)的分布屬性)1.5.1.數(shù)值型單變量數(shù)據(jù)分析步驟:選擇“輸入?yún)^(qū)域”、“分組方式”,在“輸出選項(xiàng)”中選擇“新工作表組”和新工作表名稱,選定“匯總統(tǒng)計(jì)”。單擊“確定”。DMD描述性統(tǒng)計(jì)(數(shù)據(jù)的分布屬性)步驟:得到《DMD》考試成果的匯總統(tǒng)計(jì)結(jié)果:注:Excel2003中文版描述統(tǒng)計(jì)工具輸出結(jié)果中,“區(qū)域”是“Range”的誤譯,應(yīng)當(dāng)譯為“全距”。描述性統(tǒng)計(jì)(數(shù)據(jù)的分布屬性)算術(shù)平均數(shù)(Average)設(shè)總體包括N個(gè)視察值x1,x2,......,xN,則總體平均值(均值)μ為:設(shè)n個(gè)樣本為x1,x2,……,xn,樣本平均值(均值)為:描述性統(tǒng)計(jì)(數(shù)據(jù)的分布屬性)—有關(guān)指標(biāo)說(shuō)明1.5.1.數(shù)值型單變量數(shù)據(jù)分析=AVERAGE(B2:B24)一組數(shù)據(jù)按大小依次排列以后,處于中間位置的數(shù)據(jù)。對(duì)于奇數(shù)組,中位數(shù)是中間的一個(gè),對(duì)于偶數(shù)組,中位數(shù)是中間的兩個(gè)的平均值。中位數(shù)(Median)=MEDIAN(B2:B24)1.5.1.數(shù)值型單變量數(shù)據(jù)分析眾數(shù)是一組數(shù)據(jù)出現(xiàn)次數(shù)最多的數(shù)值。假如一組數(shù)據(jù)各不相同,則這組數(shù)據(jù)不存在眾數(shù).眾數(shù)(Mode)=MODE(B2:B24)1.5.1.數(shù)值型單變量數(shù)據(jù)分析全距是一組數(shù)據(jù)x1,x2,…,xn中最大值和最小值之差。即: max(x1,x2,…,xn)-min(x1,x2,…,xn)全距可以表示數(shù)據(jù)的離散程度,全距越大離散程度越大。全距只和數(shù)據(jù)中兩個(gè)數(shù)值有關(guān),簡(jiǎn)潔受到奇異數(shù)據(jù)的影響。

數(shù)據(jù)A的全距=18-11=7,數(shù)據(jù)B的全距=39-3=36,數(shù)據(jù)B的離散程度大于數(shù)據(jù)A。全距(Range)——離散屬性的測(cè)度1.5.1.數(shù)值型單變量數(shù)據(jù)分析方差分為總體方差和樣本方差。總體方差的計(jì)算公式為:其中xi為第i個(gè)數(shù)據(jù),N為總體數(shù)據(jù)的個(gè)數(shù),μ為總體平均數(shù)。方差是數(shù)據(jù)離散程度的指標(biāo),方差越大,離散程度越大。方差的單位是數(shù)據(jù)單位的平方。Excel計(jì)算總體方差的函數(shù)是VARP。方差(Variance)1.5.1.數(shù)值型單變量數(shù)據(jù)分析序號(hào)xixi-μ(xi-μ)2111-39213-113162441841651511613-11712-24μ14σ25.14序號(hào)xixi-μ(xi-μ)213-1112127-74931511439256255140065-98174-10100μ14σ2139.57方差(Variance)樣本方差的計(jì)算公式為由于實(shí)際處理的數(shù)據(jù)大多數(shù)都是樣本數(shù)據(jù),因此樣本方差應(yīng)用更多。Excel計(jì)算樣本方差的函數(shù)是VAR。1.5.1.數(shù)值型單變量數(shù)據(jù)分析標(biāo)準(zhǔn)差(Standarddeviation)標(biāo)準(zhǔn)差是方差的平方根。計(jì)算總體標(biāo)準(zhǔn)差的公式為:計(jì)算樣本標(biāo)準(zhǔn)差的公式為:標(biāo)準(zhǔn)差的單位和數(shù)據(jù)的單位相同,因此比方差更簡(jiǎn)潔理解,應(yīng)用也更多。1.5.1.數(shù)值型單變量數(shù)據(jù)分析在工業(yè)生產(chǎn)中,產(chǎn)品的指標(biāo)總會(huì)出現(xiàn)波動(dòng),一般會(huì)把產(chǎn)品指標(biāo)的變動(dòng)限制在指標(biāo)平均值加減3個(gè)標(biāo)準(zhǔn)差的范圍內(nèi),認(rèn)為這是生產(chǎn)正常的標(biāo)記。假如產(chǎn)品指標(biāo)波動(dòng)超出這個(gè)范圍,說(shuō)明生產(chǎn)系統(tǒng)不正常。標(biāo)準(zhǔn)差的重要性1.5.1.數(shù)值型單變量數(shù)據(jù)分析

在投資風(fēng)險(xiǎn)分析中,評(píng)價(jià)投資收益有兩個(gè)指標(biāo),一個(gè)是收益期望值(平均值),另一個(gè)是收益的標(biāo)準(zhǔn)差。投資收益的標(biāo)準(zhǔn)差表示投資風(fēng)險(xiǎn)的大小,標(biāo)準(zhǔn)差越大,風(fēng)險(xiǎn)越大。收益期望值收益標(biāo)準(zhǔn)差低收益低風(fēng)險(xiǎn)低收益高風(fēng)險(xiǎn)高收益低風(fēng)險(xiǎn)高收益高風(fēng)險(xiǎn)1.5.1.數(shù)值型單變量數(shù)據(jù)分析在經(jīng)濟(jì)領(lǐng)域中,標(biāo)準(zhǔn)差常用來(lái)反映將來(lái)數(shù)據(jù)的不確定性,有主要的理論和應(yīng)用價(jià)值。標(biāo)準(zhǔn)差是測(cè)定數(shù)據(jù)離散程度的標(biāo)記,但由于不同的數(shù)據(jù)數(shù)值大小不同,相同的離散程度,數(shù)值比較大的標(biāo)準(zhǔn)差也會(huì)比較大。以下是不同年齡組每周上網(wǎng)時(shí)間的統(tǒng)計(jì)數(shù)據(jù):

為了比較大小不同的幾組數(shù)據(jù)的離散程度,定義如下的變異系數(shù)(CoefficientofVariation):變異系數(shù)18歲以下18-24歲25-30歲31-40歲40歲以上均值6.58820.92220.29316.32415.281標(biāo)準(zhǔn)差2.3682.2212.8882.7803.658變異系數(shù)0.3590.1060.1420.1700.2391.5.1.數(shù)值型單變量數(shù)據(jù)分析正態(tài)CS=0.57左偏CS=0.92右偏CS=-0.27——偏態(tài)系數(shù)(CoefficientofSkewness)

-1-0.500.51近似對(duì)稱稍右偏稍左偏明顯右偏明顯左偏CS平均數(shù)=中位數(shù)=眾數(shù) 對(duì)稱分布平均數(shù)<中位數(shù)<眾數(shù) 右偏眾數(shù)<中位數(shù)<平均數(shù) 左偏分布形態(tài)的測(cè)度1.5.1.數(shù)值型單變量數(shù)據(jù)分析

Excel中有計(jì)算數(shù)據(jù)偏度的函數(shù)“=SKEW(數(shù)據(jù)范圍)”,Excel的偏度公式為:

有的文獻(xiàn)計(jì)算數(shù)據(jù)偏度還有其他的公式。例如SPSS計(jì)算偏度的公式為:1.5.1.數(shù)值型單變量數(shù)據(jù)分析分布形態(tài)的測(cè)度-峰態(tài)系數(shù)測(cè)定分布形態(tài)的峰態(tài)系數(shù)(CoefficientofKurtosis)CK<0扁平分布;CK>0尖峰分布CK=-1.13CK=18.241.5.1.數(shù)值型單變量數(shù)據(jù)分析

Excel中有計(jì)算數(shù)據(jù)峰度的函數(shù)KURT,Excel的偏度公式為:

有的文獻(xiàn)計(jì)算數(shù)據(jù)峰度度還有其他的公式。例如SPSS計(jì)算偏度的公式為:1.5.1.數(shù)值型單變量數(shù)據(jù)分析

Excel以上對(duì)數(shù)據(jù)的描述統(tǒng)計(jì)的每一項(xiàng)內(nèi)容,也可以單獨(dú)用相應(yīng)的Excel函數(shù)計(jì)算。這些函數(shù)是:均值 AVERAGE中位數(shù) MEDIAN眾數(shù) MODE標(biāo)準(zhǔn)差 STDEVP(總體) STDEV(樣本)方差 VARP (總體) VAR(樣本)偏度 SKEW峰度 KURT最大值 MAX最小值 MIN求和 SUM計(jì)數(shù) COUNT1.5.1.數(shù)值型單變量數(shù)據(jù)分析直方圖Excel中的數(shù)值型單變量數(shù)據(jù)統(tǒng)計(jì)功能有以下三種實(shí)現(xiàn)方法1.描述性統(tǒng)計(jì)2.直方圖3.排位和百分比排位該統(tǒng)計(jì)工具供應(yīng)一張頻數(shù)分布表和一張直方圖。步驟:1)確定直方圖的區(qū)間個(gè)數(shù),填入每個(gè)組界值;2)打開(kāi)“工具”菜單;3)選擇“數(shù)據(jù)分析”;4)選擇“直方圖”;5)在“直方圖”對(duì)話框中填入數(shù)據(jù)。C:\MyDocuments\模擬成果.xls1.5.1.數(shù)值型單變量數(shù)據(jù)分析例繪制“某班《DMD》考試成果”頻數(shù)直方圖。首先,計(jì)算《DMD》考試成果的最小值和最大值;其次,確定頻數(shù)統(tǒng)計(jì)的分布區(qū)間:直方圖Excel中的統(tǒng)計(jì)功能有以下三種實(shí)現(xiàn)方法1.描述性統(tǒng)計(jì)2.直方圖3.排位和百分比排位1.5.1.數(shù)值型單變量數(shù)據(jù)分析打開(kāi)菜單:工具>數(shù)據(jù)分析,出現(xiàn)以下窗口:選擇“直方圖”,單擊“確定”。Excel“工具>數(shù)據(jù)分析>直方圖”1.5.1.數(shù)值型單變量數(shù)據(jù)分析直方圖“輸入?yún)^(qū)域”為B2:B25,“接收區(qū)域”為G2:G7,“輸出區(qū)域”為I17,選定“圖表輸出”,單擊“確定”。1.5.1.數(shù)值型單變量數(shù)據(jù)分析直方圖Excel“工具>數(shù)據(jù)分析>直方圖>對(duì)話框”得到某班《DMD》考試成果的頻數(shù)和頻數(shù)直方圖:$J$21.5.1.數(shù)值型單變量數(shù)據(jù)分析直方圖即有:在指定位置I17生成發(fā)生頻數(shù)統(tǒng)計(jì)表和頻數(shù)直方圖:注:Excel2003中文版直方圖工具輸出結(jié)果中,frequency誤譯為“頻率”,在統(tǒng)計(jì)學(xué)中應(yīng)譯為“頻數(shù)”。1.5.1.數(shù)值型單變量數(shù)據(jù)分析直方圖書(shū)中例1.15:繪制“飲料全年日銷售量”頻數(shù)直方圖。首先,計(jì)算365天銷售量的最小值和最大值;其次,確定頻數(shù)統(tǒng)計(jì)的分布區(qū)間:直方圖Excel中的統(tǒng)計(jì)功能有以下三種實(shí)現(xiàn)方法1.描述性統(tǒng)計(jì)2.直方圖3.排位和百分比排位1.5.1.數(shù)值型單變量數(shù)據(jù)分析打開(kāi)菜單:工具>數(shù)據(jù)分析,出現(xiàn)以下窗口:選擇“直方圖”,單擊“確定”。Excel“工具>數(shù)據(jù)分析>直方圖”“輸入?yún)^(qū)域”為B2:B366,“接收區(qū)域”為H2:H15,“輸出區(qū)域”為J2,選定“累積百分率”和“圖表輸出”,單擊“確定”。得到飲料銷售量356個(gè)數(shù)據(jù)的頻數(shù)和頻數(shù)直方圖:$J$2直方圖即有:在指定位置J2生成發(fā)生頻數(shù)統(tǒng)計(jì)表和頻數(shù)直方圖:接收(箱)頻率(天)累積%13010.2714092.741504113.971606130.681704041.641803751.781902658.902003067.122103977.812203687.672302494.252401498.08250699.732601100.00其他0100.00合計(jì)365用Excel函數(shù)FREQUENCY生成數(shù)據(jù)頻數(shù)圖先用鼠標(biāo)選擇準(zhǔn)備好的頻數(shù)區(qū)域I2:I15,然后在函數(shù)欄中輸入函數(shù)“=FREQUENCY()”。從提示可以看出,這個(gè)函數(shù)有兩個(gè)參數(shù),第一個(gè)參數(shù)data_array為銷售量B2:B366,其次個(gè)參數(shù)bin_array為區(qū)間H2:H15。直方圖輸入完畢后,按組合鍵“CTRL+SHIFT+ENTER”,頻數(shù)就出現(xiàn)在I2:I15區(qū)域中。Excel有一些函數(shù),它們的輸出結(jié)果不是產(chǎn)生的一個(gè)單元格中,而是同時(shí)產(chǎn)生的一個(gè)區(qū)域中,這樣的函數(shù)稱為“向量函數(shù)”。FREQUENCY就是一個(gè)向量函數(shù)。用Excel函數(shù)FREQUENCY生成數(shù)據(jù)頻數(shù)圖直方圖

繪制I2:I15頻數(shù)柱形圖如圖1.54,得到和“工具>數(shù)據(jù)分析>直方圖”同樣的結(jié)果。用Excel函數(shù)FREQUENCY生成數(shù)據(jù)頻數(shù)圖直方圖該統(tǒng)計(jì)工具供應(yīng)一張含有升序排列的數(shù)據(jù)表格以及其排列后的序號(hào)、百分位號(hào)。步驟:1)打開(kāi)“工具”菜單;2)選擇“數(shù)據(jù)分析”;3)選擇“排位與百分比排位”。4)依據(jù)對(duì)話框,選擇或輸入相關(guān)數(shù)據(jù)。排位和百分比排位1.5.1.數(shù)值型單變量數(shù)據(jù)分析Excel中的統(tǒng)計(jì)功能有以下三種實(shí)現(xiàn)方法1.描述性統(tǒng)計(jì)2.直方圖3.排位和百分比排位排位和百分比排位1.5.1.數(shù)值型單變量數(shù)據(jù)分析Excel中的統(tǒng)計(jì)功能有以下三種實(shí)現(xiàn)方法1.描述性統(tǒng)計(jì)2.直方圖3.排位和百分比排位得到某班《DMD》考試成果的數(shù)據(jù)排序表格。1.5.2.數(shù)值型雙變量數(shù)據(jù)分析對(duì)兩組數(shù)值型數(shù)據(jù)分析它們之間的相關(guān)關(guān)系。有兩種分析工具。1.散點(diǎn)圖2.相關(guān)系數(shù)變量之間的因果關(guān)系固定資產(chǎn)投資增加和GDP增長(zhǎng)二氧化碳排放量和平均氣溫上升吸煙數(shù)量和年限與肺癌的發(fā)病率變量之間的相關(guān)關(guān)系變量之間的相關(guān)關(guān)系○海水平均溫度與災(zāi)難性天氣天數(shù)(厄爾尼諾現(xiàn)象)○公司高爾夫球水平與公司股票市場(chǎng)表現(xiàn)○超市啤酒銷售量和紙尿布銷售量1.5.2.數(shù)值型雙變量數(shù)據(jù)分析散點(diǎn)圖該統(tǒng)計(jì)工具用來(lái)描述兩個(gè)變量之間的關(guān)系。通常用在直觀推斷基本關(guān)系或用在回來(lái)模型運(yùn)用前。步驟:1)打開(kāi)Excel表,輸入變量X和Y的數(shù)值;2)選中數(shù)據(jù);3)單擊“圖表向?qū)А保?)選擇圖表類型-XY散點(diǎn)圖5)對(duì)散點(diǎn)圖進(jìn)行編輯。1.5.2.數(shù)值型雙變量數(shù)據(jù)分析有兩種分析工具描述數(shù)據(jù)之間的相關(guān)關(guān)系。1.散點(diǎn)圖2.相關(guān)系數(shù)例:某公司欲調(diào)查辦公樓的租金和空置率間的關(guān)系,工作人員在10個(gè)不同的城市里,對(duì)辦公樓中每平方米的月租金和空置率的數(shù)據(jù)記錄如下:試作散點(diǎn)圖,并推斷兩變量間的相關(guān)性。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.75散點(diǎn)圖散點(diǎn)圖相關(guān)系數(shù)用來(lái)說(shuō)明兩個(gè)變量之間的相關(guān)親密程度。步驟:1)打開(kāi)“工具”菜單;2)選擇“數(shù)據(jù)分析”;3)選擇“相關(guān)系數(shù)”。4)依據(jù)對(duì)話框,選擇或輸入相關(guān)數(shù)據(jù)。相關(guān)系數(shù)1.5.2.數(shù)值型雙變量數(shù)據(jù)分析有兩種分析工具描述數(shù)據(jù)之間的相關(guān)關(guān)系。1.散點(diǎn)圖2.相關(guān)系數(shù)選擇“相關(guān)系數(shù)”相關(guān)系數(shù)步驟:選擇變量范圍,“輸出選項(xiàng)”選擇“新工作表組”,單擊“確定”。步驟:相關(guān)系數(shù)城市12345678910空置率311659257108月租金52.54.754.534.5433.252.75相關(guān)系數(shù)相關(guān)系數(shù)的基本計(jì)算公式:兩個(gè)數(shù)列的協(xié)方差:自變量數(shù)列的標(biāo)準(zhǔn)差:因變量數(shù)列的標(biāo)準(zhǔn)差:

相關(guān)程度推斷標(biāo)準(zhǔn):1.當(dāng)R=±1時(shí),X與Y為線性相關(guān);2.當(dāng)│R│<0.3時(shí),X與Y為微弱相關(guān);3.當(dāng)0.3≤│R│<0.5時(shí),X與Y為低度相關(guān);4.當(dāng)0.5≤│R│<0.8時(shí),X與Y為顯著相關(guān);5.當(dāng)0.8≤│R│<1時(shí),X與Y為高度相關(guān)。R越接近1,變量的相關(guān)關(guān)系越明顯。相關(guān)系數(shù)5.1一元線性回來(lái)5.2多元線性回來(lái)5.3非線性回來(lái)第5章回來(lái)分析一、數(shù)據(jù)與統(tǒng)計(jì)第1章 數(shù)據(jù)和數(shù)據(jù)分析第5章 回來(lái)分析第6章 統(tǒng)計(jì)預(yù)料5.1一元線性回來(lái)回來(lái)分析是一種分析隨機(jī)變量之間相關(guān)關(guān)系的統(tǒng)計(jì)理論和統(tǒng)計(jì)方法,可以依據(jù)自變量的取值,預(yù)料相應(yīng)的因變量的取值。在工業(yè)、農(nóng)業(yè)、商業(yè)以及經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、醫(yī)學(xué)等領(lǐng)域有著特殊廣泛的應(yīng)用。一些變量之間存在相關(guān)關(guān)系。例如一個(gè)城市的空調(diào)產(chǎn)品的銷售量和夏季平均氣溫或冬季平均氣溫有相關(guān)關(guān)系,股票市場(chǎng)的價(jià)格和銀行存貸款利率水平有相關(guān)關(guān)系。假如能夠建立這些相關(guān)關(guān)系的數(shù)量表達(dá)式,就可以依據(jù)一個(gè)變量的值來(lái)預(yù)料另一個(gè)變量的變更。回來(lái)分析的目的就是構(gòu)建變量之間數(shù)量關(guān)系的模型。回來(lái)分析包括只有一個(gè)自變量的一元回來(lái)和包括多個(gè)自變量的多元回來(lái)。只有一個(gè)自變量的回來(lái)設(shè)自變量為x,因變量為y,它們之間的數(shù)量關(guān)系可以有以下幾種:5.1一元線性回來(lái)線性關(guān)系xy非線性關(guān)系xy無(wú)相關(guān)性xy單變量回來(lái)方程其中X是自變量,Y是因變量。β0-截

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論