數(shù)據(jù)分析定義及實(shí)用技巧_第1頁
數(shù)據(jù)分析定義及實(shí)用技巧_第2頁
數(shù)據(jù)分析定義及實(shí)用技巧_第3頁
數(shù)據(jù)分析定義及實(shí)用技巧_第4頁
數(shù)據(jù)分析定義及實(shí)用技巧_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Excel實(shí)用技巧數(shù)據(jù)分析實(shí)例講解(簡(jiǎn)版)20XX-01張三這里可以輸入公司/團(tuán)隊(duì)名稱數(shù)據(jù)分析含義及方法Excel在數(shù)據(jù)分析中的應(yīng)用什么是數(shù)據(jù)分析?數(shù)據(jù)分析步驟明確目的數(shù)據(jù)收集數(shù)據(jù)處理數(shù)據(jù)分析方案輸出數(shù)據(jù)展現(xiàn)數(shù)據(jù)分析步驟詳解(一)明確目的數(shù)據(jù)收集數(shù)據(jù)處理數(shù)據(jù)處理是指對(duì)收集到的數(shù)據(jù)進(jìn)行加工整理,形成適合數(shù)據(jù)分析的樣式,它是數(shù)據(jù)分析前必不可少的階段。數(shù)據(jù)處理的基本目的是從大量的、雜亂無章、難以理解的數(shù)據(jù)中抽取并推導(dǎo)出對(duì)解決問題有價(jià)值、有意義的數(shù)據(jù)。數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)提取、數(shù)據(jù)計(jì)算等處理方法。數(shù)據(jù)收集是按照確定的數(shù)據(jù)分析內(nèi)容,收集相關(guān)數(shù)據(jù)的過程,它為數(shù)據(jù)分析提供了素材和依據(jù)。這里所說的數(shù)據(jù)包括第一手?jǐn)?shù)據(jù)與第二手?jǐn)?shù)據(jù),第一手?jǐn)?shù)據(jù)主要指可直接獲取的數(shù)據(jù),第二手?jǐn)?shù)據(jù)主要指經(jīng)過加工整理后得到的數(shù)據(jù)。一般數(shù)據(jù)來源主要有數(shù)據(jù)庫、公開出版物、互聯(lián)網(wǎng)和市場(chǎng)調(diào)查。在開展數(shù)據(jù)分析之前,需要想想為什么要開展數(shù)據(jù)分析?通過這次數(shù)據(jù)分析我要解決什么問題?只有明確數(shù)據(jù)分析的目的,才不會(huì)偏離方向,否則得出的數(shù)據(jù)分析結(jié)果不僅沒有指導(dǎo)意義,甚至可能將決策者引入歧途,后果嚴(yán)重。明確數(shù)據(jù)分析的目的和內(nèi)容是確保數(shù)據(jù)分析過程有效進(jìn)行的先決條件,它可以為數(shù)據(jù)收集、處理以及分析提供清晰的指引方向。數(shù)據(jù)分析步驟詳解(二)數(shù)據(jù)分析數(shù)據(jù)展現(xiàn)方案輸出數(shù)據(jù)分析報(bào)告其實(shí)是對(duì)整個(gè)數(shù)據(jù)分析過程的一個(gè)總結(jié)與呈現(xiàn),通過報(bào)告,把數(shù)據(jù)分析的起因、過程、結(jié)果及建議完整地呈現(xiàn)出來,以供決策者參考。一份好的數(shù)據(jù)分析報(bào)告,首先需要有一個(gè)好的分析框架,并且圖文并茂,層次明晰,能夠讓閱讀者一目了然。一般情況下,數(shù)據(jù)是通過表格和圖形的方式來呈現(xiàn)的,我們常說用圖表說話就是這個(gè)意思。常用的數(shù)據(jù)圖表包括餅圖、柱形圖、條形圖、折線圖、散點(diǎn)圖、雷達(dá)圖等,當(dāng)然可以對(duì)這些圖表進(jìn)一步整理加工,使之變?yōu)槲覀兯枰膱D形,例如金字塔圖、矩陣圖、漏斗圖、帕雷托圖等。由于數(shù)據(jù)分析多是通過軟件來完成的,這就要求數(shù)據(jù)分析師不僅要掌握各種數(shù)據(jù)分析方法,還要熟悉主流數(shù)據(jù)分析軟件的操作。一般的數(shù)據(jù)分析我們可以通過Excel完成,后面也將重點(diǎn)為你介紹,而高級(jí)的數(shù)據(jù)分析就要采用專業(yè)的分析軟件進(jìn)行,如數(shù)據(jù)分析工具SPSSStatistics等。絕對(duì)數(shù)與相對(duì)數(shù)頻數(shù)與頻率同比與環(huán)比百分比與百分點(diǎn)比例與比率幾個(gè)常用指標(biāo)及術(shù)語平均數(shù)

平均數(shù)

1.算術(shù)平均值我們?cè)谌粘I钪刑岬降钠骄鶖?shù),一般是指算術(shù)平均數(shù),就是一組數(shù)據(jù)的算術(shù)平均值,即全部數(shù)據(jù)累加后除以數(shù)據(jù)個(gè)數(shù)。算術(shù)平均數(shù)是非常重要的基礎(chǔ)性指標(biāo)。平均數(shù)是綜合指標(biāo),它的特點(diǎn)是將總體內(nèi)各單位的數(shù)量差異抽象化,代表總體的一般水平,掩蓋了總體內(nèi)各單位的差異。2.加權(quán)平均數(shù)加權(quán)平均數(shù)即將各數(shù)值乘以相應(yīng)的權(quán)數(shù),然后加總求和得到總體值,再除以總的單位數(shù)。加權(quán)平均值的大小不僅取決于總體中各單位的數(shù)值的大小,而且取決于各數(shù)值出現(xiàn)的次數(shù);舉例說明:平均數(shù)

5.標(biāo)準(zhǔn)差

是離均差平方的算術(shù)平均數(shù)的平方根,標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差能反映一個(gè)數(shù)據(jù)集的離散程度。平均數(shù)相同的兩組數(shù)據(jù),標(biāo)準(zhǔn)差未必相同。excel中計(jì)算公式

stdev.s;例如,A、B兩組各有6位學(xué)生參加同一次語文測(cè)驗(yàn),A組的分?jǐn)?shù)為95、85、75、65、55、45,B組的分?jǐn)?shù)為73、72、71、69、68、67。這兩組的平均數(shù)都是70,但A組的標(biāo)準(zhǔn)差約為17.08分,B組的標(biāo)準(zhǔn)差約為2.16分,說明A組學(xué)生之間的差距要比B組學(xué)生之間的差距大得多。3.幾何平均數(shù)一般用在金融領(lǐng)域,比如第一年的利率是5.4%,第二年是3.6%,第三年是6.3%求三年的平均利率是多少

計(jì)算公式工5.4%*3.6%*6.3%^3

在excel中用到的公式是geomean(),還會(huì)用到開幾次方公式是power(參數(shù),方次)或是^幾次方;

4.切尾平均數(shù)就是去掉最高分或是最底分時(shí)在excel中用到的公式trimmean(參數(shù),percent(百分比))絕對(duì)數(shù)與相對(duì)數(shù)

絕對(duì)數(shù)是反映客觀現(xiàn)象總體在一定時(shí)間、地點(diǎn)條件下的總規(guī)模、總水平的綜合性指標(biāo),也是數(shù)據(jù)分析中常用的指標(biāo),如GDP、總?cè)丝诘?。相?duì)數(shù)是指由兩個(gè)有聯(lián)系的指標(biāo)對(duì)比計(jì)算而得到的數(shù)值,它是用以反映客觀現(xiàn)象之間數(shù)量聯(lián)系程度的綜合指標(biāo)。計(jì)算相對(duì)數(shù)的基本公式是:相對(duì)數(shù)=比較數(shù)值(比數(shù))/基礎(chǔ)數(shù)值(基數(shù))百分比與百分點(diǎn)

百分比是相對(duì)數(shù)中的一種,它表示一個(gè)數(shù)是另一個(gè)數(shù)的百分之幾,也稱百分率或百分?jǐn)?shù)。百分比通常采用百分號(hào)(%)來表示,如8%,50%,168%等。百分點(diǎn)是指不同時(shí)期以百分?jǐn)?shù)的形式表示的相對(duì)指標(biāo)的變動(dòng)幅度,1個(gè)百分點(diǎn)=1%。表示構(gòu)成的變動(dòng)幅度不宜用百分?jǐn)?shù),而應(yīng)該用百分點(diǎn)。例如在講利潤(rùn)增加幅度時(shí)應(yīng)該說“公司今年的利潤(rùn)是45%,比去年的28%提高了17個(gè)百分點(diǎn)”。頻數(shù)與頻率頻數(shù)是指一組數(shù)據(jù)中個(gè)別數(shù)據(jù)重復(fù)出現(xiàn)的次數(shù)。如某校A班學(xué)生共50名同學(xué),按性別進(jìn)行分組,分為男與女兩個(gè)組別,男同學(xué)的頻數(shù)為30,女同學(xué)的頻數(shù)為20。頻率是每組類別次數(shù)與總次數(shù)的比值,它代表某類別在總體中出現(xiàn)的頻繁程度,一般采用百分?jǐn)?shù)表示,所有組的頻率加總等于100%。還是用某校A班的例子,30個(gè)男同學(xué)在50個(gè)同學(xué)中出現(xiàn)的頻率為60%,即(30÷50)X100%;而20個(gè)女同學(xué)在50個(gè)同學(xué)中出現(xiàn)的頻率為40%,即(20÷50)X100%,頻數(shù)與頻率示意圖比例與比率比例是指在總體中各部分的數(shù)值占全部數(shù)值的比重,通常反映總體的構(gòu)成和結(jié)構(gòu)。比如,A班共有學(xué)生50人,男生30人,女生20人,則男生的比例是30/50,女生的比例是20/50。由此可以看出,比例的基數(shù)(也就是分母)都是全體學(xué)生人數(shù),即為同一個(gè)基數(shù)。比率是指不同類別數(shù)值的對(duì)比,它反映的不是部分與整體之間的關(guān)系,而是一個(gè)整體中各部分之間的關(guān)系。比如剛才的例子,男生30人,女生20人,則男生與女生的比率是30/20,如圖所示。這一指標(biāo)經(jīng)常會(huì)用在社會(huì)經(jīng)濟(jì)領(lǐng)域,比如我國(guó)的人口性別比就是用每100名女性數(shù)量相對(duì)的男性數(shù)量來表示的。比例與比率示意圖同比與環(huán)比同比是指與歷史同時(shí)期進(jìn)行比較得到的數(shù)值,該指標(biāo)主要反映的是事物發(fā)展的相對(duì)情況。例如2017年12月與2016年12月相比,如圖左圖所示。環(huán)比是指與前一個(gè)統(tǒng)計(jì)期進(jìn)行比較得到的數(shù)值,該指標(biāo)主要反映的是事物逐期發(fā)展的情況。例如2017年12月與2017年11月相比,如圖右圖所示。同比與環(huán)比示意圖數(shù)據(jù)分析含義及方法Excel在數(shù)據(jù)分析中的應(yīng)用某APP用戶數(shù)據(jù)分析案例要求:分析一下每天每個(gè)注冊(cè)渠道新增用戶的行為分析目的:了解新增用戶的情況,以及推廣渠道的質(zhì)量數(shù)據(jù)收集:自建數(shù)據(jù)庫數(shù)據(jù)數(shù)據(jù)處理:運(yùn)用excel工具對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)提取、數(shù)據(jù)計(jì)算等數(shù)據(jù)分析:運(yùn)用excel的數(shù)據(jù)透視功能進(jìn)行分析數(shù)據(jù)展現(xiàn):運(yùn)用excel圖表功能進(jìn)行展現(xiàn)分析報(bào)告:運(yùn)用excel制作每日數(shù)據(jù)分析報(bào)告數(shù)據(jù)分析過程數(shù)據(jù)庫原始數(shù)據(jù)如下:用戶注冊(cè)表

用戶聊天記錄表

課程瀏覽表

話題瀏覽表

數(shù)據(jù)分析過程

分析方法:由于是一款在線教育APP,所以用戶都是學(xué)生,上面四張表記錄了這些用戶的基本資料,還有與老師聊天的信息,以及用戶進(jìn)入到APP中瀏覽課程與話題的行為數(shù)據(jù),這四張表之間的聯(lián)系就是用戶ID,用戶ID是識(shí)別用戶的唯一標(biāo)識(shí),利用這個(gè)特征,我們首先從用戶聊天記錄表得到每個(gè)用戶的聊天條數(shù),(注意:只要用戶說一句話,系統(tǒng)數(shù)據(jù)庫里面就會(huì)記錄一條信息),然后從課程瀏覽表與話題瀏覽表得到每個(gè)用戶有沒有去瀏覽課程或是話題用0,1來標(biāo)識(shí)。最后我們根據(jù)注冊(cè)用戶表,把用戶的聊天行為,瀏覽課程的行為,瀏覽話題的行為,利用excel中的Vlookup函數(shù)進(jìn)行整合,最終利用數(shù)據(jù)透視表進(jìn)行數(shù)據(jù)分析。最后利用excel做圖來展示數(shù)據(jù),形成數(shù)據(jù)報(bào)告。數(shù)據(jù)分析過程

1.注冊(cè)用戶信息表從注冊(cè)用戶信息表里面取得用戶ID,用戶注冊(cè)渠道兩項(xiàng)目數(shù)據(jù),如下圖所示:2.聊天記錄表從聊天記錄表里面取得用戶ID,用戶發(fā)言條數(shù)兩項(xiàng)目數(shù)據(jù),如下圖所示:3.課程與話題瀏覽表把這兩個(gè)表分別增加一列標(biāo)識(shí)列,這一列都填充數(shù)字1,如下圖所示:數(shù)據(jù)分析過程

把新形成的四個(gè)表利用vlookup函數(shù)整合到一張表上,具體如下:IFERROR函數(shù)

語法:IFERROR(value,value_if_error)

用法如果公式的計(jì)算結(jié)果為錯(cuò)誤,則返回指定的值;否則將返回公式的結(jié)果。使用IFERROR函數(shù)來捕獲和處理公式中的錯(cuò)誤。

Vlookup函數(shù)語法:vlookup(lookup_value,table_array,col_index_num,range_lookup)一個(gè)縱向查找函數(shù),在工作中都有廣泛應(yīng)用功能是按列查找,最終返回該列所需查詢列序所對(duì)應(yīng)的值;數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論