如何能利用excel做大數(shù)據(jù)分析報告(上下)_第1頁
如何能利用excel做大數(shù)據(jù)分析報告(上下)_第2頁
如何能利用excel做大數(shù)據(jù)分析報告(上下)_第3頁
如何能利用excel做大數(shù)據(jù)分析報告(上下)_第4頁
如何能利用excel做大數(shù)據(jù)分析報告(上下)_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、實用文檔網(wǎng)站分析中專業(yè)的工具除了GoogleAnalytics,AdobeSitecatalyst,Webtrends,騰訊分析和百度統(tǒng)計等外,我想最常用的數(shù)據(jù)處理工具就是Excel了,Excel里頭最基礎(chǔ)的就是運算和圖表的制作,稍微高級一點就是函數(shù)和數(shù)據(jù)透視表的使用了,當然你可能還會想到VBA和宏,但估計很少高手會使用這些高級的功能。那對于高級的數(shù)據(jù)分析而言,也就是涉及統(tǒng)計學(xué)的專業(yè)分析方法和原理的時候,是不是就一定得求助于SPSS,SAS這類專業(yè)的分析工具呢?數(shù)據(jù)分析從低級到高級層次的跳躍過程中有沒有可以起承接作用的工具呢?其實是有的,這就是Excel的數(shù)據(jù)分析功能。貌似最近比較火的兩本Ex

2、cel書籍誰說菜鳥不會數(shù)據(jù)分析和讓Excel飛都沒有涉及這部分的內(nèi)容。高級的數(shù)據(jù)分析會涉及回歸分析、方差分析和T檢驗等方法,不要看這些內(nèi)容貌似跟日常工作毫無關(guān)系,其實往高處走,MBA的課程也是包含這些內(nèi)容的,所以早學(xué)晚學(xué)都得學(xué),干脆就提前了解吧,請查看以下內(nèi)容。在使用之前,首先得安裝Excel的數(shù)據(jù)分析功能,默認情況下,Excel是沒有安裝這個擴展功能的,安裝如下所示:1)鼠標懸浮在Office按鈕上,然后點擊【Excel選項】:2)找到【加載項】,在管理板塊選擇【Excel加載項】,然后點擊【轉(zhuǎn)到】:Excel遠頃.曾IfcEMT取消瀏覽型規(guī)劃求胡加載項歐元工具條件求和向?qū)nternetA

3、-siVB丸標簽打印向?qū)Р殚喯驅(qū)?)選擇【分析工具庫】,點擊【確定】:0.99,所以這是一個線性特征非常明顯的數(shù)值,說明擬合直線能夠以大于99.99%地解釋、實用文檔涵蓋了實際數(shù)據(jù),具有很好的一般性,能夠起到很好的預(yù)測作用。3.使用Excel的數(shù)據(jù)分析功能1)點擊【數(shù)據(jù)分析】,在彈出的選擇框中選擇【回歸】,然后點擊【確定】:1析分娶百I_-=丸3&!粵方filSI平戲敢?guī)椭?1恥消2)【X值輸入?yún)^(qū)域】選擇訪問數(shù)的單元格,【Y值輸入?yún)^(qū)域】選擇銷售額的單元格,示的選項,包括殘差、標準殘差、殘差圖、線性擬合圖和正態(tài)概率圖。同時勾選如下所回歸輸入Y值輸入?yún)^(qū)域:X值輸入?yún)^(qū)域QD:JC$1O&:5CSU4

4、國SB$10B:SB114國假齢析T粘g智冃fg噸甌細纏躺|_國|_國出更4三歸胡細毅據(jù)組合取礎(chǔ)合分務(wù)匚總烏鴻分折1分祈坡箱分軒弋M分析工具訪問數(shù)銷售額00100104894910101055230507204=002053510005026100&0210414正態(tài)分布0正態(tài)概率圖9E輸岀選項8輸出區(qū)域:斯工作衷組():新工作萌殘差団殘差0標堆殘差3)以下內(nèi)容是殘差和標準殘差:SLTMATOUTPUT回歸統(tǒng)計MultipleR0.99980694RSquare0.999518S17AdjustedRSquare0.856756775標準謂差87.30185573觀測值a方蛙分祈dfSSMSF

5、SignificanceF13S1S237313813287S1S123,834:771.13236E-1153351.29S17621*614014L361862Z1,3析分歸差計回菇總RESIDUALOUTPUTPROBABILITYrOUTPUT觀測值預(yù)測銷售額殘差標準殘差百分比排位銷售額10006.250210.24-0.2426567-0.002971418.7510350.09-0.9532579-0.01167331.25451.BB25007S0.0230519543.75105.3333335535.69-28.357611-0.347249956.

6、25507.333333a2089.50-36.16B631-0.442898968.752053.S3S3S75223.75-198.22158-2.427299881.255025.533333L030i.32109.2825181.3382066393.7510iL3.e4)以下是殘差圖:訪問數(shù)ResidualPlot200iHU*K_200p20000400006000080000100000120000-斗00-訪問數(shù)殘差圖是有關(guān)于實際值與預(yù)測值之間差距的圖表,如果殘差圖中的散點在中軸上下兩側(cè)分布,那么擬合直線就是合理的,說明預(yù)測有時多些,有時少些,總體來說是符合趨勢的,但如果都在上

7、側(cè)或者下側(cè)就不行了,這樣有傾向性,需要重新處理。5)以下是線性擬合圖實用文檔實用文檔12W01000040000預(yù)矣韻書額GOOD400D在線性擬合圖中可以看到,除了實際的數(shù)據(jù)點,還有經(jīng)過擬和處理的預(yù)測數(shù)據(jù)點,這些參數(shù)在以上的表格中也有顯示。6)以下是正態(tài)概率圖NormalProbabilityPlot20000i1000020406080SampleP&rccntile正態(tài)概率圖一般用于檢查一組數(shù)據(jù)是否服從正態(tài)分布,是實際數(shù)值和正態(tài)分布數(shù)據(jù)之間的函數(shù)關(guān)系散點圖,如果這組數(shù)值服從正態(tài)分布,正態(tài)概率圖將是一條直線。回歸分析不一定得符合正態(tài)分布,這里只是僅僅把它描繪出來而已。以上數(shù)據(jù)表格和圖表都說

8、明公式y(tǒng)=0.01028x-27.424是一個值得信賴的預(yù)測曲線,假設(shè)搞活動時流量有50萬訪問數(shù)的話,那么預(yù)測銷售將是51373,如下圖所示:VIA:szwebanalyticsEnd.上篇博文已經(jīng)介紹了如何安裝Excel的高級數(shù)據(jù)分析功能,并且介紹了回歸分析,說實話篇幅有點長,主要是安裝那塊截圖比較多;這篇主要介紹一下描述統(tǒng)計、抽樣分析和直方圖。 一、描述統(tǒng)計 中位數(shù)、眾數(shù)、數(shù)據(jù)分布區(qū)間可能還比較容易可以算出,但是標準差和方差等的計算就比較麻煩了,這些都是描述樣本數(shù)據(jù)的常用變量,使用Excel數(shù)據(jù)分析中的”描述統(tǒng)計”可以得到這些數(shù)據(jù)。 舉個例子:根據(jù)過去15天的電子商

9、務(wù)轉(zhuǎn)化率,想要得到它的數(shù)據(jù)分布區(qū)間、標準差、峰值和極差等描述統(tǒng)計指標。一般來說,電子商務(wù)網(wǎng)站的轉(zhuǎn)換率在3%以下,轉(zhuǎn)換率指的是訂單除以訪問數(shù),注意不是除以pv,因為對于某些外貿(mào)站,訪問深度可能比較深,每即次訪問可能有10的pv,所以用pv來做電子商務(wù)的轉(zhuǎn)換率不合適。 數(shù)據(jù)源如下所示:時間電子商務(wù)轉(zhuǎn)換率1D月1曰1.m1D月2曰0.50%月3日2.SO%1CI月4日0.70%1。月5曰3.cm1。月汨i.mM月T日1.m1。月汨2.50%1D月9曰0.70%月山日1.so%10月11日1.80站10月12曰2.60%10月13曰1.80%10月14日2.BO%10月15曰1.80%分析工具

10、數(shù)據(jù)分忻器e天方機方脣指F-tMM:無重具戒因素分析按照以下圖例進行設(shè)置:設(shè)置后,會得到如下所示的圖表:(解釋是我人為添加的,是對指標的解釋)數(shù)值平均1.90%電子崗務(wù)轉(zhuǎn)換率的平均值0,00201896電子商努轉(zhuǎn)換轉(zhuǎn)值誤差的平方和的平均值的平方限-又稱為均方誤差的平方楓中位數(shù)0.019處于數(shù)列中間位冒的管0.018出現(xiàn)欠數(shù)最多的數(shù).00781939是冒軸促離平均數(shù)的平均數(shù),它是離均差平方和平均后的方根,用口表示標隹差呈方差的算術(shù)平方根6.1143E-05各佯騙與平均數(shù)之差的平方的平均數(shù)-0.4960363寮呈琳分布起伏變化的指標-以正態(tài)分布為基隹-比耳平遷時值為丘,反之則為員;眞度-.4923

11、336數(shù)捋峰值佟移的1旨數(shù)視據(jù)峰d在均值左惻或者右割分別為12値或值;區(qū)域0.025最大值與最小值的差0.005最大值.030,235觀般15tet(l)0.03最小0.005置信度舊5駙0,00433023餉胃晉信黃,也叫置信水平,它昱指持圭個體對特圭實例真實性相信的程度.實用文檔二、抽樣分析 抽樣分析工具以數(shù)據(jù)源區(qū)域為總體,從而為數(shù)據(jù)源創(chuàng)建一個樣本。當總體太大而不能進行處理或繪制時,可以選用具有代表性的樣本。 舉個例子:假設(shè)這樣一種情況,要抽查電子商務(wù)轉(zhuǎn)換率的情況是否正常。 數(shù)據(jù)源如下所示:按照以下圖例進行設(shè)置,注意是抽8個樣本:設(shè)置后,會得到如下所示的圖表:實用文檔實用文檔抽樣結(jié)果1D月丁曰1.90驗月3日2.拠10月1曰1.泗10月2曰0.亦M月陽1.90%1CI月11曰1.亦5月罔日2.拠10月陽1.泗三、直方圖 直方圖是最適合描述數(shù)據(jù)在不同選定區(qū)間分布情況的圖表 數(shù)據(jù)源如下所示:蛾據(jù)分析分析工具確定按照以下圖例進行設(shè)置:設(shè)置后,會得到數(shù)據(jù)和圖表:數(shù)拐險梯頻率累積*數(shù)據(jù)階梯頻率累積%000.00%6000640.00%200000.00%100004GS.S7%4000213.33%8000386.67%&000653.33%40002100.00%S000373

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論