版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
電子商務(wù)數(shù)據(jù)分析(慕課版)項目二
采集與處理電子商務(wù)數(shù)據(jù)
任務(wù)一采集電子商務(wù)數(shù)據(jù)任務(wù)二處理采集的電子商務(wù)數(shù)據(jù)同步實訓(xùn)活動一初識電子商務(wù)數(shù)據(jù)采集3橋梁上的壓力傳感器數(shù)據(jù)采集簡單來說就是收集和獲取數(shù)據(jù)的過程。電子商務(wù)數(shù)據(jù)的采集過程更加方便,只需通過各種渠道獲得相關(guān)的數(shù)據(jù),然后將其整理到Excel、PowerBI等分析工具中即可?;顒右怀踝R電子商務(wù)數(shù)據(jù)采集4(1)電子商務(wù)數(shù)據(jù)采集的原則采集環(huán)節(jié)得到的數(shù)據(jù)能否為分析環(huán)節(jié)所用,關(guān)鍵在于采集數(shù)據(jù)時是否遵循以下原則。精確性及時性合法性(2)電子商務(wù)數(shù)據(jù)采集的渠道電子商務(wù)數(shù)據(jù)的采集渠道較多,為了便于學(xué)習(xí),可以按照不同的數(shù)據(jù)來劃分。0102內(nèi)部數(shù)據(jù)的采集渠道外部數(shù)據(jù)的采集渠道國家統(tǒng)計局、艾瑞咨詢、生意參謀活動二明確電子商務(wù)數(shù)據(jù)采集的方法與工具5(1)電子商務(wù)數(shù)據(jù)采集的方法對于內(nèi)部數(shù)據(jù)而言,采集時只需從數(shù)據(jù)庫中復(fù)制或調(diào)用到數(shù)據(jù)分析工具中就可以使用;對于外部實地調(diào)查的數(shù)據(jù)而言,如果是紙質(zhì)問卷調(diào)查表,則需要通過掃描或手工錄入的方式獲取數(shù)據(jù),如果是電子問卷調(diào)查表,則可以復(fù)制其中的數(shù)據(jù)到分析工具中;對于外部網(wǎng)絡(luò)數(shù)據(jù),主要的獲取方法則是復(fù)制、下載和爬取3種。通過下載的方式采集數(shù)據(jù)招聘信息頁面活動二明確電子商務(wù)數(shù)據(jù)采集的方法與工具6(2)電子商務(wù)數(shù)據(jù)采集的工具利用生意參謀采集數(shù)據(jù)利用京東商智采集數(shù)據(jù)利用店偵探采集數(shù)據(jù)利用八爪魚采集器采集數(shù)據(jù)利用火車采集器采集數(shù)據(jù)活動三手動采集電子商務(wù)數(shù)據(jù)7(2)企業(yè)與企業(yè)之間的電子商務(wù)手動采集電子商務(wù)數(shù)據(jù)是指通過復(fù)制、下載等方式獲取需要的數(shù)據(jù)。查看店鋪商品的類別分布情況導(dǎo)出數(shù)據(jù)活動三手動采集電子商務(wù)數(shù)據(jù)8(2)企業(yè)與企業(yè)之間的電子商務(wù)下載數(shù)據(jù)查看采集的數(shù)據(jù)活動四使用工具采集電子商務(wù)數(shù)據(jù)9在八爪魚采集器中對采集任務(wù)進(jìn)行了適當(dāng)設(shè)置,然后開始采集所需的數(shù)據(jù)。(1)采集設(shè)置設(shè)置并保存采集任務(wù)選擇采集方式活動四使用工具采集電子商務(wù)數(shù)據(jù)10開始自動識別網(wǎng)頁數(shù)據(jù)顯示采集的數(shù)據(jù)效果取消自動識別并獲取登錄信息活動四使用工具采集電子商務(wù)數(shù)據(jù)11(2)采集數(shù)據(jù)采用本地采集模式保存設(shè)置并開始采集停止采集正在采集數(shù)據(jù)活動四使用工具采集電子商務(wù)數(shù)據(jù)12去重數(shù)據(jù)導(dǎo)出數(shù)據(jù)設(shè)置保存名稱和位置設(shè)置導(dǎo)出類型任務(wù)一采集電子商務(wù)數(shù)據(jù)任務(wù)二處理采集的電子商務(wù)數(shù)據(jù)同步實訓(xùn)活動一認(rèn)識數(shù)據(jù)分類與處理14數(shù)據(jù)分類與處理在電子商務(wù)數(shù)據(jù)分析中起著承上啟下的作用,它可以提升并優(yōu)化采集到的數(shù)據(jù)的價值,可以為數(shù)據(jù)分析提供更加精準(zhǔn)的數(shù)據(jù)信息,可以簡化數(shù)據(jù)分析的工作內(nèi)容。54321客觀性原則針對性原則便捷性原則完整性原則嚴(yán)謹(jǐn)性原則活動二分類統(tǒng)計數(shù)據(jù)15(1)分類匯總利用Excel的分類匯總功能匯總上周不同流量來源的支付總額,其具體操作如下。排列數(shù)據(jù)設(shè)置分類匯總數(shù)據(jù)分類統(tǒng)計是根據(jù)統(tǒng)計目的將采集到的原始數(shù)據(jù)進(jìn)行統(tǒng)計歸類。查看匯總結(jié)果活動二分類統(tǒng)計數(shù)據(jù)16(2)合并計算使用合并計算功能按不同流量來源統(tǒng)計兩周各個指標(biāo)的數(shù)據(jù)結(jié)果,其具體操作如下。添加數(shù)據(jù)區(qū)域引用數(shù)據(jù)區(qū)域設(shè)置標(biāo)簽位置完成合并計算活動二分類統(tǒng)計數(shù)據(jù)17(3)函數(shù)的應(yīng)用函數(shù)是Excel預(yù)先定義的特定計算公式,它通過使用指定格式的參數(shù)來完成數(shù)據(jù)計算。函數(shù)與公式都必須以等號“=”開始,后面緊跟函數(shù)名以及對應(yīng)的用小括號包括的參數(shù)。函數(shù)與公式的結(jié)構(gòu)在編輯欄中輸入函數(shù)選擇函數(shù)活動二分類統(tǒng)計數(shù)據(jù)18利用求和函數(shù)、條件求和函數(shù)、求平均值函數(shù)、計數(shù)函數(shù)、條件計數(shù)函數(shù)、求最大值函數(shù)和求最小值函數(shù),來完成對店鋪數(shù)據(jù)的統(tǒng)計,其具體操作如下。統(tǒng)計交易總額選擇函數(shù)設(shè)置函數(shù)參數(shù)活動二分類統(tǒng)計數(shù)據(jù)19統(tǒng)計訂單交易數(shù)量為1件的交易總額統(tǒng)計平均交易額設(shè)置函數(shù)參數(shù)選擇參數(shù)統(tǒng)計訂單交易數(shù)量活動二分類統(tǒng)計數(shù)據(jù)20統(tǒng)計交易金額大于100元的訂單數(shù)統(tǒng)計訂單最小交易金額統(tǒng)計訂單最大交易金額活動二分類統(tǒng)計數(shù)據(jù)21(4)數(shù)據(jù)透視表的應(yīng)用數(shù)據(jù)透視表可以對數(shù)據(jù)進(jìn)行匯總、篩選和重組,快速生成簡潔清晰的匯總報表,并能隨時調(diào)整報表內(nèi)容,可以幫助我們更好地理解和分析數(shù)據(jù)。其具體操作如下。創(chuàng)建數(shù)據(jù)透視表全年不同類目商品的銷售額統(tǒng)計活動二分類統(tǒng)計數(shù)據(jù)22篩選數(shù)據(jù)各類目上半年的銷量統(tǒng)計活動三清洗數(shù)據(jù)23定位空值(1)處理缺失值當(dāng)采集的數(shù)據(jù)中存在缺失值時,應(yīng)根據(jù)實際情況選擇不同的方式進(jìn)行處理。修補(bǔ)缺失值刪除缺失值修補(bǔ)缺失的數(shù)據(jù),其具體操作如下。補(bǔ)全空值活動三清洗數(shù)據(jù)24(2)修復(fù)錯誤值Excel會顯示錯誤信息,以提醒用戶及時修復(fù)錯誤值,通過這些信息就能知道錯誤產(chǎn)生的原因,以便解決錯誤。Excel常見錯誤信息匯總活動三清洗數(shù)據(jù)25輸入公式修復(fù)錯誤值活動三清洗數(shù)據(jù)26設(shè)置日期格式(3)統(tǒng)一數(shù)據(jù)格式統(tǒng)一數(shù)據(jù)格式可以有效提高所采集數(shù)據(jù)的質(zhì)量。在Excel中,可以利用數(shù)據(jù)類型設(shè)置和查找與替換功能來統(tǒng)一數(shù)據(jù)格式,其具體操作如下。查找并替換數(shù)據(jù)1查找并替換數(shù)據(jù)2活動三清洗數(shù)據(jù)27(4)修復(fù)邏輯錯誤數(shù)據(jù)的邏輯錯誤主要是指違反了邏輯規(guī)律產(chǎn)生的錯誤,這需要數(shù)據(jù)分析人員具備認(rèn)真細(xì)致的工作態(tài)度和可靠的專業(yè)知識,才能更容易地找到邏輯問題??傮w而言,數(shù)據(jù)出現(xiàn)的邏輯錯誤主要有3種常見情況。01PRAT02PRAT03PRAT數(shù)據(jù)不合理數(shù)據(jù)自相矛盾數(shù)據(jù)不符合規(guī)則活動三清洗數(shù)據(jù)28設(shè)置規(guī)則設(shè)置標(biāo)記格式標(biāo)記出的邏輯錯誤數(shù)據(jù)以店鋪流量數(shù)據(jù)為例,通過標(biāo)記店鋪來訪數(shù)據(jù)中的店內(nèi)跳轉(zhuǎn)人數(shù)和跳出本店人數(shù)給小艾介紹條件格式功能的示意方法,其具體操作如下:活動三清洗數(shù)據(jù)29(5)清洗重復(fù)數(shù)據(jù)當(dāng)采集的數(shù)據(jù)量較大時,可以利用Excel的刪除重復(fù)值功能,去掉數(shù)據(jù)中可能存在的重復(fù)記錄,其具體操作如下。設(shè)置檢查的字段檢查并刪除重復(fù)數(shù)據(jù)活動四轉(zhuǎn)化數(shù)據(jù)30(1)轉(zhuǎn)換數(shù)據(jù)行與列數(shù)據(jù)行列的轉(zhuǎn)換在Excel中稱為“轉(zhuǎn)置”,指的是將原來各條數(shù)據(jù)記錄的首列內(nèi)容轉(zhuǎn)置為數(shù)據(jù)的各個項目,將原來的各個項目轉(zhuǎn)置為數(shù)據(jù)記錄的首列內(nèi)容,從而實現(xiàn)將當(dāng)前各列內(nèi)容轉(zhuǎn)置為橫向的各條數(shù)據(jù)記錄。在Excel中可以直接使用選擇性粘貼功能來完成轉(zhuǎn)換,其具體操作如下。檢查并刪除重復(fù)數(shù)據(jù)數(shù)據(jù)需要進(jìn)行一定的轉(zhuǎn)化,如行列數(shù)據(jù)互換、數(shù)據(jù)內(nèi)容提取、數(shù)據(jù)分列顯示、數(shù)據(jù)重新排列等,這些情況同樣可以在Excel中加以解決?;顒铀霓D(zhuǎn)化數(shù)據(jù)31刪除原有數(shù)據(jù)轉(zhuǎn)換行與列后的效果活動四轉(zhuǎn)化數(shù)據(jù)32(2)提取數(shù)據(jù)內(nèi)容通過數(shù)據(jù)提取操作,可以將采集到的數(shù)據(jù)中有用的部分提取出來。在Excel中可以使用LEFT函數(shù)、MID函數(shù)和RIGHT函數(shù)來實現(xiàn)數(shù)據(jù)提取工作,其具體操作如下。完善數(shù)據(jù)提取數(shù)據(jù)活動四轉(zhuǎn)化數(shù)據(jù)33(3)分列數(shù)據(jù)在Excel中可以將指定的列按某種符號或特定的寬度進(jìn)行分隔,將其分成若干列,這需要利用Excel的“分列”功能,并根據(jù)“文本分列向?qū)А睂υ捒虻奶崾咎幚怼,F(xiàn)將“搜索值屬性”列分為“搜索指”列和“屬性”列,其具體操作如下。設(shè)置分列方式分列后的效果指定分列位置活動四轉(zhuǎn)化數(shù)據(jù)34(4)排列數(shù)據(jù)為了更好地分析采集到的數(shù)據(jù),有時需要對數(shù)據(jù)重新排列,如查看銷量較好的商品數(shù)據(jù),查看投訴較多的客服人員數(shù)據(jù)等。Excel提供有多種排列數(shù)據(jù)的方法,包括快速排序、關(guān)鍵字排序、自定義排序等,以便滿足實際工作中數(shù)據(jù)排列的需求。關(guān)鍵字排序的設(shè)置界面添加排序依據(jù)活動四轉(zhuǎn)化數(shù)據(jù)35設(shè)置排序主要關(guān)鍵字排序后的效果設(shè)置排序次要關(guān)鍵字活動五計算數(shù)據(jù)36(1)常規(guī)計算常規(guī)計算包括公式計算與函數(shù)計算,大多數(shù)的電子商務(wù)數(shù)據(jù)均可通過常規(guī)計算完成。Excel的公式結(jié)構(gòu)如果公式中含有單元格引用,則移動、復(fù)制公式時會涉及單元格引用的問題。混合引用絕對引用相對引用活動五計算數(shù)據(jù)37將幾個門店上半年的銷售與投入數(shù)據(jù)采集下來,使用公式計算各門店上半年的銷售總額與投入產(chǎn)出比,其具體操作如下。輸入公式計算銷售總額活動五計算數(shù)據(jù)38輸入公式計算投入產(chǎn)出比活動五計算數(shù)據(jù)39(2)日期計算日期計算在電子商務(wù)數(shù)據(jù)處理中也較為常見,借助Excel中的日期函數(shù)解決該問題。DAYS函數(shù)DATEDIF函數(shù)TODAY函數(shù)在Excel中計算這些客戶下單的間隔天數(shù)和月數(shù),其具體操作如下。輸入函數(shù)計算間隔天數(shù)輸入函數(shù)計算間隔月數(shù)活動五計算數(shù)據(jù)40(3)加權(quán)計算加權(quán)計算需要在數(shù)據(jù)的基礎(chǔ)上與權(quán)重(即系數(shù))相乘,這也是電子商務(wù)數(shù)據(jù)計算中常見的操作。在Excel中可以借助SUMPRODUCT函數(shù)來進(jìn)行加權(quán)計算,利用SUMPRODUCT函數(shù)對各渠道進(jìn)行評分計算,其具體操作如下。輸入函數(shù)計算綜合得分活動五計算數(shù)據(jù)41轉(zhuǎn)化為絕對引用填充函數(shù)任務(wù)一采集電子商務(wù)數(shù)據(jù)任務(wù)二處理采集的電子商務(wù)數(shù)據(jù)同步實訓(xùn)同步實訓(xùn)一
采集男裝休閑褲數(shù)據(jù)43小宇想在京東商城開設(shè)一家專賣男裝休閑褲的店鋪,為更好地了解京東商城銷量較好的休閑褲及其價格,他準(zhǔn)備使用八爪魚采集器采集京東商城上的一些相關(guān)商品數(shù)據(jù)。實訓(xùn)描述同步實訓(xùn)一
采集男裝休閑褲數(shù)據(jù)44操作指南復(fù)制網(wǎng)址生成采集設(shè)置保存并開始采集同步實訓(xùn)一
采集男裝休閑褲數(shù)據(jù)45停止采集導(dǎo)出數(shù)據(jù)保存數(shù)據(jù)文件選擇導(dǎo)出類型同步實訓(xùn)一采集男裝休閑褲數(shù)據(jù)46實訓(xùn)評價同步實訓(xùn)二
處理采集到的數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024食堂營養(yǎng)膳食設(shè)計與健康管理服務(wù)合同3篇
- 微納光波導(dǎo)特性研究-洞察分析
- 全新醫(yī)療設(shè)備試用協(xié)議書下載
- 合同范本樣板
- 初中生科學(xué)實驗觀后感
- it外包服務(wù)合同范本
- 二零二五年度高新技術(shù)股東內(nèi)部股權(quán)分配與轉(zhuǎn)讓協(xié)議范本3篇
- 110kV南澗變天井變自動化系統(tǒng)通訊管理機(jī)大修技術(shù)規(guī)范書
- 通信設(shè)備市場趨勢預(yù)測模型-洞察分析
- 2025年建筑混凝土工勞動合同2篇
- 成品出貨檢驗報告模板
- 物業(yè)工程管理安全培訓(xùn)課件
- 《文化苦旅》讀書分享 PPT
- 氧化鋁生產(chǎn)工藝教學(xué)拜耳法
- 2023年十八項醫(yī)療核心制度考試題與答案
- 氣管切開患者氣道濕化的護(hù)理進(jìn)展資料 氣管切開患者氣道濕化
- GB/T 12706.1-2020額定電壓1 kV(Um=1.2 kV)到35 kV(Um=40.5 kV)擠包絕緣電力電纜及附件第1部分:額定電壓1 kV(Um=1.2 kV)和3 kV(Um=3.6 kV)電纜
- 管理模板:某跨境電商企業(yè)組織結(jié)構(gòu)及部門職責(zé)
- 底架總組裝工藝指導(dǎo)書
- 簡單臨時工勞動合同模板(3篇)
- 聚酯合成反應(yīng)動力學(xué)
評論
0/150
提交評論