版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
商務(wù)數(shù)據(jù)分析測試題簡答題一、商務(wù)數(shù)據(jù)搜集要注意的原則有哪些?為了保證收集工作的有效性和數(shù)據(jù)價值,需要注意以下幾個原則:(1)及時性。注意數(shù)據(jù)的產(chǎn)生時間,過時的數(shù)據(jù)解決不了當(dāng)下的問題。(2)全面性。充分考慮到內(nèi)部和外部的數(shù)據(jù)來源,盡量避免幸存者偏差、選擇性偏差等。(3)相關(guān)性。避免犯兩類錯誤:有什么數(shù)據(jù)就用什么數(shù)據(jù),且喜歡復(fù)雜的模型;不進行事前調(diào)查,沒有任何基礎(chǔ)就想當(dāng)然的收集數(shù)據(jù)。(4)經(jīng)濟性。在選擇要分析的商業(yè)指標(biāo)、確定數(shù)據(jù)收集方法以及收集流程的過程中,要將可能產(chǎn)生的效益與花費的人力、物力、財力、時間等成本進行衡量,從而制定更為經(jīng)濟可行的數(shù)據(jù)收集方案。二、說明商務(wù)數(shù)據(jù)收集的流程數(shù)據(jù)分析人員可以按照如下的流程進行操作:(1)定位商業(yè)問題,確定有理有據(jù)的收集指標(biāo)。定位商業(yè)問題的最終目的是要透過現(xiàn)象看本質(zhì),運用4W提問法挖掘期望成果和行動之間的因果關(guān)系。(2)考慮指標(biāo)特征,選擇經(jīng)濟可行的收集方法。確定了要收集的數(shù)據(jù)指標(biāo)后,就需要著手根據(jù)指標(biāo)特征結(jié)合收集成本,考慮獲取數(shù)據(jù)應(yīng)使用的方法。(3)明確任務(wù)分工,制定切實有效的收集方案。在正式進行數(shù)據(jù)收集工作前,應(yīng)明確數(shù)據(jù)收集的指標(biāo)范圍和時間范圍。接著明確這些數(shù)據(jù)需要從哪些途徑及部門收集,最后確定參與部門和人員配備并落實為工作方案。(4)建立數(shù)據(jù)規(guī)范,進行完整準(zhǔn)確的數(shù)據(jù)檢查數(shù)據(jù)指標(biāo)需對數(shù)據(jù)進行唯一性標(biāo)識,并且貫穿之后的數(shù)據(jù)查詢、分析和應(yīng)用,建立數(shù)據(jù)指標(biāo)規(guī)范是為了使后續(xù)工作有一個可以遵循的原則,也為龐雜的數(shù)據(jù)分析工作確定了可以識別的唯一標(biāo)識。三.說明通過各種渠道收集的原始數(shù)據(jù)存在的問題?原始數(shù)據(jù)主要存在以下幾個問題:(1)缺失數(shù)據(jù),是指在實踐過程中因種種原因沒有能夠獲取觀測對象的相關(guān)信息,造成數(shù)據(jù)不完全。(2)異常值數(shù)據(jù),也可稱為離群點,是指所獲得的數(shù)據(jù)中與平均值的偏差超過兩倍及兩倍以上標(biāo)準(zhǔn)差的數(shù)據(jù)。(3)重復(fù)數(shù)據(jù),一般分為實體重復(fù)和字段重復(fù)兩種。其中,實體重復(fù)是指所有字段完全重復(fù),字段重復(fù)則表示某一個或多個不該重復(fù)的字段重復(fù)。(4)冗余數(shù)據(jù),一方面是指多個數(shù)據(jù)集合并時,同一內(nèi)容不同命名或者編碼,例如某數(shù)據(jù)集中的變量名稱為“用戶編碼”,在另一個數(shù)據(jù)集中卻為“id”;另一方面也指數(shù)據(jù)集中的2個或多個變量之間存在相關(guān)或者推導(dǎo)關(guān)系。冗余數(shù)據(jù)會造成數(shù)據(jù)重復(fù)或分析結(jié)果產(chǎn)生偏差。(5)不一致數(shù)據(jù),一般表現(xiàn)為3個方面的問題:一是人為/機械原因?qū)е碌匿浫脲e誤或者數(shù)據(jù)規(guī)范不同;二是變量單位或者量綱不匹配;三是數(shù)據(jù)特征不適應(yīng)特定數(shù)據(jù)分析模型的需求或變量過多分析難度較大。四、分析數(shù)據(jù)集數(shù)列,哪些指標(biāo)可以測度數(shù)據(jù)的集中趨勢?答:測度數(shù)據(jù)的集中趨勢的指標(biāo)可分為數(shù)值平均數(shù)和位置代表值兩大類。數(shù)據(jù)平均數(shù)主要包括算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù);位置代表值主要有中位數(shù)和眾數(shù)。數(shù)列的算術(shù)平均數(shù)為15,調(diào)和平均數(shù)為5.14,幾何平均數(shù)10.50,中位數(shù)為13,沒有眾數(shù)。論述題一、二手?jǐn)?shù)據(jù)的收集方法有哪些?舉例說明。二手?jǐn)?shù)據(jù)包括內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)兩種。(1)內(nèi)部數(shù)據(jù)內(nèi)部數(shù)據(jù)來自于組織內(nèi)部,因其他目的而收集。內(nèi)部數(shù)據(jù)的收集來源為業(yè)務(wù)資料、統(tǒng)計資料、數(shù)據(jù)庫等(企業(yè)數(shù)據(jù)庫、部門溝通等),收集方法包括報表收集、數(shù)據(jù)庫收集、系統(tǒng)日志數(shù)據(jù)收集等。①報表收集。報表收集是指企業(yè)可以通過相關(guān)業(yè)務(wù)部門每日、周的工作報表進行數(shù)據(jù)收集,如銷售明細(xì)、出入庫清單、客服記錄等。②數(shù)據(jù)庫收集。數(shù)據(jù)庫收集是指企業(yè)將數(shù)據(jù)庫收集系統(tǒng)直接對接到業(yè)務(wù)后臺服務(wù)器,業(yè)務(wù)后臺每時每刻產(chǎn)生的大量業(yè)務(wù)記錄即可寫入到數(shù)據(jù)庫中,最后由特定的處理系統(tǒng)進行數(shù)據(jù)分析。③系統(tǒng)日志數(shù)據(jù)收集。系統(tǒng)日志數(shù)據(jù)收集主要針對互聯(lián)網(wǎng)上的商務(wù)活動。網(wǎng)站日志會記錄訪客IP地址、訪問時間、訪問次數(shù)、停留時間、訪客來源等數(shù)據(jù)。通過對這些日志信息進行收集、分析,可以挖掘企業(yè)業(yè)務(wù)平臺日志數(shù)據(jù)中的潛在價值。(2)外部數(shù)據(jù)外部數(shù)據(jù)是指從組織外部獲得的二手?jǐn)?shù)據(jù)。外部數(shù)據(jù)的收集來源為公開出版的資料、計算機數(shù)據(jù)庫、其它來自互聯(lián)網(wǎng)的資料(網(wǎng)站日志、第三方平臺統(tǒng)計、互聯(lián)網(wǎng)檢索、網(wǎng)絡(luò)爬蟲等),收集方法包括文獻(xiàn)收集、網(wǎng)頁數(shù)據(jù)收集等。文獻(xiàn)收集即通過政府部門、機構(gòu)協(xié)會、新聞媒體、出版社等發(fā)布的統(tǒng)計收據(jù)、行業(yè)調(diào)查報告、新聞報道、出版物。案例分析:日期周一周二周三周四周五周六周日銷售額(元)5063505250325009504334323607假設(shè)你是某家公司的分析師,表中所示為該公司B2C電子網(wǎng)站一周的銷售數(shù)據(jù),該網(wǎng)站主要用戶群是辦公室,女性為主銷售額集中在五種產(chǎn)品以上。(1)從圖中你看出了什么問題?從這一周的數(shù)據(jù)可以看出,周末的銷售額明顯偏低。這其中的原因可以從兩個角度來分析:站在消費者的角度來看,周末可能不用上班,因而也沒有購買該產(chǎn)品的欲望;站在產(chǎn)品的角度來看,該產(chǎn)品不能在周末的時候引起消費者足夠的注意力。如果要求你提出一個運營改進建議,你會怎么做?針對該問題背后的兩方面原因,運營改進計劃也分兩方面:一是針對消費者周末沒有購買欲望的心理,引導(dǎo)提醒消費者周末就應(yīng)該準(zhǔn)備好該產(chǎn)品:二是通過該產(chǎn)品的一些類似于打折促銷的活動來提升該產(chǎn)品在周末的人氣和購買力。案例分析2對超市某月會員消費情況進行統(tǒng)計后發(fā)現(xiàn),數(shù)據(jù)表中存在缺失值、異常值和重復(fù)值,如表所示,空白單元格為缺失數(shù)據(jù),填充底紋數(shù)據(jù)為異常值,請論述如何進行數(shù)據(jù)清洗處理?可做如下數(shù)據(jù)清洗:(1)對于缺失值,id為A002的會員缺失信息過多,在分析線上消費金額字段時可參與運算,在分析其他字段時可考慮刪除改行。id為A001的會員線上消費金額缺失,需追溯數(shù)據(jù)源,在這里也可通過公式
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥品銷售顧問聘用合同
- 理發(fā)店等候區(qū)空調(diào)租賃合同
- 山西省港口設(shè)施施工合同范本
- 服裝品牌設(shè)計總監(jiān)聘用合同
- 廣播電視消防設(shè)施升級合同
- 遼寧省農(nóng)村公路養(yǎng)護手冊
- 2025版智慧城市建設(shè)企業(yè)股東變更與大數(shù)據(jù)應(yīng)用協(xié)議3篇
- 2025版物流配送中心智能化改造承包合同3篇
- 2024年物業(yè)小區(qū)增值服務(wù)管理合同3篇
- 2025版駕校與駕駛模擬器生產(chǎn)企業(yè)合作推廣協(xié)議3篇
- 北京市石景山區(qū)2023-2024學(xué)年七年級上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 2025版寒假特色作業(yè)
- Unit 7 Will people have robots Section B 1a-1e 教學(xué)實錄 2024-2025學(xué)年人教版英語八年級上冊
- 江西省吉安市2023-2024學(xué)年高一上學(xué)期1月期末考試政治試題(解析版)
- 國內(nèi)外航空安全形勢
- 《雷達(dá)原理》課件-1.1.6教學(xué)課件:雷達(dá)對抗與反對抗
- 2024年版汽車4S店商用物業(yè)租賃協(xié)議版B版
- 微信小程序云開發(fā)(赤峰應(yīng)用技術(shù)職業(yè)學(xué)院)知到智慧樹答案
- 遼寧省撫順市清原縣2024屆九年級上學(xué)期期末質(zhì)量檢測數(shù)學(xué)試卷(含解析)
- 2024-2025學(xué)年上學(xué)期福建高二物理期末卷2
- 2024四川阿壩州事業(yè)單位和州直機關(guān)招聘691人歷年管理單位遴選500模擬題附帶答案詳解
評論
0/150
提交評論