下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第5章基于關聯(lián)規(guī)則的購物籃分析教學內(nèi)容一、問題的提出二、關聯(lián)分析三、購物籃分析案例示范教學要求【知識目標】了解購物籃分析;理解關聯(lián)規(guī)則的概念及原理;掌握關聯(lián)規(guī)則算法的應用?!炯寄苣繕恕繉W會對天貓超市的購物籃進行分析。教學重點基于關聯(lián)規(guī)則的購物籃分析教學難點關聯(lián)分析模型的構建;關聯(lián)分析結果與零售策略建議。教學方法講授法、案例法、任務驅動法、演示法課時數(shù)6課時教學內(nèi)容問題的提出一、購物籃分析購物籃分析是零售企業(yè)或商家通過對顧客個人數(shù)據(jù)、顧客的交易數(shù)據(jù)和顧客購物籃中的商品數(shù)據(jù)進行綜合分析,發(fā)現(xiàn)消費者購買規(guī)律的活動。自購物籃分析被提出以來,已經(jīng)被零售企業(yè)廣泛應用于商品陳列、交叉銷售、捆綁銷售、個性化商品推薦優(yōu)化等常態(tài)化的日常經(jīng)營決策中。它的應用大大增強了顧客的購買體驗,提高了消費者的客單價,降低了顧客購物成本,減少了零售企業(yè)的經(jīng)營風險,提高了零售企業(yè)的營銷決策效率和經(jīng)營績效。問題設計如何充分挖掘天貓超市“留量”顧客的價值呢?根據(jù)零售理論,企業(yè)的銷售額=流量ⅹ轉化率ⅹ客單價。其中,流量指光顧線上或線下零售平臺或商店的人數(shù);轉化率是指所有光顧零售平臺或商店的消費者中發(fā)生實際購買行為的人數(shù)占所有光顧人數(shù)的百分比;客單價則是指零售商的每個消費者的平均交易額。由此可知,在消費者流量已飽和的情況下,天貓超市可以通過提高轉化率和客單價來提升銷售業(yè)績。但需要注意的是,由于影響網(wǎng)絡零售企業(yè)轉化率的因素眾多,涉及商品價格、網(wǎng)店零售環(huán)境、線上零售商的實力與聲譽,所售商品的聲譽、消費者的購買情境、網(wǎng)絡零售商的客群特征、售后服務政策、競爭環(huán)境等多個方面。若要通過改善上述各影響因素著手提高天貓超市的轉化率,不僅所需耗費的時間久,花費也相對較高。因此,要在短時間內(nèi)提高天貓超市的銷售額,充分挖掘天貓超市現(xiàn)有顧客的價值,提升客單價將是相對省時且有效的方法。問題解決思路一般而言,在特定時間段內(nèi),零售企業(yè)的品牌美譽度、商品陳列、商品推薦、產(chǎn)品的品牌聲譽和價格、促期政策以及交叉銷售等因素都會影響消費者的客單價。經(jīng)過跟專家的討論和對天貓超市經(jīng)營數(shù)據(jù)的了解,為了獲得更穩(wěn)定的銷售增長,運營部主管根據(jù)市場經(jīng)理提交的消費者購買數(shù)據(jù)分析報告,認為可以通過優(yōu)化關聯(lián)商品購買推薦,改進商品捆綁銷售和交叉銷售建議來提升客單價。因此,天貓超市可以根據(jù)顧客消費數(shù)據(jù)分析商品之間潛在的聯(lián)系,預測顧客可能會購買的其他商品,并據(jù)此調整和優(yōu)化該超市的零售策略。關聯(lián)分析關聯(lián)分析步驟與關聯(lián)強度關聯(lián)規(guī)則是關聯(lián)分析在大數(shù)據(jù)中發(fā)現(xiàn)事物之間相關性的結果。數(shù)據(jù)分析人員需要先根據(jù)最小支持度找出數(shù)據(jù)庫中所有的頻繁項集,然后根據(jù)最小置信度和頻繁項集挖掘出事物之間背后隱藏的關聯(lián)規(guī)則。其中,頻繁項集是經(jīng)常出現(xiàn)在一起的產(chǎn)品、物品、服務或屬性的集合,呈現(xiàn)了某些事物之間的共現(xiàn)關系。與普通共現(xiàn)關系不同的是,關聯(lián)規(guī)則更凸顯事物或屬性之間的相互依賴關系和條件先驗關系,即它除了展現(xiàn)組內(nèi)某些事物或屬性之間的共現(xiàn)外,還提示了事物或屬性之間明顯的相關關系和因果關系的存在。換句話說,關聯(lián)關系的共現(xiàn)關系更強,且大部分可以依據(jù)日常經(jīng)驗和已有理論的邏輯進行闡釋。關聯(lián)規(guī)則的強度不是有數(shù)據(jù)分析人員或管理人員主觀認定的,而是有客觀量化的指標可以衡量的。具體來說,主要包括三個指標:一是支持度,指項集的頻繁程度,即含有特定項集的項目占所有項目的百分比;二是置信度,即項集Y在包含項集X的事物中出現(xiàn)的頻繁程度;三是提升度,在含有項集X的條件下同時含有項集Y的概率與僅含有項集Y的概率比。頻繁項集指的是滿足最小支持度閾值(minsup,MinimumSupport)的所有項集。二、關聯(lián)分析的核心算法Apriori算法由Agrawal等提出的Apriori算法是利用頻繁集性質的先驗知識,通過逐層搜索的不斷迭代,即將k-項集(包含k項的項集)用于找到數(shù)據(jù)集中的所有頻繁項目集。換言之,Apriori算法的目的就是要找到最大的K-項頻繁集。Apriori算法有這樣一個性質,即若一個項集是頻繁的,那么它的所有子集一定是頻繁的;相反,若一個項集是非頻繁的,那么它的所有子集一定也是非頻繁的。為了提高頻繁項目集生成的效率,減少項目集的組合和掃描數(shù)據(jù)庫的次數(shù),該算法利用了上述性質。即如果發(fā)現(xiàn)某項集是非頻繁的,即可將整個包含該超集的子圖剪枝。Apriori算法的具體步驟如下:掃描數(shù)據(jù)庫,生成候選1-項集和頻繁1-項集;從2-項集開始循環(huán),由頻繁(k-1)-項集生成頻繁k-項集;頻繁(k-1)-項集兩兩組合,判定是否可以連接,若能,則連接生成k-項集;檢測k項集中的每個項集子集是否頻繁,舍掉不是頻繁項集的子集;再次掃描數(shù)據(jù)庫,計算前一步中過濾后的k-項集支持度,舍棄支持度小于閾值的項集,生成頻繁k-項集。當當前k-項集中只有一個項集時,循環(huán)結束。FP-growth算法雖然Aprori算法利用頻繁集的兩個特性可以過濾很多無關的集合,但是這種算法的局限性也非常突出:一方面,Aprori算法可能會產(chǎn)生很多候選項集;另一方面,Apriori算法是一個候選消除算法,在每一次消除時都需要掃描所有數(shù)據(jù)記錄,因此對I/O負載具有較高的要求。從其操作過程來看,Aprori算法的數(shù)據(jù)挖掘效率是低下的。這意味著Aprori算法無法應用于有海量數(shù)據(jù)記錄的大數(shù)據(jù)分析?;诖?,Han等人在2000年提出了頻繁模式增長(Frequent-PatternGrowth,簡稱FP-growth)的算法。近年來,F(xiàn)p-Growth算法已經(jīng)被廣泛應用于挖掘頻繁項集,其原理是:先把經(jīng)掃描數(shù)據(jù)庫找出頻繁項集后的數(shù)據(jù)集存儲壓縮在一個叫FP-tree(頻繁模式樹)的數(shù)據(jù)結構里,然后再將上述數(shù)據(jù)庫分割成一些條件數(shù)據(jù)庫,并找出頻繁項集。與Aprori算法相比,F(xiàn)P-growth算法在使用過程中只需要掃描兩次數(shù)據(jù)庫,因此它在處理大數(shù)據(jù)集上的效率要明顯高于Apriori算法。關聯(lián)分析在營銷中的應用商業(yè)零售行業(yè)該促銷哪些商品?對哪些商品進行捆綁銷售?如何進行交叉銷售?為消費者推薦何種商品?在零售行業(yè),不論是網(wǎng)絡零售商還是線下實體零售商,為了增加銷售量和獲取更多的利潤,常常面臨上述一系列問題。對于實體零售店,還面臨商品該如何陳列的問題。關聯(lián)分析可以幫助零售企業(yè)對消費者的購物籃數(shù)據(jù)進行挖掘,發(fā)現(xiàn)顧客購買一個商品時購買另一個商品的概率,明確消費者購買商品之間的關聯(lián),從而為商家進行科學、合理的商品陳列規(guī)劃、交叉銷售、捆綁銷售、商品推薦和促銷活動優(yōu)化提供有效的決策依據(jù)。金融行業(yè)如零售行業(yè)一樣,金融行業(yè)也是關聯(lián)分析應用的一個重要場景。證券公司常常會用關聯(lián)分析為投資活動決策提供依據(jù);銀行通過關聯(lián)規(guī)則分析消費者的信用卡使用情況,以實時監(jiān)控消費者信用卡的惡意透支行為;保險公司通過對投保人購買行為的關聯(lián)分析,發(fā)現(xiàn)投保人購買的關聯(lián)保險險種。除了上述行業(yè)以外,電信、科研、教育和醫(yī)療領域也是關聯(lián)分析被廣泛使用的場景。競爭數(shù)據(jù)分析中最關鍵的因素是獲取信息的質量和類型,這也決定了分析的廣度和深度。數(shù)據(jù)獲取方式有數(shù)據(jù)采買、數(shù)據(jù)爬取、外部資訊或內(nèi)部情報。購物籃分析案例示范探索數(shù)據(jù)源本案例數(shù)據(jù)包含的信息共有7985條數(shù)據(jù)。將現(xiàn)有天貓超市的7985條消費記錄數(shù)據(jù)導入“關系數(shù)據(jù)源”。數(shù)據(jù)處理根據(jù)探索數(shù)據(jù)源時分析得出的結果,對源數(shù)據(jù)進行去除重復值的操作。由于原始數(shù)據(jù)是一個商品一條記錄,在做購物籃分析時,需要對一個客戶所購買的所有商品進行關聯(lián)規(guī)則挖掘,因此需要進行聚合處理。將“BuyerName”字段作為分組依據(jù),對同一個消費者所購買的“ProductName”字段進行匯總與計數(shù)。關聯(lián)規(guī)則挖掘進行關聯(lián)規(guī)則挖掘訓練。將“Collect_list_ProductName”字段設置為特征列用于挖掘頻繁項集,然后依據(jù)訂單中所包含的物品種類數(shù)量是否大于1的原則,將數(shù)據(jù)源分成兩部分,分兩次拖拽行選擇到畫布區(qū)。商品種類數(shù)量大于1意味著購買商品數(shù)量在兩種或以上,可以從這些數(shù)據(jù)中去挖掘頻繁項集;等于1意味著該訂單只購買了一種商品,將其用于后續(xù)的預測數(shù)據(jù)。添加FP-growth算法用于訓練訓練集數(shù)據(jù),并且將最小支持度和最小置信度設置為0.1,同時引入測試數(shù)據(jù)集進行預測。零售策略建議通過關聯(lián)分析結果可以看出,煙灰缸和菜板、油壺和菜板、保溫壺和菜板、紅酒開瓶器和菜板等組合同時購買的概率最高,提升度都大于1,都是正相關的,是能夠提高購買概率的組合。也就是說,購買了煙灰缸、油壺、保溫壺和紅酒開瓶器的顧客有超過50%的概率會購買菜板。因此,為了提高天貓超市的客單價,可以制定以下策略:(1)將煙灰缸和菜板、油壺和菜板、保溫壺和菜板、紅酒開
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年八年級統(tǒng)編版語文寒假預習 第06講 《禮記》二則
- 2021年高考語文二輪復習講練測專題12-鑒賞詩歌的形象(測)(解析版)
- 二年級數(shù)學計算題專項練習1000題匯編集錦
- 【2021春備課】高中政治四步教學法(人教版-必修2):3.2-政府的責任:對人民負責-第2步-講
- 2025年跨0016成都合源美智教育科技有限公司
- 肌筋膜炎的治療教學材料
- 茅盾及其子夜課件
- 《個性時尚》課件
- 2024毛石加工定制與安裝服務合同3篇
- 2024年長春汽車經(jīng)濟技術開發(fā)區(qū)事業(yè)單位專項招聘筆試真題
- 江蘇省宿遷市沭陽縣2023-2024學年八年級上學期期末英語試題
- 【8物(科)期末】合肥市廬陽區(qū)2023-2024學年八年級上學期期末質量檢測物理試卷
- 國家安全知識教育
- 安全隱患大排查大整治專項行動方案
- 2024-2030年中國停車場建設行業(yè)發(fā)展趨勢投資策略研究報告
- 藍軍戰(zhàn)略課件
- 物業(yè)管理重難點分析及解決措施
- 北京郵電大學《數(shù)據(jù)庫系統(tǒng)》2022-2023學年第一學期期末試卷
- 科學計算語言Julia及MWORKS實踐 課件8 - 基本數(shù)據(jù)類型
- 湖北省黃岡市2023-2024學年高一上學期期末考試化學試題(含答案)
- 中國HDMI高清線行業(yè)市場動態(tài)分析及未來趨勢研判報告
評論
0/150
提交評論