第8章 商品零售購物籃分析_第1頁
第8章 商品零售購物籃分析_第2頁
第8章 商品零售購物籃分析_第3頁
第8章 商品零售購物籃分析_第4頁
第8章 商品零售購物籃分析_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

商品零售購物籃分析1分析方法與過程目錄背景2小結(jié)3現(xiàn)代商品種類繁多,顧客往往會由于需要購買的商品眾多而變得疲于選擇,且顧客并不會因?yàn)樯唐愤x擇豐富而選擇購買更多的商品。案例背景例如,貨架上有可口可樂和百事可樂,若顧客需要選購可樂若干,或許會同時(shí)購買兩種可樂,但是購買可樂的數(shù)量大多數(shù)情況下不會因?yàn)槠放茢?shù)量增加而增加。繁雜的選購過程往往會給顧客疲憊的購物體驗(yàn)。案例背景對于某些商品,顧客會選擇同時(shí)購買,如面包與牛奶、薯片與可樂等,當(dāng)面包與牛奶或者薯片與可樂分布在商場的兩側(cè),且距離十分遙遠(yuǎn)時(shí),顧客購買的欲望就會減少,在時(shí)間緊迫的情況下顧客甚至?xí)艞壻徺I某些計(jì)劃購買的商品。相反,把牛奶與面包擺放在相鄰的位置,既給顧客提供便利,提升購物體驗(yàn),又提高顧客購買的概率,達(dá)到了促銷的目的。許多商場以打折方式作為主要促銷手段,以更少的利潤為代價(jià)獲得更高的銷量。案例背景打折往往會使顧客增加原計(jì)劃購買商品的數(shù)量,對于原計(jì)劃不打算購買且不必要的商品,打折的吸引力遠(yuǎn)遠(yuǎn)不足。而正確的商品擺放卻能提醒顧客購買某些必需品,甚至吸引他們購買感興趣的商品。因此,為了獲得最大的銷售利潤,銷售什么樣的商品,采用什么樣的促銷策略,商品在貨架上如何擺放,了解顧客的購買習(xí)慣和偏好對銷售商尤其重要。通過對商場銷售數(shù)據(jù)進(jìn)行分析,從而得到顧客的購買行為特征,并根據(jù)發(fā)現(xiàn)的規(guī)律而采取有效的行動,制定商品擺放、商品定價(jià)、新商品采購計(jì)劃,對商場增加銷量并獲取最大利潤有重要意義。思考構(gòu)建零售商品的Apriori關(guān)聯(lián)規(guī)則模型,分析商品之間的關(guān)聯(lián)性。根據(jù)模型結(jié)果給出銷售策略。挖掘目標(biāo)1分析方法與過程目錄背景與挖掘目標(biāo)2小結(jié)3購物籃關(guān)聯(lián)規(guī)則挖掘主要步驟如下:對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)探索性分析,分析商品的熱銷情況與商品結(jié)構(gòu)。對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,轉(zhuǎn)換數(shù)據(jù)形式,使之符合Apriori關(guān)聯(lián)規(guī)則算法要求。在步驟2得到的建模數(shù)據(jù)基礎(chǔ)上,采用Apriori關(guān)聯(lián)規(guī)則算法,調(diào)整模型輸入?yún)?shù),完成商品關(guān)聯(lián)性分析。結(jié)合實(shí)際業(yè)務(wù),對模型結(jié)果進(jìn)行分析,根據(jù)分析結(jié)果給出銷售建議,最后輸出關(guān)聯(lián)規(guī)則結(jié)果。挖掘步驟數(shù)據(jù)挖掘建模的總體流程:總體流程某商品零售企業(yè)共收集了9835個(gè)購物籃的數(shù)據(jù),購物籃數(shù)據(jù)主要包括3個(gè)屬性:id、Goods和Types。各屬性的具體說明如表所示。獲取數(shù)據(jù)表名屬性名稱屬性說明GoodsOrderid商品所屬類別的編號Goods具體的商品名稱GoodsTypesGoods具體的商品名稱Types商品類別探索數(shù)據(jù)特征是了解數(shù)據(jù)的第一步。分析商品熱銷情況和商品結(jié)構(gòu),是為了更好地實(shí)現(xiàn)企業(yè)的經(jīng)營目標(biāo)。商品管理應(yīng)堅(jiān)持商品齊全和商品優(yōu)選的原則,產(chǎn)品銷售基本滿足“二八定律”即80%的銷售額是由20%的商品創(chuàng)造的,這些商品是企業(yè)主要盈利商品,要作為商品管理的重中之重。商品熱銷情況分析和商品結(jié)構(gòu)分析也是商品管理不可或缺的一部分,其中商品結(jié)構(gòu)分析能夠幫助保證商品的齊全性,熱銷情況分析可以助力于商品優(yōu)選。探索性分析1.描述性統(tǒng)計(jì)分析探索數(shù)據(jù)的特征,查看每列屬性、最大值、最小值,是了解數(shù)據(jù)的第一步??梢钥闯?,某商品零售企業(yè)共收集了9835個(gè)購物籃的數(shù)據(jù),售出商品總數(shù)為43367件。探索性分析名稱數(shù)值觀測值43367.00均值4908.59標(biāo)準(zhǔn)差2843.12最小值1.00上四分位數(shù)2455.50中位數(shù)4828.00下四分位數(shù)7380.50最大值9835.002.繪制條形圖分析熱銷商品銷量排行前10商品的銷量及其占比情況,如下表所示。探索性分析商品名稱銷量銷量占比全脂牛奶25135.795%其他蔬菜19034.388%面包卷18094.171%蘇打17153.955%酸奶13723.164%瓶裝水10872.507%根莖類蔬菜10722.472%熱帶水果10322.380%購物袋9692.234%香腸9242.131%銷量排行前10商品的銷量,如下圖所示。通過分析熱銷商品的結(jié)果可知,全脂牛奶銷售量最高,銷量為2513件,占比5.795%;其次是其他蔬菜、面包卷和蘇打,占比分別為4.388%、4.171%、3.955%。探索性分析3.繪制餅圖分析商品結(jié)構(gòu)對每一類商品的熱銷程度進(jìn)行分析,有利于商家制定商品在貨架的擺放策略和位置。若是某類商品較為熱銷,商場可以把此類商品擺放到商場的中心位置,方便顧客選購?;蛘叻旁谏虉錾钐幬恢?,使顧客在購買熱銷商品前經(jīng)過非熱銷商品,增加在非熱銷商品處的停留時(shí)間,促進(jìn)非熱銷產(chǎn)品的銷量。探索性分析原始數(shù)據(jù)中的商品本身已經(jīng)過歸類處理,但是部分商品還是存在一定的重疊,故再次對其進(jìn)行歸類處理。分析歸類后各類別商品的銷量及其占比,并繪制餅圖顯示各類商品的銷量占比情況。探索性分析商品類別銷量銷量占比非酒精飲料759417.51%西點(diǎn)719216.58%果蔬714616.48%米糧調(diào)料518511.96%百貨514111.85%肉類487011.23%酒精飲料22875.27%食品類18704.31%零食14593.36%熟食5411.25%通過分析各類別商品的銷量及其占比情況可知,非酒精飲料、西點(diǎn)、果蔬三類商品銷量差距不大,占總銷量的50%左右,同時(shí),根據(jù)大類劃分發(fā)現(xiàn)和食品相關(guān)的類的銷量總和接近90%,說明了顧客傾向于購買此類產(chǎn)品,而其余商品僅為商場滿足顧客的其余需求而設(shè)定,并非銷售的主力軍。探索性分析查看銷量第一的非酒精飲料類商品的內(nèi)部商品結(jié)構(gòu),并繪制餅圖顯示其銷量占比情況。探索性分析商品類別銷量銷量占比全脂牛奶251333.09%蘇打171522.58%瓶裝水108714.31%水果/蔬菜汁7119.36%咖啡5717.52%超高溫殺菌的牛奶3294.33%其他飲料2793.67%一般飲料2563.37%速溶咖啡730.96%茶380.50%可可飲料220.29%通過分析非酒精飲料內(nèi)部商品的銷量及其占情況可知,全脂牛奶的銷量在非酒精飲料的總銷量中占比超過33%,前3種非酒精飲料的銷量在非酒精飲料的總銷量中占比接近70%,說明了大部分顧客到店購買的飲料為這三種,需要時(shí)常注意貨物的庫存,定期補(bǔ)貨必不可少。探索性分析通過對數(shù)據(jù)探索分析,發(fā)現(xiàn)數(shù)據(jù)數(shù)據(jù)完整,并不存在缺失值。建模之前需要建模之前需要轉(zhuǎn)變數(shù)據(jù)的格式,才能使用apriori函數(shù)進(jìn)行關(guān)聯(lián)分析。數(shù)據(jù)預(yù)處理本章的目標(biāo)是分析商品之間的關(guān)聯(lián)關(guān)系,因此采用關(guān)聯(lián)規(guī)則算法,分析它們之間的關(guān)聯(lián)關(guān)系。關(guān)聯(lián)規(guī)則算法主要用于尋找數(shù)據(jù)中項(xiàng)集之間的關(guān)聯(lián)關(guān)系。它揭示了數(shù)據(jù)項(xiàng)間的未知關(guān)系,基于樣本的統(tǒng)計(jì)規(guī)律,進(jìn)行關(guān)聯(lián)規(guī)則分析。根據(jù)所分析的關(guān)聯(lián)關(guān)系,可從一個(gè)屬性的信息來推斷另一個(gè)屬性的信息。當(dāng)置信度達(dá)到某一閾值時(shí),就可以認(rèn)為規(guī)則成立。Apriori算法是常用的關(guān)聯(lián)規(guī)則算法之一,也是最為經(jīng)典的分析頻繁項(xiàng)集的算法,是第一次實(shí)現(xiàn)在大數(shù)據(jù)集上可行的關(guān)聯(lián)規(guī)則提取的算法。除此之外,還有FP-Tree算法、Eclat算法和灰色關(guān)聯(lián)法等。構(gòu)建模型關(guān)聯(lián)規(guī)則模型的流程圖構(gòu)建模型模型主要由輸入、算法處理、輸出3個(gè)部分組成。輸入部分包括:建模樣本數(shù)據(jù)的輸入;建模參數(shù)的輸入。算法處理部分是采用Apriori關(guān)聯(lián)規(guī)則算法進(jìn)行處理。輸出部分為采用Apriori關(guān)聯(lián)規(guī)則算法進(jìn)行處理后的結(jié)果。構(gòu)建模型模型具體實(shí)現(xiàn)步驟首先設(shè)置建模參數(shù)最小支持度、最小置信度,輸入建模樣本數(shù)據(jù);然后采用Apriori關(guān)聯(lián)規(guī)則算法對建模的樣本數(shù)據(jù)進(jìn)行分析,以模型參數(shù)設(shè)置的最小支持度、最小置信度以及分析目標(biāo)作為條件,如果所有的規(guī)則都不滿足條件,則需要重新調(diào)整模型參數(shù),否則輸出關(guān)聯(lián)規(guī)則結(jié)果。構(gòu)建模型目前,如何設(shè)置最小支持度與最小置信度,并沒有統(tǒng)一的標(biāo)準(zhǔn)。大部分都是根據(jù)業(yè)務(wù)經(jīng)驗(yàn)設(shè)置初始值,然后經(jīng)過多次調(diào)整,獲取與業(yè)務(wù)相符的關(guān)聯(lián)規(guī)則結(jié)果。本案例經(jīng)過多次調(diào)整并結(jié)合實(shí)際業(yè)務(wù)分析,選取模型的輸入?yún)?shù)為:最小支持度0.02、最小置信度0.35。運(yùn)行關(guān)聯(lián)規(guī)則代碼,得到結(jié)果如下圖。構(gòu)建模型根據(jù)多次試驗(yàn),得出了26個(gè)關(guān)聯(lián)規(guī)則。根據(jù)規(guī)則結(jié)果,可整理出購物籃關(guān)聯(lián)規(guī)則模型結(jié)果。構(gòu)建模型lhs

rhs支持度置信度lift{'水果/蔬菜汁'}=>{'全脂牛奶'}0.026640.3684951.44216{'人造黃油'}=>{'全脂牛奶'}0.0241990.4131941.617098{'仁果類水果'}=>{'全脂牛奶'}0.0300970.3978491.557043{'牛肉'}=>{'全脂牛奶'}0.0212510.4050391.58518{'冷凍蔬菜'}=>{'全脂牛奶'}0.0204370.4249471.663094{'本地蛋類'}=>{'其他蔬菜'}0.0222670.3509621.813824{'黃油'}=>{'其他蔬菜'}0.0200310.3614681.868122{'本地蛋類'}=>{'全脂牛奶'}0.0299950.4727561.850203{'黑面包'}=>{'全脂牛奶'}0.0252160.3887151.521293{'糕點(diǎn)'}=>{'全脂牛奶'}0.0332490.3737141.462587{'酸奶油'}=>{'其他蔬菜'}0.0288760.4028372.081924{'豬肉'}=>{'其他蔬菜'}0.0216570.3756611.941476{'酸奶油'}=>{'全脂牛奶'}0.0322320.4496451.759754構(gòu)建模型lhs

rhs支持度置信度lift{'豬肉'}=>{'全脂牛奶'}0.0221660.384481.504719{'根莖類蔬菜'}=>{'全脂牛奶'}0.0489070.4486941.756031{'根莖類蔬菜'}=>{'其他蔬菜'}0.0473820.4347012.246605{'凝乳'}=>{'全脂牛奶'}0.0261310.4904581.919481{'熱帶水果'}=>{'全脂牛奶'}0.0422980.4031011.577595{'柑橘類水果'}=>{'全脂牛奶'}0.0305030.368551.442377{'黃油'}=>{'全脂牛奶'}0.0275550.4972481.946053{'酸奶'}=>{'全脂牛奶'}0.0560240.4016031.571735{'其他蔬菜'}=>{'全脂牛奶'}0.0748350.3867581.513634{'其他蔬菜','酸奶'}=>{'全脂牛奶'}0.0222670.5128812.007235{'全脂牛奶','酸奶'}=>{'其他蔬菜'}0.0222670.3974592.054131{'根莖類蔬菜','全脂牛奶'}=>{'其他蔬菜'}0.0231830.4740122.44977{'根莖類蔬菜','其他蔬菜'}=>{'全脂牛奶'}0.0231830.489271.914833根據(jù)AP算法的結(jié)果,得到26個(gè)關(guān)聯(lián)規(guī)則,對其中4條關(guān)聯(lián)規(guī)則結(jié)果進(jìn)行解釋分析如下。{'其他蔬菜','酸奶'}=>{'全脂牛奶'}:支持度約為2.23%,置信度最大約為51.29%。說明同時(shí)購買酸奶,其他蔬菜和全脂牛奶這3種商品的概率約達(dá)51.29%,而這種情況發(fā)生的可能性約為2.23%。{'其他蔬菜'}=>{'全脂牛奶'}:支持度最大約為7.48%,置信度約為38.68%。說明同時(shí)購買其他蔬菜和全脂牛奶這2種商品的概率約達(dá)38.68%,而這種情況發(fā)生的可能性約為7.48%。{'根莖類蔬菜'}=>{'全脂牛奶'}:支持度約為4.89%,置信度約為44.87%。說明同時(shí)購買根莖類蔬菜和全脂牛奶這三種商品的概率約達(dá)44.87%,而這種情況發(fā)生的可能性約為4.89%。{'根莖類蔬菜'}=>{'其他蔬菜'}:支持度約為4.74%,置信度約為43.47%。說明同時(shí)根莖類蔬菜和其他蔬菜這2種商品的概率約達(dá)43.47%,而這種情況發(fā)生的可能性約為4.74%。模型評價(jià)綜合輸出結(jié)果分析,顧

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論