機器學(xué)習(xí)原理與實戰(zhàn)-第9章-航空公司客戶價值分析_第1頁
機器學(xué)習(xí)原理與實戰(zhàn)-第9章-航空公司客戶價值分析_第2頁
機器學(xué)習(xí)原理與實戰(zhàn)-第9章-航空公司客戶價值分析_第3頁
機器學(xué)習(xí)原理與實戰(zhàn)-第9章-航空公司客戶價值分析_第4頁
機器學(xué)習(xí)原理與實戰(zhàn)-第9章-航空公司客戶價值分析_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

航空公司客戶價值分析1數(shù)據(jù)準(zhǔn)備目錄目標(biāo)分析2特征工程3模型訓(xùn)練4性能度量5目前,全球經(jīng)濟環(huán)境和市場環(huán)境正在悄然發(fā)生改變,企業(yè)的業(yè)務(wù)也在逐步由產(chǎn)品為主導(dǎo)向客戶需求為主導(dǎo)轉(zhuǎn)型。一種全新的“以客戶為中心”的業(yè)務(wù)模式正在形成并被提升到前所未有的高度。隨著中國社會經(jīng)濟的發(fā)展,我國民航已經(jīng)從賣方市場轉(zhuǎn)變?yōu)橘I方市場,再加上鐵路提速和全國公路網(wǎng)日益完善,不同運輸方式間的競爭日趨激烈,航空公司面臨的壓力越來越大。航空公司屬于典型的服務(wù)行業(yè),其目的是獲取更多的利潤,然而當(dāng)今航空公司產(chǎn)品同質(zhì)化現(xiàn)象嚴(yán)重,并且競爭激烈,客戶資源成為航空公司最為短缺的資源,誰擁有的客戶資源多,誰的核心競爭力就強,獲得的利潤就會更多。背景客戶營銷戰(zhàn)略的倡導(dǎo)者JayCurry&AdamCurry從國外數(shù)百家公司進行了客戶營銷實施的經(jīng)驗中提煉了如下經(jīng)驗。公司收入的80%來自頂端的20%的客戶。20%的客戶帶來的利潤率能夠達到100%。90%以上的收入來自現(xiàn)有客戶。大部分的營銷預(yù)算經(jīng)常被用在非現(xiàn)有客戶上。5%至30%的客戶在客戶金字塔中具有升級潛力。客戶金字塔中客戶升級2%,意味著銷售收入增加10%,利潤增加50%。背景雖然這些經(jīng)驗也許并不完全準(zhǔn)確,但是客戶作為航空公司的主要利潤來源,要求航空公司不斷地認(rèn)識、發(fā)現(xiàn)、開發(fā)和滿足客戶的需求,與客戶建立一種穩(wěn)定的客戶關(guān)系。這一現(xiàn)實情況揭示了新時代客戶分化的趨勢,而這種趨勢說明了進行客戶價值分析的必要性。目前各航空公司都已認(rèn)識到這一關(guān)鍵因素,并且將客戶價值分析作為公司發(fā)展戰(zhàn)略之一。本案例將在航空公司客戶數(shù)據(jù)的基礎(chǔ)上,建立合理的客戶價值模型,對客戶進行分群,分析比較不同客戶群的客戶價值,為企業(yè)提供更精準(zhǔn)的策略依據(jù),幫助企業(yè)制定更加符合市場行情和企業(yè)現(xiàn)狀的營銷策略,為企業(yè)帶來更多的利潤。背景目前該航空公司已積累了大量的會員檔案信息和其乘坐航班記錄,以2014年3月31日為結(jié)束時間抽取兩年內(nèi)有乘機記錄的所有客戶的詳細(xì)數(shù)據(jù)。數(shù)據(jù)包含會員卡號、入會時間、性別、年齡、會員卡級別、工作地城市、工作地所在省份、工作地所在國家、觀測窗口結(jié)束時間、觀測窗口乘機積分、飛行公里數(shù)、飛行次數(shù)、飛行時間、乘機時間間隔、平均折扣率等特征。數(shù)據(jù)說明特征名稱特征說明客戶基本信息MEMBER_NO會員卡號FFP_DATE入會時間FIRST_FLIGHT_DATE第一次飛行日期GENDER性別FFP_TIER會員卡級別WORK_CITY工作地城市數(shù)據(jù)說明特征名稱特征說明客戶基本信息WORK_PROVINCE工作地所在省份WORK_COUNTRY工作地所在國家AGE年齡乘機信息FLIGHT_COUNT觀測窗口內(nèi)的飛行次數(shù)LOAD_TIME觀測窗口的結(jié)束時間LAST_TO_END最后一次乘機時間至觀測窗口結(jié)束時長avg_discount平均折扣率SUM_YR觀測窗口的票價收入SEG_KM_SUM觀測窗口的總飛行公里數(shù)LAST_FLIGHT_DATE末次飛行日期數(shù)據(jù)說明特征名稱特征說明乘機信息AVG_INTERVAL平均乘機時間間隔MAX_INTERVAL最大乘機間隔積分信息EXCHANGE_COUNT積分兌換次數(shù)EP_SUM總精英積分PROMOPTIVE_SUM促銷積分PARTNER_SUM合作伙伴積分POINTS_SUM總累計積分POINT_NOTFLIGHT非乘機的積分變動次數(shù)BP_SUM總基本積分結(jié)合目前航空公司的數(shù)據(jù)情況,可以實現(xiàn)以下目標(biāo)。借助航空公司客戶數(shù)據(jù),對客戶進行分群。對不同的客戶類別進行特征分析,比較不同客戶類別客戶的客戶價值。對不同價值的客戶類別提供個性化服務(wù),制定相應(yīng)的營銷策略。分析目標(biāo)本案例的總體流程主要包括以下4個步驟。抽取航空公司2012年4月1日至2014年3月31日的數(shù)據(jù)。對抽取的數(shù)據(jù)進行數(shù)據(jù)清洗、特征構(gòu)建和標(biāo)準(zhǔn)化等操作?;赗FM模型,使用K-Means算法進行客戶分群。針對模型結(jié)果得到不同價值的客戶,采用不同的營銷手段,提供定制化的服務(wù)。分析目標(biāo)航空公司客戶價值分析總體流程如下圖所示。分析目標(biāo)1數(shù)據(jù)準(zhǔn)備目錄目標(biāo)分析2特征工程3模型訓(xùn)練4性能度量5國內(nèi)某航空公司提供的原始數(shù)據(jù)尚未經(jīng)過處理,數(shù)據(jù)質(zhì)量可能尚未達到可以直接用于建模的程度,可能存在缺失值、異常值等問題,這些問題會導(dǎo)致建立的模型不夠精確,為盡可能地排除干擾因素、保證模型的可靠性,需要進行必要的數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備由于航空公司客戶乘機記錄信息數(shù)據(jù)量很大,因此在獲取數(shù)據(jù)時,對原始數(shù)據(jù)進行截取,以2014年3月31日為結(jié)束時間,選取寬度為兩年(2012年4月1日~2014年3月31日)的時間段作為分析觀測窗口,抽取觀測窗口內(nèi)有乘機記錄的所有客戶的詳細(xì)數(shù)據(jù)形成歷史數(shù)據(jù),總共62988條記錄。截取數(shù)據(jù)后對數(shù)據(jù)進行探索,在數(shù)據(jù)探索過程中,發(fā)現(xiàn)數(shù)據(jù)中存在缺失值和異常值,具體表現(xiàn)為票價為空值、或票價為0、或折扣率為0、或總飛行公里數(shù)為0的記錄。這些值的存在會對模型的建立產(chǎn)生不可忽視的影響,如模型的不確定性會變得更加顯著,其蘊含的規(guī)律更難把握,甚至導(dǎo)致模型輸出的結(jié)果不可靠,因此在數(shù)據(jù)清洗過程中要重點對這兩類數(shù)據(jù)進行處理。數(shù)據(jù)探索在數(shù)據(jù)清洗過程中,因為原始數(shù)據(jù)量大,缺失值和異常值在數(shù)據(jù)集中占比較小,所以需要對缺失值和異常值均進行刪除處理,即丟棄票價為0,或平均折扣率為0,或總飛行公里數(shù)為0的記錄。數(shù)據(jù)清洗1數(shù)據(jù)準(zhǔn)備目錄目標(biāo)分析2特征工程3模型訓(xùn)練4性能度量5在建模之前需要對原始數(shù)據(jù)特征進行處理,篩選出更好的特征,才能獲取更好的訓(xùn)練數(shù)據(jù),讓建立的模型能夠得到更加精確的結(jié)果。特征構(gòu)造是指從原始數(shù)據(jù)中人工的構(gòu)建一些具有實際意義的特征,本案例借助RFM模型進行特征構(gòu)造。特征工程RFM模型是識別客戶價值應(yīng)用較為廣泛的模型,RFM模型具體的含義如下。R(Recency)R(Recency)指的是最近一次消費時間與截止時間的間隔,簡稱時間間隔。通常情況下,最近一次消費時間與截止時間的間隔越短,對即時提供的商品或是服務(wù)也最有可能感興趣。這也是消費時間間隔0至6個月的顧客收到的溝通信息多于1年以上的顧客的原因。最近一次消費時間與截止時間的間隔不僅能夠為確定促銷客戶群體提供依據(jù),還能夠從中得出企業(yè)發(fā)展的趨勢。如果分析報告顯示最近一次消費時間很近的客戶在增加,則表示該公司是個穩(wěn)步上升的公司。反之,最近一次消費時間很近的客戶越來越少,則說明該公司需要找到問題所在,及時調(diào)整營銷策略。特征構(gòu)造1.RFM模型F(Frequency)F(Frequency)指顧客在某段時間內(nèi)所消費的次數(shù),簡稱消費頻率??梢哉f消費頻率越高的顧客,也是滿意度越高的顧客,其忠誠度也就越高,顧客價值也就越大。增加顧客購買的次數(shù)意味著從競爭對手處爭取市場占有率,賺取營業(yè)額。商家需要做的是通過各種營銷方式,去不斷地刺激顧客消費,提高他們的消費頻率,提升顧客的復(fù)購率。特征構(gòu)造M(Monetary)M(Monetary)指顧客在某段時間內(nèi)所消費的金額,簡稱消費金額。消費金額越大的顧客,他們的消費能力自然也就越大,這就是所謂“20%的顧客貢獻了80%的銷售額”的二八法則。而這批顧客也必然是商家在進行營銷活動時需要特別照顧的群體,尤其是在商家前期資源不足的時候。不過需要注意一點,不論采用哪種營銷方式,以不對顧客造成騷擾為大前提,否則營銷只會產(chǎn)生負(fù)面效果。在RFM模型理論中,時間間隔、消費頻率、消費金額是判別客戶價值最重要的特征,這3個特征對營銷活動的具有十分重要的意義,其中,時間間隔是最有力的特征。特征構(gòu)造RFM模型包括3個特征,無法用平面坐標(biāo)圖來展示,所以這里使用三維坐標(biāo)系進行展示,X軸表示Recency,Y軸表示Frequency,Z軸表示Monetary,每個軸一般會分成5級表示程度,1為最小,5為最大。需要特別說明的是,R特征,在X軸上R值越大代表該類客戶最近一次消費與截止時間的消費間隔越短,客戶R維度上的質(zhì)量越好。X軸表示R特征,Y軸表示F特征,Z軸表示M指標(biāo),每個軸上劃分5等級,等價于將客戶劃分為5×5×5=125。這里劃分為5級并不是嚴(yán)格的要求,一般是根據(jù)實際研究需求和顧客的總量進行劃分,對于是否等分的問題取決于該維度上客戶的分布規(guī)律。特征構(gòu)造2.RFM模型解讀通過右圖可以看出,左上角方框的客戶RFM特征取值為155。消費的近度R值是比較小的,說明該類客戶最近都沒有來店消費,原因可能是因為最近比較忙或?qū)ΜF(xiàn)有的產(chǎn)品或服務(wù)不滿意,或是找到了更好的商家。R特征數(shù)值變小需要企業(yè)管理人員引起重視,說明該類客戶可能流失,對企業(yè)造成損失。消費頻率F很高,說明客戶很活躍,經(jīng)常到商家消費。消費金額M值很高,說明該類客戶是具備一定的消費能力,為店里貢獻了很多的營業(yè)額。這類型客戶總體分析比較優(yōu)質(zhì),但是R特征時間近度值較小,其往往是需要針對進行營銷優(yōu)化的客戶群體。特征構(gòu)造同理,若客戶RFM特征取值為555。則可以判定該客戶為最優(yōu)質(zhì)客戶,即該類客戶最近有到商家消費,消費頻率很高,消費金額很大,該類客戶往往是企業(yè)利益的主要貢獻者,是需要重點關(guān)注與維護的客戶。特征構(gòu)造在RFM模型中,消費金額表示客戶在一段時間內(nèi)購買該企業(yè)產(chǎn)品金額的總和。然而航空票價受到多種因素(如距離、艙位等級)的影響,因此消費同樣金額的不同客戶對航空公司的價值可能是不同的,如一位購買長航線,低等級艙位票的旅客與一位購買短航線,高等級艙位票的旅客相比,后者對于航空公司而言價值可能更高。因此RFM模型中的消費金額這一特征并不適用于航空公司客戶價值分析。本案例在RFM模型的基礎(chǔ)上,選擇客戶在一定時間內(nèi)累積的飛行里程M、客戶在一定時間內(nèi)乘坐艙位所對應(yīng)的折扣系數(shù)的平均值C。同時,因為航空公司會員入會時間的長短在一定程度上能夠影響客戶價值,所以在模型中增加客戶關(guān)系長度L,作為區(qū)分客戶的另一特征。特征構(gòu)造3.特征構(gòu)造本案例選擇客戶關(guān)系長度L、時間間隔R、消費頻率F、飛行里程M和折扣系數(shù)的平均值C作為航空公司識別客戶價值的特征,記為LRFMC模型。特征選擇LRFMC會員入會時間距觀測窗口結(jié)束的月數(shù)客戶最近一次乘坐公司飛機距觀測窗口結(jié)束的月數(shù)客戶在觀測窗口內(nèi)乘坐公司飛機的次數(shù)客戶在觀測窗口內(nèi)累計的飛行里程客戶在觀測窗口內(nèi)乘坐艙位所對應(yīng)的折扣系數(shù)的平均值根據(jù)航空公司客戶價值LRFMC模型,選擇與LRFMC特征相關(guān)的6個特征:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、avg_discount、SEG_KM_SUM、LAST_TO_END。特征選擇LOAD_TIMEFFP_DATELAST_TO_ENDFLIGHT_COUNTSEG_KM_SUMAVG_DISCOUNT2014/3/312013/3/1623141268501.022014/3/312012/6/266651847300.762014/3/312009/12/8233603871.272014/3/312009/12/101236622591.022014/3/312011/8/251422547301.362014/3/312012/9/262326500241.29特征選擇LOAD_TIMEFFP_DATELAST_TO_ENDFLIGHT_COUNTSEG_KM_SUMAVG_DISCOUNT2014/3/312010/12/27775611600.942014/3/312009/10/21674489281.052014/3/312010/4/151125434991.332014/3/312007/1/262236687600.88由于選取的L、R、F、M、C特征在原始數(shù)據(jù)中并沒有直接給出,因此需要根據(jù)原始數(shù)據(jù)特征進行特征變換得到需要的特征。L=觀測窗口的結(jié)束時間-入會時間=LOAD_TIME-FFP_DATER=最后一次乘機時間至觀察窗口末端時長=LAST_TO_ENDF=觀測窗口的飛行次數(shù)=FLIGHT_COUNTM=觀測窗口總飛行公里數(shù)=SEG_KM_SUMC=平均折扣率=avg_discount特征變換1數(shù)據(jù)準(zhǔn)備目錄目標(biāo)分析2特征工程3模型訓(xùn)練4性能度量5采用K-Means聚類算法對航空公司客戶進行分群,K-Means聚類需要預(yù)先給出k值,即需要事先指定聚類數(shù)目,本案例根據(jù)對業(yè)務(wù)的理解與分析結(jié)合Calinski-Harabasz指數(shù)確定聚類數(shù)目k,Calinski-Harabasz指數(shù)越大表示聚類效果越好,在建模過程中k取Calinski-Harabasz指數(shù)最大值對應(yīng)的聚類數(shù)。模型訓(xùn)練1數(shù)據(jù)準(zhǔn)備目錄目標(biāo)分析2特征工程3模型訓(xùn)練4性能度量5本案例中K-Means模型采用歷史數(shù)據(jù)進行建模,隨著時間的變化,分析數(shù)據(jù)的觀測窗口在變化,航空公司客戶的數(shù)據(jù)信息也在變化。因此,考慮業(yè)務(wù)的實際情況,建議每個月運行一次該模型,通過聚類判斷新增加的客戶所屬的客戶群,同時分析新增客戶特征的價值。如果新增加客戶數(shù)據(jù)的實際情況與判斷結(jié)果差異較大,那么需要業(yè)務(wù)部門重點關(guān)注,查看出現(xiàn)差異的原因并確認(rèn)模型的穩(wěn)定性,如果模型穩(wěn)定性變化較大,那么需要重新訓(xùn)練聚類模型。性能度量客戶分群聚類結(jié)果如表所示。結(jié)果分析聚類類別聚類個數(shù)聚類中心ZLZRZFZMZC客戶群155630.4793-0.79602.43842.38320.3819客戶群212939-0.30921.6590-0.5721-0.5359-0.0183客戶群3172531.1388-0.3667-0.0957-0.10490.0957客戶群426288-0.6961-0.4085-0.1696-0.1698-0.1343根據(jù)聚類結(jié)果繪制雷達圖,如圖所示。結(jié)果分析客戶群1在特征F、M處的值最大,在特征R處的值最小,說明客戶群1消費頻率和累積飛行里程較大,消費時間間隔較小,這類客戶需要航空公司重點關(guān)注并保持良好關(guān)系,稱F、M、R特征為客戶群1的優(yōu)勢特征??蛻羧?在L、C特征處的值最小,說明客戶群2入會時間較短、享受的平均折扣系數(shù)較小??蛻羧?在R特征處的值最大,在F、M特征處的值最小,說明客戶群3消費頻率和累積飛行里程較小,消費時間間隔較大,這類客戶可能只有在機票打折的時候才會乘坐航空公司航班,稱F、M、R特征為客戶群3的弱勢特征??蛻羧?在特征L處的值最大,說明客戶群4入會時間較長。結(jié)果分析每個客戶群的優(yōu)勢特征和弱勢特征總結(jié)如表所示,其中正常字體表示最大值,加粗字體表示次大值,斜體字體表示最小值。結(jié)果分析群類別優(yōu)勢特征弱勢特征客戶群1FMR客戶群2LC客戶群3FMR客戶群4LFM重要保持客戶平均折扣系數(shù)C較高,時間間隔R較低,消費頻率(乘機次數(shù))F或累積飛行里程M較高。這類客戶是航空公司最理想的客戶,他們?yōu)楹娇展編砹舜蟛糠值睦麧?,但是這類客戶占的比例比較小,航空公司

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論