《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件9.2.1 分析用戶(hù)基本信息_第1頁(yè)
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件9.2.1 分析用戶(hù)基本信息_第2頁(yè)
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件9.2.1 分析用戶(hù)基本信息_第3頁(yè)
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件9.2.1 分析用戶(hù)基本信息_第4頁(yè)
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件9.2.1 分析用戶(hù)基本信息_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

構(gòu)建電信運(yùn)營(yíng)商用戶(hù)分群模型電信運(yùn)營(yíng)商用戶(hù)分析任務(wù)描述電信通信服務(wù)的總方針是迅速、準(zhǔn)確、安全、方便。在電信通信服務(wù)的總方針的指引下,通過(guò)客戶(hù)基本信息,將用戶(hù)分類(lèi),對(duì)每類(lèi)用戶(hù)進(jìn)行個(gè)性化服務(wù),最大程度地控制客戶(hù)流失。本任務(wù)的操作將在保護(hù)用戶(hù)信息安全的前提下進(jìn)行。大數(shù)據(jù)時(shí)代,需要堅(jiān)持網(wǎng)絡(luò)安全為人民、網(wǎng)絡(luò)安全靠人民,樹(shù)立正確的網(wǎng)絡(luò)安全觀,提高自身網(wǎng)絡(luò)安全意識(shí)和防護(hù)技能。本任務(wù)通過(guò)對(duì)客戶(hù)性別、年齡、在網(wǎng)時(shí)長(zhǎng)等信息進(jìn)行簡(jiǎn)單的畫(huà)圖來(lái)觀察客戶(hù)基本信息與用戶(hù)在3月是否流失的關(guān)系,進(jìn)行K-Means聚類(lèi)分析,建立用戶(hù)分群模型。任務(wù)要求使用pandas庫(kù)分析用戶(hù)基本信息。使用sklearn庫(kù)進(jìn)行聚類(lèi)分析。使用Matplotlib庫(kù)實(shí)現(xiàn)結(jié)果的可視化。用戶(hù)分群是依據(jù)用戶(hù)的屬性特征和行為特征、交易信息將用戶(hù)群體進(jìn)行分類(lèi),對(duì)其進(jìn)行觀察和分析的方式。從技術(shù)視角,用戶(hù)分群的方式主要有兩種:基于規(guī)則的分群方法(Rule-basedSegmentation)和基于算法的分群方法(ML-basedSegmentation)?;谝?guī)則的分群方法:主要適用于業(yè)務(wù)規(guī)則確定,分群采用的用戶(hù)特征維度單一的場(chǎng)景?;谒惴ǖ姆秩悍椒ǎ褐饕糜谟脩?hù)特征維度高,人工無(wú)法設(shè)定合理分群規(guī)則的場(chǎng)景。相關(guān)知識(shí)聚類(lèi)分析(ClusterAnalysis)和RFM模型(Recency,Frequency,Monetary)是常用的用戶(hù)分群方法。聚類(lèi)分析常見(jiàn)的數(shù)據(jù)挖掘手段,其主要假設(shè)是數(shù)據(jù)間存在相似性。而相似性是有價(jià)值的,因此可以被用于探索數(shù)據(jù)中的特性以產(chǎn)生價(jià)值。RFM模型又稱(chēng)用戶(hù)價(jià)值模型,是網(wǎng)點(diǎn)衡量當(dāng)前用戶(hù)價(jià)值和用戶(hù)潛在價(jià)值的重要工具。相關(guān)知識(shí)用戶(hù)分群把具備某種相同特性的用戶(hù)歸結(jié)在一起,再按照特定的條件選出目標(biāo)用戶(hù),進(jìn)行洞察分析查看用戶(hù)特征。對(duì)客戶(hù)性別、年齡、在網(wǎng)時(shí)長(zhǎng)等信息進(jìn)行可視化處理,觀察并分析客戶(hù)基本信息與用戶(hù)流失的關(guān)系,使企業(yè)由粗放式管理轉(zhuǎn)向精細(xì)化運(yùn)營(yíng)。面對(duì)不同人群差異化的特征和需求,降本增效,激發(fā)更加明顯的競(jìng)爭(zhēng)優(yōu)勢(shì)。為進(jìn)一步提升企業(yè)能力,企業(yè)應(yīng)堅(jiān)持發(fā)揚(yáng)斗爭(zhēng)精神,依靠頑強(qiáng)斗爭(zhēng)打開(kāi)事業(yè)發(fā)展新天地。相關(guān)知識(shí)分析用戶(hù)基本信息構(gòu)建K-Means模型分析用戶(hù)基本信息對(duì)客戶(hù)性別、年齡、在網(wǎng)時(shí)長(zhǎng)等信息進(jìn)行可視化處理,觀察并分析客戶(hù)基本信息與用戶(hù)流失的關(guān)系。1性別分析2年齡分析5用戶(hù)是否有效分析4合約計(jì)劃到期時(shí)間分析6信用等級(jí)分析3在網(wǎng)時(shí)長(zhǎng)分析為了直觀地觀察客戶(hù)性別與用戶(hù)流失之間的關(guān)系,對(duì)處理后的數(shù)據(jù)進(jìn)行性別分析。首先導(dǎo)入相關(guān)庫(kù)及數(shù)據(jù),構(gòu)建性別比率函數(shù)分別計(jì)算流失用戶(hù)和非流失用戶(hù)中的性別比率,使用pie函數(shù)繪制性別比率餅圖。性別分析為了直觀地觀察客戶(hù)年齡與用戶(hù)流失之間的關(guān)系,對(duì)處理后的數(shù)據(jù)進(jìn)行性別分析。使用plot函數(shù)繪制在流失用戶(hù)和非流失用戶(hù)中客戶(hù)年齡的分析散點(diǎn)圖。年齡分析為了直觀地觀察客戶(hù)在網(wǎng)時(shí)長(zhǎng)與用戶(hù)流失之間的關(guān)系,對(duì)處理后的數(shù)據(jù)進(jìn)行在網(wǎng)時(shí)長(zhǎng)分析。使用plot函數(shù)繪制在流失用戶(hù)和非流失用戶(hù)中的客戶(hù)在網(wǎng)時(shí)長(zhǎng)分析折線圖。在網(wǎng)時(shí)長(zhǎng)(月)分析為了直觀地觀察客戶(hù)合約計(jì)劃到期時(shí)間與用戶(hù)流失之間的關(guān)系,對(duì)處理后的數(shù)據(jù)進(jìn)行計(jì)劃到期時(shí)間分析。使用bar函數(shù)繪制在流失用戶(hù)和非流失用戶(hù)中的客戶(hù)計(jì)劃到期時(shí)間頻數(shù)直方圖。合約計(jì)劃到期時(shí)間分析為了直觀地觀察客戶(hù)是否有效與用戶(hù)流失之間的關(guān)系,對(duì)處理后的數(shù)據(jù)進(jìn)行用戶(hù)是否有效分析。使用bar函數(shù)繪制在流失用戶(hù)和非流失用戶(hù)中的客戶(hù)是否有效直方圖。用戶(hù)是否有效分析為了探究無(wú)效用戶(hù)在流失與非流失用戶(hù)群體中的占比情況。使用sum()方法計(jì)算是否有效用戶(hù)的頻數(shù),并使用bar函數(shù)繪制繪制直方圖。用戶(hù)是否有效分析

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論