![大數(shù)據(jù)在B2C電商中的應用 課件_第1頁](http://file4.renrendoc.com/view/bd18c47666b6945ad835689745e9c239/bd18c47666b6945ad835689745e9c2391.gif)
![大數(shù)據(jù)在B2C電商中的應用 課件_第2頁](http://file4.renrendoc.com/view/bd18c47666b6945ad835689745e9c239/bd18c47666b6945ad835689745e9c2392.gif)
![大數(shù)據(jù)在B2C電商中的應用 課件_第3頁](http://file4.renrendoc.com/view/bd18c47666b6945ad835689745e9c239/bd18c47666b6945ad835689745e9c2393.gif)
![大數(shù)據(jù)在B2C電商中的應用 課件_第4頁](http://file4.renrendoc.com/view/bd18c47666b6945ad835689745e9c239/bd18c47666b6945ad835689745e9c2394.gif)
![大數(shù)據(jù)在B2C電商中的應用 課件_第5頁](http://file4.renrendoc.com/view/bd18c47666b6945ad835689745e9c239/bd18c47666b6945ad835689745e9c2395.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
大數(shù)據(jù)在B2C電商中的應用——張昊旅游事業(yè)部頻道組大數(shù)據(jù)在B2C電商中的應用——張昊舉例“推薦系統(tǒng)之王”
“InstantPersonalization”
應用中心的智能算法好友推薦、親密度模型、好友智能分組……定向廣告算法、個性化推薦2…舉例“推薦系統(tǒng)之王”“InstantPersonaliz大數(shù)據(jù)相關應用3用戶行為分析價格預測推薦系統(tǒng)評分預測問題流量分析供應鏈管理實時定制報表廣告精準投放行業(yè)信息監(jiān)控評論挖掘分析傳播熱點分析銷量預測CRM社會化圖譜挖掘LBS大數(shù)據(jù)相關應用3用戶行為分析價格預測推薦系統(tǒng)評分預測問題流量推薦系統(tǒng)4推薦系統(tǒng)4流程架構推薦系統(tǒng)5…用戶行為數(shù)據(jù)庫用戶屬性數(shù)據(jù)庫行為提取行為特征轉換特征向量特征物品相關推薦候選物品集合相關表1相關表2相關表N初始推薦結果過濾排序推薦解釋選擇最終推薦結果用戶行為反饋物品屬性ABC流程架構推薦系統(tǒng)5…用戶行為數(shù)據(jù)庫用戶屬性數(shù)據(jù)庫行為提取行為推薦系統(tǒng)6協(xié)同過濾算法(CF)-UserCF/ItemCF奇異值分解(SVD)/隱語義模型(LFM)對分網(wǎng)絡/二分圖模型利用UGC標簽利用上下文社會化推薦(socialrecommendation)算法融合機器學習從準確性到多樣性推薦算法簡介推薦系統(tǒng)6協(xié)同過濾算法(CF)-UserCF/ItemCF奇推薦系統(tǒng)7協(xié)同過濾算法——基于商品/用戶間的相似度UserbasedCFItembasedCF余弦距離Jaccard距離歐氏距離海明距離推薦系統(tǒng)7協(xié)同過濾算法——基于商品/用戶間的相似度UserUserbasedCFItembasedCF推薦系統(tǒng)8典型應用新聞推薦電子商務、圖書/電影推薦推薦原理有共同愛好的用戶喜歡與用戶之前喜歡的物品類似推薦結果小群體的熱點用戶的興趣傳承個性化要求不太明顯強烈內(nèi)容數(shù)量多較少更新速度快較慢適用領域時效性強、個性化不明顯長尾豐富、個性化需求強烈舉例GroupLens、DiggAmazon、Netflix用戶的新行為推薦結果不一定立即變化推薦結果實時變化推薦解釋難容易以歷史行為解釋協(xié)同過濾算法UserbasedCFItembasedCF推薦系統(tǒng)推薦系統(tǒng)9奇異值分解——探索相似度背后隱含根源分類1分類2分類3興趣1XXXXXXXXX興趣2XXXXXXXXX興趣3XXXXXXXXX推薦系統(tǒng)9奇異值分解——探索相似度背后隱含根源分類1分類2分推薦系統(tǒng)10二分圖模型——一個游走在用戶和商品之間的爬蟲高相似性的判斷標準:兩個頂點間有很多路徑相連;連接兩個頂點間的路徑長度都比較短;連接兩個頂點間的路徑不會出現(xiàn)大的頂點;推薦系統(tǒng)10二分圖模型——一個游走在用戶和商品之間的爬蟲高相推薦系統(tǒng)11算法總結用戶用戶商品特征商品喜歡、購買有相似興趣的好友喜歡、具有相似喜歡包含相似性判斷特征聚類推薦系統(tǒng)11算法總結用戶用戶商品特征商品喜歡、購買有相似興趣推薦系統(tǒng)12預測準確度用戶滿意度覆蓋率多樣性新穎性驚喜度信任度實時性健壯性商業(yè)目標系統(tǒng)評測離線實驗(offlineexperiment)用戶調查(userstudy)在線實驗(onlineexperiment)推薦系統(tǒng)12預測準確度系統(tǒng)評測離線實驗用戶調查在線實驗推薦系統(tǒng)新的挑戰(zhàn)和方案——用戶意圖模糊情景下的多維度補充;平臺電商的店鋪定向、季節(jié)定向;反作弊問題;考慮用戶本身的權重和行為頻度;冷啟動問題;用戶疲勞;
……13推薦系統(tǒng)新的挑戰(zhàn)和方案——13評論挖掘14評論挖掘14評論挖掘15維克托·邁爾-舍恩伯格大數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)挖掘計算機應用信息管理暢銷書“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。喜歡作者說的知道“是什么”就夠了,沒必要知道“為什么”這個理論。奧倫*埃奇奧尼因為自己買到了比同一架飛機乘客貴的機票而非常氣憤,因此他創(chuàng)造了最早的互聯(lián)網(wǎng)搜索引擎。且不說這個引擎的后續(xù),至少埃奇奧尼創(chuàng)立的預測系統(tǒng)幫助乘客節(jié)省了很多錢。我們不需要知道機票為什么漲或者跌,我們只想著用最少的錢去買到同樣的機票,如此,這樣有預見性的數(shù)據(jù)庫就是起到了重要的作用。而在其他領域上,同樣的可以用這樣的大數(shù)據(jù)的思維方式去思考。數(shù)據(jù)不是靜止不動的,需要有變革的思維去看它。而現(xiàn)在的數(shù)據(jù)已經(jīng)成了一種商業(yè)資本,可以創(chuàng)造新的經(jīng)濟利益。從某種程度上說,大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術。簡言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價值信息的能力,就是大數(shù)據(jù)技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業(yè)的潛力?;旧?,人們比以往任何時候都與數(shù)據(jù)或信息交互。谷歌搜索、Facebook的帖子和微博消息使得人們的行為和情緒的細節(jié)化測量成為可能。挖掘用戶的行為習慣和喜好,凌亂紛繁的數(shù)據(jù)背后找到更符合用戶興趣和習慣的產(chǎn)品和服務,并對產(chǎn)品和服務進行針對性地調整和優(yōu)化,……相關度分析自然語言處理這個商品不錯~評論挖掘15維克托·邁爾-舍恩伯格大數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)挖掘計算機評論挖掘16TF1*IDF1+TF2*IDF2+…+TFN*IDFNTF——詞頻:關鍵詞在文本中出現(xiàn)的頻率IDF——逆文本頻率指數(shù)log(D/DW):關鍵詞在所有文本集中出現(xiàn)的頻率越高,IDF越低e.g.“原子能”“的”“應用”TF:0.002、0.035、0.005IDF:8.96、0、1TF*IDF——文本與關鍵詞相關度的科學度量評論挖掘16TF1*IDF1+TF2*IDF2+評論挖掘大數(shù)據(jù)+自然語言處理技術(NLP)17文本相關度評論信息量評論情感分詞消歧互信息特征篩選主題LDA情感分析特征詞聚類詞性標注向量空間模型TF*IDF評論挖掘大數(shù)據(jù)+自然語言處理技術(NLP)17文本相關度評論評論挖掘18(當當網(wǎng))評論挖掘A/B測試結果:顧客體驗提升;購買決策時間變短;點擊評論次數(shù)減少;頁面停留時間降低;轉化率提升;全年貢獻過億;評論挖掘18(當當網(wǎng))評論挖掘A/B測試結果:評論挖掘19評論挖掘19評分預測問題20——4分——3分——5分——?分預測幫助用戶決策評分預測問題20——4分——3分——5分——?分預測幫助用戶評分預測問題21常用算法:基于平均值;基于相似物品;隱語義與矩陣分解模型;算法融合;……評分預測問題21常用算法:歷史銷量價格產(chǎn)品季節(jié)性產(chǎn)品瀏覽量競爭對手情況產(chǎn)品曝光率營銷推廣產(chǎn)品評論供應商質量市場熱點目標用戶特征……銷量預測模型22滿位率↓買斷風險↓毛利↑運營效率↑歷史銷量價格產(chǎn)品季節(jié)性產(chǎn)品瀏覽量競爭對手情況產(chǎn)品曝光率營銷推一個旅游業(yè)的案例23F——近十萬億條價格記錄;票價預測準確率達75%;平均每張機票為旅客節(jié)省50美元;2008年以1.15億美元被微軟收購,并入必應;一個旅游業(yè)的案例23F——On
going——大數(shù)據(jù)+實時處理24Ongoing——大數(shù)據(jù)+實時處理24延伸閱讀25延伸閱讀25謝謝!謝謝!附——大數(shù)據(jù)有多大1分鐘產(chǎn)生的數(shù)據(jù)量:48小時新視頻@Youtube2000000次搜索請求@Google684478條分享消息@Facebook100000條新微博@Twitter3600張照片@Instagram90%的數(shù)據(jù)產(chǎn)生于最近兩年;2020年,非結構化數(shù)據(jù)量10倍于結構化數(shù)據(jù);27附——大數(shù)據(jù)有多大1分鐘產(chǎn)生的數(shù)據(jù)量:27大容量Volume每天新增100TB統(tǒng)計數(shù)據(jù)客戶分析的可用維度1000多個每天處理上百億次用戶行為反饋高速度Velocity實時數(shù)據(jù)收集云數(shù)據(jù)分析調度Veracity精準錯誤數(shù)據(jù)校準上下文環(huán)境過濾Variety多樣性客戶多樣性商品多樣性通過算法和機器學習附——大數(shù)據(jù)之4V28大容量Volume每天新增100TB統(tǒng)計數(shù)據(jù)客戶分析的可用維附——大數(shù)據(jù)之客戶畫像29附——大數(shù)據(jù)之客戶畫像29附——人人“好友智能分組”30返回附——人人“好友智能分組”30返回附——大數(shù)據(jù)之用戶行為31電商網(wǎng)站中的典型用戶行為行為用戶類型數(shù)據(jù)規(guī)模實時展現(xiàn)瀏覽網(wǎng)頁注冊/匿名大×將商品加入購物車注冊中√購買商品注冊中√收藏商品注冊中√評論商品注冊小√給商品評分注冊小√搜索商品注冊/匿名大×點擊搜索結果注冊/匿名大×分享商品注冊小√返回附——大數(shù)據(jù)之用戶行為31電商網(wǎng)站中的典型用戶行為行為用戶類附——推薦系統(tǒng)32幫助用戶快速發(fā)現(xiàn)有用的信息;將新產(chǎn)品推薦給用戶;將商業(yè)上需要宣傳的商品推薦給用戶;不同種類商品的交叉推薦和打包推薦;不同頁面場景下的不同推薦需求;(e.g.首頁熱門和列表長尾)推薦需求附——推薦系統(tǒng)32幫助用戶快速發(fā)現(xiàn)有用的信息;推薦需求大數(shù)據(jù)在B2C電商中的應用——張昊旅游事業(yè)部頻道組大數(shù)據(jù)在B2C電商中的應用——張昊舉例“推薦系統(tǒng)之王”
“InstantPersonalization”
應用中心的智能算法好友推薦、親密度模型、好友智能分組……定向廣告算法、個性化推薦34…舉例“推薦系統(tǒng)之王”“InstantPersonaliz大數(shù)據(jù)相關應用35用戶行為分析價格預測推薦系統(tǒng)評分預測問題流量分析供應鏈管理實時定制報表廣告精準投放行業(yè)信息監(jiān)控評論挖掘分析傳播熱點分析銷量預測CRM社會化圖譜挖掘LBS大數(shù)據(jù)相關應用3用戶行為分析價格預測推薦系統(tǒng)評分預測問題流量推薦系統(tǒng)36推薦系統(tǒng)4流程架構推薦系統(tǒng)37…用戶行為數(shù)據(jù)庫用戶屬性數(shù)據(jù)庫行為提取行為特征轉換特征向量特征物品相關推薦候選物品集合相關表1相關表2相關表N初始推薦結果過濾排序推薦解釋選擇最終推薦結果用戶行為反饋物品屬性ABC流程架構推薦系統(tǒng)5…用戶行為數(shù)據(jù)庫用戶屬性數(shù)據(jù)庫行為提取行為推薦系統(tǒng)38協(xié)同過濾算法(CF)-UserCF/ItemCF奇異值分解(SVD)/隱語義模型(LFM)對分網(wǎng)絡/二分圖模型利用UGC標簽利用上下文社會化推薦(socialrecommendation)算法融合機器學習從準確性到多樣性推薦算法簡介推薦系統(tǒng)6協(xié)同過濾算法(CF)-UserCF/ItemCF奇推薦系統(tǒng)39協(xié)同過濾算法——基于商品/用戶間的相似度UserbasedCFItembasedCF余弦距離Jaccard距離歐氏距離海明距離推薦系統(tǒng)7協(xié)同過濾算法——基于商品/用戶間的相似度UserUserbasedCFItembasedCF推薦系統(tǒng)40典型應用新聞推薦電子商務、圖書/電影推薦推薦原理有共同愛好的用戶喜歡與用戶之前喜歡的物品類似推薦結果小群體的熱點用戶的興趣傳承個性化要求不太明顯強烈內(nèi)容數(shù)量多較少更新速度快較慢適用領域時效性強、個性化不明顯長尾豐富、個性化需求強烈舉例GroupLens、DiggAmazon、Netflix用戶的新行為推薦結果不一定立即變化推薦結果實時變化推薦解釋難容易以歷史行為解釋協(xié)同過濾算法UserbasedCFItembasedCF推薦系統(tǒng)推薦系統(tǒng)41奇異值分解——探索相似度背后隱含根源分類1分類2分類3興趣1XXXXXXXXX興趣2XXXXXXXXX興趣3XXXXXXXXX推薦系統(tǒng)9奇異值分解——探索相似度背后隱含根源分類1分類2分推薦系統(tǒng)42二分圖模型——一個游走在用戶和商品之間的爬蟲高相似性的判斷標準:兩個頂點間有很多路徑相連;連接兩個頂點間的路徑長度都比較短;連接兩個頂點間的路徑不會出現(xiàn)大的頂點;推薦系統(tǒng)10二分圖模型——一個游走在用戶和商品之間的爬蟲高相推薦系統(tǒng)43算法總結用戶用戶商品特征商品喜歡、購買有相似興趣的好友喜歡、具有相似喜歡包含相似性判斷特征聚類推薦系統(tǒng)11算法總結用戶用戶商品特征商品喜歡、購買有相似興趣推薦系統(tǒng)44預測準確度用戶滿意度覆蓋率多樣性新穎性驚喜度信任度實時性健壯性商業(yè)目標系統(tǒng)評測離線實驗(offlineexperiment)用戶調查(userstudy)在線實驗(onlineexperiment)推薦系統(tǒng)12預測準確度系統(tǒng)評測離線實驗用戶調查在線實驗推薦系統(tǒng)新的挑戰(zhàn)和方案——用戶意圖模糊情景下的多維度補充;平臺電商的店鋪定向、季節(jié)定向;反作弊問題;考慮用戶本身的權重和行為頻度;冷啟動問題;用戶疲勞;
……45推薦系統(tǒng)新的挑戰(zhàn)和方案——13評論挖掘46評論挖掘14評論挖掘47維克托·邁爾-舍恩伯格大數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)挖掘計算機應用信息管理暢銷書“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。喜歡作者說的知道“是什么”就夠了,沒必要知道“為什么”這個理論。奧倫*埃奇奧尼因為自己買到了比同一架飛機乘客貴的機票而非常氣憤,因此他創(chuàng)造了最早的互聯(lián)網(wǎng)搜索引擎。且不說這個引擎的后續(xù),至少埃奇奧尼創(chuàng)立的預測系統(tǒng)幫助乘客節(jié)省了很多錢。我們不需要知道機票為什么漲或者跌,我們只想著用最少的錢去買到同樣的機票,如此,這樣有預見性的數(shù)據(jù)庫就是起到了重要的作用。而在其他領域上,同樣的可以用這樣的大數(shù)據(jù)的思維方式去思考。數(shù)據(jù)不是靜止不動的,需要有變革的思維去看它。而現(xiàn)在的數(shù)據(jù)已經(jīng)成了一種商業(yè)資本,可以創(chuàng)造新的經(jīng)濟利益。從某種程度上說,大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術。簡言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價值信息的能力,就是大數(shù)據(jù)技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業(yè)的潛力?;旧?,人們比以往任何時候都與數(shù)據(jù)或信息交互。谷歌搜索、Facebook的帖子和微博消息使得人們的行為和情緒的細節(jié)化測量成為可能。挖掘用戶的行為習慣和喜好,凌亂紛繁的數(shù)據(jù)背后找到更符合用戶興趣和習慣的產(chǎn)品和服務,并對產(chǎn)品和服務進行針對性地調整和優(yōu)化,……相關度分析自然語言處理這個商品不錯~評論挖掘15維克托·邁爾-舍恩伯格大數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)挖掘計算機評論挖掘48TF1*IDF1+TF2*IDF2+…+TFN*IDFNTF——詞頻:關鍵詞在文本中出現(xiàn)的頻率IDF——逆文本頻率指數(shù)log(D/DW):關鍵詞在所有文本集中出現(xiàn)的頻率越高,IDF越低e.g.“原子能”“的”“應用”TF:0.002、0.035、0.005IDF:8.96、0、1TF*IDF——文本與關鍵詞相關度的科學度量評論挖掘16TF1*IDF1+TF2*IDF2+評論挖掘大數(shù)據(jù)+自然語言處理技術(NLP)49文本相關度評論信息量評論情感分詞消歧互信息特征篩選主題LDA情感分析特征詞聚類詞性標注向量空間模型TF*IDF評論挖掘大數(shù)據(jù)+自然語言處理技術(NLP)17文本相關度評論評論挖掘50(當當網(wǎng))評論挖掘A/B測試結果:顧客體驗提升;購買決策時間變短;點擊評論次數(shù)減少;頁面停留時間降低;轉化率提升;全年貢獻過億;評論挖掘18(當當網(wǎng))評論挖掘A/B測試結果:評論挖掘51評論挖掘19評分預測問題52——4分——3分——5分——?分預測幫助用戶決策評分預測問題20——4分——3分——5分——?分預測幫助用戶評分預測問題53常用算法:基于平均值;基于相似物品;隱語義與矩陣分解模型;算法融合;……評分預測問題21常用算法:歷史銷量價格產(chǎn)品季節(jié)性產(chǎn)品瀏覽量競爭對手情況產(chǎn)品曝光率營銷推廣產(chǎn)品評論供應商質量市場熱點目標用戶特征……銷量預測模型54滿位率↓買斷風險↓毛利↑運營效率↑歷史銷量價格產(chǎn)品季節(jié)性產(chǎn)品瀏覽量競爭對手情況產(chǎn)品曝光率營銷推一個旅游業(yè)的案例55F——近十萬億條價格記錄;票價預測準確率達75%;平均每張機票為旅客節(jié)省50美元;2008年以1.15億美元被微軟收購,并入必應;一個旅游業(yè)的案例23F——On
going——大數(shù)據(jù)+實時處理56Ongoing——大數(shù)據(jù)+實時處理24延伸閱讀57
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學年高中政治課時分層作業(yè)9訂立合同有學問含解析新人教版選修5
- 2024-2025學年高中數(shù)學課時分層作業(yè)4平面的基本性質含解析蘇教版必修2
- 2024年高中政治第一單元生活與消費第1課第1框揭開貨幣的神秘面紗作業(yè)含解析新人教版必修1
- 2024年高考化學精準押題練第13題化學實驗基礎含解析
- 2024-2025學年高中物理第五章6向心力練習含解析新人教版必修2
- 檢驗工作人員年終總結
- 大學暑期社會實踐個人總結
- 外科護士工作計劃報告
- 魯人版道德與法治七年級下冊15.2《生命最寶貴》聽課評課記錄
- 東入合作協(xié)議書
- 視頻監(jiān)控系統(tǒng)工程施工組織設計方案
- 食堂食材配送采購 投標方案(技術方案)
- 全國助殘日關注殘疾人主題班會課件
- 工會工作制度匯編
- 液壓動力元件-柱塞泵課件講解
- 2022年版 義務教育《數(shù)學》課程標準
- (正式版)JBT 2603-2024 電動懸掛起重機
- 口腔醫(yī)學美學口腔攝影
- JBT 6697-2023 農(nóng)林拖拉機和機械 電氣設備 基本技術規(guī)范 (正式版)
- 人教版五年級上冊數(shù)學脫式計算100題及答案
- 大學美育課件:外國藝術美
評論
0/150
提交評論