手機上的大數(shù)據(jù) 用戶行為模式的挖掘和利用_第1頁
手機上的大數(shù)據(jù) 用戶行為模式的挖掘和利用_第2頁
手機上的大數(shù)據(jù) 用戶行為模式的挖掘和利用_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

手機上的大數(shù)據(jù)用戶行為模式的挖掘和利用

通過手機閱讀、手機音樂上的用戶行為,我們可以看到手機大數(shù)據(jù)在移動互聯(lián)網(wǎng)應用上的威力,但同時,手機上的大數(shù)據(jù)也不是萬能的,它的發(fā)展還面臨著很多實際的問題和挑戰(zhàn)。數(shù)據(jù)的稀疏性智能手機端的App應用數(shù)以十萬計,但是每個應用中兩個用戶之間選擇的重疊非常少,如果用用戶和商品之間已有的選擇關系占所有可能存在的選擇關系的比例來衡量系統(tǒng)的稀疏性,在我們研究的幾個App數(shù)據(jù)中,稀疏度均不超過4%,其實這些其實都是非常密的數(shù)據(jù)。想想一個具有千萬級用戶,百萬級歌手的App,平均而言一個用戶能聽100首歌嗎,估計不能,所以稀疏度應該在萬分之一或以下的量級。這個問題本質上是無法完全克服的,但是有很多辦法,可以在相當程度上緩解這個問題。比如擴散方法、隨機缺省值方法、隨機選擇等冷啟動問題在我們前面討論的音樂APP中,我們發(fā)現(xiàn)歌曲的覆蓋只有2%左右,這個是由于大量歌曲出于冷啟動狀態(tài)造成的。這是因為新商品由于被選擇次數(shù)很少或沒有,難以找到合適的辦法推薦給用戶結論。最近一個有趣的研究顯示,新用戶更容易選擇特別流行的商品—這無論如何是一個好消息,說明使用熱歌榜也能獲得不錯的結果。大數(shù)據(jù)處理與增量計算問題盡管數(shù)據(jù)很稀疏,大部分數(shù)據(jù)都包含百千萬計的用戶,與此同時新用戶不停進入系統(tǒng)。數(shù)據(jù)量不僅大,而且數(shù)據(jù)本身還時時動態(tài)變化,如何快速高效處理這些數(shù)據(jù)成為迫在眉睫的問題。在這個大前提下,算法時間和空間的復雜性,尤其是前者,獲得了空前重視。一般而言,一個高效的算法,要么自身復雜性很低,要么能夠很好并行化,要么兩者兼具。隨著加入的信息量的增多,最終每過一段時間還是需要利用全局數(shù)據(jù)重新進行計算。更先進但也更苦難的辦法,是設計出一種算法,能夠保證其誤差不會累積,也就是說其結果與利用全部數(shù)據(jù)重新計算的結果之間的差異不會單調(diào)上升。用戶行為模式的挖掘和利用深入挖掘用戶的行為模式能更準確的抓住用戶喜好,從而有希望做出更好的用戶體驗。譬如說在音樂APP中,新用戶和老用戶具有很不一樣的選擇模式:一般而言,新用戶傾向于選擇熱門的歌曲,而老用戶對歌曲的多樣性關注更多。用戶行為的時空統(tǒng)計特性也可以用于提高者設計針對特定場景的應用。舉個例子,在進行手機個性化閱讀推薦的時候,如果曾經(jīng)的數(shù)據(jù)顯示某個用戶只在7點到8點之間有一個小時左右的手機閱讀行為(可能是上班時在地鐵或者公交車上),那么9點鐘發(fā)送一個電子書閱讀的短信廣告就是很不明智的選擇。從含時數(shù)據(jù)中還可以分析出影響用戶選擇的長期和短期的興趣,通過將這兩種效應分離出來,可以明顯提高推薦的精確度。多維數(shù)據(jù)的交叉利用目前手機端的APP還出于孤立的狀態(tài),并沒有真正的完成數(shù)據(jù)打通及數(shù)據(jù)共享的地步。想象如果能夠把這些數(shù)據(jù)整合起來,特別是知道每個節(jié)點身份的對應關系(不需要知道你真實身份,只需要知道不同APP中存在的若干節(jié)點是同一個人),可以帶來的巨大的社會經(jīng)濟價值。舉個例子,你可能已經(jīng)在新浪微博上關注了很多數(shù)據(jù)挖掘達人的微博,并且分享了很多算法學習的心得和問題,當你第一次上當當網(wǎng)購書的時候,如果主頁向你推薦數(shù)據(jù)挖掘的最新專著并附有折扣,你會心動嗎?所以多維數(shù)據(jù)挖掘是真正有望解決系統(tǒng)內(nèi)部冷啟動問題的法寶——只要用戶在系統(tǒng)外部的其他系統(tǒng)有過活動。目前有很多技術方法可以實現(xiàn)這種多維數(shù)據(jù)挖掘,比如統(tǒng)計物理學的物質擴散、熱傳導方法,機器學習的遷移學習方法都有望解決這種多維數(shù)據(jù)挖掘。結論與展望由于移動互聯(lián)網(wǎng)的迅速崛起,讓互聯(lián)網(wǎng)大數(shù)據(jù)變得更為多樣、豐富。它不但可以作為互聯(lián)網(wǎng)大數(shù)據(jù)的一個有益補充,而且還可以作為移動互聯(lián)網(wǎng)新業(yè)務本身的行動指導。在市場營銷領域,數(shù)據(jù)可以用來洞察客戶,例如衡量他們的生命周期價值或者預測可能的購買行為。對于整個企業(yè)而言,利用數(shù)據(jù)進行分析和應對的能力,對于進行正確的決策并最終取得更好的業(yè)績是至關重要的。真正實現(xiàn)“精準營銷”需要底層海量的用戶行為數(shù)據(jù)做支撐,網(wǎng)絡營銷追求的都不應是曝光率,而是用戶轉化率。而對用戶轉化過程進行有效的數(shù)據(jù)分析,可實現(xiàn)效果的優(yōu)化。效果可從三個層面分解:目標是否清晰、向過程要效果,最終目標達成率就是效果。利用數(shù)據(jù)工具控制和優(yōu)化營銷過程,可不斷提升ROI效率。這需要具體了解客戶的業(yè)務發(fā)展目標和推廣需求,可以考慮借助專業(yè)的第三方服務公司作有關于網(wǎng)絡營銷策略的效果評估。以制定出或調(diào)整有關于網(wǎng)絡營銷策略。一般來說,對于不同的營銷平臺會有不同的廣告形式投放,從而產(chǎn)生的效果也多種多樣,各家說各家的好。網(wǎng)絡營銷中,品牌認知、提升偏好、主動尋找、購買轉化、分享/再購各階段,分別對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論