個性化推薦在移動互聯(lián)網(wǎng)業(yè)務(wù)中的應(yīng)用_第1頁
個性化推薦在移動互聯(lián)網(wǎng)業(yè)務(wù)中的應(yīng)用_第2頁
個性化推薦在移動互聯(lián)網(wǎng)業(yè)務(wù)中的應(yīng)用_第3頁
個性化推薦在移動互聯(lián)網(wǎng)業(yè)務(wù)中的應(yīng)用_第4頁
個性化推薦在移動互聯(lián)網(wǎng)業(yè)務(wù)中的應(yīng)用_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

個性化推薦在移動互聯(lián)網(wǎng)業(yè)務(wù)中的應(yīng)用摘要:以SoLoMo為標(biāo)志的新一輪商業(yè)模式帶動了移動互聯(lián)網(wǎng)時代用戶的上網(wǎng)行為及消費方式的轉(zhuǎn)變,用戶對互動性、實時性服務(wù)的需求愈發(fā)迫切,服務(wù)差異化和需求個性化的期望也為數(shù)據(jù)挖掘和應(yīng)用提供了新的機遇和挑戰(zhàn)。本文從移動互聯(lián)網(wǎng)用戶的行為知識庫開放平臺、智能化用戶模型關(guān)鍵技術(shù)、個性化信息推薦及應(yīng)用等幾個方面,探索如何構(gòu)造一個共贏的移動生態(tài)產(chǎn)業(yè)鏈體系。

關(guān)鍵詞:SoLoMo,用戶行為分析,云計算,數(shù)據(jù)挖掘

1前言

2011年2月JohnDoerr首次提出“SoLoMo”概念后,由social(社交)、local(本地化)和mobile(移動)所標(biāo)識的這一新的移動互聯(lián)網(wǎng)發(fā)展趨勢被業(yè)界廣泛認(rèn)可,認(rèn)為SoLoMo模式是用戶消費模式、基礎(chǔ)信息建設(shè)、移動技術(shù)變革等多方面的融合和統(tǒng)一。中國電信集團公司(以下簡稱中國電信)在向現(xiàn)代化“綜合信息服務(wù)提供商”的轉(zhuǎn)型過程中,業(yè)務(wù)模式互聯(lián)網(wǎng)化的特性逐步顯現(xiàn)并越來越明顯;特別是在移動互聯(lián)網(wǎng)進入高速發(fā)展時期后,根據(jù)中國電信對移動互聯(lián)網(wǎng)時代發(fā)展的精準(zhǔn)解讀和定位而提出的“新三者”戰(zhàn)略目標(biāo)表明,移動業(yè)務(wù)應(yīng)用的一個重要方向就是要站在移動互聯(lián)網(wǎng)時代的前列,并加強了其在價值高端區(qū)域的地位。

在SoLoMo趨勢下,成功的移動互聯(lián)網(wǎng)應(yīng)用再次證明,要以戰(zhàn)略性的高度來重視客戶的需求和體驗,技術(shù)和應(yīng)用兩手抓,更多地激發(fā)用戶在應(yīng)用中互動性、實時性的參與意識,充分運用數(shù)據(jù)挖掘理念,精確聚焦用戶需求,為用戶提供個性化、差異化的服務(wù);以產(chǎn)品的生命周期理論為指導(dǎo),適時更新產(chǎn)品功能或開發(fā)出新產(chǎn)品,持續(xù)刺激用戶對產(chǎn)品的興趣,增加用戶黏性,實現(xiàn)用戶價值最大化。

2業(yè)務(wù)運營發(fā)展的關(guān)鍵問題

移動互聯(lián)網(wǎng)時代,用戶的規(guī)?;?jīng)營愈發(fā)重要,沒有市場份額作基礎(chǔ)就難言生存,更別談發(fā)展。工業(yè)和信息化部發(fā)布的統(tǒng)計數(shù)據(jù)顯示,截至2011年年底,我國的3G用戶總數(shù)達1.28億戶,其中,中國電信的3G用戶超過3700萬戶,且有近一半的3G用戶使用中國電信天翼智能終端。這些智能終端為移動互聯(lián)網(wǎng)業(yè)務(wù)的興起和發(fā)展奠定了強有力的基礎(chǔ),除手機移動終端外,其他各種平板電腦、電子閱讀器、移動導(dǎo)航等設(shè)備終端同樣也承載著大量的移動應(yīng)用。

相比于傳統(tǒng)的固話、PC互聯(lián)網(wǎng)業(yè)務(wù),移動互聯(lián)網(wǎng)時代是個性化更明顯的時代,用戶提出了更高的能動性需求:用戶不再滿足于被動地接受信息瀏覽、信息推送等服務(wù)模式,而是希望以參與者的身份與內(nèi)容提供商一起通過自制或定制的方式來展示自己的獨特個性,這也是SNS、UGC等在社交媒體網(wǎng)站火爆的重要原因。因此,移動互聯(lián)網(wǎng)業(yè)務(wù)更需要收集這些用戶的行為特征,以新穎的創(chuàng)意和可持續(xù)的功能優(yōu)化來吸引用戶,以極致的用戶體驗來提高用戶的黏性,并在規(guī)模化的基礎(chǔ)上,提供便捷新穎的交互性產(chǎn)品,促進移動互聯(lián)網(wǎng)類業(yè)務(wù)的創(chuàng)新和發(fā)展。

在移動互聯(lián)網(wǎng)業(yè)務(wù)中,以滿足用戶個性化需求為關(guān)鍵出發(fā)點,成功把握移動互聯(lián)網(wǎng)時代個性化、差異化的市場先機,甚至成為業(yè)務(wù)規(guī)則的制定者,需要把移動互聯(lián)網(wǎng)的內(nèi)容、產(chǎn)品與用戶的年齡、身份、職業(yè)等自然屬性和消費特點、個性偏好、動態(tài)需求等特點相關(guān)聯(lián),結(jié)合下面描述的移動互聯(lián)網(wǎng)業(yè)務(wù)特點,以數(shù)據(jù)挖類服務(wù)為代表的LBS應(yīng)用中,地理信息以及用戶身份及狀態(tài)跟商業(yè)消費更容易契合而創(chuàng)造商機。

軟件功能:以終端定制為例,除了進一步繁榮軟件應(yīng)用商店類似的模式之外,還需要關(guān)注當(dāng)前現(xiàn)狀。由于終端的種類繁多,給軟件的適配造成很大困難;同時仍有部分智能終端用戶在軟件的選擇、安裝、升級維護過程存在一定程度的困難,因此采用終端定制成為電信運營商備受青睞的選擇,可以將電信主推服務(wù)與移動終端深度整合,大幅度提升用戶體驗的同時,還可以盡可能圈進部分非智能手機,避免失掉這部分用戶群。

2.5服務(wù)綜合化是產(chǎn)品從用戶規(guī)模化走向盈利的首選途徑

移動、社交和云技術(shù),作為一種綜合的驅(qū)動力,改變了人們的聯(lián)系內(nèi)容、聯(lián)系方式以及交易方式,單獨的垂直搜索類服務(wù)已經(jīng)很難滿足用戶的需求。信息獲取、信息分享、一鍵支付這類需求要求應(yīng)用的綜合化,使得用戶從一個入口進入后可以享受多種服務(wù)(如導(dǎo)航門戶、應(yīng)用商店、搜索引擎、社區(qū)門戶、音樂、視頻、游戲等),進而實現(xiàn)精準(zhǔn)廣告投放、流量經(jīng)營、交叉營銷等盈利模式。

3數(shù)據(jù)挖掘工具及算法

本節(jié)重點分析基于商業(yè)和開源的挖掘工具、算法的特點及優(yōu)劣,以及基于移動業(yè)務(wù)建立面向精確營銷的智能化用戶模型所面對的關(guān)鍵問題及解決方案。

據(jù)RexerAnalytics2010年度數(shù)據(jù)挖掘調(diào)查的結(jié)果顯示,當(dāng)前數(shù)據(jù)挖掘的主要特點呈現(xiàn)如下特征[1]。

·從挖掘算法上來看,決策樹、回歸和聚類分析依然是最常用的算法,且主要應(yīng)用領(lǐng)域為CRM、市場營銷。

·從數(shù)據(jù)存儲來看,數(shù)據(jù)挖掘依然主要發(fā)生在個人電腦上,數(shù)據(jù)一般也是存儲在本地,近幾年興起的云技術(shù)遠未達到普及。

·從關(guān)鍵疑難問題來看,臟數(shù)據(jù)、數(shù)據(jù)挖掘概念的普及、對數(shù)據(jù)的訪問依然是數(shù)據(jù)挖掘人員面臨的最大挑戰(zhàn)。

·從挖掘工具來看,開源數(shù)據(jù)挖掘軟件R-Project已經(jīng)成為挖掘人員的首選(被調(diào)查者的比例高居43%),其次是Statistica(18%)。而且Statistica、IBMSPSSModeler和R-Project在2009、2010年被參與調(diào)查人員給了最高滿意得分。

·從挖掘結(jié)果來看,模型輸出依然主要依賴于軟件本身,只有13%的挖掘人員給自己的公司的分析能力評為“優(yōu)秀”,只有8%的人認(rèn)為他們的數(shù)據(jù)質(zhì)量可以被認(rèn)為“很強”,可見這個領(lǐng)域仍存在很大上升空間。

3.1商業(yè)套件和工具概要

如圖1所示,2007年Gartner“客戶數(shù)據(jù)挖掘魔力象限”的客戶數(shù)據(jù)挖掘工具評估中[2,3],SAS和SPSS還被評為處于領(lǐng)先地位,但跟2011年的報告對比后就會發(fā)現(xiàn),經(jīng)過幾年的技術(shù)和軟件發(fā)展后,該領(lǐng)域發(fā)生了很大的變化:主流的元數(shù)據(jù)管理軟件廠商(如Oracle、IBM)進入領(lǐng)導(dǎo)行列,而數(shù)據(jù)發(fā)現(xiàn)供應(yīng)商(如Quiterian、Tibco、Tableau)正逐漸嶄露頭角并占據(jù)重要角色。因此Gartner給出的結(jié)論是,目前商業(yè)智能(BI)市場分裂為截然不同的兩個陣營,一方由傳統(tǒng)的BI平臺供應(yīng)商組成,另一方由數(shù)據(jù)發(fā)現(xiàn)供應(yīng)商組成。以Quiterian的動態(tài)數(shù)據(jù)網(wǎng)絡(luò)(DDWeb)產(chǎn)品為例,核心價值在于它使數(shù)據(jù)挖掘和統(tǒng)計分析簡單易行,從而使這些工具更容易在以市場為導(dǎo)向的企業(yè)得到利用,后者雖然市場份額不是很大,但對前者的挑戰(zhàn)正逐步加強。

目前數(shù)據(jù)挖掘相關(guān)的工具主要有以下系列:SASEnterpriseMiner是一種通用的數(shù)據(jù)挖掘工具,按照SEMMA(抽樣、探索、轉(zhuǎn)換、建模、評估)的方法進行數(shù)據(jù)挖掘,性能較高,但SAS的軟件許可證的成本及開發(fā)預(yù)測分析的人力成本對其普及造成很大阻礙;而Clementine作為一種可視化數(shù)據(jù)挖掘工具,提供了多種圖形化技術(shù),有助理解數(shù)據(jù)間的關(guān)鍵性聯(lián)系,指導(dǎo)用戶以最便捷的途徑找到問題的最終解決辦法,提出了CRISPDM(業(yè)務(wù)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)建模、評估建模、模型發(fā)布)的6步方法論;另外還有數(shù)據(jù)庫產(chǎn)品內(nèi)置的數(shù)據(jù)挖掘模塊,如:SAPNetWear7.0DataMiningWorkbench、Oracle11gDataMining、MicrosoftSQLServer2005AnalysisServices等。

3.2開源軟件簡介

開源(opensource)數(shù)據(jù)挖掘軟件有R-Project、Weka、Mahout等,但從實際應(yīng)用來看相對成熟、完整、現(xiàn)成的開源解決方案較少:R-Project有很強的面向?qū)ο蠊δ埽赏ㄟ^下載用戶撰寫的擴展包進一步增強,但由于R-Project需要較扎實的統(tǒng)計知識,造成了其學(xué)習(xí)曲線非常陡峭。Mahout是作為推薦引擎的一種實現(xiàn)框架,可以把常用的Content-Based推薦算法及協(xié)同過濾算法(Item-Based、User-Based)相結(jié)合,但在實際應(yīng)用中要髀決冷啟動、大數(shù)據(jù)量的性能下降等問題。

3.3云計算技術(shù)對數(shù)據(jù)挖掘的影響

根據(jù)Gartner的預(yù)測,盡管云計算的市場仍處于早期階段,但“云”作為一種顛覆力量,對多數(shù)的產(chǎn)業(yè)可能具有廣闊的、長期的影響。下一代的分析必然面對數(shù)據(jù)規(guī)模、復(fù)雜格式和交付速度的挑戰(zhàn),甚至從傳統(tǒng)的離線分析轉(zhuǎn)向在線嵌入式分析。

云計算的MapReduce計算模型適合結(jié)構(gòu)一致的海量數(shù)據(jù),但像點擊流數(shù)據(jù)、互聯(lián)網(wǎng)訪問日志、社交網(wǎng)絡(luò)評論等非結(jié)構(gòu)化數(shù)據(jù)更適合把云計算作為一種ETL工具來構(gòu)建用戶行為庫;而對于大量的數(shù)據(jù)密集型應(yīng)用(如數(shù)據(jù)挖掘任務(wù)),往往涉及數(shù)據(jù)降維、程序迭代、近似求解等復(fù)雜的算法,用云計算的方式實現(xiàn)比較困難。

4LBS應(yīng)用框架及前景

LBS提供了移動互聯(lián)網(wǎng)時代聚攏用戶的基礎(chǔ)能力,其核心概念(精準(zhǔn)營銷、信息定位、區(qū)域受眾、位置服務(wù))在SoLoMo模式下被廣泛應(yīng)用,并形成了多種新型的創(chuàng)意產(chǎn)品的試驗田和新產(chǎn)品體驗的促成物。隨著移動定位技術(shù)的發(fā)展,不同精度的位置服務(wù)提供者相繼出現(xiàn),服務(wù)的“本地化”概念也將呈現(xiàn)從米級到城市級多種尺度,但關(guān)鍵核心其實是服務(wù)和內(nèi)容,“位置”在這里只是服務(wù)的一種載體形式。LBS應(yīng)用的關(guān)鍵在于把移動互聯(lián)網(wǎng)的線上用戶和線下商店聯(lián)系起來并形成良性互動,重點應(yīng)用模型有基于位置信息推送實時服務(wù)、基于協(xié)同過濾進行消費智能推薦、基于偏好構(gòu)建虛擬社交圈等。

誠如ThomasHusson“移動位置趨于無形”[4]報告中提到的LBS應(yīng)用范疇所述:當(dāng)位置和地圖越來越成為新移動產(chǎn)品和服務(wù)的標(biāo)配功能之后,基本信息的提供已經(jīng)遠遠不能滿足用戶的需求了,用戶生成內(nèi)容(UGC)、實時數(shù)據(jù)(交通信息、優(yōu)惠券和促銷等)、動態(tài)數(shù)據(jù)(評論和促銷)、虛擬現(xiàn)實等與用戶環(huán)境耦合的精準(zhǔn)本地數(shù)據(jù)需求愈發(fā)顯著,把地理信息及其附屬的時間信息、行為預(yù)測引入商業(yè)模式中,必然帶給用戶全新的體驗?;ヂ?lián)網(wǎng)時代,數(shù)據(jù)量呈爆炸式增長,數(shù)據(jù)來源多樣化,如何把海量數(shù)據(jù)處理和挖掘算法結(jié)合起來,“淘金式”地尋找有價值的用戶信息成為關(guān)鍵,把消費者行為和本地數(shù)據(jù)連接起來的新模式,會產(chǎn)生與用戶環(huán)境耦合的更多精準(zhǔn)本地數(shù)據(jù)。通過把線下和線上活動嫁接起來,帶動整合產(chǎn)業(yè)鏈的良性循環(huán)。

基于海量數(shù)據(jù)處理的LBS業(yè)務(wù)框架模型,按照處理流程可分為多源數(shù)據(jù)獲取層、云計算ETL處理層、用戶行為分析層、業(yè)務(wù)建模及應(yīng)用層等邏輯架構(gòu),如圖2所示。該模型已經(jīng)在“中國電信愛音樂”的相關(guān)項目應(yīng)用,其中基于用戶已聽歌曲的內(nèi)容推薦、基于當(dāng)前位置的友鄰聽等功能的應(yīng)用,在用戶的黏性和活躍度提高方面取得了良好效果。多源數(shù)據(jù)獲取層主要靠離線方式收集用戶在業(yè)務(wù)消費過程中產(chǎn)生的歷史明細(xì)、行為習(xí)慣以及電信CRM用戶資料數(shù)據(jù)。這些數(shù)據(jù)因為來源于不同的業(yè)務(wù)系統(tǒng),其業(yè)務(wù)標(biāo)志、數(shù)據(jù)真實性、數(shù)據(jù)重復(fù)性等需要建立一套數(shù)據(jù)過濾規(guī)則來初步清洗。在海量數(shù)據(jù)ETL過程中,其大量的運算、臨時存儲等會產(chǎn)生嚴(yán)重的性能問題,可以借助云計算技術(shù)解決這一難題。在項目中,使用了基于Hadoop的開源分布式數(shù)據(jù)處理框架,通過幾臺廉價的PCServer即可處理“億×億”級的數(shù)據(jù)關(guān)聯(lián)。云計算的結(jié)果是已經(jīng)格式化的用戶行為、興趣偏好等通用行為知識數(shù)據(jù),通常存儲在關(guān)系型數(shù)據(jù)庫中,根據(jù)業(yè)務(wù)主題的需求即可構(gòu)建對應(yīng)的用戶模型并應(yīng)用于移動位置業(yè)務(wù)。

5結(jié)束語

本文從SoLoMo業(yè)務(wù)特點和數(shù)據(jù)挖掘技術(shù)應(yīng)用相結(jié)合的角度,以LBS為代表的典型移動互聯(lián)網(wǎng)應(yīng)用,探索其業(yè)務(wù)框架及前景,但是受新算法復(fù)雜性和高效性的限制以及流量費用、隱私習(xí)慣等問題的影響,要實現(xiàn)更廣泛的應(yīng)用還有很長的路要走。但隨著云計算技術(shù)的初現(xiàn)成效和更多數(shù)據(jù)挖掘工具、算法的改善,數(shù)據(jù)挖掘在移動互聯(lián)網(wǎng)時代的用戶行為分析、精確營銷以及市場預(yù)測中必然會發(fā)揮更大作用。[作者簡介]張玉忠,主要研究方向為數(shù)據(jù)挖掘、云計算;袁立宇,主要研究方向為搜索引擎技術(shù)、電子商務(wù);徐雄,主要研究方向為搜索引擎技術(shù)、電子商務(wù)。

參考文獻

1/2011/03/rexer-analytics-2010-survey/,2011

2/cio/knowledge/200707/505.html,2007

3HYPERLINK"/technology/media-products/reprints/oracle

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論