基于用戶的協(xié)同過濾算法_第1頁
基于用戶的協(xié)同過濾算法_第2頁
基于用戶的協(xié)同過濾算法_第3頁
基于用戶的協(xié)同過濾算法_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質文檔-傾情為你奉上基于用戶的協(xié)同過濾算法作者:羅沐陽(28)指導教師:張勇【摘要】:隨著網絡技術的應用和普及、電子商務的迅猛發(fā)展,越來越多的信息充斥在網絡之上。如何在眾多的資源中找到適合自己需求的信息,成為眾多學者、專家和網絡用戶火心的核心問題之一。個性化推薦技術在這樣的背景下應運而生。協(xié)同過濾技術是個性化推薦技術最為核心的技術之一,也是目前應用最為廣泛和成功的技術。本文主要研究的是基于用戶的協(xié)同過濾推薦算法的實現(xiàn)。【關鍵詞】:協(xié)同過濾,相似度,個性化推薦1.電子商務個性化推薦技術1.1個性化推薦技術電子商務對傳統(tǒng)的商務交易產生了革命性的變化,從而要求“以產品為中心”向“面向客戶”、“

2、以客戶為中心”的新的商業(yè)模式的轉變,要求電子商務網站按客戶群劃分產品,圍繞客戶進行服務,為客戶提供所需要的東西,所以對每個顧客提供個性化的服務成為必要。在這種背景下,推薦系統(tǒng)(Recommender System)應運而生,它是根據(jù)用戶個人的喜好、習慣來向其推薦信息、商品的程序。電子商務網站可以使用推薦系統(tǒng)分析客戶的消費偏好,向每個客戶具有針對性地推薦產品,幫助用戶從龐大的商品目錄中挑選真正適合自己需要的商品,盡可能為每個顧客提供個性化的服務。個性化推薦(personalized recommendation)技術通過研究不同用戶的興趣,主動為用戶推薦最需要的資源,從而更好

3、地解決互聯(lián)網信息日益龐大與用戶需求之間的矛盾。目前,推薦技術被廣泛應用到電子商務、數(shù)字圖書館、新聞網站等系統(tǒng)中。因此,各種適用于推薦系統(tǒng)的技術應運而生,如協(xié)同過濾技(CF)、bayesian網技術、聚類分析技術、關聯(lián)規(guī)則技術、神經網絡技術和圖模型技術等,其中,協(xié)同過濾是應用最為廣泛的個性化推薦技術。協(xié)同過濾推薦又分為基于模型(Model-based)的協(xié)同過濾和基于用戶的協(xié)同過濾。后來,sarwr教授在2001年提出基于項目的協(xié)同過濾算法1.2協(xié)同過濾協(xié)同過濾推薦技術是用“相似統(tǒng)計”的方法發(fā)現(xiàn)具有相似偏好或是興趣特征的“相鄰用戶”。“協(xié)同過濾”的思想最早由美國明尼蘇達州大學的學者Paul Re

4、snick在1994年,發(fā)表的GroupLens: AnOpen Architecture for Collaborative Filtering of Netnews 一文中提出的。迄今為止, 協(xié)同過濾是在個性化推薦系統(tǒng)中應用最廣泛和最被人們所認可的一種推薦技術。協(xié)同過濾的基本原理是:根據(jù)用戶對信息產品的評分情況,對其他用戶進行檢索, 找出與該用戶“品味”相似的一小群人, 也就是“鄰居”,然后再基于這些相似性進行信息產品評分預測,產生Top-N的推薦結果。協(xié)同過濾具有以下幾個主要優(yōu)點:第一,可以處理非結構化的信息產品,對非結構化如電影、音視頻等復雜對象進行推薦;第二,奇異興趣發(fā)現(xiàn)。協(xié)同過濾推

5、薦技術可以根據(jù)如信息產品的質量, 用戶的品味等一些復雜的、不易表達的概念進行信息過濾, 并發(fā)現(xiàn)用戶的潛在興趣; 第三, 推薦的個性化、自動化程度較高。本文主要研究的是基于用戶的協(xié)同過濾推薦算法的實現(xiàn)。2.基于用戶的協(xié)同過濾推薦算法 2.1算法簡介 基于用戶的協(xié)同過濾是個性化推薦中應用最為廣泛的方法,它是基于鄰居用戶的興趣愛好預測目標用戶的興趣偏好。算法先使用統(tǒng)計技術尋找與目標用戶有相同喜好的鄰居,然后根據(jù)目標用戶的鄰居的偏好產生向目標用戶的推薦。 它的基本原理是利用用戶訪問行為的相似性來互相推薦用戶可能感興趣的資源對當前用戶,系統(tǒng)通過其歷史訪問記錄及特定相似度函數(shù),計算出與其訪問行為

6、(購買的產品集合、訪問的網頁集等)最相近的N個用戶作為用戶的最近鄰居集,統(tǒng)計的近鄰用戶訪問過而目標用未訪問的資源生成候選推薦集,然后計算候選推薦集中每個資源對用戶的推薦度,取其中K個排在最前面的資源作為用戶的推薦集。2.2算法步驟2.2.1發(fā)現(xiàn)興趣相似的用戶 通常用Jaccard公式或者余弦相似度計算兩個用戶之間的相似度。設N(u)為用戶 u 喜歡的物品集合。N(v)為用戶v喜歡的物品集合,那么u和v的相似度是多少呢:      Jaccard 公式:      余弦相似度: 

7、0;假設目前共有4個用戶:A、B、C、D;共有5個物品:a、b、c、d、e。用戶與物品的關系(用戶喜歡物品)如下所示:AabdBacCbeDcde  如何一下子計算所有用戶之間的相似度呢?為計算方便,通常首先需要建立“物品用戶”的倒排表,如下所示:abcdeAABACBCDDD  然后對于每個物品,喜歡他的用戶,兩兩之間相同物品加1。例如喜歡物品a的用戶有A和B,那么在矩陣中他們兩兩加1。如下所示:  計算用戶兩兩之間的相似度,上面的矩陣僅僅代表的是公式的分子部分。以余弦相似度為例,對上進行進一步計算:  到此,計

8、算用戶相似度就大功告成,可以很直觀的找到與目標用戶興趣較相似的用戶。2.2.2推薦物品首先需要從矩陣中找出與目標用戶u最相似的K個用戶,用集合S(u, K) 表示,將S中用戶喜歡的物品全部提取出來,并去除u已經喜歡的物品。對于每個候選物品i,用戶u對它感興趣的程度用如下公式計算:  其中rvi表示用戶v對i的喜歡程度,在本例中都是為1,在一些需要用戶給予評分的推薦系統(tǒng)中,則要代入用戶評分。  舉個例子,假設我們要給A推薦物品,選取K = 3個相似用戶,相似用戶則是:B、C、D,那么他們喜歡過并且A沒有喜歡過的物品有:c、e,那么分別計算p(A, c) 和p(A, e):  看樣子用戶A對c和e的喜歡程度可能是一樣的,在真實的推薦系統(tǒng)中,只要按得分排序,取前幾個物品就可以了。3.總結我覺得關于協(xié)同過濾的推薦算法是一個很有趣的課題,但這個需要我們有很大的耐心,因為中間可能會出現(xiàn)很多錯,即使是一個小的誤區(qū),可能導致結論相差很多,只有通過不斷試驗,得出一些數(shù)據(jù),才有可能發(fā)現(xiàn)自己存在的問題,然后再改進。 經過本次試驗,雖然對基于用戶的協(xié)同過濾推薦算法的研究沒有深入到能提出一些建設性的改進,但對于算法已經有了一定的了解,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論