個(gè)性化推薦系統(tǒng)中一種基于層次的任度計(jì)算模型[文檔資料]_第1頁(yè)
個(gè)性化推薦系統(tǒng)中一種基于層次的任度計(jì)算模型[文檔資料]_第2頁(yè)
個(gè)性化推薦系統(tǒng)中一種基于層次的任度計(jì)算模型[文檔資料]_第3頁(yè)
個(gè)性化推薦系統(tǒng)中一種基于層次的任度計(jì)算模型[文檔資料]_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

個(gè)性化推薦系統(tǒng)中一種基于層次的任度計(jì)算模型 本文檔格式為 WORD,感謝你的閱讀。 引言:計(jì)算機(jī)系統(tǒng)中的信任問(wèn)題長(zhǎng)期以來(lái)都倍受?chē)?guó)家、學(xué)術(shù)界和企業(yè)界的關(guān)注。本文參考社會(huì)學(xué)和心理學(xué)將人與人之間信任的產(chǎn)生來(lái)源分為三個(gè)方面:外部來(lái)源、交互來(lái)源和內(nèi)部來(lái)源,并提出一種層次化的信任度計(jì)算模型,該模型可以根據(jù)不同類(lèi)型的用戶(hù)調(diào)整不同來(lái)源的信任在整個(gè)模型中所占的比例。最后,利用 Epinions 網(wǎng)站的相關(guān)數(shù)據(jù)對(duì)模型進(jìn)行了驗(yàn)證。 本文參考社會(huì)學(xué)和心理學(xué)將人們之間 信任的產(chǎn)生來(lái)源分為三個(gè)方面:外部來(lái)源、交互來(lái)源和內(nèi)部信任,如圖 1.1所示。外部信任是由于當(dāng)前用戶(hù)在公共環(huán)境中的聲譽(yù)而使得其他用戶(hù)對(duì)其產(chǎn)生的信任,它是一種全局信任,獨(dú)立于單個(gè)用戶(hù)。交互信任是系統(tǒng)中用戶(hù)之間的交互所產(chǎn)生的信任關(guān)系,這是一種本地信任度。內(nèi)部信任,是由于兩個(gè)人之間內(nèi)在的相似性(如愛(ài)好等)產(chǎn)生的信任關(guān)系。 圖 1.1 分層信任模型示意圖 1 基于層次的信任度計(jì)算模型 本文提出基于層次的信任度計(jì)算模型如( 1.1)所,其中 Reputation 表示外部信任, InteractiveTrust 表示交互信任, Similarity 表示內(nèi)部信任。 a, b, c 是加權(quán)平均系數(shù),滿(mǎn)足 a+b+c=1。這三個(gè)系數(shù)分別應(yīng)對(duì)不同類(lèi)型的用戶(hù):冷啟動(dòng)用戶(hù)、常規(guī)用戶(hù),爭(zhēng)議用戶(hù)。 ( 1.1) 在本文接下來(lái)的篇幅中將詳細(xì)介紹三種信任的計(jì)算方法以及 a, b, c 三個(gè)參數(shù)對(duì)于不同用戶(hù)的取值情況。 1.1 外部信任 本文使用的 PageRank 算法來(lái)計(jì)算外部信任。 PageRank將指向一個(gè)網(wǎng)頁(yè)的鏈接看成是對(duì)于這個(gè)網(wǎng)頁(yè)的投票,本文將這種鏈接稱(chēng)之為回指鏈接,而將一個(gè)網(wǎng)頁(yè)指向其他網(wǎng)頁(yè)的鏈接稱(chēng) 之為外向鏈接。例如在圖 2.1 中,將用戶(hù)看作是網(wǎng)絡(luò)中的結(jié)點(diǎn),將用戶(hù)之間的信任關(guān)系看做他們之間的信任,對(duì)于用戶(hù) A 來(lái)說(shuō),從其他用戶(hù)到用戶(hù) A 的鏈接如( B-A)等都是用戶(hù) A 的回指鏈接;而從用戶(hù) A 到其他用戶(hù)的鏈接如( A-B)等都是用戶(hù) A 的外向鏈接。 圖 2.1 信任網(wǎng)絡(luò)初始狀態(tài)示意圖 PageRank 在計(jì)算網(wǎng)頁(yè)排名的時(shí)候不單單考慮了網(wǎng)頁(yè)的回指鏈接的數(shù)量,更重要的是它還考慮了回指鏈接源網(wǎng)頁(yè)的價(jià)值。也就是說(shuō),一個(gè)高等級(jí)的頁(yè)面可以讓它所指向的低等級(jí)的頁(yè)面的等級(jí)提升。 PageRank 中,一個(gè)頁(yè)面的重要 性是由鏈向它的所有頁(yè)面的重要性經(jīng)過(guò)遞歸算法得到的,如等式( 2.2)所示是 RageRank 的數(shù)學(xué)表達(dá)式: ( 2.2) Reputation( u)表示用戶(hù) u 的信譽(yù)度, Bu表示指向用戶(hù) u 的所有用戶(hù)的集合, Nv 表示以用戶(hù) v 為源用戶(hù)的所有鏈接的數(shù)目,也就是用戶(hù) v 的外向鏈接數(shù)。 1.2 交互信任 本文使用 MoleTrust 來(lái)作為度量交互信任值的算法,之所以選擇 MoleTrust 有兩個(gè)原因: 1. 它具有省時(shí)高效的特點(diǎn); 2. 該算法對(duì)信任的計(jì)算是按照層次順序進(jìn)行的,這與我們的社交習(xí)慣 非常類(lèi)似。接下來(lái)將詳細(xì)介紹 MoleTrust 的計(jì)算過(guò)程及其缺點(diǎn)以及對(duì) MoleTrust 的改進(jìn)措施。 1.2.1 MoleTrust MoleTrust 的整個(gè)計(jì)算過(guò)程可以分為兩步完成: 1.從源節(jié)點(diǎn)出發(fā)遍歷整個(gè)信任網(wǎng)絡(luò),去除網(wǎng)絡(luò)中多余的信息和循環(huán)信任,構(gòu)造一個(gè)單向無(wú)循環(huán)的信任網(wǎng)絡(luò); 2.在第一步的基礎(chǔ)上,從源節(jié)點(diǎn)出發(fā)開(kāi)始傳播信任值,計(jì)算當(dāng)前用戶(hù)對(duì)于網(wǎng)絡(luò)中其他用戶(hù)的信任。如 Step 1 和 Step 2 所示,是 MoleTrust的具體運(yùn)算過(guò)程: MoleTrust 的 Step 1 過(guò)程有一個(gè)非 常重要的參數(shù):trust_propagation_distance,該參數(shù)用來(lái)控制信任傳播的距離。圖 2.1 經(jīng)過(guò) MoleTrust 的 Step 1 階段后得到圖 2.2所示信任網(wǎng)絡(luò)。將該信任網(wǎng)絡(luò)視為一個(gè)有向圖,在圖的第 0層是當(dāng)前用戶(hù) A,第 1 層,為用戶(hù) A 的直接朋友,以此類(lèi)推。 圖 2.2 經(jīng) MoleTrust 的 Step 1 后的信任網(wǎng)絡(luò) 在 MoleTrust 的 Step 2 階段,同樣有一個(gè)非常重要的參數(shù): trust_threshold。只有信任值大于 trust_threshod的用戶(hù)才會(huì)被加入到信 任網(wǎng)絡(luò)中,該策略可以有效防止惡意用戶(hù)對(duì)于推薦系統(tǒng)的影響。 1.2.2 Modified MoleTrust MoleTrust 在計(jì)算信任值的過(guò)程中存在一個(gè)很大的漏洞,如 Tr( A, G) =7,但這和我們的直覺(jué)是相悖的,因?yàn)?G的上層用戶(hù) C 的信任值只有 3。為了彌補(bǔ)上述漏洞,本文提出一種修正的 MoleTrust: Modified-MoleTrust。本文在在MoleTrust 的 Step 2 階段引入一個(gè)遞減因子 ,其計(jì)算方式如等式( 2.5)所示。 1.3 內(nèi)部信任 本文認(rèn)為用戶(hù)對(duì) 項(xiàng)目的評(píng)分是用戶(hù)內(nèi)部屬性的綜合體現(xiàn),所以本文選擇用戶(hù)對(duì)項(xiàng)目的評(píng)分矩陣來(lái)作為內(nèi)部信任的計(jì)算依據(jù)。有學(xué)者證明了在眾多衡量用戶(hù)相似性的指標(biāo)中,Person 相關(guān)系數(shù)的綜合表現(xiàn)最好,所以本文選擇 Person 相關(guān)系數(shù)作為內(nèi)部信任的衡量指標(biāo)。 Person 相關(guān)系數(shù)的取值范圍是 -1, 1,若 Person 相關(guān)系數(shù)的取值為正,則說(shuō)明兩個(gè)用戶(hù)之間存在著相似性,反之當(dāng)其取為負(fù)時(shí)說(shuō)明兩個(gè)人之間的興趣可能是相悖的。Person 相關(guān)系數(shù)的計(jì)算公式如等式( 2.6)所示。其中 n 表示用戶(hù) A 和用戶(hù) W 共同評(píng)分的項(xiàng)目數(shù), r( K, i)表示 用戶(hù) K 對(duì)項(xiàng)目 i 的評(píng)分。 2 實(shí)驗(yàn)結(jié)果說(shuō)明 本文利用 Epinions 網(wǎng)站的數(shù)據(jù)和 Apache 的 Mahout 平臺(tái)對(duì)所提出的模型進(jìn)行了驗(yàn)證。面對(duì)不同類(lèi)型的用戶(hù),對(duì)參數(shù)進(jìn)行調(diào)整后,該模型總能得到較為理想的推薦準(zhǔn)確度和覆蓋率,具體數(shù) 3 結(jié)束語(yǔ) 本文提出了一種基于層次的信任度計(jì)算模型,并做了相應(yīng)的實(shí)證研究,該模型能在很大程度上改善用戶(hù)的體驗(yàn)。我們

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論