版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
人工智能技術(shù)與應(yīng)用6.推薦系統(tǒng)課程概況—基本情況PART01推薦系統(tǒng)推薦系統(tǒng)概述推薦系統(tǒng)實現(xiàn)隱含語義模型推薦系統(tǒng)概述推薦系統(tǒng):推薦系統(tǒng):推薦系統(tǒng)概述推薦系統(tǒng):推薦系統(tǒng)概述協(xié)同過濾:如果你現(xiàn)在想看個電影,但你不知道具體看哪部,你會怎么做?如何確定一個用戶是不是和你有相似的品位?如何將鄰居們的喜好組織成一個排序的目錄?推薦系統(tǒng)-協(xié)同過濾協(xié)同過濾:實現(xiàn)步驟收集用戶偏好找到相似的用戶或物品計算推薦推薦系統(tǒng)-協(xié)同過濾協(xié)同過濾:實現(xiàn)步驟推薦系統(tǒng)-協(xié)同過濾協(xié)同過濾:相似度計算推薦系統(tǒng)-協(xié)同過濾協(xié)同過濾:相似度計算歐幾里德距離(EuclideanDistance)皮爾遜相關(guān)系數(shù)(PearsonCorrelationCoefficient)
Cosine相似度(CosineSimilarity)推薦系統(tǒng)-協(xié)同過濾協(xié)同過濾:相似度計算皮爾遜相關(guān)系數(shù)(PearsonCorrelationCoefficient)協(xié)方差皮爾遜相關(guān)系數(shù)Pearson相關(guān)系數(shù)是用協(xié)方差除以兩個變量的標(biāo)準(zhǔn)差得到的推薦系統(tǒng)-協(xié)同過濾協(xié)同過濾:皮爾遜相關(guān)系數(shù)推薦系統(tǒng)-協(xié)同過濾協(xié)同過濾:皮爾遜相關(guān)系數(shù)鄰居的選擇
固定數(shù)量的鄰居
基于相似度門檻的鄰居推薦系統(tǒng)-協(xié)同過濾基于用戶的協(xié)同過濾:推薦系統(tǒng)-協(xié)同過濾基于用戶的協(xié)同過濾:基于用戶的協(xié)同過濾要解決的問題已知用戶評分矩陣MatrixR(一般都是非常稀疏的)
推斷矩陣中空格emptycells處的值推薦系統(tǒng)-協(xié)同過濾基于用戶的協(xié)同過濾:基于用戶協(xié)同過濾UserCF缺點
對于一個新用戶,很難找到鄰居用戶。對于一個物品,所有最近的鄰居都在其上沒有多少打分注意事項
相似度計算最好使用皮爾遜相似度
考慮共同打分物品的數(shù)目,如乘上min(n,N)/Nn:共同打分?jǐn)?shù)N:指定閾值
對打分進(jìn)行歸一化處理
設(shè)置一個相似度閾值推薦系統(tǒng)-協(xié)同過濾基于用戶的協(xié)同過濾:基于用戶協(xié)同過濾UserCF為啥不流行1.稀疏問題2.數(shù)百萬的用戶計算,這量?3.人是善變的注意事項
推薦系統(tǒng)-協(xié)同過濾基于物品的協(xié)同過濾:
推薦系統(tǒng)-協(xié)同過濾基于物品的協(xié)同過濾:基于物品的協(xié)同過濾優(yōu)勢!計算性能高,通常用戶數(shù)量遠(yuǎn)大于物品數(shù)量可預(yù)先計算保留,物品并不善變
推薦系統(tǒng)-協(xié)同過濾基于物品的協(xié)同過濾:
推薦系統(tǒng)-協(xié)同過濾r_51=(0.41*2+0.59*3)/(0.41+0.59)=2.6基于物品的協(xié)同過濾:用戶冷啟動問題引導(dǎo)用戶把自己的一些屬性表達(dá)出來利用現(xiàn)有的開放數(shù)據(jù)平臺根據(jù)用戶注冊屬性推薦排行榜單物品冷啟動問題文本分析、主題模型打標(biāo)簽、推薦排行榜單推薦系統(tǒng)-協(xié)同過濾基于物品的協(xié)同過濾:推薦系統(tǒng)-協(xié)同過濾基于物品的協(xié)同過濾:推薦系統(tǒng)-協(xié)同過濾基于用戶的推薦實時新聞突然情況基于物品的推薦圖書電子商務(wù)電影隱語義模型:隱語義模型從數(shù)據(jù)出發(fā),進(jìn)行個性化推薦用戶和物品之間有著隱含的聯(lián)系(有一個隱含方程)隱含因子讓計算機能理解就好將用戶和物品通過中介隱含因子聯(lián)系起來隱語義模型:隱語義模型分解用戶和隱藏因子之間的關(guān)系電影和隱藏因子之間的關(guān)系(F*M)T*(N*M)=(F*M)組合隱語義模型:隱語義模型梯度下降方向:隱語義模型:隱語義模型隱語義模型目標(biāo)函數(shù)隱語義模型負(fù)樣本選擇:隱語義模型負(fù)樣本采樣:對每個用戶,要保證正負(fù)樣本的平衡(數(shù)目相似)選取那些很熱門,而用戶卻沒有行為的物品對于用戶—物品集K{(u,i)}其中如果(u,i)是正樣本,則有=1,負(fù)樣本則=0隱語義模型:隱語義模型特征的重要程度隱語義模型:重新計算USV的結(jié)果得到A2來比較下A2和A的差異,看起來差異是有的,但是并不大,所以我們可以近似來代替隱語義模型隱語義模型:
將U的第一列當(dāng)成x值,第二列當(dāng)做y值,即U的每一行用一個二維向量表示,同理V的每一行也用一個二維向量表示。
從圖中可以看到,S5和S6特別相似,Ben和Fred也特別相似隱語義模型隱語義模型:尋找相似用戶尋找相似用戶:依然用實例來說明:假設(shè),現(xiàn)在有個名字叫Bob的新用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版礦產(chǎn)資源采礦權(quán)抵押合同范本與法律分析3篇
- 二零二五年度環(huán)保標(biāo)準(zhǔn)車間租賃服務(wù)協(xié)議4篇
- 基于多任務(wù)學(xué)習(xí)的輸電線路設(shè)備缺陷檢測研究
- 二零二五年度農(nóng)村集體土地使用權(quán)流轉(zhuǎn)合同范本(2024版)4篇
- 干燥方法對預(yù)糊化高直鏈玉米淀粉的影響及其在米線中的應(yīng)用研究
- 河南杞縣方言副詞研究
- 二零二五年度圖書租賃退書協(xié)議4篇
- 二零二四年度中小企業(yè)三方貸款及稅收優(yōu)惠協(xié)議3篇
- 土石施工方案
- 歷史風(fēng)貌視角下衢州木結(jié)構(gòu)傳統(tǒng)民居節(jié)能改造研究
- 課題申報書:GenAI賦能新質(zhì)人才培養(yǎng)的生成式學(xué)習(xí)設(shè)計研究
- 駱駝祥子-(一)-劇本
- 全國醫(yī)院數(shù)量統(tǒng)計
- 《中國香文化》課件
- 2024年醫(yī)美行業(yè)社媒平臺人群趨勢洞察報告-醫(yī)美行業(yè)觀察星秀傳媒
- 第六次全國幽門螺桿菌感染處理共識報告-
- 2024-2030年中國商務(wù)服務(wù)行業(yè)市場現(xiàn)狀調(diào)查及投資前景研判報告
- 高一英語必修一試卷(含答案)(適合測試)
- 中國的世界遺產(chǎn)智慧樹知到期末考試答案2024年
- 中國綠色食品市場調(diào)查與分析報告
- 手衛(wèi)生依從性調(diào)查表
評論
0/150
提交評論