探秘社交相關性排序算法_第1頁
探秘社交相關性排序算法_第2頁
探秘社交相關性排序算法_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

探秘社交相關性排序算法

社交相關性排序(SocialRelevancyRank)即將誕生。屆時,當你搜索“活動流”時,所得的結果不會再按照時間順序排列,而是會根據(jù)每條信息與用戶的“社交圖譜(socialgraph)”之間的相關性來排列。也就是說,那些與你關系更為緊密的人將會排在前面。這種模式的流程如何?實際上,需要通過一個算法,就像谷歌的PageRank一樣。以好友為依據(jù)將你所關注的人排在搜索結果的前端是一種顯而易見的做法,但Twitter目前仍未采用?,F(xiàn)在,當你在Twitter上搜索“Wilco”時,所得的結果會按照時間先后排列。這種方式其實并沒有很好的體現(xiàn)“相關性”,因為搜索結果中的多數(shù)信息都來自于陌生人。但如果所列信息來自于你所關注的人,那么搜索結果就將更為有用。Twitter目前并不支持這種模式,但FriendFeed卻已經(jīng)很好地采納了這一模式。FriendFeed會根據(jù)用戶的社交圖譜對搜索結果進行過濾。對于FriendFeed而言,要做到這一點并不困難。一方面,它了解你所關注的人;另一方面,它會將高端feed搜索技術整合到了用戶的社交圖譜中。這種方式聽起來很很棒,但也存在一個問題。搜索“Wilco”時,效果不錯,因為這支樂隊剛剛推出了新專輯,但是很多其他的關鍵詞卻無法返回任何結果。道理很簡單,你在Facebook上的好友以及在Twitter上所關注的人不可能對你所感興趣的每個話題都發(fā)表評論。問題在于數(shù)據(jù)稀疏,也就是缺乏可信賴的觀點。尋找更多數(shù)據(jù)來源很明顯,想要解決數(shù)據(jù)稀疏的問題就需要更多的數(shù)據(jù)。解決方案之一就是整合其他可信賴的資源,比如拓寬社交圖譜。例如,搜索結果所列的內(nèi)容未必來自于你直接關注的人,它還會包含那些你關注的人所關注的其他人。在Facebook中,就是所謂的“好友的好友”。你或許會認為,自己并不熟悉這些人的觀點,因而并不信任他們,但“六度分隔理論”表明,人們的社交圈都很小,因此,這類內(nèi)容通常會擁有相同的價值。還有一種方法就是將興趣類似的人整合到一起,這也就是所謂的“興趣鄰居(tasteneighbors)”。這種方法在垂直社交網(wǎng)絡中非常普遍,例如Last.fm、Flixster和Goodreads等。這些網(wǎng)絡都能夠幫助你了解,除好友之外還有哪些人與你類似。然而,這種運算成本較高,而且非常耗時。如果Twitter要完成類似的功能,就需要根據(jù)人們所發(fā)布的鏈接和Twitter信息的語義來判定。即使這一問題非常棘手,但隨著時間的推移,應該可以解決。群體因素除了使用社交圖譜的“第二度”和“興趣鄰居”外,社交相關性排序還可以為具有影響力的人賦予更高的權重。在缺乏任何其他衡量標準時,那些擁有數(shù)十萬名關注者的人有可能會比其他陌生人具備更高的相關性。使用關注者的數(shù)量來衡量剩余的“活動流”是一種不錯的方式??傊?,將來自陌生人的無數(shù)信息機械地整合在一起并非上策。正如人們很少會查看谷歌搜索第一頁以后的內(nèi)容一樣,以時間順序排列的Twitter信息也將很快令人厭倦。社交相關性排序需要將群體的共同感受考慮進來,以此來提供一種過濾標準,從未為你提供更多的結果。完美算法完美的算法并不存在,即使PageRank也不夠完美,但我們依然覺得它很有用。正如PageRank在互聯(lián)網(wǎng)中所起的作用一樣,假以時日,社交相關性排序也將幫助我們了解社交網(wǎng)絡中無窮無盡的“活動流”的意義所在。這種排序將會對我們了解好友的方式產(chǎn)生深遠的影響。假以時日,社交相關性排序還將改變通用網(wǎng)絡搜索。如今,通用網(wǎng)絡搜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論