互聯(lián)網(wǎng)的個性化未來_第1頁
互聯(lián)網(wǎng)的個性化未來_第2頁
互聯(lián)網(wǎng)的個性化未來_第3頁
互聯(lián)網(wǎng)的個性化未來_第4頁
互聯(lián)網(wǎng)的個性化未來_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1個性化是互聯(lián)網(wǎng)的未來趨勢現(xiàn)在,一個新的風潮即將到來,將再次改變互聯(lián)網(wǎng):個性化革命。今天,我們生活在一個不斷被信息淹沒的世界。每天twitter上發(fā)出的信息超過90MB,每分鐘有34小時長的視頻傳到Y(jié)ouTube上,每個Facebook用戶平均擁有130個好友并且在一直增加,還有搜索結(jié)果中洪水般的內(nèi)容以及傳統(tǒng)網(wǎng)站上每天成千上萬的文章,而這些內(nèi)容很少與我們個人有關(guān)系。信息的蔓延擴散并不是個新現(xiàn)象?;ヂ?lián)網(wǎng)的信噪比是隨著信息組織技術(shù)與信息產(chǎn)生、傳播技術(shù)之間的戰(zhàn)爭波動的。他們的網(wǎng)絡(luò):互聯(lián)網(wǎng)初期在互聯(lián)網(wǎng)出現(xiàn)初期,信息內(nèi)容都是由專業(yè)人士創(chuàng)立和組織的。起初,信息只會出現(xiàn)在像AOL這種專業(yè)網(wǎng)站上。隨著互聯(lián)網(wǎng)的開放,Yahoo!很出色地創(chuàng)立了開放式網(wǎng)絡(luò)雅虎目錄。但是即便有開放目錄、像Google這樣的搜索引擎公司不斷地提供更好的方法去獲取我們感興趣的內(nèi)容,信息過載仍然在無可防止地發(fā)生。通過了解網(wǎng)站之間相互鏈接的規(guī)那么,Google推出了一門新的科學來從問題本身尋求解決方案。這個方案現(xiàn)在表現(xiàn)的非常好,幾乎每個網(wǎng)站都在被SEO得趨向框架內(nèi)的標準。我們的網(wǎng)絡(luò):當今時代百20揉03舌年,勿由M達yS燥pa擾ce奧和Y似ou屋Tu課be鉗帶來像的用士戶提進供內(nèi)古容沖策擊了叉主流宰的互罪聯(lián)網(wǎng)仗玩法始,同地時網(wǎng)柿絡(luò)上奴的信剃息量年開始煤急劇豈增加觸。掏“現(xiàn)蘋在每脖兩天具我們命創(chuàng)立泉的信餓息幾跟乎相尊當于啦20抖03旱年一糖年的維那么劈多〞懂,G積oo脅gl握e首飯席執(zhí)軟行官怠Er輩ic妥S友ch泉mi盛dt充說。更搜索響引擎洪的目房的不蘭是為冤了有鄉(xiāng)效組把織社產(chǎn)會化姑和實預時數(shù)吼據(jù)。奧

因桂此像幻Fa陷ce住bo央ok崖和T鑼wi江tt睬er樹這樣宣的創(chuàng)娘新公扛司創(chuàng)陰建了說社會利化過騾濾器挪,通就過授糧權(quán)給個我們薦的朋登友和異信任熔的人庫來替湖我們秧組織涉信息遞。這床個新扁過濾糟器讓傷我們交更多疊、更初好我非們不阻曾預刊想過飼的信仰息。港讀到川這里競的大渡局部叫人應塌該都篇是社牧會化梳技術(shù)億的狂清熱用疊戶。誤跟我沈一樣婚,單你可缺能正弱在開熔始體董驗到蚊你的堂社會戀化信塘息流蒼中的映信息乳過載止。脊有很邀多高勺質(zhì)量估的信也息,炮但它首變得巨越來綠越難豐被找回到。畜專業(yè)安點說碰,信惠噪比施正在陪下降迅。越考來越館多的牽人變葛得更傍加熱下衷于環(huán)社會仆化和糖事實呼網(wǎng)絡(luò)長也會泄讓問搞題變豆得更修糟糕年。攀你們戶的網(wǎng)云絡(luò):帶未來唇想象殺一下號,君一撕上網(wǎng)冬看到競的網(wǎng)跑頁、猴應用涌或是皮獲得找的經(jīng)你驗都喚是正都合你每意的集個性岸化信鑒息,結(jié)你會鐮有什覺么感慕覺呢背?到逐ES竟PN辛.c承om鉆看關(guān)同于你費喜歡半的運積動和吉球隊鍛的精察選信濫息、賽每天幸上團你購網(wǎng)提找繼你興錫趣的謀商品豈、從輸Fo般ur址sq備ua周re爛接收本你感鄰興趣序的餐干廳信彎息…訊…懶從這殲里可免以看詠到未沸來發(fā)界展的晚方向潑。近由你史尋找傻目標集信息摩轉(zhuǎn)變料為目轉(zhuǎn)標信織息來畢找你竄。他過去識,我激們?nèi)贝疑贁?shù)懼據(jù)和州技術(shù)融來視勸線這拿種個莊性化谷的體開驗。鄰但一蜓切在項不斷爭地迅辯速改躍變。駝那些加勢不峽可擋焦的豐組富的精社會侄化數(shù)剝據(jù)不賄僅留昨下了貫問題遍,同眼時也騰給出奴了解蔬決方深案肢。使評用自悲然語問言處棋理和短語義拍分析醬來評辮估你育發(fā)出鵲的消拍息、知狀態(tài)部更新執(zhí)〔如艘分享兔和簽戒到〕掠,就臥有可割能對掉你的狀身份像和興膏趣以糊及其棋他特采征做疫出整行體的誰認知罪。首一旦徒網(wǎng)絡(luò)儀了解描了你趣的喜趟好,刑它就程可以冒變得斬……檢任何滋一個滅網(wǎng)站怠或應砍用可炭以利遞用這績點來全給你掘推送老屬于掠你的抹個性捆化體魚驗。屆音樂獅的發(fā)形展遵豬循了喪類似讀的進青化過嫌程。休音樂菠的傳嘩播從唱原先團通過到專業(yè)想籌劃弟〔D飲J,憤MT狀V〕報轉(zhuǎn)變眉為俱社會賠化介渾紹倒〔混仁雜磁狂帶、鐘播放勤列表天〕再矛到舉根據(jù)令個人欲偏好頁組織震〔P凍an需do建ra侵音樂版盒〕壩。巴所有貧這一恭切并棉不意仙味著鞭編輯羞消失桐或你報的朋吃友的請推薦縫并不街重要姨。相雙反,殿它是娛一個狼完全震聚焦茶在你杜身上遷的新剪鏡頭軟。其基于微因特雪網(wǎng)的鉗個性?;艡M息服概務(wù)研屆究穩(wěn)【內(nèi)北容提歡要】參個性位化信陸息服鬼務(wù),失是針假設(shè)對不校同用決戶采帥用不津同服友務(wù)策先略和海方式奶提供物不同伯信息濫內(nèi)容胡的服補務(wù)。融它具估有以膛用戶倘為中細心、煉對用驕戶需賀求進位行挖葬掘、析靈活追多樣棒和主津動將妻信息虛推送冒給用岡戶的鉆特點搜。其其類型豆有:喊個性藝化內(nèi)共容定駛制服柔務(wù);鄙個性加化信黑息檢慧索定會制服與務(wù);距個性秘化界屋面定西制服族務(wù)。述用戶記個性幕化需害求可艇通過膨用戶汁訪問諸記錄威挖掘崇、B類oo報km旬a(chǎn)r紀k和功Ag柿en土t獲哥取。銳個性匆化信昌息服喜務(wù)模疾型,詢可采貢用信兄息A逮

垮ge全nt助自主聽學習愚法、管信息兼過濾步法、娘基于桿多M苗ul臘ti圓-A考ge咬nt觀…孫…

災茅隨著蚊因特革網(wǎng)的駐飛速乒開展銷,網(wǎng)蜂上信絮息資偉源迅法猛增腦長,踢現(xiàn)有伏的搜段索引遣擎如偉YA托HO信O等報越來躺越難聞以滿段足用怪戶獲導取信紅息的襖需要梳。這陰些搜曬索引杜擎在輛效勞膀中,果一方題面忽殲略用端戶的斜個性但化要虜求,少另一床方面域不能病提供販主動讀信息釣效勞咳,使閥因特那么網(wǎng)上睡的海土量信寒息和假設(shè)用戶榆對信起息的捆有限濃獲取旨能力菊形成勉了強割烈的乓反差煉,使暑得因揪特網(wǎng)識上信擁息的剖獲取叉和利匹用面歷臨著掃嚴重臥的效怒率和就質(zhì)量瓜問題世。有橡效解刮決這數(shù)些問憶題的洋方法昆,就朽是利廳用新眨技術(shù)劫提高絹用戶柴獲取估信息膝的能寇力,貪使信菠息服翅務(wù)更它加符揉合用啄戶自抹己的少需要住,概恰括地孔說,膽就是于建立友面向驢用戶賀的個宣性化全效勞道機制侵。

1個性化信息效勞的定義與特點

1.1個性化信息效勞的概念

個性化信息效勞是網(wǎng)絡(luò)信息效勞開展的重要方向,已經(jīng)引起國內(nèi)外許多專家學者的研究興趣,因而近兩年這方面的研究成果較多。但何謂個性化信息效勞?個性化信息效勞應包括哪些內(nèi)容?如何實現(xiàn)個性化信息效勞等問題,現(xiàn)在還沒有統(tǒng)一的科學認識。所以在一些文獻里,又將個性化信息效勞稱之為個性化效勞、個性化定制效勞、個性化信息搜索效勞、個性化信息推薦效勞、個性化信息提醒效勞和個性化信息代理效勞等等。下面是一些具有一定代表性的觀點。

〔1〕個性化信息效勞是根據(jù)客戶的特性提供具有針對性的信息內(nèi)容和系統(tǒng)功能[1]。

〔2〕個性化信息效勞就是將用戶感興趣的信息主動提交給用戶[2]。

〔3〕個性化信息效勞是基于信息用戶的信息使用行為、習慣、偏好和特點,來向用戶提供滿足其各種個性化需求的一種效勞[3]。

〔4〕所謂個性化信息效勞,是指能夠滿足用戶的個人信息需求的一種效勞,在某一特定的網(wǎng)上功能和效勞方式中,自己設(shè)定網(wǎng)上信息來源方式、表現(xiàn)形式、特定網(wǎng)上功能及其它網(wǎng)上效勞方式等,而主動地向用戶提供可能需要的信息效勞[4]。

〔5〕所謂個性化信息效勞,首先它應該是一種能滿足用戶的個體信息需求的效勞,即根據(jù)用戶提出的明確要求,或通過對用戶個性、習慣的分析而主動向用戶提供其可能需要的信息和效勞;其次它應該是一種培養(yǎng)個性,引導信息需求的效勞,以此促進信息業(yè)的多樣化和多元化開展〞[5]。

〔6〕個性化信息代理就是一個能夠理解用戶真正需求的智能Agent。所謂個性是指Agent行為中所表現(xiàn)的一致的、穩(wěn)定的、可信的、典型的特征和態(tài)度集;個性可以表示為有序的目標集和對于目標的規(guī)劃的偏好程度[6]。

筆者認為,個性化信息效勞,就是針對不同用戶采用不同的效勞策略和方式,提供不同的信息內(nèi)容的效勞。

1.2個性化信息效勞的特點

綜上所述,個性化信息效勞的根本就是尊重用戶〔或者說以用戶為中心〕,研究用戶的行為、興趣、愛好和習慣,為用戶搜索、組織、選擇、推薦更具針對性的信息效勞。通過對個性化信息效勞特點的了解和掌握,可以使我們的效勞更具針對性,從而提高用戶對信息效勞的滿意度。具體地說,個性化信息效勞具有以下特點:

〔1〕以用戶為中心。所有的效勞必須以方便用戶、滿足用戶需求為前提。

〔2〕允許用戶充分表達個性化需求,能夠?qū)τ脩粜枨笮袨檫M行挖掘。信息效勞的系統(tǒng)不僅要提供友好界面,而且要方便用戶交互,方便用戶描述自己的需求,方便用戶反應對效勞結(jié)果的評價。要能夠了解用戶的個人需求、習慣、愛好和興趣,為其提供“量身定制〞的個性化信息效勞。

〔3〕效勞方式更加靈活、多樣。不僅要為用戶提供更加準確的信息,而且還要能夠按照用戶指定的方式進行效勞,如滿足用戶對信息的顯示方式、提供結(jié)果的方式〔紙質(zhì)、電子版、網(wǎng)絡(luò)版、電子郵件等〕的要求,對效勞時間的要求,對效勞地點的要求等。

〔4〕能夠主動將用戶所需信息推送給用戶。

2個性化信息效勞的類型

在個性化信息效勞系統(tǒng)中,用戶可以根據(jù)自己的需要,選擇不同的信息資源;依據(jù)自己的習慣,指定信息的顯示方式,如對信息檢索結(jié)果的不同的元數(shù)據(jù)排序。對于一般用戶可能更關(guān)心需求的主題,希望將論文的題名放在顯著的位置,而對于一個專家,他可能更關(guān)注學科內(nèi)某些專家的研究成果,希望將著者姓名放在最顯著的位置等等。就現(xiàn)階段的環(huán)境條件而言,個性化信息效勞至少應包括個性化內(nèi)容定制效勞、個性化信息檢索定制效勞、個性化界面定制效勞和個性化信息推薦效勞四個方面。

2.1個性化內(nèi)容定制效勞

個性化定制效勞是有效獲取用戶需求信息的方法之一。它通過用戶定制獲取用戶的個性化信息,從而理解用戶的需求,為用戶提供更為準確的信息效勞,提高用戶的滿意度。同時通過與用戶的直接或間接的溝通,改善與用戶的關(guān)系,增加用戶的忠誠度[7]。

在個性化內(nèi)容定制效勞中,用戶可以根據(jù)自己的興趣和需求定制信息。定制的內(nèi)容包括信息資源、界面和效勞等等。個性化信息定制效勞系統(tǒng)通常提供一些信息資源,讓用戶選擇〔定制〕。例如在數(shù)字圖書館中,人們可以選擇數(shù)據(jù)庫資源、電子期刊、電子圖書、相關(guān)網(wǎng)站、學科導航、搜索引擎等等。也有一些系統(tǒng)讓用戶指定資源地址,系統(tǒng)提供有關(guān)的更新通知等效勞〔這是一種簡單的主動信息效勞方式,系統(tǒng)能夠及時主動將有關(guān)資源的更新信息推送給用戶,提醒用戶及時利用〕。

另外,如平安與隱私保護也是個性化信息定制效勞中需要注意的重要問題。平安包括用戶私人信息的平安和系統(tǒng)管理的平安。隱私保護也是用戶關(guān)心的問題,一旦用戶的個人信息被泄露,用戶就會失去對我們的信任,而遠離我們的效勞,隱私保護需要制定完善的隱私保護政策,提供隱私政策公示,并提供用戶隱私公開的工具和運用保證隱私不外泄的保護技術(shù)等。

2.2個性化信息檢索定制效勞

在數(shù)據(jù)庫檢索或網(wǎng)上信息的查詢中,不同的用戶由于其擁有的檢索知識和所處的領(lǐng)域不同,往往其習慣也不同。初學者一般習慣用簡單檢索,專業(yè)人員習慣用高級檢索。另外,不同用戶可能用不同的詞匯表達同一專業(yè)概念,不同用戶對檢索結(jié)果的選取原那么和排序方法也可能不同。諸如此類,正是用戶個性化的顯著表現(xiàn)。因此,檢索定制需要充分支持用戶在檢索策略、檢索方法和檢索結(jié)果處理上的個性化。根據(jù)初步分析,檢索定制可包括[8]:

〔1〕個人檢索模板定制。用戶可根據(jù)個人需要對所需信息的專業(yè)〔用分類號或主題詞、關(guān)鍵詞確認〕、應用目的〔用文獻類型區(qū)別,例如期刊論文、專利、會議文獻等〕、深度、語言、地域、數(shù)量、時域等進行定制,從而內(nèi)在地表達自己相對穩(wěn)定的檢索限制條件。用戶在每次檢索時也可以選擇“屏蔽〞〔Over

write〕模板條件,靈活表達特殊要求。

〔2〕檢索工具定制〔選擇數(shù)據(jù)庫檢索系統(tǒng)和搜索引擎〕。已納入資源定制。

〔3〕檢索式表示方式定制;用戶可自定義默認檢索方式是簡單或復雜方式,自定義布爾檢索式中“與〞、“或〞、“非〞的表示符號,系統(tǒng)還可為用戶記錄最近的特定數(shù)量的檢索式,供用戶選擇使用。

〔4〕個人詞表定制。可寫入用戶自定義的常用詞匯的自定義標準詞、通用限制詞〔檢索時對所有檢索式均加上此檢索詞〕、特殊限制詞〔對某一個或幾個詞使用的限制詞〕、以及同義詞和近義詞;當該用戶使用這些常用詞匯時,系統(tǒng)可根據(jù)個人詞表調(diào)用相應詞匯優(yōu)化檢索,或彈出相應詞匯供用戶選擇使用。

〔5〕檢索結(jié)果處理定制??蓪z索結(jié)果的相關(guān)度計算標準、輸出格式、排序方式、重復記錄整合方式、分類組織、下載格式、傳送地址等進行定制。

〔6〕檢索歷史分析定制。用戶可要求系統(tǒng)動態(tài)追蹤其檢索過程,提取最常用的檢索詞和檢索式,最經(jīng)常選擇的數(shù)據(jù)庫、期刊、網(wǎng)站等資源,最經(jīng)常排除的資源,相近用戶最常用的檢索詞、檢索式、數(shù)據(jù)庫、期刊及網(wǎng)站等〔但必須掩蔽“相近用戶〞實際身份〕。當然,這種追蹤必須事先得到用戶的授權(quán)〔包括是否同意作為“相近用戶〞被分析的授權(quán)〕,同時必須平安地保護這些歷史數(shù)據(jù),這些歷史數(shù)據(jù)可用來自動修改用戶的有關(guān)定制信息〔例如定題選報記錄〕。

2.3個性化界面定制效勞

個性化界面定制效勞是讓用戶根據(jù)自己的愛好選擇桌面的顯示方式,它包括界面的結(jié)構(gòu)布局,顯示顏色和顯示內(nèi)容的排列方式等。例如在一些網(wǎng)站中,讓用戶輸入自己的個人信息,然后生成“我的主頁〞,“我的搜索引擎〞,“我的圖書館〞等等這類效勞都屬于個性化界面定制效勞。

2.4個性化信息推薦效勞

通過網(wǎng)絡(luò)信息的挖掘,了解用戶的需求和興趣,為用戶提供個性化的實時信息推薦效勞,也是因特網(wǎng)效勞的一個開展方向。面向單個用戶的實時個性化推薦效勞有4種方法[9]:

〔1〕在Cache內(nèi)的協(xié)作推薦。

〔2〕利用聚類方法實現(xiàn)實時個性化推薦。

〔3〕利用分類方法實現(xiàn)實時個性化推薦。

〔4〕利用協(xié)作推薦的方法實現(xiàn)實時個性化推薦。

3

用戶個性化需求的獲取方法

對用戶需求、興趣、愛好的了解和獲取是個性化信息效勞具備針對性的關(guān)鍵,而對用戶網(wǎng)絡(luò)信息需求的分析、獲取和管理是保證個性化信息效勞實施的根底。對用戶需求的獲取。目前主要有兩大類方法:一類是通過人機交互模式獲取用戶的信息需求。這類方法的優(yōu)點是可以準確地獲得用戶的需求信息,也是目前絕大多數(shù)檢索系統(tǒng)所采用的方法。缺點是主動性差。對于以信息拉取技術(shù)為核心的信息效勞系統(tǒng),系統(tǒng)一般提供一個與用戶進行實時交互的檢索界面,讓用戶表達需求。對于以信息推送技術(shù)為核心的信息效勞系統(tǒng),系統(tǒng)會提供應用戶一個表達信息需求的定制表單。用戶可以十分詳細地填寫自己的個性化需求信息。另一類是通過對用戶訪問記錄的挖掘,獲取用戶的需求、興趣和愛好等。這種方法的主動性強,一般用于個性化主動信息服分系統(tǒng)中,對用戶需求行為的挖掘,目前有三種方法:一是通過Cookie

logs挖掘;二是通過Bookmark進行網(wǎng)絡(luò)信息過濾;三是利用智能Agent跟蹤用戶信息行為。

3.1用戶訪問記錄的挖掘

網(wǎng)絡(luò)用戶訪問記錄的挖掘主要是從Web的訪問記錄中抽取具有意義的模式。Web中的每個效勞器都保存了用戶的訪問日志〔Web

access

log〕等記錄,保存了有關(guān)用戶訪問和交互的信息。分析這些數(shù)據(jù)可以用來了解用戶的需求行為,為用戶提供個性化的效勞。目前Web使用記錄挖掘技術(shù)和工具可以分為兩大類:訪問模式的追蹤和個性化的使用記錄的追蹤。一般的訪問模式追蹤通過分析使用記錄來了解用戶的訪問模式和傾向,以改良站點的組織結(jié)構(gòu);而個性化的使用記錄追蹤那么傾向于分析個別用戶的偏好,其目的是根據(jù)不同用戶的訪問模式,為用戶提供個性化的定制效勞[10]。

用戶訪問挖掘針對用戶對Web的訪問記錄,利用路徑分析、分類聚類、關(guān)聯(lián)規(guī)那么和序列模式的發(fā)現(xiàn)等方法進行分析,尋找其中蘊涵的用戶知識和模式。Web訪問信息挖掘的數(shù)據(jù)對象主要是日志數(shù)據(jù)。當用戶訪問Web效勞器時,效勞器方將會產(chǎn)生三種類型的日志文件:Server

logs,Error

logs和Cookie

logs,記錄用戶的訪問情況[11]。

Cookie是由互聯(lián)網(wǎng)效勞器產(chǎn)生的記號并由客戶端持有,用于識別用戶和用戶的會話。通過Cookie分析,獲取用戶個性化需求、興趣和愛好,目前還是一種較為有效的方法。但由于Cookie存儲在客戶計算機上,使用中會由于各種原因?qū)е翪ookie內(nèi)容失真,因而通過對Cookie的挖掘獲取用戶的個性化需求,也有一定的局限性。

3.2利用Bookmark〔書簽〕獲取用戶的個性化需求

當用戶在因特網(wǎng)上用瀏覽器瀏覽主頁時,經(jīng)常會遇到自己需要的和喜歡的站點和主頁,只要點一下瀏覽器的Bookmark菜單,就能將當前的站點存入Bookmark中。下次訪問時,只要從Bookmark中取出即可使用。用戶可以對Bookmark進行多級管理,不同的目錄反映用戶不同的興趣,這給對用戶需求的分析提供了依據(jù)。

利用用戶在瀏覽器上存儲的Bookmark獲得用戶信息需求是一種有效的方法。在Bookmark中存儲的信息往往是用戶最關(guān)心的,需要記錄下來以便以后再讀。Bookmark結(jié)構(gòu)化的信息存儲更能夠確切地表達用戶需求。我們可以利用用戶對文章的評價來表達用戶的信息需求。對存入Bookmark的某一推薦目錄的文章,可以認為是用戶喜歡的文章,作為學習中的正例;在其他目錄的文章,或是經(jīng)過推薦沒有被選中的文章將作為學習的反例。根據(jù)向量空間法將正反例表示成向量,就可以利用機器學習的方法對新文章進行推薦[12]。

利用Bookmark進行信息過濾有很多優(yōu)勢。用戶可以導入自己已有的Bookmark文件或直接在瀏覽網(wǎng)絡(luò)時通過客戶端軟件參加的新書簽,并且可以對其進行各種編輯操作。用戶可以明確地對文章的內(nèi)容與自己的需求是否一致作出評價,通過反應信息將使信息推薦更為準確。用戶可以靈活地設(shè)置推薦的范圍,系統(tǒng)對用戶信息的推薦信息直接并入Bookmark結(jié)構(gòu)中,完全符合用戶的習慣。另外,系統(tǒng)使瀏覽器的Bookmark功能實現(xiàn)網(wǎng)絡(luò)化,即利用網(wǎng)絡(luò)效勞器存儲用戶的Bookmark信息,這樣,可以使用戶在任何地方、各種平臺上擁有一致的Bookmark信息。

3.3利用智能Agent獲取用戶個性化需求

監(jiān)視用戶的信息查詢過程的方法能自動獲得用戶的信息需求。其方法是在用戶的終端上運行一個監(jiān)視的信息代理〔agent〕。信息代理將用戶在web瀏覽時的相關(guān)信息不斷傳送給遠端的效勞器.效勞器將信息進行整理、組織,并從中分析出用戶的信息偏好。

4個性化信息效勞模型的構(gòu)建

要實現(xiàn)個性化信息效勞,系統(tǒng)必須具備兩方面的能力:一是構(gòu)建個性化信息Agent模型,即將個性化信息從全局信息空間中別離出來;二是構(gòu)建用戶Agent模型,即跟蹤用戶行為,學習、記憶用戶興趣,通過描述用戶的興趣特征來建立個性化用戶模型。此外,還需要有功能強大的網(wǎng)絡(luò)信息搜索能力和友好的用戶界面,這既是構(gòu)建信息Agent和用戶Agent的根底,也是實現(xiàn)個性化信息效勞的保障。

4.1個性化信息模型的構(gòu)建方法

信息Agent具有多種特性,從不同的特性角度出發(fā),可以用不同的方法來構(gòu)建個性化信息模型。這里主要介紹三種常用的方法[13]。

〔1〕信息Agent的自主學習方法。個性化效勞的對象是一個個具體的用戶,因而建立個性化信息模型時,信息Agent必須對用戶感興趣的信息類型有所了解,并以此作為信息模型構(gòu)建的基準,通過不斷的學習積累形成一個有規(guī)模的模型。信息Agem可以直接探求用戶的信息興趣和愛好,也可以從用戶信息檢索和利用行為中提取這個基準,然后由Agent執(zhí)行一定的算法,將這些信息轉(zhuǎn)化為知識存入用戶信息模型中。信息Agent有兩種不同的學習方法:一是關(guān)鍵詞學習。這種學習方法是首先對搜索來的信息進行處理,將信息中的關(guān)鍵詞按出現(xiàn)頻率、出現(xiàn)位置提取出來,根據(jù)關(guān)鍵詞的頻率來確定唯一表征信息體的關(guān)鍵詞,將具有相同表征關(guān)鍵詞的信息聚類,并存入相應的個性化信息模型中。采用關(guān)鍵詞學習方法提高了建立多個個性化信息模型的效率。二是字典學習。這是一種對相似概念的學習。在這種學習方法中,信息Agent為個性化信息模型提供的每個基準關(guān)鍵詞創(chuàng)立一個字典,字典根據(jù)關(guān)鍵詞的權(quán)值來確定其權(quán)限:搜索權(quán)和學習權(quán)。一個信息單元是否被學習首先得看其關(guān)鍵詞的權(quán)值是否到達搜索權(quán)所規(guī)定的權(quán)值,否那么首輪即被模型所淘汰。即使是過了搜索關(guān),也只有當關(guān)鍵字的權(quán)值到達學習權(quán)時,該關(guān)鍵字才能被納入字典用來表征個性化信息模型。信息Agent通過不斷的學習,并在學習中修改字典,最終可得到一個關(guān)鍵字的相對穩(wěn)定的字典。

〔2〕信息過濾的方法,信息過濾系統(tǒng)是根據(jù)用戶的信息需求對動態(tài)信息流進行過濾,把滿足用戶需求的信息傳送給用戶,可以提高獲取信息的效率。信息過濾也是構(gòu)建個性化信息模型的有效方法,它根據(jù)一定的標準將那些不相關(guān)的信息濾掉,僅保存與用戶需求相關(guān)的信息。信息Agent根據(jù)自己的關(guān)鍵詞域,提取幾個權(quán)重比擬大的關(guān)鍵詞作為過濾的標準〔E-profile〕,每個E-profile描述著一個方面的信息需求。E-profile是否標準.可在實踐中被檢驗:那些對信息需求描述不準確的E-profile個體在競爭中將被淘汰。反之那么形成越來越大的規(guī)模,構(gòu)成一個內(nèi)容充實的個性化信息模型。常用的信息過濾方法有兩種:基于臺關(guān)鍵烘詞向稱量的反過濾諒方法魯和基牽于文迅獻集橫的信蟲息過弦濾方朝法。泄基于醋關(guān)鍵辣詞向侮量的列信息匆過濾駛方法適是一昨種相宣似過且濾方套法。系其思瓶想是絹比擬付表征息信息恢單元例的關(guān)竹鍵詞打與信蟲息A困ge么nt島給出泛標準臣關(guān)鍵古詞之扶間的擠相似響性,僚只有霸當相耗似性許到達隙一定肺的度葉,該重信息務(wù)單元樹才被史保存冶下來敗。確家立關(guān)像鍵詞英的相遺似度新是這難種過涼濾方終法的石核心屈。在奇此我慮們將蛛信息抽單元恭的關(guān)貍鍵詞陣與標腿準關(guān)換鍵詞蛋都看殿作向蓋量,咽其相鐵似度指就是埋這兩款個向佛量夾薪角的掙余弦耽值。

泳添〔3倉〕基英于多塌Mu酸lt坡i-箱Ag惠en級t肥

S被ys品te雜m的準合作誕方法豈。網(wǎng)奇絡(luò)個殃性化祖效勞升不是秋面向木單一怖用戶鐮的個獸性化吧效勞共,服塘務(wù)于磚每個強用戶艇的信粗息A謹ge亭nt李之間投并不削是孤賺立的外關(guān)系清,它裹們通古過相椅互合擔作構(gòu)減成一志個M墓AS捏。M駕AS芬的合尼作求賞解能污力遠咬遠超僚過單籃個A妥ge賭nt董,這也是M古AS醬產(chǎn)生搖的最穗直接啄的原刻因。晨通過屯MA進S的緞合作往,使標每個伸用戶減擁有聞一個建或多工個A域ge晶nt姿,這妥些A孫ge懼nt揀推薦濕的信煉息在邁內(nèi)容鈴上都誦有相趙關(guān)性甘,克騙服了彼單個昂信息星Ag故en怎t功棕能不露強的煉缺陷淹。多芝Ag超en次t之神間的騾合作頂是通幸過多仔Ag昨en誕t協(xié)松商協(xié)海議來伍完成僑的。扁協(xié)商轟協(xié)議妻是M摟AS啄實現(xiàn)貌協(xié)同揮、協(xié)優(yōu)作、贊沖突歷消解舞和矛刻盾處真理的巴關(guān)鍵秘環(huán)節(jié)煎。在肅MA刃S中薦,協(xié)繼商協(xié)旅議被斷描述犯成四扇元組鉗:{豆目標甘Ag戶en距t,話源A犯ge期nt蔥,消慢息名洗,消去息內(nèi)朋容}麥,這飛種四磨元組隸形式搜通過勉嵌套畝使用技來擴眉大合怠作的夜范圍吸。信闖息A愧ge貫nt始之間漆一旦青達成且合作宗協(xié)議廊,多糖個信欲息A疊ge督nt疑的個骨性化努信息達模型櫻就構(gòu)邁成一胡個邏綿輯體目,每作個信蕩息A嗓ge債nt墨就將御自己饒和伙刻伴A哥ge稿nt籃的信籮息文病檔推殿薦給炎相關(guān)截用戶餡,以目充實繁用戶曾信息鴉需求鴉的內(nèi)嘗容。

勤4.升2猛用戶苦模型輩的構(gòu)造建方劃法

瘡使建立軋用戶艇模型渠是實愉現(xiàn)個事性化冤效勞店的另扒一個男重要戲方面揮。用陣戶模搭型是碧實現(xiàn)宴個性牌化服犯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論