信息資源整合與個(gè)性化服務(wù)_第1頁
信息資源整合與個(gè)性化服務(wù)_第2頁
信息資源整合與個(gè)性化服務(wù)_第3頁
信息資源整合與個(gè)性化服務(wù)_第4頁
信息資源整合與個(gè)性化服務(wù)_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字資源整合的機(jī)制與方法李廣建(liguangjian@)主要內(nèi)容信息技術(shù)對(duì)信息服務(wù)的影響信息資源整合信息技術(shù)對(duì)信息服務(wù)的影響隨著計(jì)算機(jī)技術(shù)、多媒體以及網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,信息載體的不斷電子化、網(wǎng)絡(luò)化,信息服務(wù)機(jī)構(gòu)(如圖書館、情報(bào)機(jī)構(gòu))的信息技術(shù)也隨之計(jì)算機(jī)化、網(wǎng)絡(luò)化,以滿足不斷變化和發(fā)展的文獻(xiàn)信息服務(wù)的需求。信息技術(shù)既對(duì)信息服務(wù)機(jī)構(gòu)帶來了機(jī)遇、也帶來了挑戰(zhàn)。機(jī)遇提供了先進(jìn)的技術(shù)手段過去手工條件做到的,現(xiàn)在提高了效率過去想到了,但因條件的限制做不到,現(xiàn)在能做了過去沒想到的,現(xiàn)在也能做了挑戰(zhàn)過去的很多認(rèn)識(shí),現(xiàn)在不靈了(觀念問題)運(yùn)行方式和作業(yè)環(huán)境發(fā)生了翻天覆地的變化(還是圖書館嗎?)用戶的要求越來越高了(需求總是很難滿足)從挑戰(zhàn)談起……現(xiàn)有圖書館工作模式流水線式的工作目錄為中心的工作模式以文獻(xiàn)為單元的工作模式現(xiàn)代信息技術(shù)環(huán)境下圖書館工作面臨的轉(zhuǎn)變工作的中心由面向館藏的轉(zhuǎn)變成面向用戶的從基于載體的信息提供轉(zhuǎn)變成是基于內(nèi)容的信息提供從館內(nèi)服務(wù)或面對(duì)面的服務(wù)轉(zhuǎn)變成網(wǎng)絡(luò)服務(wù)或遠(yuǎn)程服務(wù)技術(shù)和設(shè)備在很大程度上會(huì)影響工作效果再看看機(jī)遇……如果我們轉(zhuǎn)變觀念從圖書館的用戶到用戶的圖書館如果我們改變流程從分立的資源服務(wù)到集成整合的服務(wù)如果我們用新技術(shù)從簡(jiǎn)單的信息檢索到個(gè)性化的推送SearchenginePersonal

environmentsPDAslearningmanagementsystemscampusportalcoursematerial

textbookRSSaggregatorreading

listslibraryuserenvironmentsresourceenvironmentInstitutionalrepositoryDigitalcollectionsE-reserveCatalogLicensedcollectionsAggregationsVirtualreferenceCataloging,ILLthelibraryintheuserenvironment,Nottheuserinthelibraryenvironment.Flexibleassemblyofservicesfrommultiplesources.從圖書館的用戶到用戶的圖書館總之,要……圍繞著用戶的工作流程構(gòu)建相關(guān)的信息服務(wù);使用戶不離開其工作環(huán)境就可使用信息資源;按照用戶的使用習(xí)慣組織信息資源和服務(wù);能根據(jù)用戶的不同為其組織和裝配不同的資源和服務(wù)徹底解決……用戶看到的一個(gè)個(gè)孤立的系統(tǒng),是一個(gè)個(gè)的建設(shè)成果展示;服務(wù)系統(tǒng)自成體系,系統(tǒng)互連性差,不能被相互調(diào)用;系統(tǒng)之的連接關(guān)系是零散、無序、任意的甚至是混亂的,沒有一個(gè)清晰的流程;……用戶不了解、不明白、不易用、不會(huì)用、不能用、不愛用…..解決方案信息資源整合主要內(nèi)容信息技術(shù)對(duì)對(duì)信息服務(wù)務(wù)的影響信息資源整整合信息資源整整合整合機(jī)制整合技術(shù)整合機(jī)制目前數(shù)字資資源整合系系統(tǒng)的實(shí)現(xiàn)現(xiàn)機(jī)制可以以概括為四四種數(shù)據(jù)倉庫整整合機(jī)制Mediator/Wrapper整整合機(jī)制(中介器/封裝器整整合機(jī)制)、Agent整合機(jī)制制P2P整合合機(jī)制整合機(jī)制--數(shù)據(jù)倉庫整整合機(jī)制數(shù)據(jù)倉庫整整合機(jī)制是是一種物理理集成方式式,它將不不同來源的的數(shù)字資源源按特定的的方式(通通常是按主主題或其它它多維方式式)建模并并存儲(chǔ)在同同一物理位位置(稱為為數(shù)據(jù)倉庫庫),提供供給用戶一一個(gè)新的、、統(tǒng)一的目目標(biāo)數(shù)據(jù)模模式(schema),使得得用戶能夠夠一站式地地訪問各種種數(shù)字資源源,從而達(dá)達(dá)到整合的的目的。下圖概略地地示出了數(shù)數(shù)據(jù)倉庫整整合機(jī)制的的基本原理理數(shù)據(jù)倉庫數(shù)據(jù)源目標(biāo)模式從上圖中可可以看出,,數(shù)據(jù)倉庫庫整合機(jī)制制的最根本本的特點(diǎn)是是物理地存存放數(shù)字資資源,對(duì)不不同來源的的數(shù)字資源源進(jìn)行集中中管理,簡(jiǎn)化了用戶戶訪問信息息的復(fù)雜度度,提高了了數(shù)字資源源的訪問速速度和整合合系統(tǒng)的性性能。而且,由于于實(shí)現(xiàn)了不不同來源的的數(shù)字資源源的一致性性存儲(chǔ),這這種整合機(jī)機(jī)制還有利利于實(shí)施比比信息檢索索更復(fù)雜、、更深入的的數(shù)據(jù)挖掘掘、知識(shí)發(fā)發(fā)現(xiàn)等服務(wù)務(wù)。采用數(shù)據(jù)倉庫整整合機(jī)制進(jìn)進(jìn)行整合的的前提是必必須能合法法地(例如如通過授權(quán)權(quán))獲得來來源系統(tǒng)中中的數(shù)字資資源,而且且,由于是是集中存儲(chǔ)儲(chǔ)要整合的的數(shù)字資源源,因而難難以適應(yīng)網(wǎng)網(wǎng)絡(luò)數(shù)字資資源類型多多樣、變化化快等特點(diǎn)點(diǎn),同時(shí)還會(huì)增加本地系統(tǒng)存存儲(chǔ)與維護(hù)護(hù)的負(fù)擔(dān)。。數(shù)據(jù)倉庫整整合機(jī)制較較適用于自自建資源。。數(shù)據(jù)倉庫整整合機(jī)制所所涉及的技技術(shù)主要有有:(1)海量量數(shù)據(jù)存儲(chǔ)儲(chǔ)(2)ETL技術(shù)(3)信息息源的監(jiān)控控與更新(1)海量量數(shù)據(jù)存儲(chǔ)儲(chǔ)數(shù)據(jù)倉庫的的數(shù)據(jù)來源源于多個(gè)信信息源(即即參與整合合的系統(tǒng)中中的數(shù)字資資源),因因此具有數(shù)數(shù)據(jù)量大、、類型復(fù)雜雜的特點(diǎn),,屬于海量量數(shù)據(jù)。解決海量數(shù)數(shù)據(jù)的存儲(chǔ)儲(chǔ)問題,除除了需要相相應(yīng)的專門門設(shè)備如磁磁盤陣列、、光盤庫、、磁帶庫等等,還需要要精心地設(shè)設(shè)計(jì)存儲(chǔ)結(jié)結(jié)構(gòu)和存儲(chǔ)儲(chǔ)算法,既既要保證數(shù)數(shù)字資源有有合理的物物理存儲(chǔ)結(jié)結(jié)構(gòu),又要要保證有較較快的存取取速度。(2)ETL技術(shù)ETL技術(shù)術(shù)是對(duì)要加加以整合的的數(shù)字資源源進(jìn)行抽取取(Extract)、轉(zhuǎn)換換(Transform)、、清洗(Cleaning))、裝載((Loading))的技術(shù)。。對(duì)不同來源源的數(shù)字資資源進(jìn)行物物理集成,,首先需要要從參與整整合的系統(tǒng)統(tǒng)中抽取出出相關(guān)數(shù)字字資源,這這需要使用用信息抽取取技術(shù)。由于信息源源是異構(gòu)的的,因此,,還必須利利用轉(zhuǎn)換技技術(shù)將不同同結(jié)構(gòu)的數(shù)數(shù)字資源規(guī)規(guī)范化,消消除異構(gòu)數(shù)數(shù)字資源之之間的不一一致性,為為來自不同同系統(tǒng)的數(shù)數(shù)字資源之之間的比較較、整合以以及統(tǒng)一存存儲(chǔ)奠定基基礎(chǔ);清洗技術(shù)主主要是解決決信息冗余余的去重以以及錯(cuò)誤和和不完整信信息的修正正、剔除問問題;裝載技術(shù)則則是將清洗洗后的數(shù)字字資源按一一定的規(guī)則則加載至數(shù)數(shù)據(jù)倉庫,,形成數(shù)據(jù)據(jù)倉庫的物物理存儲(chǔ)結(jié)結(jié)構(gòu)和邏輯輯存儲(chǔ)結(jié)構(gòu)構(gòu)。(3)信息息源的監(jiān)控控與更新如前所述,,數(shù)據(jù)倉庫庫整合機(jī)制制是一種物物理整合方方式,數(shù)據(jù)據(jù)倉庫本身身與信息源源在物理上上是分離的的,因此必必須要解決決數(shù)據(jù)倉庫庫與信息源源的同步問問題。也就就是說,必必須要監(jiān)控控參與整合合的信息源源的變化,,同步更新新數(shù)據(jù)倉庫庫,確保用用戶在整合合系統(tǒng)中查查詢到的是是各個(gè)信息息源中的最最新數(shù)字資資源。整合機(jī)制--M/W整合合mediator/wrapper整整合機(jī)制是是一種虛擬擬整合方式式,在基于于這種機(jī)制制的整合系系統(tǒng)中,并并不真正存存儲(chǔ)需要整整合的數(shù)字字資源,而而是通過mediator和和wrapper來來實(shí)現(xiàn)整合合。mediator和和wrapper均均為軟件組組件,位于于用戶和數(shù)數(shù)據(jù)源之間間,mediator負(fù)責(zé)處處理用戶提提問和查詢?cè)兘Y(jié)果的整整合,wrapper則負(fù)責(zé)責(zé)對(duì)信息源源的連接和和具體查詢?cè)?。mediator/wrapper整整合機(jī)制的的基本原理理如圖所示示。中介器(mediator)分布式資源分布式資源分布式資源封裝器(wrapper)封裝器(wrapper)封裝器(wrapper)提問全局模式(GlobalSchema)信息源模式(Source/LocalSchema)在基于這種種機(jī)制的整整合系統(tǒng)中中,用戶按按全局模式式(GlobalSchema)進(jìn)進(jìn)行查詢,,mediator接收用戶戶查詢并將將其轉(zhuǎn)換成成中間格式式,然后提提交給相應(yīng)應(yīng)的wrapper,wrapper進(jìn)一步將將中間格式式的查詢轉(zhuǎn)轉(zhuǎn)化為信息息源模式或或本地模式式(Source/LocalSchema)的查詢?cè)儯⑴c參參加整合的的相應(yīng)信息息源進(jìn)行連連接,實(shí)現(xiàn)現(xiàn)對(duì)相應(yīng)信信息源的查查詢,將查查詢結(jié)果返返回給mediator,mediator對(duì)對(duì)結(jié)果進(jìn)行行處理,以以統(tǒng)一的形形式提供給給用戶。與數(shù)據(jù)倉庫庫整合機(jī)制制相比,mediator/wrapper整整合機(jī)制能夠有效地地保持各個(gè)個(gè)異構(gòu)信息源源的自治性性,滿足局局部的應(yīng)用用,并且能能夠充分發(fā)發(fā)揮mediator的作用,滿滿足全局性性應(yīng)用。同同時(shí),使用用這種機(jī)制制的整合系統(tǒng)統(tǒng)不需要在本本地儲(chǔ)存大大量的數(shù)字字資源,因因而能夠適適應(yīng)網(wǎng)絡(luò)環(huán)環(huán)境下信息息源高度自自治、數(shù)量量多、更新新變化快等等特點(diǎn),而而且,在mediator中引入Ontology等語語義相關(guān)技技術(shù)后,能能夠有效解解決知識(shí)整整合、個(gè)性性化服務(wù)等等問題。因而,mediator/wrapper整整合機(jī)制是目前實(shí)現(xiàn)數(shù)字資資源整合的主流方式式。mediator/wrapper整整合機(jī)制涉涉及的主要要技術(shù)有::(1)信息息源選擇技技術(shù)(2)信息息抽取技術(shù)術(shù)(3)查詢?cè)兲幚砑夹g(shù)術(shù)(4)結(jié)果果整合技術(shù)術(shù)(5)語義義整合技術(shù)術(shù)(1)信息息源選擇技技術(shù)mediator/wrapper整整合機(jī)制是是一種虛擬擬整合方式式,整合系系統(tǒng)本身并并不存儲(chǔ)被被整合的數(shù)數(shù)字資源,,當(dāng)用戶進(jìn)進(jìn)行查詢時(shí)時(shí),如果將將用戶查詢?cè)儾患訁^(qū)別別地發(fā)送給給參與整合合的所有信信息源,必必然會(huì)導(dǎo)致致占用較多多的帶寬并并增加系統(tǒng)統(tǒng)的負(fù)擔(dān),,這就需要要利用信息息源選擇技技術(shù)來確定定相關(guān)度高高的信息源源,以提高高整合系統(tǒng)統(tǒng)的效率。。信息源選擇擇技術(shù)主要要包括信息息源描述和和信息源選選擇兩個(gè)方方面,前者者是按一定定的算法建建立對(duì)各信信息源的描描述模型,,后者是在在信息源描描述模型的的基礎(chǔ)上,,根據(jù)用戶戶查詢,按按一定算法法選出相關(guān)關(guān)度高的信信息源作為為查詢對(duì)象象。(2)信息息抽取技術(shù)術(shù)信息抽取技技術(shù)應(yīng)用于于整合系統(tǒng)統(tǒng)的目的是是將參與整整合的半結(jié)結(jié)構(gòu)化、非非結(jié)構(gòu)化信信息源中的的數(shù)字資源源轉(zhuǎn)化成結(jié)結(jié)構(gòu)性更強(qiáng)強(qiáng)、語義更更清晰的格格式,以提提高查詢速速度。目前前,信息抽抽取技術(shù)已已經(jīng)成為了了生成wrapper的關(guān)鍵鍵技術(shù)之一一,廣泛應(yīng)應(yīng)用于面向向網(wǎng)絡(luò)數(shù)字字資源的整整合系統(tǒng)中中。(3)查詢?cè)兲幚砑夹g(shù)術(shù)查詢處理技技術(shù)是mediator/wrapper整合合機(jī)制中的的最重要的的技術(shù)之一一,是對(duì)查查詢進(jìn)行檢檢驗(yàn)、重構(gòu)構(gòu)、優(yōu)化的的技術(shù)。用戶對(duì)整合合系統(tǒng)查詢?cè)儠r(shí),整合合系統(tǒng)需首首先對(duì)用戶戶查詢進(jìn)行行語法分析析和檢驗(yàn),,確保查詢?cè)兎舷到y(tǒng)統(tǒng)全局模式式的要求,,這部分工工作主要由由查詢檢驗(yàn)驗(yàn)技術(shù)完成成。此后,整合系系統(tǒng)再將經(jīng)過過檢驗(yàn)的查詢?cè)儼匆欢ǖ囊?guī)規(guī)則轉(zhuǎn)換為面面向不同信息息源模式(本本地模式)的的多個(gè)查詢,,這個(gè)過程稱稱為查詢重構(gòu)構(gòu)。整合系統(tǒng)面對(duì)對(duì)的是不同的的信息源,由由于各個(gè)信息息源有其自身身的特點(diǎn),例例如有不同的的傳輸帶寬和和傳輸延時(shí),,加之當(dāng)前運(yùn)運(yùn)行情況有不不確定性,如如當(dāng)前的信息息源訪問量是是大還是小、、信息源是否否能很快與整整合系統(tǒng)建立立連接等等,,這就要求整整合系統(tǒng)根據(jù)據(jù)各信息源的的當(dāng)前運(yùn)行情情況制定最優(yōu)優(yōu)查詢計(jì)劃和和查詢調(diào)配方方案,并據(jù)此此對(duì)各信息源源進(jìn)行查詢,,這個(gè)過程稱稱為查詢優(yōu)化化。(4)結(jié)果整整合技術(shù)整合系統(tǒng)提供供對(duì)各信息源源的一站式訪訪問,因而對(duì)對(duì)信息源訪問問完畢后需要要用mediator對(duì)對(duì)來自不同信信息源的結(jié)果果信息進(jìn)行整整合及合成,,以統(tǒng)一的形形式呈現(xiàn)給用用戶。結(jié)果整合主要要是對(duì)不同信信息源的結(jié)果果做并操作,,并且重新計(jì)計(jì)算結(jié)果的相相關(guān)度。一般地說,對(duì)對(duì)一個(gè)信息源源進(jìn)行查詢會(huì)會(huì)形成一個(gè)相相應(yīng)的查詢子子視圖,結(jié)果果整合的目的的就是將這些些子視圖連接接起來,形成成一個(gè)完整的的視圖,提供供給用戶。(5)語義整整合技術(shù)隨著整合研究究理論和實(shí)踐踐不斷深入,,Ontology、語言建模、、機(jī)器學(xué)習(xí)等等語義相關(guān)技技術(shù)逐漸應(yīng)用用于數(shù)字資源源整合。語義整合技術(shù)術(shù)被用來在系系統(tǒng)運(yùn)行期間間獲取和處理理數(shù)字資源的的意義及其之之間的關(guān)聯(lián),,使整合系統(tǒng)統(tǒng)能夠建立用用戶提問與各各信息源之間間的語義聯(lián)系系,消除各種種數(shù)字資源的的異構(gòu)性,并并能夠?qū)⒎稚⑸⒋鎯?chǔ)、表現(xiàn)現(xiàn)形式不同的的信息源中的的有用資源進(jìn)進(jìn)行再組織,,真正滿足用用戶的信息需需求,從而提提高數(shù)字資源源整合的質(zhì)量量。整合機(jī)制-Agent整整合機(jī)制Agent是是處于一定的的環(huán)境中或者者作為環(huán)境的的一部分存在在的一種軟件件系統(tǒng),它利利用傳感器((Sensor)感應(yīng)環(huán)環(huán)境,獲取相相關(guān)信息,然然后根據(jù)這些些信息和指定定的目標(biāo)執(zhí)行行相應(yīng)操作。。近年來,研研究人員將Agent技技術(shù)應(yīng)用于整整合系統(tǒng)中,,形成了Agent整合合機(jī)制。Agent整整合機(jī)制以Agent作作為核心模塊塊,以ontology作為核心技技術(shù),比較適適合于整合分分布性較強(qiáng)的的數(shù)字資源,,其原理是:將將整合系統(tǒng)框框架中的各個(gè)個(gè)(或主要))功能模塊封封裝為Agent,各Agent之之間進(jìn)行通信信、交互和合合作,從而有有效地實(shí)現(xiàn)整整合。Agent整整合機(jī)制的基本原理如如圖所示結(jié)果結(jié)果代理方Agent代理方Agent代理方Agent用戶Agent用戶Agent提問提問信息源信息源信息源資源Agent資源Agent資源Agent在這種整合機(jī)制中,使用了三三類基本的Agent::用戶Agent、資源源Agent和代理方Agent。。用戶Agent負(fù)責(zé)維護(hù)用戶信息,并提提供系統(tǒng)接口口,以方便用戶與與整合系統(tǒng)進(jìn)進(jìn)行交互。資源Agent負(fù)責(zé)對(duì)分布式式資源進(jìn)行處處理,將數(shù)字字資源按照整整合系統(tǒng)的表表示形式進(jìn)行行描述和轉(zhuǎn)換換。代理方Agent負(fù)責(zé)將從用戶戶Agent發(fā)出的查詢?cè)冋?qǐng)求與所要要查詢的資源源Agent進(jìn)行匹配Agent整整合機(jī)制的優(yōu)優(yōu)點(diǎn)在于能夠夠有效利用Agent的的特性來提高高系統(tǒng)的整合合效率首先,Agent的自主主性和移動(dòng)性性使得整合系系統(tǒng)能夠主動(dòng)動(dòng)適應(yīng)網(wǎng)絡(luò)環(huán)環(huán)境的變化,,增強(qiáng)了整合合系統(tǒng)的靈活活性,整合系系統(tǒng)能更加適適應(yīng)數(shù)字資源源分布性及異異構(gòu)性的特點(diǎn)點(diǎn)。其次,Agent能夠在在非連續(xù)運(yùn)行行的網(wǎng)絡(luò)環(huán)境境中運(yùn)行,因因此Agent還可處于于移動(dòng)計(jì)算環(huán)環(huán)境中,這使使得各種移動(dòng)動(dòng)設(shè)備(如PDA等)也也能加入使用用整合系統(tǒng)的的中。Agent機(jī)制的的這些特點(diǎn),,使其成為了了近年來整合合研究的熱點(diǎn)點(diǎn)之一。在Agent整合機(jī)制中中,如何使多多個(gè)Agent協(xié)調(diào)工作作,是采用這這種機(jī)制的整整合系統(tǒng)要解解決的關(guān)鍵技技術(shù),具體地地說,包括::(1)Agent間的通通信技術(shù)(2)Agent協(xié)調(diào)技技術(shù)(1)Agent間的通通信技術(shù)為了達(dá)到整合合的目的,提提高整合效率率,需要通過過Agent通信技術(shù)來來實(shí)現(xiàn)Agent間的““會(huì)話”。一般來說,Agent間間的通信是通通過Agent通信語言言(ACL))來實(shí)現(xiàn)的Agent通通信語言用于于描述相應(yīng)Agent的的狀態(tài)和屬性性、定義Agent可以以交換的語法法和語義消息息。這種包含含語義信息的的通信語言不不僅有利于協(xié)協(xié)助Agent之間進(jìn)行行互操作,還還有利于進(jìn)行行語義層次的的整合。(2)Agent協(xié)調(diào)技技術(shù)在Agent整合機(jī)制中中,多個(gè)Agent作為為一個(gè)整體而而存在,雖然然每個(gè)Agent的任務(wù)務(wù)有所區(qū)別,,但它們作為為一個(gè)整體,,具有共同的的目標(biāo),那就就是實(shí)現(xiàn)整合合。因此,在任務(wù)務(wù)執(zhí)行的過程程中,需要應(yīng)應(yīng)用Agent協(xié)調(diào)技術(shù)術(shù)來管理一個(gè)個(gè)或多個(gè)Agent行為為之間的從屬屬關(guān)系,避免免執(zhí)行時(shí)發(fā)生生沖突,所要要解決的問題題包括組織結(jié)結(jié)構(gòu)、任務(wù)分分解、資源分分配、群組決決策、沖突發(fā)發(fā)現(xiàn)與解決等等整合機(jī)制-P2P整合機(jī)機(jī)制P2P(Peer-to-peer)是近年來來興起的一種種新的計(jì)算模模式,它能夠夠使PC和其其它非服務(wù)器器計(jì)算實(shí)體以以對(duì)等的方式式聯(lián)網(wǎng),彼此此共享對(duì)方的的資源。其主主要特點(diǎn)是支支持互連主機(jī)機(jī)的動(dòng)態(tài)變化化。P2P整合機(jī)機(jī)制的基本原原理如圖所示示Peer3對(duì)等點(diǎn)模式本地資源本地資源Peer2對(duì)等點(diǎn)模式本地資源本地資源Peer4對(duì)等點(diǎn)模式本地資源本地資源Peer1對(duì)等點(diǎn)模式本地資源本地資源Peer5對(duì)等點(diǎn)模式本地資源本地資源本地映射P2P映射提問Q在這種整合機(jī)機(jī)制中,存在在有多個(gè)分布布式的對(duì)等點(diǎn)點(diǎn)(peer),每一個(gè)個(gè)對(duì)等點(diǎn)都擁擁有一套自己己的數(shù)據(jù)模式式(對(duì)等點(diǎn)模模式),在整整合過程中,,通過對(duì)等點(diǎn)點(diǎn)模式與本地地資源模式的的映射,實(shí)現(xiàn)現(xiàn)對(duì)本地資源源的訪問,同同時(shí)依靠P2P映射來完完成對(duì)等點(diǎn)之之間的模式轉(zhuǎn)轉(zhuǎn)換,實(shí)現(xiàn)對(duì)對(duì)等點(diǎn)間的通通信。通過這這種方式,在在任何一個(gè)對(duì)對(duì)等點(diǎn)中執(zhí)行行的查詢也均均可以在其他他相連的對(duì)等等點(diǎn)中執(zhí)行,,從而達(dá)到有有效訪問各分分布信息源的的目的。P2P整合機(jī)機(jī)制不僅能夠夠?qū)崿F(xiàn)大規(guī)模模數(shù)字資源的的集成,而且且可以實(shí)現(xiàn)Web資源的的動(dòng)態(tài)整合,,使整合系統(tǒng)統(tǒng)具有強(qiáng)大的的擴(kuò)展性,是是一種比較有有生命力的整整合機(jī)制。但但由于學(xué)術(shù)界界對(duì)P2P整整合機(jī)制的研研究處于起步步階段,目前前理論研究較較多,實(shí)際應(yīng)應(yīng)用系統(tǒng)數(shù)量量還不太多P2P整合機(jī)機(jī)制的關(guān)鍵技技術(shù)是P2P映射以及對(duì)對(duì)等點(diǎn)的發(fā)現(xiàn)現(xiàn)與搜索,具具體地說包括括:(1))P2P映映射建建立技技術(shù)(2))P2P對(duì)對(duì)等點(diǎn)點(diǎn)的發(fā)發(fā)現(xiàn)與與搜索索技術(shù)術(shù)(1))P2P映映射建建立技技術(shù)在P2P整整合機(jī)機(jī)制中中,由由于每每個(gè)對(duì)對(duì)等點(diǎn)點(diǎn)的模模式不不同,,需要要在對(duì)對(duì)等點(diǎn)點(diǎn)模式式之間間建立立映射射P2P映射射的建建立一一般包包括兩兩個(gè)步步驟第一步步是模模式匹匹配,,即在在需匹匹配的的模式式間,,尋找找能夠夠標(biāo)識(shí)識(shí)出模模式中中的相相同或或相似似元素素的對(duì)對(duì)應(yīng)關(guān)關(guān)系,,這種種對(duì)應(yīng)應(yīng)關(guān)系系一般般是指指對(duì)元元素相相似性性的描描述,,基本本上不不包含含語義義信息息;在第二二步中中,通通過對(duì)對(duì)應(yīng)關(guān)關(guān)系,,利用用一系系列自自動(dòng)化化技術(shù)術(shù),在在人工工干預(yù)預(yù)下,,建立立精確確的P2P映射射。(2))P2P對(duì)對(duì)等點(diǎn)點(diǎn)的發(fā)發(fā)現(xiàn)與與搜索索技術(shù)術(shù)在整合合處理理過程程中,,由于于P2P網(wǎng)網(wǎng)絡(luò)中中存在在多個(gè)個(gè)對(duì)等等點(diǎn),,每個(gè)個(gè)對(duì)等等點(diǎn)存存儲(chǔ)有有不同同的數(shù)數(shù)字資資源,,因此此需要要針對(duì)對(duì)具體體的用用戶需需求,,利用用發(fā)現(xiàn)現(xiàn)策略略、搜搜索算算法等等相關(guān)關(guān)技術(shù)術(shù),對(duì)對(duì)P2P資資源進(jìn)進(jìn)行搜搜索,,找出出合適適的對(duì)對(duì)等點(diǎn)點(diǎn),并并通過過多個(gè)個(gè)對(duì)等等點(diǎn)的的協(xié)作作來集集成資資源。。目前,,在P2P對(duì)等等點(diǎn)的的發(fā)現(xiàn)現(xiàn)與搜搜索中中應(yīng)用用較多多的是是分布布式哈哈希列列表((DHT))技術(shù)術(shù),這這種技技術(shù)使使用分分布式式哈希希算法法來解解決結(jié)結(jié)構(gòu)化化的分分布式式存儲(chǔ)儲(chǔ)問題題,DHT中存存儲(chǔ)有有每個(gè)個(gè)對(duì)等等點(diǎn)的的相關(guān)關(guān)信息息,通通過DHT可針針對(duì)具具體需需求獲獲取所所需對(duì)對(duì)等點(diǎn)點(diǎn)的信信息,,從而而解決決了對(duì)對(duì)等點(diǎn)點(diǎn)的發(fā)發(fā)現(xiàn)問問題,,然后后,再再根據(jù)據(jù)基于于DHT的的路由由算法法完成成對(duì)等等點(diǎn)的的搜索索。信息資資源整整合整合機(jī)機(jī)制整合技技術(shù)整合技技術(shù)整合的的技術(shù)術(shù)體系系整合的的技術(shù)術(shù)標(biāo)準(zhǔn)準(zhǔn)總體體上劃劃分為為物理理層、、基礎(chǔ)礎(chǔ)層與與整合合三類類。根根據(jù)整整合內(nèi)內(nèi)部的的層次次關(guān)系系,自自下而而上將將整合合層細(xì)細(xì)劃為為3層層HTTP網(wǎng)絡(luò)協(xié)議元數(shù)據(jù)XMLRSS數(shù)據(jù)描述統(tǒng)一接口數(shù)據(jù)訪問中介文件SAGDRDA數(shù)據(jù)層聯(lián)邦模式Z39.5DienstSDLIP采集模式OAI搜集模式OpenURLCORBADCOMJAVARMI功能層WebServices協(xié)議族SOAPUDDIWSDL……門戶技術(shù)標(biāo)準(zhǔn)界面層JSR168WSRP物理層基礎(chǔ)層整合層物理層層物理層層指系系統(tǒng)運(yùn)運(yùn)行的的硬件件、軟軟件環(huán)環(huán)境,,解決決如何何為應(yīng)應(yīng)用系系統(tǒng)提提供統(tǒng)統(tǒng)一的的支撐撐環(huán)境境,支支持應(yīng)應(yīng)用系系統(tǒng)的的運(yùn)作作。物理層層協(xié)議議涉及及各種種網(wǎng)絡(luò)絡(luò)和通通信技技術(shù),,包括括網(wǎng)絡(luò)絡(luò)的一一些基基礎(chǔ)協(xié)協(xié)議,,如HTTP、、TCP/IP等,,以及及其他他相關(guān)關(guān)的以以太網(wǎng)網(wǎng)、骨骨干網(wǎng)網(wǎng)、廣廣域網(wǎng)網(wǎng)互聯(lián)聯(lián)的技技術(shù)標(biāo)標(biāo)準(zhǔn)與與規(guī)范范等。。對(duì)于不不提供供更高高層技技術(shù)協(xié)協(xié)議的的數(shù)字字資源源,也也可以以在這這個(gè)層層次上上進(jìn)行行整合合,例例如,,可基基于HTTP用用仿真真的方方法來來整合合數(shù)字字資源源。基礎(chǔ)層層基礎(chǔ)層層是位位于物物理互互連的的網(wǎng)絡(luò)絡(luò)協(xié)議議之上上,用用于標(biāo)標(biāo)準(zhǔn)化化、規(guī)規(guī)范化化描述述數(shù)據(jù)據(jù),為為更上上層的的數(shù)據(jù)據(jù)交換換提供供基礎(chǔ)礎(chǔ)性支支持的的標(biāo)準(zhǔn)準(zhǔn)、規(guī)規(guī)范。。基礎(chǔ)性性協(xié)議議標(biāo)準(zhǔn)準(zhǔn)又可可以從從性質(zhì)質(zhì)劃分分為數(shù)數(shù)據(jù)描描述層層面和和數(shù)據(jù)據(jù)訪問問兩個(gè)個(gè)層面面。前前者主主要包包括元元數(shù)據(jù)據(jù)、XML、RSS,后后者主主要包包括開開放數(shù)數(shù)據(jù)庫庫互連連標(biāo)準(zhǔn)準(zhǔn)(ODBC))等。。在數(shù)據(jù)據(jù)描述述層面面內(nèi)部部,RSS具有有提供供內(nèi)容容聚合合的功功能,,是為為實(shí)現(xiàn)現(xiàn)內(nèi)容容聚合合而制制定的的一種種信息息描述述、組組織的的規(guī)范范,但但它也也具有有資源源發(fā)現(xiàn)現(xiàn)、發(fā)發(fā)布的的功能能,更更是一一種新新形式式的描描述規(guī)規(guī)則。。因此此,將將RSS歸歸入基基礎(chǔ)的的描述述層面面的標(biāo)標(biāo)準(zhǔn)。。準(zhǔn)確確的說說,RSS本身身也是是基于于XML格格式的的,其其實(shí)是是XML成成功應(yīng)應(yīng)用的的一個(gè)個(gè)典型型。從從這一一層總總體來來看,,這些些基礎(chǔ)礎(chǔ)的標(biāo)標(biāo)準(zhǔn)、、規(guī)范范(除除了RSS之外外),,大多多數(shù)都都不是是專門門為解解決資資源整整合的的問題題而制制定的的,主主要是是從信信息組組織、、跨異異構(gòu)數(shù)數(shù)據(jù)庫庫的互互連、、互訪訪用途途出發(fā)發(fā)的。。但是是,它它們卻卻為更更好地地實(shí)現(xiàn)現(xiàn)資源源整合合提供供了有有力的的支持持。因此,,對(duì)于于特定定的應(yīng)應(yīng)用,,也可可以在在這個(gè)個(gè)層次次進(jìn)行行整合合數(shù)據(jù)整整合層層數(shù)據(jù)層層整合合旨在在屏蔽蔽各數(shù)數(shù)據(jù)源源異構(gòu)構(gòu)性,,使得得各數(shù)數(shù)據(jù)源源之間間能夠夠進(jìn)行行數(shù)據(jù)據(jù)的交交換與與交互互,令令用戶戶可透透明地地訪問問多個(gè)個(gè)數(shù)據(jù)據(jù)源,,感覺覺上卻卻像是是在操操作一一個(gè)單單一的的數(shù)據(jù)據(jù)源。。要實(shí)現(xiàn)現(xiàn)數(shù)據(jù)據(jù)整合合,必必須對(duì)對(duì)數(shù)據(jù)據(jù)進(jìn)行行跨數(shù)數(shù)據(jù)源源的收收集、、組織織、處處理與與集成成。根根據(jù)整整合系系統(tǒng)與與數(shù)據(jù)據(jù)源之之間交交互的的特點(diǎn)點(diǎn),又又可以以分為為三種種形式式基于聯(lián)聯(lián)邦的的整合合(如如Z39.5、、Dienst)基于采采集的的整合合(OAI)基于鏈鏈接的的整合合(如如OpenURL))數(shù)據(jù)層層整合合協(xié)議議的重重點(diǎn)是是解決決系統(tǒng)統(tǒng)之間間的數(shù)數(shù)據(jù)交交換和和數(shù)據(jù)據(jù)交互互功能層層功能層層整合合主要要重組組和擴(kuò)擴(kuò)充數(shù)數(shù)字資資源系系統(tǒng)的的已有有功能能,或或者建建立新新的功功能。??傮w體來看看,這這一層層所采采用的的標(biāo)準(zhǔn)準(zhǔn)規(guī)范范旨在在解決決系統(tǒng)統(tǒng)與系系統(tǒng)之之間功功能的的互操操作。。分布式式對(duì)象象技術(shù)術(shù)是目目前解解決功功能互互操作作的主主流技技術(shù),,分布布式對(duì)對(duì)象技技術(shù)的的作用用就是是將存存在于于網(wǎng)絡(luò)絡(luò)任何何地方方、能能被遠(yuǎn)遠(yuǎn)程應(yīng)應(yīng)用以以方法法調(diào)用用的形形式訪訪問的的實(shí)體體有機(jī)機(jī)組合合在一一起,,形成成一個(gè)個(gè)相對(duì)對(duì)較大大的組組件,,通過過這個(gè)個(gè)組件件為更更上層層的應(yīng)應(yīng)用提提供系系列的的服務(wù)務(wù)。分布式式對(duì)象象技術(shù)術(shù)涉及及的協(xié)協(xié)議標(biāo)標(biāo)準(zhǔn)主主要有有CORBA、、JavaRMI、DCOM,,以及及WebService協(xié)協(xié)議族族。界面面層層界面面層層是是最最接接近近用用戶戶的的高高級(jí)級(jí)層層次次,,主主要要實(shí)實(shí)現(xiàn)現(xiàn)表表示示層層面面的的整整合合,,使使得得服服務(wù)務(wù)用用戶戶能能夠夠通通過過統(tǒng)統(tǒng)一一的的界界面面,,同同時(shí)時(shí)享享受受到到不不同同服服務(wù)務(wù)提提供供者者提提供供的的服服務(wù)務(wù)。。門戶戶技技術(shù)術(shù)是是界界面面整整合合的的重重要要手手段段,,其其中中涉涉及及門門戶戶組組件件((portlet))技技術(shù)術(shù)以以及及相相應(yīng)應(yīng)的的的的接接口口規(guī)規(guī)范范JSR168((theJavaStandardizationRequest168)),以以及及WSRP(((WebServicesforRemotePortlet)謝謝謝9、靜夜四無無鄰,荒居居舊業(yè)貧。。。12月-2212月-22Saturday,December31,202210、雨中黃葉葉樹,燈下下白頭人。。。03:23:4703:23:4703:2312/31/20223:23:47AM11、以我獨(dú)沈久久,愧君相見見頻。。12月-2203:23:4803:23Dec-2231-Dec-2212、故人人江海海別,,幾度度隔山山川。。。03:23:4803:23:4803:23Saturday,December31,202213、乍見翻疑疑夢(mèng),相悲悲各問年。。。12月-2212月-2203:23:4803:23:48December31,202214、他鄉(xiāng)生生白發(fā),,舊國見見青山。。。31十十二月20223:23:48上午午03:23:4812月-2215、比不了得就就不比,得不不到的就不要要。。。十二月223:23上上午12月-2203:23December31,202216、行動(dòng)出成成果,工作作出財(cái)富。。。2022/12/313:23:4803:23:4831December202217、做做前前,,能能夠夠環(huán)環(huán)視視四四周周;;做做時(shí)時(shí),,你你只只能能或或者者最最好好沿沿著著以以腳腳為為起起點(diǎn)點(diǎn)的的射射線線向向前前。。。。3:23:48上上午午3:23上上午午03:23:4812月月-229、沒有失失敗,只只有暫時(shí)時(shí)停止成成功!。。12月-2212月-22Saturday,December31,202210、很多事事情努力力了未必必有結(jié)果果,但是是不努力力卻什么么改變也也沒有。。。03:23:4803:23:4803:2312/31/2022

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論