資源共享與分布式整合應(yīng)用-相關(guān)技術(shù)與標(biāo)準(zhǔn)_第1頁
資源共享與分布式整合應(yīng)用-相關(guān)技術(shù)與標(biāo)準(zhǔn)_第2頁
資源共享與分布式整合應(yīng)用-相關(guān)技術(shù)與標(biāo)準(zhǔn)_第3頁
資源共享與分布式整合應(yīng)用-相關(guān)技術(shù)與標(biāo)準(zhǔn)_第4頁
資源共享與分布式整合應(yīng)用-相關(guān)技術(shù)與標(biāo)準(zhǔn)_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

主要內(nèi)容案例分析案例1--中海油研究資源網(wǎng)案例2—西文醫(yī)學(xué)期刊統(tǒng)一檢索系統(tǒng)案例3--中國煙草科教網(wǎng)案例4—上海紡織研發(fā)公共服務(wù)平臺案例5—天津聯(lián)科信息案例7—上海生物研發(fā)公共服務(wù)平臺我的資訊中心11企業(yè)信息資源布局分散、類型異構(gòu)導(dǎo)致企業(yè)信息資源的整合和全局應(yīng)用越來越困難信息加工、維護(hù)、管理分散在不同系統(tǒng)中,信息資源分散在不同系統(tǒng)中,用戶權(quán)限互不兼容隨著企業(yè)信息化深入,造成信息系統(tǒng)越建越多相反信息的獲取和利用越來越困難,信息孤島問題越發(fā)嚴(yán)重信息發(fā)布服務(wù)多個系統(tǒng)并行現(xiàn)狀問題

迫切需要一個平臺實現(xiàn)對于企業(yè)信息資源的集成整合,提供統(tǒng)一的資源搜索服務(wù),提供企業(yè)的資源門戶和信息服務(wù)門戶無法實現(xiàn)一站式信息服務(wù)缺乏按需定制的門戶設(shè)計和擴(kuò)展能力問題總結(jié)整合服務(wù)器館藏Calis原文傳遞系統(tǒng)WF資源其它電子資源原文請求帶原文鏈結(jié)的結(jié)果顯示元數(shù)據(jù)檢索引擎檢索結(jié)果元數(shù)據(jù)采集與管理基于元數(shù)據(jù)的資源整合構(gòu)架館藏Calis原文傳遞系統(tǒng)WF資源其它電子資源帶原文鏈結(jié)的結(jié)果顯示檢索結(jié)果可以合并整合服務(wù)器跨平臺虛擬資源整合構(gòu)架與資源整合相關(guān)的標(biāo)準(zhǔn)CCF與ISO-2709機(jī)讀目錄格式

機(jī)讀目錄通訊格式由記錄結(jié)構(gòu)、內(nèi)容標(biāo)識符和記錄內(nèi)容3個要素組成。①記錄結(jié)構(gòu),是指書目記錄在機(jī)讀介質(zhì)上的物理表示方法,記錄的總體安排,基本框架。按國際標(biāo)準(zhǔn)(ISO2709),這種結(jié)構(gòu)由以下幾部分組成:a.頭標(biāo)區(qū):位于記錄之首,固定為24個字符長,為記錄處理提供某些基本參數(shù)。b.目次區(qū):是記錄內(nèi)各數(shù)據(jù)字段的索引或目次,由一系列目次項構(gòu)成。它是為檢索其后的數(shù)據(jù)字段而設(shè)置的。c.數(shù)據(jù)字段區(qū):分為兩部分,一為控制字段區(qū),描述著作和記錄本身的特征,大多為固定長的代碼性數(shù)據(jù);二為書目字段區(qū),包含編目數(shù)據(jù)的實際內(nèi)容。由一些可變長的數(shù)據(jù)字段組成。d.記錄分隔符:位于記錄的最后。②內(nèi)容標(biāo)識符,這是標(biāo)識數(shù)據(jù)元素并為其提供補(bǔ)充信息的一套符號。包括:字段標(biāo)識符,這是標(biāo)識和命名數(shù)據(jù)字段主要內(nèi)容的字符;指示符,它是為書目字段提供描述信息和處理信息的代碼;子字段標(biāo)識符,是標(biāo)識書目字段內(nèi)各數(shù)據(jù)元素的兩個字符。每個數(shù)據(jù)字段的最后都有一個字段分隔符。③記錄內(nèi)容,即編目數(shù)據(jù)本身。如作者、題名等等。這是按照文獻(xiàn)資料的著錄和編目條例規(guī)定所著錄和標(biāo)引的具體書目數(shù)據(jù)。此外,數(shù)據(jù)編碼用的字符集、各種數(shù)據(jù)代碼表(如語言代碼表,國家和地區(qū)代碼表等)也是機(jī)讀目錄通訊格式的重要組成部分。DC格式元數(shù)據(jù)DC與MARC間的數(shù)據(jù)轉(zhuǎn)換MARC特點(diǎn)MARC格式經(jīng)過近50年的發(fā)展,其描述格式特點(diǎn)已得到業(yè)內(nèi)人士的普遍認(rèn)可,主要有:完整性。即嚴(yán)格的語義規(guī)則和完整的信息描述字段。精確性。能夠精確的描述信息資源,尤其是對檢索點(diǎn)的選取能夠確保其數(shù)據(jù)元素組成具有統(tǒng)一性。可靠性。MARC描述格式得以廣泛應(yīng)用的主要原因之一就在于其著錄信息的可靠性。但是過于復(fù)雜,只有專業(yè)人員才能使用DC元數(shù)據(jù)DC描述格式的主要特點(diǎn)是:簡易性。DC只有15個元素,且都是每一個能夠普遍理解的語義,適合各種背景的人員使用。信息著錄員不須任何特殊訓(xùn)練,即可使用DC進(jìn)行著錄;可擴(kuò)展性。DC格式的彈性化和擴(kuò)展性表現(xiàn)在允許使用者為了特定目的或在特定的學(xué)科領(lǐng)域可以增加一些必要的著錄信息。由于DC沒有最終定型,有關(guān)它的使用也處于變化之中,可擴(kuò)展性保證了其具有向后兼容和擴(kuò)展的能力。XML

XML

可通過多種方式使用XML封裝的數(shù)據(jù)。一種常見的處理方式是通過使用可擴(kuò)展樣式表語言轉(zhuǎn)換(ExtensibleStylesheetLanguageTransformations,XSLT),開發(fā)人員可以使用XSLT定義對XML文檔的操作,以生成特定的結(jié)果。這種動態(tài)轉(zhuǎn)換信息的能力允許從單個源文檔產(chǎn)生多種輸出,無論輸出到不同的數(shù)據(jù)庫還是輸出到不同的瀏覽器。

XSL格式化對象(XSLFormattingObjects,XSL-FO)是一種強(qiáng)大而靈活的格式化數(shù)據(jù)的XML詞匯表,常與XSLT結(jié)合使用,把XML和HTML轉(zhuǎn)化成PDF(可移植文檔格式)。

XML的優(yōu)勢在于它能夠在多種環(huán)境中使用。大量涌現(xiàn)的各種XML詞匯表,使人們能夠立即互相理解。三種最常用的詞匯表是可擴(kuò)展超文本標(biāo)記語言(ExtensibleHyperTextMarkupLanguage,XHTML)、資源定義框架(ResourceDefinitionFramework,RDF)和可縮放向量圖形(ScalableVectorGraphics,SVG)。XMLXHTML是XML形式的HTML修訂版。XHTML文檔就是遵守XML規(guī)則的HTML文檔。同時,從業(yè)務(wù)和表示兩方面定義了其他的XML詞匯表:RDF提供了一種向XML文檔添加信息的方式;SVG提供了一種使用XML指定圖形元素的方式(因為SVG是基于文本的XML,不僅可用于動態(tài)生成圖形,還可用于動畫和腳本);語音可擴(kuò)展標(biāo)記語言(VoiceExtensibleMarkupLanguage,VoiceXML)則用于電話菜單和其他語音相關(guān)的系統(tǒng)。同樣對于MARC格式或DC格式都有專用的XML表述規(guī)格。DOAJ系統(tǒng)對DC數(shù)據(jù)的一種描述方式(OAI-DC)

-<header>

<identifier>oai:doaj-articles:6c680758291bf65568b55960a0b5b71c</identifier>

<datestamp>2004-07-15T00:00:00Z</datestamp>

</header>-<metadata>-<oaidc:dcxmlns:dc="/dc/elements/1.1/"xmlns:oaidc=""xmlns:xsi=""xsi:schemaLocation="">

<dc:title>Discoursd'ouvertureducolloque"Terrewallonne-Humainsadmis"16avril2004,Liège,Belgique</dc:title>

<dc:identifier></dc:identifier>

<dc:identifier></dc:identifier>

<dc:creator>BusquinP.</dc:creator>

<dc:description/>

<dc:source>Biotechnologie,Agronomie,SociétéetEnvironnement-Biotechnology,Agronomy,SocietyandEnvironment(BASE)</dc:source>

<dc:publisher>UniversityofGembloux,FacultyofAgriculturalSciences</dc:publisher>

<dc:date>2004</dc:date>

</oaidc:dc>

</metadata>

</record>OAI_MARC()<?xmlversion="1.0"encoding="UTF-8"?>-<sequencexmlns=""xmlns:xsi=""xsi:schemaLocation="">-<oai_marcxmlns=""status="n"type="t"level="m"encLvl="u"catForm="u">

<fixfieldid="8">"s1997vau|sm00|0|engd"</fixfield>-<varfieldid="35"i1=""i2="">

<subfieldlabel="a"></subfield>

</varfield>-<varfieldid="100"i1="1"i2="">

<subfieldlabel="a">Walker,GordonJames</subfield>

</varfield>-<varfieldid="245"i1="0"i2="0">

<subfieldlabel="a">ConceptualDevelopmentandEmpiricalTestingofanOutdoorRecreationExperienceModel:TheRecreationExperienceMatrix(REM)</subfield>

</varfield>-<varfieldid="256"i1=""i2="">

<subfieldlabel="a">Computerdata-5file(s)</subfield>

</varfield>-<varfieldid="260"i1=""i2="">

<subfieldlabel="a">Blacksburg,Va.</subfield>

<subfieldlabel="b">UniversityLibraries,VirginiaPolytechnicInstitueandStateUniversity,</subfield>

<subfieldlabel="c">1997</subfield>

</varfield>-<varfieldid="502"i1=""i2="">

<subfieldlabel="a">Thesis(PHD)--VirginiaPolytechnicInstituteandStateUniversity,1997-03-31</subfield>

</varfield>-<varfieldid="504"i1=""i2="">

<subfieldlabel="a">Includesbibliographicalreferences.</subfield>

</varfield>-<varfieldid="520"i1="3"i2="">

<subfieldlabel="a">Thisdissertationexaminesfourissues,including:(a)whetheroutdoorrecreationexperiencesnotincludedintheRecreationExperiencePreference(REP)scalesexist;(b)whethertheseexperiencescanbecategorizedusingaframeworkcalledtheRecreationExperienceMatrix(REM);(c)howwelltheRecreationOpportunitySpectrum(ROS)variablesofactivity,setting,andexpertiseexplainthetypesofexperiencesoutdoorrecreationistsreceive;and(d)howwelltwonewvariables--primarymodeandmodedependence--explainthetypesofexperiencesoutdoorrecreationistsreceive.Inordertoaddresstheseissues,anon-sitequestionnairewasdistributedatMountRogersNationalRecreationAreainVirginiaduringOctoberandNovember,1995.Atotalof410peoplecompletedthisquestionnaire.Ofthese,336provideduseableaddressesforafollow-upmail-outquestionnaire,with169(50.3%)actuallyreturningit.Afterperformingavarietyofstatisticalanalyses,itwasfoundthat:(a)someoutdoorrecreationistsdidreporthavingnon-REPexperiencesinvolvingidentity,cognition,absorption,andself-concept;(b)indirectsupportdoesexistforclassifyingoutdoorrecreationexperiencesusingtheREMframework;and(c)theROSvariablesofactivity,setting,andexpertise,doexplainsomeoutdoorrecreationexperiences,asdothenewvariablesofprimarymodeandmodedependence.</subfield>

</varfield>-<varfieldid="538"i1=""i2="">

<subfieldlabel="a">Systemrequirements:PC,WorldWideWebBrowserandPDFreader.</subfield>

</varfield>-<varfieldid="538"i1=""i2="">

<subfieldlabel="a">AvailableelectronicallyviaInternet.</subfield>

</varfield>-<varfieldid="653"i1=""i2="">

<subfieldlabel="a">outdoorrecreation</subfield>

<subfieldlabel="a">recreationexperiencepreferencescales</subfield>

<subfieldlabel="a">recreationexperiencematrix</subfield>

<subfieldlabel="a">recreationopportunityspectrum</subfield>

</varfield>-<varfieldid="710"i1="2"i2="">

<subfieldlabel="a">VirginiaTech</subfield>

<subfieldlabel="b">Forestry</subfield>

</varfield>-<varfieldid="720"i1="1"i2="">

<subfieldlabel="a">DanielR.Williams</subfield>

<subfieldlabel="e">CommitteeMember</subfield>

<subfieldlabel="a">K.JillKiecolt</subfield>

<subfieldlabel="e">CommitteeMember</subfield>

<subfieldlabel="a">BradleyR.Hertel</subfield>

<subfieldlabel="e">CommitteeMember</subfield>

<subfieldlabel="a">JosephW.Roggenbuck</subfield>

<subfieldlabel="e">CommitteeCo-Chair</subfield>

<subfieldlabel="a">R.BruceHull</subfield>

<subfieldlabel="e">CommitteeCo-Chair</subfield>

</varfield>-<varfieldid="856"i1="4"i2="0">

<subfieldlabel="z">unrestricted</subfield>

<subfieldlabel="u"></subfield>

</varfield>

</oai_marc>XML小結(jié)標(biāo)準(zhǔn)檢索語言CQLCQL是情報檢索系統(tǒng)中用來描述檢索請求的一種規(guī)范化語言,是英文CommonQueryLanguage的縮寫。其設(shè)計目標(biāo)是使用戶提交的檢索表達(dá)是可被人理解和描述得的,特別的當(dāng)描述較復(fù)雜的檢索請求時,其檢索表達(dá)式應(yīng)接近自然語言。傳統(tǒng)的檢索語言可以分為兩類,一類是功能強(qiáng)大,但需要用比較復(fù)雜的表達(dá)式描述,非專家用戶很難正確使用,比如:SQL、PQF、和XQuery,其中PQF是Z39.50協(xié)議使用的檢索語言;另一類檢索語言簡單易用,接近自然語言,但很難描述復(fù)雜的檢索概念,比如:CCL和Google。CQL則試圖可以用自然語言描述簡單和復(fù)雜的檢索請求,事實上CQL達(dá)到了這種目標(biāo),成為目前檢索系統(tǒng)的通用檢索語言。有關(guān)CQL語言的詳細(xì)介紹參見:CQL分級

一個CQL服務(wù)器(z39.50或SRW服務(wù)器)在對支持CQL處理能力方面是分級的。

0級支持檢索詞檢索如果接受到不能處理的CQL,必須能夠返回明確的錯誤信息;

1級支持0級標(biāo)準(zhǔn);有能力匹配:

(a)檢索語句中包括的索引名、關(guān)系和檢索詞;并且允許

(b)檢索詞間的布爾組配,比如:."term1ANDterm2"3.至少支持阿a)或b)的檢索處理;

2級支持1級功能能夠正確解析所有的CQL語句并給出回應(yīng)或明確的錯誤信息;SQL與CQLOpenAccess起源Openaccess分類OA相關(guān)協(xié)議OAIOAI協(xié)議構(gòu)架OAI協(xié)議規(guī)定了兩種角色:數(shù)據(jù)提供者(DataProvider)和服務(wù)提供者(ServiceProvider)。數(shù)據(jù)提供者負(fù)責(zé)元數(shù)據(jù)的生成、發(fā)布、管理和組織,數(shù)據(jù)提供者可以有自己的元數(shù)據(jù)標(biāo)準(zhǔn),但它應(yīng)能夠通過元數(shù)據(jù)映射,發(fā)布符合OAI協(xié)議規(guī)范的元數(shù)據(jù)。數(shù)據(jù)提供者將各種數(shù)字資料處理成數(shù)字對象存儲在數(shù)據(jù)庫(Repository)中,每一個數(shù)字對象都有一個全球惟一、持久的標(biāo)識符(DOI)。在基干OAI的元數(shù)據(jù)互操作框架中,數(shù)據(jù)提供者提供的元數(shù)據(jù)質(zhì)量非常關(guān)鍵服務(wù)提供者通過元數(shù)據(jù)收割機(jī)(MetadataHarvester)從數(shù)據(jù)提供者和其它服務(wù)提供者處收割元數(shù)據(jù),并對這些元數(shù)據(jù)進(jìn)行加工處理,提供增值服務(wù),建立元數(shù)據(jù)之間的關(guān)系,向用戶提供統(tǒng)一的查詢界面,它提供的最基本的增值服務(wù)是對所有元數(shù)據(jù)根據(jù)同一分類體系進(jìn)行分類整理。服務(wù)提供者也可以只按需收割某一學(xué)科、某一研究領(lǐng)域的元數(shù)據(jù)OAI協(xié)議要求數(shù)據(jù)提供者與服務(wù)提供者事先都要在(OAI)注冊服務(wù)器中進(jìn)行注冊。目的是要對數(shù)據(jù)提供者與服務(wù)提供者進(jìn)行組織,更重要的是執(zhí)行相關(guān)驗證程序來確保所登記的數(shù)據(jù)提供者或服務(wù)提供者是否完全符合OAI協(xié)議的規(guī)定,確保數(shù)據(jù)提供者和服務(wù)提供者都遵守OAI協(xié)議規(guī)范框架。注冊服務(wù)器除了提供注冊界面,還提供查詢界面,讓服務(wù)提供者查找數(shù)據(jù)提供者,用戶查找服務(wù)提供者,這類似Internet中的域名解析。

OAI協(xié)議的實現(xiàn)需要建立在超文本傳輸協(xié)議(HTTP)的基礎(chǔ)上,通常采用GET或POST請求實現(xiàn)元數(shù)據(jù)采集。OAI協(xié)議指定DC(DublinCore)為必須支持的元數(shù)據(jù)格式,通過元數(shù)據(jù)前綴說明,支持其它元數(shù)據(jù)格式,比如:OAI_MARC。一個數(shù)據(jù)提供者可以向多個服務(wù)提供者提供元數(shù)據(jù),一個服務(wù)提供者可以從多個數(shù)據(jù)提供者獲取元數(shù)據(jù)。數(shù)據(jù)提供者和服務(wù)提供者只是角色的劃分,一個組織(或服務(wù)器)既可以是數(shù)據(jù)提供者,也可以是服務(wù)提供者。服務(wù)提供者與數(shù)據(jù)提供者之間的消息傳遞是通過OAIrequest和OAIresponse實現(xiàn)的。OAI協(xié)議的運(yùn)行框架DataProvider1DataProvider3DataProvidermServiceProvider1ServiceProvider2ServiceProvidernHTTPResponse(XML)HTTPRequestOAIVerbOAI注冊中心用戶OAI命令OAI協(xié)議通過指定命令集(Verb),從數(shù)據(jù)庫前端服務(wù)器(數(shù)據(jù)提供者)向其管理的數(shù)據(jù)倉庫獲得所需信息。由于OAI是基于HTTP的應(yīng)用協(xié)議,故其命令集通過HTTP所使用前端服務(wù)器向數(shù)據(jù)庫服務(wù)器傳輸變量與內(nèi)容,由服務(wù)器程序根據(jù)變量及其內(nèi)容進(jìn)行處理,并返回結(jié)果。OAI命令至少有一個以key=vlaue形式出現(xiàn)的參數(shù),多個參數(shù)則用符號&.隔開。提供的命令(動作Action)有6種.OAI命令列表OAI-Getrecord

服務(wù)提供者向數(shù)據(jù)提供者發(fā)出如下請求:http://arX/oai2?verb=GetRecord&identifier=oai:arX:cs/0112017&metadataPrefix=oai_dc數(shù)據(jù)提供者返回的信息為:

<?xmlversion="1.0"encoding="UTF-8"?><OAI-PMHxmlns="/OAI/2.0/"xmlns:xsi="/2001/XMLSchema-instance"xsi:schemaLocation="/OAI/2.0//OAI/2.0/OAI-PMH.xsd"><responseDate>2002-02-08T08:55:46Z</responseDate><requestverb="GetRecord"identifier="oai:arX:cs/0112017"metadataPrefix="oai_dc">http://arX/oai2</request><GetRecord><record><header><identifier>oai:arX:cs/0112017</identifier><datestamp>2001-12-14</datestamp><setSpec>cs</setSpec><setSpec>math</setSpec></header><metadata><oai_dc:dcxmlns:oai_dc="/OAI/2.0/oai_dc/"xmlns:dc="/dc/elements/1.1/"xmlns:xsi="/2001/XMLSchema-instance"xsi:schemaLocation="/OAI/2.0/oai_dc//OAI/2.0/oai_dc.xsd"><dc:title>UsingStructuralMetadatatoLocalizeExperienceofDigitalContent</dc:title><dc:creator>Dushay,Naomi</dc:creator><dc:subject>DigitalLibraries</dc:subject><dc:description>Withtheincreasingtechnicalsophisticationofbothinformationconsumersandproviders,thereisincreasingdemandformoremeaningfulexperiencesofdigitalinformation.Wepresentaframeworkthatseparatesdigitalobjectexperience,orrendering,fromdigitalobjectstorageandmanipulation,sotherenderingcanbetailoredtoparticularcommunitiesofusers.</dc:description><dc:description>Comment:23pagesincluding2appendices,8figures</dc:description><dc:date>2001-12-14</dc:date></oai_dc:dc></metadata></record></GetRecord></OAI-PMH>

有關(guān)OAIPMH2.0版的詳細(xì)說明請參見:

查找目前已經(jīng)注冊的數(shù)據(jù)提供者:

RSS服務(wù)RSS是什么?

RSS是Internet上連鎖內(nèi)容和元數(shù)據(jù)的一種格式。通常用于共享標(biāo)題和到新聞文章的鏈接。對于新聞文章,真正的文章不一定是共享的,但是關(guān)于文章的元數(shù)據(jù)通常是共享的;這種元數(shù)據(jù)可以包含標(biāo)題、URL或者摘要。對于出版商而言,RSS是一種重要的工具,因為提要可用于連鎖內(nèi)容,并把第三方的內(nèi)容集成到您的站點(diǎn)中。

RSS是一種XML方言。所有的RSS文件必須符合萬維網(wǎng)聯(lián)盟(WorldWideWebConsortium,W3C)Web站點(diǎn)上發(fā)布的XML1.0規(guī)范。目前RSS的最新標(biāo)準(zhǔn)為2.0版。詳細(xì)介紹可參考RSS與情報服務(wù)OAI-服務(wù)規(guī)范OpenURL

OpenURL語法OpenURL語法OpenURL語法與Internet上公共網(wǎng)關(guān)程序HTTPGET或HTTPPOST相似,可以描述成OpenURL::=BASE-URL'?'QUERYQUERY::=DESCRIPTION('&&'DESCRIPTION)BASE-URL

資源服務(wù)商的URIDESCRIPTION要查找的原數(shù)據(jù)對象的描述如果由多個原數(shù)據(jù)對象描述用兩個&&分割。比如:

BASE-URL可以是

BASE-URL

是用戶知道的服務(wù)機(jī)構(gòu)或通過菜單(CookiePusher)選擇的服務(wù)機(jī)構(gòu)所提供URL服務(wù)的URI。DESCRIPTION::=(ORIGIN-DESCRIPTION'&')?OBJECT-DESCRIPTION|OBJECT-DESCRIPTION('&'ORIGIN-DESCRIPTION)?OBJECT-DESCRIPTIONOpenURL中攜帶的元數(shù)據(jù)對象的相關(guān)信息。ORIGIN-DESCRIPTION包含發(fā)出元數(shù)據(jù)請求的系統(tǒng)信息,這些信息作為OpenURL的一部分一般需要加密。OpenURL至少要包含一個原數(shù)據(jù)對象信息。OBJECT-DESCRIPTION和ORIGIN-DESCRIPTION的順序?qū)penURL的完整性沒有影響。

ORIGIN-DESCRIPTION::=sid'='VendorID':'DatabaseIDVendorID::=(ALPHANUM)+DatabaseID::=(ALPHANUM|ESCAPED)+

ORIGIN-DESCRIPTION

由sid

標(biāo)示名(服務(wù)標(biāo)識符)和對應(yīng)的標(biāo)示值組成。標(biāo)示值用冒號:,分割成兩部分,前面為服務(wù)供應(yīng)商,后面為原數(shù)據(jù)對象所在的數(shù)據(jù)庫名?!?’表示沒有使用escape編碼。如果OBJECT-DESCRIPTION

包括LOCAL-IDENTIFIER-ZONE說明,則必需有ORIGIN-DESCRIPTION

說明。ORIGIN-DESCRIPTION

舉例如下:sid=Ovid:Medlinesid=ERL:BX4sid=EBSCO:MFAOBJECT-DESCRIPTION::=ZONE('&'ZONE)*ZONE::=(GLOBAL-IDENTIFIER-ZONE|OBJECT-METADATA-ZONE|LOCAL-IDENTIFIER-ZONE)GLOBAL-IDENTIFIER-ZONE::='id''='GLOBAL-NAMESPACE

':'GLOBAL-IDENTIFIER('&''id''='GLOBAL-NAMESPACE':'GLOBAL-IDENTIFIER)*GLOBAL-NAMESPACE::=('doi'|'pmid'|'bibcode'|'oai')GLOBAL-IDENTIFIER::=VCHAR+GLOBAL-IDENTIFIER-ZONE

由標(biāo)示名id(命名空間)和標(biāo)示值組成。標(biāo)示值由兩部分組成用冒號”:”割,前面部分表示全球命名的標(biāo)示符,后面一部分表示值?!埃骸北硎緵]有使用Escape編碼.一個OpenURL中可以使用多個全球標(biāo)示符。到目前為止已經(jīng)定義的全球表示符有:

doi:數(shù)字對象標(biāo)示符pmid:PubMed標(biāo)識符bibcode:AstrophysicsDataSystem使用的標(biāo)示符oai:OAI中使用的標(biāo)識符。

由于篇幅有限,有關(guān)這些標(biāo)識符的編碼規(guī)則這里不作介紹。舉例如下:GLOBAL-IDENTIFIER-ZONE:id=doi:123/345678&id=pmid:202123一個沒有經(jīng)過Escape編碼的OpenURL:/sfxmenu?id=doi:123/345678&id=pmid:202123

這里用兩個全球標(biāo)識符定義了同一個元數(shù)據(jù)對象。對應(yīng)前一個經(jīng)過escape編碼的OpenURL是:/sfxmenu?id=doi:123%2F345678&id=pmid:202123

OBJECT-METADATA-ZONE::=META-TAG'='META-VALUE(&META-TAG'='META-VALUE)*META-TAG::=('genre'|'aulast'|'aufirst'|'auinit'

|'auinit1'|'auinitm'|'coden'|'issn'|'eissn'|'isbn'|'title'|'stitle'|'atitle'|'volume'|'part'|'issue'|'spage'|'epage'|'pages'|'artnum'|'sici'|'bici'|'ssn'|'quarter'|'date')META-VALUE::=VCHAR+舉例escape編碼后的OpenURL為:

/sfxmenu?sid=EBSCO:MFA&

id=pmid:203456&pid=%3Cauthor%3ESmith%2C%20Paul%20%3B%20Klein%2C%20Calvin%3C%2Fauthor%3E&%3Cyr%3E98%2F1%3C%2Fyr%3E。SFX與基于OpenURL的整合整合原理Z39.50協(xié)議Z39.50協(xié)議的下一代被稱為ZINGSRW(Search/RetrieveWebService)SRW(Search/RetrieveWebService查詢與檢索Web服務(wù))就是以Web服務(wù)方式實現(xiàn)Z39.50的功能。SRW結(jié)合了Z39.50的查詢(Search)和提取(Present)兩個服務(wù),定義了一個單一的Web服務(wù)。因為查詢和提取是緊密聯(lián)系,互相依賴的關(guān)系。為了簡化,直接將它們結(jié)合定義一個成為一個Search/Retrieve對。一個Web服務(wù)只能處理一種形式的請求,如果要將Z39.50的瀏覽(Scan)服務(wù)包含到SRW項目中來,就必須在定義一個新的Web服務(wù)??紤]到Z39.50的主要目的還是信息的查詢與檢索,目前SRW只定義了一個服務(wù),還不包括Z39.50其它的服務(wù)。目前,SRW協(xié)議的1.0版的草案初稿己經(jīng)制定出來了。協(xié)議對SRW的請求和響應(yīng)包含的參數(shù)做出了明確規(guī)定。SRW請求(1)Query查詢語句SRW使用CQL查詢語句,僅歸納為5種形式供后面介紹使用。

5種形式

1.一個單一的查詢子句,例如dc.Title.Word=”computersystem”;

2.布爾運(yùn)算符連接的多個檢索子句;

3.布爾運(yùn)算符連接的結(jié)果集和檢索子句;

4.單個結(jié)果集名,例如“resultsetRSl";

5.布爾運(yùn)算符連接的多個結(jié)果集名,例如(“resultsetRS7”AND“resultsetRSV”);(2)AuthenticationToken鑒別標(biāo)記SRW協(xié)議里包含這個參敬,是為了用于特定的用途(3)SortSpeco排序參數(shù)請求中可以包含排序參數(shù),以指定返回記錄的順序。排序參數(shù)包含在一個查詢/檢索請求里,而不像傳統(tǒng)的239.50那樣是一個單獨(dú)操作,一方面是出于簡化的目的,SRW不強(qiáng)制規(guī)定服務(wù)器保留結(jié)果集以備隨后的請求使用。(4)StartRecord,MaximumRacords,RecordSchema

查詢/檢索請求可以指定返回記錄的范圍,也可以指定返回記錄的XMLSchema.recordSchema的值是一個XMLschema名稱成schema的定義URI??梢酝ㄟ^解釋信息獲得Schema名字與對應(yīng)URL的列表,SRW預(yù)定義的記錄schema有DC、Marc、Xml等。注意:只有Query是選的SRW響應(yīng)①Numberofrecords,記錄數(shù),響應(yīng)總會返回這個參數(shù),這個參數(shù)數(shù)是生成的結(jié)果集包含的實際記錄數(shù).如果查詢失敗,這個值是0;②AuthenticationToken鑒別標(biāo)記③AtldleTime,鑒別標(biāo)記的有效期;服務(wù)器在響應(yīng)中提供一個鑒別標(biāo)記的同時還要指定它的有效期,在有效期內(nèi),客戶可以使用這個鑒別標(biāo)記.在后續(xù)的交互中,如果服務(wù)器在響應(yīng)中包含同樣的鑒別標(biāo)記,表示服務(wù)器里重置了鑒別標(biāo)記的有效期。④ResultSetld和rsIdleTime,結(jié)果集名和結(jié)果集有效期。服務(wù)器可能在響應(yīng)中提供結(jié)果集名和結(jié)果集有效期,以便客戶可以在隨后的請求中引用。rsldleTime是個大于0的整教,代表以秒為單位的時間長度。如果服務(wù)器不希望用戶在使用結(jié)果集,可以不提供resultSetld參數(shù),而不是把rsldleTime設(shè)定為一個足夠小的值。關(guān)于SRW請求和響應(yīng)的參數(shù)詳細(xì)說明參見:

SRUSRU(search/retrievalURIservice)可以說是SRW的簡化版,不同的是:SRW的信息是通過HTTPPOST方法發(fā)送的XML/SOAP/RPC消息。而SRU不使用SOAP,它的請求信息是通過HTTPGET發(fā)送的,參數(shù)包含在URL里。例如::7090/voyager?version=1.1&operation=searchRetrieve&query=dinosaur

關(guān)于SRU請求和響應(yīng)的參數(shù)詳細(xì)說明參見:

SRW/U應(yīng)用基于OpenAccess的信息服務(wù)模式

隨OA出版模式的不斷普及、互聯(lián)網(wǎng)上的開放資源越來越多,如何整合這些開源資源,并可被人們有效的使用已經(jīng)成為當(dāng)今信息服務(wù)業(yè)的主要應(yīng)用課題。元數(shù)據(jù)收割

開源資源的產(chǎn)生與應(yīng)用的第一步是需要開源資源的提供者制定相關(guān)的二次文獻(xiàn)或者是元數(shù)據(jù),由專業(yè)信息服務(wù)商收集這些原數(shù)據(jù)、經(jīng)分類整理后對外提供服務(wù)。OAIPHM方式

RSS元數(shù)據(jù)整合其它類資源整合元數(shù)據(jù)整合檢索,源文獻(xiàn)分布式服務(wù)

元數(shù)據(jù)整合的目的是為了提供“一站式”元數(shù)據(jù)檢索服務(wù)。元數(shù)據(jù)檢索的目的是為了給用戶提供一個檢索導(dǎo)航,使用戶能夠方便的通過分類、主題詞、作者、題目等檢索入口查到所需文獻(xiàn)的簡要概述,最終能夠獲取原始文獻(xiàn)。原始文獻(xiàn)保存在那里?怎樣獲取是本節(jié)主要介紹的內(nèi)容。原始文獻(xiàn)和元數(shù)據(jù)都集中保存在本地優(yōu)點(diǎn):通過元數(shù)據(jù)獲取原始文獻(xiàn)時比較簡單,通過一般的HTTP鏈接即可獲取。在原數(shù)據(jù)的來源項中,保存一個對應(yīng)的文件路徑即可。管理上也比較簡單。缺點(diǎn):

a)需要在收割元數(shù)據(jù)的同時將相應(yīng)原始文獻(xiàn)收割到本地,并對元數(shù)據(jù)的來源項進(jìn)行修改,與保存到本地的文獻(xiàn)相關(guān)聯(lián)。

b)由于原始文獻(xiàn)的較大,收割時速度很慢,占用相當(dāng)大的本地存儲設(shè)備。隨作文獻(xiàn)數(shù)字化進(jìn)程的迅速前進(jìn)這一問題越來越嚴(yán)重,主要體現(xiàn)在即時更新和存儲設(shè)備的空間問題兩個方面。

d)原始文獻(xiàn)多數(shù)是收費(fèi)的,特別是新的文獻(xiàn);集中源文獻(xiàn)管理在內(nèi)容提供商和信息服務(wù)商之間的利益分配上也存在一些問題。元數(shù)據(jù)集中,原始文獻(xiàn)分布式存儲國外典型應(yīng)用案例Scirus的一個高級檢索界數(shù)據(jù)整合與分布式數(shù)據(jù)服務(wù)

數(shù)據(jù)整合和分布式數(shù)據(jù)服務(wù)是當(dāng)今信息服務(wù)業(yè)的兩大熱門話題,是重要的應(yīng)用領(lǐng)域。數(shù)據(jù)整合之內(nèi)涵基于WebService的服務(wù)體系結(jié)構(gòu)SOAP服務(wù)器數(shù)據(jù)庫系統(tǒng)SOAP客戶端SQL結(jié)果集Request用戶請求(SOAP接口調(diào)用,XML格式)Rsponse系統(tǒng)返回接口調(diào)用結(jié)果(XML)TCP/IP基于WebService的服務(wù)體系說明SOAP服務(wù)器所提供的接口,可以通過注冊中心獲得,也可在系統(tǒng)內(nèi)部值得獲得;用戶在知道SOAP服務(wù)器所提供的接口情況下,通過常規(guī)SOAP客戶端程序直接調(diào)用所需的SOAP接口(通過SOAP服務(wù)器URI、接口名稱、參數(shù)等);SOAP接到用戶請求,根據(jù)請求的接口名稱、參數(shù)等信息情況并轉(zhuǎn)化成相應(yīng)的SQL并傳遞到后臺數(shù)據(jù)庫服務(wù)器;后臺服務(wù)器接到請求,生成相應(yīng)的結(jié)果集并傳遞到SOAP服務(wù)器;SOAP服務(wù)器接到結(jié)果集,先生成相應(yīng)的XML格式數(shù)據(jù),然后返回到用戶端(SOAP客戶端);SOAP客戶端接到SOAP返回的結(jié)果,可根據(jù)自己需要處理所獲得的XML信息集。和傳統(tǒng)的Web服務(wù)相比,基于Webservice的服務(wù)系統(tǒng)具有如下特點(diǎn):用戶可以通過標(biāo)準(zhǔn)SOAP客戶端獲取SOAP服務(wù)接口,并可調(diào)用;用戶獲得的數(shù)據(jù)是XML格式數(shù)據(jù),用戶可利用一些標(biāo)準(zhǔn)XML工具處理這些數(shù)據(jù),就像使用本地數(shù)據(jù)一樣;理論上講,客戶通過WebService可以使用服務(wù)商的數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù),就像使用自己的一樣;當(dāng)然,WebService是需要授權(quán)認(rèn)證的?;赪ebService的數(shù)據(jù)整合

整合的基礎(chǔ)是標(biāo)準(zhǔn),如果信息服務(wù)商或內(nèi)容服務(wù)商所提供的接口為符合某種標(biāo)準(zhǔn)的SOAP整合接口,那么數(shù)據(jù)整合將變得更加規(guī)范內(nèi)和高效。如果所有接口都符合SRW標(biāo)準(zhǔn),

基于WebService(SRW)的Provider體系結(jié)構(gòu):SRW(SOAPProvider)數(shù)據(jù)整合服務(wù)器SRWRequest(XML/CQL)SRWResponse(DCorMARCXMLSchema)SQL/PQF結(jié)果集數(shù)據(jù)庫系統(tǒng)或Z39.50服務(wù)器基于SRW的Provder體系說明整合服務(wù)器或內(nèi)容收割者向SRW服務(wù)器發(fā)出獲取信息的請求(基于CQL的SOAP請求);信息服務(wù)商或內(nèi)容提供商將請求經(jīng)過處理轉(zhuǎn)換成SQL向數(shù)據(jù)庫服務(wù)器發(fā)出請求,或轉(zhuǎn)換成PQF(PrefixQueryFormatZ39.50服務(wù)器使用的一種查詢語言)。數(shù)據(jù)庫服務(wù)器或Z39.50服務(wù)器將查詢結(jié)果返回給SRW服務(wù)器;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論