信息組織元數(shù)據(jù)_第1頁
信息組織元數(shù)據(jù)_第2頁
信息組織元數(shù)據(jù)_第3頁
信息組織元數(shù)據(jù)_第4頁
信息組織元數(shù)據(jù)_第5頁
已閱讀5頁,還剩103頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信息組織元數(shù)據(jù)第一頁,共一百零八頁,2022年,8月28日元數(shù)據(jù)的定義我們所說的“元數(shù)據(jù)”,英文作Metadata。目前在國內(nèi)有多種譯法,大陸一般譯作“元數(shù)據(jù)”。香港和臺灣則譯法較多,臺灣有人譯作“預(yù)設(shè)資料”、“詮釋資料”、“元資料”,也有人譯作“后設(shè)資料”。

第二頁,共一百零八頁,2022年,8月28日關(guān)于這一名稱,西方學(xué)者大多定義為:DataaboutData,即關(guān)于數(shù)據(jù)的數(shù)據(jù)。它是用于描述信息資源的高度結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)是手提箱,而元數(shù)據(jù)是它上面的姓名標牌;數(shù)據(jù)是文件夾,而元數(shù)據(jù)是夾子的標簽;數(shù)據(jù)是書的內(nèi)容,元數(shù)據(jù)是書脊上的杜威十進制數(shù)碼。第三頁,共一百零八頁,2022年,8月28日圖書管理信息書名信息作者信息圖像信息第四頁,共一百零八頁,2022年,8月28日資料庫建庫人員來源及類別所用平臺信息組織方式管理維護人員反饋信息后續(xù)信息檢索方法第五頁,共一百零八頁,2022年,8月28日第二節(jié)元數(shù)據(jù)的分類一、按功能分管理性描述性技術(shù)性保存性使用性第六頁,共一百零八頁,2022年,8月28日第二節(jié)元數(shù)據(jù)的分類二、按復(fù)雜程度分采用簡單的記錄格式結(jié)構(gòu)化的格式復(fù)雜格式第七頁,共一百零八頁,2022年,8月28日第二節(jié)元數(shù)據(jù)的分類三、按描述的資源類型分采用簡單的記錄格式結(jié)構(gòu)化的格式復(fù)雜格式第八頁,共一百零八頁,2022年,8月28日元數(shù)據(jù)的結(jié)構(gòu)內(nèi)容結(jié)構(gòu)句法結(jié)構(gòu)語義結(jié)構(gòu)第九頁,共一百零八頁,2022年,8月28日都柏林核心元數(shù)據(jù)一、DC概述二、DC定義DC核心元素集參考描述如表:資源名創(chuàng)建者第十頁,共一百零八頁,2022年,8月28日MARC于1965年由美國會圖書館一個研究小組制定,后來不斷完善,成為圖書館數(shù)字化檢索的重要格式。1991年,我國有關(guān)部門在UNIMARC基礎(chǔ)上加上我們所需的特定字段,編制了《中國機讀目錄通訊格式》(CNMARC),此后多次修訂DublicCore最初于1995年制定,從時間上看要比MARC晚,在技術(shù)上要先進MARC及Dublic(DC)

第十一頁,共一百零八頁,2022年,8月28日由來:在1995年聯(lián)合召開了第一次都柏林(都柏林為美國俄亥俄州的一個城市)核心集會議。來自圖書館、計算機及有關(guān)領(lǐng)域的專家達成一致意見,創(chuàng)建了只包含能夠描述電子文獻基本特征的DublinCore從1995年開始,專家小組共召開了13次會議,討論與核心集相關(guān)的各種問題。2004年10月11-14日,我國上海圖書館主辦了第12次會議。最近一次會議于2005年9月12-15日在西班牙首都馬德里召開,來自33個國家和地區(qū)共計214名專家學(xué)者出席了會議。DublicCore

(DC)第十二頁,共一百零八頁,2022年,8月28日簡單性原則”。定義一個能得到最廣泛應(yīng)用、被全球所理解和接受的最小元素集,并能作為特殊用戶詳細描述需求的一個核心集?!耙子眯栽瓌t”。能方便作者和信息提供者描述自己的文檔,而不給他們增加太多的負擔(dān),并能方便地實現(xiàn)資源發(fā)現(xiàn)工具之間的互操作性。DublicCore的原則

第十三頁,共一百零八頁,2022年,8月28日“內(nèi)在性(intrinsicality)原則”。指DC元數(shù)據(jù)以揭示描述對象自身的內(nèi)容屬性為主,外部屬性為輔。“可擴展性原則”。希望DC成為一個“核心”元素集合而可以通過各種方式擴展為適應(yīng)各領(lǐng)域資源描述需要的元數(shù)據(jù)方案。第十四頁,共一百零八頁,2022年,8月28日“句法獨立(syntaxindependence)原則”。指DC元數(shù)據(jù)的元素可以以多種方式編碼,應(yīng)用于各類技術(shù)平臺中。DC只規(guī)定元素的基本語義?!翱蛇x擇性”。指DC元素集合中的任何元素都是可選的。第十五頁,共一百零八頁,2022年,8月28日“可重復(fù)性”。指DC元素集合中的任何元素都是可重復(fù)的?!翱尚薷男浴?。指在具體應(yīng)用中可以對DC元素集中的任何元素進行進一步“修飾”或“限定”,但不能擴大或改變元素的基本語義。第十六頁,共一百零八頁,2022年,8月28日元素:標題、作者、主題、出版者、描述、其他參與者、日期、類型、格式、標識、關(guān)系、資料來源、語言、內(nèi)容范圍、版權(quán)15個元素組成第十七頁,共一百零八頁,2022年,8月28日都柏林核心集目前已經(jīng)擴展成一個世界性元數(shù)據(jù)標準,有五個國家(澳大利亞、芬蘭、丹麥、英國、美國)把它確定為國家標準,各類推薦方案被翻譯成33種語言。第十八頁,共一百零八頁,2022年,8月28日當(dāng)前對都柏林數(shù)據(jù)集的看法第十九頁,共一百零八頁,2022年,8月28日由于Google等檢索工具出現(xiàn),一些人甚至斷言,元數(shù)據(jù)特別是DC,在還沒有成為通用標準以前,已經(jīng)壽終正寢了。Google等通用檢索工具,查全查準兩方面都還有很多問題。第二十頁,共一百零八頁,2022年,8月28日而在這兩個方面,使用元數(shù)據(jù)的專用信息庫則會充分發(fā)揮自己的優(yōu)勢。在今后的一段時間內(nèi),元數(shù)據(jù)不會因為信息技術(shù)的進步而失去其存在的價值。這是我們斷續(xù)研究和使用元數(shù)據(jù)的最主要的動力。

第二十一頁,共一百零八頁,2022年,8月28日使用者元數(shù)據(jù)服務(wù)器使用者數(shù)據(jù)服務(wù)器數(shù)據(jù)服務(wù)器數(shù)據(jù)服務(wù)器第二十二頁,共一百零八頁,2022年,8月28日DC分為兩類:基本DC和限定DC語種描述模式體系屬性類型第二十三頁,共一百零八頁,2022年,8月28日機讀目錄(MachineReadableCatalogue,MARC)是一種以代碼形式特定結(jié)構(gòu)記錄在存儲載體上,可由特種機器及計算機閱讀、控制、處理和編輯輸出的目錄格式。第二十四頁,共一百零八頁,2022年,8月28日機讀目錄的發(fā)展簡史美國。LC在世界圖書館界率先開展了計算機在圖書館編目技術(shù)上的應(yīng)用研究。1964年LC提出了著名的“馬爾克計劃”,即以機器可讀形式記錄圖書館的書目記錄,從而開創(chuàng)了文獻資源信息描述的新階段。第二十五頁,共一百零八頁,2022年,8月28日美國LC運用集中編目的思想,一開始就把機讀目錄的研制方向確定為向全國發(fā)行機讀目錄磁帶,便于共享。1966年2月開始實施MARC試驗計劃,11月完成MARCⅠ機讀目錄格式并生產(chǎn)出試驗性磁帶,稱為“MARCⅠ”磁帶。第二十六頁,共一百零八頁,2022年,8月28日美國1967年對MARCⅠ進行改進,開始轉(zhuǎn)入MARCⅡ的設(shè)計和研究,并邀請了英國國家書目部的專家參加。1968年MARCⅡ研制成功,它是目前使用的各種機讀目錄的母體。1969年LC的機讀目錄發(fā)行服務(wù)部開始向圖書館界發(fā)行MARCⅡ磁帶,稱之為LCMARC,得到廣泛應(yīng)用和推廣。第二十七頁,共一百零八頁,2022年,8月28日美國1971年,美國國家標準局將LCMARC格式定為國家標準;1982年LCMARC改稱為USMARC;1998年6月至2000年7月經(jīng)修訂后,正式更名為MARC21。第二十八頁,共一百零八頁,2022年,8月28日國際標準化組織1969年,MARCⅡ作為美國/英國國家標準局推薦格式,呈交ISO。1973年ISO將其作為國際標準頒布,即ISO2709(文獻目錄信息交換用磁帶記錄格式),它為世界機讀目錄格式結(jié)構(gòu)大體上的統(tǒng)一鋪平了道路。第二十九頁,共一百零八頁,2022年,8月28日國際圖聯(lián)IFLA1977年正式出版了UNIMARC,指出其基本目的是為了方便國家書目機構(gòu)之間不同機讀格式數(shù)據(jù)的國際性轉(zhuǎn)換。1981年UNIMARC出第二版。1991年《UNIMARC規(guī)范格式》。采用國家:中國、日本、歐洲許多國家。第三十頁,共一百零八頁,2022年,8月28日聯(lián)合國教科文組織1978年,UNECO提議開發(fā)一種圖書館、書目機構(gòu)和文摘、索引機構(gòu)的通用格式,1983年制定了書目文獻公共交換格式規(guī)范(CommonCommunicationFormat,CCF),并于1984年出版。第三十一頁,共一百零八頁,2022年,8月28日MARC211994年12月起,美、加、不列顛圖書館開始推動USMARC、CANMARC、UKMARC三者的機讀編目格式整合計劃,但最后的成果MARC21(1999年)是CANMARC和USMARC的之間的合作與發(fā)展。MARC21是一套響應(yīng)網(wǎng)絡(luò)時代而產(chǎn)生的一種通用的開放的資料格式。第三十二頁,共一百零八頁,2022年,8月28日MARC21MARC21基本上發(fā)展成為五大部分:書目數(shù)據(jù)MARC21規(guī)范數(shù)據(jù)MARC21分類數(shù)據(jù)MARC21館藏數(shù)據(jù)MARC21團體信息MARC21第三十三頁,共一百零八頁,2022年,8月28日MARC21MARC21在原有基礎(chǔ)上增加了538字段(系統(tǒng)需求和存取注釋)、516字段(計算機文件類型或數(shù)據(jù)注釋)、256字段(計算機文件特征)以及856字段(電子地址和存?。┑茸侄?。第三十四頁,共一百零八頁,2022年,8月28日中國機讀目錄的研制過程1975年劉國均發(fā)表的《馬爾克計劃簡介——兼論圖書館引進電子計算機問題》揭開了我國計算機編目和機讀目錄研制工作序幕。1979年北京圖書館等單位組成“北京地區(qū)機讀目錄研制協(xié)作組”,開始研究LCMARC磁帶。1980年我國正式頒布了國家標準字符集。第三十五頁,共一百零八頁,2022年,8月28日中國機讀目錄的研制過程1982年,《文獻目錄信息交換用磁帶格式》(GB2901-82),主要參考了ISO2709-81。1986年,UNIMARC2版中文譯本問世,北京圖書館等單位據(jù)此編寫了CNMARC討論稿,1989年得到認定。1995年,《中國機讀目錄格式使用手冊》,2001年又出修訂版。第三十六頁,共一百零八頁,2022年,8月28日為了兼容MARC數(shù)據(jù)的應(yīng)用,在全球范圍內(nèi)掀起了從MARC到元數(shù)據(jù)metadata的研究熱潮。第三十七頁,共一百零八頁,2022年,8月28日MARC記錄基本格式無論是ISO2709標準,還是GB2901標準,都對每一個用于交換的書目記錄規(guī)定了必須遵循的標準記錄結(jié)構(gòu),即:記錄頭標區(qū)、地址目次區(qū)、數(shù)據(jù)字段區(qū)和記錄分隔符。第三十八頁,共一百零八頁,2022年,8月28日一、記錄頭標區(qū)ISO2709規(guī)定,每個記錄的頭部要有一個24位字符的記錄頭標,包含元素:記錄類型、目錄級別、在層次中的位置、記錄完整程度以及是完全采用還是部分采用ISBD規(guī)則。第三十九頁,共一百零八頁,2022年,8月28日二、地址目次區(qū)目次區(qū)緊接在頭標區(qū)之后,含有一個/多個目次款目。每個目次長12個字符,包括三位數(shù)字字段號、四位數(shù)字數(shù)據(jù)字段長度和五位數(shù)字字段起始符位置。描述中由計算機自動生成。第四十頁,共一百零八頁,2022年,8月28日三、數(shù)據(jù)字段區(qū)目次區(qū)之后為數(shù)據(jù)字段區(qū),由若干個定長和變長字段構(gòu)成,每個字段之間由字段分隔符隔開。數(shù)據(jù)字段區(qū)所含數(shù)據(jù)有兩種形式。定長數(shù)據(jù)字段。主要包括001記錄標識號和005記錄處理時間等以00-標識的字段,不設(shè)指示符和子字段。第四十一頁,共一百零八頁,2022年,8月28日變長數(shù)據(jù)字段。010-999所有字段。其結(jié)構(gòu)為:指示符1指示符2子字段標識符數(shù)據(jù)子字段標識符數(shù)據(jù)…字段分隔符第四十二頁,共一百零八頁,2022年,8月28日數(shù)據(jù)字段區(qū)劃分為10個功能塊,每個功能塊包含若干個字段。而字段標識符的第一個(最左邊)數(shù)字表示字段所屬的功能塊。第四十三頁,共一百零八頁,2022年,8月28日10大功能塊0—標識塊1—編碼信息塊2—著錄信息塊3—附注塊4—連接款目塊5—相關(guān)題名塊6—主題分析塊7—知識責(zé)任塊8—國際使用塊9—國內(nèi)使用塊第四十四頁,共一百零八頁,2022年,8月28日四、記錄分隔符MARC格式規(guī)定,在每一個MZRC記錄的最后面,放置一個專門的符號以表示該MARC記錄的結(jié)束。第四十五頁,共一百零八頁,2022年,8月28日機讀目錄的編制方式聯(lián)機編制方式原始編制方式聯(lián)機聯(lián)合編制方式第四十六頁,共一百零八頁,2022年,8月28日中國機讀目錄格式使用手冊

1.1目的和范圍格式是用于中國國家書目機構(gòu)同其他國家書目機構(gòu)以及中國國內(nèi)圖書館與情報部門之間,以標準的計算機可讀形式交換書目信息。格式在數(shù)據(jù)規(guī)范方面為書目數(shù)據(jù)庫的建立和書目數(shù)據(jù)處理提供參考或依據(jù)。第四十七頁,共一百零八頁,2022年,8月28日格式對專著、連續(xù)出版物、測繪資料、樂譜、聲像等類的機讀形式的書目記錄,規(guī)定了字段標識符指示符和子字段代碼,以及書目記錄的內(nèi)容標識在各種載體上的邏輯的和物理的格式。第四十八頁,共一百零八頁,2022年,8月28日1.2關(guān)于格式內(nèi)容擴充的說明格式結(jié)構(gòu)將保持穩(wěn)定,今后機讀格式的變化僅限于追加有限的字段、子字段和代碼,為了使我國的機讀目錄在國際范圍內(nèi)具有良好的可交換性,編制格式的主要依據(jù)是國際圖聯(lián)的UNIMARC以及我國出版物的一些特殊情況和規(guī)則的新變化。第四十九頁,共一百零八頁,2022年,8月28日1.3定義檢索點:用于檢索書目記錄的名稱,詞語和代碼。數(shù)據(jù)元素:被明確標識的最小信息單元。在可變長字段中,數(shù)據(jù)元素構(gòu)成子字段,用子字段標識符標識。字段:由字段標識符標識的被定義的特定字符串,可包含一個或多個子字段。字段分隔符:位于每一個可變長字段末尾的控制符,用來區(qū)分每一個相鄰的字段。此外,還用于地址目次區(qū)的末尾。第五十頁,共一百零八頁,2022年,8月28日定長子字段:長度固定的子字段。它可包含一個或多個數(shù)據(jù)元素。可用于定長字段,如100字段中的$a子字段。也可用于變長字段,如200字段的$z子字段。層次等級:分配給主書目實體的一個數(shù)值。該數(shù)值標識主實體在一個預(yù)先確定的層次等級結(jié)構(gòu)中所處的位置。如多卷集各卷的目錄描述和多卷集整體的目錄描述,可看作是一個屬于另一個的兩個不同層次等級。層次等級僅僅在整體及其各獨立部分均已生成書目記錄的情況下才可以使用。第五十一頁,共一百零八頁,2022年,8月28日子字段:字段內(nèi)所定義的數(shù)據(jù)單位。變長字段:長度可變的字段??砂粋€或多個數(shù)據(jù)元素或子字段。其長度包括文字數(shù)據(jù),字段指示符,子字段標識符及字段分割符。第五十二頁,共一百零八頁,2022年,8月28日2.格式結(jié)構(gòu)2.1結(jié)構(gòu)它對每一個用于交換的書目記錄規(guī)定了必須遵循的標準記錄結(jié)構(gòu)。其標準構(gòu)成為:記錄頭標:位于一條機讀記錄的開端,記載了該記錄的有關(guān)參數(shù)。記錄頭標區(qū)是為計算機處理一條記錄提供必不可少的基本參數(shù)。它由24個字符構(gòu)成。其中很多元素由計算機自動生成。第五十三頁,共一百零八頁,2022年,8月28日地址目次區(qū):區(qū)內(nèi)含有一個或多個目次款目和字段分隔符,目次項的長度是固定的,而地址目次區(qū)的長度則為可變的,這是由于每條記錄的字段數(shù)量不等,地址目次區(qū)所占字符數(shù)長度不定的緣故。地址目次區(qū)終止處的字段分隔符用以表示該區(qū)結(jié)束。地址目次區(qū)的用途在于供計算機準確、迅速的存取相應(yīng)字段的數(shù)據(jù)。第五十四頁,共一百零八頁,2022年,8月28日數(shù)據(jù)字段區(qū):將有關(guān)文獻的數(shù)據(jù)按功能塊,字段,子字段或數(shù)據(jù)元素這三個層次組織起來。層次級別為:子字段構(gòu)成字段,字段構(gòu)成功能塊。《格式》的數(shù)據(jù)字段區(qū)設(shè)置了0——標識塊1——編碼信息塊2——著錄信息塊3——附注塊4——款目連接塊5——相關(guān)題名塊6——主題分析塊7——知識責(zé)任塊8——國際使用塊9——國內(nèi)使用塊十個功能塊。記錄分隔符:至于每條機讀記錄的末尾,用來區(qū)分記錄的控制字符。第五十五頁,共一百零八頁,2022年,8月28日3功能模塊簡介3.10—標識塊本塊用來標識記錄或標識出版物實體上的號碼。如010國際標準書號子字段標識符子字段內(nèi)容$aISBN$b限定$d獲得方式和/或價格第五十六頁,共一百零八頁,2022年,8月28日例:010##$a7-118-00249-1$b精裝$dCNY55.00010##$a7-81023-606-7$dCNY6.80(上冊);CNY9.80(下冊)第五十七頁,共一百零八頁,2022年,8月28日011國際標準連續(xù)出版物號子字段標識符子字段內(nèi)容$aISSN$b限定$d獲得方式和/或價格例:011##$a0101-0064$d函索即贈011##$a0009-3947$dCNY1.00,CNY13.25(全年)第五十八頁,共一百零八頁,2022年,8月28日3.21—信息編碼塊本塊用來標識出版物的一般性數(shù)據(jù)如101作品語種子字段標識符子字段內(nèi)容$a正文語種$b中間語種$c原作語種第五十九頁,共一百零八頁,2022年,8月28日例:101##$achi《周恩來選集》正文為中文101##$achi$ceng《戰(zhàn)爭與回憶》原著為英文,譯成中文101##$achi$beng$cger《希臘的神話和傳說》原著為德文,由英譯本轉(zhuǎn)譯成中文101##$achi$alat《生物學(xué)詞匯》漢語,拉丁語對照第六十頁,共一百零八頁,2022年,8月28日3.32—著錄信息塊本塊包括有關(guān)出版物形式特征的著錄項目,但附注項和標準號除外。如200題名與責(zé)任說明項子字段標識符子字段內(nèi)容$a正題名$d并列題名$e其他題名信息$f第一責(zé)任者$g其他責(zé)任說明第六十一頁,共一百零八頁,2022年,8月28日例:《逸周書》源流考辨/黃懷信著200##$a《逸周書》源流考辨$f黃懷信著$9yizhoushuyuanliukaobian談《紅樓夢》,又名,紅學(xué)芻言/張畢來著200##$a談《紅樓夢》$a紅學(xué)芻言$f張畢來著

第六十二頁,共一百零八頁,2022年,8月28日備急千斤藥方;銀海精微/(唐)孫思邈撰;(宋)高保衡等校正200##$a備急千斤藥方$a銀海精微$f(唐)孫思邈撰$g(宋)高保衡等校正中華人民共和國婦女權(quán)益保障法=LawofthePeople’sRepublicofChinaontheprotectionofrightsandinterestofwomen:中英對照/全國人民代表大會通過200##$a中華人民共和國婦女權(quán)益保障法$dLawofthePeople’sRepublicofChinaontheprotectionofrightsandinterestofwomen$e中英對照$f全國人民代表大會通過$zeng第六十三頁,共一百零八頁,2022年,8月28日210出版發(fā)行項本字段含有文獻出版,發(fā)行和制作日期的信息。子字段標識符子字段內(nèi)容$a出版發(fā)行地$b出版者,發(fā)行者地址等$c出版者,發(fā)行者名稱等$d出版,發(fā)行日期例:第六十四頁,共一百零八頁,2022年,8月28日210##$a[鄭州]$c中州古籍出版社$d1991.2出版地不是取自主要信息源,放在方括號內(nèi)210##$a芒市[云南]$c德宏民族出版社$d[1991?]出版地不太有名,而地區(qū)名是編目員補充的,出版日期不確定.第六十五頁,共一百零八頁,2022年,8月28日3.43—附注塊本塊所設(shè)的附注是對著錄項目或檢索點做進一步陳述的信息,可涉及文獻或其內(nèi)容的物理組成的各個方面.如300一般性附注本子字段對文獻及其相關(guān)紀錄的任何方面的附注$a附注內(nèi)容第六十六頁,共一百零八頁,2022年,8月28日例:300##$a本書另有地圖兩頁置于書后袋中300##$a本書據(jù)北圖珍藏抄本影印301標識號附注本子段所含標識號指出現(xiàn)在文獻各處的任何標識號子字段$a附注內(nèi)容例:301##$a“DOE/EIA-0031/2”.出現(xiàn)在文獻題名上的一個報告號第六十七頁,共一百零八頁,2022年,8月28日3.54—款目連接塊款目連接塊是用來明晰的解釋相關(guān)書目記錄之間的關(guān)系。這種關(guān)系可歸納為三類。(1)層次關(guān)系。如總集,分集,單冊等(2)平行關(guān)系。同一作品的不同語種或不同載體形式的記錄。(3)時間關(guān)系。如更名連續(xù)出版物的先前款目和后續(xù)款目等。第六十八頁,共一百零八頁,2022年,8月28日3.65—相關(guān)題名塊本塊含有除正題名外而又通常出現(xiàn)在出版物實體上的與所編文獻相關(guān)的題名。例:500##$aGenesis$n(Anglo-Saxonpoem)為題名是Genesis的Anglo-Saxon詩集的統(tǒng)一題名加上了限定,以便將其與作為圣經(jīng)中的Genesis(創(chuàng)世紀)這本書區(qū)分開第六十九頁,共一百零八頁,2022年,8月28日3.76—主題分析塊本塊所標引的是文獻的主題數(shù)據(jù),即可是詞語也可是符號,如600個人名稱主題601團體名稱主題605題名主題等。例:600##$f唐$a杜甫$x傳記($a款目要素,用于排序$f年代$x學(xué)科主題復(fù)分)

第七十頁,共一百零八頁,2022年,8月28日200##$a燕園史話601##$a北京大學(xué)$x史料601##$a徐匯天文臺$x史料題名為《徐匯天文臺記》第七十一頁,共一百零八頁,2022年,8月28日3.87—知識責(zé)任塊本塊對所編文獻負有某種責(zé)任形式的個人或團體的名稱,需要建立檢索點的知識責(zé)任入此。如700個人名稱-主要知識責(zé)任701個人名稱-次要知識責(zé)任710團體名稱-主要知識責(zé)任等。例:700##$a朱熹$f宋701$a易海秋$4主編$a趙衛(wèi)濱$4主編該出版物為二人主編第七十二頁,共一百零八頁,2022年,8月28日3.98—國際使用塊本塊包含國際上一致約定的不適于在0—至7—處理的字段第七十三頁,共一百零八頁,2022年,8月28日3.109—國內(nèi)使用塊本塊是中國國內(nèi)各系統(tǒng)在處理一些超出通用范圍的本單位館藏數(shù)據(jù)的字段。

第七十四頁,共一百零八頁,2022年,8月28日其它元數(shù)據(jù)METSMODSEADGILSPICSCDF第七十五頁,共一百零八頁,2022年,8月28日元數(shù)據(jù)的互操作元數(shù)據(jù)的互操作的背景元數(shù)據(jù)的層次元數(shù)據(jù)的互操作協(xié)議標準第七十六頁,共一百零八頁,2022年,8月28日整合檢索模式集中式聯(lián)合目錄聯(lián)合編目系統(tǒng)人工上傳批處理采用協(xié)議,自動收割(Harvesting)元數(shù)據(jù),如OAI分布式聯(lián)合目錄采用標準協(xié)議實時查詢各資源站點的元數(shù)據(jù),如Z39.50,SDLIP,OpenURL采用動態(tài)頁面分析技術(shù),以元搜索方式實時查詢資源站點元數(shù)據(jù)。第七十七頁,共一百零八頁,2022年,8月28日互操作的現(xiàn)實目標整合下述資源:Abstracting/IndexingServicesPublishers(e.g.ElsevierScienceDirect)–importanttobeabletopulltogtherAggregatorsElectronicreservesLocaldatabasesincludingdigitizationprojectsOAIresourcesInstitutionalrepositories

第七十八頁,共一百零八頁,2022年,8月28日跨庫檢索系統(tǒng)用戶界面認證管理Session管理總控管理統(tǒng)一檢索入口連接器引擎API統(tǒng)一格式結(jié)果反饋檢索參數(shù)定制檢索結(jié)果保存檢索請求處理API檢索結(jié)果處理API用戶管理檢索請求處理模塊各協(xié)議連接器引擎檢索結(jié)果處理模塊HTTP連接器Z39.50連接器JDBC連接器OAI連接器Internet數(shù)據(jù)源Z39.50服務(wù)器本地數(shù)據(jù)庫OAI服務(wù)器日志管理針對特定資源的元數(shù)據(jù)結(jié)果格式轉(zhuǎn)換配置文件資源定制第七十九頁,共一百零八頁,2022年,8月28日支持跨系統(tǒng)的信息組合支持跨系統(tǒng)的服務(wù)集成第八十頁,共一百零八頁,2022年,8月28日互操作的層次不同的元數(shù)據(jù)方案具有差異性:語義差別句法差別結(jié)構(gòu)差別第八十一頁,共一百零八頁,2022年,8月28日互操作層次:語義互操作句法互操作結(jié)構(gòu)互操作第八十二頁,共一百零八頁,2022年,8月28日語義互操作:映射、OAI(OpenArchivesInitiativeProtocolforMetadataHarvesting)元數(shù)據(jù)互操作協(xié)議。結(jié)構(gòu)互操作:RDF(資源描述框架)語法互操作:XML(可擴展標記語言)第八十三頁,共一百零八頁,2022年,8月28日Z39.50標準和協(xié)議Z39.50標準的名稱:信息檢索--應(yīng)用服務(wù)定義與協(xié)議規(guī)范Z39.50協(xié)議是在分布式網(wǎng)絡(luò)環(huán)境下,用以支持信息搜索和信息檢索的計算機系統(tǒng)間的通信協(xié)議第八十四頁,共一百零八頁,2022年,8月28日標準所依據(jù)的相關(guān)技術(shù)基礎(chǔ)標準規(guī)定了數(shù)據(jù)庫管理系統(tǒng)的客戶端和服務(wù)器端對話的規(guī)則。這種規(guī)則建立在客戶機/服務(wù)器的體系結(jié)構(gòu)基礎(chǔ)之上。數(shù)據(jù)庫客戶端和服務(wù)器端的通訊通過網(wǎng)絡(luò)實現(xiàn)。第八十五頁,共一百零八頁,2022年,8月28日Z39.50標準與協(xié)議的對應(yīng)關(guān)系標準Z39.50--1988Z39.50--1992Z39.50--1995標準規(guī)范的協(xié)議Z39.50第一版Z39.50第二版Z39.50第二版和第三版第八十六頁,共一百零八頁,2022年,8月28日源端與目標端的概念Z39.50標準是按典型的客戶機/服務(wù)器體系結(jié)構(gòu)定義的。在Z39.50標準術(shù)語中,客戶端計算機和服務(wù)器在通訊過程中分別被稱為“源端”(Origin)和“目標端”(Target)。使用“源端”和“目標端”代表客戶機與服務(wù)器描述數(shù)據(jù)通訊過程,是為了概念上更準確。第八十七頁,共一百零八頁,2022年,8月28日Z39.50信息檢索模型用戶界面轉(zhuǎn)換客戶端Z-server轉(zhuǎn)換數(shù)據(jù)庫數(shù)據(jù)集搜索檢索結(jié)果檢索檢索結(jié)果數(shù)據(jù)庫記錄搜索第八十八頁,共一百零八頁,2022年,8月28日根據(jù)Z39.50標準實現(xiàn)的圖書館管理系統(tǒng)標準數(shù)據(jù)格式及統(tǒng)一的檢索邏輯Z39.50標準接口BER編碼TCP/IP或其它協(xié)議第八十九頁,共一百零八頁,2022年,8月28日設(shè)施、服務(wù)與操作Z39.50標準規(guī)定了源端和目標端互操作的規(guī)范。這些操作抽象為設(shè)施和服務(wù),并對其過程作出各種約定。這些設(shè)施中的服務(wù),需要通過特定的操作指令來表達。配合這些操作指令,還約定了屬性集和記錄語法,用代碼來表示特定的操作屬性和記錄語法形態(tài)。第九十頁,共一百零八頁,2022年,8月28日Z39.50標準的主要內(nèi)容設(shè)施名稱 服務(wù)名稱初始化 初始化搜索 搜索獲取 提交、分段刪除結(jié)果集 刪除瀏覽 掃描排序 排序存取控制 存取控制帳務(wù)與資源管理 資源管理、觸發(fā)資源管理、資源報告解釋 (使用搜索和獲取設(shè)施中的服務(wù))擴展服務(wù) 擴展服務(wù)終止 關(guān)閉第九十一頁,共一百零八頁,2022年,8月28日Z39.50協(xié)議的服務(wù)與機制機制記帳/資源控制機制解釋機制擴展服務(wù)群機制終止機制機制中的服務(wù)資源控制服務(wù)、觸發(fā)資源控制服務(wù)、資源報告服務(wù)擴展服務(wù)群服務(wù)關(guān)閉服務(wù)第九十二頁,共一百零八頁,2022年,8月28日Z39.50的操作Init(初始化)Search(檢索)Present(提交)Delete(刪除)Scan(掃描)Sort(排序)Resource-report(資源報告)Extended-services(擴展服務(wù))。Z39.50標準描述了八種操作類型:第九十三頁,共一百零八頁,2022年,8月28日關(guān)于屬性集在Z39.50標準實施中,bib-1是最主要的屬性集,包括6組屬性或?qū)傩灶愋停菏褂脤傩裕褐付ㄋ阉鬟^程將要訪問的檢索點。關(guān)系屬性:指定用戶輸入的檢索詞與數(shù)據(jù)庫索引值的關(guān)系。截斷屬性:指定檢索詞在索引的哪一部分作為命中條件。完整性屬性:指定檢索詞在索引中是唯一值或非唯一值。位置屬性:指定在索引字段中與檢索詞相關(guān)的內(nèi)容應(yīng)出現(xiàn)在哪個位置。結(jié)構(gòu)屬性:指定搜索的格式。第九十四頁,共一百零八頁,2022年,8月28日Z39.50的基本服務(wù)Z39.50應(yīng)用程序在實現(xiàn)其功能的過程中,根據(jù)需要選擇這些服務(wù)。有三種服務(wù)是最基本的服務(wù):初始化(Initialization)搜索(Search)提交(Present)在各種現(xiàn)有的Z39.50應(yīng)用中,通常都包括了上述三種服務(wù)功能。第九十五頁,共一百零八頁,2022年,8月28日基本服務(wù)之一:初始化初始化是在任何查詢過程中的第一步。在這個服務(wù)中,源端需要:向目標端表明自己的身份與目標端約定某些后續(xù)查詢處理過程中的基本規(guī)則與目標端交換驗證信息的具體內(nèi)容第九十六頁,共一百零八頁,2022年,8月28日搜索功能包括了系統(tǒng)的主要工作由源端向目標端提交查詢請求

這些查詢請求可以是非常簡單的請求,也可能是含有復(fù)雜邏輯檢索式(與、或、非、大于、小于等等)的請求。服務(wù)器端通常使用描述文件(Profiles)說明支持的服務(wù)類型和應(yīng)用程序兼容性,很多描述文件還說明了哪些是本系統(tǒng)能夠支持的檢索屬性?;痉?wù)之二:搜索第九十七頁,共一百零八頁,2022年,8月28日提交功能的作用是說明管理結(jié)果被返回用戶端時的形態(tài)。在提交功能中,用戶可以:指定提供記錄的數(shù)量,例如:當(dāng)命中記錄較多時,只提交前十條命中的記錄。指定提供記錄的格式,例如:要求按英國機讀格式標準提交,不要按美國機讀格式標準提交?;痉?wù)之三:提交第九十八頁,共一百零八頁,2022年,8月28日OAI:OpenArchivalInitiative第九十九頁,共一百零八頁,2022年,8月28日定義OpenArchivesInitiativeProtocolforMetadataHarvesting,(OAI-PMH)簡稱OAI協(xié)議,協(xié)議的制定目的是提供具有獨立于應(yīng)用程序的、可互操作的,能夠提供和促進Web上信息資源發(fā)布和共享的社區(qū)的應(yīng)用框架。其主要目標為:簡化文件內(nèi)容的有效傳播。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論