版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、元數(shù)據(jù)抽象模型與新加坡框架劉煒上海圖書館 2019數(shù)字圖書館建設與應用研討會數(shù)字圖書館建設與應用研討會*深圳深圳 主要內容DC元數(shù)據(jù)標準規(guī)范體系DC元數(shù)據(jù)抽象模型DC元數(shù)據(jù)新加坡框架:應用綱要的規(guī)范形式闡明:Google圖片搜索對此slide亦有貢獻DC元數(shù)據(jù)標準規(guī)范體系Element | DCMES, DCQElement |DCAMDCAP (DCTerms+) DC1.0 DC2.0DC1.0Elements元素Qualifiers修飾詞Element Refinements元素修飾詞(子元素)Encoding Schemes編碼體系修飾詞Vocabulary Encoding Sche
2、mes詞表編碼體系Syntax Encoding Schemes語法編碼體系 參見:/usage/documents/principles/#elementDC應用綱要1.0CWA14855定義指南性文檔沒有對于元數(shù)據(jù)編碼的任何規(guī)定不支持DCAM不支持Description Set (描述集)DC眼中的世界(DCAM)任何事物都是資源資源有類型任何資源都可以以URI標識任何資源都有屬性屬性詞即元數(shù)據(jù)屬性詞表即元數(shù)據(jù)方案元數(shù)據(jù)方案可有多種形式:不/半/規(guī)范的應用綱要是一種正在成型的半/規(guī)范形式任何屬性都有屬性值屬性值有領域和范圍(domain & range)
3、屬性值可以是另一個資源,可以是文字(literal)取值的規(guī)范控制,即各類KOS,也是元數(shù)據(jù)DCMI類型詞表(DCTYPE)DC元數(shù)據(jù)描述的資源對象可能存在的類型:CollectionDatasetEventImageMovingImageStillImageInteractiveResourcePhysicalObjectServiceSoftwareText“資源的唯一必備屬性:URIURI:Uniform Resource Identifier (RFC3986定義)唯一必備功能:標識資源(無論是物理的還是抽象的);包含三部分: 訪問資源的命名機制存放資源的主機名資源自身的名稱,由路徑表
4、示兩種類型:URL 如:/rfc/rfc3986.txt mailto:java-netjava.sunnews:comp.lang.java URN 如:urn:isbn:096139210 xurn:doi:10.1045/november2019-kaufmanURI是抽象類,并不規(guī)定解析進一步說明元數(shù)據(jù)是一種人工語言消除歧義、明確定義、人機共讀);元數(shù)據(jù)元素集是描述資源各個方面的屬性詞表;元數(shù)據(jù)取值如果規(guī)定只能從某些詞表中選取,這些詞表就屬于受控的規(guī)范詞表;這屬于元素取值的domain和range;元數(shù)據(jù)應用綱要是為了領域應用而制訂的元數(shù)據(jù)方案的一種表達形式,目前正在成
5、為規(guī)范的,叫做“DC元數(shù)據(jù)應用綱要”,核心是符合DC抽象模型的元數(shù)據(jù)形式化表述也就是一種機讀形式),通??梢砸訰DF形式表達;應用模型規(guī)定應用領域的各類實體及其相互關系)、著錄規(guī)則等文檔,也可以成為元數(shù)據(jù)應用綱要的組成部分;元數(shù)據(jù)注冊系統(tǒng)可以作為元數(shù)據(jù)元素的命名域管理體系而存在,但命名域并非一定需要注冊系統(tǒng)進行管理;元數(shù)據(jù)元素詞表,包括規(guī)定元數(shù)據(jù)取值的規(guī)范詞表,都可以看成是一種人工語言,每個術語都應該被賦予唯一的URI,都可以通過注冊系統(tǒng)進行管理;元數(shù)據(jù)形式化的表達必須采用基于XML的RDF或OWL等的Schema,著錄工作單當然可以通過完整表達元數(shù)據(jù)方案各種關系和約束的schema來自動生成
6、,并進行校驗。當然這需要一定的環(huán)境和軟件工具來實現(xiàn) Resource haspropertyDC:CreatorDC:TitleDC:SubjectDC:Date.X主語謂詞屬性詞屬性值optional qualifieroptional qualifier修飾/限定詞來自(from):Stuart WeibelResource hasDate2000-06-13RevisedISO8601Resource hasSubjectLanguages - GrammarLCSH來自(from):Stuart WeibelDC屬性元素的“領域和范圍(Domain and Range)”見:dubli
7、/documents/domain-range/index.shtmlRecord (encoded as html, XML, or RDF/XMLDescription setResource Description (URI)Resource Description (URI)Resource Description (URI)Statement Statement Statement language (pt-BR)DCAM圖示(來自Andy Powell)value stringvalue URIproperty (URI)syntax encodingscheme
8、Vocabulary encoding scheme新加坡框架進一步定義了DC應用綱要符合DC抽象模型(DCAM)的應用綱要 (“DC應用綱要”) 包含如下一系列文檔:功能需求說明(必須desirable)領域模型 (應有mandatory)元素集描述 (DSP) (應有mandatory)應用指南 (可選)編碼句法指南(可選)應用指南功能需求領域模型元素集描畫編碼指南與數(shù)據(jù)格式社區(qū)領域模型元素詞表DCMI抽象模型DCMI句法指南RDF/SRDF標注 Annotate建立基礎建立基礎建立基礎運用運用建立基礎建立基礎建立基礎建立基礎建立基礎建立基礎基礎標準領域標準DC應用綱要新加坡框架圖示(來自
9、Tom Baker)描述集綱要(DSP)定義了描述集在結構方面的約束:允許出現(xiàn)怎樣的描述允許采用怎樣的屬性怎樣的屬性值聚合方式以XML表達(RDF當然是XML)忽略元素的定義(通過URI參考)忽略版本控制不要求應用指南著錄規(guī)范等給人讀的文檔翻譯、修改自Mikael Nelsson的演講稿參見:/architecturewiki/DescriptionSetProfile當前元數(shù)據(jù)研究和應用中的問題 人讀而非機讀語義的模糊性模型的完整性(兩類模型:FRBR和DCAM)執(zhí)行的一致性數(shù)據(jù)的獨立性基本上無法編碼實現(xiàn)包括數(shù)據(jù)庫系統(tǒng)開發(fā))我們目前的元數(shù)據(jù)方案可以說只完成了MAR
10、C數(shù)據(jù)格式的定義,還沒有2709格式使其真正機器可讀從這一點來說,目前各類元數(shù)據(jù)著作、方案中值得推敲的地方還是比較多的一些建議建立本地化擴展術語的命名域參考建立元數(shù)據(jù)應用綱要(詞表)及編碼的登記注冊體系修訂目前的領域應用元數(shù)據(jù)應用綱要推進元數(shù)據(jù)集成開發(fā)系統(tǒng)(IDE)軟件和工具的開發(fā)建立數(shù)字圖書館標準規(guī)范的開放討論維護機制“機讀版元數(shù)據(jù)方案的推廣、培訓隨著元數(shù)據(jù)應用的開展和普及,一致性問題越來越嚴重?,F(xiàn)在如果不重視,將后患無窮!問題討論元素名是否應該翻譯?dc:creator“Verfasser”標簽“Creator”標簽“創(chuàng)建者”標簽Server inGermanyServer in CASD
11、CMI Server(上圖改編自Stuart Weibel有關演示文稿) 元素名只是一個機器識別的符號(Token)而已 一個符號(token),多種翻譯(labels) 如果翻譯了,就不是DC了 (“盜版DC“?)元數(shù)據(jù)“記錄是怎樣的結構?過去稱為記錄的,多為現(xiàn)在所稱的描述平面化(MARC中的記錄)“虛擬記錄”傳統(tǒng)結構:數(shù)據(jù)庫記錄-文件系統(tǒng)描畫/描述集1:1原則是針對描述而言,而非記錄描畫/描述集可以通過不同的記錄形式/格式來實現(xiàn)DCAM打散了資源描述,在具體應用中如何實現(xiàn)?DCAM是一個抽象模型,不考慮具體實現(xiàn)如記錄的統(tǒng)一、聚類等);DCAM提供需求分析、功能設計的思路和方法,應用系統(tǒng)可以采用任何方式實現(xiàn)功能;目前URI是一切Web資源描述的基礎,包括URL和URN兩類。URN(eg:DOI/ISBN,甚至各類詞表)如何實現(xiàn)全局解析,不是Web的事情,是行業(yè)應用的事情;URI不是完美的資源標識方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年陜西寧陜縣文化旅游投資開發(fā)有限責任公司招聘筆試參考題庫附帶答案詳解
- 2025年版?zhèn)€人房產(chǎn)出售交易資金監(jiān)管及風險控制合同
- 2025年全球及中國阻燃塑料膜行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025-2030全球3D激光雷達掃描儀行業(yè)調研及趨勢分析報告
- 2025-2030全球低截止光纖行業(yè)調研及趨勢分析報告
- 2025年全球及中國有機硅柔性皮膚粘合劑行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025版無證二手房交易合同糾紛調解及賠償協(xié)議3篇
- 委托接送子女上下學合同
- 教育政策解讀與匯報策略
- 二零二五年度廚師個人工作室聘用合同規(guī)范4篇
- 三年級數(shù)學(上)計算題專項練習附答案
- 中醫(yī)診療方案腎病科
- 2025年安慶港華燃氣限公司招聘工作人員14人高頻重點提升(共500題)附帶答案詳解
- 人教版(2025新版)七年級下冊數(shù)學第七章 相交線與平行線 單元測試卷(含答案)
- 玩具有害物質風險評估-洞察分析
- 2024年河南省公務員錄用考試《行測》真題及答案解析
- 企業(yè)合規(guī)管理實務
- T-CHSA 020-2023 上頜骨缺損手術功能修復重建的專家共識
- Hypermesh lsdyna轉動副連接課件完整版
- 小學六年級數(shù)學計算題100道(含答案)
評論
0/150
提交評論