地方文獻數(shù)據(jù)庫建設(shè)初探_第1頁
地方文獻數(shù)據(jù)庫建設(shè)初探_第2頁
地方文獻數(shù)據(jù)庫建設(shè)初探_第3頁
地方文獻數(shù)據(jù)庫建設(shè)初探_第4頁
地方文獻數(shù)據(jù)庫建設(shè)初探_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第第頁地方文獻數(shù)據(jù)庫建設(shè)初探吉安地區(qū)坐落在贛中南,是一座歷史悠久的地理文化名城,擁有豐富的地方文獻資源。建立吉安地方文獻資源數(shù)據(jù)庫,為地方經(jīng)濟建設(shè)服務(wù),是圖書館與地方經(jīng)濟建設(shè)相結(jié)合的有效途徑。

1吉安地方文獻數(shù)據(jù)的采集

地方文獻是指有關(guān)當(dāng)?shù)氐囊磺匈Y料,表現(xiàn)為不同時期各種記載形式的文獻,如:圖書、雜志、報紙、圖片、影片、畫片、拓本、表格、傳單、票據(jù)、文告、手稿、簿籍等。因此,地方文獻的數(shù)據(jù)可以從時間、空間、內(nèi)容等方面進行采集。

1.1時間順序

吉安是一個歷史悠久的文化名城,有著500年的歷史。我們收集地方文獻數(shù)據(jù)時,可以按照時間順序,從古代—近現(xiàn)代—當(dāng)代的順序進行收集。如我館編撰的《井岡山革命斗爭史研究資料索引》,就是按照時間順序進行的,從井岡山革命根據(jù)地的創(chuàng)立(1927.9—1928.2)井岡山革命根據(jù)地的鞏固和發(fā)展(1928.2—1929.1)井岡山軍民堅持斗爭(1929.1—1930.2)

1.2空間范圍

地方文獻具有典型的地域性,使得地方文獻的出現(xiàn)始終與一定的地域相聯(lián)系。吉安地理位置復(fù)雜,從地形、地貌到各區(qū)方言,再到各地習(xí)俗都有很大的區(qū)別。所以,我們可以按照地理空間,一般是按行政區(qū)劃來劃分。市下設(shè)縣,縣下設(shè)鄉(xiāng)鎮(zhèn),直到村。以地名來收集地方文獻,按地域區(qū)分隸屬關(guān)系,以地名作為細(xì)類和子目,將庫容文獻各歸其類,有利于編制地名歸類文獻檢索子系統(tǒng),形成一個樹杈式的檢索結(jié)構(gòu)。

1.3內(nèi)容范圍

地方文獻是某一地域自然現(xiàn)象、社會現(xiàn)象的知識記錄。天、地、人、事、物,包羅萬象,按內(nèi)容進行劃分可分為:

1.3.1人文、歷史類數(shù)據(jù)

(1)吉安地區(qū)研究數(shù)據(jù)(歷史、現(xiàn)狀、人文)。對于吉安市近500年的歷史,按時間空間順序,對期間的歷史、現(xiàn)狀、人文、風(fēng)俗進行收集,形成該地研究數(shù)據(jù)庫。我館歷時3年之久,編撰了《井岡山革命斗爭史研究資料索引》,匯編了全國圖書、報刊文獻當(dāng)中所載的有關(guān)井岡山斗爭資料1300余條,集中反映了井岡山革命斗爭史和井岡山精神。

(2)本地區(qū)名人數(shù)據(jù)。吉安自古以來就人杰地靈,從“人生自古誰無死,留取丹心照汗青”的文天祥,到一代文豪歐陽修,再到賀子珍、袁文才、王佐等一代革命家,到曾慶紅等新一代國家領(lǐng)導(dǎo)人。以這些歷代名人組成專題數(shù)據(jù)庫,對于其中的有特殊貢獻的名人,可追加全文數(shù)據(jù)庫、照片數(shù)據(jù),輔之以字畫、印章等必不可少的內(nèi)容。我館目前正在建立《古代吉安名人研究資料索引》,計劃將陸續(xù)出版歐陽修、文天祥、楊萬里、劉過、劉辰翁、周大必等古代名人的研究資料索引,目前已出版《楊萬里研究資料索引》、《歐陽修研究資料索引》。

(3)古籍?dāng)?shù)據(jù)。包括本地的全部古籍地方文獻的專題數(shù)據(jù)庫。由于古籍珍貴,甚至有的是孤本,不便于查詢,可通過光電掃描技術(shù),存入計算機。如《楊萬里研究資料索引》中收錄了楊萬里的詩、詞、文;《歐陽修研究資料索引》中收錄了其詩、詞、文賦以及其史學(xué)觀、經(jīng)濟觀、書法等。

(4)地方志數(shù)據(jù)。包括本地全部史志的專題數(shù)據(jù)。按照地域范圍,依次逐步采集。

(5)姓氏淵源數(shù)據(jù)。建立專題數(shù)據(jù)庫,可根據(jù)需要建立全文數(shù)據(jù)庫。

(6)譜牒多媒體數(shù)據(jù)。

(5)、(6)兩種數(shù)據(jù)在《楊萬里研究資料索引》和《歐陽修研究資料索引》當(dāng)中都有所反映,資料分別介紹了歐陽修、楊萬里的家世、生平、年譜。

1.3.2商情類數(shù)據(jù)

(1)行業(yè)動態(tài)數(shù)據(jù)。包括吉安地區(qū)熱門、重點行業(yè),如政策動態(tài)、市場、投資趨勢,形成旅游、電子、生物等行業(yè)特色專題數(shù)據(jù)。

(2)地方企業(yè)名錄數(shù)據(jù)。吉安有許多企業(yè),如電線電纜總廠、江西電視機廠、八三四廠。建立地方企業(yè)名錄數(shù)據(jù)庫,以公司名稱、業(yè)務(wù)經(jīng)營范圍、產(chǎn)品名稱等反映公司行業(yè)主題特征的字段作為基本索引字段,以公司地址、電話、員工數(shù)字段作為輔助索引字段。

(3)地市名特產(chǎn)數(shù)據(jù)。吉安地區(qū)有許多地方名特產(chǎn),如:遂川狗牯腦茶葉、泰和武山烏骨雞、安?;鹜鹊?,以他們的產(chǎn)地、用途、成分等字段來描述,形成專題數(shù)據(jù)庫。

(4)旅游資料數(shù)據(jù)。吉安旅游區(qū)和待開發(fā)旅游區(qū),如:井岡山旅游區(qū)、遂川湯湖、吉安青原山道教勝地、八都故居、君山湖度假村等,按他們的地理位置、主要景點、服務(wù)項目、歷史典故等字段形成數(shù)據(jù)庫。

(5)地區(qū)農(nóng)業(yè)科技數(shù)據(jù)庫。吉安是個以農(nóng)業(yè)為主的地區(qū),開發(fā)多種經(jīng)濟作物,如:茶葉、玉米、煙葉、甘蔗等等,數(shù)據(jù)庫重點介紹地方特色產(chǎn)品的歷史、種植、栽培、加工等技術(shù)。

1.3.3綜合數(shù)據(jù)

介紹該地各行業(yè)、各個方面的百科全書性綜合數(shù)據(jù)。

2吉安地方文獻數(shù)據(jù)庫的設(shè)計

2.1書目型數(shù)據(jù)庫

書目型文獻數(shù)據(jù)庫即二次文獻數(shù)據(jù)庫,儲存原始文獻的題名、著者文獻出處、文摘、主題詞等項目。其價值在于把用戶指引到所需要的原始文獻,如歐陽修研究,把對歐陽修研究的文章進行二次加工,形成書目索引,可設(shè)計為書目型數(shù)據(jù)庫。在對吉安地方文獻進行分類時,可把本地區(qū)名人數(shù)據(jù),人文、歷史類數(shù)據(jù),古籍、地方志數(shù)據(jù)建成書目型數(shù)據(jù)庫。目前我館建立的《古代吉安名人數(shù)據(jù)庫》,就可按照其索引資料建立書目型數(shù)據(jù)庫。

2.2源數(shù)據(jù)庫

源數(shù)據(jù)庫即一次信息庫,儲存用戶作為檢索目的而要求獲得的數(shù)據(jù)、事實或文本。其價值在于檢索的結(jié)果可以直接滿足用戶的信息要求。按照信息形式不同可分為:

(1)數(shù)值型數(shù)據(jù)庫。如:吉安地方工農(nóng)業(yè)總產(chǎn)值、市場等。

(2)詞典型數(shù)據(jù)庫。把姓氏淵源數(shù)據(jù)、地方企業(yè)名錄、地市名特產(chǎn)品數(shù)據(jù)、旅游資源數(shù)據(jù)、農(nóng)業(yè)科技等建成詞典型數(shù)據(jù)庫。

(3)全文本數(shù)據(jù)庫。名人著作數(shù)據(jù)庫、古籍?dāng)?shù)據(jù)庫等可建成全文本數(shù)據(jù)庫。

有些數(shù)據(jù)還可能是上述3種形

式的結(jié)合。如:本地名人數(shù)據(jù)庫中歐陽修、楊萬里研究資料,包括了他們的原著及其研究論文、政治思想觀點、家世生平和年譜等等,內(nèi)容復(fù)雜,可建成一些復(fù)合式專題數(shù)據(jù)庫。2.3數(shù)據(jù)庫地址指針在數(shù)據(jù)庫文檔組織中的使用

利用倒排擋形式,把由基本索引字段構(gòu)成的基本索引款目和由輔助索引字段構(gòu)成的輔助索引款目采用倒排的形式,描述其特征標(biāo)識、存取號、字段位置。在實踐中,為了提高聯(lián)機響應(yīng)的速度,常采用兩級索引的倒排文檔結(jié)構(gòu),即將倒排文檔分為詞典文檔和存取號文檔,

詞典文檔也稱為索引文檔款目,內(nèi)容包含特征標(biāo)識、含有該標(biāo)識的記錄總數(shù)、關(guān)聯(lián)到存取號文檔的指針。詞典文檔相當(dāng)于一個索引詞表,其規(guī)模由索引詞數(shù)量決定,基本不受數(shù)據(jù)庫文獻或數(shù)據(jù)記錄增加的影響,可以極大提高系統(tǒng)對檢索終端的響應(yīng)速度。存取號文檔的款目主要包括與詞典文檔指針關(guān)聯(lián)的存儲地址、含有該標(biāo)識的記錄存取號,以及該標(biāo)識在記錄中所處的字段及其位置。這樣的兩級索引結(jié)構(gòu)不僅包括了原倒排的全部內(nèi)容,而且使主機聯(lián)機響應(yīng)速度得到極大的提高。這是由于特征標(biāo)識與含有該標(biāo)識的存取號及其字段位置的分離。雖然使文檔的結(jié)構(gòu)更為復(fù)雜,卻突破了原先倒排文檔的索引款目會因記錄的增加而數(shù)百倍增加,進而因文檔的規(guī)模擴大而影響檢索速度的限制。在《歐陽修研

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論