關鍵詞索引類型剖析_第1頁
關鍵詞索引類型剖析_第2頁
關鍵詞索引類型剖析_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、補充資料:關鍵詞索引以出現在文獻題名(或正文及文摘)中的描述文獻主題內容的關鍵詞為標目的字順索引。它將每個關鍵詞輪排于索引款目中的標目位置,以提供多個檢索入口。 一般分為兩類:一類是帶上下文的索引,如題內關鍵詞索引、題外關鍵詞索引、雙重關鍵詞索引等;另一類是不帶上下文的索引, 如單純關鍵詞索引和詞對式關鍵詞索引。 關鍵詞索引通常用計 算機編制,較為簡便,適用于快速報道文獻和進行瀏覽性文獻檢索。由于關鍵詞屬未經規(guī)范的自然語言,利用關鍵詞索引難于查全同一主題的文獻,一般不用于編制累積索引。簡史 西方1516世紀出現的圣經索引和 19世紀前期英、德等國家圖書館目錄中的主詞款目,已帶有關鍵詞索引的性質

2、。1856年英國A.克里斯塔多羅的圖書館編目技術一書中出現了對關鍵詞索引法的最早論述。1958年美國H.P盧恩和PB.巴克森德爾同時向在華盛頓召開的國際科學情報會議提交關于用穿孔卡片分檢機編制關鍵詞索引 的論文。次年,盧恩發(fā)表題為技術文獻的上下文關鍵詞索引的論文。此后他又致力于用 計算機自動編制題內關鍵詞索引的研究,使機編關鍵詞索引逐步在科技檢索刊物中得到應 用。20世紀60年代以后,在題內關鍵詞索引的基礎上又陸續(xù)產生了題外關鍵詞索引、雙重 關鍵詞索引等一系列新品種。 對關鍵詞索引的研究, 促進了自動標引的實現和全文數據庫的 建立。70年代以來,中國的一些圖書館、情報機構已開始用機編關鍵詞索引

3、技術編制圖書 館目錄和檢索刊物的主題索引。題內關鍵詞索引簡稱KWIC,又稱上下文關鍵詞索引。是最早出現的機編索引,首先應用于1960年美國化學文摘社創(chuàng)辦的化學題錄。題內關鍵詞索引的標目在款目的中部,左右均為該標目的上下文 ;索引款目按位于款目中部作為標目的關鍵詞的字順排 列。格式如:(文獻號為 3456)的文舉例:一篇題為超文本技術在網絡資源組織中的應用 獻,可通過計算機自動生成以下款目:廠檢索入口中的應用/超文本技術在網絡資源組織3456應用/超文本技術在網絡資源組織中的3456超文本技術在網絡資源組織中的應用/3456本技術在網勢資源組織中的應用/超文3456術在網絡資源組織中的應用/超文

4、文本技3456資源組織中的應用/超文文本技術在網2各3456KWIC的設計思想是:文獻題名通常具有揭示文獻主題內容的作用,從題名中抽 取的關鍵詞能有效地將用戶指向相關主題的文獻;保留題名中關鍵詞前后的上下文,有助于說明關鍵詞的含義,可用作限定標目含義的說明語。KWIC的編制步驟包括:把經過人工處理的文獻題名(包括增補的關鍵詞)輸入計算機。計算機用非用詞表剔除題名中的介詞、連詞、冠詞等,篩選出有檢索意義的 關鍵詞。將每個關鍵詞依次輪流用作索引標目,同時保留其上下文。 若題名過長,可以截斷或移位。編成索引款目,并進行編排加工,最后交付印刷。上述工序除第一步由人工完成 外,其余皆由計算機完成。 例如

5、,一篇題為Play therapy for maladjusted children(孤僻兒童的 游戲療法)的論文,輸入計算機后可產生以下幾條索引款目:檢索時先在索引款目中部找到與檢索課題有關的關鍵詞,再查看其左右的上 下文,尋找切題的文獻。題外關鍵詞索引簡稱KWOG最早出現的KWIC改進形式。與KWIC相比,其標目的位置不在款目的中部而是在款目的左端或提行至左上方,標目之后(或之下)仍保留完整的文獻題名。 其款目格式為: 編制時依次輪流將題名中的每個關鍵詞置于標目的位置, 原題 名中的關鍵詞也可用一符號(如星號)代替,題名之后注明文獻地址,最后款目按關鍵詞的字順排列起來。上例如按KWOC 編

6、制,可產生以下幾條款目:childrenplay therapy for maladjusted *3000 maladjustedplay therapy for *children 3000play*therapy for maladjusted children 3000 therapyplay * for maladjusted children 3000KWOC 因標目位置突出,款目形式與普通主題索引接近,可讀性比題內關鍵詞索引強,符合用戶的檢索習慣。但所占篇幅比KWIC大,并容易造成復合主題的文獻在字順序列中被分散在多處。雙重關鍵詞索引也稱雙重上下文關鍵詞索引,是 KWIC和KWO

7、C的結合形式,由美國A.E.彼特拉克于1969年創(chuàng)制。其特點是雙重標目,主標目(第一關鍵詞)在題名之外,副標目(第二關鍵詞)在題名的左端。索引款目共2 行, 其格式如: 雙重關鍵詞索引兼有KWIC及 KWOC 的優(yōu)點,使用較為方便,但索引篇幅大,編印成本高。前例如編雙重關鍵詞索引, 可產生下列幾條索引款目:childrenmaladjusted children/play therapy for 3000play therapy for maladjusted children/ 3000therapy for maladjusted children/play 3000 maladjuste

8、dchildren/play therapy for maladjusted 3000play therapy for maladjusted children/ 3000therapy for maladjusted children/play 3000 play單純關鍵詞索引 純粹由若干關鍵詞組成的索引。 其索引款目格式是: 一般從題名、文摘或正文中抽出15個關鍵詞,將每一個關鍵詞依次輪流移至款目的左端或左上方作為標目,將其余關鍵詞用作說明語。例如美國化學文摘中一篇題為 Acetylenecrackingfrom heavy oil 的文獻(文獻地址為76733W ),可產生以下索引款目:

9、acetyleneheavy oil cracking 76733Wcrackingheavy oil acetylene 76733Wheavyoil cracking acetylene 76733W單純關鍵詞索引的制作較為簡單,它具有標引深度較大而索引篇幅較小的優(yōu)點,但由于它不帶上下文,沒有語法結構,難于判斷索引款目的含義,查準率較低。詞對式關鍵詞索引 由一對關鍵詞組成的索引。 其原理與雙重關鍵詞索引相似,只是不帶上下文。由于款目輪排時采用數學中的排列原理,因此又稱為輪排主題索引。1967年美國費城科學情報研究所(ISI)首創(chuàng),最先用于編制科學引文索引的主題索引。格式如:如第一例編成詞對式關鍵詞索引 , 可以產生以下6 條款目(款目按標目的字順排列) :children maladjusted 3000 children play therapy 3000 maladj

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論