版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第2章信息檢索根本方法2.1檢索語言2.2分類法2.3主題法2.4數(shù)據(jù)庫檢索本章內(nèi)容信息檢索的過程:文獻信息檢索課題檢索提問信息文獻信息特征分析分析形成形成輸入檢索輸出標引
著錄選用檢索語言和名稱規(guī)范文獻信息標識檢索點檢索提問標識檢索詞檢索工具檢索結(jié)果檢索過程存儲過程文獻標識和檢索標識的匹配標引人員檢索人員信息檢索的實質(zhì)——
課堂討論為什么選這門課?小張是服裝學院的大四學生,畢業(yè)設計題目是“電磁屏蔽織物的研究〞,導師要求小張查找一些與設計題目相關的文獻資料。如果你是小張,你該怎么辦?2.1檢索語言自然語言
PK
人工語言一詞多義
如:筆記本杜鵑
arm——臂、袖子、樹大枝、兵器、軍隊多詞一義如:紅薯、地瓜、山芋、白薯、甘薯、苕
airplane、aeroplane、plane、aircraft引起漏檢、誤檢,甚至檢索不到。缺陷檢索語言——根據(jù)文獻信息檢索的需要創(chuàng)造出來的一種人工語言,也稱受控語言。檢索語言是依據(jù)一定的規(guī)那么對自然語言進行事先標準,將其編制成表,以供文獻標引和檢索時使用的語言。使用的場合不同,檢索語言也有不同的叫法:在存儲文獻的過程中用來標引文獻,叫標引語言;用來索引文獻那么叫索引語言;在檢索文獻過程中那么為檢索語言。檢索語言的種類按照標識的性質(zhì)與原理劃分:分類語言——分類法主題語言——主題法代碼語言按照表達文獻的特征劃分:表達文獻外部特征的檢索語言表達文獻內(nèi)容特征的檢索語言外部標識檢索標識內(nèi)容標識書名、刊名題名專利號、ISBN、文獻號代碼著者、譯者、編者責任者分類號主題詞2.2分類法分類是人類的根本邏輯思維形式之一,是人類認識客觀事物和區(qū)分客觀事物的思維活動。分類法反映了對人類全部知識體系的認識。分類法——分類語言分類語言——用分類號表達主題概念,依據(jù)知識分類將主題概念組織、排列成類目體系,主要以類目體系的自身結(jié)構(gòu)顯示概念之間關系的標引語言。分類語言以數(shù)字、字母或字母與數(shù)字結(jié)合作為根本字符,采用字符直接連接并以圓點〔或其他符號〕作為分隔符,以根本類目作為根本詞匯,以類目的附屬關系來表達復雜概念。著名的分類法有:?國際十進分類法??美國國會圖書館圖書分類法??國際專利分類表??中國圖書館分類法?我國目前的分類法是建立在學科分類體系上的,屬于體系分類法。它是將全部文獻按其性質(zhì)分為幾個主要大類,把相同的文獻集中在一起,相近的文獻連接在一起,并將它們按“一般到具體〞的邏輯順序加以排列,從而組成一個系統(tǒng)。換句話說,就是先將文獻歸入某一大類,然后按第二級類目、第三級類目......層層劃分下去,直至劃分到能準確反映文獻內(nèi)容的那一級類目為止。體系分類法中國圖書館分類法原稱?中國圖書館圖書分類法?,簡稱“中圖法〞,是我國圖書分類法的根底:1975年正式出版第一版;1980年出版第二版;1990年出版第三版;1999年出版第四版,第四版更名為?中國圖書館分類法?,ChineseLibraryClassification〔簡稱CLC〕。中圖法體系結(jié)構(gòu)以自然科學、社會科學、哲學作為人類知識領域的根本構(gòu)成建立根本序列。并將作為社會主義分類法編制指導思想的“馬列主義〞和文獻特殊性設置的“綜合性圖書〞,形成五個部類的根本序列。設置了22個根本大類,大體按“上層建筑-經(jīng)濟根底-意識形態(tài)〞,即“政治-經(jīng)濟-文化〞的次序排列。第一部類A馬克思主義、列寧主義、毛澤東思想、鄧小平理論第二部類B哲學、宗教第三部類C社會科學總論H語言、文字D政治法律I文學E軍事J藝術F經(jīng)濟K歷史、地理G文化、科學、教育、體育第四部類N自然科學總論S農(nóng)業(yè)科學O數(shù)理科學和化學T工業(yè)技術P天文學、地球科學U交通運輸Q生物科學V航空、航天R醫(yī)藥、衛(wèi)生X環(huán)境科學、平安科學第五部類Z綜合性圖書自然科學各大類的排列那么按學科的屬性遵循從一般到特殊、從簡單到復雜、從低級到高級、從理論到應用的次序進行,并形成“根底理論-技術科學-應用科學〞三個層次。類目結(jié)構(gòu)舉例:1、附屬關系——一個類與其直接分出來的小類之間具有上下位關系。下位類具有其上位類的屬性;下位類的含義要通過其上位類來理解;上位類概念包含其所屬的各級下位類概念;附屬關系為通過移位進行縮檢和擴檢提供了便利。類目含義的理解2、并列關系——一個上位類的所有直接下位類之間具有并列關系。并列概念之和等于其直接上位概念;并列類未能枚舉出所有同級類目,那么最后一個并列類目應該是“其他〞類。3、相關關系——兩個類目在概念上具有相似性,但不屬于同一上類位。似是而非的類可通過其上位類判斷,也可以通過附注了解其區(qū)別。附屬和并列關系實例:B哲學B0哲學理論B1世界哲學B2中國哲學B20唯物主義與唯心主義(總論)B21古代哲學B22先秦哲學(公元前221年)B23秦漢、三國晉、南北朝哲學(公元前221年~公元589年)B24隋、唐、宋、元、明、清哲學(589年~1840年)B25近代哲學(1840年~1916年)B26現(xiàn)代哲學(1919年~)B27馬克思主義哲學在中國的傳播與開展相關關系實例:F經(jīng)濟F7貿(mào)易經(jīng)濟F76
商品學F760
一般性問題F760.3
商品包裝和運輸J
藝術J5工藝美術J52
中國工藝美術J524
工商工藝美術J524.1
產(chǎn)品、商品裝璜J524.2
包裝T
工業(yè)技術TB一般工業(yè)技術TB48
包裝工程TB482
包裝設計TB484
包裝材料(總論包裝材料及其包裝技術入此)T
工業(yè)技術TS輕工業(yè)、手工業(yè)TS0
一般性問題TS09
包裝裝璜技術2.3主題法主題法——是指直接以表示文獻或信息主題的語詞作標識,提供字順檢索途徑,并主要采用參照系統(tǒng)揭示詞間關系的標引和檢索文獻的方法。主題法——主題語言主題語言——由受控的自然語言語詞直接表達主題概念,按詞語字順排列主題概念,主要用參照系統(tǒng)顯示概念之間關系的標引語言。以自然語言的字符為字符,以名詞術語為根本詞匯,用一組名詞術語作為檢索標識的一類檢索語言。主題語言——主題詞的類型敘詞、標題詞、元詞——標準詞指經(jīng)過控制的,表達文獻信息內(nèi)容的語詞,由主題詞表來標準。關鍵詞——自由詞但凡能概括文獻主題或讀者需求的、有檢索意義的實詞都可以作為關鍵詞;沒有詞表,不是受控制詞;適應計算機檢索需要。主題詞的構(gòu)詞形式:縮略詞單詞詞組短語含有倒置符的詞組——Pipe,Copper含有圓括號的詞組——疲勞〔材料〕主題詞的參照關系——語義網(wǎng)車輛非承載式車體承載式車體卡車載重汽車重型載重汽車輕型載重汽車貨車屬分關系等同關系屬分關系屬分關系相關關系概括主題詞的一般方法⑴固定詞組概括⑵復雜概念分解⑶主題詞替換針對:概念比較單一的文獻需求,可直接用一個固定詞組概括表示。通用的專稱、術語例:經(jīng)濟危機、萬有引力復合的概念(字面分解后會失去檢索意義或產(chǎn)生歧義)例:剩余價值、獵戶星云⑴固定詞組概括⑵復雜概念分解針對:適于概念比較復雜的文獻需求,需要分解后用邏輯組配表示分解原那么——“最小概念原那么〞例:彌霧噴粉噴煙機——彌霧機、噴粉機、噴煙機分解方法:劃分成具有交叉關系的并列概念例:食品的低溫貯藏——食品、低溫、貯藏劃分成主體概念和限定概念例:環(huán)境污染取樣分析——環(huán)境污染、取樣、分析液壓系統(tǒng)油泵——液壓系統(tǒng)、油泵⑶主題詞替換同義詞、近義詞
例:計算機→電腦客運→旅客運輸上位詞(概念擴大)
例:計算機鍵盤→鍵盤下位詞(概念縮小)
例:信息檢索→計算機檢索2.4數(shù)據(jù)庫檢索反饋反饋檢索字段反映數(shù)據(jù)庫中文獻信息特征的詞條。①表征文獻內(nèi)容特征的主題字段題名、敘詞、標識詞和文摘等②表征文獻外部特征的非主題字段作者、文獻類型、語種、出版年份等DIALOG檢索字段字段代碼 字段名稱
AB Abstract 文摘
AU Author 作者
DE Descriptor 敘詞
DT DocumentType 文獻類型
ID Identifier 標識詞
JN JournalName 刊名
LA Language 語種
PY PublicationYear 出版年份
TI Title 題名檢索組配符布爾/邏輯算符截詞符/通配符位置算符優(yōu)先級算符布爾/邏輯算符1.邏輯與——AANDB;A*B表示兩個檢索詞的交集用以縮檢,減小范圍或是提高查準率AB不能進行“邏輯與〞組配的詞:概念等同的詞附屬概念的詞不相鄰概念的詞:概念并列或無關2.邏輯或——AORB;A+B用于組配具有附屬關系和等同關系的詞;提高查全率,降低漏檢率,屬擴大檢索。BA等同關系——同義詞/近義詞異形同義詞縮寫和全稱商品名、俗名、學名化學物質(zhì)名稱和化學物質(zhì)表達式英文同根詞附屬關系——整體與局部需要針對具體情況分別列出每一個表達局部概念的檢索詞,否那么將出現(xiàn)漏檢。例:歐洲能源(歐洲OR英國OR法國OR意大利OR…)AND(能源OR煤OR石油OR…)3.邏輯非——ANOTB;A-B用以排除不希望出現(xiàn)的檢索詞用以縮檢,提高查準率AB如果兩個關系緊密的檢索詞同在一檢索邏輯中,對其中一個使用NOT邏輯會導致含另一個詞的文獻也被排除。例:(計算機AND軟件)NOT硬件同時包含軟件、硬件的相關文獻被排除了,導致漏檢。截詞符/通配符一般有三種:*、?、$在不同檢索系統(tǒng)中的書寫形式和含義會不同①
*
代替任意多個字母例:auto*:auto、autocycle、automobile…B229*:B229、~②
?僅且必須截一個字母例:wom?n:woman、women…
$
截一個字母或0個字母例:Hof$man*:Hofman、Hoffman、Hoffmann、Hoffmanova
…位置算符①
N
——表示兩詞相鄰,順序可以顛倒②W
——
表示兩詞相鄰,但順序不能顛倒③
SAME
——表示兩詞必須出現(xiàn)在同一句子中,順序可以顛倒④
nN——兩詞之間最多可插入n個單詞,且詞序可顛倒⑤nW——兩詞之間最多可插入n個單詞,且詞序不可顛倒本卷須知:1、中文數(shù)據(jù)庫一般只用到邏輯運算符,通過模糊檢索實現(xiàn)擴檢;2、如果兩個檢索詞之間無邏輯算符,那么按照固定詞組處理;3、組配符的優(yōu)先次序:()>SAME>NOT>AND>OR檢索式的構(gòu)造由檢索詞、檢索字段和邏輯算符、截詞符、位置算符以及系統(tǒng)規(guī)定的其他組配連接符號組成。例:SCI:TS=((urbanORcity)ANDtransport*)AND
TI=(railwayORsubwayORunderground)EI:((urbanORcity)
WN
KY)AND((railwayORsubwayORunderground)WN
TI)AND((transport*)WN
AB)檢索式的調(diào)整擴檢——從查全率角度①降低檢索詞的專指度;選一些上位詞或相關詞補充到檢索式中②調(diào)節(jié)檢索式的網(wǎng)羅度;如刪去某個不很重要的概念面③進行族性檢索;可采用分類號檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45086.1-2024車載定位系統(tǒng)技術要求及試驗方法第1部分:衛(wèi)星定位
- 2025農(nóng)村公益性服務合同書
- 展覽展示裝修合同范例
- 物流門頭定制合同范例
- 農(nóng)村合資建房合同范例
- 承包開挖石方合同范例
- 文案合同范例
- 合同范例公示寫
- 水電工合同范例
- 市場衛(wèi)生保潔合同范例
- 天津市南開區(qū)2023-2024學年四年級上學期期末語文試卷
- 數(shù)據(jù)中心智能運維體系建設
- 2023年計劃訂單專員年度總結(jié)及下一年規(guī)劃
- 體質(zhì)測試成績表(自動統(tǒng)計數(shù)據(jù))(小學、初中)
- 2022年全國垃圾分類知識競賽試題庫(附含答案與解析)
- 2024版醫(yī)院手術安全管理學習培訓課件
- 材料標準目錄
- 腦卒中后吞咽障礙患者進食護理(2023年中華護理學會團體標準)
- 護士執(zhí)業(yè)注冊申請表 新
- 妊娠期高血壓疾病診治指南(2022版)解讀
- 公章證照使用登記表
評論
0/150
提交評論