![信息檢索與分析講稿_第1頁](http://file4.renrendoc.com/view/92e1ab01036c7e401be96fce56bf263c/92e1ab01036c7e401be96fce56bf263c1.gif)
![信息檢索與分析講稿_第2頁](http://file4.renrendoc.com/view/92e1ab01036c7e401be96fce56bf263c/92e1ab01036c7e401be96fce56bf263c2.gif)
![信息檢索與分析講稿_第3頁](http://file4.renrendoc.com/view/92e1ab01036c7e401be96fce56bf263c/92e1ab01036c7e401be96fce56bf263c3.gif)
![信息檢索與分析講稿_第4頁](http://file4.renrendoc.com/view/92e1ab01036c7e401be96fce56bf263c/92e1ab01036c7e401be96fce56bf263c4.gif)
![信息檢索與分析講稿_第5頁](http://file4.renrendoc.com/view/92e1ab01036c7e401be96fce56bf263c/92e1ab01036c7e401be96fce56bf263c5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、信息檢索與分析講稿(1)課程目錄信息檢索與分析理論基礎 (4次)文獻信息源及其數(shù)字化發(fā)展(4次)網(wǎng)絡資源源與搜索索引擎(4次,其中中2次上上機;內內容包括括網(wǎng)絡免免費資源源的獲取取和搜索索引擎知知識的介介紹和運運用)中文數(shù)據(jù)據(jù)庫的使使用(6次,其其中2次次上機;主要以以本館數(shù)數(shù)據(jù)庫為為講授對對象)外文數(shù)據(jù)據(jù)庫的使使用(6次,其其中2次次上機;主要以以本館數(shù)數(shù)據(jù)庫為為講授對對象)基于圖書書情報平平臺的信信息檢索索(4次次,其中中2次上上機;)文獻信息息的分析析與利用用(2次次)個人文獻獻信息管管理軟件件介紹與與利用(4次;其中中2次上上機)知識匯總總與考試試準備(2次)考試方式式:統(tǒng)一一考試(筆
2、試、閉卷)作業(yè)業(yè)網(wǎng)上學習習方式:下載課課件和講講義的地地址 HYPERLINK htttp:/llib.wzuu.eddu.ccn/nnew/ir.htmm htttp:/llib.wzuu.eddu.ccn/nnew/ir.htmm推薦網(wǎng)站站:1、哈爾爾濱工業(yè)業(yè)大學信信息檢索索研究室室 HYPERLINK htttp:/ htttp:/n/2、中國國科學院院現(xiàn)代信信息檢索索(Mooderrn IInfoormaatioon RRetrrievval) HYPERLINK htttp:/irr.icct.aac.ccn/iircooursse/ htttp:/irccourrse/3、吉林林大
3、學信息檢檢索與利利用網(wǎng)網(wǎng)絡課程程 HYPERLINK htttp:/et/nettclaass/xxjjsylly/ htttp:/n/ett/neetcllasss/xxxjsyyly/4、復旦旦大學信息檢檢索與利利用 HYPERLINK hhttpp:/2022.1220.776.2227/jiaaoyaanshhi/ddzjcc/inndexx.httm htttp:/2002.1120.76.2277/jiiaoyyansshi/dzjjc/iindeex.hhtm5、中文文Webb信息檢檢索論壇壇(北京京大學) HYPERLINK htttp:/wwww.ccwirrf.oorg/
4、htttp:/g/6、大連連理工大大學信息息檢索研研究室 HYPERLINK hhttpp:/ htttp:/iir.ddlutt.eddu.ccn/7、云南南大學精精品課程程信息息檢索網(wǎng)站 HYPERLINK hhttpp:/xxjjs.ccol.ynuu.eddu.ccn/iindeex.hhtmll htttp:/n/inndexx.httml8、南京京大學精精品課程程信息息檢索網(wǎng)站 HYPERLINK hhttpp:/jw.njuu.eddu.ccn/JJinggPinn/xxxjs/jxddw.hhtm htttp:/n/JiingPPin/xxjjs/jjxdww.httm9、華東
5、東理工大大學精品品課程文獻檢檢索 HYPERLINK hhttpp:/couursee.eccustt.eddu.ccn/ccourrsess/wxxjs/inddex.htmm htttp:/n/cooursses/wxjjs/iindeex.hhtm經典網(wǎng)站站:1、中國國國家圖圖書館 HYPERLINK hhttpp:/ htttp:/wwww.nlcc.goov.ccn/2、中國國科學院院國家科科學圖書書館 HYPERLINK htttp:/n/ htttp:/3、北京京大學圖圖書館網(wǎng)網(wǎng)站 HYPERLINK htttp:/ htttp:/4、上海海圖書館館 HYPERLINK httt
6、p:/n/ htttp:/n/5、浙江江大學圖圖書館 HYPERLINK hhttpp:/ htttp:/llibwweb.zjuu.eddu.ccn/6、中文文維基百百科 HYPERLINK htttp:/g/ htttp:/zhh.wiikippediia.oorg/7、溫州州大學圖圖書館網(wǎng)網(wǎng)站: HYPERLINK hhttpp:/ htttp:/llib.wzuu.eddu.ccn參考文獻獻:1.葉繼繼元.信息檢檢索導論論.北京京:電子子工業(yè)出出版社,20003年2.黃如如花.網(wǎng)絡信信息的檢檢索與利利用. 武昌:武漢大大學出版版社,220022年3.葉鷹鷹.信信息檢索索:理論論與方法法
7、.北京京:高等教教育出版版社,220044年4.焦玉玉英等.信息息檢索. 武漢漢:武漢漢大學出出版社,20002年5.馬費費成.信息管管理學基基礎. 武漢:武漢大大學出版版社,220022年6.沈固固朝.信息檢檢索(多多媒體)教程. 北京京:高等等教育出出版社,20002年7.王知知津.科技信信息檢索索.天津津:南開開大學出出版社,20002年8.信息息檢索與與利用,鄢春根根主編,人民郵郵電出版版社 ,20008年9.信息息檢索與與利用,洪全主編,清華大大學出版版社,出出版時間間: 220077年10.信信息資源源檢索與與利用(第2版版),林林豪慧,孫麗芳芳主編, 電子子工業(yè)出出版社, 200
8、07年年導言 信息檢檢索與分分析解析析一、對本本課程的的理解和和解釋:信息息檢索與與分析1、信息息檢索課課程的出出現(xiàn)信息、能能源和材材料,并并稱為現(xiàn)現(xiàn)代社會會的三大大支柱。20世世紀以來來,人類類創(chuàng)生的的信息量量高速增增長,浩浩如煙海海。信息息檢索,就是從從浩如煙煙海的信信息海洋洋中查找找出所需需信息的的過程。為實現(xiàn)現(xiàn)這個過過程是需需要適當當理論和和方法的的,信息息檢索課課應運而而生。2、信息息檢索(Infformmatiion Rettrieevall)作為一門門學科,信息檢檢索歷史史可追溯溯到199世紀下下半葉。但在220世紀紀中期以以前,信信息存儲儲和傳播播主要以以紙質為為載體,信息檢檢
9、索活動動也是圍圍繞和文文獻的獲獲取和控控制展開開的,因因此,信信息檢索索研究關關注的是是如何檢檢索利用用文獻中中記載的的信息,文獻檢檢索一度度成為信信息檢索索的同義義詞?,F(xiàn)現(xiàn)代意義義的信息息檢索作作為一個個獨立的的領域,是19946年年計算機機出現(xiàn)后后在國際際上逐步步得以確確立的。3、信息息檢索教教育教育部(當時是是國家教教委)119844年發(fā)出出的“高教一一字0004號”文件要求在在高等教教育院校校開設“文獻檢檢索與利利用”課程。20余年年來,文文獻檢索索教育尤尤其是手手工檢索索教育方方面已取取得了很很大的成成績。然然而隨著著計算機機、多媒媒體等信信息技術術的發(fā)展展,以多多種載體體多種記記錄
10、方式式的非紙紙信息急急劇的增增加,靠靠“手翻、眼看、大腦判判斷”的手工工檢索模模式已經經難以適適應信息息社會的的發(fā)展要要求,計計算機信信息檢索索應運而而生;以以Intternnet為為代表的的全球性性計算機機網(wǎng)絡迅迅速發(fā)展展和普及及,更進進一步的的推動了了信息檢檢索的發(fā)發(fā)展,使使得網(wǎng)絡絡化信息息檢索逐逐漸成為為信息檢檢索的主主流。二、和信信息檢索索相關的的幾個術術語的解解釋和理理解1、信息息定義物質存存在的一一種方式式,一般般指數(shù)據(jù)據(jù)、消息息中所包包含的意意義??煽梢允瓜⒅兴枋龅牡氖录牡牟欢ㄐ孕詼p少。(*注:中國情報與與文獻工工作詞匯匯基本術術語(GB4489444-885)有有關信
11、息息的定義義。據(jù)不完全全統(tǒng)計,信息的的定義有有1000多種,至今仍仍無法統(tǒng)統(tǒng)一,為為各界普普遍認同同。這種種情況主主要是由由于信息息本身的的因素,以及認認識層次次上的差差別造成成的。不同的學學科,從從不同的的角度對對信息這這個概念念有不同同的解釋釋。經濟濟學、心心理學、新聞學學和哲學學的定義義不同于于圖書情情報學對對信息的的定義??刂普撜搶<襈N維納(N. Norrberrt WWienner)從信息息自身具具有的內內容屬性性給信息息下定義義被許多多研究所所引用。信息論論的創(chuàng)始始人申農農(C.E.SShannnonn)19948年年在通通信的數(shù)數(shù)學原理理一文文中將信信息定義義為“兩次不不定性之
12、之差”。國內在這這方面也也有許多多爭論。信息的定定義之所所以呈現(xiàn)現(xiàn)多樣化化,主要要原因有有三:第第一,信信息本身身的復雜雜性,它它是一個個多元化化,多層層次、多多功能的的綜合物物;第二二,信息息科學是是一門新新興學科科,它的的許多分分支學科科仍在隨隨著社會會、經濟濟和科學學技術的的發(fā)展而而發(fā)展,其內涵涵和外延延不很確確切;第第三,人人們出于于不同的的研究和和使用目目的,從從不同的的角度或或層次出出發(fā),對對信息概概念就會會作出不不同的解解釋。因此,許許多學者者建議將將信息的的要領分分為不同同的層次次來解釋釋。在諸諸多層次次中,最最重要的的是兩個個層次:一是沒沒有任何何約束條條件的本本體論層層次,
13、即即信息是是一種客客觀存在在的現(xiàn)象象,是事事物的運運動狀態(tài)態(tài)及其變變化方式式的表征征,不受受主體意意志的影影響。不不停運動動著的事事物不斷斷產生本本體論意意義上的的信息;二是受受主體約約束的認認識論層層次,即即信息就就是主體體所感知知或所表表述的事事物運動動狀態(tài)及及其變化化方式,是反映映出來的的客觀事事物的屬屬性。例子:信信息的要要領是十十分廣泛泛的,世世間萬物物的運動動,人間間萬象的的更迭,都離不不開信息息的作用用。據(jù)說說上古時時期,諾諾亞的方方舟在洪洪水中飄飄蕩許久久,當放放出的飛飛鴿銜回回一束橄橄欖,意意味著帶帶回了洪洪水已退退的信息息。那么么李太白白的詩“日照香香爐生紫紫煙,遙遙看瀑布
14、布掛前川川,飛直直下三千千尺,疑疑是銀河河落花流流水九天天?!苯o我們們帶來的的顯然就就是廬山山瀑布的的信息;蘇東坡坡的詞“大江東東去,浪浪淘盡,千古風風流人物物?!苯o我我們傳遞遞的是赤赤壁懷古古的信息息。從自然界界角度看看,表征征物質的的屬性:地球晝晝夜的變變化是一一種信息息,它反反映出地地球繞太太陽自轉轉的運動動特性和和狀態(tài);山的高高度是一一種信息息,它反反映出山山的空間間特性;樹干的的年輪是是一種住住處它反反映了樹樹木成長長的時間間特性樹齡齡;閃電電是一種種信息,它反映映了云層層中所含含能量的的不知所所云 性性;花的的香味也也是一種種信息,它反映映了花分分子結構構的化學學特性等等等。)2、
15、知識識是人類的的主觀世世界對客客觀世界界概括和和反映,是大量量有組織織的信息息,是關關于事實實和思想想的有組組織的陳陳述。提提供某種種經過思思考的判判斷和某某種實驗驗的結果果。(1)知知識的分分類根據(jù)國際際經濟合合作與發(fā)發(fā)展組織織(OCCED)出版的的以知知識為基基礎的經經濟報報告:第一類“知事(Knoow-wwhatt)”,指關關于事實實方面的的知識,也可理理解為KKnoww-whhen、Knoow-wwherre;即即在什么么樣的時時間(KKnoww-whhen)、什么么樣的地地點或條條件下(Knoow-wwherre)能能解決什什么樣的的問題第二類“知因(Knoow-wwhy)”,指自自
16、然原理理和規(guī)律律方面的的科學理理論,知知識的生生產是在在專門研研究機構構如實驗驗室和大大學完成成的;第三類“知道怎怎樣做的的知識(Knoow-hhow)”,指做做某些事事情的技技藝和能能力,被被稱為技技術情報報和商業(yè)業(yè)秘密,其典型型是企業(yè)業(yè)開發(fā)和和保存于于其內部部的技術術訣竅或或專有技技術;第四類“誰以及及是怎樣樣創(chuàng)造知知識的(Knoow-wwho)”側重創(chuàng)創(chuàng)造思想想、方法法、手段段、過程程以及特特點等的的了解。還有一種種分類:把知識識分為顯顯性知識識(Exxpliicitt Knnowlledgge)和和隱性知知識(Taccit Knoowleedgee)。所謂顯性性知識是是指經過過人的整整
17、理和組組織后,可以編編碼化和和度量,并以文文字、公公式、計計算機程程序等形形式表現(xiàn)現(xiàn)出來,還可以以通過正正式的、系統(tǒng)化化的方式式(如出出版物、計算機機網(wǎng)絡等等)加以以傳播,便于其其他人掌掌握的知知識。典典型的顯顯性知識識主要是是指以專專利、科科學發(fā)明明和特殊殊技術等等形式存存在的知知識,它它是有載載體的、可以表表達的,OECCD的分分類中“知事(Knoow-wwhatt)”和“知因(Knoow-wwhy)”;隱性知識識是與人人結合在在一起的的經驗性性知識,很難編編碼化,并將其其文字化化或者公公式化,它們本本質上以以人為載載體,因因此難以以通過常常規(guī)的方方法收集集到它,也難以以通過常常規(guī)的信信息
18、工具具進行傳傳播。隱隱性知識識往往是是個人或或組織經經過長期期積累而而擁有的的知識,通常不不易用語語言表達達,也不不可能傳傳播給別別人或傳傳播起來來非常困困難。例例如:技技術高超超的廚師師或藝術術家可能能達到世世界水平平,卻很很難將自自己的技技術或技技巧表達達出來從從而將其其傳播給給別人或或與別人人共享。隱性知知識對應應的是OOECDD中的關關于Knnow-howw和Knnow-whoo的知識識,其特特點是不不易被認認識到、不易衡衡量其價價值、不不易被其其他人所所理解和和掌握。(2)知知識的來來源第一類是是人腦之之中,以以主觀意意識存在在,只有有當以一一定的形形式,通通過一定定的載體體表達時時
19、,才能能為其他他人所感感知;第二類是是存在于于實物之之中,如如古文物物、樣品品、樣機機、物品品等。人人們可以以通過研研究實物物而獲得得某種知知識;第三類是是用文字字、圖形形、代碼碼、符號號、聲頻頻、視頻頻等技術術手段記記錄在一一定的載載體之上上,例如如刻在甲甲骨上、印在紙紙張上等等,這就就是文獻獻。3、文獻獻是記錄有有知識的的一切載載體。(*注目目前有關關文獻的的較權威威的定義義主要有有兩個,一是文獻情情報術語語國際標標準(草草案)(ISSODDIS551277)的定定義,“為了把把人類知知識傳播播開來和和繼承下下去,人人們用文文字、圖圖形、符符號、聲聲頻、視視頻等手手段將其其記錄下下來,或或
20、寫在紙紙上,或或曬在藍藍圖上,或攝制制在感光光片上,或錄到到唱片上上,或存存貯在磁磁盤上。這種附附著在各各種載體體上的記記錄統(tǒng)稱稱為文獻獻?!?另一一個是中中國的國國家標準準。是各各種媒介介和形式式的信息息集合,包括文文字、聲聲像印刷刷品、電電子信息息、數(shù)據(jù)據(jù)庫等。)文獻的構構成要素素(1)文文獻信息息是文獻獻的內容容(2)符符號系統(tǒng)統(tǒng)是信息息的攜帶帶者(*注:文字已已不再是是表達思思想的唯唯一手段段,圖形形、聲頻頻、視頻頻等同樣樣成為表表達思想想、傳遞遞感情的的重要手手段??偪偟恼f來來,文獻獻中的符符號系統(tǒng)統(tǒng)指圖畫畫、文字字、公式式、圖表表、編碼碼、聲像像和電磁磁信息等等。)(3)載載體是符
21、符號賴以以依附的的“寄主”(*注:隨著生生產力的的發(fā)展,存貯和和表達人人們思想想的物質質載體不不同了,從金石石、竹簡簡、羊皮皮、絲帛帛、紙張張發(fā)展到到用感光光介質和和磁性介介質。從從非人工工材質的的泥版、巖石、石板、獸骨、木板、竹片、 獸皮皮、樹葉葉、樺樹樹皮等到到各種人人工材質質,如無無機材質質(陶、磚瓦、瓷,玻玻璃等)、金屬屬材質(青銅、鐵、鋁鋁、金銀銀等)、高分子子材質(帛、紙紙、膠片片、醋酸酸纖維等等)、復復合材質質(磁帶帶、光盤盤等)。紙質文文獻已經經多得不不便于快快速傳輸輸信息、高效查查閱和高高密度存存貯了,于是其其他介質質的文獻獻應運而而生,這這些文獻獻主要包包括:紙紙質文獻獻具
22、有價價格低廉廉、質地地柔軟、易于書書寫、攜攜帶和收收藏等其其它一些些載體所所無法比比擬的性性能而成成為文獻獻家族的的主干。)(4)記記錄方式式是將文文獻的符符號進入入載體的的方法和和過程(*注:按記錄錄方法分分可有手手工記錄錄、機械械記錄、光記錄錄、電記記錄、聲聲記錄和和磁記錄錄。其中中最常見見的是印印刷。隨隨著科技技的發(fā)展展,文字字記錄可可以轉變變?yōu)閿?shù)據(jù)據(jù)記錄,并用電電子方法法存貯到到磁介質質上去。此外,還有光光學字符符識別(Optticaal CCharractter Reccognnitiion,簡稱OOCR)技術就就代表了了這種嶄嶄新的技技術,它它通過光光學方法法對字符符、標記記表示的
23、的書面數(shù)數(shù)據(jù)進行行自動識識別,轉轉換成機機器可以以處理的的信息,這樣就就實現(xiàn)了了紙質文文獻信息息向電子子信息的的轉換,而且可可以通過過不同接接口裝置置向不同同設備輸輸入數(shù)據(jù)據(jù),這些些設備進進而與通通信網(wǎng)絡絡相連,實現(xiàn)遠遠距離數(shù)數(shù)據(jù)傳送送。)4、信息息、知識識與文獻獻的關系系(1)區(qū)區(qū)別信息,有有形的、獨立于于行動和和決策、經過處處理改變變形態(tài)、物質產產品、與與環(huán)境無無關、可可以復制制;知識,無無形的、與行動動和決策策相關、經過處處理改變變思維、精神產產品、環(huán)環(huán)境改變變涵義、經過學學習才能能轉讓、無法復復制?!保?)聯(lián)聯(lián)系知識是有有組織的的大量的的信息,獲得知知識有賴賴于獲得得信息;信息是知知識
24、得以以形成和和傳播的的中介,而不是是知識本本身,知知識是經經過精心心研究、領會后后的有用用信息,是人類類對信息息加工處處理后的的產物;并非所有有信息都都可成為為知識,在信息息時代,源于眾眾多復雜雜客體的的大量信信息,只只有借助助于現(xiàn)代代化的信信息手段段,并通通過掌握握現(xiàn)代信信息科學學技術的的認知主主體,才才能真正正轉化為為知識。(*注:例如,人們對對于衛(wèi)星星照片,氣象云云團的識識讀能力力是不同同的,所所獲得的的信息的的量和質質將會有有差別。)傳遞運用后事物運動知識新的信息信息產生人腦有序化用于實踐文 獻記錄在載體上信息、知知識與文文獻的關關系關系系示意圖圖5、信息息素質信息素質質(innfor
25、rmattionn liiterracyy)是一一個綜合合性的概概念,包包含信息息意識,信息技技能,信信息道德德。信息息社會人人們必須須具備的的素質,也是當當今素質質教育一一個重要要方面。(1)信信息意識識是人人們利用用信息系系統(tǒng)獲取取所需信信息的內內在動因因,具體體表現(xiàn)為為對信息息的敏感感性、選選擇能力力和消化化吸收能能力。(*注:同樣重重要的信信息,有有的人善善于抓住住,有的的人卻漠漠然視之之。這是是由于各各人的信信息意識識強弱不不同。信信息技能能的掌握握在很大大程度上上取決于于信息意意識的提提高。信息意識識的強烈烈與否對對能否挖挖掘出有有價值的的信息、對文獻獻獲取能能力的提提高起著著關鍵
26、的的作用。日本人人在這方方面做得得非常好好,例如如:大慶慶油田事事件。)(2)信信息能力力(信息息技能)尋求求有關新新知識的的能力。 具體體表現(xiàn)為為以下66種技能能:明確任務務(Taask Deffiniitioon):了解問問題的癥癥結,確確定所需需信息和和目的,分清任任務的輕輕重緩急急; 信息查詢詢策略(Infformmatiion Seeekinng SStraateggiess):了了解各種種信息源源,能夠夠作出評評價并確確定優(yōu)先先查找的的次序; 查找和檢檢索(LLocaatioon aand Acccesss):確確定信息息藏址,從信息息源中找找出信息息; 信息利用用(Usse oo
27、f IInfoormaatioon):能夠讀讀懂(或或聽懂、理解)查出的的信息,了解信信息在滿滿足需求求中的特特定價值值; 信息綜合合(Syynthhesiis):能夠組組織信息息,提供供信息產產品(論論文、報報告等); 信息評價價(Evvaluuatiion):評價價查找結結果和解解決問題題的過程程(效率率)。 (3)信信息道德德信息道德德指人人們在信信息活動動中應遵遵循的道道德規(guī)范范。信息犯罪罪運用用信息技技術故意意實施的的嚴重危危害社會會并應負負刑事責責任的行行為。三、信息息檢索的的概念信息檢索索(Innforrmattionn Reetriievaal)是是在19949年年國際數(shù)數(shù)學會
28、議議上由GGalvvin W. Moooerss 在把信息息檢索看看作是時時間性的的通訊一文中中首次提提出的。信息檢索索的概念念有狹義義和廣義義之分:(1)狹狹義的檢檢索是指指依據(jù)一一定的方方法,從從已經組組織好的的大量有有關信息息集合中中,查找找并獲取取特定的的相關信信息的過過程。這這里的信信息集合合,不是是通常所所指的信信息本身身,而是是關于文文獻的信信息或文文獻的線線索。 (2)廣廣義的檢檢索包括括信息的的存儲和和檢索兩兩個過程程(Sttoraage andd Reetriievaal)。信息存存儲是將將大量無無序的信信息集中中起來,根據(jù)信信息源的的外表特特征和內內容特征征,經過過整理、
29、分類、濃縮、標引等等處理,使其系系統(tǒng)化、有序化化,并按按一定的的技術要要求建成成一個具具有檢索索功能的的數(shù)據(jù)庫庫或檢索索系統(tǒng),供人們們檢索和和利用。而檢索索是指運運用編制制好的檢檢索工具具或檢索索系統(tǒng),查找出出滿足用用戶要求求的特定定信息。四、信信息檢索索與分析析意義義和作用用現(xiàn)代科技技的發(fā)展展,每時時每刻都都有新的的發(fā)明創(chuàng)創(chuàng)造,信信息也出出現(xiàn)新陳陳代謝加加快、老老化加劇劇、使用用壽命縮縮短的趨趨勢。而而現(xiàn)代信信息技術術的發(fā)展展,特別別是計算算機技術術、電子子技術、遠程通通訊技術術、光盤盤技術、網(wǎng)絡技技術發(fā)展展,使信信息的載載體從傳傳統(tǒng)的紙紙質印刷刷型媒介介向光學學、磁性性媒介發(fā)發(fā)展,信信息的
30、傳傳遞速度度越來越越快,傳傳播面也也越來越越廣,信信息檢索索手段越越來越先先進。面面對爆炸炸式增長長的信息息量,信信息檢索索是進行行科學研研究必不不可少的的手段之之一 。如何從這這浩如煙煙海的信信息中找找出所需需信息,是信息息檢索的的重任。充分利用用信息資資源,避避免重復復勞動 :積累累、繼承承和借鑒鑒前人的的研究成成果是科科技發(fā)展展的重要要前提,在研究究工作中中,任何何一個項項目從選選題、實實驗研究究或設計計,到成成果鑒定定,每一一步都離離不開信信息。只只有充分分掌握了了有關信信息,才才能避免免重復,少走彎彎路,保保證研究究工作在在盡可能能高的層層次上起起步,并并縮短研研究周期期。更新自身身
31、知識積積累,適適應社會會發(fā)展需需要 :掌握信信息檢索索的方法法與技能能,是形形成合理理知識和和更新知知識的重重要手段段,是做做到無師師自通、不斷進進取的主主要途徑徑。信息檢索索基礎理理論一、信息息檢索及及其發(fā)展展1、信息息檢索信息檢索索(Innforrmattionn Reetriievaal)是是在19949年年國際數(shù)數(shù)學會議議上由GGalvvin W. Moooerss首次在在把信信息檢索索看作是是時間性性的通訊訊論文文中提出出的。一句話概概括信息息檢索的的基本原原理:信信息檢索索是對信信息集合合與需求求集合的的匹配和和選擇。信息檢索索基本原原理示意意圖需求集合合:人們們?yōu)榱藵M滿足某種種需
32、求時時,感到到需要補補充知識識,因此此產生了了對信息息的需求求。信息集合合:是有有關某一一領域的的文獻或或數(shù)據(jù)的的集合體體,它是是一種公公共知識識結構,可能彌彌補用戶戶的知識識結構缺缺陷。匹配和選選擇:是是一種機機制,負負責把需需求集合合和信息息集合進進行比較較,然后后根據(jù)一一定的標標準選出出需求的的信息。2、信息息檢索的的發(fā)展階階段(1)手手工檢索索(1887619554)(2)脫脫機批處處理檢索索(19954-19665)(3)聯(lián)聯(lián)機檢索索(19965-19991)(4)網(wǎng)網(wǎng)絡化聯(lián)聯(lián)機檢索索(19991今)3、信息息檢索發(fā)發(fā)展的趨趨勢(1)深深度:傳傳統(tǒng)西西西檢索向向全文本本、多媒媒體、多
33、多載體、多原理理等新型型信息檢檢索的發(fā)發(fā)展,在在深度上上提高管管理和組組織信息息的能力力,如探探索自動動抽詞、自動索索引、自自動檢索索、自動動文摘、自動分分類、自自動翻譯譯等;(2)廣廣度:信信息資源源的網(wǎng)絡絡化和分分布化,面向IInteerneet中浩浩瀚無垠垠的資源源,在廣廣度上提提高管理理和組織織信息的的能力。信息檢索索模型信息檢索索模型:運用數(shù)數(shù)學德育育眼和工工具,對對信息檢檢索系統(tǒng)統(tǒng)中的信信息及其其處理過過程加以以翻譯和和抽象,表述為為某種數(shù)數(shù)學公事事,再經經過演繹繹、推斷斷、解釋釋和實際際檢驗,反過來來指導信信息檢索索實踐。(1)布布爾邏輯輯檢索模模型(BBoolleann Moo
34、dell)(2)向向量空間間檢索模模型(VVecttor Spaace Moddel)(3)概概率檢索索模型(Proobabbiliistiic MModeel)(4)模模糊集合合檢索模模型(FFuzzzy-sset Moddel)(5)擴擴展布爾爾邏輯檢檢索模型型(Exxtenndedd Boooleean Moddel)(6)相相關反饋饋模型(Rellevaancee Feeedbbackk Moodell)二、信息息檢索系系統(tǒng)計算機信信息檢索索系統(tǒng)主主要指它它包括的的功能模模塊或子子系統(tǒng)及及其相互互關系。一個完完整的信信息檢索索系統(tǒng),通常由由以下餓餓功能模模塊組成成:信息息選擇子子系統(tǒng)、
35、標引子子系統(tǒng)、建庫子子系統(tǒng)、詞表管管理子系系統(tǒng)、用用戶接口口子系統(tǒng)統(tǒng)、提問問處理子子系統(tǒng)。1、信息息檢索系系統(tǒng)的組組成:一一個完整整的信息息檢索系系統(tǒng),通通常由以以下幾個個功能模模塊組成成:信息息源選擇擇與采集集子系統(tǒng)統(tǒng)、標引引子系統(tǒng)統(tǒng)、建庫庫子系統(tǒng)統(tǒng)、詞表表管理子子系統(tǒng)、用戶接接口子系系統(tǒng)、提提問處理理子系統(tǒng)統(tǒng)。(參參閱后圖圖)2、信息選選擇子系系統(tǒng):本本功能模模塊的任任務是:根據(jù)系系統(tǒng)的目目標和服服務對象象的需要要,確定定數(shù)據(jù)收收集范圍圍,并廣廣泛地、定期地地采集各各種信息息源,為為系統(tǒng)提提供充足足而適用用的數(shù)據(jù)據(jù)。3、標引子子系統(tǒng):標引,就是根根據(jù)系統(tǒng)統(tǒng)的規(guī)則則和程序序,對文文獻內容容進
36、行分分析,然然后賦予予每篇文文獻以一一定數(shù)量量的內容容標識(如分類類號、主主題詞、關鍵詞詞等),作為存存儲與檢檢索的依依據(jù)。標標引作業(yè)業(yè)通常與與文獻編編目和文文摘工作作一起進進行,然然后把標標引結果果和其他他描述事事項(如如著者、著者單單位、文文獻出處處等)填填入工作作單,由由錄入員員輸入到到計算機機中。4、建庫子子系統(tǒng):本模塊塊的功能能是建立立和維護護可直接接用于檢檢索的數(shù)數(shù)據(jù)庫,包括系系統(tǒng)所用用的各索索引文檔檔。其工工作流程程主要包包括數(shù)據(jù)據(jù)錄入、錯誤檢檢查與處處理、數(shù)數(shù)據(jù)格式式轉換、生成并并定期更更新各種種文檔。5、詞表表管理子子系統(tǒng):詞表管管理子系系統(tǒng)管理理維護系系統(tǒng)中已已有的詞詞表,
37、使使它與標標引、建建庫等子子系統(tǒng)相相連接,支持用用戶查詢詢操作,并從提提問、對對話或其其它文本本中采集集新的詞詞匯信息息,以及及輸出各各種形式式的詞匯匯數(shù)據(jù)或或詞表產產品。6、用戶接接口子系系統(tǒng):它它的全稱稱是“系統(tǒng)-用戶接接口”,簡稱稱用戶接接口,是是面向系系統(tǒng)用戶戶的人-機接口口程序。它承擔擔用戶與與系統(tǒng)之之間的交交流功能能,是信信息系統(tǒng)統(tǒng)中不可可缺少的的模塊。7、提問處處理子系系統(tǒng):提提問處理理子系統(tǒng)統(tǒng)專門負負責處理理用戶輸輸入的提提問式,將提問問式中的的檢索元元和算符符區(qū)分,并轉換換成系統(tǒng)統(tǒng)內部的的可接受受的命令令方式。在對提提問進行行轉換后后,與數(shù)數(shù)據(jù)庫中中存儲的的數(shù)據(jù)進進行比較較運
38、算,然后把把運算結結果輸出出給用戶戶。信息檢索索系統(tǒng)示示意圖三、信息息檢索語語言信息檢語語言是根根據(jù)信息息檢索需需要而創(chuàng)創(chuàng)制的人人工語言言,又稱稱信息語語言、檢檢索語言言、信息息存儲與與檢索語語言、文文獻語言言、索引引語言、標引語語言、標標引符號號、標識識系統(tǒng)等等。目前前世界上上有兩千千種左右右的信息息檢索語語言。如如:中中國圖書書館分類類法、漢語語主題詞詞表都都屬于信信息檢索索語言。 可分為為分類語語言和主主題語言言。信息檢索索包括信信息存儲儲和檢索索兩個方方面,信信息檢索索語言就就是溝通通這兩個個過程中中標引人人員和檢檢索人員員的工具具,在信信息檢索索過程中中起到了了極為重重要的作作用。分
39、類語言四、信息息檢索的的基本步步驟1、分析析檢索課課題,明明確檢索索目的、要求和和檢索的的范圍,這是制制定檢索索策略的的基礎和和前提。任何一一個檢索索都是根根據(jù)已知知去查找找未知,通過分分析檢索索課題,明確的的已知線線索越多多,查獲獲所需信信息的可可能性就就越大。明確檢索索目的即即要弄清清楚檢索索是為什什么而進進行的,通常檢檢索目的的可分為為3種:1.科科研攻關關型:是是要解決決研究或或生產中中的一些些技術難難題,如如某一理理論、方方法、設設備、過過程等的的具體問問題,這這類檢索索要求查查準率高高,只要要找到合合適的文文獻即可可。2.課題普普查型:是要針針對某一一課題收收集系統(tǒng)統(tǒng)詳盡的的資料,
40、這類檢檢索要求求查全率率高,往往往要檢檢索若干干年的文文獻,一一般采用用回溯檢檢索的方方式。33.研究究探索型型:是要要密切跟跟蹤、了了解國內內外某一一方面的的最新成成果,掌掌握最新新科研動動態(tài),這這類檢索索要求信信息的新新穎、及及時性強強,多采采用定題題檢索的的方式。明確檢索索要求與與范圍,主要應應搞清楚楚檢索課課題所涉涉及的學學科、專專業(yè)范圍圍,檢索索的主題題概念是是什么,能用哪哪些名詞詞術語表表達?所所需要的的信息類類型是文文獻、還還是具體體的數(shù)據(jù)據(jù)、事實實?對檢檢出文獻獻的類型型、語種種、出版版時間、地域范范圍等有有什么具具體要求求?是否否還有其其它的已已知線索索?如文文獻名稱稱、有關
41、關人名、機構名名稱、文文獻號碼碼(專利利號、標標準號、報告號號)等,將已知知線索一一一分析析出來。2、制定定檢索策策略檢索策略略(Innforrmattionn Reetriievaal SStraateggy)是是指為實實現(xiàn)檢索索目標而而制定的的全盤計計劃或方方案,是是對整個個檢索過過程的謀謀劃與指指導。具具體包括括:(1).確定查查找范圍圍:根據(jù)據(jù)第一步步對檢索索的時間間、地域域、語種種以及文文獻類型型等的分分析,確確定一個個合理的的檢索范范圍。(2).選擇檢檢索手段段:一般般來說利利用光盤盤檢索系系統(tǒng),結結合檢索索相應的的網(wǎng)絡數(shù)數(shù)據(jù)庫能能滿足多多數(shù)檢索索要求;沒有機機檢條件件時則選選用手
42、工工檢索。如果光光盤檢索索能滿足足要求,則不必必選用其其它檢索索手段。(3).選擇檢檢索系統(tǒng)統(tǒng):選擇擇合適的的檢索系系統(tǒng)主要要是選擇擇檢索工工具/數(shù)數(shù)據(jù)庫,要根據(jù)據(jù)檢索課課題的內內容范圍圍和要求求來決定定。要了了解檢索索工具/數(shù)據(jù)庫庫的學科科專業(yè)范范圍及各各種性能能參數(shù),其內容容主要包包括:1)檢索索工具/數(shù)據(jù)庫庫的類型型是否滿滿足檢索索需要。2)檢索索工具/數(shù)據(jù)庫庫的學科科專業(yè)范范圍是否否與檢索索課題的的學科專專業(yè)相吻吻合。3)檢索索工具/數(shù)據(jù)庫庫收錄的的文獻類類型、文文獻存貯貯年限、更新周周期是否否符合檢檢索需求求。4)檢索索工具/數(shù)據(jù)庫庫描述文文獻的質質量。包包括對原原文的表表達程度度、
43、標引引深度、專指度度如何等等,是否否按標準準化著錄錄。5)檢索索工具/數(shù)據(jù)庫庫提供的的檢索入入口是否否與檢索索課題的的已知線線索相對對應。6)檢索索費用。對于聯(lián)聯(lián)機檢索索,費用用包括機機時費、聯(lián)機(脫機)打印費費、通訊訊費、字字符費等等。而且且即使是是同一種種數(shù)據(jù)庫庫在不同同的檢索索系統(tǒng)中中,檢索索費用、文檔結結構,可可檢字段段、檢索索功能等等都不完完全相同同。選擇檢索索工具/數(shù)據(jù)庫庫時,可可以利用用檢索工工具指南南、聯(lián)機機數(shù)據(jù)庫庫目錄、光盤數(shù)數(shù)據(jù)庫目目錄、數(shù)數(shù)據(jù)庫指指南等。聯(lián)機檢檢索也可可以利用用系統(tǒng)提提供的數(shù)數(shù)據(jù)庫總總索引文文檔來選選擇檢索索文檔,如DIIALOOG系統(tǒng)統(tǒng)的4111文檔檔(
44、免費費索引文文檔)。(4).確定檢檢索途徑徑和檢索索詞:檢檢索途徑徑主要根根據(jù)分析析課題時時確定的的已知條條件,以以及所選選定的檢檢索工具具能夠提提供的檢檢索途徑徑來決定定。常用用的檢索索途徑有有著者、分類、主題、文獻題題名、文文獻號、代碼(如分子子式、產產品型號號)、引引文等,還有文文獻類型型、出版版時間、語種等等。每種種途徑都都必須根根據(jù)已知知的特定定信息進進行查找找。檢索詞也也稱檢索索點,與與檢索途途徑相對對應,是是檢索途途徑的具具體化。確定檢檢索詞就就是將檢檢索課題題中包含含的各個個要素及及檢索要要求轉換換成檢索索工具/數(shù)據(jù)庫庫中允許許使用的的檢索標標識。即即用所選選定的檢檢索工具具/
45、數(shù)據(jù)據(jù)庫的詞詞表(如如主題詞詞表、分分類表)把檢索索提問的的主題概概念表達達出來,形成主主題詞或或分類號號等,也也可以是是關鍵詞詞(視檢檢索系統(tǒng)統(tǒng)而定)、人物物姓名、地名、文獻名名等。(5).構造檢檢索式:檢索式式是機檢檢中用來來表達檢檢索提問問的一種種邏輯運運算式,又稱檢檢索表達達式或檢檢索提問問式。它它由檢索索詞和檢檢索系統(tǒng)統(tǒng)允許使使用的各各種運算算符組合合而成,是檢索索策略的的具體體體現(xiàn)。構造檢索索式就是是把已經經確定的的檢索詞詞和分析析檢索課課題時確確定的檢檢索要求求用檢索索系統(tǒng)所所支持的的各種運運算符聯(lián)聯(lián)接起來來,形成成檢索式式。3、試驗驗性檢索索在檢索系系統(tǒng)中將將檢索標標識與系系統(tǒng)
46、中存存貯的文文獻標識識進行匹匹配,查查出相關關文獻,并對所所獲結果果進行分分析,看看其是否否符合需需要。如如果試查查結果滿滿意,可可進行正正式檢索索;否則則,要分分析原因因,修改改、調整整檢索策策略。調調整檢索索策略包包括修改改檢索式式、調整整檢索詞詞,重新新選擇檢檢索系統(tǒng)統(tǒng)等。(1).縮檢:當檢出出的記錄錄數(shù)量太太多時,應采用用縮檢技技術排除除不符合合需要或或相關性性較小的的記錄??梢哉{調整檢索索式將檢檢索限定定在篇名名和敘詞詞字段,利用文文獻的外外表特征征進行限限制檢索索,增加加用邏輯輯“與”、“非”運算,采用位位置算符符,改用用確切的的詞組,并指定定詞之間間的位置置關系,增加新新的限定定
47、詞,選選擇更專專指的檢檢索詞等等。(2).擴檢:當檢出出的記錄錄數(shù)量太太少時,則要采采用擴檢檢技術擴擴大檢索索范圍??梢詫z索的的字段改改為文摘摘、全文文字段等等,減少少或取消消限制條條件,提提高檢索索詞的泛泛指度,結合使使用關鍵鍵詞和敘敘詞,增增加同義義詞和其其它相關關詞并將將其與原原來的檢檢索詞用用邏輯“或”算符組組配,改改用較泛泛指的檢檢索詞,減少邏邏輯“與”、“非”運算,采用截截詞檢索索等。若采用適適當?shù)臄U擴檢技術術,檢索索結果仍仍不能令令人滿意意,則考考慮更換換檢索文文檔,即即重新選選擇檢索索工具或或數(shù)據(jù)庫庫。在實現(xiàn)上上述調整整中,一一是從學學科專業(yè)業(yè)知識出出發(fā),選選擇泛指指詞、專
48、專指詞及及相關詞詞,并確確定組配配邏輯;另一是是利用計計算機檢檢索系統(tǒng)統(tǒng)的功能能,從文文獻的類類型、年年代、文文種等外外表特征征入手對對命中文文獻集合合進行調調整與控控制,直直到獲得得較滿意意的檢索索結果。4、 正正式檢索索試檢獲得得成功,就可以以進行正正式檢索索。在檢檢索中,應靈活活運用各各種檢索索方法和和檢索途途徑,充充分利用用各種累累積索引引,并對對各種參參照款目目進行認認真審核核與利用用。為確保檢檢索結果果的完整整性,還還應利用用其它文文獻信息息源進行行查找,如瀏覽覽最新的的核心刊刊物來補補充檢索索工具或或數(shù)據(jù)庫庫中尚未未報道的的最新文文獻。5、 索索取原文文由于書目目檢索結結果得到到
49、的只是是文獻線線索,檢檢索結束束后,還還要根據(jù)據(jù)所獲得得的文獻獻線索,索取原原文。在在索取原原文過程程中,要要注意以以下問題題:(1).識別文文獻類型型:不同同類型的的文獻收收藏地點點不同,在索取取原文時時首先就就要區(qū)別別文獻的的類型。不同類類型的文文獻,其其外表特特征不同同,據(jù)此此可以區(qū)區(qū)別不同同類型的的文獻(參見11.2.3節(jié)相相關部分分)。(2).將縮寫寫刊名恢恢復全稱稱:檢索索工具中中在文獻獻來源項項的著錄錄中,常常常將期期刊名稱稱按一定定的縮寫寫規(guī)則進進行縮寫寫。例如如把 JJourrnall off Maatheematticss Phhysiics縮縮寫成 J. Matth. P
50、hyys.,把 JJourrnall off Innstiitutte oof MMetaals 縮寫成成J.IInstt.Meet. 把 JJourrnall off thhe AAeroo/Sppacee Scciennce 縮寫成成 J.A.SS.S.因此索索取原文文時,首首先要將將刊名的的縮寫恢恢復成全全稱,然然后才能能根據(jù)刊刊名全稱稱及年、卷、期期借閱原原文??s縮寫刊名名還原方方法主要要有:1)利用用檢索工工具所附附的來源源期刊表表。大多多數(shù)檢索索工具一一般都在在附錄部部分提供供摘引刊刊物一覽覽表,利利用它不不但可以以查找刊刊物的全全稱,還還可以了了解文獻獻的來源源情況。2)根據(jù)據(jù)刊
51、名縮縮寫規(guī)則則或利用用有關的的工具書書查找。國際標標準化組組織19972年年頒發(fā)了了國際際期刊名名稱縮寫寫規(guī)則ISSO-44-19972(E)對期刊刊名稱的的縮寫作作了統(tǒng)一一規(guī)定。遇到不不易確定定的刊名名縮寫時時,可以以查找國際期期刊名稱稱縮寫詞詞表ISOO-8333-119744(E)或者者利用中中國圖書書進出口口總公司司編輯的的外國國報刊目目錄、美國GGalee公司出出版的Perrioddicaal TTitlle AAbbrreviiatiionss、Ulrrichhs Intternnatiionaal PPeriiodiicalls DDireectoory等。(3).識別不不同語系
52、系文字的的音譯:在西文文檢索工工具中,俄文、中文、日文等等的文獻獻作者、出版物物名稱通通常采用用音譯法法轉換成成英文進進行著錄錄。故索索取原文文前,要要將這些些音譯的的人名、出版物物名稱還還原成原原來的語語種。1)中文文的出版版物名稱稱和著者者姓名:現(xiàn)在常常用漢語語拼音直直接著錄錄,也有有個別采采用威妥妥瑪氏拼拼音著錄錄的。威威妥瑪氏氏拼音法法(Waade sysstemm)曾廣廣泛流行行。它與與漢語拼拼音的差差別較大大,如果果遇到采采用威妥妥瑪氏拼拼音時,要首先先利用威妥瑪瑪拼音與與漢語拼拼音音節(jié)節(jié)對照表表將其其轉換成成漢語拼拼音,再再拼出漢漢字。例例如:Taiiwann muu tssai
53、i kuungyyeh轉換成成漢語拼拼音為Taiiwann muu caai ggongg yee,即即臺灣灣木材工工業(yè)。2)俄文文、日文文出版物物名稱和和著者姓姓名:分分別采用用俄文文字母拉丁字字母音譯譯對照表表和黑本式式拉丁字字母日日文字母母音譯對對照表進行音音譯著錄錄,可以以分別利利用這兩兩種表進進行還原原。(4).利用各各種收藏藏目錄:在索取取原始文文獻過程程中,要要根據(jù)不不同類型型的文獻獻查找不不同的聯(lián)聯(lián)合目錄錄、館藏藏目錄、聯(lián)機公公共目錄錄等,查查知其原原文的收收藏單位位,再進進行借閱閱。例如如要借英英文圖書書,可利利用西文文圖書聯(lián)聯(lián)合目錄錄;要借借中文期期刊,可可利用中中文期刊刊
54、館藏目目錄;要要借閱英英文期刊刊,可利利用西文文期刊聯(lián)聯(lián)合目錄錄、館藏藏目錄等等,查出出所需文文獻的入入藏單位位及其索索取號,便可以以借閱或或復制原原文。(5).利用文文獻傳遞遞服務,獲取遠遠程文章章。許多多大型檢檢索系統(tǒng)統(tǒng)提供文文獻傳遞遞服務,可以根根據(jù)檢索索結果,在線提提出索取取全文的的申請,通過EE-maail、傳真等等方式獲獲得原文文。五、檢索索技術1、布爾爾檢索:利用布布爾邏輯輯算符進進行檢索索詞語或或代碼的的邏輯組組配,是是現(xiàn)代檢檢索系統(tǒng)統(tǒng)中最常常使用的的一種方方法。(1)布布爾邏輯輯算符常用的布布爾邏輯輯算符有有三種,分別是是邏輯或或OR,邏輯與與ANDD,邏輯輯非NOOT。下下
55、面分別別簡釋它它們各自自的含義義與用法法。1)邏輯輯或“OR”邏輯或(A OOR BB)檢索索出凡含含有檢索索詞A或或者含有有檢索詞詞B或者者同時含含有檢索索詞A和和B的信信息資源源。 對于提問問式“A OOR BB”,假設設檢索詞詞A的所所有命中中信息有有M條,檢索詞詞B的所所有命中中信息有有N條,提問式式的所有有命中信信息有 Q條,則:當A和BB有一定定相關性性時,QQM+N;當A和BB密切相相關時,Q=mmax(M,NN);當A和NN不相關關時,QQ=M+N;因此,一一般說來來有M+NQmaxx(M,N)。這表明明,邏輯輯或“OR”可以擴擴大信息息的檢索索范圍,使用它它相當于于增加檢檢索
56、詞主主題的同同義詞與與近義詞詞,能提提高檢索索的查全全率。2)邏輯輯與“ANDD”邏輯與(A AAND B)檢檢索出同同時含有有檢索詞詞A和檢檢索詞BB的信息息資源。如果A和和B無關關,則沒沒有命中中文獻,Q=00;如果A和和B有一一定相關關性,則則有MQ00,或NNQ0;若A 和和B密切切相關,則有QQ=miin(MM,N);因此,一一般說來來有miin(MM,N)Q0。這這表明,邏輯與與“ANDD”可以縮縮小信息息的檢索索范圍,提高檢檢索的查查準率。 3)邏輯輯非“NOTT”邏輯非(A OOR BB)檢索索出含有有檢索詞詞A而不不含有檢檢索詞BB的信息息資源。如果A與與B無關關,則QQ=M
57、;如果A與與B有一一定相關關性,則則QMM;如果A與與B 密密切相關關,則當當MNN時,QQ=M-N,當當MNN時,QQ=0;因此,邏邏輯非“NOTT”可以用用來0排排除不希希望出現(xiàn)現(xiàn)的檢索索詞,它它與邏輯輯與“ANDD”的作用用類似,能夠縮縮小命中中信息的的范圍,提高檢檢索的查查準率。(2)注注意事項項1)有的的檢索工工具以符符號形象象地表達達布爾檢檢索的功功能,如如“+”表示邏邏輯與,“-”表示邏邏輯非。有的檢檢索工具具直接把把布爾邏邏輯隱含含在菜單單中,例例如,LLycoos以“mattch alll teermss”表示邏邏輯與,以“mattch anyy teerm”表示邏邏輯或。絕
58、大多多數(shù)檢索索工具的的高級檢檢索完全全用表格格和文字字來表達達布爾關關系,如如,Exxcitte以“必須包包括(MMUSTT coontaain)”表示邏邏輯與,用“一定不不含”(MUUST NOTT coontaain)表示邏邏輯非。有的檢索索工具部部分支持持布爾關關系,如如Yahhoo!尚不支支持邏輯輯非。2)用布布爾邏輯輯表達檢檢索要求求,除要要掌握檢檢索課題題的相關關因素外外,還應應在布爾爾算符對對檢索結結果的影影響方面面引起注注意。布布爾算符符使用正正確但卻卻不能達達到應有有檢索效效果的例例子很多多。下面面討論一一些常見見的問題題。ORR邏輯有些檢索索詞表達達的概念念,存在在整體與與
59、部分的的關系。在檢索索中,這這類關系系如果處處理不好好,就不不能得到到滿意的的檢索效效果。對對此,一一般原則則是,如如果檢索索詞涉及及到表達達整體的的概念,就要針針對具體體情況分分別列出出每一個個表達部部分概念念的檢索索詞,否否則將出出現(xiàn)漏檢檢。例如:檢檢索關于于歐洲能能源問題題的文獻獻檢索邏輯輯式可表表達為:EURROPEE ANND EENERRGY如果用這這個提問問式去檢檢索,顯顯然會出出現(xiàn)相關關文獻大大量漏檢檢。因為為,在地地理上,當我們們提到歐歐洲時,它包括括有英國國、法國國、意大大利、西西班牙等等具體國國家,然然而在檢檢索式中中,“歐洲”作為一一個檢索索詞,只只代表它它本身,無法代
60、代表英國國、法國國、意大大利、西西班牙等等。因此此,如果果要查全全該課題題的相關關文獻,檢索式式應改為為:(EURROPEE ORR BRRITAAIN OR FRAANCEE ORR ITTALYY ORR SPPAINN ORR )ANND(EENERRGY OR COAAL OOR PPETRROLEEUM OR)NOOT邏輯輯在檢索邏邏輯中使使用NOOT,能能排除含含有由NNOT指指定的檢檢索詞的的文獻,協(xié)助檢檢索出更更準確的的文獻。但是,使用NNOT必必須慎重重。因為為, 如如果兩個個關系緊緊密的檢檢索詞同同在一個個檢索邏邏輯中,對其中中一個使使用NOOT邏輯輯會導致致含另一一個詞的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球晶圓檢測用物鏡行業(yè)調研及趨勢分析報告
- 2025年全球及中國鉆頭修磨機行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025-2030全球醫(yī)療器械用注塑機行業(yè)調研及趨勢分析報告
- 主講人鄭長花
- 第06講 我們生活的大洲-亞洲(解析版)
- 2025原料采購合同的模板
- 2025個人保證擔保借款合同
- 門面房房屋租賃合同范本
- 工地配餐合同協(xié)議書范本
- it運維外包服務合同
- 畢業(yè)設計(論文)-液體藥品灌裝機的設計與制造
- 二年級下冊數(shù)學教案 -《數(shù)一數(shù)(二)》 北師大版
- 稅收流失論文-我國個人所得稅稅收流失問題及對策研究
- 長榮股份:投資性房地產公允價值評估報告
- 2022年菏澤醫(yī)學??茖W校單招綜合素質試題及答案解析
- 銀行內部舉報管理規(guī)定
- 平面幾何強化訓練題集:初中分冊數(shù)學練習題
- 項目獎金分配獎勵制度和方案完整版
- 支氣管鏡試題
- 陰道鏡幻燈課件
- 現(xiàn)代漢語詞匯學精選課件
評論
0/150
提交評論