下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、計算機檢索的步驟和方法一、明確檢索要求和檢索目標計算機檢索的第一步準備工作是明確檢索要求和檢索目標。明確檢索要求就是要搞淸楚本課題屬于什么學(xué)科,所需文獻的類型及語種,査找文獻的年代, 所需文獻的最佳篇數(shù),允許支配的檢索費用。這些要求對選擇數(shù)據(jù)庫、構(gòu)造檢索策路都是十 分重要的。確泄檢索目標也是進行訃算機信息檢索前應(yīng)搞淸楚的準備工作。例如:如果屬于開題訓(xùn)研, 則應(yīng)盡可能地檢索岀與之相關(guān)的全部文獻,即要求較高的查全率:以便充分地做好開題的準 備工作;如果屬于探索性、開創(chuàng)性的課題,則只需要査岀一些啟發(fā)性的文獻,對查準率和查 全率要求都不一定有很高的要求。二、課題分析1. 課題概念的分析方法分析課題就是
2、分析出課題所涉及的主要概念,并找出能代表這些概念的若干個詞或詞組,進 而分析概念之間的上、下、左、右關(guān)系。對于新學(xué)科、交叉學(xué)科和邊緣學(xué)科的課題,則要搞 清楚這些概念之間的關(guān)系。槪念分析的結(jié)果應(yīng)以槪念組為單元的詞或詞組的形式列岀,以便 下一步制訂檢索策略時使用。2. 隱含概念的分析方法有些課題的實質(zhì)性內(nèi)容往往很難從課題的名稱上反映出來,課題所隱含的概念和相關(guān)的內(nèi)容 需要從課題所屬的專業(yè)角度作深入分析,才能提煉出能夠確切反映課題內(nèi)容的檢索概念。例 如:社會保障包含養(yǎng)老保險、失業(yè)保險、醫(yī)療保險和社會救濟等槪念,如果要檢 索社會保障方而的文獻,應(yīng)該析出上述概念,才能保證文獻的查全率。3. 核心概念的選
3、取有些檢索詞中已經(jīng)含有的某些概念,在槪念分析中應(yīng)予以排除。例如:課題公司勞動獎勵、 職工培訓(xùn)和養(yǎng)老保險制度管理的理論和實踐,如果把勞動獎勵,職工培訓(xùn),養(yǎng)老保險 ,”公司,制度,管理六個概念全部組配起來,則會造成大量文獻漏檢。實際上,勞 動力資源管理已經(jīng)包含了勞動獎勵、職工培訓(xùn)和養(yǎng)老保險三個方而,而且,勞動力管理必然 是針對該三個方而而言的。因此,本課題只須采用勞動力資源和管理這兩個本質(zhì)概念即 可。3 if*U; Bt初科技滋啊剛悄息中心6捋制先論5;呵 廣期 中PI科學(xué)Et爲統(tǒng)斛學(xué)酬劉ft等7 ir ItHWIJvIqIiir rf* JtSC TMil wfl rf? 5p I K III
4、I lU I C/1| If* u fc * i I tt It 4 Itl 0 KiVJc I y Jr *w * I 2了令 |* w I * I.9段式識屯仃人gg為了提髙文獻的査準率,應(yīng)該從相應(yīng)的規(guī)范詞表中選擇所需的檢索詞。并且在確左檢索詞時, 除了要考慮反映主題概念的同義詞、近義詞等相關(guān)的檢索詞外,還要注意選擇被選用檢索詞 的縮寫詞和不同拼法的詞,以避免漏檢有關(guān)的文獻。三、檢索詞的擴展、選擇和處理目前的計算機信息檢索系統(tǒng),還不具備智能思考的能力,還不會對所輸入的檢索詞以及涉及 的所有詞進行自動、全面的檢索,因此,必須在槪念分析的基礎(chǔ)上列岀與概念有關(guān)的詞,從 中做岀選擇,并利用截詞等方
5、法對檢索詞予以歸并。1. 相同概念的檢索詞的擴展擴展相同概念的檢索詞的方法一般有同義詞方法、主題詞表方法和截詞方法(1) 同義詞方法。在同一概念的范疇內(nèi),從語言角度,選擇不同的名稱、不同的拼寫方 法和單復(fù)數(shù)形式。不同的名稱包括學(xué)劃和俗名、簡稱和全稱,商品名和物質(zhì)或產(chǎn)品名,事物 的代碼和事物的學(xué)名。不同的拼寫方法,以英語為例,包括英式英語和美式英語的區(qū)別。(2) 截詞方法。當某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(多數(shù)英語 單詞的單復(fù)數(shù)變化和英美不同拼寫形式),可以采用截詞方法擴展檢索詞。這種方法要求在 詞干后使用截詞符。截詞符一般包括?和*兩種。具體采用什么形式,各個系統(tǒng)都有明確
6、 的規(guī)定。例如:在DIALOG系統(tǒng)中,截詞符號有無限截詞算符(?)和有限截詞(?和 ”?? ?)等多種,?有時還用做字符屏蔽符。(3) 主題詞表方法。許多數(shù)拯庫都編有自己的主題詞表。在數(shù)據(jù)庫編有主題詞表的情況 下,應(yīng)該盡量從詞表中選擇檢索詞。使用主題詞表,不僅可以使檢索詞更加規(guī)范,提高檢索 結(jié)果的準確性,而且可以從同族詞中選取更多的上位詞、下位詞、相關(guān)詞,使獲得的檢索結(jié) 果更為理想。2. 檢索詞的選擇和處理運用上述方法得到的詞,首先應(yīng)加以選擇,并且注意選用本專業(yè)通用的術(shù)語(應(yīng)避免使用冷 僻詞和根據(jù)中文術(shù)語自譯生造的詞),然后以概念為單位,構(gòu)成組面(facets) o例如:課題 東西方社會保障制
7、度比較研究的槪念組面和檢索詞為:概念組而1:社會保障social security概念組面2:制度研究system? Research四、數(shù)據(jù)庫的選擇不同數(shù)據(jù)庫的學(xué)科范圍不同,檢索指令不同,收費的標準也不同。所以,在檢索之前應(yīng)該閱 讀有關(guān)數(shù)拯庫的使用介紹.以便選擇數(shù)拯庫時做到心中有數(shù)。選擇數(shù)據(jù)庫,我們一般應(yīng)該遵循以下幾條原則:1. 按照課題的檢索要求和目的,選擇收錄文獻種類多、專業(yè)覆蓋面寬、年代跨度對口的數(shù) 據(jù)庫;2. 肖需要查找最新文獻信息時,選擇數(shù)據(jù)更新周期短的數(shù)據(jù)庫;3. 當還需要獲取原文時,選取原文獲取較容易的數(shù)據(jù)庫;4. 在同時有多個數(shù)據(jù)庫可供選擇的情況下,應(yīng)首先選擇比較熟悉的數(shù)拯庫
8、。5. 當幾個數(shù)據(jù)庫的內(nèi)容交*重復(fù)率比較髙時,應(yīng)選擇檢索費用比較低的數(shù)據(jù)庫。五、檢索策略構(gòu)成和調(diào)整方法在實際檢索過程中,僅需一個檢索詞就能滿足檢索要求的情況并不很多。通常我們需要 使用多個檢索詞構(gòu)成檢索策略,以滿足由多槪念組配而成的較為復(fù)雜課題的要求。檢索策略,又稱提問邏輯,就是對多個檢索詞之間的相互關(guān)系和檢索順序作出的某種安排。 構(gòu)造檢索策略就是運用訃算機情報檢索系統(tǒng)可以接受的方法,包括布爾邏輯算符、位這邏輯 算符等方法,表達課題檢索要求的過程。1. 布爾邏輯算符規(guī)泄檢索詞之間的邏輯關(guān)系的算符,稱為布爾邏借算符。布爾邏輯算符包括邏輯或(OR)、 與(AND)和非(NOT)。(1) 或(OR)
9、運算符。也可用代替,是用來組配具有同義或同族槪念的詞,如同義詞、相 關(guān)詞等。其含義是,檢出的記錄中,至少含有兩個檢索詞中的一個。OR算符的基本作用是 擴大檢索范用,增加命中文獻量,提髙檢索結(jié)果的查全率,OR運算符還有一個去重的功能。 在實際檢索中,同一組而中含義相同的詞,相互之間都使用OR運算符。另外,在使用截詞 方法檢索具有相同詞干的檢索詞時,這些詞之間也自動地隱含了邏輯或的關(guān)系。(2) 與(AND)運算符。也可用*代替,用來組配不同檢索概念。其含義是檢出的記錄必須同 時含有所有的檢索詞。AND算符的基本作用是縮小檢索范國,減少命中文獻量,提高檢索結(jié) 果的查準率。在實際檢索中,不同概念組面之
10、間以及同一組而內(nèi)的不同含義的詞之間通常使 用AND算符。(3) 非(NOT)運算符。也可用-代替,但在檢索時建議使用NOT,以避免與詞間的分隔 符混淆,NOT算符是排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的il靠機核心報卩1存“紹:2001核心. iU滋分仃尤找電、兇;乳兮)Fl動化、鈴分1北亂中ia計篦帆學(xué)會等27W北用中IH科學(xué)就牧”研丸曲3 it*M研宛與發(fā)JW .It*中儀樣學(xué)瀧什律鐵術(shù)研Jt所零4 Fl勸化學(xué)璋北京中PI科學(xué)就尊3計尊也料學(xué)FU;女科技:比嘰Ji佇0中心6悴制理論馬n:.T|廣期中國科學(xué)就編統(tǒng)科辛駢兄佈等7計界機輛助設(shè)計打器形學(xué)學(xué)炭北中PHI算機會駕
11、8 iiwm i.it訊華北訃那技術(shù)呵宛原檢索詞,但不能同時含有其后的詞。NOT算符的基本作用是縮小檢索范用,提髙檢索結(jié)果的査準率.對于一個復(fù)雜的邏輯檢索式,檢索系統(tǒng)的處理是從左向右進行的。在有括號的情況下, 先執(zhí)行括號內(nèi)的運算:有多層括號時,先執(zhí)行最內(nèi)層括號中的運算,逐層向外進行。在沒有 括號的情況下,And、Or、Not的運算次序,在不同的系統(tǒng)中有不同的規(guī)左。2. 位置算符位垃算符又稱鄰接算符(adjacent operators),適用于兩個檢索詞以指左間隔距離或者指左 的順序?qū)绗F(xiàn)的場合,比如,以詞組形式表達的概念:彼此相鄰的兩個或兩個以上的詞:被禁 用詞或特殊符號分隔的詞等。位置算符是
12、調(diào)整檢索策略的一種重要手段。按照兩個檢索詞岀 現(xiàn)的順序和距離,可以有多種位置算符,而且對同一種位巻算符,檢索系統(tǒng)不同,規(guī)龍的位 置算符也不同。例如,Compendex光盤數(shù)據(jù)庫使用的位宜算符(N)(表示其兩側(cè)的檢索詞 必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序可以顛倒)、 (F)(表示其兩側(cè)的檢索詞必須在同一字段(例如同在題目字段或文摘字段)中出現(xiàn),兩詞 的詞序可以顛倒)、氣S)(表示其兩側(cè)的檢索詞必須在同一句子中岀現(xiàn),兩詞的詞序可以顛 倒)和(W)(表示其兩側(cè)的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它 詞或字母,兩詞的詞序不可以顛倒)四種(如下所列)。
13、(1)(nW)算符:表示兩個檢索詞(關(guān)鍵詞.主題詞)中間可以插入“十 個詞,但他們之 間的順序不能顛倒,但允許有一空格或標點符號。(2)(nN)算符:表示兩個檢索詞(關(guān)鍵詞、主題詞)中間可以插入“n”個詞,且詞序可 以顛倒。(3)(F)算符:表示兩個檢索詞(關(guān)鍵詞、主題詞)必須出現(xiàn)在同一個字段內(nèi),但兩詞的 詞序和中間插入的詞數(shù)不限。(4)(S)算符:表示兩個檢索詞(關(guān)鍵詞、主題詞)必須出現(xiàn)在同一個子字段內(nèi).但兩詞 的詞序和中間插入的詞數(shù)不限 注意:在不同的數(shù)據(jù)庫中,位置算符檢索功能及算符不同,應(yīng)參看數(shù)據(jù)庫的使用說明。3字段限制字段限制也是調(diào)整檢索策略的一種重要的手段。它是限立檢索詞必須在數(shù)據(jù)庫
14、記錄中規(guī)怎的 字段范用內(nèi)出現(xiàn)的文獻,方為命中文獻的一種檢索方法。如果想指泄在題爼等字段中査找所 希望的檢索詞,就需要使用字段限制。字段限制適用于在已有一左數(shù)量輸岀記錄的基礎(chǔ)上, 通過指定字段的方法,減少輸岀篇數(shù),提髙檢索結(jié)果的查準率的場合。由于字段限制采用前 綴和后綴的形式,因此又稱為前綴限制和后綴限制。例如Compendex光盤數(shù)據(jù)庫基本字段限 i|算機錢心期刊斯柴和部分檢心樹,名牟門力ft. i初札郁分勇尤找電電佇At兮)自勸化、il l!機卸分X計算機學(xué)擢北京中國itWM學(xué)金等2軟件?報it6(中IH科學(xué)紀軟件駢允祈3計算機硏宛與跋JK北寂中M科孚浣計尊技術(shù)研寛所零4自功化學(xué)眾北京中國!
15、學(xué)齡尊3 if WHH7 譏國安科技曲如im.E中心6拎的理論與應(yīng)用廣#H中國科學(xué)阮條統(tǒng)料學(xué)W%ffii7 i| VZUMlWj設(shè)計崎啊診學(xué)學(xué)JH北$中Plil算機學(xué)會駕8 il Wl UVI;;HJ北京 華北il穌技術(shù)研允魔制的用法是在需要指立字段的檢索詞后加上后綴運算符/和段碼。這個數(shù)據(jù)庫輔助字段限 制的用法是在需要指左字段的檢索詞(有時檢索詞須放在雙引號內(nèi))之前加上段碼和前綴運 算符上。常用的字段代碼有標題(TI)、文摘(AB)、敘詞(DE)、識別詞或自由詞(ID)、作者(AU)、 語種(LA)、刊需(JN)、文獻類型(DT)、年代(PY)等。這些限制符在不同的數(shù)據(jù)庫系統(tǒng) 有不同的表達形
16、式和使用規(guī)則。4. 截詞符檢索(Truncation、Wildcard Symbols)利用檢索詞(關(guān)鍵詞、主題詞)的詞丁或不完整詞形進行查找的過程為截詞檢索。它可以起 到擴大檢索范用,提高査全率,減少檢索詞(關(guān)鍵詞、主題詞)(關(guān)鍵詞、主題詞)的輸入 量,節(jié)省檢索時間。尤其在英文檢索系統(tǒng)中檢索時,若遇到需詞的單復(fù)數(shù)形式,詞的不同拼 寫法,詞的后綴變化時,均可采用此方法。截詞的方式有多種,可以分為有限截詞、無限截 詞和中間截詞。(1)有限截詞:有限后截詞主要用于詞的單、復(fù)數(shù),動詞的詞尾變化等。將“n”個截詞符 放在檢索詞(關(guān)鍵詞、主題詞)的詞干或詞尾可能變化的位置上。(2)中間截詞:一般來說,中
17、間截詞僅允許有限截詞,主要用于英、美拼寫不同的詞和單 復(fù)數(shù)拼寫不同的詞。例如:wom?n woman women(3)無限截詞:截去某個詞的尾部,是詞的前方一致比較,也稱前方一致檢索。在檢索詞(關(guān)鍵詞、主題詞)干后加1個截詞符? ”或“*”。表示該詞尾允許變化的字符數(shù)不受任何限制。例如:comput* 可檢索出 computerx computing、computersx computering、 computeriation等詞的記錄。任何一種截詞檢索,都隱含著布爾邏輯檢索的或”運算。采用截詞檢索時,既要靈活、又 要謹慎,截詞的部位要適當,如果截得太短(輸入的字符不得少于3個),將影響查準率
18、。另 外,不同的檢索系統(tǒng)使用的截詞符不同、各數(shù)據(jù)庫所支持的截斷類型也不同。不一泄能滿足課題檢索的要求,例如:或者檢出的篇數(shù)過多,而且不相關(guān)文獻所占比例很大, 或者檢岀的文獻數(shù)量太少,有時甚至為零,這時就需要調(diào)整檢索策略。調(diào)整檢索策略之前,首先要分析造成檢索結(jié)果不理想的原因。對于輸出篇數(shù)過多的情況, 應(yīng)分析是否是由下述原因造成的:選用了多義性的檢索詞;截詞截得過短;輸入的 檢索詞太少;應(yīng)該使用與(AND)的使用了或(OR);優(yōu)先運算符”0使用錯謀。對于 輸出篇數(shù)過少的情況,應(yīng)分析是否是由下述原因造成的:檢索詞拼寫錯誤;遺漏重要 的同義詞或隱含概念;檢索詞過于冷僻具體;沒有使用截詞算符;位置算符和
19、字段 算符使用的過多;使用過多的與(AND)算符。Fl動化、il耳機卸分1計算機學(xué)聊北亂中國計24tJ;t帀個科牛疏牧件硏允曲3計暮機研宛與發(fā)腋北寂中國科學(xué)浣計尊技術(shù)編尢所第4門勸化學(xué)菲北京中山科學(xué)畝尊3 if K;H7 OK IU .科拉MiMN依.Q沖心6捋制理論仃曲用 廣州 中皿糾學(xué)BCfWt料*?W%Wt57 i| WUlMlWj設(shè)計崎酣彩學(xué)學(xué)fll北*中卩“打機學(xué)會駕8 il BHl UVHJ北亂華4til貳技術(shù)研加W9懊式倶解與人I:雹能-針對上述原因,如果是屬于需要擴大檢索范用,提髙文獻査全率,調(diào)整檢索策略的方法 有:減少與(AND)算符,增加同義詞或同族相關(guān)詞使用邏輯或(OR)
20、將它們連接起來; 在詞干相同的單詞后使用截詞符(?):去除已有的字段限制、位置算符限制(或者改用限 制程度較小的位置算符)。如果是屬于縮小檢索范弗I,提高文獻查準率的,調(diào)整檢索策略的方法有:減少同義詞 或同族相關(guān)詞;增加限制概念,用邏輯與(AND)將它們連接起來;使用字段限制,或者 限定檢索詞在指定的基本字段,或者指定的輔助字段出現(xiàn),限制檢索結(jié)果的文獻類型、語 種、出版國家;使用適當?shù)奈恢盟惴皇褂梅?NOT)算符,排除無關(guān)概念。六、輸出格式和方式的選擇所謂輸出格式的選擇是對記錄字段的選擇。所謂輸出方式的選擇是指對屏幕顯示、打印和存 盤的選擇。一般情況下,如果輸出的是中間結(jié)果,屬于基本字段的題目仃I)、文摘(AB)、 敘詞(DE)和識別詞(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 濕地修復(fù)工程監(jiān)測與數(shù)據(jù)分析2025版合同2篇
- 二零二五版物流倉儲設(shè)施建設(shè)與運營合同2篇
- 二零二五年度節(jié)能工廠租賃合同編制要則3篇
- 二零二五版旅游度假區(qū)基礎(chǔ)設(shè)施建設(shè)項目包工合同范本2篇
- 二零二五年度飛機銷售合同附帶飛行員培訓(xùn)及考核協(xié)議3篇
- 二零二五年度公寓裝修及設(shè)施配套合同3篇
- 二零二五版出口貨物安全檢驗合同規(guī)定與流程3篇
- 二零二五年度汽車租賃合同解除與終止范本匯編3篇
- 二零二五版汽車維修擔保書之擔保函與擔保合同3篇
- 二零二五版別墅窗簾設(shè)計、安裝及智能家居集成合同3篇
- 第三十六屆全國電力行業(yè)風(fēng)力發(fā)電運行檢修職業(yè)技能競賽基礎(chǔ)理論題庫附有答案
- 2024年紀檢監(jiān)察綜合業(yè)務(wù)知識題庫含答案(研優(yōu)卷)
- 科室醫(yī)療質(zhì)量與安全管理小組工作制度
- 中華民族共同體概論課件第五講大一統(tǒng)與中華民族共同體初步形成(秦漢時期)
- 初二生地會考試卷及答案-文檔
- 私營企業(yè)廉潔培訓(xùn)課件
- 施工單位值班人員安全交底和要求
- 中國保險用戶需求趨勢洞察報告
- 數(shù)字化轉(zhuǎn)型指南 星展銀行如何成為“全球最佳銀行”
- 中餐烹飪技法大全
- 靈芝孢子油減毒作用課件
評論
0/150
提交評論