




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章計算機信息檢索的基本技術與方法第四章1計算機信息檢索的基本技術:布爾邏輯、截詞檢索、加權檢索,位置算符等在進行計算機檢索時,有時有一些比較復雜的課題,如:“GPS在建筑中的應用”,既涉及GPS,又涉及建筑,還有“應用”,這時候就要編制出滿足要求的計算機檢索式,它是機檢的基礎。1布爾邏輯檢索(BooleanLogicRetrieva)邏輯檢索的基礎是邏輯運算,邏輯運算中最常用的是布爾邏輯運算符(BooleanLogicOperators),即與或、非三種運算符號,用它們可以表示概念之間的邏輯關系。計算機信息檢索的基本技術:2檢索要邏輯檢課題表達式檢索結求索果概念相AND與讓算機用于制圖AANDB縮小檢交、限ABA*B索范圍定提高查準率概念平OR土地管理與土地利用AORB擴大檢行、并或+ABA+B索范圍提高查全率某一主題去NOT非除光電測以外的BNOTA提高查掉一部分相電磁波測距B-A準率關主題B檢索要邏輯檢32位置算符(ProximityOperators)位置算符是表示檢索詞之間位置關系的一種運算符。由于英文對一句話有多種表達方法,寫法可能不同。如:“GPS在鐵路橋研究中的應用”這個課題,用英文表達可能是“UsingofGPsinRailwaybridge”,也可能是“UsingofGPsinBridgeofRailway”,因而可能編制出這樣的檢索It,GPSAND(Railway(2N)Bridge)我們可以通過位置檢索提高檢索的準確率2位置算符(ProximityOperators)4(1)(W)算符與(nW)算符W是word與with的縮寫。特點:W詞序不變,中間不可插詞,但兩詞間可有個標點,連字符或空格。nW詞序不變,中間可插入N個詞。如:potential(w)energy可能檢出potentialenergyandfunction又如:gone(2w)wind可能檢出gonewiththewind(2)(N)與nN)算符N是near的縮寫特點:N詞序不限,中間不可插詞,但兩詞間可有一個標點,連字符或空格。nN詞序不限,中間可插入N個詞。如:econom??(2N)recovery可能檢出economIcrecovery,recoveryoftheeconomy,(1)(W)算符與(nW)算符W是word與with的縮寫。5(3)同字段檢索A(F)B,F是fled的縮寫。特點:A、B兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限如:environment(F)impact/DE,表示兩個詞必須同時出現(xiàn)在敘詞字段內。(4)同句檢索A(S)B,S是sentence的縮寫特點:A、B出現(xiàn)在同一自然句中(子字段),其詞序與詞量不受限制如:electric(S)pant可檢出electricpowerplants如:E中的NEAR;PQDD中的Wn(兩詞間距小于n個單詞,且前后位置任意),Pren(兩詞間距小于n個單詞,且前后位置一定)(3)同字段檢索A(F)B,F是fled的縮寫。63小詞算特Truncatingoperators)原因:在英語詞匯中,一個詞可能有多種形態(tài),如詞的單、復數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如果檢索時將這類詞全部輸入進去,會增加檢索時間和費用,采用截詞法可解決這一問題。所謂截詞檢索,是指在檢索標識中保留相同的部分,用相應的截詞符代替可變化部分。檢索中計算機會將所有含有相同部分標識的記錄全部檢索出來。常用“?”、“*”符號表示(1)有服截詞。即在檢索詞后后截幾個有限的字母,如名詞的單復數(shù),動詞的詞尾變化等。如輸入computer??表示有0-1個字母變化,可檢出computer和computers輸入stud???表示截斷處有0-3個字母變化,可檢出study,studies,studied,studing3小詞算特Truncatingoperators)7(2)無限截斷:在檢索詞后加一個“?“,表示該詞后可加任意個字符。使用無限截詞,所截詞根不能太短,否則會輸出許多無關文獻,造成誤檢。如:computer?可檢出computers,computering,computered,computerization(3)中間截斷:在檢索詞中間加一個或幾個?號,主要解決一些英美拼寫不同,單復數(shù)形式的不同的詞的輸入,可簡化輸入。如:輸入wom?n可檢出woman,women(2)無限截斷:在檢索詞后加一個“?“,表8各種算符在數(shù)據(jù)庫中的實際應用位置算符1)EInearBridgeNEARPiling*表示這兩個詞要彼此接近,前后順序不限。W/nPig*W/2pine*表示兩個詞的距離不能超過n個單詞Adjchanneladjtunnel表示含有這兩個詞,兩個詞相鄰位置一定2)ISIProceedings用同句算符(SAME):如IChannelsametunnel,表示channe1和tunnel出現(xiàn)在同一句子中才符合檢索條件。各種算符在數(shù)據(jù)庫中的實際應用93)CSAwithin"X“表示兩詞之間不得多于X個詞,前后位置任意又、如“womenwithin8movement"(順序不定)Elsevier:ADJ表示兩詞相鄰,前后順序固定,與"詞檢"的結果相同;NEAR或NEAR(N),表示西詞相鄰,中間可插入少于或等于n個單詞,前后順序可以發(fā)生變化,如果不使用(N),糸統(tǒng)默認值為103)CSA10數(shù)據(jù)庫檢索方式課件11數(shù)據(jù)庫檢索方式課件12數(shù)據(jù)庫檢索方式課件13數(shù)據(jù)庫檢索方式課件14數(shù)據(jù)庫檢索方式課件15數(shù)據(jù)庫檢索方式課件16數(shù)據(jù)庫檢索方式課件17數(shù)據(jù)庫檢索方式課件18數(shù)據(jù)庫檢索方式課件19數(shù)據(jù)庫檢索方式課件20數(shù)據(jù)庫檢索方式課件21數(shù)據(jù)庫檢索方式課件22數(shù)據(jù)庫檢索方式課件23數(shù)據(jù)庫檢索方式課件24數(shù)據(jù)庫檢索方式課件25數(shù)據(jù)庫檢索方式課件26數(shù)據(jù)庫檢索方式課件27數(shù)據(jù)庫檢索方式課件28數(shù)據(jù)庫檢索方式課件29數(shù)據(jù)庫檢索方式課件30數(shù)據(jù)庫檢索方式課件31數(shù)據(jù)庫檢索方式課件32數(shù)據(jù)庫檢索方式課件33數(shù)據(jù)庫檢索方式課件34數(shù)據(jù)庫檢索方式課件35數(shù)據(jù)庫檢索方式課件36數(shù)據(jù)庫檢索方式課件37數(shù)據(jù)庫檢索方式課件38數(shù)據(jù)庫檢索方式課件39數(shù)據(jù)庫檢索方式課件40數(shù)據(jù)庫檢索方式課件41數(shù)據(jù)庫檢索方式課件42數(shù)據(jù)庫檢索方式課件43數(shù)據(jù)庫檢索方式課件44數(shù)據(jù)庫檢索方式課件45第四章計算機信息檢索的基本技術與方法第四章46計算機信息檢索的基本技術:布爾邏輯、截詞檢索、加權檢索,位置算符等在進行計算機檢索時,有時有一些比較復雜的課題,如:“GPS在建筑中的應用”,既涉及GPS,又涉及建筑,還有“應用”,這時候就要編制出滿足要求的計算機檢索式,它是機檢的基礎。1布爾邏輯檢索(BooleanLogicRetrieva)邏輯檢索的基礎是邏輯運算,邏輯運算中最常用的是布爾邏輯運算符(BooleanLogicOperators),即與或、非三種運算符號,用它們可以表示概念之間的邏輯關系。計算機信息檢索的基本技術:47檢索要邏輯檢課題表達式檢索結求索果概念相AND與讓算機用于制圖AANDB縮小檢交、限ABA*B索范圍定提高查準率概念平OR土地管理與土地利用AORB擴大檢行、并或+ABA+B索范圍提高查全率某一主題去NOT非除光電測以外的BNOTA提高查掉一部分相電磁波測距B-A準率關主題B檢索要邏輯檢482位置算符(ProximityOperators)位置算符是表示檢索詞之間位置關系的一種運算符。由于英文對一句話有多種表達方法,寫法可能不同。如:“GPS在鐵路橋研究中的應用”這個課題,用英文表達可能是“UsingofGPsinRailwaybridge”,也可能是“UsingofGPsinBridgeofRailway”,因而可能編制出這樣的檢索It,GPSAND(Railway(2N)Bridge)我們可以通過位置檢索提高檢索的準確率2位置算符(ProximityOperators)49(1)(W)算符與(nW)算符W是word與with的縮寫。特點:W詞序不變,中間不可插詞,但兩詞間可有個標點,連字符或空格。nW詞序不變,中間可插入N個詞。如:potential(w)energy可能檢出potentialenergyandfunction又如:gone(2w)wind可能檢出gonewiththewind(2)(N)與nN)算符N是near的縮寫特點:N詞序不限,中間不可插詞,但兩詞間可有一個標點,連字符或空格。nN詞序不限,中間可插入N個詞。如:econom??(2N)recovery可能檢出economIcrecovery,recoveryoftheeconomy,(1)(W)算符與(nW)算符W是word與with的縮寫。50(3)同字段檢索A(F)B,F是fled的縮寫。特點:A、B兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限如:environment(F)impact/DE,表示兩個詞必須同時出現(xiàn)在敘詞字段內。(4)同句檢索A(S)B,S是sentence的縮寫特點:A、B出現(xiàn)在同一自然句中(子字段),其詞序與詞量不受限制如:electric(S)pant可檢出electricpowerplants如:E中的NEAR;PQDD中的Wn(兩詞間距小于n個單詞,且前后位置任意),Pren(兩詞間距小于n個單詞,且前后位置一定)(3)同字段檢索A(F)B,F是fled的縮寫。513小詞算特Truncatingoperators)原因:在英語詞匯中,一個詞可能有多種形態(tài),如詞的單、復數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如果檢索時將這類詞全部輸入進去,會增加檢索時間和費用,采用截詞法可解決這一問題。所謂截詞檢索,是指在檢索標識中保留相同的部分,用相應的截詞符代替可變化部分。檢索中計算機會將所有含有相同部分標識的記錄全部檢索出來。常用“?”、“*”符號表示(1)有服截詞。即在檢索詞后后截幾個有限的字母,如名詞的單復數(shù),動詞的詞尾變化等。如輸入computer??表示有0-1個字母變化,可檢出computer和computers輸入stud???表示截斷處有0-3個字母變化,可檢出study,studies,studied,studing3小詞算特Truncatingoperators)52(2)無限截斷:在檢索詞后加一個“?“,表示該詞后可加任意個字符。使用無限截詞,所截詞根不能太短,否則會輸出許多無關文獻,造成誤檢。如:computer?可檢出computers,computering,computered,computerization(3)中間截斷:在檢索詞中間加一個或幾個?號,主要解決一些英美拼寫不同,單復數(shù)形式的不同的詞的輸入,可簡化輸入。如:輸入wom?n可檢出woman,women(2)無限截斷:在檢索詞后加一個“?“,表53各種算符在數(shù)據(jù)庫中的實際應用位置算符1)EInearBridgeNEARPiling*表示這兩個詞要彼此接近,前后順序不限。W/nPig*W/2pine*表示兩個詞的距離不能超過n個單詞Adjchanneladjtunnel表示含有這兩個詞,兩個詞相鄰位置一定2)ISIProceedings用同句算符(SAME):如IChannelsametunnel,表示channe1和tunnel出現(xiàn)在同一句子中才符合檢索條件。各種算符在數(shù)據(jù)庫中的實際應用543)CSAwithin"X“表示兩詞之間不得多于X個詞,前后位置任意又、如“womenwithin8movement"(順序不定)Elsevier:ADJ表示兩詞相鄰,前后順序固定,與"詞檢"的結果相同;NEAR或NEAR(N),表示西詞相鄰,中間可插入少于或等于n個單詞,前后順序可以發(fā)生變化,如果不使用(N),糸統(tǒng)默認值為103)CSA55數(shù)據(jù)庫檢索方式課件56數(shù)據(jù)庫檢索方式課件57數(shù)據(jù)庫檢索方式課件58數(shù)據(jù)庫檢索方式課件59數(shù)據(jù)庫檢索方式課件60數(shù)據(jù)庫檢索方式課件61數(shù)據(jù)庫檢索方式課件62數(shù)據(jù)庫檢索方式課件63數(shù)據(jù)庫檢索方式課件64數(shù)據(jù)庫檢索方式課件65數(shù)據(jù)庫檢索方式課件66數(shù)據(jù)庫檢索方式課件67數(shù)據(jù)庫檢索
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度高科技企業(yè)擔保合同印花稅減免政策
- 2025年度高速公路服務區(qū)車位租賃及管理協(xié)議
- 2025年汽車自動采樣設備項目合作計劃書
- 2025年食品、飲料及煙草批發(fā)服務項目合作計劃書
- 開展年度企業(yè)經(jīng)驗分享計劃
- 培養(yǎng)創(chuàng)新思維的個人計劃
- 引導公眾節(jié)水的宣傳活動設計計劃
- 倉庫管理軟件的選擇與應用計劃
- 實施自動化提高生產效率計劃
- 班級團體比賽的籌備與舉辦計劃
- 慢性病建檔表系列
- GB 19641-2015食品安全國家標準食用植物油料
- 教科版科學五年級下冊《生物與環(huán)境》單元教材解讀及教學建議
- 科室會專用-元治-鹽酸貝尼地平-產品介紹
- 統(tǒng)編人教部編版語文八年級下冊語文古詩文全程復習課件
- “20道游標卡尺題目及答案”
- 馬工程西方經(jīng)濟學(第二版)教學課件-1
- 北師大版數(shù)學六年級下冊-總復習課件(精編版)
- 影視劇項目贊助合同協(xié)議書范本
- 采購需求管理課件
- 結構化面試(教師)
評論
0/150
提交評論