




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、計(jì)算機(jī)檢索技術(shù)及中文數(shù)據(jù)庫使用方法,一、計(jì)算機(jī)信息檢索的基本技術(shù): 布爾邏輯算符、截詞算符、位置算符、字段限定檢索等等。在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜的課題,如:“GPS在建筑中的應(yīng)用”,既涉及GPS,又涉及建筑,還有“應(yīng)用”,這時(shí)候就要編制出滿足要求的計(jì)算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。,一、計(jì)算機(jī)信息檢索的基本技術(shù),布爾邏輯算符、截詞算符、位置算符、字段限定檢索等等。 在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜的課題,如:“GPS在建筑中的應(yīng)用”,既涉及GPS,又涉及建筑,還有“應(yīng)用”,這時(shí)候就要編制出滿足要求的計(jì)算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。,1布爾邏輯檢索(Boolean Logic Re
2、trieval) 邏輯檢索的基礎(chǔ)是邏輯運(yùn)算,邏輯運(yùn)算中最常用的是布爾邏輯運(yùn)算符(Boolean Logic Operators),即與、或、非三種運(yùn)算符號(hào),用它們可以表示概念之間的邏輯關(guān)系。,2 位置算符(Proximity Operators) 位置算符是表示檢索詞之間位置關(guān)系的一種運(yùn)算符。由于英文對(duì)一句話有多種表達(dá)方法,寫法可能不同。如:“GPS在鐵路橋研究中的應(yīng)用”這個(gè)課題,用英文表達(dá)可能是“Using of GPS in Railway Bridge”, 也可能是“Using of GPS in Bridge of Railway”,因而可能編制出這樣的檢索式,GPS AND (Rai
3、lway (2N)Bridge)我們可以通過位置檢索提高檢索的準(zhǔn)確率,(1) (W)算符與(nW)算符 W 是word與 with的縮寫。 特點(diǎn):W詞序不變,中間不可插詞,但兩詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。 nW詞序不變,中間可插入N 個(gè)詞。 如:potential (w) energy可能檢出potential energy and function 又如:gone (2w)wind 可能檢出gone with the wind,(2) (N)與(nN)算符 N是near的縮寫 特點(diǎn):N詞序不限,中間不可插詞,但兩詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。 nN詞序不限,中間可插入N 個(gè)詞。 如:e
4、conom? (2N)recovery可能檢出economic recovery,recovery of the economy,(3)同字段檢索A(F)B,F(xiàn)是field的縮寫。 特點(diǎn):A、B兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限。 如:environment (F)impact/DE,表示兩個(gè)詞必須同時(shí)出現(xiàn)在敘詞字段內(nèi)。,(4) 同句檢索A(S)B,S是sentence的縮寫。 特點(diǎn):A、B出現(xiàn)在同一自然句中(子字段),其詞序與詞量不受限制。 如:electric (S)plant可檢出electric power plants如:EI中的NEAR;PQDD中的W/n (兩詞間距小于n個(gè)
5、單詞,且前后位置任意),Pre/n (兩詞間距小于n個(gè)單詞,且前后位置一定),3截詞算符(Truncating operators) 在英語詞匯中,一個(gè)詞可能有多種形態(tài),如詞的單、復(fù)數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如果檢索時(shí)將這類詞全部輸入進(jìn)去,會(huì)增加檢索時(shí)間和費(fèi)用,采用截詞法可解決這一問題。,所謂截詞檢索,是指在檢索標(biāo)識(shí)中保留相同的部分,用相應(yīng)的截詞符代替可變化部分。檢索中計(jì)算機(jī)會(huì)將所有含有相同部分標(biāo)識(shí)的記錄全部檢索出來。常用“?”、“*”符號(hào)表示。,(1)有限截?cái)唷J侵冈跈z索詞后后截幾個(gè)有限的字母,如名詞的單復(fù)數(shù),動(dòng)詞的詞尾變化等。如輸入computer? ?表示有0-1個(gè)字母
6、變化,可檢出computer和computers. 輸入stud?表示截?cái)嗵幱?-3個(gè)字母變化,可檢出study,studies,studied,studing.,(2)無限截?cái)啵涸跈z索詞后加一個(gè)“?“,表示該詞后可加任意個(gè)字符。使用無限截詞,所截詞根不能太短,否則會(huì)輸出許多無關(guān)文獻(xiàn),造成誤檢。 如:computer?可檢出computers,computering,computered,computerization.,(3)中間截?cái)啵涸跈z索詞中間加一個(gè)或幾個(gè)?號(hào),主要解決一些英美拼寫不同,單復(fù)數(shù)形式的不同的詞的輸入,可簡化輸入。如:輸入wom?n可檢出 woman,women,各種算符在數(shù)
7、據(jù)庫中的實(shí)際應(yīng)用位置算符,1)EI NEAR Bridge NEAR Piling* 表示這兩個(gè)詞要彼此接近,前后順序不限。 W/n Pig*W/2pine*表示兩個(gè)詞的距離不能超過n個(gè)單詞 Adj Channel adj tunnel表示含有這兩個(gè)詞,兩個(gè)詞相鄰,位置一定 2)ISI Proceedings 用同句算符(SAME):如Channel same tunnel,表示channel 和tunnel 出現(xiàn)在同一句子中才符合檢索條件。,3)CSA:,within “X” 表示兩詞之間不得多于x個(gè)詞,前后位置任意 如“women within 8 movement” (順序不定) 4)E
8、lsevier: ADJ表示兩詞相鄰,前后順序固定,與詞檢索的結(jié)果相同;NEAR或NEAR(N),表示兩詞相鄰,中間可插入少于或等于n個(gè)單詞,前后順序可以發(fā)生變化,如果不使用(N),系統(tǒng)默認(rèn)值為10,5)PQDD W/n (兩詞間距小于n個(gè)單詞,且前后位置任意),Pre/n (兩詞間距小于n個(gè)單詞,且前后位置一定),6)ProQuest W/n(表示連接兩個(gè)詞之間可以插入n個(gè)詞 ,前后位置可顛倒) 如:Education w/5 intenet 表示education和internet之間可以插入5個(gè)詞 ,并且前后位置可以顛倒。,Pre/n表示前后兩詞之間最多插入n個(gè)詞,前后位置一定 如:U.
9、S pre/n economic policy可檢出U.S aideconomic policy,or U.S wartime economic policy 。,截詞符或通配符,CSAISI ProceedingsProQuestCA用通配符“?”和截詞符“* ” 輸入 “patent*”,可以檢索到 patent、patents、 patented等,(無限截?cái)啵?輸入wom?n,可以檢索到woman和women。 輸入“fib?”,可檢索到fiber和 fibre。(有限截?cái)啵?EI用“* ” 和“$”(詞根算符) 如:Optic*檢索結(jié)果中包括以optic 開頭后面加任意多個(gè)字母的詞例
10、如optic, optics,optical 等$manager(強(qiáng)調(diào)語義)檢索出與該詞根具有同樣語意的詞如$manage 將檢出managers, managerial和management 等詞 通配符不能用在檢索詞的最前面,4括號(hào)檢索(Parentheses)用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的內(nèi)容做優(yōu)先運(yùn)算。用“()”可以表示優(yōu)先級(jí)。如比較 (GPSORGIS)ANDChina GPSORGIS ANDChinaEI 中的表示方法:Relevance AND( Aalbersberg WN AU)OR (cool WN AU),5、字段限制檢索 組成數(shù)據(jù)庫的最小單位是記錄,一條完整記錄中的
11、每一個(gè)著錄事項(xiàng)為字段。獻(xiàn)書目型數(shù)據(jù)庫的記錄基本包括下列字段:(1) 存取號(hào)字段(AN, Access Number)這是計(jì)算機(jī)檢索系統(tǒng)為每個(gè)數(shù)據(jù)庫的每篇記錄規(guī)定的能被計(jì)算機(jī)識(shí)別的特定號(hào)碼。在同一數(shù)據(jù)庫中,每篇文獻(xiàn)記錄只有一個(gè)存取號(hào);(2) 篇(題)名字段(Title Field, /TI)(3) 文摘字段(Abstract Field, /AB),(4) 敘詞字段或受控詞字段(Destriptor Field, /DE; 或 Controlled term Field-SU) 這一字段是標(biāo)引人員給文獻(xiàn)標(biāo)引的反映其主題概念的詞,這些詞來自規(guī)范化的詞表。也稱主題詞。 (5)自由詞字段或非受控詞字段
12、(Identified Field, /ID; Keyword Field , /KW ;Uncontrolled term Field) 這一字段也是標(biāo)引人員給文獻(xiàn)標(biāo)引反映其主題概念的詞,但這些詞不是規(guī)范化詞表中的詞。,(6)著者子段(Author,AU)(7)著者機(jī)構(gòu)子段 (corporate source,CS 或Affiliation source,AF) (8)刊名字段(journal,JN或Source Title,ST),(9)出版年子段 (publication,year,PY) (10)文獻(xiàn)類型子段 (ducument type,DT或Type,TY) (11)語種子段(la
13、nguage,LA) (12)分類號(hào)子段(classification,CC),使用作者檢索時(shí)應(yīng)注意姓名的書寫形式:,在ISTP中,姓前(全稱) 名后(縮寫):Gong,jy; E DC 在SCI中, (1)姓 (全稱)空格 名(首字母并且連寫) 如:Tait NG; LI DR (2)名前(全稱),姓后 如:Zequn,guan; Qingquan,Li 在EI中, 姓名就比較復(fù)雜,一般有以下幾種情況:姓 名都用全稱(姓前名后);姓全稱名縮寫(或名之間用連字符);名前姓后全稱 如 ke hengyu=ke heng-yu=ke,hengyu ke,h.y.=ke,h-y;e,d.c. hen
14、gyu ke;dongchen,e,6短語檢索(phrase search)即精確檢索短語用“”表示,檢索出與“”內(nèi)形式完全相同的的短語,以提高檢索的精確度和準(zhǔn)確度,7自然語言檢索(natural language )直接采用自然語言中的字、詞、句進(jìn)行提問式檢索,同一般口語一樣。這種基于自然語言的檢索方式又被稱為“智能檢索”,適合不太熟悉網(wǎng)絡(luò)信息技術(shù)的人員使用。支持自然語言檢索的有中文的悠游,英文的AltaVista, Excite,Infoseek,HotBot,AskJeeves等,8多種語言檢索(multilingual search)提供多種語言的檢索環(huán)境供用戶選擇,系統(tǒng)按用戶選定的語
15、種進(jìn)行檢索并反饋結(jié)果,支持多語種檢索的 如:中文天網(wǎng),英文AltaVista,Google等。,9模糊檢索(fuzzy search)又稱概念檢索。當(dāng)我們輸入一個(gè)檢索詞時(shí),搜索引擎不僅反饋包括了該關(guān)鍵詞的網(wǎng)址,同時(shí)也發(fā)來與關(guān)鍵詞意義相近的內(nèi)容。比如:我們查找“查詢”一詞時(shí),模糊檢索會(huì)反饋來包含了“查詢”、“查找”“查一查”、“尋找”、“搜索”等內(nèi)容的網(wǎng)址。反饋網(wǎng)址的排列,一般是完全符合關(guān)鍵詞的在最前邊,其次是相近的?,F(xiàn)在大多數(shù)搜索引擎都有這種功能,只是模糊的程度不同。,10 字母大小寫檢索如果用戶的檢索式用小寫字母表示,搜索工具既匹配大寫又匹配小寫,如:china(瓷器),china(中國);
16、如果用大寫字母表示,搜索工具認(rèn)為用戶指定了只要大寫,就只會(huì)查找那些與用戶鍵入的輸入形式完全相同的結(jié)果,如:china,只檢索出china。Alta Vista等搜索引擎支持區(qū)分大小寫的檢索,實(shí)際檢索中,往往將多種檢索技術(shù)混合使用。如:TI(Web OR WWW) AND market*TS=(nanotub* SAME carbon) NOT AU=Smalley RE,例:以汽車導(dǎo)航系統(tǒng)為研究課題,構(gòu)建計(jì)算機(jī)邏輯檢索式,題名詞:汽車導(dǎo)航系統(tǒng)研究 題名擴(kuò)展詞:機(jī)動(dòng)車;全球定位技術(shù)(GPS);設(shè)計(jì)調(diào)查 計(jì)算機(jī)邏輯檢索式: (汽車機(jī)動(dòng)車)(導(dǎo)航系統(tǒng)全球定位技術(shù) GPS)(研究設(shè)計(jì)調(diào)查),示例:有關(guān)
17、“企業(yè)知識(shí)產(chǎn)權(quán)研究”,檢索式 檢索結(jié)果 (*表示AND,+表示OR,限定篇名字段) (2004-2006) 1 企業(yè)知識(shí)產(chǎn)權(quán) 191篇(準(zhǔn)確度最高漏檢大) 2 企業(yè)*知識(shí)產(chǎn)權(quán) 404 (漏檢率較高 ) 3 (企業(yè)+集團(tuán)+公司)* 知識(shí)產(chǎn)權(quán) 466 (適合綜述性文獻(xiàn)) 4 (企業(yè)+集團(tuán)+公司)* (知識(shí)產(chǎn)權(quán)+專利權(quán) 520 (查全率查準(zhǔn)率較高) +商標(biāo)權(quán)+著作權(quán)+名稱權(quán)) 5 (企業(yè)+集團(tuán)+公司)* (知識(shí)產(chǎn)權(quán)+專利權(quán) 137 (縮小范圍效果最佳) +商標(biāo)權(quán)+著作權(quán)+名稱權(quán))* 保護(hù),檢索結(jié)果表明: 檢索詞的選擇、邏輯算符的使用、同義詞近義詞的擴(kuò)展、檢索字段的選擇等變化,對(duì)檢索結(jié)果數(shù)量的多少、檢
18、索的查全和查準(zhǔn)有很大影響,檢索結(jié)果過少,漏掉了相關(guān)文獻(xiàn)? 放寬檢索要求,提高檢全率 去掉某個(gè)方面的檢索要求; 放寬檢索范圍:學(xué)科領(lǐng)域、時(shí)間、文章類型,關(guān)鍵詞出現(xiàn)的字段等; 將描述檢索主題的詞想全,包括同義詞及縮寫形式; 如:MRI OR magnetic resonance imaging 使用單數(shù)單詞檢索,可以檢索到大多數(shù)單詞單數(shù)、復(fù)數(shù)和所有格,不規(guī)則單詞除外; 如:city 可以檢索出 city,cities,citys,cities 使用通配符;,檢索結(jié)果過多,很多文獻(xiàn)不相關(guān)? 進(jìn)一步限定檢索,提高檢準(zhǔn)率 更加準(zhǔn)確地描述檢索需求; 嚴(yán)格限定檢索范圍:學(xué)科領(lǐng)域、時(shí)間、文章類型,關(guān)鍵詞出現(xiàn)的
19、字段等; 選擇與檢索主題密切相關(guān)的詞和專業(yè)術(shù)語,如:kidney disease OR renal failure,避免使用過于寬泛的詞匯,如:influence; 使用詞組檢索或位置檢索; 在檢索結(jié)果的基礎(chǔ)上進(jìn)行二次檢索;,二、數(shù)據(jù)庫的檢索方法,檢索界面,瀏覽方式 ( Browse ),檢索方式 ( Search ),瀏覽方式 ( Browse ) 一般包括作者、作者單位、出版物名稱及出版社索引或者按學(xué)科劃分的分類索引 如:EI Elsevier CSA PROQUEST IEEEIEE 重慶維普以及中國期刊網(wǎng)等等都提供了各種不同的瀏覽方式,檢索方式 ( Search ),基本檢索 (bas
20、icquicksimpleeasy) 屬于一般性的檢索,它是根據(jù)自己的檢索需要,輸入字、詞或簡單的檢索式(不能使用位置檢索)來完成檢索的,是一種初級(jí)性的檢索方式。 高級(jí)檢索(advanceexpendfullexpert) 屬于專家性的檢索,可以根據(jù)自己的檢索需要,構(gòu)件比較復(fù)雜的檢索式(可以使用邏輯、括號(hào)、截詞以及位置算符)來完成高層次、高質(zhì)量的檢索,檢索結(jié)果快速、準(zhǔn)確。高級(jí)檢索分為菜單式檢索和命令式檢索兩種,三中文數(shù)據(jù)庫的使用方法,中國期刊網(wǎng) 重慶維普數(shù)據(jù)庫 萬方數(shù)據(jù)庫 全國期刊聯(lián)合目錄 高校期刊聯(lián)合目錄 書生之家,(一) 收錄特點(diǎn),中國期刊網(wǎng)目前世界上最大的連續(xù)動(dòng)態(tài)更新的中國期刊全文數(shù)據(jù)庫
21、。收錄1979年至今約7200種期刊全文。至2005年4月止,累積全文文獻(xiàn)1370多萬篇。分為九大專輯:理工A、理工B、理工C、農(nóng)業(yè)、醫(yī)藥衛(wèi)生、文史哲、經(jīng)濟(jì)政治與法律、教育與社會(huì)科學(xué) 、電子技術(shù)與信息科學(xué);126個(gè)專題文獻(xiàn)數(shù)據(jù)庫。 知識(shí)來源:中國國內(nèi)約7200種核心期刊與專業(yè)特色期刊的全文以及優(yōu)秀博碩士學(xué)位論文和重要報(bào)紙,重慶維普資訊有限公司是科學(xué)技術(shù)部西南信息中心下屬的一家大型專業(yè)化數(shù)據(jù)公司,是中文期刊數(shù)據(jù)庫建設(shè)事業(yè)的奠基人。自1989年以來,一直致力于報(bào)刊等信息資源的深層次開發(fā)和推廣應(yīng)用,業(yè)務(wù)集數(shù)據(jù)采集、數(shù)據(jù)加工、光盤制作發(fā)行和網(wǎng)上信息服務(wù)于一體。目前,已成為中國最有影響力的數(shù)據(jù)庫建設(shè)者之一。 維普公司收錄有中文報(bào)紙400種、中文期刊8000種、外文期刊5000種;已標(biāo)引加工的數(shù)據(jù)總量達(dá)1300萬篇、3000萬頁次、擁有固定客戶2000余家,在國內(nèi)同行中處領(lǐng)先地位。維普數(shù)據(jù)庫已成為我國圖書情報(bào)、教育機(jī)構(gòu)、科研院所等系統(tǒng)必不可少的基本工具和獲取資料的重要來源。 數(shù)據(jù)主要來源于期刊,萬方數(shù)據(jù)資源系統(tǒng)是建立在因特網(wǎng)上的大型科技、商務(wù)信息平臺(tái)。自1997年8月面向社會(huì)各界開放以來,在國內(nèi)外產(chǎn)生了較大的影響,同時(shí)在全國各省市建有幾百個(gè)服務(wù)中心,直接用戶達(dá)數(shù)萬人。萬方數(shù)據(jù)資源系統(tǒng)以其巨大的信息量和方便的檢索查詢功能成為我國信息界的知名品牌。,萬方數(shù)據(jù)主要資源建立在萬方數(shù)據(jù)龐大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024成都冶金職工大學(xué)輔導(dǎo)員招聘筆試真題
- 文化旅游項(xiàng)目規(guī)劃師筆試試題及答案
- 2025年隔離接地開關(guān)項(xiàng)目發(fā)展計(jì)劃
- 2025年車用交流發(fā)電機(jī)合作協(xié)議書
- 玉林市陸川縣招聘特崗教師筆試真題2024
- 2025年市場調(diào)查服務(wù)項(xiàng)目合作計(jì)劃書
- 2025年經(jīng)典心理健康知識(shí)競賽考試練習(xí)題庫(350題)【答案】
- 2025年事業(yè)單位考試中國古代近代文學(xué)史知識(shí)考試題庫(五套)【答案】
- 活動(dòng)總結(jié)范文學(xué)校五四青年節(jié)活動(dòng)總結(jié)怎么寫
- 糧食局員工年末述職報(bào)告范文
- 化工操作工儀表知識(shí)培訓(xùn)
- QCT269-2023汽車鑄造零件未注公差尺寸的極限偏差
- JT-T 1172.1-2017 系列2集裝箱 技術(shù)要求和試驗(yàn)方法 第1部分:通.用貨物集裝箱
- 消防設(shè)施維保服務(wù)投標(biāo)方案
- 鋼結(jié)構(gòu)3D3S-非線性分析講座課件
- 辦公用品應(yīng)急預(yù)案
- 關(guān)于配電房培訓(xùn)課件
- 2023年SQE供應(yīng)商質(zhì)量工程師年度總結(jié)及下年規(guī)劃
- 品牌形象設(shè)計(jì)之輔助圖形的操作
- 可用性控制程序
- 福建省泉州市泉州實(shí)驗(yàn)中學(xué)2024屆八上數(shù)學(xué)期末聯(lián)考模擬試題含解析
評(píng)論
0/150
提交評(píng)論