胡林峰V200841155_第1頁
胡林峰V200841155_第2頁
胡林峰V200841155_第3頁
胡林峰V200841155_第4頁
胡林峰V200841155_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、論文題目:計(jì)算機(jī)檢索程序、步驟學(xué)生姓名:胡林峰學(xué)號(hào):V200841155指導(dǎo)老師:談發(fā)堂專業(yè)班級(jí):2008模具設(shè)計(jì)與制造1班完成時(shí)間:2010年6月30號(hào)華中科技大學(xué)科技文獻(xiàn)檢索與寫作題目:計(jì)算機(jī)檢索程序、步驟 1計(jì)算機(jī)信息檢索的原理 計(jì)算機(jī)信息檢索是指利用計(jì)算機(jī)存儲(chǔ)和檢索信息。具體地說,就是指人們?cè)谟?jì)算機(jī)或計(jì)算機(jī)檢索網(wǎng)絡(luò)的終端機(jī)上,使用特定的檢索指令、檢索詞和檢索策略,從計(jì)算機(jī)檢索系統(tǒng)的數(shù)據(jù)庫中檢索出所需的信息,繼而再由終端設(shè)備顯示或打印的過程。為實(shí)現(xiàn)計(jì)算機(jī)信息檢索,必須事先將大量的原始信息加工處理、以數(shù)據(jù)庫的形式存儲(chǔ)在計(jì)算機(jī)中,所以計(jì)算機(jī)信息檢索廣義上講包括信息的存儲(chǔ)和檢索兩個(gè)方面。 計(jì)算

2、機(jī)信息存儲(chǔ)過程是:用手工或者自動(dòng)方式將大量的原始信息進(jìn)行加工,具體做法是將收集到的原始文獻(xiàn)進(jìn)行主題概念分析,根據(jù)一定的檢索語言抽取出卞題詞、分類號(hào)以及文獻(xiàn)的其他特征進(jìn)行標(biāo)識(shí)或者寫出文獻(xiàn)的內(nèi)容摘要。然后再把這些經(jīng)過“前處理”的數(shù)據(jù)按一定格式輸入計(jì)算機(jī)存儲(chǔ)起來,計(jì)算機(jī)在程序指令的控制下對(duì)數(shù)據(jù)進(jìn)行處理,形成機(jī)讀數(shù)據(jù)庫,存儲(chǔ)在存儲(chǔ)介質(zhì)(如磁帶、磁盤或光盤)上,完成信息的加工存儲(chǔ)過程。 計(jì)算機(jī)信息檢索過程是:用戶對(duì)檢索課題加以分析,明確檢索范圍,弄清卞題概念,然后用系統(tǒng)檢索語言來表示卞題概念,形成檢索標(biāo)識(shí)及檢索策略,輸入到計(jì)算機(jī)進(jìn)行檢索。計(jì)算機(jī)按照用戶的要求將檢索策略轉(zhuǎn)換成一系列提問,在專用程序的控制下

3、進(jìn)行高速邏輯運(yùn)算,選出符合要求的信息輸出。計(jì)算機(jī)檢索的過程實(shí)際上是一個(gè)比較、匹配的過程,檢索提問只要與數(shù)據(jù)庫中的信息的特征標(biāo)識(shí)及其邏輯組配關(guān)系相一致,則屬“命中”,即找到了符合要求的信息。如圖所示。2計(jì)算機(jī)信息檢索的步驟 進(jìn)行計(jì)算機(jī)信息檢索,一般來說要經(jīng)過以下基本程序:分析檢索課題,選擇檢索系統(tǒng)及數(shù)據(jù)庫,確定檢索詞,構(gòu)建檢索提問式,上機(jī)檢索并調(diào)整檢索策略,輸出檢索結(jié)果。2. 1分析檢索課題 利用計(jì)算機(jī)信息檢索系統(tǒng)獲取文獻(xiàn)信息的用戶,一般分為直接用戶和間接用戶兩種類型。直接用戶是指最終使用獲得的信息進(jìn)行工作的用戶(如科研人員,竹理者,決策者等);間接用戶是指專門從事計(jì)算機(jī)檢索服務(wù)的檢索人員。檢索

4、人員在接到用戶的檢索課題時(shí)應(yīng)首先分析研究課題,全面了解課題的內(nèi)容以及用戶對(duì)檢索的各種要求,從而有助于i1:確選擇檢索系統(tǒng)及數(shù)據(jù)庫,制定合理的檢索策略等。分析檢索課題時(shí)應(yīng)從以下兒方面進(jìn)行:(1)弄清用戶信息需求的日的和意圖;2)分析課題涉及的學(xué)科范圍、卞題要求;( 3)課題所需信息的內(nèi)容及其特征;( 4)課題所需信息的類型,包括文獻(xiàn)類型、出版類型、年代范圍、語種、著者、機(jī)構(gòu)等; 5)課題對(duì)查新、查準(zhǔn)、查全的指標(biāo)要求。2. 2選擇檢索系統(tǒng)和數(shù)據(jù)庫 在全面分析檢索課題的基礎(chǔ)上,根據(jù)用戶要求得到的信息類型、時(shí)間范圍、課題檢索經(jīng)費(fèi)支持等因素綜合考慮后,選擇檢索系統(tǒng)和數(shù)據(jù)庫。i1:確選擇數(shù)據(jù)庫,是保證檢索

5、成功的基礎(chǔ)。選擇數(shù)據(jù)庫時(shí)必須從以下兒個(gè)方面考慮:(1)數(shù)據(jù)庫收錄的信息內(nèi)容所涉及的學(xué)科范圍;( 2)數(shù)據(jù)庫收錄的文獻(xiàn)類型、數(shù)量、時(shí)間范圍以及更新周期;( 3)數(shù)據(jù)庫所提供的檢索途徑、檢索功能和服務(wù)方式。2. 3確定檢索詞 檢索詞是表達(dá)文獻(xiàn)信息需求的基本元素,是計(jì)算機(jī)檢索系統(tǒng)中進(jìn)行匹配的基本單元。檢索詞選擇正確與否,直接影響著檢索結(jié)果。在全面了解檢索課題的相關(guān)問題后,提煉卞要概念與隱含概念,排除次要概念,以便確定檢索詞。檢索詞的確定,一般有以下兒種方法: (1)先選用主題詞。當(dāng)所選的數(shù)據(jù)庫具有規(guī)范化詞表時(shí),應(yīng)優(yōu)先選用該數(shù)據(jù)庫詞表中與檢索課題相關(guān)的規(guī)范化卞題詞,從而可獲得最佳的檢索效果C (2)選

6、用數(shù)據(jù)庫規(guī)定的代碼。許多數(shù)據(jù)庫的文檔中使用各種代碼來表示各種卞題范疇,有很高的匹配性。例如,世界專利文摘數(shù)據(jù)庫中的分類代碼,化學(xué)文摘數(shù)據(jù)庫中的化學(xué)物質(zhì)升記號(hào)。 ( 3)選用常用的專業(yè)術(shù)語。在數(shù)據(jù)庫沒有專用的詞表或詞表中沒有可選的詞時(shí),可以從一些己有的相關(guān)專業(yè)文獻(xiàn)中選擇常用的專業(yè)術(shù)語作為檢索詞。 ( 4)選用同義詞與相關(guān)詞。同義詞、近義詞、相關(guān)詞、縮寫詞、詞形變化等應(yīng)盡量選全,以提高查全率。2. 4構(gòu)建檢索提問式 檢索提問式是計(jì)算機(jī)信息檢索中用來表達(dá)用戶檢索提問的邏輯表達(dá)式,由檢索詞和各種布爾邏輯算符、位置算符、截詞符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)組成。檢索提問式構(gòu)建得是否合理,將直接影響查全率

7、和查準(zhǔn)率。構(gòu)建檢索提問式時(shí),應(yīng)準(zhǔn)確運(yùn)用邏輯組配運(yùn)算符: (l)使用邏輯“與”算符可以縮小命中范圍,起到縮檢的作用,得到的檢索結(jié)果專指性強(qiáng),查準(zhǔn)率也就n。 (2)使用邏輯“或”算符可以擴(kuò)大命中范圍,得到更多的檢索結(jié)果,起到擴(kuò)檢的作用,查全率也就高。 ( 3)使用“非”算符可以縮小命中范圍,得到更切題的檢索效果,也可以提高查準(zhǔn)率,但是使用時(shí)要慎重,以免把一些相關(guān)信息漏掉。 另外,在構(gòu)建檢索提問式時(shí),還要注意位置算符截詞符等的使用方法,及各個(gè)檢索項(xiàng)的限定要求及輸入次序等。2. 5上機(jī)檢索并調(diào)整檢索策略 構(gòu)建完檢索提問式后,就可以上機(jī)檢索了。檢索時(shí),應(yīng)及時(shí)分析檢索結(jié)果是否與檢索要求一致,根據(jù)檢索結(jié)果對(duì)

8、檢索提問式作相應(yīng)的修改和調(diào)整,直至得到比較滿意的結(jié)果。 (1)檢索結(jié)果信息量過多。產(chǎn)生檢索結(jié)果信息量過多的原因可能有以下兩點(diǎn):一是卞題詞本身的多義性導(dǎo)致誤檢;一是對(duì)所選的檢索詞的截詞截得太短。在這種情況下,就要考慮縮小檢索范圍,提高檢索結(jié)果的查準(zhǔn)率。調(diào)整檢索策略的方法如下: 咸少同義詞與同族相關(guān)詞; 廖曾加限制概念,采用邏輯“與”連接檢索詞; 倒吏用字段限定,將檢索詞限定在某個(gè)或某些字段范圍; a吏用邏輯”非”算符,排除無關(guān)概念; 回周整位置算符,由松變嚴(yán)。 (2)檢索結(jié)果信息量過少。造成檢索結(jié)果信息量少的原因有以下兒點(diǎn):首先,選用了不規(guī)范的主題詞或某些產(chǎn)品的俗稱,商品名稱作為檢索詞;其二,同義詞、相關(guān)詞、近義詞沒有運(yùn)用全;其三,上位概念或下位概念沒有完整運(yùn)用。針對(duì)這種情況,就要考慮擴(kuò)大檢索范圍,提高檢索結(jié)果的查全率。調(diào)整檢索策略的方法如下: 選全同義詞與相關(guān)詞并用邏輯”或”將它們連接起來,增加網(wǎng)羅度; 咸少邏輯“與”的運(yùn)算,丟掉一些次要的或者太專指的概念; C去除某些字段限制; 回司整位置算符,由嚴(yán)變松。2. 6輸出檢索結(jié)果 根據(jù)檢索系統(tǒng)提供的檢索結(jié)果輸出格式,選擇需要的記錄以及相應(yīng)的字段(全部字段或部分字段),將結(jié)果顯示在顯示器屏幕上、存儲(chǔ)到磁盤或直接打印輸出,網(wǎng)絡(luò)數(shù)據(jù)庫檢索系統(tǒng)還提供電了郵件發(fā)送,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論