信息技術基礎 課件 項目七 信息檢索_第1頁
信息技術基礎 課件 項目七 信息檢索_第2頁
信息技術基礎 課件 項目七 信息檢索_第3頁
信息技術基礎 課件 項目七 信息檢索_第4頁
信息技術基礎 課件 項目七 信息檢索_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

※了解信息檢索的定義和分類。※了解搜索引擎的分類和原理。※掌握常用信息檢索技術?!莆帐褂弥W(wǎng)檢索文獻的方法。項目七

信息檢索任務一信息檢索概述一、信息檢索的定義和分類1.信息檢索的定義信息檢索是用戶獲取信息的主要方式,是查詢信息的方法和手段。信息檢索有廣義和狹義之分。廣義的信息檢索是將信息按一定的方式進行加工、整理、組織并存儲起來,再根據(jù)用戶特定的需求將相關信息準確地查找出來的過程。因此,信息檢索也稱信息的存儲與檢索。狹義的信息檢索僅指信息查詢,即用戶根據(jù)需要,采用某種方法或借助檢索工具,從信息集合中找出所需要的信息。2.信息檢索的分類根據(jù)檢索手段的不同,信息檢索可分為手工檢索和機械檢索。手工檢索是以手工翻檢的方式,通過圖書、期刊、目錄卡片等工具來檢索信息的一種手段,其優(yōu)點是回溯性好,沒有時間限制;缺點是費時,效率低。機械檢索則是利用計算機檢索數(shù)據(jù)庫的過程,其優(yōu)點是速度快;缺點是回溯性不好,并且有時間限制。在機械檢索過程中,網(wǎng)絡文獻檢索最為迅速,是信息檢索的主流。根據(jù)檢索對象的不同,信息檢索又可分為文獻檢索、數(shù)據(jù)檢索和事實檢索。這3種檢索的主要區(qū)別在于數(shù)據(jù)檢索和事實檢索需要檢索出包含在文獻中的信息本身,而文獻檢索檢索出包含所需要信息的文獻即可。二、常用的信息檢索技術是一種較為成熟且流行的檢索技術,其基礎是邏輯運算。常用的邏輯運算符有邏輯與(AND)、邏輯或(OR)和邏輯非(NOT)3種1.布爾邏輯檢索也稱臨近檢索,是用一些特定的位置算符來表達檢索詞與檢索詞之間的順序和詞間距的檢索技術。位置算符主要有(W)算符、(nW)算符、(N)算符、(nN)算符、(F)算符及(S)算符2.位置檢索是預防漏檢、提高查全率的一種常用檢索技術,其含義是,用截斷的詞的一個局部進行檢索,并認為凡是滿足這個詞局部中的所有字符的文獻,都為命中的文獻3.截詞檢索是一種在計算機檢索時,將檢索范圍限定在數(shù)據(jù)庫特定的字段中的檢索技術。常用的檢索字段主要有標題、摘要、關鍵詞、作者、作者單位及參考文獻等4.字段限制檢索三、信息檢索的原理和方法1.信息檢索的原理010203普通法追溯法分段法三、信息檢索的原理和方法是利用書目、文摘、索引等檢索工具進行文獻資料查找的方法是利用已有文獻所附的參考文獻不斷追蹤查找的方法是追溯法和普通法的綜合,它將前兩種方法分期、分段交替使用,直至查到所需資料2.信息檢索的方法任務二搜索引擎設置一、搜索引擎的分類和原理1全文搜索引擎它們從互聯(lián)網(wǎng)中提取各個網(wǎng)站的信息,建立起數(shù)據(jù)庫,并能檢索與用戶查詢條件相匹配的記錄,最后按一定的排列順序返回結果2目錄式搜索引擎它是指以人工方式或半自動方式搜集信息,由搜索引擎的編輯人員查看信息之后,依據(jù)一定的標準對網(wǎng)絡資源進行選擇、評價,由人工形成信息摘要,并將信息置于事先確定的分類框架中而形成的主題目錄3元搜索引擎在接受用戶查詢請求后,通過一個統(tǒng)一的界面,同時在多個搜索引擎上搜索,并將結果返回給用戶1.搜索引擎的分類一、搜索引擎的分類和原理1234搜索引擎通過一種特定軟件跟蹤網(wǎng)頁的鏈接,從一個鏈接“爬到”另一個鏈接,像蜘蛛在蜘蛛網(wǎng)上爬行一樣,所以被稱為“蜘蛛”或“機器人”爬行搜索引擎通過“蜘蛛”跟蹤鏈接爬行到網(wǎng)頁,并將爬行的數(shù)據(jù)存入原始頁面數(shù)據(jù)庫,其中的頁面數(shù)據(jù)與用戶瀏覽器得到的HTML完全一樣抓取存儲搜索引擎將“蜘蛛”抓取回來的頁面,進行各種預處理預處理用戶在搜索框輸入關鍵詞后,排名程序調(diào)用索引庫數(shù)據(jù),計算排名顯示給用戶,排名過程與用戶直接互動排名2.搜索引擎的原理二、常用的搜索引擎是全球最大的中文搜索引擎,它致力于向用戶提供“簡單,可依賴”的信息獲取方式1.百度搜索引擎通過一個統(tǒng)一的用戶界面,幫助用戶在多個搜索引擎中選擇和利用合適的搜索引擎來實現(xiàn)檢索操作,是對分布于網(wǎng)絡中的多種檢索工具的全局控制機制2.360搜索引擎是搜狐公司推出的全球首個第三代互動式中文搜索引擎,它致力于對中文互聯(lián)網(wǎng)信息的深度挖掘,幫助用戶加快信息獲取速度,為用戶創(chuàng)造價值3.搜狗搜索引擎任務三在中國知網(wǎng)中查文獻一、使用知網(wǎng)檢索文獻1.進入知網(wǎng)在瀏覽器地址欄中輸入中國知網(wǎng)的網(wǎng)址,打開中國知網(wǎng)首頁。2.檢索分別單擊首頁上部的“文獻檢索”“知識元檢索”“引文檢索”選項卡,便可進行相應類別的檢索。(1)快速檢索(2)高級檢索(3)專業(yè)檢索(4)作者發(fā)文檢索二、文獻處理知網(wǎng)的注冊用戶可下載和瀏覽文獻全文,系統(tǒng)提供了CAJ和PDF兩種格式4.下載檢索出的結果可按照主題、學科、發(fā)表年度、研究層次、文獻類型、文獻來源、作者、機構和基金進行分組瀏覽3.分組瀏覽檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論