因特網(wǎng)信息資源檢索_第1頁
因特網(wǎng)信息資源檢索_第2頁
因特網(wǎng)信息資源檢索_第3頁
因特網(wǎng)信息資源檢索_第4頁
因特網(wǎng)信息資源檢索_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、信息信息檢索檢索 按目錄類別查找搜索按目錄類別查找搜索:比如比如: :查高考資料查高考資料選擇選擇“教教育育”類目類目沒沒找到找到“高考高考”,就找就找 “教育教育”里里跟接近跟接近“高考高考”的的“中小學教育中小學教育”找到啦!找到啦! 按關鍵詞語查找搜索按關鍵詞語查找搜索:注意啦,要先注意啦,要先在這里輸入關在這里輸入關鍵字!鍵字!現(xiàn)在可以按現(xiàn)在可以按“搜索搜索”按鈕按鈕了了點擊我就點擊我就可以可以進入進入“高考高考”有關內(nèi)容了!有關內(nèi)容了!工作工作原理原理全文搜索引擎的工作原理全文搜索引擎的工作原理搜索引擎是如何搜索信息的呢?你聽說過“網(wǎng)絡機器人”、“爬蟲”、“蜘蛛”嗎?他們只是搜索引擎

2、的一個部分,叫“搜索器”搜索器搜索器搜索引擎的組成索引器索引器檢索器檢索器 搜索器 索引器 輸入查詢表達式 查詢結果顯示 查詢信息排序 采集結果索引數(shù)據(jù)庫檢索器 索引 排序 用戶查詢查詢結果信息采集篩選全文搜索引擎的工作原理:全文搜索引擎的工作原理:百度搜索百度搜索“海南概括海南概括”:百度蜘蛛 輸入“海南概括” 查詢結果顯示 查詢信息排序 檢索器 索引器 索引數(shù)據(jù)庫 索引 排序 用戶查詢查詢結果檢索中國日報網(wǎng) 爬中國在線海南概括頁面網(wǎng)址 抓抽取“海南、概括”等關鍵字 抽取關聯(lián) 工作工作原理原理目錄索引類搜索引擎的工作原理目錄索引類搜索引擎的工作原理(1)人工采集和存儲網(wǎng)絡信息,手工為每個網(wǎng)站

3、確定一個標題,給出大概的描述,建立關鍵字索引,將其放入相應的類目體系中。 (2)網(wǎng)絡目錄: 按主題性質(zhì)分類 以某種分類體系為依據(jù) 形成由信息鏈組成的樹狀結構 即總目錄專題目錄鏈接網(wǎng)站目錄索引目錄索引全文索引全文索引無需輸入關鍵字,可通過瀏覽主題了解某一主題的相關資源 需要關鍵字查詢 人工采集并存儲網(wǎng)絡信息 搜索器在因特網(wǎng)中抓取網(wǎng)頁,索引器提取、組織并建立數(shù)據(jù)庫 網(wǎng)頁內(nèi)容豐富、學術性較強信息資源多、復雜,不易了解主題內(nèi)容維護費用大、更新速度慢 搜索器定期自動“抓”網(wǎng)頁 元搜索引擎元搜索引擎(1995年出現(xiàn))是一種調(diào)用其他多個獨立搜年出現(xiàn))是一種調(diào)用其他多個獨立搜索引擎的引擎,是對多個獨立搜索引擎

4、的整合、調(diào)用、索引擎的引擎,是對多個獨立搜索引擎的整合、調(diào)用、控制和優(yōu)化,能方便地檢索多個搜索引擎,擴大檢索范控制和優(yōu)化,能方便地檢索多個搜索引擎,擴大檢索范圍,提高檢索的全面性。圍,提高檢索的全面性。元元搜索引擎在搜索的時候,用戶只需搜索引擎在搜索的時候,用戶只需提交一次搜索請求提交一次搜索請求,而且可以而且可以同時搜索多個數(shù)據(jù)庫同時搜索多個數(shù)據(jù)庫,并根據(jù)多個搜索引擎的,并根據(jù)多個搜索引擎的檢索結果檢索結果進行二次加工進行二次加工,如對檢索結果進行重排和標明,如對檢索結果進行重排和標明檢索結果來源等,輸出給用戶。檢索結果來源等,輸出給用戶。缺點:缺點:一般支持一般支持andand、oror、

5、notnot等操作,一般只使用等操作,一般只使用簡單、直接的搜索策略,并且檢索速度也慢。簡單、直接的搜索策略,并且檢索速度也慢。元搜索引擎元搜索引擎 當我們查找圖片、音頻等信息時,使用綜合信息檢當我們查找圖片、音頻等信息時,使用綜合信息檢索引擎通常會找到很多無用的信息,所以搜索效率和有索引擎通常會找到很多無用的信息,所以搜索效率和有效性都不高。這時,就可以使用特色搜索引擎效性都不高。這時,就可以使用特色搜索引擎(有時是(有時是綜合信息檢索工具中的一個功能)綜合信息檢索工具中的一個功能),特色檢索工具專門,特色檢索工具專門搜集某一類的信息資源,內(nèi)容豐富,數(shù)據(jù)量大,能幫助搜集某一類的信息資源,內(nèi)容

6、豐富,數(shù)據(jù)量大,能幫助我們迅速找到一些有用的信息我們迅速找到一些有用的信息。 此外還有一些專業(yè)性質(zhì)的搜索引擎,如此外還有一些專業(yè)性質(zhì)的搜索引擎,如sosig是專是專門搜集社會科學信息的信息檢索工具門搜集社會科學信息的信息檢索工具(http:/www.sosig.ac.uk),涉及經(jīng)濟學、哲學、教育、涉及經(jīng)濟學、哲學、教育、政治、環(huán)境科學、心里學、人類學、社會福利、政府管政治、環(huán)境科學、心里學、人類學、社會福利、政府管理和婦女研究等信息資源。理和婦女研究等信息資源。特色信息檢索工具特色信息檢索工具 以以ftp、telnet、usenet等資源為檢索等資源為檢索對象的檢索工具。對象的檢索工具。 如北大天網(wǎng)、如北大天網(wǎng)、archic等。等。其他信息檢索工具其他信息檢索工具發(fā)展發(fā)展趨勢趨勢傳統(tǒng)的多媒體數(shù)據(jù)庫中,除了文本和數(shù)字還包括圖形、圖象、聲音、視頻、動畫等各種媒體組合。但多媒體信息具有豐富的內(nèi)涵,如:圖象的顏色、紋理、形狀,動畫中的運動、聲音和音調(diào)等。例如歌曲的旋律、音調(diào)、音質(zhì)等難以用文字描述。這正是基于內(nèi)容的音頻檢索需要研究和解決的問題,以期達到更深的檢索層次和更好的檢索效果。專業(yè)垂直類搜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論