粵教版選修三因特網的應用 因特網上的信息檢索_第1頁
粵教版選修三因特網的應用 因特網上的信息檢索_第2頁
粵教版選修三因特網的應用 因特網上的信息檢索_第3頁
粵教版選修三因特網的應用 因特網上的信息檢索_第4頁
粵教版選修三因特網的應用 因特網上的信息檢索_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

3.2因特網上的信息檢索你認為真正的網絡高手是怎樣的?內容概要文本搜索使用單個關鍵詞進行搜索使用兩個及兩個以上關鍵詞進行搜索直接輸入多個關鍵詞,關鍵詞之間用空格,這樣就表示“AND”關系;用減號“-”表示“非”,用于表示要求搜索結果不包含某些特定信息;加上雙引號。這在查找名言警句或專有名詞時顯得格外有用搜索特殊格式的文件目前可搜索的文件格式:DOC、PPT、XLS、TXT文件;最精彩的,可搜索Flash文件:SWF文件、gif動態(tài)圖片文件方法:關鍵詞filetype:

關鍵字.文件格式或關鍵字.文件格式搜索引擎的產生

隨著網絡中信息爆炸性地增長,信息分散儲存、數量多,網絡用戶想找到所需的信息如同大海撈針。為了滿足大眾的信息檢索需求,從事專業(yè)信息檢索的公司和搜索網站應運而生。搜索引擎是因特網上信息檢索的軟件系統。最早的搜索引擎出現于1994年4月。斯坦福大學的兩名博士生,美籍華人楊致遠和美國人DavidFilo共同創(chuàng)辦了超級目錄索引雅虎(Yahoo),并成功地使搜索引擎的概念深入人心。從此搜索引擎進入了高速發(fā)展時期。搜索引擎的分類及原理按照信息搜集方法和服務提供方式的不同,搜索引擎系統可以分為三大類:1.

目錄式搜索引擎:以人工方式或半自動方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網站,提供目錄瀏覽服務和直接檢索服務。該類搜索引擎因為加入了人的智能,所以信息準確、導航質量高,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。這類搜索引擎的代表是:Yahoo、LookSmart、OpenDirectory、GoGuide等。2.

全文搜索引擎(機器人搜索引擎):由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互聯網中搜集和發(fā)現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸入檢索索引庫,并將查詢結果返回給用戶。服務方式是面向網頁的全文檢索服務。該類搜索引擎的優(yōu)點是信息量大、更新及時、毋需人工干預,缺點是返回信息過多,有很多無關信息,用戶必須從結果中進行篩選。這類搜索引擎的代表是:AltaVista、NorthernLight、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國內代表為:“天網”、悠游、OpenFind等。3.元搜索引擎:這類搜索引擎沒有自己的數據,而是將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結果進行重復排除、重新排序等處理后,作為自己的結果返回給用戶。服務方式為面向網頁的全文檢索。這類搜索引擎的優(yōu)點是返回結果的信息量更大、更全,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等。搜索引擎技術的發(fā)展趨勢1.提高搜索引擎對用戶檢索提問的理解。2.對檢索結果進行進一步處理。3.確定搜索引擎信息收集范圍,提高搜索引擎的針對性。2.索引器對所搜集的信息進行提取和組織,并建立索引庫。1.搜索器在因特網中發(fā)現、搜集網頁信息。3.由檢索器根據用戶輸入的查詢關鍵詞,在索引中快速檢出相關文檔,進行文檔與查詢內容相關比較,對人、檢出的結果進行排序、并將查詢返回給用戶。4.用戶接口:用戶接口的作用是輸入用戶查詢、顯示查詢結果、提供用戶相關性反饋機制。3.2.3搜索引擎的工作過程一個搜索引擎由搜索器、索引器、檢索器和用戶接口等四個部分組成搜索引擎的工作過程輸入查詢表達式檢索器查詢結果顯示查詢信息排序索引器搜索器采集結果索引數據庫用戶查詢查詢結果信息采集索引排序篩選用戶接口目錄索引類搜索引擎的工作原理一般采用人工方式采集和存儲網絡信息,依靠手工為每個網站確定一個標題,并給出大概的描述,建立關鍵字索引,將其放入相應的類目體系中。用戶自己的錯誤初學者搜索時容易犯的6個低級錯誤和解決方法常見錯誤1:錯別字經常發(fā)生的一種錯誤是,你輸入的關鍵詞含有錯別字,改正了就好。常見錯誤2:關健詞太常見搜索引擎對常見詞的搜索存在缺陷,因為這些詞曝光率太高了,以至于出現在成百萬網頁中,使得它們事實上不能被用來幫你找到什么有用的內容。比如說搜索“電話”。常見錯誤3:多義詞要小心使用多義詞,比如搜索“java”,你要找的信息究竟是太平洋上的一個島、一種著名的咖啡、還是一種計算機語言常見錯誤4:不會輸關鍵詞,想要什么輸什么

搜索失敗的另一個常見原因是類似這樣的搜索:“現代愛情故事歌詞”常見錯誤5:在錯誤的地方搜索

有些信息不適合搜索,應該直接到網站瀏覽,如論壇的內容。常見錯誤6:停用詞

停用詞主要見于英文搜索引擎中,指的是使用過于頻繁的單詞,如“is”、“i”、“what”、“it”等。一些搜索引擎在它的網頁庫里碰到這些詞時不會搜用戶自己的錯誤如何

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論