版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
3.2因特網(wǎng)信息資源檢索一、因特網(wǎng)信息檢索方法基于超文本/超媒體的信息瀏覽通過一個網(wǎng)站中的鏈接去訪問另外一個信息資源基于目錄服務的信息查詢(目錄式搜索)基于搜索引擎的信息檢索(全文搜索)因特網(wǎng)上的信息檢索方法基于超文本/超媒體的信息瀏覽基于目錄服務的信息查詢基于搜索引擎的信息檢索搜索引擎是什么?A.網(wǎng)頁B.網(wǎng)站C.一組程序
D.access√√二、搜索引擎的發(fā)展與分類1、產(chǎn)生為了解決信息分散存儲、數(shù)量多、冗余度大等問題,產(chǎn)生了專業(yè)信息搜索的公司和搜索網(wǎng)站最早的搜索引擎出現(xiàn)于1994年4月,美籍華人楊致遠和一個美國人共同創(chuàng)辦了超級目錄索引雅虎1994年起搜索引擎發(fā)展舉例產(chǎn)生時間搜索工具開發(fā)組或公司網(wǎng)站特點1994.4Yahoo斯坦福大學早期Yahoo數(shù)據(jù)是手工輸入1995.12AltavistaDEC公司第一個支持自然語言關鍵詞和高級檢索的引擎1997.10北大天網(wǎng)北大計算機研究室收錄網(wǎng)頁約6000萬,有強大的FTP搜索功能1998.9Google斯坦福大學提供網(wǎng)頁評級動態(tài)摘要、網(wǎng)頁快照,每天更新、多文檔格式支持2001.8Baidu百度公司快照、預覽、相關詞搜索、mp3、flash搜索功能2、搜索引擎的分類類型定義舉例目錄搜索通過人工整理分類,網(wǎng)絡信息資源按照主題分類,并以層次樹狀形式進行組織,形成分類目錄樹。Eg:雅虎、新浪
選擇“教育”類目
按目錄類別查找搜索:比如:查高考資料沒找到“高考”,就找比“教育”跟接近“高考”的“中小學教育”找到啦!優(yōu)點:實實在在找到用戶所關心內(nèi)容分類,網(wǎng)站導航質(zhì)量高。缺點:分類不夠細,需要人工介入,目錄的維護量大,更新可能不夠及時。目錄式搜索引擎的特點2、搜索引擎的分類類型定義舉例全文搜索使用關鍵詞到預先建好的或租用其它索引數(shù)據(jù)庫查詢信息的一類搜索引擎.
Eg:goole、百度
全文搜索引擎輸入關鍵字查詢信息排序索引數(shù)據(jù)庫用戶查詢查詢結(jié)果檢索搜索
按關鍵詞語查找搜索:注意啦,要先在這里輸入關鍵字!現(xiàn)在可以按“搜索”按鈕了點擊我就可以進入“高考”有關內(nèi)容了!全文搜索引擎的特點優(yōu)點:信息量大、更新較及時、不需人工干預。缺點:返回信息過多,有很多無關信息。類型定義舉例元搜索引擎元搜索引擎就是通過一個統(tǒng)一的用戶界面向多個搜索引擎同時遞交用戶查詢,返回結(jié)果去重合并,綜合結(jié)果返回給用戶.
優(yōu)點:結(jié)果精確、全面,匯聚各大搜索引擎的結(jié)果。
缺點:檢索速度較慢、犧牲個別搜索引擎性能,并非1+1=2
注意的問題搜索引擎是因特網(wǎng)上信息檢索的軟件系統(tǒng)。搜索引擎并不真正搜索互聯(lián)網(wǎng),它搜索的實際上是預先整理好的網(wǎng)頁索引數(shù)據(jù)庫。搜索引擎,也不能真正理解網(wǎng)頁上的內(nèi)容,它只能機械的匹配網(wǎng)頁上的文字。元搜索引擎示意圖特色信息檢索工具這類檢索工具專門收集某一類的信息資源。例:MIDI文件檢索工具特色信息檢索工具地圖檢索其他信息檢索工具以FTP、Telnet、Usenet等資源為檢索對象。搜索引擎分類檢索方法
優(yōu)點缺點舉例全文搜索引擎目錄式搜索引擎元搜索引擎其他非主流類型搜索引擎舉例
需要關鍵詞查詢信息量大(面向具體網(wǎng)頁內(nèi)容)、更新及時,不需要人工干預返回信息量過多,包含許多無關信息按目錄瀏覽主題和主題相關的內(nèi)容實實在在找到用戶關心的內(nèi)容分類(面向網(wǎng)站分類),網(wǎng)站導航質(zhì)量高,分類不夠細,分類目錄的建立需要人工介入,目錄維護量大,信息更新不及時需要關鍵詞查詢向多個搜索引擎提交查詢,返回經(jīng)過去重并重新排序的綜合結(jié)果時間稍長(實際效果不太理想)Google、百度雅虎
Meta-Fisher信息檢索代理、特種搜索引擎分別用目錄式搜索引擎、全文搜索引擎、元搜索引擎搜索,并填寫下表中的信息進行比較搜索內(nèi)容搜索引擎名稱搜索時間搜索數(shù)量環(huán)境保護上海世博會動動手目錄式搜索引擎:全文搜索引擎:元搜索引擎:參考資源3、搜索引擎技術的發(fā)展(1)提高搜索引擎對用戶檢索提問的理解(2)對檢索結(jié)果做進一步的處理(3)確定搜索引擎信息搜索范圍,提高搜索引擎的針對性全文搜索引擎的工作過程是什么?三、搜索引擎的工作過程①從互聯(lián)網(wǎng)上“抓取”網(wǎng)頁②建立索引數(shù)據(jù)庫③在索引數(shù)據(jù)庫中搜索排序④用戶接口:查詢和響應
四、網(wǎng)上信息檢索技巧
1、使用空格
輸入更多的關鍵詞,只要在關鍵詞中間留空格, 這相當于多個關鍵詞之間的關系是邏輯“與”.
練習1,查找“出門在外”的歌曲
2、使用減號.
要避免搜索某個詞語,可以在這個詞前面加上 一個減號(“-”,
英文字符).但在減號之前必須留一空 格.如要了解搜索引擎歷史,可以這樣輸入關鍵字:搜 索引擎
宗教
-佛教
-基督教
3、添加英文雙引號.
雙引號中的詞語在查詢到的文檔中將作為一個整體出現(xiàn).這一方法在查找名言警句或?qū)S忻~時顯得格外有用.
練習2,請你比較應用下面兩組關鍵詞的搜索結(jié)果有什么不同
1、理科的學習方法
2、“理科的學習方法”
4、查找特定格式的文件.
Google可以
直接搜索13種非HTML文件.其中包括Flash的
swf
文檔,Microsoft
Office的(doc,
ppt,
xls,
rtf)
,pdf和其它類型文檔.格式是:關鍵詞
filetype:類型名.
(梅花三弄filetype:swf)
5、標題搜索.
當我們需要搜索一篇關于某個主題的文章時,可以用以下的關鍵字:“intitle:關鍵字”.如“intitle:南瓜餅”
對比“intitle:南瓜餅”和“南瓜餅”的查找結(jié)果
6、網(wǎng)頁快照.
在訪問網(wǎng)站時,會將看過的網(wǎng)頁復制一份網(wǎng)頁快照,以備在找不到原來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人股份無償轉(zhuǎn)讓與公司治理協(xié)議4篇
- 二零二五年度民宿客棧資產(chǎn)租賃管理合同樣本4篇
- 2025年裝修工程環(huán)境保護責任書2篇
- 通訊錄系統(tǒng)c課程設計
- 2025年智能穿戴設備銷售與分銷合同范本
- 魔t的設計課程設計
- 2025年鐵路貨物運輸操作規(guī)范合同6篇
- 二零二五年度面條產(chǎn)品綠色包裝研發(fā)與應用合同4篇
- 二零二五年美容院美容院美容院員工績效考核及薪酬合同4篇
- 2025年度個人房屋裝修貸款擔保合同范本12篇
- 汽車配件購銷合同范文
- 貴州省2024年中考英語真題(含答案)
- 施工項目平移合同范本
- 北師大版八年級上冊數(shù)學期中綜合測試卷(含答案解析)
- 幼兒園創(chuàng)意美勞培訓
- 同濟大學第四版線性代數(shù)課后習題答案
- 醫(yī)療領域人工智能技術應用的倫理與法規(guī)
- 工地春節(jié)停工復工計劃安排
- 美容面部皮膚知識課件
- 胰島素注射的護理
- 腦梗死健康宣教的小講課
評論
0/150
提交評論