![第7章-網(wǎng)絡(luò)信息資源檢索與利用_第1頁(yè)](http://file4.renrendoc.com/view/a7f456c2e24875ac0cf8abb66034943a/a7f456c2e24875ac0cf8abb66034943a1.gif)
![第7章-網(wǎng)絡(luò)信息資源檢索與利用_第2頁(yè)](http://file4.renrendoc.com/view/a7f456c2e24875ac0cf8abb66034943a/a7f456c2e24875ac0cf8abb66034943a2.gif)
![第7章-網(wǎng)絡(luò)信息資源檢索與利用_第3頁(yè)](http://file4.renrendoc.com/view/a7f456c2e24875ac0cf8abb66034943a/a7f456c2e24875ac0cf8abb66034943a3.gif)
![第7章-網(wǎng)絡(luò)信息資源檢索與利用_第4頁(yè)](http://file4.renrendoc.com/view/a7f456c2e24875ac0cf8abb66034943a/a7f456c2e24875ac0cf8abb66034943a4.gif)
![第7章-網(wǎng)絡(luò)信息資源檢索與利用_第5頁(yè)](http://file4.renrendoc.com/view/a7f456c2e24875ac0cf8abb66034943a/a7f456c2e24875ac0cf8abb66034943a5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第7章
網(wǎng)絡(luò)信息資源檢索與利用
搜索引擎搜索引擎(searchengine),1995年開始
搜索引擎指自動(dòng)從因特網(wǎng)搜集信息,經(jīng)過一定整理以后,提供給用戶進(jìn)行查詢的系統(tǒng)。因特網(wǎng)上的信息浩瀚萬(wàn)千,而且毫無(wú)秩序,所有的信息象汪洋上的一個(gè)個(gè)小島,網(wǎng)頁(yè)鏈接是這些小島之間縱橫交錯(cuò)的橋梁,而搜索引擎,則為用戶繪制一幅一目了然的信息地圖,供用戶隨時(shí)查閱。搜索引擎站---“網(wǎng)絡(luò)門戶”1、搜索引擎的工作原理
信息的收集處理信息的檢索輸出2、搜索引擎的分類
目錄式搜索引擎:以人工方式或半自動(dòng)方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因?yàn)榧尤肓巳说闹悄?,所以信息?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時(shí)。這類搜索引擎的代表是:yahoo!、Galaxy、OpenDirectory……
Shou(搜狐)、Sina(新浪)….目錄式搜索引擎機(jī)器人搜索引擎由一個(gè)稱為蜘蛛(Spider)的機(jī)器人程序以某種策略自動(dòng)地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫(kù),并將查詢結(jié)果返回給用戶。服務(wù)方式是面向網(wǎng)頁(yè)的全文檢索服務(wù)。該類搜索引擎的優(yōu)點(diǎn)是信息量大、更新及時(shí)、毋需人工干預(yù),缺點(diǎn)是返回信息過多,有很多無(wú)關(guān)信息,用戶必須從結(jié)果中進(jìn)行篩選。這類搜索引擎的代表是:AltaVista、NorthernLight、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國(guó)內(nèi)代表為:"天網(wǎng)"、悠游、OpenFind等。
元搜索引擎元搜索引擎:這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。服務(wù)方式為面向網(wǎng)頁(yè)的全文檢索。這類搜索引擎的優(yōu)點(diǎn)是返回結(jié)果的信息量更大、更全,缺點(diǎn)是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等。
常用的一些搜索引擎網(wǎng)址(一)http://雅虎是中國(guó)最著名的目錄索引,是搜索引擎開山鼻祖之一。它收錄了全球資訊網(wǎng)上數(shù)以萬(wàn)計(jì)的中文網(wǎng)站,不論你要找的網(wǎng)站是用國(guó)標(biāo)碼簡(jiǎn)體字、大五碼繁體字還是圖形中文,都可以在這里找到。1999年9月檢索途徑:通過分類目錄、關(guān)鍵詞檢索檢索方法與技巧:支持布爾邏輯檢索(不支持“OR”)、可以使用引號(hào),強(qiáng)調(diào)“+”、“-”、指定關(guān)鍵字出現(xiàn)的段落(加t:、加u:)
英語(yǔ)不好也可以輕松瀏覽英文網(wǎng)頁(yè)
檢索結(jié)果:根據(jù)關(guān)聯(lián)程度排序同時(shí)列出“相關(guān)……”其它:與Google合作常用的一些搜索引擎網(wǎng)址(二)
http://1998年創(chuàng)立,搜狐“分類與搜索”已收錄網(wǎng)站四十多萬(wàn),已形成龐大的中文網(wǎng)站數(shù)據(jù)庫(kù)。搜狐的目錄導(dǎo)航式搜索引擎完全是由人工加工而成,相比機(jī)器人加工的搜索引擎來講具有很高的精確性、系統(tǒng)性和科學(xué)性。
檢索途徑:通過分類目錄、關(guān)鍵詞檢索
檢索方法與技巧:支持布爾邏輯檢索、“-”、“&”、“/”、“()”、空格檢索結(jié)果:根據(jù)關(guān)聯(lián)程度排序;返回五種分類結(jié)果其它:直通車;搜狐黃頁(yè)常用的一些搜索引擎網(wǎng)址(三)http://
1997年,(簡(jiǎn)體中文)提供有類目檢索和網(wǎng)站檢索兩種方式。支持AND和“-”等條件查詢。以搜索精度高、速度快成為最受歡迎的搜索引索,是目前搜索的領(lǐng)軍人物。檢索方法與技巧:模塊分類、關(guān)鍵詞檢索;支持布爾邏輯檢索(自動(dòng)添加AND),支持“OR”,“-”前面加空格;忽略常見詞;對(duì)通配符支持有限檢索特色:網(wǎng)頁(yè)快照、手氣不錯(cuò);相似網(wǎng)頁(yè)、查詢電話號(hào)碼、查找PDF文件、股票報(bào)價(jià)、查找字典釋意、用Google查找地圖、工具條服務(wù)、網(wǎng)頁(yè)翻譯、單詞糾錯(cuò)、繁簡(jiǎn)轉(zhuǎn)換;使用偏好常用的一些搜索引擎網(wǎng)址(四)
中國(guó)提供搜索引擎的主要網(wǎng)站中,超過80%由百度提供。1999年底,百度成立于美國(guó)硅谷,2000年百度回中國(guó)發(fā)展。是國(guó)內(nèi)唯一商業(yè)化的全文搜索引擎,提供搜狐、新浪、263、TOM等站點(diǎn)的搜索服務(wù)。檢索方法與技巧:模塊分類、關(guān)鍵詞檢索;要求“一字不差”,支持布爾邏輯檢索(可以用空格代替AND/+);可以使用檢索語(yǔ)法檢索特色:
百度快照、自動(dòng)糾錯(cuò)、百度搜霸;使用偏好;百度與google比較搜索英文不必說用google,搜索中文呢?很多人并不了解它們更新的情況,google發(fā)展早,因而它貯存了大量舊的信息,百度發(fā)展遲,信息較新。更新速度:對(duì)中文google一般半月至一月一更新,而且僅搜索到三級(jí)鏈接,三級(jí)以下便不在搜索,那么我如何看到最新的google搜索的結(jié)果呢?這個(gè)站點(diǎn):/,可見google采用不同服務(wù)器逐步更新的。百度的更新較快,半月一次,最快一周。百度和google語(yǔ)法的應(yīng)用找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT這些文件名都是網(wǎng)友想找的重點(diǎn),至于各是什么類型文件,請(qǐng)上網(wǎng)查一下便知道了,這里不多說了。尤其老板讓你做個(gè)powerpoint,找不到圖怎么辦?用google去搜索?;舅阉髡Z(yǔ)法——查找文件方法是利用語(yǔ)法filetype:后綴名。如找PDF文件,在正常關(guān)鍵詞后面加filetype:PDF即可,搜索結(jié)果全是PDF文件。找特定題目的網(wǎng)頁(yè)語(yǔ)法intitle:網(wǎng)站查找友情鏈接:
"link:"(英文單字link后加冒號(hào))用于搜索鏈接到某個(gè)URL地址的網(wǎng)頁(yè)。可以了解有哪些網(wǎng)頁(yè)把鏈接指向您的網(wǎng)頁(yè)。基本搜索語(yǔ)法——查找站點(diǎn)查找特定站點(diǎn):
site:www.*.com如金庸古龍site:
但不可加入http://或/這類,否則是錯(cuò)的。查找美國(guó)教育網(wǎng)上的宇宙大爆炸jpg圖片搜索:“BIGBANGfiletype:jpg
site:edu”結(jié)果:搜索有關(guān)BIGBANGfiletype:jpg
site:edu
的圖片Site可將搜索定位于某一個(gè)域名上,有利于縮小搜索范圍,提高搜索效率。如keywordssite:edu,效果很好!可以方便地搜索到各大學(xué)內(nèi)有用的資源。site:tw,site:edu.tw,site:.......
這是定位于國(guó)家或地區(qū),將搜索局限于某些國(guó)家或地區(qū),或加上edu,則是這些國(guó)家或地區(qū)的大學(xué),效果自然更好。特殊語(yǔ)法:inurl
“inurl”語(yǔ)法返回的網(wǎng)頁(yè)鏈接中包含第一個(gè)關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁(yè)文檔中。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁(yè)名稱中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語(yǔ)法找到這些相關(guān)資源鏈接,然后,用第二個(gè)關(guān)鍵詞確定是否有某項(xiàng)具體資料。INURL語(yǔ)法和基本搜索語(yǔ)法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。
示例:查找MIDI曲“滄海一聲笑”
搜索:inurl:midi
滄海一聲笑結(jié)果:已搜索有關(guān)inurl:midi
滄海一聲笑的中文(簡(jiǎn)體)網(wǎng)頁(yè)。
注意:“inurl:”后面不能有空格,GOOGLE也不對(duì)URL符號(hào)如“/”進(jìn)行搜索。例如,GOOGLE會(huì)把“cgi-bin/phf”中的“/”當(dāng)成空格處理。google其它功能—查縮略詞的全稱利用google查縮略詞的全稱,如果寫作時(shí)突然忘了某個(gè)縮略詞的全稱,當(dāng)時(shí)手頭若有金山詞霸等軟件則是易事,若無(wú)可考慮使用google,將其中文名與其縮略名作為關(guān)鍵詞搜索,效果很好.google其它功能——查英文單詞的中文名稱google是最全的英中詞典,你找到一個(gè)英文詞,卻不知中文怎么辦?google其它功能——搜索電話如果想知道某個(gè)公司的電話,往往許多人喜歡這樣選關(guān)鍵詞:公司名稱tel,結(jié)果得到的根本不是你需要的。如果你知道這個(gè)公司的性質(zhì)或?qū)儆谑裁吹胤降模瑒t可以這樣搜索:區(qū)號(hào)公司名,這比上述關(guān)鍵詞要有效得多,這也涉及到搜索效率的問題。常用的一些搜索引擎網(wǎng)址(五)元搜索引擎,1995年,Washington大學(xué)開發(fā),2000年被Infospace收購(gòu)。檢索方法與技巧:模塊分類、關(guān)鍵詞檢索;支持布爾邏輯檢索;可以使用檢索語(yǔ)法;搜索引擎的查詢技巧
分析研究對(duì)象,選用搜索引擎
確定搜索途徑,使用不同方式
正確選用搜索引擎的搜索選項(xiàng)
正確選用搜索引擎的各項(xiàng)搜索功能
根據(jù)反饋,修改檢索
縮小搜索范圍:利用二次搜索(重新查詢、在結(jié)果中再查、在結(jié)果中去除)、使用檢索語(yǔ)法構(gòu)造恰當(dāng)?shù)臋z索表達(dá)式、選用正確的關(guān)鍵詞。擴(kuò)大搜索范圍:使用同義詞或近義詞、使用檢索語(yǔ)法or和截詞檢索、使用多個(gè)搜索引擎和元搜索引擎如何提高查全率?選擇上位詞和相關(guān)詞;如:查找關(guān)于孫中山的文獻(xiàn),先用孫中山查,再用孫文、國(guó)父查找。調(diào)節(jié)檢索式的網(wǎng)羅度,刪除不必要的組面,如and(并且);進(jìn)行族性檢索(分類檢索或用or
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年患者隱私保護(hù)協(xié)議與策劃
- 2025年企業(yè)銷售人員招聘合同范例
- 2025年企業(yè)人員臨時(shí)借調(diào)合同范文
- 2025年居民安置過渡性協(xié)議
- 2025年個(gè)人流轉(zhuǎn)養(yǎng)殖水面使用權(quán)協(xié)議
- 2025年共享發(fā)展市場(chǎng)拓展協(xié)議
- 2025年產(chǎn)業(yè)園區(qū)企業(yè)使用條款協(xié)議
- 2025年醫(yī)療設(shè)備更新協(xié)議文本
- 2025年醫(yī)院食堂后勤服務(wù)合同標(biāo)準(zhǔn)格式
- 農(nóng)業(yè)合作社土地使用權(quán)入股框架協(xié)議
- 2025年度化妝品電商平臺(tái)流量互換銷售合作合同
- 2025年中國(guó)陪診服務(wù)行業(yè)現(xiàn)狀、發(fā)展環(huán)境及投資前景分析報(bào)告
- 2024年可行性研究報(bào)告投資估算及財(cái)務(wù)分析全套計(jì)算表格(含附表-帶只更改標(biāo)紅部分-操作簡(jiǎn)單)
- 國(guó)際貿(mào)易地理 全套課件
- 2024年云南省貴金屬新材料控股集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 少兒羽毛球培訓(xùn)課件
- 《鋼鐵是怎樣煉成的》選擇題100題(含答案)
- GB/T 3452.4-2020液壓氣動(dòng)用O形橡膠密封圈第4部分:抗擠壓環(huán)(擋環(huán))
- 部編版小學(xué)語(yǔ)文三年級(jí)(下冊(cè))學(xué)期課程綱要
- 《國(guó)家電網(wǎng)公司十八項(xiàng)電網(wǎng)反事故措施(試行)》實(shí)施細(xì)則
- 鋼絲網(wǎng)架珍珠巖夾心板安裝方法
評(píng)論
0/150
提交評(píng)論