版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第五講網(wǎng)絡(luò)信息資源檢索主要內(nèi)容1.搜索引擎2.FTP信息資源3.BBS信息資源4.USENET/Newsgroup信息資源5.LISTSERV/Mailinglist信息資源6.其他網(wǎng)絡(luò)資源搜索引擎搜索引擎發(fā)展搜索引擎原理搜索引擎主要技術(shù)搜索引擎系統(tǒng)分類搜索引擎的應(yīng)用搜索引擎發(fā)展1990年以前,沒有任何人能搜索互聯(lián)網(wǎng)所有搜索引擎的祖先:Archie最早現(xiàn)代意義上的搜索引擎出現(xiàn)于1994年7月(Lycos
Yahoo!)搜索引擎原理搜索引擎的原理,可以看做三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁→建立索引數(shù)據(jù)庫→在索引數(shù)據(jù)庫中搜索排序搜索引擎并不真正搜索互聯(lián)網(wǎng),它搜索的實際上是預(yù)先整理好的網(wǎng)頁索引數(shù)據(jù)庫搜索引擎,也不能真正理解網(wǎng)頁上的內(nèi)容,它只能機械的匹配網(wǎng)頁上的文字搜索引擎只能搜到它網(wǎng)頁索引數(shù)據(jù)庫里儲存的網(wǎng)頁文字信息。如果搜索引擎的網(wǎng)頁索引數(shù)據(jù)庫里應(yīng)該有而你沒有搜出來,那是你的能力問題,學(xué)習(xí)搜索技巧可以大幅度提高你的搜索能力搜索引擎技術(shù)?algorithms
?artificialintelligence
?compileroptimization
?computerarchitecture
?computergraphics
?datacompression
?datamining
?filesystemdesign
?geneticalgorithms
?informationretrieval
?machinelearning
?naturallanguageprocessing
?operatingsystems
?profiling
?robotics
?textprocessing
?userinterfacedesign
?webinformationretrieval
?andmore!搜索引擎系統(tǒng)分類按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類:1.全文搜索引擎(Google,百度,中搜)2.目錄索引(Yahoo,DMOZ,LookSmart)3.元搜索引擎(METASearchEngine)(Dogpile)http:///http:///搜索引擎的應(yīng)用網(wǎng)頁搜索特色搜索學(xué)術(shù)搜索商業(yè)搜索網(wǎng)頁搜索(Google)Google檢索網(wǎng)頁數(shù)量達42.8億,搜索引擎中排名第一;網(wǎng)頁圖片8.8億張
.Google支持多達132種語言,包括簡體中文和繁體中文;Google網(wǎng)站只提供搜索引擎功能,沒有花里胡哨的累贅;Google速度極快,超過50000臺服務(wù)器;Google的專利網(wǎng)頁級別技術(shù)PageRank能夠提供準(zhǔn)確率極高的搜索結(jié)果;Google智能化的“手氣不錯”功能,提供可能最符合要求的網(wǎng)站;Google的“網(wǎng)頁快照”功能,能從Google服務(wù)器里直接取出緩存的網(wǎng)頁。Google具有獨到的圖片搜索功能;Google具有強大的新聞組搜索功能;Google具有二進制文件搜索功能(PDF,DOC,SWF等);Google還有很多尚在開發(fā)階段的令人吃驚的設(shè)想和功能。初階搜索搜索引擎最基本的語法:Google分別用“”(空格)、“-”和“OR”表示“與”“非”和“或”雜項語法通配符問題關(guān)鍵字的字母大小寫搜索整個短語或者句子搜索引擎忽略的字符以及強制搜索進階搜索
面已經(jīng)探討了Google的一些最基礎(chǔ)搜索語法。通常而言,這些簡單的搜索語法已經(jīng)能解決絕大部分問題了。不過,如果想更迅速更貼切找到需要的信息,你還需要了解更多的東西對搜索的網(wǎng)站進行限制site:如九寨溝site:在某一類文件中查找信息filetype:目前已經(jīng)可以支持13種文件類型,如doc,ppt,xls,swf,ps,jpg,gif,pdf如4Gfiletype:doc搜索的關(guān)鍵字包含在URL鏈接中inurl:如virusinurl:secutiry搜索的關(guān)鍵字包含在網(wǎng)頁標(biāo)題中intitle:如intitle:交通規(guī)劃filetype:pdfinurl:示例:查找新浪網(wǎng)上九寨溝的圖片
搜索:“九寨溝site:”示例:關(guān)于4G的word文檔搜索:4Gfiletype:doc示例:網(wǎng)址中含security的關(guān)于virus的網(wǎng)頁搜索:virusinurl:secutiry示例:教育網(wǎng)中標(biāo)題含有“交通規(guī)劃”的格式為pdf的文章搜索:intitle:交通規(guī)劃filetype:pdfinurl:目錄檢索
如果不想搜索廣泛的網(wǎng)頁,而是想尋找某些專題網(wǎng)站,可以訪問Google的分類目錄“http://directory.G/”,分類的網(wǎng)站目錄一般由專人負(fù)責(zé),分類明確,信息集中目前Google使用的分類目錄采用了ODP的內(nèi)容另外,Google根據(jù)其專業(yè)的“網(wǎng)頁級別”(PageRank)技術(shù)對目錄中登錄的網(wǎng)站進行了排序,可以讓一般的檢索更具高效率學(xué)術(shù)搜索大學(xué)搜索Google的其他杰出功能
網(wǎng)頁快照
單詞英文解釋
網(wǎng)頁翻譯
單詞糾錯
繁簡轉(zhuǎn)換
搜索結(jié)果過濾
百度學(xué)術(shù)搜索引擎學(xué)術(shù)搜索引擎Scirus是迄今為止因特網(wǎng)上最全面的科技專用搜索引擎,曾被著名的《搜索引擎觀察》(SearchEngineWatch)評為“最佳專業(yè)搜索引擎”。
Scirus覆蓋了167million個以上與科技相關(guān)的網(wǎng)頁
BasicSearch基本語法+-“”ANDORANDNOTau:ti:jo:ke:url:af:dom:JournalSources:ScienceDirect
BioMedCentral
PubmedWebSources
特色搜索FTP搜索引擎NewsGroup搜索引擎圖象搜索引擎新聞搜索引擎其他特色搜索引擎FTP搜索引擎FTP搜索引擎的功能是搜集匿名FTP服務(wù)器提供的目錄列表以及向用戶提供文件信息的查詢服務(wù)。由于FTP搜索引擎專門針對各種文件,因而相對WWW搜索引擎,尋找軟件、圖像、電影和音樂等文件時,使用FTP搜索引擎更加便捷北大天網(wǎng)中英文FTP搜索引擎
http:///http:///
號稱全球最大的FTP搜索引擎NewsGroup搜索引擎新聞?wù)搲阉饕媸菍iT搜索Newsgroups等信息的引擎,可能用此工具查詢自己感興趣的新聞?wù)搲陀懻摻M
Google搜索引擎http://盛名的新聞組搜索引擎
http://
CyberFiberNewsgroups
-DirectoryofnewsgroupsontheInternet.圖象搜索引擎基于網(wǎng)頁的圖像搜索
圖像元搜索引擎
基于圖片庫的圖像搜索
優(yōu)秀的圖像搜索引擎
GoogleYahoo畫廊
Yahoo圖像搜索引擎http:///新聞搜索引擎http:///其他特色搜索引擎尋人多媒體查詢個人信息查詢地圖及相關(guān)信息尋人搜索引擎多媒體搜索引擎查詢地圖信息
其他信息查詢2.FTP信息資源FTP(FileTransferProtocol)是TCP/IP協(xié)議的一種,它是在Internet網(wǎng)上使用最廣泛的一種服務(wù),
可被用來在兩臺位于Internet網(wǎng)上的計算機之間傳輸(上傳或下載)文件。登錄成功后,可以進行文件搜索和文件傳送的操作。使用FTP幾乎可以傳送任何類型的文件。獲取FTP信息資源的主要方法使用FTP搜索引擎搜索FTP站點利用專用FTP軟件中“站點管理器”FTP搜索引擎FTP搜索引擎的功能是搜集匿名FTP服務(wù)器提供的目錄列表以及向用戶提供文件信息的查詢服務(wù)。由于FTP搜索引擎專門針對各種文件,因而相對WWW搜索引擎,尋找軟件、圖像、電影和音樂等文件時,使用FTP搜索引擎更加便捷。國內(nèi)著名FTP搜索引擎
(1)北大天網(wǎng)FTP搜索
http:///(2)清華星空搜索
http:///(3)復(fù)旦大學(xué)歪酷強力FTP搜索引擎
/(4)西交大思源搜索
http:///(5)南航歪歪搜索
http:///(6)中科大天狼搜索
http:///國外著名的FTP搜索引擎(1)http://
號稱全球最大的FTP搜索引擎(2)http:///(3)http://
(4)訪問FTP信息資源的主要方法(1)FTP內(nèi)部命令
(2)利用Web瀏覽器訪問FTP(3)利用專用FTP軟件(Cute-Ftp,Bp-Ftp,WS-Ftp),不用記復(fù)雜的命令。使用ftp命令使用web瀏覽器方式使用客戶端軟件(以Cuteftp為例)3、電子公告牌BBSBulletinBroardSystems,一種電子信息服務(wù)系統(tǒng)。早期BBS由教育機構(gòu)或研究機構(gòu)管理,現(xiàn)在多數(shù)網(wǎng)站都建立了自己的BBS系統(tǒng)。服務(wù)方式:一是需注冊(免費或收費);二是公開,允許免費連接。獲取BBS網(wǎng)址的途徑通過WWW檢索工具(比如:Yahoo、Google、AllinOne、Hotbot、Webcrawler、Infoseek、Lycos、Altavista等)來獲取BBS登陸軟件中的“地址簿”訪問BBS的方法Telnet方式,即計算機遠程登錄用BBS登錄軟件,如Sterm,Cterm通過WWW瀏覽器(如:IE等)瀏覽telnet方式客戶端軟件方式(以Cterm為例)web瀏覽器方式4.USENET/NewsgroupUsenet一詞來自于UserNetwork,Usenet里的新聞組信息以中央存儲的形式存放于某個位置(通常是一些分類目錄),通過軟件的管理允許用戶選擇定閱他們感興趣的主題閱讀、索引、刪除過期消息等。Usenet的最初構(gòu)想是借助網(wǎng)絡(luò)進行技術(shù)信息交換,但是后來也用于非技術(shù)領(lǐng)域,例如社會新聞、業(yè)余愛好、個人興趣等主題。Usenet的最主要的特色是統(tǒng)一分組、全球轉(zhuǎn)信。當(dāng)前,USERNET上討論題大致歸納出幾個大的類別。每個新聞組都有一個名稱,根據(jù)新聞組的名稱,大概就可以知道其討論的主題了。
biz.*商業(yè)類Comp.*電腦類
Sci.*自然科學(xué)類Soc.*社會類
Talk.*閑談類Rec.*娛樂類
Misc.*雜項Alt.*雜亂無規(guī)定主題類News.*與Netnews本身相關(guān)的信息國內(nèi)著名新聞組
1.新凡
http:///
2.濟南萬千
news:///
3.寧波:
4.希網(wǎng)新聞組
國外著名新聞組:
1.Google新聞組
2.微軟新聞組:
3.Newsone新聞組
4.Realplayer新聞組
獲得新聞組資源的方法通過Web直接瀏覽使用新聞組閱讀軟件
OutlookExpressAgent
Newspro等通過web方式使用OutlookExpress預(yù)訂、
閱讀和發(fā)送新聞組5.Mailinglist/LISTSERV郵件列表(Mailinglist)是指一組成員的E-Mail地址列表。郵件列表的主要功能是為有共同興趣的一組用戶建立一種關(guān)聯(lián),使用戶彼此擁有一個網(wǎng)上交流的空間。加入郵件列表的用戶可以收到發(fā)給郵件列表的所有郵件,同時,也可通過郵件列表向所有其他組員發(fā)送信息。每個郵件列表都有管理員,負(fù)責(zé)維護郵件列表,進行日常管理。管理員分為兩種:一種是人,一種是稱為Listserv的計算機程序。這種用Listserv程序進行自動管理的郵件組,有時也稱為Listserv列表。Listserv是目前功能最強的郵件列表管理軟件。用戶用電子郵件向系統(tǒng)發(fā)送命令,系統(tǒng)用電子郵件回送執(zhí)行結(jié)果的信息。郵件列表的使用范圍1.新產(chǎn)品發(fā)布、與客戶保持聯(lián)系、產(chǎn)品的技術(shù)支持、信息反饋;2.組織俱樂部,吸引新用戶的加入,提供成員之間的交流工具;3.與同學(xué)和親友保持快速、方便的聯(lián)系;4.您可以主辦自己的電子雜志,通過郵件列表的方式,向數(shù)十萬用戶同時發(fā)送;5.當(dāng)然,您還可以訂閱其他人建立的郵件列表,取得你感興趣的信息,同時可以參與討論。
郵件列表類型公開任何人可以在列表里發(fā)表信件封閉只有郵件列表里的成員才能發(fā)表信件,如同學(xué)通訊、技術(shù)討論等管制只有郵件列表管理者批準(zhǔn)的信件才能發(fā)表,如產(chǎn)品信息發(fā)布、電子雜志等國內(nèi)Mailinglist郵件列表檢索工具
(1)希網(wǎng)網(wǎng)絡(luò)
/(2)通易
http:///(3)網(wǎng)路
http:///maillist.asp
國外Mailinglist郵件列表檢索工具(1)CataList
http://www.L/lists/listref.html
(2)PubliclyAccessibleMailingLists
http:///internet/paml/(3)Lisztthemailinglistdirectory
http://
在收信人地址欄填寫服務(wù)器地址在郵件正文填寫命令行1.萬維網(wǎng)(WWW)信息資源(1)WebDirectory(網(wǎng)絡(luò)目錄)(2)VirtualLibrary(虛擬圖書館)(3)搜索引擎(4)看不見的網(wǎng)站(5)網(wǎng)絡(luò)百科全書(6)Blog信息資源(7)電子預(yù)印本(1)webDirectory(網(wǎng)絡(luò)目錄)網(wǎng)絡(luò)目錄(WebDirectory)——因特網(wǎng)上的目錄型檢索工具,又稱分類站點目錄、專題目錄或主題指南、站點導(dǎo)航系統(tǒng)等。網(wǎng)絡(luò)目錄一般采用人工方式采集和存儲網(wǎng)絡(luò)信息。但是,部分網(wǎng)絡(luò)目錄并不全是人工方式采集和組織信息,而是利用自動功能或者由用戶遞交的方式來豐富和補充資源。以某種分類法進行組織整理,并和檢索法集成。網(wǎng)絡(luò)目錄一般是通過引導(dǎo)網(wǎng)絡(luò)用戶的查詢概念(而不是確切的詞條)來幫助用戶找到所需的網(wǎng)絡(luò)信息。最著名的網(wǎng)絡(luò)目錄
Yahoo!
/
新浪
http:///
搜狗
http:///Googlehttp:///dirhpYahoo!目錄(最高層目錄)http:///二級目錄三級類目四級類目SiteListing(2)VirtualLibrary(虛擬圖書館)國內(nèi),許多人稱其為“學(xué)科導(dǎo)航”。針對某一學(xué)科或領(lǐng)域研究的需要,將Internet上有關(guān)的各種資源線索,包括與該學(xué)科領(lǐng)域有關(guān)的研究機構(gòu)、實驗室、電子書籍、學(xué)術(shù)期刊、會議論壇、專家學(xué)者等的URLs系統(tǒng)地組織起來,存放于某一網(wǎng)頁,供用戶瀏覽或檢索。提供導(dǎo)航服務(wù)的一種工具??色@得大部分學(xué)科的網(wǎng)絡(luò)資源導(dǎo)航鏈接,被認(rèn)為是世界上質(zhì)量最高的虛擬圖書館,由各個領(lǐng)域志愿者提供資源并完成組織
http:///語言類虛擬圖書館/“知識管理”虛擬圖書館http:///km清華大學(xué)虛擬圖書館http:///chinese/virtual/index.html(3)搜索引擎(SearchEngine)搜索引擎的原理可以看做三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁→建立索引數(shù)據(jù)庫→在索引數(shù)據(jù)庫中搜索排序。使用技巧:
(1)不同目的的查詢應(yīng)當(dāng)選用不同的搜索引擎。
(2)適當(dāng)?shù)剡\用語法規(guī)則進行組合搜索。
(3)靈活運用短語。GoogleScholar用于搜索學(xué)術(shù)文獻,包括同行評議的論文、學(xué)位論文、圖書、預(yù)印本、技術(shù)報告等,涉及各學(xué)科領(lǐng)域。
http:///Scirus是目前網(wǎng)上最全面、綜合性最強的科技文獻搜索引擎之一。
http:///http:///http:///(4)看不見的網(wǎng)站(InvisibleWebsite)看不見的網(wǎng)站是指在萬維網(wǎng)上可獲得的資源,但由于技術(shù)限制,或是由于特定選擇而不能或未被納入通用搜索引擎網(wǎng)頁索引中的文本網(wǎng)頁、文件或其他高質(zhì)量的權(quán)威性信息資源。我們有時也叫它“深度網(wǎng)站”或“黑洞”。(InvisibleWeb、DeepWeb、HiddenWeb、DarkMatter)看不見的網(wǎng)站的類型可檢索性數(shù)據(jù)庫拒絕收錄的網(wǎng)頁如何利用看不見的網(wǎng)站資源Directsearch
http:///gary/direct.htmInternet圖書館員索引(LII)
http://CompletePlanethttp
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- “社區(qū)創(chuàng)文明計劃”社區(qū)工作計劃
- 2025年生產(chǎn)主管年度工作計劃范文
- 幼兒園營養(yǎng)員工作計劃幼兒園營養(yǎng)員崗位職責(zé)
- 2025大學(xué)生創(chuàng)業(yè)計劃書范文模板大全
- 初中語文教研組工作計劃結(jié)尾怎么寫
- 新目標(biāo)七年級下學(xué)期的英語教學(xué)計劃
- 教師校本研修工作計劃范文個人校本研修工作計劃
- 小學(xué)創(chuàng)建文明學(xué)校工作計劃
- 2025房屋銷售計劃書范文類標(biāo)題提綱
- 學(xué)年度六年級健康教育教學(xué)工作計劃
- 造紙企業(yè)清潔生產(chǎn)報告2014年
- 診所抗菌藥物管理制度
- 智慧嬰幼兒托管解決方案
- 設(shè)計構(gòu)成與應(yīng)用 完整全套教學(xué)課件 第1-12章 平面構(gòu)成設(shè)計元素- 立體構(gòu)成在建筑設(shè)計中的應(yīng)用
- 2、廣東省高速公路發(fā)展股份有限公司 2019年度內(nèi)控缺陷整改臺賬
- 物業(yè)公司安全生產(chǎn)檢查表
- 室內(nèi)配套設(shè)備家具、家電及窗簾等項目供貨服務(wù)方案技術(shù)投標(biāo)方案
- 公司規(guī)章制度清單
- 《高效能人士的七個習(xí)慣》PPT演講模板
- 獨領(lǐng)風(fēng)騷的古代技術(shù)創(chuàng)造
- 實用俄語會話知到章節(jié)答案智慧樹2023年山東交通學(xué)院
評論
0/150
提交評論