版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
4網(wǎng)絡信息資源檢索4.1網(wǎng)絡信息資源概述4.2搜索引擎4.3開放獲取4.4慕課4.1網(wǎng)絡信息資源概述1.網(wǎng)絡信息資源的定義字面理解:
“通過計算機網(wǎng)絡可以利用的各種信息資源的總和”。具體理解:以數(shù)字化形式記錄的,以多媒體形式表達的,分布式存儲在網(wǎng)絡計算機的存儲介質(zhì)以及各類通信介質(zhì)上,并通過計算機網(wǎng)絡通信方式進行傳遞的信息內(nèi)容的集合。主體是internet2.網(wǎng)絡信息資源的特點(1)數(shù)量龐大,增長迅速;(2)內(nèi)容豐富,形式多樣;(3)變化頻繁,價值不一;(4)結構復雜,分布廣泛;(5)信息分散、無序;3.Internet信息資源類型網(wǎng)絡信息資源的種類很多,根據(jù)不同的分類標準,可以將網(wǎng)絡信息資源分為不同的類型。第一,按網(wǎng)絡傳輸協(xié)議劃分:WWW信息資源,TELNET信息資源,FTP信息資源,新聞組信息資源,電子郵件信息資源,Gopher信息資源等。第二,按照網(wǎng)絡信息資源的組織方式劃分,可分為文件方式,超文本/超媒體方式、數(shù)據(jù)庫方式等。第三,依據(jù)信息源的信息內(nèi)容則可將網(wǎng)絡信息資源分為以下類型:網(wǎng)絡數(shù)據(jù)庫、網(wǎng)絡出版物、社會信息、軟件資源等。4.網(wǎng)絡信息資源檢索的一般方法
網(wǎng)絡信息檢索方法分類目錄偶爾發(fā)現(xiàn)
順“鏈”而行主題檢索RSS閱讀網(wǎng)上瀏覽(目錄型檢索工具)搜索引擎(1)布爾邏輯檢索技術就是布爾檢索是將多個關鍵詞按照一定的邏輯關系組合在一起形成的組合檢索.
這是計算機信息檢索中最基本的也是最常用的技術。5.計算機檢索技術布爾邏輯運算符邏輯“與”邏輯“或”邏輯“非”
邏輯“與”————————————————AB用符號“and”或“*”表示,其邏輯表達式為:
A*B或AandB
其意義為檢索記錄中必須同時含有檢索詞A和B的文獻,才算命中文獻。
邏輯“或”AB用符號“or”或“+”表示,其邏輯表達式為:
AorB或A+B
其意義為檢索記錄中凡含有檢索詞A或檢索詞B,或同時含有檢索詞A和B的,均為命中文獻。
邏輯“非”
AB用符號“not”或“-”,其邏輯表達式為:
AnotB或A-B
其意義為:檢索記錄中含有檢索詞A,但不能含有檢索詞B的文獻,才算命中文獻。舉例:
要檢索“非兒童的心理測試”,對用戶來說,需要包含“心理測試”的文獻,但去掉那些包含兒童研究的文獻。在心理學數(shù)據(jù)庫可檢索到:心理測試43150
兒童11560
心理測試NOT兒童
1500
從圖中可以看出:邏輯“與”的組配縮小了檢索的范圍。參加邏輯“與”的檢索詞越多,檢索的結果范圍限制得越小,命中的文獻也就越少。邏輯“或”的關系擴大了檢索范圍。用邏輯“或”組配相當于增加了檢索詞的同義詞和近義詞,從而擴大了檢索范圍。邏輯“非”的檢索也是一種縮小檢索范圍的組配方式。但是使用邏輯“非”的組配時需要特別小心,常常會把有用的文獻也排除掉。
(2)截詞檢索技術
截詞檢索就是用截斷的詞的一個局部進行的檢索,并認為凡滿足這個詞局部中的所有字符(串)的文獻,都為命中的文獻。截詞檢索是一種常用的檢索技術,是防止漏檢的有效手段。特別是在西文檢索中,更是廣泛使用。西文的構詞比較靈活,在詞干上加上不同性質(zhì)的前、后綴就可以派生出許多新的詞匯,而且這些詞匯在意義上都比較相近。按截斷的位置區(qū)分,可以有后截斷、前截斷以及中間截斷(中間屏蔽)。
也叫做右截斷,即將一個詞的后方或右方截去有限或無限個字符,后截斷檢索也叫“前方一致”檢索。
如:comput*為無限后截斷,可以檢索包含以下詞匯的文獻:
computable、computation、compute、computer、computers、computing、computerise、computerize……后截斷如:comput???則表示有限后截斷,截0—3個字母,可檢索出包含compute、computer、computers、computing等詞匯的文獻
前截斷也叫左截斷。前截斷的檢索方法也叫“后方一致”檢索。前截斷檢索常用于復合詞。
如:*magnetic(有磁性的,有吸引力的):為無限前截斷的表達式,可檢出包含下列詞匯的文獻:
magnetic、electromagnetic、electro-magnetic、paramagnetic(順磁的)、thermo-magnetic(熱磁的)等。前截斷如:??經(jīng)濟則數(shù)據(jù)庫中含有經(jīng)濟、工業(yè)經(jīng)濟、農(nóng)業(yè)經(jīng)濟等方面的文獻均為命中文獻。前截斷與后截斷也可以組合起來使用。如:*chemi*可以檢出下列詞匯:
chemical、chemistry、chemist、eletrochemical、electrochemistry、physicochemistry、thermochemistry等。
就是將提問字符串中間的字符用通配符代替,主要用于英式美式不同拼法的英文單詞,或單復數(shù)不同的單詞。如:
manwomanorganizationdefensemenwomenorganisationdefence
檢索時為防止漏檢可用中間屏蔽的檢索方法:
m?nwom?norgani?ationdefen?e中間屏蔽注意:無論是前截斷、后截斷和中間屏蔽,從根本上來說,它們是邏輯“或”的運算,因此能擴大檢索范圍,提高查全率。此外還能減少輸入檢索詞的工作量,簡化檢索步驟,節(jié)省機時和費用。在中文數(shù)據(jù)庫中使用最多的是后截斷檢索。截詞檢索在不同的計算機檢索系統(tǒng)中規(guī)定不同,使用時請注意。
(3)字段限制檢索
在檢索系統(tǒng)中,為了提高檢索的查準率,縮小檢索的范圍,通常有一些限制的手段和方法。使用這些方法進行的檢索通常稱為限制檢索。常用的限制方法是字段限定。數(shù)據(jù)庫中每條記錄都有許多字段,將檢索詞限定在特定的字段中進行檢索就叫做字段限定檢索。各個檢索系統(tǒng)的字段限制符可能并不一樣,字段的標識符也有不同。有的系統(tǒng)不分前綴后綴限定,一律采用前綴或后綴檢索。在菜單式驅動檢索界面中,通常用戶不需使用限制符,只要在下拉菜單中選擇某個字段名稱,在提問框中輸入檢索詞,就可完成字段限定檢索。
4.2搜索引擎1.什么是搜索引擎?搜索引擎其實是一個網(wǎng)站,只不過該網(wǎng)站專門為你提供信息“檢索”服務,是對互聯(lián)網(wǎng)上的信息資源進行搜集整理,并提供查詢的系統(tǒng)。它包括信息搜集、信息整理和用戶查詢?nèi)糠?。用戶系統(tǒng)用戶接口搜索器索引器檢索器WWW信息資源FTP信息資源Telent信息資源Ghopher信息資源WAIS信息資源用戶服務組信息資源搜索引擎網(wǎng)絡網(wǎng)絡2.搜索引擎的構成及工作原理
搜索引擎有兩個主要的功能:
1、收集網(wǎng)絡信息資源,對其進行索引并建立數(shù)據(jù)庫。
2、提供網(wǎng)絡的信息導航與檢索服務(主要的功能)。
3.搜索引擎的發(fā)展歷史第一代搜索引擎是基于人工分類目錄搜索,以早期的Yahoo、AltaVista和Infoseek等為代表第二代搜索引擎的主要特征是運用“符號計算”,基于關鍵詞搜索以及以關鍵詞組合為基礎的全文搜索和模糊搜索。以Google、DirectHit等為代表?;陉P鍵詞搜索的優(yōu)勢是使用方便,搜索速度快,直接搜索內(nèi)容,這是第一代搜索引擎無法比擬的。第三代搜索引擎。不僅索引規(guī)模大,而且更多地結合了自然語言理解、個性化等智能化技術4.發(fā)展中的搜索引擎整合搜索
社區(qū)搜索
移動搜索
垂直搜索物聯(lián)網(wǎng)搜索:不僅僅是你找東西,甚至還有可能東西找你5.搜索引擎的種類
按信息搜集方法和服務提供方式目錄型搜索引擎關鍵詞型搜索引擎元搜索引擎(1)目錄型搜索引擎
以人工方式或半自動方式搜集信息,人工形成信息摘要,并將信息置于事先確定的分類框架中。使用戶能通過瀏覽該目錄,發(fā)現(xiàn)、檢索到有關的信息。這種目錄索引并非嚴格意義上的搜索引擎,僅僅是按一定標準分類的網(wǎng)站目錄列表鏈接而已。這種目錄瀏覽服務,信息大多面向網(wǎng)站。(2)關鍵詞型(索引型)搜索引擎
是通過用戶錄入關鍵詞來查找有關信息,這種方式直接方便,并可使用邏輯運算符編制檢索式,對選定條件的資源準確定位。優(yōu)點
范圍廣更新快,能及時向用戶提供新增信息檢索方便、直接缺點
檢索結果準確性差有較多重復、虛假信息不同的搜索引擎檢索界面、檢索策略的構造和輸入方式不同(2)關鍵詞型(索引型)搜索引擎適合于檢索特定的信息及較為專、深、具體或類屬不明確的課題。典型代表:
百度/Googlehttp://www.google.com
沒有獨立的數(shù)據(jù)庫,只提供一個統(tǒng)一界面,把多個具有獨立功能的引擎組合起來。萬緯搜索引擎:
超搜索:(已停用)
(3)元搜索引擎6.
百度1999年底由李彥宏、徐勇創(chuàng)建于美國硅谷。2001年10月22日,百度正式發(fā)布Baidu搜索引擎。先進的超級鏈接分析技術;內(nèi)容相關度評價技術;WAP與PDA搜索服務;17.
谷歌谷歌公司成立于1998年9月4日,由拉里·佩奇和謝爾蓋·布林共同創(chuàng)建,被公認為全球最大的搜索引擎公司。谷歌是一家位于美國的跨國科技企業(yè),業(yè)務包括互聯(lián)網(wǎng)搜索、云計算、廣告技術等,同時開發(fā)并提供大量基于互聯(lián)網(wǎng)的產(chǎn)品與服務,其主要利潤來自于AdWords等廣告服務。
1999年下半年,谷歌網(wǎng)站“Google”正式啟用。
2010年3月23日,宣布關閉在中國大陸市場搜索服務。
2017年2月,BrandFinance發(fā)布2017年度全球500強品牌榜單,排名第一。
主要業(yè)務Google搜索引擎主要的搜索服務有:網(wǎng)頁,圖片,音樂,視頻,地圖,新聞,問答。GoogleBookSearch。該工具可以在搜索頁面提供由內(nèi)容出版商提供的書本內(nèi)容的搜索結果,并提供連向購買書本的網(wǎng)頁以及內(nèi)容相關廣告。谷歌地圖提供各種地圖服務,包括局部詳細的衛(wèi)星照片。GoogleAnswers是傳統(tǒng)搜索功能的擴展-用戶不用自己搜索內(nèi)容,他們請專家搜索然后付費。顧客問問題,并為問題提供一個相應的價錢,然后研究者們回答他們的問題。2004年11月,谷歌發(fā)布“GoogleScholar”這是一個學術文獻資源搜索引擎.
谷歌翻譯谷歌免費的在線語言翻譯服務可即時翻譯文本和網(wǎng)頁,但功能還有待改進。設置搜索偏好,包括每個網(wǎng)頁上默認的搜索結果數(shù)量、界面語言,以及查詢語言Google的查詢界面直接進入最符合搜索條件的網(wǎng)頁其他搜索搜狗/新浪資料搜索/百度網(wǎng)盤知乎簡書果殼慕課網(wǎng)果殼網(wǎng)
果殼網(wǎng)是一個泛科技主題網(wǎng)站,于2010年創(chuàng)立,致力于向公眾倡導科技理念,提供負責任、有智趣的科學普及類內(nèi)容。果殼網(wǎng)現(xiàn)有科學人、小組、問答、MOOC學院等板塊,由專業(yè)科技團隊負責編輯,網(wǎng)站主編為拇姬。依興趣關注不同小組,閱讀有意思的科技內(nèi)容;在“果殼問答”里提出困惑你的科技問題,或提供靠譜的答案;關注各個門類和領域的果殼達人,加入興趣討論,分享智趣話題。在“MOOC學院”選擇感興趣的課程、對學過的課程進行點評、用筆記記錄作業(yè)、資料和學習心得,與同學們一起分享,相互幫助探討問題。知乎
知乎是北京智者天下科技有限公司于2011年1月26日上線的一個網(wǎng)絡問答社區(qū)。知乎連接各行各業(yè)的用戶,為用戶提供社區(qū)服務,使用戶能圍繞著某一感興趣的話題進行相關的討論,同時可以關注興趣一致的人。知乎首頁,大致有四個功能區(qū)?!白钚聞討B(tài)”主要呈現(xiàn)用戶所關注人的最新提問及回答等信息。除了查看最新問題及回答之外,也可以通過“設置”、“關注問題”、“添加評論”、“分享”、“感謝”和“收藏”等功能參與到自己感興趣的問題中。用戶相關行為管理信息有“我的草稿”、“我的收藏”、“所有問題”、“我關注的問題”和“邀請我回答的問題”?!把埡糜鸭尤胫酢保脩艨梢酝ㄟ^電子郵件和新浪微博邀請自己朋友加入到知乎社區(qū)中。為用戶關注或感興趣話題或用戶推薦板塊。知乎可能根據(jù)用戶關注話題信息匯總,可能通過用戶在知乎網(wǎng)絡相關行為數(shù)據(jù)記錄統(tǒng)計,達到相當準確推薦和匯總?!霸掝}廣場”板塊中,知乎網(wǎng)將所有話題分類標簽呈現(xiàn),為用戶除搜索和導航之外,有一種不錯的獲取信息方式。簡書
簡書是一個創(chuàng)作社區(qū),任何人均可以在其上進行創(chuàng)作。用戶在簡書上面可以方便的創(chuàng)作自己的作品,互相交流。簡書成為國內(nèi)優(yōu)質(zhì)原創(chuàng)內(nèi)容輸出平臺。產(chǎn)品功能享受沉浸式的創(chuàng)作體驗,隨時隨地可以進行創(chuàng)作,同時支持離線保存支持高清圖片秒傳豐富的官方推薦專題打開創(chuàng)作思路支持一鍵生成圖片分享支持私信、打賞、評論、點贊等社交功能支持專題匯聚文章功能檢索技巧明確檢索目的和要求,確定查詢策略選擇合適的網(wǎng)絡檢索工具
1、更換搜索引擎;
2、區(qū)分學術性檢索工具和商業(yè)性檢索工具,如GoogleScholar/網(wǎng)絡數(shù)據(jù)庫。網(wǎng)絡信息檢索技巧提高檢索的精度、準確性
1、選擇合適的檢索詞,盡量使用專指詞、特定概念或非常用詞,避免普通詞、泛指概念;
2、構造恰當?shù)臋z索提問,學會利用檢索工具所規(guī)定的AND、OR、NOT等邏輯符、引號等檢索符號。
3、使用限定條件、限定詞,充分利用檢索界面上提供的限制條件,如語種、時間、類型、數(shù)量等。
4、利用進階、精練檢索功能,“Refine”或“二次檢索”。網(wǎng)絡信息檢索技巧擴大檢索范圍
1、使用同義詞、近義詞;
2、使用多個搜索引擎或者元搜索引擎(All-In-One);
3、利用某些搜索引擎的自動擴檢功能,如“Morelikethis”、“相關網(wǎng)頁”等網(wǎng)絡信息檢索技巧加快檢索速度
1、直接進入相關站點;平日的積累收藏夾和書簽的利用
2、利用特殊型網(wǎng)絡檢索工具和一些特色服務站點;新聞、天氣、交通、地圖等
3、多窗口瀏覽、檢索;4.3開放存取開放存?。∣penAccess)是國際科技界、學術界、出版界、圖書館界為推動科研成果自由傳播而發(fā)起的運動,其目的是促進科學信息的廣泛傳播,促進學術信息的交流與出版,提升科學研究的公共利用程度,保障科學信息的長期保存。美國研究圖書館協(xié)會(Asso
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)學生活化教學在小學科學教育中的角色
- 綜合實踐活動在小學德育中的作用研究
- 電務段觸電傷害應急預案
- 校園欺凌現(xiàn)象與法律應對措施
- DB3715T 72-2025楊柳飛絮綜合防治技術規(guī)程
- 中外工程技術許可合同范例
- OEM技術合作合同(微機領域)
- 個人臨時借款合同范本
- 中外合資企業(yè)土地使用權轉讓協(xié)議合同
- 臨海市農(nóng)產(chǎn)品供需雙方種植收購合同
- 期末練習卷(試題)-2024-2025學年四年級上冊數(shù)學滬教版
- 2025年公務員考試申論試題與參考答案
- 2025年高考作文專練(25道真題+審題立意+范文)- 2025年高考語文作文備考總復習
- 中國高血壓防治指南(2024年修訂版)要點解讀
- 二十屆三中全會精神應知應會知識測試30題(附答案)
- 小學三年級下冊奧數(shù)題100道附答案
- 《烏有先生歷險記》原文及翻譯
- 人員測評方案
- 小升初卷(試題)-2023-2024學年六年級下冊數(shù)學人教版
- GB/T 40565.1-2024液壓傳動連接快換接頭第1部分:通用型
評論
0/150
提交評論