網(wǎng)絡(luò)信息資源的檢索.ppt_第1頁
網(wǎng)絡(luò)信息資源的檢索.ppt_第2頁
網(wǎng)絡(luò)信息資源的檢索.ppt_第3頁
網(wǎng)絡(luò)信息資源的檢索.ppt_第4頁
網(wǎng)絡(luò)信息資源的檢索.ppt_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、網(wǎng)絡(luò)信息資源及其利用,“閑話”開篇,請先考慮以下問題: 你為什么上網(wǎng)(或上網(wǎng)干什么)? 你認為網(wǎng)絡(luò)上有什么? 你希望通過這次課學(xué)到什么?,小結(jié):通過這門課程的名稱變化的講解,我們應(yīng)該了解:,我們所處的信息環(huán)境是在不斷變化的 信息技術(shù)條件對信息環(huán)境的變化是革命性的。 信息環(huán)境影響、催化或在一定程度上決定了人們的信息需求。 教材永遠跟不上信息環(huán)境和人們信息需求的變化。,網(wǎng)絡(luò)社會,在現(xiàn)在的網(wǎng)絡(luò)信息環(huán)境下,網(wǎng)絡(luò)信息資源是我們學(xué)習(xí)、工作、生活中利用率最高的信息資源之一。對網(wǎng)絡(luò)信息資源的利用是終身學(xué)習(xí)的需要,也是個人信息素養(yǎng)中的重要內(nèi)容。相對與本館紙質(zhì)文獻信息資源和數(shù)字資源的檢索利用,其對人的影響更為深遠

2、。 所以本節(jié)不僅僅介紹網(wǎng)絡(luò)信息資源及其利,還對網(wǎng)絡(luò)學(xué)習(xí)與網(wǎng)絡(luò)交流方面的內(nèi)容做了介紹。,網(wǎng)絡(luò)信息資源及其利用【目錄】,0 網(wǎng)絡(luò)基礎(chǔ) 1 網(wǎng)絡(luò)信息資源概念、類型及其特點 2 網(wǎng)絡(luò)信息資源的評價與選擇 3 網(wǎng)絡(luò)信息檢索工具 4 開放獲取信息資源及其利用 5 e_print信息資源及其利用 6 博客與RSS信息資源利用 7 FTP資源及其利用 8 Maze、BT、eMule資源及其利用 9 網(wǎng)絡(luò)交流與學(xué)習(xí):電子郵件BBS新聞組的使用 10 咨詢服務(wù)系統(tǒng)和答案搜索引擎 11 百科全書、字(詞)典、辭典黃頁白頁 12 *學(xué)術(shù)與教學(xué)信息資源及其利用 13 因特網(wǎng)上的免費信息資源(P6170),0 網(wǎng)絡(luò)基礎(chǔ),

3、0.1 認識IP地址 0.2 認識網(wǎng)絡(luò)地址和域名 0.3 域名與網(wǎng)絡(luò)信息資源有什么關(guān)系?,0.1 認識IP地址,人們?yōu)榱送ㄐ诺姆奖憬o每一臺計算機都事先分配一個類似我們?nèi)粘I钪械碾娫捥柎a一樣的標識地址,稱作網(wǎng)絡(luò)協(xié)議地址,是分配給主機的一個32位地址,由4個字節(jié)組成。分為動態(tài)IP地址和靜態(tài)IP地址兩種。動態(tài)IP地址指的是每次連線所取得的地址不同,而靜態(tài)IP地址是指每次連線均為同樣固定的地址。如在圖書館無線上網(wǎng)就是動態(tài)IP地址,每次所取得的地址不同。,0.2 網(wǎng)絡(luò)地址和認識域名,雖然可以通過IP地址來訪問每一臺主機,但是要記住那么多枯燥的數(shù)字串顯然是非常困難的,為此,Internet提供了域名(D

4、omain Name)。 域名也由若干部分組成,各部分之間用小數(shù)點分開,例如我校主機的域名是 :“”。 域名前加上傳輸協(xié)議信息及主機類型信息就構(gòu)成了網(wǎng)址(URL),例如我校www主機的URL就是:“http:/ ”。 通常,進行網(wǎng)絡(luò)訪問時,域名的www可以省略。如 域名一般不會變動。,網(wǎng)絡(luò)地址-網(wǎng)址-URL,網(wǎng)絡(luò)地址是URL(UniformResourceLocator)的俗稱,一般由三個部分構(gòu)成,各個部分如下: 1.服務(wù)器標識符通過選擇服務(wù)器標識符能夠確定將要訪問的服務(wù)器的類型,URL中的服務(wù)器標識符可以有HTTP:/、FTP:/、GOPHER:/、TELNET:/、NWES:/等等類型,分

5、別指定為采用超文本傳輸協(xié)議連接、采用文件傳輸協(xié)議連接、與GOPHER服務(wù)器連接、與TELNET會話連接、與USENET新聞組相連接。 2.信息資源地址信息資源地址是由兩部分構(gòu)成的,一是機器名稱,如是用來指示資源所存在的機器,另一個是通信端口號,如HTTP的標準端口號為80,TELNET的標準端口號為23,F(xiàn)TP的標準端口號為21等等。 3.路徑名路徑名是給出資源在所在機器上的完整文件名. 如:例一:file:/ 代表存放主機上的pub/files/目錄下的一個文件,文件名是foobar.txt。,0.3 域名與網(wǎng)絡(luò)信息資源有什么關(guān)系?,由于Internet最初是在美國發(fā)源的,因此最早的域名并無

6、國家標識,人們按用途把它們分為幾個大類,它們分別以不同的后綴結(jié)尾: 隨著Internet向全世界的發(fā)展,除了edu、gov、mil、一般只在美國專用外,另外三個大類com、org、net則成為全世界通用,因此這三大類域名通常稱為國際域名。ac 代表科研機構(gòu) 由于國際域名資源有限,各個國家、地區(qū)在域名最后加上了國家標識段,由此形成了各個國家、地區(qū)自己的國內(nèi)域名,如: 中國的商業(yè).org.hk 香港的組織.net.jp 日本的網(wǎng)絡(luò),對網(wǎng)絡(luò)信息資源的獲取與評價有參考作用,.com 商業(yè)公司 .org 組織、協(xié)會等 .net 網(wǎng)絡(luò)服務(wù),.edu 教育機構(gòu) .gov. 政府部門 .mil 軍事領(lǐng)域,全世

7、界為美國打工,目前,全世界共有13臺根服務(wù)器,其中10臺在美國,而且2臺由美軍使用,1臺由美國國家航空航天局使用。也就是說,每天世界各地的電子郵件有很多要先由美國人“過目”之后才能去它該去的地方。此外,美國私營公司掌握著全世界互聯(lián)網(wǎng)域名的分配大權(quán)。假如美國與日本的關(guān)系急劇惡化,只要美國通過技術(shù)手段刪去日本的域名“. jp”,日本馬上就會成為“網(wǎng)上孤島”,無法通過網(wǎng)絡(luò)與外界聯(lián)系。全世界的網(wǎng)絡(luò)用戶都要向美國支付費用,“全世界都在為美國打工”。 近幾年國家開始重視信息安全,一位在信息安全領(lǐng)域沉浸了20多年的專家稱: “作為全球第二大經(jīng)濟體,中國幾乎是赤身裸體地站在已經(jīng)武裝到牙齒的美國八大金剛面前。

8、2002年,美國與伊拉克交惡,伊拉克頂級域名“.iq”一度被封殺,伊拉克因此一度在虛擬世界中“蒸發(fā)”,直到2005年,互聯(lián)網(wǎng)域名與地址管理機構(gòu)ICANN才將“.iq”重新交回伊拉克人民手中。,更多,www指的是什么? 即是萬維網(wǎng)(WWW-World Wide Web):是基于超文件的、方便用戶在因特網(wǎng)上搜索和瀏覽信息的信息服務(wù)系統(tǒng)。它將位于全世界因特網(wǎng)上不同地點的相關(guān)數(shù)據(jù)信息有機地紡織在一起。媒體形式可以是文本、圖片、動畫、聲音等,可以跳轉(zhuǎn),“網(wǎng)上沖浪”。 瀏覽web信息的網(wǎng)絡(luò)瀏覽器有哪些? 微軟IE (Internet Explorer )網(wǎng)景(Netscape)遨游(maxthon)騰訊T

9、T瀏覽器MYIE,1 網(wǎng)絡(luò)信息資源概念、類型、特點,1.1 概念: 網(wǎng)絡(luò)信息資源是指信息資源以電子數(shù)據(jù)的形式存放在非印刷型的介質(zhì)中,并通過網(wǎng)絡(luò)通信手段,在計算機等終端上再現(xiàn)的信息的總和。,1.2 網(wǎng)絡(luò)信息資源的類型,按信息內(nèi)容的表現(xiàn)形式和內(nèi)容劃分可分為 全文型信息:它指直接在網(wǎng)上發(fā)行的電子期刊,網(wǎng)上報紙,印刷型期刊的電子版,網(wǎng)絡(luò)學(xué)院的各類教材,政府出版物,標準全文等; 事實型信息:天氣預(yù)報,節(jié)目預(yù)告,火車車次,飛機航班,城市或景點介紹,工程實況、IP地址等; 數(shù)值型信息:主要是指各種統(tǒng)計數(shù)據(jù); 數(shù)據(jù)庫類信息:如DIALOG,萬方等,是傳統(tǒng)數(shù)據(jù)庫的網(wǎng)絡(luò)化; 微信息(web2.0特征):如博客、播

10、客,BBS,聊天,郵件討論組,網(wǎng)絡(luò)新聞組等。 其它類型:投資行情和分析,圖形圖象,影視廣告等。,按所采用的網(wǎng)絡(luò)傳輸協(xié)議可分為:,WWW網(wǎng)絡(luò)資源:因特網(wǎng)信息資源的主流,它使用http協(xié)議,使用簡單,功能強大,能方便迅速的瀏覽和傳遞分布于網(wǎng)絡(luò)各處的文字、圖象、聲音和多媒體超文本信息。 FTP信息資源:它使用ftp協(xié)議,該協(xié)議主要用于連網(wǎng)計算機之間傳輸文件。FTP相當于在網(wǎng)絡(luò)上兩個主機之間復(fù)制文件。目前仍是發(fā)布、傳遞軟件和長文件的主要方法。 TELNET信息資源:telnet是遠程登陸協(xié)議。telnet信息資源包括硬件資源和軟件資源。許多機構(gòu)都提供遠程登陸的信息系統(tǒng),如圖書館的公共目錄系統(tǒng),信息服務(wù)

11、機構(gòu)的綜合信息系統(tǒng)等。 用戶服務(wù)組資源:包括新聞組,電子郵件組等。這些電子通信組形式所傳遞和交流的信息資源是網(wǎng)絡(luò)上最自由、最具有開放性的資源。news,1.3 網(wǎng)絡(luò)信息資源的特點,復(fù)雜性:網(wǎng)絡(luò)信息資源具有大數(shù)量、多類型、多媒體、非規(guī)范、跨時間、跨地域、跨行業(yè)、多語種等特點。 在很大程度上網(wǎng)絡(luò)的增長和信息資源的動態(tài)快速增加是由用戶驅(qū)動的,但缺乏有效的統(tǒng)一管理機制,信息安全和信息質(zhì)量的不均衡性。 信息分布和構(gòu)成缺乏結(jié)構(gòu)和組織,信息源不僅分散無序,而且其更跌和消亡也往往無法預(yù)測,因此增大了信息資源管理和利用的難度。 信息發(fā)布具有很大的自由性和任意性,隱私型信息進入了公共信息傳播渠道;由于缺乏必要的過

12、濾、質(zhì)量控制和管理機制,不僅學(xué)術(shù)信息、商業(yè)信息,政府信息、個人信息、不合適(反動、黃色)的信息混為一體,質(zhì)量良莠不齊。增加了信息識別和利用的難度。,續(xù),正式出版物和非正式信息交流交織在一起,使傳統(tǒng)的人類信息交流鏈的格局被打破,各方在網(wǎng)絡(luò)上既可以是信息的生產(chǎn)者、發(fā)布者,也可以是傳播者和使用者,對學(xué)術(shù)交流環(huán)境和信息利用產(chǎn)生了深刻的影響。 網(wǎng)絡(luò)營造了“地球村”,既 極大地促進了人類信息資源的共享,又帶來了一些意想不到的問題,如文化沖突、信息侵略、信息威懾等。 使用成本低 共享程度高 是信息資源的寶庫,2.2 網(wǎng)絡(luò)信息資源的評價與選擇,相同內(nèi)容的信息資源的載體形態(tài)或利用、獲取的方式不同,可以根據(jù)需要選

13、擇。 網(wǎng)絡(luò)信息資源的評價與選擇主要是針對信息源。 內(nèi)容因素。內(nèi)容是評價與選擇的核心和重點,從中可以反映網(wǎng)絡(luò)信息資源的本質(zhì)。評價網(wǎng)絡(luò)信息資源的內(nèi)容因素主要有:權(quán)威性、完備性、可靠性、原創(chuàng)性、新穎性、穩(wěn)定性等。 形式因素。形式指標反映了外部特征以及操作使用等方面,是為提示內(nèi)容服務(wù)的,主要包括:美觀性、條理性、查檢性、幫助性、快捷性、低耗性等。 定量的評價:Google的pagerank,星數(shù)評價等級。,權(quán)威性,在本學(xué)科領(lǐng)域具有一定的影響、具有較高的學(xué)術(shù)水平、具有較高的知名度;Google網(wǎng)頁級別評價作為重要的指標,非獨特性資源網(wǎng)頁級別需3/10以上。 主要關(guān)注如下問題:所采集的網(wǎng)站(頁)的主辦者是

14、否為有聲譽的大學(xué)、學(xué)會/協(xié)會、實驗室?網(wǎng)站是否通過權(quán)威評價機構(gòu)評價過?所選的站點是否被多個internet站點鏈接?網(wǎng)站是由某公司、機構(gòu)還是某領(lǐng)域的著名的權(quán)威或?qū)<屹澲啃畔⑻峁┱叩慕逃尘昂吐殬I(yè)背景及其研究方向?責(zé)任者有知名的出版物嗎?信息是否經(jīng)過過濾?信息是否經(jīng)同行評議過?資源是否由相關(guān)的權(quán)威推薦?是否有與權(quán)威機構(gòu)的頁面的共同鏈接?出版社是否知名和有聲望?出版社是否是公認的出版界的權(quán)威?出版社是否是大學(xué)的出版社?是否有任何原創(chuàng)作品?選擇的資源與其它作品有相關(guān)性嗎?,準確性,信息資源需嚴肅正規(guī)、準確無誤、完整規(guī)范。一方面是內(nèi)容的準確性,另一方面是格式和鏈接的準確性。對資源的導(dǎo)航需能正常訪問。

15、 主要考慮所選網(wǎng)站(頁)提供的信息是否準確?是否提供了信息的來源和出處以備用戶進一步核查;網(wǎng)頁引證的書目或提供的參考能否證實信息的準確性?頁面的句法和拼寫是否準確?有否排印錯誤?提供的信息是否完整規(guī)范?,穩(wěn)定性,信息資源需有較長的穩(wěn)定期或有穩(wěn)定運行的保障機制。 主要看所選網(wǎng)站(頁)提供信息的時間、更新頻率、最近的修改日期,鏈接速度,斷線率等。是否能持續(xù)提供給用戶使用?,可獲得性,信息資源揭示信息的層次中,至少一個能無障礙地獲得。 主要要考慮的是題名信息還是文摘信息或全文信息? 是否有對信息結(jié)論的闡述標準?是否給出了表明信息內(nèi)容的關(guān)鍵詞或主題詞?希望在該網(wǎng)頁上找到何種信息?主題的涵蓋面是否全?索

16、引或目次頁是否隱含了綜合性的內(nèi)容?是否免費?是否注冊?是否國際流量?是否符合標準?是否有其它格式或鏡像? 某種類型的信息有使用期限制嗎?訪問資源的方式是否依賴用戶使用的設(shè)備?是否需要專門軟件(如瀏覽器)?是否有方便的導(dǎo)航?是否容易鏈接所需的信息?是否有清晰的鏈接標簽?是否能分別打印頁面和文獻的某一部分?是否能發(fā)送到電子郵箱?是否提供多種檢索方式?檢索信息的效率如何?,3 網(wǎng)絡(luò)信息檢索工具,當已經(jīng)知道地址時直接通過地址訪問。 當不知道地址的時候,需要借助檢索工具 3.1搜索引擎 3.2網(wǎng)絡(luò)資源指南(門戶) 3.3專門數(shù)據(jù)庫,3.1 搜索引擎P41,搜索引擎分類 分類目錄型分類目錄雖然有搜索功能,

17、但在嚴格意義上算不上是真正的搜索引擎,僅僅是按目錄分類的網(wǎng)站鏈接列表而已。完全可以不用進行關(guān)鍵詞(Keywords)查詢,僅靠分類目錄也可找到需要的信息。如Yahoo雅虎、新浪。其他著名的還有Open Directory Project(DMOZ)、Look Smart、About等?,F(xiàn)在許多搜索引擎在提供搜索服務(wù)的時候也同時提供這一類服務(wù)。,分類目錄型搜索引擎提供了一份按類別編排因特網(wǎng)站點的目錄,各類下邊,排列屬于這一類別網(wǎng)站的站名和網(wǎng)址鏈接。 適用情況:適合于用戶對要檢索的東西沒有明確的主題概念,只知道大致的類屬 特點:描述準確,用戶可以很方便的查找到所需信息。 沒有統(tǒng)一的分類體系,類目之

18、間容易交叉。,DMOZ開放式分類目錄,DMOZ網(wǎng)站是一個著名的開放式分類目錄(Open Directory Project),之所以稱為開放式分類目錄,是因為DMOZ不同于一般分類目錄網(wǎng)站利用內(nèi)部工作人員進行編輯的模式,而是由來自世界各地的志愿者共同維護與建設(shè)的最大的全球目錄社區(qū)。 /,全文搜索引擎,全文檢索型搜索引擎處理的對象是因特網(wǎng)上網(wǎng)站中的每個網(wǎng)頁,用戶得到的檢索結(jié)果,通常是一個個網(wǎng)頁的地址和相關(guān)文字 。 這類搜索引擎的特點是信息量大,索引數(shù)據(jù)庫規(guī)模大,更新較快。但是它也有不足之處就是檢索結(jié)果反饋的信息往往太多,太濫,以致用戶很難直接從中篩選出自己真正

19、感興趣的東西,要想達到理想的檢索效果,就要借助于必要的語法規(guī)則和限制內(nèi)容。,搜索引擎工作原理,工作原理 一個完整的搜索引擎由以下三個部分組成:圖示: (1)人工或自動巡視軟件(如網(wǎng)絡(luò)蜘蛛Web Spider,爬行者Crawler,網(wǎng)絡(luò)機器人 Robots等); (2)索引庫或分類目錄;蜘蛛程序發(fā)回的網(wǎng)頁,保存在數(shù)據(jù)庫中, 并對其進行標引(提取網(wǎng)頁標題, 關(guān)鍵詞,日期等),對標引詞建立索引。 (3)用于檢索索引庫的檢索軟件及瀏覽Web界面等部分組成。,更多,中文搜索引擎指南網(wǎng)搜網(wǎng): 搜索引擎觀察專業(yè)、元、多媒體、購物 著名搜索引擎簡介:http:/www.se-,搜索引擎:水平門戶_綜合搜索引擎

20、中文,中文常用搜索引擎 百度中文搜索引擎: Google中文搜索引擎: 搜狐搜狗搜索: 雅虎: 新浪: 網(wǎng)易 : TOM搜索: 北大天網(wǎng)搜索引擎: 奇虎 ,搜索引擎:水平門戶_綜合搜索引擎英文,國外英文常用搜索引擎 Google 以搜索精度高、速度快成為最受歡迎的搜索引擎,是目前搜索界的領(lǐng)軍人物。 Fast/AllTheWeb 總部位于挪威的搜索引擎后起之秀,風(fēng)頭直逼google。 AltaVista 曾經(jīng)的搜索引擎巨人,目前仍被認為是最好的搜索引擎之一。 Overture 最著名的搜索引擎廣告商,競價排名的始作俑者,也是全文搜索引擎。 Lycos 發(fā)源于西班牙的搜索引擎,網(wǎng)絡(luò)遍布世界各地。

21、HotBot 隸屬于Lycos Networks,搜索結(jié)果來自其他搜索引擎及目錄索引。,搜索引擎:垂直搜索引擎,垂直搜索引擎:即專業(yè)或?qū)S盟阉饕?,它專門用來檢索某一主題范圍或某一類型信息,追求專業(yè)性與服務(wù)深度是它的特點。 垂直搜索引擎不但可保證此領(lǐng)域信息的收錄齊全與更新及時,而且檢索深度和分類細化遠遠優(yōu)于綜合搜索引擎。垂直搜索引擎的檢出結(jié)果雖可能較綜合搜索引擎少,但 檢出結(jié)果重復(fù)率低、相關(guān)性強 、查準率高,適合于滿足較具體的 、針對性強的檢索要求 。目前已經(jīng)涉及到購物,旅游,汽車,工作,房產(chǎn),交友等行業(yè)。,垂直搜索引擎舉例:1,找工作的搜索引擎: google學(xué)術(shù)搜索: google圖書搜索

22、: 比價購物搜索引擎 : 人脈搜索引擎: 若鄰網(wǎng)交友,找工作, 商機 人物、軟件 論壇搜索引擎:,垂直搜索引擎舉例:2,The Music Finder http:/www.music- Singingfish(只能搜尋聲音和錄像) 旅行TripAdvisor 計算機科學(xué)研究和文章 圖像搜索引擎: 圖像詞典 商業(yè)搜索引擎Business 生意定向搜索引擎。 DailyStocks cc 可以了解被查詢公司存貨的信息已經(jīng)相關(guān)的新聞報導(dǎo),研究, 引述和其他數(shù)據(jù)。 FMLX 英國定向的關(guān)于公司,存貨數(shù)據(jù),分析和研究的搜索引擎。 eBizSearch

23、關(guān)于電子商務(wù)的文章和報告。,綜合搜索引擎的專門化趨勢:,搜狗(Sogou) 人物、音樂、購物、圖片、地圖 GOOGLE 學(xué)術(shù)搜索: GOOGLE 圖書搜索 AllTheWeb 能專門對圖像、多媒體信息。,參見“搜索引擎觀察”之專門搜索引擎 Answers Searching | Computer Search Engines Domain Searching | Financial Search Engines Government Search | Invisible Web Legal Search Engines | Mailing Lists Medical Search Engine

24、s | Newsgroup Search Science Search Engines |Shopping Search Travel Search Engines | WAP Search Engines,更多搜索引擎:,元搜索引擎,一次搜索多個搜索引擎,并將結(jié)果返回給用戶。有的直接按來源引擎排列搜索結(jié)果,如Dogpile,有的則按自定的規(guī)則將結(jié)果重新排列組合。 優(yōu)點:能同時搜索多個搜索引擎,能在一定程度上提高查詢的廣度。 缺點:因為有時后并不能對一個搜索引擎全部查完,有時后也會漏掉一些重要信息。,新近出現(xiàn)的元搜索引擎 著名的元搜索引擎有InfoSpace、Dogpile、Vivisim等,

25、中文元搜索引擎中具代表性的有搜星搜索引擎。,搜索引擎舉例:GOOGLE,A.通用檢索法則:關(guān)鍵詞的選擇是核心。 Google的關(guān)鍵詞檢索,所使用的關(guān)鍵詞可以是字、單詞,也可以是短語、詞組或句子。使用Google進行檢索非常簡單,只要在搜索框內(nèi)輸入一個關(guān)鍵字,然后點擊下面的“Google搜索”按鈕(或者直接回車),結(jié)果就出來了。單個關(guān)鍵字搜索得到的信息量巨大,會帶出海量的不相關(guān)信息,通常檢索多是使用詞語作為關(guān)鍵詞。 復(fù)雜課題檢索,主題分析后就要進行正確選詞。使用Google,不同關(guān)鍵詞的選擇,將決定檢索結(jié)果排列不同,而且選詞不準,無法發(fā)揮Google強大的檢索功能,影響檢索效率。 Google搜

26、索技巧2005 ,如果檢索專業(yè)或?qū)W術(shù)性信息,建議在選擇關(guān)鍵詞時應(yīng)注意以下幾點: (1)選擇專指性強的詞 關(guān)鍵詞專指性強弱是影響查準率的重要因素之一,選用專指性強的關(guān)鍵詞,則檢出的網(wǎng)站針對性較強,查準率較高。專指性強弱是對選詞表達主題的深度而言,要深入分析檢索主題,選擇研究的對象及其重要參數(shù)、概念等名詞術(shù)語;選擇所應(yīng)用的對文章起關(guān)鏈作用的基礎(chǔ)理論、方法、設(shè)備等名稱;選擇反映重要研究成果的詞。例如,查找“網(wǎng)絡(luò)檢索工具的歷史”有關(guān)的信息,選詞時選用“搜索引擎”一詞,比選用“檢索工具”一詞,查準率會更高。,(2)多角度選詞關(guān)鍵詞的確定必須經(jīng)過對檢索主題正確分析得到。復(fù)雜主題的關(guān)鍵詞,要將反映該主題的各

27、個主要方面的詞匯都提煉出來,以提高文獻的查全率。例如,查找“搜索引擎發(fā)展的歷史”,因為搜索引擎的歷史,是與互聯(lián)網(wǎng)早期的文件檢索工具“Archie”相關(guān)的。此外,搜索引擎有個核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,“Yahoo”是優(yōu)秀搜索引擎的代表。因此,除了選擇“搜索引擎”、“歷史”外,還要選擇“Archie”、“蜘蛛”、“Lycos”、“Yahoo”等詞。這些詞都是起關(guān)鍵作用的檢索詞。,(3)選擇限制主題的詞在關(guān)鍵詞確定之后,運用檢索技術(shù)并不能保證檢索出來的信息都滿意,有時查詢的結(jié)果太多太泛。由于Google只搜索包含關(guān)鍵詞的網(wǎng)頁,除了增加表達主題的關(guān)鍵詞,還可增加限制性

28、的詞語作為關(guān)鍵詞,以排除多余的信息。例如:輸入“紅旗汽車”,將會找到關(guān)于紅旗但不含“汽車”的網(wǎng)頁。,B檢索式的構(gòu)建及檢索實例,為了完整準確地表達檢索需求,提高檢索的精確度,正確選擇關(guān)鍵詞后,還需要了解和運用Google各種檢索語法與技巧,根據(jù)Google提供的操作、運算符和使用規(guī)則說明,設(shè)計出一個高質(zhì)量的檢索式。,(1)邏輯檢索Google用空格表示邏輯“與”操作,用減號“”表示邏輯“非”操作?!癆B”表示搜索包含A但不包含B的網(wǎng)頁。Google用大寫的“OR”表示邏輯“或”操作。搜索“A OR B”,意思就是說,搜索的網(wǎng)頁中,要么有A,要么有B,要么同時有A和B。(2)通配符檢索很多搜索引擎

29、支持通配符號,如“”代表一連串字符,“?”代表單個字符等。為提供最準確的資料,Google不使用“詞干法”,也不支持“通配符”()搜索。也就是說,Google只搜索與輸入的關(guān)鍵詞完全一樣的字詞。例如:搜索“googl”或“googl”,不會得到類似“googler”或“googlin”的結(jié)果。,(3)短語或者句子檢索Google的關(guān)鍵詞可以是單詞,也可以是短語。用短語做關(guān)鍵字,必須加用英文雙引號,否則空格會被當作“與”操作符。雙引號中的詞語(比如自然與文化遺產(chǎn) )在查詢到的文檔中將作為一個整體出現(xiàn)。這一方法在查找名言警句或?qū)S忻~時顯得格外有用。,(4)搜索引擎忽略的字符以及強制搜索Googl

30、e對無實義的詞或一些網(wǎng)路上出現(xiàn)頻率極高的英文單詞,如“i”、“com”、“www”、“的”等,以及一些符號如“”、“.”等,作忽略處理。如果要對忽略的關(guān)鍵字進行強制搜索,則需要在該關(guān)鍵字前加上明文的“”號。另一個強制搜索的方法是把上述的關(guān)鍵字用英文雙引號引起來。例如,檢索“internet上www的歷史”,檢索式為:www的歷史internet。又如,“www的歷史”中,“的”其實是忽略詞,但因為被用英文雙引號引起來,搜索引擎就強制搜索這一特定短語。注意:大部分常用英文符號(如問號、句號、逗號等)無法成為搜索關(guān)鍵字,強制也不行。,(5)檢索式的實現(xiàn) 檢索式的實現(xiàn)可以在搜索框內(nèi)一次輸入,然后點擊

31、下面的“Google搜索”按鈕(或者直接回車),結(jié)果就出來了。也可以一次添加一個詞語在“在此搜尋結(jié)果的范圍內(nèi)查詢”。還可以不用操作符和運算符,在高級搜索查詢網(wǎng)頁中,按提示在搜索框內(nèi)輸入關(guān)鍵詞的實現(xiàn),如以上檢索式4可分解寫為“可包含以下全部的字詞:歷史;包含以下的完整字句:搜索引擎;包含以下任何一個字詞:archie蜘蛛lycos yahoo;不包括以下字詞:文化中國歷史”。 用操作符和運算符時,須注意操作符與作用的關(guān)鍵字之間有否空格。比如“”的使用,“搜索引擎 文化”,搜索引擎將視為關(guān)鍵字為“搜索引擎”和“文化”的邏輯“與”操作,中間的“”被忽略。“與”操作必須用大寫的“OR”,留有空格且不是

32、小寫的“or”。雙引號用英文引號等。,(6)搜索定義define:blog (7)特定文檔搜索 filetype:pdf filetype:doc,3.2 網(wǎng)絡(luò)資源指南,是由人工采集網(wǎng)上信息,然后按照一定分類標準,比如學(xué)科類型、主題等,建立網(wǎng)站分類目錄,并將篩選后的信息分門別類放入各類目中供用戶進行瀏覽。 優(yōu)點:1 .信息組織的專題性較強,滿足族性檢索要求;2.使用簡單,只要選擇相關(guān)類目,依照頁面之間的超鏈接指引很快就能到達目的信息,適于檢索不熟悉的領(lǐng)域或建議不熟悉網(wǎng)絡(luò)的用戶使用. 缺點:1.人工采集信息的收錄范圍小,更新慢;2.受主觀因素影響,類目設(shè)置不夠科學(xué),缺少規(guī)范,主要有三種類型: 學(xué)

33、科信息門戶 搜索引擎目錄目錄索引:新浪目錄 開放目錄ODP / 、 中國藝術(shù)開放目錄 什么情況下使用網(wǎng)絡(luò)資源指南? 當檢索一個范圍較廣的題目,并希望了解與該題目相關(guān)的信息時。 當沒有明確的信息需求,僅僅想在網(wǎng)絡(luò)上“溜達”時。 僅僅想瀏覽某一方面的消息和動態(tài)信息時,并不嚴格限于某幾個檢索詞的。 當信息需求更專一時。,搜索過程中應(yīng)注意的幾個問題,一、選擇合適的搜索引擎。 二、關(guān)鍵詞的提取問題。關(guān)鍵詞的提取合理與否,直接關(guān)系到檢索效果。盡量使用專指詞、特定概念。 三、多詞匯檢索: 達到限定的目的, 盡量不要使用 單詞匯檢索(散戶) 四、不同的搜索引擎使用方法不同,需要用戶

34、在實踐中不斷學(xué)習(xí)和積累。,搜索過程中應(yīng)注意的幾個問題,五、應(yīng)在檢索過程中不斷調(diào)整檢索策略。信息檢索應(yīng)該是一個動態(tài)的過程,需要根據(jù)檢索結(jié)果不斷的調(diào)整檢索表達式。有時候需要擴檢,有時候需要縮檢。(大連實德) 六、搜索引擎不是萬能的,并是不是所有的東西都能搜索到。,4 開放獲取信息資源及其利用,開放獲取(Open Access)是國際學(xué)術(shù)界、出版界、圖書情報界為了推動科研成果利用互聯(lián)網(wǎng)自由傳播而采取的運動。其目的是促進科學(xué)及人文信息的廣泛交流,促進利用互聯(lián)網(wǎng)進行科學(xué)交流與出版,提升科學(xué)研究的公共利用程度、保障科學(xué)信息的長期保存,提高科學(xué)研究的效率。 開放獲取數(shù)字資源是網(wǎng)絡(luò)上重要的共享學(xué)術(shù)信息資源,提

35、供期刊論文全文的免費閱讀,是獲取學(xué)術(shù)信息的一種新模式。 國外的一些研究表明,在很多學(xué)科領(lǐng)域,開放獲取的文章比非開放獲取的文章具有更大的研究影響力。經(jīng)過多年來不斷的發(fā)展,截止到2004年12月底,開放獲取期刊數(shù)量已經(jīng)多達1400余種。,4.1 信息資源開放獲取的三個途徑,開放獲取倉儲(Open Access Repository) a) 對于有版權(quán),但是出版社允許進行自存儲(self-archiving)的作品,作者可以放到信息開放存取倉庫中,例如論文、專著等; b) 對于沒有版權(quán)的作品,作者可以直接放到信息開放存取倉儲中,例如講義、PPT等。 開放獲取期刊(Open Access Journa

36、ls) a) 出版提供信息開放獲取的雜志,或者將原有雜志改造為信息開放獲取的雜志;b) 期刊運行經(jīng)費來源:一種是主辦者全部籌集資金,雜志對作者和讀者都是免費的, 個人網(wǎng)頁 a) 對于有版權(quán),但是出版社允許進行自存儲的作品,作者可以放到個人網(wǎng)頁上;b) 對于沒有版權(quán)的作品,作者可以直接放到個人網(wǎng)頁上,重點介紹部分國外開放獲取數(shù)字資源: 加州工學(xué)院的開放數(shù)字文檔收集項目 Directory of Open Access Journals HighWire Press The Open Access Publisher Public Library of Science Journals J-STA

37、GE E-Journal Scientific Electronic Library Online FreeFullText ,/digital/包括: 戰(zhàn)略加速計算機 計算機科技報告 圖書館工作人員編寫的出版物 并行和分布式系統(tǒng)項目組的技術(shù)報告 航空流體力學(xué)實驗室研究生的研究報告 地震工程研究實驗室技術(shù)報告 控制與動力系統(tǒng)技術(shù)報告 口述歷史文檔在線,4.2 加州工學(xué)院的開放數(shù)字文檔收集項目,4.3 Directory of Open Access Journals,/ 是由然瑞典蘭德大學(xué)圖書館整理的一份開放

38、期刊目錄。該項服務(wù)涵蓋了免費的、可獲取全文的、高質(zhì)量的科學(xué)和學(xué)術(shù)期刊(This service covers free, full text, quality controlled scientific and scholarly journals)。他們的目標是涵蓋所有學(xué)科和語言的開放期刊,目前一共有1332種開放期刊被收錄到了該目錄中,其中的708(去年是278)種可以進行文章檢索。,4.4 HighWire Press,/lists/freeart.dtl HighWire Press是全球最大的提供免費全文的學(xué)術(shù)文獻出版商,于1995年由美國

39、斯坦福大學(xué)圖書館創(chuàng)立。目前已收錄電子期刊710多種,文章總數(shù)已達368萬多篇,其中超過144 (去年是77) 萬篇文章可免費獲得全文;這些數(shù)據(jù)仍在不斷增加。通過該界面還可以檢索Medline收錄的4500種期刊中的1200多萬篇文章,可看到文摘題錄。HighWire Press收錄的期刊覆蓋以下學(xué)科:生命科學(xué)、醫(yī)學(xué)、物理學(xué)、社會科學(xué)。 部分全文可免費訪問,并不是全部。,5 e_print信息資源及其利用,電子預(yù)印本信息資源是開放獲取的另一種方式,對加快科學(xué)研究成果的交流與共享,幫助研究者追蹤本學(xué)科的最新研究進展,避免研究工作的重復(fù)等方面都有重要作用,對科學(xué)研究者有很高的參考價值。 同行可以直接

40、進行評論。,電子預(yù)印本特點,(1)作者自愿提交:作者按照一定的格式將論文進行排版后,通過網(wǎng)絡(luò)、E-mail等方式,按學(xué)科類別上傳至相應(yīng)的目錄或庫中。 (2)文責(zé)自負:送入預(yù)印本庫中的論文是不經(jīng)過任何審核的,也沒有任何先決條件決定某一論文能否送入庫中。只要作者所投論文遵守國家相關(guān)法律,有一定學(xué)術(shù)水平,符合系統(tǒng)的基本投稿要求。 (3)共享性:任何人在尊重作者版權(quán)的基礎(chǔ)上都可利合理用。 (4)交互性:有些系統(tǒng)允許對論文進行評論和交流。 (5)多載體性:作者可發(fā)表到正式的刊物或其它載體形式上。(6)交流速度快、利于學(xué)術(shù)爭鳴、可靠性高的特。,5.1 中國科技論文在線, 是經(jīng)教育部批準,由教育部科技發(fā)展中

41、心創(chuàng)建的科技論文網(wǎng)站,每日更新,可為在本網(wǎng)站發(fā)表論文的作者提供該論文發(fā)表時間的證明,并允許作者同時向其它專業(yè)學(xué)術(shù)刊物投稿,以使科研人員新穎的學(xué)術(shù)觀點、創(chuàng)新思想和技術(shù)成果能夠盡快對外發(fā)布,并保護原創(chuàng)作者的知識產(chǎn)權(quán)。 目前已經(jīng)有紙本期刊出版.文章的來源從網(wǎng)站中選擇.,5.2 中國預(yù)印本服務(wù)系統(tǒng), 由中國科學(xué)技術(shù)信息研究所與國家科技圖書文獻中心聯(lián)合建設(shè)的以提供預(yù)印本文獻資源服務(wù)為主要目的的實時學(xué)術(shù)交流系統(tǒng),是國家科學(xué)技術(shù)部科技條件基礎(chǔ)平臺面上項目的研究成果。,5.4 e-Print arXiv 預(yù)印本文獻庫, e-print arXiv是由美國國家科學(xué)基金會和美國能源部資助,在美國洛斯阿拉莫斯(Lo

42、s Alamos)國家實驗室建立的電子預(yù)印本文獻庫,始建于1991年8月。2001年后轉(zhuǎn)由Cornell University進行維護和管理。該預(yù)印本資料庫由Dr. Ginsparg發(fā)起,旨在促進科學(xué)研究成果的交流與共享。 目前包含物理學(xué)、數(shù)學(xué)、非線性科學(xué)、計算機科學(xué)四個學(xué)科共計28萬篇預(yù)印本文獻。 該站點的全文文獻有多種格式(例如PS、PDF、DVI等),需要安裝相應(yīng)的全文瀏覽器才能閱讀。,e-Print arXiv(中科院理論物理所鏡像站點,不需支付國際網(wǎng)絡(luò)通信費):/ e-Print arXiv(美國主站點,需支付國際網(wǎng)絡(luò)通信費):/,開放倉儲注冊系統(tǒng)(ROAR) / 有752個開放資源??筛鶕?jù)地區(qū)、軟件平臺、內(nèi)容類型查詢,或簡單瀏覽。每一個開放資源列有資源數(shù)量。 半導(dǎo)體研究所圖書信息中心 (有使用指南) :8080/tsh/dzzy/kfzy/kfzy.h

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論