信息資源及其組織_第1頁
信息資源及其組織_第2頁
信息資源及其組織_第3頁
信息資源及其組織_第4頁
信息資源及其組織_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1、信息資源及其組織信息的概念 信息的特征 信息的類型 知識(shí)、情報(bào)和文獻(xiàn)信息源 信息的概念 我國漢語中很早就有“信息”這個(gè)詞。早在一千多年前,唐朝詩人李中在碧云集暮春懷故人一詩中就留下了“夢斷美人沉信息,目穿長路倚樓臺(tái)”的佳句。當(dāng)時(shí),“信息”指的是音信、消息。 信息就是人或者機(jī)器通過感官或者外部設(shè)備與外界交流的所有內(nèi)容。 信息的特征a、客觀性與普遍性 b、流動(dòng)性與傳遞性 c、時(shí)效性與有效性 d、與載體的不可分割性與可加工性 e、積累性與價(jià)值性 信息的類型按照載體的形式劃分:印刷型、縮微型、聲像型、電子型按信息的應(yīng)用范圍劃分:白色信息、灰色信息、黑色信息按信息的加工程度劃分:零次信息、一次信息、

2、二次信息、三次信息按照數(shù)字化信息資源標(biāo)準(zhǔn)劃分:結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化的數(shù)據(jù) 知識(shí)、情報(bào)和文獻(xiàn) 知識(shí)是人類社會(huì)實(shí)踐的總結(jié),是人的主觀世界對(duì)客觀世界的概括和總結(jié)。 情報(bào)的概念是極其廣泛的,它是一種普遍存在的社會(huì)現(xiàn)象。 文獻(xiàn)一詞最早出現(xiàn)在論語八佾中,新版辭海讀文獻(xiàn)的定義作了解釋:“記錄有知識(shí)的一切載體的統(tǒng)稱,即用文字、圖像、符號(hào)、聲頻、視頻等手段記錄人類知識(shí)的各種載體(如紙張、膠片、磁帶、磁盤、光盤等)。 物質(zhì)的運(yùn)動(dòng)產(chǎn)生信息;各種信息經(jīng)過人們系統(tǒng)化的加工處理,轉(zhuǎn)化成知識(shí);知識(shí)經(jīng)過系統(tǒng)化的加工處理轉(zhuǎn)化為情報(bào);情報(bào)用于社會(huì)實(shí)踐,解決實(shí)踐中存在的問題,創(chuàng)造出物質(zhì)財(cái)富或精神財(cái)富,這時(shí)的情報(bào)便轉(zhuǎn)化為生產(chǎn)力,產(chǎn)生

3、新的信息,形成一個(gè)無限循環(huán)的轉(zhuǎn)化過程。這也表明,信息包含知識(shí)、知識(shí)包含情報(bào)。它們不僅僅是包含關(guān)系,而且可以互相轉(zhuǎn)化。 信息源a、口頭信息源 b、實(shí)物信息源 c、文獻(xiàn)信息源 2、信息媒體類型、特點(diǎn)和用途 媒體(Medium)指的是信息傳遞和存儲(chǔ)的最基本的技術(shù)和手段?;蛘哒f,媒體是信息的存在形式和表現(xiàn)形式。簡單地說,媒體就是人與人之間交流思想和信息的中介物。 感覺媒體:感覺媒體能夠直接作用于人的感官,使人產(chǎn)生感覺。例如,人類的語言、音樂,自然界的各種聲音、圖形、圖像,計(jì)算機(jī)系統(tǒng)中的文字、數(shù)據(jù)和文檔等都屬于感覺媒體。 表示媒體:表示媒體的作用是加工、處理和傳輸感覺媒體,如語言編碼、文本編碼、圖像編碼

4、等。 表現(xiàn)媒體:表現(xiàn)媒體的作用是將媒體信息的內(nèi)容呈現(xiàn)出來。它又分為兩種:一種是輸入表現(xiàn)媒體,如鍵盤、攝像機(jī)、光筆、話筒等;另一種是輸出表現(xiàn)媒體,如顯示器、喇叭、打印機(jī)等。 存儲(chǔ)媒體:存儲(chǔ)媒體用于存放經(jīng)過數(shù)字化后的媒體信息,以便計(jì)算機(jī)隨時(shí)處理,如硬盤、軟盤、磁帶及光盤等。 傳輸媒體:傳輸媒體用來將媒體從一處傳送到另一處,是信息通信的載體,如雙絞線、同軸電纜、光纖等。 3、信息檢索的概念 信息檢索,亦稱為情報(bào)檢索,作為一項(xiàng)行為的存在已經(jīng)有很長時(shí)間的歷史了,但信息檢索的概念是在20世紀(jì)40年代由穆爾斯(C. N. Mooers)首先提出的。 信息檢索(Information Retrieval)是指

5、將信息按照一定的方式組織和存儲(chǔ)起來,并根據(jù)信息用戶的需求找出有關(guān)的信息的過程和技術(shù)。它的全稱應(yīng)該叫“信息存儲(chǔ)與檢索”(Information Storage and Retrieval)。這是廣義的信息檢索,它包括存儲(chǔ)和檢索兩個(gè)方面,信息存貯主要包括對(duì)信息在選擇的基礎(chǔ)上進(jìn)行信息特征描述、加工并使其有序化。檢索是指借助一頂?shù)脑O(shè)備和工具,采用一系列方法和策略查找出所需要的信息。存儲(chǔ)是檢索的基礎(chǔ),檢索是存貯的目的。狹義的信息檢索則僅指該過程的后半部分,即從信息集合中找出所需要的信息的過程。 4、信息檢索的歷史 手工信息檢索階段機(jī)械信息檢索階計(jì)算機(jī)信息檢索系統(tǒng)階段 手工信息檢索階段 信息檢索直接發(fā)源于

6、文摘索引工作和參考咨詢工作。文摘工作的歷史可以追溯到遠(yuǎn)古時(shí)代。根據(jù)研究文摘?dú)v史的專家弗西斯威蒂(Francis J. Witty)介紹,一種用途類似于文摘的東西首先出現(xiàn)在公元前兩千年封裝美索不達(dá)米亞人用楔形文字寫成的文獻(xiàn)的陶制封套上。我國最早帶有內(nèi)容摘要的圖書目錄是西漢劉向、劉歆父子整理編撰的別錄和七略。古代使用文摘的人有學(xué)者、政治家,還有教皇和僧侶。 20世紀(jì),多數(shù)圖書館成立了參考咨詢部門,主要利用圖書館的書目工具來幫助讀者查找圖書、期刊或現(xiàn)成答案。隨著文獻(xiàn)的激增和讀者需求的增長,逐漸發(fā)展倒從多種文獻(xiàn)資源中查找、分析、評(píng)價(jià)和重新組織信息;“索引”突破了以前的狹隘范疇,成為獨(dú)立的檢索工具;到2

7、0世紀(jì)40年代又進(jìn)一步包括回答事實(shí)性咨詢、編制書目、文摘,進(jìn)行專題文獻(xiàn)檢索,提供文獻(xiàn)代譯等。“信息檢索”從此成為一項(xiàng)獨(dú)立的用戶服務(wù)工作,并逐漸從單純的經(jīng)驗(yàn)工作向?qū)I(yè)化方向發(fā)展。但在此階段所使用的館藏目錄、檢索工具和參考工具書都是卡片型或者印刷型的,檢索的方式基本上是以手工方式為主。 機(jī)械信息檢索階段 機(jī)械信息檢索系統(tǒng)是20世紀(jì)40-50年代開始使用各種機(jī)械裝置進(jìn)行信息檢索的機(jī)械系統(tǒng),這個(gè)階段的生命周期很短暫,是手工檢索向計(jì)算機(jī)信息檢索的過渡階段。機(jī)械信息檢索主要包括兩種基本類型。 機(jī)電信息檢索系統(tǒng):使用諸如打孔機(jī)、驗(yàn)孔機(jī)、分類機(jī)等機(jī)電設(shè)備記錄二次文獻(xiàn),用電刷作為檢索元件的信息檢索系統(tǒng)。 光電信

8、息檢索系統(tǒng):使用縮微照相記錄二次文獻(xiàn),以膠卷或膠片邊緣部分若干黑白小方塊的不同組合做檢索標(biāo)志,利用光電檢索元件查找文獻(xiàn)的檢索的系統(tǒng)。 機(jī)械信息檢索系統(tǒng)利用當(dāng)時(shí)先進(jìn)的機(jī)械裝置改了信息的存儲(chǔ)和檢索方式,通過控制機(jī)械動(dòng)作,借助機(jī)械信息處理機(jī)的數(shù)據(jù)識(shí)別功替部分人腦,促進(jìn)了信息檢索的自動(dòng)化。但它并沒有發(fā)展信息檢索語言,只是采用單一的方法對(duì)固定的存儲(chǔ)形式進(jìn)行檢索的工具,而且過分依賴于設(shè)備,檢索復(fù)雜,成本較高,檢索效率和質(zhì)量都不理想。機(jī)械信息檢索系統(tǒng)很快就被迅速發(fā)展的計(jì)算機(jī)信息檢索系統(tǒng)所取代。 計(jì)算機(jī)信息檢索系統(tǒng)階段 計(jì)算機(jī)信息檢索可以分成四個(gè)發(fā)展階段: 第一階段:脫機(jī)檢索階段 第二階段:聯(lián)機(jī)檢索階段 第三

9、階段:光盤檢索階段 第四階段:網(wǎng)絡(luò)檢索階段5、信息檢索的現(xiàn)狀 文本信息檢索 全文檢索是以全文本信息為主要檢索對(duì)象,允許用戶以布爾邏輯和自然語言,根據(jù)資料內(nèi)容而不是外在特征來實(shí)現(xiàn)檢索的先進(jìn)的檢索技術(shù)。全文檢索系統(tǒng)標(biāo)引方式有詞典法標(biāo)引、單漢字標(biāo)引、特殊標(biāo)引等。檢索技術(shù)后控檢索、原文檢索(含位置檢索)期望值與加權(quán)檢索等,檢索功能強(qiáng)大。以全文檢索為核心技術(shù)的搜索引擎已成為因特網(wǎng)時(shí)代的主流技術(shù)之一。 基于內(nèi)容檢索技術(shù) WWW上主要是利用搜索引擎為檢索手段,它的檢索方式有分類目錄式(網(wǎng)站級(jí))檢索、全文(網(wǎng)頁級(jí))檢索等幾種方式。分類目錄式檢索即超文本檢索;在全文檢索方式中,搜索引擎使用網(wǎng)絡(luò)信息資源自動(dòng)采集機(jī)

10、器人(robot)程序(也稱網(wǎng)絡(luò)蜘蛛、爬蟲軟件),動(dòng)態(tài)訪問各站點(diǎn),收集信息,建立索引,并自動(dòng)生成有關(guān)資源的簡單描述,存入數(shù)據(jù)庫中供檢索。 元搜索引擎(又稱多元搜索引擎或集成搜索引擎)是網(wǎng)絡(luò)檢索的后起之秀,是多個(gè)單一搜索引擎的集合。它沒有獨(dú)立的數(shù)據(jù)庫,主要依靠系統(tǒng)提供的統(tǒng)一界面,構(gòu)成一個(gè)一對(duì)多的分布式且具有獨(dú)立功能的虛擬邏輯機(jī)制。主要的元搜索引擎有Metacrawler等。 網(wǎng)絡(luò)智能檢索包括智能搜索引擎(Intelligent Search Engine)、智能瀏覽器(Intelligent Brower)、智能體(Agent)等。智能搜索引擎可以預(yù)期用戶的需求,并可有效地控制關(guān)鍵詞的多義性;智

11、能瀏覽器是基于機(jī)器學(xué)習(xí)理論設(shè)計(jì)的智能系統(tǒng),經(jīng)過訓(xùn)練后,可成為某個(gè)領(lǐng)域中熟練的搜索專家;智能體是一個(gè)具有控制問題求解機(jī)理的計(jì)算機(jī)單元,網(wǎng)絡(luò)中的智能體通常是一個(gè)專家系統(tǒng)、一個(gè)模塊等,它在經(jīng)過用戶指導(dǎo)后,可在不用用戶干預(yù)的情況下,找到所需信息。有些智能體使用神經(jīng)網(wǎng)絡(luò)與模糊邏輯而不是關(guān)鍵詞來識(shí)別信息的模式。 其它信息檢索技術(shù) 知識(shí)發(fā)現(xiàn)技術(shù)就是從大量的數(shù)據(jù)中發(fā)現(xiàn)有用知識(shí)的高級(jí)處理過程,是數(shù)據(jù)庫技術(shù)和機(jī)器學(xué)習(xí)的交叉學(xué)科。數(shù)據(jù)挖掘(data mining)技術(shù)是知識(shí)發(fā)現(xiàn)的核心技術(shù)。數(shù)據(jù)挖掘的定義是:按照某種既定目標(biāo),對(duì)大量數(shù)據(jù)進(jìn)行分析和探索,從中識(shí)別出有效的、新穎的、潛在的有用的知識(shí),以最終可理解的模式顯示

12、的一系列處理過程。它涉及到機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫、聯(lián)機(jī)分析、模糊邏輯、人工神經(jīng)網(wǎng)絡(luò)、不確定推理等多種學(xué)科知識(shí)。數(shù)據(jù)挖掘是一種分析工具。 網(wǎng)格技術(shù)是第三代因特網(wǎng),目前還處于起步階段。 信息推拉技術(shù)也是一種信息檢索技術(shù),分為信息推送和拉取兩種模式。 6、信息檢索的意義 有利于培養(yǎng)人才,提高學(xué)生自學(xué)能力和獨(dú)立的科研能力 幫助科研人員繼承和借鑒前人的成果,避免重復(fù)研究,減少重復(fù)勞動(dòng) 幫助科研人員迅速、準(zhǔn)確的獲取所需全部資料,提高科研效率,縮短科研周期 促進(jìn)信息資源的開發(fā)和利用,推動(dòng)社會(huì)進(jìn)步和經(jīng)濟(jì)發(fā)展 7、信息檢索的研究對(duì)象、內(nèi)容、方法 信息檢索研究對(duì)象、內(nèi)容信息檢索研究對(duì)象、內(nèi)容信息檢索研究方法信息檢索研究方法 信息檢索研究對(duì)象、內(nèi)容 a、檢索語言兼容與整合的研究 b、有關(guān)檢索系統(tǒng)的研究 c、檢索策略的研究d、以用戶為中心的網(wǎng)絡(luò)信息服務(wù)研究 e、網(wǎng)絡(luò)信息檢索技術(shù)發(fā)展研究 信息檢索研究方法 信息檢索是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論