![第一章 信息檢索緒論_第1頁](http://file4.renrendoc.com/view/4b6b321810437fcee18a7d84550b1a5f/4b6b321810437fcee18a7d84550b1a5f1.gif)
![第一章 信息檢索緒論_第2頁](http://file4.renrendoc.com/view/4b6b321810437fcee18a7d84550b1a5f/4b6b321810437fcee18a7d84550b1a5f2.gif)
![第一章 信息檢索緒論_第3頁](http://file4.renrendoc.com/view/4b6b321810437fcee18a7d84550b1a5f/4b6b321810437fcee18a7d84550b1a5f3.gif)
![第一章 信息檢索緒論_第4頁](http://file4.renrendoc.com/view/4b6b321810437fcee18a7d84550b1a5f/4b6b321810437fcee18a7d84550b1a5f4.gif)
![第一章 信息檢索緒論_第5頁](http://file4.renrendoc.com/view/4b6b321810437fcee18a7d84550b1a5f/4b6b321810437fcee18a7d84550b1a5f5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
《信息存儲與檢索》
InformationStorageandRetrieval信息管理系徐曉芳副教授2013.2課程主要內容第一章緒論第一節(jié)信息與信息檢索簡介主要介紹信息、信息檢索、信息檢索語言、檢索工具及檢索系統(tǒng)的定義;簡單介紹信息檢索的發(fā)展第二節(jié)信息資源第三節(jié)信息檢索的類型第二章信息檢索的理論與基本方法第一節(jié)信息檢索語言與檢索途徑(1)分類語言(2)主題語言(3)分類主題一體化語言(4)代碼語言(5)引文語言1、內容特征檢索途徑(1)分類途徑(2)主題途徑(3)分類主題途徑2、外部特征檢索途徑(1)責任者途徑(2)題名途徑(3)序號途徑(4)引文途徑第二節(jié)事實數(shù)據(jù)信息的檢索工具一、字典、詞典(辭典)二、百科全書三、手冊四、年鑒五、名錄第三節(jié)文獻檢索工具簡介一、目錄型檢索工具二、題錄型檢索工具三、文摘型檢索工具第四節(jié)索引介紹著者索引、主題索引(關鍵詞索引)、分類索引、題名索引、其他索引第五節(jié)計算機信息檢索基礎第三章中文文獻信息檢索《中國學術期刊數(shù)據(jù)庫》(中知庫)《維普科技期刊數(shù)據(jù)庫》《萬方資源數(shù)據(jù)庫》《中國資訊行》《人大復印資料》第四章外文文獻信息檢索一、《EiVillage數(shù)據(jù)庫》EiCompendexWeb(EI網絡版)INSPEC是《科學文摘》(ScienceAbstracts,簡稱SA)的電子版,專利(Patents):USPTOPatents為美國專利和商標局的全文專利數(shù)據(jù)庫。Techstreet標準(TechstreetStandards)世界上最大的工業(yè)標準集之一Scirus是迄今為止因特網上最全面的科技專用搜索引擎二、ISIWebofKnowledge平臺信息資源組成WebofScience(WOS)INSPECMEDLINEDerwentInnovationsIndexCurrentContentsConnectISIeSearchISTP(IndextoScientific&TechnicalProceedingsISSHP(IndextoSocialScience&HumanitiesProceedingsScienceCitationIndexExpandedSocialScienceCitationIndexArts&HumanitiesCitationIndexIndexChemicus(IC)CurrentChemicalReactions(CCR)3個引文數(shù)據(jù)庫2個會議論文引文數(shù)據(jù)庫2個化學數(shù)據(jù)庫ISIChemistry第五章Internet信息檢索第一節(jié)Internet概述第二節(jié)Internet搜索引擎搜索引擎搜索技術、網絡信息檢索技巧、國內外綜合型檢索工具第三節(jié)主要搜索引擎實驗安排《中國學術期刊數(shù)據(jù)庫》(中知庫)《維普科技期刊數(shù)據(jù)庫》《萬方資源數(shù)據(jù)庫》《中國資訊行》《人大復印資料》《EiVillage數(shù)據(jù)庫》WebofScienceInternet搜索引擎教學目的與要求
掌握文獻信息、數(shù)字信息檢索的基本原理和方法,了解國內外重要的文獻檢索工具和檢索系統(tǒng)的特點、編排體例以及使用方法,較熟練地掌握幾種工具和系統(tǒng)的檢索方法和技巧,最終使學生能夠達到利用檢索工具查閱所需資料的水平,為以后從事相關工作打下基礎。教材及參考書1、馬景娣《實用信息檢索教程》,浙江教育出版社,2004年2、葉繼元《信息檢索導論(第2版》,電子工業(yè)出版社,2009年3、王立清《信息檢索教程(第2版》,中國人民大學出版社,2008年本課程的實踐環(huán)節(jié)16學時,以上機實驗為主。關于課程的考試本課程的學生成績由以下三部分組成:平時的上機實驗成績及平時作業(yè)成績30%期中考試成績30%(理論考試)上機考核40%(實踐考試)根據(jù)平時上課的考勤情況酌情加減分第一章緒論
第一節(jié)信息存儲與檢索簡介一、什么是信息(Information)?漢語中的“信息”一詞中,“信”與“息”的意思相近,前者側重于消息、征兆,后者強調情況、音訊。兩字連成一詞使用,最早見于《三國志》中的“正數(shù)(天意、天數(shù))欲來,信息甚大?!痹谖鞣接⑽闹衖nformation一詞有情報、資料、消息、報道之意,我國大陸曾譯為情報或信息,后經國家有關部門核準,統(tǒng)一譯成“信息”。在我國臺灣、香港地區(qū),該詞被譯為“資訊”。
信息化的創(chuàng)始人香農(申農)(美國數(shù)學家、信息論的創(chuàng)始人)1948年在《通信的數(shù)學理論》中將信息定義為“兩次否定性之差”。他指出:“凡是在一種情況下能減少不確定性的任何事物都叫做信息?!边@一定義是從通信科學的角度來探討信息概念的,也就是說,通訊的意義就在于減少或消除通訊者的某種不定性,那么收信者被消除的不定性的大小就表示其所收到的信息量。這種定義沒有從信息的語義因素給出定義,也沒有考慮信息的含義價值,因此不能直接用于研究人類的信息傳播。但這一定義指出了信息的一個價值——減少不確定性,這是信息的認知知識功能,即當一個信息為人們所感知和確認后,這一信息就成為一定意義上的知識,形成后的知識又可以作為信息來傳遞;而尚未被認識的原始信息,則成為人們努力探討的對象,在尚未認識它們之前還不是知識(未知信息)。美國數(shù)學家、控制論的創(chuàng)始者維納Wiener將信息引入控制論,認為信息就是組織程度,它能使系統(tǒng)的有序性增強,減少破壞、混亂、噪聲。鐘義信(北京郵電大學原副校長):信息是事物存在的方式或運動的狀態(tài),以及這種方式或狀態(tài)直接或間接的表達?!掇o?!罚骸靶畔⑹侵笇ο⒔邮照邅碚f預先不很有知道的報道?!泵绹鴪D書館學會的信息專家:“信息是一切思想、事實和富有想像力的作品,它們以各種方式進行了記錄和傳播?!苯滩亩x:(P4)
信息是被反映物的屬性再現(xiàn),信息的屬性在于表現(xiàn)它物。也就是說,信息不是事物的本身,而是由事物發(fā)出的消息、情報、指令、數(shù)據(jù)、信號中所包含的內容,是對客觀世界中各種事物發(fā)出的特征、變化及其相互聯(lián)系的最新反映。一切事物包括自然界和人類社會都會產生信息。一個完整的信息過程,包括信息的傳遞、接收、貯存、加工和利用。信息、知識與情報的邏輯關系信息知識情報信息具有以下特征:(1)普遍性(2)時效性:信息在一定的時間內是有效的信息,在此時間之外就是無效信息。而且任何信息從信源傳播到信宿都需要經過一定的時間,都有其時滯性。(3)傳遞性(4)可轉換性:信息是可以由一種形態(tài)轉換成另一種形態(tài)。信息一般有4種形態(tài):數(shù)據(jù)、文本、聲音、圖像。這4種形態(tài)可以相互轉化,例如,照片被傳送到計算機,就把圖像轉化成了數(shù)字。(5)可再生性(6)共享性:同一信源可以供給多個信宿,因此信息是可以共享的,且不因共享而減少(7)可識別性:信息是可以識別的,識別又可分為直接認別和間接識別,直接認別是指通過感官的識別,間接識別是指通過各種測試手段的識別。不同的信息源有不同的識別方法。(8)可存儲性:信息是可以通過各種方法存儲的。二、信息檢索
1、定義
(1)從通信的角度認識信息檢索:強調信息發(fā)布者和接受者之間的通信,是兩者關系的變化和延伸。1950年,美國學者莫爾斯CalvinN.Mooers在《把信息檢索看做是時間性的通信》一文中首創(chuàng)了“信息檢索”這一術語。并認為信息檢索是一種時間性通信形式,此種通信是在時間上從一個時刻通往較晚的時刻,而在空間上可能還在同一地點。也就是說,通過信息檢索得到了一些文獻,從而使得信息發(fā)布者與信息用戶之間建立了一種通信。這個觀點在于說明,信息傳遞是種特殊的通信形式,正是這種通信促使了人類思想、文化、科學上的交流。莫爾斯強調在通信雙方中,信息發(fā)送者盡可能發(fā)送一切信息,是時間性通信的被動一方,而信息接收者是主動活躍的一方,正是接收者才決定什么時候接收以及接收什么信息。因此,信息檢索的問題就在于,如何把一個可能的用戶指引向所存儲的信息。(2)從信息檢索過程的角度認識信息檢索這種觀點認為,信息檢索就是查找出含有用戶所需信息的文獻的過程。這是一種傳統(tǒng)的主流觀點。美國信息檢索專家蘭卡斯特說:信息檢索系統(tǒng)并不是檢索信息。那是檢索什么呢?他認為是檢索文獻。因為信息是無形的,必須依附于文獻而存在。雖然信息檢索的最終結果是滿足用戶的信息需求,但檢索的直接對象還是文獻,當用戶閱讀文獻并理解其內容時,用戶的信息需求才被滿足。(3)從信息處理的角度認識信息檢索從信息處理的角度來看,信息檢索的基本問題,是如何處理信息和信息的結構。這種認識偏重于信息管理領域,認為信息檢索不僅限于傳統(tǒng)文獻的范圍,圖像、聲音、數(shù)據(jù)等也都能反映信息,并把信息檢索視為計算機科學技術的一個分支。如何看待現(xiàn)代信息和信息的結構問題:①信息的內容發(fā)生很大的變化。由于學術團體、政府機關、商業(yè)部門、個人、民間組織等任何組織或個人都可以以多種形式發(fā)布信息,對信息缺乏控制和管理。②信息的形式從印刷型向多種形式并存的方向發(fā)展,不僅僅是視覺和靜態(tài)形式,而且是動態(tài)的多媒體的。③信息資源的種類不僅僅是正式出版物,電子期刊、圖書、非正式出版物、灰色文獻、數(shù)據(jù)庫、軟件、新聞組、BBS等。(4)從信息獲取方式來認識信息檢索分為:直接檢索:直接從信息源中獲取信息,獲取方式直接,但很難廣、快、精、準地查到所需的全部信息間接檢索:通過信息檢索工具或檢查系統(tǒng)獲取所需的信息。(本課程主要學習)克服了直接檢索的缺點,在掌握一定檢索技巧前提下可以較全面、準確、快速地檢索到相關信息。(5)從實際檢索工作的角度出發(fā),對信息檢索這樣表達:廣義:將信息按一定的方式組織和存儲起來,并根據(jù)用戶需要找出相關文獻的過程。其中包括存與取兩個環(huán)節(jié),存即信息存儲,是對信息進行收集、標引、描述、及組織,并對其特征化表達集加以整序,形成信息檢索工具或檢索系統(tǒng)的過程。取即信息查找,是通過某種查詢機制從檢索工具或檢索系統(tǒng)中查找出用戶所需的特定信息或獲取其線索的過程。狹義:僅僅指信息查找的過程。即取的環(huán)節(jié)。信息源選擇信息構造檢索式相關性判斷與反饋初步檢索結果集詞匯替換檢索詞與標引詞匹配運算信息數(shù)據(jù)庫概念分析信息需求詞匯替換概念分析獲取所需信息系統(tǒng)檢索語言信息存儲信息檢索信息用戶檢索提問信息存儲與檢索流程圖本課程將側重信息檢索部分:信息檢索(informationretrieval):信息用戶為處理解決各種問題,運用檢索工具或數(shù)據(jù)庫等情況集合,從中查找、識別、獲取相關的事實、數(shù)據(jù)、知識的活動及過程。2、檢索語言(retrievallanguage)
又稱為情報語言、情報存儲和檢索語言、信息組織語言,是信息存儲與檢索過程中用于描述信息特征和表達用戶信息提問的一種人工語言,是實現(xiàn)人與檢索系統(tǒng)對話的交流語言。檢索語言可劃分為:分類語言、主題語言、分類主題語言、代碼語言、引文語言等。(下章詳細介紹)3、檢索工具
是用來報道、存和查找信息的工具,通常是指以書本或卡片形式呈現(xiàn)、采用手工方式進行的設施,如檢索期刊、書目索引和卡片目錄等。檢索工具必須具備的條件:(1)對所收錄的信息資料的各種特征(包括外部特征和內容特征)要有詳細的描述。(2)每條描述記錄都要標明可供檢索用和標識,以便按某種方式將這些描述記錄組織起來,為編織各種索引做準備。(3)全部描述記錄要科學地組織成一個有機的整體,使這些記錄存放有序,方便存取。(4)具有多種必要的檢索手段以滿足用戶從多種角度查找信息的要求。4、檢索系統(tǒng):由一定的檢索設備(如探針、選卡機、電子計算機等)和加工整理并存儲在相應的載體(如穿孔卡片、磁帶、磁盤等)上面的文檔或數(shù)據(jù)庫及其他必要設備共同構成的,具有存儲和檢索功能的信息服務設施。它往往由多個子系統(tǒng)或模塊構成,需借助專門設備進行檢索。
穿孔卡片檢索系統(tǒng)、縮微品檢索系統(tǒng)、光盤檢索系統(tǒng)、計算機檢索系統(tǒng)、網絡信息檢索系統(tǒng)檢索工具和檢索系統(tǒng)的基本作用相同,都服務于信息檢索,都是傳播信息的重要媒介和實現(xiàn)情報檢索的主要手段。檢索工具屬于傳統(tǒng)的檢索設施,今天仍發(fā)揮著重要的作用,檢索系統(tǒng)是在手工檢索工具的基礎上發(fā)展起來的,是信息檢索機械化和自動化的必然產物,目前在信息檢索中已起到主導作用。它們的區(qū)別主要表現(xiàn)在內部結構、信息表示方式和匹配機制等方面。
(1)內部結構:檢索工具的結構較為簡單,以紙介質為記錄材料和存貯設備;檢索系統(tǒng)一般以非紙介質為記錄和存貯設備,檢索系統(tǒng)的構造通常較復雜,包含有多個功能子系統(tǒng)(如文獻采集子系統(tǒng)、標引子系統(tǒng)、建庫子系統(tǒng)、提問處理子系統(tǒng)、系統(tǒng)用/戶接口、詞表管理子系統(tǒng)等)和多種設施(如輸入、輸出設備、數(shù)據(jù)庫,中央處理機和通訊設施等)。
(2)信息表示方式:檢索工具用自然語言或準自然語言描述信息特征;檢索系統(tǒng)用機器語言或機器可讀語言表示信息。
(3)匹配機制:檢索工具依靠人的智力和知識來進行信息比較選擇,功能也相對較弱;檢索系統(tǒng)依靠某種匹配機制來篩選相關信息,其功能強弱與構造和設備的先進性密切相關。三、信息檢索的發(fā)展
1、第一階段:完全手工檢索階段2、第二階段:半機械檢索系統(tǒng)-機電、光電檢索系統(tǒng)的發(fā)展階段3、第三階段:計算機檢索系統(tǒng)的發(fā)展階段4、第四階段:基于Internet的網絡化檢索系統(tǒng)階段
第二節(jié)信息資源
一、信息資源的概念信息資源是人們獲取信息的來源。1、定義 美國信息資源管理專家霍頓:單數(shù)概念的信息資源是指某種內容的來源,即包含在文件和公文中的信息內容;復數(shù)概念的信息資源是指支持工具,包括供給、設備、環(huán)境、人員、資金等。中國烏家培教授:狹義的是指信息內容本身;廣義的是指除信息內容外,還包括與其緊密相關的信息設備、信息人員、信息系統(tǒng)、信息網絡等。中科院霍國慶:信息資源是可利用的信息的集合,是經過人類開發(fā)與組織的信息集合。聯(lián)合國教科文組織出版的《文獻術語》中把信息資源定義為:“個人為滿足其信息需要而獲得信息的來源?!本唧w講,凡能產生、生產、載有、儲存、加工、傳遞信息的社會活動場所、機構、人物、產品和自然物質都是信息資源。2、特性(1)普遍性:為人們獲取信息提供了廣泛的來源(2)潛在性:指一些具有使用價值的信息往往潛伏在信息資源中,人們欲獲得價值的信息,必須對信息資源的特點、變化規(guī)律進行認真分析,尋求獲取信息的途徑和方法。(3)運動性:一切信息資源都處于運動和變動中,欲獲得信息資源中的有用信息,必須擅于捕捉獲取信息的機會,以達到開發(fā)利用有價值信息的目的。二、信息資源的分類:1、信息源可分為自然信息源和社會信息源。自然信息源廣泛存在于自然界中,是物質運動和生物生存活動的結果。如山川、土地、氣候、能源、動物、植物、微生物等,它們是人類生存最基本的自然環(huán)境和物質條件,是自然信息的發(fā)生源。社會信息源則存在于人類活動中,是社會的直接產物。無論是自然信息源還是社會信息源,其開發(fā)利用均在社會中進行,社會信息源是信息源的主體。2、按信息資源所依附的載體劃分
(1)體裁信息資源:以人體為載體并能為他人識別的信息資源。按其表述方式又可分為口語信息源和體語信息源。口語信息源是人類以口頭方式表述但未被記錄下來的口語信息,如:談話、講課、講演、討論、唱歌等。體語信息源是以人的體態(tài)為載體表述出來的信息資源,如:表情、手勢、姿態(tài)等方式表述的體語信息。(2)實物信息資源:以實物為載體的信息資源。又分為自然實物信息源與人工實物信息源。如:化石、產品、樣品等。(3)文獻信息資源:以文字、圖形、符號、聲頻、視頻等發(fā)生記錄在各種載體上的知識和信息資源。(4)網絡信息資源:以網絡為紐帶連接起來的信息資源和以網絡為主要交流、傳遞、存儲的手段與形式的信息資源。3、按信息資源傳遞的范圍劃分:(1)公開信息資源:又稱共享信息資源或白色信息資源(whiteinformation),指公開發(fā)行、流通和傳遞的信息資源,其蘊涵的信息人人可以使用。一般來說,公開信息資源的數(shù)量最大,而且能夠作為信息商品進行流通領域。(2)半公開信息資源:又稱灰色信息資源(greyinformation),指非公開發(fā)行、流通和傳遞,從常規(guī)途徑難以獲取的信息(內部信息)。這類信息出版量小,發(fā)行渠道復雜,流通傳遞范圍有限,不易收集。例如:內部的刊物、技術報告、仁義資料等。(3)非公開信息資源:又稱黑色信息資源(blackinformation),指人們未破譯或未被識別的,也指處于保密狀態(tài)的信息。例如:考古發(fā)現(xiàn)的古老文字、未解密的政府文件、內部檔案、個人日記、私人信件等。4、信息可分為可檢信息和不可檢信息。問:哪些信息源是可檢索的或不可檢索的?自然信息均屬于不可檢信息。社會信息中,人類以口頭方式表述但未被記錄下來的口語信息,以及表情、手勢、姿態(tài)等方式表述的體語信息,存儲在人的大腦中的思維過程和各種思想都屬于不可檢信息,這些信息是在特定時間、地點產生,通過直接交流、接觸獲取并進行傳播的??蓹z信息是指人類用文字、圖像、聲頻、視頻等方式加工記錄在一定載體上的信息,通過學習一定的手段和方法可以檢索,我們也稱為文獻??蓹z信息可以跨時空進行傳播并被人類利用,信息檢索實際是就是對這些信息的檢索。三、文獻信息資源1、按信息資源所依附的載體的物質形態(tài)劃分(1)刻寫型:包括手稿、日記、信件、原始檔案、碑刻等。
(2)印刷型:主要是指以紙張為載體,以印刷、手寫為記錄手段,把信息內容固化在紙張上的形式。其優(yōu)點是便于直接閱讀、使用方便,其缺點是較笨重、存儲密度低、收藏占用空間大、加工保存等花費人力物力大、識別和提取難以實現(xiàn)機械化和自動化。
(3)縮微型:以感光材料為載體,以縮微照相為記錄手段而產生的一種載體形式,如縮微膠卷、縮微膠片等。其優(yōu)點是存儲密度較大、體積小、便于收藏保存和遠距離傳遞。缺點是不能直接閱讀、需借助縮微閱讀機或閱讀復印機才能使用??s微型一般針對于數(shù)量大、利用率低但又有較大保存和利用價值的信息資源。(4)聲像型:以磁性和感光材料為載體,借助特殊的機械裝置(如復錄機、攝像機、錄像機等)直接記錄聲音、圖像信號的信息載體,又稱視聽資料,如唱片、錄音帶、錄像帶、幻燈片、電影片、多媒體資料等。其優(yōu)點是可以聞其聲、觀其形,直觀而真切,給人以生動鮮明的印象。其缺點是制造成本較高,且需要借助于一定的設備才能使用。(5)電子型:電子文獻是指經過數(shù)字化技術處理后以電子形式存在,利用計算機及現(xiàn)代通訊方式提供信息的一種新興載體。其優(yōu)點是存儲密度高,讀取速度快,更新及時,并利用電子手段隨時對內容進行增、刪、改,可以高速度、遠距離傳遞信息,具有交互性,便于信息交流和共享。電子文獻種類很多,按出版類型劃分有電子教科書、電子專著、電子工具書、電子雜志、電子報紙、電子版書目數(shù)據(jù)、計算機軟件等。按電子文獻載體形式劃分其類型有磁性型文獻、光盤型文獻和網絡型文獻。按信息結構組織形式劃分有文本型、多媒體型、超文本型及超媒體型。文本型:指的只包含純文字的文件。多媒體型:指的是能傳播文字、聲音、圖形、圖象、動畫和電視等多種類型信息的手段、方式或載體。超文本型(Hypertext):是用超鏈結的方法,將各種不同空間的文字信息組織在一起的網狀文本。超媒體型(hypermedia):如果超文本節(jié)點中的信息除文本塊以外,還有圖形、圖像、聲音、視頻等多媒體信息,則稱為超媒體(hypermedia)。2、按信息資源的加工深度和結構等級劃分(1)零次文獻:指未經過任何加工的原始文獻。如:實驗記錄、手稿、原始錄音、原始錄像、談話記錄。(2)一次文獻:未經加工或粗略加工的原始信息資源,以本人的研究成果為基本素材而創(chuàng)作的文獻,具體、詳盡和系統(tǒng)化。如期刊論文、專利文獻、科技報告、會議錄、學位論文等等。
(3)二次文獻:它是將大量分散、零亂、無序的一次文獻進行進行加工、整理、標引、著錄、濃縮,并按照一定的邏輯順序和科學體系加以編排存儲,使之系統(tǒng)化,以便于檢索利用。如:目錄、題錄、索引、文摘。具有報道和檢索功能。(4)三次文獻:通過二次信息資源提供的線索,對某一范圍內的一次信息資源進行分析、研究、加工而成的信息資源,它包括綜述、述評、專題情報研究報告、百科全書、年鑒、指南、手冊、詞典等。一次文獻是二次文獻和三次文獻的基礎,是文獻檢索的主要對象;二次文獻具有濃縮性,是一次文獻的簡略及有序化,是文獻檢索的工具;三次文獻具有綜合性,既是檢索對象,又可提供一定的檢索途徑與檢索手段??傊墨I經過加工、壓縮,從零次信息到三次信息,使科技信息由分散到集中,由無序到有序,由無組織到系統(tǒng)化,由博而精的對知識信息進行不同層次的加工的過程。3、信息的不同出版類型劃分(1)圖書:包括專著、教科書、各種科普讀物及專業(yè)參考工具書等,特點是:內容系統(tǒng)、成熟、定型、信息經篩選,可靠性強,出版周期長,更新速度慢,從檢索角度,圖書一般不作為主要檢索對象。(2)期刊:定期或不定期刊行的連續(xù)出版物,如雜志、年度報告、年鑒、叢書、學會的會議錄、學報和紀要等,特點是:數(shù)量大、品種多,內容豐富多樣、出版周期短、報道速度較快、發(fā)行、流通面很廣泛,連續(xù)性強,伴隨著相應的學科領域發(fā)展前進。職能:記錄正式的公開的科學技術活動,傳播科技信息的主要工具。(3)科技報告scientificandtechnicalreport
:報道(記錄)研究工作和開發(fā)調查工作的成果或進展情況的一種文獻類型。又稱研究報告、報告文獻。出現(xiàn)于20世紀初,第二次世界大戰(zhàn)后迅速發(fā)展,成為科技文獻中的一大門類。大多與政府的研究活動、國防及尖端科技領域有關,發(fā)表及時,課題專深,內容新穎、成熟,數(shù)據(jù)完整,且注重報道進行中的科研工作,是一種重要的信息源。查尋科技報告有專門的檢索工具。特點:①反映新的科研成果迅速。以科技報告形式反映科研成果比這些成果在期刊上發(fā)表,一般要早一年左右,有的則不在期刊上發(fā)表。②內容多樣化。它幾乎涉及整個科學、技術領域和社會科學、行為科學以及部分人文科學領域。③保密性。大量科技報告都與政府的研究活動、高新技術有關,使用范圍控制較嚴。④報告質量參差不齊。大部分科技報告是合同研究計劃的產物,由工程技術人員編寫,由于撰寫受時間限制、因保密需要以工作文件形式出現(xiàn)等因素影響,使報告的質量相差很大。⑤每份報告自成一冊,裝訂簡單,一般都有連續(xù)編號,出版發(fā)行不規(guī)則。通常載有主持單位、報告撰寫者、密級、報告號、研究項目號和合同號等。附:美國四大科技報告(AD,PB,NASA,DOE)
1、AD報告1951年開始出版?,F(xiàn)由美國國防技術情報中心負責收集整理和出版。報告內容以國防部各個合同戶的研究報告為主,其報告號冠以AD,A原先為Armed、D則為Document之意,現(xiàn)在則可理解為入藏報告(AccessionDocument)。
AD-A000001~A表示公開報告,占45%
AD-B000001~B表示非密限制報告,占39%
AD-C000001~C表示秘密報告,占16%
AD-D000001~D表示美軍專利文獻
2、PB報告產生于二戰(zhàn)結束之后,當時美國政府為了整理和利用從戰(zhàn)敗國獲得的數(shù)以千噸計的秘密科技資料,于1945年6月成立了一個專門的出版局,即美國商務部出版局(PublicationBoard),負責收集、整理、報導利用這些資料3、NASA報告是美國國家航空航天局NASA科技情報處編輯、出版的專業(yè)性檢索刊物,它是檢索航空航天科技報告的重要工具。4、DOE報告,是美國能源部DOE技術情報中心編輯出版的半月刊。收錄能源部部屬科研機構和各大學等一切與能源有關的科技文獻,以科技報告為主。(4)會議文獻:在學術會議上宣讀和交流的論文、報告及其他有關資料。會議文獻的特點是傳遞情報比較及時,內容新穎,專業(yè)性和針對性強,種類繁多,出版形式多樣。它是科技文獻的重要組成部分,同一會議上的文獻論題集中、新穎、豐富、專深、學術性強,一般是經過挑選的,質量較高,能及時反映科學技術中的新發(fā)現(xiàn)、新成果、新成就以及學科發(fā)展趨向,是了解各國科技發(fā)展水平和動向的重要文獻來源。會議文獻沒有固定的出版形式,有的刊載在學會協(xié)會的期刊上,作為專號、特輯或增刊,有些則發(fā)表在專門刊載會議錄或會議論文摘要的期刊上。一些會議文獻還常常匯編成專題論文集或出版會議叢刊、叢書。還有些會議文獻以科技報告的形式出版。此外,有的會議文獻以錄音帶、錄像帶或縮微品等形式出版。(5)專利文獻:一切與專利制度有關的在專利申請和授權各階段產生的文獻。概括地講,專利文獻是各國專利局及國際性專利組織在審批專利過程中產生的官方文件及其出版物的總稱。作為公開出版物的專利文獻主要有:專利說明書、專利公報、專利文摘、專利索引和專利分類表等。特點是:內容具體、可靠、詳盡,具有新穎性、創(chuàng)造性和實用性。能反映科學技術最新的水平,大量重復,增加用戶信息識別和去掉重復的負擔。(6)技術標準和規(guī)范:對工農業(yè)產品和工程建設的質量、規(guī)格、參數(shù)及其檢驗方法等方面所作的技術灰頂,是從事生產和建設應當共同遵守的一種技術依據(jù)和規(guī)范,每一件技術標準都是獨完整的技術資源。特點是:制定、審批有程序,適用范圍明確專一,敘述嚴謹,可靠性和現(xiàn)實性,新陳代謝頻繁。(7)政府出版物:政府出版物是由政府機構制作出版、或由政府機構編輯并授權指定出版商出版的文獻??煞謨深悾阂活愂切姓晕墨I(包括憲法、司法文獻),主要涉及政府法律、經濟方面的國會和議會記錄、議案、決議、司法資料、聽證記錄、法律、法令、規(guī)章制度、政策、調查統(tǒng)計資料等;另一類是科學技術文獻,主要指政府部門出版的科技報告、標準、專利文獻、科技政策文件,公開后的科技檔案、經濟規(guī)劃、氣象資料等。
政府出版物的內容涉及人類生活的各個領域:政治、社會、經濟、財政、工農業(yè)生產、教育、歷史,也有自然科學和應用科學的各個領域。政府出版物是了解一個國家方計、政策、科學技術和經濟、生活現(xiàn)狀的權威性信息來源。特點:政策性、綜合性、指導性強,對經濟、科技發(fā)展政策導向明顯、可靠。
(8)學位論文:學位論文是指為了獲得學位,要求被授予學位的人所撰寫的論文。根據(jù)《中華人民共和國學位條例》的規(guī)定,學位論文分為學士論文、碩士論文、博士論文三種。特點:質量參差不齊,內容專深,有獨到見解,較難獲取。(9)產品資料:產品目錄、產品說明書、產品樣本等,是對產品的性能、結構、原理、用途、使用方法、技術規(guī)范及產品規(guī)格等進行描述或說明的文獻。特點:圖文并茂,形象直觀,出版及時,更新迅速,反映的技術信息可靠。(10)技術檔案:在生產或科研過程中形成的,是具體工程和研究對象的技術文件的總稱,包括任務書、技術經濟指標、研究計劃、方案、試驗設計、實驗記錄、調查材料、總結報告等應入檔的資料。它是生產和科研中用以積累經驗、吸取教訓和提高質量的重要依據(jù),具體較高的參考價值。技術檔案有一定的保密性,一般在內部控制使用。(11)報紙:報紙指以刊載新聞和新聞評論為主,通常散頁印刷,不裝訂、沒有封面的紙質出版物。有固定名稱,面向公眾,定期、連續(xù)發(fā)行。現(xiàn)在多數(shù)報紙每日出版一次或數(shù)次,也有每周出版幾次或每周出版一次的。特點:傳播信息快,傳播信息量大,現(xiàn)實感強,傳播面廣,具有群眾性和通俗性,是重要的社會輿論工具和信息源。第三節(jié)信息檢索的類型一、按檢索對象的內容區(qū)分:(1)文獻檢索(documentretrieval)(2)數(shù)據(jù)檢索(dataretrieval)(3)事實檢索(factretrieval)
二、按檢索方式區(qū)分;(1)手工檢索:以手工操作的方式,利用檢索工具書進行信息檢索。手工信息檢索是信息檢索的傳統(tǒng)方式,已經歷經了一個多世紀的發(fā)展歷程。其優(yōu)點是直觀、靈活,便于控制檢索的準確性。缺點是查找比較復雜,檢索速度慢,工作量較大。(2)機器信息檢索:主要是指計算機檢索,是通過機器對已數(shù)字化的信息,按照設計好的程序進行查找和輸出的過程。按機器檢索的處理方式分類,有脫機檢索、聯(lián)機檢索;按照存儲的方式分類,可分為光盤檢索、網絡檢索。優(yōu)點:大大提高了檢索效率和檢索的全面性,而且拓展信息檢索領域,豐富了信息檢索的研究內容。
手檢和機檢的比較手檢:檢索點少,通常只有分類、主題、號碼、著者等幾個途徑;查準率高,查全率低,直接性靈活性差,瀏覽功能強,檢索效率低機檢:檢索點多:除虛詞外的所有詞匯;查全率高,查準率高,檢索效率高;直接性靈活性好,瀏覽功能差附:查全率:是指檢出的相關文獻量與檢索系統(tǒng)中相關文獻總量的比率,是衡量信息檢索系統(tǒng)檢出相關文獻能力的尺度。查全率=(檢出相關文獻量/系統(tǒng)中相關文獻總量)*100%
查準率:是指檢出的相關文獻量與檢出文獻總量的比率,是衡量信息檢索系統(tǒng)精確度的尺度。查準率=(檢出相關文獻量/檢出文獻總量)*100%計算機檢索是在手工檢索的基礎上發(fā)展地上起來的。已成為檢索的主流形式。但手工信息檢索工具的價廉、靈活、便攜等特征使其仍有存在和發(fā)展的空間。兩者共同存在,互相補充、互相促進。三、按檢索對象區(qū)分:(1)文本檢索:查找含有特定信息的文本文獻的檢索,其結果是以文本形式反映特信息反映的文獻。這是一種傳統(tǒng)的信息檢索類型,在信息檢索中至今占據(jù)主要地位。(2)多媒體檢索:多媒體是指將聲音、圖像、通信等在內的多種媒體的功能有機結合在一起,并用某種新媒體代替?zhèn)鹘y(tǒng)媒體的多種媒體。多媒體檢索是指根據(jù)用戶的需求,對文字、聲音、圖像、圖形等多種媒體信息進行組織、存儲從而識別、查找并獲取所需信息的過程。在因特網上存在著大量的多媒體文獻,用戶常常需要查找特定的聲音、圖像、動畫等。多媒體文獻的信息組織與處理傳統(tǒng)文本的處理截然不同,其檢索要求和檢索途徑也別具特色,這是現(xiàn)代信息檢索的新課題。四、按檢索對象的信息組織方式區(qū)分(1)全文檢索(fulltextretrieval)是將存儲于數(shù)據(jù)庫中的整本書、整篇文章中的任意內容找出來的檢索。它可以根據(jù)需要獲得全文中的有關章、節(jié)、段、句、詞等的信息,也可以進行各種統(tǒng)計與分析。如某個詞在文章中出現(xiàn)的次數(shù)。 以全文本信息作為檢索對象,建立全文數(shù)據(jù)庫,除了具有布爾邏輯檢索功能外,還具有文本檢索功能,并允許用戶以自然語言檢索,直接獲得原文中的有關章節(jié)和段句。(2)超文本檢索(hypertextretrieval):超文本是用超鏈接的方法,將各種不同空間的文字信息組織在一起的網狀文本。
超文本檢索系統(tǒng)是以超文本網絡為基礎的文獻檢索系統(tǒng)。在檢索文獻時,各節(jié)點間的多種鏈接關系可以動態(tài)地選擇性激發(fā),從而可根據(jù)思維聯(lián)想或新信息的需要,通過鏈接從一個節(jié)點跳到另一個節(jié)點,由此形成隨著人們思維和需要的流動而構成的數(shù)據(jù)鏈,體現(xiàn)出一種完全不同于過去順序檢索方式的聯(lián)想式檢索。(3)超媒體檢索(hypermediaretrieval)如果超文本節(jié)點中的信息除文本塊以外,還有圖形、圖像、聲音、視頻等多媒體信息,則稱為超媒體(hypermedia)。即存儲對象超出了文本范疇,融入了靜、動態(tài)圖像(形)以及聲音等多種媒體信息。(同樣具有超文本檢索的優(yōu)點,并且檢索內容與形式更為豐富)五、按檢索要求區(qū)分:(1)強相關檢索:強調檢索的準確性,也稱作特性檢索。這種檢索注重查準率。只要檢索得到的文獻信息能滿足用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業(yè)品買賣合同書
- 康雙的離婚協(xié)議書
- 三農村生態(tài)建設實施指南
- 工程監(jiān)理承包合同
- 云計算在企業(yè)IT架構中應用教程
- 運動訓練方法與技巧指南
- 軟件測試流程與質量保障作業(yè)指導書
- 臨設工程勞務分包合同
- 網絡安全威脅防范與應對作業(yè)指導書
- 鋼渣購銷合同
- Starter Unit 1 Hello!說課稿2024-2025學年人教版英語七年級上冊
- 2025年初中語文:春晚觀后感三篇
- Unit 7 第3課時 Section A (Grammar Focus -4c)(導學案)-【上好課】2022-2023學年八年級英語下冊同步備課系列(人教新目標Go For It!)
- 《教育強國建設規(guī)劃綱要(2024-2035年)》解讀講座
- 《基于新課程標準的初中數(shù)學課堂教學評價研究》
- 省級產業(yè)園區(qū)基礎設施項目可行性研究報告
- 預算績效評價管理機構入圍投標文件(技術方案)
- 2019北師大版高中英語選擇性必修四單詞表
- 園藝產品的品質講義
- 鋼筋混凝土框架結構工程監(jiān)理的質量控制
- 桃花節(jié)活動方案
評論
0/150
提交評論