課件教程分析第1章_第1頁
課件教程分析第1章_第2頁
課件教程分析第1章_第3頁
課件教程分析第1章_第4頁
課件教程分析第1章_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第1章信息檢索與信息資源1.1信息檢索所謂信息檢索,有時也被稱為信息獲取、信息查詢等。它們的意思相差無幾,都表示用戶利用現(xiàn)代信息查詢系統(tǒng)來獲取所需信息內(nèi)容的過程這種信息查詢系統(tǒng)通常有兩類搜索引擎各種信息資源站點1.1.1信息檢索的必要性

Google已經(jīng)成為一個動詞

2006年6月15日,著名的牛津英語大辭典(TheOxfordEnglishDictionary,OED)就已經(jīng)把Google收錄成一個動詞Google是誰?Google是一家軟件公司的名稱,這家公司在1998年才成立,發(fā)展至今已經(jīng)成為能和微軟等軟件公司競爭的大型公司它就是一家專門從事Internet信息查詢服務的搜索引擎公司國外的還有雅虎等搜索引擎,甚至微軟后來也開始從事搜索引擎的開發(fā)和運營中國國內(nèi)的也有很多,比較著名的有百度和搜狗等.這些說明了什么?搜索引擎廠家已經(jīng)成為現(xiàn)代Internet企業(yè)中舉足輕重的力量造成這種現(xiàn)象的一個根本原因就是現(xiàn)代社會已經(jīng)越來越多的需要利用搜索引擎等信息查詢服務來完成各種日常工作和生活等各個方面活動對于個人,信息查詢又有什么用呢2006年曾經(jīng)有一本暢銷書,名稱叫《搜商:人類的第三種能力》搜商(SearchQuotient,SQ)是一種與智商、情商并列的人類智力因素,也就是人類通過某種手段獲取新知識的能力,其本質(zhì)就是查詢信息和搜索信息的能力旅游出行前比如旅游出行前,需要對旅游目的地做必要的了解,防止一些完全可以避免的事情出現(xiàn),常見的方法就是查詢Internet上的搜索引擎如果事先借助搜索引擎查查各種旅游攻略、注意事項和別人旅游回來后發(fā)表的各種心得,完全可以避免這種事情在生活和工作打印機出現(xiàn)的問題老是在液晶屏上顯示一個“PrinterMispick”的提示,一時沒想起來,找了半天說明手冊其實直接在百度上輸入“PrinterMispick”,直接就解決了問題與經(jīng)濟有關的領域利用搜索引擎進行廣告推廣已經(jīng)成為一種常見的市場營銷策略,用戶只需在搜索引擎中輸入一些查詢詞,搜索引擎就會把相應的廣告有效的推送給用戶瀏覽與經(jīng)濟有關的領域各種電子商務網(wǎng)絡購物站點的關鍵功能就在信息查詢,這也是影響用戶使用感受的一個最為明顯的因素如果這種系統(tǒng)不能很好的幫助用戶找到自己所需的商品,恐怕用戶就不愿意使用它如淘寶在自己主頁的顯著位置上放置了一個搜索框,同時也在各個商品的瀏覽頁面中集成了各種方便用戶的查詢功能,甚至還要求用戶對此提出意見人生的幾件大事——教育高中畢業(yè)選擇高校和專業(yè),僅僅查閱那個小小的高校專業(yè)介紹顯然不夠看看大家對這些高校和專業(yè)的關注程度和相關網(wǎng)絡信息,才可以更好的幫助我們做出選擇人生的幾件大事——教育如果我們知道專門提供此類高校專業(yè)信息的站點,則可以獲取更為準確的參考信息如教育部學位與研究生教育發(fā)展中心主辦的“中國學位與研究生教育信息網(wǎng)”就公布有年度中國大學的學科排名信息人生的幾件大事——找工作就業(yè)找工作,那不就是就業(yè)信息查詢嗎相關就業(yè)招聘服務已經(jīng)成為現(xiàn)代網(wǎng)絡站點常見的一種服務功能人生的幾件大事——婚戀連找對象這種事情也都成為現(xiàn)代Internet信息查詢服務產(chǎn)業(yè)中一個很大的市場,如各種婚戀介紹站點等。一種感性理解的總結到此,我們可以對信息查詢的必要性有一個感性的認識在現(xiàn)代社會中,信息查詢已經(jīng)成為一種重要的用戶行為,和我們?nèi)粘9ぷ魃蠲芮邢嚓P所以我們有必要學習如何更好的使用各種諸如搜索引擎在內(nèi)的信息查詢系統(tǒng),同時也應該了解一些常見的信息資源站點,知道從哪些站點可以更為方便的獲取哪些信息,從而為我們提供更多的便利我們是如何使用這些知識的呢?

這包括兩個重要條件要存在這樣的一個知識體不管是圖書和報紙等傳統(tǒng)紙質(zhì)文獻,還是Internet存儲的電子資源,它們都是一種知識體的具體存在形式,因此知識體是客觀存在的用戶能夠表達需要什么樣的知識相對于第一個條件而言,似乎這個條件更為簡單然而對于用戶來說,這才是需要著力掌握的技能之一這其實也就是一種信息查詢的能力,越能有效的掌握獲取和查詢知識的能力,用戶就越有可能在今天海量的信息世界中找到自己所需的內(nèi)容目前的困境今天Internet上的信息量已經(jīng)呈現(xiàn)出一種爆炸性增長的態(tài)勢據(jù)報道,2008年7月,Google搜索引擎能夠查詢到的Internet網(wǎng)頁就高達1萬億,而且每天增加的網(wǎng)頁數(shù)量也在十億數(shù)量級上面對著這個海量的信息資源,人們卻難以有效的獲取所需知識主要原因在于這種信息資源的增長速度遠遠超出了人們能夠處理它們的能力約翰?奈斯比特(JohnNaisbitt)在《大趨勢》一書中是這樣形容人們目前所處的困境:“信息是豐富的,而我們正在渴求知識(RichDataButPoorInformation)”目前的困境當然,通過改進搜索引擎等信息查詢系統(tǒng)的功能可以解決這一問題。然而我們也注意到,在更多的情況下,用戶查詢技能方面的改進空間更大一些,甚至可以說,如果用戶不能很好的掌握信息查詢方法,再好的信息查詢系統(tǒng)也難以發(fā)揮它們的威力。目前的困境搜狗實驗室在2007年曾經(jīng)發(fā)表過一篇研究論文。文中指出,在對搜狗搜索引擎一個月內(nèi)近5000萬條查詢?nèi)罩具M行分析處理后,發(fā)現(xiàn)以下事實:長度不超過3個詞的查詢占了總查詢數(shù)的93.15%,平均長度為1.85個詞這說明用戶輸入的查詢通常都比較短。而我們都能想象出,查詢詞語越短就越難以有效的表達用戶的準確信息需求更為吃驚的現(xiàn)象是,只有約0.73%的查詢含有用于高級查詢功能的符號,即目前大多數(shù)中文檢索用戶只是通過輸入很少的幾個關鍵詞就開始查詢這些包括布爾查詢在內(nèi)的高級查詢往往都能更為有效的表達用戶的信息需求。1.1.2信息查詢的基本過程匹配與選擇需求集合特征化表示信息集合特征化表示外部知識信息檢索基本原理示意圖信息檢索最本質(zhì)的概括:對信息集合與需求集合的匹配與選擇。信息查詢的基本過程主要分為兩個步驟用戶發(fā)出對信息的查詢請求信息查詢系統(tǒng)響應用戶,返回請求的查詢結果用戶和知識體并不能直接交流,中間存在兩個主要的轉換環(huán)節(jié)。瀏覽網(wǎng)頁也是信息查詢行為嗎?比如用戶打開網(wǎng)易主頁,看到了主頁上的體育新聞,很快點擊該超鏈,在彈出的新頁面中看到了更多的體育新聞。由于該用戶是個籃球迷,于是在這個網(wǎng)頁中又連續(xù)點擊看到很多關于NBA聯(lián)賽的消息這種操作看起來并不像是信息查詢,其實它具有信息查詢活動的全部特點,即用戶有比較明顯的信息需求,同時也在不停的獲取滿足這種需求的各類信息資源具體來看,用戶的點擊都能反映出用戶的一種個性化的信息需求不過和一般搜索引擎查詢不一樣的地方在于這種查詢過程沒有顯式的查詢詞語輸入,而且用戶的信息需求是逐漸在瀏覽操作中被啟發(fā)而形成的但它確實是一種信息查詢過程,我們通常稱之為基于超鏈訪問行為的信息查詢1.1.3信息檢索信息檢索的類型

(1)按檢索對象的內(nèi)容劃分①書目檢索(BibliographicRetrieval)。書目檢索通常也稱為文獻檢索(DocumentRetrieval),是指以查找某一課題的相關文獻為目標的檢索。②數(shù)據(jù)檢索(NumericRetrieval)。數(shù)據(jù)檢索是指以特定的數(shù)值型數(shù)據(jù)為對象的檢索。③事實檢索(FactRetrieval)。事實檢索是指以特定的事實為目標的檢索。1.1.3信息資源檢索(2)按檢索方式劃分①手工信息檢索(ManualRetrieval)。手工信息檢索指以手工操作的方式,利用印刷型檢索工具書進行信息檢索。②計算機信息檢索(Computer-basedRetrieval)。計算機信息檢索是通過計算機對已數(shù)字化的信息,按照設計好的程序進行查找和輸出的過程。手工信息檢索和計算機信息檢索的本質(zhì)是相同的,區(qū)別僅在于信息的載體形式、存儲方式和匹配機制。1.1.3信息資源檢索(3)按檢索要求劃分①強相關檢索。強相關檢索也稱為特性檢索,強調(diào)向用戶提供高度對口的信息。②弱相關檢索。弱相關檢索也稱為族性檢索,強調(diào)向用戶提供系統(tǒng)、完整的信息。強相關檢索和弱相關檢索是兩種要求比較極端的檢索類型。實際上更多的時候,用戶對于檢索的要求介于兩者之間,既要求查找對口的信息,又希望得到所有的信息。但在信息檢索的實際過程中,查全和查準常常不能兼顧。1.1.3信息資源檢索(4)按檢索的時間跨度劃分①定題檢索(SelectiveDisseminationofInformation,SDI)。定題檢索是根據(jù)用戶的需要,預先將制訂好的檢索式存入檢索系統(tǒng)中,定期對檢索系統(tǒng)中的信息進行查詢。②回溯檢索(RetrospectiveSearch,RS)?;厮輽z索也稱為追溯檢索,是查找一段時期內(nèi)有關特定主題信息的檢索,并將檢索結果一次性提供給用戶。1.1.3信息資源檢索(5)按檢索對象的信息表現(xiàn)形式劃分①文本檢索(TextRetrieval)。文本檢索是查找含有特定信息的文本文獻的檢索。②多媒體檢索(MultimediaRetrieval)。多媒體檢索是根據(jù)用戶的需求,對文字、聲音、圖像、圖形等多種媒體信息進行組織、存儲從而識別、查找并獲取有關信息的過程。③超文本檢索(HyperTextRetrieval)。超文本檢索是將諸多文本信息通過超級鏈接聯(lián)系起來而形成的一種非線性的文本結構。④超媒體檢索(HyperMediaRetrieval)。超媒體檢索是對超文本檢索的補充。1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫1.信息檢索系統(tǒng)信息檢索系統(tǒng)是根據(jù)一定的社會需要,面向一定的用戶群體,為達到特定信息檢索需求目的而建立的一種有序化的信息資源集合體。它是一個具有收集、整理、加工、存儲和檢索信息的設備與方法,能為用戶提供信息服務的多功能開放系統(tǒng)。1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫2.信息檢索系統(tǒng)的類型(1)手工信息檢索系統(tǒng)(ManualRetrievalSystem)

手工檢索系統(tǒng)是一種以印刷型檢索工具為主體的系統(tǒng),它主要以紙質(zhì)印刷載體為依托,以各類型文獻信息資源為檢索對象,采用手工方式進行檢索。檢索者通過手工查詢就可完成檢索過程并獲取所需要的信息。這種檢索系統(tǒng)的特點是檢索過程靈活,可以隨時修改檢索策略,檢索結果較為準確。但這種系統(tǒng)檢索速度慢,效率低,更新慢,查全率低。印刷型檢索工具主要以文獻信息和事實數(shù)據(jù)信息為檢索對象,因此又可細分為文獻檢索工具和事實數(shù)據(jù)檢索工具。1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫(1)手工信息檢索系統(tǒng)(ManualRetrievalSystem)

①文獻檢索工具。文獻檢索是以獲取與檢索課題相關的特定文獻為目標的檢索活動。根據(jù)文獻著錄特點、著錄款目的內(nèi)容和揭示文獻的深度的不同,文獻檢索工具可以進一步細分為目錄、題錄、索引和文摘4種檢索工具。②事實與數(shù)據(jù)檢索工具。事實與數(shù)據(jù)檢索工具主要是依靠各類參考工具書,完成各種事實或數(shù)據(jù)的查詢,其檢索目標和對象是獲得特定的科學數(shù)據(jù)與事實說明。1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫(2)機械式信息檢索系統(tǒng)(MechanicalRetrievalSystem)機械信息檢索階段是手工信息檢索到計算機信息檢索的過渡性階段,發(fā)展于20世紀40~50年代。機械檢索系統(tǒng)包括穿孔卡片檢索系統(tǒng)和縮微品檢索系統(tǒng)2類系統(tǒng)。由于它過分依賴于設備,而且檢索復雜,成本高,檢索效率和質(zhì)量不理想,因此,機械信息檢索系統(tǒng)很快被計算機信息檢索系統(tǒng)所取代。1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫(3)計算機息檢索系統(tǒng)(Computer-basedRetrievalSystem)

20世紀50年代初,美國海軍兵器中心圖書館利用IBM701機開發(fā)了計算機信息檢索系統(tǒng),標志了計算機信息檢索階段的開始。計算機信息檢索系統(tǒng)是由計算機技術、電子技術、遠程通信技術等構成的用于信息存儲和檢索的系統(tǒng),一般包含計算機設備、終端、通信設備、數(shù)據(jù)庫和各類檢索應用軟件等。從廣義來講,計算機檢索包括信息的存儲和檢索2個環(huán)節(jié)。其過程是在人機的協(xié)同作用下完成的。1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫(3)計算機信息檢索系統(tǒng)(Computer-basedRetrievalSystem)存儲按照既定的標準和原則,從信息源中選擇合適的信息,提取信息的特征,用系統(tǒng)的索引語言進行標引,形成檢索特征標識,構成可供檢索的數(shù)據(jù)庫計算機信息檢索系統(tǒng)檢索將符合要求的檢索提問式輸入計算機檢索系統(tǒng),由計算機根據(jù)程序在選定的數(shù)據(jù)庫中進行匹配運算,再將符合提問要求的檢索結果按指定格式輸出1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫3.數(shù)據(jù)庫及其結構

數(shù)據(jù)庫(Database)是指在計算機的存儲設備上按照一定的方式存儲的相互關聯(lián)的數(shù)據(jù)集合,通常由一組相關的文檔組成。數(shù)據(jù)庫是計算機檢索系統(tǒng)的重要組成部分,是重要的電子信息資源管理工具,也是計算機信息檢索操作的主要對象。不同的數(shù)據(jù)庫,其存儲電子信息資源的內(nèi)容、形式各有不同,檢索途徑和方法也有很大的差異。數(shù)據(jù)庫主要由文檔、記錄、字段3個層次構成。對于一個數(shù)據(jù)庫而言,數(shù)據(jù)庫由若干個文檔組成,一個文檔由大量的記錄組成,而每個記錄中又包含有若干字段,這就是文獻數(shù)據(jù)庫的層次結構。3.數(shù)據(jù)庫及其結構1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫文檔(File)

記錄(Record)

字段(Field)

文檔,即文件,是數(shù)據(jù)庫內(nèi)容的基本組成形式,是由若干個邏輯記錄組成的信息集合。一般來說,一個數(shù)據(jù)庫至少包括一個順排文檔(主文檔)和一個倒排文檔(索引文檔)。記錄是文檔的基本單元,是對某一實體的全部屬性進行描述的結果。在全文數(shù)據(jù)庫中,一個記錄相當于一篇完整的文獻;在書目數(shù)據(jù)庫中,一個記錄相當于一條文摘或題錄,或者相當于目錄中的一個款目。字段是記錄的基本單元,是對某一實體的具體屬性進行描述的結果。在各類數(shù)據(jù)庫中字段的內(nèi)容都是不同的,一般字段與信息的著錄項目相對應。文獻數(shù)據(jù)庫中的字段通常分為基本字段和輔助字段。記錄:構成數(shù)據(jù)庫的基本單元,也是文檔的構成單位,是對某一實體的屬性進行描述的結果。在書目數(shù)據(jù)庫中,被描述的實體是某一特定文獻,其屬性就是該文獻的外表特征和內(nèi)容特征。即一條文獻信息(款目)。如:一條文摘信息(記錄)

一條書目信息(記錄):

ACCESSION:31739598AUTHOR:Dichter,Carl.TITLE:SoftwareengineeringwithPerlPLACE:EnglewoodCliffs,N.J.PUBLISHER:PrenticeHallPTR,YEAR:1995PUBTYPE:BookFORMAT:282p.:ill.;24cm.+1computerdisk(31/2in.)NOTES:Includesbibliographicalreferences(p.267-268)andindexSystemrequirementsforaccompanyingcomputerdisk:HighDensityMSDOS;MacintoshwithPCExchange.ISBN:013016965XSUBJECT:Softwareengineering.Perl(Computerprogramlanguage)Software--EngineeringOTHER:Pease,Mark.字段(field)是組成記錄的下級單位(條目中的一個信息項),用來描述實體的某一具體屬性。

如表述文獻內(nèi)容特征的有文摘、敘詞、自由詞字段,表述文獻外表特征的有著者、篇名、出版年、專利號等等字段,子字段(subfield),是字段的構成單位。文檔文檔:是由若干數(shù)量的記錄所構成的一類數(shù)據(jù)的集合。一般地說,一個數(shù)據(jù)庫至少包括一個順排文檔和一個倒排文檔。順排文檔是將記錄中的信息按某一字段(一般為存取號)的順序存放起來形成的文檔,通常按記錄存入的先后順序線性排列,所以也稱為線性文檔,或主文檔.122StudentTeachingintheContextofaSchool-University

123CooperativeLearninginResponsetoan

124InSearchofResponsiveTeachingfor

125TeachingTopography:IntroducingStudentstoContourMapConstruction.Fife,BarbaraS.ScienceTeacher,v62n5p38-43May1995ISSN:0036-8555AvailableFrom:UMI 倒排文檔數(shù)據(jù)庫的“索引”即是它的倒排文檔,它是將記錄中一切可檢索的標識抽出,按某種順序(如字順,分類)重新排列而形成的文檔。如主題、著者、文種等倒排文檔。倒排文檔著者倒排檔主題倒排檔文種倒排檔著者存取號主題詞存取號文種存取號Hanjs010003基因010003China010002Hanqd010001心血管010001Eng010003Madl010002腫瘤010002Eng0100014.數(shù)據(jù)庫的分類(1)參考數(shù)據(jù)庫(ReferenceDatabase)

參考數(shù)據(jù)庫是指存放某一學科領域原始文獻的來源和屬性的一類數(shù)據(jù)庫。數(shù)據(jù)庫中的記錄是通過對原始文獻的來源和屬性的再加工和過濾(如編目、索引、文摘等)而形成的,記錄內(nèi)容包括文獻的題目、著者、原文出處、文摘、主題詞等。它的作用是為用戶指出了獲取原始信息的線索,目的是引導用戶能夠快速、全面地鑒別和找到相關的信息。它包括以下數(shù)據(jù)庫:①書目數(shù)據(jù)庫(BibliographicDatabase)。②文摘數(shù)據(jù)庫和索引數(shù)據(jù)庫(AbstractDatabaseandIndexDatabase)。1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫4.數(shù)據(jù)庫的分類(2)源數(shù)據(jù)庫(SourceDatabase)

源數(shù)據(jù)庫是能夠直接為用戶提供原始資料或具體數(shù)據(jù)的一類數(shù)據(jù)庫。源數(shù)據(jù)庫可以提供的數(shù)據(jù)信息包括數(shù)值、事實和原文等,能夠直接滿足用戶的信息需求,而不必轉查其它的信息源。源數(shù)據(jù)庫主要包括以下幾種數(shù)據(jù)庫類型:①數(shù)值型數(shù)據(jù)庫(NumericDatabase)②事實型數(shù)據(jù)庫(FactDatabase)③全文型數(shù)據(jù)庫(Full-textDatabase)1.1.4信息檢索系統(tǒng)與數(shù)據(jù)庫全文數(shù)據(jù)庫:存貯一次文獻全文或其中主要部分等。事實數(shù)據(jù)庫指包含大量數(shù)據(jù)、事實的數(shù)據(jù)庫,如指南數(shù)據(jù)庫、術語數(shù)據(jù)庫等,相當于印刷型文獻中的字典、辭典、百科全書、組織機構指南、人名錄、圖冊(集)等。數(shù)值數(shù)據(jù)庫提供數(shù)值信息,如統(tǒng)計數(shù)據(jù)庫1.1.5信息檢索的發(fā)展歷史搜索引擎并非一種最早和唯一的信息查詢系統(tǒng)事實上,搜索引擎是隨著Internet網(wǎng)絡的產(chǎn)生才逐漸發(fā)展起來在Internet網(wǎng)絡出現(xiàn)之前,人們?nèi)绾芜M行信息查詢呢?早期的形式如果把時間拉回二十世紀初,那時還沒有計算機,所有的信息查詢都是基于紙質(zhì)文獻和膠片等傳統(tǒng)信息載體來進行這些都促進了一些學科的誕生,如圖書館學和檔案學等它們就是要研究如何更為有效和快速的管理和獲取這些信息資源計算機的出現(xiàn)在二十世紀中期,隨著計算機的出現(xiàn),特別是早期計算機網(wǎng)絡的出現(xiàn),人們就可以嘗試將傳統(tǒng)的信息資源電子化,并建立一些基于計算機的信息查詢系統(tǒng)這些系統(tǒng)在很大程度上借鑒了傳統(tǒng)圖書館學和檔案學的一些方法和思路,直到今天我們還能看到很多,甚至一些名詞仍然保留了下來如“索引”,今天的索引主要是指用于提高計算機數(shù)據(jù)庫查詢速度的一種特殊數(shù)據(jù)結構但是這個詞語最早在圖書館中是指對圖書的標題和作者等信息按照一定次序分條排列并以此提供圖書快速查詢線索的一種檢索工具現(xiàn)代信息查詢系統(tǒng)的出現(xiàn)從二十世紀50年代開始,基于計算機系統(tǒng)的現(xiàn)代信息查詢系統(tǒng)開始出現(xiàn)據(jù)資料表明,1954年美國海軍武器實驗站圖書館建立了世界上第一個基于計算機的信息查詢系統(tǒng)主要的發(fā)展階段從此以后,此類系統(tǒng)開始快速發(fā)展起來一般認為,迄今已經(jīng)經(jīng)歷了四個主要發(fā)展階段脫機批處理查詢階段聯(lián)機信息查詢階段光盤信息查詢階段Internet信息查詢階段脫機批處理查詢階段稱呼來源于兩個關鍵詞“脫機”:即用戶不直接使用計算機,用戶只能將自己的查詢需求提交給這些專職操作員,由他們來專門進行查詢“批處理”:這些操作員不可能接收到一個查詢請求就處理一個,操作員會在收到很多用戶提交的查詢請求后,對其進行分類合并,甚至還要對用戶的查詢進行必要的修改,得到速度最快、效果最好的查詢指令,最后集中提交給計算機一并處理。處理完后,操作員將這些查詢結果再反饋給用戶聯(lián)機信息查詢階段到了二十世紀60年代,計算機網(wǎng)絡開始出現(xiàn)這并非今天的Internet網(wǎng)絡,而是一些早期的計算機網(wǎng)絡基于這些網(wǎng)絡,人們開始嘗試實現(xiàn)聯(lián)機的網(wǎng)絡信息查詢系統(tǒng)數(shù)據(jù)資料表明,1961年,美國系統(tǒng)發(fā)展公司首次在Prolosynthex上實現(xiàn)了全文百科全書聯(lián)機查詢系統(tǒng)到了1965年,該公司在全美境內(nèi)進行聯(lián)網(wǎng)試驗并取得成功,最終形成了著名的ORBIT聯(lián)機情報查詢系統(tǒng)聯(lián)機信息查詢階段和以前的脫機批處理系統(tǒng)相比,這種系統(tǒng)的用戶不必一定是直接操作計算機的專職操作員,也可以或者更可能是一些通過網(wǎng)絡連接到計算機的其他終端用戶這種聯(lián)機信息查詢系統(tǒng)的價值更大,使用范圍更廣,影響也更深遠網(wǎng)絡技術還能保證數(shù)據(jù)的及時更新和實時獲取使用這些系統(tǒng)的用戶開始變多,任何用戶只要能夠通過網(wǎng)絡連接到該計算機系統(tǒng)上,就可以使用這些系統(tǒng)。這樣用戶就可以通過自由的不斷修改查詢條件,獲取自己滿意的查詢結果聯(lián)機信息查詢階段到了二十世紀70年代,隨著網(wǎng)絡技術的高速發(fā)展,聯(lián)機信息查詢系統(tǒng)得到了迅速發(fā)展一大批著名的大型聯(lián)機信息查詢系統(tǒng)紛紛出現(xiàn),如DIALOG、BRS、STN、ESA-IRS等其中DIALOG系統(tǒng)是最大的國際聯(lián)機信息查詢系統(tǒng),現(xiàn)為ProQuest在線信息服務提供商的成員,擁有各個行業(yè)600多個數(shù)據(jù)庫資源,存儲的記錄總數(shù)高達3億多,占世界所有信息查詢系統(tǒng)數(shù)據(jù)庫文獻總量的一半以上到了二十世紀80年代,我國也開始連接到這些國際聯(lián)機信息查詢系統(tǒng)上光盤信息查詢階段雖然聯(lián)機信息查詢系統(tǒng)非常方便,但是由于使用的是專用的計算機網(wǎng)絡,因此費用高昂到了二十世紀80年代初,Internet網(wǎng)絡還沒有普及,一種新型的數(shù)據(jù)載體改變了這種狀況,那就是光盤最早的光盤是由荷蘭的菲利普公司于1972年研制成功的激光唱盤,但直到1983年,日本才首次推出可以用于計算機存儲的數(shù)據(jù)光盤這種存儲介質(zhì)的最大特點就是容量大,而且數(shù)據(jù)保持持久,更重要的是光盤造價低廉。只要在計算機上安裝光驅(qū)或者光盤塔之類的設備即可讀取光盤上的數(shù)據(jù)信息當然,這種方式也有它的缺點,那就是數(shù)據(jù)無法及時更新,除非購買新的光盤光盤信息查詢階段1985年,美國國會圖書館首次使用光盤制作了機讀目錄直到今天,雖然Internet網(wǎng)絡已經(jīng)普及,但是數(shù)據(jù)光盤仍是一種常見的數(shù)據(jù)存儲形式因為在很多時候,直接訪問光盤來獲取信息還是一種比較簡單、穩(wěn)妥和經(jīng)濟的選擇方案所以,很多數(shù)據(jù)庫既提供Internet網(wǎng)絡版本,也提供相應的數(shù)據(jù)光盤版本如南京大學圖書館提供的ProQuest查詢服務就要求用戶在使用前選擇光盤塔中的相應數(shù)據(jù)光盤Internet信息查詢階段到了二十世紀90年代以后,隨著Internet網(wǎng)絡的發(fā)展,一切都改變了脫機批處理早已一去不復返,聯(lián)機信息查詢系統(tǒng)也逐漸在Internet網(wǎng)絡上開展服務即便是使用光盤數(shù)據(jù),就像很多圖書館一樣,它可以在購買過光盤后仍然通過Internet網(wǎng)絡給用戶提供各種信息查詢服務本書主要講述這些內(nèi)容與聯(lián)機檢索相比,Internet網(wǎng)絡檢索的特點

網(wǎng)絡檢索信息質(zhì)量差:聯(lián)機檢索系統(tǒng)的數(shù)據(jù)庫都經(jīng)過了嚴格的加工、標引,信息的附加值高,來源可靠;Internet的信息資源雖然豐富,但良莠不分,沒有可靠的來源和深度。Internet網(wǎng)上的信息檢索空間較聯(lián)機檢索大:它可以檢索網(wǎng)絡上的資源而用戶不必知道資源的地址。它是全球的網(wǎng)絡之網(wǎng)絡,信息分布在全世界各地的各臺主機上。Internet的用戶操作較聯(lián)機檢索方便。Internet檢索的準確率不如聯(lián)機檢索的高:雖然網(wǎng)上提供了巨大的信息源,但由于它不屬于某個固定機構,所以網(wǎng)上的信息幾乎是無組織的,有用的信息被埋沒在大量無用的信息之中。即使有分類,也很粗糙。速度方面:網(wǎng)絡檢索比聯(lián)機檢索快。在費用方面:網(wǎng)絡檢索比聯(lián)機檢索便宜。1.2信息資源簡單的理解信息資源就是經(jīng)過加工整理后形成的有序并且有用的信息集合體也就是指我們通常希望通過查詢活動得到的各類信息內(nèi)容和數(shù)據(jù)資源信息源又稱情報源,是用戶獲取信息的來源。聯(lián)合國教科文組織(UNESCO)從信息使用者的角度把信息源定義為:“個人為滿足其信息需要而獲得信息的來源”。從絕對意義上看,信息的產(chǎn)生“源頭”,都可以稱作信息源。信息源可分為以下4種形式。1.2.1信息資源的類型1.信息源的類型(1)體裁信息源體裁信息指以人體為載體,通過口頭語言和身體語言(體態(tài))這些信息交流符號創(chuàng)造和傳播并能為他人識別的信息。參與社會信息交流的每個人都是一個獨立的信息源。由于主要的獲取方式是口頭交流和身體語言,所以體裁信息源又可進一步劃分為口頭信息源和體語信息源。體裁信息源的特點是及時、新穎、主觀隨意和瞬時性。(2)實物信息源一切物質(zhì)實體蘊含著的豐富信息均可視為實物信息,它給人們提供了充分認識事物的物質(zhì)條件。其特點是直觀、真實和零散。依據(jù)實物的人工與天然特性又可將實物信息源分為以自然物質(zhì)為載體的天然實物信息源和人工實物為載體的人工實物信息源。(3)文獻信息源文獻信息亦稱為文獻資源,是用一定的記錄手段將系統(tǒng)化的信息內(nèi)容存儲在各類載體上而形成的一類信息源。文獻信息源是信息源的主體部分,是信息搜集、存儲、檢索和利用的主要對象。(4)網(wǎng)絡信息源網(wǎng)絡信息源以網(wǎng)絡為紐帶連接起來的和以網(wǎng)絡為主要交流、傳遞、存儲手段與形式的信息資源。網(wǎng)絡信息資源通過網(wǎng)絡將原本相互獨立、分布于世界各地的數(shù)據(jù)庫、信息中心、文獻中心等連接在一起,形成一個內(nèi)容與結構全新的信息載體。2.文獻信息源的類型(1)按照信息源的加工程度來劃分文獻信息源的分類方法多種多樣,其中,按照加工的程度來劃分。文獻信息源可以分為:

①零次文獻。②一次文獻③二次文獻④三次文獻(1)按照信息源的加工程度來劃分

零次文獻信息源是最原始的信息資源,雖未公開交流,但它是生成一次文獻信息的主要素材;一次文獻信息源是最主要的信息資源,是人們檢索和利用的主要對象;二次文獻信息源是對一次文獻信息的集中提煉和有序化,是檢索一次文獻信息的工具,故又稱檢索工具;三次文獻信息源是按知識門類或?qū)n}將二次文獻信息重新組織、高度濃縮而成,是人們查考數(shù)據(jù)信息和事實信息的主要信息源。(2)按照信息源的載體類型劃分按照文獻信息源存在的載體形式來劃分文獻信息源的類型是最常采用的方法,此方法將文獻信息源劃分成以下4類:①印刷型(PrintedForm)。②電子型(ElectronicForm)。③縮微型(MicroForm)。④聲像型(Audio-VisualForm)。3.主要的一次文獻信息源

一次文獻是文獻信息檢索的主要對象,常用的一次文獻主要包括圖書、期刊、會議文獻、學位論文、專利文獻、標準文獻、科技報告、政府出版物、產(chǎn)品樣本和產(chǎn)品目錄、檔案,統(tǒng)稱為十大文獻信息源。其中,圖書、期刊(報紙)被稱為普通文獻(白色文獻);會議文獻、學位論文、專利文獻、標準文獻、科技報告、政府出版物、產(chǎn)品樣本和產(chǎn)品目錄以及檔案8種類型文獻被稱為特種文獻(灰色文獻),它是一種介于圖書與期刊之間的文獻類型,通常在出版發(fā)行方面或獲取途徑方面比較特殊,因而被稱為特種文獻。(1)圖書(Book)圖書是一種按章成冊的出版物,是對已有研究成果、生產(chǎn)技術知識、實踐經(jīng)驗的論述和概括。圖書按其內(nèi)容性質(zhì)和作用可分為普及讀物、教科書、叢書、專著、論文集、參考工具書等。圖書的內(nèi)容成熟、系統(tǒng)、全面,有目次表和索引,查閱方便,是傳播知識的重要工具。但是由于出版周期較長,知識的新穎性不夠。

(2)期刊(Periodical)、報紙(Newspaper)①期刊。期刊又稱雜志,一般是指定期或不定期出版的有固定名稱的連續(xù)出版物。期刊出版周期短,報道速度快,內(nèi)容豐富新穎,能及時反映當代社會發(fā)展趨勢和科技發(fā)展動向,是交流學術思想和進行科學研究的最基本的文獻形式,因而成為利用率最高的文獻類型。②報紙。報紙是期刊的一種特殊類型,是以刊載新聞和事實評論為主的,定期連續(xù)向公眾發(fā)行的一種連續(xù)出版物。其基本特點是內(nèi)容新、涉及面廣,是讀者最多、影響最廣的文獻信息源。及時性是報紙區(qū)別于其他文獻的最主要特征。(3)科技報告(Science&TechnicalReport)科技報告是指科研過程進展情況的階段性記錄或科研成果的報告。科技報告一般單獨成冊,有具體的篇名、機構名稱和統(tǒng)一的連續(xù)編號(報告號)。科技報告的種類有技術報告、札記、論文、備忘錄、通報等。目前全球每年約有10萬種科級報告產(chǎn)生,其中,以美國商務出版局的PB報告、美國軍事國防部的AD報告、美國宇航部門的NASA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論