第三講 計算機檢索原理與檢索系統(tǒng)(計算機科學專業(yè)必修課程)_第1頁
第三講 計算機檢索原理與檢索系統(tǒng)(計算機科學專業(yè)必修課程)_第2頁
第三講 計算機檢索原理與檢索系統(tǒng)(計算機科學專業(yè)必修課程)_第3頁
第三講 計算機檢索原理與檢索系統(tǒng)(計算機科學專業(yè)必修課程)_第4頁
第三講 計算機檢索原理與檢索系統(tǒng)(計算機科學專業(yè)必修課程)_第5頁
已閱讀5頁,還剩121頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三講計算機檢索原理綜合性數(shù)字資源檢索圖書的數(shù)字資源檢索期刊的數(shù)字資源檢索特種文獻的數(shù)字資源計算機檢索原理與檢索系統(tǒng)一、計算機檢索原理1.計算機檢索概念計算機檢索:利用電子計算機、高速信息網(wǎng)絡等信息技術(shù)存儲和檢索信息的過程。人們在計算機檢索網(wǎng)絡或終端上,使用特定的檢索指令、檢索提問,從計算機檢索系統(tǒng)的數(shù)據(jù)庫中檢索出所需要的信息,然后再由終端設備顯示、下載或打印。優(yōu)點:(1)檢索快捷:處理速度快、運算準確、可靠性高。(2)多元靈活:采用了邏輯運算和限制檢索等功能,使檢索詞之間能夠靈活地進行組配。(3)量大面廣:可迅速瀏覽相關(guān)領(lǐng)域的所有數(shù)據(jù)庫記錄,網(wǎng)絡中每臺個人計算機都可成為信息源。(4)更新迅速:如美國OCLC網(wǎng)絡的FirstSearch檢索系統(tǒng),新刊出版后3天內(nèi),即可出現(xiàn)。(5)資源共享:利用本地計算機可以查詢、獲取網(wǎng)上豐富的信息資源,實現(xiàn)資源共享。(6)方式多樣:提供聯(lián)機回溯檢索、定題檢索、聯(lián)機訂購、直接獲取全文等多種服務,可按要求輸出。(百度知道)2.信息檢索系統(tǒng)計算機信息檢索系統(tǒng)構(gòu)成:

服務器通信網(wǎng)絡檢索終端系統(tǒng)軟件數(shù)字資源

24券網(wǎng)站聲明

(1)服務器

服務器是檢索系統(tǒng)的核心部分,在檢索過程中需要處理大量的指令和數(shù)據(jù)。服務器要具有較高的運算速度和處理能力,并且具有相當大的信息存儲容量。服務器決定了系統(tǒng)的檢索速度和存儲容量。深圳“華為”的故事1987年由任正非創(chuàng)建于中國深圳,是全球最大的電信網(wǎng)絡解決方案提供商,全球第二大電信基站設備供應商。華為的主要營業(yè)范圍是交換,傳輸,無線和數(shù)據(jù)通信類電信產(chǎn)品,在電信領(lǐng)域為世界各地的客戶提供網(wǎng)絡設備、服務和解決方案。華為不上市的原因1、華為的股份結(jié)構(gòu):為了增強融資渠道和凝聚力,實行全員持股。2、商業(yè)模式創(chuàng)新:華為將自己定位為量產(chǎn)型公司而非技術(shù)創(chuàng)新型公司。3、全系自主研發(fā):華為充分利用中國的研發(fā)低成本,大量招聘研發(fā)人員。先利用主業(yè)務的研發(fā)和營銷平臺去培育新產(chǎn)品。(2)通信網(wǎng)絡通信網(wǎng)絡是終端與服務器之間的橋梁,其作用是確保信息傳遞的暢通。國際上大型聯(lián)機檢索系統(tǒng)的主機與本地區(qū)數(shù)據(jù)通信網(wǎng)絡相聯(lián),在網(wǎng)絡上有端口,檢索用戶通過網(wǎng)線和網(wǎng)絡設備檢索數(shù)據(jù)庫信息。

(3)檢索終端檢索終端是用戶與檢索系統(tǒng)傳遞信息進行“人—機對話”的裝置,有電傳終端、數(shù)傳終端和微機終端等。常用的微機終端,由計算機、打印機以及調(diào)制解調(diào)器組成。調(diào)制解調(diào)器的作用是把終端的信息在傳輸前加載到一個載波信號上,接受時通過檢測收到的信息偏離精確載波信號的程度,分離出原先發(fā)送的信號(稱之為解調(diào)),以解決信息傳輸過程中的衰減問題。(4)軟件軟件的作用是充分發(fā)揮硬件的功能,進行信息的存儲、處理檢索以及整個系統(tǒng)的運行管理。操作系統(tǒng)軟件:Windows2000,WindowsNT等。數(shù)據(jù)庫管理系統(tǒng)軟件:Oracle、Sybase等。數(shù)據(jù)庫檢索軟件和閱讀軟件:

ssreader(超星),vip(維普)(5)數(shù)據(jù)資源數(shù)據(jù)庫、電子書刊、網(wǎng)絡資源等。數(shù)據(jù)庫是一系列信息記錄的集合,是檢索系統(tǒng)中的信息源,它存儲在計算機的磁帶、磁盤或光盤上,借助于數(shù)據(jù)庫的管理軟件技術(shù)和檢索系統(tǒng)進行利用。國際上通常將其劃分為兩大類:參考數(shù)據(jù)庫、源數(shù)據(jù)庫。

參考數(shù)據(jù)庫:指引用戶到另一信息源以獲得原文或其它細節(jié)的一類數(shù)據(jù)庫。包括:

書目數(shù)據(jù)庫——存儲某個領(lǐng)域的二次文獻(如文摘、題錄、目錄等書目數(shù)據(jù))。指南數(shù)據(jù)庫——存儲關(guān)于某些機構(gòu)、人物、出版物、項目、程序、活動等對象的簡要描述,指引用戶從其它有關(guān)信息源獲取更詳細的信息。源數(shù)據(jù)庫:能直接提供原始資料或具體數(shù)據(jù)的數(shù)據(jù)庫,用戶不必再查閱其它信息源。數(shù)值數(shù)據(jù)庫——指專門提供以數(shù)值方式表示的數(shù)據(jù)(或包括其統(tǒng)計處理表示法)的一種。事實數(shù)據(jù)庫——指專門提供事物發(fā)展過程中產(chǎn)生的事實數(shù)據(jù)。全文數(shù)據(jù)庫——存儲文獻全文或其中主要部分,簡稱全文庫。術(shù)語數(shù)據(jù)庫——專門存儲名詞術(shù)語信息、詞語信息以及術(shù)語工作和語言規(guī)范工作成果。圖像數(shù)據(jù)庫——用來存儲各種圖像或圖形信息及有關(guān)文字說明資料。3.計算機檢索的發(fā)展(1)脫機檢索(Off-LineRetrieval)脫機檢索又稱批式檢索:用戶只需要把檢索要求送往檢索中心,由專職計算機人員進行檢索。往往把一批檢索提問集中起來,對提問不立即回答,而是定期成批地在計算機上查找。由于種種缺陷,已于20世紀60年代末、70年代初漸漸停止使用,脫機檢索系統(tǒng)逐步轉(zhuǎn)化成聯(lián)機檢索系統(tǒng)。1954年,美國海軍武器實驗站圖書館在一臺電子管計算機上建立了世界上第一個計算機檢索系統(tǒng)。

(2)聯(lián)機檢索(OnlineRetrieval)使用終端設備,運用一些規(guī)定的指令輸入檢索詞和檢索策略,通過通訊網(wǎng)絡與相關(guān)檢索系統(tǒng)直接連接進行"人機對話",同時通過運行檢索軟件從信息檢索系統(tǒng)的預先儲存文獻的數(shù)據(jù)庫中查找所需信息的過程。優(yōu)點:1.克服了地理上的障礙;2.消除了時間上的延遲現(xiàn)象;3.保證檢索者獲得最新、最及時的文獻信息;4.檢索者可修改檢索策略,達到一定的查全率和查準率。缺點:1.檢索費用較高;2.受地區(qū)通訊線路質(zhì)量的影響較大;3.檢索技術(shù)較為復雜,難以普及。

20世紀60年代對聯(lián)機信息檢索進行了研究開發(fā)試驗;70年代末進入了聯(lián)機檢索地區(qū)性應用階段;90年代以后,藉以高速信息網(wǎng)絡以嶄新面貌出現(xiàn)。(3)光盤檢索(CD-ROMSEARCHING)微機、檢索軟件、光盤驅(qū)動器和光盤數(shù)據(jù)庫即構(gòu)成光盤檢索系統(tǒng)。優(yōu)點是:①使用方便、簡單,易于操作;②不受機時的限制,可反復修改檢索策略,達到很高的檢全率與檢準率;③檢索費用低廉,沒有通訊費用,一次訂購,反復使用。缺點是:①數(shù)據(jù)更新周期較慢,時差長,文獻的新穎性不夠;②同一時間只能一人使用,資源浪費較大。但是,現(xiàn)在的光盤網(wǎng)絡技術(shù)已經(jīng)解決了這一問題。(4)網(wǎng)絡信息檢索(NETWORKSEARCHING)互聯(lián)網(wǎng)的發(fā)展使人類社會信息的存儲、傳遞、交流和利用發(fā)生了革命性的變化,世界變小了,實現(xiàn)了全球通訊和資源共享?;ヂ?lián)網(wǎng)上的信息資源呈現(xiàn)爆炸性增長,傳統(tǒng)的相對獨立的聯(lián)機檢索系統(tǒng)紛紛變成了互聯(lián)網(wǎng)上的一個站點,計算機檢索進入了網(wǎng)絡信息檢索階段。二、綜合性數(shù)字資源1.中國知網(wǎng)(中國知識基礎(chǔ)設施,CNKI

)國家知識基礎(chǔ)設施的概念,由世界銀行提出于1998年。CNKI工程由清華大學、清華同方發(fā)起,始建于1999年6月。采用自主開發(fā)并具有國際領(lǐng)先水平的數(shù)字圖書館技術(shù),建成"CNKI數(shù)字圖書館",并正式啟動建設《中國知識資源總庫》及CNKI網(wǎng)格資源共享平臺,通過產(chǎn)業(yè)化運作,為全社會提供信息資源和數(shù)字化學習平臺。9000多種期刊、近1000種報紙、18萬本博士/碩士論文、16萬冊會議論文、30萬冊圖書以及國內(nèi)外1100多個專業(yè)數(shù)據(jù)庫。(1)資源分布

(2)中國期刊全文數(shù)據(jù)庫CNKI系列全文數(shù)據(jù)庫之一,它收入1994年至今國內(nèi)公開出版的九千多種核心期刊和專業(yè)特色期刊的全文,按學科內(nèi)容分十大專輯,分別是:理工A(數(shù)理化天地生)、理工B(化學化工能源與材料)、理工C(工業(yè)技術(shù))、農(nóng)業(yè)、醫(yī)藥衛(wèi)生、文史哲、經(jīng)濟政治與法律、教育與社會科學、電子技術(shù)與信息科學。(3)中國優(yōu)秀碩士/博士學位論文全文數(shù)據(jù)庫

2.萬方數(shù)據(jù)資源系統(tǒng)以中國科技信息研究所(萬方數(shù)據(jù)集團公司)全部信息資源為依托建立起來的。1997年8月在國際互聯(lián)網(wǎng)上投入服務。1993年注冊成為中國第一家數(shù)據(jù)庫專業(yè)公司。網(wǎng)址:/以科技信息為主,集經(jīng)濟、金融、社會、人文信息為一體。分科技信息系統(tǒng)、數(shù)字化期刊、企業(yè)服務系統(tǒng)、醫(yī)藥信息系統(tǒng)4部分,擁有100多個數(shù)據(jù)庫。收錄范圍涉及期刊、會議、文獻、書目、題錄、報告、論文、標準、專利、法規(guī)等。可以單庫、跨庫檢索,也可以在所有數(shù)據(jù)庫中檢索,還可以按行業(yè)檢索。3.讀秀學術(shù)搜索

提供330多萬種中文圖書搜索(書目數(shù)據(jù)是國內(nèi)收錄最全、最新的,占建國后所出版圖書的95%以上);提供180多萬種(近10億多頁)中文圖書文全文檢索與閱讀;提供期刊、報紙、學術(shù)論文、會議論文的聯(lián)合檢索;書目檢索提供圖書試讀(書扉頁和正文部分頁試讀),檢索結(jié)果“提供文獻傳遞服務”。單次咨詢不超過50頁,一周咨詢總量提供不超過整本圖書的20%的傳遞服務。4.中國高等教育文獻保障系統(tǒng)ChinaAcademicLibrary&InformationSystem,簡稱CALIS,是國務院批準的我國高等教育“211工程”中公共服務體系之一。宗旨是把國家的投資、現(xiàn)代圖書館理念、先進的技術(shù)手段、高校豐富的文獻資源和人力資源整合起來,建設以中國高等教育數(shù)字圖書館為核心的教育文獻聯(lián)合保障體系,實現(xiàn)信息資源共建、共知、共享,以發(fā)揮最大的社會效益和經(jīng)濟效益,為中國的高等教育服務。CALIS管理中心設在北京大學,下設了文理、工程、農(nóng)學、醫(yī)學四個全國文獻信息服務中心,華東北、華東南、華中、華南、西北、西南、東北七個地區(qū)文獻信息服務中心和一個東北地區(qū)國防文獻信息服務中心。

985工程來源1998年5月4日,北京大學原國家主席江澤民在慶祝北京大學建校一百周年大會上向全世界宣告:“為了實現(xiàn)現(xiàn)代化,中國要有若干所具有世界先進水平的一流大學?!?/p>

今后連續(xù)3年,政府每年拿出中央財政收入的1%,作為中國建設“世界一流大學”的資金。以當年財政收入測算,“985工程”總投入將在300億以上。211工程來源后考慮到要形成一批行業(yè)帶頭學校,經(jīng)過多次研究,確定了到2000年前后,將重點建設的高等學校確定為100所左右,并要求將此事當作面向“21世紀”的大事來抓。

這項發(fā)展高等教育的重要措施開始簡稱為“211計劃”,后來確定為“211工程”。4.中國高等教育文獻保障系統(tǒng)ChinaAcademicLibrary&InformationSystem,簡稱CALIS,是國務院批準的我國高等教育“211工程”中公共服務體系之一。宗旨是把國家的投資、現(xiàn)代圖書館理念、先進的技術(shù)手段、高校豐富的文獻資源和人力資源整合起來,建設以中國高等教育數(shù)字圖書館為核心的教育文獻聯(lián)合保障體系,實現(xiàn)信息資源共建、共知、共享,以發(fā)揮最大的社會效益和經(jīng)濟效益,為中國的高等教育服務。CALIS管理中心設在北京大學,下設了文理、工程、農(nóng)學、醫(yī)學四個全國文獻信息服務中心,華東北、華東南、華中、華南、西北、西南、東北七個地區(qū)文獻信息服務中心和一個東北地區(qū)國防文獻信息服務中心。

1998年開始建設以來,CALIS引進和共建了一系列國內(nèi)外文獻數(shù)據(jù)庫,包括大量的二次文獻庫和全文數(shù)據(jù)庫;主持開發(fā)了聯(lián)機合作編目系統(tǒng)、文獻傳遞與館際互借系統(tǒng)、統(tǒng)一檢索平臺、資源注冊與調(diào)度系統(tǒng),形成了較為完整的CALIS文獻信息服務網(wǎng)絡。迄今參加CALIS項目建設和獲取CALIS服務的成員館已超過500家。二期建設將“中英文圖書數(shù)字化國際合作計劃”(簡稱CADAL)列入重要組成部分,。全國高校圖書館通過CALIS內(nèi)部信息庫,依據(jù)程序申請成為CALIS成員館,可獲得CALIS提供的各種服務。網(wǎng)址:安陽大學圖書館河南大學圖書館河南紡織高等??茖W校圖書館河南科技大學圖書館河南科技學院圖書館河南理工學院圖書館河南農(nóng)業(yè)大學圖書館河南師范大學圖書館河南新鄉(xiāng)醫(yī)學院圖書館河南中州大學圖書館華北水利水電學院圖書館洛陽師范學院圖書館鄭州大學圖書館河南工業(yè)大學圖書館鄭州輕工業(yè)學院圖書館鄭州師范高等??茖W校圖書館安陽師范學院圖書館河南財經(jīng)學院圖書館河南財政稅務高等專科學校圖書館河南商業(yè)高等??茖W校圖書館河南司法警官職業(yè)學院圖書館河南職業(yè)技術(shù)師范學院圖書館河南職業(yè)技術(shù)學院圖書館河南中醫(yī)學院圖書館中原工學院圖書館鶴壁職業(yè)技術(shù)學院圖書館黃河科技學院圖書館黃河水利職業(yè)技術(shù)學院圖書館河南理工大學圖書館焦作師范高等專科學校圖書館開封大學圖書館洛陽大學圖書館洛陽工業(yè)高等??茖W校圖書館漯河職業(yè)技術(shù)學院圖書館民辦中原職業(yè)技術(shù)學院圖書館南陽理工學院圖書館南陽師范學院圖書館5.OCLC檢索系統(tǒng)

OCLC(聯(lián)機計算機圖書館中心——OnlineComputerLibraryCenter)始建于1967年,總部設在美國俄亥俄州都柏林。它是一個面向圖書館的非贏利組織,以推動更多的人檢索信息,實現(xiàn)資源共享。目前,它擁有15個主題范圍的80多個數(shù)據(jù)庫,其中30多個數(shù)據(jù)庫可檢索到全文,總計包括6000多種期刊的聯(lián)機全文和2100多種期刊的電子映像,共達600萬篇文章的全文。OCLC中最具特色的數(shù)據(jù)庫是聯(lián)機聯(lián)合書目庫(OCLCOnlineUnion

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論