信息檢索基礎(chǔ)理論_第1頁
信息檢索基礎(chǔ)理論_第2頁
信息檢索基礎(chǔ)理論_第3頁
信息檢索基礎(chǔ)理論_第4頁
信息檢索基礎(chǔ)理論_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

信息檢索基礎(chǔ)理論第1頁,課件共77頁,創(chuàng)作于2023年2月信息源是指信息的來源,熟悉信息源的分布情況,有利于信息用戶高效得獲取信息。1.信息源的類型文獻(xiàn)信息源文獻(xiàn)是知識的一切載體,因此,文獻(xiàn)是重要的信息源。了解文獻(xiàn)出版的類型及特點,熟悉文獻(xiàn)載體及制作方式,對于及時有效的獲取信息至關(guān)重要。文獻(xiàn)的類型第2頁,課件共77頁,創(chuàng)作于2023年2月2.按照文獻(xiàn)的結(jié)構(gòu)等級(文獻(xiàn)的加工程度)劃分即是按文獻(xiàn)中信息量變化情況來劃分,可分為四個等級(1)零次文獻(xiàn):指那些未來得及記錄下來,尚未發(fā)表或不宜公開和大范圍內(nèi)交流的比較原始的素材、底稿、手稿、工作總結(jié)、考察記錄、調(diào)查稿、原始統(tǒng)計教據(jù)、科技檔案及各種口法交流的知識、經(jīng)驗、情報、意見以及各種操作規(guī)范性方面的知識等。如實驗記錄、手稿、原始錄音、原始錄像、談話記錄等。零次文獻(xiàn)在原始文獻(xiàn)的保存、原始數(shù)據(jù)的核對、原始構(gòu)思的核定(權(quán)利人)等方面有著重要的作用。第3頁,課件共77頁,創(chuàng)作于2023年2月特點:不拘形式、成文迅速、大多為原始素材、記錄,可直接與當(dāng)事人接觸、具有很強的針對性,并且直觀形象,更具有啟發(fā)性,也更容易接受。但也因其自身原因,造成傳播途徑少、流通范圍窄,或因保密或限制使用,使其極少被人們關(guān)注。近幾年,隨著信息業(yè)飛速發(fā)展,人們開始重視它的存在與價值。例如:錄音、錄像、圖片、圖表等第4頁,課件共77頁,創(chuàng)作于2023年2月(2)一次文獻(xiàn)primarydocument):是指人們以自己的經(jīng)驗、研究成果為基本素材而創(chuàng)作或撰寫的文獻(xiàn),不管創(chuàng)作時是否參考或引用了他人的著作,也不管該文獻(xiàn)以何種物質(zhì)形式出現(xiàn),均屬一次文獻(xiàn)。大部分期刊上發(fā)表的文章和在科技會議上發(fā)表的論文均屬一次文獻(xiàn)。特點:一般論述比較詳細(xì)、具體而系統(tǒng),有觀點、有事實、有結(jié)論。他直接在科研、教學(xué)中祈禱參考和借鑒作用,是主要的情報源。包括:期刊論文、科技報告、專利說明書、會議論文等。例如:維普《中文科技期刊數(shù)據(jù)庫》第5頁,課件共77頁,創(chuàng)作于2023年2月(3)二次文獻(xiàn)(secondarydocument):是指文獻(xiàn)工作者對一次文獻(xiàn)進(jìn)行加工、提煉和壓縮和組織之后,形成的系統(tǒng)的、便于管理和利用一次文獻(xiàn)而編輯、出版和累積起來的工具性文獻(xiàn)。檢索工具書和網(wǎng)上檢索引擎是典型的二次文獻(xiàn)。特點:有組織、有系統(tǒng)包括:目錄、題錄、文摘、索引等例如:工程索引——Ei,科技會議錄索引——ISTP等第6頁,課件共77頁,創(chuàng)作于2023年2月(4)三次文獻(xiàn)tertiarydocument):在利用二次文獻(xiàn)的基礎(chǔ)上,對檢索到的一次文獻(xiàn)進(jìn)行廣泛、深入的分析研究后,選用先關(guān)一次文獻(xiàn)再次經(jīng)加工編寫出來的成果。如綜述、述評等。特點:從新的高度和深度揭示相關(guān)一次文獻(xiàn),是一次文獻(xiàn)的濃縮,是情報信息重要來源。例如:各種詞典、百科全書、年鑒、綜述、專題述評等。第7頁,課件共77頁,創(chuàng)作于2023年2月文獻(xiàn)間的相互關(guān)系零次文獻(xiàn):文獻(xiàn)形成其它文獻(xiàn)的基礎(chǔ)一次文獻(xiàn):是文獻(xiàn)的基本形式,是檢索的主要對象,是二次和三次文獻(xiàn)的基礎(chǔ);二次文獻(xiàn):是檢索一次文獻(xiàn)的工具;三次文獻(xiàn):是一次文獻(xiàn)的濃縮,是對眾多文獻(xiàn)分析、綜合歸納、整理而形成的??傮w來說:科技文獻(xiàn)經(jīng)過加工壓縮,從零次文獻(xiàn)到三次文獻(xiàn),是科技文獻(xiàn)有分散到集中,有無組織到系統(tǒng)第8頁,課件共77頁,創(chuàng)作于2023年2月3.根據(jù)文獻(xiàn)編輯出版形式劃分(1)圖書:工具書、普通圖書(2)特種文獻(xiàn):科技報告、專利文獻(xiàn)、學(xué)位論文、標(biāo)準(zhǔn)文獻(xiàn)、會議文獻(xiàn)、政府出版物、產(chǎn)品資料(3)連續(xù)出版物:期刊、報紙第9頁,課件共77頁,創(chuàng)作于2023年2月圖書:凡篇幅達(dá)48頁以上,并構(gòu)成一個書目單元的文獻(xiàn)成為圖書。識別點:ISBN號;書名;作者;出版社名稱、地點;出版年;頁數(shù)期刊:指定期連續(xù)出版,有固定的刊名并編有時序號或數(shù)序號的出版物。識別點:ISSN號;刊名;年、卷、期號;頁碼期刊論文:是從期刊中析出的文獻(xiàn)識別點:ISSN號;刊名;年、卷、期號;頁碼第10頁,課件共77頁,創(chuàng)作于2023年2月科技報告:有關(guān)科研工作記錄或成果的報告。科技報告是科技工作者圍繞某個課題研究取得成果的正式報告,或?qū)δ硞€課題研究過程中各個階段進(jìn)展情況的實際記錄。識別點:報告號例如:朱家荷,韓調(diào).鐵路區(qū)間通過能力計算方法的研究[R].北京:鐵道部科學(xué)研究院運輸及經(jīng)濟研究所,1989第11頁,課件共77頁,創(chuàng)作于2023年2月會議文獻(xiàn):是在各種學(xué)術(shù)、專題會議上發(fā)表的論文和報告。識別點:會議名稱;會議錄出版時間;會議時間;會議地址例如:徐竹青.編碼在計算機與信息科學(xué)中的地位和作用的新探討[A]。見:2001全國計算機新科技與計算機繼續(xù)教育學(xué)術(shù)會議論文集[C].北京:中國見算計學(xué)會,2001.166-169第12頁,課件共77頁,創(chuàng)作于2023年2月專利文獻(xiàn):形成過程中產(chǎn)生的一系列官方文件和有關(guān)出版物的總稱識別點:專利號;專利國別;專利權(quán)人;專利有限日期等例如:馮其波.一種激光多自由度測量系統(tǒng)與方法:中國,ZL2003105126.X[P].2003-09-03第13頁,課件共77頁,創(chuàng)作于2023年2月標(biāo)準(zhǔn)文獻(xiàn):經(jīng)過工人的權(quán)威當(dāng)局批準(zhǔn)的以文件形式表達(dá)出的統(tǒng)一規(guī)定。包括技術(shù)標(biāo)準(zhǔn)、技術(shù)規(guī)格和技術(shù)規(guī)則等文獻(xiàn)的總稱。識別點:標(biāo)準(zhǔn)號例如:GB/T166642-1996計算機集成制造系統(tǒng)體系結(jié)構(gòu)[S].北京:國家技術(shù)監(jiān)督局,1996.第14頁,課件共77頁,創(chuàng)作于2023年2月學(xué)位論文:高等學(xué)?;蜓芯吭核膶W(xué)生在導(dǎo)師指導(dǎo)下從事某一學(xué)術(shù)課題的研究,未獲得某中學(xué)為而撰寫的學(xué)位論文。識別點:學(xué)位;學(xué)位論文名稱;頒發(fā)學(xué)位的單位及其地址;授予學(xué)位的時間。例如:阮小波.90年代以來中國大眾文化研究的回顧與反思[碩士論文].浙江:浙江師范大學(xué),2006.第15頁,課件共77頁,創(chuàng)作于2023年2月政府出版物:指各國政府部門及其所屬機構(gòu)所發(fā)表、出版的文件。其內(nèi)容廣泛,概括可以分為行政性文獻(xiàn)和科技文獻(xiàn)兩大類。識別點:有數(shù);報告;會議錄等多種形式產(chǎn)品資料:指國內(nèi)外各廠商為推銷產(chǎn)品而一發(fā)的一種商業(yè)性宣傳資料。包括產(chǎn)品樣本、產(chǎn)品目錄、產(chǎn)品說明書、廠商介紹、技術(shù)座談資料等。第16頁,課件共77頁,創(chuàng)作于2023年2月技術(shù)檔案:指企業(yè)或科研機構(gòu)在技術(shù)工作中形成的有一定工程對象的技術(shù)文件。如任務(wù)書、協(xié)議書、技術(shù)經(jīng)濟指標(biāo)和審批文件、研究計劃方案大綱等。其它文獻(xiàn):包括廣播、電視、報紙等大眾傳媒、科技電影、衛(wèi)星資料等第17頁,課件共77頁,創(chuàng)作于2023年2月各類型出版物的特點比較內(nèi)容新穎性:科技報告專利期刊會議文獻(xiàn)圖書信息報道速度:科技報告期刊會議論文專利流通范圍廣度:期刊圖書會議文獻(xiàn)專利政府出版物發(fā)行量:期刊專利圖書會議文獻(xiàn)具有法律性:專利、標(biāo)準(zhǔn)易于獲得程度:期刊圖書會議文獻(xiàn)專利標(biāo)準(zhǔn)政府出版物學(xué)位論文科技報告第18頁,課件共77頁,創(chuàng)作于2023年2月2.政府信息源是國家機關(guān)及其所屬部門頒發(fā)的文件,包括政府報告、政策法令、規(guī)章制度、會議紀(jì)要、調(diào)查統(tǒng)計資料等。隨著我國的《政府公開條例》的實施與電子政府的大力推進(jìn),我國通過網(wǎng)絡(luò)公開的政府信息資源日漸豐富。中央政府門戶網(wǎng)站(1)中華人民共和國中央人民政府門戶網(wǎng)站()是國務(wù)院和國務(wù)院各部門,以及各省、自治區(qū)、直轄市人民政府在國際互聯(lián)網(wǎng)上發(fā)布政府信息和提供在線服務(wù)的綜合平臺。第19頁,課件共77頁,創(chuàng)作于2023年2月中央政府門戶網(wǎng)站第20頁,課件共77頁,創(chuàng)作于2023年2月(2)四個基礎(chǔ)信息庫①人口基礎(chǔ)數(shù)據(jù)庫由公安部牽頭,國家計生委、國家統(tǒng)計局、民政部等部門參與建設(shè),以公民身份標(biāo)志碼為唯一標(biāo)志的人口基礎(chǔ)信息庫和查詢服務(wù)系統(tǒng),實現(xiàn)人口信息計算機管理和聯(lián)機查詢,為各電子政務(wù)業(yè)務(wù)系統(tǒng)提供人口信息服務(wù)。②法人單位基礎(chǔ)信息庫③自然資源和地理空間基礎(chǔ)信息庫④宏觀經(jīng)濟基礎(chǔ)數(shù)據(jù)庫(3)其他的政府信息資源法律法規(guī):專利:標(biāo)準(zhǔn):商標(biāo):統(tǒng)計數(shù)據(jù)與經(jīng)濟金融信息:科研信息:企業(yè)信用信息:貿(mào)易信息:產(chǎn)品質(zhì)量信息第21頁,課件共77頁,創(chuàng)作于2023年2月政府信息資源第22頁,課件共77頁,創(chuàng)作于2023年2月統(tǒng)計數(shù)據(jù)與經(jīng)濟金融信息第23頁,課件共77頁,創(chuàng)作于2023年2月產(chǎn)品質(zhì)量信息第24頁,課件共77頁,創(chuàng)作于2023年2月3.行業(yè)協(xié)會信息源指介于政府、企業(yè)之間,商品生產(chǎn)業(yè)與經(jīng)營者之間,并未其提供服務(wù)、咨詢、溝通、監(jiān)督、公正、自律、協(xié)調(diào)的社會中介組織,是一種民間性組織,它不屬于政府管理機構(gòu)系列,它是政府與企業(yè)的橋梁和紐帶。據(jù)民政部消息,截至2004年12月,我國31?。ㄊ?、區(qū))(未含港澳臺)各類行業(yè)協(xié)會已達(dá)45736家。截至2008年8月13日,被中央政府網(wǎng)()收錄的全國性行業(yè)協(xié)會共299家。協(xié)會一般都建有自己的網(wǎng)站,查找該內(nèi)網(wǎng)站的方法是搜索引擎,搜索詞為“行業(yè)名稱協(xié)會網(wǎng)”;或直接用“行業(yè)名稱網(wǎng)”。第25頁,課件共77頁,創(chuàng)作于2023年2月上海市汽車行業(yè)協(xié)會第26頁,課件共77頁,創(chuàng)作于2023年2月4.公益信息服務(wù)部門信息源主要包括國家圖書館及各省、市、縣、鄉(xiāng)鎮(zhèn)公共圖書館,各高等院校圖書館、中國科學(xué)院幾個分院文獻(xiàn)中心、中國社科院幾個分院文獻(xiàn)中心,中央黨校及各省市黨校圖書館,中國科技信息研究所及省市縣科技信息研究所,國家檔案館所及各個省市縣檔案館,中央各部委及省市各委局的信息中心等。公益信息服務(wù)機構(gòu)或聯(lián)合體,擁有大量的信息資源,承擔(dān)為公眾提供服務(wù)的責(zé)任。第27頁,課件共77頁,創(chuàng)作于2023年2月公益信息服務(wù)部門第28頁,課件共77頁,創(chuàng)作于2023年2月公益信息服務(wù)部門第29頁,課件共77頁,創(chuàng)作于2023年2月公益信息服務(wù)部門第30頁,課件共77頁,創(chuàng)作于2023年2月公益信息服務(wù)部門第31頁,課件共77頁,創(chuàng)作于2023年2月5.內(nèi)容信息服務(wù)商新信息源商業(yè)綜合網(wǎng)站,如搜狐、騰訊、新浪、網(wǎng)易各種電子商務(wù)網(wǎng)站,如淘寶、阿里巴巴、支付寶等搜索引擎,如百度、google等商業(yè)數(shù)據(jù)庫,如維普、萬方數(shù)據(jù)庫等其他內(nèi)容信息服務(wù)商所開發(fā)運營的網(wǎng)站、數(shù)據(jù)庫等第32頁,課件共77頁,創(chuàng)作于2023年2月綜合網(wǎng)站第33頁,課件共77頁,創(chuàng)作于2023年2月搜索引擎第34頁,課件共77頁,創(chuàng)作于2023年2月商業(yè)數(shù)據(jù)庫第35頁,課件共77頁,創(chuàng)作于2023年2月6.信息咨詢及中介咨詢機構(gòu)信息源會計師事務(wù)所律師事務(wù)所市場信息調(diào)查機構(gòu)咨詢服務(wù)機構(gòu)(公司)生產(chǎn)力促進(jìn)中心7.個人信息源是指居民個人擁有的可為他人提供服務(wù)的信息資源。主要包括個人學(xué)術(shù)網(wǎng)站、個人博客、個人播客、個人威客、專家在線咨詢、人肉搜索引擎的等。第36頁,課件共77頁,創(chuàng)作于2023年2月

普華永道會計師事務(wù)所(PriceWaterhouseCoopersPLL)

第37頁,課件共77頁,創(chuàng)作于2023年2月咨詢服務(wù)機構(gòu)(公司)第38頁,課件共77頁,創(chuàng)作于2023年2月個人信息源第39頁,課件共77頁,創(chuàng)作于2023年2月8.信息保障系統(tǒng)信息源“在圖書館很難借到你真正需要的書,在internet上總能找到你不需要的東西?!比绾未蚱拼死Ь??答案是信息聯(lián)合保障。中國高等文獻(xiàn)保障系統(tǒng)()國家科技圖書文獻(xiàn)中心()中國高校人文社科文獻(xiàn)中心高等學(xué)校中英文圖書數(shù)字化國際合作計劃國家科技基礎(chǔ)條件平臺全國文化信息資源共享工程國際聯(lián)機計算機圖書中心Google全球數(shù)字圖書館第40頁,課件共77頁,創(chuàng)作于2023年2月中國高等文獻(xiàn)保障系統(tǒng)第41頁,課件共77頁,創(chuàng)作于2023年2月國家科技圖書文獻(xiàn)中()第42頁,課件共77頁,創(chuàng)作于2023年2月全國文化信息資源共享工程第43頁,課件共77頁,創(chuàng)作于2023年2月高等學(xué)校中英文圖書數(shù)字化國際合作計劃第44頁,課件共77頁,創(chuàng)作于2023年2月尋找信息源的方法1.按信息的生產(chǎn)使用者查詢該信息的生產(chǎn)者是誰?使用者是誰?相關(guān)者是誰(管理者)?查找信息可以從上述方面進(jìn)行:比如:鐵路法規(guī),制定者是全國人大,使用者是鐵道部,相關(guān)者是法院和一些律師事務(wù)所,鐵路法規(guī)就可以從上面網(wǎng)站中分別獲取第45頁,課件共77頁,創(chuàng)作于2023年2月2.從信息收藏與傳播工具進(jìn)行檢索比如,學(xué)術(shù)文章去專業(yè)期刊查,而你不是報紙和雜志,公開、免費信息可用網(wǎng)絡(luò)搜索引擎檢索科技商業(yè)信息可用數(shù)據(jù)庫進(jìn)行檢索第46頁,課件共77頁,創(chuàng)作于2023年2月3.從信息行業(yè)屬性檢索,包括行業(yè)學(xué)會、行業(yè)協(xié)會等第47頁,課件共77頁,創(chuàng)作于2023年2月按信息源途徑查詢?nèi)ツ睦锊樵冑Y料?圖書館搜索引擎(網(wǎng)絡(luò))信息(情報)所(中心)第48頁,課件共77頁,創(chuàng)作于2023年2月信息檢索基礎(chǔ)理論信息檢索(informationretrieval)廣義角度看,信息檢索包括信息存儲和信息獲取兩個過程。信息存儲指通過對大量無序信息的選擇和收集、著錄和標(biāo)引等方法,建成各種各樣的信息檢索工具或信息檢索系統(tǒng),使之有序化信息集合的過程。獲取是存儲的逆過程,其實質(zhì)是根據(jù)特定的需求,運用已組織好的檢索系統(tǒng),將特定的信息查找出來。存儲是獲取的前提和基礎(chǔ),沒有存儲就沒有獲取,而獲取是存儲的目的,二者密切聯(lián)系,互相依存,缺一不可。狹義角度看,從信息集合中迅速、準(zhǔn)確地查找出所需信息的程序和方法,即信息獲取的過程。第49頁,課件共77頁,創(chuàng)作于2023年2月信息檢索的原理就是將特定的信息需求與存儲在檢索系統(tǒng)中的信息標(biāo)識進(jìn)行異同的比較與匹配,選取兩者相符的信息予以輸出。無論手工檢索還是計算機檢索,其基本原理都是一樣的。也就是說,檢索系統(tǒng)對所要存儲的信息,按照其外部特征和內(nèi)容特征賦予特征標(biāo)識,然后存入系統(tǒng)。檢索時,將所需信息的特征標(biāo)識與所存信息的特征標(biāo)識進(jìn)行比較,凡是兩邊標(biāo)識一致的,就將具有這些標(biāo)識的信息從檢索系統(tǒng)中輸出。具體如圖:第50頁,課件共77頁,創(chuàng)作于2023年2月檢索流程圖信息需求信息標(biāo)引表達(dá)檢索提問信息標(biāo)知比較與匹配檢索結(jié)果評價/反饋第51頁,課件共77頁,創(chuàng)作于2023年2月信息檢索的類型文獻(xiàn)檢索(documentretrieval)是以文獻(xiàn)(包括文獻(xiàn)、題錄和全文)為檢索對象,從以存儲的文獻(xiàn)數(shù)據(jù)查找出特定文獻(xiàn)的過程,是文獻(xiàn)檢索的核心部分。第52頁,課件共77頁,創(chuàng)作于2023年2月數(shù)據(jù)檢索Dateretrieval以數(shù)據(jù)為檢索對象,從以收藏數(shù)據(jù)資料中查找特定數(shù)據(jù)的過程,包括物質(zhì)的各種參數(shù)、電話號碼、銀行轉(zhuǎn)賬、觀測數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等數(shù)字?jǐn)?shù)據(jù),也包括圖表、圖譜、市場行情、化學(xué)分子式、物質(zhì)的各種特性等非線性數(shù)字?jǐn)?shù)據(jù),是一種確定性檢索,信息用戶檢索到各種數(shù)據(jù)是經(jīng)過專家測試、評價、篩選過的,可直接用來進(jìn)行定量分析。例如:檢索2009年中國國民生產(chǎn)總值是什么?第53頁,課件共77頁,創(chuàng)作于2023年2月事實檢索Factretrieval是通過對存儲文獻(xiàn)中已有的基本事實,或?qū)?shù)據(jù)進(jìn)行處理后得出的事實的過程。其檢索對象既包括事實、概念、思想、知識等非線性數(shù)值信息,也包括一些數(shù)據(jù)信息,但需要針對查詢要求,有檢索系統(tǒng)進(jìn)行分析、推理后,再輸出最終結(jié)果。第54頁,課件共77頁,創(chuàng)作于2023年2月信息檢索的演變手工檢索系統(tǒng)計算機檢索系統(tǒng)網(wǎng)絡(luò)檢索階段信息檢索的未來階段第55頁,課件共77頁,創(chuàng)作于2023年2月信息檢索系統(tǒng)信息檢索系統(tǒng):是指根據(jù)特定的信息需求而建立起來的一種有關(guān)信息搜索、加工、存儲和檢索的程序化系統(tǒng),其主要目的是為人們提供信息服務(wù)。包括:信息、檢索技術(shù)設(shè)備、檢索語言及方法構(gòu)成:輸入功能、存儲功能、處理功能、輸出功能及控制功能。一般來說,信息檢索系統(tǒng)包括6各主要的子系統(tǒng):信息選擇子系統(tǒng)信息索引子系統(tǒng)詞表管理子系統(tǒng)檢索子系統(tǒng)用戶同系統(tǒng)之間交互子系統(tǒng)匹配子系統(tǒng)第56頁,課件共77頁,創(chuàng)作于2023年2月檢索語言檢索語言是文獻(xiàn)存貯和檢索所遵循的一種規(guī)范。在文獻(xiàn)組織和檢索中,檢索語言用來描述文獻(xiàn)外部特征或文獻(xiàn)內(nèi)部特征,對文獻(xiàn)進(jìn)行排序及檢索提問。使信息組織者和檢索者達(dá)到共同理解,實現(xiàn)存取統(tǒng)一。

檢索語言保證了不同標(biāo)引人員表達(dá)文獻(xiàn)的一致性,保證了檢索提問與文獻(xiàn)標(biāo)引的一致性,保證了檢索結(jié)果與檢索要求的一致性。第57頁,課件共77頁,創(chuàng)作于2023年2月檢索語言分類檢索語言非控制語言(非人工語言)控制語言(人工語言)題名、刊名責(zé)任者姓名專利號、檔案號等關(guān)鍵詞分類號主題語言分類語言敘詞第58頁,課件共77頁,創(chuàng)作于2023年2月檢索語言按照何種特征描述劃分檢索語言表述文獻(xiàn)外表特征表述文獻(xiàn)內(nèi)容特征題名、刊名責(zé)任者姓名專利號、檔案號等分類號主題語言分類語言敘詞關(guān)鍵詞第59頁,課件共77頁,創(chuàng)作于2023年2月檢索語言分類檢索語言分類檢索語言主題檢索語言分類主題檢索語言古代分類法現(xiàn)代分類法人大法科圖法中圖法四部分類法中圖法通用復(fù)分表第60頁,課件共77頁,創(chuàng)作于2023年2月分類語言分類是指依據(jù)事物的屬性或特征進(jìn)行區(qū)分和類聚,并將區(qū)分結(jié)果按照一定次序組織起來的活動。分類語言,(又可稱為信息資源分類法、文獻(xiàn)分類法),是使用分類方法將文獻(xiàn)主題概念區(qū)分、歸納形成類目體系,然后以號碼為基本字符,用分類號表達(dá)類目體系中每個主題概念的檢索語言。按照編制的原理可分為三種類型:體系分類法分面組配式半分面分類法第61頁,課件共77頁,創(chuàng)作于2023年2月

體系分類法

體系分類法是基于以學(xué)科門類為基礎(chǔ),根據(jù)文獻(xiàn)的內(nèi)部和某些外部特征,運用概念劃分的原則,按知識門類的邏輯次序由總體到分支、由一般到具體、由簡單至復(fù)雜進(jìn)行層層劃分,逐級展開。一個大類或上位類每劃分一次產(chǎn)生許多子類目,所有不同級別的子類目向上層層隸屬,向下級級派生,從而形成了一個嚴(yán)格有序的直線性知識門類等級體系。

《中國圖書館圖書分類法》是最常用的體系分類法。第62頁,課件共77頁,創(chuàng)作于2023年2月《中國圖書館圖書分類法》《中國圖書館圖書分類法》(簡稱《中圖法》是目前國內(nèi)最常用的體系分類語言。

1975年出版第一版

1998年出版第四版

《中圖法》以各門學(xué)科的特點和規(guī)律為基礎(chǔ),按照知識門類的邏輯次序,將學(xué)科劃分為五個基本部類、二十二個基本大類。

《中圖法》的五個部類為:馬克思主義、列寧主義、毛澤東思想;哲學(xué);社會科學(xué);自然科學(xué);綜合性圖書。第63頁,課件共77頁,創(chuàng)作于2023年2月體系分類法及其原理優(yōu)點:便于檢索、檢全某一學(xué)科、某一專業(yè)方面的文獻(xiàn),可根據(jù)需要擴大或縮小檢索范圍;對于某一個學(xué)科的檢索方便有效。缺點:現(xiàn)代科技交叉滲透,使得知識難以精確細(xì)分,受類目表的限制,使得查準(zhǔn)率降低,容易漏檢。第64頁,課件共77頁,創(chuàng)作于2023年2月中圖法二十二個大類A馬克思主義、列寧主義、毛澤東思想B哲學(xué)C社會科學(xué)總論D政治、法律E軍事F經(jīng)濟G文化、科學(xué)、教育、體育H語言、文字I文學(xué)J藝術(shù)K歷史、地理N自然科學(xué)總論O數(shù)理科學(xué)和化學(xué)P天文學(xué)、地球科學(xué)Q生物科學(xué)R醫(yī)藥、衛(wèi)生S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù)U交通運輸V航空、航天X環(huán)境科學(xué)Z綜合性圖書第65頁,課件共77頁,創(chuàng)作于2023年2月其它體系分類法1.《中國科學(xué)院圖書館圖書分類法》(簡稱《科圖法》):分為五大部二十五大類。至今仍有使用。2.杜威十進(jìn)分類法(DeweyDecimalClassificationanRelativeIndex,簡稱DC或DDC)。1876年問世,將圖書分為10個大類,采用單純阿拉伯?dāng)?shù)字做標(biāo)記。目前有兩個版本。有電子版和網(wǎng)絡(luò)版。是當(dāng)今世界流行最廣的分類法。3.美國國會圖書館圖書分類法(LibraryofCongressClassification,簡稱LCC):美國國會圖書館編制。共設(shè)21個基本大類,采用字母數(shù)字混合號碼標(biāo)記類目。第66頁,課件共77頁,創(chuàng)作于2023年2月主題檢索語言采用語詞直接作為文獻(xiàn)主題標(biāo)識,按字順排列主題標(biāo)識,提供各種檢索詞語的途徑。類型:標(biāo)題詞語言單元詞語言敘詞語言關(guān)鍵詞語言特點:專指性高、直觀性好、靈活性強第67頁,課件共77頁,創(chuàng)作于2023年2月檢索途徑檢索途徑就是檢索文獻(xiàn)的出發(fā)點及路線,有時也稱“檢索點”,從文獻(xiàn)的特征出發(fā),將其特征值域檢索系統(tǒng)中標(biāo)引數(shù)據(jù)進(jìn)行計算比較,通過匹配達(dá)到檢索目的。常用檢索途徑:主題途徑分類途徑作者途徑號碼途徑題名途徑引文途徑其他途徑第68頁,課件共77頁,創(chuàng)作于2023年2月檢索策略和方法檢索策略:即在分析檢索課題內(nèi)容實質(zhì)基礎(chǔ)上,選擇檢索系統(tǒng)、檢索途徑、確定檢索詞及其相互間的邏輯關(guān)系等的信息檢索方案。檢索表達(dá)式:檢索表達(dá)式是檢索策略的具體體現(xiàn),簡稱檢索式。檢索式一般有檢索詞和各種邏輯運算符組成,具體來說,它將檢索詞之間的邏輯關(guān)系、位置關(guān)系等用檢索系統(tǒng)規(guī)定的各種算符連接起來,成為計算機可以識別和執(zhí)行的命令形式。檢索式構(gòu)造的優(yōu)劣關(guān)系到檢索策略的成敗。第69頁,課件共77頁,創(chuàng)作于2023年2月檢索表達(dá)式主要有:邏輯表達(dá)式、加權(quán)表達(dá)式、位置檢索表達(dá)式、截詞檢索表達(dá)式,限制檢索表達(dá)式等,其中,最為常用的是邏輯表達(dá)式。邏輯表達(dá)式:是指利用布爾算符對檢索詞的關(guān)系進(jìn)行表達(dá),又稱布爾邏輯表達(dá)式。布爾算符有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論