信息組織期末復(fù)習(xí)資料_第1頁
信息組織期末復(fù)習(xí)資料_第2頁
信息組織期末復(fù)習(xí)資料_第3頁
信息組織期末復(fù)習(xí)資料_第4頁
信息組織期末復(fù)習(xí)資料_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、信息檢索需求的多樣化( 1 )文獻(xiàn)檢索:是以文獻(xiàn)為檢索對(duì)象的信息檢索。它為用戶提供的是與用戶的信息需求相關(guān)的文獻(xiàn)信息,它的目的是相關(guān)文獻(xiàn)的出處和收藏處所。文獻(xiàn)檢索的結(jié)果是提供與課題相關(guān)的數(shù)篇文獻(xiàn)的線索或原文,供用戶參考. ( 2)數(shù)據(jù)檢索:是以數(shù)值和圖表形式表示的數(shù)據(jù)為檢索對(duì)象的信息檢索。數(shù)據(jù)檢索是一種確定性檢索.(3)事實(shí)檢索:是以從文獻(xiàn)中抽取的事項(xiàng)為檢索內(nèi)容的信息檢索。信息標(biāo)引:就是對(duì)信息內(nèi)容進(jìn)行分析并充分而有效地予以揭示。揭示信息的內(nèi)容是檢索信息、利用信息的前提條件。從學(xué)科屬性揭示信息內(nèi)容就是分類標(biāo)引,從主題特征揭示信息內(nèi)容就是主題標(biāo)引。準(zhǔn)確標(biāo)引信息要求準(zhǔn)確的內(nèi)容分析,否則就會(huì)出現(xiàn)錯(cuò)誤標(biāo)

2、引。信息系統(tǒng)組織: 信息通過特征描述和內(nèi)容揭示,獲得了表示信息的標(biāo)識(shí),但這只是針對(duì)某一文獻(xiàn)和信息單元的,把這些信息有序地組織起來才完成了信息組織的過程,這個(gè)過程就是信息系統(tǒng)組織。信息系統(tǒng)組織是把描述和標(biāo)引的信息實(shí)體和信息記錄組織成一個(gè)有序的系統(tǒng)。一、信息組織方法: (一)按組織對(duì)象分:文獻(xiàn)實(shí)體組織與信息內(nèi)容組織(二)按信息組織的層次分:語法信息組織、語義信息組織與語用信息組織(三)常用信息組織方法:1.分類組織法2.主題組織法3.集成組織法三、信息組織手段1 、人工組織2、自動(dòng)組織1、分類檢索語言: 分類檢索語言習(xí)慣簡稱分類語言或分類法,分類檢索語言語族主要有三個(gè)語支,即( 1)等級(jí)體系分類語

3、言( 2)分析綜合分類語言( 3)半分析綜合分類語言。2、主題檢索語言( 1 )標(biāo)引詞語言(2)單元詞語言(3)敘詞語言檢索語言詞匯控制的意義: 檢索語言構(gòu)成材料就是詞匯,把詞匯按某種方式組織起來構(gòu)成檢索語言詞典,它是標(biāo)引和檢索的工具。檢索語言的詞匯控制又稱規(guī)范化處理。由于表述信息內(nèi)容的詞匯非常龐雜,日常的自然語言詞匯并非都能準(zhǔn)確表達(dá)信息的學(xué)科和主題內(nèi)容。自然語言缺點(diǎn)(1)詞匯的同義現(xiàn)象。( 2)詞匯的多義現(xiàn)象。( 3)詞匯語義不清或語義不確定。( 4)詞量龐大(5)詞間關(guān)系不明晰在現(xiàn)行的一些檢索系統(tǒng)中,也比較廣泛地直接采用自然語言檢索,它雖然節(jié)省了詞匯控制的成本,但卻是以犧牲檢索效率為代價(jià)的

4、。因此,完全采用自然語言進(jìn)行信息組織的系統(tǒng)并不是理想的檢索系統(tǒng)。即便是面對(duì)互聯(lián)網(wǎng)急劇增長的信息資源,人們也越來越感到需要進(jìn)行規(guī)范化控制。由此有了規(guī)范化檢索語言在網(wǎng)絡(luò)信息組織中的應(yīng)用研究,有了網(wǎng)絡(luò)本體語言的開發(fā)。網(wǎng)絡(luò)信息組織從自由走向規(guī)范足以說明詞匯控制的意義。檢索語言詞匯控制的內(nèi)容:詞匯控制的目的是為了使檢索詞符合唯一性、規(guī)律性、定型性、通用性和準(zhǔn)確性。為了達(dá)到這個(gè)目標(biāo),應(yīng)該從以下幾方面進(jìn)行詞匯控制。( 1 )詞量控制。詞量控制是指對(duì)收入詞表的詞匯進(jìn)行壓縮、精選,使之與所要標(biāo)引的信息數(shù)量和檢索要求相適應(yīng)。 ( 2)詞類控制。自然語言詞匯有多種類別,如名詞、動(dòng)詞、形容詞、副詞、介詞、嘆詞,還有大

5、量的詞組。( 3)詞形控制。詞匯也存在不同的書面表達(dá)方式,如不同的次序、簡繁體、單復(fù)數(shù)、不同拼寫法,以及標(biāo)點(diǎn)符號(hào)、字符、數(shù)字等,為了實(shí)現(xiàn)每個(gè)詞詞義和詞性的唯一性,必須進(jìn)行詞形控制。( 4)詞義控制 。檢索語言中的每個(gè)詞匯都只表示一個(gè)概念,即使檢索語言詞匯一般都比較精煉和簡短,也會(huì)出現(xiàn)一詞多義和同形異義現(xiàn)象。因此,必要時(shí)在主題詞或類目詞后加限定詞,加含義及范圍注釋,或附加簡明定義等。 ( 5)詞間關(guān)系控制。在情報(bào)檢索語言詞典編制中,對(duì)詞匯語義和詞間關(guān)系必須控制,這是為了詞典中每個(gè)詞匯都有獨(dú)立的語義,詞間關(guān)系能形成一個(gè)語義網(wǎng)。(6)專指度控制。檢索語言詞匯的專指度是指其語義的內(nèi)涵與外延與信息主題內(nèi)

6、容的切合程度。信息檢索系統(tǒng)由六個(gè)子系統(tǒng)構(gòu)成:( 1)信息選擇子系統(tǒng)( 2)標(biāo)引子系統(tǒng)( 3)詞表子系統(tǒng)( 4)檢索子系統(tǒng) ( 5) 用戶與系統(tǒng)之間的交互子系統(tǒng)( 6) 匹配子系統(tǒng)即對(duì)信息標(biāo)引與提問標(biāo)引進(jìn)行匹配的子系統(tǒng)。從系統(tǒng)構(gòu)成分析可見,檢索語言和標(biāo)引是系統(tǒng)的中心環(huán)節(jié),它起著承上啟下,連接用戶與系統(tǒng)的關(guān)鍵作用。概念之間的關(guān)系(一 )屬種關(guān)系:它是指一個(gè)概念的外延包含另一概念的全部外延,其中,外延大的概念叫屬概念,外延小的概念叫種概念。(二)同一關(guān)系:它是指兩概念在外延上完全重合。(三)交叉關(guān)系: 即兩種概念之間有且只有一部分外延是重合的。概念邏輯方法(1) 概念的限定與概括概念的限定是指通過增

7、加概念的內(nèi)涵以縮小概念的外延,即由屬概念過渡到種概念的邏輯方法。對(duì)一概念進(jìn)行限定,從語言上說一般是增加限制詞,如定語、狀語等,例如,給“人”加上“大”就成為“大人”增加的限制詞應(yīng)是恰當(dāng)?shù)?,不能與原概念矛盾或重復(fù)。概念的概括是與概念的限定相反的一種邏輯方法,它是通過減少概念的內(nèi)涵從而擴(kuò)大其外延,由外延較小的種概念過渡到屬概念。如把“先進(jìn)工人”抽去“先進(jìn)的”這一內(nèi)涵就變成“工人”,再減去“從事工業(yè)生產(chǎn)的”這一內(nèi)涵就變成“人”,這就是一個(gè)概括的過程。概括的方法可以使我們的認(rèn)識(shí)上升到一定高度,加深對(duì)事物本質(zhì)的了解。(2) 概念的劃分概念的劃分就是以事物的某種屬性為分類標(biāo)準(zhǔn),將一個(gè)屬概念的外延分成若干個(gè)

8、種概念的方法。事物有各種各樣的屬性,根據(jù)不同的屬性就可做不同的劃分。如按圖書的文字可以把“圖書”分為“中文圖書”和“外文圖書”,按圖書的學(xué)科類別又可以劃分成“自然科學(xué)圖書”、 “社會(huì)科學(xué)圖書”等,按圖書的裝訂形式還可以劃分成“平裝圖書”、 “精裝圖書”,等等。概念的劃分的基本規(guī)則是: 劃分得到的子項(xiàng)的外延之和應(yīng)當(dāng)?shù)扔谀疙?xiàng)的外延,劃分得到的各子項(xiàng)的外延必須互相排斥,每次劃分應(yīng)當(dāng)使用同一標(biāo)準(zhǔn)進(jìn)行,劃分必須是按層次逐級(jí)進(jìn)行。分類檢索的類型分類檢索的基本形式有三種,即瀏覽式檢索、直接檢索、瀏覽與直接相結(jié)合的檢索1、 瀏覽檢索:就是按照信息系統(tǒng)的分類體系,以線性的方式沿著某一個(gè)起點(diǎn),一層一層地在逐級(jí)查找

9、,也就是知識(shí)樹或知識(shí)地圖瀏覽方式。2、 直接檢索:當(dāng)信息被組織在數(shù)據(jù)庫中后,某些對(duì)系統(tǒng)比較熟悉的用戶,對(duì)需求明確的信息可以進(jìn)行直接檢索,即在系統(tǒng)中直接輸入分類號(hào)、類名、關(guān)鍵詞進(jìn)行檢索。這種形式的檢索往往還要借助于該系統(tǒng)所使用的分類法。3、 瀏覽與直接相結(jié)合的檢索:這種檢索方式是電子分類法和網(wǎng)絡(luò)信息分類系統(tǒng)特有的功能,就是在進(jìn)行瀏覽式檢索過程、在一個(gè)特定類目的限定下輸入要檢索信息的某些特征語詞,以便迅速將該類信息定位;或者先輸入信息的某個(gè)特征,初步判斷、確定它的類屬,在此基礎(chǔ)進(jìn)行瀏覽檢索。分類法的宏觀結(jié)構(gòu)一般包括( 1 )編制說明( 2)基本類目表( 3)分類法主表( 4)輔助分類體系( 5)分

10、類法附表(6)分類法索引( 7)分類法使用手冊(cè)與附錄分類法的微觀結(jié)構(gòu)一般包括( 1 )分類號(hào)(2)類名( 3)類級(jí)( 4)類目注釋和參照分類法編制的基本程序(一)分類法的功能分析與定位(二)系統(tǒng)用戶需求(三)分類體系設(shè)計(jì)(四)分類標(biāo)記設(shè)計(jì)(五)分類法結(jié)構(gòu)設(shè)計(jì)(六)分類法主表設(shè)計(jì)(七)分類法輔助分類體系設(shè)計(jì)(八)分類法輔助表設(shè)計(jì)(九)分類法索引設(shè)計(jì)(十)試標(biāo)引與修訂按標(biāo)記制度劃分的分類標(biāo)記1.層累標(biāo)記制2.順序標(biāo)記制3.混合標(biāo)記制4.分面標(biāo)記制5.回歸標(biāo)記制6.起訖標(biāo)記制擴(kuò)展同級(jí)類編號(hào)法編號(hào)的方法是:某類的子類較多,本身的號(hào)碼不敷使用,就借用相鄰空余的同位類號(hào),并將其擴(kuò)展成與該子類相匹配的同級(jí)號(hào)

11、碼,為剩余的子類配號(hào)。此種擴(kuò)號(hào)法的特點(diǎn)是使同位類都有相同長度的號(hào)碼。子順擴(kuò)號(hào)法當(dāng)某類下同位類很多,但無須再進(jìn)一步劃分,且同位類有不可預(yù)見性時(shí),可使用類名的首字母進(jìn)行擴(kuò)號(hào),即類號(hào) +字母。例如:M675 法國文學(xué)作品:按作家分M675B巴爾扎克作品M675D狄更新作品M675M 莫泊桑作品主題法的含義所謂主題法,一般是指直接以表示文獻(xiàn)主題的語詞作標(biāo)識(shí),提供字順檢索途徑,并主要采用參照系統(tǒng)揭示詞間關(guān)系的標(biāo)引和檢索文獻(xiàn)的方法。它是分類法之外,另一種從內(nèi)容角度標(biāo)引和檢索文獻(xiàn)的主要方法。從檢索語言的角度來說,主題法也就是主題檢索語言,或稱主題語言,它是用自然語言語詞或受控的自然語言語詞直接表達(dá)主題概念,

12、按語詞字順排列主題概念,主要用參照系統(tǒng)顯示概念之間關(guān)系的檢索語言。按照表達(dá)主題概念的語詞標(biāo)識(shí)的構(gòu)成原理和特征的不同,主題法一般分為標(biāo)題法、單元詞法、敘詞法、關(guān)鍵詞法。關(guān)鍵詞法:是直接以文獻(xiàn)中能夠表達(dá)主題概念的關(guān)鍵詞作標(biāo)識(shí)的一種準(zhǔn)主題法?;蛘哒f,關(guān)鍵詞法是由計(jì)算機(jī)或人工從文獻(xiàn)中抽取關(guān)鍵詞作標(biāo)識(shí),并按字順排列,提供主題檢索途徑的方法。所謂關(guān)鍵詞,是出現(xiàn)在文獻(xiàn)題名、文摘、正文中,能夠表達(dá)文獻(xiàn)主題,具有文獻(xiàn)意義的語詞。關(guān)鍵詞法作為主題法的一種,與標(biāo)題法、敘詞法相比,具有兩個(gè)主要特點(diǎn):( 1 )關(guān)鍵詞是自然語言的語詞,一般不作規(guī)范化處理;( 2)一般不編制受控詞表進(jìn)行詞匯控制,不顯示詞間關(guān)系,只是編制禁

13、用詞表來控制抽詞。概念組配是敘詞法的基本原理在敘詞語言采用的多種原理方法中,概念組配是最基本的原理,它是決定敘詞法特點(diǎn)和性能的根本因素。1、 概念組配與字面組配的區(qū)別敘詞法采用的是概念組配,而不是字面組配。(1) . 概念組配與字面組配對(duì)詞匯單位的要求不同。概念組配要求以表達(dá)基本概念的語詞為標(biāo)識(shí),用于概念組配的語詞既可以是單詞,也可以是詞組。字面組配只要求參與組配的詞與組配構(gòu)成的詞在字面形式上的一致強(qiáng)調(diào)參與組配語詞的單元性,因此,要求采用最小的詞匯單位單詞,而不用詞組。(2) . 概念組配與字面組配的本質(zhì)不同。概念組配本質(zhì)上是在概念分析的基礎(chǔ)上進(jìn)行概念綜合,是符合概念邏輯的組配。概念組配所表達(dá)

14、的概念與參與組配的各方面所表達(dá)的概念在邏輯上是有聯(lián)系的,往往表現(xiàn)為下位概念與上位概念的關(guān)系。字面組配是利用構(gòu)詞法進(jìn)行詞的分拆和組合,它符合構(gòu)詞規(guī)律,但是不一定符合概念邏輯。2、敘詞的概念組配類型( 1 )交叉組配交叉組配是指使用兩個(gè)或多個(gè)具有交叉關(guān)系的敘詞進(jìn)行組配。( 2) 方面組配方面組配,又稱限定組配,是指將表示某一事物的敘詞與表示事物方面的敘詞進(jìn)行組配。( 3)特稱組配特稱組配,是指用一個(gè)表示事物類稱的屬概念敘詞與表達(dá)“種差”的敘詞進(jìn)行組配。字順表的微觀結(jié)構(gòu)1、 敘詞款目和非正式敘詞款目的著錄項(xiàng)目2.敘詞款目和非正式敘詞款目的著錄格式3.款目詞的排列詞匯轉(zhuǎn)換模式: 1 、單向轉(zhuǎn)換2、互逆

15、轉(zhuǎn)換3、多向轉(zhuǎn)換4、中介轉(zhuǎn)換信息主題類型1 .依據(jù)主題結(jié)構(gòu)區(qū)分( 1 )單因素主題( 2)多因素主題(多因素主題又細(xì)分為復(fù)合主題與聯(lián)結(jié)主題)2 .依據(jù)主題與檢索系統(tǒng)專業(yè)性質(zhì)相關(guān)程度區(qū)分( 1 )專業(yè)主題( 2)相關(guān)主題( 3)非專業(yè)主題3 .依據(jù)主題概括的文獻(xiàn)內(nèi)容范圍區(qū)分( 1 )整體主題( 2)局部主題4 .根據(jù)主題在文獻(xiàn)中的重要程度區(qū)分( 1 )主要主題(2)次要主題5 .依據(jù)主題在文獻(xiàn)中呈現(xiàn)的清晰程度區(qū)分( 1 )顯性主題( 2)隱性主題主題分析的水平和要求(一)主題分析的意義1、主題分析的含義主題分析,一般是指標(biāo)引過程分析文獻(xiàn)內(nèi)容和提取主題概念的環(huán)節(jié)。具體地說,主題分析是通過審讀文獻(xiàn)而

16、了解文獻(xiàn)內(nèi)容及其表現(xiàn)形式,選擇內(nèi)容單元而確定文獻(xiàn)主題數(shù)量,概括單元內(nèi)容而形成主題概念,分析主題的結(jié)構(gòu)和類型,并在必要時(shí)判斷主題的學(xué)科專業(yè)屬性的一種智力勞動(dòng)。2、主題分析的意義:主題分析是標(biāo)引的基礎(chǔ)環(huán)節(jié),正確的標(biāo)引必須以正確的主題分析為前提。主題分析的質(zhì)量不僅直接影響標(biāo)引的質(zhì)量,而且在根本上影響著檢索系統(tǒng)的檢索效率。主題分析的意義主要表現(xiàn)在以下四方面:( 1 )主題分析是標(biāo)引不可缺少的環(huán)節(jié)。( 2)從文獻(xiàn)分析出的主題和主題因素的多少?zèng)Q定著文獻(xiàn)標(biāo)引深度。( 3)從文獻(xiàn)中分析出的主題概念和主題因素的準(zhǔn)確性是決定標(biāo)引結(jié)果是否準(zhǔn)確的首要環(huán)節(jié)。(4)從文獻(xiàn)中分析出的主題概念是否符合用戶的需要,影響文獻(xiàn)標(biāo)引

17、的有效性和文獻(xiàn)的利用率。(二) 主題文獻(xiàn)分析水平1.宏觀主題分析和微觀主題分析2.概括式主題分析和描述式主題分析(三 )主題分析的質(zhì)量要求1.充分析出主題概念2. 不過度析出主題概念各種信息標(biāo)引方式(一)依揭示文獻(xiàn)內(nèi)容的方式分: 1.整體標(biāo)引2.全面標(biāo)引3.對(duì)口標(biāo)引4.綜合標(biāo)引5.分散標(biāo)引6. 分析標(biāo)引7.互見標(biāo)引(二)依標(biāo)引深度分:1.深標(biāo)引2. 淺標(biāo)引(三)依所用標(biāo)識(shí)與主題概念的對(duì)應(yīng)性分:1 .專指標(biāo)引2. 組配標(biāo)引3.上位標(biāo)引4.依附標(biāo)引5.暫定標(biāo)引(四)依組配標(biāo)識(shí)是否組合分:1.先組標(biāo)引2.后組標(biāo)引(五)依所用標(biāo)識(shí)受控程度分:1.受控標(biāo)引2.自由標(biāo)引3.混合標(biāo)引(六)依標(biāo)引的自動(dòng)化程度

18、分1、 人工標(biāo)引2、 自動(dòng)標(biāo)引3、 半自動(dòng)標(biāo)引(七 依引的實(shí)施方式分1) 獨(dú)立標(biāo)引2) 統(tǒng)一標(biāo)引3) 聯(lián)合標(biāo)引4) 在版標(biāo)引。自然語言區(qū)別于受控語言的特點(diǎn)采用自然語言較之受控語言有如下優(yōu)點(diǎn):5) 1 )可以降低標(biāo)引難度及成本,從而提高標(biāo)引速度;6) 2)采用用戶熟悉的自然語言,符合用戶檢索習(xí)慣,減少了概念轉(zhuǎn)換中產(chǎn)生的失真現(xiàn)象,專指度高;7) 3)由于自然語言標(biāo)引檢索多采用自動(dòng)處理方式,省略了編制詞表和詞匯的智力負(fù)擔(dān);8) 4)自然語言標(biāo)引檢索人口詞多,有利于提高查全率;9) 5)操作簡單方便,靈活,比較適合沒有專業(yè)知識(shí)的廣大網(wǎng)絡(luò)用戶使用。幾種常用的的機(jī)械分詞方法如下:(1 )正向最大匹配法(由左到右的方向,MM法)( 2) 逆向最大匹配法(由右到左的方向,RMM法)( 3) 最少切分(使每一句中切出的詞數(shù)最?。?4) 雙向匹配法(MM+RMM )( 5) 最大匹配法具體描述如下: 從標(biāo)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論