共詞分析與共引分析方法的比較研究_第1頁
共詞分析與共引分析方法的比較研究_第2頁
共詞分析與共引分析方法的比較研究_第3頁
共詞分析與共引分析方法的比較研究_第4頁
共詞分析與共引分析方法的比較研究_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、共詞分析與共引分析方法的比較研究伍若梅/孔悅凡2012-12-19 15:40:40來源:情報資料工作2010年01期【英文標題】A Comparison on Co-word Analysis and Co-citation Analysis (School of Media Science, Northeast Normal University, Changchun, 130117)【作者簡介】伍若梅,女,1986年生,東北師范大學傳媒科學學院情報學研究生。東北師范大學傳媒科學學院 長春 130117孔悅凡,女,1984年生,東北師范大學傳媒科學學院圖書館學研究生。東北師范大學傳媒科學學

2、院 長春 130117【內(nèi)容提要】 文章主要從共詞分析和共引分析的起源、研究對象及性質(zhì)、前提假設(shè)、影響因素、應(yīng)用過程及范圍以及存在的問題幾個方面對這兩種方法進行了比較,并得出若干結(jié)論。The author compares the co-word analysis and co-citation analysis from aspects such as the origin, research objects, supposes, factors and application range, and have drawn a series of related conclusions. 【關(guān)

3、 鍵 詞】文獻計量/共詞分析/共引分析bibliomerics/co-word analysis/co-citation analysis共詞分析(co-word)和共引分析(co-citation)是隨著電子文獻形式和網(wǎng)絡(luò)文獻形式的出現(xiàn)而發(fā)展起來的兩種重要的文獻計量學方法。近年來隨著科學知識圖譜逐漸成為科學計量學研究的熱門領(lǐng)域,共詞方法和共引分析方法也成為人們所關(guān)注的焦點。作為情報學研究方法的重要組成部分,二者均可廣泛應(yīng)用于科學評價、科技管理等諸多領(lǐng)域。尤其是這兩種方法都可以應(yīng)用于學科范式可視化研究,但有的學者利用共詞分析方法來研究,有的學者利用共引分析方法來對某學科或領(lǐng)域的范式進行研究。那

4、么兩者之間有何異同呢?為了更好地理解并恰當?shù)睦眠@兩種方法,本文試圖從起源、概念、方法和過程等幾個方面對二者做簡要的比較分析。1 共詞分析與共引分析概述共詞分析法最早是由法國文獻計量學家Callon提出的。利用共詞分析法的基本原理不僅可以揭示研究領(lǐng)域的研究熱點,橫向和縱向分析領(lǐng)域?qū)W科的發(fā)展過程、特點以及領(lǐng)域或?qū)W科之間的關(guān)系,而且還可以反映某個專業(yè)的科學研究水平及其發(fā)展歷史的動態(tài)和靜態(tài)結(jié)構(gòu),其最終分析研究結(jié)果可以作為高層決策者制定戰(zhàn)略決策和長遠發(fā)展規(guī)劃的基礎(chǔ)。共引分析法始于Small于1973年提出的以文獻為單位的共引分析,是將一批文獻(或著者、期刊)作為分析對象,利用聚類分析、多維標度等多元統(tǒng)

5、計分析方法,借助計算機,把眾多的分析對象之間錯綜復(fù)雜的共引網(wǎng)狀關(guān)系簡化為數(shù)目相對較少的若干類群之間的關(guān)系并直觀地表示出來的過程1。之后,共引概念推廣到與文獻相關(guān)的各種特征對象上,從而形成各種類型的共引概念,如詞的共引、文獻共引、著者共引、期刊共引、主題共引和類的共引等。自White和Griffth 1981年提出著者共引分析以來,其理論發(fā)展也已經(jīng)比較成熟,除了可以反映科學的知識結(jié)構(gòu)外,還被用來研究科學交流模式和信息檢索中知識結(jié)構(gòu)的可視化。另外,期刊共引的引入并運用于期刊及學科領(lǐng)域的研究,主題和類的共引的引入并運用于領(lǐng)域分析,乃至利用共引理論來探討科學范式等等,都將共引分析理論研究提高到新的高度

6、。2 共詞分析與共引分析比較2.1 起源共詞分析方法最早是在20世紀70年代中后期由法國文獻計量學家提出的。1986年,法國國家科學研究中心CNRS(Cntre National de la Recherché Scientifique)的Callon,Law和Rip出版了Mapping The Dynamics Of Science And Technology2。此書的出版使共詞分析方法得以廣泛推廣。而共引分析是在1973年由美國情報學家Small最早提出的,他在美國情報學會雜志(Journal Of American Society For Information Scienc

7、e)發(fā)表了Co-Citation In The Scientific Literature: A New Measure Of The Relationship Between Two Documents一文,提出了“共引”的概念2。同年,Marshakova在她關(guān)于利用參考文獻進行文獻分類的論文中,也提出了共引的概念。2.2 研究對象及性質(zhì)共詞分析的原理主要是對一組詞兩兩統(tǒng)計它們在同一篇文獻中出現(xiàn)的次數(shù),以此為基礎(chǔ)對這些詞進行聚類分析,從而反映出這些詞之間的親疏關(guān)系,進而分析這些詞所代表的學科和主題的結(jié)構(gòu)變化。它利用大量文獻中共同出現(xiàn)的關(guān)鍵詞對有效地反映文本關(guān)鍵詞之間的關(guān)聯(lián)強度,減少了關(guān)鍵詞

8、的空間,用一套結(jié)構(gòu)圖有效地層示了關(guān)鍵詞之間的關(guān)聯(lián)3。而共引分析的基本原理主要是以具有一定學科代表性的一批文獻為分析對象,利用聚類分析、多維尺度等多元統(tǒng)計分析方法,借助計算機,把眾多的分析對象之間錯綜復(fù)雜的共引網(wǎng)狀關(guān)系簡化為數(shù)目相對較少的若干類群之間的關(guān)系并直觀地表示出來,在此基礎(chǔ)上分析研究分析對象所代表的學科及文獻的結(jié)構(gòu)和特點1。由兩種方法的基本原理可以分析出,共詞分析屬于內(nèi)容分析方法的一種。它是先探討詞與詞之間的親疏關(guān)系,通過分析詞之間的關(guān)系推斷學科的研究熱點或研究范式。其研究對象是詞或詞組。由于高頻詞往往反映的是熱點,所以共詞分析適于研究新學科的研究范式或者成熟學科的研究熱點。而共引分析的

9、理論基礎(chǔ)是同時被引用的文獻在主題上具有或多或少的相似性,因此同被引次數(shù)可以測度文獻在內(nèi)容方面的相關(guān)度,其屬于引文分析方法的一種。它是先探討文獻與文獻之間的親疏關(guān)系,通過以往發(fā)表的高被引的文獻來反映學科的結(jié)構(gòu),其研究對象是文獻。由于高被引文獻的形成需要較長的時間,而新興學科的研究往往人數(shù)眾多而不集中,作品比較分散,被引用情況不穩(wěn)定。因此,由共引分析得出的結(jié)論往往不能反映新文獻所代表的研究主題,從而其更適于研究成熟學科的研究范式,不適于學科的研究熱點研究。2.3 假設(shè)前提可靠性是人們選擇研究方法的一個很重要的指標,而可靠性的測度除了考察方法的實施過程,還可以從其實施的假設(shè)前提來分析。共詞分析的假設(shè)

10、前提最早是由Whittaker于1989年提出的,而共引分析的前提假設(shè)最早由Small于1974提出。從表1中可以看出,二者的共同點在于兩種方法的實施都基于一定的假設(shè)前提之上。不同點在于共詞分析實施所需要的假設(shè)多于共引分析所需要的假設(shè)。共詞分析的假設(shè)前提主要是作者選擇的詞匯能夠在一定程度上反映主題內(nèi)容,而共引分析的假設(shè)前提主要是同被引的文獻在主題上具有一定程度的相似性。一個是基于詞的假設(shè),一個是基于文獻的假設(shè)。一般來說,一種方法的實現(xiàn)所需要的假設(shè)越多,即所需要的條件越多,那么由該方法得出的結(jié)論就越不可靠,并在使用過程中越容易出現(xiàn)問題。另外,由于漢語詞匯本身所具有的語義模糊性以及詞與詞之間關(guān)系的

11、不確定性,同時鑒于共引分析的文獻間所具有實在的相互引用關(guān)系比共詞分析的詞與詞之間的關(guān)系更為確定,所以在研究同一問題時共引分析方法比共詞分析方法較為可靠。2.4 影響因素共詞分析與共引分析兩種方法經(jīng)過20多年的發(fā)展,各自都在不斷的發(fā)展、完善,共詞分析主要經(jīng)歷三個階段,共引分析的發(fā)展經(jīng)歷了兩個方面的改進,其發(fā)展過程見表2。從表2中兩種方法的演進過程可以看出,共詞方法與共引方法的發(fā)展影響因素不同。影響共詞分析方法的因素有:一是共詞分析結(jié)果的可視化需要,如包容地圖和戰(zhàn)略坐標都是結(jié)果可視化的不同表示;二是分析對象形式的改變,即從以往需要人為集中選擇的文獻到現(xiàn)在的以數(shù)據(jù)庫結(jié)構(gòu)形式為主的分析對象。而共引分析

12、方法的發(fā)展兩個影響因素是:一是對分析對象選擇的精確性要求,即對高被引文獻選擇的不同要求;二是對分析對象進行聚類的準確性要求,如聚類方法研究進展。由此可以看出,共詞分析更注重結(jié)果的可視化和分析對象的形式,而共引分析更注重對分析對象的精確性處理。但不論如何發(fā)展,兩種方法的最終追求都是通過對分析對象的處理來準確地反映客觀事實。2.5 應(yīng)用過程及范圍同為兩種文獻計量學方法,共詞分析與共引分析的應(yīng)用既有相同點又有不同點。從表3和表4可以看出,二者的相同點在于:(1)應(yīng)用過程都需要確定分析領(lǐng)域、將原始矩陣轉(zhuǎn)化為相關(guān)矩陣、數(shù)據(jù)的綜合處理所用的方法等。(2)都可以用于揭示研究領(lǐng)域的發(fā)展過程,信息檢索和反映學科

13、結(jié)構(gòu)。而不同之處在于:(1)數(shù)據(jù)的獲取方式不同。共詞分析數(shù)據(jù)直接從選擇的文獻中抽取詞匯,不需要外在的數(shù)據(jù)庫,而共引分析數(shù)據(jù)的獲得需要一些引文數(shù)據(jù)庫。(2)應(yīng)用范圍不同。共詞方法的應(yīng)用范圍比共引方法小。一是因為分析對象不同。共詞方法分析基礎(chǔ)是詞或詞組,共引分析的對象是文獻。而兩個較大領(lǐng)域之間詞共現(xiàn)的幾率比較小,所以利用共詞方法時選擇高頻詞會很困難。再者,兩個領(lǐng)域之間知識輸入與輸出的關(guān)系往往反映在文獻的相互引用上,而不一定反映在詞共現(xiàn)上。因此,共引方法可以選擇多領(lǐng)域進行分析,而共詞方法的選擇領(lǐng)域應(yīng)該盡可能小一些。另外,共引方法可以揭示微觀的文獻所代表的主題關(guān)系、中觀的學科結(jié)構(gòu)和宏觀的科學結(jié)構(gòu),從而

14、將文獻信息所反映的科學的、領(lǐng)域的、知識的關(guān)系可視化,其不僅用于傳統(tǒng)的文獻計量學領(lǐng)域,更廣泛應(yīng)用于科學學研究,揭示科學的發(fā)展規(guī)律與趨勢。而共詞方法往往只可以用于某具體的學科結(jié)構(gòu)或研究領(lǐng)域分析。共引方法還可以用于科學交流模式的分析,而共詞方法多用于具體學科研究熱點的分析。因此,理論上共引方法的應(yīng)用范圍比共詞方法廣。(3)使用的關(guān)鍵因素不同。對共詞分析來說,詞對出現(xiàn)頻率是共詞方法數(shù)量化處理的基礎(chǔ)對象,對不同的詞對處理方式產(chǎn)生不同的共詞分析類型。如共詞聚類分析法、共詞關(guān)聯(lián)分析法、共詞詞頻分析法和突發(fā)詞監(jiān)測法等6。而共引方法始于以文獻為單位的共引分析,之后經(jīng)過共引概念的推廣而形成了各種類型的共引方式,如

15、:詞的共引、文獻共引、著者共引、期刊共引、主題共引和類的共引等。其中文獻共引、作者共引和期刊共引是共引分析方法最常用的三種類型。從兩種方法的類型來看,共詞分析的類型是從處理詞對的方法形成的,共引分析的類型是從共引概念在各種特征對象上的推廣而形成的。從這個方面看,共詞分析使用的關(guān)鍵在于選擇處理詞對的方法,而共引分析使用的關(guān)鍵在于選擇恰當?shù)奶卣鲗ο蟆?.6 存在問題由于兩種方法實施所需要的假設(shè)前提具有一定的理想性,共詞分析和共引分析均不可避免的存在著一些問題。共詞分析是基于詞的分析,而詞的選擇很容易出現(xiàn)問題,尤其關(guān)鍵詞的選擇具有很強的主觀性和隨意性,由此造成同一主題內(nèi)容由不同詞表示或者同一詞表示不

16、同的主題內(nèi)容,因此,得出的結(jié)論不能完全符合客觀事實。共引分析是基于文獻之間相互引用關(guān)系進行的分析,而文獻間的引用本身存在著許多問題。引文中存在著引用動機的復(fù)雜性、引文數(shù)量隨機性等問題,造成引文分析結(jié)構(gòu)的不準確。由此造成共引分析方法也存在分析結(jié)果的不準確性。3 小結(jié)作為兩種重要的文獻計量學方法,由于共詞分析和共引分析在利用過程中存在著交叉,人們在選擇利用時會出現(xiàn)一些問題。而研究方法對研究問題和研究結(jié)果是至關(guān)重要的,所以本文對兩種方法從幾個方面進行了比較,以期減少利用中出現(xiàn)的問題,并得出以下幾個結(jié)論:(1)起源上來說,共引分析方法稍早于共詞分析。(2)研究對象與性質(zhì)方面,共詞分析研究對象是詞或詞組

17、,屬于內(nèi)容分析方法的一種,共引分析研究對象是文獻,屬于引文分析方法一種。(3)從假設(shè)前提來看,共詞分析多于共引分析,由此其可靠性弱于共引分析。(4)從方法演進上來看,兩種方法發(fā)展的影響因素有所不同。共詞分析是基于分析結(jié)果可視化的需要與分析對象形式的改變兩種因素而發(fā)展的,共引分析發(fā)展的影響因素是分析對象選擇的精確性要求和分析對象進行聚類準確性要求。(5)從應(yīng)用上來比較,二者在應(yīng)用過程和應(yīng)用范圍上有相同點,也有不同點。不同點在于數(shù)據(jù)獲取方式、應(yīng)用領(lǐng)域及應(yīng)用關(guān)鍵因素三個方面。共詞分析多用于比較微觀的具體的學科或領(lǐng)域,而共引分析既可用于微觀的學科與領(lǐng)域,也可用于中觀和宏觀的科學結(jié)構(gòu)的分析。共詞分析多用于研究新學科、領(lǐng)域的研究范式或者成熟學科的研究熱點,而共引分析多用于研究成熟學科的研究范式或?qū)W科結(jié)構(gòu)。兩種方法均存在一定程度的問題?!緟⒖嘉墨I】 1耿海英.共引分析方法及其應(yīng)用研究D.北京:中國科學研究院,2007:3,12-13.2Callon M, Law J, Rip A. Mapping the dynamics of Science and technology: Sociology

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論