基于ciespace的語義網研究熱點可視化分析_第1頁
基于ciespace的語義網研究熱點可視化分析_第2頁
基于ciespace的語義網研究熱點可視化分析_第3頁
基于ciespace的語義網研究熱點可視化分析_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于ciespace的語義網研究熱點可視化分析

網絡正義網由互聯(lián)網創(chuàng)始人simodhyberrys提出,1998年,網絡創(chuàng)始人phe。2000年12月的XML(可擴展標記語言)會議上正式提出語義網的概念和體系結構。隨后大量學術研究機構和團體舉辦了多次關于語義網的學術討論會,開始關注語義網的研究,語義網開始成為情報學的研究熱點。TimothyBerners-Lee最初將語義網定義為:某種定義Web上的數(shù)據和鏈接的方式,從而使WWW上的內容可獲取并且可解釋。Wikipedia(維基百科)對語義網的定義是:通過給萬維網上的文檔(如HTML)添加能夠被計算機所理解的語義,從而使整個互聯(lián)網成為一個通用的信息交換媒介。因此,對國外語義網研究的演進軌跡、發(fā)展格局、熱點領域及前沿趨勢等進行定量與定性分析,總結其發(fā)展規(guī)律與特征,對于推進我國情報學的研究具有重要意義。1知識圖譜的建立本文采用美國德雷賽爾大學陳超美教授開發(fā)的CiteSpace3.7.R8進行可視化分析,在對國外研究語義網論文進行計量分析的基礎上,結合相關文獻主題分析,利用CiteSpace軟件繪制知識圖譜。數(shù)據來源于ISI(美國科學情報研究所)WebofScience(簡稱WoS)統(tǒng)一文獻檢索平臺。根據本文研究內容,設定以下檢索式:(TI(標題)=(“SemanticWeb”)ANDLG(文獻語言)=“English”;檢索WoS的四大索引庫(檢索時間:2013.12.23)。選擇期刊論文和會議論文兩種研究性文獻類型(排除國內論文),共得到1900-2013年國外發(fā)表的語義網相關論文數(shù)據2644條,其中會議論文2098篇,期刊論文1069篇(部分會議論文發(fā)表后又在期刊發(fā)表)。2國外意義網絡的研究2.1語義網研究年際變化從發(fā)文量看:2000年以前發(fā)文量較少,此后呈穩(wěn)步增長趨勢;2005-2008年進入高產階段,年均保持在300篇以上;從2009年起,發(fā)文量逐年遞減。統(tǒng)計結果表明,國外語義網研究自20世紀90年代末起步,自2002年語義網-ISWC會議召開后,發(fā)文量不斷上升,相關研究日益成熟,應用領域不斷擴展;經過許多學者的努力研究和實驗,語義網在理論研究和實際應用上都有很大的進步。2.2“語義網”頻次分布從國家/地區(qū)分布來看,美國發(fā)文量最高,為457篇,其次為德國和英國。在CiteSpace軟件中繪制國家/地區(qū)共現(xiàn)網絡圖譜。圖譜中共有52個節(jié)點,15個連接。對“語義網”出現(xiàn)頻次在50次以上和中心度0.01以上的進行統(tǒng)計(見表1),可以看出,頻次較高的來自美國,即其發(fā)文數(shù)最多,在該領域內具有很強的研究實力;英格蘭、德國、西班牙、意大利等節(jié)點的頻次也較高,表明這些國家的研究成果較多,也具有較強的研究實力。總體上,各國間在發(fā)文量與學術水平之間存在著不同程度的差異。中心度最高的國家為德國,其中心度達到0.27,美國位列第二,中心度為0.19。2.3語義網研究的核心領域從學科類別分布來看,語義網的研究主要集中在計算機領域。在CiteSpace中繪制學科主題共現(xiàn)網絡圖譜,可以看出國外對語義網的研究主要集中在計算機學科?;陬l次(取30次以上)和中心度統(tǒng)計,頻次最高的為計算機科學(為2474次),遠高于其他學科領域;其次為工程技術和通信。這表明,計算機與工程技術科學是國外對語義網研究的核心領域。其他中心度較高的學科節(jié)點有數(shù)學、運籌學、信息科學等,與其他學科也有著較廣泛的關聯(lián)。2.4知識產權在線保護和利用技術研究關鍵節(jié)點文獻在不同聚類網絡的演進過程中起著重要的過渡性作用,有助于識別和探測某一領域研究的動態(tài)演進和發(fā)展趨勢。CiteSpace中針對各個時間段的關鍵節(jié)點論文,基于中間中心度(0.1及其以上)和被引頻次(30次及其以上)進行統(tǒng)計排序。被引頻次最高的是2001年Berners-leeT的論文,被引用高達266次,在Google學術搜索中的被引頻次為16408次(2013年12月27日檢索)。其次是1993年GruberTR發(fā)表的論文,他把本體定義成“共享概念化的形式地、明確地規(guī)范”。1993年McilraithSA提出網絡服務標記———語義網標記語言DAML,被引頻次為120次。該標記使多種Web服務自動發(fā)現(xiàn)代理技術能夠實現(xiàn)、執(zhí)行、組合和互操作。作者提出這樣一種自動化Web服務組合技術。2003年Baader提出描述邏輯是知識表示的形式化語言,他的這個判斷非常適合對數(shù)據庫/數(shù)據倉庫概念模型的推理。擴展描述邏輯(如整數(shù)和有理數(shù)),其中包括聚合函數(shù)在這些領域(如最小值、最大值、計數(shù)和總和),這通常用于數(shù)據庫系統(tǒng)。證明了聚合函數(shù)的存在容易導致的(故意)推斷問題。2004年McguinnessDL認為OWLWeb本體語言是表示信息的過程。2004年HorrocksI在語義Web規(guī)則語言(SWRL)的基礎上,提出將OWLWeb本體語言的OWLDL和OWLLite與規(guī)則標記語言的一元/二進制數(shù)據記錄RuleML子語言相結合的建議,給出了基于RuleML和OWL的XML表示語法和基于OWL的RDF/XML交換語法。2.5語義網服務的認知在CiteSpace中繪制共詞聚類網絡圖譜。關鍵詞是對文獻主題內容的高度概括或集中描述。詞頻分析是一種重要的基于內容的定性分析方法,而高頻詞分析有助于考察某一科學領域的研究熱點?;谠~頻進行統(tǒng)計與排序,國外在語義網研究領域的高頻詞如表2所示。根據關鍵詞頻次分析總結出以下研究熱點。(1)本體研究。本體(Ontology)原本是哲學研究中的一個分支。1991年Neches等人最早給出本體在信息科學中的定義:“給出構成相關領域詞匯的基本術語和關系,以及利用這些術語和關系構成的規(guī)定這些詞匯外延規(guī)則的定義。”1993年,美國斯坦福大學知識系統(tǒng)實驗室(KSL)的Gruber給出了第一個在信息科學領域被廣泛接受的本體正式定義:“概念模型的明確的規(guī)范說明。”1997年Borst對其進一步完善,表述為:“共享概念模型的形式化規(guī)范說明。”Studer等人認為本體包含4層含義,即概念模型、明確、形式化和共享。本體強調實體本質的概念化與抽象化,強調概念及概念間的關聯(lián),并通過多種知識表示元素將這些關聯(lián)反映出來,這些知識表示基本元素主要包括:概念、屬性、關系(對象屬性)、函數(shù)、公理和實例。(2)語義網服務及Web服務研究。語義網服務(SWS)是用本體作為數(shù)據模型,在語義描述框架的基礎上,提供機器可理解的語義描述。語義網服務的支撐技術有3個:Web服務描述本體,用來描述Web服務和相關方面的完整的描述框架;以本體作為底層的數(shù)據模型以支持機器對Web數(shù)據的解釋;為Web服務使用過程的自動化定義語義驅動。(3)OWL-S研究。OWL-S(OntologyWebLanguageforServices,網絡服務的本體語言)最早由S.McIlraith于2001年5月提出,用于描述語義Web服務,在特定的約束下能夠讓用戶和代理自動發(fā)現(xiàn)、調用、編寫和監(jiān)控網絡資源,提供服務。2.6語義網的前沿研究領域突現(xiàn)詞(burstterm)是指頻次出現(xiàn)增長快速的研究前沿術語。由于突現(xiàn)詞的詞頻時間分布和動態(tài)變化特性,突現(xiàn)詞比關鍵詞更能準確地揭示與反映研究前沿領域。在CiteSpace中進行突現(xiàn)詞探測,從大量的術語與關鍵詞集合中析取出13個專業(yè)突現(xiàn)術語,如表3所示。從表3可以看出,2001年“邏輯”和“檢索”是語義網領域最早的研究前沿。邏輯是語義網的基礎,語義網的研究主要是由邏輯學和人工智能研究者發(fā)展來的;2003年,“系統(tǒng)”“Web服務”“DAML”成為語義網的前沿研究領域。Webservice是一個平臺獨立的、松耦合的、自包含的、基于可編程的Web的應用程序,可使用開放的XML標準來描述、發(fā)布、發(fā)現(xiàn)、協(xié)調和配置這些應用程序,用于開發(fā)分布式的互操作應用程序。美國國防高級設計研究署代理置標語言(DAML)是美國國防高級設計研究組(DARPA)使用的一種標記語言,它是一種基于擴展標記語言(XML);2004年“語義Web服務”詞頻增長較快,語義Web被賦予解決智能搜索引擎、智能信息代理、智能交易代理等基于Web個性化、智能化的服務等問題的任務,利用本體來改進WebServices,即語義Web服務(SemanticWebServices);2005年“OWL-S”成為研究前沿,OWL-S是Web服務和語義Web的結合,主要是為了解決Web服務描述和發(fā)現(xiàn)以及業(yè)務組合的語義表示;2008年“Web2.0”成為研究熱點;2011年“LinkedData”是主要研究前沿,描述了發(fā)布能夠交互鏈接的結構數(shù)據的方法,信息共享的方式擴展到能被自動讀取,能夠連接并查詢不同的數(shù)據源;2012年“SemanticSensorWeb”(SSW)成為研究熱點,SSW是結合傳感和語義網的技術,SSW用空間、時間和主題語義元數(shù)據標注傳感器數(shù)據,建立在開放地理空間聯(lián)盟的傳感器網絡賦能(SWE)內,并利用語義Web技術來提供更好的描述和傳感數(shù)據并進行擴展。3語義網領域的核心研究領域綜上所述,本文總結出以下結論:①目前國外在語義網領域的研究處于相對成熟與深化變革階段;②美國在該領域的研究發(fā)文量最高,其次為德國和英國;③計算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論