




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于領(lǐng)域本體的電子學(xué)習(xí)資源庫模型
摘要:隨著電子學(xué)習(xí)系統(tǒng)快速的發(fā)展,電子學(xué)習(xí)資源呈現(xiàn)爆炸式的增長,如何有效地組織海量電子學(xué)習(xí)資源成為構(gòu)建高效電子學(xué)習(xí)系統(tǒng)的重要因素。針對現(xiàn)有資源庫在資源組織方面存在的不足,提出了一個基于領(lǐng)域知識本體的電子學(xué)習(xí)資源庫檢索模型,該模型利用領(lǐng)域知識來構(gòu)建領(lǐng)域知識本體庫并通過抽取電子學(xué)習(xí)資源元數(shù)據(jù)構(gòu)建元數(shù)據(jù)庫,通過映射關(guān)系完成對電子學(xué)習(xí)資源的語義組織,并在此基礎(chǔ)之上構(gòu)建一個語義檢索模型,以有效地解決現(xiàn)有電子學(xué)習(xí)資源檢索中丟失語義背景的問題,使檢索結(jié)果在查全率、查準率方面有所提高,更加符合用戶的需求。
關(guān)鍵詞:電子學(xué)習(xí)資源庫;檢索;語義;領(lǐng)域本體;元數(shù)據(jù)
abstract:
withtherapiddevelopmentofe-learningsystem,e-learningresourcesgrowexplosively.howtoeffectivelyorganizee-learningresourcesisakeyfactorofconstructingefficiente-learningsystem.concerningtheexistingresourcesorganizationdeficiencyofe-learningresourcelibrary,thispaperproposedane-learningresourceretrievalmodelbasedondomainontology.thismodelbuiltadomainknowledgelibrarybymakinguseofthedomainknowledgeandconstructede-learningresourcesmetadatadatabasebyextractingresourcesmetadata,realizedsemanticorganizationofe-learningresourcesthroughmappingrelations,andconstructedasemanticretrievalmodelonthisbasis,inordertoeffectivelysolvetheproblemofthelossofsemanticbackgroundinthee-learningresourceretrieving.themodelhasalsoenhancedtherecallrateandtheprecisionrateontheretrievalresults,anditismoreinlinewiththeneedsoftheusers.
keywords:
e-learningresourcelibrary;retrieval;semantic;domainontology;metadata
0引言
隨著信息技術(shù)的發(fā)展與普及,以此為基礎(chǔ)的電子學(xué)習(xí)技術(shù)也得到了大家的充分重視,在世界范圍為掀起了教育資源建設(shè)熱潮。各國在教育資源建設(shè)方面也投入了大量的資金:美國國家自然科學(xué)基金投資1億美元建設(shè)了nsf/abpa/nasa數(shù)字圖書館,還投資3000萬美元建設(shè)美國數(shù)字圖書館聯(lián)盟項目;英國高等教育基金計劃投資1500萬英鎊作為“電子圖書館”的啟動資金。國內(nèi)的教育信息化經(jīng)過10多年的發(fā)展,教育資源建設(shè)也得到了長足的進步,cnki數(shù)字圖書館已成為全世界最大規(guī)模的知識信息資源基地,建成了《中國期刊全文數(shù)據(jù)庫》等系列數(shù)據(jù)庫[1]。
隨著大規(guī)模教育資源的建設(shè),電子學(xué)習(xí)資源組織方面的問題日益凸顯,學(xué)習(xí)資源利用率低下、共享不足造成重復(fù)建設(shè)、出現(xiàn)資源“孤島”等問題,這些問題嚴重影響了電子學(xué)習(xí)的發(fā)展,已經(jīng)成為電子學(xué)習(xí)領(lǐng)域亟待解決的問題[2-3]。許多研究者在這方面也做了大量的研究,本體論的提出為解決電子學(xué)習(xí)資源組織方面的問題提出了一個解決途徑,人們嘗試利用本體的語義表達能力來實現(xiàn)電子學(xué)習(xí)資源的語義組織和語義檢索。文獻[4]提出了一個語義擴展方法,首先建立詞匯數(shù)據(jù)庫,然后通過計算數(shù)據(jù)庫中詞匯的語義距離對用戶的查詢進行語義擴展;文獻[5]中,作者設(shè)計了一個搜索引擎swoogle,它是基于爬蟲的語義web信息檢索系統(tǒng),可以對網(wǎng)絡(luò)中的語義web文件進行檢索,并利用本體排序算法對返回的結(jié)果進行排序;文獻[6]以產(chǎn)品信息檢索為例,研究了產(chǎn)品信息檢索系統(tǒng)框架以及語義相似度算法,提出了一個基于本體的產(chǎn)品信息檢索模型;文獻[7]以玉米種植領(lǐng)域為例,提出了基于領(lǐng)域本體的語義標注方法以及用戶查詢處理和查詢推薦算法,設(shè)計了一個面向玉米種植領(lǐng)域的語義檢索系統(tǒng)。
本文以“計算機網(wǎng)絡(luò)”領(lǐng)域為例介紹了領(lǐng)域本體構(gòu)建,提出了一個基于領(lǐng)域本體的語義檢索模型,并深入研究了知識映射。基于領(lǐng)域知識本體的語義檢索主要利用領(lǐng)域本體表示某一領(lǐng)域知識概念以及它們之間的語義關(guān)系,將用戶輸入的關(guān)鍵詞轉(zhuǎn)化為本體概念,通過語義相似度的計算擴展概念并建立知識映射以實現(xiàn)語義檢索的效果。
1基于領(lǐng)域本體的電子學(xué)習(xí)資源庫模型
在以上研究的基礎(chǔ)上,本文提出了基于領(lǐng)域本體的電子學(xué)習(xí)資源庫模型,該資源庫模型主要有三個庫組成:本體庫、元數(shù)據(jù)庫以及資源庫,如圖1所示。
本體庫存放的是領(lǐng)域本體。電子學(xué)習(xí)資源庫用來存放各種電子學(xué)習(xí)資源,如各種文本文件、視頻文件、音頻文件等,是整個電子學(xué)習(xí)資源模型的基礎(chǔ)。學(xué)習(xí)資源庫由教學(xué)管理者來管理維護,并搜集學(xué)習(xí)資源。抽取電子學(xué)習(xí)資源的屬性信息,通過元數(shù)據(jù)標注形成元數(shù)據(jù)信息,這些元數(shù)據(jù)信息就存在元數(shù)據(jù)庫中。
相對于其他基于本體的學(xué)習(xí)資源庫,本文中多了一個元數(shù)據(jù)庫,它具有以下作用:
1)將對電子學(xué)習(xí)資源庫的操作管理轉(zhuǎn)化為對元數(shù)據(jù)庫的操作管理,而元數(shù)據(jù)數(shù)據(jù)量小,可以利用關(guān)系數(shù)據(jù)庫進行存儲,極大地方便了操作管理;
2)便于對電子學(xué)習(xí)資源進行元數(shù)據(jù)標注,本體一經(jīng)建立很難經(jīng)常進行改動,而資源庫中的資源卻經(jīng)常變動不斷增加,通過元數(shù)據(jù)庫,資源入庫時通過元數(shù)據(jù)標注接口可以直接對資源進行標注,然后將語義元數(shù)據(jù)存入源數(shù)據(jù)庫中,標注過程不涉及到本體庫,因此便于資源的元數(shù)據(jù)標注。
該資源庫模型中三個庫之間具有兩個映射關(guān)系:元數(shù)據(jù)庫與資源庫之間的映射關(guān)系,本體庫與元數(shù)據(jù)庫之間的知識映射關(guān)系。對于元數(shù)據(jù)庫與資源庫之間的映射,通過提取資源庫中的電子學(xué)習(xí)資源屬性,進行元數(shù)據(jù)標注形成資源的元數(shù)據(jù),然后將元數(shù)據(jù)存入元數(shù)據(jù)庫中,即元數(shù)據(jù)與電子學(xué)習(xí)資源建立了映射關(guān)系。對于本體庫與元數(shù)據(jù)庫之間的知識映射,在本文第3章中將詳細進行介紹。
2基于領(lǐng)域知識本體的電子學(xué)習(xí)資源庫模型
2.1領(lǐng)域本體的概念
swartout等于1999年提出:“本體是用于描述或表達某一領(lǐng)域知識的一組概念或者術(shù)語集,既可用于組織知識庫較高層次的知識抽象,也可以用來描述特定領(lǐng)域的知識?!保?]。該定義說明了本體的用處,本體用于對領(lǐng)域知識建模,是對領(lǐng)域知識的抽象表示。它提供明確定義的共識,是知識共享的基礎(chǔ)。本文的領(lǐng)域知識本體包括6個構(gòu)成要素:類(概念)、實例、屬性、關(guān)系、公理和規(guī)則[9-10]。這些構(gòu)成要素可以定義某一領(lǐng)域知識本體。
定義1領(lǐng)域本體是描述某一領(lǐng)域知識的概念或術(shù)語以及它們之間關(guān)系的集合,因此領(lǐng)域知識本體可以用一個6元組dko(c,i,at,re,ax,ru)表示,6個元素的定義如下。
1)類或者概念(class)。
這個類的概念與面向?qū)ο缶幊陶Z言中的類的概念相似,用來表示事物的分類,從語義上講,它表示的是實例的集合,是概念的定義描述。
2)實例(instance)。
代表的一個具體個體,從語義上講,實例表示的就是上述類的一個具體對象或者實例。
3)屬性(attribute)。
用于描述類和實例所具有的屬性、特征、屬性值以及屬性約束條件。
4)關(guān)系(relation)。
是在特定領(lǐng)域中,概念、實例以及它們相互之間的關(guān)聯(lián)方式。在語義上關(guān)系對應(yīng)于實例元組的集合,形式上定義為n維笛卡兒積的子集,r:a1×a2×a3×…×an。常用的有以下4種關(guān)系:part-of、kind-of、instance-of、attribute-of。
5)公理(axiom)。
代表領(lǐng)域知識本體中的永真斷言。
6)規(guī)則(rule)。
規(guī)則是用來描述根據(jù)某一斷言邏輯推論出的語句形式聲明,其形式是if-then。
2.2領(lǐng)域知識本體設(shè)計
本體描述語言主要用于概念形式化描述,目前有許多本體描述語言,如xol、rdf、rdfs、oil、owl等[11]。本文使用owl實現(xiàn)領(lǐng)域知識本體的描述。owl是w3c推薦的本體描述語言標準,它處于w3c的本體語言棧中最上層,是在daml+oil基礎(chǔ)上發(fā)展起來的,是目前表達能力最強的本體描述語言。根據(jù)表達能力和計算能力的不同,owl提供了3種子語言:owllite、owldl和owlfull,它們滿足了不同需求用戶的需要[12]。它們的情況如表1所示。
本文采用owldl語言來構(gòu)建領(lǐng)域知識本體,它兼顧了表達能力和推理計算能力。
本文使用protégé4.0作為本體開發(fā)工具,protégé是斯坦福大學(xué)醫(yī)學(xué)信息化研究小組開發(fā)的,它是基于java語言開發(fā)的開源本體編輯和知識獲取軟件,具有良好的擴展性,它擴展的owl插件是功能很強大的知識建模工具。
選擇本體開發(fā)工具和編碼語言以后,本文以計算機網(wǎng)絡(luò)領(lǐng)域知識為例,建立一個領(lǐng)域知識本體。領(lǐng)域知識本體的構(gòu)建首先需要確定領(lǐng)域知識概念模型,目前有三種概念模型建模方法:自上而下的方法、自下而上的方法、核心擴展法。本文采用核心擴展法,根據(jù)計算機網(wǎng)絡(luò)經(jīng)典教材,通過頭腦風暴法產(chǎn)生計算機網(wǎng)絡(luò)領(lǐng)域核心概念,通過認真識別、分析最終確定了“傳輸介質(zhì)”、“網(wǎng)絡(luò)類型”、“交換設(shè)備”、“網(wǎng)絡(luò)協(xié)議”、“網(wǎng)絡(luò)拓撲結(jié)構(gòu)”、“網(wǎng)絡(luò)管理”和“網(wǎng)絡(luò)體系結(jié)構(gòu)”7個核心概念。概念如圖2所示。
3知識映射
資源庫模型中有兩個映射關(guān)系:元數(shù)據(jù)庫與資源庫之間的映射關(guān)系,本體庫與元數(shù)據(jù)庫之間的知識映射關(guān)系。這兩種映射關(guān)系都是通過語義相似度計算來定義的。而本文中二者的語義相似度計算函數(shù)是相同的,因此這兩種映射關(guān)系本質(zhì)上是一致的。首先對本體庫與元數(shù)據(jù)庫之間的知識映射關(guān)系做出如下定義。
定義2設(shè)m=(me,o,fmap)為元數(shù)據(jù)me到本體o的知識映射,fmap為知識映射函數(shù),定義:
fmap=sim(eme,eo)(1)
其中:eme表示元數(shù)據(jù)概念元素,eo為本體概念元素,sim(eme,eo)為語義相似度計算函數(shù)。由上面的定義可以看出,通過語義相似度計算建立元數(shù)據(jù)庫與本體庫之間的知識映射關(guān)系。領(lǐng)域本體表示了某一領(lǐng)域知識概念、屬性以及它們之間的語義關(guān)系,形成了一個具有語義的知識概念層次結(jié)構(gòu),通過知識映射的計算語義相似度,得到具有語義相似性的元數(shù)據(jù)元素,形成語義關(guān)聯(lián),從而使電子學(xué)習(xí)資源也具有語義層次結(jié)構(gòu)。
由于兩種映射關(guān)系本質(zhì)上是相同的,參照知識映射關(guān)系的定義對元數(shù)據(jù)庫與資源庫之間的映射關(guān)系做出如下定義。
定義3設(shè)e=(me,r,smap)為元數(shù)據(jù)me到資源r的映射,smap為映射函數(shù),定義:
smap=sim(eme,er)(2)
其中:eme表示元數(shù)據(jù)概念元素,eo為資源概念元素,sim(eme,er)為語義相似度計算函數(shù)。
對于語義相似度的計算,需要遵循一定的基礎(chǔ)和原則,所遵循的基礎(chǔ)是:用于語義相似度計算的概念集中的元素具有語義相似度,它們之間具有樹狀層次結(jié)構(gòu)關(guān)系,即本文可以將概念元素集看作是一個樹狀結(jié)構(gòu)。所要遵循的原則如下。
1)量化原則。相似度是一個取值在[0,1]范圍的數(shù)值,即如果兩個概念是同義的,則語義相關(guān)度為1,當兩個概念之間沒有聯(lián)系時,語義相似度為0。
2)簡單性原則。在考慮各種影響語義相似度的因素的情況下,應(yīng)該使語義相似度計算盡可能地簡單,盡可能地降低計算的復(fù)雜度。
3)結(jié)合概念屬性關(guān)系。本體中概念的關(guān)系有:is-a,instance-of等。概念之間不同的關(guān)系,它們之間的相似度不一樣。
4)可調(diào)節(jié)性。它是指語義相似度的計算結(jié)果可通過某些參數(shù)來調(diào)節(jié),語義相似度本身是一個主觀性很強的概念,對于不同的應(yīng)用環(huán)境相似度是不同的,因此可調(diào)節(jié)性保證了語義相似度的計算能滿足不同的應(yīng)用環(huán)境需求。
5)對稱性。概念之間的相似度計算應(yīng)該符合下面等式:sim(a,b)=sim(b,a),這樣有便于多個概念間相似度的比較和換算。
本文將綜合考慮語義重合度、節(jié)點屬性等方面的因素,計算語義相似度,得到符合本文實際需求的語義相似度計算方法。
1)節(jié)點層次深度。
本體中概念可以看成一個層次樹,概念所處層次越深,概念越具體,概念之間的相似度越大。用depth()表示節(jié)點j在本體樹中的深度,up(j)表示節(jié)點j的父節(jié)點,設(shè)根節(jié)點為root,則:
depth(root)=1
任一非根節(jié)點j的深度計算公式為:
depth(j)=depth(up(j))+1
本體概念樹t的深度depth(t)為:
depth(t)=max(depth(j))
其中j為任意節(jié)點,即本體樹的深度等于所有節(jié)點中深度最大值。
節(jié)點深度相應(yīng)的語義相似度計算式如式(3)所示:
weight1(i,j)=∑min(depth(i),depth(j))n=112n(3)
2)節(jié)點距離。
概念語義距離是指概念集中兩個概念對應(yīng)的節(jié)點在層次樹中構(gòu)成最短路徑所經(jīng)歷的邊數(shù),語義距離也是決定語義相似度的一個因素,通常,語義距離越遠,說明兩個概念關(guān)系越稀疏,相似度也就越小。設(shè)dis(i,j)為節(jié)點i和j之間最短路徑的邊數(shù),節(jié)點距離相應(yīng)的語義相似度計算式如式(4)所示:
weight2(i,j)=2×depth(t)-dis(i,j)2×depth(t)(4)
3)節(jié)點密度。
節(jié)點密度是概念樹中節(jié)點的疏密程度。在概念樹中,不同的部分節(jié)點有密有疏,節(jié)點密集的局部說明概念細化程度大,概念就也具體,節(jié)點間的語義相似度就越高,因此節(jié)點密度也是決定語義相似度的一個因素。設(shè)bro(i)、bro(j)分別表示節(jié)點i、j的兄弟節(jié)點個數(shù),node(t)表示概念樹的所有節(jié)點總數(shù),節(jié)點密度因素相應(yīng)的語義相似度公式如式(5)所示:
weight3(i,j)=bro(i)+bro(j)node(t)(5)
4)語義重合度。
語義重合度是在概念樹中兩個節(jié)點之間共有祖宗節(jié)點個數(shù),即兩個概念之間共有的上位概念的數(shù)目。語義重合度的大小也決定了語義相似度的大小。設(shè)parent(i),parent(j)分別表示節(jié)點i、j的祖宗節(jié)點數(shù),它們的值為從本節(jié)點出發(fā)上溯到根節(jié)點的所有節(jié)點數(shù)目,parent(i)∩parent(j)表示節(jié)點i與節(jié)點j的公共的祖宗節(jié)點個數(shù)。語義重合度對應(yīng)的語義相似度計算式如式(6)所示:
weight4(i,j)=parent(i)∩parent(j)parent(i)+parent(j)(6)
5)屬性與實例重合度。
事物的區(qū)別和聯(lián)系是通過屬性來進行判別的,如果兩個概念具有相同的屬性以及實例,則兩個概念是有聯(lián)系的,這種聯(lián)系就是本文所說的語義相似度。如果兩個概念之間相同的屬性以及實例越多,則表明兩個概念越相似;反之則越相異。同時,屬性是具有屬性值的,對于兩個概念之間的某一屬性具有屬性值,相同屬性值越多說明語義相似度也越高。設(shè)attri_ins(i)、attri_ins(j)分別是節(jié)點i和節(jié)點j的屬性和實例的數(shù)目,屬性以及實例重合度相應(yīng)的語義相似度計算式如式(7)所示:
weight5(i,j)=attri_ins(i)∩attri_ins(j)attri_ins(i)∪attri_ins(j)(7)
其中:attri_ins(i)∩attri_ins(j)表示節(jié)點i和節(jié)點j相同的屬性以及實例數(shù)目或者兩者某一共同屬性的相同屬性值數(shù)目,attri_ins(i)∪attri_ins(j)表示節(jié)點i和節(jié)點j屬性以及實例和節(jié)點i、j的某一屬性的屬性值的數(shù)目。
綜上,基于概念節(jié)點特性得到了如下語義相似度計算模型,如式(8)所示:
similarity(i,j)=aweight1(i,j)+bweight2(i,j)+cweight3(i,j)+dweight4(i,j)+eweight5(i,j)(8)
此處有兩個問題:1.文中沒有weight1(i,j)的表達式,是否需要交代一下?讀者會看得懂嗎?請明確。2.這個公式中的weight2(i,j)與前面的式(3)的“weight(i,j)2”中的下標表示不一致,請明確到底是哪一種書寫格式。
其中:a、b、c、d、e分別對應(yīng)的是這后面有6項,而變量只有5個,是否準確?節(jié)點層次深度、節(jié)點距離、節(jié)點密度、語義重合度、屬性與實例重合度的調(diào)節(jié)因子,而且a+b+c+d+e=1。對于不同應(yīng)用環(huán)境,決定語義相似度的因素權(quán)重是不同的,調(diào)節(jié)因子可以根據(jù)需要進行調(diào)整。對于不同領(lǐng)域的領(lǐng)域本體,計算語義相似度的各種因素所占的權(quán)重是不同的。
4基于領(lǐng)域知識本體的電子學(xué)習(xí)資源語義檢索模型
在基于領(lǐng)域本體的電子學(xué)習(xí)資源庫模型的基礎(chǔ)上,本文提出一個語義檢索模型,該語義檢索模型包括4個部分:用戶查詢接口、查詢分析模塊、語義推理模塊以及語義查詢模塊。如圖3所示。
1)用戶查詢接口。它提供可視化的檢索界面方便用戶使用。它是用戶與系統(tǒng)進行交互的橋梁,將用戶的檢索信息提交給查詢分析模塊,將查詢模塊的檢索結(jié)果顯示給用戶。
2)查詢分析模塊。該模塊的功能是對用戶輸入的檢索信息進行預(yù)處理。用戶在檢索時,一般會輸入自然語言,其中會包含不具有檢索意義的虛詞,首先需要抽取具有檢索意義的實詞,然后對抽取的檢索詞進行語義標注,確定問題的中心,進行規(guī)范化處理。如:用戶輸入“路由器制造廠家有哪些”,經(jīng)過處理以后形成“路由器制造商”這樣的關(guān)鍵詞序列,然后將“路由器”標注為通信設(shè)備,問題的中心是制造廠家,完成這些工作方便進一步的語義判斷。
3)語義推理模塊。該模塊實現(xiàn)語義推理功能,主要由推理機構(gòu)成。語義推理模塊接受上一步中標注的檢索詞,結(jié)合推理規(guī)則,利用推理機進行語義推理,查詢本體庫,同時利用推理引擎進行語義推理,得到檢索詞之間的語義關(guān)系,最終產(chǎn)生標準的查詢語句用于進一步的信息查詢。目前常用的推理機有jena、racer和jess。本文采用jena推理機,同時,本文利用目前流行的sparql作為本體查詢語言[13]?!奥酚善魃a(chǎn)商”利用sparql查詢語句可以表示為:
程序前
select?producer
where
{?xfoaf:“foaf”這個書寫是否正確,請明確。producer?producer
}
程序后
4)語義查詢模塊。利用語義推理模塊生成的標準的查詢語句對本體庫進行查詢,如果是知識檢索,則將查詢結(jié)果返回為用戶;如果是資源檢索,則利用本體庫查詢結(jié)果繼續(xù)對元數(shù)據(jù)庫進行查詢,然后將資源查詢結(jié)果返回給用戶。這兩種查詢在圖3中無法體現(xiàn)出來,請解釋或說明一下。如對“路由器制造商”的查詢,可以從本體文件中查找到“通信設(shè)備制造商”這個類,然后再找到制造路由器的制造商,因此,可以查詢出路由器的制造商有哪些。如果用戶選擇知識檢索,則直接將查詢到的制造商返回給用戶,如果用戶選擇的是資源檢索,則將查詢的制造商名稱作為關(guān)鍵詞繼續(xù)對元數(shù)據(jù)庫進行搜索,檢索到相應(yīng)的路由器制造商的資源信息返回給用戶。
本文利用java語言搭建檢索模型框架,實現(xiàn)模型中模塊的基本功能以及模塊之間的交互。同時利用protégé3.4.1所提供的api來訪問并獲取owl語言所描述的本體信息。并在此基礎(chǔ)上實現(xiàn)語義推理模塊的功能。另一方面通過將用戶查詢語句轉(zhuǎn)化為標準的sparql語言表達式,基于sparql查詢引擎實現(xiàn)語義推理與查詢分析功能。這種機制使得語義檢索模型的實現(xiàn)簡單且高效,確保了語義檢索的準確性與高效性。
對于語義檢索模型,它的語義檢索步驟如下,如圖4所示。
1)用戶輸入查詢信息,然后抽取查詢信息中具有查詢意義的關(guān)鍵詞。
2)利用領(lǐng)域本體計算關(guān)鍵詞與本體中概念進行語義匹配,獲得擴展概念集合。
3)利用推理機對上面獲得的擴展概念集合進行推理,計算擴展概念集之間的語義關(guān)系,生成本體查詢語言所表示的查詢語句。
4)利用生成的查詢語句對本體庫進行查詢,如果是知識檢索,則將查詢結(jié)果返回為用戶;如果是資源檢索,則對元數(shù)據(jù)庫進行查詢,然后將資源查詢結(jié)果返回給用戶。
5實驗與評估
為了評估建立在基于領(lǐng)域本體的電子學(xué)習(xí)資源庫基礎(chǔ)之上的語義檢索模型效率,建立了語義檢索和基于關(guān)鍵詞的常規(guī)檢索實驗環(huán)境。該實驗環(huán)境由武漢大學(xué)網(wǎng)絡(luò)多媒體實驗室構(gòu)建的電子學(xué)習(xí)系統(tǒng)平臺搭建而成,主要考查的指標有兩個:查全率(recall)與查準率(precision)。查全率是指檢索出的相關(guān)電子學(xué)習(xí)資源數(shù)目與全部相關(guān)的電子學(xué)習(xí)資源總數(shù)的百分比;查準率是指檢索出的相關(guān)電子學(xué)習(xí)資源數(shù)目與檢索出的全部電子學(xué)習(xí)資源總數(shù)的百分比。
在實驗中,查準率的計算是通過對查詢結(jié)果判斷是否和給定查詢相關(guān)以獲得有效資源集,有效資源集與查詢結(jié)果集的大小之比即為本次查詢的查準率。而查全率的計算就相對地困難,因為需要針對給定的查詢計算整個資源庫中的相關(guān)資源數(shù)。對于像本文所構(gòu)建的小型實驗系統(tǒng),可以通過瀏覽資源庫的方式以獲得被漏檢的資源數(shù)量。通過上述方式,可以計算出檢索的查準率與查全率,對檢索效率作出定量的評價。
該實驗中使用相同的測試集和檢索信息,選取常用的9個計算機網(wǎng)絡(luò)領(lǐng)域的概念關(guān)鍵詞進行檢索實驗,為了使實驗盡可能地做到全面而準確,本實驗中用到了3類檢索關(guān)鍵詞,都是計算機網(wǎng)絡(luò)領(lǐng)域常用的概念關(guān)鍵詞。檢索詞組一中檢索詞為概念比較寬泛的檢索詞;檢索詞組二中的檢索詞為概念比較精確的檢索詞;檢索詞組三中的檢索詞為具有語義關(guān)系的檢索詞組,如表2所示。
利用以上測試所用檢索詞組得到了兩種檢索方式的查全率以及查準率對比圖,如圖5、6所示。從圖中可以看出,在查全率方面,對于寬泛概念的檢索,語義檢索方式明顯高于關(guān)鍵詞檢索方式,這是因為基于領(lǐng)域本體的語義檢索可以利用領(lǐng)域本體對概念進行擴展,得到該檢索詞的下位知識概念或?qū)嵗?,因此,檢索結(jié)果比較全面。對于查準率,在具有語義關(guān)系的關(guān)鍵詞組的檢索方面,語義檢索發(fā)揮了巨大的優(yōu)勢,它可以更準確地計算出關(guān)鍵詞組之間的語義關(guān)系,挖掘深層次的語義關(guān)系,因此,查準效果明顯。
6結(jié)語
本文針對現(xiàn)有電子學(xué)習(xí)資源庫在資源組織方面的不足之處,提出了一個基于領(lǐng)域本體的電子學(xué)習(xí)資源庫模型,該資源庫模型包括三個數(shù)據(jù)庫以及兩種映射關(guān)系。本文重點介紹了知識映射關(guān)系,該模型實現(xiàn)了電子學(xué)習(xí)資源的語義組織。在基于領(lǐng)域本體的電子學(xué)習(xí)資源庫模型的基礎(chǔ)上構(gòu)建了語義檢索模型,解決了現(xiàn)有電子學(xué)習(xí)資源檢索中丟失語義背景的問題,使檢索系統(tǒng)在查全率、查準率方面的檢索效果有所提高,更加符合用戶的需求。
參考文獻:
[1]
樸姬順,張萍.發(fā)達國家網(wǎng)絡(luò)教育資源庫建設(shè)的特點分析與啟示[j].陜西師范大學(xué)繼續(xù)教育學(xué)報,2005,22(4):94-97.
[2]
劉澤文.網(wǎng)絡(luò)教育資源建設(shè)的現(xiàn)狀與發(fā)展趨勢[j].株洲師范高等專科學(xué)校學(xué)報,2005,10(5):70-72.
[3]
張滬寅,李鑫,陸春濤,等.lmod:一種基于本體描述的電子學(xué)習(xí)資源庫模型[j].計算機應(yīng)用研究,2011,28(4):1360-1364.
[4]
mkaiw,mckinleyl,thompsona.semanticdistancenormscomputedfromanelectronicdictionary(wordnet)[j].behaviorresearchmethods,2004,36(3):421-431.
[5]
dingli,finint,joshia,etal.swoogle:asearchandmetadataengineforthesemanticweb[c]//proceedingsofthe13thacminternationalconferenceoninformationandknowledgemanagement.newyork:acmpress,2004:652-659.
[6]
gaohuiying,zhaojinghua,yinqiuju,etal.ontology-basedenterpriseinformationretrievalmodel[c]//proceedingsof2009ieeeinternationalconferenceongreysystemsandintelligentservices.washington,dc:ieeecomputersociety,2009:1326-1330.
[7]
qihong,zhangliangliang,gaoying.semanticretrievalsystembasedoncornontology[c]//proceedingsofthe5thinternationalconferenceonfrontierofcomputerscienceandtechnology.washington,dc:ieeecomputersociety,2010:116-121.
[8]
swartoutw,tatea.ontologies[j].ieeeintelligentsystemsandtheirapplications,1999,14(1):18-19.
[9]
abrahamsb,daiw.architectureforautomateda
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度互聯(lián)網(wǎng)貸款居間推廣合同范本
- 二零二五年度房產(chǎn)抵押貸款合同履行監(jiān)督合同
- 二零二五年度個人對個人無擔保緊急借款合同
- 二零二五年度股東合作風險共擔與市場拓展合作協(xié)議
- 二零二五年度特色果樹種植基地承包經(jīng)營合同
- 二零二五年度人工智能醫(yī)療合作誠意金合同
- 二零二五年度美發(fā)店連鎖經(jīng)營合作協(xié)議書
- 二零二五年度旅游保險代理合作協(xié)議模板
- 2025年度鄰里拆墻安全責任協(xié)議書
- 生病老師發(fā)言稿
- 【EHS流程圖】建設(shè)項目職業(yè)衛(wèi)生“三同時”工作流程圖(9頁)
- [考研英語]商志英語作文模板
- 小學(xué)交通安全主題班會:《一盔一帶 安全出行》
- 上海住房租賃企業(yè)信息記載表
- Fluent出入口邊界條件設(shè)置及實例解析
- 模擬追溯演練報告(成品到原料)
- 常用一線降壓藥一覽表
- IATF16949-2016內(nèi)部審核方案
- 醫(yī)用耗材分類目錄 (低值 ╱ 高值)
- 權(quán)威實驗室CMA資質(zhì)認定程序文件模板
- 平面機構(gòu)簡圖及自由分解PPT課件
評論
0/150
提交評論