《異質(zhì)信息網(wǎng)絡(luò)探析》1800字_第1頁
《異質(zhì)信息網(wǎng)絡(luò)探析》1800字_第2頁
《異質(zhì)信息網(wǎng)絡(luò)探析》1800字_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

異質(zhì)信息網(wǎng)絡(luò)分析綜述我們生活在一個相互關(guān)聯(lián)的世界里。大部分的數(shù)據(jù)或信息對象、個體代理、群體或組件都是相互關(guān)聯(lián)或相互作用的,形成了眾多的、龐大的、相互關(guān)聯(lián)的、復(fù)雜的網(wǎng)絡(luò)。大量研究表明,這些互相關(guān)聯(lián)的網(wǎng)絡(luò)是現(xiàn)實(shí)世界的一種抽象形式,通過探索信息網(wǎng)絡(luò)不同節(jié)點(diǎn)、關(guān)系之間的關(guān)聯(lián)性一定程度上可以代表對現(xiàn)實(shí)世界內(nèi)真實(shí)的信息潛在關(guān)系的一種映射,為數(shù)據(jù)挖掘提供了一種有效的途徑。下面對異質(zhì)信息網(wǎng)絡(luò)的一些概念進(jìn)行定義。定義2.1:信息網(wǎng)絡(luò)[41](InformationNetwork)被廣泛定義為一種特殊的有向圖形式,假設(shè)一個有向圖圖G=(V,E),包括節(jié)點(diǎn)類型映射函數(shù)τ:V→A,以及鏈接類型映射函數(shù)?:E→R。對于任意節(jié)點(diǎn)ν∈V都有一個節(jié)點(diǎn)類型函數(shù)τ(ν)∈A與之對應(yīng)。同樣的每個鏈接關(guān)系(邊類型)e∈E與傳統(tǒng)的網(wǎng)絡(luò)定義不同,信息網(wǎng)絡(luò)定義明確地區(qū)分了網(wǎng)絡(luò)中的節(jié)點(diǎn)類型和關(guān)系類型。注意,如果存在從X型到Y(jié)型的關(guān)系,我們將其表示為XRY,則逆關(guān)系R?1可以表示為YR?1X。R及其逆R?1通常不相等,除非兩種類型相同并且R是對稱的。當(dāng)節(jié)點(diǎn)類型|X|>1或關(guān)系類型|R|>1時,這樣的網(wǎng)絡(luò)可以被稱為異質(zhì)信息網(wǎng)絡(luò)(HeterogeneousInformationNetwork,HIN),否則即為同質(zhì)信息網(wǎng)絡(luò)(HomogeneousInformationNetwork)。對于一個復(fù)雜的異質(zhì)信息網(wǎng)絡(luò),有必要提供其元級(即模式級)描述,以更好地理解網(wǎng)絡(luò)中的節(jié)點(diǎn)類型和關(guān)系類型。因此,提出了網(wǎng)絡(luò)模式的概念來描述網(wǎng)絡(luò)的元結(jié)構(gòu)。定義2.2:網(wǎng)絡(luò)模式(Networkschema)[41]:定義一個網(wǎng)絡(luò)模式TG=(A,R),TG是異質(zhì)網(wǎng)絡(luò)G=(V,E)的元模板,同時具有節(jié)點(diǎn)類型映射τ:V→A,以及鏈接類型映射函數(shù)?:E→R,這是一個在節(jié)點(diǎn)類型X上定義的有向圖,其中任意節(jié)點(diǎn)X與Y的邊是來自R的關(guān)系。異質(zhì)信息網(wǎng)絡(luò)(HIN)的網(wǎng)絡(luò)模式規(guī)定了對象集的類型約束以及對象之間的關(guān)系,HIN的網(wǎng)絡(luò)模式將HIN半結(jié)構(gòu)化,同時引導(dǎo)了語義信息的獲取。在網(wǎng)絡(luò)模式約束下的信息網(wǎng)絡(luò)而后被稱為網(wǎng)絡(luò)模式的一個實(shí)例。社會、科學(xué)、生物等方面的許多互相關(guān)聯(lián)的大規(guī)模數(shù)據(jù)集中都可以構(gòu)建成異質(zhì)信息網(wǎng)絡(luò)。下面舉一個HIN的例子。學(xué)術(shù)信息網(wǎng)絡(luò):學(xué)術(shù)信息網(wǎng)絡(luò)是一個典型的異質(zhì)信息網(wǎng)絡(luò),如下圖2.1所示,該異質(zhì)信息網(wǎng)絡(luò)包含三種實(shí)體類型的對象:論文(Paper)、期刊會議(Venue)、和作者(Author)。對于任意的論文p∈P圖2.1學(xué)術(shù)信息網(wǎng)絡(luò)不同的信息可以與信息網(wǎng)絡(luò)相關(guān)聯(lián)。屬性可以附加到信息網(wǎng)絡(luò)中的節(jié)點(diǎn)或鏈接。例如,位置屬性、分類屬性或數(shù)字屬性,通常與推特信息網(wǎng)絡(luò)中的一些用戶和推文相關(guān)聯(lián)。此外,時間信息通常與節(jié)點(diǎn)和鏈接相關(guān)聯(lián),以反映信息網(wǎng)絡(luò)的動態(tài)。例如,在一個書目信息網(wǎng)絡(luò)中,每年都會出現(xiàn)新的論文和作者,以及它們相關(guān)的鏈接。除了信息網(wǎng)絡(luò)的結(jié)構(gòu)信息之外,這些信息在挖掘信息網(wǎng)絡(luò)的一些任務(wù)中也是有用的,甚至是重要的。如前所示,兩個節(jié)點(diǎn)可以在異構(gòu)信息網(wǎng)絡(luò)中通過不同的路徑進(jìn)行鏈接。例如,可以通過“作者、作者”路徑、“作者、地點(diǎn)、論文作者”路徑進(jìn)行聯(lián)系。在形式上,這些路徑稱為元路徑,定義如下。定義2.3元路徑[48,59]:定義一個元路徑ρ是在網(wǎng)絡(luò)模式TG=(A,R)圖上定義的路徑,可以用A1R1A2R2A3R3??RiA圖2.2學(xué)術(shù)信息網(wǎng)絡(luò)元路徑對于一條路徑p=(a1a2a3?ai+1給定一個元路徑Φ,每個節(jié)點(diǎn)都存在一組基于元路徑的鄰居,它們可以在異構(gòu)圖中揭示不同的結(jié)構(gòu)信息和豐富的語義。PathSim[48]是一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論