


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
異質(zhì)信息網(wǎng)絡(luò)分析綜述我們生活在一個相互關(guān)聯(lián)的世界里。大部分的數(shù)據(jù)或信息對象、個體代理、群體或組件都是相互關(guān)聯(lián)或相互作用的,形成了眾多的、龐大的、相互關(guān)聯(lián)的、復(fù)雜的網(wǎng)絡(luò)。大量研究表明,這些互相關(guān)聯(lián)的網(wǎng)絡(luò)是現(xiàn)實(shí)世界的一種抽象形式,通過探索信息網(wǎng)絡(luò)不同節(jié)點(diǎn)、關(guān)系之間的關(guān)聯(lián)性一定程度上可以代表對現(xiàn)實(shí)世界內(nèi)真實(shí)的信息潛在關(guān)系的一種映射,為數(shù)據(jù)挖掘提供了一種有效的途徑。下面對異質(zhì)信息網(wǎng)絡(luò)的一些概念進(jìn)行定義。定義2.1:信息網(wǎng)絡(luò)[41](InformationNetwork)被廣泛定義為一種特殊的有向圖形式,假設(shè)一個有向圖圖G=(V,E),包括節(jié)點(diǎn)類型映射函數(shù)τ:V→A,以及鏈接類型映射函數(shù)?:E→R。對于任意節(jié)點(diǎn)ν∈V都有一個節(jié)點(diǎn)類型函數(shù)τ(ν)∈A與之對應(yīng)。同樣的每個鏈接關(guān)系(邊類型)e∈E與傳統(tǒng)的網(wǎng)絡(luò)定義不同,信息網(wǎng)絡(luò)定義明確地區(qū)分了網(wǎng)絡(luò)中的節(jié)點(diǎn)類型和關(guān)系類型。注意,如果存在從X型到Y(jié)型的關(guān)系,我們將其表示為XRY,則逆關(guān)系R?1可以表示為YR?1X。R及其逆R?1通常不相等,除非兩種類型相同并且R是對稱的。當(dāng)節(jié)點(diǎn)類型|X|>1或關(guān)系類型|R|>1時,這樣的網(wǎng)絡(luò)可以被稱為異質(zhì)信息網(wǎng)絡(luò)(HeterogeneousInformationNetwork,HIN),否則即為同質(zhì)信息網(wǎng)絡(luò)(HomogeneousInformationNetwork)。對于一個復(fù)雜的異質(zhì)信息網(wǎng)絡(luò),有必要提供其元級(即模式級)描述,以更好地理解網(wǎng)絡(luò)中的節(jié)點(diǎn)類型和關(guān)系類型。因此,提出了網(wǎng)絡(luò)模式的概念來描述網(wǎng)絡(luò)的元結(jié)構(gòu)。定義2.2:網(wǎng)絡(luò)模式(Networkschema)[41]:定義一個網(wǎng)絡(luò)模式TG=(A,R),TG是異質(zhì)網(wǎng)絡(luò)G=(V,E)的元模板,同時具有節(jié)點(diǎn)類型映射τ:V→A,以及鏈接類型映射函數(shù)?:E→R,這是一個在節(jié)點(diǎn)類型X上定義的有向圖,其中任意節(jié)點(diǎn)X與Y的邊是來自R的關(guān)系。異質(zhì)信息網(wǎng)絡(luò)(HIN)的網(wǎng)絡(luò)模式規(guī)定了對象集的類型約束以及對象之間的關(guān)系,HIN的網(wǎng)絡(luò)模式將HIN半結(jié)構(gòu)化,同時引導(dǎo)了語義信息的獲取。在網(wǎng)絡(luò)模式約束下的信息網(wǎng)絡(luò)而后被稱為網(wǎng)絡(luò)模式的一個實(shí)例。社會、科學(xué)、生物等方面的許多互相關(guān)聯(lián)的大規(guī)模數(shù)據(jù)集中都可以構(gòu)建成異質(zhì)信息網(wǎng)絡(luò)。下面舉一個HIN的例子。學(xué)術(shù)信息網(wǎng)絡(luò):學(xué)術(shù)信息網(wǎng)絡(luò)是一個典型的異質(zhì)信息網(wǎng)絡(luò),如下圖2.1所示,該異質(zhì)信息網(wǎng)絡(luò)包含三種實(shí)體類型的對象:論文(Paper)、期刊會議(Venue)、和作者(Author)。對于任意的論文p∈P圖2.1學(xué)術(shù)信息網(wǎng)絡(luò)不同的信息可以與信息網(wǎng)絡(luò)相關(guān)聯(lián)。屬性可以附加到信息網(wǎng)絡(luò)中的節(jié)點(diǎn)或鏈接。例如,位置屬性、分類屬性或數(shù)字屬性,通常與推特信息網(wǎng)絡(luò)中的一些用戶和推文相關(guān)聯(lián)。此外,時間信息通常與節(jié)點(diǎn)和鏈接相關(guān)聯(lián),以反映信息網(wǎng)絡(luò)的動態(tài)。例如,在一個書目信息網(wǎng)絡(luò)中,每年都會出現(xiàn)新的論文和作者,以及它們相關(guān)的鏈接。除了信息網(wǎng)絡(luò)的結(jié)構(gòu)信息之外,這些信息在挖掘信息網(wǎng)絡(luò)的一些任務(wù)中也是有用的,甚至是重要的。如前所示,兩個節(jié)點(diǎn)可以在異構(gòu)信息網(wǎng)絡(luò)中通過不同的路徑進(jìn)行鏈接。例如,可以通過“作者、作者”路徑、“作者、地點(diǎn)、論文作者”路徑進(jìn)行聯(lián)系。在形式上,這些路徑稱為元路徑,定義如下。定義2.3元路徑[48,59]:定義一個元路徑ρ是在網(wǎng)絡(luò)模式TG=(A,R)圖上定義的路徑,可以用A1R1A2R2A3R3??RiA圖2.2學(xué)術(shù)信息網(wǎng)絡(luò)元路徑對于一條路徑p=(a1a2a3?ai+1給定一個元路徑Φ,每個節(jié)點(diǎn)都存在一組基于元路徑的鄰居,它們可以在異構(gòu)圖中揭示不同的結(jié)構(gòu)信息和豐富的語義。PathSim[48]是一個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2021-2022學(xué)年廣東省廣州市南武教育集團(tuán)七年級(下)期中數(shù)學(xué)試卷(含答案)
- 遺產(chǎn)繼承顧問服務(wù)合同(2篇)
- 環(huán)保工程承包與實(shí)施合同
- 樣機(jī)報廢說明
- 電子會議參與情況統(tǒng)計表
- 四川省達(dá)州市渠縣中學(xué)2025屆高三下學(xué)期二??荚嚨乩碓囶}(含答案)
- 汽車維修技術(shù)發(fā)動機(jī)原理與故障診斷試題
- 在公司年會上的致辭報告
- 《光的三原色原理及其應(yīng)用:初中物理教學(xué)教案》
- 物流行業(yè)貨物運(yùn)輸延誤免責(zé)協(xié)議書
- 2024臨床免疫學(xué)定性檢驗程序性能驗證指南
- 健康體檢報告分析結(jié)果
- 2024年?;钒踩芾碇贫群蛵徫话踩僮饕?guī)程(9篇范文)
- 自動販賣機(jī)方案
- 《莖和葉》名師課件
- 電網(wǎng)公司QC小組太陽能光伏發(fā)電降溫增效裝置的研制
- 混流式水輪發(fā)電機(jī)組導(dǎo)水機(jī)構(gòu)A級檢修作業(yè)指導(dǎo)書
- CONSORT2010流程圖(FlowDiagram)【模板】文檔
- 2014年林產(chǎn)化工松香深加工行業(yè)分析報告
- 前廳月工作計劃
- DB52∕T 1433-2019 固體礦產(chǎn)資源綠色勘查技術(shù)規(guī)范
評論
0/150
提交評論