




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Gephi的社交網絡消息可視化分析系統(tǒng)的設計與實現(xiàn)作者:寧躍飛李艷萍來源:《現(xiàn)代電子技術》2017年第17期業(yè)務邏輯層顯示層IIDPSMapReduceOoyie圖1社交網絡消息可視化系統(tǒng)邏輯結構圖業(yè)務邏輯層顯示層IIDPSMapReduceOoyie相似度數(shù)據顯示層按照結果數(shù)據繪圖圖2系統(tǒng)的工作流程圖相似度數(shù)據顯示層按照結果數(shù)據繪圖圖4兩層樹狀轉發(fā)結構bunihngoiigumaichiixkxIjooxxsugargumanHyungo125ssnakdn圖5時間序列轉發(fā)結構本文方法——基于遺傳算法布局無向圖方法7O6O5O4O3O2O1OO芒同一沱fc攻7040040006000120001800048CX)05500080000120000網絡消息量圖6時間復雜度分析
(a)埴「遺傳算法布局無向圖方法3)本文方法圖7效果布局圖(a)埴「遺傳算法布局無向圖方法3)本文方法圖7效果布局圖表1可視化性能刪試序號可視化節(jié)點規(guī)模展現(xiàn)節(jié)點規(guī)模本文方法準確率/%遺傳算法布局無向圖方法準確率/25240012295.2688.653400024695.0583.244600028494.3676.2551200038494.1871.0861800056893.9265.3274800088493.2460.07855000108493.1755.28980000365293.0650.1610120000456892.8435.67摘要:傳統(tǒng)基于遺傳算法布局無向圖方法塑造的社交網絡消息可視化系統(tǒng)不適合大規(guī)模社交網絡消息的可視化,存在運行時間長以及顯示效果粗糙等問題。針對該問題,設計并實現(xiàn)了基于Gephi的社交網絡消息可視化系統(tǒng),其由顯示層、業(yè)務邏輯層以及數(shù)據支撐層構成,該系統(tǒng)可呈現(xiàn)出社交網絡消息的路徑傳播以及系統(tǒng)的可視化布局。詳細介紹了系統(tǒng)實現(xiàn)社交網絡消息可視化的工作流程。網絡工具Gephi分別采用基于時間序列以及樹狀排列的算法,對相似消息以及具有明確用戶轉發(fā)關系的消息進行排序,對經過排序后的消息采用Gephi的文件格式gexf進行寫入保存操作,生成社交網絡消息的傳播路徑圖。實驗結果說明該系統(tǒng)具有較低的時間復雜度、對社交網絡的布局效果更佳,可視化性能強。關鍵詞:Gephi;社交網絡;消息可視化;傳播路徑中圖分類號:TN711-34;TP391.1文獻標識碼:A文章編號:1004-373X(2017)17-0183-04DesignandimplementationofGephi-basedinformationvisualizationanalysissystemforsocialnetworkNINGYuefei,LIYanping(ZhengzhouShengdaUniversityofEconomics,BusinessandManagement,Zhengzhou450000,China)Abstract:Thesocialnetwork'sinformationvisualizationsystemconstructedwithtraditionalundirectedgraphmethodbasedongeneticalgorithmisunsuitableforinformationvisualizationoflarge-scalesocialnetwork,andhasproblemsoflongrunningtimeandroughdisplayeffect.Inordertosolvetheaboveproblems,aGephi-basedinformationvisualizationsystemofsocialnetworkwasdesignedandimplemented.Thesystemiscomposedofdisplaylayerbusinesslogiclayeranddatasupportlayer,andcanpresenttheinformationpropagationpathofthesocialnetworkandvisualizationlayoutofthesystem.Theworkflowofsocialnetworkinformationvisualizationrealizedwiththesystemisintroducedindetail.ThealgorithmsbasedontimeseriesandarborescencesortingareusedinnetworktoolGephirespectivelytosortthesimilarinformationandinformationwithexplicituserforwardingrelation.ThesortedinformationiswrittenandsavedwithfileformatgexfofGephitogeneratetheinformationpropagationpathdiagramofsocialnetwork.Theexperimentalresultsshowthatthesystemhaslowtimecomplexity,perfectlayouteffectofsocialnetwork,andstrongvisualizationperformance.Keywords:Gephi;socialnetwork;messagevisualization;propagationpath隨著科學技術的發(fā)展,社交網絡平臺在人們的生產和生活中具有廣泛的應用價值,社交網絡平臺使得網絡輿論高速傳播,網絡中的數(shù)據量呈現(xiàn)爆炸式增長[1]。對社交網絡中的海量數(shù)據進行分析和可視化,能夠將抽象的數(shù)據變換成人們更易理解和觀測的圖形,形象描述出數(shù)據內的信息,實現(xiàn)輿論信息的有效監(jiān)控[2]。傳統(tǒng)基于遺傳算法布局無向圖方法塑造的社交網絡消息可視化系統(tǒng)不適合大規(guī)模社交網絡消息的可視化,存在運行時間長以及顯示效果粗糙等問題[3]。因此設計更加準確、高效的社交網絡消息可視化分析系統(tǒng)具有重要的應用意義。1Gephi的社交網絡消息可視化分析系統(tǒng)1.1系統(tǒng)邏輯層結構本文設計的可視化系統(tǒng)由顯示層、業(yè)務邏輯層以及數(shù)據支撐層構成,如圖1所示。(1)顯示層為用戶提供了可交互的界面,確保用戶在界面上設置需要呈現(xiàn)的數(shù)據和待檢索的文字信息,并向用戶呈現(xiàn)結果信息、文本檢索信息排列情況以及社團狀態(tài)等。(2)業(yè)務邏輯層用于對顯示層反饋的用戶需求進行操作,將操作后的數(shù)據以及圖形信息再反饋到顯示層。業(yè)務邏輯層由數(shù)據爬取模塊、數(shù)據操作模塊、文本向量化模塊以及可視化模塊構成[4]。其中的數(shù)據爬取模塊設計在新浪微博API中的網絡爬蟲可按照顯示層設定的爬取需求完成社交網絡信息的采集。數(shù)據處理模塊將爬取的數(shù)據變換成后續(xù)需要處理的格式化數(shù)據[5],通過MapReduce和Oozie協(xié)同進行用戶間行為的采集、用戶關系數(shù)據的加權以及用戶微博數(shù)據格式化等處理。社團劃分模塊采用不同的社團劃分方法,將獲取的用戶關系加權數(shù)據進行社團劃分,存儲獲取的社團信息。文本向量化模塊將社團的微博文本信息和顯示層反饋的檢索文件變換成向量,運算獲取社團信息同檢索文本的同類度,將完成排序的結果反饋給后續(xù)模塊??梢暬K采用Gephi工具,基于獲取的社團信息以及用戶關系,獲取社交網絡消息的路徑傳播圖[6],通過顯示層呈現(xiàn)系統(tǒng)可視化布局圖。(3)數(shù)據支撐層實現(xiàn)系統(tǒng)中數(shù)據爬取模塊獲取的數(shù)據,以及其他不同模塊間中間數(shù)據的分布式存儲。1.2系統(tǒng)的工作流程基于Gephi的社交網絡消息可視化分析系統(tǒng)的運行流程圖如圖2所示。圖2描述的系統(tǒng)詳細工作流程如下:(1)若客戶需要的社交網絡可視化消息數(shù)據不存在,則進行爬取。通過爬取模塊,按照顯示層內設置的種子文件路徑以及爬取方案完成爬取,基于爬取數(shù)據的大小,用戶按照顯示層內的“目標路徑”選擇路徑存儲到相應的區(qū)域。(2)爬取獲取的數(shù)據需要進行格式化操作,實現(xiàn)用戶間關系數(shù)據、用戶微博數(shù)據等的格式化輸出,并將輸出數(shù)據存儲到用戶目標路徑。(3)若用戶所需的可視化數(shù)據已經存在,則直接運行社團劃分模塊,用戶選擇進行社團劃分以及相應的劃分方法,將顯示層中的信息傳播路徑存儲到本機中。(4)若檢索框中存在數(shù)據,應進行可視化信息的呈現(xiàn),同時運行文本信息向量化以及可視化布局[7]。向量化時先檢測是否存在完成向量化的社團數(shù)據,若存在則運行下一步,否則對社團數(shù)據進行向量化處理。(5)對檢索文本框內的數(shù)據進行向量化處理,采用MapReduce分布式運算獲取檢索文本相似運算結果,將結果反饋給顯示層。(6)按照顯示層設置的可視化方法,采用Gephi工具獲取社交網絡消息的路徑傳播圖,并將結果反饋給顯示層。(7)顯示層依據獲取的網絡信息傳播路徑和相似度排序進行繪圖,完成社交網絡結構的布局。2Gephi的社交網絡消息傳播路徑塑造設計的社交網絡消息可視化分析系統(tǒng)采用復雜網絡工具Gephi對社交網絡信息進行消息轉發(fā)分析,分析社交網絡消息的傳播路徑。社交網絡中相同以及相似的消息會被不同用戶發(fā)送,能夠推測出用戶間存在的官方轉發(fā)關系以及非官方轉發(fā)關系[8]。社交網絡中不存在明確轉發(fā)關系的相似消息可依據時間序列進行排序,而存在轉發(fā)關系的消息可通過排序算法進行排序,對排序后的節(jié)點集通過gexf圖文件進行排序展示,獲取社交網絡消息的路徑傳播圖。為了對社交網絡節(jié)點進行排序,需要收集指定的4個數(shù)據表中的數(shù)據,再面向官方轉發(fā)消息和相似性消息設計排序算法,分別對用戶節(jié)點進行樹狀排序和時間序列排序[9]。Gephi基于上述4種數(shù)據表,采集其中的社交網絡用戶轉發(fā)關系,匯總時間序列,規(guī)劃排序算法,生成gexf格式的網絡數(shù)據,呈現(xiàn)社交網絡消息傳播路徑,發(fā)現(xiàn)消息源頭。使用Gephi可高效率渲染社交網絡用戶間的關系,及用戶間話語疊加相似度。Gephi中含有較多的簡單程序嵌套,可將Gephi的功能融入系統(tǒng)的應用程序內。Gephi為數(shù)據顯示設置了較多的數(shù)據格式[10],系統(tǒng)將排序好的數(shù)據節(jié)點依據Gephi設置的gexf數(shù)據格式存儲,如圖3所示,其導出的簡單轉發(fā)圖中存在兩個節(jié)點,分別描述用戶名mynte以及ccpout,分析圖中箭頭能夠得出,用戶ccpout轉發(fā)了用戶mynte的消息。Gephi將社交網絡消息傳遞關系劃分成官方轉發(fā)關系的傳遞關系以及依據時間序列的傳遞關系,通過淺灰色渲染官方轉發(fā)消息傳播路徑,深灰色渲染依據時間序列的傳播路徑。Gephi分別采用基于時間序列以及樹狀排列的算法對相似消息以及具有確定用戶轉發(fā)關系的消息進行排序,將完成排序的節(jié)點信息以及邊信息分別存儲到對應的gexf圖文件中,生成的gexf社交網絡消息路徑傳播圖由官方轉發(fā)的消息路徑傳播圖和依據時間序列的路徑傳播圖構成。分析基于Gephi產生的社交網絡消息路徑傳播圖,可總結出不同結構的路徑傳播圖?;诠俜睫D發(fā)消息的路徑傳播圖主要包括兩層樹狀轉發(fā)結構、自轉發(fā)結構、多層樹狀轉發(fā)結構、樹干轉發(fā)結構以及環(huán)形轉發(fā)結構。其中兩層樹狀結構的轉發(fā)路徑圖如圖4所示,能夠看出發(fā)送消息的源頭是soswga用戶,其具有大量的粉絲,這些粉絲都轉發(fā)了源頭用戶的消息。依據時間序列的消息傳播圖如圖5所示,其中的消息都是相似的,這些消息基于時間序列完成轉發(fā)。3實驗結果與分析實驗從時間復雜度、圖布局效果以及可視化性能三個方面檢測本文方法的性能。實驗采用的數(shù)據集都是爬蟲從新浪微博中爬取到的數(shù)據集。3.1時間復雜度測試實驗統(tǒng)計出本文方法和基于遺傳算法布局無向圖方法進行社交網絡消息可視化過程中的時間復雜度,結果如圖6所示。分析圖6可得,隨著社交網絡消息量的增加,兩種方法的運行時間都不斷提升,本文方法的時間復雜度低于基于遺傳算法布局無向圖方法,說明本文方法對海量社交網絡消息的可視化分析效率較高。3.2圖布局效果測試兩種方法在實驗社交網絡消息集中進行可視化呈現(xiàn),兩種方法獲取的社交網絡消息可視化布局圖如圖7所示。雀圖7中可明顯看出,相對于基于遺傳算法布局無向圖方法,本文方法可以更好地呈現(xiàn)出圖像結構以及用戶間的轉發(fā)關系,準確呈現(xiàn)出社交網絡的特征。3.3可視化性能測試實驗對兩種方法從社交網絡中獲取數(shù)據后,從數(shù)據處理到可視化布局過程中系統(tǒng)的準確率進行檢測,結果見表1。分析表1可以看出,本文方法的準確率高于基于遺傳算法布局無向圖方法,并且不受社交網絡消息量的干擾,始終保持較高的準確度。說明本文可準確挖掘社交網絡中內部成員間的關系以及其中的關鍵人物,具有較高的可視化性能。4結語本文設計并實現(xiàn)了基于Gephi的社交網絡消息可視化分析系統(tǒng)。實驗結果說明該系統(tǒng)具有較低的時間復雜度,對社交網絡的布局效果更佳,可視化性能強。參考文獻陳召群,車向前,谷源濤.基于譜聚類的大規(guī)模社交網絡可視化方法研究[J].計算機仿真,2015,32(9):318-322.于蕾,吳強.一個基于社區(qū)相似度分析的物流網絡優(yōu)化算法[J].現(xiàn)代電子技術,2016,39(6):45-48.劉輝.基于隨機游走算法的社交網絡構建[J].湖北成人教育學院學報,2014,20(1):11-12.周碧,段富.免疫細胞因子網絡模型設計與仿真研究[J].現(xiàn)代電子技術,2016,39(8):21-25.賀超波,湯庸,麥輝強,等.在線社交網絡挖掘綜述[J].武漢大學學報(理學版),2014,60(3):189-200
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小班藝術活動豐富孩子的創(chuàng)意計劃
- 倉庫物流環(huán)節(jié)的協(xié)同管理計劃
- 中學教育改革計劃
- 醫(yī)保相關知識培訓課件
- 貴州豐聯(lián)礦業(yè)有限公司普安縣久豐煤礦變更礦產資源綠色開發(fā)利用方案(三合一)評審意見
- 《且末縣邦泰礦業(yè)投資有限公司新疆且末縣屈庫勒克東礦區(qū)金(銻)礦礦產資源開發(fā)利用與生態(tài)保護修復方案》專家意見的認定
- 《8 節(jié)日美食》(教學設計)-2023-2024學年五年級下冊綜合實踐活動皖教版
- 如何改善個人責任意識提升組織效率
- 第三單元第十三課《使用電子郵件和QQ》-教學設計 2023-2024學年粵教版(2019)初中信息技術七年級上冊
- 2025年粘土主題組合創(chuàng)意標準教案
- 2025年黑龍江職業(yè)學院單招職業(yè)適應性測試題庫附答案
- 2025年四川三江招商集團有限公司招聘筆試參考題庫含答案解析
- 2024年西安電力高等??茖W校高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2025高考數(shù)學一輪復習-第10章-第8節(jié) 二項分布、超幾何分布與正態(tài)分布【課件】
- 《心力衰竭護理》課件
- 2024年牡丹江大學單招職業(yè)適應性測試題庫帶答案
- 內保單位培訓
- 早產兒與低出生體重兒袋鼠式護理技術規(guī)
- 進化醫(yī)療-跨物種腫瘤基因治療的開拓者
- 法理學復習題+答案
- 信息化系統(tǒng)平臺試運行方案
評論
0/150
提交評論