版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Python商業(yè)數(shù)據(jù)分析社會(huì)網(wǎng)絡(luò)分析學(xué)習(xí)目標(biāo)理解社會(huì)網(wǎng)絡(luò)基本概念掌握社會(huì)網(wǎng)絡(luò)中心性的計(jì)算方法掌握社會(huì)網(wǎng)絡(luò)鏈接分析方法掌握社區(qū)發(fā)現(xiàn)的常見方法12.1社會(huì)網(wǎng)絡(luò)基本概念
12.1社會(huì)網(wǎng)絡(luò)基本概念度節(jié)點(diǎn)與其他節(jié)點(diǎn)的關(guān)系數(shù)量就是度有向圖中根據(jù)關(guān)系的指向又可以分為入度和出度入度是指其他節(jié)點(diǎn)指向該節(jié)點(diǎn)的邊的數(shù)量出度則是該節(jié)點(diǎn)指向其他節(jié)點(diǎn)的邊的數(shù)量有向圖中根據(jù)關(guān)系的指向又可以分為入度和出度,入度是指其他節(jié)點(diǎn)指向該節(jié)點(diǎn)的邊的數(shù)量度分布(DegreeDistribution)類似于分布直方圖,能刻畫網(wǎng)絡(luò)的整體特征和節(jié)點(diǎn)的重要性12.1社會(huì)網(wǎng)絡(luò)基本概念最短路徑長(zhǎng)度網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)的通路往往有很多條,在所有通路中最短的稱為最短路徑節(jié)點(diǎn)3到節(jié)點(diǎn)6的不重復(fù)路徑中3-2-4-6的路徑最短,最短路徑長(zhǎng)度為3可以刻畫節(jié)點(diǎn)之間信息傳遞的速度平均路徑長(zhǎng)度(AverageShortestPathLength)網(wǎng)絡(luò)中任意兩個(gè)節(jié)點(diǎn)間最短路徑長(zhǎng)度的平均值在社交網(wǎng)絡(luò)中可以衡量用戶之間關(guān)系的緊密程度,代表用戶之間最短關(guān)系鏈中的朋友數(shù)量網(wǎng)絡(luò)直徑(Diameter):網(wǎng)絡(luò)中所有最短路徑中長(zhǎng)度最大的路徑長(zhǎng)度12.1社會(huì)網(wǎng)絡(luò)基本概念
12.1社會(huì)網(wǎng)絡(luò)基本概念Python中的NetworkX庫(kù)是圖論與復(fù)雜網(wǎng)絡(luò)的建模工具12.1社會(huì)網(wǎng)絡(luò)基本概念12.1社會(huì)網(wǎng)絡(luò)基本概念12.2社會(huì)網(wǎng)絡(luò)的中心性識(shí)別社會(huì)網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)一個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)有著廣泛的聯(lián)系,則重要程度要高于那些聯(lián)系比較少的節(jié)點(diǎn)度中心性(DegreeCentrality)貼近中心性(ClosenessCentrality)中介中心性(BetweennessCentrality)12.2社會(huì)網(wǎng)絡(luò)的中心性
12.2社會(huì)網(wǎng)絡(luò)的中心性
12.2社會(huì)網(wǎng)絡(luò)的中心性
12.2社會(huì)網(wǎng)絡(luò)的中心性12.2社會(huì)網(wǎng)絡(luò)的中心性Facebookegonets度中心性前50的節(jié)點(diǎn)處于密集的節(jié)點(diǎn)簇中心,而貼近中心性和中介中心性前50的節(jié)點(diǎn)大多位于連接節(jié)點(diǎn)簇的“橋梁”位置12.3社會(huì)網(wǎng)絡(luò)的鏈接分析——PageRank算法
12.3.1PageRank算法核心假設(shè)如果一個(gè)網(wǎng)頁(yè)有眾多鏈入鏈接,則其很可能是重要的如果一個(gè)網(wǎng)頁(yè)有重要的鏈入鏈接,即指向該網(wǎng)頁(yè)的網(wǎng)頁(yè)是重要的,則其很可能是重要的一個(gè)網(wǎng)頁(yè)的重要性被其鏈出鏈接均分。影響一個(gè)網(wǎng)頁(yè)重要性的因素包括網(wǎng)頁(yè)的鏈入鏈接數(shù)量鏈入網(wǎng)頁(yè)的重要性鏈入網(wǎng)頁(yè)的鏈出鏈接數(shù)12.3.1PageRank算法
12.3.1PageRank算法
12.3.1PageRank算法
12.3.1PageRank算法優(yōu)點(diǎn)防止作弊的發(fā)生一個(gè)頁(yè)面的權(quán)威和重要性是由指向它的頁(yè)面所決定的,也就是由該頁(yè)面的鏈入鏈接決定在用戶進(jìn)行檢索時(shí),搜索的效率就非常高每一個(gè)頁(yè)面的PageRank值不受查詢條件的影響,它只受全局的鏈接情況影響所有頁(yè)面的PageRank值都是在離線的情況下計(jì)算出來的,而不是在用戶查詢時(shí)計(jì)算的12.3.2HITS算法HITS算法是與查詢相關(guān)的權(quán)威等級(jí)與PageRank算法的思想類似,一個(gè)網(wǎng)頁(yè)的鏈入鏈接數(shù)量越多,權(quán)威等級(jí)越高權(quán)威等級(jí)高的網(wǎng)頁(yè)又稱為權(quán)威網(wǎng)頁(yè),權(quán)威網(wǎng)頁(yè)往往含有權(quán)威信息而被其他網(wǎng)頁(yè)引用中心等級(jí)一個(gè)網(wǎng)頁(yè)的鏈出鏈接數(shù)量越多,該網(wǎng)頁(yè)的中心等級(jí)越高中心等級(jí)高的網(wǎng)頁(yè)也稱為中心網(wǎng)頁(yè),中心網(wǎng)頁(yè)一般是某些話題的重要載體,通過這個(gè)“橋梁”網(wǎng)頁(yè)連接其他相關(guān)網(wǎng)頁(yè)HITS算法有效地利用權(quán)威網(wǎng)頁(yè)和中心網(wǎng)頁(yè)的相互促進(jìn)關(guān)系,即中心網(wǎng)頁(yè)一定有很多鏈出鏈接指向權(quán)威網(wǎng)頁(yè),而權(quán)威網(wǎng)絡(luò)一定有很多由中心網(wǎng)頁(yè)指向的鏈入鏈接12.3.2HITS算法
12.3.2HITS算法
12.3鏈接分析代碼示例networkx中的pagerank()和hits()函數(shù)能快速實(shí)現(xiàn)這兩個(gè)算法12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)兩個(gè)算法能通過networkx庫(kù)中community模塊的kernighan_lin_bisection()和girvan_newman()函數(shù)實(shí)現(xiàn)12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)FN算法(FastNewmanAlgorithm)首先將每一個(gè)節(jié)點(diǎn)視為一個(gè)社區(qū),計(jì)算模塊度以模塊度增加最大的方式進(jìn)行社區(qū)合并,直至無法增加模塊度Louvain算法將網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)視為一個(gè)社區(qū),對(duì)于每個(gè)節(jié)點(diǎn),評(píng)估將其加入與之相連的鄰居節(jié)點(diǎn)中的模塊度增益,然后將其加入到使得模塊度增益最大的節(jié)點(diǎn)中,不斷迭代直至模塊度取得局部最大值,即單一節(jié)點(diǎn)的變動(dòng)無法使模塊度進(jìn)一步增加第二階段在第一階段結(jié)果的基礎(chǔ)上將所有社區(qū)轉(zhuǎn)變?yōu)橐粋€(gè)個(gè)“新”節(jié)點(diǎn),“新”節(jié)點(diǎn)之間邊的權(quán)重為兩個(gè)社區(qū)中原始節(jié)點(diǎn)之間邊的權(quán)重之和完成第二階段后再次應(yīng)用第一階段的方法,不斷迭代直至模塊度不再增加模塊度優(yōu)化算法能夠使得社區(qū)劃分結(jié)果的模塊度最大,但是由于優(yōu)化目標(biāo)是全局社區(qū)結(jié)構(gòu)質(zhì)量,因此無法挖掘網(wǎng)絡(luò)中較小的社區(qū)結(jié)構(gòu)12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)networkx庫(kù)中community模塊的greedy_modularity_communities()能實(shí)現(xiàn)FN算法12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)標(biāo)簽傳播算法通過已有社區(qū)標(biāo)簽的節(jié)點(diǎn)將標(biāo)簽逐步傳播給鄰近節(jié)點(diǎn)的社區(qū)發(fā)現(xiàn)方法給每個(gè)節(jié)點(diǎn)初始化一個(gè)不同的標(biāo)簽每個(gè)節(jié)點(diǎn)選擇與其直接相連的所有鄰居節(jié)點(diǎn)中出現(xiàn)次數(shù)最多的標(biāo)簽,若有多個(gè)出現(xiàn)次數(shù)相同的標(biāo)簽則進(jìn)行隨機(jī)選擇。不斷重復(fù)上述過程,直至每個(gè)節(jié)點(diǎn)的標(biāo)簽都是與其直接相連的所有鄰居節(jié)點(diǎn)中出現(xiàn)次數(shù)最多的標(biāo)簽連接緊密的節(jié)點(diǎn)有共同的標(biāo)簽,即屬于同一個(gè)社區(qū)標(biāo)簽傳播算法思路簡(jiǎn)單,適用于大型網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn),但由于算法中有隨機(jī)選擇的過程,劃分結(jié)果的穩(wěn)定性較弱12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)networkx庫(kù)中community模塊的asyn_lpa_communities()函數(shù)可實(shí)現(xiàn)LPA算法
12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)LPA算法將Facebookegonets
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 車輛抵押合同借款范本年
- 商品采購(gòu)合同范本年
- 合同協(xié)議補(bǔ)充模板
- 鋼鐵項(xiàng)目擔(dān)保合同
- 攝影師勞動(dòng)合同范本
- 商品混凝土合同書范本
- 草坪種植合同協(xié)議書模板范本
- 租賃合同申請(qǐng)書年
- 空置房屋轉(zhuǎn)讓合同模板
- 部編版道德與法治九年級(jí)上冊(cè)《我們的夢(mèng)想》聽課評(píng)課記錄1
- DL-T+5196-2016火力發(fā)電廠石灰石-石膏濕法煙氣脫硫系統(tǒng)設(shè)計(jì)規(guī)程
- 2024-2030年中國(guó)產(chǎn)教融合行業(yè)市場(chǎng)運(yùn)營(yíng)態(tài)勢(shì)及發(fā)展前景研判報(bào)告
- 2024年微生物檢測(cè)試劑行業(yè)商業(yè)計(jì)劃書
- 高中英語選擇性必修一單詞表
- 物業(yè)公司介紹
- (正式版)SHT 3551-2024 石油化工儀表工程施工及驗(yàn)收規(guī)范
- JTGT H21-2011 公路橋梁技術(shù)狀況評(píng)定標(biāo)準(zhǔn)
- 【永輝超市公司員工招聘問題及優(yōu)化(12000字論文)】
- 中國(guó)直銷發(fā)展四個(gè)階段解析
- 2024屆浙江省寧波市鎮(zhèn)海區(qū)鎮(zhèn)海中學(xué)高一物理第一學(xué)期期末質(zhì)量檢測(cè)試題含解析
- 部編版語文四年級(jí)下冊(cè) 教材解讀
評(píng)論
0/150
提交評(píng)論