![超圖理論與應(yīng)用_第1頁(yè)](http://file4.renrendoc.com/view/255a5fc2da7d6d1acaff3e1e3e09bfb5/255a5fc2da7d6d1acaff3e1e3e09bfb51.gif)
![超圖理論與應(yīng)用_第2頁(yè)](http://file4.renrendoc.com/view/255a5fc2da7d6d1acaff3e1e3e09bfb5/255a5fc2da7d6d1acaff3e1e3e09bfb52.gif)
![超圖理論與應(yīng)用_第3頁(yè)](http://file4.renrendoc.com/view/255a5fc2da7d6d1acaff3e1e3e09bfb5/255a5fc2da7d6d1acaff3e1e3e09bfb53.gif)
![超圖理論與應(yīng)用_第4頁(yè)](http://file4.renrendoc.com/view/255a5fc2da7d6d1acaff3e1e3e09bfb5/255a5fc2da7d6d1acaff3e1e3e09bfb54.gif)
![超圖理論與應(yīng)用_第5頁(yè)](http://file4.renrendoc.com/view/255a5fc2da7d6d1acaff3e1e3e09bfb5/255a5fc2da7d6d1acaff3e1e3e09bfb55.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
超圖理論與應(yīng)用第1頁(yè),共38頁(yè),2023年,2月20日,星期二動(dòng)機(jī)(Motivation)什么是共指消解(CoreferenceResolution)共指消解的各種方法圖分割(GraphPartitioning)方法簡(jiǎn)單圖分割方法的潛在缺陷引入超圖(Hypergraph)的意義第2頁(yè),共38頁(yè),2023年,2月20日,星期二超圖(Hypergraph)超圖的定義超圖的分割超圖真比簡(jiǎn)單圖優(yōu)越嗎?如何將超圖運(yùn)用到共指消解中第3頁(yè),共38頁(yè),2023年,2月20日,星期二什么是共指消解[李明i]怕[高媽媽j]一人呆在家里寂寞,[他i]便將[他自己i]家里的電視搬了過(guò)來(lái)給[她j]。第4頁(yè),共38頁(yè),2023年,2月20日,星期二共指消解的方法規(guī)則方法利用句法層面的知識(shí),進(jìn)行啟發(fā)式消解。統(tǒng)計(jì)方法基于訓(xùn)練語(yǔ)料庫(kù),統(tǒng)計(jì)出概率分布,然后進(jìn)行預(yù)測(cè)。機(jī)器學(xué)習(xí)決策樹(shù)、樸素貝葉斯、規(guī)則學(xué)習(xí)等等。圖方法以節(jié)點(diǎn)表示名詞短語(yǔ),以邊表示名詞短語(yǔ)間的共指關(guān)聯(lián)度。第5頁(yè),共38頁(yè),2023年,2月20日,星期二圖方法節(jié)點(diǎn)表示名詞短語(yǔ)邊表示短語(yǔ)與短語(yǔ)之間的某種關(guān)聯(lián)(這種關(guān)聯(lián)必須要對(duì)“共指”起到貢獻(xiàn),如人稱(chēng)、性別、單復(fù)數(shù)等屬性)邊的權(quán)值用來(lái)表示這種關(guān)聯(lián)對(duì)共指起到的貢獻(xiàn)的大小第6頁(yè),共38頁(yè),2023年,2月20日,星期二簡(jiǎn)單圖一條邊只能連接兩個(gè)頂點(diǎn)第7頁(yè),共38頁(yè),2023年,2月20日,星期二超圖一條邊可以連接多個(gè)頂點(diǎn)第8頁(yè),共38頁(yè),2023年,2月20日,星期二為什么引入超圖(一個(gè)例子)簡(jiǎn)單圖版本丟失了“同一作者的多篇文章”這一信息,而超圖版本則保存了這一信息。在共指消解里面,也有類(lèi)似的信息,比如“多個(gè)指代的性別(gender)相同”、“多個(gè)指代的數(shù)量相同”(即同為單數(shù)或同為復(fù)數(shù))等。頂點(diǎn)代表文章,每條邊代表兩個(gè)頂點(diǎn)(文章)享有同一個(gè)作者第9頁(yè),共38頁(yè),2023年,2月20日,星期二為什么引入超圖(一個(gè)例子)假設(shè)有三篇文章,v1,v2,v3。它們的作者分別是:v1:A,Bv2:B,Cv3:C,D如果v1:A,Bv2:A,Cv3:A,D第10頁(yè),共38頁(yè),2023年,2月20日,星期二簡(jiǎn)單圖的分割目標(biāo):使分割出來(lái)的兩個(gè)子圖之間的關(guān)聯(lián)最小
問(wèn)題:如何定義“關(guān)聯(lián)最小”?第11頁(yè),共38頁(yè),2023年,2月20日,星期二簡(jiǎn)單圖分割的數(shù)學(xué)表達(dá)分割子圖間關(guān)聯(lián)最小
=跨分割邊界的所有邊的權(quán)值之和最小鄰接矩陣(AdjacencyMatrix)A(i,j)=頂點(diǎn)i和頂點(diǎn)j之間的所有邊的權(quán)值之和MinCut(G+,G-),根據(jù)二次型表達(dá)式等價(jià)于:MaxYYTAY,其中Yi∈{+1,-1};第12頁(yè),共38頁(yè),2023年,2月20日,星期二簡(jiǎn)單圖分割的問(wèn)題問(wèn)題:導(dǎo)致退化的分割第13頁(yè),共38頁(yè),2023年,2月20日,星期二Normalized-Cut僅僅做到跨邊界的權(quán)值和最小還不夠,因?yàn)榭赡艽嬖谝恍┕铝Ⅻc(diǎn),它們跟外界的聯(lián)系本身就極小,于是很可能被獨(dú)立分割出來(lái)。第14頁(yè),共38頁(yè),2023年,2月20日,星期二Normalized-Cut解決思想:一個(gè)cut是“好的”當(dāng)且僅當(dāng)對(duì)任意一個(gè)子圖來(lái)說(shuō),從子圖中的節(jié)點(diǎn)出發(fā)跨越分割邊界的邊的權(quán)值和相比于從子圖節(jié)點(diǎn)出發(fā)的所有邊的權(quán)值和的比例越小越好。通俗來(lái)說(shuō)就是:任一分割出來(lái)的子圖跟外界的聯(lián)系主要來(lái)自該子圖內(nèi)部。第15頁(yè),共38頁(yè),2023年,2月20日,星期二Normalized-CutNP-Hard第16頁(yè),共38頁(yè),2023年,2月20日,星期二拉普拉斯矩陣(LaplacianMatrix)第17頁(yè),共38頁(yè),2023年,2月20日,星期二譜(Spectrum)方法NP-Hard譜方法逼近解minz(ZTLZ/ZTZ)其中Zi∈{r+,r-};r+=√|{i:zi<0}|/|{i:zi>0}|r-=√|{i:zi>0}|/|{i:zi<0}|不變式:ZTZ=n;ZT1=0;含義:L是拉普拉斯矩陣L=B–A第18頁(yè),共38頁(yè),2023年,2月20日,星期二
超圖理論的目標(biāo)
將簡(jiǎn)單圖的表達(dá)泛化為超圖表達(dá),將簡(jiǎn)單圖分割算法推廣到超圖分割之上,并證明超圖分割和簡(jiǎn)單圖分割的內(nèi)在標(biāo)準(zhǔn)(criteria)是一致的第19頁(yè),共38頁(yè),2023年,2月20日,星期二超圖的表示關(guān)鍵是超邊如何表示:用一個(gè)點(diǎn)集來(lái)表示。令V是一個(gè)頂點(diǎn)集合V={v1,v2,v3,v4,v5,v6,v7};則每一條超邊都是V的一個(gè)子集E={e1,e2,e3,e4}={{v1,v2,v3},{v2,v3},{v3,v5,v6},{v4}}第20頁(yè),共38頁(yè),2023年,2月20日,星期二
超圖的矩陣表達(dá)頂點(diǎn)的度d(v)超邊的度超圖的矩陣表達(dá)第21頁(yè),共38頁(yè),2023年,2月20日,星期二
超圖的鄰接矩陣其中W是一對(duì)角陣,對(duì)角線元素為各超邊的權(quán)值。A是超圖的鄰接矩陣按右邊方法表示的A(超圖的鄰接矩陣),A(i,i)為0,A(i,j)為vi和vj共享的所有超邊的權(quán)值和。Dv為一對(duì)角陣,對(duì)角線元素為各頂點(diǎn)的度d(v)。第22頁(yè),共38頁(yè),2023年,2月20日,星期二
超圖的分割(cut)如何將簡(jiǎn)單圖的分割標(biāo)準(zhǔn)推廣到超圖上面?第23頁(yè),共38頁(yè),2023年,2月20日,星期二
理解超圖cut的含義將被切割的每一條超邊看作一個(gè)子圖,其中每?jī)蓚€(gè)頂點(diǎn)都是兩兩相連的,連接的權(quán)值皆為w(e)/(e的度)。該子圖被切割為e∩G+和e∩G-個(gè)頂點(diǎn),因此被切斷的邊一共有|e∩G+||e∩G-|個(gè)。第24頁(yè),共38頁(yè),2023年,2月20日,星期二
超圖的Normalized-Cut超圖和簡(jiǎn)單圖的Normailzed-cut是形式一致的第25頁(yè),共38頁(yè),2023年,2月20日,星期二
超圖的Normailzed-Cut第26頁(yè),共38頁(yè),2023年,2月20日,星期二隨機(jī)游走(RandomWalk)第27頁(yè),共38頁(yè),2023年,2月20日,星期二超圖分割的隨機(jī)游走解釋意義:證明超圖分割的確是簡(jiǎn)單圖分割的一個(gè)妥善的推廣,這對(duì)超圖分割算法的有效性至關(guān)重要。圖分割的隨機(jī)游走解釋?zhuān)阂粋€(gè)最優(yōu)分割須使得隨機(jī)游走落在同一個(gè)子圖中的概率最大,同時(shí)隨機(jī)游走跨越分割邊界的幾率最小。目標(biāo):證明超圖分割也滿足同樣的隨機(jī)游走性質(zhì)。第28頁(yè),共38頁(yè),2023年,2月20日,星期二什么是隨機(jī)游走(RandomWalk)
GooglePagerank算法第29頁(yè),共38頁(yè),2023年,2月20日,星期二GooglePagerank算法基本模型:用一個(gè)向量I來(lái)代表所有頁(yè)面的重要性,I的第i個(gè)分量Ii就是第i個(gè)頁(yè)面的重要性;另,假設(shè)一個(gè)頁(yè)面有l(wèi)j個(gè)向其它頁(yè)面的鏈接,那么每個(gè)被指向的頁(yè)面都得到該頁(yè)面的1/lj的重要性;同時(shí)假設(shè)一個(gè)頁(yè)面的重要性完全來(lái)自指向它的頁(yè)面的貢獻(xiàn)數(shù)學(xué)表達(dá):其中Pj表示第j個(gè)頁(yè)面。lj表示第j個(gè)頁(yè)面上的鏈接數(shù),Pj∈Bi表示第j個(gè)頁(yè)面指向Pi。這么多頁(yè)面,它們互相之間都有一堆鏈接,我怎么知道一個(gè)特定的頁(yè)面的重要性是多少呢?第30頁(yè),共38頁(yè),2023年,2月20日,星期二GooglePageRank算法第31頁(yè),共38頁(yè),2023年,2月20日,星期二GooglePagerank算法如何計(jì)算I=HI中的I?(I是H的一個(gè)特征向量,對(duì)應(yīng)特征值為1)迭代法:Ik+1=HIk第32頁(yè),共38頁(yè),2023年,2月20日,星期二GooglePagerank算法第33頁(yè),共38頁(yè),2023年,2月20日,星期二GooglePagerank算法問(wèn)題:鏈接黑洞(只進(jìn)不出)第34頁(yè),共38頁(yè),2023年,2月20日,星期二GooglePagerank算法解決:隨機(jī)游走(RandomWalk)理論假設(shè)你是一個(gè)網(wǎng)絡(luò)爬蟲(chóng),在網(wǎng)絡(luò)上跟著頁(yè)面鏈接隨機(jī)的游走。那么,當(dāng)你發(fā)現(xiàn)自己停在一個(gè)頁(yè)面Pj上,而Pj共有l(wèi)j個(gè)鏈接,其中一個(gè)指向Pi,那么你下一步游走到Pi的幾率就是1/lj。在你隨機(jī)游走的整個(gè)過(guò)程中,假設(shè)你停留在Pj上的時(shí)間是Tj,那么你停留在Pi上的時(shí)間就是:隨機(jī)游走模型跟頁(yè)面重要性模型是一致的隨機(jī)游走模型跟頁(yè)面重要性模型是一致的第35頁(yè),共38頁(yè),2023年,2月20日,星期二GooglePagerank算法隨機(jī)游走到頁(yè)面2(一個(gè)鏈接黑洞)的時(shí)候,盡管沒(méi)有鏈接,但我們可以假設(shè)下一
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年高中歷史 第一單元 古代中國(guó)經(jīng)濟(jì)的基本結(jié)構(gòu)與特點(diǎn) 第1課 發(fā)達(dá)的古代農(nóng)業(yè)新課說(shuō)課稿1 新人教版必修2
- Unit 4 There are seven days in a week. Lesson 19(說(shuō)課稿)-2023-2024學(xué)年人教精通版英語(yǔ)四年級(jí)下冊(cè)
- Unit 1 Teenage Life Listening and Speaking 說(shuō)課稿 -2024-2025學(xué)年高中英語(yǔ)人教版2019 必修第一冊(cè)001
- 2024年春七年級(jí)語(yǔ)文下冊(cè) 第3單元 10 老王說(shuō)課稿 新人教版
- Unit 5 Working the Land Reading and thinking 說(shuō)課稿-2024-2025學(xué)年高二英語(yǔ)人教版(2019)選擇性必修第一冊(cè)
- 農(nóng)田整改合同范本
- 作品出版合同范例
- 鄭州水泥化糞池施工方案
- 關(guān)于活動(dòng)執(zhí)行合同范本
- 加盟區(qū)域保護(hù)合同范例
- 測(cè)繪工程產(chǎn)品價(jià)格表匯編
- 拘留所教育課件02
- 語(yǔ)言和語(yǔ)言學(xué)課件
- 《工作場(chǎng)所安全使用化學(xué)品規(guī)定》
- 裝飾圖案設(shè)計(jì)-裝飾圖案的形式課件
- 2022年菏澤醫(yī)學(xué)專(zhuān)科學(xué)校單招綜合素質(zhì)考試筆試試題及答案解析
- 護(hù)理學(xué)基礎(chǔ)教案導(dǎo)尿術(shù)catheterization
- ICU護(hù)理工作流程
- 廣東版高中信息技術(shù)教案(全套)
- 市政工程設(shè)施養(yǎng)護(hù)維修估算指標(biāo)
- 分布式光伏屋頂調(diào)查表
評(píng)論
0/150
提交評(píng)論