




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
-.z最大流算法發(fā)現(xiàn)web社團(tuán)改進(jìn)何擁軍龔發(fā)根摘要:提出了一種更好的分配邊容量的方法,即不是給每條邊分配一個(gè)一樣的常量值,而是為不同的邊依據(jù)信息的重要度來(lái)動(dòng)態(tài)的分配不同的邊值,較好的解決最大流算法發(fā)現(xiàn)web社團(tuán)中的主題漂移問(wèn)題。關(guān)鍵詞:web社團(tuán);超;最大流Thema*imal-flowdiscoversthewebmassorganizationalgorithmimprovementAbstract:Proposedsideonekindofbetterassignmentthecapacitymethod,namelyisnotassignsasameconstantvalueforeach,butisesthedynamicassignmentdifferentontheotherhandvaluefordifferentontheonehandbasedontheinformationimportance,thegoodsolutionma*imal-flowalgorithmdiscoversinthewebmassorganizationthesubjectdriftingquestion.1引言Web社團(tuán)是自Internet誕生以來(lái)就客觀存在的一些web群體,一個(gè)web社團(tuán)通常是這樣的一群頁(yè)面的集合:它們?cè)趦?nèi)容上一般都是圍繞*一主題,具有一定的相關(guān)性,或者具有*一相似特性[1]。一般的一個(gè)web社團(tuán)只是整個(gè)互聯(lián)網(wǎng)web圖中的一個(gè)非常小的子圖。如何去發(fā)現(xiàn)互聯(lián)網(wǎng)上這些潛在的web社團(tuán)也是近幾年來(lái)才引起眾多研究者關(guān)注的研究領(lǐng)域。在任一個(gè)圖中邊和節(jié)點(diǎn)都是很重要的元素,同樣在web圖當(dāng)中,代表超的邊也往往包含有一些非常重要的信息,如果能利用圖的理論知識(shí),通過(guò)web圖來(lái)研究web社團(tuán)將會(huì)有更好的效果,所以很多的研究工作關(guān)注通過(guò)web的超構(gòu)造關(guān)系來(lái)挖掘web社團(tuán)資源[2]。眾多的研究者提出了各種各樣的基于構(gòu)造分析發(fā)現(xiàn)web社團(tuán)的方法。Gibson和Kleinberg等人[3,4]提出了基于分析搜索算法HITS,Kumar等人[5]從二分有向圖的角度對(duì)互聯(lián)網(wǎng)上的社團(tuán)給出了一種明確的定義描述,把web社團(tuán)看作一些二分有向圖的核。Yasuhito[6]等人提出了通過(guò)交互站點(diǎn)的方法。文獻(xiàn)[7][8]最先提出通過(guò)最大流算法來(lái)發(fā)現(xiàn)web社團(tuán),文獻(xiàn)[9][10]從多方面對(duì)最大流算法進(jìn)展了實(shí)驗(yàn)及評(píng)價(jià)。2相關(guān)研究工作2.1最大流算法與最小割切網(wǎng)絡(luò)中的最大流算法具有廣泛的應(yīng)用,在這首先介紹一下在圖論中對(duì)S-T的最大流問(wèn)題的簡(jiǎn)化定義:給定一個(gè)網(wǎng)絡(luò)流圖,邊的容量為,兩個(gè)節(jié)點(diǎn),然后找出流經(jīng)源節(jié)點(diǎn)到沉積節(jié)點(diǎn)最大流量。直觀理解,假設(shè)邊為管道,節(jié)點(diǎn)為開(kāi)關(guān),則最大流問(wèn)題就是如何讓源節(jié)點(diǎn)S到沉積節(jié)點(diǎn)T能流過(guò)的流量最大。Ford和Fulkerson[11]已經(jīng)證明了“最大流-最小割切〞理論,即網(wǎng)絡(luò)流中最大流等于把到沉積節(jié)點(diǎn)別離的最小割切容量,等式如下:〔1〕其中為網(wǎng)絡(luò)流,為給切,假設(shè),其中為一個(gè)子集,,給定,則邊集就叫做S-T的一個(gè)割切,包含在割切中的邊叫做割邊,最小割切即滿足割邊的容量和為所有割邊中最小的一個(gè)割切。2.2web社團(tuán)這里引用文獻(xiàn)[9][10]里定義web社團(tuán)為:設(shè)為*些節(jié)點(diǎn)的集合,一個(gè)web社團(tuán)是其中的一個(gè)子集,滿足條件:對(duì)任何節(jié)點(diǎn),與屬于當(dāng)中節(jié)點(diǎn)之間連接的邊數(shù)大于它和以外節(jié)點(diǎn)之間連接的邊數(shù),即,如圖1所示圖1web社團(tuán)3最大流算法的特點(diǎn)及存在的問(wèn)題最大流算法應(yīng)用到web構(gòu)造中抽取社團(tuán)的思想最先是由G.Flake等人提出的,在文獻(xiàn)[9][10]里面G.Flake等人通過(guò)實(shí)驗(yàn)證明了最大流算法對(duì)于解決HITS算法在社團(tuán)抽取當(dāng)中存在的主題漂移問(wèn)題有較好的效果。下面重點(diǎn)探討該算法同時(shí)所存在的一些問(wèn)題并提出自己的解決方案。3.1社團(tuán)體積與邊的關(guān)系G.Flake等人在文獻(xiàn)[9][10]里對(duì)邊的容量與社團(tuán)體積之間的關(guān)系進(jìn)展了深入的研究,如以下圖所示。圖的橫坐標(biāo)表示邊容量的增加,縱坐標(biāo)表示隨之所獲得的社團(tuán)體積??梢钥闯?,隨著邊的容量的增加,社團(tuán)的體積也顯著加大,但這種變化是離散的,即分階段上升,而且不同階段的跳躍長(zhǎng)度并不相等。從以下圖來(lái)看,當(dāng)邊的容量從9到10,14到15,20到21這幾個(gè)階段每一次跳躍后,社團(tuán)的體積都急劇變大,社團(tuán)變化相應(yīng)的值為9到36,36到50,50到630。明顯看出邊的容量在20到21這個(gè)跳躍點(diǎn)社團(tuán)的體積增加最迅速。圖2邊的容量與社團(tuán)體積的關(guān)系3.2G.Flake算法存在的問(wèn)題及改進(jìn)算法的提出如前面所說(shuō),邊的容量對(duì)社團(tuán)的體積會(huì)產(chǎn)生很大的影響,不僅僅在數(shù)量上,而且還會(huì)影響到社團(tuán)成員的質(zhì)量。G.Flake最先提出把最大流算法用來(lái)抽取web社團(tuán),在文獻(xiàn)[9][10]里采用分配給各邊一個(gè)一樣的容量值,雖然可以較好的解HITS算法存在的主題漂移問(wèn)題,但對(duì)社團(tuán)的質(zhì)量和數(shù)量也會(huì)帶來(lái)許多不利的影響,而且隨著web圖節(jié)點(diǎn)的增加,噪音頁(yè)面相應(yīng)也會(huì)增加,僅僅通過(guò)增加邊的容量并不能很好的解決這些問(wèn)題,在很多情況下邊的容量提升得越大,主題漂移的問(wèn)題就會(huì)越易顯現(xiàn)出來(lái)。其主要的原因就是沒(méi)有考慮到每條邊的不同重要程度,把所有的邊一視**,表達(dá)不出不同邊的價(jià)值度對(duì)形成社團(tuán)的影響。為了更好的解決這些問(wèn)題,本文提出了一種更好的分配邊的容量的方法,即不是給每條邊分配一個(gè)一樣的常量值,而是依據(jù)信息的重要度為不同的邊分配不同的邊值。4改進(jìn)的最大流算法正如上節(jié)所說(shuō),一個(gè)理想的方法就是;重要的邊分配給一個(gè)更大的容量,不重要的邊分配給一個(gè)較小容量。則關(guān)鍵的問(wèn)題是如何定義一個(gè)重要邊和不重要邊,以及如何給不同重要程度的邊分配不同邊的容量,這就等于給邊定義一個(gè)等級(jí)或者分值一樣,所以必須把它對(duì)頁(yè)面的價(jià)值分布轉(zhuǎn)化到邊的價(jià)值分布上來(lái)。在web超分析里,PageRank算法和HITS算法是用來(lái)計(jì)算頁(yè)面分值和權(quán)威性的最典型的兩個(gè)算法[1],HITS算法是個(gè)不斷反復(fù)迭代的過(guò)程,迭代到一定次數(shù)就會(huì)很快收斂。因?yàn)镠ITS算法最終的計(jì)算結(jié)果是得到每個(gè)頁(yè)面的權(quán)威和HUB分值,在web圖中,邊所連接的兩個(gè)節(jié)點(diǎn)所對(duì)應(yīng)的web頁(yè)面都有它們的權(quán)威和HUB分值,自然可以認(rèn)為重要的邊所連接的應(yīng)該是分值比較大的節(jié)點(diǎn),依據(jù)這個(gè)思想來(lái)進(jìn)展邊容量分配,這就是本文算法的主要思想。4.1邊容量分配方法首先重新定義一個(gè)可變HUB分值和Authority分值變量如下:,〔2〕在HITS算法里得到的HUB和權(quán)威分值都是在這個(gè)*圍,不適合作為邊的容量,因?yàn)樽畲罅魉惴ɡ镞吶萘勘仨毷且粋€(gè)正整數(shù),所以通過(guò)設(shè)定一個(gè)常量系數(shù)來(lái)得到分值的另外一種形式,這里的取值一般是基于整個(gè)鄰接圖的平均連接數(shù),在本文后面的實(shí)驗(yàn)里設(shè)置=100。用來(lái)表示任一節(jié)點(diǎn)到子節(jié)點(diǎn)的距離,例如假設(shè)經(jīng)過(guò)兩條不重復(fù)的邊可以到達(dá)子節(jié)點(diǎn),則=2,接下來(lái)我們定義邊的容量為下面兩種形式:〔3〕〔4〕以上公式所得到的邊的容量是一個(gè)動(dòng)態(tài)的變量,不同邊的容量由它所連接的節(jié)點(diǎn)和所代表的頁(yè)面分值和來(lái)決定,應(yīng)用該方法的效果我們?cè)诤竺嬖儆懻?。下面我們給出基于以上邊容量分配方法的最大流算法抽取社團(tuán)的詳細(xì)步驟。4.2改進(jìn)的最大流算法下面給出基于HITS算法邊容量分配的最大流發(fā)現(xiàn)社團(tuán)的詳細(xì)步驟:Input:子節(jié)點(diǎn)集合Output:;(圍繞每一個(gè)子節(jié)點(diǎn),以深度2抽取一個(gè)web子圖)計(jì)算HUB和權(quán)威分值向量和按照前面的介紹的方法構(gòu)建鄰接圖應(yīng)用前面公式〔2〕設(shè)置邊的容量,,如果,則添加到,并設(shè)置邊的容量。執(zhí)行的最大流算法。獲得一個(gè)節(jié)點(diǎn)集合,其中每個(gè)節(jié)點(diǎn)要求和子節(jié)點(diǎn)連通,并對(duì)每一個(gè)節(jié)點(diǎn)都進(jìn)展分值計(jì)算〔在后面會(huì)介紹分值計(jì)算方法〕根據(jù)計(jì)算的分值排序,把前面一些分值最高的非子節(jié)點(diǎn)添加到子節(jié)點(diǎn)集合當(dāng)中。反復(fù)執(zhí)行步驟1到8直到中的節(jié)點(diǎn)趨于一個(gè)穩(wěn)定的社團(tuán)為止。按分值大小的順序輸出中社團(tuán)的節(jié)點(diǎn)從實(shí)驗(yàn)來(lái)看,中的節(jié)點(diǎn)通常很快就會(huì)趨于穩(wěn)定,因?yàn)殡m然子節(jié)點(diǎn)集合會(huì)不斷擴(kuò)展,但整個(gè)鄰接圖卻一般不會(huì)加大,即使擴(kuò)展也不會(huì)擴(kuò)展太大。本文采取了和文獻(xiàn)[7][8]里不同方法給中的成員節(jié)點(diǎn)計(jì)算分值。設(shè)表示從其它社團(tuán)節(jié)點(diǎn)到它的入數(shù),表示它的出數(shù)。用來(lái)表示節(jié)點(diǎn)的分值,則我們計(jì)算分值的公式如下:〔4〕在文獻(xiàn)[7]中計(jì)算分值僅僅以每個(gè)節(jié)點(diǎn)的數(shù)為依據(jù),因?yàn)橛行┡旁谇懊娣种递^高的節(jié)點(diǎn)會(huì)有一樣的數(shù)。但它們的權(quán)威和HUB分值也許并不一樣,所以僅僅以數(shù)來(lái)選擇最高分值的節(jié)點(diǎn)參加到子節(jié)點(diǎn)當(dāng)中去是不太好的。本文把每個(gè)節(jié)點(diǎn)的權(quán)威分值和HUB分值也考慮進(jìn)去了,所以防止了這種情況。5試驗(yàn)及其評(píng)價(jià)5.1試驗(yàn)數(shù)據(jù)的收集與清理數(shù)據(jù)集:由于web挖掘需要的數(shù)據(jù)集往往非常龐大,web社團(tuán)的挖掘需要更大數(shù)據(jù)資源才能表達(dá)算法的性能和優(yōu)越性,為了測(cè)試算法的效果和驗(yàn)證它的有效性,對(duì)不同的查詢主題和不同數(shù)據(jù)集分別進(jìn)展了實(shí)驗(yàn),數(shù)據(jù)量接近5G。種子節(jié)點(diǎn)集:一般每個(gè)社團(tuán)都有一個(gè)明確的主題,所以在抽取社團(tuán)前需要給定一個(gè)比較接近主題的URL頁(yè)面作為子節(jié)點(diǎn),為了更有代表性的說(shuō)明問(wèn)題,本文分別選擇了20個(gè)互不一樣的主題頁(yè)面作為子節(jié)點(diǎn),前十個(gè)選擇了以英文為關(guān)鍵字的查詢主題,后十個(gè)選擇了中文為關(guān)鍵字的查詢主題,每一個(gè)主題都具有明確的意義。表1中列出了各個(gè)子節(jié)點(diǎn)及其詳細(xì)的說(shuō)明數(shù)據(jù)清理:數(shù)據(jù)清理是為了更好的進(jìn)展數(shù)據(jù)挖掘以獲得高質(zhì)量的挖掘結(jié)果而做的準(zhǔn)備工作。算法在實(shí)驗(yàn)之前對(duì)獲得的粗燥數(shù)據(jù)集進(jìn)展了必要的數(shù)據(jù)清理,數(shù)據(jù)清理后我們就可以得到一個(gè)比較合理的鄰接web圖。在數(shù)據(jù)清理過(guò)程中主要做了一下幾個(gè)工:1首先排除了那些入或者出數(shù)超過(guò)了500以上的web頁(yè)面,因?yàn)檫@樣的一些頁(yè)面往往是非常知名的一些站點(diǎn)頁(yè)面,像,Google,等,這些站點(diǎn)頁(yè)面根本就不需要用戶使用什么挖掘策略去獲得的。2去除那些RUL里包含有關(guān)鍵詞%,.,bbs,cgi-bin,diary,news等的頁(yè)面,因?yàn)檫@樣的一些頁(yè)面往往和用戶要找的主題無(wú)關(guān)。還會(huì)產(chǎn)生更多的主題漂移問(wèn)題。3去除鏡像頁(yè)面,所謂的鏡像頁(yè)面是指與主的內(nèi)容一樣的其它位置的頁(yè)面就叫做鏡像頁(yè)面,太多的鏡像頁(yè)面只會(huì)重復(fù)同一個(gè)頁(yè)面內(nèi)容,擾亂用戶的視野,所以要盡可能事先去除。5.2實(shí)驗(yàn)及性能評(píng)價(jià)為了更好的說(shuō)明改進(jìn)方法的效果,本文對(duì)兩種方法的實(shí)驗(yàn)結(jié)果進(jìn)展了多方面的比較和分析。在下面的數(shù)據(jù)分析當(dāng)中分別用C1和C2表示兩種最大流算法所獲得的社團(tuán),C1表示本文改進(jìn)算法的結(jié)果,C2是Flake等人方法的結(jié)果。表1顯示了針對(duì)于每個(gè)子節(jié)點(diǎn)所獲得的web社團(tuán)的大致情況,包括子節(jié)點(diǎn),主題,web鄰接圖的節(jié)點(diǎn)數(shù)以及兩種方法所獲得的社團(tuán)成員數(shù)。其中|V|,|C1|,|C2|分別表示web鄰接圖的節(jié)點(diǎn)數(shù),改進(jìn)算法獲得的社團(tuán)成員數(shù)及原算法獲得社團(tuán)成員數(shù)。C2一豎排的第11,12,17個(gè)主題上面都標(biāo)有一個(gè)“*〞表示在這種情況下所獲得的社團(tuán)體積都是不合理的失敗情況。如表所示,改進(jìn)算法所獲得的社團(tuán)C1在總體上要明顯好于原來(lái)的算法結(jié)果,原來(lái)的算法雖然在*些情況下確實(shí)獲得了比較好的結(jié)果,但在另外一些情況下卻產(chǎn)生了非常壞的結(jié)果,比方在主題3,13,15,17這幾個(gè)情況下,雖然我們使用了多種固定邊容量進(jìn)展了實(shí)驗(yàn),但所獲得的結(jié)果還是不則理想。對(duì)兩種方法我們分別觀察了前10個(gè)和主題相關(guān)的最權(quán)威頁(yè)面情況,在以下圖3示意了結(jié)果大致情況,由圖所示可以看出C1和C2中平均的相關(guān)頁(yè)面數(shù)分別大約為6.25〔*圍分布大約從3到10〕和4.30〔*圍分布大約從1到7〕,C1的效果明顯好于C2。同時(shí)可以看出,在所選的20個(gè)主題中有14個(gè)情況C1比C2要好,4個(gè)情況是一樣的水平,只有2個(gè)情況是C1比C2差的。而且大多數(shù)包括在C2中的相關(guān)頁(yè)面也都包括在C1中了。表2詳細(xì)列舉了關(guān)于主題1社團(tuán)的前10個(gè)成員URL的具體情況,右邊的“+〞和“-〞分別用來(lái)表示該頁(yè)面和主題的相關(guān)與不相關(guān)性。種子頁(yè)面1是關(guān)于JAVA方面的內(nèi)容,表C1中所有的URL頁(yè)面都是和主題“JAVA〞要求非常接近的一些頁(yè)面,而在C2中除了種子頁(yè)面以外和主題接近的頁(yè)面數(shù)一共只有3個(gè),雖然它們有些也是關(guān)于JAVA的討論內(nèi)容,但往往不是和用戶最關(guān)心的JAVA開(kāi)發(fā),JAVA軟件,JAVA技術(shù)等方面內(nèi)容,比方“〞這個(gè)成員,而且仔細(xì)觀察就會(huì)發(fā)現(xiàn):C1中的成員頁(yè)面的HUB分值都高于C2中的HUB分值,也即它們之間的相互數(shù)大于C2中成員之間的相互數(shù)。表3詳細(xì)列舉了關(guān)于主題11的前10成員URL的具體情況,這是一個(gè)關(guān)于“**〞主題的社團(tuán)情況,如表所示,C1中雖然出現(xiàn)了一個(gè)不太理想的成員,且C2中和主體相關(guān)的成員數(shù)也明顯增加了,但總體上來(lái)看,C1比C2中的效果還是要好。圖3每一主題分值最前的10個(gè)頁(yè)面中和主題相關(guān)的社團(tuán)成員分布情況。其中下面橫排對(duì)應(yīng)的是20個(gè)主題,C1,C2所對(duì)應(yīng)的兩種方法的平均社團(tuán)成員頁(yè)面數(shù)分別為6.05和4.20表1。種子節(jié)點(diǎn)、社團(tuán)主題、鄰接圖體積及兩種方法發(fā)現(xiàn)的社團(tuán)相關(guān)情況結(jié)點(diǎn)編號(hào)種子節(jié)點(diǎn)URL主題|V||C||C2|1java.sun./JAVA88219182./*ML/*ML89815103.kdnuggets./Dataming727194*4.puterworld./puter667514125.coffeereview./Coffe45317136.weddingmanor./Wedding102347207walking.about./Walking104358138.kraftfoods./Foods297814189Starsand/Animalprotection1125311111health.people../**1420281212.yiliao../醫(yī)療2546421513travel.china./zh_/旅游857186*14.qiche../汽車3542421915.westudyenglish./英語(yǔ)學(xué)習(xí)795178*16military.china./zh_/世界軍事2456331417.ce./中國(guó)經(jīng)濟(jì)1045112*18../english/inde*.htm中國(guó)政治2046251719./考研1256191520.eol./教育20342411表2關(guān)于主題“JAVA〞:java.sun./的試驗(yàn)比照C1C21java.sun./+java.sun./+2.java-./+.javascript./+3ernet./+./~hall/java/-4.javaworld./+./+5./+-6.developer./java/+./javafaq/javatutorial.html-7.anfyteam./java/+.adtmag./-8.microsoft./mscorp/java/+webdeveloper.earthweb./webjs/-9.apple./macos*/features/java/+-10./+java.about./+表3第11個(gè)主題:**C1C21health.people../+.healthonline..tw/+2health.sohu./+./-3.jkb../+.jk99./-4health.china./+.*inhuanet./health/-5.medboo./+.people../GB/paper503/+6.fm120./-health.qianlong./+7health.eastday./+.tcmtoday./healthlib/-8.365jk./+.uhealthy./chinese/+9.cctv./health/inde*.shtml+./+10health.enorth../+./e21web/-6小結(jié)Web社團(tuán)是一種很自然的網(wǎng)絡(luò)群體,也是一種很重要的網(wǎng)絡(luò)資源,目前所有發(fā)現(xiàn)web社團(tuán)的方法都是基于構(gòu)造和web圖模型的思想,其中Fake等人提出的最大流算法是一種比較好的方法,相對(duì)于HITS算法中存在的嚴(yán)重主題漂移問(wèn)題有很大的改善,但由于采取的是固定邊容量的分配方法,對(duì)社團(tuán)的數(shù)量和質(zhì)量還是會(huì)產(chǎn)生諸多問(wèn)題。在這里,本文為發(fā)現(xiàn)網(wǎng)絡(luò)社團(tuán)的最大流算法提出了一種改進(jìn)方法。特別,提出了一個(gè)比較好的動(dòng)態(tài)分配邊容量的改進(jìn)最大流算法。為了驗(yàn)證改進(jìn)算法的效果,對(duì)算法進(jìn)展了實(shí)驗(yàn)比照,并列舉了實(shí)驗(yàn)結(jié)果里每個(gè)網(wǎng)絡(luò)社團(tuán)排名最前的10個(gè)節(jié)點(diǎn),通過(guò)大量的試驗(yàn)數(shù)據(jù)比照,顯示了改進(jìn)算法取得了較好的效果。當(dāng)然對(duì)web社團(tuán)發(fā)現(xiàn)研究還只是初步的開(kāi)場(chǎng),更多的工作需進(jìn)一步努力和改進(jìn),我們下一步的工作就是期望能開(kāi)發(fā)一個(gè)在線標(biāo)準(zhǔn)系統(tǒng),能夠根據(jù)參數(shù)的設(shè)置自動(dòng)發(fā)現(xiàn)更多更好的web社團(tuán)。參考文獻(xiàn)[1]王曉宇,周傲英.萬(wàn)維網(wǎng)的構(gòu)造分析及應(yīng)用綜述[J].軟件學(xué)報(bào),2003:14〔10〕[2]KumarR,RaghavanP,RajagopalanS,SivakumarD,TomkinsA,UpfalE.TheWebasagraph.In:SergeA,ed.Proceedingsofthe18thACMSIGACT-SIGMOD-SIGARTSymposiumonPrinciplesofDatabaseSystems.Pennsylvania:ACMPress,1999.109~118.[3]KleinbergJ.Authoritativesourcesinahyperlinkedenvironment.In:TarjanRE,etal.,eds.Proceedingsofthe9thACM-SIAMSymposiumonDiscreteAlgorithms.NewOrleans:ACMPress,1997.668~677.[4]GibsonD,KleinbergJ,RaghavanP.InferringWebmunitiesfromlinktopology.In:Proceedingsofthe9thACMConferenceonHyperte*tandHypermedia.Pittsburgh:ACMPress,1998.225~234.[5]P.KrishnaReddy,MasaruKitsuregawa.BuildingamunityhierarchyfortheWebbasedonbipartitegraphs.2002.3[6]YasuhitoAsano,HiroshiImai,MasashiToyoda,andMasaruKitsuregawa.FindingNeighbormunitiesintheWebusinganInter-siteGraph..Proceedingsofthe14thInternationalConferenceonDatabaseandE*pertSystemsApplications(DE*A2003),2003.9[7]G.Flake,S.Lawrence,andC.L.Giles.Efficientidentificationofwebmunities.In6thACMSIGKDDInternationalConferenceonKnowledgeDiscovery
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 提高公司財(cái)務(wù)團(tuán)隊(duì)服務(wù)水平的培訓(xùn)計(jì)劃
- 提升前臺(tái)溝通技巧的工作計(jì)劃
- 醫(yī)院財(cái)務(wù)管理優(yōu)化的策略與效果計(jì)劃
- 學(xué)習(xí)資源共享平臺(tái)建設(shè)計(jì)劃
- 《貴州創(chuàng)泰礦業(yè)有限公司修文縣龍場(chǎng)鎮(zhèn)高倉(cāng)老二洞鋁鐵礦山礦產(chǎn)資源綠色開(kāi)發(fā)利用方案(三合一)》專家組評(píng)審意見(jiàn)
- 第二單元課題2氧氣-教學(xué)設(shè)計(jì)-2024-2025學(xué)年九年級(jí)化學(xué)人教版上冊(cè)
- 2025年鎮(zhèn)江道路運(yùn)輸從業(yè)資格證模擬考試年新版
- 2025年湖州資格證模擬考試
- 2025年湖北貨車資格證考試題
- 2025年遼陽(yáng)貨運(yùn)從業(yè)資格證模擬考試下載題
- 核心素養(yǎng)導(dǎo)向下的高中歷史大單元教學(xué)設(shè)計(jì)研究課題設(shè)計(jì)論證
- 員工入職登記表
- 2024年新疆維吾爾自治區(qū)招聘事業(yè)單位工作人員考試真題
- 科技創(chuàng)新在環(huán)境保護(hù)中的重要作用研究報(bào)告
- 2025年濟(jì)源職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)學(xué)生專用
- 《金融市場(chǎng)分析方法》課件
- 卵巢癌的篩查:如何進(jìn)行卵巢癌的早期篩查
- 2025年南網(wǎng)數(shù)字集團(tuán)公開(kāi)選聘高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 5G基站建設(shè)的審批流程與標(biāo)準(zhǔn)
- 西門子S7-1200 PLC應(yīng)用技術(shù)項(xiàng)目教程(第3版) 考試復(fù)習(xí)題
- 人工智能在招聘行業(yè)的應(yīng)用
評(píng)論
0/150
提交評(píng)論