




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、PAGE PAGE 17超鏈接環(huán)境(hunjng)下的權(quán)威資源(zyun)1 引言(ynyn)超鏈接的網(wǎng)絡(luò)結(jié)構(gòu)是一個(gè)有豐富資源的環(huán)境內(nèi)容信息,它提供給我們一個(gè)有效的方法讓我們?nèi)ダ斫馑?。在這種情況下,我們針對這種環(huán)境下的鏈接結(jié)構(gòu)開發(fā)了一系列的算法工具從中分離信息,并通過在試驗(yàn)中報(bào)告和說明它們在萬維網(wǎng)中的多種多樣內(nèi)容中的有效作用。我們尤其關(guān)注它在一個(gè)廣闊的搜索主題中分析和搜集相關(guān)網(wǎng)頁以及發(fā)現(xiàn)最權(quán)威網(wǎng)頁時(shí)鏈接的使用。對于萬維網(wǎng),當(dāng)我們不缺乏技術(shù)的時(shí)候,我們發(fā)現(xiàn)搜索和結(jié)構(gòu)分析的問題在區(qū)域上下文中尤其重要。萬維網(wǎng)是一個(gè)巨大而復(fù)雜的超文本資料庫,它同時(shí)在以驚人的速度持續(xù)擴(kuò)展著。更甚者,它可以看做一個(gè)錯(cuò)綜復(fù)
2、雜的超媒體結(jié)構(gòu)。它同時(shí)有數(shù)以百萬計(jì)的在線參與者,這些參與者們有著多種多樣互相沖突的目標(biāo),同時(shí)他們還在不斷的創(chuàng)造超鏈接內(nèi)容。所以,當(dāng)每個(gè)人都在以一種極端的本地層次強(qiáng)制整理信息時(shí),全局的組織已經(jīng)完全的改變了上層的結(jié)構(gòu)只能通過之后的分析才能浮現(xiàn)出來。我們的工作就是源于萬維網(wǎng)上的搜索問題。我們可以粗糙的定義為一個(gè)過程給出查詢,提供相關(guān)的網(wǎng)頁。由于相關(guān)性是主觀存在的,所以搜索方法的質(zhì)量需要人類來評估。我們是從觀察萬維網(wǎng)上提高搜索方法的質(zhì)量開始的。在現(xiàn)階段,一個(gè)豐富而有趣的問題是在很多方式中,它們算法的有效性和存儲性是互不相關(guān)的。尤其是現(xiàn)在的搜索引擎都是典型的只搜索萬維網(wǎng)上的一定大小的內(nèi)容的搜索引擎,同時(shí)
3、響應(yīng)還是秒級別的。盡管可以提高響應(yīng)時(shí)間來換取對于用戶來說更重要的結(jié)果,但是對于搜索工具來說,用額外的時(shí)間來進(jìn)行計(jì)算,這是非常不可行的。準(zhǔn)確的說,我們?nèi)狈σ环N具體定義的功能,這種功能客觀上應(yīng)滿足我們想要搜索到的頁面的質(zhì)量。查詢和權(quán)威資源。我們認(rèn)為搜索是開始于用戶提供的查詢的。它不需要查詢的統(tǒng)一概念性的視圖;且它不止是一種查詢,它需要運(yùn)用不同的技術(shù)來處理。思考一下,比如說,有下面幾種查詢:特定查詢,如“網(wǎng)景是否支持JDK 1.1代碼簽名的API(應(yīng)用程序接口)?”廣泛主題(zht)查詢,如“找到關(guān)于(guny)JAVA編程語言的信息”相似(xin s)頁面查詢,如“找到與相似的頁面”我們現(xiàn)在專注前
4、兩種類型的查詢,我們可以看到它們現(xiàn)在又很多不同種類的障礙。處理特定查詢時(shí)的困難是集中的,粗略地說,是圍繞所說的稀缺問題的。有極少的頁面包含這些所需的信息,并且通常很難確定這些頁面的真正來源。對于廣泛主題查詢,另一方面,我們期待在萬維網(wǎng)上找到數(shù)以千計(jì)的相關(guān)頁面。這樣的一組頁面可能通過標(biāo)引項(xiàng)匹配(如輸入一個(gè)字符串“Gates”,“search engines”,“censorship”到搜索引擎AltaVista17),或者更復(fù)雜的方式產(chǎn)生。因此,這并不是一個(gè)稀缺問題,相反,其基本困難在于豐度問題:可以作為相關(guān)頁面合理地返回的頁面數(shù)目太大,以至于人們很難消化。在這些條件下,為了提供有效的搜索方法,
5、就需要一種方法,從巨大的相關(guān)網(wǎng)頁集合中篩選出最“權(quán)威”或“徹底”的那些。我們對于廣泛主題的查詢,可以將權(quán)威這一概念,作為我們工作中的中心焦點(diǎn)。我們在處理這一問題所面臨的基本障礙之一是準(zhǔn)確地模型化在特定的查詢主題上下文中的權(quán)威網(wǎng)頁。鑒于某一網(wǎng)頁,我們?nèi)绾伪鎰e其權(quán)威?討論一些在這里出現(xiàn)的復(fù)雜難懂的問題是很有用的。首先,考慮報(bào)告的自然目標(biāo),即哈佛大學(xué)主頁為查詢“哈佛”的最權(quán)威頁面之一。不幸的是,在萬維網(wǎng)上有超過 100 萬的網(wǎng)頁使用了目標(biāo)詞 “Harvard”。同時(shí) 不是最常使用的,或者使用最突出的,或者以任何其他方式支持一種基于文本的排序函數(shù)。事實(shí)上,一個(gè)疑問是,是否存在一個(gè)純粹的內(nèi)源性措施去適當(dāng)
6、地評估一個(gè)頁面的權(quán)威。第二個(gè)問題是找到主要的www 搜索引擎的主頁。我們可以從查詢“搜索引擎”開始,但是這存在一個(gè)困難,事實(shí)上很多權(quán)威網(wǎng)站(雅虎,Excite,AltaVista) 都沒有在其頁面上使用這個(gè)詞。這是一個(gè)基本的和重復(fù)出現(xiàn)的現(xiàn)象 另一個(gè)例子,我們就沒有理由指望本田或豐田的主頁包含術(shù)語“汽車制造商”。鏈接結(jié)構(gòu)分析。萬維網(wǎng)的網(wǎng)頁之間的超鏈接結(jié)構(gòu)分析,給了我們一個(gè)方式來處理許多上文討論過的困難。超鏈接隱含了大量潛在的人為判斷,我們認(rèn)為這種類型的判斷正是我們制定一個(gè)權(quán)威的概念所需要的。具體來說,萬維網(wǎng)上鏈接的建立是以下判斷類型的具體表現(xiàn):頁 p,通過包括頁面 q的鏈接,就可以在在某種程度上
7、賦予 頁面q 的權(quán)威性。此外,鏈接通過指向它們頁面,讓我們完全有機(jī)會找到潛在的權(quán)威性的東西 ;針對很多突出的頁面沒有充足地自我描述的網(wǎng)頁,這種方式圍繞著以上的問題提供了一種方法。當(dāng)然(dngrn),這種情況下,有大量的鏈接(lin ji)的應(yīng)用程序(chngx)中有很多的潛在缺陷。首先,針對各種各樣的原因創(chuàng)建的鏈接,其中有很多與權(quán)威性無關(guān)。例如,主要用于導(dǎo)航目的而創(chuàng)建大量的鏈接( “點(diǎn)擊此處返回到主菜單”) ;其他表示的付費(fèi)的廣告。另一個(gè)問題是很難找到相關(guān)性和流行性標(biāo)準(zhǔn)之間的適當(dāng)?shù)钠胶猓@兩個(gè)都有助于權(quán)威這個(gè)直覺概念的判斷。這對在下面這個(gè)簡單的啟發(fā)式算法定位權(quán)威頁面所固有的嚴(yán)重問題的思考具有
8、指導(dǎo)性作用:包含查詢字符串的所有頁,都返回導(dǎo)入鏈接的最大數(shù)目。我們之前已經(jīng)討論的許多查詢 (搜索引擎、汽車制造商,),其中的一些查詢的最權(quán)威頁面不包含相關(guān)的查詢字符串。反之,這啟發(fā)式算法會考慮普遍受歡迎的網(wǎng)頁,如 或 所包含的任何查詢字符串,它極具權(quán)威性。在這項(xiàng)工作中,我們針對權(quán)威的授予,提出了一個(gè)基于鏈接的模型,并提出它是如何統(tǒng)一標(biāo)識與廣泛搜索主題相關(guān)的、 權(quán)威的 www 頁面的方法。我們的模型基于權(quán)威性的主題與這些權(quán)威性頁面所鏈接到的許多有關(guān)權(quán)威性頁面之間所存在的關(guān)系我們把后面的這一種類型的頁面叫做樞紐。我們觀察到樞紐和由鏈接結(jié)構(gòu)定義在圖中權(quán)值之間存在的某種自然的平衡,我們利用這一點(diǎn)開發(fā)算
9、法,能同時(shí)識別兩種類型的頁面。這種算法操作于我們構(gòu)建的基于文本的 www 搜索引擎輸出中的子圖 ;我們構(gòu)建這些子圖的技術(shù)是設(shè)計(jì)產(chǎn)生一個(gè)小的可能包含一個(gè)給定的主題最權(quán)威頁面集合。概述(i sh)。我們(w men)發(fā)現(xiàn)權(quán)威萬維網(wǎng)資源(zyun)的方法必須要具有全球性質(zhì): 我們希望確定萬維網(wǎng)中廣泛搜索主題的最中央頁作為一個(gè)整體。全局辦法涉及到了表示和過濾大容量的信息的基本問題,因?yàn)樗械呐c主題有關(guān)的廣泛主題查詢的頁面有數(shù)以百萬計(jì)。這與查詢本地的方法不同,理解萬維網(wǎng)中的頁面的相互連接屬于單個(gè)邏輯站點(diǎn)或內(nèi)聯(lián)網(wǎng); 在這種情況下,本地方法數(shù)據(jù)量小得多,經(jīng)??紤]不同組的主導(dǎo)地位。注意到我們主要關(guān)心的這個(gè)是一
10、個(gè)從根本上與聚類問題不同的問題也是很重要的。聚類問題剖析了異構(gòu)遷入子圖,在某種程度上這更有凝聚力 ;在萬維網(wǎng)的背景下,這可能涉及到要區(qū)分不同含義或感覺的被查詢詞相關(guān)的網(wǎng)頁。因此,聚類的本質(zhì)上是不同于那些通過權(quán)威性而發(fā)現(xiàn)提取出廣泛主題的問題,雖然后面的部分將表明某些聯(lián)系。即使我們完全能夠分析含糊不清的查詢詞 (如Windows或Gates) 的多個(gè)意義,我們將仍然留下一個(gè)潛在問題,那就是表示和過濾掉與每個(gè)查詢詞主要意思相關(guān)的大量頁面。本文的結(jié)構(gòu)如下。第二部分討論的是通過廣泛主題搜索來構(gòu)建萬維網(wǎng)上的子圖從而產(chǎn)生一系列豐富而理想的相關(guān)權(quán)威頁面的方法。第三部分和第四部分討論在這樣的一個(gè)子圖上識別樞紐和
11、權(quán)威性的資源的主要算法,以及該算法的一些應(yīng)用。第五部分討論萬維網(wǎng)的搜索、 文獻(xiàn)計(jì)量學(xué),和社會網(wǎng)絡(luò)研究領(lǐng)域的相關(guān)工作和聯(lián)系。第六部分描述了如何擴(kuò)展我們基本的算法,進(jìn)而去搜集多個(gè)樞紐頁面和相同鏈接結(jié)構(gòu)內(nèi)的權(quán)威頁面。最后,第七部分研究為了讓我們的技術(shù)更有效,我們應(yīng)該如何定義所搜索的主題的“廣泛性”。第八部分針對在這里提出的方法的調(diào)查工作,我們進(jìn)行了一些評價(jià)的問題。2 萬維網(wǎng)中構(gòu)造一個(gè)集中性的子圖我們可以將任何集合 V 的超鏈接的頁面作為一個(gè)有向圖 G = (V ;E): 節(jié)點(diǎn)對應(yīng)于頁面,一個(gè)有向的邊 (p,q) E 表示的從 p 到 q 的一個(gè)鏈接。我們知道一個(gè)節(jié)點(diǎn) p 出度是其所鏈接到其他的節(jié)點(diǎn)的
12、數(shù)目。而 p 的入度是其它的節(jié)點(diǎn)鏈接到P的數(shù)目。在一個(gè)圖 G中,我們可以通過以下方式隔離小區(qū)域或子圖。假設(shè)W V是一些頁面的子集,我們使用 G W 來表示圖中的W: 其節(jié)點(diǎn)是在W中的頁面,且它的邊對應(yīng)于 W.在頁面之間的所有鏈接。假設(shè)(jish)我們針對字符串進(jìn)行(jnxng)廣泛主題查詢。我們希望通過鏈接結(jié)構(gòu)的分析找到權(quán)威性高的頁面(y min);但首先我們應(yīng)該找到我們算法所操作的在萬維網(wǎng)中的那個(gè)子圖。在這里我們主要是關(guān)注在相關(guān)頁面上的計(jì)算量。因此,在這里我們舉個(gè)例子,我們可以將分析限制在集合Q(),此處Q()是包含所查詢字符串的所有頁面,但這有兩個(gè)明顯的弊端。首先,這個(gè)集合可能會包含超過百
13、萬的頁面,因此需要大量的計(jì)算成本;第二,我們發(fā)現(xiàn)部分或大部分最適合主題的資源可能不屬于這一集合。理想情況下,我們關(guān)注于具有以下屬性的頁面的集合S()。( = 1 * ROMAN I)S()相對小。( = 2 * ROMAN II)S()是具有很多相關(guān)的頁面。( = 3 * ROMAN III)S() 包含大部分 (或許多) 最權(quán)威的資源。通過保持集合 S() 小,我們就能夠負(fù)擔(dān)得起應(yīng)用非平凡算法的計(jì)算開銷 ; 通過確保S()具有很多相關(guān)的頁面,我們能容易找到好的權(quán)威資源,因?yàn)檫@些頁面很可能需要大量引用。我們怎樣才能找到這樣的一個(gè)集合呢?對于參數(shù)t(通常設(shè)置其值為200),我們首先從一個(gè)基于文本
14、的搜索引擎 AltaVista 17 或Hotbot 57 搜索查詢字符串 ,并從中收集 t 個(gè)排名最高的頁面。我們將這t個(gè)頁面作為根集合R()。根集合滿足前面所需要的()和()兩條性質(zhì)。但它一般是不滿足 (iii)的。我們看一下這個(gè),最上層的 t個(gè) 頁面由我們使用的基于文本的搜索引擎所返回返回的,它們包含所查詢的字符串 。因此 R() 顯然是集合Q()的子集,且Q()是所有包含的頁面。我們爭論的是 Q() 往往不滿足條件 (iii)。它觀察在 Q()也是很有趣的,R()頁面之間通常鏈接是極少的,這通常是無結(jié)構(gòu)的。例如,在我們的實(shí)驗(yàn)中,查詢詞java的根集在不同域中的頁面之間包含15個(gè)鏈接;查
15、詢詞 censorship 的根集在不同域中的頁面之間包含28個(gè)鏈接. 這些數(shù)字都是典型的多種查詢嘗試 ;他們應(yīng)與根集頁面之間存在的200*199 = 39800個(gè)潛在鏈接進(jìn)行比較。然而,我們可以(ky)使用根集 S(),來產(chǎn)生(chnshng)一組頁面集合(jh)S(),它將滿足我們一直在尋找的那些條件??紤]針對查詢主題,那些強(qiáng)有力的權(quán)威資源盡管它不在集合 R(),但是很可能會在 R() 所指向的鏈接中的至少一個(gè)頁面中。因此,我們可以通過擴(kuò)大 R() ,在子圖中增加權(quán)威資源的權(quán)值,并沿著鏈接,進(jìn)入和離開它。具體而言,我們定義了下面的過程。即:對于(duy)子圖(,E,t,d): 所查詢(ch
16、xn)字符串.E : 基于(jy)文本的搜索引擎T, d : 自然數(shù)R():針對字符串,搜索引擎E的結(jié)果中的前t 個(gè)排名最高的頁面使 S():= R()對于每個(gè)頁面 p ()使T+(p) 表示p指向的所有的頁面使T(p) 指向p的所有頁面將T+(p)中的所有頁面添加到 S()中如果T(p)的絕對值 d 則:將T(p)中的所有(suyu)頁面添加到 S()中.否則(fuz)從T(p)中添加(tin ji)d個(gè)頁面中到 S()中.結(jié)束返回S()因此,我們通過與日俱增的 R(),獲得 S()。其中包括了R()中的一個(gè)頁面所指向的任意頁面,以及其他指向R()的任意頁面。限制條件是我們允許R()中單個(gè)頁
17、面所指向的最多d個(gè)頁面加入到 S()中。后一點(diǎn)至關(guān)重要,因?yàn)橐恍┤f維網(wǎng)上的的網(wǎng)頁由數(shù)十萬個(gè)頁面指向它,但如果我們想要保持S()相對小,S() 中就不能完全包括所有的這些頁面。我們提到了 S() 是 的基本集合 ;在我們的實(shí)驗(yàn)中,我們通過在搜索引擎 AltaVista中調(diào)用子圖過程,設(shè)置t = 200 和 d = 50來構(gòu)建它。我們發(fā)現(xiàn)S()通常滿足上面多提到的(),()和()它的大小通常是在10005000范圍內(nèi);而且,如上所述,權(quán)威的資源只能被根集 R() 中的 200 個(gè)頁面中的任何一個(gè)進(jìn)行添加,才能被添加到 S()中。在下一部分,我們將描述我們計(jì)算樞紐以及計(jì)算基本集合S()中權(quán)威資源的算
18、法。在談到這之前, 我們討論一個(gè)提供純粹導(dǎo)航功能的啟發(fā)式算法,它對于消除鏈接的影響非常有用。首先,讓 GS() 表示上面所說的,在 S() 頁面上所引導(dǎo)出來的子圖。我們將GS()中的兩種鏈接區(qū)分開來。如果是鏈接不同域名之間的頁面,則該鏈接是橫向鏈接,如果是相同域名之間的鏈接,則稱它為內(nèi)部鏈接。這里的“域名”,我們指的是在與網(wǎng)頁關(guān)聯(lián)的 URL 字符串的第一級。由于內(nèi)部鏈接往往是一個(gè)網(wǎng)頁基礎(chǔ)結(jié)構(gòu)的導(dǎo)航,他們比橫向鏈接所指向的頁面?zhèn)魉偷臋?quán)威信息少。因此,我們從GS()中刪除所有的內(nèi)部鏈接,保持只留下對應(yīng)于橫向鏈接的邊緣部分 ;最終產(chǎn)生了圖 G()。這是一個(gè)(y )非常簡單的啟發(fā)法,但我們(w men
19、)發(fā)現(xiàn)它有效避免了許多(xdu)如其他鏈接同樣的方式所產(chǎn)生的異常狀態(tài)。還有其他簡單的啟發(fā)式算法,可以用于消除那些看起來并不直觀的鏈接,以此來產(chǎn)生權(quán)威資源。其中值得一提的是我們基于以下的觀察。假設(shè)同一個(gè)域名中的大量頁面指向同一個(gè)頁面p。很多時(shí)候,在這些引用頁頁中,這對應(yīng)于很多的代言、 廣告或一些其他類型的的“合謀” 例如這句話“此站點(diǎn)設(shè)計(jì)的”和相應(yīng)的鏈接,在給定域中的每一頁的底部。要消除這種現(xiàn)象,我們可以設(shè)置參數(shù) m (通常為m 4-8 ),并僅允許來自單個(gè)域最多m頁可以指向任何給定的頁面 p。再次,在某些情況下,這將是一個(gè)有效的啟發(fā)式算法,盡管我們做接下來的實(shí)驗(yàn)時(shí)并沒有使用它。3 計(jì)算樞紐及權(quán)
20、威資源上一節(jié)的方法提供了一個(gè)比較集中的查詢主題的小的子圖G()它有許多相關(guān)的頁面和很權(quán)威的資源?,F(xiàn)在我們單純地通過 G() 的鏈接結(jié)構(gòu)分析,來從頁面的整體集合中提取這些很權(quán)威的資源。最簡單的方法,可以說,通過他們的入度指向在 G()它們的鏈接的數(shù)量來進(jìn)行排序。早些時(shí)候,當(dāng)它被應(yīng)用到包含所查詢目標(biāo)字符串 中搜集頁面的時(shí)候,我們沒有考慮這種想法。 但是現(xiàn)在我們明顯需要構(gòu)建一個(gè)相關(guān)頁面的小集合,而這個(gè)集合是包含我們想要找的大部分的權(quán)威資源的。因此,這些權(quán)威資源既屬于 G(),也被G()中的頁面大量引用。事實(shí)上,純粹由入度的排序方法通常在G() 的上下文中所起的效果比我們之前所預(yù)想的要好 ;在某些情況
21、下,它可以產(chǎn)生一律的高質(zhì)量的結(jié)果。然而,該方法還保留著幾個(gè)重大問題。例如,查詢“java”,具有最大的入度的頁面包括 和 ,以及廣告加勒比海度假,和亞馬遜書主頁的頁面。這樣的混雜是從這個(gè)簡單排序方案產(chǎn)生問題的類型所產(chǎn)生的代表: 雖然這些頁面的前兩個(gè)當(dāng)然是“好”的答案,其他與查詢主題無關(guān) ;它們雖然入度較大但缺乏主題統(tǒng)一性。這表明基本的困難是在子圖G()的入度最具權(quán)威性的和簡單“普遍流行”的網(wǎng)頁之間存在的內(nèi)在的張力;我們最后需要的網(wǎng)頁是入度較大,且符合我們的查詢主題。你也許(yx)會疑惑是否需要(xyo)圍繞這些(zhxi)問題,針對基礎(chǔ)集合,進(jìn)一步利用頁面的文本內(nèi)容,而不僅僅是利用G() 的鏈
22、接結(jié)構(gòu)。我們現(xiàn)在表明情況并非如此它其實(shí)可以更有效地從鏈接提取信息我們開始以下的觀察。和權(quán)威網(wǎng)頁內(nèi)容相關(guān)的初始查詢不僅要查詢?nèi)攵容^大的 ;更因?yàn)樗鼈児餐掝}中的所有權(quán)威資源,所以也應(yīng)該考慮是否與指向它們的頁面集重疊。因此,除了極具權(quán)威性的頁面之外,我們也期望找到所謂的樞紐頁:這些是鏈接到多個(gè)相關(guān)權(quán)威頁面的的頁面。這些樞紐頁“齊心協(xié)力”圍繞一個(gè)共同的主題,并使我們能夠從入度較大的頁面中拋棄不相關(guān)的頁面。(如圖 2 所示,這是一個(gè)梗概性的例子; 當(dāng)然,在現(xiàn)實(shí)中,這幅畫并不是如此簡單的)樞紐頁面和權(quán)威頁面表現(xiàn)出相輔相成的關(guān)系: 一個(gè)良好的樞紐頁是指向許多好的權(quán)威性資源的頁面 ; 同時(shí)一個(gè)好的權(quán)威性頁面
23、是許多的樞紐頁所指向的網(wǎng)頁。顯然,如果我們想要在子圖 G()內(nèi)確定樞紐頁和權(quán)威性頁面,我們需要一種方法來打破這種循環(huán)。一種(y zhn)迭代算法。我們通過迭代(di di)算法,利用集樞紐頁和權(quán)威頁面之間的關(guān)系,來保持和更新每個(gè)頁面的權(quán)重(qun zhn)數(shù)值。對于每一個(gè)頁面P,我們賦予一個(gè)非負(fù)的代表權(quán)威程度的權(quán)值x(p),也賦予一個(gè)代表樞紐程度的一個(gè)權(quán)值y(p)。我們把權(quán)重的每種類型都進(jìn)行歸一化,保持其平方的總和為 1不變: 我們將有最大的x和y的值的頁面分別作為最好的權(quán)威頁面和樞紐頁面。數(shù)值,它自然地表達(dá)了樞紐頁面與權(quán)威頁面之間相輔相成的關(guān)系,如接下來所示:如果具有較大的 x 值的頁面p
24、指向許多頁面,那么它就應(yīng)該獲得較大的 y 值 ;如果頁面 p被許多頁具有較大的 y值的頁面所指,那么它就應(yīng)該獲得較大的 x 值。我們用I和 O定義了以下兩個(gè)關(guān)于權(quán)重的操作,給出權(quán)重 x(p),y(p),I操作可更新 x 權(quán)重如下所示:而O操作可以更新y的權(quán)重:因此 I 和 O 操作是樞紐頁面和權(quán)威頁面加強(qiáng)彼此的基本手段。(參見圖 3)?,F(xiàn)在(xinzi),若要查找所需的“平衡(pnghng)”值權(quán)重(qun zhn),一個(gè)是可以交替使用I和 O 操作中,看看是否到達(dá)了一個(gè)固定的點(diǎn)。事實(shí)上,我們現(xiàn)在可以說明我們基本的算法的一個(gè)描述。我們將權(quán)重 x(p)的集合作為一個(gè)向量集 x,它是 G()中每個(gè)頁面的一個(gè)坐標(biāo) ;類似地,我們將權(quán)重 y(p) 的集合作為一個(gè)向量 y。此過程可用于以下(yxi)簡單方法(fngf)來篩選出前c個(gè)權(quán)威(qunwi)頁面和前 c 個(gè)樞紐頁面。我們將在與G()等價(jià)的集合G 上應(yīng)用篩選過程,通常與 c 5-10,。要解決如何最好地選擇 k的問題,我們首先申明,將一個(gè)任意大的 k 值作為迭代次數(shù)使用迭代,數(shù)列x(k)和y(k
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廈門a2貨運(yùn)從業(yè)資格證考試
- 2025年武威駕??荚囏涍\(yùn)從業(yè)資格證考試
- 《中醫(yī)藥基礎(chǔ)》課程標(biāo)準(zhǔn)
- 減肥連鎖加盟合同范本
- 農(nóng)村后院出租合同范本
- 廠房車間裝修合同范本
- 加工合同范本文庫
- 中專畢業(yè)個(gè)人自我鑒定
- 倉庫配送員合同范本
- 公路建設(shè)期全生命周期碳排放量化研究
- 防雷應(yīng)急演練
- 學(xué)校機(jī)考考場改造方案
- 2025新譯林版英語七年級下Unit 2 Neighborhood單詞表
- GB/T 15934-2024電器附件電線組件和互連電線組件
- 經(jīng)濟(jì)師中級考試《工商管理》歷年真題及答案
- CQI-23模塑系統(tǒng)評估審核表-中英文
- DB11∕T 1071-2014 排水管(渠)工程施工質(zhì)量檢驗(yàn)標(biāo)準(zhǔn)
- 現(xiàn)代家政導(dǎo)論-課件 3.2.2認(rèn)知家庭生活管理
- 2024抖音八大寵物心智人群洞察報(bào)告-萌寵數(shù)說:解密養(yǎng)寵人群心智圖譜
- 2024外包用工專題報(bào)告
評論
0/150
提交評論