網(wǎng)絡(luò)結(jié)構(gòu)與效應(yīng)原理:第18章 冪律與富者更富及其與長尾、齊普夫定律等的關(guān)系_第1頁
網(wǎng)絡(luò)結(jié)構(gòu)與效應(yīng)原理:第18章 冪律與富者更富及其與長尾、齊普夫定律等的關(guān)系_第2頁
網(wǎng)絡(luò)結(jié)構(gòu)與效應(yīng)原理:第18章 冪律與富者更富及其與長尾、齊普夫定律等的關(guān)系_第3頁
網(wǎng)絡(luò)結(jié)構(gòu)與效應(yīng)原理:第18章 冪律與富者更富及其與長尾、齊普夫定律等的關(guān)系_第4頁
網(wǎng)絡(luò)結(jié)構(gòu)與效應(yīng)原理:第18章 冪律與富者更富及其與長尾、齊普夫定律等的關(guān)系_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

冪律與富者更富

及其與長尾、齊普夫定律等的關(guān)系(基于第18章)PowerLaw,ScaleFree,Richgetsricher

LongTail,Zipf’sLaw,2/8Law流行性(popularity)同一類事物的不同實(shí)例被關(guān)注、認(rèn)知、或偏愛的程度人(明星),書籍,歌曲,某一類產(chǎn)品(例如軟飲料),某一類服務(wù)(例如提供同一種服務(wù)的網(wǎng)站),微博主為什么會(huì)有差別?這種差別有沒有什么規(guī)律?有沒有辦法增進(jìn)某些實(shí)例在這種差別中的優(yōu)勢(shì)?流行性的定量觀察給定一個(gè)國家(地區(qū))的網(wǎng)頁集合(S),其中一個(gè)網(wǎng)頁的入向鏈接數(shù)為k的概率f(k)是多少?考慮在卓越和當(dāng)當(dāng)上銷售的書籍集合(S),在其中發(fā)現(xiàn)銷量為k的書的概率f(k)是多少?它們的概率函數(shù)是否有相似之處,是否反映了一種規(guī)律,普適于其他具有流行現(xiàn)象的事物?如果體現(xiàn)了反映流行現(xiàn)象的一種規(guī)律,為什么會(huì)有這規(guī)律?以回答第一個(gè)問題為例給定一個(gè)國家(地區(qū))的網(wǎng)頁集合(S),發(fā)現(xiàn)其中一個(gè)網(wǎng)頁的入向鏈接數(shù)為k的概率f(k)是多少?n是網(wǎng)頁總數(shù)pi表示xi的入向鏈接數(shù)什么性質(zhì)?曲線是什么形狀?為什么不是正態(tài)分布?概率密度函數(shù)μ:均值;σ2:方差;σ:標(biāo)準(zhǔn)差中心極限定理:大量獨(dú)立同分布的隨機(jī)變量之和(均值)是正態(tài)分布的隨機(jī)變量;與原始分布是什么無關(guān)。網(wǎng)頁入向鏈接的個(gè)數(shù)(隨機(jī)量)應(yīng)該是什么分布?如果想象:網(wǎng)頁A是否給網(wǎng)頁B鏈接是一個(gè)隨機(jī)變量;那么,B得到的入鏈個(gè)數(shù)就是大量隨機(jī)變量之和。于是,正態(tài)分布?數(shù)據(jù)實(shí)驗(yàn)表明:大量各種不同的數(shù)據(jù)集都顯現(xiàn)出這種性態(tài)因此,我們說這就是反映網(wǎng)頁入度分布的規(guī)律,由于是冪函數(shù),俗稱“冪律”kf(k)=1/k**2g(k)=1/2**k110.520.250.2530.1111111110.12540.06250.062550.040.0312560.0277777780.01562570.0204081630.007812580.0156250.0039062590.0123456790.001953125100.010.000976563冪率的習(xí)慣(圖形)表示log(f(k))是關(guān)于log(k)的線性函數(shù)以log(k)為橫軸,log(f(k))為縱軸的圖像是一條直線這等價(jià)于說在對(duì)數(shù)坐標(biāo)(橫和縱)下,函數(shù)的圖像是一條直線log(k)1234…k101102103104…因此,給定一組原始數(shù)據(jù)k:1,2,3,…f(k):…為查看f(k)是否冪律,一種做法就是取log(k)和對(duì)應(yīng)的log(f(k)),然后用得到的數(shù)據(jù)值在常規(guī)坐標(biāo)下繪制曲線圖形,觀察結(jié)果看起來像不像一條直線。在數(shù)據(jù)量很大的時(shí)候(流行度數(shù)據(jù)常常如此),這種方式很有效。許多繪圖工具直接支持對(duì)數(shù)坐標(biāo)。冪律:流行度的一種主導(dǎo)規(guī)律網(wǎng)頁(網(wǎng)站)的入度,網(wǎng)站的出度網(wǎng)站的規(guī)模(其中網(wǎng)頁的數(shù)量)每天能接到k個(gè)電話的電話書籍的銷量…但不是100%普適的規(guī)律。對(duì)數(shù)正態(tài)分布(lognormal)也反映某些事物流行的現(xiàn)象。冪律的基本特性Scalefree(不受尺度影響的)Scalefree函數(shù)隱含著自相似(selfsimilarity)平均行為不反映典型行為“典型行為”-經(jīng)常遇到的;“平均行為”-總和/個(gè)數(shù)正態(tài)分布的“平均行為”反映“典型行為”典型看到“中等個(gè)子”,大個(gè)子很稀少ScaleFree=“無標(biāo)度”?一個(gè)事物從不同的尺度看,具有相同的性質(zhì)F(ax),F(x)F(ax)=bF(x)冪函數(shù)就具有這種性質(zhì)!冪律的基本特性Scalefree(不受尺度影響的)Scalefree函數(shù)隱含著自相似(selfsimilarity)平均行為不反映典型行為“典型行為”-經(jīng)常遇到的;“平均行為”-總和/個(gè)數(shù)正態(tài)分布的“平均行為”反映“典型行為”典型看到“中等個(gè)子”,特別矮,特別高的都很稀少冪律分布比較容易看到“個(gè)大的”中國人均住房面積:符合冪律分布取值范圍

n=1,...,100

均值=4.65,相對(duì)比較小

意味著:看到比均值大的對(duì)象的可能性很高

具體算出來,看到較大對(duì)象的概率約為0.2

最后這個(gè)計(jì)算表明看到比均值大一倍對(duì)象的概率約為0.1體會(huì)“典型”不同于“平均”的算例冪律的成因(“富者更富”模型)網(wǎng)頁按照順序創(chuàng)建:1,2,3,…,j,…當(dāng)創(chuàng)建網(wǎng)頁j時(shí),以概率p或1-p選擇如下(a)或(b)執(zhí)行(a)以概率

p,均勻地、隨機(jī)地選擇一個(gè)早先創(chuàng)建的網(wǎng)頁

i,建立一個(gè)從

j到i的鏈接(b)以1-p的概率,均勻地、隨機(jī)地選擇一個(gè)早先創(chuàng)建的網(wǎng)頁

i,建立一個(gè)從

j到

i

所指向的網(wǎng)頁的鏈接。。。。。。。j此模型產(chǎn)生冪律ak-c,其中的指數(shù)c取決于概率p為什么說這體現(xiàn)了“富者更富”網(wǎng)頁按照順序創(chuàng)建:1,2,3,…,j,…當(dāng)創(chuàng)建網(wǎng)頁j時(shí),以概率p或1-p選擇如下(a)或(b)執(zhí)行(a)以概率

p,均勻地、隨機(jī)地選擇一個(gè)早先創(chuàng)建的網(wǎng)頁

i,建立一個(gè)從

j到i的鏈接(b)以1-p的概率,均勻地、隨機(jī)地選擇一個(gè)早先創(chuàng)建的網(wǎng)頁

i,建立一個(gè)從

j到

i

所指向的網(wǎng)頁的鏈接。等價(jià)于說:……(b)以1-p的概率,按照與已有入度成比例的概率,選擇一個(gè)早先創(chuàng)建的網(wǎng)頁

i,建立一個(gè)從

j到

i

的鏈接。富者更富效應(yīng)的不可預(yù)測(cè)性“富者更富”也具有級(jí)聯(lián)的意味,現(xiàn)實(shí)生活中有不少體現(xiàn)這種情形的現(xiàn)象最初階段充滿不確定性,“富”到一定程度后就開始“起飛”與《哈利波特》同樣質(zhì)量的小說在同一時(shí)期其實(shí)很多,但真正流行起來的很少同樣水平的歌星在同一時(shí)期其實(shí)很多,但真正出名的很少一類事物流行史的細(xì)節(jié)不可能重演,但歷史的結(jié)果宏觀上總是如此(流行的分布)歷史平行演化的一次模擬實(shí)驗(yàn)建一個(gè)音樂下載網(wǎng)站,向網(wǎng)民提供48首人們不太熟悉的歌曲的下載該網(wǎng)站也公布每首歌曲的“已下載次數(shù)”,后面上來的人能夠看到(從而就有一種促進(jìn)富者更富的功效)觀察一段時(shí)間后那些歌曲下載量的分布實(shí)驗(yàn)設(shè)計(jì)的妙處在:人們不知道他們被隨機(jī)分到8個(gè)類似的網(wǎng)站之一(歌曲相同,初始狀態(tài)相同)!于是:研究人員看到了8段平行發(fā)展的歷史。與“長尾”(longtail)的關(guān)系一類產(chǎn)品(例如書籍,個(gè)人音樂專輯)各個(gè)品種的銷售量(流行度)常符合冪律商業(yè)上人們更方便直接談銷量(而不是概率),設(shè)該類產(chǎn)品的品種總數(shù)為n,于是即銷量為x的品種的個(gè)數(shù)發(fā)現(xiàn)銷量為x的品種的概率“長尾”(進(jìn)一步)關(guān)心“銷量至少為k的品種數(shù)”也是冪函數(shù)(但冪次變了)長尾的典型圖示。由于降了一個(gè)冪次,尾巴顯得更加明顯齊普夫定律(Zipf’sLaw)

--另一個(gè)視角看“長尾”橫軸此時(shí)可看成“銷量排名位次”,縱軸則是對(duì)應(yīng)位次的銷量。從函數(shù)關(guān)系看:銷量至少為k的品種數(shù)“向左翻轉(zhuǎn)”“順時(shí)針旋轉(zhuǎn)”也是冪函數(shù),尾巴更粗長尾效應(yīng)與營銷策略銷量位次對(duì)應(yīng)概率意義冪律中的冪次3對(duì)應(yīng)概率意義冪律中的冪次2結(jié)論是:如果一類商品的品種流行性分布為冪律,且品種足夠多(即max很大),經(jīng)營利基產(chǎn)品也能獲得很大利益但有兩個(gè)前提*降低庫存成本*讓顧客容易發(fā)現(xiàn)那些產(chǎn)品考慮top-100之后Zipf形式的表達(dá)“長尾”-“2/8律”“銷量排前20%的書的銷量之和占總銷量的80%”,“少數(shù)人的財(cái)富之和占所有人財(cái)富之和的大部分”,…設(shè)共有1000種書,銷量滿足齊普夫律,y=b/x我們來看看排名前20%的銷量之和占總銷量的百分比,也就是總銷量為b*ln(1000)=6.9b有5.3/6.9=0.77=77%銷售排行版、推薦、搜索是促進(jìn)“暢銷產(chǎn)品”還是促進(jìn)“利基產(chǎn)品”的銷售?排行版:推動(dòng)富者更富推薦(相關(guān)推薦)取決于“相關(guān)”的含義,若是“買了這產(chǎn)品的其他人通常也買了…”,則傾向于是富者更富;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論