版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、簽:物L(fēng)、了7勺在勺口怪電子科技大學(xué)學(xué)報(bào)2015年弟二期1數(shù)據(jù)描述本文研究所采用的數(shù)據(jù)集來(lái)源于兩組由手機(jī)收集到的經(jīng)過(guò)匿名化處理的地占八、簽到信息:數(shù)據(jù)集D1來(lái)自LBS社交網(wǎng)站Gow/alla全球范圍內(nèi)的用戶可通過(guò)移動(dòng)端的應(yīng)用程序或者瀏覽器進(jìn)行主動(dòng)簽到從而與好友分享新的地占八、活動(dòng)和旅行線路數(shù)據(jù)集D2來(lái)自國(guó)內(nèi)某沿海城市的手機(jī)QQ用戶使用涉及地圖服務(wù)的應(yīng)用時(shí)被動(dòng)記錄下的地占八、信息0因此兩組數(shù)據(jù)都是用戶發(fā)生空問(wèn)移動(dòng)行為時(shí)記錄的位置信息包括了用戶ID、地占八、經(jīng)緯度、時(shí)問(wèn)等屬性且相比于D2D1由于是用戶主動(dòng)上傳分享的故苴/、主動(dòng)性更強(qiáng)一些0為了保證用戶軌跡信息里且/、有統(tǒng)計(jì)意義本文在計(jì)算可預(yù)測(cè)性時(shí)去
2、掉了地占八、簽到里不足100條的用戶在去掉不活躍的用戶之后D1、D2的用戶數(shù)里分別為全部用戶的8.35%和28.92%但軌跡里卻臺(tái)匕目匕分別達(dá)到65J59%和79.33%地占八、數(shù)目分別達(dá)到全里數(shù)據(jù)的76.156%和81.00%0兩組數(shù)據(jù)的的大小U0統(tǒng)計(jì)兩個(gè)數(shù)據(jù)集中全部用戶和地占八、的活躍度分布結(jié)果如圖1所示0用戶活躍度N的累積分布如圖1a所示兩個(gè)數(shù)據(jù)集中用戶比例均在大約30個(gè)地占八、處開(kāi)始明顯下降這說(shuō)明在人們的日常生活中大多數(shù)人經(jīng)常訪問(wèn)的地占八、數(shù)是有限的對(duì)這些有限數(shù)里地占八、的訪問(wèn)是較為均勻的0如圖1a插圖所示曲線在雙對(duì)數(shù)坐標(biāo)下近似為直線即-ln(P(N)N故兩個(gè)數(shù)據(jù)集中用戶的活躍度分布的
3、累積形式表現(xiàn)為廣延指數(shù)分布形式30-31:0()exp(/)c(;P=x-xx苴/、中0 x為特征標(biāo)度指數(shù)c即為圖1a插圖中近似直線的斜率0而由圖1b知地占八、的活躍度分布則為幕律分布0這說(shuō)明在特定地占八、簽到的人數(shù)且/、有較強(qiáng)的異質(zhì)性即日常生活中大部分地占八、的訪問(wèn)人數(shù)較少同時(shí)存在少數(shù)熱門(mén)地占八、且/、有大里的訪問(wèn)人數(shù)0這樣的現(xiàn)象與購(gòu)物、占八、評(píng)等典型二部圖網(wǎng)絡(luò)的度分布研究結(jié)果類似3:2說(shuō)明在直實(shí)系統(tǒng)中行為的主動(dòng)發(fā)出者所覆蓋的受眾是有限而較為均勻的而行為的被動(dòng)接收者卻可以接受大里而異質(zhì)的訪問(wèn)0由于Gowualla數(shù)據(jù)的地占八、精確度非常問(wèn)里非常少因而苴/、UU曲線要快多后者2.2簽到行為的統(tǒng)
4、計(jì)特征度信息計(jì)算用戶i在離并進(jìn)一步到每個(gè)為0式中im表示該用計(jì)算每個(gè)用戶的回轉(zhuǎn)5忤所示該分布同樣表現(xiàn)數(shù)人在日常生活中的活少數(shù)人的活動(dòng)5M徑臺(tái)匕目匕達(dá)里0進(jìn)一步計(jì)算每個(gè)用轉(zhuǎn)5忤徑之問(wèn)的Peason相關(guān)分別為0.630和0.556即關(guān)關(guān)系02.3跳轉(zhuǎn)距離相關(guān)性用戶否存在內(nèi)在聯(lián)系是否示著下一步也是長(zhǎng)距離問(wèn)題本文采用文獻(xiàn)33標(biāo)研究所有個(gè)體用戶高故大部分地占八、的訪曲線的衰減速度比QQ的的異質(zhì)性更強(qiáng)0根據(jù)簽到記錄中的經(jīng)緯簽到過(guò)程中的跳轉(zhuǎn)距用戶的平均跳轉(zhuǎn)距離戶全部軌跡占八、的質(zhì)心0徑苴/、概率分布如圖2b為幕律形式說(shuō)明大多動(dòng)5忤徑是有限的只有到數(shù)百、甚至數(shù)千公戶的平均跳轉(zhuǎn)距離和回系數(shù)結(jié)果在D1和D2中二者
5、表現(xiàn)為較強(qiáng)的正相相鄰的兩次跳轉(zhuǎn)之問(wèn)是一次長(zhǎng)距離的跳轉(zhuǎn)也預(yù)的跳轉(zhuǎn)?為了研究這個(gè)3中定義的記憶性指跳轉(zhuǎn)距離的相關(guān)性0若更小因此力商值也必然更大0如圖3a所示D2的直實(shí)值rea=2.11即用戶跳轉(zhuǎn)的不確定性約為2.112,-4與文獻(xiàn)20一致0說(shuō)明在日常生活中用戶的被動(dòng)簽到行為在下一時(shí)刻可臺(tái)匕目匕訪問(wèn)的地占八、數(shù)是非常有限而主動(dòng)簽到行為可臺(tái)匕目匕訪問(wèn)的地占八、數(shù)要大多即用戶行為的主動(dòng)性會(huì)大大提高力商值同時(shí)降低可預(yù)測(cè)性03.2影響可預(yù)測(cè)性和規(guī)律性的因素分析從刖文的統(tǒng)計(jì)結(jié)果可以看出人類的日常簽到行為具有復(fù)雜性和規(guī)律性交織的特征0那么規(guī)律性越強(qiáng)的用戶是否更容易預(yù)測(cè)?訪問(wèn)過(guò)更多地占八、的用戶、活動(dòng)徑更大的用戶
6、是否更難預(yù)測(cè)?計(jì)算每個(gè)用戶的可預(yù)測(cè)性ma)in和規(guī)律性reaiR之問(wèn)的Peaison系數(shù)結(jié)果顯示該值在D1和D2中分別為0.057和0.027即規(guī)律性與可預(yù)測(cè)性之問(wèn)并無(wú)明顯的相關(guān)關(guān)系并不是行為越規(guī)律的用戶越容易預(yù)測(cè)0此外計(jì)算可預(yù)測(cè)性ma:xin和跳轉(zhuǎn)距離記憶性M之問(wèn)的Pearson系數(shù)結(jié)果在D1和D2中分別為0.111和0.096說(shuō)明可預(yù)測(cè)與跳轉(zhuǎn)距離也沒(méi)有顯者關(guān)聯(lián)0下面本文分析影響用戶簽到行為動(dòng)過(guò)程而rarid由于苴計(jì)算方式導(dǎo)致苴損失了過(guò)多的信息故數(shù)值接近于零因此沒(méi)有明顯變化0相對(duì)于回轉(zhuǎn)半徑平均跳轉(zhuǎn)距離對(duì)可預(yù)測(cè)性的影響作用更小03.2,2規(guī)律性的影響因素分析規(guī)律性反映了用戶在特定時(shí)段出現(xiàn)在最常
7、訪問(wèn)地點(diǎn)的概率那么上述三個(gè)統(tǒng)計(jì)里對(duì)用戶簽到行為的規(guī)律性是否有影響呢?計(jì)算結(jié)果顯示隨著用戶訪問(wèn)地占八、數(shù)的增大rand快速衰減并趨近于零而real在很大范圍內(nèi)保持緩慢的下降說(shuō)明僅僅是地占八、數(shù)的增大并不會(huì)對(duì)用戶簽到的規(guī)律性產(chǎn)生太大影響0而回轉(zhuǎn)半徑和平均跳轉(zhuǎn)距離對(duì)規(guī)律性幾乎沒(méi)有影響03.2,3最常訪問(wèn)地占八、的影響在人們的日常生活中不論是個(gè)體還是群體用戶對(duì)某個(gè)特定地占八、的訪問(wèn)量都且/、有顯著的異質(zhì)性少數(shù)地點(diǎn)且/、有極高的訪問(wèn)縣里而大多數(shù)地點(diǎn)極少被光顧0那么這些訪問(wèn)里大的地占八、是否對(duì)可預(yù)測(cè)性產(chǎn)生影響呢?為了回答這個(gè)問(wèn)題逐步刪除用戶移動(dòng)軌跡中訪問(wèn)縣里最大的K個(gè)地點(diǎn)查看用戶最大直J、實(shí)嫡和可預(yù)測(cè)性的
8、變挑選訪問(wèn)過(guò)的唯一地點(diǎn)數(shù)據(jù)集D1和D2中分別是在刪除訪問(wèn)里大的地占八、1個(gè)不同的地占八、0實(shí)驗(yàn)最大直實(shí)可預(yù)測(cè)性max以分為兩個(gè)階段0當(dāng)刪一閾值時(shí)整體可預(yù)測(cè)續(xù)增長(zhǎng)超過(guò)該閾值后升趨勢(shì)0而real的變化于閾值范圍區(qū)問(wèn)內(nèi)隨著于閾值范圍內(nèi)則慢慢變幾個(gè)訪問(wèn)里特別大的地較大且嫡曲線變化的性曲線變化的閾值0可非平凡現(xiàn)象:一股情況富的用戶來(lái)說(shuō)隨著最戶的地占八、簽到序列會(huì)慢值將慢慢增大最大可當(dāng)軌跡占八、被刪除到一定化情況0在實(shí)驗(yàn)刖首先數(shù)大于最大刪除里(在50和20)的用戶以保證時(shí)用戶仍然訪問(wèn)過(guò)多于結(jié)果如圖6所示平均曲線的變化規(guī)律大致可除的地占八、數(shù)N不超過(guò)某性呈下降趨勢(shì);當(dāng)N繼整體可預(yù)測(cè)性反而呈上趨勢(shì)則正好相反在
9、小K的增大而變大在大小0并且在刪除刖面占八、時(shí)曲線的斜率都比閾值要小于最大可預(yù)測(cè)以從以下方面理解這種下對(duì)地占八、訪問(wèn)信息豐常訪問(wèn)地占八、的刪除用慢變隨機(jī)化此時(shí)嫡預(yù)測(cè)性也隨之降低0但程度時(shí)用戶訪問(wèn)序列中的軌跡占八、都逐漸趨近幾乎成為一個(gè)完全隨機(jī)測(cè)性下降趨勢(shì)逐漸變緩問(wèn)次數(shù)都為1的時(shí)候預(yù)測(cè)性曲線也慢慢趨向跡點(diǎn)時(shí)嫡值隨著N的最大可預(yù)測(cè)性則因?yàn)殡S而緩慢增長(zhǎng)0由此說(shuō)明是帶來(lái)簽到行為高可預(yù)而可預(yù)測(cè)性曲線的最值Fano不等式中二者的非4結(jié)語(yǔ)和討論本文通過(guò)兩組手機(jī)用戶常的出行行為總結(jié)了用嫡的方法分析了簽到點(diǎn)分析了影響可預(yù)測(cè)性的簽到行為具有一定的問(wèn)且/、有明顯的異質(zhì)性0地點(diǎn)數(shù)和對(duì)最常訪問(wèn)地性和規(guī)律性有明顯影響于被
10、訪問(wèn)極少的次數(shù)的地占八、訪問(wèn)序列可預(yù)0當(dāng)全部的軌跡占八、的訪嫡值達(dá)到最大此時(shí)可最小值0當(dāng)繼續(xù)刪除軌增大而逐漸變小此時(shí)機(jī)序列中地占八、數(shù)的減少用戶經(jīng)常訪問(wèn)的地占八、測(cè)性的一個(gè)重要因素0占八、比嫡曲線滯后則是線性關(guān)系造成的0的簽到數(shù)據(jù)研究人類日簽到行為的一股規(guī)律行為的可預(yù)測(cè)性并重的幾個(gè)因素0發(fā)現(xiàn)人們記憶效應(yīng)對(duì)地點(diǎn)的訪總體來(lái)看用戶訪問(wèn)的點(diǎn)的訪問(wèn)規(guī)律對(duì)可預(yù)測(cè)0具體而言用戶訪問(wèn)此用戶對(duì)地占八、訪問(wèn)的異質(zhì)性是影響苴可預(yù)測(cè)性的重要因素0從研究結(jié)果可以看到數(shù)據(jù)集D2到的可預(yù)測(cè)性數(shù)值要高于D1這樣的差別反應(yīng)了兩組數(shù)據(jù)集的不同0如刖文介紹所說(shuō)Gow/alla是一個(gè)鼓勵(lì)用戶主動(dòng)上報(bào)地理位置的LBS;網(wǎng)站苴行為更多源自旅游、美食、娛樂(lè)等活動(dòng)的分享而QQ數(shù)據(jù)是在用戶日常生活中使用地圖服務(wù)時(shí)記錄的位置信息日常生活中出行的記憶性和規(guī)律性更強(qiáng)地占八、重合度也更高因而苴可整體可預(yù)測(cè)性也更高0人類行為動(dòng)力學(xué)研究的是人類行為的宏觀統(tǒng)計(jì)規(guī)律而嫡的方法分析可預(yù)測(cè)性到的則是預(yù)測(cè)準(zhǔn)確度的理論上限并不是直正意義上的預(yù)測(cè)算法0由于人類行為的高度復(fù)雜性
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報(bào)參考:歷代徽州民歌集成藝術(shù)特色研究
- 體育表演環(huán)保實(shí)踐與可持續(xù)發(fā)展戰(zhàn)略考核試卷
- 2025年統(tǒng)編版2024選修3地理下冊(cè)月考試卷
- 2025年湘師大新版八年級(jí)地理下冊(cè)月考試卷含答案
- 2025年牛津譯林版九年級(jí)生物下冊(cè)階段測(cè)試試卷含答案
- 二零二五版木地板安裝與維護(hù)保養(yǎng)服務(wù)合同4篇
- 二零二五年度內(nèi)衣品牌授權(quán)運(yùn)營(yíng)合同4篇
- 二零二五版木工手工藝品加工定制合同3篇
- 二零二五版智能門(mén)窗安全性能檢測(cè)與認(rèn)證合同3篇
- 二零二五版健身俱樂(lè)部健身用品定制與銷(xiāo)售合同2篇
- 高考滿分作文常見(jiàn)結(jié)構(gòu)完全解讀
- 理光投影機(jī)pj k360功能介紹
- 六年級(jí)數(shù)學(xué)上冊(cè)100道口算題(全冊(cè)完整版)
- 八年級(jí)數(shù)學(xué)下冊(cè)《第十九章 一次函數(shù)》單元檢測(cè)卷帶答案-人教版
- 帕薩特B5維修手冊(cè)及帕薩特B5全車(chē)電路圖
- 系統(tǒng)解剖學(xué)考試重點(diǎn)筆記
- 小學(xué)五年級(jí)解方程應(yīng)用題6
- 云南省地圖含市縣地圖矢量分層地圖行政區(qū)劃市縣概況ppt模板
- 年月江西省南昌市某綜合樓工程造價(jià)指標(biāo)及
- 作物栽培學(xué)課件棉花
評(píng)論
0/150
提交評(píng)論