




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、Google Analytics和其他工具間的數(shù)據(jù)差異我的網(wǎng)站上同時放了Google Analytics和其他的網(wǎng)站分析工具,為什么這兩個工具報告的數(shù)據(jù)會不一樣?哪個是準(zhǔn)確的?這是經(jīng)常被問到的一個問題,估計也是每個使用網(wǎng)站分析工具的朋友都會碰到的問題。如何回答呢?你可以這樣解釋:當(dāng)你有一只表時,可以知道現(xiàn)在是幾點鐘,而當(dāng)他同時擁有兩只表時,卻無法確定現(xiàn)在的時間。兩只手表并不能告訴你更準(zhǔn)確的時間,反而會讓你失去對準(zhǔn)確時間的信心。網(wǎng)站分析工具也是同樣的道理。怎么樣?很cool吧。這個答案雖然很正確,但卻并不能解決實際的問題,并且還有推卸責(zé)任的嫌疑。好吧,我們是勇敢的網(wǎng)站分析師,讓問題來的再猛烈些吧
2、?。ㄌ靺龋以谡f什么??。┏R姷臄?shù)據(jù)差異原因:網(wǎng)站分析工具之間產(chǎn)生數(shù)據(jù)差異的的原因有很多種,需要具體情況具體分析。這里站在Google Analytics工具的角度看下GA與其他網(wǎng)站分析工具產(chǎn)生數(shù)據(jù)差異時常見的幾種原因。1追蹤代碼的實施問題追蹤代碼實施的問題是指添加追蹤代碼時,由于各種原因出現(xiàn)頁面漏加或重復(fù)添加的問題,或者是與現(xiàn)有追蹤代碼不一致。這個問題看起來好像并不容易發(fā)生,一個網(wǎng)站雖然有成百上千個頁面,但通常都會使用幾個固定的頁底文件,只要保證這幾個頁底文件中都添加了追蹤代碼,那么整個網(wǎng)站也就OK了。但真的是這樣嗎?理論上如果是一個新網(wǎng)站,并且你對網(wǎng)站的結(jié)構(gòu)了如指掌,那么是沒問題的。但大部
3、分網(wǎng)站的情況都沒這么簡單,它們經(jīng)歷過數(shù)次調(diào)整,優(yōu)化,和改版。這時候原來簡單的問題就變得復(fù)雜了。我曾經(jīng)碰到過兩次這樣的情況,網(wǎng)站中同時包含新老兩版的頁面文件,并且它們使用了不同的頁底文件,這時候兩類頁面中可能包含有不同工具的追蹤代碼,或是同一個工具的不同定制追蹤代碼。2追蹤代碼的位置差異追蹤代碼位置差異是指兩種追蹤代碼在頁面中的位置差異,例如,異步的Google Analytics追蹤代碼建議放在</head>標(biāo)簽之前,而有些網(wǎng)站分析工具的追蹤代碼可能會放在</body>之前。當(dāng)頁面被加載時,</head>中的追蹤代碼先被執(zhí)行,而</body>中的
4、追蹤代碼后被執(zhí)行。此時如果訪問者沒有等到頁面顯示完整就關(guān)閉了頁面,或者點擊鏈接進入了下一頁面,那么同一頁面中的兩個工具記錄到的數(shù)據(jù)就會不一樣。</head>中的追蹤代碼會完整的記錄這次訪問,而</body>中的追蹤代碼卻不會。3對特殊訪問者的處理特殊訪問者是指對瀏覽器進行了特殊設(shè)置的訪問者,不同的網(wǎng)站分析工具在處理特殊訪問者時是不一樣的。例如:當(dāng)訪問者的瀏覽器拒絕cookie時,Google Analytics不會記錄這個訪問者的任何訪問信息。而其他的網(wǎng)站分析工具當(dāng)發(fā)現(xiàn)訪問者拒絕cookie時,可能會按優(yōu)先級設(shè)置選擇記錄這個訪問者的IP地址來填補這個訪問者的信息。4追蹤
5、策略間的差異網(wǎng)站訪問者的情況千差萬別,而每個網(wǎng)站分析工具都有自己的追蹤策略,Google Analytics是基于Javascript和cookie的,而有些工具是No Javascript的,(GA也提供No Javascript的頁面標(biāo)簽)或是基于日志的,或者是session的。不同的追蹤策略導(dǎo)致了不同的數(shù)據(jù)記錄方式,而這也會產(chǎn)生數(shù)據(jù)上的差異。5丟包和防火墻的影響數(shù)據(jù)在INTERNET上是以數(shù)據(jù)包為單位傳輸?shù)?,每包nK。就是說,不管你的網(wǎng)有多好,你的數(shù)據(jù)都不會是以線性傳輸?shù)?,中間總是有空洞的。數(shù)據(jù)包的傳輸,不可能百分之百的能夠完成,因為種種原因,總會有一定的損失。碰到這種情況,INTERN
6、ET會自動的讓雙方的電腦根據(jù)協(xié)議來補包。如果你的線路好,速度快,包的損失會非常小,補包的工作也相對較易完成,因此可以近似的將你的數(shù)據(jù)看做是無損傳輸。但是,如果你的線路較差,數(shù)據(jù)的損失量就會非常大,補包工作也不可能百分之百完成。在這種情況下,數(shù)據(jù)的傳輸就會出現(xiàn)空洞,造成丟包。丟包問題對于Google Analytics是個永恒的話題,它的服務(wù)器遠(yuǎn)在美國,丟包是肯定的。這也肯定是造成數(shù)據(jù)差異的一個原因,但其實我卻并不想把它作為數(shù)據(jù)差異的主要原因。最起碼不應(yīng)該是這個問題的第一個答案。因為丟包就好像是個黑匣子,我們無法控制和測量它。GA的丟包的比例有多少?其他的網(wǎng)站分析工具也會有丟包的問題嗎?服務(wù)器在
7、中國的就比在美國的丟包情況要好一些嗎?據(jù)我所知 Omniture目前在中國也沒有自己的分析服務(wù)器。除了丟包以外,還有一個黑匣子就是我們祖國的防火墻。天岸曾經(jīng)問我防火墻對Google Analytics收集數(shù)據(jù)是否會產(chǎn)生影響,這個影響有多大?這個問題我真的不知道。也無法回答。但肯定是會有影響的。6度量定義間的差異不同的網(wǎng)站分析工具對度量有著不同的定義,例如:piwik會將頁面瀏覽,下載和出站鏈接都算在一起,而在google analytics中,下載和出站默認(rèn)是不記錄的,而只有單獨設(shè)置了虛擬頁面后才會和綜合瀏覽量記錄在一起,但通常我們會使用事件追蹤來記錄下載行為,而不是虛擬頁面。所以這時候,兩個
8、工具直接的綜合瀏覽量就會產(chǎn)生差異。7處理數(shù)據(jù)的時間差異不同的網(wǎng)站分析工具在處理數(shù)據(jù)的時間上也會不同,Google Analytics以小時為單位處理數(shù)據(jù),通常從訪問者訪問你的網(wǎng)站到你在報告中看到這條訪問的數(shù)據(jù)需要1個小時的時間,有時候可能需要更長的時間。這個時間就是google analytics處理數(shù)據(jù)的時間。并且在一小時后,你看到的也還不是準(zhǔn)確的數(shù)字,因為google會在每天結(jié)束后再重新處理一遍當(dāng)天的數(shù)據(jù)。這就是說,當(dāng)天或者是實時的數(shù)據(jù)通常是不準(zhǔn)確的。通常要在隔天后數(shù)據(jù)才會基本穩(wěn)定。這是google analytics處理數(shù)據(jù)的時間,其他網(wǎng)站分析工具的處理過程和時間也會各有差異,所以當(dāng)選擇
9、當(dāng)天數(shù)據(jù)進行對比時差異就變的不可避免了。這里再多說兩句,很多網(wǎng)站分析工具都推出了實時數(shù)據(jù)的功能。我的理解就是說,報告中的數(shù)據(jù)與網(wǎng)站訪問情況同步,或者只有很短暫的延遲。但是這可能嗎?訪問者訪問網(wǎng)站是一個連續(xù)的過程,并且每個訪問過程都不一樣,無論是訪問的持續(xù)時間,還是用戶行為上。而網(wǎng)站分析工具中的大部分?jǐn)?shù)據(jù)是以訪次為基礎(chǔ)的。例如:每訪次頁面瀏覽數(shù),網(wǎng)站停留時間等等。舉個例子:當(dāng)我訪問一個博客網(wǎng)站時,我可能會閱讀5篇文章,這5篇文章分別在三個不同的頁面上,而我的閱讀速度是10分鐘一篇。這樣算下來,我的一次訪問花費了50分鐘的時間,那么實時網(wǎng)站分析工具在哪個時間點顯示這次訪問的數(shù)據(jù)呢?如果在訪次剛開始
10、的時候顯示,這次訪問的很多數(shù)據(jù)還可能會有變化,那么這些數(shù)據(jù)準(zhǔn)確嗎?如果是在50分鐘之后顯示,就是說這個訪次結(jié)束后。那就不能算作實時數(shù)據(jù)了,只能算準(zhǔn)實時。解決方法:前面說了一大堆可能的原因了,下面要說一說如何解決數(shù)據(jù)差異的問題。其實很多時候,我們并不能完全解決這些問題,但找到問題所在和產(chǎn)生的原因總比什么都不知道要好一些。當(dāng)出現(xiàn)數(shù)據(jù)差異時,有個很好的查找方法,就是細(xì)分。細(xì)分:產(chǎn)生差異的具體度量第一步,先要對產(chǎn)生差異的具體度量進行細(xì)分。在所有的度量中,有些是基本度量,有些是復(fù)合度量。例如:pageviews,這就是一個基本度量,如果是pageviews的數(shù)據(jù)產(chǎn)生問題,多半是因為追蹤代碼設(shè)置問題導(dǎo)致的
11、。而如果是Bounce Rate,Pages/Visit或Avg. Time on Site出現(xiàn)差異,那么就要對這些復(fù)合度量進行拆分,找出分子或者是分母度量的差異,然后再進行對比和分析。 細(xì)分:產(chǎn)生差異的具體頁面第二步,找出存在差異的具體基本度量后,還要對頁面進行細(xì)分,就是說這些基本度量在網(wǎng)站的哪些頁面中產(chǎn)生了差異,有些時候你會發(fā)現(xiàn),同一個度量在某些頁面或頻道數(shù)據(jù)相差并不大的,但在另一些頁面或頻道中卻差了近一倍。找到這個頻道或頁面,檢查頁底文件的追蹤代碼。 如果是每個頁面的數(shù)據(jù)都不一樣,可能是度量的定義或收集方法導(dǎo)致的。這就比較復(fù)雜了,需要了解每個工具對度量的定義和追蹤方法。按照過濾cookie值的方法過濾來自search和campaign的流量通常都不會有問題,但在過濾referral流量的時候會有一些問題。報告中的數(shù)據(jù)比真實的referral流量低。這是為什么呢?因為某些時候在google analytics返回的數(shù)據(jù)中cookie存儲的來源信息和referral信息是不相同的。例如:訪問者先通過搜索訪問網(wǎng)站,在同一個session中又從其他的網(wǎng)站的鏈接訪問了網(wǎng)站。這時候google是不會更新cookie中的來源信息的。而如何
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年心腦血管事件監(jiān)測培訓(xùn)
- 養(yǎng)老護理中的輪椅使用
- 災(zāi)害安全知識教育
- 礦山自救互救培訓(xùn)
- 住院醫(yī)師規(guī)范化培訓(xùn)教學(xué)病例討論教案指南
- 家居品類直播培訓(xùn)
- 下肢血栓的預(yù)防及護理
- 重癥肺炎血壓管理指南
- 公司基本禮儀培訓(xùn)
- 內(nèi)分泌內(nèi)科問診要點與流程
- 甘肅省慶陽市(2024年-2025年小學(xué)五年級語文)人教版期末考試(下學(xué)期)試卷及答案
- 2024馬克思主義發(fā)展史第2版配套題庫里面包含考研真題課后習(xí)題和章節(jié)題庫
- 基層管理角色轉(zhuǎn)變
- 2024年輸配電及用電工程職稱評審題庫-多選、判斷
- 急救車藥品管理制度
- 2024年職業(yè)技能:拍賣師專業(yè)知識考試題與答案
- 4.1中國特色社會主義進入新時代+課件-高中政治統(tǒng)編版必修一中國特色社會主義+(36張)
- 圍欄網(wǎng)片采購安裝投標(biāo)方案(技術(shù)標(biāo))
- 浙江省2024年高中化學(xué)1月學(xué)業(yè)水平考試試題
- 2024年吉林省長春市中考英語試卷(含答案與解析)
- 100%股權(quán)轉(zhuǎn)讓協(xié)議書
評論
0/150
提交評論