版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
使用student’sT檢驗的未必是學生產品經理在面臨方案選擇時,往往會面臨多個方案選擇的情況。面對這種情況,最好的辦法是選擇一個相同的。為了確保公平性,我們常常會用到T檢驗和方差檢驗。本文分享了相關方法在網站分析中的應用,希望對你有所幫助。
前言一直想整理一下統(tǒng)計方法在網站分析中的應用,剛好前幾天遇到類似的問題,借這個機會整理一下網站分析中T檢驗的思路。在統(tǒng)計面前我們并沒有生產方法,我們只是方法的搬運工,希望能用的恰到好處而已。T檢驗全稱為student’sT檢驗,是由19世紀末的一位釀酒師戈塞特推導出的小樣本統(tǒng)計方法,因其發(fā)表研究成果時用的筆名為“學生”,這一方法被稱作是student’sT檢驗,雖有其名,但使用者卻未必是學生。產品經理在進行產品方案選擇時,往往會面臨多個方案選擇的情況,面對這樣的問題,最簡單直接的方法是找一個相同的。指標,分別在多個方案上進行計算,查看計算結果的差異,這一方式固然是最為簡單的,但是引發(fā)的弊端也非常的明顯,比如:測試往往會針對不同的人群、不同的數(shù)據量,這些因子會對計算的結果產生影響,但是在上面單純指標的計算中,卻并沒有將其考慮在內,導致計算結果并不公正。為解決上面的問題,大家開始使用統(tǒng)計學中的T檢驗來進行結果計算,這一方法剝離了數(shù)據中的業(yè)務屬性,單純從統(tǒng)計的角度考慮兩組數(shù)據所對應的方案的差異,能有效避免不同人群、不同數(shù)量集引發(fā)的計算差異。T檢驗的優(yōu)勢除了他自身的統(tǒng)計屬性外,還在于他的穩(wěn)定性,這一方法對數(shù)據的正態(tài)性有一定的耐受能力,當數(shù)據不滿足正態(tài)時,可以采用一定的數(shù)據變換方式,將數(shù)據轉換成正態(tài),進而使用這一方法進行計算。一、哪些場景下會用到T檢驗和方差檢驗在產品設計中,能夠用到T檢驗的地方非常多,我們最常見的就是A/B測試:在進行網站功能優(yōu)化時,每個設計師或產品經理會產生不同的設計思路,最終形成多個設計方案,那么問題來了,如果不能進行公正的分析,用哪一個方案就成了一種風險性決策。方案上線到APP上如果不能引發(fā)用戶的積極態(tài)度,不僅會影響產品的活躍度,更有可能影響產品進一步的優(yōu)化。為公正起見,在A/B測試的場景中,經常會看到T檢驗的影子。除了A/B測試外,T檢驗還常被用在對網站進行改版或推廣上,APP上線一個新的功能或者設計一個新的推廣活動,其效果是否會有明顯的不同,就需要進行T檢驗。此時往往會在不同時間段取兩組數(shù)據,計算兩組相同的指標,對兩組指標進行對比。講一個相對專業(yè)一點的話語:這一方法實際上是在檢驗一個二元分類變量是否對一個連續(xù)變量有明顯的影響。另外,在運營推廣活動中,優(yōu)惠券的設計是設計成“滿15減3”還是“滿15減5”?在頁面設計中,按鈕是設計在頁面頂部還是在頁面底部?在問卷調查中,題目是設計7個還是設計10個?這些實驗性的、選擇性的方案中,往往都會有T檢驗的身影。總結可知,T檢驗的應用場景是在方案選擇中,而使用的范圍則可以總結為:1)樣本來自的總體應服從或近似服從正態(tài)分布;2)兩樣本相互獨立,樣本數(shù)可以不等;兩獨立樣本T檢驗目的是:利用來自兩個總體的獨立樣本,推斷兩個總體是否存在顯著差異。二、T檢驗和方差檢驗的原理T檢驗在統(tǒng)計學中是與Z檢驗、卡方檢驗齊名的三大統(tǒng)計方法之一,在網站分析中得到廣泛的應用,T檢驗以假設檢驗為分析基礎,在假設成立的基礎上查看樣本數(shù)據對各種分布的滿足程度。首先,我們來了解一下假設檢驗方法:假設檢驗是用反證法來證明某一假設是否成立的方法,其思路為:1)假定這個假設H0是成立的,并構造出一個服從某一分布F(X)的統(tǒng)計量X(X~F(X));2)計算服從分布F(X)的隨機變量x大于(或小于)統(tǒng)計量X的概率P{X<x}(或者P{X>x}),這一概率值記為p-value;3)選定一個顯著性水平alpha,如果p-value<alpha,則認為原來的假設H0不成立;如果p-value>alpha,則認為原來的假設成立。數(shù)據的語言總是很生硬的,因為其嚴謹性要求他必須字斟句酌,但是我們在生活中卻需要一些聽得懂的表達來理解,我盡量用一些通俗的語言,幫助大家理解這一思路:我們先來解釋一下顯著性水平表示的是什么,所謂的顯著性水平alpha是指一次實驗中小概率事件發(fā)生的概率,統(tǒng)計中往往會假設小概率事件是不會發(fā)生的事件,所以小概率事件會被稱作是錯誤概率,例如:alpha=0.05即為小概率事件發(fā)生的概率界限為0.05,小于這一概率即為小概率事件(即為錯誤概率),大于這一概率則為非小概率事件(即為正確概率)。在假設檢驗中常用的顯著水平取值有:以A/B測試為例,假設A、B兩個方案無顯著差異,即H0成立(H0和H1的定義見如下解釋,指標x往往是用均值來計算):理解完顯著性水平之后,我們就可以探索假設檢驗了:
H0:不同方案(統(tǒng)計中將其稱為不同的水平)中,指標x沒有顯著性差異;
H1:不同方案中,指標x有顯著性差異;
我們假設H0成立,并依據樣本的數(shù)據構造一個統(tǒng)計量X,根據假設這一統(tǒng)計量就會服從F(X)分布,則隨機產生的數(shù)據大概率會落到這一分布中,落在這一分布長尾中的數(shù)據相對較少,我們選擇顯著性水平為0.05,則長尾概率小于0.05的事件即為小概率事件,也即不可能發(fā)生的事件,這一事件發(fā)生時,我們推翻H0假設,即H1成立,兩個方案有顯著性差異。圖中陰影部位即為小概率發(fā)生事件的位置,也就是長尾發(fā)生的位置,在進行假設檢驗中往往存在兩個注意點:一個是兩類錯誤(alpha錯誤和beta錯誤);另一個是單尾檢驗和雙尾檢驗(本文的T檢驗是雙尾檢驗)。因為本文的思路是先構建一個T檢驗的基本思路,所以,這兩個注意點在本文中暫不做介紹。在了解完假設檢驗之后,我們的T檢驗方法就呼之欲出了,下面我們介紹一下T檢驗的思路:1)建立檢驗假設和確定檢驗水準。H0:μ=μ0,H1:μ≠μ0,α=0.05,雙側檢驗;2)選定檢驗方法和計算統(tǒng)計量。用單樣本的t檢驗;在不同的前提下可以構建不同的統(tǒng)計量,并且服從不同的分布狀態(tài),總前提是涉及檢驗的兩組數(shù)據都服從正態(tài)分布。本文中以正態(tài)分布為例進行計算,在正態(tài)情況下,t值的計算公式為:df=n-1公式中的含義轉化成文字即為:t值=(兩個樣本殘差的均值-理想情況下殘差均值)/殘差標準差,計算殘差的情況下u0=0。通過上面的公式可以計算出對應的t值,以及自由度df。三、確定P值和作出推斷結論在確定好t值和自由度后,我們就需要確定對應的P-value值,然后再以這個P-value值與顯著性水平alpha做比較,即可確定兩個方案是否是顯著性差異。傳統(tǒng)的統(tǒng)計學中存在一個t分布表,記錄了t-p的轉化關系,主要思路是通過確定的自由度n和單尾顯著性水平alpha/2查找出對應的標準t值,然后將運算的t值與標準t值進行比較,得出p-value值與alpha的關系。P<alpha時拒絕原假設,兩個方案存在顯著性差異。感覺大家在看到這里的時候,對T檢驗馬上就要失去信心了,一個方案選擇而已,又是t值,又是p值的,好不麻煩,臨了還給出一個t分布表,簡直要放棄掉;好在現(xiàn)在互聯(lián)網發(fā)展快速彌補了這一缺陷,將這一流程封裝成函數(shù),簡化了這一流程,我們只需要輸入兩個樣本數(shù)組,就可以得出兩個方案對應的p-value值,直接將p-value與alpha進行比較即可。T檢驗的應用涉及面非常廣泛,自身也有其不足之處,比如面對三個或三個以上的方案選擇時,T檢驗就失去了作用,此時可以借助方差檢驗,方差分析又會有單因素方差分析、單因素協(xié)方差分析、雙因素方差分析、含兩個協(xié)變量的雙因素協(xié)方差分析等多種方式,各種繁瑣,此處也只能是拋磚引玉,梳理出一個常用的思路而已,對于方差分析,我就不多做描述了。四、網站頁面設計方案A/B分析在做頁面設計時,對于按鈕在頂部還是底部進行AB測試,通常希望獲知它對網站流量pv是否有顯著的影響?;诜治瞿康模覀儷@取兩個方案各15天pv數(shù)據:1)在進行使用這一數(shù)據進行檢驗時首先要驗證數(shù)據的正態(tài)性,如果不符合正態(tài)特性,則需要將數(shù)據正態(tài)化之后再進行檢驗。2)利用levene檢驗兩個樣本的方差齊次性(方差齊次性可簡單理解為兩總體方差相等,有興趣可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024屆內蒙古自治區(qū)錫林郭勒盟高三上學期期末考試歷史試題(解析版)
- 2024-2025學年浙江省杭州地區(qū)(含周邊)重點中學高二上學期期中考試歷史試題(解析版)
- 廣東省廣州市天河區(qū)2025屆高三上學期綜合測試(一)英語試卷含答案
- 單位管理制度集合大合集【人員管理】十篇
- 單位管理制度合并匯編人員管理
- 單位管理制度分享匯編【職員管理】十篇
- 高中語文一些重要的文化常識
- 單位管理制度范例選集【職工管理篇】
- 單位管理制度呈現(xiàn)大合集【員工管理】十篇
- 《白菜育種》課件
- 案例:伊通河中段水環(huán)境綜合整治工程
- 仿真植物施工方案
- 開題報告-基于Stm32掃地機器人的控制系統(tǒng)設計
- 裝配作業(yè)指導書
- 教代會會場背景(紅旗)圖片課件
- 腦出血護理查房-中醫(yī)院
- 森林生態(tài)系統(tǒng)固碳現(xiàn)狀、速率、機制和潛力研究實施方案細則
- 公眾責任保險知識培訓教育課件
- 深基坑事故案例
- 中國茶文化(中文版)
- 02J401鋼梯安裝圖集
評論
0/150
提交評論