網(wǎng)站推薦系統(tǒng)分析推薦系統(tǒng)絕對(duì)不會(huì)向你推薦什么_第1頁(yè)
網(wǎng)站推薦系統(tǒng)分析推薦系統(tǒng)絕對(duì)不會(huì)向你推薦什么_第2頁(yè)
網(wǎng)站推薦系統(tǒng)分析推薦系統(tǒng)絕對(duì)不會(huì)向你推薦什么_第3頁(yè)
網(wǎng)站推薦系統(tǒng)分析推薦系統(tǒng)絕對(duì)不會(huì)向你推薦什么_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、網(wǎng)站推薦系統(tǒng)分析:推薦系統(tǒng)絕對(duì)不會(huì)向你推薦什么現(xiàn)在,你對(duì)于每回上網(wǎng)購(gòu)物時(shí)在線零售商是如何打量你,并努力把你的喜好和其他人的相匹配有了一個(gè)基本的概念。推薦系統(tǒng)還有另外兩大特點(diǎn),也對(duì)你最終看到的推薦結(jié)果有著顯著的影響:第一,在弄清楚你和其他購(gòu)物者的相似度有多高之前,推薦系統(tǒng)必須先弄明白你真正喜歡什么;第二,推薦系統(tǒng)依照一組商業(yè)規(guī)則運(yùn)行,以確保推薦結(jié)果既讓你覺(jué)得有用,也使商家有利可圖。推薦算法是如何贏得你的信任,又讓商家有錢(qián)可賺的?采集你的上網(wǎng)數(shù)據(jù)舉個(gè)例子,來(lái)看亞馬遜的藝術(shù)品商店,上次我們?nèi)タ吹臅r(shí)候那里有 900 多萬(wàn)冊(cè)印刷品和海報(bào)在降價(jià)促銷(xiāo)。亞馬遜的藝術(shù)品商店有這樣幾個(gè)方法來(lái)評(píng)估你的喜好。它會(huì)讓你

2、在 1 到 5 顆星的等級(jí)上給某一件藝術(shù)作品打分,它也會(huì)記錄下你把哪些畫(huà)點(diǎn)擊放大了來(lái)看、哪些畫(huà)你反反復(fù)復(fù)看了好多次,你把哪些放進(jìn)了心愿單,還有你最終實(shí)際下單買(mǎi)了什么。它還會(huì)追蹤在你瀏覽過(guò)的每一個(gè)頁(yè)面上都顯示了哪些畫(huà)作。在線零售商會(huì)使用你在其網(wǎng)站行進(jìn)的路徑(你瀏覽過(guò)的頁(yè)面和點(diǎn)擊商品的鏈接) 來(lái)向你推薦相關(guān)聯(lián)的商品。此外,它還把你的購(gòu)買(mǎi)記錄和打分信息結(jié)合起來(lái),建立一個(gè)你長(zhǎng)期購(gòu)買(mǎi)偏好的檔案。像亞馬遜這樣的公司會(huì)收集大量此類有關(guān)客戶的數(shù)據(jù)。在你登錄期間,你在它網(wǎng)站上的幾乎每一個(gè)動(dòng)作都會(huì)被記下來(lái),留作將來(lái)使用。多虧有了瀏覽器 cookie,連匿名購(gòu)物者的上網(wǎng)記錄商家也能維持,最終這些數(shù)據(jù)將在匿名購(gòu)物者創(chuàng)

3、建賬戶或者登陸時(shí),鏈接到顧客的個(gè)人資料。這種爆炸式的數(shù)據(jù)采集并非為在線商家所獨(dú)有,沃爾瑪便以其對(duì)現(xiàn)金收據(jù)數(shù)據(jù)的深入挖掘而著稱于業(yè)界。但是,網(wǎng)上商店處在一個(gè)更有利的位置去查看和記錄,不止是消費(fèi)者買(mǎi)了些什么,還包括你曾考慮過(guò)、瀏覽過(guò)和決定不買(mǎi)哪些商品。在全世界大部分地區(qū),所有這類活動(dòng)都是任人監(jiān)視和記錄的;只有在歐洲,數(shù)據(jù)隱私法在一定程度上限制了這種操作。當(dāng)然,不論法律如何,顧客發(fā)現(xiàn)自己的數(shù)據(jù)被人濫用后,都會(huì)產(chǎn)生強(qiáng)烈的抵觸情緒。早在 2000 年 9 月,亞馬遜吃過(guò)一次苦頭:有一部分顧客發(fā)現(xiàn)他們收到的報(bào)價(jià)更高,因?yàn)榫W(wǎng)站將他們識(shí)別為老顧客,而不是匿名進(jìn)入或是從某個(gè)比價(jià)網(wǎng)站轉(zhuǎn)接進(jìn)來(lái)的顧客。亞馬遜聲稱這只

4、是一項(xiàng)隨機(jī)的價(jià)格測(cè)試,其呈現(xiàn)出來(lái)的結(jié)果與老顧客身份之間的關(guān)聯(lián)純屬巧合。話是這樣說(shuō),它還是叫停了這項(xiàng)操作。在商業(yè)規(guī)則下運(yùn)行加在推薦算法之上的種種商業(yè)規(guī)則,旨在防止算法給出愚蠢的推薦,并幫助在線零售商在不失去你信任的前提下實(shí)現(xiàn)營(yíng)業(yè)額的最大化。最起碼,推薦系統(tǒng)應(yīng)該避免人們說(shuō)的超市悖論(Supermarket Paradox)。例如,差不多每個(gè)去超市的人都喜歡吃香蕉,也經(jīng)常會(huì)買(mǎi)一些。那么,推薦系統(tǒng)該不該向每一位顧客都推薦香蕉呢?答案是否定的這樣做既幫不上顧客,也提高不了香蕉的銷(xiāo)量。所以,智能的超市推薦系統(tǒng)始終會(huì)包括有一條規(guī)則,明確地將香蕉排除在推薦結(jié)果之外。這個(gè)例子可能聽(tīng)起來(lái)沒(méi)什么,但在我們?cè)缙诮?jīng)手的

5、一個(gè)項(xiàng)目中,我們的推薦系統(tǒng)就曾經(jīng)向幾乎每一個(gè)到訪我們網(wǎng)站的人推薦披頭士的白色專輯(White Album)。從統(tǒng)計(jì)學(xué)的意義上講,這是個(gè)很棒的推薦:顧客此前都沒(méi)有從這個(gè)電子商務(wù)網(wǎng)點(diǎn)購(gòu)買(mǎi)過(guò)這張專輯,而大多數(shù)顧客對(duì)白色專輯的評(píng)價(jià)都很高。盡管如此,這個(gè)推薦仍然是無(wú)效的任何一個(gè)對(duì)白色專輯感興趣的人都已經(jīng)有了一張了。當(dāng)然,大部分的推薦規(guī)則都是更加微妙的。比如說(shuō),當(dāng)約翰在 9 月份在 Netflix 索動(dòng)作影片時(shí),結(jié)果中不會(huì)出現(xiàn)復(fù)仇者聯(lián)盟(The Avengers),因?yàn)檫@部大片在當(dāng)時(shí)還沒(méi)有租借版,這樣的推薦結(jié)果不會(huì)讓 Netflix 有錢(qián)賺。因此,約翰被導(dǎo)向了鋼鐵俠 2(Iron Man 2),這部片已經(jīng)

6、可以用流媒體播放了。其他的規(guī)則還包括禁止推薦為招徠顧客而虧本銷(xiāo)售的商品(loss leader);反過(guò)來(lái),鼓勵(lì)推薦滯銷(xiāo)品。在經(jīng)營(yíng)Net Perceptions期間,我們就曾與一位客戶合作,他利用推薦系統(tǒng)來(lái)識(shí)別庫(kù)存積壓商品的潛在客戶,取得了相當(dāng)大的成功。贏取你的信任然而,這種事情很快就會(huì)變得棘手起來(lái)。一個(gè)只會(huì)推銷(xiāo)高利潤(rùn)商品的推薦算法是不會(huì)贏得顧客的信任的。這就像是去餐館,那兒的服務(wù)生極力向你推薦某道魚(yú)一樣。這個(gè)魚(yú)真的是他覺(jué)得最好吃的嗎?還是大廚催著底下的人趕在魚(yú)變質(zhì)前把它給賣(mài)出去?為了建立信任感,更復(fù)雜的推薦算法會(huì)盡力保持一定的透明度,讓顧客對(duì)系統(tǒng)為什么會(huì)向自己推薦這件商品有一個(gè)大致的概念,并且

7、在不喜歡收到的推薦結(jié)果時(shí),可以更改他們的個(gè)人資料。比如說(shuō),你可以刪除你在亞馬遜上買(mǎi)來(lái)送禮的購(gòu)物記錄;畢竟,那些東西反映的不是你個(gè)人的喜好。你還可以知道系統(tǒng)為什么會(huì)向你推薦某些產(chǎn)品。當(dāng)亞馬遜為約翰挑選了 Jonathan Franzen 的小說(shuō)自由之后,約翰點(diǎn)擊標(biāo)簽上的鏈接“為什么推薦給我?”。隨即顯示出一份簡(jiǎn)要的說(shuō)明,原來(lái)是他放在心愿單里的幾本書(shū)觸發(fā)了這一推薦。不過(guò),由于他還沒(méi)有讀過(guò)心愿單上的那幾本書(shū),約翰就不去管自由這個(gè)推薦結(jié)果了。像這樣的解釋說(shuō)明會(huì)讓用戶明白推薦結(jié)果是否有用。但是,完善個(gè)人資料和解釋推薦結(jié)果往往不足以保證系統(tǒng)不出錯(cuò)。最近,亞馬遜用高清大屏幕電視機(jī)(HDTV)的促銷(xiāo)電子郵件對(duì)

8、喬進(jìn)行了轟炸每周 3 封,連續(xù)扔了一個(gè)月。除了給喬寄了過(guò)多的電子郵件,這家零售商還沒(méi)有意識(shí)到,喬已經(jīng)用他妻子的賬戶買(mǎi)了一臺(tái)電視機(jī)。此外,這些電子郵件并沒(méi)有提供一種很明顯的方法,讓喬可以說(shuō)“謝謝,但我不感興趣”。最終,喬取消了他在亞馬遜的一些郵件訂閱;他并不在意收不到各種信息,而且他有了更多的時(shí)間來(lái)真的看他的電視。推薦算法的作用究竟有多大? 那好,推薦算法究竟起了多大作用呢?它們當(dāng)然一直都在增加在線銷(xiāo)售額;據(jù)阿倫森集團(tuán)(Aaronson Group)的分析師杰克阿倫森(Jack Aaronson)估計(jì),由于推薦算法帶動(dòng)銷(xiāo)售額的增長(zhǎng),對(duì)推薦算法的投資能獲得 10%-30% 的收益。而且,它們還只是

9、剛剛起步?,F(xiàn)在,對(duì)我們這些研究推薦系統(tǒng)的人來(lái)說(shuō),最大的挑戰(zhàn)在于弄清楚如何去判斷新的方法和算法才最好。這可不像基準(zhǔn)化分析微處理器那么簡(jiǎn)單,因?yàn)椴煌耐扑]系統(tǒng)有著非常不同的目標(biāo)。評(píng)價(jià)一個(gè)算法最簡(jiǎn)單的方法,是看它的預(yù)測(cè)和用戶的實(shí)際評(píng)價(jià)之間差異有多大。舉例來(lái)說(shuō),假如約翰給青春浪漫小說(shuō)暮光之城(Twilight )一顆星,亞馬遜或許會(huì)注意到算法根據(jù)其他相似用戶的評(píng)價(jià)曾預(yù)計(jì)約翰會(huì)給兩顆星,也即出現(xiàn)了一顆星的偏差。但是,賣(mài)家更加關(guān)心算法在用戶評(píng)價(jià)高的商品上出的錯(cuò),因?yàn)楹迷u(píng)多的物品是顧客更有可能購(gòu)買(mǎi)的;約翰反正也不會(huì)買(mǎi)暮光之城。所以,把這個(gè)評(píng)價(jià)計(jì)入考慮對(duì)理解推薦算法起了多大作用沒(méi)什么幫助。另一個(gè)常見(jiàn)方法是看算

10、法給出的推薦結(jié)果和顧客實(shí)際購(gòu)買(mǎi)的商品,之間匹配度有多高。不過(guò),這種方法也可能起到誤導(dǎo)作用,因?yàn)檫@樣分析會(huì)將用戶自己設(shè)法找到的商品錯(cuò)誤地算在推薦算法的頭上,而用戶自己找得到東西恰恰是最不應(yīng)該被推薦的!鑒于這些方法的缺點(diǎn),研究人員一直在研究新的評(píng)判指標(biāo),不只看精度,也會(huì)關(guān)注像發(fā)現(xiàn)意外驚喜和多樣性等其他屬性。發(fā)現(xiàn)意外驚喜(Serendipity)會(huì)加權(quán)不尋常的推薦結(jié)果,尤其是那些對(duì)某一個(gè)用戶極具價(jià)值,但對(duì)其他同類用戶而言沒(méi)什么用的推薦結(jié)果。調(diào)整為發(fā)現(xiàn)意外驚喜的算法會(huì)注意到白色相簿似乎是一個(gè)對(duì)幾乎每個(gè)人來(lái)說(shuō)都不錯(cuò)的推薦,因此會(huì)改為尋找一個(gè)不太常見(jiàn)的選擇也許是 Joan Armatrading 的愛(ài)和情

11、感。這個(gè)不那么熱門(mén)的推薦結(jié)果不太可能擊中目標(biāo),但一旦它遇上了,則將給用戶帶來(lái)一個(gè)大得多的驚喜??赐扑]結(jié)果的多樣性同樣也很能說(shuō)明問(wèn)題。比方說(shuō),一個(gè)超愛(ài)看 Dick Francis 神秘類小說(shuō)的用戶,在看到推薦表單里全都是 Dick Francis 的作品時(shí),仍有可能會(huì)感到失望。一個(gè)真正多樣化的推薦表單會(huì)包括不同作者和不同類型的書(shū),還有電影、游戲和其他的產(chǎn)品。推薦系統(tǒng)研究則需要突破各種各樣的阻礙,遠(yuǎn)不止是在現(xiàn)有的系統(tǒng)上進(jìn)行微調(diào)。研究者們眼下正在考慮的是,推薦算法應(yīng)該在怎樣一個(gè)程度上幫助用戶發(fā)掘一個(gè)網(wǎng)站的內(nèi)容集合中他們未曾了解的部分。比方說(shuō),把買(mǎi)書(shū)的人送去亞馬遜的服裝部門(mén),而不是給一些安全的、顧客更有可能接受的推薦結(jié)果。在零售世界之外,推薦算法可以幫助人們接觸到新的想法;就算我們不同意其中的一些,但整體作用大概會(huì)是積極的,因?yàn)檫@將有助于減少社會(huì)的巴爾干化(Balkanization,即碎片化)。推薦算法能不能做到這一點(diǎn),還要不讓人感到厭煩或者不信任,仍需拭目以待。但有一點(diǎn)是明確的:推薦系統(tǒng)只會(huì)變得越來(lái)越好,收集越來(lái)越多關(guān)于你的數(shù)據(jù),并在別的、意想不到的地方展示出來(lái)。如果你喜歡這篇文章,亞馬遜會(huì)很樂(lè)意向你推薦其他所有你可能會(huì)喜歡的關(guān)于推薦系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論