分析:為什么大數(shù)據(jù)并不能幫你找到女朋友_第1頁
分析:為什么大數(shù)據(jù)并不能幫你找到女朋友_第2頁
分析:為什么大數(shù)據(jù)并不能幫你找到女朋友_第3頁
免費預覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

【計算機論文】分析:為什么大數(shù)據(jù)并不能幫你找到女朋友

我們很多人抱怨現(xiàn)實中約會很難一下子找到宿命中的人,在線網(wǎng)站也讓找到真愛的幾率變大,操作又容易上手。據(jù)我所知,目前微信,陌陌,探探,世紀佳緣,match,tinder很多這樣的“嚴肅”交友(約會)的工具,他們號稱采用大數(shù)據(jù)建立人物畫像,采用KNN聚合,DNN神經(jīng)網(wǎng)絡,幫你提升匹配率,找到人生幸福另一半,事實上是這樣的嗎?工作原理當你把你的簡歷在這種網(wǎng)站或者APP更新,一些算法就開始準備潛在合拍的。然后給你打分,或者隨機給你幾個選。而這些結(jié)果基于也許就幾十個,一般你回答幾個問題,或者你產(chǎn)生的一些行為?;緮?shù)據(jù):年齡、身高…戶口所在地、畢業(yè)學校、工作單位、家庭狀況。一些網(wǎng)站最厲害的問你100個問題,什么喜歡的顏色,食物,運動,偶像,喜歡看的書類型,然后開始關聯(lián)賬號,微信,微博,比如微博、微信等社交媒體的內(nèi)容及更新頻率,QQ登錄及在線時間,更新發(fā)型頻率,作息時間規(guī)律,經(jīng)常出現(xiàn)的場所。這些背后就是對用戶行為做預測和匹配,跟亞馬遜,Netflix去預測產(chǎn)品差不多,不同的話Netflix推薦電影給你,電影卻不需要反向去關注你。下面就介紹一個有趣的匹配算法。穩(wěn)定婚姻匹配算法1962年,美國數(shù)學家DavidGale和LloydShapley發(fā)明了一種尋找穩(wěn)定婚姻的策略,人們稱之為延遲認可算法(Gale-Shapley算法)。為了讓大家相信數(shù)學家不是真得如此無聊,我要指出它確確實實是一個地道的組合數(shù)學問題,有其特定的數(shù)學價值。當然啦,它也有很多別的背景和應用,比如用來在若干個公司和應聘者之間進行招聘中介……但是數(shù)學家們怎么會放過如此八卦的一個名字呢?于是它就這樣流傳下來了。規(guī)則如下:先對所有男士進行落選標記,稱其為自由男。當存在自由男時,進行以下操作:①每一位自由男在所有尚未拒絕她的女士中選擇一位被他排名最優(yōu)先的女士;②每一位女士將正在追求她的自由男與其當前男友進行比較,選擇其中排名優(yōu)先的男士作為其男友,即若自由男優(yōu)于當前男友,則拋棄前男友;否則保留其男友,拒絕自由男。③若某男士被其女友拋棄,重新變成自由男。在算法執(zhí)行期間,自由男們主動出擊,依次對最喜歡和次喜歡的女人求愛,一旦被接受,即失去自由身,進入訂婚狀態(tài);而女人們則采取“守株待兔”和“喜新厭舊”策略,對前來求愛的男士進行選擇:若該男子比未婚夫強,則悔婚,選擇新的未婚夫;否則拒絕該男子的求婚。被女友拋棄的男人重獲自由身,重新?lián)碛辛俗非笈说臋?quán)利——當然,新的追求對象比不過前女友。這樣,在算法執(zhí)行期間,每個人都有可能訂婚多次——也有可能一開始就找到了自己的最愛,從一而終——每訂一次婚,女人們的選擇就會更有利,而男人們的品味則越來越差。只要男女生的數(shù)量相等,則經(jīng)過多輪求婚,訂婚,悔婚和再訂婚之后,每位男女最終都會找到合適的伴侶——雖然不一定是自己的最愛(男人沒能追到自己的最愛,或女人沒有等到自己的最愛來追求),但絕對不會出現(xiàn)“雖然彼此相愛,卻不能在一起”的悲劇,所有人都會組成穩(wěn)定的婚姻。這個是數(shù)學界切切實實研究過的問題。對于以前沒有接觸過這個問題的人,這個理論最出人意外的結(jié)論是:傳統(tǒng)的求愛,結(jié)婚過程是male-optimal的,也就是說,男性能夠得到盡可能好的心上人,女性卻不然。這就是所謂的穩(wěn)定匹配問題(StableMarriageProblem,也叫穩(wěn)定婚姻問題)。真的行得通嗎?那么問題來了,這些數(shù)據(jù)和計算之后的結(jié)果會導致更好的匹配嗎?我想還是不行。這些約會工具越來越多,成功的反而越少。伯克利大學還做過調(diào)查,比如說美國人只有5%是從網(wǎng)上認識建立長期關系(only5percentofAmericansinlong-termpartnershipsmetonline.)那個報告說了幾點有意思的,個性習慣的相同對健康的兩性關系也沒啥幫助。就算算法再復雜,也對找到合適對象沒多少幫助,除非你把可能遇見的人數(shù)增加。但最麻煩的還是用戶會說謊,對他們多高,多重,收入,年齡都可能是瞎扯,如果給你選擇年薪3萬,30萬,在沒有任何信用的情況下,你選哪個?或者你隨便填個數(shù),你怎么不上天呢?這樣建立起來的模型有什么意義?還有一點,有些人號稱需要一些硬性指標和條件,一定對方多高,多有錢,多牛逼,但真正相處,也許就不會這么要求了。然后就發(fā)現(xiàn)那些把錢放在考慮第一位的人,照樣dating藝術(shù)家或者彈吉他的。有些交友網(wǎng)站,讓你去填個問卷調(diào)查,什么心理分析,性格色彩,MBIT,喜歡的電影,(還有要填政治理想的!)如果拿這些作為匹配可能是誤區(qū),但換一個思路,通過用戶的活躍度和發(fā)布的朋友圈來做。那么這就得去監(jiān)控用戶行為,后臺將這些動作作為依據(jù)去迭代模型。到底約幾次才能找到真愛?這是個有趣問題,老派的約會方式是去本地的PUB,比如你有1%的可能性對方同意要約,你得去100次才能搞定一個。而作為另外一方,應該用什么策略來接受約會邀請?其實根據(jù)博弈論,拒絕掉前37%的你想要約會的人,然后挑選下一個出現(xiàn)的比前37%都要好的人。令人驚訝的是,你最終將找到真愛的幾率為37%,具體計算過程不展開了,參考文檔在最后。約會APP和其他方式其實通過這些網(wǎng)上APP,你極大增加曝光率,因為池子大,還可以加過濾,來個快速排序:)總體上這種方式未必浪漫,但高效啊。還有哪些方式去約呢,比如公司同事(讀到一個調(diào)查1/3的公司員工,包括上下屬約會也占很大比例),書店(聽說高曉松老師剛開的書店還促成了眷侶),微博(我一個程序員朋友就這樣認識他愛人后來結(jié)婚了),甚

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論