大數(shù)據(jù)與計(jì)算社會(huì)學(xué)_第1頁
大數(shù)據(jù)與計(jì)算社會(huì)學(xué)_第2頁
大數(shù)據(jù)與計(jì)算社會(huì)學(xué)_第3頁
大數(shù)據(jù)與計(jì)算社會(huì)學(xué)_第4頁
大數(shù)據(jù)與計(jì)算社會(huì)學(xué)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)與計(jì)算社會(huì)學(xué)

2009年2月,包括大衛(wèi)拉茲在內(nèi)的15名美國科學(xué)家在科學(xué)上發(fā)表了一篇具有里程碑意義的文章《數(shù)學(xué)社會(huì)學(xué)》。文章指出,“計(jì)算社會(huì)學(xué)”的學(xué)科正在發(fā)展。人們收集和使用前所未有的數(shù)據(jù),為社會(huì)科學(xué)的研究服務(wù)。在過去的三年多時(shí)間里,“計(jì)算社會(huì)學(xué)”正如這些宣言者所認(rèn)為的那樣,表現(xiàn)出了很大的能量。本文,是Nature雜志今年8月刊發(fā)的關(guān)于這一領(lǐng)域最新進(jìn)展的綜述文章。喬恩·克萊因伯格(JonKleinberg)的早期工作并不適合心臟不好的人。他于1992年發(fā)表的第一篇文章是計(jì)算機(jī)科學(xué)的論文,其內(nèi)容就像它的標(biāo)題一樣緊湊。這篇論文的題目是《基于動(dòng)態(tài)Voronoi圖和最小Hausdorff距離的點(diǎn)集歐氏平面運(yùn)動(dòng)研究》。在萬維網(wǎng)席卷全球之后,成千上萬的個(gè)體用戶自主決定和誰聯(lián)系以及聯(lián)系什么??巳R因伯格開始研究當(dāng)代生活所產(chǎn)生的大量數(shù)字副產(chǎn)品,比如電子郵件、移動(dòng)電話、信用卡購物、網(wǎng)絡(luò)搜索以及社會(huì)網(wǎng)絡(luò)。今天,作為位于紐約州伊薩卡的康奈爾大學(xué)的計(jì)算機(jī)科學(xué)家,克萊因伯格利用這些數(shù)據(jù)來撰寫論文,比如《形成你自己的觀點(diǎn)有多糟糕?》以及《你一開口就征服了我:措辭如何影響記憶力》——這些標(biāo)題非常適合出現(xiàn)在社會(huì)科學(xué)雜志上??巳R因伯格并不孤單。計(jì)算社會(huì)科學(xué)這個(gè)領(lǐng)域的出現(xiàn)正在吸引對(duì)數(shù)學(xué)感興趣的科學(xué)家蜂擁而至。而且,這也促進(jìn)了學(xué)術(shù)部門的成立,并激勵(lì)像位于加州門洛帕克的社會(huì)網(wǎng)絡(luò)公司Facebook(臉譜)這樣的巨頭成立研究團(tuán)隊(duì)來研究社會(huì)網(wǎng)絡(luò)的結(jié)構(gòu)以及信息在社會(huì)網(wǎng)絡(luò)之間是如何傳遞的。“這真是革命性的?!笨的螤柎髮W(xué)的社會(huì)科學(xué)家米歇爾·梅西(MichaelMacy)說,她也是2009年聯(lián)合簽署增加這個(gè)新學(xué)科影響力宣言的15位作者之一?!爸拔覀円恢笔芟抻诰C述性文章,文章通常是回顧性的,實(shí)驗(yàn)室研究的對(duì)象也一直是為數(shù)不多的大二學(xué)生。”現(xiàn)在,數(shù)字化數(shù)據(jù)流使得我們以前所未有的規(guī)模和層次來描繪個(gè)體和群體的行為。這些數(shù)據(jù)還帶來了大量的挑戰(zhàn)——特別是隱私問題,以及數(shù)據(jù)集合未必如實(shí)反應(yīng)人群整體狀況的問題。雖然如此,“我把大數(shù)據(jù)給社會(huì)學(xué)帶來的機(jī)遇,等同于粒子加速器給物理學(xué)帶來的機(jī)遇,以及功能磁共振成像給神經(jīng)系統(tǒng)科學(xué)帶來的機(jī)遇?!泵肺髡f。弱連接研究的興起最早大規(guī)模利用數(shù)字化數(shù)據(jù)在社會(huì)科學(xué)問題上進(jìn)行研究的例子是2002年克萊因伯格和明尼蘇達(dá)州卡爾頓學(xué)院的計(jì)算機(jī)科學(xué)家大衛(wèi)·立本諾埃爾(DavidLiben·Nowell)開展的一項(xiàng)研究。他們考察了社會(huì)科學(xué)家認(rèn)為有助于推動(dòng)人際關(guān)系形成的機(jī)制:即人們傾向于和朋友的朋友成為朋友。雖然這個(gè)觀點(diǎn)很完美,但是卻從來沒有在幾十甚至幾百人的人際網(wǎng)絡(luò)中進(jìn)行過檢驗(yàn)。克萊因伯格和立本諾埃爾研究了科研合作中形成的關(guān)系網(wǎng)絡(luò)。他們考察了在1994年至1996年間向電子打印存檔(arXiv)上傳論文的數(shù)以千計(jì)的物理學(xué)家。通過編寫軟件來自動(dòng)提取作者的姓名,他們所建立的合作伙伴數(shù)字網(wǎng)絡(luò)的數(shù)量級(jí)要遠(yuǎn)遠(yuǎn)大過以前測(cè)試過的數(shù)字網(wǎng)絡(luò),新網(wǎng)絡(luò)的每個(gè)連接都代表著兩個(gè)曾經(jīng)合作過的研究人員。通過跟蹤這些網(wǎng)絡(luò)如何隨著時(shí)間的推移而發(fā)生變化,他們發(fā)現(xiàn)一些研究人員之間親近程度的度量指標(biāo)可以用來預(yù)測(cè)未來合作的可能性。正如期望的那樣,研究結(jié)果表明新的合作關(guān)系傾向于出現(xiàn)在那些同自己的現(xiàn)存研究伙伴有合作關(guān)系的人群中,用研究人員自己的話說就是“朋友的朋友”。但是這種預(yù)測(cè)在數(shù)學(xué)上的精確性可以使得它在更大的網(wǎng)絡(luò)中得以運(yùn)用。曾師從克萊因伯格的拉斯·巴克斯托姆(LarsBackstrom)博士也在研究關(guān)聯(lián)-預(yù)測(cè)的問題———他現(xiàn)在就職于臉譜,在這里他可以盡情發(fā)揮自己的學(xué)識(shí),而他的工作就是設(shè)計(jì)社會(huì)網(wǎng)絡(luò)中的當(dāng)前朋友推薦系統(tǒng)。另外一個(gè)已經(jīng)被計(jì)算機(jī)研究人員證實(shí)的經(jīng)久不衰的社會(huì)科學(xué)理念就是”弱連接”的重要性———它是指相隔較遠(yuǎn)且很少碰面的熟人間的關(guān)系。如今就職于斯坦福大學(xué)的社會(huì)科學(xué)家馬克·格蘭諾維特(MarkGranovetter)在1973年提出弱連接在社會(huì)派系中發(fā)揮著橋梁的作用,因而弱連接對(duì)于信息的傳播以及經(jīng)濟(jì)的流動(dòng)都是重要的。在前數(shù)字化時(shí)代,大規(guī)模地證實(shí)他的這種想法幾乎是不可能的。但是,美國哈佛大學(xué)網(wǎng)絡(luò)科學(xué)家的尤卡·佩卡翁內(nèi)拉(JukkaPekkaOnnela)在2007年帶領(lǐng)的一個(gè)團(tuán)隊(duì)利用四百萬手機(jī)用戶的數(shù)據(jù)證實(shí)了弱連接確實(shí)發(fā)揮了社會(huì)橋梁的作用(見“弱連接的能量”圖)。2010年,包括梅西在內(nèi)的另外一個(gè)團(tuán)隊(duì)證實(shí)了格蘭諾維特關(guān)于經(jīng)濟(jì)流動(dòng)性和弱連接存在關(guān)聯(lián)性的理論也是正確的。利用英國六千五百萬有線通訊和移動(dòng)電話采集的數(shù)據(jù),以及全國普查的數(shù)據(jù),他們揭示了個(gè)體關(guān)系多元性和經(jīng)濟(jì)發(fā)展之間存在很大的相關(guān)性:人們?cè)礁辉G宜麄兊穆?lián)系越多元化,則他們的社區(qū)越富裕?!霸?0世紀(jì)70年代,我們不敢想象可以大規(guī)模地利用這些數(shù)據(jù)進(jìn)行研究,”格蘭諾維特說。學(xué)術(shù)研究團(tuán)隊(duì)的研究克萊因伯格的學(xué)生約翰·烏甘德(JohanUgander)發(fā)現(xiàn)情況肯定比那還要復(fù)雜:人們決定加入臉譜的原因不取決于他們已經(jīng)加入該網(wǎng)絡(luò)的朋友數(shù)目,而取決于隸屬于不同社會(huì)群體的朋友加入該網(wǎng)站的數(shù)目。換句話說,如果加入臉譜網(wǎng)站的有你的同事,體育俱樂部的朋友以及你的密友,那么該網(wǎng)站給你留下的印象要比你在上面只發(fā)現(xiàn)了來自一個(gè)社會(huì)群體的朋友要深。所以“觀念的傳播取決于讓他們堅(jiān)守該觀念的人的多樣化”這一結(jié)論對(duì)于營銷和公共健康活動(dòng)來說可能是重要的。隨著計(jì)算社會(huì)學(xué)研究的擴(kuò)展,社會(huì)科學(xué)研究的應(yīng)用也在不斷發(fā)展。就職于麻省理工學(xué)院的計(jì)算機(jī)科學(xué)家亞歷克斯·彭特蘭(AlexPentland)的研究團(tuán)隊(duì)利用智能手機(jī)應(yīng)用程序和便攜式錄音設(shè)備采集研究對(duì)象每日活動(dòng)和交際的精準(zhǔn)數(shù)據(jù)。通過把這些數(shù)據(jù)和身心健康調(diào)查相結(jié)合,該團(tuán)隊(duì)得知了如何識(shí)別包括抑郁在內(nèi)的健康問題的出現(xiàn)?!拔覀儼l(fā)現(xiàn)這些群體從來不會(huì)進(jìn)行表達(dá),”彭特蘭說,“當(dāng)涉及到關(guān)照那些需要關(guān)照的人的時(shí)候,能夠感知到他們的孤獨(dú)是十分重要的?!庇膳硖靥m的學(xué)生安默爾馬丹成立的位于馬薩諸塞州的分拆上市公司Ginger.io現(xiàn)在研發(fā)了一個(gè)智能手機(jī)程序,如果數(shù)據(jù)顯示某種健康問題的存在,那么這個(gè)程序就會(huì)通知衛(wèi)生保健部門。其他一些公司正在研究推特(Twitter)上每天發(fā)布的超過4億條信息。一些研究團(tuán)隊(duì)開發(fā)出了一款軟件,利用這款軟件可以通過對(duì)推特使用者網(wǎng)上情緒的分析來預(yù)測(cè)實(shí)際情況,比如電影的票房收益或者選舉結(jié)果。雖然這種預(yù)測(cè)的精準(zhǔn)性還一直備受爭(zhēng)議,但是推特基于這個(gè)方法于今年8月開始推出了美國總統(tǒng)競(jìng)選的每日政治指數(shù)。同時(shí),就職于布盧明頓印第安納大學(xué)的約翰·博倫(JohanBollen)和他的同事也采用類似的軟件來研究推特上表達(dá)的社會(huì)情緒與股票市場(chǎng)波動(dòng)之間的關(guān)聯(lián)。他們研究的結(jié)果已經(jīng)足以震撼位于倫敦的投資公司-德溫特資本市場(chǎng),并得到該公司的認(rèn)可。數(shù)據(jù)處理與研究反思當(dāng)這些基于推特的調(diào)查在大約2年前出現(xiàn)的時(shí)候,對(duì)于這種服務(wù)在特定人口群體中(例如年輕人中)的流行性是否會(huì)扭曲其研究結(jié)果的質(zhì)疑就一直存在。圍繞著這些新數(shù)據(jù)的類似辯論也不斷出現(xiàn)。舉個(gè)例子來說,臉譜網(wǎng)現(xiàn)在的用戶接近10億人,然而在這些用戶中年輕人的數(shù)量大大超過其他群體。同時(shí)網(wǎng)絡(luò)交流和現(xiàn)實(shí)的交流也存在著差別,對(duì)于一個(gè)領(lǐng)域的結(jié)論是否也適用于其他領(lǐng)域還不清晰?!拔覀兺ǔ囊粋€(gè)群體如何使用一種技術(shù)入手來推測(cè)該技術(shù)通用的使用情況,”哈佛大學(xué)網(wǎng)絡(luò)科學(xué)家薩繆爾·阿貝斯曼(SamuelArbesman)說,“這也可能未必是合理的?!敝С终哒J(rèn)為這些都不是新的問題。幾乎所有的調(diào)查數(shù)據(jù)都包含一些人口變量方面的偏差,社會(huì)科學(xué)家已經(jīng)研發(fā)出一些加權(quán)方法來糾正這種偏差。如果能夠計(jì)算出特定數(shù)據(jù)集合中的偏差,比如臉譜網(wǎng)上某個(gè)群體的權(quán)重過大,那么這個(gè)研究結(jié)果就可以隨之而進(jìn)行調(diào)整?!霸?0世紀(jì)70年代,我們不敢想象可以大規(guī)模地利用這些數(shù)據(jù)進(jìn)行研究?!蹦樧V和推特等公司所提供的減少偏差的服務(wù)也越來越廣泛地被應(yīng)用。即使還存在偏差,那么這種偏差也比用來研究心理學(xué)和人類行為的數(shù)據(jù)集中存在的偏差要小得多,這些研究的數(shù)據(jù)大多數(shù)來自于西方世界中那些高度工業(yè)化,富裕且民主的社會(huì)中的大學(xué)生。格蘭諾維特對(duì)大數(shù)據(jù)進(jìn)入其研究領(lǐng)域持一種更加哲學(xué)的保留意見。他說他對(duì)這種新的方法“十分感興趣,”但是他也擔(dān)心對(duì)數(shù)據(jù)的關(guān)注會(huì)減弱獲得更好社會(huì)系統(tǒng)理論的需求。他說,“即使絕大多數(shù)計(jì)算社會(huì)學(xué)論文都聚焦于現(xiàn)存的理論,當(dāng)然這是很有研究?jī)r(jià)值的,但是只有其中一小部分做了為當(dāng)今所需的研究?!北热缯f,格蘭諾維特有關(guān)弱連接的論文在發(fā)表了40年后還有很高的引用率。雖然這篇文章“多少利用了開放的數(shù)據(jù)”,他說,“但是其研究結(jié)果并不是來源于數(shù)據(jù)分析,而是對(duì)其他研究的反思。這是一個(gè)單獨(dú)的活動(dòng),我們需要人們來進(jìn)行這樣的研究活動(dòng)?!鄙鐣?huì)科學(xué)家這個(gè)新職業(yè)的出現(xiàn)也與數(shù)據(jù)處理的話題糾纏在一起。就職于位于帕羅奧多市的惠普實(shí)驗(yàn)室的計(jì)算機(jī)科學(xué)家貝爾納多·休伯曼(BernardoHuberman)在今年2月寫到,“很多新出現(xiàn)的‘大數(shù)據(jù)’都來源于私人領(lǐng)域,而其他研究人員是無法獲得這些數(shù)據(jù)的。這些數(shù)據(jù)源有可能被隱藏起來,不但存在驗(yàn)證問題,還涉及這些研究結(jié)果普適性的問題?!币粋€(gè)典型的案例就是臉譜網(wǎng)內(nèi)部的研究團(tuán)隊(duì)利用其網(wǎng)站上9億用戶的交互數(shù)據(jù)來開展自己的研究,這些研究包括對(duì)地球上任意兩個(gè)人之間的關(guān)系不超過六個(gè)人的小世界理論的再評(píng)估。(他們認(rèn)為地球上任意兩個(gè)人之間的關(guān)系不超過五個(gè)人)。由于部分涉及到個(gè)人隱私問題,所以這個(gè)研究團(tuán)隊(duì)只發(fā)表了其研究結(jié)果,而不是原始數(shù)據(jù)。在今年7月,臉譜網(wǎng)宣布說它正在制定一個(gè)計(jì)劃,這個(gè)計(jì)劃讓其他研究者有機(jī)會(huì)對(duì)其內(nèi)部團(tuán)隊(duì)用來得出結(jié)論的匯總匿名數(shù)據(jù)進(jìn)行復(fù)核,但是該計(jì)劃不僅有時(shí)間限制,還僅限于首次進(jìn)入臉譜總部的外來研究者。就眼前來說,計(jì)算社會(huì)學(xué)家更關(guān)注他們學(xué)科領(lǐng)域的文化問題。包括哈佛大學(xué)在內(nèi)的一些研究機(jī)構(gòu)都在這個(gè)領(lǐng)域設(shè)立了研究項(xiàng)目,但是不同研究部門之間的學(xué)術(shù)領(lǐng)域幾乎沒有交叉。鄧肯·瓦茨(DuncanWatts)是紐約的哥倫比亞大學(xué)的社會(huì)科學(xué)家和網(wǎng)絡(luò)理論家,他回想起了近期的一個(gè)調(diào)研錯(cuò)誤,該錯(cuò)誤使他把計(jì)算科學(xué)和社會(huì)學(xué)的研究生召集到一起同時(shí)開會(huì)。他說到,“有足夠的證據(jù)表明這兩個(gè)群體可以互有裨益:計(jì)算科學(xué)專業(yè)的學(xué)生比社會(huì)學(xué)專業(yè)的學(xué)生有更多的方法論知識(shí),但是社會(huì)學(xué)專業(yè)的學(xué)生能提出更多有意思的問題。雖然他們從不認(rèn)識(shí)對(duì)方,也沒有機(jī)會(huì)走進(jìn)對(duì)方的辦公室。”作為2009年宣言第一作者的哈佛大學(xué)社會(huì)科學(xué)家戴維·拉澤(DavidLazar)認(rèn)為很多研究人員還沒有意識(shí)到這些新數(shù)據(jù)的能量。沒有數(shù)據(jù)分析的文章也可以發(fā)表在頂級(jí)社會(huì)科學(xué)雜志中。而參加探討社會(huì)議題的計(jì)算科學(xué)會(huì)議的社會(huì)科學(xué)家的人數(shù)卻少的可憐,這樣的會(huì)議包括今年6月在都柏林舉辦的博客和社會(huì)媒體的會(huì)議。盡管如此,拉澤認(rèn)為,隨著具有里程碑意義的研究論文發(fā)表在頂尖學(xué)術(shù)期刊以及社會(huì)行為數(shù)據(jù)集的首次可用,這些障礙正在被打破。他說,“這些變革正出現(xiàn)在我們面前,而不是身后?!碑?dāng)然這也是克萊因伯格的觀點(diǎn)。他說,“我把自己看作是一個(gè)對(duì)社會(huì)問題感興趣的計(jì)算機(jī)科學(xué)家,但是嚴(yán)格地限定研究的邊界是很難的?!睆慕徊鎸W(xué)科到新興學(xué)科2012年1月7日,中國科學(xué)院學(xué)位評(píng)定委員會(huì)在京召開會(huì)議,同意在中科院研究生院設(shè)立“社會(huì)計(jì)算”交叉學(xué)科,并上報(bào)國務(wù)院學(xué)位委員會(huì)批準(zhǔn)。根據(jù)中科院學(xué)位評(píng)定委員會(huì)的建議,此次擬新設(shè)立的“社會(huì)計(jì)算”學(xué)科是跨“控制科學(xué)與工程”、“計(jì)算機(jī)科學(xué)與技術(shù)”和“管理科學(xué)與工程”三個(gè)一級(jí)學(xué)科的交叉學(xué)科,學(xué)科代碼定為“99J2”,擁有博士和碩士學(xué)位授予權(quán),學(xué)位培養(yǎng)工作將依托中科院自動(dòng)化所。按照國務(wù)院學(xué)位委員會(huì)的相關(guān)規(guī)定,中科院自動(dòng)化所有望在今年成為我國首個(gè)“社會(huì)計(jì)算”研究生培養(yǎng)點(diǎn),同時(shí)具備博士和碩士學(xué)位授予權(quán)。目前,國際上只有卡耐基梅隆大學(xué)(CarnegieMellonUniversity)和喬治梅森大學(xué)(GeorgeMasonUniversity)開設(shè)了跟社會(huì)計(jì)算相關(guān)的博士培養(yǎng)點(diǎn),密西根大學(xué)(U-niversityofMichigan)開設(shè)了類似的碩士培養(yǎng)點(diǎn)。中科院自動(dòng)化所在社會(huì)計(jì)算領(lǐng)域的研究工作起步較早,研究實(shí)力和水平與國際同步,具備了設(shè)置社會(huì)計(jì)算這一新興交叉學(xué)科的基礎(chǔ)和實(shí)力。自動(dòng)化所王飛躍研究員率先使用“社會(huì)計(jì)算”這一術(shù)語命名面向計(jì)算社會(huì)科學(xué)研究領(lǐng)域,并提出了基于ACP(人工社會(huì)ArtificialSocieties+計(jì)算實(shí)驗(yàn)ComputationalExperiments+平行執(zhí)行ParallelExecution)理論方法的社會(huì)計(jì)算研究和應(yīng)用框架。據(jù)悉,中科院自動(dòng)化所已經(jīng)開始“社會(huì)計(jì)算”交叉學(xué)科的建設(shè)工作,擬聘請(qǐng)王飛躍研究員為該學(xué)科的首席科學(xué)家,劉德榮研究員和曾大軍研究員為該學(xué)科的學(xué)術(shù)帶頭人。今年,自動(dòng)化所將依托下屬的“復(fù)雜系統(tǒng)管理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論