大數(shù)據(jù)分析與實踐-社會研究與數(shù)字治理第3章 計算社會科學(xué)及其發(fā)展_第1頁
大數(shù)據(jù)分析與實踐-社會研究與數(shù)字治理第3章 計算社會科學(xué)及其發(fā)展_第2頁
大數(shù)據(jù)分析與實踐-社會研究與數(shù)字治理第3章 計算社會科學(xué)及其發(fā)展_第3頁
大數(shù)據(jù)分析與實踐-社會研究與數(shù)字治理第3章 計算社會科學(xué)及其發(fā)展_第4頁
大數(shù)據(jù)分析與實踐-社會研究與數(shù)字治理第3章 計算社會科學(xué)及其發(fā)展_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第3章計算社會科學(xué)及其發(fā)展QQ:81505050楊武劍周蘇大數(shù)據(jù)分析與實踐——社會研究與數(shù)字治理我們正處于信息爆炸式增長的大數(shù)據(jù)時代,如何利用好大數(shù)據(jù)、人

工智能等數(shù)字技術(shù)提升社會治理現(xiàn)代化水平,更好地服務(wù)經(jīng)濟社會發(fā)

展和人民生活改善,成為重要的時代命題。本文分別從不同角度談及了對數(shù)字化治理的看法。我國社會治理處于數(shù)字化轉(zhuǎn)型階段近年來,大數(shù)據(jù)、人工智能、區(qū)塊鏈等數(shù)字技術(shù)被廣泛應(yīng)用于智慧城市、公共事務(wù)管理等社會治理領(lǐng)域中,加速了社會治理的數(shù)字化轉(zhuǎn)型進程,但由于各項技術(shù)的應(yīng)用目前處于探索的階段,要真正實現(xiàn)數(shù)字化治理還面臨諸多阻礙。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道治理本身是體制機制、決策、監(jiān)督和實施的綜合性問題,所以數(shù)字

化治理不能僅從“數(shù)字化”的角度看。從主體方看,要實現(xiàn)智能、自驅(qū)

動、高效實時的功能;從對象方看,要解決便捷、效率、連通、公平的問

題。這樣來看,數(shù)字化治理必然是系統(tǒng)科學(xué)問題,“數(shù)智化社會治理”這種提法更能說明問題和引導(dǎo)爭取的方向。我國社會治理還處在數(shù)字化轉(zhuǎn)型階段,而長期遺留的各種錯配問題并未消除,社會治理水平整體滯后,所以當(dāng)前的任務(wù)主要是構(gòu)建基礎(chǔ)、打通信息孤島,實現(xiàn)高聯(lián)通和數(shù)字化。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道全面實現(xiàn)數(shù)字化社會治理應(yīng)該是切實地實現(xiàn)跨層級、跨地域、跨系

統(tǒng)、跨組織、跨業(yè)務(wù)的數(shù)據(jù)互聯(lián)互通。同時,具有一系列的現(xiàn)代化治

理手段和工具,讓城市變得更聰明。一體化、集約化、網(wǎng)絡(luò)化的綜合型數(shù)

據(jù)平臺作為“數(shù)字底座”,將演變成為新型基礎(chǔ)設(shè)施的一部分,最終實現(xiàn)政府服務(wù)和政府治理體系的數(shù)字化,認為實現(xiàn)數(shù)字化社會治理要經(jīng)歷從信息化、數(shù)字化到智能化,目前處于向數(shù)字化轉(zhuǎn)型的關(guān)鍵時期。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道完善數(shù)字治理體系,提升社會治理現(xiàn)代化水平數(shù)字化手段讓全社會參與者更多地看到數(shù)字經(jīng)濟模式的發(fā)展?jié)摿?。但是?/p>

我們也看到數(shù)字治理暴露出來的一些問題,其中最為突出的是隱私保護問

題、區(qū)域協(xié)調(diào)問題和決策科學(xué)問題。導(dǎo)致這些問題出現(xiàn)的本質(zhì)原因還是治理體系缺乏現(xiàn)代化,數(shù)字化治理更多是治理能力問題,而其必須以治理體系的革新為基礎(chǔ)和前提要件。因此,完善相關(guān)法律法規(guī)、加強學(xué)術(shù)研究、優(yōu)化機制問題和建立科學(xué)決策思維是未來的當(dāng)務(wù)之急。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道關(guān)于合規(guī)和隱私保護等問題,人們首先想到的是立法,當(dāng)然這是首

要的途徑。但更重要的應(yīng)該是發(fā)掘市場的潛力和社會主體的主動性,如

果對于數(shù)據(jù)方面的問題可以明確確權(quán)和溯源(區(qū)塊鏈是能夠提高解決方案的

技術(shù)途徑),并在此基礎(chǔ)上實現(xiàn)市場化的定價機制,那么就可以利用市場手段解決相關(guān)問題,同時這是一個前景巨大的市場空間,不僅能引進新的業(yè)態(tài),還能顯著提高經(jīng)濟活力和創(chuàng)新水平。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道推動數(shù)據(jù)治理體系建設(shè)一直是業(yè)界探索的熱點。數(shù)據(jù)在預(yù)測趨勢走

向、輔助政府及時做出政策策略中發(fā)揮的作用是巨大的,但部門間的數(shù)

據(jù)孤島問題凸顯。這是由于目前我國現(xiàn)行的管理模式和信息應(yīng)用模式還多

以“條塊分割、碎片化”為主,各個部門在自上而下的高度集中和橫向的部門分立的雙重因素下,跨部門信息協(xié)同面臨重重阻力,導(dǎo)致數(shù)據(jù)治理結(jié)構(gòu)與治理機制不健全,數(shù)據(jù)治理能力難以提升。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道數(shù)據(jù)治理體系是整體關(guān)聯(lián)、動態(tài)平衡的系統(tǒng)工程,猶如一個智能生

命體,需要政府、社會及企業(yè)分別構(gòu)建云數(shù)據(jù)管理子中心,以點帶面,

實現(xiàn)全面的肢體連接。建成基于人、地、事、物、組織的知識圖譜,最終讓

數(shù)據(jù)連成一張網(wǎng)。還需要探索建立統(tǒng)一規(guī)范的數(shù)據(jù)管理制度來打破多部門、多機構(gòu)間“數(shù)據(jù)信息孤島”,并以“政產(chǎn)學(xué)研用”合作機制,建立統(tǒng)一的數(shù)據(jù)標準,通過API接口等方式,推廣數(shù)據(jù)交換共享的“普通話”。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道同時,數(shù)據(jù)安全和個人隱私保護一直是數(shù)據(jù)智能應(yīng)用的前提,尤其

是當(dāng)數(shù)據(jù)“升格”被納入五大生產(chǎn)要素之一后,在數(shù)據(jù)共享交換、使用

過程中如何保障數(shù)據(jù)安全是需要解決的問題。除了立法層面的保障,目前

業(yè)內(nèi)也在探索關(guān)于數(shù)據(jù)隱私保護的技術(shù),如邊緣計算、聯(lián)邦學(xué)習(xí)、安全多方計算等,通過技術(shù)的力量,可以在很大程度上保障數(shù)據(jù)的隱私。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道構(gòu)建“城市大腦”,實現(xiàn)精細化治理社會治理現(xiàn)代化是一個不斷提升的歷史進程,在這個過程中面臨一系列

社會問題。可以融合運用數(shù)據(jù)智能技術(shù),構(gòu)建“城市大腦”來提升社會治

理現(xiàn)代化水平。他認為,城市問題最終都可以歸結(jié)為城市有限的資源和有限的基礎(chǔ)設(shè)施與公眾不斷提高的需求之間的矛盾,只有通過城市大腦來提高城市的運營效率,才能夠解決這個城市的核心問題。圖3-1城市大腦第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道“城市大腦”建設(shè)要以城市治理的精細化為目標,以業(yè)務(wù)需求為牽引,構(gòu)建全面感知、數(shù)據(jù)匯集融合、智能分析計算、統(tǒng)籌決策的新一代城市智能基礎(chǔ)設(shè)施。通過建設(shè)“城市大腦”,可以匯集教育、醫(yī)療、旅游、交通、公共安全等領(lǐng)域的數(shù)據(jù),形成統(tǒng)一的城市大數(shù)據(jù)平臺,進而在這個平臺上構(gòu)建智慧城市的指揮控制中心,政府部門通過分析城市大腦的運行態(tài)勢,可以更好地做集約化的管理和指揮調(diào)度,包括城市管理、生態(tài)環(huán)保、治安防控及政務(wù)服務(wù)等。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道“城市大腦”建設(shè)是數(shù)字化治理的一次重要探索,包括數(shù)字孿生等一系列概念將城市的建設(shè)空間和資產(chǎn)空間推向了更高的維度。目前,城市數(shù)字大腦建設(shè)除了進一步完善智能化機制以外,更要注重人—機結(jié)合的決策運行機制,特別是引入包括社會科學(xué)專家在內(nèi)的跨學(xué)科、跨業(yè)務(wù)的決策團隊,從而在根本上實現(xiàn)城市大腦的決策智能的升級。另外,城市之間、行政層級之間、各行政區(qū)劃之間的數(shù)字大腦的協(xié)調(diào)同步也是必須考慮的問題,這也是新發(fā)展理念的具體體現(xiàn)。第3章導(dǎo)讀案例大數(shù)據(jù)時代的社會治理之道目錄什么是計算社會科學(xué)社會科學(xué)與大數(shù)據(jù)社會研究的范式變革計算社會學(xué)發(fā)展1234什么是計算社會科學(xué)PART013.13.1什么是計算社會科學(xué)大數(shù)據(jù)時代,越來越多的人類活動在各種數(shù)據(jù)庫中留下痕跡,產(chǎn)生了關(guān)于人類行為的大規(guī)模數(shù)據(jù)。這些數(shù)據(jù)為社會研究提供了新的可能,通過對這些數(shù)據(jù)的分析,可以獲得人類行為和社會過程的模式。3.1什么是計算社會科學(xué)計算社會科學(xué)指的是在社會科學(xué)中將計算和算法工具應(yīng)用于關(guān)于人類行為的大規(guī)模數(shù)據(jù),采用計算機運算方法以建立模型、模擬、分析社會現(xiàn)象的學(xué)術(shù)分支。計算社會科學(xué)的分支包括計算社會學(xué)、計算經(jīng)濟學(xué)、自動媒體分析等。計算社會科學(xué)演化自科學(xué)方法基礎(chǔ),實證研究(如利用大數(shù)據(jù)分析數(shù)字足跡)以及科學(xué)理論(如利用電腦模擬建立社會模型)等,是一種多學(xué)科綜合的方法,透過先進的信息科技來觀察社會,特別是信息處理、數(shù)據(jù)處理,將

計算技術(shù)用于分析社會網(wǎng)絡(luò)、社會地理系統(tǒng)、社群

媒體、傳統(tǒng)媒體內(nèi)容等。3.1.2計算經(jīng)濟學(xué)3.1.1計算社會學(xué)計算社會科學(xué)指的是在社會科學(xué)中將計算和算法工具應(yīng)用于關(guān)于人類行為的大規(guī)模數(shù)據(jù),采用計算機運算方法以建立模型、模擬、分析社會現(xiàn)象的學(xué)術(shù)分支。3.1什么是計算社會科學(xué)3.1.1

計算社會學(xué)計算社會學(xué)分支包括:①社會網(wǎng)絡(luò)分析和群體形成;②集體行為和政治社會學(xué);③知識社會學(xué);④文化社會學(xué)、社會心理學(xué)和情緒;⑤文化生產(chǎn);⑥經(jīng)濟社會學(xué)和組織;⑦人口統(tǒng)計學(xué)和人口研究。計算社會學(xué)使用數(shù)字方法來分析與模擬社會現(xiàn)象,其中包括使用計算機模擬、人工智能、復(fù)雜統(tǒng)計方法,以及社會性網(wǎng)絡(luò)分析等新途徑,由下而上地塑造社會互動的模型,來發(fā)展與測試復(fù)雜社會過程的理論。3.1.1

計算社會學(xué)計算社會學(xué)包含了對于社會行為者的理解,這些行為者之間的互動,以及這些互動對于社會整體的影響。雖然社會科學(xué)的主題與方法和自然科學(xué)或計算機科學(xué)相異,當(dāng)代對于社會的模擬所使用的許多方法仍舊起源于如物理學(xué)與人工智能等領(lǐng)域。而一些源自于社會科學(xué)的方法也被納入自然科學(xué),例如在社會性網(wǎng)絡(luò)分析與網(wǎng)絡(luò)科學(xué)領(lǐng)域中,網(wǎng)絡(luò)中心性的測量。在相關(guān)文獻中,計算社會學(xué)經(jīng)常與社會復(fù)雜度的研究相關(guān)。像是復(fù)雜系統(tǒng)、宏觀過程與微觀過程之間非線性的互連與突現(xiàn)等社會復(fù)雜度的概念也進入了計算社會學(xué)的詞匯。一個實際且廣為人知的例子是以“虛擬社會”的形式建造一個演算模型,研究者可以借此分析一個社會體系的結(jié)構(gòu)。3.1.2

計算經(jīng)濟學(xué)計算經(jīng)濟學(xué)是一個介于信息科學(xué)、經(jīng)濟學(xué)與管理學(xué)之間的研究主題。它以經(jīng)濟系統(tǒng)的計算建模為應(yīng)用方向,其內(nèi)容包含代理人模型、一般均衡模型、總體模型、理性預(yù)期模型、計算計量與統(tǒng)計模型、計算金融模型、網(wǎng)絡(luò)市場的設(shè)計演算工具,以及特別為計算經(jīng)濟學(xué)設(shè)計的規(guī)劃工具等。3.1.2

計算經(jīng)濟學(xué)計算經(jīng)濟學(xué)應(yīng)用計算經(jīng)濟模型求解經(jīng)濟問題的解析解與統(tǒng)計解。一個研究方向為代理人計算經(jīng)濟學(xué)(ACE),專門研究將整體經(jīng)濟過程視為代理人間互動的動態(tài)系統(tǒng),因此它是復(fù)雜適應(yīng)系統(tǒng)的經(jīng)濟適應(yīng)方式。在這里,“代理人”被視為根據(jù)規(guī)則互動的演算個體,而不是真的人群。代理人包括社會個體、生物個體與實質(zhì)個體。理論最佳化假設(shè)個體是有限理性的,為一些市場力量所限制,如賽局理論。從初始條件出發(fā),ACE模型隨著時間經(jīng)代理人互動而發(fā)展,最終目標為:檢驗理論發(fā)現(xiàn)與實際資料間隨時間經(jīng)過的差異性。運算工具包括使用軟件找到多個矩陣運算以及求解線性與非線性方程解。3.1.2

計算經(jīng)濟學(xué)賽局理論所謂“賽局理論”,就是策略性思考,在互相影響的環(huán)境之中,設(shè)法找出最適合自己的行動。故事是這樣的……甲帶著一塊大餅出門,乙?guī)е鴥蓧K大餅出門,半路上,素昧平生的兩人偶遇了。甲、乙兩人相談甚歡,于是提議一起分享帶來的大餅,甲一個,乙兩個,合計三個。雖然乙比甲多一個,但因為大餅不值錢,所以沒人計較。正要吃大餅時,第三個人,丙來了,甲、乙兩人熱情地招待丙,請他一起吃大餅。還是那句老話,因為大餅不值錢嘛,所以沒人計較。3.1.2

計算經(jīng)濟學(xué)吃完大餅,三人正要分道揚鑣時,丙突然從口袋里掏出六枚金幣。丙說:“謝謝你們請我吃大餅,為了報答你們,我要送你們六枚金幣,至于怎么分配,就由你們自己決定了!”說完之后,丙就走了。這下子,麻煩來了,大餅不值錢,沒什么好計較的,但金幣不一樣,差一枚就差很多。甲興奮地說:“太好了,既然丙給了我們六枚金幣,那我們一人三枚分了它吧!”乙搖搖頭,不以為然:“等等,不對,我貢獻了兩塊餅,而你才拿出一塊餅,按照比例分配,2∶1=4∶2,我應(yīng)該得到四枚金幣才對,你只能得兩枚金幣?!奔渍J為自己應(yīng)該得到三枚金幣,但乙卻認為甲只能得到兩枚,就這樣,兩個人吵了起來。吵著吵著,甚至還打了起來。3.1.2

計算經(jīng)濟學(xué)這時,有個路人經(jīng)過,知道事情的原委之后,告訴甲、乙兩人,前面村子里有個智慧老人,該怎么分配,你們?nèi)柲莻€老人,一定可以得到一個滿意的答案。這時,甲自告奮勇,主動跳出來,他愿意到前面村子去找智慧老人。非常巧,甲剛到村子口,就巧遇智慧老人。智慧老人說:“其實我不是什么智慧老人,我只是學(xué)過幾年數(shù)學(xué),勉強算得上是個數(shù)學(xué)家?!奔渍f:“不管你是智慧老人還是數(shù)學(xué)家,都請幫我算一下,我應(yīng)該得幾枚金幣?”智慧老人說:“這個問題很簡單,十秒鐘就可以算出來,答案對你很不利。”3.1.2

計算經(jīng)濟學(xué)甲說:“不利?你的意思是我只能獲得兩枚金幣?”智慧老人搖搖頭:“不是兩枚,而是……一枚都沒有?!奔左@呼:“什么意思?你再說清楚一點。”智慧老人說:“從數(shù)學(xué)家的角度來看,乙應(yīng)得六枚金幣,而你一枚都沒有?!奔左@呼:“我不相信,你亂說?!敝腔劾先诉M一步解釋:“三個人吃三塊大餅,這代表你們?nèi)齻€人,一人吃了一塊大餅。從這個角度來看,你吃了自己的大餅,至于丙吃的,是乙的餅。所以乙應(yīng)得六枚金幣,而你一枚都沒有?!?.1.2

計算經(jīng)濟學(xué)聽了智慧老人的說法之后,甲沮喪極了,因為智慧老人的話,確實有那么一點道理。“原來我連一枚金幣都不應(yīng)該拿?!碑?dāng)甲垂頭喪氣,轉(zhuǎn)身準備回去時,智慧老人叫住他:“剛才是數(shù)學(xué)家的算法,現(xiàn)在我要告訴你智慧老人的算法?!薄笆裁??居然有兩種算法?”“沒錯,有兩種算法?!敝腔劾先苏f,以前他還是個數(shù)學(xué)家的時候,他認真算出來的答案,總是讓人不開心,于是他轉(zhuǎn)換了另一種算法,從此人們皆大歡喜。后來,人們漸漸不叫他數(shù)學(xué)家,而是改叫他“智慧老人”。3.1.2

計算經(jīng)濟學(xué)“什么算法,這么神奇?快告訴我?!敝腔劾先苏f:“你回去之后,告訴乙,你沒有見到智慧老人,你走到一半就發(fā)現(xiàn)自己錯了……”就這樣,甲照著智慧老人的話去做。甲回去之后,乙急忙問:“太好了,你見到智慧老人了吧!他怎么說?”甲說:“嗯,我并沒有見到智慧老人,我走到一半就發(fā)現(xiàn)自己錯了……”“錯了?哪里錯了?”乙問。甲說:“走在半路上,我越想越覺得你說的是對的,我太貪心了,你出了兩塊餅,我才出了一塊,而我居然想跟你平分金幣,是我不好,就照你說的,你四枚金幣,我兩枚金幣。”乙聽完甲的話,表情瞬間變得溫和了起來。3.1.2

計算經(jīng)濟學(xué)當(dāng)甲、乙兩人分完金幣,甲二枚,乙四枚,正要分道揚鑣時,乙突然叫住甲。甲:“怎么了?”乙伸出握拳的手:“這個給你?!睆堥_手掌,乙的手心里是一枚金幣。乙說:“我很少看到像你這么老實的人,事實上,你說的也有道理,我們本來就說好要一起吃餅,所以理應(yīng)一起分享金幣才對?!奔茁犃耍荒橌@訝。驚訝的原因不是乙多給了他一枚金幣,而是乙的反應(yīng),完全被智慧老人料中了。3.1.2

計算經(jīng)濟學(xué)智慧老人告訴甲,你回去之后假裝沒見到我,然后退讓一步,說自己太貪心了,你愿意照乙的分法來分配金幣。這時,你立刻從零枚金幣變成至少擁有兩枚金幣。此外,因為你承認了自己貪心,所以也會引發(fā)乙覺得自己也很貪心的連鎖反應(yīng)。所以你很有機會,變成“坐二望三”。從非理性的爭執(zhí)開始,到數(shù)學(xué)家的理性計算,最后再到看穿人情世故的智慧,一層一層地往上疊,這個故事厲害吧?!社會科學(xué)與大數(shù)據(jù)PART023.23.2社會科學(xué)與大數(shù)據(jù)作為資本、勞動力和自然資源之外的第四種生產(chǎn)要素,大數(shù)據(jù)必將影響到傳統(tǒng)社會科學(xué)的理論和實證研究基礎(chǔ),重構(gòu)人文社科的理論范式和研究方法,加速各學(xué)科之間的相互融合。3.2社會科學(xué)與大數(shù)據(jù)在社會科學(xué)發(fā)展史上,重大理論問題往往能引發(fā)長期的學(xué)術(shù)爭論。但隨著實證證據(jù)的豐富和社會熱點的轉(zhuǎn)移,爭論往往會在新的證據(jù)出現(xiàn)之前告一段落。而大數(shù)據(jù)的出現(xiàn),可能為經(jīng)典的理論之辨提供新的實證來源,進而有望為社科理論界重新描繪新的學(xué)術(shù)圖景。雖然社會科學(xué)理論的流派和體系眾多,但它們都可以溯源到少數(shù)具有典范性、啟發(fā)性和詮釋意義的概念、假說和理論,這些經(jīng)典學(xué)說通常立足于高遠的宏觀層面去理解和描繪社會結(jié)構(gòu)及其變遷的歷史,具有更高的概括能力和更寬的輻射面。然而,宏大理論卻難以解釋經(jīng)驗的現(xiàn)實問題。3.2社會科學(xué)與大數(shù)據(jù)由于理論的宏觀性和復(fù)雜性,傳統(tǒng)的截面數(shù)據(jù)、面板數(shù)據(jù)等抽樣分析方法,無法在經(jīng)驗層面上對這些理論進行檢驗,且囿于傳統(tǒng)的資料采集方式,研究者所能獲得的經(jīng)驗材料,無論在時間還是空間維度上都是有限的。因此,一直以來,要想使用經(jīng)典學(xué)說指導(dǎo)經(jīng)驗研究,只能在其中不斷增加結(jié)構(gòu)性因素以降低理論層次,這使得經(jīng)典理論的影響力逐漸式微。大數(shù)據(jù)在經(jīng)典理論和經(jīng)驗研究間架起了一座橋梁,使得學(xué)界得以重新審視和延伸經(jīng)典理論,并使驗證和拓展宏大敘事成為可能。大數(shù)據(jù)的出現(xiàn),可以為經(jīng)典理論的驗證進行補充,甚至帶來更多的發(fā)現(xiàn)??梢?,大數(shù)據(jù)時代,經(jīng)典理論將有可能實現(xiàn)“落地發(fā)展”,并不斷被歷史的、結(jié)構(gòu)性的情境所檢驗和延伸,呈現(xiàn)出更強的生命力。3.2.3大數(shù)據(jù)重構(gòu)定量與定性研究3.2.1大數(shù)據(jù)推動相關(guān)分析崛起3.2.4大數(shù)據(jù)優(yōu)化數(shù)據(jù)處理3.2.2大數(shù)據(jù)推動學(xué)科融合大數(shù)據(jù)的出現(xiàn),可能為經(jīng)典的理論之辨提供新的實證來源,進而有望為社科理論界重新描繪新的學(xué)術(shù)圖景。3.2社會科學(xué)與大數(shù)據(jù)3.2.1

大數(shù)據(jù)推動相關(guān)分析崛起挖掘因果機制是科學(xué)研究的基本任務(wù),也是科學(xué)知識積累和學(xué)科建設(shè)的核心。傳統(tǒng)社會科學(xué)尤其是定量分析致力于進行因果推斷、提供機制性解釋,但由于社會人的異質(zhì)性,基于非實驗數(shù)據(jù)的定量分析很難避免諸如遺漏變量、樣本偏誤、聯(lián)立性等內(nèi)生性問題,這在很大程度上影響了因果推斷的有效性。社會科學(xué)家試圖通過固定效應(yīng)模型、傾向性匹配、工具變量等方法來規(guī)避內(nèi)生性問題以改進因果推斷,但上述方法有賴于高質(zhì)量的調(diào)查數(shù)據(jù),而現(xiàn)實中高質(zhì)量的調(diào)查數(shù)據(jù)通常難以獲得。大數(shù)據(jù)時代的到來,為我們呈現(xiàn)了一幅相關(guān)分析重新崛起、因果推斷更加強化的雙贏學(xué)科目標新圖景,將會對社會科學(xué)學(xué)科目標起到階段性的豐富和拓展。3.2.2

大數(shù)據(jù)推動學(xué)科融合專業(yè)化是現(xiàn)代社會的鮮明特征,專業(yè)化程度的提高大大加強了人們認識自然和社會的能力,個人在越來越專業(yè)化的同時,也失去了對整體文化的了解和控制。對社會科學(xué)而言,學(xué)術(shù)分工的專業(yè)化進程大大提高了研究效率和學(xué)術(shù)領(lǐng)域內(nèi)的交流評估質(zhì)量,但也逐漸形成了各自為政的不足:研究者在獲得相當(dāng)深度的同時,失去了對廣度的把握,不同學(xué)科間的邊界日益鮮明,且學(xué)科邊界間還產(chǎn)生了許多空白地帶。因此,學(xué)科融合必將在社會科學(xué)發(fā)展過程中周期性地出現(xiàn)。大數(shù)據(jù)的出現(xiàn)將會從以下兩個維度推動學(xué)科融合:3.2.2

大數(shù)據(jù)推動學(xué)科融合第一,大數(shù)據(jù)將會向外推動社會科學(xué)與自然科學(xué),尤其是計算機科學(xué)的融合。大數(shù)據(jù)之“大”使得數(shù)據(jù)的性質(zhì)發(fā)生了顯著變化,其數(shù)據(jù)的獲取和分析,往往需要有別于傳統(tǒng)社會科學(xué)訓(xùn)練的方法和工具,這就為原本在計算機、人工智能和數(shù)理等領(lǐng)域具有專長的學(xué)者參與社會現(xiàn)象的分析甚至轉(zhuǎn)型為社會科學(xué)家提供了機會。第二,大數(shù)據(jù)將會向內(nèi)推動社會科學(xué)學(xué)科間的交流和對話。長期以來,社會科學(xué)內(nèi)部各學(xué)科間區(qū)隔明顯,顯著地表現(xiàn)在每個學(xué)科使用的數(shù)據(jù)和分析方法都自成體系。盡管數(shù)據(jù)分析的方法和原理大同小異,但學(xué)科差異下的數(shù)據(jù)搜集和使用“各自為政”,難以達成有效交流。大數(shù)據(jù)的出現(xiàn)將有助于改善這一對話困境。因此可以預(yù)見,越來越多的跨學(xué)科研究和交叉學(xué)科研究將會不斷涌現(xiàn)。3.2.2

大數(shù)據(jù)推動學(xué)科融合隨著信息革命的深入,大數(shù)據(jù)被廣泛地應(yīng)用于經(jīng)濟、金融、選舉、競賽、就業(yè)、高考、疾病、災(zāi)害等諸領(lǐng)域進行趨勢預(yù)測,其邏輯基礎(chǔ)在于從大量征兆的累積中判斷社會現(xiàn)象發(fā)生質(zhì)變的臨界點。較之傳統(tǒng)經(jīng)濟學(xué)研究,大數(shù)據(jù)推斷改變市場的成效可謂立竿見影。在傳播學(xué)方面,大數(shù)據(jù)分析技術(shù)的提升能夠同步提高新聞生產(chǎn)的廣泛潛入性和規(guī)?;幚硇畔⒌哪芰Γ⒃谡{(diào)查性新聞、可視化敘事和應(yīng)用三個層面驅(qū)動創(chuàng)新。大數(shù)據(jù)新聞的重要特點在于其個性化和精準性,既能基于讀者所在地和閱讀興趣的差異來進行新聞的個性化推薦和定制,提升讀者的閱讀體驗,又能基于社會表層現(xiàn)實和深層現(xiàn)實、受眾理性認知和感性認知對受眾行為和社會事件發(fā)展趨勢做出精準的預(yù)測。這無疑為政府科學(xué)決策、提高公共管理和服務(wù)水平提供了強有力的保證。3.2.3

大數(shù)據(jù)重構(gòu)定量與定性研究從某種意義而言,大數(shù)據(jù)的使用使得定量研究和定性研究兩大陣營之間出現(xiàn)了一個混合地帶。大數(shù)據(jù)海量的數(shù)據(jù)規(guī)模和全新的數(shù)據(jù)特征使得定量研究與定性研究在資料獲得與分析方法方面逐步走向趨同,這在某種程度上緩解甚至重構(gòu)了定量研究與定性研究間的關(guān)系。對定性研究者而言,大數(shù)據(jù)可以通過海量規(guī)模的樣本直接發(fā)現(xiàn)和展示出社會現(xiàn)象的規(guī)律,既不需要控制變量來檢驗關(guān)聯(lián),又能避免定性方法在案例選擇方面的樣本偏差。大數(shù)據(jù)可為定性研究提供全新又不過于復(fù)雜的研究思維,并讓檢索和數(shù)據(jù)描述等過去被定量研究者“壟斷”的方法為我所用。3.2.3

大數(shù)據(jù)重構(gòu)定量與定性研究對定量研究者而言,在探索變量間的因果關(guān)系所遭遇的最大困境便在于反事實問題。囿于研究倫理的限制,研究者無法同時得到個體在受干預(yù)和不受干預(yù)兩種情況下的狀態(tài),這就使得尋找用于解決反事實問題的控制變量變得愈發(fā)困難,從而會導(dǎo)致統(tǒng)計推斷產(chǎn)生遺漏變量偏誤。由于數(shù)據(jù)的海量性甚至全樣本的性質(zhì),一旦把基于大數(shù)據(jù)的簡單關(guān)聯(lián)分析或時間序列分析結(jié)果與文獻中的傳統(tǒng)回歸分析進行比對,就能形成非常具有說服力的證據(jù)鏈。可以預(yù)見:以描述和簡單回歸分析為主要方法的大數(shù)據(jù)研究,將同時出現(xiàn)在定量和定性兩大陣營之中,并進一步縮小定性定量分析方法的鴻溝。3.2.3

大數(shù)據(jù)重構(gòu)定量與定性研究在對宏大概念進行測量的過程中,是否能尋找到相應(yīng)的、有說服力的測量指標通常是實踐中的重點和難點。在研究實踐中,應(yīng)用大數(shù)據(jù)能夠優(yōu)化變量的測量。除了傳統(tǒng)的抽樣數(shù)據(jù)可以用來對城市進行研究之外,大數(shù)據(jù)特別是書籍報刊大數(shù)據(jù)能夠為城市及文化傳播研究提供新的維度。特別是,通過從大數(shù)據(jù)中提取出傳統(tǒng)社會科學(xué)分析方法所能夠處理的關(guān)鍵性變量對大數(shù)據(jù)進行二次分析,得以充分發(fā)揮傳統(tǒng)定量分析方法的價值,達到對城市知名度形成渠道及其變化趨勢分析的目的。總體上,大數(shù)據(jù)有助于重新強化“描述”在定量分析中的地位,也催生了利用大數(shù)據(jù)提取小數(shù)據(jù)然后進行定量分析的主要途徑。3.2.4

大數(shù)據(jù)優(yōu)化數(shù)據(jù)處理除了數(shù)據(jù)采集、分析、挖掘和因果推斷外,在研究實踐中我們還必須有效地展示數(shù)據(jù)結(jié)果。一直以來,數(shù)據(jù)展示存在著千人一面、閱讀者難以理解的痼疾,而以簡潔、清晰的方式展示數(shù)據(jù)間的內(nèi)在模式,使受眾對數(shù)據(jù)及其所代表的現(xiàn)象間的結(jié)構(gòu)關(guān)系達到更深的理解,是大數(shù)據(jù)時代社會科學(xué)界的又一重大變革。大數(shù)據(jù)時代的數(shù)據(jù)展示主要以可視化的方式進行。數(shù)據(jù)可視化是借助圖形、圖像處理、計算機視覺以及用戶界面等多種手段,通過表達、建模以及對立體、表面、屬性和動畫顯示等多種形式,從多角度把海量信息、概念視覺化,直接展示信息背后規(guī)律的方式。它能幫助受眾迅速了解研究者的觀點和思路,快速得到某一問題的答案,從而解決諸如信息過飽和、信息可靠性不足以及信息透明度缺失等問題。3.2.4

大數(shù)據(jù)優(yōu)化數(shù)據(jù)處理數(shù)據(jù)可視化其實是知識的一種再生產(chǎn)方式,研究者以圖形、時間序列、地圖、流、矩陣、網(wǎng)絡(luò)、層次和信息圖形為基本元素,通過元素間的多種組合來表達自己對海量信息和數(shù)據(jù)的理解,進而解釋較為宏大和抽象的理論問題??梢暬⒉痪窒抻跀?shù)字,概念也同樣適用??梢灶A(yù)見:大數(shù)據(jù)時代,數(shù)據(jù)可視化必將徹底取代傳統(tǒng)的數(shù)據(jù)展示形式,充分展現(xiàn)數(shù)據(jù)的溫度與美感。大數(shù)據(jù)技術(shù)對社會科學(xué)的沖擊與改變不容小覷。重要的是,大數(shù)據(jù)為我國社會科學(xué)發(fā)展提供了加速超越西方和形成中國特色的重要機遇。這是因為,大數(shù)據(jù)對于社會科學(xué)界是一個全新的事物。只有迅速占據(jù)大數(shù)據(jù)的高地,才能在學(xué)術(shù)對話中占據(jù)主動。社會研究的范式變革PART033.33.3社會研究的范式變革大數(shù)據(jù)時代的到來對社會科學(xué)研究產(chǎn)生巨大影響。除“全樣本”數(shù)據(jù)、大數(shù)據(jù)技術(shù)以及數(shù)據(jù)驅(qū)動的知識發(fā)現(xiàn)三個方面的直接影響外,大數(shù)據(jù)還將進一步推動社會科學(xué)研究范式三個層面的變革。但挑戰(zhàn)也是存在的。比如,大數(shù)據(jù)的可得性不盡如人意。一方面數(shù)據(jù)巨頭將數(shù)據(jù)視為核心資產(chǎn),拒絕共享數(shù)據(jù);另一方面大數(shù)據(jù)可能涉及個人隱私、商業(yè)機密或者國家安全,不能共享?!按髷?shù)據(jù)知識產(chǎn)生的前提要求大數(shù)據(jù)能夠真實、全面地反映經(jīng)驗世界和網(wǎng)絡(luò)世界?!北M管存在挑戰(zhàn),但大數(shù)據(jù)技術(shù)必將孕育社會科學(xué)研究范式的革命,唯有主動擁抱變革,迎難而上,才能實現(xiàn)跨越式發(fā)展,不負時代重托。3.3.3手段變革:大數(shù)據(jù)服務(wù)于因果分析3.3.1大數(shù)據(jù)帶來的變革因素3.3.4功能變革:分析與預(yù)測統(tǒng)一于政策3.3.2路徑變革“數(shù)據(jù)驅(qū)動”知識發(fā)現(xiàn)盡管存在挑戰(zhàn),但大數(shù)據(jù)技術(shù)必將孕育社會科學(xué)研究范式的革命,唯有主動擁抱變革,迎難而上,才能實現(xiàn)跨越式發(fā)展,不負時代重托。3.3社會研究的范式變革3.3.1

大數(shù)據(jù)帶來的變革因素就社會科學(xué)研究而言,大數(shù)據(jù)時代到底為我們帶來什么?研究表明,至少有四點很重要。一是數(shù)據(jù)的實時可得?;ヂ?lián)網(wǎng)上的大量信息是實時的,且移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展導(dǎo)致每個人可能隨時隨地在制造數(shù)據(jù)。社會科學(xué)應(yīng)充分利用數(shù)據(jù)的實時性,大大提高研究的時效性。3.3.1

大數(shù)據(jù)帶來的變革因素二是可得數(shù)據(jù)是海量的。傳統(tǒng)統(tǒng)計學(xué)處理的主要是樣本,而在大數(shù)據(jù)時代,你能得到的數(shù)據(jù)可能就是總體。如就個人遷徙而言,手機等隨身設(shè)備可以將每個個體的移動都記錄在案。大數(shù)據(jù)時代的到來,許多數(shù)據(jù)貧乏的學(xué)科成為數(shù)據(jù)富集的研究領(lǐng)域,而“社會科學(xué)是被‘樣本=總體’撼動得最厲害的學(xué)科”。大數(shù)據(jù)提供的“全樣本”數(shù)據(jù)不僅成就了許多因數(shù)據(jù)缺乏而無法開展的研究,同時也帶來新的挑戰(zhàn)。大數(shù)據(jù)其量之大超出一般傳統(tǒng)統(tǒng)計軟件所能處理的范圍,而且解釋變量增加會導(dǎo)致高維數(shù)據(jù)中的“維數(shù)災(zāi)難”,解決這些問題需要新的分析方法和工具。3.3.1

大數(shù)據(jù)帶來的變革因素三是數(shù)據(jù)的非結(jié)構(gòu)化。大數(shù)據(jù)的來源和形式都十分多樣化,如互聯(lián)網(wǎng)信息包含文本、圖片以及影音等多種形式。這些信息中到底哪些包含我們所需要的信息?社會科學(xué)研究如何充分利用數(shù)據(jù)挖掘技術(shù),將這些非結(jié)構(gòu)化信息轉(zhuǎn)化為統(tǒng)計模型所能利用的形式?這些都是需要解決的問題。四是數(shù)據(jù)分析的技術(shù)手段日新月異。伴隨著數(shù)據(jù)規(guī)模的擴大,新的大數(shù)據(jù)分析技術(shù)不斷地涌現(xiàn),機器學(xué)習(xí)、并行計算等技術(shù)的發(fā)展和改進加快了大數(shù)據(jù)的處理速度。社會科學(xué)研究如何吸收和利用這些強大的技術(shù)手段,使之成為社會科學(xué)家工具箱中的利器,是未來社會科學(xué)家們必須面對的問題。3.3.1

大數(shù)據(jù)帶來的變革因素社會科學(xué)研究的不是物與物的關(guān)系,而是人與物或人與人的關(guān)系。它的研究對象是社會,目標在于認識各種社會現(xiàn)象并盡可能地發(fā)現(xiàn)關(guān)聯(lián),而核心在于探究因果關(guān)系。它研究人的行為,目的是解釋許多人的行為所帶來的無意的或未經(jīng)設(shè)計的結(jié)果。各種社會現(xiàn)象可視為已發(fā)生的不可控試驗,其背后存在某種潛在的本質(zhì)規(guī)律或因果關(guān)系??紤]到因果聯(lián)系的普遍性和復(fù)雜性,數(shù)據(jù)作為對不可控試驗的特殊描述必須盡可能的豐富,唯此才是更全面、更接近真實的描述。大數(shù)據(jù)驅(qū)動的知識發(fā)現(xiàn)已經(jīng)對傳統(tǒng)社會科學(xué)認識論和方法論的研究方法產(chǎn)生巨大挑戰(zhàn)。傳統(tǒng)的認識論“以專家為中心”,傳統(tǒng)科學(xué)方法論的研究依賴于以“專家為中心的參量分析”,其研究中心是理論模型與經(jīng)驗證據(jù)的關(guān)系。該方法論在大數(shù)據(jù)時代具有局限性,對單個專家而言大數(shù)據(jù)分析不可行,而且科學(xué)哲學(xué)經(jīng)驗——理論這一單線理解模式也難以應(yīng)對大數(shù)據(jù)時代的認識論這種新情況。3.3.2

路徑變革:“數(shù)據(jù)驅(qū)動”知識發(fā)現(xiàn)數(shù)據(jù)驅(qū)動的知識發(fā)現(xiàn),是指利用統(tǒng)計學(xué)、機器學(xué)習(xí)等方法,從掌握的大數(shù)據(jù)中提取隱含在數(shù)據(jù)背后、人們事先不知道,但存在潛在效用、能被人理解的信息和知識的過程。其中,精細的概率模型、統(tǒng)計推理、數(shù)據(jù)挖掘與機器學(xué)習(xí)相結(jié)合,成為從大數(shù)據(jù)中提取知識的有力途徑。基于數(shù)據(jù)的知識發(fā)現(xiàn)催生了2007年圖靈獎獲得者吉姆·格雷提出的科學(xué)研究“第四范式”。他指出,科學(xué)發(fā)展經(jīng)歷了幾千年前的實驗科學(xué)(描述自然現(xiàn)象)、幾百年前的理論科學(xué)(用模型或歸納法進行科學(xué)研究)、計算科學(xué)(模擬復(fù)雜現(xiàn)象),而當(dāng)今“科學(xué)世界發(fā)生變化,對此毋庸置疑。3.3.2

路徑變革:“數(shù)據(jù)驅(qū)動”知識發(fā)現(xiàn)新的研究范式將首先基于計算機模擬或者儀器捕捉獲取數(shù)據(jù),然后利用軟件處理數(shù)據(jù),并在計算機中保存得到的知識或信息??茖W(xué)家僅在該過程的最后階段才開始審視他們的數(shù)據(jù)。這種數(shù)據(jù)密集型科學(xué)的技術(shù)和方法是如此不同,應(yīng)該將其作為科學(xué)探索的‘第四范式’以區(qū)別于計算科學(xué)”。3.3.2

路徑變革:“數(shù)據(jù)驅(qū)動”知識發(fā)現(xiàn)相對于“數(shù)據(jù)驅(qū)動”而言,當(dāng)前社會科學(xué)的主流研究范式可稱為“理論假設(shè)驅(qū)動”。社會科學(xué)家進行一項研究時,強調(diào)首先要通過廣泛的文獻調(diào)研以了解現(xiàn)有知識體系的前沿邊界,然后提出本研究可能給現(xiàn)有知識體系帶來的貢獻,即研究的基本“問題”所在;然后從該問題出發(fā),在一定的理論框架和必要的理論推演下提出待實證檢驗的“新知識”,也即“理論假設(shè)”,然后設(shè)計統(tǒng)計模型、收集數(shù)據(jù),最后利用所得數(shù)據(jù)驗證理論假定并得出結(jié)論。3.3.2

路徑變革:“數(shù)據(jù)驅(qū)動”知識發(fā)現(xiàn)可以預(yù)見,大數(shù)據(jù)時代的社會科學(xué)研究將充分吸收“數(shù)據(jù)驅(qū)動的知識發(fā)現(xiàn)”模式的優(yōu)勢,形成“數(shù)據(jù)驅(qū)動”和“理論假設(shè)驅(qū)動”相結(jié)合的新范式?!皵?shù)據(jù)驅(qū)動的知識發(fā)現(xiàn)”對社會科學(xué)研究產(chǎn)生挑戰(zhàn)并將重構(gòu)研究過程,但這并不意味著理論假設(shè)驅(qū)動的社會科學(xué)研究范式的終結(jié),兩者的結(jié)合將更好地認識世界。實際上,理論假設(shè)驅(qū)動的研究路徑為廣大社會科學(xué)研究者所接受的重要原因是,其在信息不足條件下帶來的高效性。在傳統(tǒng)的技術(shù)條件下,社會科學(xué)研究者搜集信息、處理數(shù)據(jù)面臨著高昂的成本?;谝延兄R體系提出理論假設(shè),有助于迅速聚焦研究的問題,而基于核心問題出發(fā)收集和處理數(shù)據(jù),有利于節(jié)約成本。但這種先給出理論假設(shè)的作法也往往局限了研究的理論創(chuàng)見,因為選擇了某一理論假設(shè)就意味著放棄了很多其他的甚至更有價值的理論假設(shè)。3.3.2

路徑變革:“數(shù)據(jù)驅(qū)動”知識發(fā)現(xiàn)隨著大數(shù)據(jù)技術(shù)的發(fā)展,收集和處理數(shù)據(jù)成本大大下降,研究者可避開現(xiàn)有理論和個人知識的束縛,在先驗假設(shè)盡可能少甚至沒有任何假設(shè)的情況下,通過大范圍的數(shù)據(jù)挖掘發(fā)現(xiàn)一些基本的模式,從中提出更重要的研究問題和理論假設(shè),并結(jié)合已有理論知識凝練理論假設(shè);然后基于理論假設(shè)對數(shù)據(jù)進行進一步的問題導(dǎo)向、更集中的深度挖掘來驗證假設(shè)的合理性;如果此時已有數(shù)據(jù)不能滿足假設(shè)驗證的要求,可進一步收集數(shù)據(jù),當(dāng)然也可以采用傳統(tǒng)方法收集小樣本數(shù)據(jù),以保證假設(shè)驗證的科學(xué)性。因此,大數(shù)據(jù)時代一項典型社會科學(xué)研究的實施過程將包括初步數(shù)據(jù)挖掘與問題發(fā)現(xiàn)、問題聚焦與理論假設(shè)確立、深度數(shù)據(jù)挖掘與假設(shè)檢驗、知識形成與研究結(jié)論等環(huán)節(jié),而基于數(shù)據(jù)的知識發(fā)現(xiàn)模式及大數(shù)據(jù)分析技術(shù)將深度融合于以上各個環(huán)節(jié)之中。3.3.3

手段變革:大數(shù)據(jù)服務(wù)于因果分析在傳統(tǒng)的社會科學(xué)研究范式中,學(xué)者研究的焦點是探究因果關(guān)系。盡管相關(guān)關(guān)系在大數(shù)據(jù)分析中得到凸顯,但“因果關(guān)系是人類理性行為與活動的基本依據(jù),人類理性本身不可能否定因果關(guān)系”。“大數(shù)據(jù)長于分析相關(guān)關(guān)系,而非因果關(guān)系。但是,如何從相關(guān)關(guān)系中推斷出因果關(guān)系,才是大數(shù)據(jù)真正問題所在。”在大數(shù)據(jù)時代,因果關(guān)系將得到更好的解釋,大數(shù)據(jù)不僅可以改進傳統(tǒng)方法,而且其著重探究的相關(guān)關(guān)系也有助于探究因果關(guān)系。3.3.3

手段變革:大數(shù)據(jù)服務(wù)于因果分析探究變量間因果關(guān)系的最佳方法是進行可控性試驗,基于試驗不僅可以將試驗對象分為控制組和實驗組,還可以避免外界因素干擾。然而,社會科學(xué)研究對象的特殊性,致使“進行實驗的特殊困難”,而且“在社會研究題材上進行受控實驗的可能性極為狹小”。在社會科學(xué)的研究中,通?;诟怕式嵌壤斫庖蚬捎媒y(tǒng)計方法判斷因果。在實證分析中,因果關(guān)系判斷的準確度通常受制于三因素:變量的內(nèi)生性、變量遺漏、樣本代表性。內(nèi)生性問題是因果關(guān)系難以判斷的主要原因,它是指“在一些情況下出現(xiàn)反向因果問題:解釋變量受到被解釋變量影響,而不是我們假設(shè)的影響被解釋變量”。3.3.3

手段變革:大數(shù)據(jù)服務(wù)于因果分析關(guān)于變量遺漏問題。現(xiàn)實生活中,聯(lián)系是普遍存在的,單因單果的現(xiàn)象很難出現(xiàn)。這意味著,構(gòu)建合理的模型應(yīng)該包括所有可能影響因變量的元素,而不應(yīng)該僅僅涉及兩個變量。但由于數(shù)據(jù)等原因的限制,常常導(dǎo)致變量遺漏問題。關(guān)于樣本代表性問題。如前所述,傳統(tǒng)研究范式中的數(shù)據(jù)通常來自抽樣調(diào)查,然而研究者的主觀選擇、客觀條件限制以及操作過程失誤等均可導(dǎo)致樣本選擇性偏誤,從而導(dǎo)致樣本代表性問題。大數(shù)據(jù)時代,大數(shù)據(jù)試圖提供的“全樣本”數(shù)據(jù)將令上述問題得到改善。首先,更多的數(shù)據(jù)意味著更多的工具變量備選,研究中可選擇更好的工具變量;其次,“全樣本”將解決抽樣帶來的樣本代表性問題;最后,不僅因數(shù)據(jù)缺失造成的變量遺漏問題將得以解決,還可以對“全樣本”數(shù)據(jù)進行篩選,以判斷哪些變量應(yīng)該包含于模型中。3.3.4

功能變革:分析與預(yù)測統(tǒng)一于政策社會科學(xué)研究重視因果判斷的根本原因在于,社會科學(xué)家普遍認為對因果關(guān)系的明確把握是理論運用于實際的前提。就政策問題而言,政策制定者需要知道改變某一個政策工具對社會產(chǎn)生何種影響。因為改變政策工具是對系統(tǒng)的外在干預(yù),如果政策和預(yù)期結(jié)果之間沒有正向因果關(guān)系,通過外生政策干預(yù)不能取得預(yù)期結(jié)果。因此,一種流行的看法是,盡管對變量間相關(guān)關(guān)系的掌握有助于進行預(yù)測分析,但離開了因果關(guān)系,相關(guān)關(guān)系(或者預(yù)測分析)將無助于政策實施。然而,在此我們想強調(diào)的是,盡管在過去社會科學(xué)研究中預(yù)測問題沒有得到應(yīng)有的重視,但預(yù)測問題在政策研究中同樣十分重要。3.3.4

功能變革:分析與預(yù)測統(tǒng)一于政策用天氣問題作為類比,政策問題可概括為兩類,即“雨傘”問題和“降雨”問題。所謂“雨傘”問題,即判斷是否會下雨以決定是否帶雨傘,這類問題也稱為預(yù)測問題或者對策問題。所謂“降雨”問題,即依據(jù)所需的降雨量決定采取何種措施,如向空中打多少干冰,這類問題也稱為干預(yù)問題,需要掌握降雨措施和降雨量之間的因果關(guān)系。盡管政策研究涉及上述兩類問題,但以往的社會科學(xué)研究主要關(guān)注后一類問題,即因果問題,而現(xiàn)有的數(shù)據(jù)挖掘技術(shù)則更關(guān)注前一類問題,即預(yù)測問題。3.3.4

功能變革:分析與預(yù)測統(tǒng)一于政策事實上,現(xiàn)實中政策問題往往是兩類問題的結(jié)合。為此,不妨進一步分析“降雨”問題。在我們向空中撒入干冰前,需要研究清楚干冰對降雨的影響,這是一個因果判斷問題。假定我們針對特定區(qū)域?qū)嵤┤斯そ涤?,那么該地區(qū)的實際降雨量不僅取決于撒入空中的干冰數(shù)量,還取決于風(fēng)向。我們可以控制干冰的數(shù)量,卻無法控制風(fēng)向。為此,只能選擇在風(fēng)向合適的時候?qū)嵤┤斯そ涤辏@意味著我們需要預(yù)測風(fēng)向。事實上,幾乎所有的政策干預(yù)都需要在時機合適時實施,因此對“時機”的預(yù)測是十分必要的。計算社會學(xué)發(fā)展PART043.43.4計算社會學(xué)發(fā)展所謂“新計算社會學(xué)”是社會學(xué)界借助計算機、互聯(lián)網(wǎng)與人工智能技術(shù)等現(xiàn)代科技手段,利用大數(shù)據(jù)技術(shù)等新方法來獲取數(shù)據(jù)與分析數(shù)據(jù),從而研究與解釋社會的一種新的范式或思維方式,其目的是要克服既有社會學(xué)研究方法的局限與不足,達到對人類行為與社會運行規(guī)律的真實認知與科學(xué)解釋。計算社會學(xué)的發(fā)展是大數(shù)據(jù)時代社會學(xué)發(fā)展的必然結(jié)果。計算機科學(xué)、互聯(lián)網(wǎng)與人工智能技術(shù)的發(fā)展是計算社會學(xué)發(fā)展的基礎(chǔ)條件,而社會學(xué)家對社會學(xué)研究新方法的不懈探索與追求,是計算社會學(xué)發(fā)展的內(nèi)在動力。3.4.3計算社會學(xué)發(fā)展的思考3.4.1計算社會學(xué)的發(fā)展3.4.2計算社會學(xué)發(fā)展的五大內(nèi)容計算機科學(xué)、互聯(lián)網(wǎng)與人工智能技術(shù)的發(fā)展是計算社會學(xué)發(fā)展的基礎(chǔ)條件,而社會學(xué)家對社會學(xué)研究新方法的不懈探索與追求,是計算社會學(xué)發(fā)展的內(nèi)在動力。3.4計算社會學(xué)發(fā)展3.4.1

計算社會學(xué)的發(fā)展社會學(xué)從產(chǎn)生、發(fā)展到現(xiàn)在,所走過的是一條坎坷不平的道路,正如美國社會學(xué)家柯林斯和馬科夫斯基所說的,社會學(xué)的確是一門很艱難的科學(xué),這是因為社會學(xué)在研究方法上經(jīng)歷了一個困難的探索過程。3.4.1

計算社會學(xué)的發(fā)展20世紀50年代,社會學(xué)研究方法開始被作為重要問題進行探索并引起爭論。此時,西方社會學(xué)的定量研究正迅速發(fā)展成為主流研究方法。例如,1956年在美國紐約召開了一次“社會測量大會”,聚集了一大批頂尖的社會科學(xué)學(xué)者,對社會科學(xué)研究方法的發(fā)展提出了多種意見與構(gòu)想。心理學(xué)家史蒂文斯提出社會科學(xué)研究需要測量手段的更新,社會學(xué)家拉扎斯菲爾德提出需要關(guān)注定性研究與定量研究之間的關(guān)系問題,等等。這次會議對此后包括社會學(xué)在內(nèi)的社會科學(xué)研究方法的發(fā)展起到了重要的推動作用,進一步提高了定量方法在社會學(xué)研究中的主導(dǎo)地位。3.4.1

計算社會學(xué)的發(fā)展進入20世紀70年代后,由于計算機的發(fā)展與廣泛使用,以及由此所帶來的各種數(shù)據(jù)分析統(tǒng)計軟件的問世,社會學(xué)研究在大樣本問卷調(diào)查、數(shù)據(jù)的多變量統(tǒng)計建模與分析方面,達到了一個前所未有的水平。與此同時,人們也在積極探索其他研究方法,如進行社會科學(xué)實驗和開展社會現(xiàn)象的計算機建模研究等等。盡管如此,社會學(xué)研究方法所面臨的問題似乎越來越多。有研究專家認為,現(xiàn)在用于研究社會和社會關(guān)系的所有方法,包括定量與定性方法,都存在局限性。其中最明顯的矛盾在研究方法上,社會學(xué)也因此而分化為不同的陣營。社會學(xué)研究方法所面臨的困境,實際上是人類行為研究所受時代條件限制的反映。大數(shù)據(jù)時代的到來,正在為社會學(xué)研究方法突破困境創(chuàng)造條件。3.4.1

計算社會學(xué)的發(fā)展20世紀90年代中后期以來,一系列技術(shù)進步使得社會學(xué)研究方法的進一步創(chuàng)新成為可能,其中最重要的成就表現(xiàn)在四個方面:(1)社會網(wǎng)絡(luò)理論與研究方法的發(fā)展;(2)人工智能的發(fā)展帶來新的數(shù)據(jù)處理系統(tǒng)的問世;(3)計算機模擬領(lǐng)域內(nèi)基于代理者模擬方法的發(fā)展;(4)互聯(lián)網(wǎng)的快速發(fā)展,特別是移動互聯(lián)網(wǎng)時代的到來。2009年,包括哈佛大學(xué)教授拉澤爾在內(nèi)的15名頂級學(xué)者正式提出“計算社會科學(xué)”這一概念。專家們預(yù)言一個以新電腦技術(shù)、互聯(lián)網(wǎng)為基礎(chǔ),具有無限可能性的計算社會科學(xué)的產(chǎn)生正在成為現(xiàn)實,甚至在一些互聯(lián)網(wǎng)大廠中,也開始了計算社會科學(xué)的研究。3.4.1

計算社會學(xué)的發(fā)展過去,人們只能夠獲取間斷的、片面性的社會數(shù)據(jù),而如今,社會科學(xué)家搜集與處理海量數(shù)據(jù)的能力得到空前提升,這正是計算社會科學(xué)得以產(chǎn)生的一個重要原因。另一個原因是認知科學(xué)的發(fā)展。人類對自身認知機制的深入了解,神經(jīng)生物學(xué)、計算機科學(xué)以及其他學(xué)科的融合,為人類行為研究的計算機模擬提供了條件,新技術(shù)的應(yīng)用使經(jīng)濟學(xué)、社會學(xué)、政治學(xué)等社會科學(xué)的研究進入一個新的時代。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容新的計算社會學(xué)的目標是借助各種與社會學(xué)研究相關(guān)的新技術(shù)、新工具、新手段,克服以往社會學(xué)研究中存在的各種缺陷與障礙,提高社會學(xué)研究的科學(xué)性與有效性,開創(chuàng)社會學(xué)發(fā)展的新時代。要實現(xiàn)這個目標,必須實現(xiàn)社會學(xué)研究各個環(huán)節(jié)、各個方面的創(chuàng)新,因此新計算社會學(xué)實際上是一個全面創(chuàng)新的社會學(xué)研究方法體系。根據(jù)對現(xiàn)已發(fā)表的論文和在會議上展示的研究成果的分析,研究者將其劃分為五個互相關(guān)聯(lián)的組成部分:大數(shù)據(jù)的獲取與分析、質(zhì)性研究與定量研究的融合、互聯(lián)網(wǎng)社會實驗研究、計算機社會模擬研究和新型社會計算工具的研制與開發(fā)。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容(1)大數(shù)據(jù)的獲取與分析。數(shù)據(jù)、資料的獲取與分析,是社會學(xué)研究的兩大關(guān)鍵問題,也正是在這兩個環(huán)節(jié)上,社會學(xué)研究受到的批評和詬病甚多。大數(shù)據(jù)的獲取與分析,有望為解決問題找到新的突破口。未來的研究可以從文本內(nèi)容、選舉活動、商業(yè)行為、地理位置、健康信息等數(shù)據(jù)著手,通過大規(guī)模與時序性數(shù)據(jù)的研究改變政治學(xué)乃至社會科學(xué)的基礎(chǔ)。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容大數(shù)據(jù)社會學(xué)研究所采用的數(shù)據(jù)量遠大于傳統(tǒng)的實證社會學(xué)研究。大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別主要在于三個方面:第一,傳統(tǒng)數(shù)據(jù)樣本量一般較小,而大數(shù)據(jù)論文則動輒數(shù)十萬、上百萬,大數(shù)據(jù)環(huán)境下,樣本幾乎等于總體,研究者甚至沒有進行抽樣的必要。第二,傳統(tǒng)數(shù)據(jù)常用問卷調(diào)查方法獲取,數(shù)據(jù)主觀性高、可信性問卷獲得,而是在現(xiàn)實生活中自動形成,可信度大于傳統(tǒng)問卷調(diào)查數(shù)據(jù)。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容第三,傳統(tǒng)數(shù)據(jù)的產(chǎn)生過程是“搜集”,設(shè)計問卷后進行調(diào)查,問卷的針對性強,但問卷的應(yīng)用范圍受到限制,為一個研究而進行的問卷數(shù)據(jù)搜集很難很好地應(yīng)用于另一項研究,而大數(shù)據(jù)社會學(xué)研究則重在數(shù)據(jù)的“挖掘”,客觀數(shù)據(jù)并不為任何一個課題而產(chǎn)生,而是對真實世界的自然記錄,有利于研究者充分發(fā)揮社會學(xué)的想象力,可以挖掘的數(shù)據(jù)無窮無盡,可供研究的領(lǐng)域沒有邊界。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容(2)定性研究與定量研究的融合。如何更加有效地利用文本、影音等質(zhì)性資料開展研究,是社會學(xué)長期以來面臨的難題。有效研究方法的缺乏,造成了質(zhì)性研究與定量研究之間一直無法彌合的鴻溝。大數(shù)據(jù)時代的到來,為社會學(xué)的發(fā)展提供了更加有效的研究方法與研究工具,使定量研究與定性研究的融合成為可能。劉易斯等更提出,大數(shù)據(jù)環(huán)境下,計算機方法與人工處理的混合使用,可以讓傳統(tǒng)的“內(nèi)容分析”方法得到升華。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容(3)社會學(xué)互聯(lián)網(wǎng)實驗研究。社會學(xué)的研究方法體系中早就有實驗方法的位置,而且也有運用實驗方法開展社會學(xué)研究的先例。但社會學(xué)界對實驗方法一直存有戒心,因為運用實驗方法來研究社會現(xiàn)象的確存在諸多難以克服的弊端和障礙。運用互聯(lián)網(wǎng)這個平臺來進行社會學(xué)的實驗研究,是一種創(chuàng)新,而且有可能使實驗法成為未來社會學(xué)研究的主流方法。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容麻省理工學(xué)院的森托拉對1528名實驗參與者進行的社會網(wǎng)絡(luò)中行為傳播的研究、特維克瓦與梅西進行的關(guān)于“慷慨”的社會“傳染”實驗都是社會學(xué)互聯(lián)網(wǎng)實驗研究的上佳之作。范德里特等關(guān)于個體成就的互聯(lián)網(wǎng)實驗更是通過四個公眾網(wǎng)站,進行了四場社會學(xué)實驗,成功地實現(xiàn)了互聯(lián)網(wǎng)實驗的“組合拳”研究。社會學(xué)互聯(lián)網(wǎng)實驗是一種全新的實驗方法,是真正理想的在自然條件下進行的社會實驗研究。這種實驗研究的優(yōu)勢在于,它不僅可以消除傳統(tǒng)社會實驗研究存在的某些弊端,如“霍桑效應(yīng)”等,尤其是不受時間和空間的限制,這為社會學(xué)提供了通過互聯(lián)網(wǎng)實驗研究人類行為與社會現(xiàn)象的無限可能性,設(shè)計巧妙的互聯(lián)網(wǎng)社會實驗將會極大地擴展和豐富社會學(xué)家的社會學(xué)想象力。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容(4)ABM模擬方法在社會學(xué)研究中的應(yīng)用。社會學(xué)的計算機模擬研究方法已經(jīng)發(fā)展到第三代,即“基于代理的模擬方法(ABM)”。最早的社會學(xué)計算機模擬研究產(chǎn)生于20世紀60年代,其理論基礎(chǔ)是結(jié)構(gòu)功能主義學(xué)說,重視的是對宏觀變量如組織、企業(yè)、城市、人口發(fā)展變化等的模擬,也就是在歷史數(shù)據(jù)的支持下,模擬宏觀社會現(xiàn)象的演化路徑。從20世紀70年代開始,微觀模擬逐步取代宏觀模擬。研究者通過對微觀個體行為的觀察與測量獲取數(shù)據(jù),由此對個體的行為進行演化模擬與推測,了解個體行為決策的機制。3.4.2

計算社會學(xué)發(fā)展的五大內(nèi)容20世紀90年代后,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論