




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
-11-中國工商銀行金融青年論壇論文中國工商銀行金融青年論壇論文互聯(lián)網金融的健康發(fā)展與風險管理互聯(lián)網金融的健康發(fā)展與風險管理大數(shù)據(jù)的源起演進與贏利邏輯大數(shù)據(jù)的源起演進與贏利邏輯——基于金融和營銷業(yè)的部分實例202014年7月大數(shù)據(jù)的源起演進與贏利邏輯——基于金融和營銷業(yè)的部分實例蔡寧偉摘要:2005年以后,針對大數(shù)據(jù)的研究層出不窮。但是,仍存在兩大亟需解決的問題:一是對大數(shù)據(jù)本質的認識不足,忽視對其源起和演進的探索;二是對大數(shù)據(jù)贏利的關鍵點展開不足,未能全面展示大數(shù)據(jù)贏利的邏輯內涵。本研究嘗試彌補上述兩大認識不足。通過定義梳理對比,發(fā)掘大數(shù)據(jù)的本質特征、獲取特質、優(yōu)勢應用和現(xiàn)實意義,說明大數(shù)據(jù)的來龍去脈。通過列舉部分金融業(yè)和相關企業(yè)的實例,詮釋大數(shù)據(jù)的贏利步驟、特征和目的,明確縱橫向大數(shù)據(jù)的優(yōu)勢,并提出未來大數(shù)據(jù)的五類價值發(fā)現(xiàn)和發(fā)展展望。一、引言2005年特別是2010年以后,社會對于“大數(shù)據(jù)”的研究呈井噴式的增長。這種增長一方面源自理論研究的不斷推動,Nature和Science雜志于2008年、2011年相繼推出專刊,專題介紹大數(shù)據(jù);一方面源自實踐應用的提升,2012年美國等發(fā)達國家對大數(shù)據(jù)的不斷重視,啟動“大數(shù)據(jù)研究與開發(fā)計劃”(BigDataResearchandDevelopmentInitiative),引導多國將其提上國家戰(zhàn)略的議程;還有一方面源自熱點新聞的持續(xù)聚焦,2013年“斯諾登事件”就安全部門秘密監(jiān)控的猛烈爆料與持續(xù)發(fā)酵,引發(fā)公眾對大數(shù)據(jù)隱私泄漏的警惕和好奇。由此,學界和產業(yè)界都展開了對大數(shù)據(jù)的研究和探索,取得了一定成果;一些發(fā)達國家和先進企業(yè)已經將大數(shù)據(jù)的分析應用到實際工作中,取得了一定成效。但是,這一階段的研究和實踐還存在一些亟需解決的問題,對大數(shù)據(jù)本質及其贏利關鍵的說明與解釋仍然不足。主要表現(xiàn)為兩個方面:一是對大數(shù)據(jù)本質的認識不足,一些研究片面認識其是基于物聯(lián)網、社交網絡或“云計算”的時代產物,而忽視對其源起和演進的探索;二是對大數(shù)據(jù)贏利的關鍵點展開不足,研究未能全面展示大數(shù)據(jù)贏利的邏輯內涵,只看現(xiàn)象不看原因,對其價值取向和趨勢缺乏系統(tǒng)梳理。因此,無論是學界和企業(yè)界抑或大眾對于大數(shù)據(jù)如何產生暨怎樣發(fā)展、以什么方式贏利等關鍵問題的認識仍然模糊甚至存在分歧。大數(shù)據(jù)的定義與內涵大數(shù)據(jù)的贏利與邏輯大數(shù)據(jù)的定義與內涵大數(shù)據(jù)的贏利與邏輯大數(shù)據(jù)的源起與演進大數(shù)據(jù)的特征與意義首次嘗試建構模型初次提出認知地圖首次嘗試建構模型初次提出認知地圖全面梳理歸納對比中外學者組織圖1大數(shù)據(jù)獲取渠道與贏利邏輯之研究設計本研究嘗試彌補上述兩大認識不足,通過列舉部分金融業(yè)和相關企業(yè)的實例,說明大數(shù)據(jù)的前世今生,詮釋大數(shù)據(jù)的贏利邏輯,并提出大數(shù)據(jù)未來的價值發(fā)現(xiàn)和發(fā)展展望。在此,我們進行了圖一中的研究設計,嘗試通過比較全面的對比、梳理和歸納,來建構大數(shù)據(jù)的演進過程與贏利模型;其中上部是研究的主要過程和結果,下部是對應采取的研究方法和意義。二、大數(shù)據(jù)的定義與內涵事實上,西方早在20世紀80年代,就已經有了大數(shù)據(jù)的提法(朱東華、張嶷、汪雪鋒、李兵、黃穎、馬晶、許幸榮、楊超、朱福進,2013)。我國針對大數(shù)據(jù)的研究相對起步相對較晚,在20世紀80和90年代已經出現(xiàn)了與大數(shù)據(jù)相關的一些概念,如“樣本”(Sample)、“大樣本”、“全樣本”、“抽樣”、“大數(shù)據(jù)流”、“大數(shù)據(jù)量”、“海量數(shù)據(jù)”、“數(shù)據(jù)庫”等等。雖然這些概念與大數(shù)據(jù)本身截然不同,但至少可以作為技術層面了解和分析大數(shù)據(jù)的視角、手段與方法。目前,學者對于大數(shù)據(jù)的概念眾說紛紜,在此本研究截取中外學者和組織具有代表性的觀點,通過文本分析和梳理歸納,對比和解析大數(shù)據(jù)的定義與內涵。表1大數(shù)據(jù)的代表性定義與特征提出者國別定義特征Manyika、Chui、Brown、Bughin、Dobbs、Roxburgh、Byers(2011)美意指一般數(shù)據(jù)庫軟件難以獲取、存儲、管理和分析的大容量數(shù)據(jù)非一般、大容量Mayer-Sch?nberger、Cukier(2012)英意指為人類的生活創(chuàng)造前所未有的可量化的維度,開啟重大的時代轉型,其核心是預測參見[英]維克托·邁爾-舍恩伯格、肯尼思·庫克耶.《大數(shù)據(jù)時代》[M].杭州:浙江人民出版社,2012年12月第一版,1-103??闪炕?、轉型、預測Gartner(2013)美意指在一個或多個維度上超出傳統(tǒng)信息技術的處理能力的極端信息管理和處理問題參見參見http://,2013年1月1日;它是一家知名的信息技術顧問咨詢公司。超乎尋常維基百科(Wiki)(2014)無意指無法在一定時間內用常規(guī)軟件工具對其內容進行抓取、管理和處理的數(shù)據(jù)集合參見參見,2014年3月8日。處理時間長、數(shù)據(jù)集合國家科學基金會(NSF)(2013)美意指由科學儀器、傳感設備、互聯(lián)網交易、電子郵件、音視頻軟件、網絡點擊流等多種數(shù)據(jù)源生成的大規(guī)模、多元化、復雜、長期的分布式數(shù)據(jù)集參見參見,2013年1月1日。來源多樣、規(guī)模大、復雜、長期、數(shù)據(jù)集合李璠、賈鴻飛(2012)中意指用來描述數(shù)據(jù)規(guī)模巨大、數(shù)據(jù)類型復雜的數(shù)據(jù)集,其規(guī)模已經超出普通的數(shù)據(jù)庫管理工具在可容忍的運行時間內進行數(shù)據(jù)的捕獲、存儲和處理的能力規(guī)模巨大、類型復雜、處理難度高李國杰(2012)中意指無法在可容忍的時間內用傳統(tǒng)IT技術和軟硬件工具對其進行感知、獲取、管理和服務的數(shù)據(jù)集合處理時間長、數(shù)據(jù)集合互聯(lián)網數(shù)據(jù)中心(IDC)(2013)中意指為了更經濟更有效地從高頻率、大容量、不同結構和類型的數(shù)據(jù)中獲取價值而設計的新一代架構和技術,描述信息爆炸時代的海量數(shù)據(jù),并命名與之相關的技術發(fā)展與創(chuàng)新參見鄭玲微.《大步跨入大數(shù)據(jù)時代》[J].杭州:《信息化建設》,2013(1):11-13。高頻率、大容量、不同結構類型、技術創(chuàng)新香山會議(2013)中意指數(shù)字化生存時代的新型戰(zhàn)略資源,是驅動創(chuàng)新的重要因素,正在改變人類的生產和生活方式參見石勇.《數(shù)據(jù)挖掘與大數(shù)據(jù)在金融與銀行領域的應用及前景》[R].北京:大數(shù)據(jù)專題報告,2014年2月22日。戰(zhàn)略資源、驅動創(chuàng)新、改變現(xiàn)狀就大數(shù)據(jù)本身而言,綜合表一中的定義,我們認為學者公認的大數(shù)據(jù)主要有以下特征。一是容量特別巨大(Volume),不僅是TB(1000GB)、PB(1000TB)或者EB(1000PB)量級,據(jù)相關研究論文或報告稱大數(shù)據(jù)總量基本以ZB(2的70次方)計量(方方,2012)。二是數(shù)據(jù)來源多樣(Variety),數(shù)字、文字、圖片、音頻、視頻、檔案文件、電子日志等都是其來源。三是處理要求迅速(Velocity),既然是海量數(shù)據(jù),從中要求提取的有用信息一定具有時效性;因此我們認為這一特征的實質來源于大數(shù)據(jù)的大容量,且更準確的應該作為對大數(shù)據(jù)處理的要求。四是具有一定價值(Value),但價值密度低、隱藏較深,需要深入挖掘和不斷“提純”。以商業(yè)銀行ATM監(jiān)控為例,一般監(jiān)控視頻要求存儲時間達3個月,但如果涉及某個客戶異常交易或者外部風險事件的可能僅有短短的1-3分鐘。五是處理要求精準性(Veracity),類似于處理要求迅速,我們認為這一特征的實質同樣源自大容量的特征,且應視為對大數(shù)據(jù)的處理要求;甘綺翠(2013)認為這一特征是企業(yè)維度的特征,更適合于企業(yè)要求。我們認為:不僅企業(yè),就連政府、高校等機構同樣有此需要,2013年曝光的美國“楞鏡門”事件從一定程度上驗證了政府等機構對大數(shù)據(jù)的這一特征需求。此外,對于戰(zhàn)略資源、驅動創(chuàng)新和改變現(xiàn)狀而言,我們認為這并非單指大數(shù)據(jù)的特征,而是其價值與意義的體現(xiàn)。在目前的實踐中,大數(shù)據(jù)已經起到了上述作用,并將進一步發(fā)揮它們的特長。就大數(shù)據(jù)的獲取而言,我們認為目前主要呈現(xiàn)如下三大特征:一是渠道越便利,數(shù)據(jù)獲取越易。以常見的調研問卷為例,以前調研獲取信息一般通過面對面問答或發(fā)放問卷及手寫錄入,后來發(fā)展到電話調研和計算機錄入回答,再后來開始了網上或手機填答,目前微信等渠道也可以開展調研和投票,廣受被調查者喜愛。二是溝通越豐富,數(shù)據(jù)信度越高。所謂數(shù)據(jù)的信度(Reliability),意指數(shù)據(jù)的可信程度,即重復調研前后數(shù)據(jù)結果的一致程度。在問卷調查中,很容易因為被調查者不理解題目的意思而引起回答的不一致,甚至前后矛盾,而問卷在設計時也往往設置這樣具有內在邏輯的題目,以驗證回答的信度。在以往發(fā)放回收問卷中,被調查者和調查者難以多次溝通,即便出現(xiàn)疑問被調查者也難以詢問;而目前采用微信、電子郵件等方式調研則更容易促進雙方的溝通,即便出現(xiàn)問題交流也比較及時、溝通成本較小,這是溝通方式或渠道豐富的益處。三是調研激勵越大,數(shù)據(jù)效度越高。所謂數(shù)據(jù)效度(Validity),意指數(shù)據(jù)的有效程度,即“所答即所問”。以往,國內的調研往往借助親朋好友的關系進行,沒有禮品、獎金等激勵,結果發(fā)現(xiàn)存在部分被調查者敷衍了事、心不在焉的情況,如問及個人收入選擇年收入為“0”等,即便其為某公司中層管理者。后來,逐步發(fā)展為給予現(xiàn)金、購物網站禮券、獎品、書籍、手機話費作為報酬的方式,由于采取按勞所得的原則,數(shù)據(jù)獲取愈加準確,有的調研長達30分鐘,多則給出高達100元的獎勵。三、大數(shù)據(jù)的源起與演進綜合上述定義,不難看出,大數(shù)據(jù)研究的絕大多數(shù)內容與人們的生產生活休戚相關,是人們工作生活的數(shù)字化集合。因此,相當比例的大數(shù)據(jù)研究針對的是社會科學的研究。當然自然科學也需要大數(shù)據(jù),不過自然科學一定比例的數(shù)據(jù)來自更為穩(wěn)定、具有一定限制條件的實驗室,而不一定需要通過大數(shù)據(jù)的形式或途徑來獲取,有的數(shù)據(jù)可以直接通過觀測獲得。由于大數(shù)據(jù)具有上述針對性,因此其源起在一定程度上打上了社會科學的烙印,從而具有一定社會科學的特征。事實上,科學主要分為自然科學、社會科學和人文藝術三類。自然科學可以稱為科學,具有其特有的研究體系和方法,強調精確探索世界萬物的客觀規(guī)律;人文藝術則更多地偏向感性思考,并不追求準確,較少存在理性活動;社會科學主要研究人與社會的關系,借鑒了自然科學的理性方法,但具有自身感性變化的一面,兼故了自然科學與人文藝術的特征,是理性與感性的交集,被稱之為“準科學”。比如,以社會科學中的管理學為例,就被譽為“科學與藝術的合體”。因此,圖2中展示的三類科學之間也存在交叉和互補。個體個體組織織國家國計算概率論術家信息科學企事業(yè)單位大數(shù)據(jù)基礎學科群政數(shù)學統(tǒng)信文學藝術政府機構非贏利組織非贏利組織利組織家庭國際組織個人大數(shù)據(jù)縱橫向支持學科群自應用礎學科群數(shù)學統(tǒng)計學概率論計算機技術信息科學社會科學人文藝術應用來源自然科學國家和地區(qū)其他學科圖2大數(shù)據(jù)的源起與演進在大數(shù)據(jù)概念提出之前,人類已經對數(shù)據(jù)產生了濃厚的興趣。遠古時代,“結繩記事”就是一種數(shù)據(jù)記載和記錄創(chuàng)新;近現(xiàn)代,借鑒了自然科學研究方法的社會科學,其定量研究中的抽樣、取樣、樣本分析或者質性研究中的案例研究實際都是從大數(shù)據(jù)、大集合中提取具有代表性、典型性的部分“小數(shù)據(jù)”,從而分析和預測整體數(shù)據(jù)即大數(shù)據(jù)的全貌。因此,大數(shù)據(jù)的本質離不開數(shù)學、統(tǒng)計學、概率論、計算機技術和信息科學的學科群支持,也離不開高等數(shù)學與數(shù)理統(tǒng)計、生物學、社會學、經濟學、心理學和管理學等其他相關學科的理論補充。值得一提的是,就大數(shù)據(jù)的潛在應用指數(shù)而言,盡管零售行業(yè)以“啤酒與尿布”(Walmart)此營銷組合主要針對單身父親或去超市購物的父親,尿布與啤酒這兩種原本看似風馬牛不相及的商品擺在一起,使尿布和啤酒的銷量大幅增加;此組合的奧妙在于不僅滿足了男性角色的需要,更同時滿足了同一客戶作為父親角色即其幼小子女的需要。,“少女懷孕”(Target)此事件源自一位憤怒的美國父親對超市經理的投訴,認為其17歲的女兒絕不可能懷孕,而超市卻將嬰兒尿布和童車的優(yōu)惠券寄到他們家里;事實上,超市的廣告促銷并非失誤,而是針對每一位客戶的購物清單組合列出了下一步營銷的對象和舉措,而他的女兒在超市購買了某些測孕和備孕商品后被證實真的懷孕了。等經典大數(shù)據(jù)分析的案例備受關注,金融行業(yè)仍排名居首(Manyika、Chui、Brown、Bughin、Dobbs、Roxburgh、Byers,2011)。有學者預測,包括金融企業(yè)在內的企業(yè)正在放棄“以產品為中心”(Good-dominantLogic)轉變?yōu)椤耙苑諡橹行摹保⊿ervice-dominantLogic)(馮芷艷、郭迅華、曾大軍、陳煜波、陳國青,2013),或者稱之為“以客戶為中心”此營銷組合主要針對單身父親或去超市購物的父親,尿布與啤酒這兩種原本看似風馬牛不相及的商品擺在一起,使尿布和啤酒的銷量大幅增加;此組合的奧妙在于不僅滿足了男性角色的需要,更同時滿足了同一客戶作為父親角色即其幼小子女的需要。此事件源自一位憤怒的美國父親對超市經理的投訴,認為其17歲的女兒絕不可能懷孕,而超市卻將嬰兒尿布和童車的優(yōu)惠券寄到他們家里;事實上,超市的廣告促銷并非失誤,而是針對每一位客戶的購物清單組合列出了下一步營銷的對象和舉措,而他的女兒在超市購買了某些測孕和備孕商品后被證實真的懷孕了。從其數(shù)據(jù)來源來看,大數(shù)據(jù)的制造者、擁有者和使用者都比較多元,個體、群體、組織均參與其中,且個人信息與家庭、企業(yè)、政府等組織信息甚至國家信息相互交匯融合,數(shù)據(jù)量不斷增大,這與其多樣性的特征相一致。我們認為:政府、企業(yè)、非營利組織(科研機構、高校)、網絡與開放數(shù)據(jù)(個人、團隊)等都可能是大數(shù)據(jù)的擁有者。例如,稅務部門擁有很多企業(yè)和員工的收入數(shù)據(jù),住建部門擁有很多個體的房屋居住和交易數(shù)據(jù);商業(yè)銀行擁有所轄客戶的賬戶與交易行為數(shù)據(jù),快遞公司擁有大量客戶的信息和交易情況數(shù)據(jù);高校擁有大量的學生與畢業(yè)生信息數(shù)據(jù),醫(yī)院擁有一定量的患者信息及疾病治療數(shù)據(jù);咨詢機構和顧問公司擁有多年積累的項目調查數(shù)據(jù),還有一些個人建立了源于自身興趣和專業(yè)的數(shù)據(jù)庫。但是上述數(shù)據(jù)之間,因為數(shù)據(jù)所有者的職能、定位和監(jiān)管要求等,難以實現(xiàn)共享,于是一些企業(yè)逐步嘗試多元化經營,以期獲得更廣范圍的數(shù)據(jù)。例如:2012年建設銀行推出“善融商務”,從而終止與阿里巴巴的合作轉而獨立獲取有關數(shù)據(jù);2013年淘寶與天弘基金聯(lián)手推出“余額寶”,從而在一定程度上彌補了自身金融交易信息不足的短板;2014年工商銀行推出在線商城“融易購”,則在一定層面完善了社會數(shù)據(jù)缺失的弱勢;與之類似,2014年騰訊入股京東和大眾點評,努力豐富生活服務電商品類,旨在強化社會數(shù)據(jù)和交易數(shù)據(jù)的獲取,與此同時,百度收購糯米也是一例很好的佐證。如圖2所示,大數(shù)據(jù)的源起比較全面的展示了大數(shù)據(jù)的信息源、支持學科群和應用領域。其中,應用領域在此主要以科學類別概括說明,而從實踐上,大數(shù)據(jù)的應用主體往往又回到了其來源,例如個人、企業(yè)、非盈利組織、政府等都可能成為大數(shù)據(jù)的挖掘和使用主體。所以,在圖二中,來源還有一個箭頭從此出發(fā),直接與應用相聯(lián)系,這反映的是大數(shù)據(jù)的來源與應用主體可能同源。如是,通過圖二可以直觀展示大數(shù)據(jù)的來龍去脈與前世今生。四、大數(shù)據(jù)的優(yōu)勢與創(chuàng)新既然大數(shù)據(jù)與社會科學研究聯(lián)系比較緊密,又備受研究者和實踐者的關注,那么大數(shù)據(jù)一定有其獨特的優(yōu)勢和創(chuàng)新點。那么,大數(shù)據(jù)的獨特優(yōu)勢到底是什么?大數(shù)據(jù)的創(chuàng)新究竟如何體現(xiàn)?大家往往眾說紛紜、莫衷一是。我們認為:大數(shù)據(jù)的獨特優(yōu)勢正是在于其信息的全面,進而實現(xiàn)由局部數(shù)據(jù)向全面數(shù)據(jù)、由結果數(shù)據(jù)向過程數(shù)據(jù)、由總量數(shù)據(jù)向明細數(shù)據(jù)、由過時數(shù)據(jù)向實時數(shù)據(jù)的應用轉變,對應推動組織采取全面管理、流程管理、精益管理和敏捷管理的開展,從而可以采取創(chuàng)新的方法從中挖掘出個人或組織希望得到的、準確的、可靠的信息,提升分析、歸納與預測的信度和效度,進而有利于達成個體或組織目標。傳統(tǒng)數(shù)據(jù)傳統(tǒng)數(shù)據(jù)大數(shù)據(jù)管理變革目標愿景局部數(shù)據(jù)結果數(shù)據(jù)總量數(shù)據(jù)過時數(shù)據(jù)范圍維度導向維度層次維度時間維度優(yōu)勢應用全局數(shù)據(jù)過程數(shù)據(jù)明細數(shù)據(jù)實時數(shù)據(jù)全面管理過程管理精益管理敏捷管理質量控制流程再造戰(zhàn)略規(guī)劃風險規(guī)避圖3大數(shù)據(jù)的應用轉型與管理變革如圖3所示,大數(shù)據(jù)獨特優(yōu)勢是建立在其特征之上的,依據(jù)視角不同,可以分為四大維度。從范圍維度上上看,大數(shù)據(jù)實現(xiàn)了從局部數(shù)據(jù)向全局數(shù)據(jù)的轉型,擁有全量數(shù)據(jù)不再是空想,繼而有助于個體或組織實現(xiàn)全面管理和制定戰(zhàn)略規(guī)劃;從導向維度上看,大數(shù)據(jù)實現(xiàn)了從結果數(shù)據(jù)向過程數(shù)據(jù)的轉型參見陳新躍.《從大數(shù)據(jù)到價值挖掘》[R].北京:大數(shù)據(jù)報告,2014年2月14日。,過程導向更有助于發(fā)現(xiàn)和解決問題,繼而有助于個體或組織提升過程管理和實施流程再造;從層次維度上看,大數(shù)據(jù)實現(xiàn)了從總量數(shù)據(jù)向明細數(shù)據(jù)的轉型,各個粒度的數(shù)據(jù)可以實現(xiàn)分類分層聚焦,繼而有助于個體或組織實現(xiàn)精益管理和采取質量控制;從時間維度上看,大數(shù)據(jù)實現(xiàn)了從過時數(shù)據(jù)向實時數(shù)據(jù)的轉型,提供了基于當前情境的數(shù)據(jù)獲取和未來數(shù)據(jù)預測,繼而有助于個體或組織實施敏捷管理和采取風險規(guī)避。事實上,全面管理、過程管理、精益管理和敏捷管理等管理變革正是大量企業(yè)基于自身和外部數(shù)據(jù)的創(chuàng)新,在制造企業(yè)、組織運營、流程管理等領域得到了廣泛的應用。此外,戰(zhàn)略規(guī)劃、流程再造、質量控制、風險規(guī)避等可能成為個體或組織的主要目標愿景之一,這些目標本身也存在一定內在聯(lián)系,因此不能說哪一項是所謂“終極目標參見陳新躍.《從大數(shù)據(jù)到價值挖掘》[R].北京:大數(shù)據(jù)報告,2014年2月14日。為更好的展示大數(shù)據(jù)的優(yōu)勢與創(chuàng)新,我們首先需簡要回溯大數(shù)據(jù)的學科支持,特別是有關社會科學研究本體、客體及方法論的現(xiàn)狀和局限。眾所周知,社會科學研究一般包含研究主體即研究者、研究客體即研究對象兩大要素,研究和研究方法科學性的必然要求就是合理控制研究誤差。目前,有關研究方法的論文和論著一般都明確指出:研究誤差往往來源于樣本的抽樣大數(shù)據(jù)樣本意味著“全樣本”,即便如此,為保證時效性和控制成本,實現(xiàn)大數(shù)據(jù)處理要求快(Velocity)的要求,我們認為樣本的選擇即抽樣必不可少大數(shù)據(jù)樣本意味著“全樣本”,即便如此,為保證時效性和控制成本,實現(xiàn)大數(shù)據(jù)處理要求快(Velocity)的要求,我們認為樣本的選擇即抽樣必不可少——既要全面又要抽樣,從粗糙中尋求精確(石勇,2014)。在此,我們以社會科學研究中最為常見的一種研究方法:調查研究(SurveyResearch)為例,其研究目的在于對研究對象的特征和關系進行調查,并做統(tǒng)計分析和描述,即取得和分析資料(邱澤奇,2003)。這種研究方式的一個重要特征,是其在時間維度上的一次性,或者稱為單點性。因而,調查研究通常被稱作是一種橫截面研究,其優(yōu)勢在于針對性對性較強,便于實施,靈活性較大(何斌、鄭弘、李思瑩、董振寧,2013)。正是由于調查研究的橫剖特征,使其在具有大量優(yōu)點的同時,也存在著一些內在的不足和局限。這種局限性的一個主要體現(xiàn),就是調查研究對現(xiàn)象之間因果關系的推斷相對軟弱無力。由于“從社會調查中所獲得的這種抽掉時間框架的‘事實’中,人們往往比較容易發(fā)現(xiàn)不同現(xiàn)象相互之間的‘共變’特征,而比較難發(fā)現(xiàn)它們之間的‘因果’特征”,因此在解釋社會現(xiàn)象之間的因果關系方面,調查研究的方法存在著明顯的不足(風笑天,2006)。比如,其結果容易受到調查方案設計的缺陷或執(zhí)行過程中的偏差影響,又如調查者不配合或不如實作答等,所以用以保證問卷或量表信度和效度的工作需要一定的投入,也需要耗費較長的時間。對此,也有學者提出量化研究可以借鑒質性研究的優(yōu)勢,反之亦行,以實現(xiàn)優(yōu)勢互補(胡中鋒、黎雪瓊,2003),進而以順序、平行和交錯三種方式進行融合(陳忠衛(wèi),2013),例如采取仿真實驗、案例推演、沙盤模型、計算機決策等方法。大數(shù)據(jù)的出現(xiàn),恰恰可以在一定程度上解決上述問題,成為除了質性研究以外彌補調查研究和定量研究缺陷的另一種思路與途徑。以我們熟悉的金融業(yè)務為例,兩類誤差有如下典型案例。為避免第一類誤差,英國小額貸款公司Wonga利用大數(shù)據(jù)挖掘算法開展某些貸款業(yè)務,他們通過對客戶以往各種碎片化信息進行獲取和整理,用大量的數(shù)據(jù)還原客戶特征的全貌并建立貸款模型,同時根據(jù)不良貸款等風險信息不斷完善模型,從而有效控制風險。如今Wonga年利潤逾5億美金,其風險管理能力廣受業(yè)界好評(李璠、賈鴻飛,2012)。與之類似,阿里公司根據(jù)在淘寶網上中小企業(yè)的交易狀況篩選出財務健康和講究誠信的企業(yè),向他們發(fā)放無擔保貸款,目前已放貸300多億元,壞賬率僅為0.3%(鄔賀銓,2013)。為避免第二類誤差,金融行業(yè)可以利用大數(shù)據(jù)開展如下創(chuàng)新。例如,某商業(yè)銀行的一位信用卡客戶每月平均刷卡5次、刷卡金額1500元、打1次客服電話,且辦卡一年來從未收到或受理任何投訴;按照傳統(tǒng)的單一數(shù)據(jù)分析,該客戶應該是一位滿意度較高、風險流失較低的客戶。但如果通過大數(shù)據(jù)搜索到該客戶的微信,通過“某銀行”、“投訴”、“抱怨”、“生氣”、“不滿意”、“不方便”、“打不通”等相關“關鍵詞”的組合檢索,發(fā)現(xiàn)真實情況是:由于他的工資卡和信用卡不在同一家銀行,導致還款極為不便,好幾次打客服電話沒有接通,已多次在微信上抱怨,滿意度和忠誠度均較低,與傳統(tǒng)分析得出了截然不同的結論。綜上所述,大數(shù)據(jù)的內涵不僅僅是某一時點的截面數(shù)據(jù),更是一定時期積累的縱向數(shù)據(jù)。因此,大數(shù)據(jù)不僅可以為社會科學研究中基于演繹邏輯的定量研究廣泛使用,也可以為另一類研究方法即基于歸納邏輯的以案例研究(CaseStudy)、追蹤研究(PanelStudy)、扎根理論(GroundedTheory)、參與式觀察(ParticipantObservation)、實驗研究(ExperimentalStudy)、檔案研究(內容研究)(ArchivesStudy)等為代表的質性研究所引入和使用。本質上看,大數(shù)據(jù)因其來源多樣,從而可以通過不同渠道、維度、時段的數(shù)據(jù)進行相互驗證,更容易發(fā)現(xiàn)單一來源數(shù)據(jù)的不足和矛盾,從而實現(xiàn)多源交互檢驗。這一方式類似案例研究構建的“證據(jù)三角形”(Triangulation)(Yin,2004參見[美]Yin,R.,K.《案例研究設計與方法》[M].重慶:重慶大學出版社,2004年11月第一版,1-59、106-114。),通過多種途徑提高數(shù)據(jù)的信度和效度。參見[美]Yin,R.,K.《案例研究設計與方法》[M].重慶:重慶大學出版社,2004年11月第一版,1-59、106-114。五、大數(shù)據(jù)的贏利與邏輯既然大數(shù)據(jù)存在上述優(yōu)勢,那么大數(shù)據(jù)又是如何實現(xiàn)贏利的呢?大數(shù)據(jù)贏利需要遵循怎樣的邏輯?我們接下來將對圖二中的應用部分作進一步闡釋,并嘗試將大數(shù)據(jù)的贏利演進與其特征、目標相結合,以認知地圖(CognitiveMap)認知地圖也稱“心像圖”認知地圖也稱“心像圖”(MindMap)、“心智圖”(MentalMap)等,由Tolman于1960年代提出,以普通地圖的形式展示知識的有機結構;本研究采取廣義認知地圖的方法,是基于認知科學的人類對于事物及其相互之間關系的關聯(lián)圖示,可用于表達隱性知識的圖形(張凌,2012)。個體國家個體國家組織橫截面大數(shù)據(jù)時間積累縱向大數(shù)據(jù)大數(shù)據(jù)特征目標信息對稱減少誤差數(shù)據(jù)挖掘大數(shù)據(jù)精確定位提升績效長期追蹤尋找規(guī)律獲取渠道多樣容量大精準營銷優(yōu)化創(chuàng)新個性化數(shù)據(jù)企業(yè)核心數(shù)據(jù)處理要求快精確性戰(zhàn)略預測風險管理具有價值預測決策圖4大數(shù)據(jù)贏利的特征、目的與邏輯內涵(一)大數(shù)據(jù)的贏利步驟首先,從圖4大數(shù)據(jù)贏利演進的中間部分,即大數(shù)據(jù)贏利的邏輯內涵來看,組織若想實現(xiàn)大數(shù)據(jù)的價值基本需要采取以下五個步驟。一是從個體、組織、國家等大數(shù)據(jù)的源頭獲取數(shù)據(jù),一般而言,企業(yè)最初獲取或者日常獲取的這類數(shù)據(jù)往往是一種橫截面的數(shù)據(jù),即節(jié)點數(shù)據(jù),主要反映某一時間點的信息。因此,即便此時的數(shù)據(jù)涵蓋了方方面面,嚴格意義上講也只能稱為橫截面大數(shù)據(jù)。二是企業(yè)等數(shù)據(jù)搜集主體通過長時間的積累和追蹤,不斷累積橫截面的數(shù)據(jù),逐漸形成某一時間段的大數(shù)據(jù)。在研究上,這類數(shù)據(jù)被稱為縱向數(shù)據(jù),具有考量個體和組織行為習慣、特征偏好等功用。三是大數(shù)據(jù)搜集的主體通過數(shù)據(jù)挖掘,尋找大數(shù)據(jù)中隱含的內在聯(lián)系與因果關系,可以發(fā)現(xiàn)某些數(shù)據(jù)及其行為主體的規(guī)律。事實上,只有橫截面與縱向共享的全量數(shù)據(jù),才能稱為真正意義的大數(shù)據(jù)。四是即便企業(yè)擁有了大數(shù)據(jù),也不能直接通過它來實現(xiàn)贏利,需要在結合內在規(guī)律的同時通過發(fā)現(xiàn)其中的個性化數(shù)據(jù)信息信息,進而采取精準營銷、流程優(yōu)化、產品創(chuàng)新等手段。這一系列手段,是企業(yè)實現(xiàn)內部改進、提升對外服務的必要條件。五是即便企業(yè)不斷優(yōu)化改善,實現(xiàn)了營銷等方法上的準確定位與創(chuàng)新,企業(yè)仍然存在長期的發(fā)展挑戰(zhàn)。這時候,依托大數(shù)據(jù)進行中長期戰(zhàn)略預測、對顛覆性的小概率事件進行風險管理,將事后和事中風險前移到事前管理,可以使企業(yè)在解決“近憂”的同時兼故“遠慮”,保持企業(yè)的基業(yè)常青。(二)大數(shù)據(jù)的贏利特征從圖4大數(shù)據(jù)贏利演進的下部分,即大數(shù)據(jù)贏利的特征來看,前文提到的大數(shù)據(jù)特征始終貫穿大數(shù)據(jù)贏利邏輯的全生命周期。一是橫截面的大數(shù)據(jù)獲取主要體現(xiàn)了大數(shù)據(jù)獲取渠道的多樣性(Variety)、容量大等特征。二是縱向大數(shù)據(jù)的積累主要體現(xiàn)了大數(shù)據(jù)容量大(Volume)、價值密度低等特征,橫縱向大數(shù)據(jù)的集合更加復合展示了上述特征。三是正因大數(shù)據(jù)具有上述特征,因此在進行數(shù)據(jù)挖掘、規(guī)律尋找的之時,處理要求快(Velocity)便成為其通用的要求。不難看出,處理要求快實際并非大數(shù)據(jù)本身所具有,而是大數(shù)據(jù)處理主體的必然要求。四是更進一步,從發(fā)掘個性化數(shù)據(jù),實施精準營銷、優(yōu)化創(chuàng)新起,精確性(Veracity)也是處理大數(shù)據(jù)的必然要求。因此,類似處理要求快,精確性也并非大數(shù)據(jù)本身獨有,海量數(shù)據(jù)匯聚一起,準確需要處理主體來實施。五是對于企業(yè)等主體關注的有關戰(zhàn)略預測、風險管理的核心大數(shù)據(jù),必然具有較高的價值(Value),事實上,這一價值主要針對所需要的主體而言,即存在一種相對價值,并且這一價值的賦予和附加恰恰是實施主體通過搜集積累、數(shù)據(jù)挖掘、創(chuàng)新優(yōu)化等手段所累進的。例如,工商銀行已經實現(xiàn)了由事后監(jiān)督向基于操作風險監(jiān)控事中管理的戰(zhàn)略轉型,并創(chuàng)新地開展了事前預測,增強流程和系統(tǒng)的風險管控能力(易會滿,2013)。這一創(chuàng)新正是基于大數(shù)據(jù)的上述特征并應用于實踐,不斷改善公司治理,增強企業(yè)的核心競爭力,取得了良好的經營管理效益。(三)大數(shù)據(jù)的贏利目的從圖4大數(shù)據(jù)贏利演進的上部分,即大數(shù)據(jù)贏利的目標要求來看,源自大數(shù)據(jù)實施主體的要求與大數(shù)據(jù)贏利的步驟和特征休戚相關、相輔相承,從而形成一整套交互融合的邏輯體系。一是橫截面的大數(shù)據(jù)獲取主要解決信息不對稱的問題,避免因某些數(shù)據(jù)的缺失導致企業(yè)決策失誤,實現(xiàn)某一時點數(shù)據(jù)的對稱共享。二是僅僅有橫截面的大數(shù)據(jù)處理還遠遠不夠,需要企業(yè)通過自身、外包、外購、開源、交換等多種途徑積累更長時間段內的縱向數(shù)據(jù),最終建立縱橫向維度的大數(shù)據(jù)集合,以擁有足夠的數(shù)據(jù)資源較少甚至消除概率誤差、系統(tǒng)誤差、研究客體誤差和研究主客體溝通的“四大誤差”,為企業(yè)進一步挖掘數(shù)據(jù)價值提供基礎支撐。三是個性化數(shù)據(jù)挖掘用以實現(xiàn)精準定位的目的,無論外部精準營銷,還是內部流程診斷,個性化的數(shù)據(jù)必不可少,而通過大數(shù)據(jù)的不斷提煉和發(fā)掘,可以將某些個體的信息片段或者斷點連接起來,形成展示個體信息和習慣的全貌,獲得抽樣調查因果關系解釋不足的先天缺陷。四是進一步發(fā)掘企業(yè)關注的長期核心數(shù)據(jù)、小概率異常數(shù)據(jù)等,提煉事關企業(yè)戰(zhàn)略發(fā)展、宏觀經濟形勢變遷、極端概率風險事件的數(shù)據(jù),保障企業(yè)實現(xiàn)持續(xù)穩(wěn)健發(fā)展。五是無論上述哪一方面,實質都是為了助力企業(yè)內外部挖潛,確保企業(yè)實現(xiàn)贏利,幫助企業(yè)持續(xù)提升績效。六、大數(shù)據(jù)的價值與展望社會科學研究的一個重要目標,就是要探索和解釋不同社會現(xiàn)象(研究變量)之間的因果關系。而因果關系的基本條件之一,就是存在關系的兩種現(xiàn)象之間具有時間上先后順序。作為原因的現(xiàn)象要發(fā)生在前,作為結果的現(xiàn)象要發(fā)生在后(風笑天,2006)。正如Cook和Campbell(1986)以及Shadish、Cook和Campbell(2002)等提出有效的因果推論必須滿足三條準則:一是假定的原因和結果之間具有共變性,或者稱之為存在穩(wěn)定的關系;二是原因暫時優(yōu)先性,即原因必須發(fā)生在結果之前;三是能夠控制和排除可能的因果關系之間存在其他解釋的可能性,即除此原因之外沒有其他替代性的解釋。其中的準則之二,就是用以保證因果關系的時間順序,即先后順序的必要條件。大數(shù)據(jù)的出現(xiàn),為社會科學研究實現(xiàn)這一目標奠定了更為堅實的資源和信息基礎,其建構、解釋和預測的精確性(Veracity)甚至可以達到前所未有的高度。2014年,美國微軟紐約研究院的經濟學家Rothschild通過綜合博彩公司賠率、投票排行等大數(shù)據(jù)分析,以概率的形式成功預測了24項奧斯卡大獎中的21項,成功率高達87.5%參見,2014年3月4日。。無獨有偶,美國印第安納大學利用谷歌的心情分析工具,從海量網民的留言中歸納出六種心情,進而預測道瓊斯工業(yè)指數(shù),準確率高達87%(鄔賀銓,2013)。我們認為:通過一定規(guī)模的大數(shù)據(jù),更容易發(fā)現(xiàn)和解釋不同社會現(xiàn)象之間的因果關系,進而為個人、組織特別是以贏利為目的的制造和金融等企業(yè)提供更為方便、準確的金融產品和信息服務。具體來看,主要表現(xiàn)為以下五個方面:參見,2014年3月4日。(一)實現(xiàn)精準營銷大數(shù)據(jù)有助于企業(yè)實現(xiàn)精準營銷。前面提到的經典案例“啤酒與尿布”、“少女懷孕”等都是一定量級數(shù)據(jù)綜合分析的結果。盡管經過了大量客戶與實踐的檢驗,但仍不排除存在一定數(shù)量的促銷和廣告推送失誤。例如,不排除美國有的已婚女性也喜歡喝啤酒,也不排除已婚女性持有先生的信用卡幫助先生購買啤酒。但是,在更為廣闊的大數(shù)據(jù)面前,這些例外都會迎刃而解。例如,除了“啤酒與尿布”,鐘情啤酒的已婚女性可能還存在其他購物組合,如“啤酒與女士香水”、“啤酒與護發(fā)素”等等,如果企業(yè)發(fā)現(xiàn)這類組合,便可以將客戶從的單身父親類別中剔除,并建立新的客戶類別。在此基礎上,向客戶推送的營銷信息、金融產品也可以不斷完善,實現(xiàn)個性化、差異化與定制化。事實上,所謂垃圾信息只是用錯了地方、給錯了對象,一旦投送的客戶確實需要這些信息,便會“視為珍寶”,決不置之不理。依靠大數(shù)據(jù)作為支撐,垃圾短信、垃圾郵件、垃圾廣告都可以變廢為寶,延伸客戶關系管理(CRM)的范疇,建立企業(yè)與客戶更為緊密的聯(lián)系。(二)發(fā)掘新型產品大數(shù)據(jù)有助于企業(yè)發(fā)掘新型產品。在產品和服務的創(chuàng)新過程中,除了企業(yè)主動發(fā)起之外,來自客戶的需求也不容忽視。無論是客戶的客觀需要、抱怨投訴和意見建議,積少成多,便可以從中發(fā)現(xiàn)端倪。例如,一些客戶因持有不同銀行的信用卡或者在不同銀行貸款,需要每月定期去多家銀行或者登陸各銀行網銀還款,有銀行正是基于客戶“多頭還款”的問題開發(fā)了基于同一銀行卡的定期轉賬還款產品,很受這類客戶的歡迎。再如,一旦有客戶在網銀退出某類金融產品或者通過電話銀行、自助銀行放棄某項金融服務的使用,不妨在隨后的流程或界面上多問一句:可否請您告知我們放棄此類產品的原因?并列舉若干選項:A、操作不方便;B、未達預期收益;C、存在安全隱患;D、其他銀行有收益更好的產品……以及您還需要補充的情況等等。日積月累,這些信息更有助于了解客戶和競爭對手,進而不斷完善、豐富和改進金融產品與服務。(三)優(yōu)化內部流程大數(shù)據(jù)有助于企業(yè)優(yōu)化內部流程。除了外部客戶之外,企業(yè)員工這一內部客戶的感受和體驗也不容忽視?;诖髷?shù)據(jù)理念,可以協(xié)助企業(yè)尋找影響員工滿意度的關鍵瓶頸,梳理導致內部抱怨的流程要點,從而幫助企業(yè)進一步優(yōu)化流程,提高運營效率和服務質量。例如,通過系統(tǒng)監(jiān)控,可以發(fā)現(xiàn)員工在哪些環(huán)節(jié)操作時間過長,在哪些步驟容易出現(xiàn)失誤,并進一步分析有沒有員工可以在計劃時間內保質保量完成,為什么一些員工需要更多的時間,為什么一些員工會出現(xiàn)失誤。進而通過改進操作流程、完善運營系統(tǒng)、進一步培訓監(jiān)督等方式來共同提升員工的操作水平。事實上,20世紀80年代后出現(xiàn)的“全面質量管理”(TQM)、“戴明環(huán)”、“六希格瑪”(6)等管理理念正是基于企業(yè)內部數(shù)據(jù)分析、匯總的結果。而通過大數(shù)據(jù),還可以結合員工個體的日常行為、企業(yè)的重大事件等來共同預測、防范和控制一些小概率錯誤的影響,合理控制或降低事故的作用范圍和程度。(四)創(chuàng)新商業(yè)模式大數(shù)據(jù)有助于企業(yè)創(chuàng)新商業(yè)模式。相信在未來的若干時間,一批數(shù)據(jù)公司、顧問公司、數(shù)據(jù)倉儲公司、數(shù)據(jù)挖掘公司、分析統(tǒng)計公司、數(shù)據(jù)營銷策劃公司會應運而生,活躍在各個行業(yè);而一批企業(yè)數(shù)據(jù)庫、行業(yè)數(shù)據(jù)庫、政府數(shù)據(jù)庫會逐步建立,甚至有的數(shù)據(jù)庫會實現(xiàn)部分數(shù)據(jù)的開源共享,從而產生更大規(guī)模的數(shù)據(jù)使用與融合。當然,無論上述哪種商業(yè)模式,或者精準營銷、創(chuàng)新產品、優(yōu)化流程的哪個方面,企業(yè)或者個人都將付出一定技術與人力成本。因此,我們在此提示各類組織、個體,在選擇大數(shù)據(jù)挖掘處理之前,一定要先行了解和評估大數(shù)據(jù)分析運營的成本,從而結合自身實際客觀考量是親歷親為還是業(yè)務外包,是全面挖掘還是典型取樣,是自己自足還是開源共享??膳c預見的是,在不久的將來,一批基于大數(shù)據(jù)應用的企業(yè)整合、并購和外包浪潮會隨之到來,并深刻影響和改變我們的工作與生活。這一時期,更需要公民、企業(yè)與政府聯(lián)手,制定有關大數(shù)據(jù)應用與共享的系列法律和規(guī)則。(五)加強風險管理大數(shù)據(jù)還有助于提升風險管理水平。眾所周知,大數(shù)據(jù)是與互聯(lián)網相伴相生的,在密切人與人聯(lián)系的同時,相關風險事件也層出不窮。其中,以電話欺詐、信用卡欺詐、支付欺詐為代表的“三類欺詐”尤為突出,又與個人信息泄露和部分數(shù)據(jù)共享有著緊密關聯(lián)。例如,電話欺詐離不開個人信息,信用卡欺詐一般建立在原卡克隆或密碼竊取的基礎上,支付欺詐常?;谔摷倬W站和偽造鏈接、成為電話和信用卡欺詐的落腳點甚至應用了黑客技術偷窺客戶的交易信息。于是,這給網上支付帶來了相當?shù)奶魬?zhàn),如何提
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三農產品質量檢測技術規(guī)范手冊
- 收銀機銷售合同協(xié)議書
- 人防安裝施工方案
- 鋼結構網架施工方案
- 防火專項施工方案
- 人工河道引水施工方案
- 伊犁不銹鋼網施工方案
- 廠房圍墻文明施工方案
- 單線雙向道路施工方案
- 墻面電路改造施工方案
- DB5101-T 71-2020 成都市電動汽車充電設施 安全管理規(guī)范
- 2025年七臺河職業(yè)學院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 監(jiān)理人員安全培訓考試試卷(答案)
- 2025年北京電子科技職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- xxx項目財務評價報告
- 2024年山東交通職業(yè)學院高職單招語文歷年參考題庫含答案解析
- 團隊賦能培訓
- 2025年廣東廣州市黃埔區(qū)第二次招聘社區(qū)專職工作人員高頻重點提升(共500題)附帶答案詳解
- 第一單元第2課《人工智能應用》說課稿 2023-2024學年浙教版(2023)初中信息技術八年級下冊
- 2025年寫人要抓住特點
- 萬兆小區(qū)方案及實施路徑
評論
0/150
提交評論