版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第1章
緒論演講人2024/12/24本章學(xué)習(xí)目標(biāo)了解大數(shù)據(jù)的基本概念、基本特征、構(gòu)成與容量單位了解大數(shù)據(jù)的價(jià)值與作用、大數(shù)據(jù)時(shí)代的新變革了解大數(shù)據(jù)處理的基本環(huán)節(jié)和支撐技術(shù)了解大數(shù)據(jù)安全和共享的基本概念了解大數(shù)據(jù)的發(fā)展現(xiàn)狀和發(fā)展趨勢(shì)理解數(shù)據(jù)要素在社會(huì)、經(jīng)濟(jì)、生活中的重要性,培養(yǎng)“用數(shù)據(jù)說話”的理念了解我國大數(shù)據(jù)發(fā)展現(xiàn)狀和政策法規(guī),培養(yǎng)科技報(bào)國的情懷與擔(dān)當(dāng)目錄1.1引言1.2數(shù)據(jù)1.3大數(shù)據(jù)的相關(guān)概念1.4大數(shù)據(jù)的意義、價(jià)值與作用1.5大數(shù)據(jù)時(shí)代的新變革1.6大數(shù)據(jù)處理的主要環(huán)節(jié)1.7大數(shù)據(jù)的安全和共享1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)1.9小結(jié)1.1引言
當(dāng)前世界正處于向數(shù)字化全面轉(zhuǎn)型的過程中,數(shù)據(jù)是數(shù)字經(jīng)濟(jì)時(shí)代的關(guān)鍵生產(chǎn)要素,是國家基礎(chǔ)性戰(zhàn)略資源,是推動(dòng)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展的重要引擎。隨著信息技術(shù)和人類生產(chǎn)生活交匯融合,互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速普及,全球數(shù)據(jù)呈現(xiàn)爆發(fā)式增長、海量集聚的特點(diǎn),對(duì)經(jīng)濟(jì)發(fā)展、社會(huì)治理、國家管理、人民生活都產(chǎn)生了重大影響。
大數(shù)據(jù)作為一種資源、技術(shù)、工具和方法,已經(jīng)深刻影響了人們生活的各個(gè)方面,并對(duì)人類認(rèn)知世界及與世界交流的方式提出了全新的挑戰(zhàn)。正如維克托邁爾舍恩伯格(ViktorMayer-Sch?nberger)在《大數(shù)據(jù)時(shí)代》一書中指出的:“大數(shù)據(jù)帶來的信息風(fēng)暴正在變革我們的生活、工作和思維,大數(shù)據(jù)開啟了一次重大的時(shí)代轉(zhuǎn)型”。
隨著大數(shù)據(jù)技術(shù)進(jìn)入人類活動(dòng)的各個(gè)領(lǐng)域,我們?cè)诶么髷?shù)據(jù)的同時(shí)也在源源不斷地產(chǎn)生大數(shù)據(jù),并在實(shí)踐中逐漸對(duì)大數(shù)據(jù)中所蘊(yùn)含的價(jià)值有了清晰的認(rèn)識(shí),迫切需要運(yùn)用大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)的分析和知識(shí)的挖掘,提升認(rèn)識(shí)世界、發(fā)現(xiàn)規(guī)律和預(yù)測(cè)未來的能力。1.2數(shù)據(jù)
數(shù)據(jù)是對(duì)事實(shí)或觀察結(jié)果的記錄,是對(duì)客觀事物的邏輯歸納,是用于表示客觀事物的未經(jīng)加工的原始素材。按照《中華人民共和國數(shù)據(jù)安全法》給出的定義,本法所稱數(shù)據(jù),是指任何以電子或者其他方式對(duì)信息的記錄。由此可見,數(shù)據(jù)本身可以有豐富的表現(xiàn)形式。它不僅指狹義上的數(shù)字,還可以指具有一定意義的文字、字母、數(shù)字符號(hào)的組合、圖形、圖像、視頻、音頻等,也指客觀事物的屬性、數(shù)量、位置及其相互關(guān)系的抽象表示。數(shù)據(jù)可以是連續(xù)的值,如聲音、圖像,被稱為模擬數(shù)據(jù);也可以是離散的,如符號(hào)、文字,被稱為數(shù)字?jǐn)?shù)據(jù)。
從計(jì)算機(jī)科學(xué)的角度,數(shù)據(jù)是所有能輸入計(jì)算機(jī)并被計(jì)算機(jī)程序處理的符號(hào)的總稱,是用于輸入計(jì)算機(jī)進(jìn)行處理,具有一定意義的數(shù)字、字母、符號(hào)和模擬量等的通稱。在計(jì)算機(jī)系統(tǒng)中,數(shù)據(jù)以二進(jìn)制信息單元0、1的形式表示。1.2數(shù)據(jù)
從人類認(rèn)知的角度,數(shù)據(jù)是匯聚起來用于認(rèn)知的原材料,信息是人類可以理解和認(rèn)知的事物的狀態(tài)和聯(lián)系。從“數(shù)據(jù)—信息—知識(shí)—智慧”的DIKW(Data-Information-Knowledge-Wisdom)模型來看(見圖1-1),數(shù)據(jù)是信息的表現(xiàn)形式和載體,而信息是經(jīng)過加工的數(shù)據(jù)。數(shù)據(jù)本身沒有意義,數(shù)據(jù)只有通過人類的分析和處理,才能成為對(duì)人類有用、具有特定功能的信息。數(shù)據(jù)是信息的表達(dá),信息是數(shù)據(jù)的內(nèi)涵。1.2數(shù)據(jù)
知識(shí)是在對(duì)信息進(jìn)行綜合、提煉的基礎(chǔ)上獲得的經(jīng)驗(yàn)、判斷與理解;智慧是合理地應(yīng)用知識(shí)并進(jìn)行正確判斷、決策的能力。圖1-1DIKW模型示意圖1.2數(shù)據(jù)1.2.1數(shù)據(jù)的構(gòu)成
數(shù)據(jù)可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非半結(jié)構(gòu)化數(shù)據(jù)3類。(1)結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)具有固定的結(jié)構(gòu)、類型和屬性劃分等,通??梢杂枚S表表示,如用關(guān)系型數(shù)據(jù)庫存儲(chǔ)的信息、Excel表中存放的信息等。例如,學(xué)生信息表,具有學(xué)號(hào)、姓名、性別、出生日期和電話號(hào)碼等屬性。1.2數(shù)據(jù)(1)結(jié)構(gòu)化數(shù)據(jù)
表1-1所示為結(jié)構(gòu)化數(shù)據(jù)示例,其數(shù)據(jù)由每一行的記錄組成,每個(gè)記錄有若干個(gè)屬性或特征。表1-1結(jié)構(gòu)化數(shù)據(jù)示例學(xué)號(hào)姓名性別出生日期1100101小王男1998-03-051100102小李女1999-08-051100103小陳男2000-03-071.2數(shù)據(jù)(2)半結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)具有一定的結(jié)構(gòu)性,但又靈活多變,如XML(eXtensibleMarkupLanguage,可擴(kuò)展標(biāo)記語言)或HTML(HyperTextMarkupLanguage,超文本標(biāo)記語言)格式的文件,其自描述、數(shù)據(jù)結(jié)構(gòu)和內(nèi)容混雜在一起。XML是一種W3C制定的標(biāo)準(zhǔn)通用標(biāo)記語言,已成為國際上數(shù)據(jù)交換的一種公共語言。右邊的代碼用XML文件格式來描述表1-1中的3個(gè)記錄。1.2數(shù)據(jù)(3)非結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)是指無法采用固定的結(jié)構(gòu)來表示的數(shù)據(jù),如文本、圖像、視頻和音頻等數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)的格式非常多樣,無法用統(tǒng)一的結(jié)構(gòu)表示,而且在技術(shù)上非結(jié)構(gòu)化信息比結(jié)構(gòu)化信息更難標(biāo)準(zhǔn)化和理解。圖1-2所示為典型的非結(jié)構(gòu)化數(shù)據(jù)(文本、圖片和視頻)示意圖。
(a)文本
(b)圖像
(c)視頻1.2數(shù)據(jù)(3)非結(jié)構(gòu)化數(shù)據(jù)
根據(jù)IDC(InternationalDataCorporation,國際數(shù)據(jù)公司)的一份調(diào)查報(bào)告,目前結(jié)構(gòu)化數(shù)據(jù)僅占全部數(shù)據(jù)的20%,而半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化占比為80%,因此在利用傳統(tǒng)的關(guān)系數(shù)據(jù)庫(RelationalDatabase)和數(shù)據(jù)倉庫技術(shù)存儲(chǔ)、檢索和分析數(shù)據(jù)的基礎(chǔ)上,近年來發(fā)展出多種NoSQL數(shù)據(jù)庫系統(tǒng)來對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,如HBase、Redis和MongoDB等。1.2數(shù)據(jù)1.2.2數(shù)據(jù)存儲(chǔ)容量的單位
數(shù)據(jù)存儲(chǔ)容量的基本單位是bit,其單位從小到大的順序是:bit(位)、Byte(字節(jié))、KB(千字節(jié))、MB(兆字節(jié))、GB(吉字節(jié))、TB(太字節(jié))、PB(拍字節(jié))、EB(艾字節(jié))、ZB(澤字節(jié))、YB(堯字節(jié))、BB、NB、DB,它們是按照進(jìn)率1024(210)來計(jì)算的。數(shù)據(jù)存儲(chǔ)容量的單位如表1-2所示。1.2數(shù)據(jù)1.2.2數(shù)據(jù)存儲(chǔ)容量的單位詞頭名稱符號(hào)科學(xué)計(jì)數(shù)法換算關(guān)系bit(位)b1
Byte(字節(jié))B81B=8bitkilo(千)KB8×2101KB=1024B=8192bitmega(兆)MB8×2201MB=1024KB=1,048,576Bytesgiga(吉)GB8×2301GB=1024MB=1,048,576KBtera(太)TB8×2401TB=1024GB=1,048,576MBpeta(拍)PB8×2501PB=1024TB=1,048,576GBexa(艾)EB8×2601EB=1024PB=1,048,576TBzetta(澤)ZB8×2701ZB=1024EB=1,048,576PByotta(堯)YB8×2801YB=1024ZB=1,048,576TB表1-2數(shù)據(jù)存儲(chǔ)容量的單位1.3大數(shù)據(jù)的相關(guān)概念1.3.1大數(shù)據(jù)的概念
“大數(shù)據(jù)”這一名詞最早公開出現(xiàn)于1998年,美國高性能計(jì)算公司SGI的首席科學(xué)家約翰馬西(JohnMashey)在一個(gè)國際會(huì)議報(bào)告中指出:隨著數(shù)據(jù)量的快速增長,必將出現(xiàn)數(shù)據(jù)難理解、難獲取、難處理和難組織4個(gè)難題,并用“BigData(大數(shù)據(jù))”來描述這一挑戰(zhàn),在計(jì)算機(jī)領(lǐng)域引起了人們的重視和關(guān)注。
在“大數(shù)據(jù)”這一概念形成的過程中,有3個(gè)標(biāo)志性的事件。2008年9月,美國《自然》(Nature)雜志??癇igdata:ThenextGoogle”,第一次正式提出了“大數(shù)據(jù)”概念。2011年2月,《科學(xué)》(Science)雜志??癉ealingwithdata”,第一次綜合分析了大數(shù)據(jù)對(duì)人們生活造成的影響,詳細(xì)描述了人類面臨的“數(shù)據(jù)困境”。2011年5月,麥肯錫全球研究院(McKinseyGlobalInstitute)發(fā)布報(bào)告——“Bigdata:Thenextfrontierforinnovation,competition,andproductivity”,第一次給大數(shù)據(jù)做出相對(duì)清晰的定義。1.3大數(shù)據(jù)的相關(guān)概念1.3.1大數(shù)據(jù)的概念
2015年8月31日,國務(wù)院《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》的開篇給出了大數(shù)據(jù)的定義:大數(shù)據(jù)是以容量大、類型多、存取速度快、應(yīng)用價(jià)值高為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對(duì)數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)。
從以上對(duì)大數(shù)據(jù)的定義可以看出,大數(shù)據(jù)與傳統(tǒng)所處理的數(shù)據(jù)相比,具有體量大、結(jié)構(gòu)復(fù)雜的顯著特點(diǎn),并且難以用常規(guī)的技術(shù)進(jìn)行處理。1.3大數(shù)據(jù)的相關(guān)概念1.3.2大數(shù)據(jù)的基本特征
通常用“4V”特征來描述大數(shù)據(jù)的主要特征,即大數(shù)據(jù)具有體量大、種類多、速度快和價(jià)值高4個(gè)特征,大數(shù)據(jù)“4V”特征示意圖如圖1-3所示。圖1-3大數(shù)據(jù)“4V”特征示意圖1.3大數(shù)據(jù)的相關(guān)概念(1)體量大大數(shù)據(jù)的特征首先體現(xiàn)在數(shù)量巨大,存儲(chǔ)單位達(dá)到TB、PB甚至ZB級(jí)別。圖靈獎(jiǎng)得主JimGrey對(duì)未來數(shù)據(jù)量急劇增長的規(guī)律做過這樣的預(yù)言:未來每18個(gè)月產(chǎn)生的數(shù)據(jù)量等于有史以來的數(shù)據(jù)量之和。01根據(jù)Domo公司2021年對(duì)全球大數(shù)據(jù)每分鐘產(chǎn)生量的分析數(shù)據(jù),F(xiàn)acebook用戶每分鐘上傳的圖片有240K張、共享44M條信息,Twitter用戶每分鐘上傳了575K條信息,TikTok用戶每分鐘觀看167M視頻,等等。02根據(jù)國際權(quán)威機(jī)構(gòu)Statista的統(tǒng)計(jì)和預(yù)測(cè),2035年全球數(shù)據(jù)產(chǎn)生量預(yù)計(jì)達(dá)到2142ZB,全球數(shù)量即將迎來更大規(guī)模的爆發(fā),全球每年數(shù)據(jù)產(chǎn)生量估算圖如圖1-4所示。031.3大數(shù)據(jù)的相關(guān)概念(1)體量大圖1-4全球每年數(shù)據(jù)產(chǎn)生量估算圖(數(shù)據(jù)來源:Statista2020年10月)1.3大數(shù)據(jù)的相關(guān)概念(2)種類多
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相比,數(shù)據(jù)的來源廣、維度多、類型雜。各種機(jī)器設(shè)備在自動(dòng)產(chǎn)生數(shù)據(jù)的同時(shí),人們自身的生活行為也在不斷地創(chuàng)造數(shù)據(jù),不僅有企/事業(yè)單位的業(yè)務(wù)數(shù)據(jù),還有海量的人類社交活動(dòng)數(shù)據(jù)。1.3大數(shù)據(jù)的相關(guān)概念(3)速度快
隨著計(jì)算機(jī)技術(shù)、互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)生成和處理的速度遠(yuǎn)遠(yuǎn)超出人們的想象,這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)或小數(shù)據(jù)的一個(gè)顯著特征。1.3大數(shù)據(jù)的相關(guān)概念(4)價(jià)值高
大數(shù)據(jù)有巨大的潛在價(jià)值,具有價(jià)值高但價(jià)值密度低的特點(diǎn),也就是說,同其呈幾何指數(shù)爆發(fā)式增長相比,某一對(duì)象或模塊數(shù)據(jù)的價(jià)值密度較低,這給我們挖掘海量的大數(shù)據(jù)增加了難度和成本。1.4大數(shù)據(jù)的意義、價(jià)值與作用
當(dāng)前,大數(shù)據(jù)不僅是技術(shù),還是新的工具、方法和資產(chǎn),正深刻影響著社會(huì)生活的方方面面。2021年12月12日,《國務(wù)院關(guān)于印發(fā)“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃的通知》中指出發(fā)展數(shù)字經(jīng)濟(jì)的重要性,提出“數(shù)據(jù)要素是數(shù)字經(jīng)濟(jì)深化發(fā)展的核心引擎”,要求充分發(fā)揮數(shù)據(jù)要素作用。2015年8月,國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,系統(tǒng)部署大數(shù)據(jù)發(fā)展工作。信息技術(shù)與經(jīng)濟(jì)社會(huì)的交匯融合引發(fā)了數(shù)據(jù)迅猛增長,數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源。堅(jiān)持創(chuàng)新驅(qū)動(dòng)發(fā)展,加快大數(shù)據(jù)部署,深化大數(shù)據(jù)應(yīng)用,已成為穩(wěn)增長、促改革、調(diào)結(jié)構(gòu)、惠民生和推動(dòng)政府治理能力現(xiàn)代化的內(nèi)在需要和必然選擇。1.4大數(shù)據(jù)的意義、價(jià)值與作用1.4.1大數(shù)據(jù)的意義
大數(shù)據(jù)對(duì)社會(huì)、經(jīng)濟(jì)和科技等各個(gè)方面都具有非常重要的意義。在經(jīng)濟(jì)方面,大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力;在社會(huì)方面,大數(shù)據(jù)可以提高政府的決策能力和治理能力;在科技方面,大數(shù)據(jù)成為科學(xué)研究的新途徑。1.4大數(shù)據(jù)的意義、價(jià)值與作用(1)大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力
新經(jīng)濟(jì)時(shí)代以知識(shí)經(jīng)濟(jì)、虛擬經(jīng)濟(jì)和網(wǎng)絡(luò)經(jīng)濟(jì)為標(biāo)志,新經(jīng)濟(jì)時(shí)代的數(shù)據(jù)本身就是資產(chǎn)和生產(chǎn)要素。大數(shù)據(jù)的應(yīng)用,推動(dòng)了生產(chǎn)要素的共享、整合和協(xié)作,促進(jìn)了生產(chǎn)要素的高效利用,改變了傳統(tǒng)的生產(chǎn)方式和經(jīng)濟(jì)運(yùn)行機(jī)制,提高了經(jīng)濟(jì)運(yùn)行水平和效率。目前,大數(shù)據(jù)已經(jīng)成為經(jīng)濟(jì)發(fā)展的新動(dòng)力,大數(shù)據(jù)是重要的戰(zhàn)略資源,大數(shù)據(jù)將改變社會(huì)生產(chǎn)的結(jié)構(gòu)和模式。
大數(shù)據(jù)技術(shù)的運(yùn)用,激發(fā)了生產(chǎn)模式和商業(yè)模式的變革和創(chuàng)新,催生了新業(yè)態(tài),也為傳統(tǒng)企業(yè)的生產(chǎn)和服務(wù)提供了新途徑。例如,在企業(yè)的生產(chǎn)和營銷活動(dòng)中,大數(shù)據(jù)分析是發(fā)現(xiàn)新客戶群體、確定最優(yōu)供應(yīng)商、創(chuàng)新產(chǎn)品、理解銷售季節(jié)性等的最好方法。應(yīng)用大數(shù)據(jù)分析,可以了解、細(xì)分市場(chǎng)和客戶群體,為每個(gè)群體量身定制個(gè)性化的服務(wù),創(chuàng)造差異化優(yōu)勢(shì)。通過大數(shù)據(jù)預(yù)測(cè)需求的變化趨勢(shì),可以創(chuàng)造和發(fā)掘新的需求,有助于開創(chuàng)全新的產(chǎn)品或服務(wù)領(lǐng)域,提高投資的回報(bào)率;新零售以互聯(lián)網(wǎng)為依托,通過運(yùn)用大數(shù)據(jù)、人工智能等先進(jìn)技術(shù)手段,對(duì)商品的生產(chǎn)、流通與銷售過程進(jìn)行升級(jí)改造,進(jìn)而重塑業(yè)態(tài)結(jié)構(gòu)與生態(tài)圈。新零售將線下物流、服務(wù)、體驗(yàn)等優(yōu)勢(shì)與線上商流、資金流、信息流融合,拓展智能化、網(wǎng)絡(luò)化的零售新模式。1.4大數(shù)據(jù)的意義、價(jià)值與作用(2)大數(shù)據(jù)成為提升政府治理能力的新途徑
政府?dāng)?shù)據(jù)資源豐富,應(yīng)用需求旺盛,政府既是大數(shù)據(jù)發(fā)展的推動(dòng)者,也是大數(shù)據(jù)應(yīng)用的受益者。政府應(yīng)用大數(shù)據(jù)能更好地響應(yīng)社會(huì)和經(jīng)濟(jì)指標(biāo)變化,解決城市管理、安全管控、行政監(jiān)管中的問題,預(yù)測(cè)判斷事態(tài)走勢(shì)等。對(duì)政府管理而言,建立“用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新”的理念和管理機(jī)制,以大數(shù)據(jù)來提高決策科學(xué)化與管理精細(xì)化的水平,是提升政府治理能力的新途徑。1.4大數(shù)據(jù)的意義、價(jià)值與作用(3)大數(shù)據(jù)已經(jīng)成為科學(xué)研究的新方法
傳統(tǒng)科學(xué)研究的三個(gè)范式是“實(shí)驗(yàn)”“理論分析”“計(jì)算”,在大數(shù)據(jù)時(shí)代,“數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”(Data-IntensiveScientificDiscovery)成為科學(xué)研究的第四范式?!癉ata-IntensiveScientificDiscovery”是微軟亞洲研究院在其編寫的《TheFourthParadigm:Data-IntensiveScientificDiscovery》一書(見圖1-5)中提出的,該書擴(kuò)展了開創(chuàng)性計(jì)算機(jī)科學(xué)家、圖靈獎(jiǎng)獲得者吉姆格雷(JimGray)的思想,對(duì)數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)的理念、應(yīng)用和影響進(jìn)行了全面分析。該書系統(tǒng)介紹了地球與環(huán)境科學(xué)、生命與健康科學(xué)、數(shù)字信息基礎(chǔ)設(shè)施和數(shù)字化學(xué)術(shù)信息交流等方面基于海量數(shù)據(jù)的科研活動(dòng)、過程、方法和基礎(chǔ)設(shè)施,生動(dòng)揭示了在海量數(shù)據(jù)和無處不在的網(wǎng)絡(luò)上發(fā)展起來的與實(shí)驗(yàn)科學(xué)、理論推演、計(jì)算機(jī)仿真這三種科研范式相輔相成的科學(xué)研究第四范式——數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)。1.4大數(shù)據(jù)的意義、價(jià)值與作用(3)大數(shù)據(jù)已經(jīng)成為科學(xué)研究的新方法圖1-5微軟亞洲研究院關(guān)于第四范式的著作1.4大數(shù)據(jù)的意義、價(jià)值與作用1.4.2大數(shù)據(jù)的核心價(jià)值
大數(shù)據(jù)的核心價(jià)值在于提供了一種人類認(rèn)識(shí)復(fù)雜系統(tǒng)的新思維和新手段,可以幫助人們發(fā)現(xiàn)規(guī)律、預(yù)測(cè)未來和決策指導(dǎo)。1.4大數(shù)據(jù)的意義、價(jià)值與作用(1)發(fā)現(xiàn)規(guī)律
發(fā)現(xiàn)規(guī)律是指從大數(shù)據(jù)中總結(jié)、抽取相關(guān)的信息和知識(shí),幫助人們分析發(fā)生了什么,解釋現(xiàn)象并呈現(xiàn)事物的發(fā)展規(guī)律?!景咐?-1】Twitter情緒分析是一個(gè)通過社交大數(shù)據(jù)發(fā)現(xiàn)規(guī)律的例子。Twitter公司本身并不運(yùn)營所有的數(shù)據(jù)產(chǎn)品,而是將數(shù)據(jù)授權(quán)給其他數(shù)據(jù)服務(wù)公司。許多公司利用Twitter的社交數(shù)據(jù)做出了各種令人驚嘆的應(yīng)用,從社交監(jiān)測(cè)到醫(yī)療應(yīng)用程序,甚至跟蹤流感疫情的爆發(fā)。美國華爾街德溫特資本市場(chǎng)公司的首席執(zhí)行官保羅霍廷每天使用程序分析全球3.4億個(gè)Twitter賬戶的信息,以判斷公眾情緒,然后從“1”到“50”進(jìn)行評(píng)分。根據(jù)評(píng)分結(jié)果,保羅霍廷決定如何處理他所持有的股票?;敉⒌呐袛嘣瓌t非常簡單,如果大家看起來都很高興,那就買更多的股票,如果大家的焦慮增加,那就賣掉手上持有的股票。1.4大數(shù)據(jù)的意義、價(jià)值與作用(2)預(yù)測(cè)未來
預(yù)測(cè)未來是指從大數(shù)據(jù)中分析事物之間的關(guān)聯(lián)關(guān)系、發(fā)展模式等,并據(jù)此對(duì)事物發(fā)展的趨勢(shì)進(jìn)行預(yù)測(cè)?!景咐?-2】圓通快遞用大數(shù)據(jù)預(yù)測(cè)快遞的接件量和中轉(zhuǎn)量。每年“雙十一”對(duì)快遞公司都是大考,包裹集中到某個(gè)中轉(zhuǎn)倉庫,堆積如山,不及時(shí)運(yùn)轉(zhuǎn)的話很可能“爆倉”。2014年“雙十一”期間,圓通公司發(fā)送了2.4億個(gè)包裹,用時(shí)16天;而2015年同樣的包裹量,僅用時(shí)7天。借助大數(shù)據(jù)分析,圓通公司對(duì)哪些區(qū)域、線路可能存在較大的接件量、中轉(zhuǎn)量進(jìn)行了預(yù)測(cè),從而優(yōu)化人力、車輛與貨物的匹配,避免了快遞的堆積。從這個(gè)例子可以看出大數(shù)據(jù)預(yù)測(cè)的作用,大數(shù)據(jù)正從資源變成一種新的生產(chǎn)要素,一旦加入到生產(chǎn)環(huán)節(jié)中,就能帶來巨大的改變。1.4大數(shù)據(jù)的意義、價(jià)值與作用(2)預(yù)測(cè)未來【案例1-3】2013年,微軟紐約研究院的經(jīng)濟(jì)學(xué)家大衛(wèi)羅斯柴爾德(DavidRothschild)利用大數(shù)據(jù)成功預(yù)測(cè)24個(gè)奧斯卡獎(jiǎng)項(xiàng)中的19個(gè),成為人們津津樂道的話題。之后,大衛(wèi)羅斯柴爾德再接再厲,成功預(yù)測(cè)第86屆奧斯卡金像獎(jiǎng)?lì)C獎(jiǎng)典禮24個(gè)獎(jiǎng)項(xiàng)中的21個(gè),繼續(xù)向人們展示現(xiàn)代科技的神奇魔力。1.4大數(shù)據(jù)的意義、價(jià)值與作用(3)決策指導(dǎo)
目前,在大數(shù)據(jù)應(yīng)用的實(shí)踐中,更多的是描述性和預(yù)測(cè)性的分析,而更深一層的大數(shù)據(jù)決策指導(dǎo)才是最具有價(jià)值的,它是在描述性與預(yù)測(cè)性分析的基礎(chǔ)上,對(duì)各種策略的效果進(jìn)行評(píng)估分析,以對(duì)決策進(jìn)行指導(dǎo)和優(yōu)化?!景咐?-4】2012年11月奧巴馬大選連任成功的勝利果實(shí)被歸功于大數(shù)據(jù),因?yàn)樗母傔x團(tuán)隊(duì)進(jìn)行了大規(guī)模與深入的數(shù)據(jù)挖掘。2012年11月,美國總統(tǒng)選舉異常激烈,奧巴馬在整個(gè)競選過程中打破了沒有一名美國總統(tǒng)能夠在全國失業(yè)率高于7.4%的情況下連任成功的慣例。在奧巴馬獲勝幾小時(shí)后,《時(shí)代》周刊就刊發(fā)報(bào)道,認(rèn)為奧巴馬的成功,其競選團(tuán)隊(duì)的大數(shù)據(jù)戰(zhàn)略功不可沒。大規(guī)模與深入的數(shù)據(jù)挖掘,幫助奧巴馬在獲取有效選民、投放廣告、募集資金方面起到重要作用。奧巴馬的競選團(tuán)隊(duì)表示,大數(shù)據(jù)是他們的一個(gè)大優(yōu)勢(shì)!《時(shí)代》周刊更是斷言,依靠直覺與經(jīng)驗(yàn)進(jìn)行決策的優(yōu)勢(shì)急劇下降,在政治領(lǐng)域,大數(shù)據(jù)的時(shí)代已經(jīng)到來。1.4大數(shù)據(jù)的意義、價(jià)值與作用1.4.3大數(shù)據(jù)的作用
當(dāng)前,大數(shù)據(jù)已經(jīng)在社會(huì)各個(gè)領(lǐng)域發(fā)揮出巨大的作用,大數(shù)據(jù)的利用已經(jīng)成為提高核心競爭力的關(guān)鍵因素,它為我們看待世界提供了一種全新的角度,人們的行為決策將日益依賴于數(shù)據(jù)分析,而不是像過去更多憑借經(jīng)驗(yàn)和直覺。以下介紹幾個(gè)大數(shù)據(jù)在多個(gè)行業(yè)應(yīng)用的著名案例?!景咐?-5】孟山都公司(MonsantoCompany)是美國的一家跨國農(nóng)業(yè)生物技術(shù)公司,該公司首先發(fā)起“GreenDataRevolution”運(yùn)動(dòng),建立開放農(nóng)業(yè)數(shù)據(jù)聯(lián)盟(AgriculturalDataAlliance)來統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),讓農(nóng)民也能享受大數(shù)據(jù)的成果。典型的應(yīng)用,如農(nóng)場(chǎng)設(shè)備制造商JohnDeere與DuPontPioneer聯(lián)合提供“決策服務(wù)”,農(nóng)民只需要在駕駛室里拿出平板電腦,收集種子監(jiān)視器傳來的數(shù)據(jù),然后將其上傳給服務(wù)器,通過服務(wù)器端的智能決策服務(wù)系統(tǒng),返回化肥的配方到農(nóng)場(chǎng)的拖拉機(jī)上。1.4大數(shù)據(jù)的意義、價(jià)值與作用1.4.3大數(shù)據(jù)的作用【案例1-6】英國國家醫(yī)療服務(wù)體系(NationalHealthService,NHS)的糖尿病預(yù)防項(xiàng)目,通過移動(dòng)端收集患者的生活起居數(shù)據(jù)、生理變化數(shù)據(jù)、用藥數(shù)據(jù)、飲食數(shù)據(jù)、運(yùn)動(dòng)數(shù)據(jù)和醫(yī)療數(shù)據(jù),對(duì)收集到的信息進(jìn)行糖尿病風(fēng)險(xiǎn)等級(jí)評(píng)估,根據(jù)評(píng)估情況為每個(gè)患者制定適宜的個(gè)性化干預(yù)治療方案?!景咐?-7】HealthTap是美國的一個(gè)提供7×24小時(shí)遠(yuǎn)程問診服務(wù)的醫(yī)療平臺(tái),它利用移動(dòng)互聯(lián)網(wǎng)收集患者上傳的個(gè)人習(xí)慣數(shù)據(jù)和健康情況,以及病史、癥狀、病情、藥物、檢測(cè)診療等數(shù)據(jù),根據(jù)患者信息,為其提供醫(yī)生推薦、藥物推薦等服務(wù),減少用戶就診時(shí)間,提高醫(yī)生和患者的匹配度。據(jù)2018年的統(tǒng)計(jì),每天有超過170個(gè)國家的數(shù)億用戶和超過140,000名醫(yī)生使用其平臺(tái)。1.4大數(shù)據(jù)的意義、價(jià)值與作用1.4.3大數(shù)據(jù)的作用【案例1-8】大數(shù)據(jù)金融監(jiān)管。中國證券監(jiān)督管理委員會(huì)從2013年下半年開發(fā)啟用大數(shù)據(jù)分析系統(tǒng),到2015年,已調(diào)查內(nèi)幕交易線索375起,立案142起,分別比以往同期增長了21%、33%。中國證券監(jiān)督管理委員會(huì)上海監(jiān)管局2017年以來招聘了大量的大數(shù)據(jù)研究和大數(shù)據(jù)挖掘人才,專門模擬不同賬戶之間的關(guān)聯(lián),通過無數(shù)次的模擬分析找到看似無關(guān),但本質(zhì)上相關(guān)的賬戶之間的交易關(guān)聯(lián)。大數(shù)據(jù)在若干重要領(lǐng)域的作用,可以簡短地總結(jié)如下。(1)醫(yī)療大數(shù)據(jù)——看病更高效。(2)生物大數(shù)據(jù)——改良基因。(3)金融大數(shù)據(jù)——理財(cái)?shù)睦?。?)零售大數(shù)據(jù)——了解消費(fèi)者。1.4大數(shù)據(jù)的意義、價(jià)值與作用1.4.3大數(shù)據(jù)的作用(5)電商大數(shù)據(jù)——精準(zhǔn)營銷的法寶。(6)農(nóng)牧大數(shù)據(jù)——量化生產(chǎn)。(7)交通大數(shù)據(jù)——暢通出行。(8)教育大數(shù)據(jù)——因材施教。(9)體育大數(shù)據(jù)——奪冠精靈。(10)食品大數(shù)據(jù)——安全飲食的保護(hù)傘。(11)政府大數(shù)據(jù)——改進(jìn)社會(huì)服務(wù)。(12)物流大數(shù)據(jù)——優(yōu)化配送和庫存。1.5大數(shù)據(jù)時(shí)代的新變革
世界著名的質(zhì)量管理專家愛德華茲·戴明說過:“除了上帝,任何人都必須用數(shù)據(jù)來說話”,當(dāng)前,“用數(shù)據(jù)說話、讓數(shù)據(jù)發(fā)聲”已成為人類認(rèn)知世界的一種全新方法。
維克托·邁爾·舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書中指出,大數(shù)據(jù)時(shí)代要關(guān)注三大變革:(1)處理數(shù)據(jù)理念的思維變革。(2)挖掘數(shù)據(jù)價(jià)值的商業(yè)變革。(3)面對(duì)數(shù)據(jù)風(fēng)險(xiǎn)的管理變革。1.5大數(shù)據(jù)時(shí)代的新變革1.5.1大數(shù)據(jù)帶來的思維變革
對(duì)于大數(shù)據(jù)時(shí)代帶來的處理數(shù)據(jù)理念的思維模式轉(zhuǎn)變,維克托邁爾舍恩伯格提出了3個(gè)非常著名的觀點(diǎn)。1.要全體,不要抽樣2.要相關(guān),不要因果3.要效率,允許不精確1.5大數(shù)據(jù)時(shí)代的新變革(1)要全體,不要抽樣
在過去,由于收集、儲(chǔ)存和分析數(shù)據(jù)的技術(shù)落后,大量數(shù)據(jù)的收集成本非常高昂,我們只能收集少量的數(shù)據(jù)進(jìn)行分析。在大數(shù)據(jù)時(shí)代,可以獲取足夠多的數(shù)據(jù)樣本乃至全體數(shù)據(jù)。抽樣不合理會(huì)導(dǎo)致預(yù)測(cè)結(jié)果的偏差,在大數(shù)據(jù)時(shí)代,依靠強(qiáng)大的數(shù)據(jù)處理能力,應(yīng)該去處理所有數(shù)據(jù)。【案例1-9】Farecast系統(tǒng)用大數(shù)據(jù)預(yù)測(cè)機(jī)票價(jià)格,幫助消費(fèi)者抓住最佳購買時(shí)機(jī)。
2003年,奧倫埃齊奧尼準(zhǔn)備乘坐從西雅圖到洛杉磯的飛機(jī)去參加弟弟的婚禮。他認(rèn)為飛機(jī)票越早預(yù)定應(yīng)該越便宜,于是他在婚禮舉行日期前好幾個(gè)月就預(yù)定了一張去洛杉磯的機(jī)票。在飛機(jī)上,奧倫埃齊奧尼好奇地問鄰座的乘客花了多少錢購買機(jī)票。當(dāng)?shù)弥莻€(gè)人的機(jī)票比他買得晚,但是票價(jià)卻比他便宜很多時(shí),他感到非常氣憤。于是,他又詢問了另外幾個(gè)乘客,結(jié)果發(fā)現(xiàn)大家買的票居然都比他的便宜。1.5大數(shù)據(jù)時(shí)代的新變革(1)要全體,不要抽樣
奧倫埃齊奧尼是當(dāng)時(shí)美國最有名的計(jì)算機(jī)專家之一,他下定決心要開發(fā)一個(gè)項(xiàng)目,來幫助人們推測(cè)當(dāng)前的機(jī)票價(jià)格是否合理。這個(gè)項(xiàng)目后來發(fā)展成為一家得到了風(fēng)險(xiǎn)投資基金支持的科技創(chuàng)業(yè)公司,名為Farecast。Farecast的機(jī)票預(yù)測(cè)系統(tǒng)初始用一個(gè)航線41天之內(nèi)的12000個(gè)價(jià)格樣本進(jìn)行預(yù)測(cè),取得了不錯(cuò)的預(yù)測(cè)結(jié)果。接著,F(xiàn)arecast使用每一條航線整整一年的價(jià)格數(shù)據(jù)來進(jìn)行預(yù)測(cè),隨著不斷添加更多的數(shù)據(jù),預(yù)測(cè)的結(jié)果越來越準(zhǔn)確。奧倫埃齊奧尼說:“這只是一個(gè)暫時(shí)性的數(shù)據(jù),隨著你收集的數(shù)據(jù)越來越多,你的預(yù)測(cè)結(jié)果會(huì)越來越準(zhǔn)確?!比缃?,F(xiàn)arecast已經(jīng)擁有驚人的約2000億條飛行數(shù)據(jù)記錄,通過對(duì)機(jī)票價(jià)格的變化趨勢(shì)預(yù)測(cè),讓消費(fèi)者能夠更合理地選擇出行時(shí)間和航線,平均為消費(fèi)者節(jié)省了20%的機(jī)票費(fèi)用。1.5大數(shù)據(jù)時(shí)代的新變革(2)要相關(guān),不要因果
因果分析和相關(guān)分析是人們認(rèn)識(shí)、了解世界最重要的手段和方法。因果關(guān)系,即某種現(xiàn)象(原因)引起了另一種現(xiàn)象(結(jié)果),其原因和結(jié)果必須同時(shí)具有必然的聯(lián)系。因果關(guān)系的分析通?;谶壿嬐评?,難度較大。相關(guān)關(guān)系的分析通過從大量數(shù)據(jù)中挖掘頻繁模式,發(fā)現(xiàn)事物之間有趣的關(guān)聯(lián)和相關(guān)聯(lián)系,然而該分析方法通常面臨數(shù)據(jù)量不足的問題。在大數(shù)據(jù)時(shí)代,由于已經(jīng)獲取到了大量的數(shù)據(jù),建立在相關(guān)關(guān)系分析法之上的預(yù)測(cè)成為大數(shù)據(jù)的核心。如果A事件和B事件經(jīng)常一起發(fā)生,那么當(dāng)B事件發(fā)生時(shí),我們就可以預(yù)測(cè)A事件也發(fā)生了,至于為什么會(huì)是這樣,在某些應(yīng)用上,已經(jīng)沒那么重要了。1.5大數(shù)據(jù)時(shí)代的新變革(2)要相關(guān),不要因果【案例1-10】沃爾瑪:請(qǐng)把蛋撻與颶風(fēng)用品擺在一起
沃爾瑪是世界上最大的零售商,擁有超過200萬的員工,年銷售額約4500億美元,比大多數(shù)國家的GDP還多。沃爾瑪?shù)馁徫飻?shù)據(jù)庫記錄了每一個(gè)顧客的購物清單和消費(fèi)額,還包括購物籃中的物品、購買時(shí)間,甚至購買當(dāng)日的天氣。2004年,沃爾瑪公司對(duì)其龐大的購物數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)每當(dāng)季節(jié)性颶風(fēng)來臨前,不僅手電筒的銷量增加了,而且蛋撻(美式含糖早餐零食)的銷量也增加了。因此,當(dāng)季節(jié)性颶風(fēng)來臨時(shí),沃爾瑪會(huì)把蛋撻放在靠近颶風(fēng)用品的位置,以方便行色匆匆的顧客購買,從而增加商品銷量。1.5大數(shù)據(jù)時(shí)代的新變革(2)要相關(guān),不要因果【案例1-11】美國折扣零售商塔吉特(Target)的懷孕趨勢(shì)預(yù)測(cè)。
美國折扣零售商塔吉特把大數(shù)據(jù)相關(guān)關(guān)系的分析應(yīng)用到極致?!都~約時(shí)報(bào)》的記者查爾斯杜西格(CharlesDuhigg)在一份報(bào)道中闡述了塔吉特怎樣在完全不和準(zhǔn)媽媽對(duì)話的前提下,預(yù)測(cè)一個(gè)女性會(huì)在什么時(shí)候懷孕。
對(duì)零售商來說,知道一個(gè)顧客是否懷孕是非常重要的,因?yàn)檫@是一對(duì)夫妻改變消費(fèi)觀念的開始,也是一對(duì)夫妻生活的分水嶺,他們會(huì)開始光顧以前不會(huì)去的商店,漸漸對(duì)新的品牌建立忠誠。塔吉特的分析團(tuán)隊(duì)首先查看了簽署嬰兒禮物登記簿的女性的消費(fèi)記錄。塔吉特公司注意到,登記簿上的婦女會(huì)在懷孕大概第3個(gè)月的時(shí)候買很多無香乳液;幾個(gè)月之后,她們會(huì)買一些,含有鎂、鈣、鋅的營養(yǎng)品。公司最終找出了大概20多種關(guān)聯(lián)物,這些關(guān)聯(lián)物可以給顧客進(jìn)行“懷孕趨勢(shì)”評(píng)分,這些相關(guān)關(guān)系甚至使得塔吉特能夠比較準(zhǔn)確地預(yù)測(cè)預(yù)產(chǎn)期,這樣就能夠在孕期的每個(gè)階段給客戶寄送相應(yīng)的優(yōu)惠券。1.5大數(shù)據(jù)時(shí)代的新變革(3)要效率,允許不精確
對(duì)采用“小數(shù)據(jù)”而言,由于收集的信息量比較少,所以必須確保記錄下來的數(shù)據(jù)盡量精確,并要求計(jì)算模型和運(yùn)算也非常精確,因?yàn)椤安钪晾?,失之千里”。然而在大?shù)據(jù)的“全樣本時(shí)代”,有多少偏差就是有多少偏差,不會(huì)被放大。谷歌公司的人工智能專家彼得諾維格(PeterNorvig)說過:“大數(shù)據(jù)基礎(chǔ)上的簡單算法比小數(shù)據(jù)基礎(chǔ)上的復(fù)雜算法更加有效?!币虼丝焖佾@得一個(gè)大概的輪廓和發(fā)展脈絡(luò),要比嚴(yán)格的精確性重要得多?!景咐?-12】麻省理工學(xué)院的通貨膨脹率預(yù)測(cè)。
美國勞工統(tǒng)計(jì)局的人員每個(gè)月都要公布消費(fèi)物價(jià)指數(shù)(ConsumerPriceIndex,CPI),這是用來測(cè)試通貨膨脹率的。政府通過人工采集價(jià)格信息數(shù)據(jù)每年大概需要花費(fèi)兩億五千萬美元。這些數(shù)據(jù)是精確的也是有序的,但是數(shù)據(jù)往往會(huì)有幾周的滯后。麻省理工學(xué)院(MIT)的兩位經(jīng)濟(jì)學(xué)家,通過一個(gè)軟件在互聯(lián)網(wǎng)上每天可以收集到50萬種商品的價(jià)格,雖然他們所收集的數(shù)據(jù)沒有美國勞工統(tǒng)計(jì)局的精確,但由于數(shù)據(jù)量非常大,因此他們能比官方數(shù)據(jù)提前發(fā)現(xiàn)通貨緊縮或膨脹趨勢(shì)。1.5大數(shù)據(jù)時(shí)代的新變革(3)要效率,允許不精確【案例1-13】谷歌翻譯系統(tǒng)。
谷歌公司2006年開始涉足機(jī)器翻譯,這被當(dāng)作實(shí)現(xiàn)“收集全世界的數(shù)據(jù)資源,并讓人人都可享受這些資源”目標(biāo)的一個(gè)步驟。谷歌翻譯利用一個(gè)巨大且繁雜的數(shù)據(jù)庫——也就是全球的互聯(lián)網(wǎng),進(jìn)行語料的收集和利用。谷歌翻譯系統(tǒng)為了訓(xùn)練計(jì)算機(jī),會(huì)吸收它能找到的所有翻譯材料,它增加了各種各樣的數(shù)據(jù),還接受了有錯(cuò)誤的數(shù)據(jù)。由于谷歌語料庫的內(nèi)容來自未經(jīng)過濾的網(wǎng)頁內(nèi)容,所以會(huì)包含各種錯(cuò)誤,但谷歌語料庫的規(guī)模是其他語料庫的好幾百萬倍,這樣的優(yōu)勢(shì)完全壓倒了缺點(diǎn)。谷歌翻譯部的負(fù)責(zé)人弗朗茲奧齊(FranzOch)指出:“谷歌的翻譯系統(tǒng)不會(huì)像Candide一樣只是仔細(xì)地翻譯300萬句話,它會(huì)掌握用不同語言翻譯的質(zhì)量參差不齊的數(shù)十億頁的文檔?!鄙先f億的語料就相當(dāng)于950億句英語。1.5大數(shù)據(jù)時(shí)代的新變革1.5.2大數(shù)據(jù)帶來的社會(huì)變革1.大數(shù)據(jù)帶來的經(jīng)濟(jì)模式變革
在大數(shù)據(jù)時(shí)代,經(jīng)濟(jì)活動(dòng)和商業(yè)模式的方式產(chǎn)生了根本性的變革,形成新的業(yè)態(tài)和產(chǎn)業(yè)鏈,正如2021年12月12日發(fā)布的《國務(wù)院關(guān)于印發(fā)“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃的通知》中指出的“數(shù)據(jù)要素是數(shù)字經(jīng)濟(jì)深化發(fā)展的核心引擎”。當(dāng)前,企業(yè)面臨一個(gè)新的課題——業(yè)務(wù)數(shù)據(jù)化,即如何“基于數(shù)據(jù)”動(dòng)態(tài)地定義、優(yōu)化和重組業(yè)務(wù)及其流程,進(jìn)而提升業(yè)務(wù)的敏捷性,降低風(fēng)險(xiǎn)和成本。接下來介紹若干大數(shù)據(jù)對(duì)商業(yè)模式帶來變革的案例。1.5大數(shù)據(jù)時(shí)代的新變革(1)大數(shù)據(jù)帶來新的商業(yè)模式
2016年11月11日,國務(wù)院辦公廳印發(fā)《關(guān)于推動(dòng)實(shí)體零售創(chuàng)新轉(zhuǎn)型的意見》(國辦發(fā)〔2016〕78號(hào)),明確了推動(dòng)我國實(shí)體零售創(chuàng)新轉(zhuǎn)型的指導(dǎo)思想和基本原則?!兑庖姟诽岢鲆龠M(jìn)線上線下融合,推動(dòng)企業(yè)線上服務(wù)、線下體驗(yàn)、金融支持、物流支撐等四大能力的全面提升。例如,近年來興起的“新零售”商業(yè)模式,是企業(yè)以互聯(lián)網(wǎng)為依托,運(yùn)用大數(shù)據(jù)、人工智能等先進(jìn)技術(shù)手段,對(duì)商品的生產(chǎn)、流通與銷售過程進(jìn)行升級(jí)改造,進(jìn)而重塑業(yè)態(tài)結(jié)構(gòu)與生態(tài)圈的。新零售將線下物流、服務(wù)、體驗(yàn)等優(yōu)勢(shì)與線上商流、資金流、信息流融合,拓展智能化、網(wǎng)絡(luò)化的零售新模式。1.5大數(shù)據(jù)時(shí)代的新變革(2)大數(shù)據(jù)改變企業(yè)的營銷手段
企業(yè)的傳統(tǒng)營銷手段主要是集中推銷和各種廣告宣傳,更原始的辦法是用大量的勞動(dòng)力發(fā)傳單推銷產(chǎn)品;而在大數(shù)據(jù)的時(shí)代,企業(yè)可以充分利用大數(shù)據(jù)進(jìn)行精準(zhǔn)、高效與低成本的營銷。
例如,電商的推薦系統(tǒng)(RecommendationSystem)會(huì)收集用戶以往的購買行為、瀏覽過的商品、對(duì)商品的評(píng)價(jià)和反饋等信息,運(yùn)用推薦算法對(duì)這些數(shù)據(jù)進(jìn)行分析,以便向用戶推薦其感興趣的商品,以提升用戶的購買率。1.5大數(shù)據(jù)時(shí)代的新變革(3)大數(shù)據(jù)創(chuàng)造和發(fā)掘新的需求
通過大數(shù)據(jù)預(yù)測(cè)需求的變化趨勢(shì),可以幫助企業(yè)開創(chuàng)全新的產(chǎn)品或服務(wù)領(lǐng)域,提高投資的回報(bào)率。運(yùn)用大數(shù)據(jù)進(jìn)行細(xì)分市場(chǎng)和客戶群體分析,可以提供精確服務(wù)滿足用戶需求,為每個(gè)群體定制特別的服務(wù),甚至為每個(gè)客戶量身定制?!景咐?-14】駕駛員識(shí)別和防盜系統(tǒng)。
日本先進(jìn)工業(yè)技術(shù)研究所的科學(xué)家通過在汽車座椅下部安裝壓力傳感器,把人體屁股特征轉(zhuǎn)化成數(shù)據(jù),然后把數(shù)據(jù)進(jìn)行量化后做成能識(shí)別車主的防盜系統(tǒng)。有了這個(gè)系統(tǒng)后,如果駕駛員不是車主,系統(tǒng)就會(huì)要求司機(jī)輸入密碼,若密碼不對(duì),汽車會(huì)自動(dòng)熄火。這種能把一個(gè)人的坐姿數(shù)據(jù)化的技術(shù),預(yù)示著一些切實(shí)可行的服務(wù)和一個(gè)前途光明的產(chǎn)業(yè)。比如,通過匯集數(shù)據(jù),利用事故發(fā)生之前的坐姿變化情況,分析出坐姿和行駛安全之間的關(guān)系。同時(shí),通過匯集數(shù)據(jù),可以發(fā)現(xiàn)汽車被盜及盜賊身份。1.5大數(shù)據(jù)時(shí)代的新變革(4)大數(shù)據(jù)成為企業(yè)管理決策的新手段
傳統(tǒng)的決策制定往往是“目標(biāo)”或“模型”驅(qū)動(dòng)的——根據(jù)目標(biāo)(或模型)進(jìn)行決策。然而,大數(shù)據(jù)時(shí)代出現(xiàn)了另一種思維模式,即數(shù)據(jù)驅(qū)動(dòng)型決策,數(shù)據(jù)成為決策制定的主要“觸發(fā)條件”和“重要依據(jù)”?!景咐?-15】網(wǎng)飛公司的電視劇制作。
運(yùn)用大數(shù)據(jù)技術(shù),美國網(wǎng)飛公司(Netflix)成功推出網(wǎng)絡(luò)劇《紙牌屋》。網(wǎng)飛公司是世界上最大的在線影片租賃提供商,并非傳統(tǒng)的影視制作公司,為什么它首次推出一部作品就能獲得第65屆艾美獎(jiǎng)最佳導(dǎo)演和最佳選角等多項(xiàng)大獎(jiǎng)呢?個(gè)中原因是大數(shù)據(jù)在公司決策過程中起了關(guān)鍵作用。無論是《紙牌屋》劇本的挑選,還是導(dǎo)演、演員的選定,網(wǎng)飛公司都將其龐大的用戶數(shù)據(jù)庫作為科學(xué)決策的依據(jù),依靠數(shù)據(jù)分析抓住觀眾的喜好?!都埮莆荨吠瞥鲋?,迅速成為美國各大社交網(wǎng)站的熱門話題,其明星效應(yīng)使得該劇大獲成功?!都埮莆荨愤M(jìn)入中國后,首先在美劇迷中掀起交流熱潮,繼而由美劇迷在網(wǎng)絡(luò)中發(fā)起的分享行為進(jìn)行擴(kuò)散。這些都是對(duì)傳統(tǒng)影視公司商業(yè)模式的一種顛覆,也成就了一個(gè)網(wǎng)站主導(dǎo)、數(shù)據(jù)先行的商業(yè)傳奇故事1.5大數(shù)據(jù)時(shí)代的新變革2.大數(shù)據(jù)帶來的公共服務(wù)與管理變革
對(duì)政府的公共服務(wù)和管理而言,大數(shù)據(jù)的價(jià)值在于提高決策科學(xué)化與管理精細(xì)化的水平。大數(shù)據(jù)在政府的公共服務(wù)領(lǐng)域的應(yīng)用,可有效推動(dòng)政務(wù)工作開展,提高政府部門的決策水平、服務(wù)效率和社會(huì)管理水平,產(chǎn)生巨大的社會(huì)價(jià)值?!景咐?-16】聯(lián)合國“全球脈動(dòng)”(GlobalPulse)項(xiàng)目。
聯(lián)合國于2019年提出“全球脈動(dòng)”(GlobalPulse)倡議計(jì)劃,希望大數(shù)據(jù)能對(duì)全球的發(fā)展起到杠桿作用,推動(dòng)數(shù)字?jǐn)?shù)據(jù)快速收集和分析方式的創(chuàng)新。2012年5月29日,在聯(lián)合國“全球脈動(dòng)”計(jì)劃發(fā)布的《大數(shù)據(jù)開發(fā):機(jī)遇與挑戰(zhàn)》報(bào)告中,闡述了各國特別是發(fā)展中國家在運(yùn)用大數(shù)據(jù)促進(jìn)社會(huì)發(fā)展方面所面臨的歷史機(jī)遇和挑戰(zhàn),并為正確運(yùn)用大數(shù)據(jù)提出了策略建議。1.5大數(shù)據(jù)時(shí)代的新變革2.大數(shù)據(jù)帶來的公共服務(wù)與管理變革
為了利用數(shù)字化的早期預(yù)警信號(hào)來提前指導(dǎo)援助項(xiàng)目,聯(lián)合國將開發(fā)所謂的“情緒分析”技術(shù),使用自然語言解密軟件來對(duì)社交網(wǎng)站和文本消息中的海量信息進(jìn)行分析,用來幫助預(yù)測(cè)某個(gè)給定地區(qū)的失業(yè)率、支出削減或是疾病暴發(fā)等現(xiàn)象?!景咐?-17】大數(shù)據(jù)助力公共安全保障。
大數(shù)據(jù)在國防、反恐、安全等領(lǐng)域的應(yīng)用,可以對(duì)各部門搜集到的各類信息進(jìn)行自動(dòng)分類、整理、分析,有效解決情報(bào)、監(jiān)視和偵察系統(tǒng)不足等問題,提高國家安全保障能力。例如,2013年4月15日,美國馬薩諸塞州的波士頓發(fā)生了震驚世界的馬拉松爆炸案,相關(guān)調(diào)查機(jī)構(gòu)通過采集案發(fā)現(xiàn)場(chǎng)附近10TB左右的數(shù)據(jù)(其中包括移動(dòng)通信基站上的電話通信記錄,附近商店、加油站、報(bào)攤的監(jiān)控錄像,以及志愿者提供的圖片和影像資料),迅速鎖定并令犯罪嫌疑人現(xiàn)形。1.6大數(shù)據(jù)處理的主要環(huán)節(jié)
大數(shù)據(jù)是大量、高速、多變的信息,它需要新型的處理技術(shù)去促成更強(qiáng)的決策能力、洞察力與最佳化處理,本節(jié)將介紹大數(shù)據(jù)處理的主要環(huán)節(jié)。大數(shù)據(jù)的處理流程可以歸納為:數(shù)據(jù)采集與數(shù)據(jù)預(yù)處理、數(shù)據(jù)存儲(chǔ)與管理、數(shù)據(jù)分析與挖掘和計(jì)算結(jié)果展示4個(gè)環(huán)節(jié)。大數(shù)據(jù)處理的主要環(huán)節(jié)如圖1-6所示。圖1-6大數(shù)據(jù)處理的主要環(huán)節(jié)1.6大數(shù)據(jù)處理的主要環(huán)節(jié)(1)數(shù)據(jù)采集與預(yù)處理
數(shù)據(jù)采集又稱為數(shù)據(jù)獲取,是指從現(xiàn)實(shí)世界系統(tǒng)中采集信息,并進(jìn)行計(jì)量和記錄的過程。數(shù)據(jù)的來源可能是傳感器、互聯(lián)網(wǎng)、系統(tǒng)運(yùn)行的日志文件等,也可能是人類生活和生產(chǎn)活動(dòng)所產(chǎn)生的各種類型的數(shù)據(jù)。在數(shù)據(jù)規(guī)模不斷擴(kuò)大的情況下,運(yùn)用數(shù)據(jù)采集自動(dòng)化工具,從外部系統(tǒng)、互聯(lián)網(wǎng)和物聯(lián)網(wǎng)等途徑自動(dòng)獲取、傳輸和記錄數(shù)據(jù)已經(jīng)成為必要的技術(shù)手段。
采集的數(shù)據(jù)可能包含噪聲、缺失值、不一致性和冗余等問題,數(shù)據(jù)預(yù)處理的目的就是要提高數(shù)據(jù)的質(zhì)量。通過數(shù)據(jù)預(yù)處理工作,可以使殘缺的數(shù)據(jù)完整,并將錯(cuò)誤的數(shù)據(jù)糾正、多余的數(shù)據(jù)去除,進(jìn)而將所需的數(shù)據(jù)挑選出來,并且進(jìn)行數(shù)據(jù)集成。數(shù)據(jù)預(yù)處理有多種方法,如數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)歸納等。1.6大數(shù)據(jù)處理的主要環(huán)節(jié)(2)數(shù)據(jù)存儲(chǔ)與管理
現(xiàn)在的大數(shù)據(jù)都是高度分散的,結(jié)構(gòu)松散,并且容量越來越大,存儲(chǔ)單位達(dá)到TB、PB甚至ZB級(jí)別,傳統(tǒng)的存儲(chǔ)方法已經(jīng)無法適應(yīng)其要求。目前,“分布式存儲(chǔ)系統(tǒng)”是大數(shù)據(jù)存儲(chǔ)的主要技術(shù)手段。
分布式存儲(chǔ)系統(tǒng)是相對(duì)于集中式存儲(chǔ)而言的,它將數(shù)據(jù)分散存儲(chǔ)在多臺(tái)獨(dú)立的設(shè)備上。傳統(tǒng)的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用集中的存儲(chǔ)服務(wù)器存放所有數(shù)據(jù),存儲(chǔ)服務(wù)器成為系統(tǒng)性能的瓶頸,也是可靠性和安全性的焦點(diǎn),無法滿足大規(guī)模存儲(chǔ)應(yīng)用的需求。分布式存儲(chǔ)系統(tǒng)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),使用多個(gè)存儲(chǔ)服務(wù)器來分擔(dān)存儲(chǔ)負(fù)荷,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展。1.6大數(shù)據(jù)處理的主要環(huán)節(jié)(3)數(shù)據(jù)分析與挖掘
數(shù)據(jù)分析與挖掘是指對(duì)體量巨大的數(shù)據(jù)進(jìn)行分析和挖掘,從中抽取出有價(jià)值的(隱含的、有潛在用途的、未知的、人們可以理解的)信息和模式的過程。也就是原始數(shù)據(jù)如何轉(zhuǎn)化為有用的信息,進(jìn)而轉(zhuǎn)化為知識(shí)與智慧的過程。“分析”通常指用傳統(tǒng)的統(tǒng)計(jì)學(xué)方法,對(duì)數(shù)據(jù)的特征進(jìn)行分析,如統(tǒng)計(jì)特征分析、數(shù)據(jù)分布特性分析和回歸分析等;而“挖掘”通常指的是用人工智能方法,挖掘大數(shù)據(jù)中所蘊(yùn)含的知識(shí),如聚類、分類和關(guān)聯(lián)規(guī)則挖掘等。1.6大數(shù)據(jù)處理的主要環(huán)節(jié)(4)計(jì)算結(jié)果展示
計(jì)算結(jié)果的展示環(huán)節(jié)主要運(yùn)用“數(shù)據(jù)可視化”技術(shù),也就是利用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)、數(shù)據(jù)分析與挖掘的結(jié)果轉(zhuǎn)換成圖形或圖像顯示出來。數(shù)據(jù)可視化是理解、探索、分析大數(shù)據(jù)的重要手段,常見的數(shù)據(jù)可視化工具包括圖表生成工具、可視化報(bào)表、商業(yè)智能分析、可視化編程語言等。
圖1-7展示了數(shù)據(jù)可視化的示例。1.6大數(shù)據(jù)處理的主要環(huán)節(jié)(4)計(jì)算結(jié)果展示圖1-7數(shù)據(jù)可視化示例1.7大數(shù)據(jù)的安全和共享
目前,大數(shù)據(jù)的安全問題突出,然而開放共享的需求非常迫切,在國家層面推出促進(jìn)數(shù)據(jù)共享開放、保障數(shù)據(jù)安全和保護(hù)公民隱私的相關(guān)政策和法規(guī),并制定相關(guān)的數(shù)據(jù)互操作技術(shù)規(guī)范和標(biāo)準(zhǔn),以及保證數(shù)據(jù)質(zhì)量的技術(shù)方法等,對(duì)于推動(dòng)大數(shù)據(jù)技術(shù)的發(fā)展和規(guī)范應(yīng)用具有非常重要的意義。1.7大數(shù)據(jù)的安全和共享1.7.1大數(shù)據(jù)的開放和共享
大數(shù)據(jù)的真正價(jià)值在于如何合法地充分應(yīng)用,數(shù)據(jù)開放和數(shù)據(jù)共享成為大數(shù)據(jù)應(yīng)用的關(guān)鍵因數(shù)。數(shù)據(jù)開放是指提供方無償提供數(shù)據(jù),需求方免費(fèi)獲取數(shù)據(jù);數(shù)據(jù)共享是指互為供需雙方,相互提供數(shù)據(jù)。但是,當(dāng)前信息“孤島”林立、融合困難、缺乏數(shù)據(jù)開放和共享機(jī)制,已成為大數(shù)據(jù)管理與利用中的重要難題。
近年來,世界各國紛紛將數(shù)據(jù)開放和共享納入國家發(fā)展戰(zhàn)略。2013年,在北愛爾蘭召開的G8會(huì)議(G8Summit,八國集團(tuán)首腦會(huì)議)上,簽署了《開放數(shù)據(jù)憲章》,提出了開放數(shù)據(jù)的五大原則、14個(gè)重點(diǎn)開放領(lǐng)域(見表1-3)和3項(xiàng)共同行動(dòng)。其所提出的開放數(shù)據(jù)五大原則如下。1.7大數(shù)據(jù)的安全和共享7.1大數(shù)據(jù)的開放和共享(1)開放數(shù)據(jù)成為規(guī)則。(2)注重質(zhì)量和數(shù)量。(3)讓所有人都可用。(4)為改善治理發(fā)布數(shù)據(jù)。(5)為激勵(lì)創(chuàng)新發(fā)布數(shù)據(jù)。1.7大數(shù)據(jù)的安全和共享1.7.1大數(shù)據(jù)的開放和共享
國務(wù)院于2015年9月發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》指出“大力推動(dòng)政府部門數(shù)據(jù)共享,穩(wěn)步推動(dòng)公共數(shù)據(jù)資源開放”。明確政務(wù)信息應(yīng)“以共享為原則,不共享為例外”,將“形成公共數(shù)據(jù)資源合理適度開放共享的法規(guī)制度和政策體系”作為中長期目標(biāo)。一方面,在依法加強(qiáng)安全保障和隱私保護(hù)的前提下,穩(wěn)步推動(dòng)公共數(shù)據(jù)資源開放。加快建設(shè)國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺(tái),制定公共機(jī)構(gòu)數(shù)據(jù)開放計(jì)劃,推進(jìn)公共機(jī)構(gòu)數(shù)據(jù)資源統(tǒng)一匯聚和集中向社會(huì)開放。通過政務(wù)數(shù)據(jù)公開共享,引導(dǎo)企業(yè)、行業(yè)協(xié)會(huì)、科研機(jī)構(gòu)、社會(huì)組織等主動(dòng)采集并開放數(shù)據(jù)。另一方面,依托政府?dāng)?shù)據(jù)統(tǒng)一共享交換平臺(tái),大力推進(jìn)國家人口基礎(chǔ)信息庫、法人單位信息資源庫、自然資源和空間地理基礎(chǔ)信息庫等國家基礎(chǔ)數(shù)據(jù)資源,以及金稅、金關(guān)、金財(cái)、金審、金盾、金宏、金保、金土、金農(nóng)、金水、金質(zhì)等信息系統(tǒng)跨部門、跨區(qū)域共享。加快各地區(qū)、各部門、各有關(guān)企事業(yè)單位及社會(huì)組織信用信息系統(tǒng)的互聯(lián)互通和信息共享,豐富面向公眾的信用信息服務(wù),提高政府服務(wù)和監(jiān)管水平。1.7大數(shù)據(jù)的安全和共享1.7.1大數(shù)據(jù)的開放和共享大數(shù)據(jù)的開放與共享涉及多個(gè)領(lǐng)域,包括但不限于:(1)政務(wù)大數(shù)據(jù)的開放與共享;(2)科學(xué)研究大數(shù)據(jù)的開放與共享;(3)企業(yè)大數(shù)據(jù)的開放與共享;(4)健康大數(shù)據(jù)的開放與共享;(5)金融與征信大數(shù)據(jù)的開放與共享;(6)個(gè)人大數(shù)據(jù)的開放與共享。
2022年10月28日,國務(wù)院辦公廳印發(fā)《全國一體化政務(wù)大數(shù)據(jù)體系建設(shè)指南》,文件中提出要深入推進(jìn)政務(wù)數(shù)據(jù)共享開放和平臺(tái)建設(shè),構(gòu)建全國一體化政務(wù)大數(shù)據(jù)體系,加強(qiáng)數(shù)據(jù)匯聚融合、共享開放和開發(fā)利用,促進(jìn)數(shù)據(jù)依法有序流動(dòng),充分發(fā)揮政務(wù)數(shù)據(jù)在提升政府履職能力、支撐數(shù)字政府建設(shè)以及推進(jìn)國家治理體系和治理能力現(xiàn)代化中的重要作用。1.7大數(shù)據(jù)的安全和共享1.7.2大數(shù)據(jù)安全與個(gè)人隱私保護(hù)一方面,數(shù)據(jù)共享開放的需求十分迫切,另一方面數(shù)據(jù)的無序流通與共享,又可能導(dǎo)致隱私保護(hù)和數(shù)據(jù)安全方面的重大風(fēng)險(xiǎn),必須對(duì)其加以規(guī)范和限制。從國家層面,為了強(qiáng)化大數(shù)據(jù)的安全保障,需要健全大數(shù)據(jù)安全保障體系,加強(qiáng)大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)安全技術(shù)研究與應(yīng)用,建立和落實(shí)大數(shù)據(jù)安全評(píng)估體系,加強(qiáng)關(guān)鍵信息基礎(chǔ)設(shè)施安全防護(hù)。隨著互聯(lián)網(wǎng)的迅猛發(fā)展和大數(shù)據(jù)時(shí)代的來臨,人們可以隨時(shí)隨地從互聯(lián)網(wǎng)上獲取信息和服務(wù),但公民的個(gè)人隱私安全問題也日益凸顯。個(gè)人幾乎無法保護(hù)自己的隱私,上網(wǎng)注冊(cè)時(shí)綁定的手機(jī)號(hào)、身份證號(hào)、移動(dòng)的位置信息、訪問過的App,還有銀行的各種數(shù)據(jù)都有可能被違法收集和再利用。有些企業(yè)為了自身業(yè)務(wù)發(fā)展的需要,會(huì)私自采集網(wǎng)站或App的個(gè)人隱私數(shù)據(jù),給社會(huì)道德和穩(wěn)定帶來嚴(yán)重隱患。1.7大數(shù)據(jù)的安全和共享1.7.2大數(shù)據(jù)安全與個(gè)人隱私保護(hù)
2020年11月13日,中共中央網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室和中華人民共和國國家互聯(lián)網(wǎng)信息辦公室的“App違法違規(guī)收集使用個(gè)人信息治理工作組”通過評(píng)估,發(fā)現(xiàn)35款A(yù)pp存在個(gè)人信息收集使用問題,
App名稱安卓版本號(hào)運(yùn)營者存在的問題課后網(wǎng)V8.浙江××教育科技股份有限公司(1)用戶明確表示不同意打開位置權(quán)限后,仍頻繁征求用戶同意,干擾用戶正常使用;(2)既未經(jīng)用戶同意,也未做匿名化處理,向第三方提供用戶課后網(wǎng)的賬號(hào)信息睿視V2.5.1.3.0北京××科技有限公司(1)收集用戶的宗教信仰、婚史等個(gè)人敏感信息,與業(yè)務(wù)功能無關(guān);(2)收集用戶的身份證照片、房產(chǎn)證照片等個(gè)人敏感信息時(shí),未同步告知用戶其目的營銷助手V3.42上?!痢列畔⒖萍加邢薰荆?)在申請(qǐng)打開相機(jī)、通信錄、電話、存儲(chǔ)、位置、麥克風(fēng)等可收集個(gè)人信息的權(quán)限時(shí),未同步告知用戶其目的;(2)未逐一列出嵌入的騰訊Bugly、極光推送、友盟等第三方SDK(軟件開發(fā)工具包)收集使用個(gè)人信息的目的、類型觸漫V5.4.1廣州××動(dòng)漫網(wǎng)絡(luò)科技有限公司(1)收集身份證號(hào)等個(gè)人第三信息時(shí),未同步告知用戶其目的;(2)因用戶不同意打開非必要的電話、存儲(chǔ)權(quán)限,拒絕提供所有業(yè)務(wù)功能表1-4App違法違規(guī)收集使用個(gè)人信息的例子1.7大數(shù)據(jù)的安全和共享1.7.2大數(shù)據(jù)安全與個(gè)人隱私保護(hù),
在個(gè)人隱私保護(hù)中,一方面要提高數(shù)據(jù)安全保護(hù)意識(shí),不輕易暴露自己的重要信息,盡可能不要將敏感信息發(fā)布在互聯(lián)網(wǎng)上,也不要隨意注冊(cè)使用來歷不明的App,更不要輕信網(wǎng)絡(luò)中的陌生人,時(shí)刻提高警惕。另一方面,每一個(gè)人都要嚴(yán)于律己,遵守國家的法律規(guī)范,不要觸犯他人的隱私權(quán)益,不要隨意散發(fā)未經(jīng)證實(shí)的消息。1.7大數(shù)據(jù)的安全和共享1.7.3我國大數(shù)據(jù)相關(guān)的安全政策法規(guī)
2016年11月,全國人民代表大會(huì)常務(wù)委員會(huì)頒布《中華人民共和國網(wǎng)絡(luò)安全法》,對(duì)網(wǎng)絡(luò)數(shù)據(jù)的完整性、保密性和可用性,防止網(wǎng)絡(luò)數(shù)據(jù)泄露或被竊取、篡改,以及網(wǎng)絡(luò)數(shù)據(jù)的境外流動(dòng)等提出相關(guān)規(guī)定。2016年12月,《國家網(wǎng)絡(luò)空間安全戰(zhàn)略》頒布,要求建立大數(shù)據(jù)安全管理制度,并建立完善國家網(wǎng)絡(luò)安全技術(shù)支撐體系。國家市場(chǎng)監(jiān)督管理總局和國家標(biāo)準(zhǔn)化管理委員會(huì)發(fā)布的規(guī)范《信息安全技術(shù)個(gè)人信息安全規(guī)范》(標(biāo)準(zhǔn)號(hào):GB/T35273—2020)于2020年10月1日正式實(shí)施。該標(biāo)準(zhǔn)針對(duì)個(gè)人信息面臨的安全問題,規(guī)范個(gè)人信息控制者在收集、保存、使用、共享、轉(zhuǎn)讓、公開披露等信息處理環(huán)節(jié)中的相關(guān)行為,旨在遏制個(gè)人信息的非法收集、濫用、泄漏等亂象,最大限度地保障個(gè)人的合法權(quán)益和社會(huì)公共利益。對(duì)標(biāo)準(zhǔn)中的具體事項(xiàng),法律法規(guī)另有規(guī)定的,需遵照其規(guī)定執(zhí)行。1.7大數(shù)據(jù)的安全和共享1.7.3我國大數(shù)據(jù)相關(guān)的安全政策法規(guī)2021年6月10日第十三屆全國人民代表大會(huì)常務(wù)委員會(huì)第二十九次會(huì)議通過《中華人民共和國數(shù)據(jù)安全法》,旨在規(guī)范數(shù)據(jù)處理活動(dòng),保障數(shù)據(jù)安全,促進(jìn)數(shù)據(jù)開發(fā)利用,保護(hù)個(gè)人、組織的合法權(quán)益,維護(hù)國家主權(quán)、安全和發(fā)展利益。該法案在數(shù)據(jù)安全與發(fā)展、數(shù)據(jù)安全制度、數(shù)據(jù)安全保護(hù)義務(wù)、政務(wù)數(shù)據(jù)安全與開放和法律責(zé)任等方面做出一系列規(guī)定。該法案提出建立國家數(shù)據(jù)分類分級(jí)保護(hù)制度;建立集中統(tǒng)一、高效權(quán)威的數(shù)據(jù)安全風(fēng)險(xiǎn)評(píng)估、報(bào)告、信息共享、監(jiān)測(cè)預(yù)警機(jī)制;建立數(shù)據(jù)安全應(yīng)急處置機(jī)制;建立數(shù)據(jù)安全審查制度,對(duì)影響或者可能影響國家安全的數(shù)據(jù)處理活動(dòng)進(jìn)行國家安全審查;國家對(duì)與維護(hù)國家安全和利益、履行國際義務(wù)相關(guān)的屬于管制物項(xiàng)的數(shù)據(jù)依法實(shí)施出口管制。1.7大數(shù)據(jù)的安全和共享1.7.3我國大數(shù)據(jù)相關(guān)的安全政策法規(guī)2022年2月15日,國家互聯(lián)網(wǎng)信息辦公室等十三部門聯(lián)合修訂發(fā)布的《網(wǎng)絡(luò)安全審查辦法》正式施行,提出以關(guān)鍵信息基礎(chǔ)設(shè)施的供應(yīng)鏈安全為核心,重點(diǎn)加強(qiáng)對(duì)數(shù)據(jù)安全的關(guān)注和規(guī)范,聚焦網(wǎng)絡(luò)產(chǎn)品、服務(wù)及數(shù)據(jù)處理活動(dòng),助推關(guān)鍵信息基礎(chǔ)設(shè)施與網(wǎng)絡(luò)平臺(tái)的高質(zhì)量發(fā)展。2022年6月22日,中央全面深化改革委員會(huì)第二十六次會(huì)議召開,審議通過了《中共中央國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》,提出數(shù)據(jù)基礎(chǔ)制度建設(shè)事關(guān)國家發(fā)展和安全大局,要維護(hù)國家數(shù)據(jù)安全,保護(hù)個(gè)人信息和商業(yè)秘密,促進(jìn)數(shù)據(jù)高效流通使用、賦能實(shí)體經(jīng)濟(jì),統(tǒng)籌推進(jìn)數(shù)據(jù)產(chǎn)權(quán)、流通交易、收益分配、安全治理,加快構(gòu)建數(shù)據(jù)基礎(chǔ)制度體系。1.7大數(shù)據(jù)的安全和共享1.7.3我國大數(shù)據(jù)相關(guān)的安全政策法規(guī)
2022年8月31日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布《數(shù)據(jù)出境安全評(píng)估申報(bào)指南(第一版)》,對(duì)數(shù)據(jù)出境安全評(píng)估的申報(bào)方式、申報(bào)流程、申報(bào)材料等具體要求做出了說明。數(shù)據(jù)處理者因業(yè)務(wù)需要確需向境外提供數(shù)據(jù),符合數(shù)據(jù)出境安全評(píng)估適用情形的,應(yīng)當(dāng)根據(jù)《數(shù)據(jù)出境安全評(píng)估辦法》規(guī)定,按照申報(bào)指南申報(bào)數(shù)據(jù)出境安全評(píng)估。
2022年10月28日,國務(wù)院辦公廳印發(fā)《全國一體化政務(wù)大數(shù)據(jù)體系建設(shè)指南》,明確了“堅(jiān)持整體協(xié)同、安全可控”的基本原則,提出“安全保障一體化”的任務(wù),并強(qiáng)調(diào)該任務(wù)是“以‘?dāng)?shù)據(jù)’為安全保障的核心要素”,要“形成制度規(guī)范、技術(shù)防護(hù)和運(yùn)行管理三位一體的全國一體化政務(wù)大數(shù)據(jù)安全保障體系”。1.7大數(shù)據(jù)的安全和共享1.7.3我國大數(shù)據(jù)相關(guān)的安全政策法規(guī)
2022年12月13日,中華人民共和國工業(yè)和信息化部正式發(fā)布《工業(yè)和信息化領(lǐng)域數(shù)據(jù)安全管理辦法(試行)》,其主要內(nèi)容包括界定工業(yè)和信息化領(lǐng)域數(shù)據(jù)和數(shù)據(jù)處理者的概念,明確監(jiān)管范圍和監(jiān)管職責(zé);確定數(shù)據(jù)分類分級(jí)管理、重要數(shù)據(jù)的識(shí)別與備案相關(guān)要求;針對(duì)不同級(jí)別的數(shù)據(jù),圍繞數(shù)據(jù)收集、存儲(chǔ)、加工、傳輸、提供、公開、銷毀、出境、轉(zhuǎn)移、委托處理等環(huán)節(jié),提出相應(yīng)安全管理和保護(hù)要求等7個(gè)方面,自2023年1月1日起施行。
2022年12月19日,《中共中央國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(“數(shù)據(jù)二十條”)正式對(duì)外發(fā)布。“數(shù)據(jù)二十條”正式拉開了我國數(shù)據(jù)基礎(chǔ)制度建設(shè)的大幕,對(duì)加快培育數(shù)據(jù)要素市場(chǎng)具有劃時(shí)代的里程碑意義?!皵?shù)據(jù)二十條”提出構(gòu)建4項(xiàng)基礎(chǔ)性制度,即“數(shù)據(jù)產(chǎn)權(quán)制度”“流通交易制度”“收益分配制度”和“安全治理制度”。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)
在信息化時(shí)代,數(shù)據(jù)已經(jīng)成為重要的生產(chǎn)要素和社會(huì)財(cái)富甚至國家間競爭的關(guān)鍵資源。世界各國都把推進(jìn)經(jīng)濟(jì)數(shù)字化作為實(shí)現(xiàn)創(chuàng)新發(fā)展的重要?jiǎng)幽?,在前沿技術(shù)研發(fā)、數(shù)據(jù)開放共享、隱私安全保護(hù)、人才培養(yǎng)等方面做了前瞻性布局。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)1.8.1大數(shù)據(jù)的發(fā)展現(xiàn)狀
大數(shù)據(jù)的提出是社會(huì)發(fā)展和應(yīng)用推動(dòng)的結(jié)果,也是信息技術(shù)發(fā)展的必然趨勢(shì)。根據(jù)中國信息通信研究院發(fā)布的《大數(shù)據(jù)白皮書(2022年)》,目前國際上許多發(fā)達(dá)國家通過政策、立法和設(shè)立機(jī)構(gòu)等形式,持續(xù)深化實(shí)施大數(shù)據(jù)戰(zhàn)略;在國內(nèi),黨中央、國務(wù)院做出一系列重要部署,促進(jìn)我國在大數(shù)據(jù)領(lǐng)域的良好發(fā)展。大數(shù)據(jù)技術(shù)在數(shù)據(jù)存儲(chǔ)與計(jì)算、數(shù)據(jù)管理、數(shù)據(jù)流通、數(shù)據(jù)應(yīng)用和數(shù)據(jù)安全五大核心領(lǐng)域的發(fā)展成效不斷顯現(xiàn)。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)1.世界主要國家和地區(qū)的大數(shù)據(jù)戰(zhàn)略
當(dāng)前,世界各國普遍將大數(shù)據(jù)產(chǎn)業(yè)作為經(jīng)濟(jì)社會(huì)發(fā)展的重點(diǎn),通過出臺(tái)“數(shù)字新政”、強(qiáng)化機(jī)構(gòu)設(shè)置、加大資金投入等方式,搶占大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的制高點(diǎn)。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)(1)美國
2012年3月,美國聯(lián)邦政府推出“大數(shù)據(jù)研究和發(fā)展倡議”,其中對(duì)于國家大數(shù)據(jù)戰(zhàn)略的表述如下:通過收集、處理龐大而復(fù)雜的數(shù)據(jù)信息,從中獲得知識(shí)和洞見,提升能力,加快科學(xué)、工程領(lǐng)域的創(chuàng)新步伐,強(qiáng)化美國國土安全,轉(zhuǎn)變教育和學(xué)習(xí)模式。作為響應(yīng),同年5月,奧巴馬政府發(fā)布了“構(gòu)建21世紀(jì)數(shù)字政府”戰(zhàn)略規(guī)劃,通過D平臺(tái)的建設(shè)吸引更多參與者加入,同時(shí)以行政管理和預(yù)算局牽頭推進(jìn)政府自身的公共數(shù)據(jù)開放。美國眾議院和參議院于2022年6月發(fā)布了《美國數(shù)據(jù)隱私和保護(hù)法案》討論稿,該法案在制度設(shè)計(jì)上既考慮了增強(qiáng)個(gè)人數(shù)據(jù)權(quán)利的國際趨勢(shì),又包含很多有利于數(shù)據(jù)價(jià)值釋放的內(nèi)容,以促進(jìn)對(duì)個(gè)人數(shù)據(jù)的合理利用。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)(2)歐盟
2010年11月,歐盟通信委員會(huì)向歐洲議會(huì)提交了題為《開放數(shù)據(jù):創(chuàng)新、增長和透明治理的引擎》的研究報(bào)告,圍繞開放數(shù)據(jù)制定大數(shù)據(jù)相關(guān)戰(zhàn)略,于2011年11月被歐盟數(shù)字議程采納,作為“歐盟開放數(shù)據(jù)戰(zhàn)略”部署實(shí)施。其核心在于促進(jìn)成員國政府擁有的公共數(shù)據(jù)的開放度與透明度,通過數(shù)據(jù)處理、共享平臺(tái)與科研數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),向全社會(huì)開放歐盟公共管理部門的所有信息,實(shí)現(xiàn)“泛歐門戶”成員國的無障礙信息共享。歐洲議會(huì)于2022年4月就歐盟《數(shù)據(jù)治理法案》的重要舉措,構(gòu)建了3個(gè)適用于各個(gè)行業(yè)的數(shù)據(jù)共享機(jī)制,確保在符合歐洲公共利益和數(shù)據(jù)提供者合法權(quán)益的條件下,實(shí)現(xiàn)數(shù)據(jù)更廣泛的國際共享。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)(3)韓國
在韓國政府倡導(dǎo)的“創(chuàng)意經(jīng)濟(jì)”國家發(fā)展方針指導(dǎo)下,韓國多個(gè)部門提出了具體的大數(shù)據(jù)發(fā)展計(jì)劃,包括2011年韓國科學(xué)技術(shù)政策研究院以“構(gòu)建英特爾綜合數(shù)據(jù)庫”為基礎(chǔ)的“大數(shù)據(jù)中心戰(zhàn)略”,以及2012年韓國國家科學(xué)技術(shù)委員會(huì)制定的大數(shù)據(jù)未來發(fā)展環(huán)境戰(zhàn)略計(jì)劃。其中,2012年由未來創(chuàng)造科學(xué)部牽頭的“培養(yǎng)大數(shù)據(jù)、云計(jì)算系統(tǒng)相關(guān)企業(yè)1000個(gè)”的國家級(jí)大數(shù)據(jù)發(fā)展計(jì)劃,通過《第五次國家信息化基本計(jì)劃(2013—2017)》等多項(xiàng)具體發(fā)展戰(zhàn)略落實(shí)到生產(chǎn)層面。
韓國在2022年成立了以國務(wù)總理為委員長的國家數(shù)據(jù)政策委員會(huì),作為國家數(shù)據(jù)和新產(chǎn)業(yè)政策的管理機(jī)構(gòu),并于9月召開了韓國國家數(shù)據(jù)政策委員會(huì)的第一次會(huì)議,發(fā)表了對(duì)8個(gè)數(shù)據(jù)領(lǐng)域,5個(gè)新產(chǎn)業(yè)領(lǐng)域,共計(jì)13個(gè)領(lǐng)域的改善計(jì)劃,目標(biāo)是在韓國打造全球頂級(jí)水平的數(shù)字力量。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)(4)日本
2010年5月,日本發(fā)達(dá)信息通信網(wǎng)絡(luò)社會(huì)推進(jìn)戰(zhàn)略本部發(fā)布了以實(shí)現(xiàn)國民本位的電子政府、加強(qiáng)地區(qū)間的互助關(guān)系等為目標(biāo)的《信息通信技術(shù)新戰(zhàn)略》,在其基礎(chǔ)上,總務(wù)省于2012年7月發(fā)布“活躍ICT日本”新綜合戰(zhàn)略,側(cè)重于以技術(shù)革新發(fā)展大數(shù)據(jù)戰(zhàn)略,進(jìn)而實(shí)現(xiàn)國民本位的電子政府、加強(qiáng)地區(qū)間的互助關(guān)系。日本的大數(shù)據(jù)戰(zhàn)略已經(jīng)在應(yīng)用當(dāng)中發(fā)揮了重要作用,ICT技術(shù)與大數(shù)據(jù)信息能力的結(jié)合對(duì)協(xié)助解決抗災(zāi)救災(zāi)和核電事故等公共問題貢獻(xiàn)明顯,提生了社會(huì)公共價(jià)值。
2021年9月,日本政府成立數(shù)字廳,成為日本負(fù)責(zé)行政數(shù)字化的最高部門,旨在構(gòu)建更完善的數(shù)字政府,推動(dòng)數(shù)字化轉(zhuǎn)型,目標(biāo)為“用智能手機(jī)在60秒內(nèi)完成所有行政程序”,最大程度利用數(shù)字技術(shù)優(yōu)勢(shì),將數(shù)字科技作為全新要素融入傳統(tǒng)社會(huì),促進(jìn)經(jīng)濟(jì)社會(huì)形態(tài)積極轉(zhuǎn)型。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)2.我國大數(shù)據(jù)戰(zhàn)略
黨中央、國務(wù)院高度重視大數(shù)據(jù)的產(chǎn)業(yè)發(fā)展,推動(dòng)實(shí)施國家大數(shù)據(jù)戰(zhàn)略。2015年7月,《國務(wù)院辦公廳關(guān)于運(yùn)用大數(shù)據(jù)加強(qiáng)對(duì)市場(chǎng)主體服務(wù)和監(jiān)管的基于意見》發(fā)布。同年9月,國務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,10月黨的十八屆五中全會(huì)正式提出“實(shí)施國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享”,標(biāo)志著大數(shù)據(jù)戰(zhàn)略上升為國家層面的戰(zhàn)略。2016年,《政務(wù)信息資源共享管理暫行辦法》出臺(tái)。2017年,《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》實(shí)施。工業(yè)和信息化部先后發(fā)布《工業(yè)數(shù)據(jù)分類分級(jí)指南(試行)》(2020年2月27日)、《關(guān)于推動(dòng)工業(yè)互聯(lián)網(wǎng)加快發(fā)展的通知》(2020年3月6日)、《關(guān)于工業(yè)大數(shù)據(jù)發(fā)展的指導(dǎo)意見》(2020年4月28日)、《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》(2021年11月30日),利用多種手段引導(dǎo)各方協(xié)同發(fā)掘工業(yè)數(shù)據(jù)的應(yīng)用價(jià)值。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)2.我國大數(shù)據(jù)戰(zhàn)略
2018年5月,習(xí)近平總書記在向中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)的賀信中指出,中國高度重視大數(shù)據(jù)發(fā)展。我們秉持創(chuàng)新、協(xié)調(diào)、綠色、開放、共享的發(fā)展理念,圍繞其建設(shè)網(wǎng)絡(luò)強(qiáng)國、數(shù)字中國、智慧社會(huì),全面實(shí)施國家大數(shù)據(jù)戰(zhàn)略,助力中國經(jīng)濟(jì)從高速增長轉(zhuǎn)向高質(zhì)量發(fā)展。
2021年3月11日,第十三屆全國人民代表大會(huì)第四次會(huì)議表決通過了關(guān)于國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要的決議(簡稱“十四五規(guī)劃”)。在“十四五規(guī)劃”中針對(duì)大數(shù)據(jù)的重要意義和促進(jìn)我國大數(shù)據(jù)發(fā)展提出了如下若干意見。(1)加快構(gòu)建全國一體化大數(shù)據(jù)中心體系,強(qiáng)化算力統(tǒng)籌智能調(diào)度,建設(shè)若干國家樞紐節(jié)點(diǎn)和大數(shù)據(jù)中心集群,建設(shè)E級(jí)和10E級(jí)超級(jí)計(jì)算中心;(2)培育壯大人工智能、大數(shù)據(jù)、區(qū)塊鏈、云計(jì)算、網(wǎng)絡(luò)安全等新興數(shù)字產(chǎn)業(yè);1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)2.我國大數(shù)據(jù)戰(zhàn)略(3)鼓勵(lì)企業(yè)開放搜索、電商、社交等數(shù)據(jù),發(fā)展第三方大數(shù)據(jù)服務(wù)產(chǎn)業(yè);(4)完善適用于大數(shù)據(jù)環(huán)境下的數(shù)據(jù)分類分級(jí)保護(hù)制度。加強(qiáng)數(shù)據(jù)安全評(píng)估,推動(dòng)數(shù)據(jù)跨境安全有序流動(dòng)。
2022年6月22日,中央全面深化改革委員會(huì)第二十六次會(huì)議召開,審議通過了《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》,提出要加快構(gòu)建數(shù)據(jù)基礎(chǔ)制度,充分發(fā)揮我國海量數(shù)據(jù)規(guī)模和豐富應(yīng)用場(chǎng)景優(yōu)勢(shì),激活數(shù)據(jù)要素潛能,做強(qiáng)做優(yōu)做大數(shù)字經(jīng)濟(jì),增強(qiáng)經(jīng)濟(jì)發(fā)展新動(dòng)能,構(gòu)筑國家競爭新優(yōu)勢(shì)。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)3.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀從我國大數(shù)據(jù)行業(yè)發(fā)展的歷程看,可以粗略地將其劃分為“探索期”“市場(chǎng)啟動(dòng)期”“高速發(fā)展期”3個(gè)階段,未來將逐步邁入“應(yīng)用成熟期”。(1)探索期(2009年—2011年)。大數(shù)據(jù)產(chǎn)業(yè)在中國出現(xiàn),并受到廣泛關(guān)注。典型的大數(shù)據(jù)產(chǎn)品和服務(wù)相繼上線,互聯(lián)網(wǎng)企業(yè)率先將大數(shù)據(jù)應(yīng)用落地。(2)市場(chǎng)啟動(dòng)期(2012—2014年)。大數(shù)據(jù)企業(yè)用戶不斷增多,資本市場(chǎng)高度重視,具有數(shù)據(jù)資產(chǎn)的企業(yè)謀求轉(zhuǎn)型。但是,這一時(shí)期大數(shù)據(jù)的市場(chǎng)和技術(shù)不夠成熟,同質(zhì)化較強(qiáng)、技術(shù)成熟度弱、商業(yè)模式尚不清晰。(3)高速發(fā)展期(2015—2022年)。大數(shù)據(jù)市場(chǎng)陸續(xù)出現(xiàn)新商業(yè)模式、新產(chǎn)品、新服務(wù)。大數(shù)據(jù)市場(chǎng)集中典型的商業(yè)模式得到市場(chǎng)印證,新產(chǎn)品和新服務(wù)具有穩(wěn)定的剛性需求,細(xì)分市場(chǎng)逐漸走向差異化競爭。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)3.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀
2021年11月工業(yè)和信息化部發(fā)布的《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》指出,“十三五”時(shí)期,我國大數(shù)據(jù)產(chǎn)業(yè)快速起步。據(jù)測(cè)算,產(chǎn)業(yè)規(guī)模年均復(fù)合增長率超過30%,2020年超過1萬億元,發(fā)展取得顯著成效,逐漸成為支撐我國經(jīng)濟(jì)社會(huì)發(fā)展的優(yōu)勢(shì)產(chǎn)業(yè)。我國大數(shù)據(jù)發(fā)展的態(tài)勢(shì)好、動(dòng)力足,政策體系逐步完善,產(chǎn)業(yè)基礎(chǔ)日益鞏固,產(chǎn)業(yè)鏈初步形成,生態(tài)體系持續(xù)優(yōu)化。
京津冀、上海、貴州等8個(gè)國家大數(shù)據(jù)綜合試驗(yàn)區(qū)先行先試,布局建設(shè)了11個(gè)大數(shù)據(jù)領(lǐng)域國家新型工業(yè)化產(chǎn)業(yè)示范基地,有力推動(dòng)了大數(shù)據(jù)產(chǎn)業(yè)集聚,行業(yè)集聚示范效應(yīng)顯著增強(qiáng)。從2012年黨的十八大以來,貴州全力實(shí)施大數(shù)據(jù)戰(zhàn)略行動(dòng),數(shù)字經(jīng)濟(jì)增速連續(xù)6年全國第一,已成為世界聚集超大型數(shù)據(jù)中心最多的地區(qū)之一,吸引了包括蘋果、華為、騰訊等公司或機(jī)構(gòu)的項(xiàng)目落地。大數(shù)據(jù)發(fā)展惠及政用、商用、民用多個(gè)領(lǐng)域,給當(dāng)?shù)孛癖娚a(chǎn)、生活方式帶來顯著改變。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)3.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀
阿里巴巴、百度和華為等龍頭企業(yè)持續(xù)深化大數(shù)據(jù)布局和應(yīng)用創(chuàng)新。例如,從2020年到2022年,阿里云分布式數(shù)據(jù)庫PolarDB市場(chǎng)份額位居全球云數(shù)據(jù)庫第三位及中國市場(chǎng)第一位。浪潮集團(tuán)、中科曙光、美林?jǐn)?shù)據(jù)等基礎(chǔ)技術(shù)型企業(yè)向醫(yī)療、電力、能源等領(lǐng)域進(jìn)一步下沉專業(yè)化服務(wù),浪潮集團(tuán)“基于健康醫(yī)療大數(shù)據(jù)的醫(yī)養(yǎng)健康創(chuàng)新應(yīng)用”、中科曙光“面向智慧電力的大數(shù)據(jù)智能分析平臺(tái)”、美林?jǐn)?shù)據(jù)“基于知識(shí)圖譜技術(shù)的能源企業(yè)數(shù)據(jù)資產(chǎn)管理應(yīng)用”入選工業(yè)和信息化部2020年大數(shù)據(jù)產(chǎn)業(yè)發(fā)展試點(diǎn)示范項(xiàng)目。
2021年5月,國家發(fā)展和改革委員會(huì)等4個(gè)部門印發(fā)《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》,提出堅(jiān)持新發(fā)展理念,堅(jiān)持改革創(chuàng)新、先行先試,推動(dòng)數(shù)據(jù)中心、云計(jì)算服務(wù)、數(shù)據(jù)流通與治理、數(shù)據(jù)應(yīng)用、數(shù)據(jù)安全等統(tǒng)籌協(xié)調(diào)、一體設(shè)計(jì),加快打造一批算力高質(zhì)量供給、數(shù)據(jù)高效率流通的大數(shù)據(jù)發(fā)展高地。統(tǒng)籌圍繞國家重大區(qū)域發(fā)展戰(zhàn)略,根據(jù)能源結(jié)構(gòu)、產(chǎn)業(yè)布局、市場(chǎng)發(fā)展、氣候環(huán)境等因素,在京津冀、長三角、粵港澳大灣區(qū)、成渝,以及貴州、內(nèi)蒙古、甘肅、寧夏等地布局建設(shè)全國一體化算力網(wǎng)絡(luò)國家樞紐節(jié)點(diǎn)(以下簡稱“國家樞紐節(jié)點(diǎn)”),發(fā)展數(shù)據(jù)中心集群,引導(dǎo)數(shù)據(jù)中心集約化、規(guī)?;?、綠色化發(fā)展。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)3.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀
目前我國大數(shù)據(jù)發(fā)展態(tài)勢(shì)良好,但是大數(shù)據(jù)人才還很缺乏。根據(jù)中華人民共和國人力資源和社會(huì)保障部發(fā)布的《新職業(yè)——大數(shù)據(jù)工程技術(shù)人員就業(yè)景氣現(xiàn)狀分析報(bào)告》,2020年中國大數(shù)據(jù)行業(yè)人才的需求規(guī)模達(dá)到210萬人,且未來5年內(nèi)仍將保持30%~40%的增速,需求總量預(yù)計(jì)為2000萬左右。未來大數(shù)據(jù)領(lǐng)域的人才需求,主要包括大數(shù)據(jù)專業(yè)技術(shù)人才和跨領(lǐng)域的綜合型人才。大數(shù)據(jù)專業(yè)技術(shù)人才主要從事數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能模型與算法開發(fā),以及大數(shù)據(jù)工程應(yīng)用和實(shí)施等工作;跨領(lǐng)域的綜合型人才主要從事資源整合、行業(yè)應(yīng)用和大數(shù)據(jù)相關(guān)法律領(lǐng)域的工作。從大數(shù)據(jù)從業(yè)人員的數(shù)量和質(zhì)量,以及各大高校和培訓(xùn)機(jī)構(gòu)人才培養(yǎng)的現(xiàn)狀來看,目前所培養(yǎng)的大數(shù)據(jù)人才遠(yuǎn)遠(yuǎn)滿足不了目前國內(nèi)市場(chǎng)的大量需求,高端人才尤其稀缺。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)3.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀
中國信息通信研究院發(fā)布的《大數(shù)據(jù)白皮書(2022年)》報(bào)告顯示,2021年我國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模增加到1.3萬億元,復(fù)合增長率超過30%;發(fā)表大數(shù)據(jù)領(lǐng)域論文量占全球31%,大數(shù)據(jù)相關(guān)專利受理總數(shù)占全球超過50%,均位居第一;大數(shù)據(jù)市場(chǎng)主體總量超18萬家,大數(shù)據(jù)相關(guān)企業(yè)獲得的投資總金額超過800億元,再創(chuàng)歷史新高。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)3.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀
工業(yè)和信息化部發(fā)布的《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》提出,到2025年,中國大數(shù)據(jù)產(chǎn)業(yè)測(cè)算規(guī)模突破3萬億元,年均復(fù)合增長率保持在25%左右,創(chuàng)新力強(qiáng)、附加值高、自主可控的現(xiàn)代化大數(shù)據(jù)產(chǎn)業(yè)體系基本形成。《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》論述了我國大數(shù)據(jù)的發(fā)展成效。
一是產(chǎn)業(yè)基礎(chǔ)日益鞏固。數(shù)據(jù)資源極大豐富,總量位居全球前列。產(chǎn)業(yè)創(chuàng)新日漸活躍,專利受理總數(shù)全球占比近20%?;A(chǔ)設(shè)施不斷夯實(shí),建成全球規(guī)模最大的光纖網(wǎng)絡(luò)和4G網(wǎng)絡(luò),5G終端連接數(shù)超過2億,位居世界第一。標(biāo)準(zhǔn)體系逐步完善,33項(xiàng)國家標(biāo)準(zhǔn)立項(xiàng),24項(xiàng)發(fā)布。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)3.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀
二是產(chǎn)業(yè)鏈初步形成。圍繞“數(shù)據(jù)資源、基礎(chǔ)硬件、通用軟件、行業(yè)應(yīng)用、安全保障”的大數(shù)據(jù)產(chǎn)品和服務(wù)體系初步形成,全國遴選出338個(gè)大數(shù)據(jù)優(yōu)秀產(chǎn)品和解決方案,以及400個(gè)大數(shù)據(jù)典型試點(diǎn)示范。行業(yè)融合逐步深入,大數(shù)據(jù)應(yīng)用從互聯(lián)網(wǎng)、金融、電信等數(shù)據(jù)資源基礎(chǔ)較好的領(lǐng)域逐步向智能制造、數(shù)字社會(huì)、數(shù)字政府等領(lǐng)域拓展。
三是生態(tài)體系持續(xù)優(yōu)化。區(qū)域集聚成效顯著,已建設(shè)了8個(gè)國家大數(shù)據(jù)綜合試驗(yàn)區(qū)和11個(gè)大數(shù)據(jù)領(lǐng)域國家新型工業(yè)化產(chǎn)業(yè)示范基地。一批大數(shù)據(jù)龍頭企業(yè)快速崛起,初步形成了大企業(yè)引領(lǐng)、中小企業(yè)協(xié)同、創(chuàng)新企業(yè)不斷涌現(xiàn)的發(fā)展格局。產(chǎn)業(yè)支撐能力不斷提升,咨詢服務(wù)、評(píng)估測(cè)試等服務(wù)保障體系基本建立。數(shù)字營商環(huán)境持續(xù)優(yōu)化,電子政務(wù)在線服務(wù)指數(shù)躍升至全球第9位,進(jìn)入世界領(lǐng)先梯隊(duì)。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)3.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀
根據(jù)2022年IDC(國際數(shù)據(jù)公司)最新的數(shù)據(jù)顯示,2021年全球大數(shù)據(jù)市場(chǎng)的IT總投資規(guī)模為2176.1億美元(約1.5萬億元人民幣),并有望在2026年增至4491.1億美元(約3.1萬億元人民幣),5年預(yù)測(cè)期內(nèi)(2021—2026)實(shí)現(xiàn)約15.6%的復(fù)合年增長率。中國市場(chǎng)方面,IDC預(yù)計(jì),2026年中國大數(shù)據(jù)IT支出規(guī)模預(yù)計(jì)為359.5億美元(約2482.73億元人民幣),市場(chǎng)規(guī)模位列單體國家第二。從增速的角度來看,中國大數(shù)據(jù)IT支出5年CAGR約為21.4%,位列全球第一。中國大數(shù)據(jù)市場(chǎng)支出預(yù)測(cè)如圖1-8所示。1.8大數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì)1.8.2大數(shù)據(jù)的發(fā)展趨勢(shì)
中國信息通信研究院發(fā)布的《大數(shù)據(jù)白皮書(2022年)》認(rèn)為,經(jīng)過多年技術(shù)和產(chǎn)業(yè)的發(fā)展,大數(shù)據(jù)產(chǎn)業(yè)內(nèi)部逐漸細(xì)化,形成數(shù)據(jù)存儲(chǔ)與計(jì)算、數(shù)據(jù)管理、數(shù)據(jù)流通、數(shù)據(jù)應(yīng)用、數(shù)據(jù)安全五大核心領(lǐng)域。五大核心領(lǐng)域當(dāng)前呈現(xiàn)不同發(fā)展現(xiàn)狀,在數(shù)據(jù)要素大戰(zhàn)略的新形勢(shì)下,發(fā)展方向均進(jìn)一步明確:一是數(shù)據(jù)存儲(chǔ)與計(jì)算的發(fā)展方向聚焦為在持續(xù)提升能力基礎(chǔ)上,通過精細(xì)化運(yùn)營和技術(shù)升級(jí)實(shí)現(xiàn)“降本提質(zhì)”;二是數(shù)據(jù)管理的發(fā)展方向聚焦為盡快借助政策紅利和智能技術(shù)帶來的改變,促進(jìn)各行業(yè)大規(guī)模實(shí)現(xiàn)全域數(shù)據(jù)管理;三是數(shù)據(jù)流通的發(fā)展方向聚焦為通過建設(shè)基礎(chǔ)制度、創(chuàng)新流通技術(shù),實(shí)現(xiàn)數(shù)據(jù)流通過程中安全與效率的平衡,從而構(gòu)建全社會(huì)范圍數(shù)據(jù)規(guī)范化流通;四是數(shù)據(jù)應(yīng)用的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業(yè)儀表行業(yè)相關(guān)投資計(jì)劃提議范本
- 美容護(hù)膚品銷售合同三篇
- 城市發(fā)展主管工作總結(jié)與規(guī)劃前瞻計(jì)劃
- 2023-2024學(xué)年四川省攀枝花市外東區(qū)攀枝花市實(shí)驗(yàn)學(xué)校人教版四年級(jí)上冊(cè)期末測(cè)試數(shù)學(xué)試卷(原卷版)-A4
- 《防溺水教育班會(huì)》課件
- 《高血脂患者宣教》課件
- 《計(jì)算機(jī)軟件系統(tǒng)》課件
- 創(chuàng)建國家衛(wèi)生城市工作參考計(jì)劃范文5篇
- 《計(jì)算導(dǎo)數(shù)》課件
- 電子商務(wù)調(diào)研報(bào)告范文
- 2024年安全員之A證考試題庫附參考答案(黃金題型)
- 學(xué)員培訓(xùn)合同范本
- 民宿管理與運(yùn)營基礎(chǔ)知識(shí)單選題100道及答案解析
- 《法學(xué)開題報(bào)告:人工智能創(chuàng)作物著作權(quán)的法律分析》4500字
- GB/T 44906-2024生物質(zhì)鍋爐技術(shù)規(guī)范
- 公司招標(biāo)書范本大全(三篇)
- 課題2 碳的氧化物(第1課時(shí))教學(xué)課件九年級(jí)化學(xué)上冊(cè)人教版2024
- 2024年藥膳大賽理論知識(shí)考試題庫400題(含答案)
- 寒假假前安全教育課件
- 世界美術(shù)史 1學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 呼吸衰竭應(yīng)急預(yù)案及處理流程
評(píng)論
0/150
提交評(píng)論