大數(shù)據(jù)挖掘與商務(wù)智能_第1頁(yè)
大數(shù)據(jù)挖掘與商務(wù)智能_第2頁(yè)
大數(shù)據(jù)挖掘與商務(wù)智能_第3頁(yè)
大數(shù)據(jù)挖掘與商務(wù)智能_第4頁(yè)
大數(shù)據(jù)挖掘與商務(wù)智能_第5頁(yè)
已閱讀5頁(yè),還剩144頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)挖掘與商務(wù)智能大數(shù)據(jù)時(shí)代大數(shù)據(jù)時(shí)代大數(shù)據(jù)時(shí)代第1頁(yè)數(shù)據(jù)是寶貴財(cái)富,其中蘊(yùn)含大量有用(有利于管理和決策)信息和知識(shí)。計(jì)算機(jī)和通訊技術(shù)發(fā)展,使數(shù)據(jù)量急劇增加,人類進(jìn)入大數(shù)據(jù)時(shí)代。收集、傳輸、存放、整合、分析與挖掘數(shù)據(jù)各項(xiàng)技術(shù)快速發(fā)展。大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析與數(shù)據(jù)挖掘作為一門信息技術(shù),其興起主要是受數(shù)據(jù)積累增加和對(duì)數(shù)據(jù)分析需求驅(qū)動(dòng)。第2頁(yè)在大數(shù)據(jù)時(shí)代,我們共同探討數(shù)據(jù)分析與數(shù)據(jù)挖掘思想、方法、工具和應(yīng)用前景。盡量向大家介紹數(shù)據(jù)挖掘與商務(wù)智能全貌,給一些資料性信息。因?yàn)閿?shù)據(jù)挖掘與商務(wù)智能包括方法廣泛,軟件、工具、企業(yè)太多,應(yīng)用太廣,此次以介紹方法為主。第3頁(yè)大數(shù)據(jù)挖掘與商務(wù)智能概論大數(shù)據(jù)將變革現(xiàn)有數(shù)

2、據(jù)觀大數(shù)據(jù)”對(duì)社會(huì)發(fā)展影響商務(wù)智能和數(shù)據(jù)挖掘作用云計(jì)算構(gòu)建新型信息基礎(chǔ)設(shè)施信息時(shí)代高科技犯罪目錄大數(shù)據(jù)挖掘與商務(wù)智能概論大數(shù)據(jù)將變革現(xiàn)有數(shù)據(jù)觀大數(shù)據(jù)”對(duì)社會(huì)發(fā)展影響商務(wù)智能和數(shù)據(jù)挖掘作用云計(jì)算構(gòu)建新型信息基礎(chǔ)設(shè)施信息時(shí)代高科技犯罪大數(shù)據(jù)挖掘與商務(wù)智能概論大數(shù)據(jù)將變革現(xiàn)有數(shù)據(jù)觀大數(shù)據(jù)”對(duì)社會(huì)發(fā)展影響商務(wù)智能和數(shù)據(jù)挖掘作用云計(jì)算構(gòu)建新型信息基礎(chǔ)設(shè)施信息時(shí)代高科技犯罪第4頁(yè) 大數(shù)據(jù)挖掘 與商務(wù)智能概論第一部分第一第5頁(yè)從數(shù)據(jù)談起數(shù)據(jù)無(wú)所不在大數(shù)據(jù)現(xiàn)象、起源與特征第6頁(yè)大數(shù)據(jù)現(xiàn)象與起源(1)從2月18日開(kāi)始,全國(guó)70萬(wàn)家三上企業(yè)和房地產(chǎn)開(kāi)發(fā)經(jīng)營(yíng)企業(yè)將在統(tǒng)一數(shù)據(jù)采集和處理平臺(tái)上,經(jīng)過(guò)互聯(lián)網(wǎng)直接向國(guó)家數(shù)據(jù)

3、中心。年實(shí)現(xiàn)數(shù)據(jù)聯(lián)網(wǎng)直報(bào)“三個(gè)全部”:全部由調(diào)查對(duì)象填報(bào)調(diào)查,全部經(jīng)過(guò)互聯(lián)網(wǎng)直接向國(guó)家數(shù)據(jù)中心報(bào)送;全部現(xiàn)場(chǎng)調(diào)查,全部由調(diào)查員手持電子終端設(shè)備現(xiàn)場(chǎng)采集數(shù)據(jù),并經(jīng)過(guò)網(wǎng)絡(luò)直報(bào)國(guó)家數(shù)據(jù)中心;全部國(guó)家統(tǒng)計(jì)調(diào)查,均在統(tǒng)一軟件平臺(tái)處理數(shù)據(jù)。國(guó)家(省、市)統(tǒng)計(jì)局(8)第7頁(yè)國(guó)家統(tǒng)計(jì)局推進(jìn)“大數(shù)據(jù)”應(yīng)用11月19日下午,國(guó)家統(tǒng)計(jì)局與baidu、阿里巴巴等11家企業(yè)簽署了大數(shù)據(jù)戰(zhàn)略合作框架協(xié)議,共同推進(jìn)大數(shù)據(jù)在政府統(tǒng)計(jì)中應(yīng)用。年9月30日,國(guó)家統(tǒng)計(jì)局第二批企業(yè)大數(shù)據(jù)戰(zhàn)略合作協(xié)議簽約儀式在京盛大舉行,搜房、浪潮、數(shù)海等6家企業(yè)參加簽約。第8頁(yè)大數(shù)據(jù)現(xiàn)象與起源(2)金融數(shù)據(jù)(/)低頻數(shù)據(jù):日數(shù)據(jù)高頻數(shù)據(jù):金融市場(chǎng)中

4、逐筆交易數(shù)據(jù)和逐秒交易數(shù)據(jù)超高頻數(shù)據(jù):實(shí)時(shí)數(shù)據(jù)第9頁(yè)金融大數(shù)據(jù)挑戰(zhàn)與應(yīng)對(duì)在以網(wǎng)絡(luò)化和數(shù)字化為基本特征新經(jīng)濟(jì)時(shí)代,金融產(chǎn)業(yè)日漸回歸本質(zhì),表現(xiàn)為金融數(shù)據(jù)流產(chǎn)生、交換、存放、分析以及使用。大數(shù)據(jù)對(duì)金融業(yè)帶來(lái)了猛烈挑戰(zhàn)沖擊,我國(guó)金融機(jī)構(gòu)需要明確大數(shù)據(jù)戰(zhàn)略頂層設(shè)計(jì),加強(qiáng)大數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),實(shí)施穩(wěn)妥大數(shù)據(jù)安全策略,方能從容迎接大數(shù)據(jù)時(shí)代。第10頁(yè)在超市中,數(shù)據(jù)經(jīng)過(guò)條碼掃描機(jī)獲得。這么“購(gòu)物藍(lán)”數(shù)據(jù)庫(kù)由大量交易統(tǒng)計(jì)組成。RFID技術(shù)與物聯(lián)網(wǎng)應(yīng)用大數(shù)據(jù)現(xiàn)象與起源(3)第11頁(yè)什么是物聯(lián)網(wǎng)?全方面感知可靠傳輸智能處理感知傳輸智能利用RFID、傳感器、二維碼等能夠隨時(shí)隨地采集物體動(dòng)態(tài)信息。經(jīng)過(guò)網(wǎng)絡(luò)將感知各種信息進(jìn)

5、行實(shí)時(shí)傳送。 利用計(jì)算機(jī)技術(shù),及時(shí)地對(duì)海量數(shù)據(jù)進(jìn)行信息控制,真正到達(dá)了人與物溝通、物與物溝通。第12頁(yè)物聯(lián)網(wǎng)大數(shù)據(jù)挑戰(zhàn)物聯(lián)網(wǎng)不但僅是傳感器,物聯(lián)網(wǎng)是提供支撐智慧地球一個(gè)基礎(chǔ)架構(gòu),物聯(lián)網(wǎng)存在使這種基于大數(shù)據(jù)采集以及分析變成了一個(gè)可能,這面臨著三項(xiàng)挑戰(zhàn)。物聯(lián)網(wǎng)邊緣計(jì)算。物聯(lián)網(wǎng)中間件。物聯(lián)網(wǎng)運(yùn)行管理平臺(tái)。第13頁(yè) 全球四大衛(wèi)星導(dǎo)航系統(tǒng)北斗衛(wèi)星導(dǎo)航系統(tǒng)美國(guó)全球定位系統(tǒng)俄羅斯格洛納斯歐盟伽利略系統(tǒng)到年,北斗衛(wèi)星導(dǎo)航系統(tǒng)將擁有35顆衛(wèi)星截止6月12日,已發(fā)射23顆,形成覆蓋全球衛(wèi)星網(wǎng)絡(luò),九省示范應(yīng)用,LBS。大數(shù)據(jù)現(xiàn)象與起源(4)第14頁(yè)北斗“三步走”發(fā)展戰(zhàn)略GEO(GeosynchronousEeart

6、hOrbit):地球靜止軌道衛(wèi)星IGSO(InclinedGeosynchronousSatelliteOrbit):傾斜軌道同時(shí)衛(wèi)星MEO(MediumEarthOrbit):中高軌衛(wèi)星第15頁(yè)大數(shù)據(jù)與北斗系統(tǒng)把短信和導(dǎo)航結(jié)合,是中國(guó)北斗衛(wèi)星導(dǎo)航系統(tǒng)獨(dú)特創(chuàng)造。北斗衛(wèi)星導(dǎo)航系統(tǒng)應(yīng)用當(dāng)前逐步形成規(guī)?;?biāo)準(zhǔn)化趨勢(shì),已向民用用戶全方面開(kāi)放,成功應(yīng)用于個(gè)人位臵服務(wù)、氣象應(yīng)用、交通管理、運(yùn)輸管理、應(yīng)搶救援、精密授時(shí)、精細(xì)農(nóng)業(yè)等多個(gè)行業(yè)。近期,東南亞四國(guó)(泰國(guó)、老撾、文萊緬甸)都于中國(guó)政府簽署協(xié)議,采取我國(guó)北斗導(dǎo)航系統(tǒng),同時(shí)中國(guó)與巴基斯坦有望在近期簽署北斗系統(tǒng)合作協(xié)議,成為第五個(gè)使用北斗導(dǎo)航國(guó)家。第16

7、頁(yè)生物信息學(xué)(人類基因組計(jì)劃)神經(jīng)信息學(xué)(人類腦計(jì)劃)大數(shù)據(jù)現(xiàn)象與起源(5)第17頁(yè)生命科學(xué)大數(shù)據(jù)時(shí)代降臨要處理當(dāng)前生命科學(xué)問(wèn)題,需要從時(shí)空狀態(tài)對(duì)生老病死進(jìn)行解讀,這就需要大數(shù)據(jù),這種大數(shù)據(jù)揭示就是大科學(xué),這種大科學(xué)就是人類發(fā)展史上最大產(chǎn)業(yè)。生命科學(xué)已進(jìn)入大科學(xué)、大數(shù)據(jù)時(shí)代,基因資源源頭。怎樣去儲(chǔ)存這些資源,為未來(lái)研究使用提供基礎(chǔ)成為一個(gè)關(guān)鍵問(wèn)題。為了適應(yīng)更龐大數(shù)據(jù)存放、處理、分析與應(yīng)用要求,深圳華大基因研究院還和國(guó)家超算天津中心、深圳超算中心、廣州超算中心等機(jī)構(gòu)展開(kāi)戰(zhàn)略性合作。下一步,將經(jīng)過(guò)云計(jì)算模式來(lái)組織存放和處理相關(guān)數(shù)據(jù)。第18頁(yè)大數(shù)據(jù)現(xiàn)象與起源(6)19第19頁(yè)網(wǎng)絡(luò)大數(shù)據(jù)20網(wǎng)絡(luò)數(shù)據(jù)即

8、使不是最原始大數(shù)據(jù)源,也是使用最廣泛、認(rèn)可度最高大數(shù)據(jù)源。網(wǎng)絡(luò)數(shù)據(jù)是指用戶瀏覽萬(wàn)維網(wǎng)所產(chǎn)生日志信息,是等候分析和挖掘信息寶庫(kù)。橫跨于大量不一樣行業(yè)中企業(yè)組織已經(jīng)把那些來(lái)自于網(wǎng)站詳細(xì)而又處于客戶層面行為數(shù)據(jù)源整合入它們本身企業(yè)數(shù)據(jù)分析環(huán)境中。第20頁(yè)大數(shù)據(jù)引發(fā)數(shù)據(jù)觀變革第二部分第21頁(yè)我們來(lái)到大數(shù)據(jù)時(shí)代數(shù)據(jù)極簡(jiǎn)主義大數(shù)據(jù):一切數(shù)據(jù)皆有用數(shù)據(jù)觀、技術(shù)、成本改變(硬件、軟件和除理技術(shù)、起源)第22頁(yè)全球每秒鐘發(fā)送 2.9 百萬(wàn)封電子郵件,一分鐘讀一篇話,足夠一個(gè)人晝夜不息讀5.5 年天天會(huì)有 2.88 萬(wàn)個(gè)小時(shí)視頻上傳到Y(jié)outube,足夠一個(gè)人晝夜不息觀看3.3 年推特上天天公布 5 千萬(wàn)條消息,

9、假設(shè)10 秒鐘瀏覽一條信息,這些消息足夠一個(gè)人晝夜不息瀏覽16 年天天亞馬遜上將產(chǎn)生 6.3 百萬(wàn)筆訂單每個(gè)月網(wǎng)民在Facebook 上要花費(fèi)7 千億分鐘,被移動(dòng)互聯(lián)網(wǎng)使用者發(fā)送和接收數(shù)據(jù)高達(dá)1.3EBGoogle 上天天需要處理24PB 數(shù)據(jù)人們從信息被動(dòng)接收者變成了主動(dòng)創(chuàng)造者我們來(lái)到大數(shù)據(jù)時(shí)代第23頁(yè)20世紀(jì)90年代,數(shù)據(jù)倉(cāng)庫(kù)之父Bill Inmon就經(jīng)常提及Big Data5 月,在“云計(jì)算相遇大數(shù)據(jù)” 為主題EMC World 會(huì)議中,EMC 拋出了Big Data概念什么是大數(shù)據(jù):Big Data名詞由來(lái)第24頁(yè) 大數(shù)據(jù)=海量數(shù)據(jù)+復(fù)雜類型數(shù)據(jù) 海量和非結(jié)構(gòu)化,增加如此之塊,以至于難

10、以使用現(xiàn)有數(shù)據(jù)庫(kù)管理工具來(lái)駕馭,困難在于數(shù)據(jù)獲取、存貯、搜索、共享、分析和可視化等方面 大數(shù)據(jù)定義數(shù)據(jù)量復(fù)雜性:種類和速度銷量庫(kù)存薪酬表客戶信息合約ERP/CRMWEB2.0廣告博客搜索營(yíng)銷文本/圖像網(wǎng)絡(luò)日志大數(shù)據(jù)社會(huì)情緒音頻/視頻傳感器RFID維基/博客微博金融信息個(gè)人數(shù)據(jù)位置信息政府信息氣象數(shù)據(jù)保險(xiǎn)信息EBPBTBGB維基大數(shù)據(jù)定義 大數(shù)據(jù)是任何超出了一臺(tái)計(jì)算機(jī)處理能力數(shù)據(jù)量亞馬遜大數(shù)據(jù)定義 大數(shù)據(jù)是由局部數(shù)據(jù)匯聚而成能反應(yīng)出整體數(shù)據(jù),整體數(shù)據(jù)又隨時(shí)空在不停膨脹。Informatica大數(shù)據(jù)定義 大數(shù)據(jù)=交易數(shù)據(jù)+互動(dòng)數(shù)據(jù)+觀察數(shù)據(jù)中國(guó)電信大數(shù)據(jù)定義數(shù)據(jù)量中心大數(shù)據(jù)定義第25頁(yè) 假如自然界

11、中事件完全不可預(yù)測(cè)地隨機(jī)發(fā)生,人們生活將無(wú)法忍受;與此相反,假如每一件事情都是確定、完全能夠預(yù)測(cè),則生活將是無(wú)趣。利用因果關(guān)系解釋觀察現(xiàn)象或預(yù)測(cè)未來(lái)存在邏輯和實(shí)際上困難。 大數(shù)據(jù)理性認(rèn)知美C.R 勞 與傳統(tǒng)比較,大數(shù)據(jù)分析處理關(guān)鍵是預(yù)測(cè)和推斷,根本變革在于不刻意追求因果關(guān)系,而更多關(guān)注相關(guān)關(guān)系。也就是說(shuō),只要知道和什么相關(guān),而無(wú)須強(qiáng)求為何相關(guān)。英舍恩伯格 大數(shù)據(jù)時(shí)代降臨,使人類第一次有機(jī)會(huì)和條件在非常多和非常深入層次取得和使用全方面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),簡(jiǎn)而言之就是樣本=總體。英舍恩伯格 大數(shù)據(jù)為政府統(tǒng)計(jì)提供了總體性、非結(jié)構(gòu)化、豐富真實(shí)原始資料,能夠極大地縮短數(shù)據(jù)采集時(shí)間,降低報(bào)表填報(bào)任務(wù)

12、,減輕調(diào)查對(duì)象負(fù)擔(dān),提升統(tǒng)計(jì)數(shù)據(jù)質(zhì)量。 國(guó)家統(tǒng)計(jì)局 馬建堂大數(shù)據(jù),也叫全局?jǐn)?shù)據(jù)、總體數(shù)據(jù),數(shù)據(jù)量越大其預(yù)測(cè)和推斷準(zhǔn)確性越高第26頁(yè)1. 體量Volume2. 多樣性Variety3. 價(jià)值密度value4. 速度Velocity大數(shù)據(jù)異構(gòu)和多樣性,各種形式(文本、圖像、視頻、機(jī)器數(shù)據(jù)),無(wú)模式或者模式不顯著,不連貫語(yǔ)法或句義以大量不相關(guān)信息對(duì)未來(lái)趨勢(shì)與模式可預(yù)測(cè)分析,深度復(fù)雜分析,機(jī)器學(xué)習(xí)、人工智能實(shí)時(shí)分析而非批量式分析,數(shù)據(jù)輸入、處理與丟棄,立竿見(jiàn)影大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理數(shù)據(jù)集合大數(shù)據(jù):4V特征非結(jié)構(gòu)化數(shù)據(jù)超大規(guī)模暴發(fā)式增加,比結(jié)構(gòu)化數(shù)據(jù)增

13、加快10倍到50倍,是傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)10倍到50倍,占總數(shù)據(jù)量8090%第27頁(yè)大數(shù)據(jù)不但僅是數(shù)據(jù)“大” 多大? PB級(jí)比大更主要是數(shù)據(jù)復(fù)雜性、全方面性,有時(shí)甚至大數(shù)據(jù)中小數(shù)據(jù)如一條微博就含有顛覆性價(jià)值軟件是大數(shù)據(jù)引擎第28頁(yè)大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)區(qū)分大數(shù)據(jù)是在傳統(tǒng)數(shù)據(jù)庫(kù)學(xué)科的分支數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基礎(chǔ)上進(jìn)一步發(fā)展起來(lái)的。但有兩點(diǎn)比較主要的不同:結(jié)構(gòu)化程度:傳統(tǒng)數(shù)據(jù)庫(kù)保存的是結(jié)構(gòu)化或者半結(jié)構(gòu)化的數(shù)據(jù),以二維表或者標(biāo)準(zhǔn)XML文件的方式存儲(chǔ)數(shù)據(jù),由于結(jié)構(gòu)清晰,處理相對(duì)容易;大數(shù)據(jù)面向的是一切計(jì)算機(jī)可以存儲(chǔ)的數(shù)據(jù)格式,包括互聯(lián)網(wǎng)上的各種網(wǎng)頁(yè)、圖片、音頻、視頻,包括辦公文檔、報(bào)表,包括人們?cè)谒阉饕嬷休斎?/p>

14、的關(guān)鍵詞、在社交網(wǎng)絡(luò)中的留言、喜好,也包括各種傳感器自動(dòng)收集的監(jiān)控結(jié)果等等,顯然不同的格式處理起來(lái)更加困難。噪聲(異常)數(shù)據(jù)的處理:傳統(tǒng)數(shù)據(jù)庫(kù)通常把異常數(shù)據(jù)先剔除,應(yīng)用在需要高精確度的領(lǐng)域,如銀行對(duì)每個(gè)賬戶的管理;大數(shù)據(jù)則允許異常數(shù)據(jù)存在,更多應(yīng)用在預(yù)測(cè)方面,找出大量數(shù)據(jù)中隱藏的關(guān)聯(lián)關(guān)系,少量異常數(shù)據(jù)不會(huì)對(duì)總體結(jié)果產(chǎn)生影響。第29頁(yè)大數(shù)據(jù)市場(chǎng)分析1-年中國(guó)大數(shù)據(jù)市場(chǎng)規(guī)模2各行業(yè)大數(shù)據(jù)市場(chǎng)規(guī)模政府、互聯(lián)網(wǎng)、電信、金融大數(shù)據(jù)市場(chǎng)規(guī)模較大,四個(gè)行業(yè)將占據(jù)二分之一市場(chǎng)份額。因?yàn)楦鱾€(gè)行業(yè)都存在大數(shù)據(jù)應(yīng)用需求,潛在市場(chǎng)空間非??捎^。是中國(guó)大數(shù)據(jù)市場(chǎng)元年,一些大數(shù)據(jù)產(chǎn)品已經(jīng)推出,部分行業(yè)也有大數(shù)據(jù)應(yīng)用案例產(chǎn)

15、生。年-20,將迎來(lái)大數(shù)據(jù)市場(chǎng)飛速發(fā)展。年中國(guó)大數(shù)據(jù)市場(chǎng)規(guī)模到達(dá)4.7億元,20大數(shù)據(jù)市場(chǎng)將迎來(lái)增速為138.3%飛躍,到20,整個(gè)市場(chǎng)規(guī)模迫近百億。第30頁(yè)國(guó)際企業(yè)角力大數(shù)據(jù) EMCEMC大數(shù)據(jù)處理方案專注于使組織更有效地使用他們從不一樣起源產(chǎn)生數(shù)據(jù),包含網(wǎng)絡(luò)上,網(wǎng)頁(yè)上,消費(fèi)者,監(jiān)控系統(tǒng)和傳感器。EMC數(shù)據(jù)計(jì)算產(chǎn)品事業(yè)部正在開(kāi)發(fā)分析工具以處理大數(shù)據(jù)現(xiàn)象。EMC大數(shù)據(jù)處理方案包含40多個(gè)產(chǎn)品。年7月收購(gòu)數(shù)據(jù)庫(kù)軟件供給商Greenplum,花費(fèi)3億美元七月收購(gòu)數(shù)據(jù)復(fù)制處理方案提供商Data Domain,花費(fèi)24億美元不一定和大數(shù)據(jù)完全相關(guān),EMC從起收購(gòu)了Archer Technologies

16、, SourceLabs, FastScale Technology, Configuresoft, and Varonis Systems。IBMIBM策略是提供一個(gè)全方面方法來(lái)處理前所未有信息爆炸提出挑戰(zhàn),因?yàn)樾畔⒘坎徽撛诹髁?、種類、速度還是活力上都是爆炸式增加IBM一直致力于擴(kuò)大對(duì)包含數(shù)據(jù)倉(cāng)庫(kù)中大數(shù)據(jù)、信息流和結(jié)構(gòu)化數(shù)據(jù)分析在過(guò)去四年中,IBM已經(jīng)投入超出120億美元進(jìn)行了23項(xiàng)相關(guān)并購(gòu),其中包含:209月收購(gòu)數(shù)據(jù)庫(kù)分析供給商N(yùn)etezza企業(yè),花費(fèi)17億美元2010月收購(gòu)網(wǎng)絡(luò)分析軟件供給商Coremetrics年10月收購(gòu)數(shù)據(jù)分析和統(tǒng)計(jì)軟件提供商SPSS, 花費(fèi)12億美元年1月收購(gòu)業(yè)務(wù)

17、規(guī)則管理軟件供給商ILOG, 花費(fèi)3億4千萬(wàn)美元花費(fèi)20億美元收購(gòu)商務(wù)智能軟件供給商Cognos微軟微軟提供了高性能計(jì)算能力,并在靠Windows Compute Cluster服務(wù)器進(jìn)入相關(guān)市場(chǎng)最近,微軟HPC部門開(kāi)發(fā)了該企業(yè)Dryad并行處理技術(shù)小區(qū)技術(shù)預(yù)覽(CTP),第一步是向Windows HPC Server用戶提供處理大數(shù)據(jù)工具甲骨文甲骨文大數(shù)據(jù)提供數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)軟件主要用于配合Sun硬件,尤其是它最高端服務(wù)7月收購(gòu)專注于數(shù)據(jù)復(fù)制和實(shí)時(shí)數(shù)據(jù)集成處理方案私人企業(yè)GoldenGate Software第31頁(yè)大數(shù)據(jù)產(chǎn)業(yè)價(jià)值鏈數(shù)據(jù)數(shù)據(jù)掌控者,擁有或者能夠搜集大量數(shù)據(jù)企業(yè)。海量數(shù)據(jù)就是財(cái)富

18、,能夠考慮自己分析或者賣數(shù)據(jù)給其它企業(yè)。技術(shù)技術(shù)供給商或者分析企業(yè)。掌握了從海量數(shù)據(jù)中分析出有用信息技能或者工具,但本身不一定擁有數(shù)據(jù)。思維有創(chuàng)新思維人或者企業(yè)。他們對(duì)大數(shù)據(jù)敏感,有怎樣挖掘數(shù)據(jù)新價(jià)值獨(dú)特想法。第32頁(yè)分析技術(shù):數(shù)據(jù)處理:自然語(yǔ)言處理技術(shù)統(tǒng)計(jì)和分析:A/B test; top N排行榜;地域占比;文本情感分析數(shù)據(jù)挖掘:關(guān)聯(lián)規(guī)則分析;分類;聚類模型預(yù)測(cè):預(yù)測(cè)模型;機(jī)器學(xué)習(xí);建模仿真大數(shù)據(jù)技術(shù):數(shù)據(jù)采集:ETL工具數(shù)據(jù)存?。宏P(guān)系數(shù)據(jù)庫(kù);NoSQL;SQL等基礎(chǔ)架構(gòu)支持:云存放;分布式文件系統(tǒng)等計(jì)算結(jié)果展現(xiàn):云計(jì)算;標(biāo)簽云;關(guān)系圖等大數(shù)據(jù)技術(shù)體系:取、存、管、用存放結(jié)構(gòu)化數(shù)據(jù):海量數(shù)

19、據(jù)查詢、統(tǒng)計(jì)、更新等操作效率低非結(jié)構(gòu)化數(shù)據(jù)圖片、視頻、word、pdf、ppt等文件存放不利于檢索、查詢和存放半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化存放按照非結(jié)構(gòu)化存放處理方案:Hadoop(MapReduce技術(shù))流計(jì)算(twitterstorm和yahoo!S4)第33頁(yè)高并發(fā)讀寫大數(shù)據(jù)關(guān)鍵技術(shù)需求高效率存放 和訪問(wèn)高可擴(kuò)展性和高可用性低成本建設(shè)運(yùn)維 確保一致性開(kāi)銷過(guò)大,難以實(shí)現(xiàn)高并發(fā) 存放性能受限于控制器,性能難以確保 關(guān)系型表單存放難以適應(yīng)不一樣數(shù)據(jù)類型 上億行數(shù)據(jù)超級(jí)達(dá)標(biāo)效率極低 傳統(tǒng)基于盤陣存放設(shè)備,造價(jià)昂貴,且市場(chǎng)壟斷嚴(yán)重,建設(shè)成本居高不下,擴(kuò)容成本尤其高 許可和維護(hù)花費(fèi)高昂 無(wú)法簡(jiǎn)單經(jīng)過(guò)添加

20、服務(wù)節(jié)點(diǎn)來(lái)擴(kuò)展數(shù)據(jù)容量和負(fù)載能力,難以進(jìn)行橫向擴(kuò)展 數(shù)據(jù)庫(kù)升級(jí)需要停機(jī)維護(hù)和數(shù)據(jù)遷移,造成服務(wù)中止 不確保遵照ACID標(biāo)準(zhǔn),提升并發(fā)讀寫性能 Schema-Free存放適應(yīng)不一樣數(shù)據(jù)類型舍棄SQL標(biāo)準(zhǔn)功效,盡可能簡(jiǎn)化數(shù)據(jù)操作,提升效率MapReduce實(shí)現(xiàn)高效訪問(wèn) 基于X86設(shè)備,價(jià)格低廉開(kāi)源系統(tǒng),節(jié)約許可費(fèi)用 支持水平擴(kuò)展,可簡(jiǎn)單經(jīng)過(guò)添加服務(wù)節(jié)點(diǎn)來(lái)擴(kuò)展數(shù)據(jù)容量和負(fù)載能力數(shù)據(jù)庫(kù)升級(jí)不影響服務(wù)連續(xù)第34頁(yè)大數(shù)據(jù)分析模型研究對(duì)象由組織、用戶、大數(shù)據(jù)和工具組成運(yùn)行系統(tǒng)研究?jī)?nèi)容大數(shù)據(jù)組成 大數(shù)據(jù)行為 大數(shù)據(jù)行為和數(shù)據(jù)組織研究方法知識(shí)工程解構(gòu)大數(shù)據(jù)系統(tǒng)研發(fā)工程支撐大數(shù)據(jù)系統(tǒng)價(jià)值工程牽引大數(shù)據(jù)系統(tǒng)研究目標(biāo)

21、大數(shù)據(jù)生產(chǎn)平臺(tái)大數(shù)據(jù)開(kāi)發(fā)平臺(tái)大數(shù)據(jù)采集平臺(tái)大數(shù)據(jù)應(yīng)用平臺(tái)研究重點(diǎn)數(shù)據(jù)分而治之資源組織調(diào)度邏輯復(fù)制遷移組織大數(shù)據(jù)用戶工具知識(shí)工程研發(fā)工程價(jià)值工程社會(huì)價(jià)值結(jié)構(gòu)功效信源信宿信道控制狀態(tài)協(xié)同生產(chǎn)采集存放應(yīng)用傳遞展現(xiàn)概念定議劃分經(jīng)濟(jì)價(jià)值科技價(jià)值商業(yè)價(jià)值為何是什么怎么做第35頁(yè)大數(shù)據(jù)變革現(xiàn)有數(shù)據(jù)觀:以變革始大數(shù)據(jù)將變革人們認(rèn)世界的模式,最重要的是建模分析的方式;由選擇抽樣到全樣本(all-sample),“樣本=總體”;大數(shù)據(jù)更重視相關(guān)關(guān)系,而不去過(guò)于追求因果關(guān)系;即使從前的建模也一樣是模擬,無(wú)法解決因果;大數(shù)據(jù)將徹底改變IT公司的構(gòu)成,擁有數(shù)據(jù)、技術(shù)與思維的公司將三足鼎立,但最終擁有數(shù)據(jù)的公司將最有價(jià)值

22、。大數(shù)據(jù)改變政府和企業(yè)對(duì)待數(shù)據(jù)的觀念,真正認(rèn)識(shí)到數(shù)據(jù)的重要性政務(wù)的大數(shù)據(jù)需求:原有異構(gòu)數(shù)據(jù)的整理收集以及未來(lái)的應(yīng)用創(chuàng)新第36頁(yè) 大數(shù)據(jù)是組織一個(gè)資產(chǎn) 數(shù)據(jù)資源已經(jīng)是上升為國(guó)家戰(zhàn)略資源。人類已進(jìn)入“后信息經(jīng)濟(jì)時(shí)代”,即智慧經(jīng)濟(jì)。 智慧經(jīng)濟(jì)是一個(gè)創(chuàng)新形態(tài)萌生經(jīng)濟(jì),能實(shí)現(xiàn)經(jīng)濟(jì)與環(huán)境、能源、社會(huì)最大程度可連續(xù)發(fā)展。 大數(shù)據(jù)是智慧經(jīng)濟(jì)基礎(chǔ)。從哪里來(lái)、當(dāng)前在哪里、要到哪里去大數(shù)據(jù)是一個(gè)資產(chǎn)第37頁(yè) 三個(gè)小故事:智者善用數(shù)據(jù)和工具 孟德?tīng)柾攵闺s交試驗(yàn),基于數(shù)十年試驗(yàn)數(shù)據(jù),經(jīng)過(guò)采集、分析、歸納、推導(dǎo)、預(yù)測(cè)找到其規(guī)律。(一)使用數(shù)據(jù) 曹沖稱象,大而劃之、分而治之。秤是分析,算盤是匯總。(二)處理數(shù)據(jù) 平民傳奇,

23、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)系統(tǒng),處理對(duì)象切分與存貯;MR編程模式處理分析與歸納。(三)構(gòu)建系統(tǒng)第38頁(yè) 大數(shù)據(jù)處理行為技術(shù)特征數(shù)據(jù)無(wú)限分而治之功效有限復(fù)制分發(fā)第39頁(yè) 大數(shù)據(jù)系統(tǒng)定義 是一個(gè)以人為主導(dǎo),利用計(jì)算機(jī)硬件、軟件、網(wǎng)絡(luò)通信設(shè)備以及其它辦公設(shè)備,進(jìn)行信息搜集、傳輸、加工、儲(chǔ)存、更新、拓展和維護(hù)系統(tǒng) 是一個(gè)將各類信息系統(tǒng)產(chǎn)生數(shù)據(jù)作為存貯、分析和利用信息系統(tǒng),經(jīng)過(guò)借助計(jì)算機(jī)硬件、軟件、網(wǎng)絡(luò)通信設(shè)備以及其它設(shè)備,實(shí)現(xiàn)對(duì)數(shù)據(jù)搜集、存貯、處理、傳遞、備份系統(tǒng)。管理信息系統(tǒng)大數(shù)據(jù)系統(tǒng)第40頁(yè) 大數(shù)據(jù)系統(tǒng)設(shè)計(jì)目標(biāo)設(shè)計(jì)目標(biāo)1可以存貯海量數(shù)2可以進(jìn)行高速處理3可以快速開(kāi)發(fā)出并行服務(wù)4可以搭建在廉價(jià)的機(jī)

24、群上第41頁(yè) 大數(shù)據(jù)系統(tǒng)邏輯架構(gòu)數(shù)據(jù)應(yīng)用層外部系統(tǒng)層數(shù)據(jù)計(jì)算層數(shù)據(jù)節(jié)點(diǎn)子系統(tǒng)任務(wù)節(jié)點(diǎn)子系統(tǒng)綜合管控層信息安全保障體系標(biāo)準(zhǔn)規(guī)范體系數(shù)據(jù)分析層 定制計(jì)算子系統(tǒng) 數(shù)據(jù)分析子系統(tǒng) 數(shù)據(jù)倉(cāng)庫(kù)子系統(tǒng) 數(shù)據(jù)域節(jié)點(diǎn)子系統(tǒng)任務(wù)節(jié)點(diǎn)子系統(tǒng)名稱節(jié)點(diǎn)子系統(tǒng)作業(yè)節(jié)點(diǎn)子系統(tǒng)數(shù)據(jù)庫(kù)主節(jié)點(diǎn)子系統(tǒng)統(tǒng)一協(xié)同節(jié)點(diǎn)子系統(tǒng)備份節(jié)點(diǎn)子系統(tǒng) 數(shù)據(jù)調(diào)用子系統(tǒng) 數(shù)據(jù)展現(xiàn)子系統(tǒng) 數(shù)據(jù)采集子系統(tǒng) ERP系統(tǒng) 電子商務(wù)網(wǎng)站 第42頁(yè) 與現(xiàn)有系統(tǒng)關(guān)系現(xiàn)有系統(tǒng)大數(shù)據(jù)系統(tǒng)數(shù)據(jù)輸入分布節(jié)點(diǎn)1分布節(jié)點(diǎn)2分布節(jié)點(diǎn)3輸出現(xiàn)有系統(tǒng)調(diào)用大數(shù)據(jù)系統(tǒng)分布節(jié)點(diǎn)1分布節(jié)點(diǎn)2分布節(jié)點(diǎn)3輸出第43頁(yè)HADOOP第44頁(yè)MaHout第45頁(yè)主流大數(shù)據(jù)庫(kù) 使用現(xiàn)實(shí)狀況第46頁(yè)大數(shù)據(jù)

25、現(xiàn)象An EverestSized Opportunity!47第47頁(yè)容量單位:從K到Y(jié)KMGTPEZYKKilo1K字節(jié)=1,024字節(jié)MMeg1M字節(jié)=1,048,576字節(jié)GGiga1G字節(jié)=1,073,741,824字節(jié)TTera1T字節(jié)=1,099,511,627,776字節(jié)PPeta1P字節(jié)=1,125,899,906,842,624字節(jié)EExa1E字節(jié)=1,152,921,504,606,846,976字節(jié)ZZetta1Z字節(jié)=1,180,591,620,717,411,303,424字節(jié)YYotta1Y字節(jié)=1208,925,819,614,629,174,706,176字節(jié)

26、48數(shù)據(jù)存放單位及換算關(guān)系第48頁(yè)大數(shù)據(jù)價(jià)值(Value)大數(shù)據(jù)價(jià)值密度低。大數(shù)據(jù)將引發(fā)新“智慧革命”:從海量、復(fù)雜、實(shí)時(shí)大數(shù)據(jù)中能夠發(fā)現(xiàn)知識(shí)、提升智能、創(chuàng)造價(jià)值。有了云計(jì)算、物聯(lián)網(wǎng),但缺乏大數(shù)據(jù)分析處理核心技術(shù),智慧城市“大腦”就不夠發(fā)達(dá),“智商”就不夠高,能力就不夠強(qiáng)。第49頁(yè)廣義大數(shù)據(jù)人才、組織(數(shù)據(jù)科學(xué)家等)數(shù)據(jù)處理、存放、分析技術(shù)(Hadoop、NoSQL、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等)非結(jié)構(gòu)化數(shù)據(jù)(文本、視頻、聲音、傳感器、GPS等)結(jié)構(gòu)化數(shù)據(jù)(客戶數(shù)據(jù)、銷售數(shù)據(jù)等)狹義大數(shù)據(jù)(具備3V特征)廣義大數(shù)據(jù)第50頁(yè)新信息世界觀:物理世界、信息世界、人類社會(huì)組成三元世界大數(shù)據(jù)第51頁(yè)共生智能系統(tǒng)

27、中數(shù)據(jù)、信息與知識(shí)管理組織與社群:人類集體智能決議與問(wèn)題求解擴(kuò)展計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng):人工智能數(shù)據(jù)加工平臺(tái)可感知環(huán)境與物品:周遭智能(AmI)感知與執(zhí)行終端數(shù)據(jù)、信息、知識(shí)流轉(zhuǎn)共生智能系統(tǒng):綜合集成共同處理現(xiàn)實(shí)復(fù)雜問(wèn)題第52頁(yè)大數(shù)據(jù)對(duì)社會(huì)發(fā)展影響第三部分第53頁(yè)大數(shù)據(jù)對(duì)社會(huì)發(fā)展影響科學(xué)研究第四種范式公共管理大數(shù)據(jù)國(guó)家戰(zhàn)略智慧城市工業(yè)生產(chǎn)與商業(yè)經(jīng)營(yíng)大數(shù)據(jù)產(chǎn)業(yè)鏈與商務(wù)智能第54頁(yè)自然科學(xué)大數(shù)據(jù)???月11日出版科學(xué)9月3日出版自然雜志刊登專題大數(shù)據(jù)雜志登載專題數(shù)據(jù)處理第55頁(yè)第四種范式觀察與經(jīng)驗(yàn)描述與試驗(yàn)、理論建模、仿真與計(jì)算等科研模式之后,當(dāng)代又出現(xiàn)了數(shù)據(jù)密集型科研范式。微軟企業(yè)于10月公布了TheF

28、ourthParadigm:Data-IntensiveScientific,首次全方面地描述了快速興起數(shù)據(jù)密集型科學(xué)研究?!癟heNextScienceRevolution”,HarvardBusinessReview,November第56頁(yè)第四范式:數(shù)據(jù)密集型科學(xué)發(fā)覺(jué)漢字版科學(xué)正在進(jìn)入一個(gè)嶄新階段。在信息與網(wǎng)絡(luò)技術(shù)快速發(fā)展推進(jìn)下,大量從宏觀到微觀、從自然到社會(huì)觀察、感知、計(jì)算、仿真、模擬、傳輸?shù)仍O(shè)施和活動(dòng),產(chǎn)生出大量科學(xué)數(shù)據(jù),形成被成為“大數(shù)據(jù)”(BigData)新科學(xué)基礎(chǔ)設(shè)施。57第57頁(yè)大數(shù)據(jù)國(guó)家戰(zhàn)略5月,聯(lián)合國(guó)公布了大數(shù)據(jù)促發(fā)展:挑戰(zhàn)與機(jī)遇白皮書。58第58頁(yè)國(guó)家大數(shù)據(jù)戰(zhàn)略8月,國(guó)

29、務(wù)院促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要。9月,貴州獲批全國(guó)首個(gè)大數(shù)據(jù)綜合試驗(yàn)區(qū)。11月,中國(guó)共產(chǎn)黨十八屆五中全會(huì)公報(bào)提出要實(shí)施“國(guó)家大數(shù)據(jù)戰(zhàn)略”。年3月,“十三五”規(guī)劃綱要中指出,實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略。年8月,國(guó)家發(fā)改委公布關(guān)于組織申報(bào)大數(shù)據(jù)領(lǐng)域創(chuàng)新能力建設(shè)專題通知,組建13個(gè)國(guó)家級(jí)大數(shù)據(jù)試驗(yàn)室。年10月,第二批國(guó)家級(jí)大數(shù)據(jù)綜試區(qū),包含兩個(gè)跨區(qū)域類綜試區(qū)(京津冀、珠江三角洲),四個(gè)區(qū)域示范類綜試區(qū)(上海、河南、重慶、沈陽(yáng)),一個(gè)大數(shù)據(jù)基礎(chǔ)設(shè)施統(tǒng)籌發(fā)展類綜試區(qū)(內(nèi)蒙古)。第59頁(yè)公共管理智慧城市建設(shè)愿景第60頁(yè)“智慧城市”系統(tǒng)體系結(jié)構(gòu)綜合應(yīng)用智能處理傳輸感知華為企業(yè)提議一個(gè)“智慧城市”系統(tǒng)體系結(jié)構(gòu)第61頁(yè)物理

30、空間信息與知識(shí)空間社會(huì)心智空間智慧城市三個(gè)空間理論第62頁(yè)智慧城市三個(gè)空間理論城市管理是個(gè)復(fù)雜學(xué)科,智慧城市建設(shè)是一項(xiàng)復(fù)雜系統(tǒng)工程。對(duì)智慧城市建設(shè)應(yīng)該同時(shí)著眼于三個(gè)空間整體。63第63頁(yè)64第64頁(yè)44第65頁(yè)大數(shù)據(jù):變革世界關(guān)鍵資源Dataarebecomingthenewrawmaterialofbusiness:aneconomicinputalmostonaparwithcapitalandlabor.數(shù)據(jù)正逐步變成商業(yè)所需原材料之一:一項(xiàng)幾乎和資本或勞力一樣主要經(jīng)濟(jì)原料。(Feb.27th,2010)66第66頁(yè)產(chǎn)業(yè)界關(guān)注麥肯錫咨詢企業(yè)“大數(shù)據(jù)”研究報(bào)告“Bigdata:Thenex

31、tfrontierforinnovation,competition,andproductivity”McKinseyGlobalInstitute,May2011.高德納(Gartner)研究與顧問(wèn)咨詢企業(yè)第67頁(yè)大數(shù)據(jù)產(chǎn)業(yè)鏈大數(shù)據(jù)產(chǎn)業(yè)是指對(duì)互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、運(yùn)行商等渠道產(chǎn)生大量數(shù)據(jù)資源進(jìn)行快速獲取、搜集存放、價(jià)值提煉、智能處理和分發(fā),從而用于企業(yè)決議支持等方面信息服務(wù)業(yè)。大數(shù)據(jù)全生命周期能夠劃分為“數(shù)據(jù)產(chǎn)生數(shù)據(jù)采集數(shù)據(jù)傳輸數(shù)據(jù)存放數(shù)據(jù)處理數(shù)據(jù)分析與挖掘數(shù)據(jù)公布、展示和應(yīng)用產(chǎn)生新數(shù)據(jù)”等階段。大數(shù)據(jù)產(chǎn)業(yè)鏈主要包含數(shù)據(jù)源層、數(shù)據(jù)存放平臺(tái)層、數(shù)據(jù)分析和挖掘?qū)右约按髷?shù)據(jù)應(yīng)用層。大數(shù)據(jù)應(yīng)用層主要分

32、布在互聯(lián)網(wǎng)、電信、金融、零售和政府等行業(yè),和企業(yè)用戶業(yè)務(wù)愈加結(jié)合緊密,經(jīng)過(guò)大數(shù)據(jù)分析實(shí)現(xiàn)商業(yè)智能(BI)、決議支持和用戶需求挖掘等應(yīng)用價(jià)值。第68頁(yè)大數(shù)據(jù)產(chǎn)業(yè)鏈第69頁(yè)大數(shù)據(jù)產(chǎn)業(yè)鏈第70頁(yè)通信行業(yè)大數(shù)據(jù)產(chǎn)業(yè)鏈結(jié)構(gòu)第71頁(yè)第72頁(yè)Gartner魔力象限橫軸:前瞻性(CompletenessofVision)包括廠商或供給商提供產(chǎn)品底層技術(shù)基礎(chǔ)能力、市場(chǎng)領(lǐng)導(dǎo)能力、創(chuàng)新能力和外部投資等等。縱軸:執(zhí)行能力(AbilitytoExecute)包括產(chǎn)品使用難度、市場(chǎng)服務(wù)完善程度和技術(shù)支持能力、管理團(tuán)體經(jīng)驗(yàn)和能力等。NichePlayers利基者、投機(jī)者Challengers挑戰(zhàn)者Visionaries有遠(yuǎn)

33、見(jiàn)者、愿景者Leaders領(lǐng)導(dǎo)者、行業(yè)領(lǐng)袖52第73頁(yè)年數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)管了解決方案魔力象限第74頁(yè)商務(wù)智能(BI)魔力象限第75頁(yè)智能決議與管理科學(xué)目前決策制定者正在被大量數(shù)據(jù)淹沒(méi),數(shù)字信息從各種各樣傳感器、工具和模擬實(shí)驗(yàn)?zāi)抢镌丛床煌5赜縼?lái),令企業(yè)組織能力、分析能力和儲(chǔ)存信息能力捉襟見(jiàn)肘。正如麥肯錫報(bào)告揭示那樣,商業(yè)管理作為科學(xué)一個(gè)特征正在越來(lái)越凸現(xiàn)出來(lái)。第76頁(yè)管理與管理系統(tǒng)管理是管理主體作用于管理客體活動(dòng)過(guò)程。隨著科技發(fā)展,管理及管理系統(tǒng)數(shù)字化、網(wǎng)絡(luò)化、智能化已越來(lái)越受到人們廣泛關(guān)注。信息管理系統(tǒng):數(shù)據(jù)處理系統(tǒng)、檢索系統(tǒng)、計(jì)算機(jī)輔助系統(tǒng)、管理信息系統(tǒng)(MIS)、辦公自動(dòng)化系統(tǒng)(OA)、決議

34、支持系統(tǒng)(DSS)、知識(shí)管理系統(tǒng)(KMS)等。第77頁(yè)決議與信息78“決議”一詞英語(yǔ)表述為decision-making,意思就是作出決定或選擇。當(dāng)今是信息爆炸時(shí)代,主要不是取得信息,而在于對(duì)信息加工和分析,使之對(duì)決議有用。決議者需要是對(duì)決議有意義新信息,決議者注意力是一個(gè)最寶貴資源,不能無(wú)謂消耗在大量無(wú)關(guān)信息上。對(duì)信息提供,就應(yīng)該有一定條件限制,不符合這些條件信息,不應(yīng)該輸送給決議者。所以信息系統(tǒng)應(yīng)該包含一個(gè)篩選系統(tǒng),以確保提供與決議相關(guān)有用信息。第78頁(yè)決議需要信息與知識(shí)情報(bào)階段:確定問(wèn)題設(shè)計(jì)階段:找出處理方案選擇階段:選出處理方案實(shí)施階段:實(shí)施方案返回情報(bào)階段返回設(shè)計(jì)階段返回選擇階段西蒙

35、決議過(guò)程四個(gè)階段決議過(guò)程發(fā)覺(jué)那些需要引發(fā)注意征兆并加以解釋,比如銷售滑坡、生產(chǎn)成本猛漲、老用戶對(duì)新產(chǎn)品需求、新競(jìng)爭(zhēng)對(duì)手帶來(lái)威脅等。最優(yōu)方案由各種原因決定,如成本、實(shí)施難易程度、對(duì)員工要求、方案實(shí)施時(shí)間次序等。執(zhí)行選中方案,檢測(cè)實(shí)施結(jié)果,并作出必要調(diào)整。第79頁(yè)商務(wù)智能和數(shù)據(jù)挖掘作用第四部分第四部分第80頁(yè)什么是商務(wù)智能? 高級(jí)管理人員信息系統(tǒng)(EIS)管理信息系統(tǒng)(MIS),決議支持系統(tǒng)(DSS)數(shù)據(jù)庫(kù)技術(shù),數(shù)據(jù)倉(cāng)庫(kù)(數(shù)據(jù)集市)數(shù)據(jù)整合與清洗工具查詢和匯報(bào)工具,在線分析處理工具(OLAP)統(tǒng)計(jì)數(shù)據(jù)分析,數(shù)據(jù)挖掘分析性ERP、CRM、SCM企業(yè)績(jī)效管理,平衡記分卡第81頁(yè)商業(yè)智能Gartner商

36、業(yè)智能概念于1996年最早由加特納集團(tuán)(GartnerGroup)提出,加特納集團(tuán)將商業(yè)智能定義為:商業(yè)智能描述了一系列概念和方法,經(jīng)過(guò)應(yīng)用基于事實(shí)支持系統(tǒng)來(lái)輔助商業(yè)決議制訂。商業(yè)智能技術(shù)提供使企業(yè)快速分析數(shù)據(jù)技術(shù)和方法,包含搜集、管理和分析數(shù)據(jù),將這些數(shù)據(jù)轉(zhuǎn)化為有用信息,然后分發(fā)到企業(yè)各處。第82頁(yè)什么是商務(wù)智能? 商務(wù)智能是企業(yè)利用當(dāng)代信息技術(shù)搜集、管理和分析結(jié)構(gòu)化和非結(jié)構(gòu)化商務(wù)數(shù)據(jù)和信息,創(chuàng)造和累計(jì)商務(wù)知識(shí)和看法,改進(jìn)商務(wù)決議水平,采取有效商務(wù)行動(dòng),完善各種商務(wù)流程,提升各方面商務(wù)績(jī)效,增強(qiáng)綜合競(jìng)爭(zhēng)力智慧和能力。/view/557579.htm第83頁(yè)企業(yè) 企業(yè)這里用“組織機(jī)構(gòu)”或“實(shí)體

37、”會(huì)顯得更完整,因?yàn)槿拷M織機(jī)構(gòu)和實(shí)體(不只是企業(yè))都能夠而且應(yīng)該利用商務(wù)智能;之所以仍用“企業(yè)”是為保持與“商務(wù)”一致性。各行各業(yè),包含非企業(yè)性機(jī)構(gòu),比如政府部門、教育機(jī)構(gòu)、醫(yī)療機(jī)構(gòu)和公用事業(yè)等,都應(yīng)該而且能夠利用商務(wù)智能。第84頁(yè)當(dāng)代信息技術(shù)利用當(dāng)代信息技術(shù)這是這一定義中關(guān)鍵之一,IT發(fā)展產(chǎn)生了信息經(jīng)濟(jì)和信息社會(huì),在這一新型經(jīng)濟(jì)和社會(huì)形態(tài)中,信息爆炸式激增又產(chǎn)生了對(duì)能夠處理和控制信息新技術(shù)強(qiáng)烈需求;商務(wù)智能就是新IT在商務(wù)分析中有效利用。BI過(guò)程中所包括IT主要有:從不一樣數(shù)據(jù)源搜集數(shù)據(jù)中提取有用數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行清理以確保數(shù)據(jù)質(zhì)量,將數(shù)據(jù)經(jīng)轉(zhuǎn)換、重構(gòu)后存入數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市(這時(shí)數(shù)據(jù)變?yōu)樾?/p>

38、息),然后尋找適當(dāng)查詢、匯報(bào)和分析工具和數(shù)據(jù)挖掘工具對(duì)信息進(jìn)行處理(這時(shí)信息變?yōu)檩o助決議知識(shí)),最終將知識(shí)展現(xiàn)于用戶面前,轉(zhuǎn)變?yōu)闆Q議。第85頁(yè)搜集數(shù)據(jù)收集收集數(shù)據(jù)是管理和分析數(shù)據(jù)前提,數(shù)據(jù)收集工作是十分主要,必須引發(fā)企業(yè)充分重視,在這方面中國(guó)企業(yè)與世界上發(fā)達(dá)國(guó)家中先進(jìn)企業(yè)之間差距非常大,這是商務(wù)智能在中國(guó)還不能很快成熟起來(lái)主要原因之一,這應(yīng)了中國(guó)一句俗話:“巧婦難為無(wú)米之炊”。數(shù)據(jù)和信息收集主要是經(jīng)過(guò)各種交易系統(tǒng)進(jìn)行,比如ERP、CRM、SCM和E-Business等系統(tǒng)。伴隨中國(guó)企業(yè)在這些方面進(jìn)步,數(shù)據(jù)和信息數(shù)量會(huì)快速增加。另外,信息,尤其是非結(jié)構(gòu)化信息,來(lái)自企業(yè)各個(gè)部門和各個(gè)員工創(chuàng)造和收集

39、、沒(méi)有放在上述交易系統(tǒng)中內(nèi)容。第三方也是企業(yè)收集數(shù)據(jù)和信息一個(gè)主要起源,這么外部數(shù)據(jù)和信息包含市場(chǎng)調(diào)研匯報(bào)、人口統(tǒng)計(jì)匯報(bào)、用戶信用匯報(bào)等。第86頁(yè)管理和分析數(shù)據(jù)管理這里“管理”主要是指對(duì)數(shù)據(jù)儲(chǔ)存、提取、清洗、轉(zhuǎn)換、裝載、整合等工作,其目標(biāo)主要是為了提高數(shù)據(jù)質(zhì)量和安全性。分析“分析”是一個(gè)廣泛概念,這里包括數(shù)據(jù)查詢、數(shù)據(jù)匯報(bào)、多維分析、數(shù)據(jù)挖掘、高級(jí)統(tǒng)計(jì)分析等。大多數(shù)人了解商務(wù)智能都集中在這些分析工具上。第87頁(yè)結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化結(jié)構(gòu)化數(shù)據(jù)主要是指儲(chǔ)存于各個(gè)交易系統(tǒng)背后關(guān)系型數(shù)據(jù)庫(kù)中數(shù)據(jù),通常都是以表格形式存在和展現(xiàn)。傳統(tǒng)商務(wù)智能概念只包括這種結(jié)構(gòu)化、可定量數(shù)據(jù)。非結(jié)構(gòu)化非結(jié)構(gòu)化數(shù)據(jù)和信

40、息主要是上面提到各個(gè)部門和各個(gè)員工創(chuàng)造和收集、沒(méi)有放在各種交易系統(tǒng)中內(nèi)容,通常是以零散文件形式存在和展現(xiàn);新商務(wù)智能概念納入了非結(jié)構(gòu)化內(nèi)容分析,不過(guò)非機(jī)構(gòu)化內(nèi)容管理依然主要是經(jīng)過(guò)文件管理和內(nèi)容管理(DocumentManagement&ContentManagement)軟件來(lái)進(jìn)行。第88頁(yè)商務(wù)數(shù)據(jù)和信息商務(wù)數(shù)據(jù)和信息并不能加以狹隘了解,這里所致商務(wù)數(shù)據(jù)和信息包含一切可能對(duì)商務(wù)產(chǎn)生影響、直接和間接數(shù)據(jù)和信息,往小里說(shuō)包含顧客名字、地址和電話號(hào)碼等,往大里說(shuō)包含過(guò)國(guó)際上政治、經(jīng)濟(jì)、文化和軍事情況等。第89頁(yè)商務(wù)智能目標(biāo)創(chuàng)造和累計(jì)商務(wù)知識(shí)和看法這是商務(wù)智能第一層目標(biāo)和功能,也是最直接目標(biāo)和功能;“

41、知識(shí)和看法”正是“智能”得名由來(lái)。改進(jìn)商務(wù)決議水平這是商務(wù)智能更高一層目標(biāo)和功能,企業(yè)能否利用好這一功能、實(shí)現(xiàn)這一目標(biāo)在很大程度上取決于領(lǐng)導(dǎo)者意識(shí)和胸襟以及企業(yè)文化中決議科學(xué)化和民主化成份。第90頁(yè)商務(wù)行動(dòng)與商務(wù)流程采取有效商務(wù)行動(dòng)采取有效商務(wù)行動(dòng)是創(chuàng)造和累計(jì)商務(wù)知識(shí)和看法、改善商務(wù)決策水平目標(biāo)和動(dòng)力。商務(wù)智能是能夠指導(dǎo)實(shí)戰(zhàn)高明兵法,而不是“無(wú)所不知、但無(wú)能為力”“紙上談兵”。完善各種商務(wù)流程殘缺、散亂、僵化、低效商務(wù)流程是企業(yè)頑疾,商務(wù)智能能夠?yàn)檫@一頑疾診斷和治療做出一定貢獻(xiàn);優(yōu)化后自動(dòng)化(請(qǐng)注意先后次序)商務(wù)流程反過(guò)來(lái)也會(huì)促進(jìn)商務(wù)智能發(fā)展。第91頁(yè)商務(wù)績(jī)效 提升各方面商務(wù)績(jī)效這是商務(wù)智能在

42、企業(yè)內(nèi)部最高目標(biāo)和作用,有效商務(wù)智能系統(tǒng)和技術(shù)能夠幫助企業(yè)提升各個(gè)方面績(jī)效:財(cái)務(wù)和非財(cái)務(wù),前臺(tái)和后臺(tái),企業(yè)內(nèi)和供給鏈內(nèi),組織和個(gè)人。企業(yè)績(jī)效管理已成為熱門管理和技術(shù)概念,這既是因?yàn)楦鞣N軟件廠商推動(dòng)又是因?yàn)槠髽I(yè)所面臨績(jī)效方面壓力增大。第92頁(yè)綜合競(jìng)爭(zhēng)力增強(qiáng)綜合競(jìng)爭(zhēng)力這是商務(wù)智能在企業(yè)中最高目標(biāo)和作用。商務(wù)智能事關(guān)企業(yè)興衰成敗和生死存亡。如今以及未來(lái)企業(yè)之間競(jìng)爭(zhēng)是主要是綜合智能上競(jìng)爭(zhēng),不論是中國(guó)企業(yè)還是外國(guó)企業(yè),不論是國(guó)營(yíng)企業(yè)還是民營(yíng)企業(yè),不論是大企業(yè)還是小企業(yè),都必須提升企業(yè)經(jīng)營(yíng)和競(jìng)爭(zhēng)活動(dòng)中智能水平,爭(zhēng)取成為優(yōu)異智能企業(yè),否則一定會(huì)落后于智能上高人一等、捷足先登企業(yè)。智慧和能力把商務(wù)智能分為智慧

43、和能力是因?yàn)檎嬲虅?wù)智能現(xiàn)有思想層面也有行動(dòng)層面(而且“智能”本身能夠一分為二、二合為一)。第93頁(yè)商務(wù)智能關(guān)鍵技術(shù)起源:從數(shù)據(jù)到知識(shí)挑戰(zhàn)和跨越結(jié)蛹:數(shù)據(jù)倉(cāng)庫(kù)之厚積薄發(fā)蠶動(dòng):聯(lián)機(jī)分析處理之驚艷破繭:數(shù)據(jù)挖掘之智能生命產(chǎn)生化蝶:數(shù)據(jù)可視化華麗上演第94頁(yè)數(shù)據(jù)、信息與知識(shí)每時(shí)每刻,我們身邊都充滿了各種各樣數(shù)據(jù)。但只有將這些雜亂無(wú)章數(shù)據(jù),轉(zhuǎn)換為信息和知識(shí),才能幫助我們做出聰明選擇。由于數(shù)據(jù)、信息與知識(shí)三者之間有著親密相關(guān)性,他們常被混淆使用。我們將重點(diǎn)對(duì)數(shù)據(jù)、信息與知識(shí)進(jìn)行分析和對(duì)比。第95頁(yè)數(shù)據(jù)(Data)數(shù)據(jù)泛指對(duì)客觀事物數(shù)量、屬性、位臵及其相互關(guān)系抽象表示,以適合于用人工或自然方式進(jìn)行保留、傳

44、遞和處理。比如,水溫度是100,禮品重量是500克,木頭長(zhǎng)度是2米,大樓高度時(shí)45層。在這些表述中:100;500克;2米;45層就是數(shù)據(jù)。數(shù)據(jù)表現(xiàn)形式是多種多樣,除了數(shù)字,數(shù)據(jù)還以圖像、聲音、文字等形式表現(xiàn)出來(lái)。第96頁(yè)信息(Information)信息是指有一定含義、經(jīng)過(guò)加工處理、對(duì)決策有價(jià)值數(shù)據(jù)。信息數(shù)據(jù)處理信息是有意義數(shù)據(jù),是被賦予相關(guān)性和目標(biāo)性數(shù)據(jù)。例如,人口分布情況、降雨量分布情況等??梢杂脤iT信息管理系統(tǒng)對(duì)各類信息進(jìn)行管理。信息管理系統(tǒng)最基本功能就是數(shù)據(jù)收集和數(shù)據(jù)處理。第97頁(yè)76知識(shí)(Knowledge)知識(shí)是信息基礎(chǔ)上又一次升華,是濃縮系統(tǒng)化了信息。需要經(jīng)過(guò)信息,使用歸納、演

45、繹方法得到。知識(shí)只有在經(jīng)過(guò)廣泛深入地實(shí)踐檢驗(yàn),被人消化吸收,并成為了個(gè)人信念和判斷取向之后才能成為知識(shí)。知識(shí)信息+了解(understanding)與推理(reasoning)處理問(wèn)題技能(skill)決議支持系統(tǒng)、教授系統(tǒng)、案例推理系統(tǒng)是對(duì)人類知識(shí)利用,而智能數(shù)據(jù)分析是取得隱含在數(shù)據(jù)信息中知識(shí)。OECD1990s知識(shí)分類3W+H第98頁(yè)信息(Information)知識(shí)(Knowledge)與智慧(Wisdom)99第99頁(yè)TheDataInformationKnowledgeandWisdomHierarchy(DIKW)知識(shí)是從數(shù)據(jù)到智慧劃分為不一樣層次。100第100頁(yè)數(shù)據(jù)分析與挖掘價(jià)

46、值第101頁(yè)數(shù)據(jù)分析與挖掘概況數(shù)據(jù)爆炸,知識(shí)貧乏苦惱:淹沒(méi)在數(shù)據(jù)中;不能制訂合適決議!數(shù)據(jù)知識(shí)決議n模式n趨勢(shì)n事實(shí)n關(guān)系n模型n關(guān)聯(lián)規(guī)則n序列n目標(biāo)市場(chǎng)n資金分配n貿(mào)易選擇n在哪兒做廣告n銷售地理位置n金融n經(jīng)濟(jì)n政府n人口統(tǒng)計(jì)n生命周期第102頁(yè)數(shù)據(jù)解析學(xué)專題匯報(bào)Analytics:Thereal-worlduseofbigdataHowinnovativeenterprisesextractvaluefromuncertaindata()第103頁(yè)數(shù)據(jù)解析學(xué)(DataAnalytics)數(shù)據(jù)解析學(xué)是各種學(xué)科交叉產(chǎn)物。商務(wù)智能e-science數(shù)據(jù)解析學(xué)統(tǒng)計(jì)學(xué)數(shù)據(jù)分析機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘知識(shí)發(fā)

47、覺(jué)數(shù)學(xué)概率論計(jì)算機(jī)科學(xué)人工智能數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)信息管理知識(shí)管理運(yùn)籌學(xué)/管理科學(xué)第104頁(yè)什么是商務(wù)分析?(BusinessAnalytics) 商務(wù)分析以商業(yè)知識(shí)為基礎(chǔ),以建模和編程為伎倆,從數(shù)據(jù)分析出發(fā),以決議優(yōu)化來(lái)創(chuàng)造價(jià)值新興專業(yè),實(shí)現(xiàn)大數(shù)據(jù)商業(yè)應(yīng)用。 Businessanalysisonthebasisofbusinessknowledge,bymeansofmodelingandprogramming,startingfromtheanalysisofdata,tocreatevalueofemergingprofessionaldecisionmakingoptimization,im

48、plementationoflargeNumbersAccordingtothecommercialapplication105第105頁(yè)BusinessAnalyticsDescriptivePrescriptivePredictiveBusinessAnalytics第106頁(yè)云計(jì)算構(gòu)建新型信息基礎(chǔ)設(shè)施第五部分第107頁(yè)云計(jì)算與大數(shù)據(jù)大數(shù)據(jù)應(yīng)用運(yùn)行在云平臺(tái)之上假如數(shù)據(jù)是財(cái)富,那么大數(shù)據(jù)就是寶藏;云計(jì)算就是挖掘和利用寶藏利器!沒(méi)有強(qiáng)大計(jì)算能力,數(shù)據(jù)寶藏終究是鏡中花;沒(méi)有大數(shù)據(jù)存放和積淀,云計(jì)算也只能是殺雞用宰牛刀!第108頁(yè)什么是云計(jì)算:云業(yè)務(wù)模式Gartner高級(jí)分析師Ben Pring評(píng)

49、價(jià)道:“它正在成為一個(gè)大眾化詞語(yǔ)?!辈贿^(guò),問(wèn)題是似乎每個(gè)人對(duì)于云計(jì)算了解各不相同。作為一個(gè)對(duì)互聯(lián)網(wǎng)比喻,“云”是很輕易了解。不過(guò)一旦同“計(jì)算”聯(lián)絡(luò)起來(lái),它意義就擴(kuò)展了,而且開(kāi)始變得含糊起來(lái)。有些分析師和企業(yè)把云計(jì)算僅僅定義為計(jì)算升級(jí)版基本上就是互聯(lián)網(wǎng)上提供眾多虛擬服務(wù)器。另外一些人把云計(jì)算定義愈加寬泛,他們認(rèn)為用戶在防火墻保護(hù)之外消費(fèi)任何事物都處于“云”之中。人云亦云 眾說(shuō)紛紜提交請(qǐng)求硬件軟件服務(wù)存放網(wǎng)絡(luò)云用戶按需付費(fèi)服務(wù)第109頁(yè)什么是云計(jì)算: 業(yè)務(wù)模式同時(shí)滿足以上三個(gè)條件是云計(jì)算1服務(wù)可租用:用戶所需資源不在客戶一端而在網(wǎng)絡(luò)2服務(wù)可計(jì)量:服務(wù)能力含有分鐘級(jí)或秒級(jí)計(jì)量能力3高性價(jià)比:含有較之

50、傳統(tǒng)模式5倍以上性價(jià)比優(yōu)勢(shì)云計(jì)算第110頁(yè)云計(jì)算定義與特征(12345)經(jīng)過(guò)網(wǎng)絡(luò)接入彈性可擴(kuò)展物理或虛擬資源池,并能夠以按需、自服務(wù)方式對(duì)資源進(jìn)行布署和管理服務(wù)模式1個(gè)定義1:提供者以租代售,由賣產(chǎn)品變?yōu)橘u服務(wù),提升資源利用率并降低服務(wù)成本2:使用者以租代買,提升投資回報(bào)率2個(gè)角色3種模式1:SAAS(軟件即服務(wù))2:PAAS(平臺(tái)即服務(wù))3:IAAS(基礎(chǔ)設(shè)施即服務(wù))1:私有云2:小區(qū)云3:公有云4:混合云4種布署1:寬帶網(wǎng)絡(luò)接入2:按需服務(wù)3:資源共享4:快速?gòu)椥詳U(kuò)展5:服務(wù)可度量5個(gè)特點(diǎn)什么是云計(jì)算:技術(shù)特征第111頁(yè)虛擬化技術(shù)硬件虛擬化系統(tǒng)虛擬化應(yīng)用虛擬化并行運(yùn)算技術(shù)映射(Map)歸約

51、(Reduce)云計(jì)算4大支撐技術(shù)四大技術(shù)是拆分分布技術(shù)是合成一機(jī)變多機(jī)一算變多算一存變多存海量數(shù)據(jù)管理技術(shù)列族存貯主服務(wù)器子表服務(wù)器海量數(shù)據(jù)存貯技術(shù)元數(shù)據(jù)節(jié)點(diǎn)數(shù)據(jù)節(jié)點(diǎn)一庫(kù)變多庫(kù)第112頁(yè)云四大效能:對(duì)客戶價(jià)值整體高效、資源共效按需分配、均衡統(tǒng)籌互聯(lián)互通數(shù)據(jù)統(tǒng)一第113頁(yè)云最大優(yōu)勢(shì),有效處理資源、信息孤島問(wèn)題共享硬件資源:計(jì)算、存放、網(wǎng)絡(luò)統(tǒng)一管理業(yè)務(wù)、應(yīng)用、數(shù)據(jù)統(tǒng)一安全服務(wù)統(tǒng)一管理服務(wù)標(biāo)準(zhǔn)、規(guī)范、法規(guī)體系專網(wǎng)專網(wǎng)專網(wǎng)專網(wǎng)專網(wǎng)專網(wǎng)信息基礎(chǔ)網(wǎng)絡(luò)設(shè)施第114頁(yè)世界領(lǐng)先IT企業(yè)服務(wù)器持有量名稱服務(wù)器數(shù)量備注谷歌(Google)100萬(wàn)臺(tái)底依能耗推算數(shù)據(jù)為90萬(wàn)臺(tái),總數(shù)約占全球2%,Google 建成一

52、個(gè)單體數(shù)據(jù)中心服務(wù)器數(shù)量就高達(dá)4.5萬(wàn)臺(tái)。估算當(dāng)前全球服務(wù)器數(shù)量(30多個(gè)數(shù)據(jù)中心)數(shù)量應(yīng)在100萬(wàn)臺(tái)。亞馬遜45.4萬(wàn)臺(tái)據(jù)中國(guó)軟件網(wǎng)推測(cè),這些服務(wù)器分布于全球7100個(gè)機(jī)架上,過(guò)去6個(gè)月每個(gè)月新增110個(gè)機(jī)架惠普(HP/EDS)38萬(wàn)臺(tái)HP收購(gòu)EDS運(yùn)行著180個(gè)數(shù)據(jù)中心微軟30萬(wàn)臺(tái),微軟那時(shí)有21.8萬(wàn)臺(tái)服務(wù)器。微軟在芝加哥新服務(wù)器農(nóng)場(chǎng)能容下30萬(wàn)臺(tái)服務(wù)器baidu25臺(tái)據(jù)華為稱,baidu服務(wù)器數(shù)量每年以10萬(wàn)臺(tái)以上速度增加,baidu數(shù)據(jù)中心采取了華為 S9300設(shè)備。從市場(chǎng)份額和業(yè)務(wù)量推算從以來(lái),baidu服務(wù)器應(yīng)在40萬(wàn)臺(tái)。騰訊20萬(wàn)臺(tái)主要分布在深圳、上海、北京、天津、成都。其中騰

53、訊天津數(shù)據(jù)中心,初開(kāi)建,投資5億美元,服務(wù)器托管能力超出10萬(wàn)臺(tái)。開(kāi)工建設(shè)騰訊深汕云計(jì)算數(shù)據(jù)中心,總用地面積20萬(wàn)平方米,服務(wù)器20萬(wàn)臺(tái),總投資額20億元人民幣。Facebook 6萬(wàn)臺(tái)全球擁有8億用戶,在俄勒岡州普賴因維爾(Prineville)建造新數(shù)據(jù)中心投資達(dá)2.1億美元,數(shù)據(jù)中心第一期工程已于建設(shè)完成,建設(shè)面積為30萬(wàn)平方英尺第115頁(yè)云計(jì)算產(chǎn)業(yè)市場(chǎng)前景 據(jù)IDC預(yù)計(jì)和推算,從底到年底,云計(jì)算能為全球帶來(lái)12,103億美元新業(yè)務(wù)收入,為中國(guó)帶來(lái)超出20,483億人民幣(3,012億美元)新凈業(yè)務(wù)收入 服務(wù)創(chuàng)新孵化作用預(yù)測(cè),以廣東省為例,至年累計(jì)可研制孵化3000多個(gè)互聯(lián)網(wǎng)服務(wù),只要其

54、中千分之三服務(wù)能夠到達(dá)騰訊規(guī)模,就能產(chǎn)生千億元產(chǎn)值孵化數(shù)當(dāng)年1002004008001600累計(jì)10030070015003100第116頁(yè)截止到8月,國(guó)內(nèi)眾多省市、行業(yè)都規(guī)劃、開(kāi)啟、應(yīng)用了云計(jì)算服務(wù)。北京“祥云”計(jì)劃上?!霸坪!庇?jì)劃深圳“鯤云”計(jì)劃重慶“云端”計(jì)劃寧波“星云”計(jì)劃、無(wú)錫“云谷”計(jì)劃蘇州“彩云”計(jì)劃哈爾濱“云飛揚(yáng)”計(jì)劃惠州“惠云”計(jì)劃廣州“天云”計(jì)劃內(nèi)蒙古“藍(lán)天白云”計(jì)劃云計(jì)算在中國(guó)第117頁(yè)中國(guó)云要自己建,去IOE和八大金剛,及去開(kāi)源IOE: IBM ORACLE EMC2八大金剛:思科、IBM、谷歌、高通、英特爾、蘋果、甲骨文、微軟美國(guó)“八大金剛”在中國(guó)長(zhǎng)驅(qū)直入,占據(jù)政府、

55、海關(guān)、郵政、金融、鐵路、民航、醫(yī)療、軍警等關(guān)鍵領(lǐng)域,它們與美國(guó)政府、軍隊(duì)保持著緊密聯(lián)絡(luò),美國(guó)情報(bào)部門經(jīng)過(guò)它們?cè)O(shè)備、軟件、網(wǎng)絡(luò)獲取信息,也幾乎零門檻。開(kāi)源云小區(qū):OpensourceOpenstack非?;钴S,應(yīng)用也較為廣泛;檢驗(yàn)每一行代碼,每一類庫(kù)是不可能任務(wù);開(kāi)源小區(qū)掌握實(shí)際還是歐美產(chǎn)業(yè)界,并不完全是理想騎士們;產(chǎn)品過(guò)分用開(kāi)源,服務(wù)得不到保障,另也會(huì)被開(kāi)源綁架;一些半開(kāi)源真品也一樣混同我們視聽(tīng)。美國(guó)9家互聯(lián)網(wǎng)企業(yè)在棱鏡項(xiàng)目中暴露第118頁(yè)云平臺(tái)規(guī)劃:總體技術(shù)架構(gòu)云平臺(tái)建設(shè)依靠于云計(jì)算技術(shù),是新型計(jì)算資源利用模式。它將計(jì)算任務(wù)分布在由數(shù)臺(tái)服務(wù)器組成資源池上,使各種應(yīng)用系統(tǒng)能夠依據(jù)需要獲取計(jì)算能

56、力、存放空間和信息服務(wù)。設(shè)計(jì)理念:安全是前提應(yīng)用是關(guān)鍵管控是關(guān)鍵利舊,擴(kuò)展性第119頁(yè)云操作系統(tǒng):整個(gè)云平臺(tái)管理者氣象應(yīng)用位置應(yīng)用GIS應(yīng)用桌面云應(yīng)用桌面云APP資源管理子系統(tǒng)云中間件層應(yīng)用層資源驅(qū)動(dòng)層X(jué)en驅(qū)動(dòng)KVM驅(qū)動(dòng)VMware驅(qū)動(dòng)虛擬化驅(qū)動(dòng)集合LocalDisk驅(qū)動(dòng)NAS驅(qū)動(dòng)IP-SAN驅(qū)動(dòng)存放驅(qū)動(dòng)集合FC-SAN驅(qū)動(dòng)分布式存放驅(qū)動(dòng)Switch驅(qū)動(dòng)Firewall驅(qū)動(dòng)LB驅(qū)動(dòng)網(wǎng)絡(luò)與外設(shè)驅(qū)動(dòng)集合VPN驅(qū)動(dòng)監(jiān)控驅(qū)動(dòng)通訊適配層消息隊(duì)列消息格式轉(zhuǎn)換傳輸協(xié)議支持網(wǎng)絡(luò)通訊插件生命周期管理消息路由插件服務(wù)定義插件管理JavaC/C+Python.異構(gòu)語(yǔ)言適配其它設(shè)備OS硬件安全體系管理體系計(jì)算資源管

57、理存放資源管理網(wǎng)絡(luò)資源管理任務(wù)管理子系統(tǒng)任務(wù)過(guò)程管理任務(wù)計(jì)劃管理監(jiān)控管理子系統(tǒng)基本監(jiān)控信息管理定制監(jiān)控信息管理策略管理子系統(tǒng)調(diào)度策略管理容錯(cuò)策略管理節(jié)能策略管理動(dòng)態(tài)遷移策略管理用戶管理子系統(tǒng)用戶管理授權(quán)管理分組管理OS管理集合單機(jī)OS管理存放OS管理交換機(jī)OS管理防火墻OS管理硬件管理集合服務(wù)器兼容管理存放設(shè)備兼容管理網(wǎng)絡(luò)設(shè)備兼容管理負(fù)載均衡OS管理應(yīng)用安全集合應(yīng)用訪問(wèn)控制應(yīng)用信息隱藏Web攻擊防護(hù)URL信息防護(hù)網(wǎng)絡(luò)安全集合網(wǎng)絡(luò)流量控制網(wǎng)絡(luò)流量分析網(wǎng)絡(luò)訪問(wèn)控制虛擬私有云(VPC)OS 層服務(wù)器單機(jī)OS插件管理子系統(tǒng)故障管理子系統(tǒng)接口層自助服務(wù):管理員入口普通用戶入口API維護(hù)人員入口系統(tǒng)漏洞防

58、護(hù)弱口令防破解用戶安全認(rèn)證行為審計(jì)系統(tǒng)系統(tǒng)安全集合自助申請(qǐng)與交付組織管理與業(yè)務(wù)流程審批資源編排第120頁(yè)云操作系統(tǒng):資源全局監(jiān)控對(duì)云平臺(tái)配置、優(yōu)化、管理策略和經(jīng)驗(yàn)積累第121頁(yè)電子政務(wù)云實(shí)施:傳統(tǒng)電子政務(wù)建設(shè)面臨問(wèn)題 近年來(lái),我國(guó)電子政務(wù)建設(shè)迅猛發(fā)展,全國(guó)絕大部分地域都已經(jīng)建設(shè)了以電子政務(wù)基礎(chǔ)網(wǎng)絡(luò)平臺(tái)、政府門戶網(wǎng)站和辦公自動(dòng)化系統(tǒng)等為代表一系列電子政務(wù)項(xiàng)目,國(guó)家電子政務(wù)總體框架已見(jiàn)雛形。不過(guò),伴隨電子政務(wù)建設(shè)不停推進(jìn),許多矛盾和困難也隨之不停涌現(xiàn)出來(lái)。 伴隨政府信息化逐步深入,電子政務(wù)云平臺(tái)發(fā)展推進(jìn)了政務(wù)信息互聯(lián)互通、信息共享、業(yè)務(wù)協(xié)同,強(qiáng)化了信息資源整合,規(guī)范了采集和公布,加強(qiáng)了社會(huì)綜合開(kāi)發(fā)

59、利用。建設(shè)電子政務(wù)公共平臺(tái)是電子政務(wù)發(fā)展到深化應(yīng)用、突出實(shí)效階段主要舉措。第122頁(yè)電子政務(wù)云定義及目標(biāo)電子政務(wù)云定義 “電子政務(wù)云”(E-government cloud)是利用云計(jì)算技術(shù),統(tǒng)籌利用機(jī)房資源、計(jì)算資源、存放資源、網(wǎng)絡(luò)資源、信息資源、應(yīng)用支撐等資源和條件,發(fā)揮云計(jì)算虛擬化、高可靠性、通用性、高可擴(kuò)展性以及快速、按需、彈性服務(wù)等特征,為區(qū)域政府單位用戶提供基礎(chǔ)設(shè)施、支撐軟件、應(yīng)用功效、信息資源、運(yùn)行保障和信息安全等多方面不一樣類型不一樣級(jí)別服務(wù)電子政務(wù)綜合性服務(wù)平臺(tái)。電子政務(wù)云目標(biāo) 電子政務(wù)云緊緊圍繞各級(jí)政務(wù)部門深化電子政務(wù)應(yīng)用、提升推行職責(zé)能力迫切需要,為各部門實(shí)現(xiàn)政務(wù)、業(yè)務(wù)目

60、標(biāo)提供公共技術(shù)環(huán)境和服務(wù)支撐。滿足業(yè)務(wù)不停發(fā)展和改革需要。滿足跨地域、跨部門、跨層級(jí)信息共享,以及行業(yè)系統(tǒng)與地方應(yīng)用條塊結(jié)合需要。滿足大量數(shù)據(jù)訪問(wèn)、存放和智能化處理需要。滿足安全可靠運(yùn)行需要。第123頁(yè)電子政務(wù)云價(jià)值推進(jìn)電子政務(wù)向科學(xué)發(fā)展方式轉(zhuǎn)變提升基礎(chǔ)設(shè)施資源利用率促進(jìn)互聯(lián)互通和信息共享提升電子政務(wù)信息安全保障能力四大價(jià)值云計(jì)算含有超強(qiáng)計(jì)算能力和低成本、高安全性等特征,將其應(yīng)用于電子政務(wù)領(lǐng)域含有十分主要價(jià)值和意義。電子政務(wù)云應(yīng)用價(jià)值主要包含以下幾方面:第124頁(yè)電子政務(wù)云總體布署架構(gòu)4朵云-省級(jí)電子政務(wù)云-民生服務(wù)云-業(yè)務(wù)專有云-市級(jí)電子政務(wù)云N+1+N容災(zāi)模式-N個(gè)市級(jí)政務(wù)云采取省級(jí)政務(wù)云

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論