埃森哲大數(shù)據(jù)分析方法論及工具課件_第1頁
埃森哲大數(shù)據(jù)分析方法論及工具課件_第2頁
埃森哲大數(shù)據(jù)分析方法論及工具課件_第3頁
埃森哲大數(shù)據(jù)分析方法論及工具課件_第4頁
埃森哲大數(shù)據(jù)分析方法論及工具課件_第5頁
已閱讀5頁,還剩125頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

consultingItechnologyoutsourcing大數(shù)據(jù)分析方法論consultingItechnologyoutsou1consultingItechnologyoutsou目錄)概述Q數(shù)據(jù)分析框架③數(shù)據(jù)分析方法(數(shù)據(jù)理解&數(shù)據(jù)淮備分類與回歸①聚類分析關(guān)聯(lián)分析時(shí)序模型構(gòu)優(yōu)化◎數(shù)據(jù)分析支撐工具Copyrighte2019AccentureAllnightsreserved目錄2目錄目錄2數(shù)據(jù)分析即從數(shù)據(jù)、信息到知識的過程,數(shù)據(jù)分析需要數(shù)學(xué)理論、行業(yè)經(jīng)驗(yàn)以及計(jì)算機(jī)工具三者結(jié)合具支撐各種廠薊開發(fā)了教據(jù)分析的工具、模玦,將分析模型數(shù)學(xué)&統(tǒng)計(jì)學(xué)知識封裝,使不了解技術(shù)的人也能夠快捷的實(shí)現(xiàn)數(shù)學(xué)藪據(jù)分析的基礎(chǔ),將整理、描述建模,快遠(yuǎn)響應(yīng)分析需求預(yù)測數(shù)據(jù)的手段、過程抽象為教學(xué)模型的理論知機(jī)器學(xué)習(xí)不需要人過多干預(yù),通過計(jì)算機(jī)自動學(xué)習(xí),發(fā)現(xiàn)數(shù)據(jù)規(guī)律,但結(jié)論不傳統(tǒng)分析在教據(jù)量較少時(shí),傳統(tǒng)的易控制學(xué)習(xí)數(shù)據(jù)分析已能夠發(fā)現(xiàn)數(shù)據(jù)中包含的知識,包括結(jié)構(gòu)挖掘傳f分析、杜邦分析等模型教據(jù)挖掘法成熟,應(yīng)用廣泛,本嶔據(jù)挖掘是挖掘教據(jù)背后隱區(qū)文不展開介紹藏的知識的重要手段行業(yè)經(jīng)驗(yàn)分析誤區(qū)不了解分析模型的數(shù)學(xué)原理,會導(dǎo)致行業(yè)經(jīng)驗(yàn)錯誤的使用模型,而得出錯誤的分析行業(yè)經(jīng)驗(yàn)可在數(shù)據(jù)分析前確定分析需結(jié)論,影響業(yè)務(wù)決策,因此在選用分求,分析中檢驗(yàn)方法是否合理,以及析模型時(shí),要深入了解該模型的原理分析后指導(dǎo)應(yīng)用,但行業(yè)特征不同和使用限制其應(yīng)用也不同,因此本文不展開介紹Copyrighte2019AccentureAllnightsreserved數(shù)據(jù)分析即從數(shù)據(jù)、信息到知識的過程,數(shù)據(jù)分析需要數(shù)3數(shù)據(jù)分析即從數(shù)據(jù)、信息到知識的過程,數(shù)據(jù)分析需要數(shù)數(shù)據(jù)分析即隨著計(jì)算機(jī)技術(shù)發(fā)展和數(shù)據(jù)分析理論的更新,當(dāng)前的數(shù)據(jù)分析逐步成為機(jī)器語言、統(tǒng)計(jì)知識兩個(gè)學(xué)科的交集(備選)數(shù)據(jù)分析工具各種廠商開發(fā)了數(shù)據(jù)分析的工具、模塊,將分析模型封裝,使不解技術(shù)的人也能夠快捷的實(shí)現(xiàn)數(shù)學(xué)建??焖夙憫?yīng)分析需求數(shù)據(jù)分析傳統(tǒng)分析在數(shù)據(jù)量較少時(shí),傳統(tǒng)的數(shù)據(jù)分析已能夠發(fā)現(xiàn)敖據(jù)數(shù)據(jù)中包含的知識,包括結(jié)構(gòu)分析、杜邦分析等模型信息處理傳統(tǒng)分析方法成熟,應(yīng)用廣泛,本文不展開介紹信息處理信息處理基于查詢,可以發(fā)現(xiàn)有用的信息。但是這種查詢的回答反映業(yè)務(wù)數(shù)據(jù)的是直接存放在數(shù)據(jù)庫中的信息數(shù)據(jù)挖掘就是充分利用了統(tǒng)計(jì)學(xué)和人工智能它們不反映復(fù)雜的模式,或隱藏在數(shù)據(jù)庫中的規(guī)律技術(shù)的應(yīng)用程序,并把這些高深復(fù)雜的技術(shù)封裝起來,使人們不用自己掌握這些技術(shù)也能完成同樣的功能,并且更專注于自己所要解決的問題Copyrighte2019AccentureAllnightsreserved隨著計(jì)算機(jī)技術(shù)發(fā)展和數(shù)據(jù)分析理論的更新,當(dāng)前的數(shù)據(jù)4隨著計(jì)算機(jī)技術(shù)發(fā)展和數(shù)據(jù)分析理論的更新,當(dāng)前的數(shù)據(jù)隨著計(jì)算機(jī)隨著計(jì)算機(jī)科學(xué)的進(jìn)步,數(shù)據(jù)挖掘、商務(wù)智能、大數(shù)據(jù)等概念的出現(xiàn),數(shù)據(jù)分析的手段和方法更加豐富常規(guī)分析數(shù)據(jù)挖掘商務(wù)智能大數(shù)據(jù)技術(shù)數(shù)據(jù)可視化莉示教據(jù)之間的靜…統(tǒng)計(jì)學(xué)和計(jì)算機(jī)找·一系列以事實(shí)為支多種類型的據(jù)大數(shù)據(jù)葉代,展示態(tài)關(guān)系術(shù)等多學(xué)科的結(jié)合持,輔助商業(yè)決策的中,快進(jìn)獲取知識術(shù)和方法,會用名理解數(shù)掘、演繹數(shù)括專家系統(tǒng)、有能對數(shù)據(jù)質(zhì)量要求高赦據(jù)挖掘技術(shù)的衍·將據(jù)分析的范擴(kuò)展一般由數(shù)據(jù)倉庫!推向“將來從“過去”求搖、數(shù)提備份和復(fù)等部分組成對數(shù)據(jù)分析的體系化管理,數(shù)據(jù)分析的主體依然是數(shù)掘挖掘本文在描逑數(shù)據(jù)分析的流程后,重點(diǎn)介紹通用的數(shù)據(jù)分析方法和主流的應(yīng)用工具數(shù)據(jù)件分析隨著數(shù)據(jù)量的不斷擴(kuò)大,數(shù)據(jù)分析理論正處于飛速發(fā)展期,因此本文的方法側(cè)重于基礎(chǔ)原理介紹Copyrighte2019AccentureAllnightsreserved隨著計(jì)算機(jī)科學(xué)的進(jìn)步,數(shù)據(jù)挖掘、商務(wù)智能、大數(shù)據(jù)等5隨著計(jì)算機(jī)科學(xué)的進(jìn)步,數(shù)據(jù)挖掘、商務(wù)智能、大數(shù)據(jù)等隨著計(jì)算機(jī)目錄概述數(shù)據(jù)分析框架③數(shù)據(jù)分析方法(數(shù)據(jù)理解&數(shù)據(jù)淮備分類與回歸①聚類分析關(guān)聯(lián)分析時(shí)序模型構(gòu)優(yōu)化◎數(shù)據(jù)分析支撐工具Copyrighte2019AccentureAllnightsreserved目錄6目錄目錄6數(shù)據(jù)分析標(biāo)準(zhǔn)流程CRISP-DM為90年代由SG組織(當(dāng)時(shí))提出,已被業(yè)界廣泛認(rèn)可的數(shù)據(jù)分析流程1.業(yè)務(wù)理解(businessunderstanding)確定目標(biāo)、明確分析需求2數(shù)據(jù)理解(dataunderstanding)收集原始數(shù)據(jù)、描述數(shù)據(jù)、探索數(shù)據(jù)、檢驗(yàn)效據(jù)質(zhì)量商業(yè)理解效據(jù)理解3.數(shù)據(jù)準(zhǔn)備(datapreparation)選擇數(shù)據(jù)、清洗數(shù)據(jù)、構(gòu)造數(shù)據(jù)、整合數(shù)據(jù)、格式化敖據(jù)建立模型4建立模型(modeling)選擇建模技術(shù)、參數(shù)調(diào)優(yōu)、生成測試計(jì)劃、構(gòu)建模型型評估5評估模型(evaluation)對模型進(jìn)行較為仝面的評價(jià),評價(jià)結(jié)果、重審過程6部署(deployment分析結(jié)果應(yīng)用Copyrighte2019AccentureAllnightsreserved數(shù)據(jù)分析標(biāo)準(zhǔn)流程7數(shù)據(jù)分析標(biāo)準(zhǔn)流程數(shù)據(jù)分析標(biāo)準(zhǔn)流程7數(shù)據(jù)分析框架業(yè)務(wù)理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備》《建立模型》《模型評估應(yīng)用理解業(yè)務(wù)背景數(shù)據(jù)收集數(shù)據(jù)探索選擇方法、工評估分析需求數(shù)據(jù)清洗樓過程評估分析結(jié)果應(yīng)月氵毅撼轉(zhuǎn)換日具,建立模型氵模型結(jié)果許估]:分析模型改堤據(jù)分析的本質(zhì)日物取的敦?fù)?jù)必頻能氵運(yùn)用計(jì)方法對數(shù)氵綜合考慮業(yè)務(wù)君求對型的:理解業(yè)務(wù)背景敏據(jù)收集探索教據(jù)建立模型·建模過程評將模型應(yīng)用于是服務(wù)于業(yè)務(wù):夠正確反映業(yè)務(wù)需氵據(jù)進(jìn)行粼索,發(fā)現(xiàn)氵精廢、數(shù)據(jù)清況、準(zhǔn)確性、效率和:業(yè)務(wù)賓,才務(wù)理解,缺乏業(yè)會對業(yè)務(wù)將造成氵數(shù)據(jù)內(nèi)部規(guī)律?;ㄙM(fèi)成本等因素求,如果沒有並:求,否則分析轄論用性迷行評能實(shí)現(xiàn)數(shù)據(jù)分選擇最合適的型。佔(zhàn)析的真正價(jià)值務(wù)指導(dǎo),會導(dǎo)致:。數(shù)據(jù)特?fù)Q在實(shí)中對分析無法落地。:·數(shù)據(jù)清洗為了達(dá)到樓型的掬:分析目的,往往模型結(jié)果評估::和解決業(yè)務(wù)問教據(jù)要求,需要:用多個(gè)樸型,然后:評估是否有遺:題評估業(yè)務(wù)雪吏::原始數(shù)據(jù)中存在教:對教據(jù)進(jìn)行轉(zhuǎn)換通過后續(xù)的樸型評:的業(yè)務(wù),模型結(jié):據(jù)梨失和壞數(shù)據(jù)判斷分析需求是·如果不處理會號致否可以糝換為毅:模型失效,園此對致化、標(biāo)淮化等。整,以尋求取合初的業(yè)務(wù)問題需要結(jié)合業(yè)務(wù)寺!聚的及時(shí)跟蹤分析項(xiàng)目,菜:數(shù)據(jù)逼過過濾“去家進(jìn)行評估些需求是不能有噪”從而提取出有后期的樸型調(diào)轉(zhuǎn)換為數(shù)據(jù)分:效數(shù)據(jù)整和優(yōu)化符合商業(yè)邏輯致?lián)蛔?、?shù)據(jù):質(zhì)量極差等Copyrighte2019AcoentureAllnightsreserved數(shù)據(jù)分析框架8數(shù)據(jù)分析框架數(shù)據(jù)分析框架8數(shù)據(jù)分析框架業(yè)務(wù)理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備建立模型模型評估數(shù)據(jù)探KN法均方根誤差SVM算法均方誤差收集敖據(jù)正概率計(jì)神經(jīng)網(wǎng)絡(luò)特征描述〔45決策樹評估分析需求群間差異度分布特K均值算法群內(nèi)相似度業(yè)務(wù)符合度結(jié)構(gòu)分析FP-growth算法確需求Apriori算法支持度數(shù)據(jù)清躉信度教據(jù)摶換指效平滑}均方根誤差是支持向量機(jī)□均方誤差是否滿灰色理論一!正概率統(tǒng)計(jì)足要求灰色理論造傳算法Copyrighte2019AccentureAllnightsreserve圖流程概要方法分類處理方法模型檢獪數(shù)據(jù)分析框架9數(shù)據(jù)分析框架數(shù)據(jù)分析框架9目錄概述數(shù)據(jù)分析框架)數(shù)據(jù)分析方法Q數(shù)據(jù)理解&數(shù)據(jù)準(zhǔn)備分類與回歸①聚類分析關(guān)聯(lián)分時(shí)序模型●.結(jié)構(gòu)優(yōu)化◎數(shù)據(jù)分析支撐工具Copyrighte2019AccentureAllnightsreserved目錄10目錄目錄10埃森哲大數(shù)據(jù)分析方法論及工具課件11埃森哲大數(shù)據(jù)分析方法論及工具課件11埃森哲大數(shù)據(jù)分析方法論及工具課件12埃森哲大數(shù)據(jù)分析方法論及工具課件12埃森哲大數(shù)據(jù)分析方法論及工具課件13埃森哲大數(shù)據(jù)分析方法論及工具課件13埃森哲大數(shù)據(jù)分析方法論及工具課件14埃森哲大數(shù)據(jù)分析方法論及工具課件14埃森哲大數(shù)據(jù)分析方法論及工具課件15埃森哲大數(shù)據(jù)分析方法論及工具課件15埃森哲大數(shù)據(jù)分析方法論及工具課件16埃森哲大數(shù)據(jù)分析方法論及工具課件16埃森哲大數(shù)據(jù)分析方法論及工具課件17埃森哲大數(shù)據(jù)分析方法論及工具課件17埃森哲大數(shù)據(jù)分析方法論及工具課件18埃森哲大數(shù)據(jù)分析方法論及工具課件18埃森哲大數(shù)據(jù)分析方法論及工具課件19埃森哲大數(shù)據(jù)分析方法論及工具課件19埃森哲大數(shù)據(jù)分析方法論及工具課件20埃森哲大數(shù)據(jù)分析方法論及工具課件20埃森哲大數(shù)據(jù)分析方法論及工具課件21埃森哲大數(shù)據(jù)分析方法論及工具課件21埃森哲大數(shù)據(jù)分析方法論及工具課件22埃森哲大數(shù)據(jù)分析方法論及工具課件22埃森哲大數(shù)據(jù)分析方法論及工具課件23埃森哲大數(shù)據(jù)分析方法論及工具課件23埃森哲大數(shù)據(jù)分析方法論及工具課件24埃森哲大數(shù)據(jù)分析方法論及工具課件24埃森哲大數(shù)據(jù)分析方法論及工具課件25埃森哲大數(shù)據(jù)分析方法論及工具課件25埃森哲大數(shù)據(jù)分析方法論及工具課件26埃森哲大數(shù)據(jù)分析方法論及工具課件26埃森哲大數(shù)據(jù)分析方法論及工具課件27埃森哲大數(shù)據(jù)分析方法論及工具課件27埃森哲大數(shù)據(jù)分析方法論及工具課件28埃森哲大數(shù)據(jù)分析方法論及工具課件28埃森哲大數(shù)據(jù)分析方法論及工具課件29埃森哲大數(shù)據(jù)分析方法論及工具課件29埃森哲大數(shù)據(jù)分析方法論及工具課件30埃森哲大數(shù)據(jù)分析方法論及工具課件30埃森哲大數(shù)據(jù)分析方法論及工具課件31埃森哲大數(shù)據(jù)分析方法論及工具課件31埃森哲大數(shù)據(jù)分析方法論及工具課件32埃森哲大數(shù)據(jù)分析方法論及工具課件32埃森哲大數(shù)據(jù)分析方法論及工具課件33埃森哲大數(shù)據(jù)分析方法論及工具課件33埃森哲大數(shù)據(jù)分析方法論及工具課件34埃森哲大數(shù)據(jù)分析方法論及工具課件34埃森哲大數(shù)據(jù)分析方法論及工具課件35埃森哲大數(shù)據(jù)分析方法論及工具課件35埃森哲大數(shù)據(jù)分析方法論及工具課件36埃森哲大數(shù)據(jù)分析方法論及工具課件36埃森哲大數(shù)據(jù)分析方法論及工具課件37埃森哲大數(shù)據(jù)分析方法論及工具課件37埃森哲大數(shù)據(jù)分析方法論及工具課件38埃森哲大數(shù)據(jù)分析方法論及工具課件38埃森哲大數(shù)據(jù)分析方法論及工具課件39埃森哲大數(shù)據(jù)分析方法論及工具課件39埃森哲大數(shù)據(jù)分析方法論及工具課件40埃森哲大數(shù)據(jù)分析方法論及工具課件40埃森哲大數(shù)據(jù)分析方法論及工具課件41埃森哲大數(shù)據(jù)分析方法論及工具課件41埃森哲大數(shù)據(jù)分析方法論及工具課件42埃森哲大數(shù)據(jù)分析方法論及工具課件42埃森哲大數(shù)據(jù)分析方法論及工具課件43埃森哲大數(shù)據(jù)分析方法論及工具課件43埃森哲大數(shù)據(jù)分析方法論及工具課件44埃森哲大數(shù)據(jù)分析方法論及工具課件44埃森哲大數(shù)據(jù)分析方法論及工具課件45埃森哲大數(shù)據(jù)分析方法論及工具課件45埃森哲大數(shù)據(jù)分析方法論及工具課件46埃森哲大數(shù)據(jù)分析方法論及工具課件46埃森哲大數(shù)據(jù)分析方法論及工具課件47埃森哲大數(shù)據(jù)分析方法論及工具課件47埃森哲大數(shù)據(jù)分析方法論及工具課件48埃森哲大數(shù)據(jù)分析方法論及工具課件48埃森哲大數(shù)據(jù)分析方法論及工具課件49埃森哲大數(shù)據(jù)分析方法論及工具課件49埃森哲大數(shù)據(jù)分析方法論及工具課件50埃森哲大數(shù)據(jù)分析方法論及工具課件50埃森哲大數(shù)據(jù)分析方法論及工具課件51埃森哲大數(shù)據(jù)分析方法論及工具課件51埃森哲大數(shù)據(jù)分析方法論及工具課件52埃森哲大數(shù)據(jù)分析方法論及工具課件52埃森哲大數(shù)據(jù)分析方法論及工具課件53埃森哲大數(shù)據(jù)分析方法論及工具課件53埃森哲大數(shù)據(jù)分析方法論及工具課件54埃森哲大數(shù)據(jù)分析方法論及工具課件54埃森哲大數(shù)據(jù)分析方法論及工具課件55埃森哲大數(shù)據(jù)分析方法論及工具課件55埃森哲大數(shù)據(jù)分析方法論及工具課件56埃森哲大數(shù)據(jù)分析方法論及工具課件56埃森哲大數(shù)據(jù)分析方法論及工具課件57埃森哲大數(shù)據(jù)分析方法論及工具課件57埃森哲大數(shù)據(jù)分析方法論及工具課件58埃森哲大數(shù)據(jù)分析方法論及工具課件58埃森哲大數(shù)據(jù)分析方法論及工具課件59埃森哲大數(shù)據(jù)分析方法論及工具課件59埃森哲大數(shù)據(jù)分析方法論及工具課件60埃森哲大數(shù)據(jù)分析方法論及工具課件60埃森哲大數(shù)據(jù)分析方法論及工具課件61埃森哲大數(shù)據(jù)分析方法論及工具課件61埃森哲大數(shù)據(jù)分析方法論及工具課件62埃森哲大數(shù)據(jù)分析方法論及工具課件62埃森哲大數(shù)據(jù)分析方法論及工具課件63埃森哲大數(shù)據(jù)分析方法論及工具課件63埃森哲大數(shù)據(jù)分析方法論及工具課件64埃森哲大數(shù)據(jù)分析方法論及工具課件64埃森哲大數(shù)據(jù)分析方法論及工具課件65埃森哲大數(shù)據(jù)分析方法論及工具課件65consultingItechnologyoutsourcing大數(shù)據(jù)分析方法論consultingItechnologyoutsou66consultingItechnologyoutsou目錄)概述Q數(shù)據(jù)分析框架③數(shù)據(jù)分析方法(數(shù)據(jù)理解&數(shù)據(jù)淮備分類與回歸①聚類分析關(guān)聯(lián)分析時(shí)序模型構(gòu)優(yōu)化◎數(shù)據(jù)分析支撐工具Copyrighte2019AccentureAllnightsreserved目錄67目錄目錄67數(shù)據(jù)分析即從數(shù)據(jù)、信息到知識的過程,數(shù)據(jù)分析需要數(shù)學(xué)理論、行業(yè)經(jīng)驗(yàn)以及計(jì)算機(jī)工具三者結(jié)合具支撐各種廠薊開發(fā)了教據(jù)分析的工具、模玦,將分析模型數(shù)學(xué)&統(tǒng)計(jì)學(xué)知識封裝,使不了解技術(shù)的人也能夠快捷的實(shí)現(xiàn)數(shù)學(xué)藪據(jù)分析的基礎(chǔ),將整理、描述建模,快遠(yuǎn)響應(yīng)分析需求預(yù)測數(shù)據(jù)的手段、過程抽象為教學(xué)模型的理論知機(jī)器學(xué)習(xí)不需要人過多干預(yù),通過計(jì)算機(jī)自動學(xué)習(xí),發(fā)現(xiàn)數(shù)據(jù)規(guī)律,但結(jié)論不傳統(tǒng)分析在教據(jù)量較少時(shí),傳統(tǒng)的易控制學(xué)習(xí)數(shù)據(jù)分析已能夠發(fā)現(xiàn)數(shù)據(jù)中包含的知識,包括結(jié)構(gòu)挖掘傳f分析、杜邦分析等模型教據(jù)挖掘法成熟,應(yīng)用廣泛,本嶔據(jù)挖掘是挖掘教據(jù)背后隱區(qū)文不展開介紹藏的知識的重要手段行業(yè)經(jīng)驗(yàn)分析誤區(qū)不了解分析模型的數(shù)學(xué)原理,會導(dǎo)致行業(yè)經(jīng)驗(yàn)錯誤的使用模型,而得出錯誤的分析行業(yè)經(jīng)驗(yàn)可在數(shù)據(jù)分析前確定分析需結(jié)論,影響業(yè)務(wù)決策,因此在選用分求,分析中檢驗(yàn)方法是否合理,以及析模型時(shí),要深入了解該模型的原理分析后指導(dǎo)應(yīng)用,但行業(yè)特征不同和使用限制其應(yīng)用也不同,因此本文不展開介紹Copyrighte2019AccentureAllnightsreserved數(shù)據(jù)分析即從數(shù)據(jù)、信息到知識的過程,數(shù)據(jù)分析需要數(shù)68數(shù)據(jù)分析即從數(shù)據(jù)、信息到知識的過程,數(shù)據(jù)分析需要數(shù)數(shù)據(jù)分析即隨著計(jì)算機(jī)技術(shù)發(fā)展和數(shù)據(jù)分析理論的更新,當(dāng)前的數(shù)據(jù)分析逐步成為機(jī)器語言、統(tǒng)計(jì)知識兩個(gè)學(xué)科的交集(備選)數(shù)據(jù)分析工具各種廠商開發(fā)了數(shù)據(jù)分析的工具、模塊,將分析模型封裝,使不解技術(shù)的人也能夠快捷的實(shí)現(xiàn)數(shù)學(xué)建??焖夙憫?yīng)分析需求數(shù)據(jù)分析傳統(tǒng)分析在數(shù)據(jù)量較少時(shí),傳統(tǒng)的數(shù)據(jù)分析已能夠發(fā)現(xiàn)敖據(jù)數(shù)據(jù)中包含的知識,包括結(jié)構(gòu)分析、杜邦分析等模型信息處理傳統(tǒng)分析方法成熟,應(yīng)用廣泛,本文不展開介紹信息處理信息處理基于查詢,可以發(fā)現(xiàn)有用的信息。但是這種查詢的回答反映業(yè)務(wù)數(shù)據(jù)的是直接存放在數(shù)據(jù)庫中的信息數(shù)據(jù)挖掘就是充分利用了統(tǒng)計(jì)學(xué)和人工智能它們不反映復(fù)雜的模式,或隱藏在數(shù)據(jù)庫中的規(guī)律技術(shù)的應(yīng)用程序,并把這些高深復(fù)雜的技術(shù)封裝起來,使人們不用自己掌握這些技術(shù)也能完成同樣的功能,并且更專注于自己所要解決的問題Copyrighte2019AccentureAllnightsreserved隨著計(jì)算機(jī)技術(shù)發(fā)展和數(shù)據(jù)分析理論的更新,當(dāng)前的數(shù)據(jù)69隨著計(jì)算機(jī)技術(shù)發(fā)展和數(shù)據(jù)分析理論的更新,當(dāng)前的數(shù)據(jù)隨著計(jì)算機(jī)隨著計(jì)算機(jī)科學(xué)的進(jìn)步,數(shù)據(jù)挖掘、商務(wù)智能、大數(shù)據(jù)等概念的出現(xiàn),數(shù)據(jù)分析的手段和方法更加豐富常規(guī)分析數(shù)據(jù)挖掘商務(wù)智能大數(shù)據(jù)技術(shù)數(shù)據(jù)可視化莉示教據(jù)之間的靜…統(tǒng)計(jì)學(xué)和計(jì)算機(jī)找·一系列以事實(shí)為支多種類型的據(jù)大數(shù)據(jù)葉代,展示態(tài)關(guān)系術(shù)等多學(xué)科的結(jié)合持,輔助商業(yè)決策的中,快進(jìn)獲取知識術(shù)和方法,會用名理解數(shù)掘、演繹數(shù)括專家系統(tǒng)、有能對數(shù)據(jù)質(zhì)量要求高赦據(jù)挖掘技術(shù)的衍·將據(jù)分析的范擴(kuò)展一般由數(shù)據(jù)倉庫!推向“將來從“過去”求搖、數(shù)提備份和復(fù)等部分組成對數(shù)據(jù)分析的體系化管理,數(shù)據(jù)分析的主體依然是數(shù)掘挖掘本文在描逑數(shù)據(jù)分析的流程后,重點(diǎn)介紹通用的數(shù)據(jù)分析方法和主流的應(yīng)用工具數(shù)據(jù)件分析隨著數(shù)據(jù)量的不斷擴(kuò)大,數(shù)據(jù)分析理論正處于飛速發(fā)展期,因此本文的方法側(cè)重于基礎(chǔ)原理介紹Copyrighte2019AccentureAllnightsreserved隨著計(jì)算機(jī)科學(xué)的進(jìn)步,數(shù)據(jù)挖掘、商務(wù)智能、大數(shù)據(jù)等70隨著計(jì)算機(jī)科學(xué)的進(jìn)步,數(shù)據(jù)挖掘、商務(wù)智能、大數(shù)據(jù)等隨著計(jì)算機(jī)目錄概述數(shù)據(jù)分析框架③數(shù)據(jù)分析方法(數(shù)據(jù)理解&數(shù)據(jù)淮備分類與回歸①聚類分析關(guān)聯(lián)分析時(shí)序模型構(gòu)優(yōu)化◎數(shù)據(jù)分析支撐工具Copyrighte2019AccentureAllnightsreserved目錄71目錄目錄71數(shù)據(jù)分析標(biāo)準(zhǔn)流程CRISP-DM為90年代由SG組織(當(dāng)時(shí))提出,已被業(yè)界廣泛認(rèn)可的數(shù)據(jù)分析流程1.業(yè)務(wù)理解(businessunderstanding)確定目標(biāo)、明確分析需求2數(shù)據(jù)理解(dataunderstanding)收集原始數(shù)據(jù)、描述數(shù)據(jù)、探索數(shù)據(jù)、檢驗(yàn)效據(jù)質(zhì)量商業(yè)理解效據(jù)理解3.數(shù)據(jù)準(zhǔn)備(datapreparation)選擇數(shù)據(jù)、清洗數(shù)據(jù)、構(gòu)造數(shù)據(jù)、整合數(shù)據(jù)、格式化敖據(jù)建立模型4建立模型(modeling)選擇建模技術(shù)、參數(shù)調(diào)優(yōu)、生成測試計(jì)劃、構(gòu)建模型型評估5評估模型(evaluation)對模型進(jìn)行較為仝面的評價(jià),評價(jià)結(jié)果、重審過程6部署(deployment分析結(jié)果應(yīng)用Copyrighte2019AccentureAllnightsreserved數(shù)據(jù)分析標(biāo)準(zhǔn)流程72數(shù)據(jù)分析標(biāo)準(zhǔn)流程數(shù)據(jù)分析標(biāo)準(zhǔn)流程72數(shù)據(jù)分析框架業(yè)務(wù)理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備》《建立模型》《模型評估應(yīng)用理解業(yè)務(wù)背景數(shù)據(jù)收集數(shù)據(jù)探索選擇方法、工評估分析需求數(shù)據(jù)清洗樓過程評估分析結(jié)果應(yīng)月氵毅撼轉(zhuǎn)換日具,建立模型氵模型結(jié)果許估]:分析模型改堤據(jù)分析的本質(zhì)日物取的敦?fù)?jù)必頻能氵運(yùn)用計(jì)方法對數(shù)氵綜合考慮業(yè)務(wù)君求對型的:理解業(yè)務(wù)背景敏據(jù)收集探索教據(jù)建立模型·建模過程評將模型應(yīng)用于是服務(wù)于業(yè)務(wù):夠正確反映業(yè)務(wù)需氵據(jù)進(jìn)行粼索,發(fā)現(xiàn)氵精廢、數(shù)據(jù)清況、準(zhǔn)確性、效率和:業(yè)務(wù)賓,才務(wù)理解,缺乏業(yè)會對業(yè)務(wù)將造成氵數(shù)據(jù)內(nèi)部規(guī)律?;ㄙM(fèi)成本等因素求,如果沒有並:求,否則分析轄論用性迷行評能實(shí)現(xiàn)數(shù)據(jù)分選擇最合適的型。佔(zhàn)析的真正價(jià)值務(wù)指導(dǎo),會導(dǎo)致:。數(shù)據(jù)特?fù)Q在實(shí)中對分析無法落地。:·數(shù)據(jù)清洗為了達(dá)到樓型的掬:分析目的,往往模型結(jié)果評估::和解決業(yè)務(wù)問教據(jù)要求,需要:用多個(gè)樸型,然后:評估是否有遺:題評估業(yè)務(wù)雪吏::原始數(shù)據(jù)中存在教:對教據(jù)進(jìn)行轉(zhuǎn)換通過后續(xù)的樸型評:的業(yè)務(wù),模型結(jié):據(jù)梨失和壞數(shù)據(jù)判斷分析需求是·如果不處理會號致否可以糝換為毅:模型失效,園此對致化、標(biāo)淮化等。整,以尋求取合初的業(yè)務(wù)問題需要結(jié)合業(yè)務(wù)寺!聚的及時(shí)跟蹤分析項(xiàng)目,菜:數(shù)據(jù)逼過過濾“去家進(jìn)行評估些需求是不能有噪”從而提取出有后期的樸型調(diào)轉(zhuǎn)換為數(shù)據(jù)分:效數(shù)據(jù)整和優(yōu)化符合商業(yè)邏輯致?lián)蛔恪?shù)據(jù):質(zhì)量極差等Copyrighte2019AcoentureAllnightsreserved數(shù)據(jù)分析框架73數(shù)據(jù)分析框架數(shù)據(jù)分析框架73數(shù)據(jù)分析框架業(yè)務(wù)理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備建立模型模型評估數(shù)據(jù)探KN法均方根誤差SVM算法均方誤差收集敖據(jù)正概率計(jì)神經(jīng)網(wǎng)絡(luò)特征描述〔45決策樹評估分析需求群間差異度分布特K均值算法群內(nèi)相似度業(yè)務(wù)符合度結(jié)構(gòu)分析FP-growth算法確需求Apriori算法支持度數(shù)據(jù)清躉信度教據(jù)摶換指效平滑}均方根誤差是支持向量機(jī)□均方誤差是否滿灰色理論一!正概率統(tǒng)計(jì)足要求灰色理論造傳算法Copyrighte2019AccentureAllnightsreserve圖流程概要方法分類處理方法模型檢獪數(shù)據(jù)分析框架74數(shù)據(jù)分析框架數(shù)據(jù)分析框架74目錄概述數(shù)據(jù)分析框架)數(shù)據(jù)分析方法Q數(shù)據(jù)理解&數(shù)據(jù)準(zhǔn)備分類與回歸①聚類分析關(guān)聯(lián)分時(shí)序模型●.結(jié)構(gòu)優(yōu)化◎數(shù)據(jù)分析支撐工具Copyrighte2019AccentureAllnightsreserved目錄75目錄目錄75埃森哲大數(shù)據(jù)分析方法論及工具課件76埃森哲大數(shù)據(jù)分析方法論及工具課件76埃森哲大數(shù)據(jù)分析方法論及工具課件77埃森哲大數(shù)據(jù)分析方法論及工具課件77埃森哲大數(shù)據(jù)分析方法論及工具課件78埃森哲大數(shù)據(jù)分析方法論及工具課件78埃森哲大數(shù)據(jù)分析方法論及工具課件79埃森哲大數(shù)據(jù)分析方法論及工具課件79埃森哲大數(shù)據(jù)分析方法論及工具課件80埃森哲大數(shù)據(jù)分析方法論及工具課件80埃森哲大數(shù)據(jù)分析方法論及工具課件81埃森哲大數(shù)據(jù)分析方法論及工具課件81埃森哲大數(shù)據(jù)分析方法論及工具課件82埃森哲大數(shù)據(jù)分析方法論及工具課件82埃森哲大數(shù)據(jù)分析方法論及工具課件83埃森哲大數(shù)據(jù)分析方法論及工具課件83埃森哲大數(shù)據(jù)分析方法論及工具課件84埃森哲大數(shù)據(jù)分析方法論及工具課件84埃森哲大數(shù)據(jù)分析方法論及工具課件85埃森哲大數(shù)據(jù)分析方法論及工具課件85埃森哲大數(shù)據(jù)分析方法論及工具課件86埃森哲大數(shù)據(jù)分析方法論及工具課件86埃森哲大數(shù)據(jù)分析方法論及工具課件87埃森哲大數(shù)據(jù)分析方法論及工具課件87埃森哲大數(shù)據(jù)分析方法論及工具課件88埃森哲大數(shù)據(jù)分析方法論及工具課件88埃森哲大數(shù)據(jù)分析方法論及工具課件89埃森哲大數(shù)據(jù)分析方法論及工具課件89埃森哲大數(shù)據(jù)分析方法論及工具課件90埃森哲大數(shù)據(jù)分析方法論及工具課件90埃森哲大數(shù)據(jù)分析方法論及工具課件91埃森哲大數(shù)據(jù)分析方法論及工具課件91埃森哲大數(shù)據(jù)分析方法論及工具課件92埃森哲大數(shù)據(jù)分析方法論及工具課件92埃森哲大數(shù)據(jù)分析方法論及工具課件93埃森哲大數(shù)據(jù)分析方法論及工具課件93埃森哲大數(shù)據(jù)分析方法論及工具課件94埃森哲大數(shù)據(jù)分析方法論及工具課件94埃森哲大數(shù)據(jù)分析方法論及工具課件95埃森哲大數(shù)據(jù)分析方法論及工具課件95埃森哲大數(shù)據(jù)分析方法論及工具課件96埃森哲大數(shù)據(jù)分析方法論及工具課件96埃森哲大數(shù)據(jù)分析方法論及工具課件97埃森哲大數(shù)據(jù)分析方法論及工具課件97埃森哲大數(shù)據(jù)分析方法論及工具課件98埃森哲大數(shù)據(jù)分析方法論及工具課件98埃森哲大數(shù)據(jù)分析方法論及工具課件99埃森哲大數(shù)據(jù)分析方法論及工具課件99埃森哲大數(shù)據(jù)分析方法論及工具課件100埃森哲大數(shù)據(jù)分析方法論及工具課件100埃森哲大數(shù)據(jù)分析方法論及工具課件101埃森哲大數(shù)據(jù)分析方法論及工具課件101埃森哲大數(shù)據(jù)分析方法論及工具課件102埃森哲大數(shù)據(jù)分析方法論及工具課件102埃森哲大數(shù)據(jù)分析方法論及工具課件103埃森哲大數(shù)據(jù)分析方法論及工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論