版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、SAP大數(shù)據(jù)分析平臺(tái)方案議程大數(shù)據(jù)的技術(shù)特點(diǎn)及發(fā)展趨勢(shì)-宋一平基于用戶訪問的大數(shù)據(jù)應(yīng)用場(chǎng)景及Demo演示-孫戎&姚法主要大數(shù)據(jù)應(yīng)用場(chǎng)景Demo演示主流媒體、網(wǎng)站的大數(shù)據(jù)應(yīng)用場(chǎng)景SAP大數(shù)據(jù)解決方案-孫戎?jǐn)?shù)據(jù)交換平臺(tái)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)數(shù)據(jù)管控平臺(tái)數(shù)據(jù)的展現(xiàn)與可視化SAP建議的大數(shù)據(jù)解決方案及驗(yàn)證四個(gè)關(guān)鍵技術(shù)的發(fā)展方向IT 的消耗連通性Connectivity智能手機(jī)賣的比PC 多到2013年,將有超過150億的移動(dòng)設(shè)備連接到互聯(lián)網(wǎng)云 Cloud到2011年,80% 新軟件提供云服務(wù)的能力社交媒介Social Media有超過10億的人們?cè)L問社交網(wǎng)絡(luò)Facebook 超過 Google,作為訪問最多的網(wǎng)
2、站大數(shù)據(jù) Big Data數(shù)據(jù)量每18個(gè)月增長(zhǎng)一倍,其中 85% 非結(jié)構(gòu)化數(shù)據(jù)也包含在業(yè)務(wù)領(lǐng)域傳統(tǒng)IT架構(gòu)不堪重負(fù)迫使不斷尋求新的技術(shù) 例如 Hadoop全球2014年全球數(shù)據(jù)總量4.1ZB85% 來自于新數(shù)據(jù)類型2020年將有10倍增長(zhǎng),將達(dá)到40ZB未來新的數(shù)據(jù)源 (情感, 點(diǎn)擊流,地理、傳感器等)中國(guó)2013年中國(guó)數(shù)據(jù)總量0.8ZB2013年數(shù)據(jù)量是2012年的兩倍2013年中國(guó)相當(dāng)于2009年全球數(shù)據(jù)量2020年將是2013年10倍,將達(dá)到8.5ZBRef: HortonworksKB-MB-GB-TB-PB-EB-ZB-YB-NB-DB大數(shù)據(jù)分析案例Netflix (奈飛)在美國(guó)有
3、2700 萬訂閱用戶,在全世界則有 3300 萬,每天高峰時(shí)段網(wǎng)絡(luò)下載量都是出自 Netflix的流媒體服務(wù),現(xiàn)在人們?cè)诰W(wǎng)上看流媒體視頻比看實(shí)體 DVD 的時(shí)間還多。每天用戶在 Netflix 上產(chǎn)生 3000 萬多個(gè)行為,比如你暫停、回放或者快進(jìn)時(shí)都會(huì)產(chǎn)生一個(gè)行為,Netflix 的訂閱用戶每天還會(huì)給出 400 萬個(gè)評(píng)分,還會(huì)有 300 萬次搜索請(qǐng)求,詢問劇集播放時(shí)間和設(shè)備等成功美劇的要素:導(dǎo)演:大衛(wèi)芬奇 David Fincher(社交網(wǎng)絡(luò)、七宗罪)奧斯卡影帝:凱文史派西 Kevin Spacey (王牌對(duì)王牌,洛城機(jī)密)典型的BBC劇型大數(shù)據(jù)分析案例美國(guó)總統(tǒng)奧巴馬的再次當(dāng)選創(chuàng)造了奇跡:在
4、他獲勝前的 70 年時(shí)間里,沒有一名美國(guó)總統(tǒng)能夠在全國(guó)失業(yè)率高于 7.4% 的情況下連任成功;如何獲得更多選民支持以及讓他們掏腰包,奧巴馬團(tuán)隊(duì)比羅姆尼團(tuán)隊(duì)更加聰明:奧巴馬與羅姆尼均獲得近 10 億美金籌款,而其網(wǎng)絡(luò)籌款是羅姆尼的兩倍;奧巴馬在整個(gè)競(jìng)選過程中的花銷不到 3 億美金,而羅姆尼花了近 4 億美金卻仍然敗選;奧巴馬最終以 332 票贏得選舉,高出羅姆尼近一百?gòu)埻镀?,而在大選前一周的一項(xiàng)民調(diào)中顯示,55% 的被調(diào)查選民都認(rèn)為羅姆尼比奧巴馬更具有未來視野!成功當(dāng)選的要素:實(shí)時(shí)分析社交媒體信息,掌握各州輿情掌握“微觀智能”,實(shí)踐“微競(jìng)爭(zhēng)”實(shí)現(xiàn)花少錢,辦大事大數(shù)據(jù) Big Data維基百科對(duì)大
5、數(shù)據(jù)的定義:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過可容忍時(shí)間的數(shù)據(jù)集。VelocityVolumeVarietyMobileCRM DataPlanningOpportunitiesTransactionsCustomerSales OrderThingsInstant MessagesDemandInventory簡(jiǎn)單明了Gartner定義:“大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)?!贝髷?shù)據(jù)是一種觀念、文化、創(chuàng)新思維、洞察力什么是大數(shù)據(jù)? 4V特征Volume海量數(shù)據(jù)TB、PB Variety結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)
6、據(jù)Velocity實(shí)時(shí)查詢即席分析BIG DATAValue預(yù)測(cè)分析發(fā)現(xiàn)價(jià)值從 DB 到 BD 數(shù)據(jù)庫(kù)(Database, DB)到大數(shù)據(jù)(Big Data, BD)1、數(shù)據(jù)規(guī)模:譬如VLDB(Very Large Database),和“大海”XLDB(Extremely Large Database)相比仍舊偏小?!俺靥痢钡奶幚韺?duì)象通常以MB 為基本單位,而“大?!眲t常常以GB,甚至是TB、PB 為基本處理單位。2、數(shù)據(jù)類型:DB 數(shù)據(jù)的種類較少,而以結(jié)構(gòu)化數(shù)據(jù)為主。BD 數(shù)據(jù)的種類繁多,包含著結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù),并且半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)所占份額越來越大。3、模式(Sche
7、ma)和數(shù)據(jù)的關(guān)系:DB 先有模式,后產(chǎn)生數(shù)據(jù)。BD 時(shí)代難以預(yù)先確定模式,模式只有在數(shù)據(jù)出現(xiàn)之后才能確定,且模式隨著數(shù)據(jù)量的增長(zhǎng)處于不斷的演變之中。4、處理對(duì)象:DB 中數(shù)據(jù)是處理對(duì)象。BD 中除了數(shù)據(jù)是處理對(duì)象之外,還可通過某些數(shù)據(jù)的存在來判斷其他種類的數(shù)據(jù)是否存在,要將數(shù)據(jù)作為一種資源來輔助解決其他諸多領(lǐng)域的問題。5、處理工具:DB 采用所謂的One Size Fits All。BD 是說No Size Fits All。傳統(tǒng)數(shù)據(jù)和大數(shù)據(jù)的區(qū)別大數(shù)據(jù)之前,依賴模型及算法當(dāng)數(shù)據(jù)越大時(shí),數(shù)據(jù)本身(而不是研究數(shù)據(jù)所使用的算法和模型)保證了數(shù)據(jù)分析結(jié)果的有效性。只要擁有足夠多的數(shù)據(jù),也能得到接近
8、事實(shí)的結(jié)論。數(shù)據(jù)足夠多時(shí),利用相關(guān)關(guān)系,無需知道因果關(guān)系就能得出結(jié)論Google 翻譯時(shí),并不設(shè)定語法和翻譯規(guī)則。而是利用Google數(shù)據(jù)庫(kù)中收集的所有用戶的用詞習(xí)慣進(jìn)行比較推薦。當(dāng)用戶行為的記錄數(shù)據(jù)越來越多時(shí),計(jì)算機(jī)可在不了解問題邏輯的情況之下,提供有效的結(jié)果。能處理多種數(shù)據(jù)結(jié)構(gòu),大數(shù)據(jù)利用互聯(lián)網(wǎng)上記錄人類行為數(shù)據(jù)進(jìn)行分析以前,計(jì)算機(jī)能處理結(jié)構(gòu)化數(shù)據(jù),并記錄在數(shù)據(jù)庫(kù)中。大數(shù)據(jù)技術(shù)降低對(duì)數(shù)據(jù)結(jié)構(gòu)的要求,社交信息、地理位置信息、行為習(xí)慣信息、偏好信息等各種維度的信息都可以實(shí)時(shí)處理,立體完整地勾勒出每一個(gè)體的各種特征。大數(shù)據(jù)技術(shù)大數(shù)據(jù)技術(shù)被設(shè)計(jì)用于在成本可承受的條件下,通過非??焖伲╲elocit
9、y)地采集、發(fā)現(xiàn)和分析,從大量(volumes)、多類別(variety)的數(shù)據(jù)中提取價(jià)值(value),將是IT 領(lǐng)域新一代的技術(shù)與架構(gòu)。HadoopHadoop集群架構(gòu)HadoopNameNode10s to 1000s DataNode(s)Hadoop軟件架構(gòu)計(jì)算引擎Map-ReduceHiveHBaseMahoutPigSqoop數(shù)據(jù)存儲(chǔ)HDFS一個(gè)開源的分布式處理大數(shù)據(jù)的系統(tǒng)架構(gòu),由Apache基金會(huì)開發(fā)大規(guī)模、低廉的服務(wù)器集群HDFS:Hadoop分布式文件系統(tǒng),PB級(jí)別Map / Reduce:并行計(jì)算框架在較低成本下,處理分析無限容量的任何格式數(shù)據(jù), 但性能較慢HADOOP
10、2.0Hadoop發(fā)展趨勢(shì)HADOOP 1.0Single Use System 單一使用系統(tǒng)Batch Apps批應(yīng)用Multi Purpose Platform 多用途平臺(tái)Batch, Interactive, Online, Streaming, 批, 交互, 在線,流處理MapReduce(cluster resource management 集群資源管理& data processing 數(shù)據(jù)處理)HDFS(redundant 冗余, reliable storage 可靠的存儲(chǔ)) YARN(cluster resource management 集群資源管理)HDFS2(redu
11、ndant 冗余, reliable storage 可靠的存儲(chǔ)) MapReduce(batch 批)Tez(Interactive 交互)Others(varied 多樣化)Hadoop 不等于大數(shù)據(jù)但提供了一個(gè)低成本的大數(shù)據(jù)存儲(chǔ)方案15% 的世界500強(qiáng)企業(yè),在2015年前將要開始挖掘大數(shù)據(jù)的價(jià)值89% 的客戶還在使用傳統(tǒng)的RDBMS作為他們的大數(shù)據(jù)方案一部分50% 的大數(shù)據(jù)客戶正在或?qū)⒁捎肏adoop方案34% 的Hadoop用戶存儲(chǔ)和分析的數(shù)據(jù)100TB 55% 的Hadoop用戶每天跑多于1次的分析任務(wù),18%的Hadoop用戶每小時(shí)執(zhí)行多于1次的分析任務(wù)國(guó)外企業(yè)的Hadoop應(yīng)
12、用基于客戶交互數(shù)據(jù)的目標(biāo)市場(chǎng)預(yù)測(cè)分析欺詐偵測(cè)與安全檢查數(shù)據(jù)探索與機(jī)器學(xué)習(xí)搜索日志的分析和網(wǎng)頁數(shù)據(jù)的挖掘工作。其中一個(gè)由1100臺(tái)節(jié)點(diǎn)組成的集群,包括8800核CPU和12000TB的原始存儲(chǔ)用于存儲(chǔ)并處理電子商務(wù)交易的相關(guān)數(shù)據(jù)。集群超過1700個(gè)節(jié)點(diǎn),數(shù)量總量已經(jīng)超過17個(gè)PB,每天凈增長(zhǎng)20T左右。每天在Hadoop集群運(yùn)行的MapReduce任務(wù)有超過4萬(有時(shí)會(huì)超過6萬),其中大部分任務(wù)是每天定期執(zhí)行的統(tǒng)計(jì)任務(wù),例如數(shù)據(jù)魔方、量子統(tǒng)計(jì)、推薦系統(tǒng)、排行榜等等。這些任務(wù)一般在凌晨1點(diǎn)左右開始執(zhí)行,3-4個(gè)小時(shí)內(nèi)全部完成。每天讀數(shù)據(jù)在2PB左右,寫數(shù)據(jù)在1PB左右目前已經(jīng)在江蘇省上線的Mc+A
13、bis信令共享平臺(tái),就是由珠海世紀(jì)鼎利承建的基于Hadoop框架的云平臺(tái)構(gòu)建了一個(gè)公用云平臺(tái);有自己的商業(yè)版Hadoop解決方案;Hadoop社區(qū)的積極貢獻(xiàn)者。國(guó)內(nèi)企業(yè)的Hadoop應(yīng)用數(shù)據(jù)中心的數(shù)據(jù)源范圍全國(guó)業(yè)務(wù)支撐系統(tǒng)中的數(shù)據(jù)集合生產(chǎn)系統(tǒng)中的非結(jié)構(gòu)化數(shù)據(jù),例如合同、發(fā)票掃描件等網(wǎng)頁內(nèi)容;互聯(lián)網(wǎng)視音頻;博客、微博、論壇數(shù)據(jù);郵件;廣告數(shù)據(jù);客戶行為軌跡等位置信息;監(jiān)控視音頻數(shù)據(jù);傳感數(shù)據(jù)等傳統(tǒng)類數(shù)據(jù)互聯(lián)網(wǎng)類數(shù)據(jù)物聯(lián)網(wǎng)類數(shù)據(jù)其他類數(shù)據(jù)IDC數(shù)據(jù)等數(shù)據(jù)中心的數(shù)據(jù)當(dāng)量為PB級(jí),在數(shù)據(jù)爆炸時(shí)代,很容易達(dá)到EB級(jí)1ZB=1,024EB=1,048,576PB=1,073,741,824TB云數(shù)據(jù)中心與
14、傳統(tǒng)數(shù)據(jù)中心的區(qū)別云計(jì)算數(shù)據(jù)中心是一種基于云計(jì)算架構(gòu)的,計(jì)算、存儲(chǔ)及網(wǎng)絡(luò)資源松耦合,完全虛擬化各種IT設(shè)備、模塊化程度較高、自動(dòng)化程度較高、具備較高綠色節(jié)能程度的新型數(shù)據(jù)中心。云數(shù)據(jù)中心的特點(diǎn):高度的虛擬化,包括服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、應(yīng)用等虛擬化,使用戶可以按需調(diào)用各種資源;自動(dòng)化管理程度,包括對(duì)物理服務(wù)器、虛擬服務(wù)器的管理,對(duì)相關(guān)業(yè)務(wù)的自動(dòng)化流程管理、對(duì)客戶服務(wù)的收費(fèi)等自動(dòng)化管理;綠色節(jié)能,云計(jì)算數(shù)據(jù)中心在各方面符合綠色節(jié)能標(biāo)準(zhǔn),一般PUE值不超過1.5云數(shù)據(jù)中心與傳統(tǒng)數(shù)據(jù)中心在區(qū)別:云數(shù)據(jù)中心的基礎(chǔ)設(shè)備更加規(guī)模化、標(biāo)準(zhǔn)化,由此帶來了管理的復(fù)雜性。云數(shù)據(jù)中心為了節(jié)省成本、實(shí)現(xiàn)日益增多的業(yè)務(wù),須
15、采用各種虛擬化技術(shù)。管理差異,體現(xiàn)在自動(dòng)化方面。在云數(shù)據(jù)中心,當(dāng)業(yè)務(wù)需要遷移、設(shè)備需要統(tǒng)一配置、故障需要及時(shí)檢查排除、流程需要跟蹤時(shí),如何高效管理這樣海量的設(shè)備和應(yīng)用?當(dāng)然需要通過自動(dòng)化的手段來實(shí)現(xiàn)。云數(shù)據(jù)中心的出現(xiàn)無疑是新的進(jìn)步,除了高度的虛擬化等特征,還包括新技術(shù)和新產(chǎn)品,如低功耗CPU,固態(tài)硬盤等。服務(wù)器架構(gòu)的發(fā)展趨勢(shì)磁盤存儲(chǔ)CPU內(nèi)存Log瓶頸數(shù)據(jù)磁盤存儲(chǔ)Log數(shù)據(jù)備份 更高密度的CPU核心和內(nèi)存計(jì)算提高吞吐量水平可擴(kuò)展以滿足高并發(fā)和不斷增長(zhǎng)的業(yè)務(wù)需求更經(jīng)濟(jì)的采購(gòu)和運(yùn)維成本NLS傳統(tǒng)小型機(jī)x86 新型服務(wù)器CPU內(nèi)存.分布式水平擴(kuò)展大數(shù)據(jù)價(jià)值實(shí)現(xiàn)的難點(diǎn)復(fù)雜性易于獲取多樣性實(shí)時(shí)性可執(zhí)行行
16、業(yè)特定業(yè)務(wù)場(chǎng)景及業(yè)務(wù)規(guī)則特定算法分析結(jié)果易于獲取決策能夠有效送達(dá)(人、機(jī)器)對(duì)決策能快速反應(yīng)要了解相關(guān)資源情況能夠獲取執(zhí)行結(jié)果實(shí)時(shí)性要求高隨機(jī)性高數(shù)據(jù)來源數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)范圍數(shù)據(jù)獲取方式21大數(shù)據(jù):從數(shù)據(jù)到價(jià)值數(shù)據(jù)捕獲與采集數(shù)據(jù)存儲(chǔ)與管理數(shù)據(jù)分析與挖掘結(jié)果展示與決策開展行動(dòng)與評(píng)估批處理ETL復(fù)制與同步數(shù)據(jù)眾包復(fù)雜事件處理結(jié)構(gòu)化非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)分布式文件系統(tǒng)關(guān)系數(shù)據(jù)庫(kù)非關(guān)系數(shù)據(jù)庫(kù)(NoSQL)數(shù)據(jù)倉(cāng)庫(kù)云計(jì)算和云存儲(chǔ)實(shí)時(shí)流處理A/B Testing關(guān)聯(lián)規(guī)則分析分類 / 聚類遺傳算法 / 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 / 模式識(shí)別時(shí)間序列分析回歸分析系統(tǒng)仿真 / 機(jī)器學(xué)習(xí)空間分析社會(huì)網(wǎng)絡(luò)分析自然語言分析Map
17、Reduce / R語言標(biāo)簽云聚類圖空間信息流熱圖信息推送確定行動(dòng)內(nèi)容確定資源確定時(shí)間確定位置反饋計(jì)劃實(shí)際對(duì)比基于用戶訪問的大數(shù)據(jù)應(yīng)用場(chǎng)景及Demo演示SAP HANA 平臺(tái)所有SAP應(yīng)用運(yùn)行的最佳平臺(tái)SAP HANA是SAP戰(zhàn)略的核心所有的SAP應(yīng)用都可以運(yùn)行在HANA平臺(tái)上,大部分已經(jīng)進(jìn)行了優(yōu)化SAP HANA可以基于云或傳統(tǒng)模式進(jìn)行部署SAP HANA可以基于私有云 (HEC) 以及平臺(tái)云部署(HCP)SAP HANA由通過第三方的共有云提供(Amazon AWS, Microsoft Azure)核心業(yè)務(wù)處理流程S/4HANA數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市例如:BW on HANA高級(jí)分析 BPC
18、, S&OP, CO-PA操作型報(bào)表, BI HANA Live, Lumira云方案Successfactors, Sales, Service and Marketing大數(shù)據(jù)Customer Engagement IntelligenceIoT 預(yù)測(cè)性維護(hù)SAP HANA 市場(chǎng)領(lǐng)先的內(nèi)存數(shù)據(jù)庫(kù)平臺(tái)The Forrester Research WaveForrester研究中的亮點(diǎn)“SAP 內(nèi)存數(shù)據(jù)庫(kù)技術(shù)開始得到市場(chǎng)的認(rèn)可.” Noel Yuhanna, ForresterSAP HANA 平臺(tái)在策略和現(xiàn)階段能力的評(píng)分都得到了最高SAP 是唯一一個(gè)在遠(yuǎn)見得到滿分的公司SAP 是唯一一個(gè)在數(shù)
19、據(jù)管理和交易能力方面得到滿分的公司SAP 還在其他方面得到了滿分,其中包括執(zhí)行,市場(chǎng)表現(xiàn),合作伙伴,分析能力等Source: The Forrester WaveTM: In-Memory Database Platforms, Q3 15 SAP HANA 市場(chǎng)領(lǐng)先的內(nèi)存數(shù)據(jù)庫(kù)平臺(tái)The Forrester Research Wave來源: Gartner (2016)年2月 /doc/reprints?id=1-2ZV8BTS&ct=160229&st=sbSAP 提供了IQ與HANA兩套方案。HANA成為SAP數(shù)據(jù)倉(cāng)庫(kù)解決方案的核心SAP在數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域持續(xù)獲得成功。BW on HANA的
20、用戶持續(xù)高速增長(zhǎng)。 SAP持續(xù)提升基于云的靈活部署能力,以及高可用性/容災(zāi)等方面方案。 SAP持續(xù)強(qiáng)化HANA與Hadoop以及其它數(shù)據(jù)平臺(tái)的集成能力, 并且提供了Vora產(chǎn)品支持Spark,作為大型數(shù)據(jù)倉(cāng)庫(kù)的方案更加成熟和完善。數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)管理分析系統(tǒng)2016年2月SAP HANA網(wǎng)站門戶分析:-)預(yù)測(cè)性維護(hù)網(wǎng)絡(luò)優(yōu)化內(nèi)部威脅探測(cè)實(shí)時(shí)風(fēng)險(xiǎn)管理資產(chǎn)追蹤360度客戶視圖客戶流失個(gè)性化關(guān)懷產(chǎn)品建議實(shí)時(shí)需求供應(yīng)預(yù)測(cè)欺詐監(jiān)測(cè)利用大數(shù)據(jù)來驅(qū)動(dòng)業(yè)務(wù)更深入地了解客戶的需求場(chǎng)景一:故障信息與工控?cái)?shù)據(jù)相關(guān)性分析局限性ERP系統(tǒng)壓縮機(jī)故障數(shù)據(jù)不足,粒度太粗,影響到故障關(guān)聯(lián)工控?cái)?shù)據(jù)的分析若IT數(shù)據(jù)足夠,粒度合適,可
21、以進(jìn)一步分析OT數(shù)據(jù)的模式及進(jìn)行故障模式的預(yù)測(cè)場(chǎng)景介紹將ECC PM模塊中的設(shè)備故障信息數(shù)據(jù)(IT)與工控系統(tǒng)收集的傳感器數(shù)據(jù)(OT)進(jìn)行關(guān)聯(lián)。用戶可以針對(duì)某一類設(shè)備具體的一次故障,然后以設(shè)備的故障日期為基線向以前時(shí)間倒推查詢工控系統(tǒng)中設(shè)備運(yùn)行數(shù)據(jù)。由此觀察設(shè)備故障與傳感器信號(hào)的關(guān)聯(lián)關(guān)系,展示設(shè)備故障模式。步驟數(shù)據(jù)采集:通過SAP HANA SDS(Smart Data Streaming)從SCADA系統(tǒng)實(shí)時(shí)推送壓縮機(jī)運(yùn)轉(zhuǎn)數(shù)據(jù)(OT)到SAP HANA;通過SLT從ECC系統(tǒng)實(shí)時(shí)導(dǎo)入數(shù)據(jù)(IT)到SAP HANA數(shù)據(jù)存儲(chǔ):分別把IT數(shù)據(jù)和OT數(shù)據(jù)存放到不同HANA數(shù)據(jù)庫(kù)表中 數(shù)據(jù)清洗:分析兩
22、類數(shù)據(jù)之間關(guān)聯(lián)性數(shù)據(jù)建模:建立信息視圖,對(duì)兩類數(shù)據(jù)進(jìn)行實(shí)時(shí)快速的關(guān)聯(lián),聚合數(shù)據(jù)展示:使用SAP Business Object Design Studio直連HANA視圖,通過組件交互反應(yīng)數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,以多維度、可視化的方式對(duì)數(shù)據(jù)進(jìn)行展示場(chǎng)景一:故障信息與工控?cái)?shù)據(jù)相關(guān)性分析以地圖展示故障發(fā)生站點(diǎn)(站點(diǎn)經(jīng)緯度數(shù)據(jù)存儲(chǔ)在SAP HANA中),及現(xiàn)有西氣東輸站點(diǎn)個(gè)數(shù)、設(shè)備數(shù)量及一年內(nèi)總共發(fā)生故障數(shù)目和類型。場(chǎng)景一:故障信息與工控?cái)?shù)據(jù)相關(guān)性分析點(diǎn)擊其中一個(gè)站點(diǎn),可將過濾應(yīng)用到整個(gè)界面例如:點(diǎn)擊“霍爾果斯”站點(diǎn),顯示霍爾果斯的故障類型和按月故障數(shù)量場(chǎng)景一:故障信息與工控?cái)?shù)據(jù)相關(guān)性分析分析故障發(fā)生時(shí)間
23、、站點(diǎn)分布:如烏魯木齊站點(diǎn),15年1季度發(fā)生故障2次,2,3季度發(fā)生故障各1次。通過分析,1季度發(fā)生故障概率較高,故可在1季度末增加檢修次數(shù)分析故障類型分布:所有站點(diǎn)中,停機(jī)維護(hù)共發(fā)生8次,所占比例最高通過分析,可在下年維修預(yù)算中,為停機(jī)維護(hù)提供較多預(yù)算場(chǎng)景一:故障信息與工控?cái)?shù)據(jù)相關(guān)性分析點(diǎn)擊其中一條故障描述,以故障/檢修日期為基線,向前倒推查詢壓縮機(jī)轉(zhuǎn)速數(shù)據(jù),展示對(duì)應(yīng)時(shí)間節(jié)點(diǎn)的發(fā)動(dòng)機(jī)轉(zhuǎn)速信息。場(chǎng)景一:故障信息與工控?cái)?shù)據(jù)相關(guān)性分析經(jīng)過分析,可通過轉(zhuǎn)速判斷出壓縮機(jī)故障原因,例如圖3轉(zhuǎn)速不規(guī)律,可能是故障前的轉(zhuǎn)速模式,故需要安排檢修場(chǎng)景二:能耗相關(guān)分析步驟將管道壓力跟溫度作為獨(dú)立因子,對(duì)壓縮機(jī)的轉(zhuǎn)
24、速進(jìn)行擬合。數(shù)據(jù)預(yù)處理:選取6,8,10號(hào)壓縮機(jī)在2014.10.19 2015.12.03的轉(zhuǎn)速數(shù)據(jù),將這三臺(tái)壓縮機(jī)的數(shù)據(jù)進(jìn)行平均計(jì)算;同時(shí)選取在2014.10.19 2015.12.03期間的管道溫度和壓力數(shù)據(jù);將壓力,管道,轉(zhuǎn)速的數(shù)據(jù)平均計(jì)算到每一天;去除轉(zhuǎn)速小于1000的數(shù)據(jù)(可認(rèn)為此時(shí)壓縮機(jī)停止工作);再將這三項(xiàng)數(shù)據(jù)的日期進(jìn)行關(guān)聯(lián),按日期維度進(jìn)行后續(xù)建模。數(shù)據(jù)訓(xùn)練:將2014.10.19 2015.07.01期間的數(shù)據(jù)進(jìn)行訓(xùn)練,選取多元回歸(MLR)算法進(jìn)行建模。數(shù)據(jù)預(yù)測(cè):將所有數(shù)據(jù)(2014.10.19 2015.12.03)代入建立好的模型中進(jìn)行壓縮機(jī)轉(zhuǎn)速的預(yù)測(cè),擬合成一條曲線場(chǎng)
25、景描述基于某站點(diǎn)管線溫度與壓力,通過SAP HANA內(nèi)置PAL算法,擬合出壓縮機(jī)轉(zhuǎn)速曲線(近似認(rèn)為壓縮機(jī)能耗模式)。局限缺少管線能耗數(shù)據(jù)溫度,壓力與壓縮機(jī)轉(zhuǎn)速數(shù)據(jù)契合程度低分析功能測(cè)試二:能耗相關(guān)分析壓縮機(jī)擬合值,平均真實(shí)值,6號(hào),8號(hào),10號(hào)壓縮機(jī)真實(shí)值的曲線場(chǎng)景三:防欺詐管理利用高效能的SAP HANA內(nèi)存計(jì)算技術(shù)與業(yè)務(wù)流程相結(jié)合預(yù)警通知和管理采用實(shí)時(shí)模擬計(jì)算以減少誤報(bào)利用SAP HANA內(nèi)存計(jì)算技術(shù)處理海量數(shù)據(jù)針對(duì)不斷變化的欺詐模式可以根據(jù)規(guī)則和預(yù)測(cè)分析進(jìn)行檢測(cè)更早地發(fā)現(xiàn)欺詐減少損失預(yù)防和遏制欺詐情況少花錢同時(shí)提高檢測(cè)準(zhǔn)確性分析性能調(diào)查檢測(cè)實(shí)施設(shè)計(jì)*監(jiān)視KPI關(guān)鍵績(jī)效指標(biāo)并生成管理報(bào)告采
26、用快速評(píng)測(cè)、評(píng)估和欺詐remediation方法對(duì)報(bào)警進(jìn)行管理執(zhí)行大量的和實(shí)時(shí)的檢測(cè)任務(wù),終止可疑的業(yè)務(wù)交易通過模擬和校準(zhǔn)定義欺詐檢測(cè)策略分析欺詐模式并定義檢測(cè)規(guī)則和模型場(chǎng)景三:采用SAP HANA技術(shù)的SAP防欺詐管理方案SAP HANAIn-Memory(*) 可采用SAP HANA 、 SAP 預(yù)測(cè)分析 (可選) 或者第三方工具高性能處理海量數(shù)據(jù)主要收益與SAP和非SAP的運(yùn)營(yíng)系統(tǒng)的強(qiáng)大的數(shù)據(jù)集成能力對(duì)檢測(cè)規(guī)則可以靈活地建模還可選擇將欺詐狀態(tài)提供給外部業(yè)務(wù)運(yùn)營(yíng)系統(tǒng)進(jìn)行事件處理 (例如取消對(duì)欺詐的支付行為) 場(chǎng)景三:高性能應(yīng)用架構(gòu)一個(gè)靈活且強(qiáng)大的技術(shù)環(huán)境提高了檢測(cè)效率BI 工具數(shù)據(jù)提供和集
27、成運(yùn)營(yíng)系統(tǒng)(SAP或者非SAP)工資支付付費(fèi)采購(gòu)訂單差旅報(bào)銷檢測(cè)和告警調(diào)查和決策SAP HANAIn-Memory.在線演示:“云大物移” 網(wǎng)站分析所涉及的內(nèi)容1、用戶的訪問體驗(yàn)怎么樣?把自己當(dāng)作網(wǎng)站的用戶去訪問網(wǎng)站,留意網(wǎng)站的潛在目標(biāo)、客戶體驗(yàn)和不便之處。順便關(guān)注下競(jìng)爭(zhēng)對(duì)手網(wǎng)站。2、網(wǎng)站的流量獲取策略是什么樣的?這些信息可從流量來源報(bào)告中獲取。3、用戶的留存情況與忠誠(chéng)度怎么樣?可查看用戶忠誠(chéng)度和新近度數(shù)據(jù)。4、如何發(fā)現(xiàn)和快速改進(jìn)網(wǎng)站存在問題的頁面?分析熱門著陸網(wǎng)頁。找出那些跳出率較高的著陸頁面及其跳出率較高的原因,提供優(yōu)化建議。5、哪些頁面是最有價(jià)值的頁面?頁面價(jià)值和著陸頁面的單次訪問價(jià)值。
28、6、用戶如何使用網(wǎng)站上的站內(nèi)搜索?通過關(guān)鍵字標(biāo)簽云可以快速了解這些信息。7、用戶在網(wǎng)站上有產(chǎn)生轉(zhuǎn)化嗎?分析目標(biāo)和目標(biāo)價(jià)值。8、營(yíng)銷預(yù)算是否需要優(yōu)化?查看廣告轉(zhuǎn)化與效果。9、用戶的轉(zhuǎn)化流程順暢嗎?關(guān)注渠道可視化報(bào)告。10、分析報(bào)告中是否還存在盲點(diǎn)?可查看智能報(bào)告。網(wǎng)站的眼睛網(wǎng)站的神經(jīng)網(wǎng)站的大腦訪問來自哪里?訪問者在哪里?哪些頁面最受歡迎?訪問者從哪里來?訪問者從哪里進(jìn)入?網(wǎng)站布局合理嗎?網(wǎng)站導(dǎo)航清洗嗎?哪些功能存在問題?網(wǎng)站內(nèi)容有效嗎?轉(zhuǎn)換路徑靠譜嗎?如何分析目標(biāo)?如何分配廣告預(yù)算?如何衡量產(chǎn)品表現(xiàn)?哪些產(chǎn)品需要優(yōu)化?哪些指標(biāo)需要關(guān)注?網(wǎng)站分析是什么網(wǎng)站分析的目的、流程及價(jià)值如何完成網(wǎng)站的目標(biāo)如
29、果你不能衡量它,你就不能改進(jìn)他如何進(jìn)行網(wǎng)站分析訪問量訪問來源媒介訪問時(shí)間粒度地理位置目標(biāo)頁面新老訪問網(wǎng)站流量多維分析指標(biāo)維度維度自然搜索BD流量直接流量推介流量集中訪問網(wǎng)站流量質(zhì)量分析網(wǎng)站內(nèi)容及導(dǎo)航分析首頁列表頁列表頁列表頁詳情頁詳情頁詳情頁詳情頁詳情頁詳情頁網(wǎng)站頁面質(zhì)量分析頻道頁詳情頁類別頁離開網(wǎng)站返回首頁離開網(wǎng)站質(zhì)量數(shù)量網(wǎng)站用戶分析1、用戶統(tǒng)計(jì)監(jiān)控分析各類用戶群體的變化情況,看網(wǎng)站在吸引和保留用戶方面的能力2、用戶定向營(yíng)銷分析用戶的行為來指導(dǎo)網(wǎng)站區(qū)分用戶群體的營(yíng)銷3、用戶調(diào)研用問卷和實(shí)驗(yàn)的方法了解用戶的需求、建議和滿意度社交媒體意見領(lǐng)袖的管理44社交媒體意見領(lǐng)袖管理解決方案有三個(gè)部分(如下
30、圖所示):意見領(lǐng)袖的維護(hù),意見領(lǐng)袖分析,意見領(lǐng)袖導(dǎo)控。通過三個(gè)部分,抓住媒體傳播關(guān)鍵路徑,有效和社交媒體的意見領(lǐng)袖建立良好的互動(dòng)機(jī)制,意見領(lǐng)袖的識(shí)別與影響力評(píng)估45意見領(lǐng)袖評(píng)估的主要流程意見領(lǐng)袖影響范圍分析網(wǎng)站轉(zhuǎn)化分析創(chuàng)建網(wǎng)站分析體系1、定義網(wǎng)站目標(biāo)期望網(wǎng)站達(dá)到的效果,創(chuàng)建網(wǎng)站時(shí)的原始動(dòng)力2、細(xì)化網(wǎng)站的目標(biāo)(目標(biāo)=子目標(biāo)+子目標(biāo))1、用什么指標(biāo)衡量2、目標(biāo)實(shí)現(xiàn)的時(shí)間范圍3、如何操作3、分解網(wǎng)站的目標(biāo)。多用“so what”反問自己如1、希望訪問者來自哪里?2、希望訪問者從哪里進(jìn)入網(wǎng)站3、網(wǎng)站的哪些頁面應(yīng)該盡量多的被看到?4、訪問者應(yīng)該按哪些路徑瀏覽網(wǎng)站5、訪問者應(yīng)該從哪里離開網(wǎng)站網(wǎng)站轉(zhuǎn)化分析尋
31、找關(guān)鍵KPI指標(biāo)的路徑SAP大數(shù)據(jù)分析平臺(tái)解決方案方案整體技術(shù)框架ERP數(shù)據(jù)SEM數(shù)據(jù)SRM數(shù)據(jù)PDM外部數(shù)據(jù)源OAEAM數(shù)據(jù)交換平臺(tái)流數(shù)據(jù)(ESP)數(shù)據(jù)復(fù)制(SRS)ETL(Data Services)ESB(PI)數(shù)據(jù)管控平臺(tái)主數(shù)據(jù)治理(MDG)元數(shù)據(jù)管理(信息管家)數(shù)據(jù)質(zhì)量管理(Data Quality)數(shù)據(jù)標(biāo)準(zhǔn)管理數(shù)據(jù)安全管理企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)PMISSAP HANAIn-memory computing分析SAP BusinessObjects BI探索, 儀表盤, 報(bào)表, 圖表, 可視化SAP Lumira 數(shù)據(jù)分析與可視化SAP Predictive Analysis 預(yù)測(cè)分析S
32、AP大數(shù)據(jù)平臺(tái)建議架構(gòu)歷史數(shù)據(jù)、非機(jī)構(gòu)化數(shù)據(jù)Hadoop分布式文件系統(tǒng)HivePigSpark擴(kuò)展數(shù)據(jù)層(冷存儲(chǔ))結(jié)構(gòu)化歷史數(shù)據(jù)擴(kuò)展表磁盤數(shù)據(jù)結(jié)構(gòu)化實(shí)時(shí)數(shù)據(jù)熱表擴(kuò)展存儲(chǔ)(定義)SDAvUDFVoraModels / PAL / R溫存儲(chǔ)(動(dòng)態(tài)分層)熱存儲(chǔ)(內(nèi)存計(jì)算)數(shù)據(jù)老化自動(dòng)搬移DLMCRM數(shù)據(jù)SAP 移動(dòng)平臺(tái) (BI Mobile, Mobile ApplicationSAP大數(shù)據(jù)平臺(tái)解決方案數(shù)據(jù)交換平臺(tái)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)數(shù)據(jù)管控平臺(tái)數(shù)據(jù)的展現(xiàn)與可視化1SAP HANA Smart Data AccessSAP ESP - EventStream ProcessorSAP Data Servic
33、esSAP SRS - Replication ServerSAP LT Replication ServerSAP SQL Anywhere任何數(shù)據(jù)源數(shù)據(jù)遷移轉(zhuǎn)換和持續(xù)數(shù)據(jù)Event StreamsData SynchronizationData VirtualizationODBCSAP HANAVirtual TablesData Sources (SP6: HANA, IQ, ASE, Hadoop, Teradata) Network Devices Wired / WirelessComplex Event Data SourceNon-SAP Data SourcesCloud
34、DeploymentsSAP Business SuiteTrigger-BasedLog-BasedETL, Batch強(qiáng)大的數(shù)據(jù)提供平臺(tái)SAP的數(shù)據(jù)服務(wù)方案全面考慮數(shù)據(jù)集成, 數(shù)據(jù)質(zhì)量管理, 數(shù)據(jù)切面及非結(jié)構(gòu)化數(shù)據(jù)獲取問題支持訪問全部關(guān)鍵業(yè)務(wù)數(shù)據(jù)(任意數(shù)據(jù)源,類型和領(lǐng)域), 一體化平臺(tái)全面解決數(shù)據(jù)的清洗、排重、歸并、衍生、合并、統(tǒng)計(jì)、匯總等一系列數(shù)據(jù)加工問題結(jié)構(gòu)數(shù)據(jù)非結(jié)構(gòu)數(shù)據(jù) 一個(gè)運(yùn)行時(shí)架構(gòu)及一系列服務(wù)業(yè)務(wù)界面統(tǒng)一的元數(shù)據(jù)技術(shù)界面數(shù)據(jù)服務(wù)解決方案包數(shù)據(jù)抽取數(shù)據(jù)質(zhì)量數(shù)據(jù)切面文本分析統(tǒng)一的管理環(huán)境(調(diào)度, 安全, 用戶管理) 一套源/目標(biāo)各類型數(shù)據(jù)庫(kù):OracleDB2Sybase ASESy
35、base IQSQL ServerInformixMySQLTeradataHP NeoViewNetezzaODBCSAP HANA全面接口支持各類型技術(shù)接口:Text delimitedText fixed widthEBCDICXMLCobolExcelHTTPJMSSOAP(Web Services)JSONSAP BusinessObjects Data Service性能強(qiáng)勁的執(zhí)行引擎使用便捷的開發(fā)工具所有的任務(wù)在統(tǒng)一的圖形界面開發(fā)易于使用,拖拽界面內(nèi)帶數(shù)據(jù)預(yù)覽、結(jié)構(gòu)分析、清洗和調(diào)試交付可信賴的信息集成數(shù)據(jù)質(zhì)量管理跨越BI環(huán)境的元數(shù)據(jù)管理端到端沖突分析簡(jiǎn)化變動(dòng)管理性能強(qiáng)勁的執(zhí)行引擎
36、通過高性能并行架構(gòu)支持網(wǎng)格計(jì)算最好的企業(yè)應(yīng)用連接性實(shí)時(shí)和批處理數(shù)據(jù)整合Designer (Windows)Administrator (Web)Request-Response Access ServerReal-time ServicesJob Server and EngineHeterogeneous Data SourcesHeterogeneous Data TargetsWeb ApplicationsLocal RepositoryCentral RepositoryData IntegratorSAP大數(shù)據(jù)平臺(tái)解決方案數(shù)據(jù)交換平臺(tái)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)數(shù)據(jù)管控平臺(tái)數(shù)據(jù)的展現(xiàn)與可視化2SA
37、P 大數(shù)據(jù) 實(shí)時(shí)平臺(tái)各種移動(dòng)應(yīng)用各種應(yīng)用服務(wù)器SAP Business Suite 和 BW ABAP 應(yīng)用服務(wù)器JSONR開放的連通性MDXSQLSAP HANA 平臺(tái)SAP HANA 平臺(tái)覆蓋了數(shù)據(jù)庫(kù),數(shù)據(jù)處理,應(yīng)用平臺(tái),預(yù)測(cè)功能,計(jì)劃編制功能,文本分析和商務(wù)智能分析等功能,所以能為企業(yè)運(yùn)營(yíng)提供全面實(shí)時(shí)的支持。管理 Administration擴(kuò)展的應(yīng)用服務(wù)集成服務(wù)Deployment:數(shù)據(jù)庫(kù)服務(wù)開發(fā) DevelopmentOLTP | OLAP | Search | Text Analysis |Predictive | Events | Spatial | Rules | Planni
38、ng | Calculators處理引擎應(yīng)用函數(shù)庫(kù) 和 數(shù)據(jù)模型Predictive Analysis Libraries | Business Function Libraries | Data Models & Stored ProceduresData Virtualization | Replication | ETL/ELT | Mobile Synch | Streaming應(yīng)用服務(wù)器 | UI 集成服務(wù) | Web 服務(wù)器本地 On-Premise | 混合 Hybrid | 按需 On-Demand支持各種設(shè)備ON-PREMISE | CLOUD | HYBRIDSAP HAN
39、A 平臺(tái)基于HANA的大數(shù)據(jù)平臺(tái)SpatialGraphPredictiveSearchText AnalyticsPlanningDataEnrichmentSeriesDataFunctionLibraries處理服務(wù)Web Server JavaScriptFiori用戶界面Graphic Modeler應(yīng)用服務(wù)ALMApplication Lifecycle Management列存儲(chǔ)內(nèi)存數(shù)據(jù)庫(kù) OLTP+OLAP多核大規(guī)模并行計(jì)算高級(jí)壓縮多租戶動(dòng)態(tài)分層存儲(chǔ)數(shù)據(jù)庫(kù)服務(wù)高可用性和災(zāi)難恢復(fù)開放的標(biāo)準(zhǔn)數(shù)據(jù)模型Data VirtualizationELT & Replication集成服務(wù)Ha
40、doop IntegrationStreaming (CEP)Remote DataSync企業(yè)大數(shù)據(jù)溫度數(shù)據(jù)在架構(gòu)中的存儲(chǔ)分布數(shù)據(jù)溫度產(chǎn)品數(shù)據(jù)特點(diǎn)可能操作熱數(shù)據(jù)(內(nèi)存存儲(chǔ))SAP HANA內(nèi)存即時(shí)分析要求的結(jié)構(gòu)化數(shù)據(jù)和流數(shù)據(jù),比如ERP中的數(shù)據(jù)存儲(chǔ)在HANA內(nèi)存中. 熱數(shù)據(jù)頻繁訪問,較高性能要求寫、讀、更新和刪除溫?cái)?shù)據(jù)(硬盤存儲(chǔ))SAP HANA 動(dòng)態(tài)分層大數(shù)據(jù)或者PB級(jí)數(shù)據(jù)擴(kuò)展- 適合不需要內(nèi)存實(shí)時(shí)處理的數(shù)據(jù),比如:預(yù)測(cè)性維護(hù)場(chǎng)景需要的主要設(shè)備實(shí)時(shí)數(shù)據(jù)與熱數(shù)據(jù)在統(tǒng)一的HANA平臺(tái)中. 溫?cái)?shù)據(jù)是相對(duì)時(shí)間久不太常查詢的數(shù)據(jù), 但是需要在線訪問寫、讀、更新和刪除 冷數(shù)據(jù)(擴(kuò)展存儲(chǔ))Hadoop(
41、文件存儲(chǔ))結(jié)構(gòu)化數(shù)據(jù):如超過三年以上的財(cái)務(wù)數(shù)據(jù)大部分實(shí)時(shí)數(shù)據(jù)大部分非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)關(guān)閉或者不用的數(shù)據(jù)可以從熱存儲(chǔ)和溫存儲(chǔ)遷移到冷存儲(chǔ)存放實(shí)時(shí)數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),可無限擴(kuò)展,降低成本寫,讀、刪除數(shù)據(jù)的溫度是隨時(shí)間動(dòng)態(tài)變化的,而且并不是同類型數(shù)據(jù)只存在一個(gè)存儲(chǔ)空間,要看具體的業(yè)務(wù)場(chǎng)景和數(shù)據(jù)價(jià)值,比如實(shí)時(shí)數(shù)據(jù)不只是在溫存儲(chǔ)中,也可以在HANA內(nèi)存中,HANA也有處理時(shí)間序列的功能。HANA大數(shù)據(jù)平臺(tái)的數(shù)據(jù)存儲(chǔ)層如何有效區(qū)別各數(shù)據(jù)層次內(nèi)存管理操作類型日常運(yùn)行的業(yè)務(wù)應(yīng)用,分析操作和統(tǒng)計(jì)報(bào)表實(shí)時(shí)分析復(fù)雜的分析、預(yù)測(cè)等密集型計(jì)算數(shù)據(jù)特征當(dāng)前活躍數(shù)據(jù)信息單位價(jià)值高的業(yè)務(wù)數(shù)據(jù)管理數(shù)據(jù)量管理數(shù)據(jù)規(guī)模在幾十個(gè)TB量
42、級(jí)Hadoop企業(yè)級(jí)海量數(shù)據(jù)存儲(chǔ)低成本的數(shù)據(jù)存儲(chǔ)、通用硬件高度靈活、可擴(kuò)展架構(gòu)數(shù)據(jù)特征大量非結(jié)構(gòu)化/半結(jié)構(gòu)化數(shù)據(jù),社交媒體和外部數(shù)據(jù)非活躍,批量處理數(shù)據(jù)信息單位價(jià)值相對(duì)不高的業(yè)務(wù)數(shù)據(jù)數(shù)據(jù)移動(dòng)(同前)管理數(shù)據(jù)量管理數(shù)據(jù)規(guī)??蛇_(dá)到PB級(jí)動(dòng)態(tài)分層HANA的磁盤級(jí)處理引擎數(shù)據(jù)特征歷史數(shù)據(jù)為主近實(shí)時(shí)的分析場(chǎng)景信息單位價(jià)值較高的業(yè)務(wù)數(shù)據(jù)數(shù)據(jù)移動(dòng)(Data Lifecycle Mgt.)定義數(shù)據(jù)分割/分區(qū)策略按照規(guī)則在內(nèi)存和硬盤引擎間移動(dòng)數(shù)據(jù)管理數(shù)據(jù)量管理數(shù)據(jù)規(guī)模在幾百個(gè)TB以內(nèi)SAP HANASAP HANAHANA RAMDT數(shù)據(jù)的溫度是隨時(shí)間動(dòng)態(tài)變化的,而且并不是同類型數(shù)據(jù)只存在一個(gè)存儲(chǔ)空間,要看具體
43、的業(yè)務(wù)場(chǎng)景和數(shù)據(jù)價(jià)值,比如實(shí)時(shí)數(shù)據(jù)不只是在溫存儲(chǔ)中,也可以在HANA內(nèi)存中,HANA也有處理時(shí)間序列的功能。支持豐富的Hadoop處理引擎,支持主要的Hadoop廠商,如Cloudera, Hortonworks, MapR等Smart Data Access將外部的數(shù)據(jù)源映射為本地的數(shù)據(jù)表,做到實(shí)時(shí)訪問外部數(shù)據(jù)源支持與Hadoop,Teradata, Microsoft SQL Server, Oracle, IBM DB2, IBM Netezza 等數(shù)據(jù)庫(kù)的集成Virtual UDF (vUDF)可自定義的數(shù)據(jù)聯(lián)邦類型支持訪問Hadoop分布式文件系統(tǒng)(HDFS),無需Mapper/Re
44、ducer解析包支持直接調(diào)用自定義的Map Reduce任務(wù)vUDF可集成到SQL語句效益能夠利用Hadoop集群中HIVE & Spark無法提供的功能 (如. Hadoop Distributed File System (HDFS) 和MapReduce)提高非結(jié)構(gòu)化數(shù)據(jù)的即席查詢能力SAP HANAvUDF OperatorRFC HadoopHadoopMap ReduceHDFSYARNHIVE與Hadoop的深度集成Smart Data AccessYARNHDFS其他應(yīng)用文件文件文件SAP HANA - Apache Spark Adapter可用于提高分布式系統(tǒng)連接的性能編譯
45、查詢可以提高應(yīng)用和數(shù)據(jù)分析在各節(jié)點(diǎn)的運(yùn)行效率基于 Hadoop 的 OLAP 體驗(yàn)非常常見,可用于從大數(shù)據(jù)中挖掘業(yè)務(wù)洞察,比如向下鉆取 HDFS 數(shù)據(jù)編譯查詢Apache Spark Adapter向下鉆取功能SAP HANA 內(nèi)存平臺(tái) SAP HANA VoraApache SparkSAP HANA VoraApache Spark內(nèi)存存儲(chǔ)應(yīng)用服務(wù)數(shù)據(jù)庫(kù)服務(wù)集成服務(wù)處理服務(wù)SAP HANA 平臺(tái)SAP HANA VoraApache SparkSAP HANA-ApacheSpark AdapterSAP HANA Vora 內(nèi)置于 Apache Spark 執(zhí)行架構(gòu)之中,是一款內(nèi)存計(jì)算查
46、詢引擎,能夠基于 Hadoop 提供豐富的交互式分析體驗(yàn)。SAP HANA Vora與Spark的深度集成SAP大數(shù)據(jù)平臺(tái)解決方案數(shù)據(jù)交換平臺(tái)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)數(shù)據(jù)管控平臺(tái)數(shù)據(jù)的展現(xiàn)與可視化3數(shù)據(jù)資產(chǎn)管理資產(chǎn)財(cái)務(wù)一體化系統(tǒng)700,00015,0001,0003,0002,000物料供應(yīng)商客戶會(huì)計(jì)科目礦別HR系統(tǒng)500組織機(jī)構(gòu)電子商務(wù)系統(tǒng)20,0003,000物料供應(yīng)商數(shù)據(jù)中心3,000元數(shù)據(jù)指標(biāo)物料供應(yīng)商客戶會(huì)計(jì)科目礦別組織機(jī)構(gòu)元數(shù)據(jù)指標(biāo)用友等其他系統(tǒng)500,00010,0001,0001,000物料供應(yīng)商客戶會(huì)計(jì)科目華能集團(tuán)核心主數(shù)據(jù)總量約為126萬。這些數(shù)據(jù)源不統(tǒng)一,分散在資產(chǎn)財(cái)務(wù)一體化,人力資
47、源系統(tǒng),電子商務(wù)系統(tǒng)、數(shù)據(jù)中心等系統(tǒng)中,各自獨(dú)立管理1,2200,00028,0002,0004,0002,0005003,000什么樣的數(shù)據(jù)能夠成為資產(chǎn),或有資格成為資產(chǎn)?被企業(yè)擁有和控制能夠用貨幣來計(jì)量能為企業(yè)帶來經(jīng)濟(jì)利益數(shù)據(jù)資產(chǎn)增值擴(kuò)大數(shù)據(jù)規(guī)模,提高數(shù)據(jù)活性,提升收集運(yùn)用數(shù)據(jù)的能力建設(shè)數(shù)據(jù)交易,加速數(shù)據(jù)資產(chǎn)化數(shù)據(jù)治理關(guān)鍵點(diǎn)數(shù)據(jù)治理每個(gè)治理點(diǎn)都必須基于具體和成熟的業(yè)務(wù)需求 沒有一刀切 “one size fits all” 的解決方案關(guān)注交互模型 業(yè)務(wù)與IT數(shù)據(jù)治理不只是購(gòu)買數(shù)據(jù)管理的軟件,也需要有一個(gè)清晰的數(shù)據(jù)管理規(guī)劃數(shù)據(jù)治理需要有不斷并進(jìn)和跟蹤的各自維度數(shù)據(jù)治理包含整個(gè)企業(yè)或組織,不僅
48、僅是IT的事情企業(yè)或組織的領(lǐng)導(dǎo)決策層參與是必要的根據(jù)對(duì)象、流程和技術(shù)需求,并以SAP產(chǎn)品和解決方案為基礎(chǔ),SAP 希望建立靈活的、可持續(xù)的數(shù)據(jù)治理“The formal orchestration of people, processes, and technology to enable an organization to leverage data as an enterprise asset.”MDM Institute數(shù)據(jù)治理的維度1. DataExplicit definitions for each data element流程標(biāo)準(zhǔn)化的數(shù)據(jù)維護(hù)分布IT 系統(tǒng)工具與應(yīng)用清晰定義 源
49、/集成數(shù)據(jù)治理的核心目標(biāo):在整個(gè)企業(yè)內(nèi)部制定并執(zhí)行統(tǒng)一的,且符合業(yè)務(wù)要求的、科學(xué)合理的數(shù)據(jù)標(biāo)準(zhǔn)通過數(shù)據(jù)標(biāo)準(zhǔn)的執(zhí)行使得企業(yè)內(nèi)部各個(gè)業(yè)務(wù)環(huán)節(jié)使用的主數(shù)據(jù)完整統(tǒng)一,只有一個(gè)真正的版本并且質(zhì)量較高提高主數(shù)據(jù)的使用率和用戶對(duì)企業(yè)數(shù)據(jù)質(zhì)量的信任度最終滿足企業(yè)的諸多管理戰(zhàn)略目標(biāo)的需求數(shù)據(jù)對(duì)象元數(shù)據(jù) 為每個(gè)數(shù)據(jù)元素顯式定義數(shù)據(jù)質(zhì)量治理定義分析驗(yàn)證改進(jìn)維護(hù)批準(zhǔn)報(bào)表SAP 數(shù)據(jù)管理使業(yè)務(wù)更完整、更精確信息生命周期管理集成清洗與監(jiān)控管理關(guān)聯(lián)歸檔Before After數(shù)據(jù)質(zhì)量管理主數(shù)據(jù)管理內(nèi)容管理發(fā)布內(nèi)容發(fā)布數(shù)據(jù)集成SAP Data Services:訪問、集成、清洗、匹配和加強(qiáng)數(shù)據(jù)SAP Document Pre
50、sentment by OpenText:一致協(xié)作SAP Information Lifecycle Management:數(shù)據(jù)保持管理SAP Information Steward: 監(jiān)控?cái)?shù)據(jù)質(zhì)量SAP Extended ECM by OpenText: 紙質(zhì)流程數(shù)字化上下文文檔合規(guī)歸檔記錄管理SAP Master Data Governance:治理主數(shù)據(jù)SAP Portal Content Management by OpenText:協(xié)同門戶SAP Invoice Management by OpenText:優(yōu)化發(fā)票流程獲得清洗保持清洗數(shù)據(jù)質(zhì)量可視化數(shù)據(jù)質(zhì)量平衡計(jì)分卡數(shù)據(jù)質(zhì)量評(píng)分標(biāo)準(zhǔn)
51、最新質(zhì)量計(jì)分隨時(shí)間質(zhì)量運(yùn)行趨勢(shì)關(guān)鍵質(zhì)量維度 (數(shù)據(jù)KPI),可定制SAP大數(shù)據(jù)平臺(tái)解決方案數(shù)據(jù)交換平臺(tái)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)數(shù)據(jù)管控平臺(tái)數(shù)據(jù)的展現(xiàn)與可視化4商務(wù)智能是后ERP時(shí)代的迫切需求分析系統(tǒng)計(jì)劃洞察BI行動(dòng)ERP交易系統(tǒng)商務(wù)智能 優(yōu)化 行動(dòng)執(zhí)行 運(yùn)營(yíng)績(jī)效決策支持?jǐn)?shù)據(jù)分析預(yù)測(cè)交易流程運(yùn)營(yíng)綜合運(yùn)營(yíng)分析財(cái)務(wù)分析設(shè)備管理銷售分析計(jì)劃調(diào)度分析生產(chǎn)分析物資分析人力分析大數(shù)據(jù)分析整體框架和應(yīng)用規(guī)劃全面、綜合、決策物資采購(gòu)銷售設(shè)備運(yùn)輸生產(chǎn)執(zhí)行財(cái)務(wù)人力訂單生產(chǎn)計(jì)劃企業(yè)級(jí)數(shù)據(jù)可信分析運(yùn)營(yíng)分析生產(chǎn)分析運(yùn)銷分析財(cái)務(wù)分析生產(chǎn)計(jì)劃分析銷售計(jì)劃分析運(yùn)輸計(jì)劃分析外購(gòu)計(jì)劃分析物資計(jì)劃分析煤產(chǎn)量分析產(chǎn)能分析產(chǎn)能利用率開拓進(jìn)尺毛煤入倉(cāng)
52、生產(chǎn)生產(chǎn)分析運(yùn)行狀態(tài)監(jiān)控利用率分析故障率分析完好率分析使用時(shí)間設(shè)備電耗銷售分析價(jià)格分析客戶分析庫(kù)存分析合同分析備品備件分析采購(gòu)分析供應(yīng)商分析運(yùn)營(yíng)成本分析利潤(rùn)分析杜邦分析資產(chǎn)分析預(yù)算分析人力資本分析人員構(gòu)成分析人員狀態(tài)分析人員績(jī)效分析人員流動(dòng)分析決策支持應(yīng)用智能投資決策運(yùn)營(yíng)風(fēng)險(xiǎn)預(yù)警生產(chǎn)計(jì)劃智能自動(dòng)排程設(shè)計(jì)實(shí)時(shí)需求預(yù)測(cè)實(shí)時(shí)供給預(yù)測(cè)定制化生產(chǎn)生產(chǎn)風(fēng)險(xiǎn)預(yù)警設(shè)備故障預(yù)警預(yù)測(cè)性維護(hù)客戶需求預(yù)測(cè)銷售訂單預(yù)測(cè)市場(chǎng)價(jià)格預(yù)測(cè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警資金計(jì)劃智能人力最優(yōu)模型設(shè)計(jì)商務(wù)智能應(yīng)用分析適應(yīng)不同用戶的要求決策層管理層執(zhí)行層管理關(guān)鍵指標(biāo),及時(shí)調(diào)整經(jīng)營(yíng)戰(zhàn)略。比如收購(gòu)或并購(gòu)新公司,進(jìn)入新市場(chǎng),引入新產(chǎn)品;管理層需要獲取和解讀數(shù)
53、據(jù),快速調(diào)整運(yùn)作戰(zhàn)術(shù)。比如開展/終止銷售計(jì)劃,調(diào)整供應(yīng)鏈指標(biāo);日常業(yè)務(wù)操作需求,直接獲得分析內(nèi)容提高操作效率。比如客戶信用狀況,成本費(fèi)用報(bào)表;具體的視角實(shí)時(shí)瀏覽/行業(yè)規(guī)范(套打)全面的視角實(shí)時(shí)分析/趨勢(shì)分析/預(yù)測(cè)推演統(tǒng)一的視角實(shí)時(shí)告警/交互審批/級(jí)聯(lián)分析示例:儀表板SAP大數(shù)據(jù)預(yù)測(cè)分析專為業(yè)務(wù)用戶設(shè)計(jì)數(shù)據(jù)挖掘/統(tǒng)計(jì)學(xué)/概率學(xué) 專業(yè)知識(shí)無業(yè)務(wù)分析師數(shù)據(jù) 科學(xué)家業(yè)務(wù)用戶低高97%3%1%SAP 大數(shù)據(jù)預(yù)測(cè)分析SAP PA 智能建模+Lumira自助探索SAP PA 專家建模R語言SAP HANA 分析函數(shù)包BI 平臺(tái)HANARDBMSExcel / CSVhadoopBW*ClipboardSAP商務(wù)智能詳細(xì)架構(gòu)報(bào)表儀表盤分析水晶報(bào)表即席查詢DashboardDesign Studio數(shù)據(jù)探索高級(jí)分析平臺(tái)客戶端BI工具數(shù)據(jù)源語義層*數(shù)據(jù)源數(shù)據(jù)建模數(shù)據(jù)分析分析共享查看平臺(tái)Lumira 服務(wù)器(基于 HANA)Lumira 云 (基于HANA)Lumira 桌面版Excel / CSVLumira 服務(wù)器(內(nèi)存數(shù)據(jù)庫(kù)) SAP IQ企業(yè)核心業(yè)務(wù)數(shù)據(jù)數(shù)據(jù)展現(xiàn)BO儀表盤Lumira自助探索其它應(yīng)用系統(tǒng)SAP ERPSAP大數(shù)據(jù)預(yù)測(cè)分析系統(tǒng)架構(gòu) 敏捷分析+內(nèi)存數(shù)據(jù)庫(kù)+自助探索移動(dòng)可視化第三方數(shù)據(jù)SAP CRM 歷史數(shù)據(jù)擴(kuò)展存儲(chǔ)Predictive
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度消防檢測(cè)服務(wù)外包合同勞動(dòng)廳制定2篇
- 2025年度石材行業(yè)市場(chǎng)調(diào)查與分析合同3篇
- 二零二五年度外墻巖棉板保溫材料采購(gòu)、施工及質(zhì)量監(jiān)管合同2篇
- 二零二五年度旅游行業(yè)SaaS解決方案銷售及服務(wù)協(xié)議3篇
- 二零二五年度波形護(hù)欄安裝及售后保養(yǎng)服務(wù)合同3篇
- 二零二五年度廣告發(fā)布合同:某品牌在央視春晚廣告投放3篇
- 編織紅繩課程設(shè)計(jì)
- 二零二五年度建筑膩?zhàn)赢a(chǎn)品進(jìn)出口代理合同3篇
- 二零二五年度彩鋼房租賃與投資合作協(xié)議3篇
- 課程設(shè)計(jì)怎么形容成語
- 綜合測(cè)試 散文閱讀(多文本)(解析版)-2025年高考語文一輪復(fù)習(xí)(新高考)
- 鈑金設(shè)備操作培訓(xùn)
- 2024駕校經(jīng)營(yíng)權(quán)承包合同
- 快遞公司與驛站合作協(xié)議模板 3篇
- 水利工程招標(biāo)文件樣本
- 品質(zhì)管控培訓(xùn)質(zhì)量管理與質(zhì)量控制課件
- 小數(shù)加減乘除計(jì)算題大全(300題大全)-
- 第17課 西晉的短暫統(tǒng)一和北方各族的內(nèi)遷(說課稿)-2024-2025學(xué)年七年級(jí)歷史上冊(cè)素養(yǎng)提升說課稿(統(tǒng)編版2024)
- 2023-2024學(xué)年小學(xué)語文四年級(jí)素養(yǎng)檢測(cè)復(fù)習(xí)試題附答案
- 露天礦山全員安全教育培訓(xùn)
- 共生理論視域下開放型區(qū)域產(chǎn)教融合實(shí)踐中心建設(shè)路徑研究
評(píng)論
0/150
提交評(píng)論