![ODS在金融行業(yè)的應(yīng)用_第1頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-6/30/664cf3fd-71d5-4704-9a10-5d46b4089807/664cf3fd-71d5-4704-9a10-5d46b40898071.gif)
![ODS在金融行業(yè)的應(yīng)用_第2頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-6/30/664cf3fd-71d5-4704-9a10-5d46b4089807/664cf3fd-71d5-4704-9a10-5d46b40898072.gif)
![ODS在金融行業(yè)的應(yīng)用_第3頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-6/30/664cf3fd-71d5-4704-9a10-5d46b4089807/664cf3fd-71d5-4704-9a10-5d46b40898073.gif)
![ODS在金融行業(yè)的應(yīng)用_第4頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-6/30/664cf3fd-71d5-4704-9a10-5d46b4089807/664cf3fd-71d5-4704-9a10-5d46b40898074.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、ODS在金融行業(yè)的應(yīng)用ODS項(xiàng)目組什么是ODS?ODS(Operational Data Store)操作型數(shù)據(jù)存儲(chǔ),對(duì)于一些準(zhǔn)實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)庫(kù)當(dāng)中的數(shù)據(jù)的暫時(shí)存儲(chǔ),支持一些同時(shí)關(guān)聯(lián)到歷史數(shù)據(jù)與實(shí)時(shí)數(shù)據(jù)分析的數(shù)據(jù)暫時(shí)存儲(chǔ)區(qū)域。ODS 是一個(gè)集成了來自不同操作數(shù)據(jù)庫(kù)數(shù)據(jù)的環(huán)境,其目的是為終端用戶提供一致的企業(yè)數(shù)據(jù)集成視圖。例如,目前中國(guó)建設(shè)銀行內(nèi)部有很多系統(tǒng):核心業(yè)務(wù)系統(tǒng)CCBS、信貸管理系統(tǒng)CMIS、個(gè)貸系統(tǒng)PLS、外匯資金系統(tǒng)OPICS、抵債系統(tǒng)DMAMIS、總帳系統(tǒng)GLMIS等等,他們之間的信息有重疊和不一致存在,如客戶資料、客戶所對(duì)應(yīng)的業(yè)務(wù)信息等,如何綜合應(yīng)用這些數(shù)據(jù),首要任務(wù)就是進(jìn)行數(shù)據(jù)
2、整合,ODS的特點(diǎn)恰恰可以解決這個(gè)問題,而且ODS的出現(xiàn),也正是因?yàn)橛辛诉@種需求的存在。中國(guó)建設(shè)銀行ODS采用統(tǒng)一的數(shù)據(jù)模型,保存全行標(biāo)準(zhǔn)化全量數(shù)據(jù)、短期(30-60天)的明細(xì)/流水?dāng)?shù)據(jù),屏蔽目標(biāo)系統(tǒng)對(duì)源系統(tǒng)的數(shù)據(jù)需求,滿足DW&MIS、ERP、APMIS、NARMIS、CCMIS等分析系統(tǒng)的數(shù)據(jù)交換需求。ODS在商業(yè)智能中扮演什么角色?金融行業(yè)的ODS提供了一個(gè)統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)平臺(tái),基于ODS平臺(tái)的數(shù)據(jù)交換,為金融行業(yè)的數(shù)據(jù)倉(cāng)庫(kù)以及各數(shù)據(jù)分析系統(tǒng)提供所需的源數(shù)據(jù)。ODS有如下優(yōu)勢(shì):1.組織機(jī)構(gòu)可以獲得他們業(yè)務(wù)分析和客戶交易的完整視圖,有利于更好地了解客戶和做出統(tǒng)觀全局的商業(yè)決策。2.O
3、DS能以較高的性能生成操作報(bào)告,并實(shí)時(shí)或近實(shí)時(shí)地查詢產(chǎn)品及服務(wù)相關(guān)的數(shù)據(jù)。3.它提供一個(gè)平臺(tái),可以集中共享不同應(yīng)用軟件系統(tǒng)數(shù)據(jù);一種方式是應(yīng)用軟件直接訪問ODS中的數(shù)據(jù);另一種方式則可從ODS中將數(shù)據(jù)變化復(fù)制到現(xiàn)有系統(tǒng)的數(shù)據(jù)庫(kù)中。4.由于部分集成數(shù)據(jù)已駐留在ODS中,因而ODS可縮短遷移DW所需的時(shí)間。5.ODS可幫助集成現(xiàn)有新型系統(tǒng)。上圖所示,中國(guó)建設(shè)銀行ODS,通過ETL從CCBS、CMIS、PLS等源系統(tǒng)提取業(yè)務(wù)、管理數(shù)據(jù),并經(jīng)過標(biāo)準(zhǔn)化處理(公用代碼標(biāo)準(zhǔn)化、數(shù)據(jù)類型標(biāo)準(zhǔn)化、數(shù)據(jù)格式標(biāo)準(zhǔn)化以及客戶信息標(biāo)準(zhǔn)化),建立全行統(tǒng)一的標(biāo)準(zhǔn)化ODS數(shù)據(jù)模型ODSDB。ODS平臺(tái)按照需求定期向DW以及其
4、他管理系統(tǒng)ERP、APMIS等提供全量、增量數(shù)據(jù);DW對(duì)ODS提供的數(shù)據(jù)進(jìn)行整合、加工和分析,建立面向主題的、集成的、與時(shí)間相關(guān)的、不可修改的數(shù)據(jù)集合,滿足建行的企業(yè)管理、決策需要。如何實(shí)現(xiàn)ODS? 首先,需要建立一個(gè)統(tǒng)一的ODS數(shù)據(jù)模型。這個(gè)模型必須涵蓋所有需要整合應(yīng)用系統(tǒng)內(nèi)的信息,該數(shù)據(jù)模型一般不需要保留歷史信息,只需要保留當(dāng)前的信息(而DW中需要保存每一個(gè)修改的歷史記錄)。例如,目前建行ODS整合了11個(gè)源系統(tǒng)的信息,ODS模型保存了全行當(dāng)前的全量數(shù)據(jù)以及短期的明細(xì)/流水信息,對(duì)于歷史數(shù)據(jù)進(jìn)行了必要的備份,保證數(shù)據(jù)的可回溯性。建行ODS模型基本沿用了被整合系統(tǒng)的數(shù)據(jù)結(jié)構(gòu),只對(duì)客戶模型進(jìn)行
5、了整合,建立了統(tǒng)一的客戶模型。 其次,就是數(shù)據(jù)處理,主要包括數(shù)據(jù)導(dǎo)入以及數(shù)據(jù)導(dǎo)出。其中,數(shù)據(jù)的導(dǎo)入就是利用ETL,將源系統(tǒng)的數(shù)據(jù)通過extract(抽?。ransfer(轉(zhuǎn)換)、clean(清洗)和load(裝載)整合到ODS的統(tǒng)一模型中。數(shù)據(jù)的導(dǎo)出就是為DW等目標(biāo)系統(tǒng)提供提供經(jīng)過整合的數(shù)據(jù)。ETL在ODS中至關(guān)重要,它將影響數(shù)據(jù)模型的準(zhǔn)確性、完整性以及數(shù)據(jù)處理的效率,以下將結(jié)合中國(guó)建設(shè)銀行的ODS項(xiàng)目,著重討論ODS中ETL的實(shí)現(xiàn)。1ETL過程,可以利用數(shù)據(jù)庫(kù)系統(tǒng)、業(yè)務(wù)子系統(tǒng)工具自行開發(fā),或者購(gòu)買現(xiàn)成的ETL工具(如EAI、Informatic等廠商的ETL工具 )。自行開發(fā)可以充分利用
6、子系統(tǒng)的優(yōu)化操作,提高數(shù)據(jù)處理效率,但是靈活性以及可拓展性欠佳;現(xiàn)成的ETL工具可以靈活定制數(shù)據(jù)處理流程、簡(jiǎn)化開發(fā)、縮短ETL方案實(shí)施周期,但是其處理效率較低、工具購(gòu)買成本較高。效率至上的指導(dǎo)方針,決定了建行ODS采用自行開發(fā)的方案。2ETL主要包括數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換/清洗、數(shù)據(jù)裝載以及數(shù)據(jù)統(tǒng)計(jì)管理四個(gè)模塊。數(shù)據(jù)抽取模塊,主要分為DB到DB以及DB到文件兩種方式,數(shù)據(jù)的抽取很大程度受到了數(shù)據(jù)源的影響,不同的數(shù)據(jù)庫(kù)需要開發(fā)不同的數(shù)據(jù)抽取程序,同一數(shù)據(jù)源需要考慮能夠靈活增加數(shù)據(jù)抽取的對(duì)象。數(shù)據(jù)轉(zhuǎn)換/清洗模塊,在ODS中主要是數(shù)據(jù)的標(biāo)準(zhǔn)化轉(zhuǎn)換,包括數(shù)據(jù)類型標(biāo)準(zhǔn)化、公共代碼標(biāo)準(zhǔn)化、數(shù)據(jù)映射轉(zhuǎn)換等,同時(shí)
7、需要考慮非法數(shù)據(jù)的清洗、檢核處理,該模塊包括文件中轉(zhuǎn)換清洗以及數(shù)據(jù)庫(kù)中轉(zhuǎn)換清洗兩種方式。數(shù)據(jù)裝載模塊,是整個(gè)ETL過程的效率瓶頸,這一部分可以利用數(shù)據(jù)庫(kù)的工具,例如ORACLE的sqlldr工具或者ORACLE 10g的數(shù)據(jù)泵,如何捕獲數(shù)據(jù)庫(kù)工具的異常是利用數(shù)據(jù)庫(kù)工具的關(guān)鍵。數(shù)據(jù)統(tǒng)計(jì)管理模塊,主要對(duì)ETL作業(yè)的監(jiān)控以及數(shù)據(jù)流的監(jiān)控,包括ETL各模塊作業(yè)處理的過程、結(jié)果,以及數(shù)據(jù)的完整性監(jiān)控等。3元數(shù)據(jù)管理,ETL過程需要通過元數(shù)據(jù)的管理來實(shí)現(xiàn)數(shù)據(jù)流程的監(jiān)控以及作業(yè)的靈活調(diào)度。需要定義:源數(shù)據(jù)結(jié)構(gòu)、目標(biāo)數(shù)據(jù)結(jié)構(gòu)、源和目標(biāo)的映射(包括定制映射的方案、定制映射調(diào)用的函數(shù)、定制清洗的方案)、作業(yè)處理日
8、志以及作業(yè)依賴關(guān)系。4異常處理,ETL異常主要包括:硬件、操作系統(tǒng)、網(wǎng)絡(luò)導(dǎo)致異常;數(shù)據(jù)源數(shù)據(jù)傳輸、質(zhì)量導(dǎo)致異常;ETL過程處理導(dǎo)致異常;目標(biāo)數(shù)據(jù)模型導(dǎo)致異常;人工干預(yù)導(dǎo)致異常等;處理方法包括:手工干預(yù),重新調(diào)整ETL過程;終止流程,通知管理員;拒絕數(shù)據(jù),記錄原因;清洗數(shù)據(jù),部分入庫(kù);監(jiān)控資源,反復(fù)嘗試。5作業(yè)調(diào)度、監(jiān)控,根據(jù)作業(yè)依賴關(guān)系的元數(shù)據(jù)進(jìn)行ETL作業(yè)的調(diào)度,并對(duì)執(zhí)行過程進(jìn)行監(jiān)控。作業(yè)調(diào)度需要包括以下功能:靈活啟停作業(yè);根據(jù)日期規(guī)則設(shè)置作業(yè)執(zhí)行計(jì)劃;支持作業(yè)的并發(fā)執(zhí)行;允許作業(yè)網(wǎng)絡(luò)的嵌套;方便新增ETL作業(yè)。作業(yè)的監(jiān)控需要包括以下功能:監(jiān)控作業(yè)的當(dāng)前執(zhí)行情況;查詢作業(yè)歷史執(zhí)行情況。6其他考慮。job粒度:一個(gè)大的數(shù)據(jù)流動(dòng)才定為一個(gè)job,比如從接口到表,雖然經(jīng)過了轉(zhuǎn)換、清洗、裝載,但這個(gè)步驟都只為一個(gè)目的服務(wù):將數(shù)據(jù)從接口裝入到表,因此可以定為一個(gè)job,而不是象常見的ETL工具,定為3個(gè)job,否則就割裂了之間的聯(lián)系,不便于描述數(shù)據(jù)流向。數(shù)據(jù)流圖:能夠結(jié)合元數(shù)據(jù)管理,對(duì)ETL過程的數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 文化活動(dòng)策劃方案范文
- 現(xiàn)代企業(yè)如何依賴云平臺(tái)優(yōu)化數(shù)據(jù)審核流程
- 游戲類直播平臺(tái)的用戶行為分析與優(yōu)化策略研究
- 現(xiàn)代舞臺(tái)背景屏技術(shù)革新與發(fā)展
- 環(huán)保材料在辦公環(huán)境建設(shè)中的應(yīng)用
- 生產(chǎn)過程中的危機(jī)應(yīng)對(duì)與風(fēng)險(xiǎn)化解
- 未來十年電動(dòng)汽車市場(chǎng)預(yù)測(cè)與展望
- 生態(tài)系統(tǒng)服務(wù)在商業(yè)地產(chǎn)開發(fā)中的應(yīng)用
- 現(xiàn)代網(wǎng)絡(luò)技術(shù)企業(yè)管理的重要支撐
- 18《書湖陰先生壁》說課稿-2024-2025學(xué)年統(tǒng)編版語(yǔ)文六年級(jí)上冊(cè)
- (正式版)HGT 22820-2024 化工安全儀表系統(tǒng)工程設(shè)計(jì)規(guī)范
- 養(yǎng)老護(hù)理員培訓(xùn)老年人日常生活照料
- 黑龍江省哈爾濱市八年級(jí)(下)期末化學(xué)試卷
- 各種抽油泵的結(jié)構(gòu)及工作原理幻燈片
- 學(xué)習(xí)弘揚(yáng)雷鋒精神主題班會(huì)PPT雷鋒精神我傳承爭(zhēng)當(dāng)時(shí)代好少年P(guān)PT課件(帶內(nèi)容)
- 社區(qū)獲得性肺炎的護(hù)理查房
- 體育賽事策劃與管理第八章體育賽事的利益相關(guān)者管理課件
- 專題7閱讀理解之文化藝術(shù)類-備戰(zhàn)205高考英語(yǔ)6年真題分項(xiàng)版精解精析原卷
- 《生物資源評(píng)估》剩余產(chǎn)量模型
- 2022年廣東省10月自考藝術(shù)概論00504試題及答案
- 隧道二襯承包合同參考
評(píng)論
0/150
提交評(píng)論