云平臺(tái)數(shù)據(jù)治理項(xiàng)目技術(shù)方案_第1頁
云平臺(tái)數(shù)據(jù)治理項(xiàng)目技術(shù)方案_第2頁
云平臺(tái)數(shù)據(jù)治理項(xiàng)目技術(shù)方案_第3頁
云平臺(tái)數(shù)據(jù)治理項(xiàng)目技術(shù)方案_第4頁
云平臺(tái)數(shù)據(jù)治理項(xiàng)目技術(shù)方案_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、52/52云平臺(tái)數(shù)據(jù)治理項(xiàng)目技術(shù)方案目 錄 TOC o 1-4 h z u 第1章 整體方案 PAGEREF _Toc41230706 h 41.1 項(xiàng)目需求理解方案 PAGEREF _Toc41230707 h 41.1.1 項(xiàng)目背景 PAGEREF _Toc41230708 h 41.1.2 項(xiàng)目概述 PAGEREF _Toc41230709 h 41.1.2.1 項(xiàng)目現(xiàn)狀 PAGEREF _Toc41230710 h 41.1.2.2 項(xiàng)目目標(biāo) PAGEREF _Toc41230711 h 61.1.2.3 項(xiàng)目?jī)?nèi)容 PAGEREF _Toc41230712 h 71.2 總體設(shè)計(jì)方案

2、PAGEREF _Toc41230713 h 81.2.1 總體定位及目標(biāo) PAGEREF _Toc41230714 h 81.2.2 設(shè)計(jì)原則及約束 PAGEREF _Toc41230715 h 91.2.2.1 總體設(shè)計(jì)原則 PAGEREF _Toc41230716 h 91.2.2.2 總體設(shè)計(jì)約束 PAGEREF _Toc41230717 h 101.2.3 總體應(yīng)用架構(gòu)設(shè)計(jì) PAGEREF _Toc41230718 h 111.2.4 總體數(shù)據(jù)架構(gòu)設(shè)計(jì) PAGEREF _Toc41230719 h 121.2.4.1 數(shù)據(jù)框架設(shè)計(jì) PAGEREF _Toc41230720 h 131

3、.2.4.2 數(shù)據(jù)框架細(xì)化設(shè)計(jì) PAGEREF _Toc41230721 h 141.3 數(shù)據(jù)治理方案 PAGEREF _Toc41230722 h 161.3.1 概述 PAGEREF _Toc41230723 h 161.3.2 數(shù)據(jù)管理制度與機(jī)制 PAGEREF _Toc41230724 h 161.3.3 數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范建設(shè) PAGEREF _Toc41230725 h 171.3.3.1 一致性維度標(biāo)準(zhǔn) PAGEREF _Toc41230726 h 191.3.3.2 基礎(chǔ)數(shù)據(jù)項(xiàng)體系標(biāo)準(zhǔn) PAGEREF _Toc41230727 h 191.3.4 元數(shù)據(jù)管理 PAGEREF _To

4、c41230728 h 221.3.4.1 元數(shù)據(jù)管理總體分析 PAGEREF _Toc41230729 h 221.3.4.2 元數(shù)據(jù)管理設(shè)計(jì) PAGEREF _Toc41230730 h 271.3.5 數(shù)據(jù)質(zhì)量管理 PAGEREF _Toc41230731 h 301.3.5.1 數(shù)據(jù)質(zhì)量管理總體分析 PAGEREF _Toc41230732 h 311.3.5.2 數(shù)據(jù)質(zhì)量管理設(shè)計(jì) PAGEREF _Toc41230733 h 321.3.6 數(shù)據(jù)生命周期管理 PAGEREF _Toc41230734 h 351.3.6.1 數(shù)據(jù)生命周期總體分析 PAGEREF _Toc4123073

5、5 h 361.3.6.2 數(shù)據(jù)生命周期管理設(shè)計(jì) PAGEREF _Toc41230736 h 411.3.7 數(shù)據(jù)歸集 PAGEREF _Toc41230737 h 441.3.7.1 數(shù)據(jù)歸集流程設(shè)計(jì) PAGEREF _Toc41230738 h 441.3.7.2 數(shù)據(jù)歸集方法設(shè)計(jì) PAGEREF _Toc41230739 h 451.3.8 數(shù)據(jù)資產(chǎn)管理 PAGEREF _Toc41230740 h 461.3.8.1 數(shù)據(jù)資產(chǎn)分類 PAGEREF _Toc41230741 h 471.3.8.2 數(shù)據(jù)資產(chǎn)盤點(diǎn) PAGEREF _Toc41230742 h 471.3.8.3 數(shù)據(jù)質(zhì)量

6、評(píng)估 PAGEREF _Toc41230743 h 471.3.8.4 數(shù)據(jù)資產(chǎn)使用情況監(jiān)控 PAGEREF _Toc41230744 h 471.3.9 數(shù)據(jù)安全管理 PAGEREF _Toc41230745 h 481.3.9.1 安全管控機(jī)制建設(shè) PAGEREF _Toc41230746 h 481.3.9.2 數(shù)據(jù)訪問權(quán)限管理 PAGEREF _Toc41230747 h 491.3.9.3 數(shù)據(jù)分級(jí)分類管理 PAGEREF _Toc41230748 h 491.3.9.4 數(shù)據(jù)脫敏管理 PAGEREF _Toc41230749 h 491.3.9.5 數(shù)據(jù)安全審計(jì) PAGEREF _

7、Toc41230750 h 49整體方案項(xiàng)目需求理解方案項(xiàng)目背景云平臺(tái)數(shù)據(jù)管理項(xiàng)目基于大數(shù)據(jù)技術(shù)和理念,以云平臺(tái)為基礎(chǔ),集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需求主體提供更為全面豐富的決策和參考支持,構(gòu)建開放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。項(xiàng)目自開工建設(shè)以來,始終以“用數(shù)據(jù)服務(wù)征管方式轉(zhuǎn)變”為建設(shè)主線,在大數(shù)據(jù)算法應(yīng)用、海量用戶支持、關(guān)系云圖、風(fēng)險(xiǎn)動(dòng)態(tài)積分、用戶畫像等方面進(jìn)行了積極探索、實(shí)踐,出色完成了設(shè)定任務(wù),達(dá)到了預(yù)期效果。目前,云平臺(tái)數(shù)據(jù)管理項(xiàng)目已從驗(yàn)證階段轉(zhuǎn)為生產(chǎn)應(yīng)用階段,實(shí)現(xiàn)了以數(shù)據(jù)為中心,以技術(shù)基礎(chǔ)平臺(tái)為依托,以分析類應(yīng)用實(shí)現(xiàn)為目標(biāo),涵蓋數(shù)據(jù)“采、存、通、用”全生命周期

8、的一體化生態(tài)系統(tǒng),是大數(shù)據(jù)、互聯(lián)網(wǎng)、云計(jì)算等理念、方法論、技術(shù)手段和解決方案的集成展現(xiàn)。在云平臺(tái)數(shù)據(jù)管理項(xiàng)目建設(shè)完成的基礎(chǔ)上,總局云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)工作的主要任務(wù)是:以云平臺(tái)數(shù)據(jù)管理項(xiàng)目建設(shè)內(nèi)容為基礎(chǔ),做好現(xiàn)有硬、軟件運(yùn)行維護(hù)與優(yōu)化升級(jí);進(jìn)一步拓寬數(shù)據(jù)集成范圍、拓展數(shù)據(jù)應(yīng)用、深度挖掘數(shù)據(jù)價(jià)值;根據(jù)機(jī)構(gòu)改革后云平臺(tái)數(shù)據(jù)管理工作的新內(nèi)容、新要求,對(duì)數(shù)據(jù)層、應(yīng)用層進(jìn)行調(diào)整、優(yōu)化,保障云平臺(tái)平穩(wěn)運(yùn)行;有力加強(qiáng)數(shù)據(jù)治理、提高數(shù)據(jù)質(zhì)量,滿足當(dāng)前數(shù)據(jù)管理工作需要,支撐各類型數(shù)據(jù)應(yīng)用工作需求,助力推動(dòng)征管模式變革和各項(xiàng)稅收政策改革,最終形成推動(dòng)數(shù)據(jù)管理思維變化,營(yíng)造良好稅收數(shù)據(jù)生態(tài)

9、。項(xiàng)目概述項(xiàng)目現(xiàn)狀云平臺(tái)數(shù)據(jù)管理項(xiàng)目以云平臺(tái)為基礎(chǔ),以云服務(wù)器軟件、負(fù)載均衡軟件SLB、對(duì)象存儲(chǔ)軟件OSS、大數(shù)據(jù)計(jì)算服務(wù)軟件ODPS、數(shù)據(jù)可視化引擎DataV等18款大數(shù)據(jù)產(chǎn)品為依托,構(gòu)建了以數(shù)據(jù)治理為核心、以一體化云平臺(tái)為載體、滿足各類用戶需求的稅收大數(shù)據(jù)平臺(tái)。主要完成平臺(tái)層、數(shù)據(jù)層、應(yīng)用層的建設(shè):1.平臺(tái)層建設(shè)。主要包括計(jì)算存儲(chǔ)和網(wǎng)絡(luò)設(shè)備、系統(tǒng)軟件工具集、安全及運(yùn)維監(jiān)控管理的建設(shè),從硬件和技術(shù)層面有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用需求的矛盾,搭建靈活、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù)云環(huán)境,并構(gòu)建完整的三層服務(wù)模式。通過建設(shè)IaaS層,為全國(guó)數(shù)據(jù)大集中環(huán)境提供包括CPU

10、、內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)、操作系統(tǒng)等基礎(chǔ)設(shè)施資源,提高資源的利用率,降低采購(gòu)成本;通過建設(shè)PaaS平臺(tái),基于IaaS提供的能力,以服務(wù)的方式提供計(jì)算平臺(tái)和軟件組合,為最終用戶提供云環(huán)境下的應(yīng)用開發(fā)、部署和運(yùn)行平臺(tái),解決應(yīng)用軟件開發(fā)的規(guī)范化問題,降低系統(tǒng)運(yùn)行維護(hù)成本;通過建設(shè)SaaS層,全國(guó)數(shù)據(jù)大集中環(huán)境為總局、省局、納稅人、相關(guān)部門提供個(gè)性化的數(shù)據(jù)服務(wù)。2.數(shù)據(jù)層建設(shè)。通過構(gòu)建數(shù)據(jù)治理體系和開展數(shù)據(jù)分析處理,將云平臺(tái)和工程規(guī)劃范圍內(nèi)的其他數(shù)據(jù)平臺(tái)集于一體,使金三生產(chǎn)系統(tǒng)數(shù)據(jù)、總局保留軟件數(shù)據(jù)和多來源的外部交換數(shù)據(jù)相互貫通,實(shí)現(xiàn)各類數(shù)據(jù)的集中定義和管理,為建立統(tǒng)一數(shù)據(jù)視圖、數(shù)據(jù)集市、各類分析業(yè)務(wù)的定義

11、、指標(biāo)和規(guī)則定義以及數(shù)據(jù)集成定義提供語義基礎(chǔ),同時(shí)提供對(duì)各類數(shù)據(jù)的審核管理和維護(hù)機(jī)制,維護(hù)數(shù)據(jù)的完整性、準(zhǔn)確性以及一致性,實(shí)現(xiàn)數(shù)據(jù)生命周期管理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)審計(jì)等各項(xiàng)功能。通過數(shù)據(jù)治理過程,使得數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)質(zhì)量都能夠得到持續(xù)的提升,保證數(shù)據(jù)資產(chǎn)的長(zhǎng)久價(jià)值。(1)基礎(chǔ)層完成了對(duì)稅務(wù)數(shù)據(jù)、外部數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)三類數(shù)據(jù)的集成,共集成了六千余張表,同時(shí)完成了數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化以及非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)結(jié)構(gòu)化數(shù)據(jù)等操作。(2)中間層完成了四大主題庫和標(biāo)簽體系的建設(shè)。四大主題庫分別是:組織庫(法人和法人分支機(jī)構(gòu)),涉及模型近200個(gè);自然人庫,涉及模型近百個(gè);稅務(wù)機(jī)關(guān)庫,涉及模型近200個(gè);關(guān)系

12、庫(單位納稅人之間、單位納稅人與自然人之間),涉及模型幾十個(gè)。同時(shí)構(gòu)建了企業(yè)、自然人、稅務(wù)機(jī)關(guān)標(biāo)簽體系,包含:企業(yè)標(biāo)簽(一般納稅人標(biāo)簽、小規(guī)模納稅人標(biāo)簽、千戶集團(tuán)標(biāo)簽)、自然人標(biāo)簽、稅務(wù)機(jī)關(guān)標(biāo)簽。(3)模型層完成了面向應(yīng)用的數(shù)據(jù)模型構(gòu)建。在建設(shè)模型層的過程中,以構(gòu)建面向應(yīng)用類數(shù)據(jù)模型和構(gòu)建分析挖掘類分析模型為原則,基于稅收動(dòng)態(tài)監(jiān)控、票流分析、關(guān)系云圖、增值稅發(fā)票查詢分析系統(tǒng)等應(yīng)用共設(shè)計(jì)數(shù)百個(gè)數(shù)據(jù)模型,上千個(gè)指標(biāo)口徑。3.應(yīng)用層建設(shè)?;谌珓?wù)數(shù)據(jù),建立多層次、多類型、多渠道的數(shù)據(jù)服務(wù)體系,為總局各司局和省局不同類型用戶提供多維數(shù)據(jù)服務(wù),滿足各級(jí)稅務(wù)機(jī)關(guān)在決策、管理、執(zhí)行、研究等方面的工作需求。應(yīng)

13、用層前期建設(shè)立足于稅收業(yè)務(wù)特點(diǎn)、現(xiàn)狀和需求狀況,重點(diǎn)選取部分應(yīng)用進(jìn)行驗(yàn)證性和示范性開發(fā)。已開發(fā)用戶畫像、票流分析、納稅人關(guān)系云圖、納稅人關(guān)系分析、增值稅發(fā)票查詢分析系統(tǒng)、風(fēng)險(xiǎn)情報(bào)系統(tǒng)、單管戶查詢、企業(yè)信息自助查詢、數(shù)據(jù)資源需求管理、數(shù)據(jù)質(zhì)效考核、稅收動(dòng)態(tài)監(jiān)控大屏版、稅收動(dòng)態(tài)監(jiān)控桌面版、云平臺(tái)訪問監(jiān)控以及涉稅專業(yè)服務(wù)動(dòng)態(tài)監(jiān)控等應(yīng)用。4. 數(shù)據(jù)治理工作主要從五個(gè)方面開展:元數(shù)據(jù)管理、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全管理。在數(shù)據(jù)標(biāo)準(zhǔn)方面繼承了國(guó)家標(biāo)準(zhǔn)化內(nèi)容,把控?cái)?shù)據(jù)建設(shè)標(biāo)準(zhǔn)。同時(shí)結(jié)合業(yè)務(wù)需要積累并整理了核心征管系統(tǒng)業(yè)務(wù)表單和物理表的對(duì)照關(guān)系,形成了包含:核心征管系統(tǒng)、個(gè)稅系統(tǒng)、防偽

14、稅控系統(tǒng)、外部交換系統(tǒng)、出口退稅系統(tǒng)等業(yè)務(wù)系統(tǒng)的數(shù)據(jù)字典。在數(shù)據(jù)質(zhì)量方面制定數(shù)據(jù)質(zhì)量規(guī)則指標(biāo)二百多項(xiàng),推動(dòng)全國(guó)數(shù)據(jù)質(zhì)量持續(xù)優(yōu)化。5.數(shù)據(jù)服務(wù)云平臺(tái)數(shù)據(jù)管理項(xiàng)目運(yùn)行一年以來,為總局多個(gè)業(yè)務(wù)司局提供數(shù)據(jù)加工服務(wù);承接總局稽查局的選案工作;承接納稅服務(wù)司納稅信用等級(jí)評(píng)定指標(biāo)調(diào)整測(cè)算工作,為信用評(píng)價(jià)指標(biāo)調(diào)整提供數(shù)據(jù)依據(jù)等;開展新辦企業(yè)預(yù)警模型、非正常戶預(yù)警模型、進(jìn)銷不匹配模型等指標(biāo)設(shè)計(jì)測(cè)算工作。項(xiàng)目目標(biāo)本項(xiàng)目旨在根據(jù)業(yè)務(wù)需求,對(duì)平臺(tái)層、數(shù)據(jù)層、應(yīng)用層實(shí)施有效的運(yùn)行維護(hù),完成云平臺(tái)整體升級(jí)優(yōu)化完善,并根據(jù)機(jī)構(gòu)改革要求及進(jìn)程完成云平臺(tái)調(diào)整優(yōu)化各項(xiàng)工作,保障云平臺(tái)平穩(wěn)運(yùn)行。1.做好云平臺(tái)數(shù)據(jù)管理項(xiàng)目升級(jí)完善

15、工作,包括:基于云平臺(tái)開發(fā)、開放更多數(shù)據(jù)應(yīng)用,豐富優(yōu)化云平臺(tái)的現(xiàn)有功能應(yīng)用場(chǎng)景,創(chuàng)新應(yīng)用功能,提升云平臺(tái)數(shù)據(jù)管理項(xiàng)目的應(yīng)用價(jià)值和潛能等內(nèi)容。根據(jù)國(guó)家與各省局需要,做好云平臺(tái)應(yīng)用的增加及數(shù)據(jù)開放范圍的擴(kuò)大工作。對(duì)各司局的遷移軟件,做好技術(shù)及軟件方面的對(duì)接工作,滿足其數(shù)據(jù)庫創(chuàng)建、擴(kuò)容、變更等需求。2.做好云平臺(tái)數(shù)據(jù)管理項(xiàng)目的運(yùn)行維護(hù)與數(shù)據(jù)治理工作,包括應(yīng)用系統(tǒng)日常巡檢和監(jiān)控、故障綜合分析及應(yīng)急處理、性能持續(xù)優(yōu)化等服務(wù),以保障云平臺(tái)數(shù)據(jù)管理項(xiàng)目平穩(wěn)運(yùn)行。對(duì)云平臺(tái)的硬件擴(kuò)容提供相應(yīng)的技術(shù)支持,做好對(duì)機(jī)器的版本升級(jí)和應(yīng)用的性能測(cè)試等工作,保障數(shù)據(jù)處理和各類應(yīng)用能夠正常適應(yīng)新的硬件平臺(tái)。按照關(guān)于數(shù)據(jù)治理組

16、織機(jī)構(gòu)、流程制度以及配套支撐工具等要求,做好元數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型,數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全等工作,強(qiáng)化數(shù)據(jù)治理能力,提高數(shù)據(jù)管理水平,確保整體數(shù)據(jù)環(huán)境可靠、高效、安全,有力支撐征管改革和稅制改革。3.做好機(jī)構(gòu)改革涉及云平臺(tái)調(diào)整優(yōu)化工作,根據(jù)國(guó)家制定的國(guó)合并改革方案,在完成金三系統(tǒng)合并、調(diào)整與地方稅費(fèi)全國(guó)集成基礎(chǔ)上,完成云平臺(tái)數(shù)據(jù)層、應(yīng)用層的相應(yīng)調(diào)整優(yōu)化與功能開發(fā)工作,以保障數(shù)據(jù)及時(shí)、準(zhǔn)確集成至云平臺(tái),并按照最新的需求展示和供應(yīng)數(shù)據(jù)。項(xiàng)目?jī)?nèi)容云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)工作,重點(diǎn)需要完成對(duì)云平臺(tái)數(shù)據(jù)管理項(xiàng)目的運(yùn)行維護(hù)、對(duì)已有功能的優(yōu)化完善及新增數(shù)據(jù)需求、應(yīng)用功能的處理與設(shè)計(jì)

17、開發(fā)以及機(jī)構(gòu)改革涉及云平臺(tái)調(diào)整優(yōu)化有關(guān)工作。重點(diǎn)包括但不限于以下內(nèi)容:云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)項(xiàng)目是在云平臺(tái)數(shù)據(jù)管理項(xiàng)目建設(shè)成果基礎(chǔ)上,做好云平臺(tái)數(shù)據(jù)管理升級(jí)完善及運(yùn)維工作與機(jī)構(gòu)改革涉及云平臺(tái)調(diào)整優(yōu)化工作兩項(xiàng)內(nèi)容:總體設(shè)計(jì)方案總體定位及目標(biāo)云平臺(tái)數(shù)據(jù)管理項(xiàng)目是工程第二階段的重要組成部分,項(xiàng)目基于目前最新的大數(shù)據(jù)處理技術(shù)手段和理念,借助金三全面上線的有利契機(jī),以大數(shù)據(jù)云平臺(tái)為基礎(chǔ),集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需求主體提供更為全面豐富的決策和參考支持,構(gòu)建開放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。項(xiàng)目定位集中體現(xiàn)了基礎(chǔ)性、創(chuàng)新性和示范性?;A(chǔ)性。一是構(gòu)建硬件基

18、礎(chǔ),通過搭建靈活的、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù)云環(huán)境,從硬件和技術(shù)層面有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用需求的矛盾。二是夯實(shí)管理基礎(chǔ),以打造成熟完善的數(shù)據(jù)治理體系為重點(diǎn),為保障數(shù)據(jù)資產(chǎn)質(zhì)量提供支撐。三是提供應(yīng)用基礎(chǔ),為各司局、省局自行開發(fā)應(yīng)用項(xiàng)目提供基礎(chǔ)數(shù)據(jù)和工具,鼓勵(lì)多樣性應(yīng)用開發(fā)。創(chuàng)新性。一是數(shù)據(jù)利用創(chuàng)新,遵循總體架構(gòu)要求,繼承前期建設(shè)成果,在保持四大應(yīng)用系統(tǒng)總體格局不變的情況下,實(shí)現(xiàn)數(shù)據(jù)全國(guó)大集中。二是管理思維創(chuàng)新,整合數(shù)據(jù)資源和管理資源,以統(tǒng)一平臺(tái)來解決之前總局各司局?jǐn)?shù)據(jù)利用各自為政、重復(fù)建設(shè)、標(biāo)準(zhǔn)不一致、成果不能共享等問題。三是服務(wù)模式創(chuàng)新,體現(xiàn)“眾包協(xié)助”要

19、求,以提供基礎(chǔ)數(shù)據(jù)服務(wù)為主,形成數(shù)據(jù)統(tǒng)一加工和應(yīng)用多樣開發(fā)結(jié)合的格局。示范性。為全國(guó)各省局?jǐn)?shù)據(jù)開發(fā)利用提供從硬件建設(shè)、數(shù)據(jù)治理和應(yīng)用開發(fā)的示范性模板,推進(jìn)全收數(shù)據(jù)利用水平提升。云平臺(tái)數(shù)據(jù)管理項(xiàng)目實(shí)現(xiàn)了稅收征管數(shù)據(jù)的全國(guó)集中和規(guī)范管理,為各級(jí)稅務(wù)機(jī)關(guān)提供了強(qiáng)大計(jì)算處理能力,有機(jī)整合大數(shù)據(jù)技術(shù),全面集成內(nèi)部數(shù)據(jù)、積極拓展外部數(shù)據(jù)、強(qiáng)化數(shù)據(jù)治理能力,實(shí)現(xiàn)了數(shù)據(jù)的過程監(jiān)控;建立了稅務(wù)數(shù)據(jù)的資產(chǎn)化管理模式,并以用戶為核心提供差異化的數(shù)據(jù)服務(wù),形成了開發(fā)協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。同時(shí),加強(qiáng)外部數(shù)據(jù)交換,實(shí)現(xiàn)了稅務(wù)數(shù)據(jù)與外部門數(shù)據(jù)的有效共享整合,為國(guó)家信息共享化建設(shè)提供了稅務(wù)方案。云平臺(tái)數(shù)據(jù)管理項(xiàng)目升級(jí)完善及

20、運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)項(xiàng)目以云平臺(tái)數(shù)據(jù)管理項(xiàng)目的建設(shè)內(nèi)容為基礎(chǔ),根據(jù)的業(yè)務(wù)需求和國(guó)合并工作要求,對(duì)平臺(tái)功能進(jìn)行持續(xù)性升級(jí)完善,集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,提升數(shù)據(jù)治理能力,為各需求主體提供更為全面豐富的決策和參考支持,并提供必要的基礎(chǔ)運(yùn)維,保障云平臺(tái)正常運(yùn)行。設(shè)計(jì)原則及約束總體設(shè)計(jì)原則大數(shù)據(jù)云平臺(tái)建設(shè)與開發(fā),需要協(xié)調(diào)“整體與局部、集中與分散、先進(jìn)與實(shí)用、近期與長(zhǎng)遠(yuǎn)、統(tǒng)一與個(gè)性”之間的矛盾,涉及到數(shù)據(jù)庫、數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理(OLAP)、數(shù)據(jù)挖掘等多技術(shù)、多學(xué)科的交叉,是一項(xiàng)復(fù)雜的工程。項(xiàng)目建設(shè)應(yīng)遵循“整體規(guī)劃、大膽創(chuàng)新、分步實(shí)施、統(tǒng)一規(guī)范”的總體原則,在總體規(guī)劃上要

21、體現(xiàn)體系化、規(guī)范化,在具體設(shè)計(jì)上體現(xiàn)前瞻性、創(chuàng)新性,在項(xiàng)目實(shí)施中分步驟、保重點(diǎn),按照工程計(jì)劃逐步實(shí)現(xiàn)建設(shè)目標(biāo)。大數(shù)據(jù)云平臺(tái)建設(shè)與開發(fā)應(yīng)滿足但不限于以下原則要求:實(shí)現(xiàn)結(jié)構(gòu)上穩(wěn)定、靈活、可擴(kuò)展底層的數(shù)據(jù)治理和上層應(yīng)用開發(fā)在架構(gòu)上保持松耦合。上層應(yīng)用可根據(jù)用戶需求不斷開發(fā)、優(yōu)化或調(diào)整,數(shù)據(jù)資源層提供標(biāo)準(zhǔn)化接口,以服務(wù)的形式封裝數(shù)據(jù),屏蔽底層物理數(shù)據(jù)庫信息和數(shù)據(jù)結(jié)構(gòu),增強(qiáng)系統(tǒng)靈活性,在充分滿足現(xiàn)有需求的基礎(chǔ)上兼顧后期發(fā)展,在相對(duì)穩(wěn)定的架構(gòu)下,選擇成熟的產(chǎn)品與技術(shù),滿足稅務(wù)未來(5年)業(yè)務(wù)需求及技術(shù)的發(fā)展變化。設(shè)計(jì)上開放、一致、安全在設(shè)計(jì)時(shí)從縱向、橫向、前向、后向多維互聯(lián)角度充分考慮,建立完整的數(shù)據(jù)管理

22、體系,遵守統(tǒng)一的數(shù)據(jù)源、統(tǒng)一的數(shù)據(jù)模型、統(tǒng)一的數(shù)據(jù)接口、統(tǒng)一的接口標(biāo)準(zhǔn)等原則,保障數(shù)據(jù)的一致性。同時(shí)兼顧系統(tǒng)的開放性,充分考慮各類應(yīng)用需求,包括大數(shù)據(jù)應(yīng)用、傳統(tǒng)數(shù)據(jù)應(yīng)用,涵蓋統(tǒng)計(jì)監(jiān)控、宏觀決策、微觀分析、公眾服務(wù)等。且不設(shè)置應(yīng)用總集成概念和實(shí)體,以利于各司局、部分省局及其他相關(guān)主體自主開發(fā)各類應(yīng)用。此外設(shè)計(jì)上也不局限于分析類應(yīng)用,可嘗試海量并發(fā)查詢類應(yīng)用等應(yīng)用模式。最終實(shí)現(xiàn)對(duì)敏感數(shù)據(jù)與應(yīng)用訪問的權(quán)限控制和軌跡跟蹤,加強(qiáng)核心數(shù)據(jù)的管控,確保系統(tǒng)數(shù)據(jù)安全。管理數(shù)據(jù)權(quán)限并實(shí)施數(shù)據(jù)訪問控制,針對(duì)各應(yīng)用系統(tǒng)組織實(shí)施安全審計(jì)。標(biāo)準(zhǔn)上規(guī)范、易懂、通用完善業(yè)務(wù)、技術(shù)、管理標(biāo)準(zhǔn)規(guī)范體系,包括制定和推廣總體標(biāo)準(zhǔn)、

23、信息系統(tǒng)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)和業(yè)務(wù)規(guī)范等,確保各類命名規(guī)范,業(yè)務(wù)規(guī)則定義,度量方式等的規(guī)范性和通用性,并使用統(tǒng)一的業(yè)務(wù)語言進(jìn)行描述,易于業(yè)務(wù)人員和技術(shù)人員的理解使用。同時(shí)建立配套的運(yùn)行維護(hù)和數(shù)據(jù)治理機(jī)制,保障系統(tǒng)的有機(jī)生命力,支撐業(yè)務(wù)發(fā)展的需要。用戶體驗(yàn)上友好、便利、易用基于SOA架構(gòu)開發(fā)數(shù)據(jù)應(yīng)用,在技術(shù)選擇上,充分利用云計(jì)算、大數(shù)據(jù)等前沿應(yīng)用技術(shù)的最新成果,借助云的靈活性,更好的滿足稅務(wù)行業(yè)可變業(yè)務(wù)的需求,借助云的敏捷性,更快的響應(yīng)業(yè)務(wù)要求,通過大數(shù)據(jù)提供的海量數(shù)據(jù)處理能力,更充分的挖掘稅收數(shù)據(jù)的價(jià)值。在業(yè)務(wù)展示上充分利用數(shù)據(jù)可視化新技術(shù),借助于圖形化手段,從不同的維度觀察數(shù)據(jù),從而對(duì)數(shù)據(jù)進(jìn)行更深

24、入的觀察和分析。在數(shù)據(jù)應(yīng)用集成層提供豐富的數(shù)據(jù)分析工具,支持模塊的拖拽和自由組合??傮w設(shè)計(jì)約束總體設(shè)計(jì)包括總體架構(gòu)設(shè)計(jì)和數(shù)據(jù)治理機(jī)制設(shè)計(jì)兩個(gè)部分。數(shù)據(jù)治理機(jī)制設(shè)計(jì)目標(biāo)根據(jù)數(shù)據(jù)本項(xiàng)目數(shù)據(jù)治理要求與約束,完成國(guó)家數(shù)據(jù)治理機(jī)制建設(shè)。設(shè)計(jì)要求數(shù)據(jù)治理涵蓋了人員,流程和技術(shù),是一系列改變數(shù)據(jù)使用行為的過程,它從根本上改變業(yè)務(wù)和信息技術(shù)的使用方法。在內(nèi)容上,要求實(shí)現(xiàn)元數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)管理和數(shù)據(jù)質(zhì)量管理三個(gè)方面的機(jī)制和流程建設(shè)。設(shè)計(jì)約束遵循本項(xiàng)目數(shù)據(jù)治理機(jī)制要求和約束??傮w應(yīng)用架構(gòu)設(shè)計(jì)根據(jù)招標(biāo)文件中要求,云平臺(tái)數(shù)據(jù)管理項(xiàng)目是以大數(shù)據(jù)云平臺(tái)為基礎(chǔ),集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需

25、求主體提供更為全面豐富的決策和參考支持,構(gòu)建開放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。主要包括平臺(tái)層建設(shè)、數(shù)據(jù)層建設(shè)和應(yīng)用層建設(shè)。云計(jì)算支撐平臺(tái):系統(tǒng)搭建靈活、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù)云環(huán)境,并構(gòu)建完整的三層服務(wù)模式,包括計(jì)算存儲(chǔ)和網(wǎng)絡(luò)設(shè)備、系統(tǒng)軟件工具集、安全及運(yùn)維監(jiān)控管理的建設(shè),從硬件和技術(shù)層面有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用需求的矛盾。大數(shù)據(jù)支撐平臺(tái):大數(shù)據(jù)支撐平臺(tái)是用于各項(xiàng)數(shù)據(jù)相關(guān)工作的云計(jì)算產(chǎn)品和大數(shù)據(jù)工具軟件集合,利用現(xiàn)有或者采購(gòu)的相關(guān)軟件產(chǎn)品,構(gòu)建數(shù)據(jù)治理體系和開展數(shù)據(jù)分析處理,將大數(shù)據(jù)云平臺(tái)和工程規(guī)劃范圍內(nèi)的其他數(shù)據(jù)平臺(tái)集于一體,使的金三生產(chǎn)系統(tǒng)數(shù)據(jù)、總局保留軟件

26、數(shù)據(jù)和多來源的外部交換數(shù)據(jù)相互貫通,持續(xù)提升數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)質(zhì)量,實(shí)現(xiàn)數(shù)據(jù)“好用、足用”的目標(biāo)。應(yīng)用平臺(tái)層:在全收數(shù)據(jù)大集中和外部數(shù)據(jù)擴(kuò)展基礎(chǔ)上,為總局和各司局及部分省局提供方式靈活、內(nèi)容豐富的自主應(yīng)用開發(fā)的平臺(tái)。本項(xiàng)目實(shí)現(xiàn)主體畫像、全國(guó)視角的納稅人遵從分析和稅收動(dòng)態(tài)展示3類驗(yàn)證和示范應(yīng)用。 總體數(shù)據(jù)架構(gòu)設(shè)計(jì)根據(jù)總局?jǐn)?shù)據(jù)層平臺(tái)的要求,我們將需求細(xì)分為數(shù)據(jù)集成、數(shù)據(jù)治理、主體匯總、數(shù)據(jù)應(yīng)用等4個(gè)技術(shù)支撐平臺(tái),以承擔(dān)所有數(shù)據(jù)活動(dòng)涉及的數(shù)據(jù)獲取、模型組織、信息加工、質(zhì)量管理、結(jié)果展現(xiàn)等處理功能。數(shù)據(jù)框架設(shè)計(jì)1 數(shù)據(jù)集成負(fù)責(zé)數(shù)據(jù)集成,通過調(diào)度控制和規(guī)則管理實(shí)現(xiàn)對(duì)數(shù)據(jù)集成的任務(wù)管理,數(shù)據(jù)集成平

27、臺(tái)將源數(shù)據(jù)(核心征管、電子稅務(wù)、出口退稅、外部數(shù)據(jù)等)通過ETL/數(shù)據(jù)復(fù)制的數(shù)據(jù)加工、清洗、轉(zhuǎn)換,完成從源數(shù)據(jù)數(shù)據(jù)準(zhǔn)備區(qū)統(tǒng)一數(shù)據(jù)視圖。加工中出現(xiàn)的錯(cuò)誤預(yù)警提交給數(shù)據(jù)治理平臺(tái)的數(shù)據(jù)質(zhì)量管理應(yīng)用。2 數(shù)據(jù)匯聚匯聚數(shù)據(jù)是將基礎(chǔ)數(shù)據(jù)區(qū)的數(shù)據(jù)按照納稅人、業(yè)務(wù)日期、業(yè)務(wù)狀態(tài)等維度進(jìn)行的輕度匯總的事實(shí)表和事實(shí)表關(guān)聯(lián)的維度表。3 數(shù)據(jù)應(yīng)用由查詢統(tǒng)計(jì)、征管狀況分析、報(bào)表管理、風(fēng)險(xiǎn)管理、政策評(píng)估、績(jī)效管理、知識(shí)管理、稅收收入核算分析系統(tǒng)、電子檔案管理等部分和日常應(yīng)用管理組成。本包負(fù)責(zé):查詢統(tǒng)計(jì)、征管狀況分析、報(bào)表管理、稅收收入核算分析系統(tǒng)、電子檔案管理的建設(shè)和大數(shù)據(jù)平臺(tái)的日常應(yīng)用管理建設(shè)。4 數(shù)據(jù)治理負(fù)責(zé)環(huán)境的數(shù)

28、據(jù)治理,它是結(jié)合數(shù)據(jù)治理相關(guān)的組織、制度和流程和數(shù)據(jù)標(biāo)準(zhǔn)完成對(duì)數(shù)據(jù)的治理,治理內(nèi)容包括:數(shù)據(jù)質(zhì)量的管理、元數(shù)據(jù)的管理、數(shù)據(jù)生命周期的管理、以及數(shù)據(jù)審計(jì)管理等。數(shù)據(jù)框架細(xì)化設(shè)計(jì)1、基礎(chǔ)數(shù)據(jù)層基于目前總局?jǐn)?shù)據(jù)狀況,數(shù)據(jù)采集的源頭主要包含:各類稅收業(yè)務(wù)系統(tǒng)數(shù)據(jù)、外部交換數(shù)據(jù)、互聯(lián)網(wǎng)開放數(shù)據(jù)。稅收業(yè)務(wù)系統(tǒng):稅收業(yè)務(wù)系統(tǒng)是本次數(shù)據(jù)體系中最主要的數(shù)據(jù)源頭,稅務(wù)業(yè)務(wù)相關(guān)的數(shù)據(jù)主要從這些系統(tǒng)中獲取。核心征管系統(tǒng)數(shù)據(jù)覆蓋13個(gè)業(yè)務(wù)域的業(yè)務(wù)數(shù)據(jù),同時(shí)發(fā)票數(shù)據(jù)和出口退稅數(shù)據(jù)雖然系統(tǒng)還沒有統(tǒng)一,但是會(huì)統(tǒng)一采集到核心征管數(shù)據(jù)體系內(nèi)。交換數(shù)據(jù):交換數(shù)據(jù)分為兩個(gè)部分,總局統(tǒng)一交換數(shù)據(jù)和各省局交換數(shù)據(jù)。在基礎(chǔ)數(shù)據(jù)層會(huì)單獨(dú)規(guī)劃

29、交換數(shù)據(jù)域,統(tǒng)一規(guī)劃數(shù)據(jù)交換模型,將總局交換數(shù)據(jù)中數(shù)據(jù)價(jià)值度高、數(shù)據(jù)質(zhì)量高、數(shù)據(jù)穩(wěn)定性好的數(shù)據(jù)和選取幾個(gè)省局的交換數(shù)據(jù),合并數(shù)據(jù)結(jié)構(gòu),采集到統(tǒng)一的數(shù)據(jù)交換域?;ヂ?lián)網(wǎng)數(shù)據(jù):互聯(lián)網(wǎng)是一個(gè)開放式的數(shù)據(jù)源,在本次數(shù)據(jù)體系和應(yīng)用的建設(shè)中,需要依賴互聯(lián)網(wǎng)的開放數(shù)據(jù)作為應(yīng)用的基礎(chǔ)數(shù)據(jù),參與稅務(wù)數(shù)據(jù)價(jià)值挖掘過程中?;ヂ?lián)網(wǎng)的數(shù)據(jù)獲取會(huì)利用平臺(tái)的爬蟲工具,定向的獲取互聯(lián)網(wǎng)數(shù)據(jù)。本次需要建設(shè)互聯(lián)網(wǎng)爬數(shù)的平臺(tái),能夠滿足甲方不斷增加數(shù)據(jù)源,調(diào)整數(shù)據(jù)爬取深度的要求,滿足爬取數(shù)據(jù)從非結(jié)構(gòu)化到結(jié)構(gòu)化存儲(chǔ)的要求;2、數(shù)據(jù)中間層數(shù)據(jù)中間層的建設(shè)主要的目的是將采集和整理后的基礎(chǔ)數(shù)據(jù),以某個(gè)主體或者關(guān)系,將數(shù)據(jù)聯(lián)系起來。設(shè)計(jì)擴(kuò)展性強(qiáng)

30、的數(shù)據(jù)模型,隨著原始業(yè)務(wù)數(shù)據(jù)的逐步豐富,不停豐富主體的描述、行為及管理類的數(shù)據(jù)。 數(shù)據(jù)中間層在整個(gè)數(shù)據(jù)體系建設(shè)中起到通的作用,以主體維度聯(lián)通各種來源數(shù)據(jù)。聯(lián)通后的中間層數(shù)據(jù),將提供給下游模型和挖掘應(yīng)用更豐富、更標(biāo)準(zhǔn)、更易用的生產(chǎn)原料??偩执髷?shù)據(jù)云平臺(tái)將具有強(qiáng)大得數(shù)據(jù)計(jì)算和存儲(chǔ)能力?;谄脚_(tái)的能力和互聯(lián)網(wǎng)數(shù)據(jù)建設(shè)的設(shè)計(jì)思路,在數(shù)據(jù)中間層的建設(shè)中不會(huì)做復(fù)雜的業(yè)務(wù)邏輯加工,保留業(yè)務(wù)的事實(shí)明細(xì)數(shù)據(jù)。增強(qiáng)數(shù)據(jù)中間層的擴(kuò)展性和復(fù)用性,業(yè)務(wù)邏輯的加工放在應(yīng)用和挖掘?qū)油瓿伞_@樣會(huì)壓縮整個(gè)數(shù)據(jù)處理的過程,同時(shí)有利于數(shù)據(jù)口徑的統(tǒng)一和數(shù)據(jù)質(zhì)量的控制?;谀壳翱偩謱?duì)于大數(shù)據(jù)應(yīng)用的要求,本次數(shù)據(jù)中間層的建設(shè)將著重三個(gè)主

31、體庫的建設(shè):企業(yè)庫、自然人庫、關(guān)系庫。3 數(shù)據(jù)挖掘?qū)訑?shù)據(jù)挖掘是指利用打通后的數(shù)據(jù),針對(duì)需要數(shù)據(jù)支撐的業(yè)務(wù),進(jìn)行數(shù)據(jù)模型的建設(shè)和數(shù)據(jù)價(jià)值的挖掘?;诒敬卧破脚_(tái)數(shù)據(jù)管理項(xiàng)目的業(yè)務(wù)需求,數(shù)據(jù)模型和挖掘?qū)鞴芊治瞿P?、企業(yè)風(fēng)險(xiǎn)控制模型、個(gè)人風(fēng)險(xiǎn)控制模型、企業(yè)標(biāo)簽體系模型、自然人標(biāo)簽體系模型。征管分析模型:基于目前總局對(duì)于征管工作所規(guī)劃的指標(biāo)體系,提煉出當(dāng)前業(yè)務(wù)狀態(tài)下最關(guān)鍵和重要的指標(biāo),對(duì)這些指標(biāo)進(jìn)行數(shù)據(jù)建模,每日生產(chǎn)出數(shù)據(jù)指標(biāo)數(shù)據(jù),并持續(xù)跟蹤指標(biāo)的變化情況,為征管工作分析應(yīng)用提供數(shù)據(jù)支撐。 企業(yè)標(biāo)簽體系模型:針對(duì)目前總局對(duì)于企業(yè)征稅管理的需要,設(shè)計(jì)對(duì)企業(yè)進(jìn)行分類、刻畫的描述標(biāo)簽,制定標(biāo)簽業(yè)務(wù)含義及

32、數(shù)據(jù)算法,通過對(duì)企業(yè)庫的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得刻畫企業(yè)的標(biāo)簽數(shù)據(jù)。自然人標(biāo)簽體系模型:針對(duì)目前總局對(duì)于自然人征稅管理的需要,設(shè)計(jì)對(duì)自然人進(jìn)行分類、刻畫的描述標(biāo)簽,制定標(biāo)簽業(yè)務(wù)含義及數(shù)據(jù)算法,通過對(duì)自然人庫的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得刻畫自然人的標(biāo)簽數(shù)據(jù)。數(shù)據(jù)治理方案概述數(shù)據(jù)治理體系將云平臺(tái)和工程規(guī)劃范圍內(nèi)的其他數(shù)據(jù)平臺(tái)集于一體,使金三生產(chǎn)系統(tǒng)數(shù)據(jù)、總局保留軟件數(shù)據(jù)和多來源的外部交換數(shù)據(jù)相互貫通,實(shí)現(xiàn)各類數(shù)據(jù)的集中定義和管理,為建立統(tǒng)一數(shù)據(jù)視圖、數(shù)據(jù)集市、各類分析業(yè)務(wù)的定義、指標(biāo)和規(guī)則定義以及數(shù)據(jù)集成定義提供語義基礎(chǔ),同時(shí)提供對(duì)各類數(shù)據(jù)的審核管理和維護(hù)機(jī)制,維護(hù)數(shù)據(jù)的完整性、準(zhǔn)確性以及一致性,實(shí)現(xiàn)數(shù)

33、據(jù)生命周期管理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)審計(jì)等各項(xiàng)功能。通過數(shù)據(jù)治理過程,使得數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)質(zhì)量都能夠得到持續(xù)的提升,保證數(shù)據(jù)資產(chǎn)的長(zhǎng)久價(jià)值。數(shù)據(jù)管理制度與機(jī)制數(shù)據(jù)管理規(guī)章制度是將數(shù)據(jù)管理體系實(shí)施中的重要步驟、行動(dòng)和任務(wù)的處理方式、途徑和評(píng)估等進(jìn)行規(guī)范和固化,概括和規(guī)定如何實(shí)施數(shù)據(jù)管理體系、如何考核實(shí)施結(jié)果以及如何進(jìn)一步完善整套機(jī)制,為數(shù)據(jù)管理體系建設(shè)的參與者提供可以遵照?qǐng)?zhí)行的原則和具體方法。政策規(guī)章制度以固化的、標(biāo)準(zhǔn)化的形式來描述管理決策分析平臺(tái)數(shù)據(jù)管理模型中設(shè)計(jì)的組織架構(gòu)、崗位職責(zé)、工作流程等各項(xiàng)內(nèi)容。這些規(guī)范與以往經(jīng)營(yíng)活動(dòng)中發(fā)布和執(zhí)行的很多數(shù)據(jù)管理相關(guān)的政策規(guī)章制度是類似的,但數(shù)據(jù)管理

34、的政策規(guī)章制度是針對(duì)數(shù)據(jù)管理各管理主題本身要解決的問題以及管理主題之間的協(xié)調(diào)性問題做出相應(yīng)的規(guī)定。在此定義的數(shù)據(jù)管理框架還應(yīng)包括:明確數(shù)據(jù)管理框架的目的和重大意義、基本原則和定位、所遵循的外部或內(nèi)部要求、各相關(guān)方的義務(wù)和權(quán)利、績(jī)效考核手段、可供使用的業(yè)務(wù)手段和技術(shù)手段、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)傳輸、數(shù)據(jù)質(zhì)量控制和監(jiān)控、需要補(bǔ)充完善的規(guī)章制度等。數(shù)據(jù)管理制度與機(jī)制要求如下:1.按照數(shù)據(jù)治理體系要求,根據(jù)數(shù)據(jù)治理工作具體實(shí)踐持續(xù)協(xié)助完善數(shù)據(jù)管理制度和機(jī)制,修訂數(shù)據(jù)治理體系規(guī)范。2.按季度編寫數(shù)據(jù)治理報(bào)告,報(bào)告應(yīng)基于該季度數(shù)據(jù)治理工作情況編寫,并針對(duì)數(shù)據(jù)治理中的問題提出分析改善方案。數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范建設(shè)數(shù)據(jù)標(biāo)準(zhǔn)

35、規(guī)范是總局信息化標(biāo)準(zhǔn)的一部分,是對(duì)總局管理所涉及的各項(xiàng)數(shù)據(jù)的定義與解釋,以及數(shù)據(jù)質(zhì)量及安全性要求的統(tǒng)一定義。數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范著重于對(duì)稅務(wù)局各業(yè)務(wù)部門使用的通用及共享數(shù)據(jù)制定一套大家共同接受的業(yè)務(wù)概念及技術(shù)實(shí)施時(shí)的統(tǒng)一定義。數(shù)據(jù)標(biāo)準(zhǔn)主要內(nèi)容包括:業(yè)務(wù)數(shù)據(jù)、數(shù)據(jù)模型、數(shù)據(jù)交互等;數(shù)據(jù)元素定義的業(yè)務(wù)規(guī)則;數(shù)據(jù)實(shí)施的相關(guān)技術(shù)要求,例如:數(shù)據(jù)的存儲(chǔ)格式、質(zhì)量問題等。由于稅務(wù)業(yè)務(wù)在不斷的發(fā)展和變化,反映稅務(wù)業(yè)務(wù)的數(shù)據(jù)標(biāo)準(zhǔn)也是一個(gè)動(dòng)態(tài)的管理目標(biāo)。在數(shù)據(jù)標(biāo)準(zhǔn)的制定工作初步完成后,數(shù)據(jù)標(biāo)準(zhǔn)的日常維護(hù)和更新工作就成為保證數(shù)據(jù)標(biāo)準(zhǔn)得以遵照和執(zhí)行的基礎(chǔ)。數(shù)據(jù)標(biāo)準(zhǔn)管理流程作為數(shù)據(jù)管理的重要組成部分,它的主要目標(biāo)是明確定義數(shù)

36、據(jù)標(biāo)準(zhǔn)的維護(hù)流程,明確數(shù)據(jù)標(biāo)準(zhǔn)管理的組織架構(gòu),為數(shù)據(jù)標(biāo)準(zhǔn)的管理提供一套端到端的管理機(jī)制和維護(hù)環(huán)境。以下管理流程的建立方法著重說明在數(shù)據(jù)管理流程的框架設(shè)計(jì)下,數(shù)據(jù)標(biāo)準(zhǔn)的管理流程是如何建立起來的。數(shù)據(jù)標(biāo)準(zhǔn)管理工作負(fù)責(zé)制定和維護(hù)全部業(yè)務(wù)經(jīng)營(yíng)涉及的數(shù)據(jù)標(biāo)準(zhǔn),通過系統(tǒng)的實(shí)施逐步推廣數(shù)據(jù)標(biāo)準(zhǔn)的落實(shí)。數(shù)據(jù)標(biāo)準(zhǔn)管理體現(xiàn)在數(shù)據(jù)標(biāo)準(zhǔn)的制定、審核、執(zhí)行、反饋和爭(zhēng)議協(xié)調(diào)等各個(gè)工作環(huán)節(jié)中。數(shù)據(jù)標(biāo)準(zhǔn)的制定需要參考標(biāo)準(zhǔn)機(jī)構(gòu)制定的數(shù)據(jù)標(biāo)準(zhǔn),同時(shí)也應(yīng)參考各個(gè)部門內(nèi)部使用的特定數(shù)據(jù)的定義。數(shù)據(jù)標(biāo)準(zhǔn)管理的對(duì)象是稅務(wù)局所有生產(chǎn)、管理決策的數(shù)據(jù),不包括為維護(hù)系統(tǒng)運(yùn)行而設(shè)置的參數(shù)型數(shù)據(jù),如系統(tǒng)日志的數(shù)據(jù)定義等。數(shù)據(jù)標(biāo)準(zhǔn)采用數(shù)據(jù)分類管理的

37、方式對(duì)數(shù)據(jù)進(jìn)行定義和管理。參考領(lǐng)先實(shí)踐的經(jīng)驗(yàn),數(shù)據(jù)標(biāo)準(zhǔn)可以結(jié)合以下兩種分類方式進(jìn)行管理: 按照共享程度分類根據(jù)數(shù)據(jù)的共享程度,稅務(wù)的數(shù)據(jù)可歸為三大類:通用數(shù)據(jù)、共享數(shù)據(jù)、部門特定數(shù)據(jù)。其中,通用數(shù)據(jù)是指那些由各業(yè)務(wù)部門共享的數(shù)據(jù),如查詢統(tǒng)計(jì)數(shù)據(jù)、報(bào)表數(shù)據(jù)等;共享數(shù)據(jù)是指那些由多個(gè)業(yè)務(wù)部門共同使用的數(shù)據(jù);而特定數(shù)據(jù)是指那些專屬于某些應(yīng)用系統(tǒng)或業(yè)務(wù)部門的數(shù)據(jù)。數(shù)據(jù)標(biāo)準(zhǔn)管理的對(duì)象范圍包括這三類數(shù)據(jù),但數(shù)據(jù)標(biāo)準(zhǔn)的推廣實(shí)施可先從通用數(shù)據(jù)開始,最后將部門特定數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化管理; 按照數(shù)據(jù)產(chǎn)生方式分類根據(jù)不同產(chǎn)生方式,數(shù)據(jù)可歸為三大類:基礎(chǔ)數(shù)據(jù)、衍生數(shù)據(jù)、公共代碼類數(shù)據(jù)。其中,基礎(chǔ)數(shù)據(jù)由系統(tǒng)生成或直接錄入,

38、衍生類數(shù)據(jù)由基礎(chǔ)數(shù)據(jù)通過轉(zhuǎn)換和計(jì)算產(chǎn)生,公共代碼類數(shù)據(jù)是通用的共享代碼,是特殊的基礎(chǔ)數(shù)據(jù)。根據(jù)的具體情況并參照以往標(biāo)準(zhǔn)化工作的實(shí)踐,數(shù)據(jù)標(biāo)準(zhǔn)管理工作應(yīng)參照以下指導(dǎo)原則:數(shù)據(jù)標(biāo)準(zhǔn)的推廣執(zhí)行必須遵循循序漸進(jìn)的原則。數(shù)據(jù)標(biāo)準(zhǔn)管理小組不僅是標(biāo)準(zhǔn)的制定和管理組織,而且還是提供數(shù)據(jù)標(biāo)準(zhǔn)咨詢的內(nèi)部服務(wù)組織,為各項(xiàng)目的順利開展提供數(shù)據(jù)標(biāo)準(zhǔn)定義的解釋和數(shù)據(jù)標(biāo)準(zhǔn)使用的培訓(xùn)。數(shù)據(jù)標(biāo)準(zhǔn)的制定應(yīng)參照國(guó)際、國(guó)內(nèi)、行業(yè)等標(biāo)準(zhǔn),并結(jié)合稅務(wù)行業(yè)的實(shí)際需求。數(shù)據(jù)標(biāo)準(zhǔn)的定義要與行業(yè)、國(guó)內(nèi)及國(guó)際的數(shù)據(jù)標(biāo)準(zhǔn)相適應(yīng),在充分考慮和尊重現(xiàn)有數(shù)據(jù)情況等的基礎(chǔ)上,結(jié)合系統(tǒng)現(xiàn)實(shí)和未來的切實(shí)需要,編制或補(bǔ)充相應(yīng)的數(shù)據(jù)標(biāo)準(zhǔn)。數(shù)據(jù)標(biāo)準(zhǔn)定義應(yīng)具有前瞻性。

39、數(shù)據(jù)標(biāo)準(zhǔn)定義的前瞻性,要求已經(jīng)定義的數(shù)據(jù)標(biāo)準(zhǔn)能夠在一段時(shí)間內(nèi)相對(duì)穩(wěn)定地滿足總局對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化的要求,而不是頻繁地更改與修訂。完善的數(shù)據(jù)標(biāo)準(zhǔn)審閱流程。鑒于數(shù)據(jù)標(biāo)準(zhǔn)的重要性及跨業(yè)務(wù)領(lǐng)域共用的特點(diǎn),為保證數(shù)據(jù)標(biāo)準(zhǔn)定義的質(zhì)量滿足準(zhǔn)確性、通用性、前瞻性等要求,需要建立完善的數(shù)據(jù)標(biāo)準(zhǔn)審閱流程。審閱過程要充分征求業(yè)務(wù)部門、數(shù)據(jù)標(biāo)準(zhǔn)主管部門、業(yè)務(wù)部門業(yè)務(wù)專家等各方面的意見,并據(jù)此制定相對(duì)完善的、可用性強(qiáng)的數(shù)據(jù)標(biāo)準(zhǔn)。一致性維度標(biāo)準(zhǔn)一致性維度是指具有一致的維度關(guān)鍵字、一致的屬性列名字、一致的屬性定義以及一致的屬性值(將轉(zhuǎn)化成一致的報(bào)表標(biāo)簽與分組標(biāo)識(shí)),不管是在同一數(shù)據(jù)庫中還是基于配有多種數(shù)據(jù)庫平臺(tái)的數(shù)據(jù)倉庫范圍內(nèi),

40、對(duì)于某個(gè)特定的維度,這些內(nèi)容都是一樣的。簡(jiǎn)單來說,只要在數(shù)據(jù)層范圍內(nèi),不管物理上部署了多少個(gè)數(shù)據(jù)庫,不管什么應(yīng)用系統(tǒng),對(duì)于某個(gè)指定的維度,都具有相同的表結(jié)構(gòu)和相同的數(shù)據(jù)。一致性維度作為一根總線,不僅使這些內(nèi)部系統(tǒng)能夠以一個(gè)統(tǒng)一的標(biāo)準(zhǔn)結(jié)合在一起,還使所有基于數(shù)據(jù)平臺(tái)的外部系統(tǒng)能按照這根總線的標(biāo)準(zhǔn)插入其中,構(gòu)成一個(gè)總線矩陣,以實(shí)現(xiàn)數(shù)據(jù)層大平臺(tái)的概念。在設(shè)計(jì)一致性維度時(shí),不依賴、不照搬生產(chǎn)系統(tǒng)數(shù)據(jù)層中特定的表,而是充分考慮各個(gè)系統(tǒng)之間的差異,集成多個(gè)系統(tǒng)?;A(chǔ)數(shù)據(jù)項(xiàng)體系標(biāo)準(zhǔn)通過抽象與歸納稅務(wù)領(lǐng)域中的各類憑證數(shù)據(jù)和大量常見的、公共的分析指標(biāo),以數(shù)據(jù)層中經(jīng)過加工的各類事實(shí)數(shù)據(jù)為基礎(chǔ),把這些憑證數(shù)據(jù)和分析

41、指標(biāo)在數(shù)據(jù)層面上定義為各種基礎(chǔ)數(shù)據(jù)項(xiàng),從而形成稅務(wù)領(lǐng)域的基礎(chǔ)數(shù)據(jù)項(xiàng)體系,為各類查詢統(tǒng)計(jì)、分析評(píng)估、預(yù)警監(jiān)控等分析型應(yīng)用提供統(tǒng)一和標(biāo)準(zhǔn)的數(shù)據(jù)支撐。在業(yè)務(wù)層面,基礎(chǔ)數(shù)據(jù)項(xiàng)體系規(guī)范了不同分析型應(yīng)用之間的口徑描述,使得不同系統(tǒng)間對(duì)某個(gè)特定的分析指標(biāo)具有一致的定義,解決了同名不同義和同義不同名的情況。在數(shù)據(jù)層面,基礎(chǔ)數(shù)據(jù)項(xiàng)體系保證了不同子系統(tǒng)間分析結(jié)果的唯一性,解決了同一個(gè)分析指標(biāo)在不同系統(tǒng)間出現(xiàn)不同的分析結(jié)果、分析結(jié)果相互矛盾的情況。所有分析應(yīng)用系統(tǒng)對(duì)某些憑證數(shù)據(jù)的查詢和公共的分析指標(biāo)的利用都來源于統(tǒng)一的基礎(chǔ)數(shù)據(jù)項(xiàng)部分(當(dāng)然還會(huì)有其它非公共的數(shù)據(jù),這些非公共的數(shù)據(jù)從數(shù)據(jù)層的其它部分獲?。?,保證了多子系

42、統(tǒng)間分析口徑的一致性和數(shù)據(jù)的唯一性?;A(chǔ)數(shù)據(jù)項(xiàng)的定義基礎(chǔ)數(shù)據(jù)項(xiàng)是對(duì)稅務(wù)系統(tǒng)內(nèi)各類常見的憑證數(shù)據(jù)和分析指標(biāo)在數(shù)據(jù)層面的解釋和實(shí)現(xiàn)。例如,登記戶數(shù)、應(yīng)申報(bào)戶數(shù)、已申報(bào)戶數(shù)、稅收收入等。它包含三個(gè)要素:1、口徑在業(yè)務(wù)上,用于規(guī)范基礎(chǔ)數(shù)據(jù)項(xiàng)的業(yè)務(wù)口徑,使基礎(chǔ)數(shù)據(jù)項(xiàng)不是籠統(tǒng)的、模糊的。在設(shè)計(jì)實(shí)現(xiàn)時(shí),用于明確每個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)進(jìn)行取數(shù)的事實(shí)表和表的字段,以及取數(shù)時(shí)的限制條件等。2、維度維度用來確定基礎(chǔ)數(shù)據(jù)項(xiàng)的屬性,明確可以從哪些視角出發(fā)來分析某個(gè)特定的基礎(chǔ)數(shù)據(jù)項(xiàng)。因?yàn)橐恢滦跃S度標(biāo)準(zhǔn)的建設(shè),所以基礎(chǔ)數(shù)據(jù)項(xiàng)體系中維度這個(gè)要素保證了基礎(chǔ)數(shù)據(jù)項(xiàng)在不同應(yīng)用子系統(tǒng)之間的一致性,使不同子系統(tǒng)間對(duì)同一個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)、同一個(gè)維度

43、的分析都能得到唯一的值。在基礎(chǔ)數(shù)據(jù)項(xiàng)體系中,與它關(guān)系密切的一致性維度包括:(1)稅務(wù)機(jī)構(gòu)稅務(wù)機(jī)構(gòu)維用于確定某個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)的分析數(shù)據(jù)的空間范圍,包括市、區(qū)縣和所三個(gè)層次,可以在三個(gè)層次間上卷下鉆來靈活取數(shù)。(2)時(shí)間時(shí)間維用于確定某個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)的分析數(shù)據(jù)的時(shí)間范圍,包括日期、旬、月、季度、半年和年六個(gè)層次,可以在六個(gè)層次間上卷下鉆來靈活取數(shù)。時(shí)間維和上面描述的稅務(wù)機(jī)構(gòu)維幾乎是所有基礎(chǔ)數(shù)據(jù)項(xiàng)必定包含的兩個(gè)維度,只有從某個(gè)特定的空間和時(shí)間范圍內(nèi)來分析數(shù)據(jù)才有意義。(3)行業(yè)行業(yè)維用于確定某個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)的分析數(shù)據(jù)所屬的行業(yè),因?yàn)楹芏鄶?shù)據(jù)只有在同個(gè)行業(yè)內(nèi)比較才有意義,包括明細(xì)行業(yè)、中類、大類、門類和產(chǎn)業(yè)

44、五個(gè)層次的內(nèi)容,可以在五個(gè)層次間上卷下鉆來靈活取數(shù)。(4)登記注冊(cè)類型登記注冊(cè)類型維用于確定某個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)的分析數(shù)據(jù)所屬的登記注冊(cè)類型,包括小類、中類、大類三個(gè)層次的內(nèi)容,可以在三個(gè)層次間上卷下鉆來靈活取數(shù)。(5)征收項(xiàng)目征收項(xiàng)目維用于確定某個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)的分析數(shù)據(jù)所屬的征收項(xiàng)目。(6)其它跟特定的基礎(chǔ)數(shù)據(jù)項(xiàng)有關(guān)的維度,比如,對(duì)稅收收入這個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng),除了上面列的維度外,可能還會(huì)比較關(guān)心預(yù)算科目維和預(yù)算級(jí)次維。3、值在確定基礎(chǔ)數(shù)據(jù)項(xiàng)的口徑和選擇特定的維度及維度的值后,就能量化這個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng),得到基礎(chǔ)數(shù)據(jù)項(xiàng)的值?;A(chǔ)數(shù)據(jù)項(xiàng)體系建設(shè)在討論基礎(chǔ)數(shù)據(jù)項(xiàng)的定義時(shí)明確了基礎(chǔ)數(shù)據(jù)項(xiàng)包含口徑、維度和值三大要素,

45、那么,在進(jìn)行基礎(chǔ)數(shù)據(jù)項(xiàng)體系的建設(shè)時(shí),也將主要圍繞這三要素展開。1、確定口徑和維度對(duì)于每個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng),在分析其業(yè)務(wù)上的含義后,明確這個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)必須支持的維度,確定其在數(shù)據(jù)層中的事實(shí)表和字段(包括各維度對(duì)應(yīng)的字段和基礎(chǔ)數(shù)據(jù)項(xiàng)的值對(duì)應(yīng)的字段),以及條件限制等取數(shù)上的口徑。2、取得值對(duì)于根據(jù)第一部分確定的口徑和維度能直接從分析主題中取得值的基礎(chǔ)數(shù)據(jù)項(xiàng),直接進(jìn)行下面將要介紹的基礎(chǔ)數(shù)據(jù)項(xiàng)管理即可。而對(duì)于不能直接從分析主題中取得值的基礎(chǔ)數(shù)據(jù)項(xiàng),則需要經(jīng)過數(shù)據(jù)加工過程,利用各類技術(shù)手段把基礎(chǔ)數(shù)據(jù)項(xiàng)所需的數(shù)據(jù)預(yù)先加工好。3、基礎(chǔ)數(shù)據(jù)項(xiàng)管理基礎(chǔ)數(shù)據(jù)項(xiàng)的口徑整理清楚了,值也能取到了,但是如果不對(duì)它們進(jìn)行統(tǒng)一的管理

46、,那么它們還是一盤散沙,發(fā)揮不出基礎(chǔ)數(shù)據(jù)項(xiàng)體系的優(yōu)勢(shì)。通過指標(biāo)庫,把那些散落在數(shù)據(jù)倉庫中的基礎(chǔ)數(shù)據(jù)項(xiàng)集中管理起來。對(duì)技術(shù)實(shí)現(xiàn)人員,能從稅務(wù)指標(biāo)庫中了解每個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)的物理存儲(chǔ)及數(shù)據(jù)加工過程;對(duì)用戶,能從指標(biāo)庫中獲取每個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)的口徑描述及如何使用它們。元數(shù)據(jù)管理元數(shù)據(jù)管理包括但不限于以下內(nèi)容:1、數(shù)據(jù)血緣影響分析。根據(jù)數(shù)據(jù)資產(chǎn)鏈路進(jìn)行數(shù)據(jù)血緣影響分析工作。2、元數(shù)據(jù)配置維護(hù)。對(duì)云平臺(tái)26項(xiàng)技術(shù)、業(yè)務(wù)元數(shù)據(jù)進(jìn)行配置和維護(hù);3、新增功能建設(shè)。投標(biāo)方應(yīng)根據(jù)招標(biāo)方的要求開發(fā)元數(shù)據(jù)管理相關(guān)功能,包括但不限于以下內(nèi)容:(1)關(guān)系配置管理,用于對(duì)應(yīng)用、功能、數(shù)據(jù)項(xiàng)等基礎(chǔ)數(shù)據(jù)進(jìn)行靈活配置管理。(2)數(shù)據(jù)項(xiàng)管

47、理,用于收集云平臺(tái)應(yīng)用數(shù)據(jù)項(xiàng)內(nèi)容錄入及管理。(3)數(shù)據(jù)需求管理,主要用于收集云平臺(tái)各項(xiàng)數(shù)據(jù)需求內(nèi)容。元數(shù)據(jù)管理總體分析元數(shù)據(jù)管理的范圍在云平臺(tái)數(shù)據(jù)管理項(xiàng)目規(guī)劃和建設(shè)過程中,我們針對(duì)稅務(wù)行業(yè)的現(xiàn)狀,管理技術(shù)元數(shù)據(jù)、交易業(yè)務(wù)元數(shù)據(jù)、統(tǒng)計(jì)業(yè)務(wù)元數(shù)據(jù)。1、技術(shù)元數(shù)據(jù)是存儲(chǔ)關(guān)于數(shù)據(jù)倉庫系統(tǒng)技術(shù)細(xì)節(jié)的數(shù)據(jù),是用于開發(fā)和管理數(shù)據(jù)倉庫使用的數(shù)據(jù)。主要包括涉及到的所有數(shù)據(jù)源DB。2、業(yè)務(wù)元數(shù)據(jù)是從業(yè)務(wù)角度描述了數(shù)據(jù)倉庫中的數(shù)據(jù),它提供了介于使用者和實(shí)際系統(tǒng)之間的語義層,使得不懂計(jì)算機(jī)技術(shù)的業(yè)務(wù)人員也能夠“讀懂”數(shù)據(jù)倉庫中的數(shù)據(jù)。主要包括交易業(yè)務(wù)元數(shù)據(jù)、統(tǒng)計(jì)業(yè)務(wù)元數(shù)據(jù)。其中交易業(yè)務(wù)元數(shù)據(jù)主要是的稅務(wù)行業(yè)涉及到的憑

48、證及數(shù)據(jù)項(xiàng)信息,統(tǒng)計(jì)業(yè)務(wù)元數(shù)據(jù)主要是稅務(wù)行業(yè)涉及到的指標(biāo)、緯度、基礎(chǔ)編碼、業(yè)務(wù)術(shù)語、業(yè)務(wù)規(guī)則、業(yè)務(wù)描述等。詳細(xì)范圍分類如下表:應(yīng)用模塊具體功能子功能備注建設(shè)階段元數(shù)據(jù)實(shí)體管理技術(shù)元數(shù)據(jù)各個(gè)數(shù)據(jù)源涉及的表和字段按照業(yè)務(wù)源系統(tǒng)分類組織自動(dòng)獲取交易業(yè)務(wù)元數(shù)據(jù)憑證元數(shù)據(jù)根據(jù)業(yè)務(wù)梳理憑證庫自動(dòng)獲取,或者模板整理,批量導(dǎo)入數(shù)據(jù)項(xiàng)元數(shù)據(jù)根據(jù)業(yè)務(wù)梳理憑證庫自動(dòng)獲取,或者模板整理,批量導(dǎo)入業(yè)務(wù)術(shù)語、業(yè)務(wù)規(guī)則、業(yè)務(wù)描述根據(jù)業(yè)務(wù)梳理模板整理,批量導(dǎo)入統(tǒng)計(jì)業(yè)務(wù)元數(shù)據(jù)維度元數(shù)據(jù)根據(jù)業(yè)務(wù)梳理指標(biāo)庫自動(dòng)獲取,或者模板整理,批量導(dǎo)入指標(biāo)元數(shù)據(jù)根據(jù)業(yè)務(wù)梳理指標(biāo)庫自動(dòng)獲取,或者模板整理,批量導(dǎo)入元數(shù)據(jù)關(guān)系梳理技術(shù)元數(shù)據(jù)數(shù)據(jù)庫表D

49、B實(shí)體間字段級(jí)關(guān)系梳理按照數(shù)據(jù)流關(guān)系梳理ETL中自動(dòng)獲取,或者模板整理,批量導(dǎo)入交易業(yè)務(wù)元數(shù)據(jù)各個(gè)憑證數(shù)據(jù)項(xiàng)之間的關(guān)系梳理按照業(yè)務(wù)數(shù)據(jù)流向梳理模板整理,批量導(dǎo)入統(tǒng)計(jì)業(yè)務(wù)元數(shù)據(jù)指標(biāo)、維度之間關(guān)系梳理按照業(yè)務(wù)數(shù)據(jù)流向梳理模板整理,批量導(dǎo)入元數(shù)據(jù)應(yīng)用基本功能應(yīng)用圖形分析功能血緣分析技術(shù)元數(shù)據(jù)表查詢查詢功能指標(biāo)查詢查詢功能元數(shù)據(jù)分類分析元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。在數(shù)據(jù)倉庫系統(tǒng)中,元數(shù)據(jù)可以幫助數(shù)據(jù)倉庫管理員和數(shù)據(jù)倉庫的開發(fā)人員非常方便地找到他們所關(guān)心的數(shù)據(jù),元數(shù)據(jù)是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。根據(jù)不同語境中描述一個(gè)數(shù)據(jù)的屬性角度及內(nèi)容不同,可將描述一個(gè)數(shù)據(jù)的元數(shù)據(jù)劃分為業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)

50、據(jù)和管理元數(shù)據(jù),如下圖:業(yè)務(wù)元數(shù)據(jù)是在業(yè)務(wù)語境中對(duì)一個(gè)數(shù)據(jù)的業(yè)務(wù)屬性部分的描述,從商業(yè)和業(yè)務(wù)的角度描述數(shù)據(jù)倉庫的數(shù)據(jù),提供了良好的語義層定義,如數(shù)據(jù)的業(yè)務(wù)說明、語境、關(guān)系等,業(yè)務(wù)元數(shù)據(jù)使業(yè)務(wù)人員能夠更好的理解數(shù)據(jù)倉庫分析出來的數(shù)據(jù)。技術(shù)元數(shù)據(jù)是在技術(shù)語境中對(duì)一個(gè)數(shù)據(jù)的技術(shù)屬性部分的描述,描述關(guān)于數(shù)據(jù)處理技術(shù)細(xì)節(jié)的數(shù)據(jù),如數(shù)據(jù)的字段名、字段長(zhǎng)度、小數(shù)點(diǎn)位數(shù)等,這些元數(shù)據(jù)應(yīng)用于開發(fā)、管理和維護(hù)數(shù)據(jù)整合系統(tǒng)。管理元數(shù)據(jù)是在管理語境中對(duì)一個(gè)數(shù)據(jù)的管理屬性部分的描述,如數(shù)據(jù)的版本號(hào)、提交單位、批準(zhǔn)單位、應(yīng)用狀態(tài)等。一個(gè)數(shù)據(jù)的業(yè)務(wù)、技術(shù)和管理元數(shù)據(jù)共同構(gòu)成此數(shù)據(jù)的完整元數(shù)據(jù)描述。元數(shù)據(jù)用于支持管理決策分析

51、平臺(tái)的技術(shù)活動(dòng)、管理活動(dòng)和業(yè)務(wù)活動(dòng),其應(yīng)用覆蓋管理決策分析平臺(tái)技術(shù)、管理和業(yè)務(wù)等各個(gè)方面。元數(shù)據(jù)覆蓋范圍分析根據(jù)軟件開發(fā)的大體階段,結(jié)合每個(gè)階段對(duì)數(shù)據(jù)的處理加工工作,給出了每個(gè)階段中涉及的元數(shù)據(jù)的大體范圍,如下圖:標(biāo)準(zhǔn)規(guī)范在軟件開發(fā)初始階段,需要制定數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范,從而產(chǎn)生數(shù)據(jù)初始的標(biāo)準(zhǔn)規(guī)范部分的元數(shù)據(jù),標(biāo)準(zhǔn)規(guī)范的元數(shù)據(jù)包括數(shù)據(jù)元定義、數(shù)據(jù)項(xiàng)定義、表證單書定義等。數(shù)據(jù)建模數(shù)據(jù)建模階段對(duì)標(biāo)準(zhǔn)階段定義的業(yè)務(wù)數(shù)據(jù)項(xiàng)或數(shù)據(jù)集進(jìn)行整理、重組,結(jié)合軟件的功能需求,形成符合軟件功能需求的數(shù)據(jù)組織形式,產(chǎn)生數(shù)據(jù)重組過程的不同集合形態(tài)的元數(shù)據(jù),數(shù)據(jù)建模的元數(shù)據(jù)包括概念模型元數(shù)據(jù)、邏輯模型元數(shù)據(jù)及物理模型元數(shù)據(jù)。

52、創(chuàng)建數(shù)據(jù)存儲(chǔ)對(duì)建模階段的物理模型進(jìn)行物理落地創(chuàng)建,創(chuàng)建后形成數(shù)據(jù)的實(shí)際物理存儲(chǔ)的元數(shù)據(jù),本項(xiàng)目中物理存儲(chǔ)的元數(shù)據(jù)包括源數(shù)據(jù)庫、統(tǒng)一視圖庫、數(shù)據(jù)倉庫和各數(shù)據(jù)集市庫的元數(shù)據(jù)。數(shù)據(jù)集成數(shù)據(jù)集成對(duì)數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換等處理,在此過程中需要對(duì)數(shù)據(jù)的轉(zhuǎn)換規(guī)則、轉(zhuǎn)換過程進(jìn)行定義,形成數(shù)據(jù)轉(zhuǎn)換規(guī)則、轉(zhuǎn)換過程定義的元數(shù)據(jù)。應(yīng)用展現(xiàn)或數(shù)據(jù)展現(xiàn)應(yīng)用展現(xiàn)通過方案的手段形成各種各樣的數(shù)據(jù)展現(xiàn)內(nèi)容和樣式。在制定方案的過程中就形成了不同方案的元數(shù)據(jù),包括查詢統(tǒng)計(jì)方案、報(bào)表方案、征管分析方案以及挖掘方案等的元數(shù)據(jù)。數(shù)據(jù)治理數(shù)據(jù)治理中包括對(duì)數(shù)據(jù)質(zhì)量的業(yè)務(wù)定義、檢查規(guī)則定義、檢查的手段及流程管理的元數(shù)據(jù)。還包括對(duì)數(shù)據(jù)生命周期

53、的定義、數(shù)據(jù)遷移規(guī)則及遷移方式描述的元數(shù)據(jù)。元模型分類元模型是元數(shù)據(jù)的模型,是確定元數(shù)據(jù)的存儲(chǔ)形式和存儲(chǔ)內(nèi)容。元模型是由元數(shù)據(jù)類型來確定的,如:數(shù)據(jù)庫的元數(shù)據(jù)應(yīng)有一套的數(shù)據(jù)庫各元數(shù)據(jù)的元模型與之對(duì)應(yīng),以便數(shù)據(jù)庫的各種信息能夠全面的、準(zhǔn)確的、完整的、不丟失的采集起來。理論上來說,在開發(fā)過程產(chǎn)生的元數(shù)據(jù)都應(yīng)該采集起來,但有些過程元數(shù)據(jù)采集來用處不大,可以不需要采集,如:數(shù)據(jù)建模的元數(shù)據(jù)。元模型有如下幾種分類:類型說明標(biāo)準(zhǔn)規(guī)范元模型描述數(shù)據(jù)標(biāo)準(zhǔn)或規(guī)范,如:表單、代碼表、接口、稅務(wù)業(yè)務(wù)數(shù)據(jù)元技術(shù)元模型描述系統(tǒng)技術(shù)元數(shù)據(jù),如:數(shù)據(jù)庫、ETL、ER模型等業(yè)務(wù)元模型描述業(yè)務(wù)口徑,如:指標(biāo)、報(bào)表、統(tǒng)計(jì)規(guī)則元模

54、型描述質(zhì)量檢查規(guī)則等生命周期元模型描述生命周期的元數(shù)據(jù)元數(shù)據(jù)管理設(shè)計(jì)應(yīng)用架構(gòu)元數(shù)據(jù)管理的體系架構(gòu)如下圖所示:元數(shù)據(jù)管理體系架構(gòu)包括:元數(shù)據(jù)獲取層、元數(shù)據(jù)存儲(chǔ)層、元數(shù)據(jù)功能層和元數(shù)據(jù)應(yīng)用層,詳細(xì)描述如下:1、獲取層獲取層描述了元數(shù)據(jù)獲取的各種途徑。元數(shù)據(jù)覆蓋數(shù)據(jù)源系統(tǒng)涉及的所有數(shù)據(jù)的整個(gè)生命周期,基本采用以自動(dòng)方式進(jìn)行獲?。ㄈ鐢?shù)據(jù)字典、數(shù)據(jù)模型等)。另外提供手工獲取功能實(shí)現(xiàn)對(duì)業(yè)務(wù)、技術(shù)和管理元數(shù)據(jù)的補(bǔ)充獲取。2、存儲(chǔ)層存儲(chǔ)層定義了元數(shù)據(jù)存儲(chǔ)所遵循的元模型,存儲(chǔ)從獲取層得到的各類元數(shù)據(jù)的屬性要求和存儲(chǔ)格式要求,包括業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)據(jù)和管理元數(shù)據(jù)。元數(shù)據(jù)管理元模型是元模型設(shè)計(jì)工具實(shí)現(xiàn)。3、功能層

55、功能層為各類元數(shù)據(jù)應(yīng)用提供了基本的功能支撐,主要包括元數(shù)據(jù)基本功能、元數(shù)據(jù)分析功能、元數(shù)據(jù)服務(wù)接口和元模型管理四個(gè)部分。4、應(yīng)用層應(yīng)用層在元數(shù)據(jù)管理模塊功能層的支持下,元數(shù)據(jù)應(yīng)用層通過調(diào)用功能層的功能,對(duì)元數(shù)據(jù)管理的實(shí)際問題提供應(yīng)用解決方案。技術(shù)架構(gòu)元數(shù)據(jù)管理的技術(shù)架構(gòu)具有良好擴(kuò)展性,以及元數(shù)據(jù)能力公開的特性,另外提供方便的集成方式,其前端界面集成到業(yè)務(wù)工作門戶的數(shù)據(jù)治理平臺(tái)中。如下圖所示:詳細(xì)描述如下:1、工作門戶提供統(tǒng)一訪問應(yīng)用功能的入口。2、集成層提供對(duì)系統(tǒng)訪問的控制,如:權(quán)限集成、頁面集成等。3、業(yè)務(wù)應(yīng)用層專用工具層采用成熟的元數(shù)據(jù)管理工具 MetaOne?;A(chǔ)服務(wù)是為了支撐上面兩層功

56、能而提供的通用的統(tǒng)一的基礎(chǔ)數(shù)據(jù)應(yīng)用服務(wù)。這部分的功能由工具軟件提供保障。4、應(yīng)用功能是數(shù)據(jù)治理平臺(tái)的最上層,提供了直接滿足于業(yè)務(wù)需求的功能服務(wù),應(yīng)用功能層包含基本功能、分析功能、元模型管理、元數(shù)據(jù)服務(wù)接口、元數(shù)據(jù)獲取組件等。5、技術(shù)服務(wù)層:提供數(shù)據(jù)訪問、網(wǎng)絡(luò)訪問、文件訪問及其他訪問等服務(wù)。6、資源層用于存儲(chǔ)云平臺(tái)數(shù)據(jù)管理涉及的元數(shù)據(jù)。部署架構(gòu)數(shù)據(jù)質(zhì)量管理數(shù)據(jù)質(zhì)量的好壞是決定數(shù)據(jù)利用率的重要因素,數(shù)據(jù)質(zhì)量管理旨在發(fā)現(xiàn)并有效提升數(shù)據(jù)質(zhì)量,數(shù)據(jù)質(zhì)量管理包括但不限于以下內(nèi)容:1、數(shù)據(jù)質(zhì)量檢查。制定檢查規(guī)則,并針對(duì)2017年度建設(shè)的二百多項(xiàng)數(shù)據(jù)質(zhì)量規(guī)則根據(jù)業(yè)務(wù)變化情況開展更新維護(hù),提供評(píng)審;根據(jù)檢查規(guī)則

57、編寫(更新)檢查腳本。2、數(shù)據(jù)質(zhì)量問題分析。結(jié)合云平臺(tái)基礎(chǔ)層、中間層加工過程和數(shù)據(jù)查詢服務(wù)過程,分析確認(rèn)數(shù)據(jù)質(zhì)量分析點(diǎn),開展數(shù)據(jù)質(zhì)量問題驗(yàn)證和分析;提取云平臺(tái)日常運(yùn)行中出現(xiàn)的數(shù)據(jù)質(zhì)量問題;根據(jù)數(shù)據(jù)質(zhì)量檢查規(guī)則和腳本掃描問題。3、編寫數(shù)據(jù)質(zhì)量分析報(bào)告。針對(duì)上述幾點(diǎn)產(chǎn)生的問題數(shù)據(jù)進(jìn)行分析,形成問題解決方案,編寫分析報(bào)告;并對(duì)處理后的問題數(shù)據(jù)跟蹤檢查。4、數(shù)據(jù)績(jī)效考核支持。對(duì)總局發(fā)起的定期數(shù)據(jù)績(jī)效考核工作進(jìn)行支持,包括但不限于考核需求分析、腳本編寫、數(shù)據(jù)提取及歸類分析以及問題解答等工作。5、數(shù)據(jù)質(zhì)量考核工作支持。對(duì)總局發(fā)起的定期數(shù)據(jù)質(zhì)量考核工作進(jìn)行支持,包括但不限于考核需求分析、腳本編寫、數(shù)據(jù)提取及

58、歸類分析以及問題解答等工作。數(shù)據(jù)質(zhì)量管理總體分析經(jīng)過對(duì)本項(xiàng)目的數(shù)據(jù)質(zhì)量管理的需求的分析,從本項(xiàng)目的宏觀角度來看,數(shù)據(jù)質(zhì)量管理的范圍包括以下幾個(gè)方面:數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范的建立;數(shù)據(jù)模型的統(tǒng)一、規(guī)范;建立元數(shù)據(jù)管理并實(shí)現(xiàn)以元數(shù)據(jù)為源頭的主動(dòng)管理;業(yè)務(wù)系統(tǒng)中的界面層及邏輯層的數(shù)據(jù)邏輯符合性檢查;數(shù)據(jù)從采集到展現(xiàn)給用戶的整個(gè)加工過程中的數(shù)據(jù)質(zhì)量檢查及涉及的數(shù)據(jù)質(zhì)量問題的數(shù)據(jù)維護(hù)。在以上的數(shù)據(jù)質(zhì)量管理的范圍中,并不是所有的數(shù)據(jù)質(zhì)量范圍都由數(shù)據(jù)質(zhì)量管理平臺(tái)來負(fù)責(zé)實(shí)現(xiàn),而只是有很少范圍內(nèi)的數(shù)據(jù)質(zhì)量問題由數(shù)據(jù)質(zhì)量管理平臺(tái)來負(fù)責(zé)實(shí)現(xiàn),并結(jié)合其它的應(yīng)用功能或子平臺(tái)共同形成一個(gè)整體的數(shù)據(jù)質(zhì)量管理體系,具體的數(shù)據(jù)質(zhì)量范圍

59、管理的劃分如下圖:數(shù)據(jù)質(zhì)量管理設(shè)計(jì)應(yīng)用架構(gòu)數(shù)據(jù)質(zhì)量管理應(yīng)用按層次劃分為獲取層、存儲(chǔ)層、功能層和應(yīng)用層。詳細(xì)描述如下:獲取層獲取層是數(shù)據(jù)質(zhì)量功能和應(yīng)用的基礎(chǔ),主要是實(shí)現(xiàn)數(shù)據(jù)的采集功能。數(shù)據(jù)質(zhì)量管理采集、保留系統(tǒng)以及云平臺(tái)所需的質(zhì)量監(jiān)控?cái)?shù)據(jù)。采集的數(shù)據(jù)范圍包括數(shù)據(jù)源采集、統(tǒng)一視圖采集、數(shù)據(jù)倉庫采集、數(shù)據(jù)集市采集和數(shù)據(jù)集成采集等。存儲(chǔ)層存儲(chǔ)層中主要包括二個(gè)部分:規(guī)則信息:規(guī)則信息包括數(shù)據(jù)質(zhì)量檢查規(guī)則、數(shù)據(jù)維護(hù)方案、數(shù)據(jù)部署信息和高度信息等;數(shù)據(jù)質(zhì)量信息:存儲(chǔ)數(shù)據(jù)質(zhì)量信息包括質(zhì)量告警信息、質(zhì)量評(píng)估信息和數(shù)據(jù)質(zhì)量問題處理信息等;功能層功能層是對(duì)數(shù)據(jù)質(zhì)量管理的支撐,主要包括三部分內(nèi)容的功能:數(shù)據(jù)質(zhì)量評(píng)估:

60、包括基礎(chǔ)數(shù)據(jù)質(zhì)量評(píng)估和平臺(tái)指標(biāo)關(guān)聯(lián)性分析。配置管理:包括基礎(chǔ)信息管理、質(zhì)量規(guī)則管理、檢查流程管理和數(shù)據(jù)制質(zhì)量檢查等等。質(zhì)量問題管理:數(shù)據(jù)質(zhì)量問題處理是按照問題處理流程對(duì)系統(tǒng)監(jiān)控所發(fā)現(xiàn)的問題進(jìn)行處理的過程,包括問題生成、問題分析、問題處理(包括流轉(zhuǎn))和問題總結(jié)。應(yīng)用層應(yīng)用層包括數(shù)據(jù)質(zhì)量的所有功能,主要包括數(shù)據(jù)質(zhì)量檢查、納稅人信息主題評(píng)估、數(shù)據(jù)質(zhì)量知識(shí)應(yīng)用、數(shù)據(jù)質(zhì)量維護(hù)等等。技術(shù)架構(gòu)數(shù)據(jù)質(zhì)量管理的技術(shù)結(jié)構(gòu)包括數(shù)據(jù)質(zhì)量信息庫、功能組件、數(shù)據(jù)質(zhì)量應(yīng)用和數(shù)據(jù)質(zhì)量對(duì)外服務(wù)接口等部分,如下圖所示:詳細(xì)描述如下:1、工作門戶提供統(tǒng)一訪問應(yīng)用功能的入口。2、集成層提供對(duì)系統(tǒng)訪問的控制,如:權(quán)限集成、頁面集成等。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論