安邦BI系統(tǒng)數(shù)據(jù)模型全面介紹_第1頁
安邦BI系統(tǒng)數(shù)據(jù)模型全面介紹_第2頁
安邦BI系統(tǒng)數(shù)據(jù)模型全面介紹_第3頁
安邦BI系統(tǒng)數(shù)據(jù)模型全面介紹_第4頁
安邦BI系統(tǒng)數(shù)據(jù)模型全面介紹_第5頁
已閱讀5頁,還剩42頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、安邦BI系統(tǒng)數(shù)據(jù)模型介紹主題題維度建模模的基本本概念模型概述述模型介紹紹模型運(yùn)用用方法與與技巧相關(guān)技術(shù)術(shù)問題如何建立立分析集集市模型型行業(yè)經(jīng)驗(yàn)驗(yàn)BI.Insurance DWM工作組和和建模持續(xù)發(fā)展展業(yè)務(wù)需求求安邦分析集市模型業(yè)務(wù)驅(qū)動(dòng)動(dòng)根據(jù)固定定報(bào)表和和KPI、持續(xù)率率、承保保理賠、執(zhí)行力力、再保保五個(gè)數(shù)數(shù)據(jù)集市市的業(yè)務(wù)務(wù)需求,結(jié)合BI.InsuranceDWM的建模方方法,建立Taiping EDW分析集市市模型分析集市市模型概概念維度建模模一種非規(guī)規(guī)范化的的關(guān)系模模型由一組屬屬性構(gòu)成成的表所所組成表跟表之之間的關(guān)關(guān)系通過過關(guān)鍵字字和外鍵鍵來定義義以良好的的可理解解性和方方便的產(chǎn)產(chǎn)生報(bào)表表來

2、進(jìn)行行數(shù)據(jù)組組織,很很少考慮慮修改的的性能通過SQL或者相關(guān)關(guān)的工具具實(shí)現(xiàn)數(shù)數(shù)據(jù)的查查詢和維維護(hù)分析集市市模型概概念事實(shí)表(一)每一個(gè)事事實(shí)表通通常包含含了業(yè)務(wù)務(wù)需求所所關(guān)心的的一系列列的指標(biāo)標(biāo)值每一個(gè)事事實(shí)表的的行包括括具有可加加性的數(shù)數(shù)值型的的指標(biāo)值值文本事實(shí)實(shí)通常具具有不可可預(yù)見的的內(nèi)容,很難進(jìn)進(jìn)行分析析與維表相相連接的的外鍵通常具有有兩個(gè)和和兩個(gè)以以上的外外鍵外鍵之間間表示維維表之間間多對(duì)多多的關(guān)系系分析集市市模型概概念事實(shí)表(二)事實(shí)表的的特征非常的大大包含含幾萬、幾十萬萬甚至幾幾百幾千千條的記記錄內(nèi)容相對(duì)對(duì)的窄列列數(shù)數(shù)較少經(jīng)常發(fā)生生變化現(xiàn)現(xiàn)實(shí)實(shí)世界中中新事件件的發(fā)生生事實(shí)實(shí)表中增增

3、加一條條記錄典型情況況下,僅僅僅是數(shù)數(shù)據(jù)的追追加事實(shí)表的的使用各類指標(biāo)標(biāo)值的聚聚集計(jì)算算分析集市市模型概概念維表(一一)每一張維維表對(duì)應(yīng)應(yīng)現(xiàn)實(shí)世世界中的的一個(gè)對(duì)對(duì)象或者者概念例如如:客戶戶、產(chǎn)品品、保單單、標(biāo)的的、案件件維表的特特征包含了眾眾多描述述性的屬屬性列如保單維維表里的的銷售渠渠道、保保費(fèi)區(qū)間間、風(fēng)險(xiǎn)險(xiǎn)等級(jí)等等通常情況況下,跟跟事實(shí)表表相比,行數(shù)相相對(duì)較小小通常 10萬條內(nèi)容相對(duì)對(duì)固定幾乎就是是一類查查找表分析集市市模型概概念維表(二二)維表的應(yīng)應(yīng)用基于維屬屬性的過過濾(切切片、切切塊等)基于維屬屬性的各各種聚集集操作報(bào)表中各各類標(biāo)簽簽的主要要來源事實(shí)表通通過維表表進(jìn)行引引用分析集市市

4、模型概概念Facts屬性個(gè)數(shù)數(shù)少(窄窄)記錄行數(shù)數(shù)多(大大)數(shù)值型指指標(biāo)隨著時(shí)間間的推移移,數(shù)據(jù)據(jù)增長Dimensions屬性個(gè)數(shù)數(shù)多(寬寬)記錄行數(shù)數(shù)少(小?。┟枋鲂詫賹傩造o態(tài)的,很少發(fā)發(fā)生變化化 事實(shí)表與與維表的的比較分析主題題域數(shù)據(jù)據(jù)(AnalyticalSubject Areas)通過事實(shí)實(shí)(Facts)和維度度(Dimensions)模型方方式表達(dá)達(dá),為典典型保險(xiǎn)險(xiǎn)分析應(yīng)應(yīng)用提供供分析型型數(shù)據(jù)架架構(gòu),為為數(shù)據(jù)集集市提供供統(tǒng)一的的指標(biāo)和和維度,為數(shù)據(jù)據(jù)應(yīng)用提提供統(tǒng)一一的數(shù)據(jù)據(jù)信息。分析主題題域數(shù)據(jù)據(jù),將業(yè)業(yè)務(wù)需求求階段定定義的分分析主題題域,按按照維度度建模方方法,格格式化成成符合維維

5、度事事實(shí)表的的星型模模型或雪雪花模型型。其中中維度信信息由核核心原子子數(shù)據(jù)按按照定義義的層次次形成相相關(guān)的維維度視圖圖,事實(shí)實(shí)表數(shù)據(jù)據(jù)通過核核心原子子數(shù)據(jù)相相關(guān)主題題域數(shù)據(jù)據(jù)經(jīng)過匯匯總計(jì)算算得到。核心原原子數(shù)據(jù)據(jù)和分析析數(shù)據(jù)分分別映射射到不同同的數(shù)據(jù)據(jù)集市中中。其中,典典型的分分析主題題域如通通用承保保分析(Universalunderwriting analysis)如下圖圖:分析集市市模型設(shè)設(shè)計(jì)步驟驟需求整理指標(biāo)標(biāo)維度矩矩陣設(shè)計(jì)集市市層模型型設(shè)計(jì)分析析層模型型維度指標(biāo)標(biāo)矩陣維度指標(biāo)標(biāo)矩陣是是把需求求轉(zhuǎn)化為為多維模模型的重重要工具具業(yè)務(wù)分析析需求舉舉例與上一年年相比,各險(xiǎn)種種所占的的份額有有

6、何差異異?每個(gè)機(jī)構(gòu)構(gòu)在各險(xiǎn)險(xiǎn)種所占占份額是是多少?機(jī)構(gòu)險(xiǎn)種時(shí)間2006和2007年度各險(xiǎn)險(xiǎn)種份額額對(duì)比20062007Thousands2006年度各機(jī)機(jī)構(gòu)在各各險(xiǎn)種上上的份額額維度建模模舉例時(shí)間機(jī)構(gòu)險(xiǎn)種客戶主題題維度建模模的基本本概念模型概述述模型介紹紹模型運(yùn)用用方法與與技巧相關(guān)技術(shù)術(shù)問題元數(shù)據(jù)模型在整整個(gè)系統(tǒng)統(tǒng)架構(gòu)中中的定位位ETL過程核心收付車險(xiǎn)理賠財(cái)務(wù)面向業(yè)務(wù)務(wù)應(yīng)用數(shù)據(jù)集市Cube最終用戶基本上與與業(yè)務(wù)數(shù)數(shù)據(jù)同構(gòu)構(gòu)保留詳細(xì)細(xì)交易數(shù)數(shù)據(jù)數(shù)據(jù)倉庫庫面向分析主題輕度匯總數(shù)據(jù)Star Schema 建模中間表財(cái)務(wù)賬戶活動(dòng)理賠事件收付費(fèi)處理資金供應(yīng)角色實(shí)物地理位置協(xié)議產(chǎn)品分析層分析層模模型主題題

7、域分析層模模型每個(gè)個(gè)主題域域?yàn)橥愵惖臉I(yè)務(wù)務(wù)處理,共享相相同的維維度承保理賠賠分析記錄安邦邦保險(xiǎn)所所關(guān)注的的主要承承保理賠賠業(yè)務(wù)指指標(biāo)。收付費(fèi)分分析記錄財(cái)務(wù)務(wù)收付中中應(yīng)收保保費(fèi)、實(shí)實(shí)收保費(fèi)費(fèi)、應(yīng)收收率、應(yīng)應(yīng)付賠款款、實(shí)付付賠款等等收付類類信息。核賠效率率分析記錄理賠賠環(huán)節(jié)中中查勘、定損、核損、繕制過過程的相相關(guān)指標(biāo)標(biāo)。主題題維度建模模的基本本概念模型概述述模型介紹紹模型運(yùn)用用方法與與技巧相關(guān)技術(shù)術(shù)問題分析層模模型結(jié)構(gòu)構(gòu)收付費(fèi)分分析的星星型結(jié)構(gòu)構(gòu)分析層模模型介紹紹“承保理理賠分析析事實(shí)表表”、“收付費(fèi)費(fèi)分析事事實(shí)表”、“核核賠效率率分析事事實(shí)表”都是經(jīng)經(jīng)輕度匯匯總生成成的表,它們?nèi)慷际鞘鞘聞?wù)

8、型型事實(shí)表表中間事實(shí)實(shí)表都是是經(jīng)過版版本化的的歷史表表,保存存最細(xì)粒粒度的數(shù)數(shù)據(jù)中間事實(shí)實(shí)表主要要用于生生成輕度度匯總表表的過渡渡,除此此之外,通過冗冗余相關(guān)關(guān)屬性,中間事事實(shí)表的的設(shè)計(jì)也也考慮了了其它無無法從直直接從分分析層計(jì)計(jì)算的指指標(biāo)的計(jì)計(jì)算事務(wù)型事事實(shí)和快快照型事事實(shí)機(jī)構(gòu)險(xiǎn)種日期未決變化201010210112008-9-121000201010210112008-9-13-300201010210112008-9-122200201020120312008-9-12100201020220012008-9-121000201020220012008-9-131200201020220

9、012008-9-14-2200事務(wù)型快照型快照型事事實(shí)表的的指標(biāo)通通常包含含時(shí)點(diǎn)值值,隨著著時(shí)間積積累,維維度組合合會(huì)越來來越細(xì),此類型型的事實(shí)實(shí)表通常常用于粒粒度較粗粗的數(shù)據(jù)據(jù)集市或或Cube;而事務(wù)務(wù)型事實(shí)實(shí)表的度度量都是是可累加加的,其其對(duì)于維維度較多多的輕度度匯總表表是有利利。如果果OLAP server支持在事事務(wù)型事事實(shí)表上上計(jì)算時(shí)時(shí)點(diǎn)值,建議在在維度較較細(xì)的Cube上使用事事務(wù)型事事實(shí)。機(jī)構(gòu)險(xiǎn)種日期期末未決201010210112008-9-121000201010210112008-9-13700201010210112008-9-142900201020120312008-

10、9-12100201020120312008-9-13100201020120312008-9-14100201020220012008-9-121000201020220012008-9-132200201020220012008-9-140中間層歷歷史數(shù)據(jù)據(jù)的版本本化數(shù)據(jù)倉庫庫中的歷歷史數(shù)據(jù)據(jù)決不會(huì)會(huì)被刪除除或覆蓋蓋,因此此需要加加入數(shù)據(jù)據(jù)版本特特性來區(qū)區(qū)分隨時(shí)時(shí)間變化化的業(yè)務(wù)務(wù)信息,使得在在任一給給定時(shí)間間點(diǎn)上都都能檢索索到正確確的數(shù)據(jù)據(jù)。數(shù)據(jù)是否否需要版版本化,首先依依賴于實(shí)實(shí)體是否否有時(shí)變變特性,比如“報(bào)案信信息”通通常是在在某個(gè)時(shí)時(shí)間點(diǎn)上上發(fā)生,它就沒沒有時(shí)變變特性,因此就就不需要

11、要版本化化。在實(shí)體中中加入時(shí)時(shí)間戳屬屬性可以以實(shí)現(xiàn)數(shù)數(shù)據(jù)版本本化,這這個(gè)時(shí)間間戳可以以基于業(yè)業(yè)務(wù)涵義義,如對(duì)對(duì)保單的的某次批批改的生生效日期期;也可可以僅僅僅是技術(shù)術(shù)上的,比如員員工某項(xiàng)項(xiàng)登記信信息被修修改,則則生成新新的員工工記錄,并指定定該記錄錄的有效效(Valid)期間,ETL處理需要要實(shí)現(xiàn)數(shù)數(shù)據(jù)相鄰鄰版本時(shí)時(shí)間戳的的鏈接。需要為版版本化的的實(shí)體找找出一個(gè)個(gè)錨ID來唯一標(biāo)標(biāo)識(shí)每個(gè)個(gè)數(shù)據(jù)實(shí)實(shí)例,比比如保單單實(shí)體的的錨ID可以是保保單號(hào),表明該該實(shí)體中中最原子子的粒度度是保單單。時(shí)間戳與與數(shù)據(jù)版版本業(yè)務(wù)信息息的不同同版本的的時(shí)間鏈鏈時(shí)間戳(start_date/end_date)員工姓名職位

12、離職時(shí)間start_dateend_date張三初級(jí)核保人2006-5-212007-12-3張三中級(jí)核保人2007-12-39999-12-31李四業(yè)務(wù)員2004-3-122006-10-8李四業(yè)務(wù)經(jīng)理2006-10-82008-5-9李四業(yè)務(wù)經(jīng)理2008-5-92008-5-99999-12-31以上start_date為紅色的的是該數(shù)數(shù)據(jù)實(shí)例例被創(chuàng)建建時(shí)的版版本,該該值從邏邏輯上看看應(yīng)該為為數(shù)據(jù)的的業(yè)務(wù)創(chuàng)創(chuàng)建日期期,比如如入職日日期,但但為了避避免受到到數(shù)據(jù)質(zhì)質(zhì)量的影影響,我我們通常常把每個(gè)個(gè)數(shù)據(jù)實(shí)實(shí)例的第第一個(gè)版版本的start_date置為1900-01-01承保中間間表場景景示例保

13、單號(hào)批單號(hào)保險(xiǎn)起期保險(xiǎn)金額保費(fèi)核保日期批改原因start dateend date00012006-3-712000802006-3-4N/A1900-1-12006-5-18000100012006-3-7002006-5-18注銷2006-5-189999-12-3100022006-4-19223001202006-4-7N/A1900-1-12006-5-10000200022006-4-19223001202006-5-10修改2006-5-102006-5-21000200032006-4-19223001382006-5-21加保2006-5-219999-12-31000320

14、07-1-121200008902007-1-8N/A1900-1-19999-12-3100042007-5-2570005002007-4-22N/A1900-1-19999-12-3100052008-3-1440000036002008-3-8N/A1900-1-12008-4-6000500042008-3-1431000030002008-4-6退保2008-4-62008-4-16000500052006-3-1431000030002008-4-16修改2008-4-169999-12-31收付費(fèi)中中間表場場景示例例單據(jù)號(hào)type狀態(tài)應(yīng)收保費(fèi)實(shí)收保費(fèi)應(yīng)付賠款實(shí)付賠款應(yīng)付手續(xù)費(fèi)實(shí)

15、付手續(xù)費(fèi)start dateend date0001保費(fèi)應(yīng)收2000.00 0.00 1900-1-12006-5-180001保費(fèi)實(shí)收2000.00 2000.00 2006-5-189999-12-310002手續(xù)費(fèi)應(yīng)付132.00 0.00 1900-1-12006-5-100002手續(xù)費(fèi)實(shí)付132.00 132.00 2006-5-102006-5-110002手續(xù)費(fèi)沖正132.00 0.00 2006-5-119999-12-310003保費(fèi)應(yīng)收10000.00 0.00 1900-1-19999-12-310004賠款應(yīng)付26700.00 0.00 1900-1-19999-12-

16、310005賠款應(yīng)付14700.00 0.00 1900-1-12006-4-60005賠款實(shí)付14700.00 14700.00 2006-4-69999-12-310006保費(fèi)應(yīng)收3500.00 0.00 1900-1-19999-12-31理賠中間間事實(shí)表表場景示示例賠案號(hào)次數(shù)立案日期估損金額賠付金額結(jié)案日期結(jié)案狀態(tài)start dateend date000112006-3-730009999-12-31N1900-1-12006-53-7300032002006-5-18Y2006-5-189999-12-31000212006-4-19120009999-1

17、2-31N1900-1-12006-5-10000212006-4-19110009999-12-31N2006-5-102006-5-21000212006-4-1911000100002006-5-21Y2006-5-219999-12-31000312007-1-129009999-12-31N1900-1-19999-12-31000412007-5-2570009999-12-31N2007-5-29999-12-31000512008-312-31N1900-1-12006-4-6000512008-3-1421000200002006-4-6Y2006-

18、4-69999-12-31000522006-4-163003002006-5-26Y1900-1-19999-12-31中間層的的構(gòu)建算算法請(qǐng)安邦項(xiàng)項(xiàng)目組自自行用Visio畫出算法法流程圖圖,分頁頁貼在此此處分析層模模型未涵涵蓋的特特殊分析析應(yīng)用需求中有有部分的的指標(biāo)在在計(jì)算上上比較獨(dú)獨(dú)特,且且與其它它指標(biāo)沒沒有太多多的共享享價(jià)值,因此未未納入分分析層模模型的考考查范疇疇,這些些指標(biāo)主主要有:核保效率率分析用mid_policy_fact與核保信信息表關(guān)關(guān)聯(lián),再再經(jīng)過聚聚合計(jì)算算可得到到相應(yīng)的的分析指指標(biāo)理財(cái)險(xiǎn)網(wǎng)網(wǎng)點(diǎn)活動(dòng)動(dòng)率該指標(biāo)為為非累計(jì)計(jì)指標(biāo),不考慮慮安置在在分析層層,可在在構(gòu)建CUBE

19、時(shí)按原始始算法計(jì)計(jì)算,但但日、月月、季、年的匯匯總值要要分別計(jì)計(jì)算車貸險(xiǎn)指指標(biāo)該類指標(biāo)標(biāo)的數(shù)據(jù)據(jù)源比較較特殊,不考慮慮建立分分析層,可在構(gòu)構(gòu)建CUBE時(shí)按原始始算法計(jì)計(jì)算從中間層層到分析析層承保理理賠簽單類只計(jì)算保保單,口口徑為:核保日日期在當(dāng)當(dāng)期andstart_date=1900-1-1主要指標(biāo)標(biāo)有:保保險(xiǎn)金額額、保單單保費(fèi)、保單筆筆數(shù)、累累計(jì)儲(chǔ)金金、已驗(yàn)驗(yàn)車數(shù)量量、應(yīng)驗(yàn)驗(yàn)車數(shù)量量需要減去去退保和和注銷會(huì)計(jì)年度度類不考慮版版本,所所有記錄錄一起計(jì)計(jì)算,口口徑為:核保日日期在當(dāng)當(dāng)期保額和保保費(fèi)只累累計(jì)變化化值主要指標(biāo)標(biāo)有:保保費(fèi)收入入、批增增批減保保費(fèi)(件件數(shù))、退保(注銷)保費(fèi)(件數(shù))等理

20、賠類口徑:結(jié)結(jié)案日期期在當(dāng)期期或估損損修改日日期在當(dāng)當(dāng)期部分指標(biāo)標(biāo)只考慮慮起始兩兩個(gè)版本本,即立立案和結(jié)結(jié)案,比比如立案案估損金金額、結(jié)結(jié)案天數(shù)數(shù)主要指標(biāo)標(biāo)有:已已決筆數(shù)數(shù)、已決決賠款、未決筆筆數(shù)變化化、未決決賠款變變化、立立案估損損金額、估損偏偏差絕對(duì)對(duì)值、加加權(quán)估損損金額、結(jié)案天天數(shù)特殊口徑徑類已賺保費(fèi)費(fèi)算算法參見見“模型型運(yùn)用方方法與技技巧”有部分指指標(biāo)不需需要定義義在分析析層,因因?yàn)樗鼈儌兛梢詮膹囊陨现钢笜?biāo)衍生生,比如如車險(xiǎn)續(xù)續(xù)保指標(biāo)標(biāo)、理財(cái)財(cái)險(xiǎn)指標(biāo)標(biāo),都可可以從承承保理賠賠分析表表以保險(xiǎn)險(xiǎn)止期維維度為口口徑聚合合生成。從中間層層到分析析層收付費(fèi)費(fèi)收付費(fèi)指指標(biāo)的主主要口徑徑基本上上都是

21、以以收付確確認(rèn)日期期來計(jì)算算,在源源系統(tǒng)中中體現(xiàn)為為應(yīng)收(付)確認(rèn)日期期和實(shí)收收(付)確認(rèn)日期期需求中要要求按幣幣種分別別展現(xiàn)人人民幣和和非人民民幣的統(tǒng)統(tǒng)計(jì)值,由于本本事實(shí)表表已經(jīng)包包含保單單維度,因此這這些指標(biāo)標(biāo)都可以以根據(jù)保保單維度度中的幣幣種重新新匯總生生成應(yīng)收保費(fèi)費(fèi)變化的的計(jì)算規(guī)規(guī)則是:應(yīng)收一一筆保費(fèi)費(fèi)以正數(shù)數(shù)累計(jì),實(shí)收一一筆保費(fèi)費(fèi)以負(fù)數(shù)數(shù)累計(jì),對(duì)實(shí)收收的沖正正以正數(shù)數(shù)累計(jì)滾動(dòng)12個(gè)月財(cái)務(wù)務(wù)保費(fèi)收收入是應(yīng)應(yīng)收保費(fèi)費(fèi)收入的的衍生指指標(biāo)核賠效率率分析核賠效率率分析的的指標(biāo)基基本都有有共享的的維度,因此為為其建立立一個(gè)分分析層主主題是合合適的核賠效率率分析涉涉及的源源表比較較分散,且增量量機(jī)

22、制較較為復(fù)雜雜,因此此建立中中間表有有一定的的難度,目前的的策略是是參照原原指標(biāo)算算法分別別計(jì)算出出各指標(biāo)標(biāo),并插插入一臨臨時(shí)表中中,再對(duì)對(duì)該表執(zhí)執(zhí)行聚合合操作由于源系系統(tǒng)可能能會(huì)更新新核賠數(shù)數(shù)據(jù)的狀狀態(tài),因因而導(dǎo)致致部分指指標(biāo)存在在“過期期”現(xiàn)象象,在目目前沒有有歷史數(shù)數(shù)據(jù)支持持的情況況,我們們的解決決辦法是是由業(yè)務(wù)務(wù)部門確確定一個(gè)個(gè)過期閥閥值天數(shù)數(shù)N,超超過N天天之前的的指標(biāo)不不會(huì)再過過期,那那么每天天加載核核賠效率率事實(shí)表表時(shí),不不僅僅計(jì)計(jì)算當(dāng)天天的事實(shí)實(shí)數(shù)據(jù),而是把把N天之之前的數(shù)數(shù)據(jù)也都都復(fù)算一一遍主題題維度建模模的基本本概念模型概述述模型介紹紹模型運(yùn)用用方法與與技巧相關(guān)技術(shù)術(shù)問題數(shù)

23、據(jù)版本本的截取取時(shí)間點(diǎn)點(diǎn)查詢出2008-4-10各業(yè)務(wù)員員的數(shù)據(jù)據(jù):select*from業(yè)務(wù)員表表wherestart_date 2008-4-10保單中間間表連接接員工表表獲取員員工的職職位屬性性:selecta.policy, ,b.職位from mid_policy_facta,業(yè)務(wù)員表表bwherea.c_emp_cde= b.c_emp_cdeandb.start_date t_udr_date截取時(shí)間間為常量量截取時(shí)間間為連接接主表的的相關(guān)時(shí)時(shí)間字段段時(shí)間鏈的的生成技技巧假定經(jīng)過過相應(yīng)的的處理后后得到一一個(gè)數(shù)據(jù)據(jù)集T,T可以是一一個(gè)臨時(shí)時(shí)表、視視圖或子子查詢,并包含含一個(gè)日日期字

24、段段Start_date(不可有空空值)作為時(shí)間間鏈的開開始日期期,但End_date還未生成成,則可可以用以以下SQL生成時(shí)間間鏈:Selectanchor_id, ,start_date,lead(start_date,1,to_date(99991231,yyyymmdd)over(partition by anchor_idorderbystart_date)asend_dateFrom T;其中Anchor_id是數(shù)據(jù)集集的錨ID,比如保保單號(hào)、單據(jù)號(hào)號(hào)等歷史表增增量加載載策略在常規(guī)情情況下,該算法法也適合合全量加加載,此此時(shí)數(shù)據(jù)據(jù)集是全全量數(shù)據(jù)據(jù),而目目標(biāo)表的的初始狀狀況是空空表。

25、由于目標(biāo)標(biāo)表中要要求第一一條版本本記錄的的Start_date應(yīng)該為1900-1-1,這里的的算法要要考慮T01的增量在在目標(biāo)表表中沒有有前續(xù)版版本記錄錄的情況況已賺保費(fèi)費(fèi)的計(jì)算算以上有效效時(shí)間段段不能采采用保單單版本的的時(shí)間鏈鏈,而要要按業(yè)務(wù)務(wù)上的保保單生效效規(guī)則來來確定時(shí)時(shí)間范圍圍一般情況況下,保保單的生生效開始始日期就就是保險(xiǎn)險(xiǎn)起期,但對(duì)于于倒簽單單,則按按核保日日期計(jì)算算,因此此回避了了在此之之前已匯匯總的漏漏算問題題最好在承承保中間間表中事事先計(jì)算算出業(yè)務(wù)務(wù)有效時(shí)時(shí)間范圍圍,作為為業(yè)務(wù)時(shí)時(shí)間鏈,不僅避避免在匯匯總指標(biāo)標(biāo)時(shí)多做做計(jì)算,而且有有利于測測試時(shí)核核對(duì)數(shù)據(jù)據(jù)由于涉及及到除法法,

26、如果果時(shí)間維維的粒度度太細(xì),可能導(dǎo)導(dǎo)致過多多的精度度誤差,建議匯匯總表中中該指標(biāo)標(biāo)字段保保留更多多的小數(shù)數(shù)位,比比如68位2007.12007.6安邦以前前的算法法累加各版版本保費(fèi)費(fèi)變化乘乘以當(dāng)期期內(nèi)的保保險(xiǎn)期限限時(shí)間段段在當(dāng)前前保險(xiǎn)期期限內(nèi)的的占比2007.12007.6較準(zhǔn)確的的算法累加各版版本當(dāng)前前保費(fèi)乘乘以當(dāng)期期內(nèi)的有有效時(shí)間間段在當(dāng)當(dāng)前保險(xiǎn)險(xiǎn)期限內(nèi)內(nèi)的占比比每個(gè)線段段表示保保單各版版本用于于計(jì)算當(dāng)當(dāng)期有效效天數(shù)的的基準(zhǔn)時(shí)時(shí)間段,而被陰陰影覆蓋蓋的部分分作為時(shí)時(shí)間占比比的分子子承保理賠賠分析應(yīng)應(yīng)用場景假假設(shè)Ply_prof_idDpt_id統(tǒng)計(jì)月份簽單件數(shù)已決件數(shù)未決件數(shù)變化10012

27、0012007.2103100120012007.321-1100120022007.3101100220022007.3112100120012007.4011100120022007.4102100220022007.421-1100220032007.4101100220032007.5100100120022007.5010100220022007.501-1100220032007.6011Ply_prof_id保險(xiǎn)起期10012007.210022007.3Ply_prof_dm為簡化起起見,假假定保單單維表只只有一個(gè)個(gè)維屬性性:保險(xiǎn)險(xiǎn)起期(月)DM_FACT承保理賠賠分析事事實(shí)表

28、經(jīng)經(jīng)過聚合合計(jì)算后后生成的的局部視視圖,含含有三個(gè)個(gè)指標(biāo),除統(tǒng)計(jì)計(jì)月份外外的維度度組合有有四種(不同的的顏色區(qū)區(qū)分)承保理賠賠分析應(yīng)應(yīng)用轉(zhuǎn)換成成快照型型事實(shí)經(jīng)過與月月維表的的分區(qū)外外連接,以上查查詢填充充了遺漏漏的月份份,并利利用分析析函數(shù)計(jì)計(jì)算出“期末未未決”這這個(gè)時(shí)點(diǎn)點(diǎn)值??煽梢岳糜么瞬樵?cè)兘ubeDM_FACT應(yīng)該是經(jīng)經(jīng)聚合后后粒度已已經(jīng)較粗粗的事實(shí)實(shí),可以以是表、視圖、物化視視圖或子子查詢可以通過過對(duì)月維維表增加加查詢條條件來減減少最終終快照型型事實(shí)的的維度組組合,比比如保單單維表中中實(shí)際上上是包含含“核保保月份”的,則則可以增增加一個(gè)個(gè)連接條條件為“v1.mon_id=核保月份

29、份”,但但這種做做法必須須要有數(shù)數(shù)據(jù)質(zhì)量量的保證證會(huì)計(jì)年度度的報(bào)表表或分析析應(yīng)用可可以在該該查詢結(jié)結(jié)果的基基礎(chǔ)上直直接以mon_id為時(shí)間維維度進(jìn)行行聚合得得到WITH v1 AS (SELECTmon_idFROM cal_monWHERE mon_id=200706)SELECTply_prof_id,dpt_id,mon_id,簽單件數(shù)數(shù),已決件數(shù)數(shù),sum(未決件數(shù)數(shù)變化) OVER(PARTITION BY ply_prof_id,dpt_idORDERBYmon_idROWSUNBOUNDEDPRECEDING) as期末未決決件數(shù)FROM(SELECT ply_prof_id,d

30、pt_id,v1.mon_id,簽單件數(shù)數(shù),已決件數(shù)數(shù),未決決件數(shù)變變化FROM dm_factPARTITION BY (ply_prof_id,dpt_id)RIGHTOUTERJOIN v1ON(v1.mon_id =統(tǒng)計(jì)月份份)承保理賠賠分析應(yīng)應(yīng)用保單年年度算法法保單年度度分析是是在兩個(gè)個(gè)時(shí)間維維度上的的快照型型事實(shí),兩個(gè)時(shí)時(shí)間維度度分別是是保險(xiǎn)起起期和截截止月份份,所有有指標(biāo)都都是在截截止月份份維度上上的時(shí)點(diǎn)點(diǎn)值,計(jì)計(jì)算該快快照型事事實(shí)可參參考下面面的SQL。該算法同同樣可以以增加條條件減少少維度組組合,比比如通常常在保險(xiǎn)險(xiǎn)責(zé)任結(jié)結(jié)束N年后,保保單年度度分析的的價(jià)值已已經(jīng)減退退,因此此可以在在連接條條件中增增加“v1.mon_id=pf.保險(xiǎn)止期期+ N”,注意:由由于實(shí)際際模型中中保單維維表不止止保險(xiǎn)起起期一個(gè)個(gè)屬性,則以下下查詢?cè)谠诰S度上上還存在在重復(fù)值值,直接接使用需需要再進(jìn)進(jìn)行聚合合。WITH v1 AS (SELECTmon_idFROM cal_monWHERE mon_id=pf.保險(xiǎn)起期期)承保理賠賠分析應(yīng)應(yīng)用保單年年度快照照事實(shí)保險(xiǎn)起期Dpt_id截止月份簽單件數(shù)已決件數(shù)未決件數(shù)2007.220012007.21032007.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論