



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
每??練5道數(shù)據(jù)倉庫建模?試題來源:CSDN作者:數(shù)據(jù)分析?Y每??練如果要對數(shù)據(jù)分析?試題進(jìn)?歸納總結(jié),基本可以分為三?類,分別是技術(shù)題、邏輯思維題、業(yè)務(wù)場景題。本欄?旨在為?伙伴們分享???經(jīng)典的數(shù)據(jù)分析?試題,?家在學(xué)習(xí)之余也可以進(jìn)??測,鞏固學(xué)習(xí)成果(?末贈送學(xué)習(xí)資料)今?,我們就數(shù)據(jù)倉庫建模部分總結(jié)了5道經(jīng)典的?試題,?起測測吧!1什么叫數(shù)據(jù)倉庫?數(shù)據(jù)倉庫的特點(diǎn)??先,?于?持決策,?向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,對多個異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)?了重組,并包含歷史數(shù)據(jù),?且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)?般不再修改。數(shù)據(jù)倉庫是?個?向主題的(SubjectOriented)、集成的(Integrate)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(TimeVariant)的數(shù)據(jù)集合,它?于?持企業(yè)或組織的決策分析處理。2數(shù)據(jù)倉庫和數(shù)據(jù)庫有什么區(qū)別?事務(wù)性數(shù)據(jù)庫和決策?持?jǐn)?shù)據(jù)庫的區(qū)別,當(dāng)然包括?標(biāo)、?途、設(shè)計(jì)等等1.數(shù)據(jù)是?向事務(wù)處的,數(shù)據(jù)是由?常的業(yè)務(wù)產(chǎn)?的,常更新;數(shù)據(jù)倉庫是?向主題的,數(shù)據(jù)來源于數(shù)據(jù)庫或?件,經(jīng)過?定的規(guī)則轉(zhuǎn)換得到,?來分析的。2.數(shù)據(jù)庫?般是?來存儲當(dāng)前交易數(shù)據(jù);數(shù)據(jù)倉庫存儲?般存儲的是歷史數(shù)據(jù)。3.數(shù)據(jù)庫的設(shè)計(jì)?般是符合三范式的,有最?的精確度和最?的冗余度,有利于數(shù)據(jù)的插?;數(shù)據(jù)倉庫的設(shè)計(jì)?般是星型的,有利于查詢。3數(shù)據(jù)倉庫的基本架構(gòu)是什么?數(shù)據(jù)源,ETL,datastage,ODS,datawarehouse,datamart,OLAP等等,可能為針對每?個結(jié)構(gòu)進(jìn)?發(fā)問啊1.數(shù)據(jù)源是數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)源泉,通常包括企業(yè)各類信息,包括存放于RDBMS中的各種業(yè)務(wù)處理數(shù)據(jù)和各類?檔數(shù)據(jù);各類是數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)源泉,通常包括企業(yè)各類信息,包括存放于RDBMS中的各種業(yè)務(wù)處理數(shù)據(jù)和各類?檔數(shù)據(jù);各類法律法規(guī)、市場信息和競爭對?的信息等等;2.數(shù)據(jù)的存儲與管理數(shù)據(jù)的存儲和管理是整個數(shù)據(jù)倉庫的核?,是關(guān)鍵。數(shù)據(jù)倉庫的組織管理?式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫,同時也決定了其對外部數(shù)據(jù)的表現(xiàn)形式。從數(shù)據(jù)倉庫的技術(shù)特點(diǎn)著?分析,來決定采?什么產(chǎn)品和技術(shù)來建?數(shù)據(jù)倉庫,然后針對現(xiàn)有各業(yè)務(wù)系統(tǒng)的數(shù)據(jù),進(jìn)?抽取、清理,并有效集成,按照主題進(jìn)?組織。數(shù)據(jù)倉庫按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(通常稱為數(shù)據(jù)集市)。3.OLAP服務(wù)器對需要的數(shù)據(jù)進(jìn)?有效集成,按多維模型予以組織,以便進(jìn)?多?度、多層次的分析,并發(fā)現(xiàn)趨勢。其具體實(shí)現(xiàn)可以分為:ROLAP(關(guān)系型在線分析處理)、MOLAP(多維在線分析處理)和HOLAP(混合型線上分析處理)。?ROLAP基本數(shù)據(jù)和聚合數(shù)據(jù)均存放在RDBMS之中;?MOLAP基本數(shù)據(jù)和聚合數(shù)據(jù)均存放于多維數(shù)據(jù)庫中;?HOLAP基本數(shù)據(jù)存放于RDBMS之中,聚合數(shù)據(jù)存放于多維數(shù)據(jù)庫中。4.前端?具主要包括各查詢?具、數(shù)據(jù)分析?具、數(shù)據(jù)挖掘?具、種報(bào)表?具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應(yīng)?開發(fā)?具。數(shù)據(jù)分析?具主要針對OLAP服務(wù)器。報(bào)表?具、數(shù)據(jù)挖掘?具主要針對數(shù)據(jù)倉庫。4模型設(shè)計(jì)的思路、業(yè)務(wù)需求與數(shù)據(jù)驅(qū)動構(gòu)造數(shù)據(jù)倉庫有兩種?式:??上?下??下?上BillInmon先?推崇“?上?下”的?式,即?個企業(yè)建?唯?的數(shù)據(jù)中?,就像?個數(shù)據(jù)的倉庫,其中數(shù)據(jù)是經(jīng)過整合、經(jīng)過清洗、去掉臟數(shù)據(jù)的、標(biāo)準(zhǔn)的,能夠提供統(tǒng)?的視圖。要建?這樣的數(shù)據(jù)倉庫,并不從它需要?持哪些應(yīng)???,?是要從整個企業(yè)的環(huán)境??,分析其中的概念,應(yīng)該有什么樣的數(shù)據(jù),達(dá)成概念完成整;(會考慮到很全?的設(shè)計(jì))RalphKimball先?推崇“?下?上”的?式,他認(rèn)為建設(shè)數(shù)據(jù)倉庫應(yīng)該按照實(shí)際的應(yīng)?需求,加載需要的數(shù)據(jù),不需要的數(shù)據(jù)不要加載到數(shù)據(jù)倉庫中。這種?式建設(shè)周期較短,客戶能夠很快看到結(jié)果。(針對客戶的需求,需求要什么就做什么)?者都要達(dá)到同?個?標(biāo):企業(yè)級數(shù)據(jù)倉庫。實(shí)際上在建設(shè)數(shù)據(jù)倉庫的時候,?般都參照這兩種?式結(jié)合使?沒有硬性規(guī)定。5模型設(shè)計(jì)的步驟
構(gòu)建企業(yè)級數(shù)據(jù)倉庫五步法:1.確定主題即確定數(shù)據(jù)分析或前端展現(xiàn)的主題。主題要體現(xiàn)出某???的各分析?度(維度)和統(tǒng)計(jì)數(shù)值型數(shù)據(jù)(量度)之間的關(guān)系,確定主題時要綜合考慮。2.確定量度確定主題后,需要考慮分析的技術(shù)指標(biāo)。它們?般為數(shù)據(jù)值型數(shù)據(jù),其中有些度量值不可以匯總;有些可以匯總起來,以便為分析者提供有?的信息。量度是要統(tǒng)計(jì)的指標(biāo),必須事先選擇恰當(dāng),基于不同的量度可以進(jìn)?復(fù)雜關(guān)鍵性指標(biāo)(KPI)的設(shè)計(jì)和計(jì)算。3.確定事實(shí)數(shù)據(jù)粒度確定量度之后,需要考慮該量度的匯總情況和不同維度下量度的聚合情況。例如:在業(yè)務(wù)系統(tǒng)中數(shù)據(jù)最?記錄到秒,?在將來分析需求中,時間只要精確到天就可以了。在ETL處理過程中,按天來匯總數(shù)據(jù),些時數(shù)據(jù)倉庫中量度的粒度就是”天”。如果不能確認(rèn)將來的分析需求中是否要精確的秒,那么,我們要遵循”最?粒度原則”。在數(shù)據(jù)倉庫中的事實(shí)表中保留每?秒的數(shù)據(jù),從?在后續(xù)建?多維分析模型(CUBE)的時候,會對數(shù)據(jù)提前進(jìn)?匯總,保障產(chǎn)?分析結(jié)果的效率。4.確定維度維度是分析的各個?度。例如:我們希望按照時間,或者按照地區(qū),或者按照產(chǎn)品進(jìn)?分析。那么這?的時間,地區(qū),產(chǎn)品就是相應(yīng)的維度?;诓煌木S度,可以看到各個量度匯總的情況,也可以基于所有的維度進(jìn)?交叉分析。維度的層次(Hierarchy)和級別(Level)。例如:在時間維度上,按照”度-季度-?”形成了?個層次,其中”年”,”季度”,”?”成為了這個層次的3個級別。我們可以將“產(chǎn)品?類-產(chǎn)品?類-產(chǎn)品”劃為?個層次,其中包含“產(chǎn)品?類”、“產(chǎn)品?類”、“產(chǎn)品”三個級別。我們可以將3個級別設(shè)置成?張數(shù)據(jù)表中的3個字段,?如時間維度;我們也可以使?三張表,分別保存產(chǎn)品?類,產(chǎn)品?類,產(chǎn)品三部分?jǐn)?shù)據(jù),?如產(chǎn)品維度。建?維度表時要充分使?代理鍵。代理鍵是數(shù)據(jù)值型的ID號碼(每張表的第?個字段),它唯?標(biāo)識了第?維度成員。在聚合時,數(shù)值型字段的匹配和?較,join效率?。同時代理鍵在緩慢變化維中,起到了對新數(shù)據(jù)與歷史數(shù)據(jù)的標(biāo)識作?。5.創(chuàng)建事實(shí)表在確定好事實(shí)數(shù)據(jù)和維度后,將考慮加載事實(shí)表。業(yè)務(wù)系統(tǒng)的的?筆筆?產(chǎn),交易記錄就是將要建?的事實(shí)表的原始數(shù)據(jù)。我們的做法是將原始表與維度表進(jìn)?關(guān)聯(lián),?成事實(shí)表。關(guān)聯(lián)時有為空的數(shù)據(jù)時(數(shù)據(jù)源臟),需要使?外連接,連接后將各維度的代理鍵取出放于事實(shí)表中,事實(shí)表除了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度專利技術(shù)價格保密合同書
- 2025年度休閑漁業(yè)發(fā)展魚塘承包經(jīng)營合同
- 2025年度護(hù)膚品專業(yè)渠道代理商招募合同
- 2025年度業(yè)主起訴解除物業(yè)服務(wù)合同法律依據(jù)與實(shí)踐應(yīng)用
- 2025年度商業(yè)街場地租賃合同解除書
- 2025年度大型活動安全預(yù)案人身免責(zé)及應(yīng)急處理合同
- 2025年度山地滑雪場租賃管理服務(wù)協(xié)議
- 2025年廣東環(huán)境保護(hù)工程職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試題庫含答案
- 2025年度智能公寓簡易版租賃合同
- 2025年度教育培訓(xùn)機(jī)構(gòu)中途入股投資及分紅合作協(xié)議
- 2024銷售人員年終工作總結(jié)2篇
- 2024年牛排行業(yè)分析報(bào)告及未來發(fā)展趨勢
- 智能微電網(wǎng)應(yīng)用技術(shù)
- 車間維修現(xiàn)場安全操作規(guī)程范文
- 【全套】醫(yī)院智能化系統(tǒng)報(bào)價清單
- 全面質(zhì)量管理體系條款對照表
- 高職工商企業(yè)管理專業(yè)人才培養(yǎng)方案
- 北師大版五年級數(shù)學(xué)上冊典型例題系列之期中專項(xiàng)練習(xí):分段計(jì)費(fèi)問題(解析版)
- 行政法學(xué)基礎(chǔ)講義
- 中建專項(xiàng)施工升降機(jī)安裝專項(xiàng)施工方案
- 錄用通知書offer錄取通知書
評論
0/150
提交評論