數(shù)據(jù)倉(cāng)庫(kù)面試題_第1頁
數(shù)據(jù)倉(cāng)庫(kù)面試題_第2頁
數(shù)據(jù)倉(cāng)庫(kù)面試題_第3頁
數(shù)據(jù)倉(cāng)庫(kù)面試題_第4頁
數(shù)據(jù)倉(cāng)庫(kù)面試題_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)倉(cāng)庫(kù)及BI工程師面試題集錦、,、.刖百1、介紹一下項(xiàng)目經(jīng)驗(yàn)、項(xiàng)目中的角色。一、數(shù)據(jù)庫(kù)1、 Oracle數(shù)據(jù)庫(kù),視圖與表的區(qū)別?普通視圖與物化視圖的區(qū)別?物化視圖的作用?i .視圖與表的區(qū)別1. 1、視圖是已經(jīng)編譯好的sql語句。而表不是2. 視圖沒有實(shí)際的物理記錄。而表有。3. 表是內(nèi)容,視圖是窗口4. 表只用物理空間而視圖不占用物理空間,視圖只是邏輯概念的存在,表可以及時(shí)四對(duì)它進(jìn)行修改,但視圖只能有創(chuàng)建的語句來修改ii .物化視圖與視圖區(qū)別1 .物化視圖和視圖差別非常大,不是幾句能說清物化視圖是自動(dòng)刷新或者手動(dòng)刷新的,視圖不用刷新物化視圖也可以直接update,但是不影響basetabl

2、e,對(duì)視圖的update反映到basetable±物化視圖主要用于遠(yuǎn)程數(shù)據(jù)訪問,物化視圖中的數(shù)據(jù)需要占用磁盤空間,視圖中不保存數(shù)據(jù)。2、 Oracle數(shù)據(jù)庫(kù),有哪幾類索引,分別有什么特點(diǎn)?a)1.單列索引與復(fù)合索引一個(gè)索引可以由一個(gè)或多個(gè)列組成,用來創(chuàng)建索引的列被稱為索引列”。單列索引是基于單列所創(chuàng)建的索引,復(fù)合索引是基于兩列或者多列所創(chuàng)建的索引。2 .唯一索引與非唯一索引唯一索引是索引列值不能重復(fù)的索引,非唯一索引是索引列可以重復(fù)的索引。無論是唯一索引還是非唯一索引,索引列都允許取NULL值。默認(rèn)情況下,Oracle創(chuàng)建的索引是不唯一索引。3.B樹索引B樹索引是按B樹算法組織并存放

3、索引數(shù)據(jù)的,所以B樹索引主要依賴其組織并存放索引數(shù)據(jù)的算法來實(shí)現(xiàn)快速檢索功能。4 .位圖索引位圖索引在多列查詢時(shí),可以對(duì)兩個(gè)列上的位圖進(jìn)行AND和OR操作,達(dá)到更好的查詢效果。5 .函數(shù)索引Oracle中不僅能夠直接對(duì)表中的列創(chuàng)建索引,還可以對(duì)包含列的函數(shù)或表達(dá)式創(chuàng)建索引,這種索引稱為位圖索引”。3、 Union與UnionAll的區(qū)另a)Union會(huì)對(duì)查詢結(jié)果進(jìn)行排序去重,效率比unionall低,unionall只是兩個(gè)查詢集的合并操作。建議使用Unionall,查詢出來后再對(duì)數(shù)據(jù)進(jìn)行去重操作。4、 對(duì)游標(biāo)的理解?游標(biāo)的分類?使用方法?游標(biāo)是映射在結(jié)果集中一行數(shù)據(jù)的位置實(shí)體,有了游標(biāo),用戶

4、就可以訪問結(jié)果集中的任何一條數(shù)據(jù)。游標(biāo)分為靜態(tài)游標(biāo)和REF游標(biāo),靜態(tài)游標(biāo)分為顯示游標(biāo)和隱式游標(biāo),顯示游標(biāo)使用步驟是聲明游標(biāo),打開游標(biāo),獲取記錄,關(guān)閉游標(biāo)。所有的DML語句為隱式游標(biāo),可以從游標(biāo)的屬性獲得sql語句的信息。REF游標(biāo)是動(dòng)態(tài)關(guān)聯(lián)結(jié)果集的臨時(shí)對(duì)象,使用步驟也是先要進(jìn)行聲明游標(biāo),然后打開游標(biāo),獲取記錄,關(guān)閉游標(biāo)。5、 如何查找和刪除表中的重復(fù)數(shù)據(jù)?給出方法或SQL。查詢表中重復(fù)數(shù)據(jù)。Select*frompeoplewhereidin(Selectidfrompeoplegroupbyidhavingcount(id)>1);Deletefrompeoplewhereidin(s

5、electidfrompeoplegroupbyidhavingcount(id)>1)androwidnotin(selectmin(rowid)frompeoplegroupbyidhacingcount(id)>1);創(chuàng)建索引有哪些需要注意的要點(diǎn)?a)一般來說,不需要為比較小的表創(chuàng)建索引(數(shù)據(jù)占用存儲(chǔ)空間小)b)即使是大表,如果經(jīng)常需要查詢的數(shù)據(jù)不超過10%到15%的話,那就沒有必要為其建立索引的必要。c)如對(duì)于一些重復(fù)內(nèi)容比較少的列,特別是對(duì)于那些定義了唯一約束的列。在這些列上建立索引,往往可以起到非常不錯(cuò)的效果。d)數(shù)據(jù)庫(kù)管理員,需要隔一段時(shí)間,如一年,對(duì)數(shù)據(jù)庫(kù)的索引進(jìn)行

6、優(yōu)化。該去掉的去掉,該調(diào)整的調(diào)整,以提高數(shù)據(jù)庫(kù)的性能。e)通常來說,表的索引越多,其查詢的速度也就越快。但是,表的更新速度則會(huì)降低。這主要是因?yàn)楸淼母拢ㄈ缤碇胁迦胍粭l記錄)速度,反而隨著索引的增加而增加。f)對(duì)于一些數(shù)據(jù)倉(cāng)庫(kù)或者決策型數(shù)據(jù)庫(kù)系統(tǒng),其主要用來進(jìn)行查詢。g)位圖索引。基數(shù)是位圖索引中的一個(gè)基本的定義,它是指數(shù)據(jù)庫(kù)表中某個(gè)字段內(nèi)容中不重復(fù)的數(shù)值。i. Oracle數(shù)據(jù)庫(kù)中,有哪幾種分區(qū)?各自特點(diǎn)是什么?作用是什么?分區(qū)索引的分類和作用?范圍分區(qū),散列分區(qū),復(fù)合分區(qū),索引分區(qū)ii. 表T(a,b,c,d),要根據(jù)字段c排序后取第2130條記錄顯示,請(qǐng)給出sql。select*fro

7、m(selectc.*,rownumasrnfrom(select*fromtorderbyc)c)wherernberween21and30;iii. 怎樣優(yōu)化數(shù)據(jù)庫(kù)?iv. 首先應(yīng)確定那里出現(xiàn)性能問題,一般一個(gè)調(diào)度時(shí)常都會(huì)有時(shí)間10g記錄,若發(fā)現(xiàn)某個(gè)調(diào)度時(shí)間過長(zhǎng),那么我們可以使用oracle自帶profiler進(jìn)行診斷出該模塊出現(xiàn)性能問題的sql。v. .找出問題sql后對(duì)表大小進(jìn)行分析,知道哪些是大表和小表。vi. .查看該sql執(zhí)行計(jì)劃(用autotrace)即可大概找出問題原因。vii. 查詢方面:查看是否未走索引,或sql寫法中有運(yùn)算或<>等影響走索引條件,或并未對(duì)關(guān)鍵

8、關(guān)聯(lián)字段創(chuàng)建索引,必要情況重建索引。viii. 刪除更新情況,盡量使用rowido9、華為開發(fā)流程是什么(CMMIa)華為接口人或業(yè)務(wù)提出需求文檔。b)我們根據(jù)需求文檔寫入概要設(shè)計(jì)。c)根據(jù)概要設(shè)計(jì)進(jìn)行開發(fā)。d)開發(fā)完成后進(jìn)行ut測(cè)試e)編寫詳細(xì)設(shè)計(jì)。f)上線后編寫廣品文檔ETL工具1、 Informatica中,Update組件叫什么?更新機(jī)制?2、 Informatica中,LookUp組件有哪幾類?區(qū)別是什么?3、Informatica中,如何調(diào)用存儲(chǔ)過程?4、Informatica中,工作流控制有哪些組件?5、Informatica優(yōu)化方案?6、DataStage的JOB有哪些類型?特

9、點(diǎn)分別是什么?7、DataStage中,如何設(shè)置paralleljob并行運(yùn)行?8、DataStage中,JoinStage與LookupStage組件在使用上有何區(qū)別?9、DataStage的優(yōu)化方案?10、 什么是維度?人們觀察數(shù)據(jù)的特定角度。例如,一個(gè)企業(yè)在考慮產(chǎn)品的銷售情況時(shí),通常從時(shí)間、地區(qū)和產(chǎn)品的不同角度來深入觀察產(chǎn)品的銷售情況。這里的時(shí)間、地區(qū)和產(chǎn)品就是維。11、 事實(shí)表、維度表是什么?12、 事實(shí)表:就是所有需要統(tǒng)計(jì)值的表;維度表:根據(jù)時(shí)間或地區(qū)需要分析的數(shù)據(jù)表。13、 DW維表分類a) 1.一致性維度b) 2.雜項(xiàng)維度c) 3.角色類14、 緩慢變化維a)隨著時(shí)間的推移維度中

10、的屬性,慢慢會(huì)改變。例如一個(gè)產(chǎn)品銷售地區(qū)之前為國(guó)內(nèi)省,現(xiàn)在上國(guó)際,為各個(gè)國(guó)家。15、 ETL分另1J是"Extract"、"Transform"、"Load"。16、datastage優(yōu)點(diǎn)a)優(yōu)點(diǎn)在于,把復(fù)雜的工作,分解成,易查錯(cuò)的job。三、模型設(shè)計(jì)1、有哪幾種模型設(shè)計(jì)方法?特點(diǎn)分別是什么?2、模型設(shè)計(jì)的步驟?確定該業(yè)務(wù)過程每個(gè)事實(shí)表的粒度確定維度的屬性確定維度的層次確定每個(gè)事實(shí)所需要關(guān)聯(lián)的維度確定數(shù)字型事實(shí),包括預(yù)先計(jì)算的確定緩慢變化維3、維度模型的設(shè)計(jì)方法?4、模型設(shè)計(jì)的思路?業(yè)務(wù)需求驅(qū)動(dòng)?數(shù)據(jù)驅(qū)動(dòng)?3、模型設(shè)計(jì)經(jīng)驗(yàn)說明。在概念模型設(shè)計(jì)、邏輯模型設(shè)計(jì)以及物理模型設(shè)計(jì)幾個(gè)階段主要的工作是什么?四、Cognos開發(fā)1、Cube刷新方案?2、報(bào)表數(shù)據(jù)權(quán)限控制方案?3、Cube增量刷新方案?五、Shell開發(fā)1、在Unix/Linux中,查看磁盤空間可以用哪些命令?2、在Unix/Linux中,壓縮和解壓縮文件可以用哪些命令?3、sed命令的作用?4、在Unix/Linux中,添加用戶用什么命令?5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論