BI的選型、體系架構與相關技術_第1頁
BI的選型、體系架構與相關技術_第2頁
BI的選型、體系架構與相關技術_第3頁
BI的選型、體系架構與相關技術_第4頁
BI的選型、體系架構與相關技術_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、更多企業(yè)學院: 中小企業(yè)管理全能版版183套講座+89700份資料總經(jīng)理、高層管理49套講座+16388份資料中層管理學院46套講座+6020份資料國學智慧、易經(jīng)46套講座人力資源學院56套講座+27123份資料各階段員工培訓學院院77套講座+ 324份資料員工管理企業(yè)學院67套講座+ 8720份資料工廠生產(chǎn)管理學院52套講座+ 13920份資料財務管理學院53套講座+ 17945份資料銷售經(jīng)理學院56套講座+ 14350份資料銷售人員培訓學院72套講座+ 4879份資料更多企業(yè)學院: 中小企業(yè)管理全能版版183套講座+89700份資料總經(jīng)理、高層管理49套講座+16388份資料中層管理學院4

2、6套講座+6020份資料國學智慧、易經(jīng)46套講座人力資源學院56套講座+27123份資料各階段員工培訓學院院77套講座+ 324份資料員工管理企業(yè)學院67套講座+ 8720份資料工廠生產(chǎn)管理學院52套講座+ 13920份資料財務管理學院53套講座+ 17945份資料銷售經(jīng)理學院56套講座+ 14350份資料銷售人員培訓學院72套講座+ 4879份資料更多企業(yè)學院: 中小企業(yè)管理全能版版183套講座+89700份資料總經(jīng)理、高層管理49套講座+16388份資料中層管理學院46套講座+6020份資料國學智慧、易經(jīng)46套講座人力資源學院56套講座+27123份資料各階段員工培訓學院院77套講座+ 3

3、24份資料員工管理企業(yè)學院67套講座+ 8720份資料工廠生產(chǎn)管理學院52套講座+ 13920份資料財務管理學院53套講座+ 17945份資料銷售經(jīng)理學院56套講座+ 14350份資料銷售人員培訓學院72套講座+ 4879份資料什么是BI?商業(yè)智能也稱作BI,是是英文單詞Business Intelligence的的縮寫。商業(yè)智能能的概念最早在1996年年提出。當時將商商業(yè)智能定義為一一類由數(shù)據(jù)倉庫(或或數(shù)據(jù)集市)、查查詢報表、數(shù)據(jù)分分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復復等部分組成的、以幫助企業(yè)決策策為目的技術及其其應用。目前,商商業(yè)智能通常被理理解為將企業(yè)中現(xiàn)現(xiàn)有的數(shù)據(jù)轉化為為知識,幫助企業(yè)業(yè)做出

4、明智的業(yè)務務經(jīng)營決策的工具具。這里所談的數(shù)數(shù)據(jù)包括來自企業(yè)業(yè)業(yè)務系統(tǒng)的訂單單、庫存、交易賬賬目、客戶和供應應商等來自企業(yè)所所處行業(yè)和競爭對對手的數(shù)據(jù)以及來來自企業(yè)所處的其其他外部環(huán)境中的的各種數(shù)據(jù)。而商商業(yè)智能能夠輔助助的業(yè)務經(jīng)營決策策既可以是操作層層的,也可以是戰(zhàn)戰(zhàn)術層和戰(zhàn)略層的的決策。為了將數(shù)數(shù)據(jù)轉化為知識,需需要利用數(shù)據(jù)倉庫庫、聯(lián)機分析處理理(OLAP)工工具和數(shù)據(jù)挖掘等等技術。因此,從從技術層面上講,商商業(yè)智能不是什么么新技術,它只是是數(shù)據(jù)倉庫、OLAP和和數(shù)據(jù)挖掘等技術術的綜合運用。圖 1 商務智能的發(fā)發(fā)展因此,把商業(yè)智能看成成是一種解決方案案應該比較恰當。商業(yè)智能的關鍵是從許多來自

5、不同的企業(yè)運作系統(tǒng)的數(shù)據(jù)中提取出有用的數(shù)據(jù)并進行清理,以保證數(shù)據(jù)的正確性,然后經(jīng)過抽?。‥xtraction)、轉換(Transformation)和裝載(Load),即ETL過程,合并到一個企業(yè)級的數(shù)據(jù)倉庫里,從而得到企業(yè)數(shù)據(jù)的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具、OLAP工具等對其進行分析和處理(這時信息變?yōu)檩o助決策的知識),最后將知識呈現(xiàn)給管理者,為管理者的決策過程提供支持。c。圖 2 商務智能的原原理BI的選型要選型,首先要了解目目前市場上主流的的BI產(chǎn)品:數(shù)據(jù)庫方面,有DB2、Oracle、SQL Server、Teradata,早早先還有專門用于于數(shù)據(jù)倉庫

6、的Redbrick(被被IBM收編以后后,退出歷史舞臺臺)。M。ETL工具上,像Datastage、Powercenter都都是比較主流的,此此外,還有很多公公司也有自己的ETL產(chǎn)產(chǎn)品,例如SAS的的ETL Server、BO的Data Integrator等等。1。OLAP工具上,則還還可以細分為MOLAP(Muilt-Dimension OLAP,多維度型在線分析系統(tǒng))和ROLAP(Relational OLAP,關系型在線分析系統(tǒng)),前者可以選擇Hyperion、Cognos、Microsoft公司的產(chǎn)品,而后者可供選擇的余地就不多,像Microstrategy可能是目前能夠看得見市場份

7、額比較大的,以前和Redbrick一起。此外,還有一個叫Metacube的ROLAP工具,早在2000年以后也退出市場。B。數(shù)據(jù)挖掘產(chǎn)品領域,有有SAS、SPSS等等兩大廠家,而像像IBM、Teradata也也都有自己的挖掘掘工具。除此之外外,在報表服務器器、前端工具上的的選擇可就多了,其其中,Cognos、BO、Brio是是比較主流的。E。從這些主流產(chǎn)品來看,大大多是舶來品。國國內也有研發(fā)BI產(chǎn)產(chǎn)品的,但多限于于ETL、前端以以及數(shù)據(jù)挖掘產(chǎn)品品。j。從目前各類用戶的產(chǎn)品品選型過程來看,問問題多出在以下幾幾個方面。其一,只見樹木不見森森林,只顧得降低低單個工具的成本本,卻忽視了總體體成本。有些

8、大企企業(yè)在IT建設上上一擲千金,從不不在乎在購買產(chǎn)品品上投入多少,每每一塊都是選用最最好的。但是,更更多的企業(yè)則不得得不出于成本考慮慮,能省則省。除除了數(shù)據(jù)庫和OLAP工工具兩項之外,經(jīng)經(jīng)常動心思的地方方就是,設想如果果把ETL和前端端展現(xiàn)自己來開發(fā)發(fā)是不是會省點資資金出來。b。然而問題是,如果僅僅僅從單個產(chǎn)品的成成本考慮而忽視綜綜合的項目成本,最最后很可能會被難難以維護的程序所所困擾,甚至要完完全推翻重來,這這樣的成本恐怕會會更高。而對于那那些財大氣粗的大大企業(yè)來說,即便便選擇了每個領域域最好的產(chǎn)品,組組合起來也不一定定就是最好的。v。其二,評估報告難以客客觀。企業(yè)負責產(chǎn)產(chǎn)品選型的人,通通常

9、要求廠商提供供一份評估報告,要要列出幾種方案選選擇,各自優(yōu)劣何何在,最后得出哪哪種方案是最適合合自己的。M。如果從字面上理解此報報告,某種產(chǎn)品哪哪方面比較好,哪哪方面不好,這并并不客觀。對于廠廠商而言,這就是是一筆單子,當然然會盡量把自己產(chǎn)產(chǎn)品的優(yōu)勢體現(xiàn)出出來,而回避自己己的弱勢。同時對對于選型負責人來來說,也許其早就就對某種工具有好好感,或是跟某個個廠家的關系不錯錯,甚至有更進一一步的交易。這樣樣的情況,想客觀觀一點不容易。j。選型要點其實,如果是選擇這些些主流的產(chǎn)品的話話,大家知道一句句話,“沒有最好好的,只有最合適適的”。什么是最最合適?拋開上面面提到的幕后因素素,其實也就是三三點需要考

10、慮產(chǎn)品成本、開發(fā)發(fā)人員對這個產(chǎn)品品的熟悉程度、有有沒有類似案例。P。首先看成本。NCR、IBM和Oracle的的產(chǎn)品線完整,但但卻很貴。微軟的的產(chǎn)品便宜些,可可如果數(shù)據(jù)量大,恐恐怕又不太敢用它它,就更別談那些些不要錢的開源產(chǎn)產(chǎn)品了。當然,成成本不光是產(chǎn)品本本身的價格決定的的,后面人員學習習、項目延期、客客戶滿意度低都要要作為成本考慮,這這些隱型成本才是是難以計算的。提提到成本,就不能能不提一下BI模模型,因為BI產(chǎn)產(chǎn)品中模型是最昂昂貴的一部分,在在國內很大一部分分企業(yè)采用的自主主開發(fā)的方式,采采用這種方式可以以避免高額的費用用,但卻無法學習習到國外先進的商商業(yè)經(jīng)驗。R。再看人員的經(jīng)驗。人的的學

11、習曲線是不可可避免的,不要妄妄想人們接觸一個個新產(chǎn)品就能立馬馬成為高手,能夠夠基于陌生的產(chǎn)品品做出良好架構。這這方面,顯然Oracle和和微軟有優(yōu)勢,因因為在這兩家產(chǎn)品品上有經(jīng)驗的人多多,好找。當然,如如果你們原來的業(yè)業(yè)務系統(tǒng)用的就是是這幾家產(chǎn)品之一一,不妨仍然用它它。x。其次案例比白皮書更重重要。如今很多BI廠廠商可以提供全方方位解決方案,提提供一站式服務。像像IBM、Oracle、SAS都稱自己己是這樣的全方案案提供商,也就是是說它們的產(chǎn)品線線已經(jīng)包含了數(shù)據(jù)據(jù)庫、OLAP、ETL等各類工工具。直接選用它它們,就不用再為為工具選型煩惱了了,但企業(yè)有時由由于各方面的原因因,決定不使用一一家產(chǎn)品

12、時,要考考慮他們之間是否否兼容。但如果你你要是從產(chǎn)品的白白皮書里去尋找此此類信息,會發(fā)現(xiàn)現(xiàn)說得很美,互相相之間會如何完美美地“無縫”兼容容,但實際上卻不不是那么回事。因因此,不要去看這這些文字的東西,要要去尋找同行業(yè)類類似的案例,如果果同行業(yè)沒有,就就去尋找數(shù)據(jù)量類類似、業(yè)務復雜度度類似以及相似應應用的其他行業(yè)案案例。U。BI的體系架構及相關關技術一個BI系統(tǒng)為了滿足足企業(yè)管理者的要要求,從浩如煙海海的資料中找出其其關心的數(shù)據(jù),必必須要做到以下幾幾步:Q。為了整合各種格式的數(shù)數(shù)據(jù),清除原有數(shù)數(shù)據(jù)中的錯誤記錄錄數(shù)據(jù)預處理理的要求。C。對預處理過數(shù)據(jù),應該該統(tǒng)一集中起來元數(shù)據(jù)(Meta Data)

13、、數(shù)數(shù)據(jù)倉庫(Data Warehouse)的要求;4。最后,對于集中起來的的龐大的數(shù)據(jù)集,還還應進行相應的專專業(yè)統(tǒng)計,從中發(fā)發(fā)掘出對企業(yè)決策策有價值的新的機機會OLAP(聯(lián)機事務分析)和數(shù)據(jù)挖掘(Data Mining)的要求。0。所以,一個典型的BI體體系架構應該包含含這3步所涉及的的相關要求。圖 3 BI的體系架架構整個體系架構中包括:終端用戶查詢和和報告工具、OLAP工工具、數(shù)據(jù)挖掘(Data Mining)軟軟件、數(shù)據(jù)倉庫(Data Warehouse)和和數(shù)據(jù)集市(Data Mart)產(chǎn)品品、聯(lián)機分析處理理 (OLAP) 等工具。J。1)、終端用戶查詢和和報告工具。專門用來支持初級

14、用戶戶的原始數(shù)據(jù)訪問問,不包括適應于于專業(yè)人士的成品品報告生成工具。U。2)、數(shù)據(jù)預處理(STL-數(shù)據(jù)抽取、轉換換、裝載)從許多來自不同的企業(yè)業(yè)運作系統(tǒng)的數(shù)據(jù)據(jù)中提取出有用的的數(shù)據(jù)并進行清理理,以保證數(shù)據(jù)的的正確性,然后經(jīng)經(jīng)過抽取(Extraction)、轉換(Transformation)和和裝載(Load),即即ETL過程,合合并到一個企業(yè)級級的數(shù)據(jù)倉庫里,從從而得到企業(yè)數(shù)據(jù)據(jù)的一個全局視圖圖。o。3)、OLAP工具。提供多維數(shù)據(jù)管理環(huán)境境,其典型的應用用是對商業(yè)問題的的建模與商業(yè)數(shù)據(jù)據(jù)分析。OLAP也也被稱為多維分析析。y。4)、數(shù)據(jù)挖掘(Data Mining)軟軟件。使用諸如神經(jīng)網(wǎng)絡

15、、規(guī)規(guī)則歸納等技術,用用來發(fā)現(xiàn)數(shù)據(jù)之間間的關系,做出基基于數(shù)據(jù)的推斷。w。5)、數(shù)據(jù)倉庫(Data Warehouse)和和數(shù)據(jù)集市(Data Mart)產(chǎn)品品。e。包括數(shù)據(jù)轉換、管理和和存取等方面的預預配置軟件,通常常還包括一些業(yè)務務模型,如財務分分析模型。K。6)、聯(lián)機分析處理 (OLAP) 。OLAP是使分析人員員、管理人員或執(zhí)執(zhí)行人員能夠從多多角度對信息進行行快速、一致、交交互地存取,從而而獲得對數(shù)據(jù)的更更深入了解的一類類軟件技術。2。其中核心技術在于數(shù)據(jù)據(jù)預處理、數(shù)據(jù)倉倉庫的建立(DW)、數(shù)據(jù)挖掘(DM)和和聯(lián)機分析處理(OLAP)三三個部分。接下來來,我們對這幾個個核心部分進行詳詳

16、細說明:s。數(shù)據(jù)預處理:當早期大型的在線事務務處理系統(tǒng)(OLTP)問世后不久,就就出現(xiàn)了一種用于于“抽取”處理的的簡單程序,其作作用是搜索整個文文件和數(shù)據(jù)庫,使使用某些標準選擇擇合乎要求的數(shù)據(jù)據(jù),將其復制拷貝貝出來,用于總體體分析。因為這樣樣做不會影響正在在使用的在線事務務處理系統(tǒng),降低低其性能,同時,用用戶可以自行控制制抽取出來的數(shù)據(jù)據(jù)。但是,現(xiàn)在情情況發(fā)生了巨大的的變化,企業(yè)同時時采用了多個在線線事務處理系統(tǒng),而而這些系統(tǒng)之間的的數(shù)據(jù)定義格式不不盡相同,即使采采用同一軟件廠商商提供的不同軟件件產(chǎn)品,或者僅僅僅是產(chǎn)品版本不同同,之間的數(shù)據(jù)定定義格式也有少許許差距。由此,我我們必須先定義一一個

17、統(tǒng)一的數(shù)據(jù)格格式,然后把各個個來源的數(shù)據(jù)按新新的統(tǒng)一的格式進進行轉換,然后集集中裝載入數(shù)據(jù)倉倉庫中。m。其中,尤其要注意的一一點時,并不是各各個來源的不同格格式的所有數(shù)據(jù)都都能被新的統(tǒng)一格格式包容,我們也也不應強求非要把把所有數(shù)據(jù)源的數(shù)數(shù)據(jù)全部集中起來來。Why?原因因很多。有可能原原來錄入的數(shù)據(jù)中中,少量的記錄使使用了錯誤的數(shù)據(jù)據(jù),這類數(shù)據(jù)如果果無法校正,應該該被舍去。某些數(shù)數(shù)據(jù)記錄是非結構構化的,很難將其其轉化成新定義的的統(tǒng)一格式,而且且從中抽取信息必必須讀取整個文件件,效率極低,如如大容量的二進制制數(shù)據(jù)文件,多媒媒體文件等,這類類數(shù)據(jù)如果對企業(yè)業(yè)決策不大,可以以舍去。P。目前已有一部分軟

18、件廠廠商開發(fā)出專門的的ETL工具,其其中包括:Ardent DataStageEvolutionary Technologies,Inc. (ETI) Extractq。Information PowermartSagent SolutionSAS InstituteOracle Warehouse BuilderMSSQL Server2000 DTS數(shù)據(jù)倉庫:數(shù)據(jù)倉庫概念是由號稱稱“數(shù)據(jù)倉庫之父父”William H.Inmon在在上世紀80年代代中期撰寫的建建立數(shù)據(jù)倉庫一一書中首次提出,“數(shù)據(jù)倉庫是一個面向主題的、集成的、非易失性的,隨時間變化的用來支持管理人員決策的數(shù)據(jù)集合”。G。面向

19、主題是數(shù)據(jù)倉庫第第一個顯著特點,就是指在數(shù)據(jù)倉庫中,數(shù)據(jù)按照不同的主題進行組織,每一個主題中的數(shù)據(jù)都是從各操作數(shù)據(jù)庫中抽取出來匯集而成,這些與該主題相關的所有歷史數(shù)據(jù)就形成了相應的主題域。2。數(shù)據(jù)倉庫的第二個顯著著特點是集成。數(shù)數(shù)據(jù)來源于不同的的數(shù)據(jù)源,通過相相應的規(guī)則進行一一致性轉換,最終終集成為一體。y。數(shù)據(jù)倉庫的第三個特點點是非易失性。一一旦數(shù)據(jù)被加載到到數(shù)據(jù)倉庫中,數(shù)數(shù)據(jù)的值不會再發(fā)發(fā)生變化,盡管運運行系統(tǒng)中對數(shù)據(jù)據(jù)進行增、刪、改改等操作,但對這這些數(shù)據(jù)的操作將將會作為新的快照照記錄到數(shù)據(jù)倉庫庫中,從而不會影影響到已經(jīng)進入到到數(shù)據(jù)倉庫的數(shù)據(jù)據(jù)。4。數(shù)據(jù)倉庫最后一個特點點是它隨時間變化化

20、。數(shù)據(jù)倉庫中每每一個數(shù)據(jù)都是在在特定時間的記錄錄,每個記錄都有有著相應的時間戳戳。v。圖 4 數(shù)據(jù)倉庫體系系架構數(shù)據(jù)倉庫對外部數(shù)據(jù)源源和操作型數(shù)據(jù)源源的元數(shù)據(jù),按照照數(shù)據(jù)倉庫模式設設計要求進行歸類類,并建成元數(shù)據(jù)據(jù)庫,相對應的數(shù)數(shù)據(jù)經(jīng)過ETL后后加載到數(shù)據(jù)倉庫庫中;當信息客戶戶需要查詢數(shù)據(jù)時時先通過信息展現(xiàn)現(xiàn)系統(tǒng)了解元數(shù)據(jù)據(jù)或者直接瀏覽元元數(shù)據(jù)庫,再發(fā)起起數(shù)據(jù)查詢請求得得到所需數(shù)據(jù)。V。一個典型的企業(yè)數(shù)據(jù)倉倉庫系統(tǒng),通常包包含數(shù)據(jù)源、數(shù)據(jù)據(jù)存儲與管理、數(shù)數(shù)據(jù)的訪問三個部部分。f。圖 5 數(shù)據(jù)倉庫系統(tǒng)統(tǒng)數(shù)據(jù)源:是指企業(yè)操作作型數(shù)據(jù)庫中的各各種生產(chǎn)運營數(shù)據(jù)據(jù)、辦公管理數(shù)據(jù)據(jù)等內部數(shù)據(jù)和一一些調查數(shù)

21、據(jù)、市市場信息等來自外外環(huán)境的數(shù)據(jù)總稱稱。這些數(shù)據(jù)是構構建數(shù)據(jù)倉庫系統(tǒng)統(tǒng)的基礎是整個系系統(tǒng)的數(shù)據(jù)源泉。q。數(shù)據(jù)的存儲與管理:數(shù)數(shù)據(jù)倉庫的存儲主主要由元數(shù)據(jù)的存存儲及數(shù)據(jù)的存儲儲兩部分組成。元元數(shù)據(jù)是關于數(shù)據(jù)據(jù)的數(shù)據(jù),其內容容主要包括數(shù)據(jù)倉倉庫的數(shù)據(jù)字典、數(shù)據(jù)的定義、數(shù)數(shù)據(jù)的抽取規(guī)則、數(shù)據(jù)的轉換規(guī)則則、數(shù)據(jù)加載頻率率等信息。各操作作數(shù)據(jù)庫中的數(shù)據(jù)據(jù)按照元數(shù)據(jù)庫中中定義的規(guī)則,經(jīng)經(jīng)過抽取、清理、轉換、集成,按按照主題重新組織織,依照相應的存存儲結構進行存儲儲。也可以面向應應用建立一些數(shù)據(jù)據(jù)集市,數(shù)據(jù)集市市可以看作是數(shù)據(jù)據(jù)倉庫的一個子集集,它含有較少的的主題域且歷史時時間更短數(shù)據(jù)量更更少,一般只能為

22、為某個局部范圍內內的管理人員服務務,因此也稱之為為部門級數(shù)據(jù)倉庫庫。T。數(shù)據(jù)的訪問:由OLAP(聯(lián)機分析處理)、數(shù)據(jù)挖掘、統(tǒng)統(tǒng)計報表、即席查查詢等幾部分組成成。例如OLAP:針對特定的分析析主題,設計多種種可能的觀察形式式,設計相應的分分析主題結構(即即進行事實表和維維表的設計),使使管理決策人員在在多維數(shù)據(jù)模型的的基礎上進行快速速、穩(wěn)定和交互性性的訪問,并進行行各種復雜的分析析和預測工作。按按照存儲方式來分分,OLAP可以以分成MOLAP以以及ROLAP等等方式,MOLAP (Multi-Dimension OLAP)將OLAP分分析所需的數(shù)據(jù)存存放在多維數(shù)據(jù)庫庫中。分析主題的的數(shù)據(jù)可以形成

23、一一個或多個多維立立方體。ROLAP (Relational OLAP)將OLAP分分析所需的數(shù)據(jù)存存放在關系型數(shù)據(jù)據(jù)庫中。分析主題題的數(shù)據(jù)以“事實實表-維表”的星星型模式組織。R。數(shù)據(jù)挖掘:數(shù)據(jù)挖掘的定義非常模模糊,對它的定義義取決于定義者的的觀點和背景。如如下是一些DM文文獻中的定義:B。數(shù)據(jù)挖掘是一個確定數(shù)數(shù)據(jù)中有效的,新新的,可能有用的的并且最終能被理理解的模式的重要要過程。i。數(shù)據(jù)挖掘是一個從大型型數(shù)據(jù)庫中提取以以前未知的,可理理解的,可執(zhí)行的的信息并用它來進進行關鍵的商業(yè)決決策的過程。B。數(shù)據(jù)挖掘是用在知識發(fā)發(fā)現(xiàn)過程,來辯識識存在于數(shù)據(jù)中的的未知關系和模式式的一些方法。數(shù)數(shù)據(jù)挖掘是

24、發(fā)現(xiàn)數(shù)數(shù)據(jù)中有益模式的的過程。T。數(shù)據(jù)挖掘是我們?yōu)槟切┬┪粗男畔⒛J绞蕉芯看笮蛿?shù)據(jù)據(jù)集的一個決策支支持過程。N。雖然數(shù)據(jù)挖掘的這些定定義有點不可觸摸摸,但在目前它已已經(jīng)成為一種商業(yè)業(yè)事業(yè)。如同在過過去的歷次淘金熱熱中一樣,目標是是開發(fā)礦工。利利潤最大的是賣工工具給礦工,而不不是干實際的開發(fā)發(fā)。4。目前業(yè)內已有很多成熟熟的數(shù)據(jù)挖掘方法法論,為實際應用用提供了理想的指指導模型。其中,標標準化的主要有三三個:CRISP-DM;PMML;OLE DB for DM。p。CRISP-DM(Cross-Industry Standard Process for Data Mining)是是目前公認的、

25、較較有影響的方法論論之一。CRISP-DM強調,DM不不單是數(shù)據(jù)的組織織或者呈現(xiàn),也不不僅是數(shù)據(jù)分析和和統(tǒng)計建模,而是是一個從理解業(yè)務務需求、尋求解決決方案到接受實踐踐檢驗的完整過程程。CRISP-DM將整個挖掘掘過程分為以下六六個階段:商業(yè)理理解(Business Understanding),數(shù)數(shù)據(jù)理解(Data Understanding),數(shù)據(jù)準備(Data Preparation),建模(Modeling),評估(Evaluation)和發(fā)布(Deployment)。其框架圖如下下:L。圖 6 CRISP-DM模型框架圖圖從技術層來看,數(shù)據(jù)挖挖掘技術可分為描描述型數(shù)據(jù)挖掘和和預測型數(shù)

26、據(jù)挖掘掘兩種。描述型數(shù)數(shù)據(jù)挖掘包括數(shù)據(jù)據(jù)總結、聚類及關關聯(lián)分析等。預測測型數(shù)據(jù)挖掘包括括分類、回歸及時時間序列分析等。B。數(shù)據(jù)總結:繼承于數(shù)據(jù)據(jù)分析中的統(tǒng)計分分析。數(shù)據(jù)總結目目的是對數(shù)據(jù)進行行濃縮,給出它的的緊湊描述。傳統(tǒng)統(tǒng)統(tǒng)計方法如求和和值、平均值、方方差值等都是有效效方法。另外還可可以用直方圖、餅餅狀圖等圖形方式式表示這些值。廣廣義上講,多維分分析也可以歸入這這一類。A。聚類:是把整個數(shù)據(jù)庫庫分成不同的群組組。它的目的是使使群與群之間差別別很明顯,而同一一個群之間的數(shù)據(jù)據(jù)盡量相似。這種種方法通常用于客客戶細分。在開始始細分之前不知道道要把用戶分成幾幾類,因此通過聚聚類分析可以找出出客戶特性

27、相似的的群體,如客戶消消費特性相似或年年齡特性相似等。在在此基礎上可以制制定一些針對不同同客戶群體的營銷銷方案。Q。關聯(lián)分析:是尋找數(shù)據(jù)據(jù)庫中值的相關性性。兩種常用的技技術是關聯(lián)規(guī)則和和序列模式。關聯(lián)聯(lián)規(guī)則是尋找在同同一個事件中出現(xiàn)現(xiàn)的不同項的相關關性;序列模式與與此類似,尋找的的是事件之間時間間上的相關性,如如對股票漲跌的分分析等。Z。分類:目的是構造一個個分類函數(shù)或分類類模型(也常常稱稱作分類器),該該模型能把數(shù)據(jù)庫庫中的數(shù)據(jù)項映射射到給定類別中的的某一個。要構造造分類器,需要有有一個訓練樣本數(shù)數(shù)據(jù)集作為輸入。訓訓練集由一組數(shù)據(jù)據(jù)庫記錄或元組構構成,每個元組是是一個由有關字段段(又稱屬性或

28、特特征)值組成的特特征向量,此外,訓訓練樣本還有一個個類別標記。一個個具體樣本的形式式可表示為:( v1, v2, .,vn;c ),其中vi表表示字段值,c表表示類別。a。回歸:是通過具有已知知值的變量來預測測其它變量的值。一一般情況下,回歸歸采用的是線性回回歸、非線性回歸歸這樣的標準統(tǒng)計計技術。一般同一一個模型既可用于于回歸也可用于分分類。常見的算法法有邏輯回歸、決決策樹、神經(jīng)網(wǎng)絡絡等。e。時間序列:時間序列是是用變量過去的值值來預測未來的值值。數(shù)據(jù)挖掘(Data Mining)軟軟件。使用諸如神神經(jīng)網(wǎng)絡、規(guī)則歸歸納等技術,用來來發(fā)現(xiàn)數(shù)據(jù)之間的的關系,做出基于于數(shù)據(jù)的推斷。w。圖 7 數(shù)據(jù)

29、挖掘系統(tǒng)統(tǒng)以下是一些當前的數(shù)據(jù)據(jù)挖掘產(chǎn)品:IBM: Intelligent Miner 智智能礦工Tandem: Relational Data Miner 關系數(shù)據(jù)礦工U。AngossSoftware: KnowledgeSEEDER 知識搜索者Z。Thinking Machines Corporation: DarwinTM4。NeoVista Software: ASICISL Decision Systems,Inc.: Clementine 3。DataMind Corporation: DataMind Data Crunchery。Silicon Graphics: MineSe

30、tCalifornia Scientific Software: BrainMakery。WizSoft Corporation: WizWhyLockheed Corporation: ReconSAS Corporation: SAS Enterprise Miner q。聯(lián)機分析處理(OLAP):OLAP的概念最早是是由關系數(shù)據(jù)庫之之父E.F.Codd于于1993年提出出的,他同時提出出了關于OLAP的的12條準則。B。OLAP的提出引起了了很大的反響,OLAP作作為一類產(chǎn)品同聯(lián)聯(lián)機事務處理 (OLTP) 明明顯區(qū)分開來。A。當今的數(shù)據(jù)處理大致可可以分成兩大類:聯(lián)機事務處理OLTP(On

31、-Line Transaction Processing)、聯(lián)機分析處理OLAP(On-Line Analytical Processing)。OLTP是是傳統(tǒng)的關系型數(shù)數(shù)據(jù)庫的主要應用用,主要是基本的的、日常的事務處處理,例如銀行交交易。OLAP是是數(shù)據(jù)倉庫系統(tǒng)的的主要應用,支持持復雜的分析操作作,側重決策支持持,并且提供直觀觀易懂的查詢結果果。y。OLAP是使分析人員員、管理人員或執(zhí)執(zhí)行人員能夠從多多角度對信息進行行快速、一致、交交互地存取,從而而獲得對數(shù)據(jù)的更更深入了解的一類類軟件技術。OLAP的的目標是滿足決策策支持或者滿足在在多維環(huán)境下特定定的查詢和報表需需求,它的技術核核心是維這個

32、個概念。8?!熬S”是人們觀察客觀觀世界的角度,是是一種高層次的類類型劃分?!熬S”一般包含著層次次關系,這種層次次關系有時會相相當復雜。通過把把一個實體的多項項重要的屬性定義義為多個維(DImension),使用戶能對不不同維上的數(shù)據(jù)進進行比較。因此OLAP也也可以說是多維數(shù)數(shù)據(jù)分析工具的集集合。M。OLAP的基本多維分分析操作有鉆?。≧oll Up和Drill Down)、切切片(Slice)和和切塊(Dice)、以及旋轉(Pivot)、Drill Across、Drill Through等等。O。鉆取是改變維的層次,變變換分析的粒度。它它包括向上鉆?。≧oll Up)和向下鉆鉆取(Drill

33、 Down)。Roll Up是在某一維維上將低層次的細細節(jié)數(shù)據(jù)概括到高高層次的匯總數(shù)據(jù)據(jù),或者減少維數(shù)數(shù);而Drill Down則相反反,它從匯總數(shù)據(jù)據(jù)深入到細節(jié)數(shù)據(jù)據(jù)進行觀察或增加加新維。U。切片和切塊是在一部分分維上選定值后,關關心度量數(shù)據(jù)在剩剩余維上的分布。如如果剩余的維只有有兩個,則是切片片;如果有三個,則則是切塊。g。旋轉是變換維的方向,即即在表格中重新安安排維的放置(例例如行列互換)。2。OLAP有多種實現(xiàn)方方法,根據(jù)存儲數(shù)數(shù)據(jù)的方式不同可可以分為ROLAP、MOLAP、HOLAP。U。ROLAP表示基于關關系數(shù)據(jù)庫的OLAP實實現(xiàn)(Relational OLAP)。以以關系數(shù)據(jù)庫

34、為核核心,以關系型結結構進行多維數(shù)據(jù)據(jù)的表示和存儲。ROLAP將將多維數(shù)據(jù)庫的多多維結構劃分為兩兩類表:一類是事事實表,用來存儲儲數(shù)據(jù)和維關鍵字字;另一類是維表表,即對每個維至至少使用一個表來來存放維的層次、成員類別等維的的描述信息。維表表和事實表通過主主關鍵字和外關鍵鍵字聯(lián)系在一起,形形成了“星型模式式”。對于層次復復雜的維,為避免免冗余數(shù)據(jù)占用過過大的存儲空間,可可以使用多個表來來描述,這種星型型模式的擴展稱為為“雪花模式”。N。MOLAP表示基于多多維數(shù)據(jù)組織的OLAP實實現(xiàn)(Multidimensional OLAP)。以以多維數(shù)據(jù)組織方方式為核心,也就就是說,MOLAP使使用多維數(shù)組

35、存儲儲數(shù)據(jù)。多維數(shù)據(jù)據(jù)在存儲中將形成成“立方塊(Cube)”的結構,在MOLAP中中對“立方塊”的的“旋轉”、“切切塊”、“切片”是產(chǎn)生多維數(shù)據(jù)據(jù)報表的主要技術術。S。HOLAP表示基于混混合數(shù)據(jù)組織的OLAP實實現(xiàn)(Hybrid OLAP)。如如低層是關系型的的,高層是多維矩矩陣型的。這種方方式具有更好的靈靈活性。E。還有其他的一些實現(xiàn)OLAP的的方法,如提供一一個專用的SQL Server,對對某些存儲模式(如如星型、雪片型)提提供對SQL查詢詢的特殊支持。M。OLAP工具是針對特特定問題的聯(lián)機數(shù)數(shù)據(jù)訪問與分析。它通過多維的方式對數(shù)據(jù)進行分析、查詢和報表。維是人們觀察數(shù)據(jù)的特定角度。例如,

36、一個企業(yè)在考慮產(chǎn)品的銷售情況時,通常從時間、地區(qū)和產(chǎn)品的不同角度來深入觀察產(chǎn)品的銷售情況。這里的時間、地區(qū)和產(chǎn)品就是維。而這些維的不同組合和所考察的度量指標構成的多維數(shù)組則是OLAP分析的基礎,可形式化表示為(維1,維2,維n,度量指標),如(地區(qū)、時間、產(chǎn)品、銷售額)。多維分析是指對以多維形式組織起來的數(shù)據(jù)采取切片(Slice)、切塊(Dice)、鉆?。―rill Down和Roll Up)、旋轉(Pivot)等各種分析動作,以求剖析數(shù)據(jù),使用戶能從多個角度、多側面地觀察數(shù)據(jù)庫中的數(shù)據(jù),從而深入理解包含在數(shù)據(jù)中的信息。C。根據(jù)綜合性數(shù)據(jù)的組織織方式的不同,目目前常見的OLAP主主要有基于多維

37、數(shù)數(shù)據(jù)庫的MOLAP及及基于關系數(shù)據(jù)庫庫的ROLAP兩兩種。MOLAP是是以多維的方式組組織和存儲數(shù)據(jù),ROLAP則則利用現(xiàn)有的關系系數(shù)據(jù)庫技術來模模擬多維數(shù)據(jù)。在在數(shù)據(jù)倉庫應用中中,OLAP應用用一般是數(shù)據(jù)倉庫庫應用的前端工具具,同時OLAP工工具還可以同數(shù)據(jù)據(jù)挖掘工具、統(tǒng)計計分析工具配合使使用,增強決策分分析功能。5。一個典型的BI系統(tǒng)介介紹商業(yè)智能系統(tǒng)應具有的的主要功能:讀取數(shù)據(jù)可讀取多多種格式(如Excel、Access、以Tab分割的的txt和固定長長的txt等)的的文件,同時可讀讀取關系型數(shù)據(jù)庫庫 (對應ODBC)中的數(shù)據(jù)。X。分析功能關聯(lián)/限限定 關聯(lián)分析主主要用于發(fā)現(xiàn)不同同事件

38、之間的關聯(lián)聯(lián)性,即一個事件件發(fā)生的同時,另另一個事件也經(jīng)常常發(fā)生。關聯(lián)分析析的重點在于快速速發(fā)現(xiàn)那些有實用用價值的關聯(lián)發(fā)生生的事件。o。數(shù)據(jù)輸出功能打印印統(tǒng)計列表和圖表表畫面等,可將統(tǒng)統(tǒng)計分析好的數(shù)據(jù)據(jù)輸出給其他的應應用程序使用,或或者以HTML格格式保存。z。定型處理所需要的的輸出被顯示出來來時,進行定型登登錄,可以自動生生成定型處理按鈕鈕。以后,只需按按此按鈕,即使很很復雜的操作,也也都可以將所要的的列表、視圖和圖圖表顯示出來。1。以國外的一個BI系統(tǒng)統(tǒng)為例,我們來介介紹一個BI系統(tǒng)統(tǒng)的主要功能,這這個系統(tǒng)主要包含含數(shù)據(jù)倉庫管理器器(Warehouse Manager)、數(shù)據(jù)復制(Data

39、 Propagator)、多維數(shù)據(jù)庫(OLAP Server)、前臺分析工具具(Wired for OLAP)以及數(shù)據(jù)挖掘(Intelligent Miner)、On Demand。e。數(shù)據(jù)倉庫管理器(Warehouse Manager)它主要由以下幾部分功功能組成:數(shù)據(jù)訪訪問,數(shù)據(jù)轉換,數(shù)數(shù)據(jù)分布,數(shù)據(jù)存存儲,靠描述性數(shù)數(shù)據(jù)查找和理解數(shù)數(shù)據(jù),顯示、分析析和發(fā)掘數(shù)據(jù),數(shù)數(shù)據(jù)轉換過程的自自動化及其管理。它它縮短了復雜的海海量數(shù)據(jù)與有洞察察力的商務決策之之間的差距,有助助于公司更進一步步了解其業(yè)務、市市場、競爭對手和和客戶。O。數(shù)據(jù)復制 (Data Propagator)Data Propagat

40、or提提供的復制功能允允許從一個數(shù)據(jù)源源讀取數(shù)據(jù)并把它它送到另外一個地地方,而且可以是是雙向的。當發(fā)生生沖突時,可自動動檢測出來并進行行補償。此外,它它還有以下特色:T。(1)Pull Architecture Through Staging Tables(分級表牽引式體體系結構):二個個組成部分-Capture和和Apply。Capture部部分在源數(shù)據(jù)庫服服務器上運行,它它捕獲要被復制的的數(shù)據(jù),并把數(shù)據(jù)據(jù)放入服務器分級級表中;Apply部部分在目標機上運運行。在用戶定義義的時間間隔里或或某個事件發(fā)生后后,它連到源數(shù)據(jù)據(jù)庫中,并從分級級表中抽取所需的的數(shù)據(jù)。這種被動動的“牽引式”體體系結構減

41、少了數(shù)數(shù)據(jù)源的額外開銷銷,能夠支持數(shù)據(jù)據(jù)源及目標機的獨獨立運作性以及新新一代流動計算機機作為目標機的數(shù)數(shù)據(jù)復制。這種體體系結構還支持中中介分級表,其中中最初的源可以復復制到區(qū)域目標中中,然后再復制到到各區(qū)域內的目標標機上。U。(2)支持更新和修正正:既支持更新也也支持修正復制。Apply可可以完全替換目標標數(shù)據(jù)或者僅僅修修正上次復制以來來所發(fā)生的改變。C。(3)改變事務運行記記錄的Capture:捕獲數(shù)據(jù)修改。它它從數(shù)據(jù)庫運行日日志(LOG)中中讀出修改,從而而抓取用于復制的的數(shù)據(jù)修改,進而而安排好這些數(shù)據(jù)據(jù)。這就減少了對對源的額外開銷,不不需要另外處理如如觸發(fā)器。甚至可可以直接從內存中中讀運

42、行記錄,以以減少I/O。c。(4)加工數(shù)據(jù):數(shù)據(jù)據(jù)首先要從運行記記錄移到分級表,所所以能在復制之前前加工或處理它;由于分級表是數(shù)數(shù)據(jù)庫表,使用標標準SQL就能定定義加工處理功能能。除了通過SQL來來構造子集,匯總總并連結表以外,分分級表還能提供基基于時間分析源數(shù)數(shù)據(jù)改變的方法。這這要考慮到整個新新一類的應用包括括檢查跟蹤,歷史史分析,asof查詢等等。M。(5)GUI管理機構構:通過圖形用戶戶界面可以定義和和管理數(shù)據(jù)拷貝,定定義代碼和觸發(fā)器器沒有專門語言。這這樣最終用戶就有有權定義和管理,而而不僅僅是DBA和和程序員的范圍。7。多維數(shù)據(jù)庫服務器(OLAP Server)該工具在商務智能中扮演著

43、重要角色,可以深入最終用戶的業(yè)務,對桌面上的數(shù)據(jù)進行實時操作,能夠快速地分布傳統(tǒng)監(jiān)視和報告范圍之外的應用程序數(shù)據(jù)。5。數(shù)據(jù)挖掘工具(Intelligent Miner)當用戶的數(shù)據(jù)積累到一一定數(shù)量時,這些些數(shù)據(jù)的某些潛在在聯(lián)系、分類、推推導結果和待發(fā)現(xiàn)現(xiàn)價值隱藏在其中中,該工具幫助客客戶發(fā)現(xiàn)這些有價價值的數(shù)據(jù)。V。Wired for OLAP使用該功能可以提高信信息技術組織的效效率。信息技術人人員可以讓用戶利利用分析和報表的的功能獲得他們所所需的信息,而不不會失去對信息、數(shù)據(jù)完整性、系系統(tǒng)性能和系統(tǒng)安安全的控制。K。強大功能的報表繁忙的信息技術部門可可以在幾分鐘內創(chuàng)創(chuàng)建用于在企業(yè)中中分發(fā)的完善

44、的報報表。,決策人員員可以從該Web頁頁面上找到可用的的一系列報表。M。圖形化分析遠遠超出對數(shù)據(jù)的靜態(tài)態(tài)圖形化視圖,提提供強壯的圖形化化OLAP分析。決決策人員可以根據(jù)據(jù)需要排序、分組組數(shù)據(jù)并改變“圖圖表”(Chart)的類型(直方圖圖、餅形圖、線圖圖、堆積圖)。圖圖表中的元素可以以被“鉆取”到其其他的細節(jié)層次,并并可以返回來恢復復一個概要性的視視圖。c。多種圖表視圖:直方圖圖、線圖、組合圖圖、餅形圖、堆積積圖和離散點圖可在任何地方“鉆取”沒有路徑的預先先定義完善的報表復合報表通過用各種不不同的形式(交叉叉表、圖表、表格格或以上幾種形式式的組合)來表現(xiàn)分析結果果,對工作進行概概括;優(yōu)美格式的的

45、商用報表。1。交互式的、立即的“所所見即所得”(WYSIWYG)顯示On Demand該工具提供給客戶一套套高性能的解決方方案來進行在線捕捕獲、存儲和重取取計算機輸出的文文檔。它使得落后后的紙張文件搜索索和使用縮微膠片片閱讀器搜索稱為為歷史。有了OnDemand,客客戶可以立刻發(fā)現(xiàn)現(xiàn)特定的信息并且且很容易地瀏覽它它,而不用在龐大大的數(shù)據(jù)和紙張中中苦苦尋找;存儲儲、重取和分發(fā)企企業(yè)產(chǎn)生的信息比比以前更加方便和和易于接受。i。BI的實施實施商業(yè)智能系統(tǒng)是一一項復雜的系統(tǒng)工工程,整個項目涉涉及企業(yè)管理, 運作管理, 信信息系統(tǒng), 數(shù)據(jù)據(jù)倉庫, 數(shù)據(jù)挖挖掘, 統(tǒng)計分析析等眾多門類的知知識。因此用戶除了

46、要要選擇合適的商業(yè)業(yè)智能軟件工具外外,還必須按照正確確的實施方法才能能保證項目得以成成功。商業(yè)智能項目的的實施步驟可分為為:7。需求分析:需求分析是是商業(yè)智能實施的的第一步, 在其其他活動開展之前前必須明確的定義義企業(yè)對商業(yè)智能能的期望和需求, 包括需要分析的的主題, 各主題題可能查看的角度度(維度);需要發(fā)現(xiàn)企業(yè)那那些方面的規(guī)律,用戶的需求必須須明確。J。數(shù)據(jù)倉庫建模:通過對對企業(yè)需求的分析析,建立企業(yè)數(shù)據(jù)據(jù)倉庫的邏輯模型型和物理模型,并并規(guī)劃好系統(tǒng)的應應用架構,將企業(yè)業(yè)各類數(shù)據(jù)按照分分析主題進行組織織和歸類. M。數(shù)據(jù)抽?。簲?shù)據(jù)倉庫建建立后必須將數(shù)據(jù)據(jù)從業(yè)務系統(tǒng)中抽抽取到數(shù)據(jù)倉庫中中, 在

47、抽取的過過程中還必須將數(shù)數(shù)據(jù)進行轉換、清洗、以適應分析的需需要. A。建立商業(yè)智能分析報表表:商業(yè)智能分析報報表需要專業(yè)人員員按照用戶制訂的的格式進行開發(fā), 用戶也可自行開開發(fā)(開發(fā)方式簡簡單,快捷) . C。用戶培訓和數(shù)據(jù)模擬測測試:對于開發(fā)使用用分離型的商業(yè)智智能系統(tǒng), 最終終用戶的使用是相相當簡單的,只需需要點擊操作就可可針對特定的商業(yè)業(yè)問題進行分析。m。系統(tǒng)改進和完善:任何何系統(tǒng)的實施都必必須是不斷完善的的. 商業(yè)智能系系統(tǒng)更是如此, 在用戶使用一段段時間后可能會提提出更多的,更具具體的要求, 這這時需要再按照上上述步驟對系統(tǒng)進進行重構或完善。5。其中,在BI系統(tǒng)實施施中要注意以下問問

48、題:統(tǒng)一協(xié)調,全局規(guī)劃BI系統(tǒng)由于是構筑于于所有的業(yè)務系統(tǒng)統(tǒng)之上,有著獨特特的復雜性和全面面性。BI系統(tǒng)決決不僅僅是一個單單純的IT項目的的實施,它涉及到到企業(yè)經(jīng)營管理的的各個方面,需要要上至公司高層領領導下至基層業(yè)務務人員的大力配合合。實施這樣的系系統(tǒng)的難度和所需需要投入的資源遠遠超于普通的業(yè)務務支持系統(tǒng)。企業(yè)業(yè)必須進行縝密的的思考和全局的計計劃,把BI軟件件納入企業(yè)軟件管管理的整體戰(zhàn)略之之中。全局規(guī)劃不不僅要對項目實施施隊伍做出規(guī)劃,同同時還要對項目后后續(xù)的部署維護和和功能的增強完善善所需要的資源做做出規(guī)劃。商務智智能計劃必須有一一個整體的愿景和和路線圖,否則,就就很難統(tǒng)一起來。F。一把手

49、工程BI也是一把手工程。BI同同ERP和CRM等等軟件一樣也是一一把手工程。一般般的工作人員想到到的只是利用BI迅迅速生成報表,提提高勞動效率;而而一把手的角度,是是從提高企業(yè)業(yè)務務增值的目的出發(fā)發(fā),兩者在需求模模型設計時側重點點完全不同,結果果也大相徑庭。另另一方面,沒有一一把手的大力支持持,企業(yè)的業(yè)務流流程調整會遇到很很大阻力,甚至是是難以貫徹下去。O。因此,在決定上BI之之前,企業(yè)用戶的的老總和其智囊團團需要慎重考慮哪哪些業(yè)務首先需要要決策支持,這項項業(yè)務的內部流程程是否清楚,如何何對其進行內部流流程重整。并要配配套相應的部門來來專門負責數(shù)據(jù)的的跟蹤和優(yōu)化分析析,這樣企業(yè)的決決策將會變得

50、越來來越理智客觀,在在日益激烈的商業(yè)業(yè)競爭中將也會領領先一步。J。BI的組織和技能要素素建立BI體體系需要許多技能能,包括商務技能能、信息技術技能能和分析技能。然然而要建立同時具具備以上三種能力力的數(shù)據(jù)分析部門門談何容易。善于于聯(lián)系看似不相關關的事物并能有效效地呈現(xiàn)它們之間間的關系是一種非非常難得的能力,通通常企業(yè)里面具備備這種能力的人才才很少,即使有也也沒有被充分重視視。國際國內的BI人人才奇缺。如果企企業(yè)不能有效地組組織BI活動(如如著手建立集中化化的BI能力中心心和投資BI技能能建設)將無法在在戰(zhàn)略層面展示BI的的作用,且將面對對至少50%的額額外實施費用。而而沒有集中的,專專門的BI功

51、能部部門,BI系統(tǒng)無無法被深入和有效效的支持。G。由于人才的稀少,建立立一個集中的,匯匯集各種人才的BI能能力中心是非常必必要的(要成立專專門的數(shù)據(jù)分析部部門)。來自不同同部門的人以建立立一種互相協(xié)作的的BI隊伍遠比尋尋找同時具備三種種能力的人才更現(xiàn)現(xiàn)實可行。7。一個有效的BI能力中中心有三個重要的的任務:指導用戶能夠實實現(xiàn)重復的BI任任務(如管理報表表和簡單的重復分分析)的自我服務務;承擔復雜的,額額外的分析工作直直到這些分析能夠夠成為可重復使用用的簡單工作;確保BI系統(tǒng)的的功能和潛力不被被高估,實實在在在地解決現(xiàn)實的問問題。s。企業(yè)建設BI系統(tǒng)的目目的,是要從大量量的數(shù)據(jù)中找出可可以給企業(yè)

52、帶來增增值效益的數(shù)據(jù)分分析,但是這些數(shù)數(shù)據(jù)必須有相應的的人對其進行跟蹤蹤處理,否則BI的的價值也就只停留留在迅速做出報表表的層面,BI的的核心價值也被大大打折扣。而所有有的任務,都需要要精心的策劃和長長期的努力。A。數(shù)據(jù)基礎先行“BI是數(shù)據(jù)驅動的應應用”。BI系統(tǒng)統(tǒng)建設的核心是堅堅固、高質量的數(shù)數(shù)據(jù)基礎。建立這這樣一個數(shù)據(jù)資料料庫的任務是極其其艱巨的,要消耗耗大量的時間和資資源。而企業(yè)數(shù)據(jù)據(jù)的積累是伴隨著著各種基礎信息系系統(tǒng)的建設而進行行的,這是一個長長期的過程。 M。在基礎系統(tǒng)尚未建立和和完善階段,切忌忌同時發(fā)動不同的的系統(tǒng)建設,如在在實施BI系統(tǒng)的的同時就在建設分分銷供應鏈系統(tǒng)。不僅資源捉

53、襟見肘,數(shù)據(jù)的質量和完備問題也是不可預料的因素。本意是整合公司所有的數(shù)據(jù)資源,但是數(shù)據(jù)資源仍在不斷地變化,如何整合這些尚未確定的資源是一個巨大的挑戰(zhàn)。o。找準切入點BI要想大做小,從最最迫切的業(yè)務入手手。無論是上哪種種管理軟件,幾乎乎都會聽到同樣的的聲音:不要貪大大求全,從最迫切切的業(yè)務入手,BI也也不例外,它可以以做成一個獨立的的龐大系統(tǒng),把企企業(yè)中所有的業(yè)務務數(shù)據(jù)全部放在一一個數(shù)據(jù)倉庫里,進進行多維分析;也也可以將其嵌入到到各項單獨的業(yè)務務數(shù)據(jù)中,進行單單獨的業(yè)務分析。咨咨詢顧問的意見是是先把最緊要的業(yè)業(yè)務管理起來,以以便迅速響應市場場需求,做出最佳佳決策。積累了一一定經(jīng)驗后,再逐逐漸增加

54、BI系統(tǒng)統(tǒng)繼續(xù)對其他業(yè)務務進行決策分析,這這樣可以在一定程程度上規(guī)避風險,因因為上BI也要進進行流程的重整,一一個部門的整頓對對公司的影響要比比整個公司整頓的的影響小得多,就就好比動小手術總總要比作大手術的的疼痛小一些一樣樣。f。堅持業(yè)務趨動堅持業(yè)務趨動而不是IT趨趨動。涉及到管理理的問題,就是行行為科學的問題,也也就是人的問題。因因此管理軟件的需需求拉動都是從業(yè)業(yè)務部門牽頭做起起,而不是IT部部門。也許一些企企業(yè)也明白應由業(yè)業(yè)務部門來提出對對軟件的設計需求求,但業(yè)務人員的的水平不足以達到到提出未來管理模模型架構的水平,如如果出于這樣的原原因,企業(yè)老總要要給予IT部門絕絕對的權威,讓他他有權來

55、要求業(yè)務務部門必須配合IT部部門共同協(xié)商提出出需求模型,以盡盡量準確的把握企企業(yè)的業(yè)務發(fā)展方方向。Q。BI與其它系統(tǒng)的差別別商業(yè)智能(BI)幫助助企業(yè)的管理層進進行快速,準確的的決策,迅速的發(fā)發(fā)現(xiàn)企業(yè)中的問題題,提示管理人員員加以解決。但商商業(yè)智能軟件系統(tǒng)統(tǒng)不能代替管理人人員進行決策,不不能自動處理企業(yè)業(yè)運行過程中遇到到的問題。商業(yè)智智能為企業(yè)帶來的的是一種經(jīng)過科學學武裝的管理思維維,給整個企業(yè)帶帶來的是決策的快快速性和準確性,發(fā)發(fā)現(xiàn)問題的及時性性,以及發(fā)現(xiàn)那些些對手未發(fā)現(xiàn)的潛潛在的知識和規(guī)律律。z。BI與報表系統(tǒng)實現(xiàn)現(xiàn)有業(yè)務報表的問問題常被作為BI應應用的開始,雖然然務實,但卻是一一個陷阱。

56、傳統(tǒng)的的報表系統(tǒng)和BI是是有本質區(qū)別的。傳傳統(tǒng)的業(yè)務報表系系統(tǒng)針對分離的事事務處理而設計扁扁平系統(tǒng),并不擅擅長于結構化的分分析和統(tǒng)計。而一一個獨立的BI系系統(tǒng),能夠從傳統(tǒng)統(tǒng)業(yè)務系統(tǒng)中獲取取各類業(yè)務數(shù)據(jù),通通過數(shù)學模型建立立多層次的分析體體系,并將其轉化化成有商業(yè)意義的的信息。BI的應應用需求往往復雜雜多變。BI的實實施復雜性遠遠超超過傳統(tǒng)的報表系系統(tǒng)。不能帶著傳傳統(tǒng)事務處理系統(tǒng)統(tǒng)的思維模式進行行BI系統(tǒng)實施。q。另外,報表系統(tǒng)和BI的的使用對象和目的的也不盡相同。報報表系統(tǒng)更著重于于短期的運作支持持,而BI則關注注長期的戰(zhàn)略決策策,甚至更著重于于商業(yè)趨勢和業(yè)務務單元的聯(lián)系而非非具體的數(shù)據(jù)和精精

57、確度本身。BI并并不是用來代替著著眼于日常運做的的報表系統(tǒng)的!這這種理解的含糊非非常容易導致對BI項項目復雜度和資源源的投入要求估計計不足。Q。BI與ERP在ERP環(huán)境中安裝數(shù)數(shù)據(jù)倉庫是一個相相當經(jīng)濟的建議。因為,從基礎架構的角度上看,BI數(shù)據(jù)庫和ERP有許多共通之處。兩者都采用分布式架構存儲海量數(shù)據(jù),因此,雙方進行融合的可能性很大;兩者都為大范圍終端用戶提供深度訪問的能力;兩者都具有高度的分布性和應用程序的可擴展性,盡管這種特性在BI上體現(xiàn)得不是很明顯;兩者基于同樣的前提。即利用直接或者間接數(shù)據(jù)作為預測工作的信息參考。D。在過去10年中,ERP技技術和BI都有重重大的發(fā)展,但它它們的發(fā)展道路

58、或或多或少是并行的的。兩者的商業(yè)判判斷能力都有賴于于信息技術,但功功能特點卻各自針針對于商業(yè)智能(Business Intelligence)和業(yè)績跟蹤(Performance Tracking)的不同方面。j。雖然存在類似之處,但但BI和ERP絕絕對不是同一事物物或是同一事物體體的兩個方面,它它們是互補的系統(tǒng)統(tǒng)。w。它們最大的共性就是,它它們使企業(yè)運行得得更有效率、響應應更及時并易于整整合。因此,已實實施了ERP的企企業(yè)需要BI是顯顯而易見的。M。行業(yè)客戶實施ERP之之后,就建立起了了新的業(yè)務處理模模式。ERP系統(tǒng)統(tǒng)所涉及的所有業(yè)業(yè)務流程通過整合合彼此協(xié)調,打破破了原有的部門分分割局面。公司

59、內內所有環(huán)節(jié)的信息息獲知能力都得到到了提升,企業(yè)內內外的業(yè)務處理瓶瓶頸將被打破,響響應速度也能相應應改善。x。BI能提高行業(yè)用戶在在關鍵領域的信息息獲知能力及掌控控精度。首先,報報告格式將大大改改良,整合后的用用戶數(shù)據(jù)無疑使報報告進行得更快、更及時、更精確確。其次,信息傳傳輸也將越來越實實時化,在各部門門周轉時間將大為為減少。最后,業(yè)業(yè)務處理流程當中中可能出現(xiàn)的問題題和失誤也易于及及時發(fā)現(xiàn),從而使使糾錯工作更加迅迅速和準確。O。通過BI,孤立、分散散的企業(yè)數(shù)據(jù)按歷歷史記錄順序彼此此相關了,而且能能按高效、易于提提取的結構進行存存儲;行業(yè)用戶由由此就可以按不同同的透視方法進行行快速分析。與傳傳輸

60、數(shù)據(jù)不同,一一旦信息進入數(shù)據(jù)據(jù)倉庫或局部領域域的數(shù)據(jù)集市,它它就不可改變。它它成為了分析型數(shù)數(shù)據(jù),而非傳輸型型數(shù)據(jù)。因此,行行業(yè)用戶可以做的的分析就不再是簡簡單的總結,他們們可以按自己設置置的分析方法對數(shù)數(shù)據(jù)進行任何深度度的分析。這種數(shù)數(shù)據(jù)倉庫按照執(zhí)行行快速、靈活可變變的形式組織起來來,數(shù)據(jù)訪問變得得異常簡便(用戶戶不需專門應用軟軟件就能訪問,就就像從書架上取下下一本書一樣方便便)。d。BI與DSS、ISS商業(yè)智能作為一種新興興的決策支持體系系,與傳統(tǒng)的DSS、EIS相比,在在以下方面存在明明確的優(yōu)勢。q。使用對象范圍商業(yè)業(yè)智能的使用對象象不再像DSS、EIS僅僅局限限于企業(yè)的領導與與決策、分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論