




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)信息知識(shí)決策行動(dòng)利潤(rùn)MISBIDSS&專家系統(tǒng) 決策支持系統(tǒng)、商務(wù)智能以及專家系統(tǒng)在組織信息管理過(guò)程中發(fā)揮的作用BI&DSSMIS(ERP、CRM、SCM)EDPSDSS與BI在組織IS中的地位第一節(jié) 決策支持 1 第二節(jié) 商務(wù)智能2第五章 決策支持和商務(wù)智能第一節(jié) 決策支持決策1 決策支持系統(tǒng)2 群體決策支持系統(tǒng)3專家系統(tǒng)4決策及相關(guān)知識(shí)5.1.1管理的重點(diǎn)在于經(jīng)營(yíng),經(jīng)營(yíng)的中心在于決策.決策貫穿管理活動(dòng)的始終,管理的過(guò)程主要是決策及其實(shí)施的過(guò)程 .決策是企業(yè)最重要、意義最重大的活動(dòng)之一.由于決策問(wèn)題的范圍和規(guī)模越來(lái)越大,越來(lái)越復(fù)雜,變化越來(lái)越快,迫切要求引進(jìn)科學(xué)決策方法,以提高決策水平。
2、決策是為了實(shí)現(xiàn)特定的目標(biāo),根據(jù)客觀的可能性,在占有一定信息和經(jīng)驗(yàn)的基礎(chǔ)上,借助一定的工具、技巧和方法,對(duì)影響目標(biāo)實(shí)現(xiàn)的諸因素進(jìn)行分析、計(jì)算和判斷、選擇后,對(duì)未來(lái)行動(dòng)做出的決定。決策是人們?cè)谡?、?jīng)濟(jì)、技術(shù)、工作和日常生活中普遍存在的一種行為。決策的概念 1決策的過(guò)程四個(gè)階段 2情報(bào)階段:發(fā)現(xiàn)問(wèn)題設(shè)計(jì)階段:找出可行性方案選擇階段:找出適合的方案實(shí)施階段:方案實(shí)施返回情報(bào)階段返回設(shè)計(jì)階段返回選擇階段結(jié)構(gòu)化決策有時(shí)也稱為程序化決策,結(jié)構(gòu)化決策問(wèn)題相對(duì)比較簡(jiǎn)單、直接,其決策過(guò)程和決策方法有固定的規(guī)律可以遵循,能用明確的語(yǔ)言和模型加以描述,并可依據(jù)一定的通用模型和決策規(guī)則實(shí)現(xiàn)其決策過(guò)程的基本自動(dòng)化。企業(yè)
3、的訂貨和物資供應(yīng)等,通??捎眠\(yùn)籌學(xué)、計(jì)算機(jī)仿真和管理信息系統(tǒng)等來(lái)解決。 計(jì)算工資選擇商品(簡(jiǎn)單的價(jià)格比較)決策問(wèn)題的類型3結(jié)構(gòu)化決策案例:選擇一種新的打包機(jī)所進(jìn)行的結(jié)構(gòu)化決策 非結(jié)構(gòu)化決策問(wèn)題是指那些決策過(guò)程復(fù)雜,其決策過(guò)程和決策方法沒有固定的規(guī)律可以遵循,沒有固定的決策規(guī)則和通用模型可依,決策者的主觀行為(學(xué)識(shí)、經(jīng)驗(yàn)、直覺、判斷力、洞察力、個(gè)人偏好和決策風(fēng)格等)對(duì)各階段的決策效果有相當(dāng)?shù)挠绊?。是否引進(jìn)一條新的生產(chǎn)線是否發(fā)動(dòng)一場(chǎng)廣告宣傳戰(zhàn)是否改變公司的形象決策問(wèn)題的類型3非結(jié)構(gòu)化決策案例:為產(chǎn)品的發(fā)展方向做出的決策 半結(jié)構(gòu)化決策問(wèn)題介于上述兩者之間,其決策過(guò)程和決策方法有一定規(guī)律可以遵循,但又
4、不能完全確定,即有所了解但不全面,有所分析但不確切,有所估計(jì)但不確定。這樣的決策問(wèn)題一般可適當(dāng)建立模型,但無(wú)法確定最優(yōu)方案。股票市場(chǎng)的投資分析選擇合適的工作決策問(wèn)題的類型3半結(jié)構(gòu)化決策決策支持系統(tǒng)的目標(biāo)是幫助人們分析信息找出商務(wù)智能,進(jìn)而發(fā)現(xiàn)知識(shí). 術(shù)語(yǔ)“決策支持系統(tǒng)”是指可以輔助人們決策的任何計(jì)算機(jī)化的系統(tǒng).決策支持系統(tǒng)5.1.2從狹義上講,決策支持系統(tǒng)是一種高度靈活且具有良好交互性的,主要用于對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化問(wèn)題的決策提供輔助支持的信息系統(tǒng)。決策支持系統(tǒng)將決策者具有的經(jīng)驗(yàn)、直覺、判斷能力等和信息技術(shù)本身特定的功能聯(lián)系在一起,使二者都能發(fā)揮各自的優(yōu)勢(shì)。決策支持系統(tǒng)的含義1決策者與決策支持
5、系統(tǒng)的結(jié)合決策者的優(yōu)勢(shì)DSS的優(yōu)勢(shì)IT的優(yōu)勢(shì)經(jīng)驗(yàn)直覺判斷知識(shí)提高生產(chǎn)率增進(jìn)理解加快速度提高靈活性減少問(wèn)題的復(fù)雜性降低成本速度信息處理能力DSS的主要功能就是通過(guò)加強(qiáng)決策者的洞察力來(lái)對(duì)決策者提供幫助,改善決策者的決策效果。決策者的知識(shí)技能與IT的強(qiáng)大功能相結(jié)合,使決策者能更迅速地響應(yīng)市場(chǎng)的變化以及更高效地管理資源早期的管理信息系統(tǒng)主要為管理者提供預(yù)定的報(bào)告,而DSS則是在人和計(jì)算機(jī)交互的過(guò)程中幫助決策者探索可能的方案,為管理者提供決策所需的信息。管理信息系統(tǒng)和決策支持系統(tǒng)各自代表了信息系統(tǒng)發(fā)展過(guò)程中的某一階段,但至今它們?nèi)栽诓粩嗟匕l(fā)展,而且是相互交叉的關(guān)系。管理信息系統(tǒng)是面向管理的信息系統(tǒng),決策
6、支持系統(tǒng)則是面向決策的信息系統(tǒng)。決策支持系統(tǒng)在組織中可能是一個(gè)獨(dú)立的系統(tǒng),也可能作為管理信息系統(tǒng)的一個(gè)高層子系統(tǒng)而存在。DSS不同于傳統(tǒng)的管理信息系統(tǒng)一家國(guó)有保險(xiǎn)公司在給有酒后駕車(DUI)歷史的司機(jī)保險(xiǎn)時(shí),利用DSS分析公司遭受風(fēng)險(xiǎn)的金額。系統(tǒng)揭示出:以前有一次(DUI)歷史的40歲以上的已婚有房男性很少再次犯規(guī),通過(guò)降低這些人的保險(xiǎn)費(fèi)率,公司在不增加遭受風(fēng)險(xiǎn)損失的情況下,提高了市場(chǎng)占有率。CRM是許多成功的公司戰(zhàn)略的重要組成部分,而DSS是CRM的重要組成部分。華爾街的零售業(yè)經(jīng)濟(jì)公司利用決策支持系統(tǒng)分析客戶行為和目標(biāo),從而展現(xiàn)機(jī)遇并警示經(jīng)紀(jì)人注意最新出現(xiàn)的問(wèn)題。決策支持系統(tǒng)的應(yīng)用舉例面向組
7、織中上層管理人員經(jīng)常面臨的半結(jié)構(gòu)化問(wèn)題;把模型和分析技術(shù)與傳統(tǒng)的數(shù)據(jù)存儲(chǔ)技術(shù)及檢索技術(shù)結(jié)合起來(lái);易于為非計(jì)算機(jī)專業(yè)人員以交互會(huì)話的方式使用;強(qiáng)調(diào)對(duì)環(huán)境及用戶決策方法改變的靈活性及適應(yīng)性;支持但不是代替高層決策者制定決策。充分利用先進(jìn)信息技術(shù)快速傳遞和處理信息。決策支持系統(tǒng)的特征3三角式結(jié)構(gòu)是由數(shù)據(jù)庫(kù)、模型庫(kù)、方法庫(kù)等子系統(tǒng)與對(duì)話子系統(tǒng)成三角形分布的結(jié)構(gòu),也是DSS最基本的結(jié)構(gòu)。用戶數(shù)據(jù)庫(kù)管理子系統(tǒng)方法庫(kù)管理子系統(tǒng)模型庫(kù)管理子系統(tǒng)數(shù)據(jù)庫(kù)方法庫(kù)模型庫(kù)圖5-1 DSS的四庫(kù)邏輯結(jié)構(gòu)圖對(duì)話管理子系統(tǒng)決策支持系統(tǒng)的構(gòu)成4三角式結(jié)構(gòu)對(duì)話管理子系統(tǒng)是DSS中用戶和計(jì)算機(jī)的接口,起著在操作者、模型庫(kù)、數(shù)據(jù)庫(kù)和
8、方法庫(kù)之間傳遞、轉(zhuǎn)換命令和數(shù)據(jù)的重要作用,其核心是人機(jī)界面。數(shù)據(jù)庫(kù)管理子系統(tǒng)是存儲(chǔ)、管理、提供與維護(hù)用于決策支持的數(shù)據(jù)的DSS基本部件,是支撐模型庫(kù)子系統(tǒng)及方法庫(kù)子系統(tǒng)的基礎(chǔ)。數(shù)據(jù)庫(kù)管理子系統(tǒng)由數(shù)據(jù)庫(kù)、數(shù)據(jù)庫(kù)析取模塊、數(shù)據(jù)字典、數(shù)據(jù)庫(kù)管理系統(tǒng)及數(shù)據(jù)查詢模塊等部件組成。三角式結(jié)構(gòu)模型庫(kù)子系統(tǒng)是構(gòu)建和管理模型的計(jì)算機(jī)軟件系統(tǒng),它是DSS中最復(fù)雜與最難實(shí)現(xiàn)的部分。方法庫(kù)子系統(tǒng)是存儲(chǔ)、管理、調(diào)用及維護(hù)DSS各部件要用到的通用算法、標(biāo)準(zhǔn)函數(shù)等方法的部件。三角式結(jié)構(gòu)串聯(lián)結(jié)構(gòu)的特點(diǎn)是對(duì)話子系統(tǒng)不直接與數(shù)據(jù)庫(kù)子系統(tǒng)聯(lián)系,而是通過(guò)模型庫(kù)子系統(tǒng)轉(zhuǎn)達(dá)操作請(qǐng)求。因此模型庫(kù)子系統(tǒng)必須設(shè)有用戶操作數(shù)據(jù)庫(kù)的轉(zhuǎn)接功能。融合式
9、系統(tǒng)結(jié)構(gòu)數(shù)據(jù)庫(kù)子系統(tǒng)與模型庫(kù)子系統(tǒng)互不獨(dú)立,既可以說(shuō)是模型庫(kù)子系統(tǒng)建立在數(shù)據(jù)庫(kù)子系統(tǒng)的基礎(chǔ)上,也可以說(shuō)是數(shù)據(jù)庫(kù)子系統(tǒng)被嵌入模型庫(kù)子系統(tǒng)之中,模型庫(kù)中的模型運(yùn)行時(shí)直接調(diào)用數(shù)據(jù)庫(kù)中的數(shù)據(jù)。其他結(jié)構(gòu)群體決策的含義群體決策是指多人在一起討論問(wèn)題,提出解決問(wèn)題的若干方案,并通過(guò)對(duì)這些方案進(jìn)行評(píng)價(jià),選擇可用的方案,最后做出決策。一般來(lái)說(shuō),群體決策問(wèn)題都是非結(jié)構(gòu)化問(wèn)題,很難直接用結(jié)構(gòu)化的方法提供支持。 群體決策支持系統(tǒng)5群體決策支持系統(tǒng)的概念所謂群體決策支持系統(tǒng)(Group DSS,GDSS)就是將計(jì)算機(jī)技術(shù)、通信技術(shù)和決策支持技術(shù)等結(jié)合在一起,支持群體決策問(wèn)題的求解。GDSS是對(duì)個(gè)體決策支持系統(tǒng)的擴(kuò)展,是
10、為群體決策活動(dòng)提供支持的信息系統(tǒng),它促進(jìn)具有共同責(zé)任的群體求解半結(jié)構(gòu)化和非結(jié)構(gòu)化決策問(wèn)題。GDSS使多個(gè)決策參與者共同進(jìn)行思想和信息的交流,群策群力,尋找一個(gè)令人滿意和可行的方案,但在決策過(guò)程中只由某個(gè)特定的人做出最終決策,并對(duì)決策結(jié)果負(fù)責(zé)。 群體決策支持系統(tǒng)的組成主持人決策者決策者人機(jī)接口規(guī)則庫(kù)子系統(tǒng)公共顯示設(shè)備局部決策支持系統(tǒng)通信庫(kù)子系統(tǒng)公共數(shù)據(jù)庫(kù)管理系統(tǒng)公共模型庫(kù)管理系統(tǒng)公共方法庫(kù)管理系統(tǒng)圖5-2 一種典型的群體決策支持系統(tǒng)的構(gòu)成框架圖群體決策支持系統(tǒng)的類型決策室決策者面對(duì)面地集于一室在同一時(shí)間進(jìn)行群體決策局域決策網(wǎng)建立在計(jì)算機(jī)局域網(wǎng)基礎(chǔ)上的,用于多位決策者在近距離內(nèi)的不同房間(例如:自
11、己的辦公室)里定時(shí)或不定時(shí)作群體決策的系統(tǒng)群體決策支持系統(tǒng)的類型虛擬會(huì)議利用計(jì)算機(jī)網(wǎng)絡(luò)通信技術(shù),使分散在各地的決策者在某一時(shí)間內(nèi)能以不見面的方式進(jìn)行集中決策。遠(yuǎn)程決策網(wǎng)充分利用廣域網(wǎng)等信息技術(shù)來(lái)支持群體決策,它綜合了局域決策網(wǎng)與虛擬會(huì)議的優(yōu)點(diǎn),可使決策參與者異時(shí)異地地共同對(duì)同一問(wèn)題做出決策。在企業(yè)中,人是非常有價(jià)值的,因?yàn)橐克麄兺瓿芍匾慕?jīng)營(yíng)任務(wù)。多數(shù)企業(yè)都需要專業(yè)知識(shí),而企業(yè)的專業(yè)知識(shí)常常只能存在于某些人的大腦中。專家系統(tǒng)能夠獲取企業(yè)的專業(yè)知識(shí),并將它們提供給那些非專業(yè)人員,以便用它來(lái)解決問(wèn)題或?qū)W習(xí)如何解決問(wèn)題。專家系統(tǒng)5.1.3專家系統(tǒng)的概念由于各個(gè)應(yīng)用領(lǐng)域的特點(diǎn)不同,人們研究專家系統(tǒng)的
12、出發(fā)點(diǎn)不同,看待問(wèn)題的觀點(diǎn)不同,追求的目標(biāo)不同,導(dǎo)致對(duì)專家系統(tǒng)的定義存在不一致的看法。一般認(rèn)為:它是一個(gè)智能程序系統(tǒng);它具有相關(guān)領(lǐng)域內(nèi)大量的專家知識(shí);它能應(yīng)用人工智能技術(shù)模擬人類專家求解問(wèn)題的思維過(guò)程進(jìn)行推理,解決相關(guān)領(lǐng)域內(nèi)的困難問(wèn)題,并且達(dá)到該領(lǐng)域?qū)<业乃健?專家系統(tǒng)的概念概括的說(shuō),所謂專家系統(tǒng)是一種在相關(guān)領(lǐng)域中具有專家水平解題能力的智能程序系統(tǒng),它能運(yùn)用領(lǐng)域?qū)<叶嗄攴e累的經(jīng)驗(yàn)與專門知識(shí),模擬人類專家的思維過(guò)程,求解需要專家才能解決的困難問(wèn)題。1一個(gè)醫(yī)學(xué)專家系統(tǒng)就能夠像真正的專家一樣,診斷病人的疾病,判別出病情的嚴(yán)重性,并給出相應(yīng)的處方和治療建議.地質(zhì)專家可以根據(jù)地質(zhì)資料和勘探數(shù)據(jù),判斷什
13、么地方有礦藏,是否有開采價(jià)值。例子會(huì)計(jì)-用于審計(jì)、稅務(wù)計(jì)劃、管理咨詢和培訓(xùn)方面醫(yī)藥-在兼顧多方面因素(如患者病史、感染源以及現(xiàn)有藥品的價(jià)格)情況下開出抗生素處方財(cái)務(wù)管理-辨別銀行貸款部門中有拖欠傾向的賬戶生產(chǎn)-知道各類產(chǎn)品的加工制造,如飛機(jī)零部件專家系統(tǒng)的應(yīng)用領(lǐng)域一個(gè)非常簡(jiǎn)單的專家系統(tǒng)規(guī)則現(xiàn)象或事實(shí)是否解釋1綠燈亮了嗎?通過(guò)十字路口轉(zhuǎn)到規(guī)則2綠燈亮?xí)r是安全的,否則需要更多的信息2紅燈亮了嗎?轉(zhuǎn)到規(guī)則4轉(zhuǎn)到規(guī)則3應(yīng)停車,不可以通過(guò)3在你到達(dá)十字路口前,紅燈很可能要亮嗎?轉(zhuǎn)到規(guī)則4通過(guò)十字路口只有黃燈亮?xí)r才會(huì)出現(xiàn)這種情況,然后你將有兩種選擇4在進(jìn)入十字路口前,你能停車嗎?停車轉(zhuǎn)到規(guī)則5應(yīng)停車,否則
14、就可能出現(xiàn)問(wèn)題5是否有輛車正從某側(cè)開過(guò)來(lái)準(zhǔn)備應(yīng)付撞車事件通過(guò)十字路口除非十字路口處沒有車路過(guò),否則很可能相撞一個(gè)非常簡(jiǎn)單的專家系統(tǒng)綠燈亮了嗎(是/否)?否紅燈亮了嗎(是/否)?否在你到達(dá)十字路口前,紅燈很可能要亮嗎(是/否)?為什么?只有黃燈亮?xí)r才會(huì)出現(xiàn)這種情況,然后你將有兩種選擇。在你到達(dá)十字路口前,紅燈很可能要亮嗎(是/否)?否結(jié)論:通過(guò)十字路口接上例 如果在接近十字路口時(shí)綠燈亮了,你可以直接通過(guò);如果紅燈亮了,就應(yīng)該停車;如果不停車并且某一側(cè)有車經(jīng)過(guò),你可能就會(huì)有麻煩了。同樣,若黃燈亮了,你可以在交通燈快要變成紅燈之前通過(guò)路口;否則,就有可能發(fā)生交通事故。專家系統(tǒng)的一般結(jié)構(gòu)專家系統(tǒng)通常由
15、知識(shí)庫(kù)、知識(shí)庫(kù)管理系統(tǒng)、推理機(jī)、數(shù)據(jù)庫(kù)、知識(shí)獲取與學(xué)習(xí)系統(tǒng)、解釋系統(tǒng)和用戶接口等部分構(gòu)成。 專家、開發(fā)人員知識(shí)獲取與學(xué)習(xí)系統(tǒng)解釋系統(tǒng)推理機(jī)知識(shí)庫(kù)管理系統(tǒng)用戶接口用戶工作區(qū)間知識(shí)庫(kù)圖5-3 專家系統(tǒng)的一般體系結(jié)構(gòu)2各部分功能知識(shí)庫(kù)知識(shí)庫(kù)是經(jīng)過(guò)分類組織的“知識(shí)的集合”,知識(shí)庫(kù)的概念是數(shù)據(jù)庫(kù)概念在知識(shí)處理領(lǐng)域的拓廣。知識(shí)庫(kù)以某種知識(shí)表示形式存放專家系統(tǒng)所需的各種知識(shí)。一般來(lái)說(shuō),專家系統(tǒng)中的知識(shí)庫(kù)與專家系統(tǒng)程序是相互獨(dú)立的,用戶可以通過(guò)改變、完善知識(shí)庫(kù)中的知識(shí)內(nèi)容來(lái)提高專家系統(tǒng)的性能。在專家系統(tǒng)中運(yùn)用得較為普遍的知識(shí)是產(chǎn)生式規(guī)則。例如,在“動(dòng)物識(shí)別”專家系統(tǒng)中有這樣一條規(guī)則:IF 能做單腿跳嗎=否 A
16、ND 在蘇格蘭嗎=是 AND 高度=大THEN 動(dòng)物=馬 各部分功能(續(xù))知識(shí)庫(kù)管理系統(tǒng)知識(shí)庫(kù)管理系統(tǒng)用于建立原始的知識(shí)庫(kù)結(jié)構(gòu)和初始數(shù)據(jù),組織知識(shí)庫(kù)中的內(nèi)容,并對(duì)知識(shí)庫(kù)進(jìn)行例行維護(hù)。人類專家或?qū)<蚁到y(tǒng)管理員通過(guò)該子系統(tǒng)向知識(shí)庫(kù)增加新知識(shí),修改有關(guān)的數(shù)據(jù),刪除已過(guò)時(shí)的知識(shí)。推理機(jī)推理機(jī)是對(duì)專家系統(tǒng)推理過(guò)程進(jìn)行控制的程序,它從用戶所給的初始條件出發(fā),依據(jù)一定的控制策略,通過(guò)使用知識(shí)庫(kù)中的有關(guān)知識(shí),反復(fù)匹配知識(shí)庫(kù)中的規(guī)則,得出推理結(jié)論,從本質(zhì)上,可將推理機(jī)理解為對(duì)于以某種語(yǔ)言表示的推理規(guī)則的解釋程序。各部分功能(續(xù))數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)又叫工作空間,是一個(gè)動(dòng)態(tài)的存儲(chǔ)區(qū)域。其中包含專家系統(tǒng)運(yùn)行過(guò)程中的各種數(shù)據(jù)
17、,如初始條件、中間結(jié)果、推理結(jié)論等。一般來(lái)說(shuō),數(shù)據(jù)庫(kù)中存放著系統(tǒng)當(dāng)前所處理對(duì)象的一些事實(shí)和系統(tǒng)當(dāng)前的狀態(tài)數(shù)據(jù)。例如,醫(yī)療專家系統(tǒng)的數(shù)據(jù)庫(kù)存放當(dāng)前患者的姓名、年齡、病情癥狀以及推理得到的初步診斷結(jié)果。知識(shí)獲取與學(xué)習(xí)系統(tǒng)知識(shí)獲取與學(xué)習(xí)系統(tǒng)是專家系統(tǒng)中用于維護(hù)更新知識(shí)庫(kù)的程序部分。專家系統(tǒng)自身通過(guò)推理過(guò)程或?yàn)橥瓿赏评碓谂c用戶的交互過(guò)程中發(fā)現(xiàn)并學(xué)習(xí)新的知識(shí),然后通過(guò)知識(shí)庫(kù)管理系統(tǒng)更新知識(shí)庫(kù)。同時(shí),人類專家和系統(tǒng)開發(fā)人員也通過(guò)這個(gè)系統(tǒng)增加、刪除或修改知識(shí)庫(kù)的內(nèi)容。各部分功能(續(xù))解釋系統(tǒng)解釋系統(tǒng)的功能是回答用戶有關(guān)推理過(guò)程方面的問(wèn)題,向用戶解釋說(shuō)明專家系統(tǒng)的推理過(guò)程、推理中所使用的知識(shí)、所得結(jié)論的緣由、
18、條件和結(jié)論之間的因果關(guān)系等。解釋的內(nèi)容通過(guò)用戶接口輸出。用戶接口用戶接口是專家系統(tǒng)與用戶交互的界面,是專家系統(tǒng)中完成系統(tǒng)與用戶對(duì)話的程序部分。它直接面向用戶,系統(tǒng)通過(guò)用戶界面接收所求解問(wèn)題的初始數(shù)據(jù),并將推理結(jié)果及相關(guān)的解釋輸出給用戶。 專家系統(tǒng)的特征具有專家水平的專門知識(shí)一般問(wèn)題的求解能力具有解釋功能具有獲取知識(shí)的能力知識(shí)和推理機(jī)構(gòu)相互獨(dú)立3ES利用IT來(lái)獲取并利用人類的專業(yè)知識(shí)。ES能夠很好地解決具有清晰規(guī)則和程序的問(wèn)題且具有很高的效率,并給企業(yè)帶來(lái)巨大的收益。專家系統(tǒng)的應(yīng)用范疇ES能做的事情處理大量的信息匯集來(lái)自各種渠道的信息提供決策的一致性減少完成任務(wù)的人員工作時(shí)間減少錯(cuò)誤改善為顧客提
19、供的服務(wù)提供新的信息降低成本運(yùn)用DSS時(shí),用戶必須對(duì)所處理的問(wèn)題具有相當(dāng)?shù)膶I(yè)知識(shí)和專業(yè)技能。DSS是輔助用戶進(jìn)行決策,意味著用戶必須知道如何對(duì)問(wèn)題進(jìn)行推理、應(yīng)該提出哪些問(wèn)題、如何得到答案以及如何進(jìn)行下一步驟。專家系統(tǒng)自身就具有這些功能,用戶只須向ES提供需要解決問(wèn)題的事實(shí)和癥候,用以實(shí)際解決問(wèn)題的技術(shù)或?qū)I(yè)知識(shí)是由某領(lǐng)域內(nèi)的專家提供的。專家系統(tǒng)與DSS的區(qū)別第二節(jié) 商務(wù)智能企業(yè)資源計(jì)劃(ERP)、銷售終端(POS)、市場(chǎng)調(diào)查、供應(yīng)商、客戶、網(wǎng)絡(luò)、政府部門等都在不斷地增加信息,據(jù)統(tǒng)計(jì),平均每18個(gè)月信息量就翻一番,但據(jù)專家估計(jì)目前被利用的數(shù)據(jù)只有5%10%,并且我們能分析的數(shù)據(jù)僅限于數(shù)據(jù)庫(kù)中的
20、數(shù)據(jù)。那么怎樣才能把大量的數(shù)據(jù)轉(zhuǎn)換成可靠的、有價(jià)值的商務(wù)信息以增加利潤(rùn)和市場(chǎng)份額,獲得更多的競(jìng)爭(zhēng)優(yōu)勢(shì),這已成為商業(yè)IT界關(guān)注的問(wèn)題。由此,商務(wù)智能技術(shù)應(yīng)運(yùn)而生。商務(wù)智能產(chǎn)生的背景企業(yè)的“數(shù)據(jù)監(jiān)獄”(Data Jail)現(xiàn)象。對(duì)大部分企業(yè)來(lái)說(shuō)數(shù)據(jù)處理的問(wèn)題不是數(shù)據(jù)缺乏,而是大量的數(shù)據(jù)冗余和數(shù)據(jù)不一致。龐大的數(shù)據(jù)量和傳統(tǒng)數(shù)據(jù)管理方法的缺陷,使大部分企業(yè)出現(xiàn)了“數(shù)據(jù)擁擠”(數(shù)據(jù)監(jiān)獄)現(xiàn)象,既不利于企業(yè)的管理也不利于信息的有效利用。 “數(shù)據(jù)資產(chǎn)”新企業(yè)觀念的建立。目前大部分大中規(guī)模的企業(yè)都是信息豐富的組織,而一個(gè)信息豐富的組織的績(jī)效不僅僅依賴于產(chǎn)品、服務(wù)或地點(diǎn)等因素,而更重要的是依賴知識(shí)。商務(wù)智能的本
21、質(zhì)正是把數(shù)據(jù)轉(zhuǎn)化為知識(shí),致力于知識(shí)發(fā)現(xiàn)和挖掘,使企業(yè)的數(shù)據(jù)資產(chǎn)能帶來(lái)明顯的經(jīng)濟(jì)效益,減少不確定性因素的影響,使企業(yè)取得新的競(jìng)爭(zhēng)優(yōu)勢(shì)。 1商務(wù)智能產(chǎn)生的背景(續(xù))企業(yè)運(yùn)營(yíng)模式的變化。電子商務(wù)正在改變著全球商務(wù)活動(dòng)的方式,信息在經(jīng)濟(jì)活動(dòng)中越來(lái)越占據(jù)著重要的地位。建立在Internet之上的企業(yè)經(jīng)營(yíng)模式電子商務(wù):電子郵件、電子數(shù)據(jù)交換、電子支付系統(tǒng)、電子營(yíng)銷等技術(shù)的發(fā)展和應(yīng)用為商務(wù)智能系統(tǒng)提供了市場(chǎng)和生存環(huán)境。 數(shù)據(jù)庫(kù)和人工智能技術(shù)的發(fā)展。商務(wù)智能的發(fā)展也得益于相關(guān)技術(shù)的發(fā)展,并行處理系統(tǒng)、廉價(jià)數(shù)據(jù)存儲(chǔ)、新數(shù)據(jù)挖掘算法、神經(jīng)網(wǎng)絡(luò)技術(shù)、人工智能技術(shù)、決策支持技術(shù)、從大量數(shù)據(jù)中發(fā)現(xiàn)其后潛藏的商業(yè)機(jī)會(huì)等等
22、技術(shù)的發(fā)展,使企業(yè)能以更低的成本投資商務(wù)智能,并取得更高的投資回報(bào)率。1一類由數(shù)據(jù)倉(cāng)庫(kù)(或數(shù)據(jù)集市)、查詢報(bào)表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成的,以幫助企業(yè)決策為目的的技術(shù)。商務(wù)智能(Business Intelligence,BI)是一種知識(shí),它包含了企業(yè)的客戶、競(jìng)爭(zhēng)對(duì)手、合作伙伴、競(jìng)爭(zhēng)環(huán)境和企業(yè)內(nèi)部運(yùn)作的知識(shí),使企業(yè)有能力制定有效的、重要的和經(jīng)常性的商業(yè)戰(zhàn)略決策。創(chuàng)建商務(wù)智能需要數(shù)據(jù)和信息,人們首先必須收集并合理地組織信息,然后必須使用合理的IT工具(數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘)來(lái)定義和分析信息內(nèi)部的各種關(guān)系。決策者利用IT工具從信息中提取商務(wù)智能。商務(wù)智能的定義2構(gòu)建
23、商務(wù)智能的過(guò)程商務(wù)智能的典型應(yīng)用 產(chǎn)品銷售管理包括產(chǎn)品的銷售策略、銷售量分析,影響產(chǎn)品銷售的因素分析,以及產(chǎn)品銷售的改進(jìn)方案的預(yù)測(cè)。 客戶關(guān)系管理通過(guò)客戶關(guān)系管理子系統(tǒng),使企業(yè)可以分析顧客購(gòu)買習(xí)慣和購(gòu)買傾向,調(diào)查顧客滿意度,進(jìn)而采取相應(yīng)對(duì)策增強(qiáng)顧客保持力,培養(yǎng)忠實(shí)顧客,維持良好的顧客關(guān)系。 產(chǎn)品創(chuàng)新和推廣異常處理25.2.2數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse,DW)技術(shù)產(chǎn)生于20世紀(jì)90年代初,其目標(biāo)是進(jìn)行決策支持。數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生是多方面因素綜合作用的結(jié)果,數(shù)據(jù)庫(kù)技術(shù)和分布式處理技術(shù)的發(fā)展、企業(yè)對(duì)信息的需求和決策支持系統(tǒng)的不足促使數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生。 數(shù)據(jù)倉(cāng)庫(kù) 5.2.2 數(shù)據(jù)倉(cāng)庫(kù)是信息的邏輯
24、集合,這些信息來(lái)自于許多不同的業(yè)務(wù)數(shù)據(jù)庫(kù),并用于創(chuàng)建商務(wù)智能,以便支持企業(yè)的分析活動(dòng)和決策任務(wù)什么是數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)的特征面向主題的集成的穩(wěn)定的與時(shí)間相關(guān)的數(shù)據(jù)倉(cāng)庫(kù)具有多維性在關(guān)系數(shù)據(jù)庫(kù)模型中,信息是用一系列二維表來(lái)表示數(shù)據(jù)倉(cāng)庫(kù)中包含若干層的行和列大多數(shù)數(shù)據(jù)倉(cāng)庫(kù)實(shí)際上是一個(gè)多維數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)中的層根據(jù)不同的維度來(lái)表達(dá)信息這種多維度的信息圖表被稱為超立體結(jié)構(gòu)在企業(yè)中,大多數(shù)數(shù)據(jù)庫(kù)是面向業(yè)務(wù)的,即大多數(shù)數(shù)據(jù)庫(kù)都支持聯(lián)機(jī)事務(wù)處理(OLTP)數(shù)據(jù)倉(cāng)庫(kù)不是面向業(yè)務(wù)的,它們是用來(lái)支持企業(yè)中各種決策活動(dòng)的,因此DW僅支持聯(lián)機(jī)分析處理(OLAP)數(shù)據(jù)倉(cāng)庫(kù)支持決策而非事務(wù)處理MCI電話公司 以customer
25、marketing warehouse進(jìn)行趨勢(shì)分析、估算促銷成本、客戶維持率分析,從而能得知采取便宜且更為有效的選擇性促銷方式。 Wal-Mart連鎖零售商店分析顧客每次采購(gòu)的物品、時(shí)間及物品的擺置地點(diǎn)等,找出其中關(guān)聯(lián)性,并據(jù)此決定每一家店的進(jìn)貨方式、促銷戰(zhàn)略與店面貨物的最有效排列方式。美國(guó)聯(lián)邦住宅局利用數(shù)據(jù)倉(cāng)庫(kù)將10年來(lái)分散于70多個(gè)系統(tǒng)中的預(yù)算與會(huì)計(jì)資料整合起來(lái),供預(yù)算預(yù)測(cè)、支出分析、趨勢(shì)分析、方案評(píng)比及政策分析之用。Visa會(huì)員銀行利用數(shù)據(jù)倉(cāng)庫(kù)CRIS(cardholder risk information service)分析,幫助銀行發(fā)現(xiàn)欺詐的行為模式,減少了16%的偽造信用卡損失。
26、數(shù)據(jù)倉(cāng)庫(kù)實(shí)用案例數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的結(jié)構(gòu)分析工具關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)文件其他數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)管理工具抽取、轉(zhuǎn)換、裝載元數(shù)據(jù)庫(kù)數(shù)據(jù)建模工具綜合數(shù)據(jù)當(dāng)前數(shù)據(jù)歷史數(shù)據(jù)用戶查詢工具C/S工具OLAP工具數(shù)據(jù)挖掘工具源數(shù)據(jù)倉(cāng)庫(kù)管理數(shù)據(jù)倉(cāng)庫(kù)概念模型是對(duì)事物的概括和抽象。概念模型獨(dú)立于機(jī)器,反映了事物和事物之間的聯(lián)系,具有簡(jiǎn)明、易理解的特點(diǎn)。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)概念模型是多維數(shù)據(jù)模型。在數(shù)據(jù)倉(cāng)庫(kù)中,維是同類數(shù)據(jù)的集合,是組織數(shù)據(jù)的變量,也是重要的決策因素。數(shù)據(jù)倉(cāng)庫(kù)的組織多維數(shù)據(jù)模型的示例 北京1牛奶面包啤酒可樂黃油商品(工業(yè)-類別-商品)城市(國(guó)家-省-市)日期(年-月-日)234567上海廣州天津星型模型大多數(shù)數(shù)據(jù)倉(cāng)庫(kù)都采用星
27、型模型來(lái)表示多維數(shù)據(jù)模型。星型模型包括一個(gè)事實(shí)表和多個(gè)維表,其中的事實(shí)表和維表都是關(guān)系表。事實(shí)表包含數(shù)據(jù)倉(cāng)庫(kù)中的測(cè)量數(shù)據(jù)和指向與測(cè)量數(shù)據(jù)相關(guān)的其他維表的外鍵指針,每個(gè)外鍵指針指向一個(gè)維表。維表記錄每一維的主鍵和相關(guān)因素的屬性,每個(gè)維表對(duì)應(yīng)多維模型中的一維,它們形成了概念模型的多維層次聯(lián)系。 銷售表客房表訂單號(hào)銷售員號(hào)客戶號(hào)產(chǎn)品號(hào)日期標(biāo)識(shí)地區(qū)標(biāo)識(shí)數(shù)量總價(jià)訂單號(hào)訂貨日期客戶號(hào)客戶名稱客戶地址銷售員號(hào)銷售員姓名城市產(chǎn)品號(hào)產(chǎn)品名稱產(chǎn)品目錄單價(jià)日期標(biāo)識(shí)日月年地區(qū)名稱省別訂貨表地區(qū)表產(chǎn)品表日期表事實(shí)表圖5-9 星型模型星型模型雪花模型雪花模型是對(duì)星型模型的擴(kuò)展。它通過(guò)對(duì)星型模型維表進(jìn)一步細(xì)化,使原有的一些
28、維表被擴(kuò)展為更小的事實(shí)表,形成由一些局部星型模型所組成的多層次結(jié)構(gòu)。維表細(xì)化的目的是通過(guò)減少數(shù)據(jù)存儲(chǔ)量和聯(lián)合較少的維表來(lái)改善查詢性能。 地區(qū)表目錄表客房表事實(shí)表年表月表銷售表訂單號(hào)銷售員號(hào)客戶號(hào)產(chǎn)品號(hào)日期標(biāo)識(shí)地區(qū)標(biāo)識(shí)數(shù)量總價(jià)訂單號(hào)訂貨日期客戶號(hào)客戶名稱客戶地址銷售員號(hào)銷售員姓名城市產(chǎn)品號(hào)產(chǎn)品名稱產(chǎn)品目錄單價(jià)日期標(biāo)識(shí)日月年地區(qū)名稱省別訂貨表產(chǎn)品表日期表圖5-10 雪花模型產(chǎn)品目錄目錄描述月份年年省表省別雪花模型 數(shù)據(jù)集市(Data Marts)是一種更小、更集中的數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)集市面向特定應(yīng)用,主要針對(duì)具體的、部門級(jí)的應(yīng)用。數(shù)據(jù)集市數(shù)據(jù)集市的特征規(guī)模小,面向部門,有特定的應(yīng)用由業(yè)務(wù)部門定義、設(shè)計(jì)
29、、開發(fā)、管理和維護(hù)能快速實(shí)現(xiàn)購(gòu)買比較便宜,投資回收快工具集的緊密集成提供更詳細(xì)的、預(yù)先存在的、數(shù)據(jù)倉(cāng)庫(kù)的摘要子集可升級(jí)到完整的數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)的比較作業(yè)用數(shù)據(jù)處理特性(數(shù)據(jù)庫(kù))分析用數(shù)據(jù)處理特性(數(shù)據(jù)倉(cāng)庫(kù))數(shù)據(jù)特性 無(wú)重復(fù)數(shù)據(jù)重復(fù)數(shù)據(jù)詳細(xì)、少量匯總(微觀)詳細(xì)、大量匯總(宏觀)數(shù)據(jù)處理量(數(shù)個(gè)月)數(shù)據(jù)處理量(510年)經(jīng)常移動(dòng)不常移動(dòng)作業(yè)特性 提供作業(yè)階層數(shù)據(jù)處理服務(wù)提供管理階層信息服務(wù)支持每日交易的操作(增添、刪除、查詢、打?。┲С止芾頉Q策的需求(查詢、打?。┞?lián)機(jī)事務(wù)處理(OLTP)聯(lián)機(jī)分析處理(OLAP)要求操作有效率且快速回應(yīng)對(duì)效率及快速回應(yīng)不特別要求開發(fā)特性軟件開發(fā)生命周期動(dòng)
30、態(tài)反復(fù)分析交易系統(tǒng)導(dǎo)向、適于大量交易決策分析導(dǎo)向、適于復(fù)雜查詢使用數(shù)據(jù)倉(cāng)庫(kù)時(shí)需重點(diǎn)考慮的問(wèn)題企業(yè)是否真正需要數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘工具時(shí)十分昂貴的,而且需要不斷地得到擴(kuò)展的和昂貴的支持。有些企業(yè)并不需要數(shù)據(jù)倉(cāng)庫(kù),若能從業(yè)務(wù)數(shù)據(jù)庫(kù)中輕而易舉地獲取決策所必需的信息,就沒必要采用數(shù)據(jù)倉(cāng)庫(kù)。企業(yè)員工需要整個(gè)數(shù)據(jù)倉(cāng)庫(kù)嗎如果不是這樣,就應(yīng)考慮建立數(shù)據(jù)集市。怎樣更新信息為創(chuàng)建數(shù)據(jù)庫(kù),可以用“快照”(snapshot)方式從其他數(shù)據(jù)庫(kù)中提取信息,并導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù),但如果關(guān)鍵的信息要做到即時(shí)更新,則往往是不可行的。案例:金融業(yè)數(shù)據(jù)倉(cāng)庫(kù)解決方案數(shù)據(jù)倉(cāng)庫(kù)是金融銀行機(jī)構(gòu)實(shí)現(xiàn)客戶關(guān)系管理的核心技術(shù),也是金融銀行業(yè)競(jìng)爭(zhēng)
31、優(yōu)勢(shì)的來(lái)源,主要的應(yīng)用業(yè)務(wù)部門為信用卡部、信貸部、市場(chǎng)部和零售業(yè)務(wù)部等,應(yīng)用領(lǐng)域是以客戶為中心的,分銷渠道管理、客戶利潤(rùn)分析、客戶關(guān)系優(yōu)化、風(fēng)險(xiǎn)評(píng)估和管理。采用數(shù)據(jù)倉(cāng)庫(kù)作為個(gè)性化服務(wù)的手段,在發(fā)達(dá)國(guó)家和地區(qū),金融銀行業(yè)的實(shí)踐已取得顯著的成效 。什么是個(gè)性化服務(wù)呢?客戶認(rèn)為:隱含知道我(Who)在什么數(shù)據(jù)(When)、需要什么產(chǎn)品或服務(wù)(What)、以我可以接受的價(jià)格(How much)、經(jīng)由我喜好的分銷渠道(Where),對(duì)我提供銷售。銀行認(rèn)為:以有競(jìng)爭(zhēng)性的產(chǎn)品或服務(wù)(What)、在適當(dāng)?shù)臅r(shí)間(When)、通過(guò)適當(dāng)?shù)姆咒N渠道(Where)、對(duì)信用好風(fēng)險(xiǎn)低的客戶(Who)、以合理的價(jià)格(How
32、Much)和利潤(rùn)(Profitable)完成銷售。兩者都是在精打細(xì)算的前提下,以達(dá)成各自的需求和目標(biāo)。金融業(yè)數(shù)據(jù)倉(cāng)庫(kù)解決方案(續(xù))以客戶為中心的數(shù)據(jù)倉(cāng)庫(kù)決策支持系統(tǒng)可以快速的了解每一項(xiàng)交易、每一個(gè)賬號(hào)、每一個(gè)分銷渠道、每一位客戶的風(fēng)險(xiǎn)和利潤(rùn),讓銀行作出正確的業(yè)務(wù)決策,及時(shí)響應(yīng)每一位客戶現(xiàn)在未來(lái)的需要,提高整體運(yùn)作和管理水平。主要體現(xiàn)在以下幾個(gè)方面:(1)分銷渠道的分析和管理(Behavior Explorer)建立分銷渠道的分析和管理階段完成后,銀行就能知道客戶、渠道、產(chǎn)品或服務(wù)三者之間的關(guān)系,了解客戶的購(gòu)買行為,客戶或渠道對(duì)業(yè)務(wù)收入的貢獻(xiàn),哪些客戶比較喜好經(jīng)由什么渠道在何時(shí)和銀行打交道,目前
33、的分銷渠道的服務(wù)能力如何,需要增加哪些分銷渠道才能達(dá)到預(yù)期的服務(wù)水平。金融業(yè)數(shù)據(jù)倉(cāng)庫(kù)解決方案(續(xù))(2)利潤(rùn)評(píng)價(jià)模型(Profitable Measurement Foundation)建立所有客戶的每一個(gè)賬號(hào)的利潤(rùn)評(píng)價(jià)模型,以便了解每一位客戶對(duì)銀行的總利潤(rùn)貢獻(xiàn)度。銀行可以依照客戶的利潤(rùn)貢獻(xiàn)度安排合適的分銷渠道提供服務(wù)和銷售,知道哪些有利潤(rùn)的客戶需要留住,采用什么方法留住客戶,以交叉銷售改善客戶的利潤(rùn)貢獻(xiàn)度,知道哪些客戶應(yīng)該爭(zhēng)取。另外,銀行可以模擬和預(yù)測(cè),新產(chǎn)品對(duì)銀行利潤(rùn)的貢獻(xiàn)度,或是新政策對(duì)銀行會(huì)產(chǎn)生什么樣的財(cái)務(wù)影響,或是客戶流失或留住對(duì)銀行的整體利潤(rùn)的影響。金融業(yè)數(shù)據(jù)倉(cāng)庫(kù)解決方案(續(xù))(3
34、)客戶關(guān)系優(yōu)化(Relationship Optimizer)客戶在每一筆交易中都能主動(dòng)的告訴銀行需要什么產(chǎn)品或服務(wù),例如,定期存款是希望退休養(yǎng)老使用、申請(qǐng)信用卡是需要現(xiàn)金消費(fèi)、詢問(wèn)放貸利息是需要住房貸款等,這些都是銀行提供產(chǎn)品或服務(wù)最好的時(shí)機(jī)。銀行需要將賬號(hào)每天發(fā)生的交易明細(xì),以實(shí)時(shí)或定時(shí)的方式加載到中央數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),核對(duì)客戶行為的變化。當(dāng)有上述變化時(shí),馬上生成事件,然后銀行業(yè)務(wù)部門利用客戶購(gòu)買傾向模型、渠道喜好模型、利潤(rùn)貢獻(xiàn)度模型、信用和風(fēng)險(xiǎn)評(píng)分模型等,主動(dòng)地和客戶溝通并進(jìn)行交叉銷售,達(dá)成留住客戶和增加利潤(rùn)的目標(biāo)。金融業(yè)數(shù)據(jù)倉(cāng)庫(kù)解決方案(續(xù))(4)風(fēng)險(xiǎn)評(píng)估和管理風(fēng)險(xiǎn)評(píng)估和管理是實(shí)施數(shù)據(jù)倉(cāng)庫(kù)
35、最困難的工作,本階段因?yàn)闋可婧芏喙芾碇贫?,所以需要較長(zhǎng)的時(shí)間。風(fēng)險(xiǎn)評(píng)估和管理主要利用各種數(shù)學(xué)模型進(jìn)行分析,模擬風(fēng)險(xiǎn)和利潤(rùn)間的關(guān)系。當(dāng)本階段完成后,銀行就完全實(shí)現(xiàn)了以客戶為中心的個(gè)性化服務(wù)數(shù)據(jù)倉(cāng)庫(kù)決策支持系統(tǒng),可以在滿足高利潤(rùn)低風(fēng)險(xiǎn)客戶需求的前提下,達(dá)成銀行收益的極大化。 學(xué)習(xí)內(nèi)容聯(lián)機(jī)分析處理的概念OLAP的基本分析操作聯(lián)機(jī)分析處理OLAP 5.2.3 聯(lián)機(jī)分析處理(OLAP) 的概念聯(lián)機(jī)分析處理 (On-Line Analytical Processing,OLAP)OLAP是在傳統(tǒng)的聯(lián)機(jī)事務(wù)處理(on-line transaction processing,OLTP)的基礎(chǔ)上發(fā)展起來(lái)的一種數(shù)
36、據(jù)分析技術(shù),又稱多維分析或共享多維信息的快速分析。它用于完成基于某種數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)分析功能。隨著用戶對(duì)數(shù)據(jù)分析要求的增加,OLTP已不能完全滿足用戶的需求。關(guān)系數(shù)據(jù)庫(kù)雖然具有一定的數(shù)據(jù)視圖選取、比較和綜合的能力,但受到數(shù)據(jù)分析能力的制約,例如,SQL等數(shù)據(jù)庫(kù)查詢語(yǔ)言對(duì)大型數(shù)據(jù)庫(kù)的簡(jiǎn)單查詢不能滿足決策者提出的信息需求,用戶的決策分析需要對(duì)關(guān)系數(shù)據(jù)庫(kù)進(jìn)行大量計(jì)算才能得出結(jié)果。1OLTP和OLAP 的比較OLTP是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)的主要應(yīng)用,主要是基本的、日常的事務(wù)處理,例如銀行交易。OLAP是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果,可以以多維的形式從
37、多方面和多角度來(lái)觀察組織的狀態(tài)、了解組織的變化。 OLTP和OLAP 的比較(續(xù))OLTPOLAP用戶操作人員,低層管理人員決策人員,高級(jí)管理人員功能日常操作處理分析決策DB 設(shè)計(jì)面向應(yīng)用面向主題數(shù)據(jù)當(dāng)前的,最新的細(xì)節(jié)的,二維的分立的歷史的,聚集的,多維的集成的,統(tǒng)一的存取讀/寫數(shù)十條記錄讀上百萬(wàn)條記錄工作單位簡(jiǎn)單的事務(wù)復(fù)雜的查詢用戶數(shù)上千個(gè)上百個(gè)DB 大小100MB-GB100GB-TB OLAP的一些基本概念變量變量是數(shù)據(jù)的實(shí)際意義,即描述數(shù)據(jù)“是什么” 一般情況下,變量總是一個(gè)數(shù)值度量指標(biāo),例如人數(shù)、單價(jià)、銷售量等都是變量, 維維是人們觀察數(shù)據(jù)的特定角度。例如,企業(yè)常常關(guān)心產(chǎn)品銷售數(shù)據(jù)隨
38、著時(shí)間推移而產(chǎn)生的變化情況,這時(shí)是從時(shí)間角度來(lái)觀察產(chǎn)品的銷售,所以時(shí)間是一個(gè)維(時(shí)間維)。 2OLAP的一些基本概念(續(xù))維的層次人們觀察數(shù)據(jù)的某個(gè)特定角度(即某個(gè)維)還可以存在細(xì)節(jié)程度不同的多個(gè)描述方面,我們稱這個(gè)描述方面為維的層次。維成員維的一個(gè)取值稱為該維的一個(gè)維成員。如果一個(gè)維是多層次的,那么該維的維成員是由各個(gè)不同維層次的取值組合而成的。例如,時(shí)間維的一個(gè)維成員,即“某年某月某日”。一個(gè)維成員并不一定在每個(gè)維層次上都要取值,例如“某年某月”、“某月某日”、“某年”等都是時(shí)間維的維成員。對(duì)應(yīng)一個(gè)數(shù)據(jù)項(xiàng)來(lái)說(shuō),維成員是該數(shù)據(jù)項(xiàng)在某維中位置的描述。例如對(duì)一個(gè)銷售數(shù)據(jù)來(lái)說(shuō),時(shí)間維是維成員“某年
39、某月某日”就表示該銷售數(shù)據(jù)是“某年某月某日”的銷售數(shù)據(jù),“某年某月某日”是該銷售數(shù)據(jù)在時(shí)間維上位置的描述。OLAP的一些基本概念(續(xù))多維數(shù)組一個(gè)多維數(shù)組可以表示為:(維1,維2,維n,變量)。例如,若日用品銷售量數(shù)據(jù)是按時(shí)間、地區(qū)和銷售渠道組織起來(lái)的三維立方體,加上變量銷售額,就組成了一個(gè)多維數(shù)組(地區(qū)、時(shí)間、銷售渠道、銷售額)。數(shù)據(jù)單元(單元格)多維數(shù)組的取值成為一個(gè)數(shù)據(jù)單元。當(dāng)多維數(shù)組的各個(gè)維都選中一個(gè)維成員,這些維成員的組合就唯一確定了一個(gè)變量的值。那么數(shù)據(jù)單元就可以表示為(維1維成員,維2維成員,維n維成員,變量的值)。例如,我們?cè)诋a(chǎn)品、地區(qū)、時(shí)間和銷售渠道上各取維成員“牙膏”、“上
40、海”、“1998年12月”和“批發(fā)”,就唯一確定了變量“銷售額”的一個(gè)值(假設(shè)為100000),則該數(shù)據(jù)單元可表示為(牙膏、上海、1998年12月、批發(fā),100000)。 OLAP的基本分析操作切片(Slice)定義1:在多維數(shù)組的某一維上選定一維成員的動(dòng)作成為切片,即在多維數(shù)組(維1,維2,維n,變量)中選一維,如維i,并取其一維成員(設(shè)為“維成員Vi”),所得的多維數(shù)組的子集(維1,維成員Vi,維n,變量)稱為在維i上的一個(gè)切片。定義2:選定多維數(shù)組的一個(gè)二維子集的動(dòng)作叫做切片,即選定多維數(shù)組(維1,維2,維n,變量)中的兩個(gè)維,如維i和維j,在這兩個(gè)維上取某一區(qū)間或任意維成員,而將其余的
41、維都取定一個(gè)維成員,則得到的就是多維數(shù)組在維i和維j上的一個(gè)二維子集,稱這個(gè)二維子集為多維數(shù)組在維i和維j上的一個(gè)切片,表示為:(維i,維j,變量)。3切片示例上海時(shí)間維地區(qū)維產(chǎn)品維廣州電視機(jī) 電冰箱9899上海電視機(jī)切塊(Dice)定義1:在多維數(shù)組的某一維上選定某一區(qū)間的維成員的動(dòng)作稱為切塊,即限制多維數(shù)組的某一維的取值區(qū)間。顯然,當(dāng)這一區(qū)間只取一個(gè)維成員時(shí),即得到一個(gè)切片。定義2:選定多維數(shù)組的一個(gè)三維子集的動(dòng)作稱為切塊。即選定多維數(shù)組(維1,維2,。,維n,變量)中的三個(gè)維:維i,維j和維r,在這三個(gè)維上取某一區(qū)間或任意的維成員,而將其余的維都取定一個(gè)維成員,則得到的就是多維數(shù)組在維i
42、、維j和維r上的一個(gè)三維子集,我們稱這個(gè)三維子集為多維數(shù)組在維i、維j和維r上的一個(gè)切塊,表示為:(維i,維j,維r,變量)。 OLAP的基本分析操作3旋轉(zhuǎn)(Rotate)旋轉(zhuǎn)即改變一個(gè)報(bào)告或頁(yè)面顯示的維方向。例如,旋轉(zhuǎn)可能包含交換行和列,或是把某一個(gè)行維移到列維中去,或是把頁(yè)面顯示中的一個(gè)維和頁(yè)面外的維進(jìn)行交換(令其成為新的行或列中的一個(gè))。 OLAP的基本分析操作3旋轉(zhuǎn)示例(a)是把一個(gè)橫向?yàn)闀r(shí)間、縱向?yàn)楫a(chǎn)品的報(bào)表旋轉(zhuǎn)成為橫向?yàn)楫a(chǎn)品、縱向?yàn)闀r(shí)間的報(bào)表。(b)是把一個(gè)橫向?yàn)闀r(shí)間、縱向?yàn)楫a(chǎn)品的報(bào)表,變成一個(gè)橫向仍為時(shí)間,而縱向旋轉(zhuǎn)為地區(qū)的報(bào)表。 時(shí)間維產(chǎn)品維產(chǎn)品維時(shí)間維行列交換(a)時(shí)間維產(chǎn)品
43、維時(shí)間維地區(qū)維旋轉(zhuǎn)以改變頁(yè)面顯示(b)圖5-12 旋轉(zhuǎn)下鉆/上探(drill down/roll up)鉆探處理是使用戶在數(shù)據(jù)倉(cāng)庫(kù)的多層數(shù)據(jù)中能通過(guò)導(dǎo)航信息而獲得更多的細(xì)節(jié)性數(shù)據(jù)。鉆探一般是指向下鉆探。 還包括上探:即讓用戶查看一個(gè)數(shù)據(jù)集的粗集視圖,例如上例中相反的操作為上探交叉鉆探:即可讓用戶在同一層次從一個(gè)數(shù)據(jù)集橫向地移到另一個(gè)數(shù)據(jù)集進(jìn)行查看和分析 OLAP的基本分析操作3下鉆示例地區(qū)銷售額(萬(wàn)元)上海900長(zhǎng)沙650廣州8001999年某產(chǎn)品銷售數(shù)據(jù) 1999年地區(qū)1季度2季度3季度4季度上海200200350150長(zhǎng)沙250100150150廣州2001501802701999年各季度
44、某產(chǎn)品銷售數(shù)據(jù)人們?cè)谌粘I钪薪?jīng)常會(huì)遇到這樣的情況:超市的經(jīng)營(yíng)者希望將經(jīng)常被同時(shí)購(gòu)買的商品放在一起,以增加銷售;保險(xiǎn)公司想知道購(gòu)買保險(xiǎn)的客戶一般具有哪些特征;醫(yī)學(xué)研 究人員希望從已有的成千上萬(wàn)份病歷中找出患某種疾病的病人的共同特征,從而為治愈這種疾病提供一些幫助。對(duì)于以上問(wèn)題,現(xiàn)有MIS中的數(shù)據(jù)分析工具無(wú)法給出答案。因?yàn)闊o(wú)論是查詢、統(tǒng)計(jì)還是報(bào)表,其處理方式都是對(duì)指定的數(shù)據(jù)進(jìn)行簡(jiǎn)單的數(shù)字處理,而不能對(duì)這些數(shù)據(jù)所包含的內(nèi)在信息進(jìn)行提取。隨著MIS的廣泛應(yīng)用和數(shù)據(jù)量激增,人們希望能夠提供更高層次的數(shù)據(jù)分析功能,從而更好地對(duì)決策或科研工作提供支持。正是為了滿足這種要求,從大量數(shù)據(jù)中提取出隱藏在其中的有
45、用信息,將機(jī)器學(xué)習(xí)應(yīng)用于大型數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘(Data Mining)技術(shù)得到了長(zhǎng)足的發(fā)展。 數(shù)據(jù)挖掘5.2.41數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘(Data Mining)是從大量數(shù)據(jù)中抽取有意義的、隱含的、以前未知的并有潛在使用價(jià)值的知識(shí)的過(guò)程。 數(shù)據(jù)挖掘的基本理念:“顧客過(guò)去的消費(fèi)行為可以作為未來(lái)采購(gòu)意愿的指標(biāo)。”,從不同的數(shù)據(jù)來(lái)源收集大量的顧客信息,以便分析并確認(rèn)特定的顧客需求,掌握特定目標(biāo)市場(chǎng)。例如:顧客在何時(shí)、何處采購(gòu),購(gòu)買什么產(chǎn)品,什么價(jià)格,在哪一種商店,在何時(shí)到何處旅游等。2數(shù)據(jù)挖掘的過(guò)程采集選擇的目的是辨別出需要分析的數(shù)據(jù)集合,縮小處理范圍,然而實(shí)際相系統(tǒng)中收集到的原始數(shù)據(jù)通常是“臟”的
46、,即數(shù)據(jù)存在雜亂性、重復(fù)性及不完整性。數(shù)據(jù)預(yù)處理可以處理數(shù)據(jù)中的遺漏及清洗臟數(shù)據(jù),從而提高數(shù)據(jù)挖掘的質(zhì)量,數(shù)據(jù)預(yù)處理包括數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)變換和數(shù)據(jù)簡(jiǎn)化等幾方面的功能。采集選擇數(shù)據(jù)預(yù)處理采集開采原始數(shù)據(jù)源數(shù)據(jù)目標(biāo)數(shù)據(jù)模式知識(shí)解釋評(píng)價(jià)數(shù)據(jù)挖掘的過(guò)程數(shù)據(jù)挖掘的過(guò)程(續(xù))數(shù)據(jù)挖掘階段進(jìn)行實(shí)際的挖掘操作,它要先決定是進(jìn)行發(fā)現(xiàn)型的數(shù)據(jù)挖掘,還是驗(yàn)證型的數(shù)據(jù)挖掘,然后選擇合適的工具,進(jìn)行發(fā)現(xiàn)知識(shí)的操作及證實(shí)發(fā)現(xiàn)的知識(shí)。解釋評(píng)價(jià)的任務(wù)不僅是把結(jié)果表達(dá)出來(lái)(例如采用信息可視化方法),還要對(duì)信息進(jìn)行過(guò)濾處理,如果不能令決策者滿意,需要重復(fù)以上數(shù)據(jù)挖掘的過(guò)程。3數(shù)據(jù)挖掘與數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系首先,由于大多數(shù)數(shù)據(jù)挖
47、掘工具要在集成的、一致的、經(jīng)過(guò)清理的數(shù)據(jù)上進(jìn)行挖掘。而已經(jīng)完成數(shù)據(jù)清理、數(shù)據(jù)變換和數(shù)據(jù)集成的數(shù)據(jù)倉(cāng)庫(kù),完全能為數(shù)據(jù)挖掘提供它所需要的挖掘數(shù)據(jù),使數(shù)據(jù)挖掘免除了數(shù)據(jù)準(zhǔn)備的繁雜過(guò)程。3數(shù)據(jù)挖掘與數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系其次,在數(shù)據(jù)挖掘過(guò)程中,常常需要進(jìn)行探測(cè)式的數(shù)據(jù)分析,從各種數(shù)據(jù)庫(kù)中選擇相關(guān)數(shù)據(jù),對(duì)各種數(shù)據(jù)選擇不同的粒度,以不同的形式提供知識(shí)或結(jié)果。而數(shù)據(jù)倉(cāng)庫(kù)中的OLAP完全可以為數(shù)據(jù)挖掘提供有關(guān)的數(shù)據(jù)操作支持,例如,對(duì)數(shù)據(jù)立方體或數(shù)據(jù)挖掘中間結(jié)果進(jìn)行下鉆、上探、旋轉(zhuǎn)、切塊、切片等操作,且以O(shè)LAP的可視化功能為數(shù)據(jù)挖掘過(guò)程或挖掘結(jié)果提供良好的操作平臺(tái),這些都將極大地增強(qiáng)數(shù)據(jù)挖掘的功能和靈活性。此外,在數(shù)
48、據(jù)挖掘過(guò)程中,如果將數(shù)據(jù)挖掘與數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行有效的連接,將增加數(shù)據(jù)挖掘的聯(lián)機(jī)挖掘功能。用戶在數(shù)據(jù)挖掘的過(guò)程中,可以利用數(shù)據(jù)倉(cāng)庫(kù)中的OLAP與各種數(shù)據(jù)挖掘工具的連接,使用戶可以為數(shù)據(jù)挖掘選擇合適的數(shù)據(jù)挖掘工具,能夠在數(shù)據(jù)挖掘過(guò)程中靈活地組織挖掘工具以增強(qiáng)數(shù)據(jù)挖掘能力,同時(shí)還為用戶靈活地改變數(shù)據(jù)挖掘的模式與任務(wù)提供便利。數(shù)據(jù)挖掘工具是用戶對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行信息查詢的軟件工具。數(shù)據(jù)挖掘工具支持OLAP的概念,即通過(guò)對(duì)數(shù)據(jù)的處理來(lái)支持決策任務(wù)。數(shù)據(jù)挖掘工具數(shù)據(jù)挖掘工具集查詢與報(bào)表工具查詢與報(bào)表工具與QBE工具、SQL和典型數(shù)據(jù)庫(kù)環(huán)境中的報(bào)表生成器類似。大多數(shù)數(shù)據(jù)倉(cāng)庫(kù)環(huán)境都支持諸如QBE、SQL和報(bào)表生成器之
49、類的簡(jiǎn)單易用的數(shù)據(jù)操作子系統(tǒng)工具。智能代理智能代理運(yùn)用各種人工智能工具(如:神經(jīng)網(wǎng)絡(luò)、模糊邏輯)形成OLAP中的“信息發(fā)現(xiàn)”基礎(chǔ),并創(chuàng)建商務(wù)智能。智能代理是一種軟件,它可以輔助人或充當(dāng)人的代表來(lái)執(zhí)行重復(fù)的與計(jì)算機(jī)相關(guān)的任務(wù)。數(shù)據(jù)挖掘代理在數(shù)據(jù)倉(cāng)庫(kù)上運(yùn)行以發(fā)現(xiàn)信息(知識(shí))。智能代理不僅僅應(yīng)用于數(shù)據(jù)倉(cāng)庫(kù)環(huán)境的OLAP,而且還能應(yīng)用于Web上查詢信息。多維分析工具切片/切塊技術(shù)旋轉(zhuǎn)魔方統(tǒng)計(jì)工具統(tǒng)計(jì)工具幫助人們利用各種數(shù)學(xué)模型將信息存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中,進(jìn)而去挖掘出新的信息。時(shí)間序列分析-計(jì)劃未來(lái)趨勢(shì)回歸分析-確定一個(gè)變量對(duì)另一個(gè)變量的影響4數(shù)據(jù)挖掘的主要應(yīng)用領(lǐng)域以產(chǎn)品營(yíng)銷領(lǐng)域?yàn)槔?顧客特性分析(customer profile analysis)目標(biāo)市場(chǎng)分析(targeted market analysis)市場(chǎng)購(gòu)物籃分析(marketbasket analysis)5數(shù)據(jù)挖掘分類分類(Classification)其旨在生成一個(gè)分類函數(shù)或分類模型,該模型能把數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到給定類別中的某一個(gè)。既可以用此模型分析已有的數(shù)據(jù),也可以用它來(lái)預(yù)測(cè)未來(lái)的數(shù)據(jù)。聚集(Clustering)聚集是對(duì)記錄分組,把相似的記錄在一個(gè)聚集里。聚集和分類的區(qū)別是聚集不依賴于預(yù)先定義好的類,不需要訓(xùn)練集。數(shù)據(jù)可視化(Description and Visualization)數(shù)據(jù)可視化嚴(yán)格
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國(guó)高性能熱塑性塑料行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國(guó)高爾夫服裝行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)高壓蒸汽發(fā)生器行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國(guó)高壓氧艙行業(yè)市場(chǎng)深度調(diào)研及投資前景與投資策略研究報(bào)告
- 2024年育嬰師實(shí)踐操作考試試題及答案
- 2025-2030中國(guó)飼料加工機(jī)械行業(yè)市場(chǎng)發(fā)展分析及前景趨勢(shì)與投資研究報(bào)告
- 2025-2030中國(guó)飲料碳酸機(jī)市場(chǎng)行情監(jiān)測(cè)與投資可行性研究報(bào)告
- 2025-2030中國(guó)餐廳家具行業(yè)發(fā)展分析及投資風(fēng)險(xiǎn)預(yù)測(cè)研究報(bào)告
- 2025-2030中國(guó)食物過(guò)敏原PCR試劑盒行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025-2030中國(guó)食品級(jí)硅膠行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 工程量確認(rèn)單范本
- 曲臂車安全協(xié)議模板
- 腰椎間盤的診斷證明書
- 英語(yǔ)精讀與寫作(一)知到章節(jié)答案智慧樹2023年長(zhǎng)春工程學(xué)院
- DB31 SW-Z 017-2021 上海市排水檢測(cè)井圖集
- 農(nóng)業(yè)機(jī)械學(xué)育苗移栽機(jī)械
- 澳大利亞PSC檢查經(jīng)過(guò)
- 01-14江蘇大學(xué)車輛工程考研復(fù)試真題答案
- TMYZX 001-2021 釀酒專用小麥原糧
- 2023年湖北國(guó)土資源職業(yè)學(xué)院高職單招(數(shù)學(xué))試題庫(kù)含答案解析
- GB/T 37910.1-2019焊縫無(wú)損檢測(cè)射線檢測(cè)驗(yàn)收等級(jí)第1部分:鋼、鎳、鈦及其合金
評(píng)論
0/150
提交評(píng)論