決策支持系統(tǒng)與數(shù)據(jù)挖掘_第1頁
決策支持系統(tǒng)與數(shù)據(jù)挖掘_第2頁
決策支持系統(tǒng)與數(shù)據(jù)挖掘_第3頁
決策支持系統(tǒng)與數(shù)據(jù)挖掘_第4頁
決策支持系統(tǒng)與數(shù)據(jù)挖掘_第5頁
已閱讀5頁,還剩128頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

決策支持系統(tǒng)與數(shù)據(jù)挖掘第1頁,課件共133頁,創(chuàng)作于2023年2月第3次上機(jī):設(shè)計(jì)表單(FORM)1第3次上機(jī)內(nèi)容和要求:內(nèi)容:表單設(shè)計(jì)要求:1、預(yù)習(xí)VF教材(綠皮書)的第7章表單設(shè)計(jì)2、用表單向?qū)槿龔垟?shù)據(jù)表設(shè)計(jì)表單,如P157頁圖7-153、用表單向?qū)гO(shè)計(jì)多表表單,并存放在表單設(shè)計(jì)器上修改(利用屬性表、控件等工具),要求做兩個(gè)多表表單4、做一個(gè)“歡迎使用教學(xué)管理信息系統(tǒng)”的表單。如P170頁圖7-27。第2頁,課件共133頁,創(chuàng)作于2023年2月第8章決策支持系統(tǒng)與商務(wù)智能(1)

決策支持系統(tǒng)與數(shù)據(jù)挖掘第3頁,課件共133頁,創(chuàng)作于2023年2月第8章(1)決策支持和數(shù)據(jù)倉庫◆內(nèi)容提要:

▼決策支持系統(tǒng)(DSS)

聯(lián)機(jī)分析處理(OLAP)

▼數(shù)據(jù)倉庫和數(shù)據(jù)挖掘⊙數(shù)據(jù)倉庫在商業(yè)中的應(yīng)用★主要術(shù)語和概念★主要參考資料第4頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫Datawarehouse已講內(nèi)容與新內(nèi)容的關(guān)系營銷系統(tǒng)生產(chǎn)系統(tǒng)財(cái)務(wù)系統(tǒng)人力管理決策支持系統(tǒng)DSS數(shù)據(jù)倉庫Datawarehouse人工智能AI商務(wù)智能BI計(jì)算機(jī)數(shù)據(jù)庫網(wǎng)絡(luò)7種策略TCSOAKWSMISDSSESS4種戰(zhàn)略MRPMRPIIERPSCMCRMEC數(shù)據(jù)挖掘Datamining第5頁,課件共133頁,創(chuàng)作于2023年2月本章內(nèi)容提要:相互關(guān)系數(shù)據(jù)倉庫OLAP決策支持系統(tǒng)數(shù)據(jù)挖掘技術(shù)人工智能商務(wù)智能第6頁,課件共133頁,創(chuàng)作于2023年2月決策支持系統(tǒng)、商務(wù)智能與數(shù)據(jù)倉庫◆定義:決策支持系統(tǒng)(decisionsupportsystemDSS)為交互式計(jì)算機(jī)系統(tǒng),運(yùn)用數(shù)據(jù)、模型分析、專家知識及其他資源通過友善的人機(jī)接口互動,協(xié)助個(gè)人或團(tuán)體決策者提升半結(jié)構(gòu)化決策的績效和滿足。在IBM中,又稱為商務(wù)智能(businessintelligenceBI)?!舳x:數(shù)據(jù)倉庫(datawarehouseDW)是一種數(shù)據(jù)庫概念的延伸與推廣,以適應(yīng)決策支持需要的一種數(shù)據(jù)的集合。第7頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘與聯(lián)機(jī)分析處理◆定義:數(shù)據(jù)挖掘(dataminingDM)是一種探索性的分析方法。(根據(jù)已經(jīng)有的數(shù)據(jù),挖掘其中的規(guī)律)◆定義:聯(lián)機(jī)分析處理(on-lineanalyticalprocessesOLAP):是一種驗(yàn)證性分析方法。(先定方法,后由數(shù)據(jù)驗(yàn)證)第8頁,課件共133頁,創(chuàng)作于2023年2月決策支持系統(tǒng)DSS決策支持系統(tǒng)(deciseionsupportsystem)第9頁,課件共133頁,創(chuàng)作于2023年2月DSS和MIS的不同1、MIS主要為中層管理提供信息服務(wù)2、主要是通過查詢或報(bào)表進(jìn)行聯(lián)機(jī)事務(wù)處理(OLTP)3、問題:結(jié)構(gòu)化問題4、使用:5、主要技術(shù):關(guān)系數(shù)據(jù)庫的關(guān)系運(yùn)算1、DSS支持高層的決策2、主要是通過對話系統(tǒng)進(jìn)行聯(lián)機(jī)分析處理(OLAP)3、問題:半結(jié)構(gòu)化問題4、使用

歷史性數(shù)據(jù)庫5、主要技術(shù):數(shù)據(jù)挖掘:依賴性分析、聚類分析、神經(jīng)網(wǎng)絡(luò)、遺傳算法、粗糙集理論

數(shù)據(jù)庫數(shù)據(jù)倉庫第10頁,課件共133頁,創(chuàng)作于2023年2月決策支持系統(tǒng)(DSS)的半結(jié)構(gòu)化問題●決策支持系統(tǒng)(DSS)定義:為交互式計(jì)算機(jī)系統(tǒng),運(yùn)用數(shù)據(jù)、模型分析、專家知識及其他資源通過友善的人機(jī)接口互動,協(xié)助個(gè)人或團(tuán)體決策者提升半結(jié)構(gòu)化決策的績效和滿意決策。

◆給我銷售量最好的產(chǎn)品名單◆告訴我出現(xiàn)問題的地區(qū)◆告訴我為什么(向下鉆取)◆讓我看看其它數(shù)據(jù)(橫向鉆取)◆顯示最大的利潤◆當(dāng)一個(gè)地區(qū)的銷售低于目標(biāo)時(shí),提醒我半結(jié)構(gòu)化問題:股票管理、貿(mào)易市場開發(fā)經(jīng)費(fèi)預(yù)算資本獲利分析等

問題第11頁,課件共133頁,創(chuàng)作于2023年2月決策支持系統(tǒng)(DSS)的基本模式●DSS的基本模式:真實(shí)系統(tǒng)決策環(huán)境操作響應(yīng)管理者協(xié)作人員與人的行為有關(guān)的信息處理數(shù)據(jù)MIS信息外部數(shù)據(jù)問題對話系統(tǒng)數(shù)據(jù)庫系統(tǒng)模型庫方法庫知識庫DSS第12頁,課件共133頁,創(chuàng)作于2023年2月決策支持系統(tǒng)(DSS)的基本構(gòu)件

基本構(gòu)件人—機(jī)對話系統(tǒng):核心是人—機(jī)界面提問方式:“如果….則…..”能夠給用戶必要的提示和幫助數(shù)據(jù)庫:MIS的DB支持日常事務(wù)處理DSS的數(shù)據(jù)倉庫可以用聯(lián)機(jī)分析處理(OLAP)支持決策。方法庫:包括通用算法和標(biāo)準(zhǔn)函數(shù):排序算法、分類算法、最小生成樹算法最短路徑算法、線形規(guī)劃、整數(shù)規(guī)劃、動態(tài)規(guī)劃、各種統(tǒng)計(jì)算法、各種組合算法等知識庫:包括知識的獲取,知識的解釋、知識的表示、知識推理、知識庫的管理和維護(hù)。DSS的知識庫使用的技術(shù)和專家系統(tǒng)與人工智能技術(shù)一致。模型庫:可以提供推理比較選擇、分析整個(gè)問題的模型,DSS是以模型驅(qū)動的,可根據(jù)具體問題生成決策模型,輸出用于制定或估計(jì)決策.第13頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)庫、數(shù)據(jù)倉庫、知識庫、方法庫數(shù)據(jù)庫:指長期儲存在計(jì)算機(jī)內(nèi)的、有組織的、可共享的數(shù)據(jù)集合

數(shù)據(jù)倉庫:不同于數(shù)據(jù)庫。數(shù)據(jù)庫系統(tǒng)是一種通用的平臺,用來管理企業(yè)的數(shù)據(jù);而數(shù)據(jù)倉庫是一種概念,在此概念下進(jìn)行的構(gòu)造過程,我們叫它數(shù)據(jù)倉庫處理。所以,數(shù)據(jù)倉庫不是花錢可以購買的現(xiàn)成產(chǎn)品,它是一個(gè)建立的過程。知識庫(KnowledgeBase)是知識工程中結(jié)構(gòu)化,易操作,易利用,全面有組織的知識集群,是針對某一(或某些)領(lǐng)域問題求解的需要,采用某種知識表示方式在計(jì)算機(jī)存儲器中、組織、管理和使用的互相聯(lián)系的知識片存儲集合。方法庫基本數(shù)學(xué)方法統(tǒng)計(jì)方法優(yōu)化方法預(yù)測方法計(jì)劃方法金融方法計(jì)劃評審時(shí)間序列矩陣運(yùn)算線性規(guī)劃判別分析因子分析關(guān)聯(lián)分析初等函數(shù)算法插值算法擬合算法平滑算法外推算法回歸分析第14頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)庫與數(shù)據(jù)倉庫第15頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫建立過程ETL

(ExtractTransformationLoad)數(shù)據(jù)加載:包括數(shù)據(jù)的抽取、清洗(DataCleaning)、轉(zhuǎn)換和加載第16頁,課件共133頁,創(chuàng)作于2023年2月方法庫第17頁,課件共133頁,創(chuàng)作于2023年2月方法庫方法庫中的方法模塊方法庫基本數(shù)學(xué)方法統(tǒng)計(jì)方法優(yōu)化方法預(yù)測方法計(jì)劃方法金融方法計(jì)劃評審矩陣計(jì)算時(shí)間序列線性規(guī)劃判別分析因子分析二元相關(guān)分析方差分析回歸分析外推法平滑法擬合法插值法初等函數(shù)法第18頁,課件共133頁,創(chuàng)作于2023年2月方法庫的輸出報(bào)表圖形第19頁,課件共133頁,創(chuàng)作于2023年2月知識庫第20頁,課件共133頁,創(chuàng)作于2023年2月第21頁,課件共133頁,創(chuàng)作于2023年2月工程造價(jià)與管理知識庫第22頁,課件共133頁,創(chuàng)作于2023年2月項(xiàng)目管理知識庫

第23頁,課件共133頁,創(chuàng)作于2023年2月DSSImageLibraryBrowser第24頁,課件共133頁,創(chuàng)作于2023年2月影響DSS的因素(四個(gè))&

案例第25頁,課件共133頁,創(chuàng)作于2023年2月DSS的主要關(guān)鍵要素和決策流程DSS的主要關(guān)鍵要素(4個(gè))即影響DSS結(jié)果的因素:1、環(huán)境(如環(huán)境的壓力、主管的支持、權(quán)力和政治結(jié)構(gòu)等)2、任務(wù):決策的工作項(xiàng)目3、使用者:使用者的認(rèn)知方式、動機(jī)、期望、使用方式4、DSS系統(tǒng):系統(tǒng)設(shè)計(jì)的質(zhì)量、推動和導(dǎo)人策略等問題認(rèn)知情報(bào)搜集方案設(shè)計(jì)選擇方案推動結(jié)果決策的流程:西蒙的決策過程第26頁,課件共133頁,創(chuàng)作于2023年2月DSSLiftoffInFlight第27頁,課件共133頁,創(chuàng)作于2023年2月CLIME-DSS-2.第28頁,課件共133頁,創(chuàng)作于2023年2月Leicester(英國累斯特),DSS(STScI/AURUA)

第29頁,課件共133頁,創(chuàng)作于2023年2月

商務(wù)DSS系統(tǒng)

第30頁,課件共133頁,創(chuàng)作于2023年2月決策支持系統(tǒng)(DSS)的發(fā)展趨勢決策支持系統(tǒng)發(fā)展趨勢第31頁,課件共133頁,創(chuàng)作于2023年2月決策支持系統(tǒng)(DSS)的發(fā)展趨勢1、智能決策支持系統(tǒng)(IDSS):人—機(jī)接口(對話機(jī))自然語言處理系統(tǒng)問題處理系統(tǒng)模型庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)方法庫管理系統(tǒng)知識庫管理系統(tǒng)推理機(jī)模型庫數(shù)據(jù)庫方法庫知識庫用戶第32頁,課件共133頁,創(chuàng)作于2023年2月企業(yè)智能決策支持系統(tǒng)架構(gòu)圖第33頁,課件共133頁,創(chuàng)作于2023年2月IDSS智能決策支持系統(tǒng)第34頁,課件共133頁,創(chuàng)作于2023年2月決策支持系統(tǒng)(DSS)的發(fā)展趨勢2、群體決策支持系統(tǒng)(GDSS)決策室大屏幕大屏幕大屏幕遠(yuǎn)程電信會議遠(yuǎn)程決策決策局網(wǎng)第35頁,課件共133頁,創(chuàng)作于2023年2月群體決策支持GDSS的類型及相互關(guān)系群組決策支持系統(tǒng)(GDSS)就是由DSS演化來的。包括:計(jì)算機(jī)輔助協(xié)同工作(CSCW)群組決策支持系統(tǒng)(GDSS)電子會議系統(tǒng)(EMS)它們之間的關(guān)系如圖:

GDSS專家Delphi法線上投票多目標(biāo)決策

EMS電子會議線上討論

CSCW共同編輯協(xié)同設(shè)計(jì)第36頁,課件共133頁,創(chuàng)作于2023年2月GDSS群體決策支持系統(tǒng)第37頁,課件共133頁,創(chuàng)作于2023年2月theGDSStools,wordprocessing第38頁,課件共133頁,創(chuàng)作于2023年2月聯(lián)機(jī)分析處理OLAP聯(lián)機(jī)分析處理(on-lineanalyticalprocesses)第39頁,課件共133頁,創(chuàng)作于2023年2月●OLAP技術(shù)是與數(shù)據(jù)倉庫技術(shù)相伴發(fā)展起來的,1993年,“關(guān)系數(shù)據(jù)庫”之父E。F。Codd首次提出了OLAP的概念,專門支持復(fù)雜的分析操作。●OLAP的主要特征是能夠提供數(shù)據(jù)的多維概念視圖。多維信息被抽象為立方體,它包括維和度量值,維是我們說的觀察角度,度量值是我們關(guān)心的指標(biāo)值??梢允褂脩魪亩嘟嵌?、多側(cè)面、多層次直觀地考察數(shù)據(jù)倉庫中數(shù)據(jù),深入理解數(shù)據(jù)中的信息和內(nèi)含。第40頁,課件共133頁,創(chuàng)作于2023年2月基本概念聯(lián)鎖商店的銷售金額(主題)的維1、按時(shí)間角度分析、統(tǒng)計(jì)其銷售金額(季度)2、按不同商品角度分析統(tǒng)計(jì)的銷售金額。(產(chǎn)品)3、按聯(lián)鎖商店不同地域分析統(tǒng)計(jì)的銷售金額(地域)觀察角度稱為“維”,觀察深度稱為“層”。一個(gè)維中可以允許有若干層。NO1NO2NO3ALL一二三四all(季)

TVPCVCDALL產(chǎn)品商店第41頁,課件共133頁,創(chuàng)作于2023年2月什么是聯(lián)機(jī)分析處理(OLAP)●什么是聯(lián)機(jī)分析處理(OLAP)

OLAP是一種驗(yàn)證性分析軟件,它具有歸納的作用。它將數(shù)據(jù)倉庫中的數(shù)據(jù)作為分析對象,通過多種復(fù)雜操作,可以對高層管理人員提供有力的決策支持。它可以滿足分析人員的要求,進(jìn)行快速靈活地大數(shù)據(jù)量復(fù)雜的操作處理。并且以一種直觀、易懂的形式將結(jié)果展示給決策人員。第42頁,課件共133頁,創(chuàng)作于2023年2月OLAP與OLTP的比較比較項(xiàng)目OLAP(聯(lián)機(jī)分析處理)OLTP(聯(lián)機(jī)事務(wù)處理)應(yīng)用基礎(chǔ)數(shù)據(jù)倉庫DBMS用戶決策者(高層管理)一般操作者(低、中)目的為決策提供支持為日常工作服務(wù)數(shù)據(jù)特征導(dǎo)出數(shù)據(jù)原始數(shù)據(jù)數(shù)據(jù)細(xì)節(jié)綜合數(shù)據(jù)細(xì)節(jié)程度低細(xì)節(jié)程度高時(shí)間特征歷史數(shù)據(jù),一個(gè)時(shí)段當(dāng)前數(shù)據(jù)數(shù)據(jù)量需求一次處理需大量數(shù)據(jù)一次處理需少量數(shù)據(jù)第43頁,課件共133頁,創(chuàng)作于2023年2月CreateOLAP

第44頁,課件共133頁,創(chuàng)作于2023年2月NETOLAPcontrol界面第45頁,課件共133頁,創(chuàng)作于2023年2月簡單聯(lián)機(jī)分析軸側(cè)圖結(jié)果第46頁,課件共133頁,創(chuàng)作于2023年2月OLAP的分析結(jié)果第47頁,課件共133頁,創(chuàng)作于2023年2月AnalyzerOLAP

第48頁,課件共133頁,創(chuàng)作于2023年2月OLAPExample1第49頁,課件共133頁,創(chuàng)作于2023年2月OLAPMarket分析第50頁,課件共133頁,創(chuàng)作于2023年2月什么是聯(lián)機(jī)分析處理(OLAP)2、OLAP試測環(huán)境構(gòu)建的4個(gè)過程:OLAP主題OLAP概念模型----星形、雪花、星座模型OLAP邏輯模型-----多維數(shù)據(jù)模型OLAP物理模型------ROLAP/MOLAP第51頁,課件共133頁,創(chuàng)作于2023年2月OLAP聯(lián)機(jī)分析概念模型OLAP概念模型:

星型、雪花型、星座型第52頁,課件共133頁,創(chuàng)作于2023年2月基本概念聯(lián)鎖商店的銷售金額(主題)的維度1、按時(shí)間角度分析、統(tǒng)計(jì)其銷售金額(季度)2、按不同商品角度分析統(tǒng)計(jì)的銷售金額。(產(chǎn)品)3、按聯(lián)鎖商店不同地域分析統(tǒng)計(jì)的銷售金額(地域)觀察深度稱為“層”。一個(gè)維中可以允許有若干層。NO1NO2NO3ALL一二三四all(季)

TVPCVCDALL產(chǎn)品商店第53頁,課件共133頁,創(chuàng)作于2023年2月OLAPvs第54頁,課件共133頁,創(chuàng)作于2023年2月聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型●OLAP的基本概念模型:1、星型模型(starschema)星型模型的主體是事實(shí)表(如:銷售表)其主要事實(shí)稱為量或度量(如:銷售金額),另一種表稱為維表,用以建立多維結(jié)構(gòu)中的維值,一般有一個(gè)事實(shí)表和n個(gè)維表。在維表中給出取值條件,在事實(shí)表中獲得值的結(jié)果。商店標(biāo)識符產(chǎn)品標(biāo)識符日期標(biāo)識符單價(jià)金額日期標(biāo)識符日月季年產(chǎn)品標(biāo)識符產(chǎn)品名類名大類名現(xiàn)存貨物日期表(維表)銷售表(事實(shí)表)商店表(維表)商店標(biāo)識符商店名市名省名國名洲名產(chǎn)品表(維表)實(shí)例第55頁,課件共133頁,創(chuàng)作于2023年2月聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型2、雪花模式很多情況維呈現(xiàn)層次狀,即具有一定深度。就成為雪花模式。商店標(biāo)識符商店名市標(biāo)識符產(chǎn)品標(biāo)識符類標(biāo)識符產(chǎn)品名現(xiàn)存貨物商店標(biāo)識符產(chǎn)品標(biāo)識符日期標(biāo)識符單價(jià)犧牲金額日期標(biāo)識符月標(biāo)識符月年標(biāo)識符季標(biāo)識符年標(biāo)識符季月標(biāo)識符季標(biāo)識符月類標(biāo)識符大類標(biāo)識符類名國標(biāo)識符國名洲標(biāo)識符省標(biāo)識符省名國標(biāo)識符市標(biāo)識符市名省標(biāo)識符大類標(biāo)識符大類名洲標(biāo)識符洲名銷售表(事實(shí)表)產(chǎn)品表類表洲表大類表商店表市表省表國表年表日期表月表季表第56頁,課件共133頁,創(chuàng)作于2023年2月聯(lián)機(jī)分析處理的基本數(shù)據(jù)模型3、星座模式通過共享維,將多個(gè)星型模式連接在一起,構(gòu)成星座模式。產(chǎn)品標(biāo)識符產(chǎn)品名類名大類名現(xiàn)存貨物日期標(biāo)識符日月季年商店標(biāo)識符產(chǎn)品標(biāo)識符日期標(biāo)識符單價(jià)犧牲金額商店標(biāo)識符商店名市名省名國名洲名產(chǎn)品標(biāo)識符日期標(biāo)識符供應(yīng)商標(biāo)識單價(jià)數(shù)量金額供應(yīng)商標(biāo)識符供應(yīng)商名市名省名國名洲名事實(shí)表第57頁,課件共133頁,創(chuàng)作于2023年2月案例銀行交易分析第58頁,課件共133頁,創(chuàng)作于2023年2月機(jī)構(gòu)表聯(lián)機(jī)分析處理的實(shí)例:銀行交易分析●OLAP的操作實(shí)例(如:銀行交易分析)1、雪花模型:帳號ID統(tǒng)計(jì)日期機(jī)構(gòu)代號發(fā)生金額發(fā)生筆數(shù)帳號ID帳戶類名稱科目名稱帳戶名稱日期ID月ID日月ID年ID月年ID年省行代號ID省行名時(shí)間表帳戶表帳戶交易事實(shí)表交易分析雪花模型OLAP的邏輯模型是四維數(shù)據(jù)模型,它的多維數(shù)組形式為(時(shí)間,帳號,機(jī)構(gòu),發(fā)生金額與筆數(shù))如(2004年1月15日,4321567,工行漢口分理處,360萬元,567筆)第59頁,課件共133頁,創(chuàng)作于2023年2月聯(lián)機(jī)分析處理的實(shí)例:銀行交易分析2、銀行交易量分析:年季月發(fā)生額2003q1119779862903。302003q1210791201658。282003q1318749783281。052003q2419138629532。602003q2517192112346。632003q2620601215354。17年季月發(fā)生筆數(shù)2003q1181,7622003q1253,9652003q1385,3682003q2479,3962003q2568,3342003q26124,123發(fā)生金額發(fā)生筆數(shù)第60頁,課件共133頁,創(chuàng)作于2023年2月案例分析結(jié)果●發(fā)現(xiàn)2月份交易額萎縮,1月和4月進(jìn)出資金量較大,但交易筆數(shù)相對比較小。這表明客戶進(jìn)行大筆資金調(diào)度,進(jìn)一步對帳戶做切片操作,最終可以將進(jìn)行大筆資金調(diào)度的客戶鎖定。第61頁,課件共133頁,創(chuàng)作于2023年2月邏輯模型(多維數(shù)據(jù)模型)第62頁,課件共133頁,創(chuàng)作于2023年2月聯(lián)機(jī)分析處理的基本概念●基本概念:1、對象(Object)

關(guān)注和聚焦的分析客體稱為對象。如:聯(lián)鎖商店的銷售金額。2、維(dimension)對對象的觀察角度稱為“維”。如在聯(lián)鎖商店的銷售金額可以有三維:時(shí)間維:按時(shí)間角度分析、統(tǒng)計(jì)其銷售金額。商品維:按不同商品角度分析統(tǒng)計(jì)的銷售金額。地域維:按聯(lián)鎖商店不同地域分析統(tǒng)計(jì)的銷售金額。3、層(layer)

觀察深度稱為“層”。一個(gè)維中可以允許有若干層。如:在聯(lián)鎖商店的

時(shí)間維可以有日、旬、月、季、年等層

商品維可以有商品類(如家電類)商品大類(如電氣產(chǎn)品大類)等

地域維可以有市、省、國、洲等第63頁,課件共133頁,創(chuàng)作于2023年2月聯(lián)機(jī)分析處理的多維數(shù)據(jù)模型(邏輯模型)OLAP的多維結(jié)構(gòu)多維結(jié)構(gòu)由多個(gè)維組成,當(dāng)每個(gè)維確定一個(gè)取值時(shí),即可獲得一個(gè)多維結(jié)構(gòu)中的變量。這個(gè)變量稱為數(shù)據(jù)單元,或單元。(cell)這種表示方式稱為多維數(shù)組。也稱為數(shù)據(jù)立方體。(如:產(chǎn)品維成員:vcd;日期維成員:2003年3月19日;商店維成員:NO。1)

商店NO1NO2NO3ALL一二三四all(季)

TVPCVCDALL產(chǎn)品多維結(jié)構(gòu)的操作:1、切片2、切塊3、旋轉(zhuǎn)4、鉆探(下鉆如地域時(shí)間和上探(反方向))第64頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫的操作(下鉆、上卷)第65頁,課件共133頁,創(chuàng)作于2023年2月WiththeOracleOLAPdatamodel第66頁,課件共133頁,創(chuàng)作于2023年2月RelationshipsbetweencommonOLAP

第67頁,課件共133頁,創(chuàng)作于2023年2月OracleOLAP

第68頁,課件共133頁,創(chuàng)作于2023年2月SAPOLAP

第69頁,課件共133頁,創(chuàng)作于2023年2月MSSQLServer2005的功能:分析服務(wù)第70頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫DW與數(shù)據(jù)挖掘DM數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(datawarehousedatamining)第71頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫數(shù)據(jù)倉庫第72頁,課件共133頁,創(chuàng)作于2023年2月引論◆數(shù)據(jù)倉庫(datawarehouse)在1988年Devlin和Murphy發(fā)表了首篇數(shù)據(jù)倉庫的論文,在1993年,由WilliamH.Inmon所寫的《BuildingtheDataWarehouse》首次系統(tǒng)地闡述了數(shù)據(jù)倉庫的思想和理論?!糁R發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase

KDD)在1989年8月第11屆國際人工智能聯(lián)合會議的專題研討會上,首次提出基于數(shù)據(jù)庫的知識發(fā)現(xiàn)技術(shù)?!魯?shù)據(jù)挖掘(DataMiningDM)在1995年,在美國計(jì)算機(jī)年會(ACM)上,首次提出數(shù)據(jù)挖掘的概念。數(shù)據(jù)挖掘是KDD過程中最為關(guān)鍵的步驟,在實(shí)際使用中兩個(gè)術(shù)語的應(yīng)用往往不加區(qū)別。第73頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫●定義:數(shù)據(jù)倉庫是一個(gè)面向主題的,集成的,隨時(shí)間變化的非易失性數(shù)據(jù)的集合,用于支持管理層的決策過程。●數(shù)據(jù)倉庫的特性:

1、面向主題性(創(chuàng)建和使用都圍繞主題:產(chǎn)品、客戶等)

2、數(shù)據(jù)集成性(從業(yè)務(wù)處理系統(tǒng)獲取,如:OLTP、EC

等,要經(jīng)過數(shù)據(jù)預(yù)處理:挑選、清理、綜合)

3、數(shù)據(jù)的時(shí)變性(數(shù)據(jù)不能長期不變)

4、數(shù)據(jù)的非易失性(數(shù)據(jù)不能更改)

5、數(shù)據(jù)的集合性(多維數(shù)據(jù)庫方式進(jìn)行存儲的多維模式)

6、支持決策作用(根本的目的是對決策的支持,以便提高管理決策的質(zhì)量和效果)第74頁,課件共133頁,創(chuàng)作于2023年2月清洗操作,最后加載到數(shù)據(jù)倉庫中數(shù)據(jù)準(zhǔn)備第75頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫與數(shù)據(jù)集市第76頁,課件共133頁,創(chuàng)作于2023年2月決策分析與多維分析、數(shù)據(jù)挖掘等的關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫決策分析數(shù)據(jù)挖掘關(guān)系數(shù)據(jù)模型多維數(shù)據(jù)模型關(guān)系型分析多維分析第77頁,課件共133頁,創(chuàng)作于2023年2月以數(shù)據(jù)倉庫為基礎(chǔ)的電子商務(wù)架構(gòu)第78頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫典型產(chǎn)品簡介公司產(chǎn)品管理數(shù)據(jù)抽取建模OLAP數(shù)據(jù)挖掘數(shù)據(jù)展示接口OracleOraclev9。i√√強(qiáng)√良好√強(qiáng)MSSQLServer√√√強(qiáng)√強(qiáng)√SASSAS√√√強(qiáng)特色√√BusinessObjectBusinessObject√√√√√√√BrioBrio√√√√√√√CrystalDecisionsCrystal√√青大海威HIGHWAY√√√強(qiáng)√強(qiáng)√參考:徐潔磐《數(shù)據(jù)倉庫與決策支持系統(tǒng)》科學(xué)出版社P—192~224第79頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)倉庫市場保持了良好的增長第80頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘、知識發(fā)現(xiàn)數(shù)據(jù)挖掘、知識發(fā)現(xiàn)第81頁,課件共133頁,創(chuàng)作于2023年2月什么是數(shù)據(jù)挖掘(DM)●什么是數(shù)據(jù)挖掘(datamining)從數(shù)據(jù)倉庫中利用知識發(fā)現(xiàn)技術(shù)(如:依賴性分析、聚類分析、基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)、基于遺傳算法的數(shù)據(jù)挖掘技術(shù)、基于粗糙集的數(shù)據(jù)挖掘技術(shù)等)尋求商業(yè)模式?!駭?shù)據(jù)挖掘的目標(biāo):

1、找到更好的顧客

2、增加市場分額和獲取更高利潤

3、了解顧客的全面關(guān)系,制定定價(jià)策略和產(chǎn)品包裝方式。

4、分辨顧客的生命期信息

5、分析購賣行為和促銷反映,增加促銷效益。

第82頁,課件共133頁,創(chuàng)作于2023年2月什么是數(shù)據(jù)知識發(fā)現(xiàn)(KDD)●數(shù)據(jù)知識發(fā)現(xiàn)(knowledgediscoverydatabaseKDD)

1996年

fayyad的定義:知識發(fā)現(xiàn)是從數(shù)據(jù)集中識別有效模式的非平凡過程,該模式是新穎的,有潛在應(yīng)用價(jià)值的和最終可以理解的。

數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的關(guān)鍵過程。商務(wù)智能中的KDD過程:數(shù)據(jù)目標(biāo)數(shù)據(jù)預(yù)處理后數(shù)據(jù)轉(zhuǎn)化后數(shù)據(jù)商務(wù)智能模式數(shù)據(jù)選擇預(yù)處理數(shù)據(jù)轉(zhuǎn)化數(shù)據(jù)挖掘解釋/評價(jià)第83頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘的14種算法關(guān)聯(lián)規(guī)則分類分析聚類分析APRIoRI算法回歸分析差異分析劃分法層次法基于密度方法基于網(wǎng)格方法決策樹算法粗集算法人工神經(jīng)網(wǎng)絡(luò)貝葉斯方法遺傳算法第84頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘的主要技術(shù)(算法)內(nèi)容數(shù)據(jù)挖掘主要技術(shù)1、描述(歸納)2、分類預(yù)測3、聚類分析4、關(guān)聯(lián)分析5、依賴性分析6、粗糙集7、模糊技術(shù)MSSQLServer2005的數(shù)據(jù)挖掘算法:1、貝葉斯算法2、決策樹算法3、時(shí)序算法4、聚類算法5、序列聚類算法6、關(guān)聯(lián)規(guī)則算法7、神經(jīng)網(wǎng)絡(luò)算法8、文本挖掘技術(shù)第85頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘第86頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘的方法數(shù)據(jù)挖掘的方法第87頁,課件共133頁,創(chuàng)作于2023年2月四類重要的數(shù)據(jù)挖掘方法聚類分析關(guān)聯(lián)分析異常檢測預(yù)測建模第88頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘技術(shù)(DM)1、分類和預(yù)測:

分類在機(jī)器學(xué)習(xí)中稱為模式識別,分類技術(shù)包括統(tǒng)計(jì)方法(logistic回歸、線形判別、二次判別、費(fèi)歇爾判別)k—近鄰分類、決策樹分類、基于關(guān)聯(lián)規(guī)則的分類、貝葉斯分類、神經(jīng)元網(wǎng)絡(luò)分類、支持向量機(jī)分類

預(yù)測是對業(yè)務(wù)信息所代表的對象的顯著性區(qū)別,對對象的區(qū)別對待,進(jìn)而達(dá)到控制成本或者提高效率。第89頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘技術(shù):預(yù)測方法1、預(yù)測方法第90頁,課件共133頁,創(chuàng)作于2023年2月聚類分析2、聚類分析是多元分析的一種,也是非監(jiān)督模式的一個(gè)重要分支。它把一個(gè)沒有類別標(biāo)記的樣本集,按某種準(zhǔn)則劃分成若干個(gè)子集(類),使相似的樣本盡可能歸為一類,而不相似的樣本盡量劃分到不同的類中。傳統(tǒng)的聚類分析是一種硬劃分,它把每個(gè)待劃分的對象嚴(yán)格地劃分到某類中,具有非此即彼的性質(zhì)。而實(shí)際上大多數(shù)對象并沒有嚴(yán)格的屬性,它們在性態(tài)和類屬方面存在著中介性。具有亦此亦彼的性質(zhì),因此適合進(jìn)行軟劃分。分類算法將數(shù)據(jù)按含義劃分成組,用戶可以用此算法生成側(cè)面,例如:感興趣的顧客側(cè)面。一些常見的聚類算法包括:模式識別、側(cè)面生成、線形聚族和概念聚族。

第91頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘技術(shù)(DM)聚類分析:是將一個(gè)數(shù)據(jù)集合按照某個(gè)標(biāo)準(zhǔn)分成幾個(gè)簇。分類聚類收入債務(wù)貸款不貸款收入債務(wù)123分類第92頁,課件共133頁,創(chuàng)作于2023年2月蛋白質(zhì)的聚類分析第93頁,課件共133頁,創(chuàng)作于2023年2月SPSS數(shù)據(jù)挖掘方法-聚類分析

第94頁,課件共133頁,創(chuàng)作于2023年2月關(guān)聯(lián)規(guī)則4、關(guān)聯(lián)規(guī)則挖掘:

對不同類型之間的相互關(guān)系分析其潛在的邏輯規(guī)律,為業(yè)務(wù)運(yùn)作提供決策支持。是在給定的事務(wù)數(shù)據(jù)庫中找出最小支持度和最小置信度的規(guī)則如:x→y第95頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘軟件SPSS(貝葉斯網(wǎng)絡(luò))第96頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘技術(shù):邏輯斯蒂回歸第97頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘技術(shù)(DM)3、依賴性分析:1、基本概念:

◆規(guī)則:一般形式為“IF條件成立,THEN結(jié)論”。通過關(guān)聯(lián)規(guī)則,可以發(fā)現(xiàn)這三種規(guī)則:有用的、價(jià)值不高的、費(fèi)解的。

價(jià)值不高的規(guī)則往往是對一些商業(yè)領(lǐng)域內(nèi)眾所周知的規(guī)則的重現(xiàn)。如:今天是情人節(jié),那么鮮花的價(jià)格肯定會暴漲。

費(fèi)解的規(guī)則往往是數(shù)據(jù)中一些偶然的東西。如:有一天某個(gè)超市發(fā)現(xiàn)購買消暑商品的顧客增加,但是只有這一天特別突出,前后消量趨于平常。

有用的規(guī)則多是那些“潛在的,別人沒有發(fā)現(xiàn)的也沒有廣泛運(yùn)用在商業(yè)中的規(guī)則”如:尿布與啤酒之間的依賴性第98頁,課件共133頁,創(chuàng)作于2023年2月依賴性分析原理依賴性分析原理:

依賴性分析算法在數(shù)據(jù)倉庫的條目或?qū)ο笾g抽取依賴性.利用依賴性分析算法可以從某一對象的信息來推斷另一數(shù)據(jù)對象的信息.

一組依賴性可以表示為依賴圖.人們利用依賴性分析是為了解變動,并了解變動發(fā)生的可能原因.如:

銷后服務(wù)對產(chǎn)品銷售的影響.第99頁,課件共133頁,創(chuàng)作于2023年2月依賴性分析◆支持度:如果88%的顧客購買了商品A,就說商品A的支持度為0。88即suport=0。88◆最小支持度:

如果某種規(guī)則發(fā)生的概率低于指定的最小支持度(minsupport),則我們可以不考慮這種規(guī)則。

P(A→B)>minsupport

最小支持度用來去除可能性很小的規(guī)則,

也就是費(fèi)解的規(guī)則第100頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘技術(shù)(DM)◆最小置信度:

P(AB)

>minconfidence

P(A)

如果某個(gè)規(guī)則成立的概率很小,則這個(gè)規(guī)則沒有什么用途。因?yàn)檫@兩件事物的聯(lián)系很小。事實(shí)上只有高于最小支持度并且高于最小可信度的規(guī)則才被保留。

收入成本其他服務(wù)存貨服務(wù)產(chǎn)品顧客依賴性分析圖第101頁,課件共133頁,創(chuàng)作于2023年2月依賴性分析案例“尿布與啤酒的依賴”

◆可信度:

confidence=P(條件和結(jié)論)

P(條件)例如在超市中,A,B,C商品的購買率如右表所示,我們定義如下規(guī)則:

IFBTHENA,則它的可信度是:

P(AandBandC)

P(BandC)

=5%/15%=0。33

元組(商品)購買概率A45%B42.5%C40%A和B25%A和C20%B和C15%A和B和C5%第102頁,課件共133頁,創(chuàng)作于2023年2月依賴性分析案例“尿布與啤酒的依賴”序號顧客商品名稱時(shí)間1tom啤酒尿布香煙2000/1/12john啤酒可樂尿布2000/1/23kate啤酒罐頭衛(wèi)生巾2000/1/34benny啤酒尿布衛(wèi)生巾2000/1/4產(chǎn)品1產(chǎn)品2置信度啤酒尿布0.75啤酒衛(wèi)生巾0.5尿布啤酒0.75衛(wèi)生巾啤酒0.5支持度=同時(shí)購買啤酒和尿布的銷售次數(shù)總銷售次數(shù)置信度:大于40%置信度的情況大于60%支持度的情況產(chǎn)品1產(chǎn)品2置信度支持度啤酒尿布0.750.75尿布啤酒0.751衛(wèi)生巾啤酒0.51第103頁,課件共133頁,創(chuàng)作于2023年2月香港大型商業(yè)中心對交通的依賴性分析

第104頁,課件共133頁,創(chuàng)作于2023年2月城市對房地產(chǎn)業(yè)的依賴性比較第105頁,課件共133頁,創(chuàng)作于2023年2月依賴性分析軟件第106頁,課件共133頁,創(chuàng)作于2023年2月粗糙集(roughset)技術(shù)4、粗糙集(roughset)理論是一種研究不精確、不確定性的數(shù)學(xué)工具,由波蘭數(shù)學(xué)家Z。Pawlak在1982年首先提出,

1991年他的《粗糙集合》專著出版。在粗糙集理論中,知識這個(gè)概念被視為一種分類能力,通過分類將差異不大的個(gè)體劃分為一類,它們之間構(gòu)成一種不可分辨關(guān)系,又被稱為不可分辨劃分。它正是將這種劃分后的每一類作為研究對象,研究其某一概念的肯定支持,或肯定不支持,或可能支持(也可能不支持)的程度,并用粗糙隸屬函數(shù)加以定量描述。

第107頁,課件共133頁,創(chuàng)作于2023年2月粗糙集(roughset)技術(shù)●應(yīng)用粗糙集合進(jìn)行數(shù)據(jù)挖掘:數(shù)據(jù)挖掘研究的實(shí)施對象多為關(guān)系數(shù)據(jù)庫,關(guān)系表可被看作是粗糙集理論中的決策表(也稱為信息表)這給粗糙集方法的應(yīng)用帶來極大的方便。現(xiàn)實(shí)世界中的規(guī)則有確定性的,也有不確定性的,從數(shù)據(jù)庫中發(fā)現(xiàn)不確定的知識,為粗糙集方法的用武之地。運(yùn)用粗糙集方法得到的知識發(fā)現(xiàn)算法可以極大地提高效率。所以在知識獲取、機(jī)器學(xué)習(xí)、規(guī)則生成、決策分析、智能控制等領(lǐng)域獲得了廣泛應(yīng)用。在科研、金融、天文、醫(yī)療等領(lǐng)域龐大數(shù)據(jù)的發(fā)掘中,可以發(fā)現(xiàn)隱含在數(shù)據(jù)中的許多有價(jià)值的知識。第108頁,課件共133頁,創(chuàng)作于2023年2月基于粗糙集理論的知識獲取系統(tǒng)第109頁,課件共133頁,創(chuàng)作于2023年2月模糊技術(shù)5、模糊技術(shù):

扎德提出的模糊集合論為模糊信息的描述和處理提供了數(shù)學(xué)基礎(chǔ)。模糊集合是傳統(tǒng)集合的擴(kuò)展。模糊集合的隸屬函數(shù)的值域?yàn)閇0,1],當(dāng)模糊集合的隸屬函數(shù)的值域?yàn)閇1,1]時(shí),該模糊集合就退化為傳統(tǒng)的集合。

在對數(shù)據(jù)源進(jìn)行挖掘分析時(shí),可為指定的屬性引人模糊概念,使用模糊集的方法用隸屬度對屬性值進(jìn)行轉(zhuǎn)換,使數(shù)據(jù)源中的屬性值便于人們的理解和計(jì)算機(jī)分析處理。為每個(gè)屬性引人一個(gè)模糊概念

第110頁,課件共133頁,創(chuàng)作于2023年2月模糊技術(shù)6、模糊技術(shù):如:收視率為“高”或“低”等,并確定相應(yīng)的隸屬函數(shù),然后進(jìn)一步掃描數(shù)據(jù)源,對每個(gè)事件的各屬性的取值用相應(yīng)的隸屬度代替。原來屬性之間的關(guān)聯(lián)就變成模糊意義上的關(guān)聯(lián)。所形成的關(guān)聯(lián)規(guī)則,即為模糊關(guān)聯(lián)規(guī)則。

模糊關(guān)聯(lián)規(guī)則的模糊性不僅體現(xiàn)在模糊概念的模糊性,而且體現(xiàn)在隸屬函數(shù)確定的模糊性,因?yàn)殡`屬函數(shù)的確定也有一定的模糊性,而不同的隸屬函數(shù)所得到的屬性值也會不同,從而可能導(dǎo)致挖掘結(jié)論不同。模糊集還用于分類,對于數(shù)據(jù)挖掘系統(tǒng)進(jìn)行分類,模糊邏輯是有用的。它提供了在高度抽象層處理的便利。第111頁,課件共133頁,創(chuàng)作于2023年2月模糊查詢技術(shù)在公交管理中的應(yīng)用第112頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘在解決方法上的分類

分析問題

示例

SQLServer2005算法分類:為案例分布預(yù)定義的級別(如:好與差)●信用風(fēng)險(xiǎn)分析●客戶流失分析●客戶挽留●決策樹●貝葉斯算法●神經(jīng)網(wǎng)絡(luò)分割:開發(fā)一種按相似案例分組的分類方法●客戶資料分析●郵件推銷活動●聚類分析●順序聚類關(guān)聯(lián):相關(guān)性高級計(jì)算●購物籃分析●高級資料研究●決策樹●相關(guān)規(guī)則時(shí)間序列預(yù)測:預(yù)測未來●預(yù)測銷售●預(yù)測股票價(jià)格●時(shí)間序列預(yù)測:根據(jù)相似案例(如:現(xiàn)有客戶)的值預(yù)測新方案的值●提供保險(xiǎn)率●預(yù)測客戶收入●預(yù)測溫度●全部偏差分析:發(fā)現(xiàn)案例或群體與其他案例和群體的差別●信用卡欺騙檢測●網(wǎng)絡(luò)入侵分析●全部第113頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘功能和應(yīng)用領(lǐng)域應(yīng)用領(lǐng)域挖掘功能的例子挖掘過程挖掘技術(shù)欺詐檢測信用卡欺詐內(nèi)部查帳商店失竊確定標(biāo)準(zhǔn)狀況變化數(shù)據(jù)可視化基于記憶的推理風(fēng)險(xiǎn)評估信用卡升級抵押貸款客戶保持客戶信貸分類鏈接的檢測和分析決策樹基于記憶的推理市場分析市場籃子分析目標(biāo)銷售客戶個(gè)性行銷預(yù)測性的建模數(shù)據(jù)庫分割類檢測決策樹鏈接分析遺傳算法第114頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘的實(shí)例第115頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘:SQLServer2005第116頁,課件共133頁,創(chuàng)作于2023年2月SQLserver2005數(shù)據(jù)挖掘研究第117頁,課件共133頁,創(chuàng)作于2023年2月使用Access2007開始數(shù)據(jù)挖掘

第118頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘在人力資源方面的應(yīng)用第119頁,課件共133頁,創(chuàng)作于2023年2月DM(數(shù)據(jù)挖掘)上海數(shù)據(jù)庫開發(fā)第120頁,課件共133頁,創(chuàng)作于2023年2月生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)挖掘軟件第121頁,課件共133頁,創(chuàng)作于2023年2月SQLServer分析服務(wù)中的數(shù)據(jù)挖掘

第122頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘工具的比較工具名稱IBMDB2DBMinner2.0SASDarwinMineSetMasa3.0產(chǎn)品提供IBM公司DBMinerTechnologySASInstituteThinkingMachineSGI公司和美國Standford創(chuàng)我科技可提供的競爭能力強(qiáng)大并行計(jì)算能力多任務(wù)挖掘工具,通過DMQL進(jìn)行數(shù)理統(tǒng)計(jì)分析軟件數(shù)據(jù)挖掘核心競爭力數(shù)據(jù)庫和技術(shù)領(lǐng)先多種關(guān)系數(shù)據(jù)庫多種數(shù)據(jù)獲取、篩選、轉(zhuǎn)換價(jià)格咨詢和購賣硬件費(fèi)用昂貴比較便宜昂貴,多采用租賃軟件免費(fèi),數(shù)據(jù)展示和準(zhǔn)備費(fèi)用高比較便宜比較便宜運(yùn)行平臺多平臺多平臺多平臺多平臺Oracle數(shù)據(jù)庫多平臺Windows平臺第123頁,課件共133頁,創(chuàng)作于2023年2月數(shù)據(jù)挖掘工具的比較工具名稱IBMDB2DBMinner2.0SASDarwinMineSetMasa3.0用戶界面使用復(fù)雜的數(shù)據(jù)可視化技術(shù)可視化界面可視化界面,操作復(fù)雜可視化界面,比強(qiáng)的用戶界面可視化顯示,操作簡單有經(jīng)驗(yàn)用戶可自由優(yōu)化參數(shù)建模技術(shù)與算法有廣泛的數(shù)據(jù)挖掘技術(shù)和算法集,統(tǒng)計(jì)功能差算法簡單,主要與SQLServer的OLAP集成提供所以的數(shù)據(jù)挖掘方法,包括統(tǒng)計(jì)分析、時(shí)序分析僅有聚類,沒有關(guān)聯(lián)和序列規(guī)則算法構(gòu)造表達(dá)式由已有的數(shù)據(jù)項(xiàng)生成新的數(shù)據(jù)項(xiàng)多種可行的數(shù)據(jù)挖掘算法,可以嵌人其它軟件代碼模型發(fā)布具有大量數(shù)據(jù)挖掘和程序接口開放式體系結(jié)構(gòu)用特有的SQL語言后臺用特別程序發(fā)布包采用C、C++、Java手工編碼輸出程序支持國際字符,可以直接發(fā)表到Web發(fā)布簡單,有模板第124頁,課件共133頁,創(chuàng)作于2023年2月小結(jié)決策支持系統(tǒng)與數(shù)據(jù)挖掘小結(jié)第125頁,課件共133頁,創(chuàng)作于2023年2月本章小結(jié)數(shù)據(jù)倉庫OLAP決策支持系統(tǒng)數(shù)據(jù)挖掘技術(shù)人工智能商務(wù)智能第126頁,課件共133頁,創(chuàng)作于2023年2月本章小結(jié)數(shù)據(jù)挖掘技術(shù)1、描述(歸納)2、分類預(yù)測3、聚類分析4、關(guān)聯(lián)分析5、依賴性分析6、粗糙集7、模糊技術(shù)MSSQLServer2005的數(shù)據(jù)挖掘算法:1、貝葉斯算法2、決策樹算法3、時(shí)序算法4、聚類算法5、序列聚類算法6、關(guān)聯(lián)規(guī)則算法7、神經(jīng)網(wǎng)絡(luò)算法8、文本挖掘技術(shù)第127頁,課件共133頁,創(chuàng)作于2023年2月第八章決策支持與商務(wù)智能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論