![數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用課件_第1頁](http://file4.renrendoc.com/view/55bf2d36ebb324e1b17c055cc0799c76/55bf2d36ebb324e1b17c055cc0799c761.gif)
![數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用課件_第2頁](http://file4.renrendoc.com/view/55bf2d36ebb324e1b17c055cc0799c76/55bf2d36ebb324e1b17c055cc0799c762.gif)
![數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用課件_第3頁](http://file4.renrendoc.com/view/55bf2d36ebb324e1b17c055cc0799c76/55bf2d36ebb324e1b17c055cc0799c763.gif)
![數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用課件_第4頁](http://file4.renrendoc.com/view/55bf2d36ebb324e1b17c055cc0799c76/55bf2d36ebb324e1b17c055cc0799c764.gif)
![數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用課件_第5頁](http://file4.renrendoc.com/view/55bf2d36ebb324e1b17c055cc0799c76/55bf2d36ebb324e1b17c055cc0799c765.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用北京科技大學(xué)楊炳儒教授數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用北京科技大學(xué)1數(shù)據(jù)挖掘(知識發(fā)現(xiàn))新進展數(shù)據(jù)挖掘在商務(wù)智能決策中的應(yīng)用數(shù)據(jù)挖掘在CRM中的應(yīng)用數(shù)據(jù)挖掘(知識發(fā)現(xiàn))新進展2第一部分數(shù)據(jù)挖掘(知識發(fā)現(xiàn))新進展五、研究動態(tài)與趨向一、數(shù)據(jù)挖掘(知識發(fā)現(xiàn))概念內(nèi)涵與外延的發(fā)展二、挖掘知識類型的擴展三、挖掘技術(shù)方法的擴展四、應(yīng)用的擴展第一部分數(shù)據(jù)挖掘(知識發(fā)現(xiàn))新進展五、研究動態(tài)與趨向一、數(shù)據(jù)3一、數(shù)據(jù)挖掘(知識發(fā)現(xiàn))概念內(nèi)涵與外延的發(fā)展結(jié)構(gòu)化數(shù)據(jù)挖掘DM(KDD)多媒體數(shù)據(jù)構(gòu)成的大型異質(zhì)異構(gòu)數(shù)據(jù)庫,稱為復(fù)雜數(shù)據(jù)類型挖掘CDM[動態(tài)(在線)-分布式-并行系統(tǒng)]Web:1、以文本為主的頁面內(nèi)容挖掘2、以客戶訪問信息為主3、以Web結(jié)構(gòu)為主多媒體:音頻、視頻、圖像、圖形、時序、空間等基于知識庫的知識發(fā)現(xiàn)KDK一、數(shù)據(jù)挖掘(知識發(fā)現(xiàn))概念內(nèi)涵與外延的發(fā)展結(jié)構(gòu)化數(shù)據(jù)挖掘多4知識發(fā)現(xiàn)的新定義:
在現(xiàn)實世界中,針對客觀存在的具有海量性、不確定性、不完全性的量的、質(zhì)的、復(fù)雜形態(tài)的知識源,挖掘其中潛在的、先前未知的、用戶感興趣的、最終可被用戶理解的模式的非平凡提取過程。知識發(fā)現(xiàn)的新定義:在現(xiàn)實世界中,針對客5二、挖掘知識類型的擴展擴展擴展關(guān)聯(lián)規(guī)則、分類、聚類、相似模式、混沌模式、時序模式、預(yù)測等文本、客戶訪問路徑、音頻、視頻……生物信息挖掘、游戲信息挖掘、XML文檔、多語言文本挖掘、圖表數(shù)據(jù)庫、分子結(jié)構(gòu)數(shù)據(jù)庫等二、挖掘知識類型的擴展擴展擴展關(guān)聯(lián)規(guī)則、分類、聚類、相似模式6三、挖掘技術(shù)方法的擴展擴展統(tǒng)計學(xué)(數(shù)理統(tǒng)計)、證據(jù)理論、機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、粗糙集、近似推理、小波、分形、概念格、概念樹提升、決策樹等Hilbert空間、信息融合與神經(jīng)網(wǎng)絡(luò)結(jié)合、距離測度函數(shù)、數(shù)據(jù)立方體、隱馬爾可夫模型、信息熵、主觀Bayes方法、信息擴散等三、挖掘技術(shù)方法的擴展擴展統(tǒng)計學(xué)(數(shù)理統(tǒng)計)、證據(jù)理論、Hi7四、應(yīng)用的擴展金融、醫(yī)療保健、市場業(yè)、零售業(yè)、制造業(yè)、工程與科學(xué)、經(jīng)紀業(yè)和安全交易、證券交易、瑕疵分析、政府和防衛(wèi)、電信、司法、企業(yè)經(jīng)營管理等等應(yīng)用領(lǐng)域擴展Internet、農(nóng)業(yè)、氣象、遠程教育、天文學(xué)、生物信息、地理信息等等四、應(yīng)用的擴展金融、醫(yī)療保健、市場業(yè)、零售業(yè)、應(yīng)用領(lǐng)域擴展I8Marksman、ThinkMachine、DataMind、IntelligentMiner、KnowledgeSEEKER、等等實例和軟件的擴展MSMiner、KDD*、KDK*、KD(D&K)等等Marksman、ThinkMachine、實例和軟件的擴9五、研究動態(tài)與趨向
目前國際上KDD的研究主要是以知識發(fā)現(xiàn)的任務(wù)描述、知識評價與知識表示為主線,有效的知識發(fā)現(xiàn)算法為中心。這是在相當(dāng)長的一段時間內(nèi)保持的主流與基調(diào)。
五、研究動態(tài)與趨向目前國際上KDD的研究主要是10國外研究動態(tài)2003年8月27日在華盛頓召開了第九屆知識發(fā)現(xiàn)與數(shù)據(jù)挖掘國際會議,參與討論的專家一致認為:數(shù)據(jù)挖掘正面臨著巨大的機遇和挑戰(zhàn)。國外研究動態(tài)2003年8月27日在華盛頓召開了第九屆知識發(fā)現(xiàn)11其中U.Fayyad認為從科學(xué)發(fā)展的長遠來看,最大的絆腳石是基礎(chǔ)理論的缺乏以及所面臨的問題和挑戰(zhàn)的清晰明白的闡述。他認為對于我們要做什么,幾乎沒有理論甚至工程實踐來指導(dǎo):在今天它仍然是”不為人知的藝術(shù)”。我們需要理論來指導(dǎo)我們要做什么以及要如何作。這些理論能夠促使工程解決方法的出現(xiàn),這樣我們也可以將我們的“手藝”更有效的教給其他人。而這種形勢與從業(yè)者以及對應(yīng)用感興趣的人們的巨大的熱情同時存在,這些人來自不同的領(lǐng)域,但是沒有科學(xué)根基以及持續(xù)的學(xué)術(shù)發(fā)展,本領(lǐng)域不可能得到發(fā)展與鞏固。其中U.Fayyad認為從科學(xué)發(fā)展的長遠來看,最大的絆腳石12R.Uthurusamy認為WEB的使用和生產(chǎn)廠家的大肆宣傳等都會在短期內(nèi)影響本領(lǐng)域的發(fā)展,它們會使得我們將更多的精力投向數(shù)據(jù)庫營銷、CRM和OLAP等方面,而不是致力于使KDD從根本上或科學(xué)上有大的進步。KDD的基礎(chǔ)研究界必須消除這些干擾而去努力解決KDD的真正的根本的問題。R.Uthurusamy認為WEB的使用和生產(chǎn)廠家的大肆宣傳13國內(nèi)研究動態(tài)我們編制了了軟件對中國期刊網(wǎng)上1994年至今的論文進行了分類與統(tǒng)計。1、歷年發(fā)表文章數(shù)分類匯總圖示如下(含所有的類別共11707篇)國內(nèi)研究動態(tài)我們編制了了軟件對中國期刊網(wǎng)上1994年至今的論142、按照數(shù)據(jù)挖掘、決策支持系統(tǒng)、專家系統(tǒng)方面的文章統(tǒng)計圖示如下:(評價)2、按照數(shù)據(jù)挖掘、決策支持系統(tǒng)、專家系統(tǒng)方面的文章統(tǒng)計圖示如15發(fā)展的基本特征(1)原有理論方法的深化與拓展
如:1)網(wǎng)絡(luò)數(shù)據(jù)挖掘;流數(shù)據(jù);混合數(shù)據(jù)。2)基于神經(jīng)網(wǎng)絡(luò)的的時序數(shù)據(jù)、相似序列、快速挖掘算法的研究等。
3)粗糙集與支持向量機模型與方法的擴展。4)凸分析與數(shù)據(jù)包絡(luò)分析方法的運用。5)增強(強化)學(xué)習(xí)模型與方法的運用。發(fā)展的基本特征(1)原有理論方法的深化與拓展16(2)復(fù)雜類型(系統(tǒng))數(shù)據(jù)挖掘成為熱點
如:1)生物信息挖掘。
KnowledgeDiscoveryforPromoterStructureAnalysisStudyofMotifCorrelationinProteinsbyDataMining(用數(shù)據(jù)挖掘技術(shù)進行蛋白質(zhì)中啟動子的結(jié)構(gòu)分析)
2)半結(jié)構(gòu)化、非結(jié)構(gòu)化等復(fù)雜類型數(shù)據(jù)挖掘。
AMethodforMiningDataofSequentialImages----RebuildingofGray(Position)timeFunctiononArbitraryDirectionLines(基于圖表數(shù)據(jù)庫知識發(fā)現(xiàn)系統(tǒng)的概念等級聚類)3)分布式數(shù)據(jù)挖掘系統(tǒng)。4)動態(tài)、在線數(shù)據(jù)挖掘系統(tǒng)。5)流數(shù)據(jù)、混合數(shù)據(jù)與不完備數(shù)據(jù)挖掘系統(tǒng)。(2)復(fù)雜類型(系統(tǒng))數(shù)據(jù)挖掘成為熱點17(3)新技術(shù)與方法的引入(其它學(xué)科領(lǐng)域的滲透)如:人工免疫系統(tǒng)方法;協(xié)同驗算方法;模擬退火算法;保角變換方法;黎曼幾何方法等。(4)理論融合交叉性研究如:基于RoughSet的證據(jù)推理算法;模糊關(guān)系數(shù)據(jù)模型與粗集結(jié)合算法等。認知心理學(xué)、認知物理學(xué)、認知生物學(xué)等。(5)基礎(chǔ)理論研究內(nèi)在機理研究;自主知識發(fā)現(xiàn)框架;DM=數(shù)據(jù)集+似然關(guān)系+挖掘算法等。(3)新技術(shù)與方法的引入(其它學(xué)科領(lǐng)域的滲透)18第二部分數(shù)據(jù)挖掘在商務(wù)智能決策中的應(yīng)用一、基于信息挖掘的新型智能決策支持系統(tǒng)二、商務(wù)部國際商務(wù)中心項目簡介三、軟件系統(tǒng)實現(xiàn)整體說明第二部分數(shù)據(jù)挖掘在商務(wù)智能決策中的應(yīng)用一、基于信息挖掘的19一、基于信息挖掘的新型智能決策支持系統(tǒng)自從美國麻省理工學(xué)院的MichaelS.S.Morton和PeterG.W.Keen于20世紀70年代首次提出決策支持系統(tǒng)(DSS)以來,其發(fā)展迅速,不斷取得顯著的成果,并成為許多行業(yè)經(jīng)營管理中一個不可缺少的現(xiàn)代化決策支持工具?,F(xiàn)在正逐步形成新一代的DSS:群決策支持系統(tǒng)(GDSS),分布式?jīng)Q策支持系統(tǒng)(DDSS),戰(zhàn)略決策支持系統(tǒng)等,尤其是智能決策支持系統(tǒng)(IDSS)的出現(xiàn),將人工智能的知識推理等技術(shù)引入DSS,使DSS的發(fā)展進入了一個新的階段。近年來,又相繼出現(xiàn)了基于數(shù)據(jù)倉庫與基于WEB的智能決策支持系統(tǒng),大大推進了IDSS的發(fā)展。
一、基于信息挖掘的新型智能決策支持系統(tǒng)自從美國麻省理工學(xué)院的20但是,傳統(tǒng)的決策支持系統(tǒng)尚存在著推理技術(shù)單調(diào),自學(xué)習(xí)能力較差,形成知識庫中的知識不足夠豐富這一新的“瓶頸”現(xiàn)象。近年來Internet迅速發(fā)展,網(wǎng)上信息極大豐富而知識卻相對缺乏,并且這些信息和以往決策支持系統(tǒng)所處理的信息不同,是非結(jié)構(gòu)化的,這就使其處理方式也必然有所不同。所以新一代決策支持系統(tǒng)的發(fā)展方向是高度智能化,以多種知識表示、自組織協(xié)同工作、自動知識獲取和自適應(yīng)能力較強等為特征。但是,傳統(tǒng)的決策支持系統(tǒng)尚存在著推理技術(shù)單調(diào),自學(xué)習(xí)能力較差21為此,我們提出了基于信息挖掘的智能決策支持系統(tǒng)IDSSIM,這里的信息挖掘區(qū)別于通常的數(shù)據(jù)挖掘,是從結(jié)構(gòu)化數(shù)據(jù)或復(fù)雜類型數(shù)據(jù)(文本、日志、音頻、視頻、圖像等)中提取新穎、潛在有用知識的非平凡抽取過程。所形成的IDSSIM結(jié)構(gòu)模型可廣泛應(yīng)用于各行各業(yè)在管理信息系統(tǒng)的基礎(chǔ)上所提升的輔助決策支持系統(tǒng)中。IDSSIM的總體結(jié)構(gòu)模型如下圖所示:為此,我們提出了基于信息挖掘的智能決策支持系統(tǒng)IDSSIM,22數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用23其理論基礎(chǔ)是我們提出的基于雙庫協(xié)同機制的知識發(fā)現(xiàn)系統(tǒng)KDD*和WEB數(shù)據(jù)挖掘過程,它以多個知識源的知識融合、多抽象級與不同知識層次的結(jié)構(gòu),以及使數(shù)據(jù)庫、知識庫、方法庫、模型庫、文本庫、日志庫六庫協(xié)同運作為特征,形成了極其豐富的動態(tài)知識庫系統(tǒng)與相應(yīng)的集成推理機制,為解決決策系統(tǒng)構(gòu)造中的核心技術(shù)提供了一條有效的途徑,也從根本上提高了決策支持系統(tǒng)的實用化程度。其理論基礎(chǔ)是我們提出的基于雙庫協(xié)同機制的知識發(fā)現(xiàn)系統(tǒng)KDD*24系統(tǒng)的核心是“源于信息的知識發(fā)現(xiàn)KDBI”(KnowledgeDiscoveryBasedonInformation),它在模塊實現(xiàn)上主要包含三個部分:基于雙庫協(xié)同機制的知識發(fā)現(xiàn)子系統(tǒng)(KDD*)、基于推理機制的知識發(fā)現(xiàn)子系統(tǒng)(KDRM)和基于WEB挖掘的知識發(fā)現(xiàn)子系統(tǒng)(KDWM)。可粗略地表示為:KDBI=KDD*+KDRM+KDWM。系統(tǒng)的核心是“源于信息的知識發(fā)現(xiàn)KDBI”(Knowledg25首先,六庫(數(shù)據(jù)庫、知識庫、方法庫、模型庫、文本庫、日志庫)在多庫管理子系統(tǒng)的管理下協(xié)同運作。知識獲取子系統(tǒng)可以從領(lǐng)域?qū)<夷抢铽@取知識,也可以獲取書本中的知識,并將這些知識存儲在知識庫中。基于信息挖掘的新型智能決策支持系統(tǒng)。首先,六庫(數(shù)據(jù)庫、知識庫、方法庫、模型庫、文本庫、日志庫)26其次,知識庫中的知識可以直接納入綜合知識庫,也可以被基于雙庫協(xié)同機制的知識發(fā)現(xiàn)(KDD*)子系統(tǒng)利用,在以屬性為基礎(chǔ)的知識庫建庫原則下,通過搜索知識庫中知識結(jié)點的不關(guān)聯(lián)態(tài),產(chǎn)生“創(chuàng)見意向”,發(fā)現(xiàn)短缺知識。其次,知識庫中的知識可以直接納入綜合知識庫,也可以被基于雙庫27再次,基于推理機制的知識發(fā)現(xiàn)子系統(tǒng)(KDRM),包括用一種或多種知識表示方法描述的已知問題及其解法的描述集合的知識庫和需要求解的問題集;通過Fuzzy推理、演繹推理、廣義綜合歸納推理和基于案例的推理等,構(gòu)造規(guī)則集和發(fā)現(xiàn)新知識。來自WEB的信息首先被存儲在文本庫和日志庫中,并由基于WEB的知識發(fā)現(xiàn)子系統(tǒng)挖掘關(guān)于訪問信息、文本和結(jié)構(gòu)方面的知識,并將挖掘結(jié)果存入WEB知識庫。再次,基于推理機制的知識發(fā)現(xiàn)子系統(tǒng)(KDRM),包括用一種或28二、商務(wù)部國際商務(wù)中心項目簡介在與國家商務(wù)部國際商務(wù)中心的合作中,構(gòu)造了基于我們專利技術(shù)的“面向加工貿(mào)易基于競爭情報的智能決策支持系統(tǒng)”。針對外貿(mào)加工中國內(nèi)采購與供應(yīng)鏈系統(tǒng)進行深入分析,通過數(shù)據(jù)挖掘、WEB挖掘、案例推理與OLAP等技術(shù),挖掘出一些平時很難靠直觀或憑借經(jīng)驗發(fā)現(xiàn)的規(guī)則,發(fā)現(xiàn)了若干新的知識。對領(lǐng)導(dǎo)戰(zhàn)略決策與企業(yè)經(jīng)營決策管理有一定的參考價值。二、商務(wù)部國際商務(wù)中心項目簡介在與國家商務(wù)部國際商務(wù)中心的合29利用商務(wù)部國際商務(wù)中心長期積累的對外加工貿(mào)易的數(shù)據(jù),充分運用我們的創(chuàng)新性信息處理技術(shù)和數(shù)據(jù)挖掘技術(shù),開展研發(fā)工作。目前已通過驗收,并將對國家的對外貿(mào)易和商務(wù)活動產(chǎn)生較大影響。概括起來有如下幾點:1)為對外貿(mào)易企業(yè)“請進來,走出去”提供決策支持;2)為領(lǐng)導(dǎo)關(guān)注的熱點問題,提供決策支持;3)為外商投資提供咨詢指導(dǎo);4)為國家和地方招商引資提供科學(xué)的建議。利用商務(wù)部國際商務(wù)中心長期積累的對外加工貿(mào)易的數(shù)據(jù),30項目主頁應(yīng)用窗口項目主頁應(yīng)用窗口31三、軟件系統(tǒng)實現(xiàn)整體說明1、OLAP問題域運行環(huán)境與開發(fā)工具三、軟件系統(tǒng)實現(xiàn)整體說明1、OLAP32OLAP問題域1、經(jīng)營企業(yè)信息分析2、國產(chǎn)料件分析3、進口料件分析4、加工行業(yè)分析5、外商分析6、進出口幣種分析7、工繳費分析8、口岸與海關(guān)分析9、出口成品分析OLAP問題域1、經(jīng)營企業(yè)信息分析33OLAP運行環(huán)境與工具服務(wù)器端: 硬件:性能較好的服務(wù)器、網(wǎng)絡(luò)鏈接 軟件:ORACLE數(shù)據(jù)庫服務(wù)器及數(shù)據(jù)、BRIOINTELLIGENCESERVER、BRIOCLIENTDESIGNER客戶端:硬件:普通PC、網(wǎng)卡、INTERNET網(wǎng)絡(luò)鏈接軟件:BRIOCLIENTEXPLORER、通用瀏覽器OLAP運行環(huán)境與工具服務(wù)器端:342.KDD*問題域計算模式與開發(fā)工具總體設(shè)計流程圖2.KDD*問題域35KDD*問題域說明預(yù)想:就采購價值鏈方面內(nèi)容,展開數(shù)據(jù)挖掘,重點對國內(nèi)采購現(xiàn)狀,抽取相關(guān)關(guān)聯(lián)規(guī)則,提供領(lǐng)導(dǎo)決策信息。方法特征:智能系統(tǒng)內(nèi)在的使用了人工智能方法與軟計算方法,知識發(fā)現(xiàn)方法尋求新穎的知識類型,因而所發(fā)現(xiàn)的知識與數(shù)據(jù)狀況密切相關(guān)。在未作實際挖掘前難以確定其明確主題。將提交結(jié)果:就目前挖掘情況看,領(lǐng)導(dǎo)決策方面與企業(yè)經(jīng)營決策方面的內(nèi)容都可能發(fā)現(xiàn)較有價值得知識。因而,須在實際研發(fā)過程中,逐步篩選、調(diào)試、聚焦。KDD*問題域說明預(yù)想:就采購價值鏈方面內(nèi)容36KDD*計算模式與開發(fā)工具計算模式:客戶機/服務(wù)器模式運行環(huán)境與開發(fā)工具客戶端:windows平臺,DELPH,ODBC服務(wù)器端:商務(wù)部現(xiàn)有環(huán)境和ORACLE數(shù)據(jù)庫系統(tǒng)
KDD*計算模式與開發(fā)工具計算模式:客戶機/服務(wù)器模式37KDD*總體設(shè)計流程圖KDD*總體設(shè)計流程圖38數(shù)據(jù)清理:主要完成數(shù)據(jù)源的選取、數(shù)據(jù)清洗、去噪聲以及填補空缺數(shù)據(jù)等等,也就是要為挖掘準為數(shù)據(jù),確切的說就是為數(shù)據(jù)離散做準備。主題管理:主要是針對挖掘的目標不同而設(shè)立不同的主題,這部分主要實現(xiàn)主題的定義、修改、刪除以及主題的選擇等功能,在主題的定義中要完成與該主題相關(guān)的數(shù)據(jù),也就是要在這里確定挖掘的方向。數(shù)據(jù)清理:主要完成數(shù)據(jù)源的選取、數(shù)據(jù)清洗、去噪聲以及填補空缺39屬性值離散化:建立主題以后根據(jù)所選擇的數(shù)據(jù)確定語言變量以及所對應(yīng)的語言變量值,同時對所選定的數(shù)據(jù)根據(jù)語言變量和語言變量值進行離散形成挖掘數(shù)據(jù)庫,為下面的挖掘工作做準備。知識庫管理:分為基礎(chǔ)知識庫管理和衍生知識庫管理兩個部分,其中基礎(chǔ)知識庫包括基礎(chǔ)知識的錄入、修改、刪除等基本的維護工作;衍生知識庫包括挖掘出的知識的輸入,只是的展示等工作,這部分涉及到挖掘及知識的展示。
數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用40數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)產(chǎn)生規(guī)則,分為兩個部分用戶子定義挖掘和系統(tǒng)自動挖掘(啟發(fā)式協(xié)調(diào)器)。用戶子定義挖掘是根據(jù)用戶感興趣的內(nèi)容進行聚焦挖掘,啟發(fā)式挖掘是根據(jù)基礎(chǔ)知識庫,針對短缺知識進行挖掘。知識評價:對挖掘出的規(guī)則進行評價決定是否存入到衍生知識庫中,首先是通過中斷協(xié)調(diào)器進行評價然后再經(jīng)過領(lǐng)域?qū)<疫M行評價來決定是否存入衍生知識庫。數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)產(chǎn)生規(guī)則,分為兩個部分用戶子定義挖掘和系統(tǒng)41附:與此相應(yīng)的,我們還研發(fā)了用于智能決策的“分布式數(shù)據(jù)資源集成系統(tǒng)”,給出了統(tǒng)一數(shù)據(jù)訪問接口、快速全文檢索、文本分類、文本數(shù)字化、個性化信息推送和信息發(fā)布等一攬子整體解決方案。附:與此相應(yīng)的,我們還研發(fā)了用于智能決策的“分布式數(shù)據(jù)資源集42第三部分數(shù)據(jù)挖掘在CRM中的應(yīng)用一、數(shù)據(jù)挖掘?qū)RM的影響二、在CRM中數(shù)據(jù)挖掘常用技術(shù)三、解決實際商業(yè)問題四、建立解決方案的關(guān)鍵第三部分數(shù)據(jù)挖掘在CRM中的應(yīng)用一、數(shù)據(jù)挖掘?qū)RM的影43一、數(shù)據(jù)挖掘?qū)RM的影響21世紀的商業(yè)競爭不僅取決于對市場的反應(yīng)速度,還取決于對本行業(yè)新知識的獲取、積累和有效利用的能力。實際上效率不再是商場上取勝的唯一關(guān)鍵。在這個新的啟用web的電子商務(wù)經(jīng)濟時代,靈活性和敏感性也是在競爭中取勝的重要因素。能夠提供客戶資源及相關(guān)數(shù)據(jù)分析的客戶關(guān)系管理系統(tǒng)(CustomerRelationshipManagement,CRM)就成為焦點。作為專門管理企業(yè)前臺的客戶關(guān)系管理為企業(yè)提供了一個收集、分析和利用各種客戶信息的系統(tǒng),幫助企業(yè)充分利用其客戶管理資源,也為企業(yè)在電子商務(wù)時代從容自如地面對客戶提供了科學(xué)手段和方法。一、數(shù)據(jù)挖掘?qū)RM的影響21世紀的商業(yè)競爭44客戶關(guān)系管理(CRM)指的是企業(yè)與其客戶的交流方式,它實施于企業(yè)的市場營銷、銷售、服務(wù)與技術(shù)支持等與客戶有關(guān)的領(lǐng)域。它是一種管理理念,又是一種旨在改善企業(yè)與客戶之間關(guān)系的新型管理機制,也是一種管理軟件和技術(shù),它將最佳的商業(yè)實踐與數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、一對一營銷、銷售自動化以及其它信息技術(shù)緊密結(jié)合在一起,為企業(yè)的銷售、客戶服務(wù)和決策支持等領(lǐng)域提供了一個業(yè)務(wù)自動化的解決方案,使企業(yè)有了一個基于電子商務(wù)的面對客戶的前沿,從而順利實現(xiàn)由傳統(tǒng)企業(yè)模式到以電子商務(wù)為基礎(chǔ)的現(xiàn)代企業(yè)模式的轉(zhuǎn)化??蛻絷P(guān)系管理(CRM)指的是企業(yè)與其客戶的交流方45CRM的特征
①一對一營銷②高度集成的交流渠道③統(tǒng)一共享的信息資源④商業(yè)智能化的數(shù)據(jù)分析和處理⑤對基于Web的功能的支持CRM體系結(jié)構(gòu)圖如下所示:CRM的特征46業(yè)務(wù)規(guī)則和元數(shù)據(jù)管理工作流管理聯(lián)系歷史交易歷史客戶和帳務(wù)數(shù)據(jù)倉庫外部數(shù)據(jù)ETL工具(抽取轉(zhuǎn)換裝載工具)行銷數(shù)據(jù)集市活動管理分析數(shù)據(jù)集市報表數(shù)據(jù)集市活動管理數(shù)據(jù)挖掘/分析數(shù)據(jù)源行銷數(shù)據(jù)存儲決策支持應(yīng)用特別查詢和報表直接郵寄(廣告)聯(lián)系管理呼叫中心銷售力量客服中心Internet電子郵件其他信息渠道CRM體系結(jié)構(gòu)圖業(yè)務(wù)規(guī)則和元數(shù)據(jù)管理工作流管理聯(lián)系歷史交易歷史客戶和帳務(wù)數(shù)據(jù)47在這個體系結(jié)構(gòu)圖中,有很多用于產(chǎn)生和使用信息的客戶接觸點和發(fā)送渠道。經(jīng)過集成和分析信息,可以完整、正確地得出客戶的大概情況----他們的喜好、需求、抱怨、和使他們成為公司產(chǎn)品和服務(wù)網(wǎng)的終身會員的特性。最后數(shù)據(jù)倉庫環(huán)境下所有的部件都將被部署到適當(dāng)?shù)奈恢?,并提供多種用于集成和分析的重要功能。在這個體系結(jié)構(gòu)圖中,有很多用于產(chǎn)生和使用信息的48從較高的層次看,CRM系統(tǒng)的體系結(jié)構(gòu)很像一棟房子:客戶接觸點是根基數(shù)據(jù)倉庫是地基客戶利益性是隅石數(shù)據(jù)挖掘是藍圖Web應(yīng)用是頂石這些技術(shù)結(jié)合在一起便構(gòu)成了完整的CRM系統(tǒng)。從較高的層次看,CRM系統(tǒng)的體系結(jié)構(gòu)很像一棟49二、在CRM中數(shù)據(jù)挖掘常用技術(shù)比較典型的數(shù)據(jù)挖掘方法
①關(guān)聯(lián)分析
②序列模式分析③分類分析④聚類分析⑤決策樹⑥神經(jīng)元網(wǎng)絡(luò)⑦規(guī)則歸納二、在CRM中數(shù)據(jù)挖掘常用技術(shù)比較典型的數(shù)據(jù)挖掘方法50三、解決實際商業(yè)問題客戶盈利分析新客戶的獲取交叉營銷客戶的保持客戶的細分三、解決實際商業(yè)問題客戶盈利分析51客戶盈利分析客戶盈利能力分析是數(shù)據(jù)挖掘的基礎(chǔ),也是數(shù)據(jù)挖掘是否用于正確方向的一個指標。一般情況下,在顧客身上的花費越多,他們保持更高的忠誠度和購買更多產(chǎn)品的可能性越大。保持客戶的忠誠度將對客戶盈利能力產(chǎn)生極深的影響。數(shù)據(jù)挖掘技術(shù)可以用來預(yù)測在不同市場活動情況下的客戶盈利能力;可以預(yù)測未來的盈利能力;預(yù)測客戶盈利能力的變化??蛻粲治隹蛻粲芰Ψ治鍪菙?shù)據(jù)挖掘的基礎(chǔ),也是數(shù)據(jù)挖掘是52新客戶的獲取在大多數(shù)商業(yè)領(lǐng)域中,業(yè)務(wù)發(fā)展的主要指標里包括新客戶的獲取能力。新客戶的獲取包括發(fā)現(xiàn)那些對你的產(chǎn)品不了解的客戶,也包括以前接受你的競爭對手服務(wù)的顧客。數(shù)據(jù)挖掘技術(shù)可以幫助我們對潛在客戶群進行分析,并增加市場推廣活動產(chǎn)生的反饋率。新客戶的獲取在大多數(shù)商業(yè)領(lǐng)域中,業(yè)務(wù)發(fā)展的主要指標里包括新客53交叉營銷交叉營銷是指你向現(xiàn)有的客戶提供新的產(chǎn)品和服務(wù)的營銷過程。公司與其客戶之間的商業(yè)關(guān)系是一種持續(xù)的不斷發(fā)展的關(guān)系,在這種關(guān)系建立起來以后,可以有很多種方法來不斷改善這種關(guān)系。雙方的目標是達到雙贏的結(jié)果,客戶獲益是由于他們得到了更好更貼切的服務(wù)質(zhì)量,商家則因為增加銷售量獲利。交叉營銷交叉營銷是指你向現(xiàn)有的客戶提供新的產(chǎn)品和服務(wù)的營銷過54客戶的保持隨著行業(yè)的競爭越來越激烈和獲得一個新客戶的開支愈來愈大,保持原有客戶的工作愈來愈有價值。使用數(shù)據(jù)挖掘技術(shù)可以用來預(yù)測哪些客戶具有高風(fēng)險轉(zhuǎn)移的可能性。例如使用分類回歸樹(CART)來生成各種預(yù)測模型,可以對客戶流失原因有深入的了解。客戶的保持隨著行業(yè)的競爭越來越激烈和獲得一個新客戶的開支愈來55客戶的細分細分是指將一個大的消費群體劃分成一個個細分群的動作,同屬于一個細分群的消費者彼此相似,而隸屬于不同細分群的消費者被視為不同。細分的目的可以讓管理者從一個比較高的層次上“鳥瞰”整個數(shù)據(jù)庫中的數(shù)據(jù),從而可以用不同的方法對待處于不同細分群眾的客戶,提供相對個性化的服務(wù)??梢杂脭?shù)據(jù)挖掘中的決策樹或者聚類的方法來實現(xiàn)細分??蛻舻募毞旨毞质侵笇⒁粋€大的消費群體劃分成一個個細分群的動作56四、建立解決方案的關(guān)鍵建立商業(yè)案例判斷是否用數(shù)據(jù)挖掘技術(shù)在CRM中應(yīng)用數(shù)據(jù)挖掘系統(tǒng)步驟優(yōu)化CRM四、建立解決方案的關(guān)鍵建立商業(yè)案例57建立商業(yè)案例針對數(shù)據(jù)挖掘創(chuàng)建商業(yè)案例的第一步就是找到可以采用數(shù)據(jù)挖掘技術(shù)的地方。在創(chuàng)建商業(yè)案例的過程中,最重要的是商業(yè)價值的定義,或者說如何來評判數(shù)據(jù)挖掘的價值,評估指標包括收益的增長、利潤、成本降低、投資回報率(ROI)、競爭優(yōu)勢等。建立商業(yè)案例針對數(shù)據(jù)挖掘創(chuàng)建商業(yè)案例的第一步就是找到可以采用58在開始任何數(shù)據(jù)挖掘項目之前,必須要回答一個重要問題,即是否真的需要用這種方法,要對此做出決定,重要的是理解所需的數(shù)據(jù)挖掘技術(shù)的復(fù)雜度級別。例如:是否只需要一些標準的打印好的報表,還是需要交互式的ROL分析或OLAP來看看數(shù)據(jù)是什么樣的?是否需要用真正的數(shù)據(jù)挖掘技術(shù)來建立預(yù)測模型、搜索數(shù)據(jù)庫已獲得有用的模式?選擇一種數(shù)據(jù)挖掘技術(shù)和某種實際產(chǎn)品的關(guān)鍵在于產(chǎn)品能否帶來商業(yè)價值。如果某種技術(shù)不能被轉(zhuǎn)化為利潤、增加收入、降低成本,或提高投資收回率,商業(yè)上就不會有人花時間用它。判斷是否用數(shù)據(jù)挖掘技術(shù)在開始任何數(shù)據(jù)挖掘項目之前,必須要回答一個重要問題,即是否真59①定義問題②定義用戶③定義數(shù)據(jù)④數(shù)據(jù)清洗、⑤控制項目的范圍⑥試驗⑦質(zhì)量保證⑧教育培訓(xùn)⑨發(fā)布⑩維護在CRM中啟動數(shù)據(jù)挖掘應(yīng)用的步驟①定義問題在CRM中啟動數(shù)據(jù)挖掘應(yīng)用的步驟60優(yōu)化CRM優(yōu)化CRM過程:
對CRM進行優(yōu)化比對其他業(yè)務(wù)問題優(yōu)化更加困難,但是隨著數(shù)據(jù)庫、數(shù)據(jù)挖掘和CRM系統(tǒng)自身的發(fā)展,現(xiàn)在已經(jīng)可以經(jīng)常對CRM進行優(yōu)化,以增加客戶收益率。優(yōu)化過程有三個重要步驟:
①評價:檢查發(fā)生的結(jié)果②預(yù)測:根據(jù)已經(jīng)發(fā)生的事情來設(shè)想其他的③行動:進行嘗試優(yōu)化CRM優(yōu)化CRM過程:61小結(jié)小結(jié)62謝謝!謝謝!63數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用北京科技大學(xué)楊炳儒教授數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用北京科技大學(xué)64數(shù)據(jù)挖掘(知識發(fā)現(xiàn))新進展數(shù)據(jù)挖掘在商務(wù)智能決策中的應(yīng)用數(shù)據(jù)挖掘在CRM中的應(yīng)用數(shù)據(jù)挖掘(知識發(fā)現(xiàn))新進展65第一部分數(shù)據(jù)挖掘(知識發(fā)現(xiàn))新進展五、研究動態(tài)與趨向一、數(shù)據(jù)挖掘(知識發(fā)現(xiàn))概念內(nèi)涵與外延的發(fā)展二、挖掘知識類型的擴展三、挖掘技術(shù)方法的擴展四、應(yīng)用的擴展第一部分數(shù)據(jù)挖掘(知識發(fā)現(xiàn))新進展五、研究動態(tài)與趨向一、數(shù)據(jù)66一、數(shù)據(jù)挖掘(知識發(fā)現(xiàn))概念內(nèi)涵與外延的發(fā)展結(jié)構(gòu)化數(shù)據(jù)挖掘DM(KDD)多媒體數(shù)據(jù)構(gòu)成的大型異質(zhì)異構(gòu)數(shù)據(jù)庫,稱為復(fù)雜數(shù)據(jù)類型挖掘CDM[動態(tài)(在線)-分布式-并行系統(tǒng)]Web:1、以文本為主的頁面內(nèi)容挖掘2、以客戶訪問信息為主3、以Web結(jié)構(gòu)為主多媒體:音頻、視頻、圖像、圖形、時序、空間等基于知識庫的知識發(fā)現(xiàn)KDK一、數(shù)據(jù)挖掘(知識發(fā)現(xiàn))概念內(nèi)涵與外延的發(fā)展結(jié)構(gòu)化數(shù)據(jù)挖掘多67知識發(fā)現(xiàn)的新定義:
在現(xiàn)實世界中,針對客觀存在的具有海量性、不確定性、不完全性的量的、質(zhì)的、復(fù)雜形態(tài)的知識源,挖掘其中潛在的、先前未知的、用戶感興趣的、最終可被用戶理解的模式的非平凡提取過程。知識發(fā)現(xiàn)的新定義:在現(xiàn)實世界中,針對客68二、挖掘知識類型的擴展擴展擴展關(guān)聯(lián)規(guī)則、分類、聚類、相似模式、混沌模式、時序模式、預(yù)測等文本、客戶訪問路徑、音頻、視頻……生物信息挖掘、游戲信息挖掘、XML文檔、多語言文本挖掘、圖表數(shù)據(jù)庫、分子結(jié)構(gòu)數(shù)據(jù)庫等二、挖掘知識類型的擴展擴展擴展關(guān)聯(lián)規(guī)則、分類、聚類、相似模式69三、挖掘技術(shù)方法的擴展擴展統(tǒng)計學(xué)(數(shù)理統(tǒng)計)、證據(jù)理論、機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、粗糙集、近似推理、小波、分形、概念格、概念樹提升、決策樹等Hilbert空間、信息融合與神經(jīng)網(wǎng)絡(luò)結(jié)合、距離測度函數(shù)、數(shù)據(jù)立方體、隱馬爾可夫模型、信息熵、主觀Bayes方法、信息擴散等三、挖掘技術(shù)方法的擴展擴展統(tǒng)計學(xué)(數(shù)理統(tǒng)計)、證據(jù)理論、Hi70四、應(yīng)用的擴展金融、醫(yī)療保健、市場業(yè)、零售業(yè)、制造業(yè)、工程與科學(xué)、經(jīng)紀業(yè)和安全交易、證券交易、瑕疵分析、政府和防衛(wèi)、電信、司法、企業(yè)經(jīng)營管理等等應(yīng)用領(lǐng)域擴展Internet、農(nóng)業(yè)、氣象、遠程教育、天文學(xué)、生物信息、地理信息等等四、應(yīng)用的擴展金融、醫(yī)療保健、市場業(yè)、零售業(yè)、應(yīng)用領(lǐng)域擴展I71Marksman、ThinkMachine、DataMind、IntelligentMiner、KnowledgeSEEKER、等等實例和軟件的擴展MSMiner、KDD*、KDK*、KD(D&K)等等Marksman、ThinkMachine、實例和軟件的擴72五、研究動態(tài)與趨向
目前國際上KDD的研究主要是以知識發(fā)現(xiàn)的任務(wù)描述、知識評價與知識表示為主線,有效的知識發(fā)現(xiàn)算法為中心。這是在相當(dāng)長的一段時間內(nèi)保持的主流與基調(diào)。
五、研究動態(tài)與趨向目前國際上KDD的研究主要是73國外研究動態(tài)2003年8月27日在華盛頓召開了第九屆知識發(fā)現(xiàn)與數(shù)據(jù)挖掘國際會議,參與討論的專家一致認為:數(shù)據(jù)挖掘正面臨著巨大的機遇和挑戰(zhàn)。國外研究動態(tài)2003年8月27日在華盛頓召開了第九屆知識發(fā)現(xiàn)74其中U.Fayyad認為從科學(xué)發(fā)展的長遠來看,最大的絆腳石是基礎(chǔ)理論的缺乏以及所面臨的問題和挑戰(zhàn)的清晰明白的闡述。他認為對于我們要做什么,幾乎沒有理論甚至工程實踐來指導(dǎo):在今天它仍然是”不為人知的藝術(shù)”。我們需要理論來指導(dǎo)我們要做什么以及要如何作。這些理論能夠促使工程解決方法的出現(xiàn),這樣我們也可以將我們的“手藝”更有效的教給其他人。而這種形勢與從業(yè)者以及對應(yīng)用感興趣的人們的巨大的熱情同時存在,這些人來自不同的領(lǐng)域,但是沒有科學(xué)根基以及持續(xù)的學(xué)術(shù)發(fā)展,本領(lǐng)域不可能得到發(fā)展與鞏固。其中U.Fayyad認為從科學(xué)發(fā)展的長遠來看,最大的絆腳石75R.Uthurusamy認為WEB的使用和生產(chǎn)廠家的大肆宣傳等都會在短期內(nèi)影響本領(lǐng)域的發(fā)展,它們會使得我們將更多的精力投向數(shù)據(jù)庫營銷、CRM和OLAP等方面,而不是致力于使KDD從根本上或科學(xué)上有大的進步。KDD的基礎(chǔ)研究界必須消除這些干擾而去努力解決KDD的真正的根本的問題。R.Uthurusamy認為WEB的使用和生產(chǎn)廠家的大肆宣傳76國內(nèi)研究動態(tài)我們編制了了軟件對中國期刊網(wǎng)上1994年至今的論文進行了分類與統(tǒng)計。1、歷年發(fā)表文章數(shù)分類匯總圖示如下(含所有的類別共11707篇)國內(nèi)研究動態(tài)我們編制了了軟件對中國期刊網(wǎng)上1994年至今的論772、按照數(shù)據(jù)挖掘、決策支持系統(tǒng)、專家系統(tǒng)方面的文章統(tǒng)計圖示如下:(評價)2、按照數(shù)據(jù)挖掘、決策支持系統(tǒng)、專家系統(tǒng)方面的文章統(tǒng)計圖示如78發(fā)展的基本特征(1)原有理論方法的深化與拓展
如:1)網(wǎng)絡(luò)數(shù)據(jù)挖掘;流數(shù)據(jù);混合數(shù)據(jù)。2)基于神經(jīng)網(wǎng)絡(luò)的的時序數(shù)據(jù)、相似序列、快速挖掘算法的研究等。
3)粗糙集與支持向量機模型與方法的擴展。4)凸分析與數(shù)據(jù)包絡(luò)分析方法的運用。5)增強(強化)學(xué)習(xí)模型與方法的運用。發(fā)展的基本特征(1)原有理論方法的深化與拓展79(2)復(fù)雜類型(系統(tǒng))數(shù)據(jù)挖掘成為熱點
如:1)生物信息挖掘。
KnowledgeDiscoveryforPromoterStructureAnalysisStudyofMotifCorrelationinProteinsbyDataMining(用數(shù)據(jù)挖掘技術(shù)進行蛋白質(zhì)中啟動子的結(jié)構(gòu)分析)
2)半結(jié)構(gòu)化、非結(jié)構(gòu)化等復(fù)雜類型數(shù)據(jù)挖掘。
AMethodforMiningDataofSequentialImages----RebuildingofGray(Position)timeFunctiononArbitraryDirectionLines(基于圖表數(shù)據(jù)庫知識發(fā)現(xiàn)系統(tǒng)的概念等級聚類)3)分布式數(shù)據(jù)挖掘系統(tǒng)。4)動態(tài)、在線數(shù)據(jù)挖掘系統(tǒng)。5)流數(shù)據(jù)、混合數(shù)據(jù)與不完備數(shù)據(jù)挖掘系統(tǒng)。(2)復(fù)雜類型(系統(tǒng))數(shù)據(jù)挖掘成為熱點80(3)新技術(shù)與方法的引入(其它學(xué)科領(lǐng)域的滲透)如:人工免疫系統(tǒng)方法;協(xié)同驗算方法;模擬退火算法;保角變換方法;黎曼幾何方法等。(4)理論融合交叉性研究如:基于RoughSet的證據(jù)推理算法;模糊關(guān)系數(shù)據(jù)模型與粗集結(jié)合算法等。認知心理學(xué)、認知物理學(xué)、認知生物學(xué)等。(5)基礎(chǔ)理論研究內(nèi)在機理研究;自主知識發(fā)現(xiàn)框架;DM=數(shù)據(jù)集+似然關(guān)系+挖掘算法等。(3)新技術(shù)與方法的引入(其它學(xué)科領(lǐng)域的滲透)81第二部分數(shù)據(jù)挖掘在商務(wù)智能決策中的應(yīng)用一、基于信息挖掘的新型智能決策支持系統(tǒng)二、商務(wù)部國際商務(wù)中心項目簡介三、軟件系統(tǒng)實現(xiàn)整體說明第二部分數(shù)據(jù)挖掘在商務(wù)智能決策中的應(yīng)用一、基于信息挖掘的82一、基于信息挖掘的新型智能決策支持系統(tǒng)自從美國麻省理工學(xué)院的MichaelS.S.Morton和PeterG.W.Keen于20世紀70年代首次提出決策支持系統(tǒng)(DSS)以來,其發(fā)展迅速,不斷取得顯著的成果,并成為許多行業(yè)經(jīng)營管理中一個不可缺少的現(xiàn)代化決策支持工具。現(xiàn)在正逐步形成新一代的DSS:群決策支持系統(tǒng)(GDSS),分布式?jīng)Q策支持系統(tǒng)(DDSS),戰(zhàn)略決策支持系統(tǒng)等,尤其是智能決策支持系統(tǒng)(IDSS)的出現(xiàn),將人工智能的知識推理等技術(shù)引入DSS,使DSS的發(fā)展進入了一個新的階段。近年來,又相繼出現(xiàn)了基于數(shù)據(jù)倉庫與基于WEB的智能決策支持系統(tǒng),大大推進了IDSS的發(fā)展。
一、基于信息挖掘的新型智能決策支持系統(tǒng)自從美國麻省理工學(xué)院的83但是,傳統(tǒng)的決策支持系統(tǒng)尚存在著推理技術(shù)單調(diào),自學(xué)習(xí)能力較差,形成知識庫中的知識不足夠豐富這一新的“瓶頸”現(xiàn)象。近年來Internet迅速發(fā)展,網(wǎng)上信息極大豐富而知識卻相對缺乏,并且這些信息和以往決策支持系統(tǒng)所處理的信息不同,是非結(jié)構(gòu)化的,這就使其處理方式也必然有所不同。所以新一代決策支持系統(tǒng)的發(fā)展方向是高度智能化,以多種知識表示、自組織協(xié)同工作、自動知識獲取和自適應(yīng)能力較強等為特征。但是,傳統(tǒng)的決策支持系統(tǒng)尚存在著推理技術(shù)單調(diào),自學(xué)習(xí)能力較差84為此,我們提出了基于信息挖掘的智能決策支持系統(tǒng)IDSSIM,這里的信息挖掘區(qū)別于通常的數(shù)據(jù)挖掘,是從結(jié)構(gòu)化數(shù)據(jù)或復(fù)雜類型數(shù)據(jù)(文本、日志、音頻、視頻、圖像等)中提取新穎、潛在有用知識的非平凡抽取過程。所形成的IDSSIM結(jié)構(gòu)模型可廣泛應(yīng)用于各行各業(yè)在管理信息系統(tǒng)的基礎(chǔ)上所提升的輔助決策支持系統(tǒng)中。IDSSIM的總體結(jié)構(gòu)模型如下圖所示:為此,我們提出了基于信息挖掘的智能決策支持系統(tǒng)IDSSIM,85數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用86其理論基礎(chǔ)是我們提出的基于雙庫協(xié)同機制的知識發(fā)現(xiàn)系統(tǒng)KDD*和WEB數(shù)據(jù)挖掘過程,它以多個知識源的知識融合、多抽象級與不同知識層次的結(jié)構(gòu),以及使數(shù)據(jù)庫、知識庫、方法庫、模型庫、文本庫、日志庫六庫協(xié)同運作為特征,形成了極其豐富的動態(tài)知識庫系統(tǒng)與相應(yīng)的集成推理機制,為解決決策系統(tǒng)構(gòu)造中的核心技術(shù)提供了一條有效的途徑,也從根本上提高了決策支持系統(tǒng)的實用化程度。其理論基礎(chǔ)是我們提出的基于雙庫協(xié)同機制的知識發(fā)現(xiàn)系統(tǒng)KDD*87系統(tǒng)的核心是“源于信息的知識發(fā)現(xiàn)KDBI”(KnowledgeDiscoveryBasedonInformation),它在模塊實現(xiàn)上主要包含三個部分:基于雙庫協(xié)同機制的知識發(fā)現(xiàn)子系統(tǒng)(KDD*)、基于推理機制的知識發(fā)現(xiàn)子系統(tǒng)(KDRM)和基于WEB挖掘的知識發(fā)現(xiàn)子系統(tǒng)(KDWM)??纱致缘乇硎緸椋篕DBI=KDD*+KDRM+KDWM。系統(tǒng)的核心是“源于信息的知識發(fā)現(xiàn)KDBI”(Knowledg88首先,六庫(數(shù)據(jù)庫、知識庫、方法庫、模型庫、文本庫、日志庫)在多庫管理子系統(tǒng)的管理下協(xié)同運作。知識獲取子系統(tǒng)可以從領(lǐng)域?qū)<夷抢铽@取知識,也可以獲取書本中的知識,并將這些知識存儲在知識庫中。基于信息挖掘的新型智能決策支持系統(tǒng)。首先,六庫(數(shù)據(jù)庫、知識庫、方法庫、模型庫、文本庫、日志庫)89其次,知識庫中的知識可以直接納入綜合知識庫,也可以被基于雙庫協(xié)同機制的知識發(fā)現(xiàn)(KDD*)子系統(tǒng)利用,在以屬性為基礎(chǔ)的知識庫建庫原則下,通過搜索知識庫中知識結(jié)點的不關(guān)聯(lián)態(tài),產(chǎn)生“創(chuàng)見意向”,發(fā)現(xiàn)短缺知識。其次,知識庫中的知識可以直接納入綜合知識庫,也可以被基于雙庫90再次,基于推理機制的知識發(fā)現(xiàn)子系統(tǒng)(KDRM),包括用一種或多種知識表示方法描述的已知問題及其解法的描述集合的知識庫和需要求解的問題集;通過Fuzzy推理、演繹推理、廣義綜合歸納推理和基于案例的推理等,構(gòu)造規(guī)則集和發(fā)現(xiàn)新知識。來自WEB的信息首先被存儲在文本庫和日志庫中,并由基于WEB的知識發(fā)現(xiàn)子系統(tǒng)挖掘關(guān)于訪問信息、文本和結(jié)構(gòu)方面的知識,并將挖掘結(jié)果存入WEB知識庫。再次,基于推理機制的知識發(fā)現(xiàn)子系統(tǒng)(KDRM),包括用一種或91二、商務(wù)部國際商務(wù)中心項目簡介在與國家商務(wù)部國際商務(wù)中心的合作中,構(gòu)造了基于我們專利技術(shù)的“面向加工貿(mào)易基于競爭情報的智能決策支持系統(tǒng)”。針對外貿(mào)加工中國內(nèi)采購與供應(yīng)鏈系統(tǒng)進行深入分析,通過數(shù)據(jù)挖掘、WEB挖掘、案例推理與OLAP等技術(shù),挖掘出一些平時很難靠直觀或憑借經(jīng)驗發(fā)現(xiàn)的規(guī)則,發(fā)現(xiàn)了若干新的知識。對領(lǐng)導(dǎo)戰(zhàn)略決策與企業(yè)經(jīng)營決策管理有一定的參考價值。二、商務(wù)部國際商務(wù)中心項目簡介在與國家商務(wù)部國際商務(wù)中心的合92利用商務(wù)部國際商務(wù)中心長期積累的對外加工貿(mào)易的數(shù)據(jù),充分運用我們的創(chuàng)新性信息處理技術(shù)和數(shù)據(jù)挖掘技術(shù),開展研發(fā)工作。目前已通過驗收,并將對國家的對外貿(mào)易和商務(wù)活動產(chǎn)生較大影響。概括起來有如下幾點:1)為對外貿(mào)易企業(yè)“請進來,走出去”提供決策支持;2)為領(lǐng)導(dǎo)關(guān)注的熱點問題,提供決策支持;3)為外商投資提供咨詢指導(dǎo);4)為國家和地方招商引資提供科學(xué)的建議。利用商務(wù)部國際商務(wù)中心長期積累的對外加工貿(mào)易的數(shù)據(jù),93項目主頁應(yīng)用窗口項目主頁應(yīng)用窗口94三、軟件系統(tǒng)實現(xiàn)整體說明1、OLAP問題域運行環(huán)境與開發(fā)工具三、軟件系統(tǒng)實現(xiàn)整體說明1、OLAP95OLAP問題域1、經(jīng)營企業(yè)信息分析2、國產(chǎn)料件分析3、進口料件分析4、加工行業(yè)分析5、外商分析6、進出口幣種分析7、工繳費分析8、口岸與海關(guān)分析9、出口成品分析OLAP問題域1、經(jīng)營企業(yè)信息分析96OLAP運行環(huán)境與工具服務(wù)器端: 硬件:性能較好的服務(wù)器、網(wǎng)絡(luò)鏈接 軟件:ORACLE數(shù)據(jù)庫服務(wù)器及數(shù)據(jù)、BRIOINTELLIGENCESERVER、BRIOCLIENTDESIGNER客戶端:硬件:普通PC、網(wǎng)卡、INTERNET網(wǎng)絡(luò)鏈接軟件:BRIOCLIENTEXPLORER、通用瀏覽器OLAP運行環(huán)境與工具服務(wù)器端:972.KDD*問題域計算模式與開發(fā)工具總體設(shè)計流程圖2.KDD*問題域98KDD*問題域說明預(yù)想:就采購價值鏈方面內(nèi)容,展開數(shù)據(jù)挖掘,重點對國內(nèi)采購現(xiàn)狀,抽取相關(guān)關(guān)聯(lián)規(guī)則,提供領(lǐng)導(dǎo)決策信息。方法特征:智能系統(tǒng)內(nèi)在的使用了人工智能方法與軟計算方法,知識發(fā)現(xiàn)方法尋求新穎的知識類型,因而所發(fā)現(xiàn)的知識與數(shù)據(jù)狀況密切相關(guān)。在未作實際挖掘前難以確定其明確主題。將提交結(jié)果:就目前挖掘情況看,領(lǐng)導(dǎo)決策方面與企業(yè)經(jīng)營決策方面的內(nèi)容都可能發(fā)現(xiàn)較有價值得知識。因而,須在實際研發(fā)過程中,逐步篩選、調(diào)試、聚焦。KDD*問題域說明預(yù)想:就采購價值鏈方面內(nèi)容99KDD*計算模式與開發(fā)工具計算模式:客戶機/服務(wù)器模式運行環(huán)境與開發(fā)工具客戶端:windows平臺,DELPH,ODBC服務(wù)器端:商務(wù)部現(xiàn)有環(huán)境和ORACLE數(shù)據(jù)庫系統(tǒng)
KDD*計算模式與開發(fā)工具計算模式:客戶機/服務(wù)器模式100KDD*總體設(shè)計流程圖KDD*總體設(shè)計流程圖101數(shù)據(jù)清理:主要完成數(shù)據(jù)源的選取、數(shù)據(jù)清洗、去噪聲以及填補空缺數(shù)據(jù)等等,也就是要為挖掘準為數(shù)據(jù),確切的說就是為數(shù)據(jù)離散做準備。主題管理:主要是針對挖掘的目標不同而設(shè)立不同的主題,這部分主要實現(xiàn)主題的定義、修改、刪除以及主題的選擇等功能,在主題的定義中要完成與該主題相關(guān)的數(shù)據(jù),也就是要在這里確定挖掘的方向。數(shù)據(jù)清理:主要完成數(shù)據(jù)源的選取、數(shù)據(jù)清洗、去噪聲以及填補空缺102屬性值離散化:建立主題以后根據(jù)所選擇的數(shù)據(jù)確定語言變量以及所對應(yīng)的語言變量值,同時對所選定的數(shù)據(jù)根據(jù)語言變量和語言變量值進行離散形成挖掘數(shù)據(jù)庫,為下面的挖掘工作做準備。知識庫管理:分為基礎(chǔ)知識庫管理和衍生知識庫管理兩個部分,其中基礎(chǔ)知識庫包括基礎(chǔ)知識的錄入、修改、刪除等基本的維護工作;衍生知識庫包括挖掘出的知識的輸入,只是的展示等工作,這部分涉及到挖掘及知識的展示。
數(shù)據(jù)挖掘在商務(wù)智能決策與CRM中的應(yīng)用103數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)產(chǎn)生規(guī)則,分為兩個部分用戶子定義挖掘和系統(tǒng)自動挖掘(啟發(fā)式協(xié)調(diào)器)。用戶子定義挖掘是根據(jù)用戶感興趣的內(nèi)容進行聚焦挖掘,啟發(fā)式挖掘是根據(jù)基礎(chǔ)知識庫,針對短缺知識進行挖掘。知識評價:對挖掘出的規(guī)則進行評價決定是否存入到衍生知識庫中,首先是通過中斷協(xié)調(diào)器進行評價然后再經(jīng)過領(lǐng)域?qū)<疫M行評價來決定是否存入衍生知識庫。數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)產(chǎn)生規(guī)則,分為兩個部分用戶子定義挖掘和系統(tǒng)104附:與此相應(yīng)的,我們還研發(fā)了用于智能決策的“分布式數(shù)據(jù)資源集成系統(tǒng)”,給出了統(tǒng)一數(shù)據(jù)訪問接口、快速全文檢索、文本分類、文本數(shù)字化、個性化信息推送和信息發(fā)布等一攬子整體解決方案。附:與此相應(yīng)的,我們還研發(fā)了用于智能決策的“分布式數(shù)據(jù)資源集105第三部分數(shù)據(jù)挖掘在CRM中的應(yīng)用一、數(shù)據(jù)挖掘?qū)RM的影響二、在CRM中數(shù)據(jù)挖掘常用技術(shù)三、解決實際商業(yè)問題四、建立解決方案的關(guān)鍵第三部分數(shù)據(jù)挖掘在CRM中的應(yīng)用一、數(shù)據(jù)挖掘?qū)RM的影106一、數(shù)據(jù)挖掘?qū)RM的影響21世紀的商業(yè)競爭不僅取決于對市場的反應(yīng)速度,還取決于對本行業(yè)新知識的獲取、積累和有效利用的能力。實際上效率不再是商場上取勝的唯一關(guān)鍵。在這個新的啟用web的電子商務(wù)經(jīng)濟時代,靈活性和敏感性也是在競爭中取勝的重要因素。能夠提供客戶資源及相關(guān)數(shù)據(jù)分析的客戶關(guān)系管理系統(tǒng)(CustomerRelationshipManagement,CRM)就成為焦點。作為專門管理企業(yè)前臺的客戶關(guān)系管理為企業(yè)提供了一個收集、分析和利用各種客戶信息的系統(tǒng),幫助企業(yè)充分利用其客戶管理資源,也為企業(yè)在電子商務(wù)時代從容自如地面對客戶提供了科學(xué)手段和方法。一、數(shù)據(jù)挖掘?qū)RM的影響21世紀的商業(yè)競爭107客戶關(guān)系管理(CRM)指的是企業(yè)與其客戶的交流方式,它實施于企業(yè)的市場營銷、銷售、服務(wù)與技術(shù)支持等與客戶有關(guān)的領(lǐng)域。它是一種管理理念,又是一種旨在改善企業(yè)與客戶之間關(guān)系的新型管理機制,也是一種管理軟件和技術(shù),它將最佳的商業(yè)實踐與數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、一對一營銷、銷售自動化以及其它信息技術(shù)緊密結(jié)合在一起,為企業(yè)的銷售、客戶服務(wù)和決策支持等領(lǐng)域提供了一個業(yè)務(wù)自動化的解決方案,使企業(yè)有了一個基于電子商務(wù)的面對客戶的前沿,從而順利實現(xiàn)由傳統(tǒng)企業(yè)模式到以電子商務(wù)為基礎(chǔ)的現(xiàn)代企業(yè)模式的轉(zhuǎn)化??蛻絷P(guān)系管理(CRM)指的是企業(yè)與其客戶的交流方108CRM的特征
①一對一營銷②高度集成的交流渠道③統(tǒng)一共享的信息資源④商業(yè)智能化的數(shù)據(jù)分析和處理⑤對基于Web的功能的支持CRM體系結(jié)構(gòu)圖如下所示:CRM的特征109業(yè)務(wù)規(guī)則和元數(shù)據(jù)管理工作流管理聯(lián)系歷史交易歷史客戶和帳務(wù)數(shù)據(jù)倉庫外部數(shù)據(jù)ETL工具(抽取轉(zhuǎn)換裝載工具)行銷數(shù)據(jù)集市活動管理分析數(shù)據(jù)集市報表數(shù)據(jù)集市活動管理數(shù)據(jù)挖掘/分析數(shù)據(jù)源行銷數(shù)據(jù)存儲決策支持應(yīng)用特別查詢和報表直接郵寄(廣告)聯(lián)系管理呼叫中心銷售力量客服中心Internet電子郵件其他信息渠道CRM體系結(jié)構(gòu)圖業(yè)務(wù)規(guī)則和元數(shù)據(jù)管理工作流管理聯(lián)系歷史交易歷史客戶和帳務(wù)數(shù)據(jù)110在這個體系結(jié)構(gòu)圖中,有很多用于產(chǎn)生和使用信息的客戶接觸點和發(fā)送渠道。經(jīng)過集成和分析信息,可以完整、正確地得出客戶的大概情況----他們的喜好、需求、抱怨、和使他們成為公司產(chǎn)品和服務(wù)網(wǎng)的終身會員的特性。最后數(shù)據(jù)倉庫環(huán)境下所有的部件都將被部署到適當(dāng)?shù)奈恢?,并提供多種用于集成和分析的重要功能。在這個體系結(jié)構(gòu)圖中,有很多用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 部編人教版歷史七年級上冊第2課《第二次鴉片戰(zhàn)爭》聽課評課記錄
- 期股獎勵模式股權(quán)激勵協(xié)議書范本
- 無錫市短期房屋租賃合同范本
- 醫(yī)院藥品合作協(xié)議書范本
- 商品房的租賃合同范本
- 游戲平臺合作合同范本
- 建筑公司合作協(xié)議書范本
- 湘教版數(shù)學(xué)七年級下冊2.1.4《多項式的乘法》聽評課記錄2
- 預(yù)加固樁施工方案
- 成考大專20年數(shù)學(xué)試卷
- 2025年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招高職單招英語2016-2024年參考題庫含答案解析
- 五 100以內(nèi)的筆算加、減法2.筆算減法 第1課時 筆算減法課件2024-2025人教版一年級數(shù)學(xué)下冊
- 2025江蘇太倉水務(wù)集團招聘18人高頻重點提升(共500題)附帶答案詳解
- 2025年八省聯(lián)考陜西高考生物試卷真題答案詳解(精校打印)
- 2025脫貧攻堅工作計劃
- 借款人解除合同通知書(2024年版)
- 《血小板及其功能》課件
- 江蘇省泰州市靖江市2024屆九年級下學(xué)期中考一模數(shù)學(xué)試卷(含答案)
- 沐足店長合同范例
- 《旅游資料翻譯》課件
- 《既有軌道交通盾構(gòu)隧道結(jié)構(gòu)安全保護技術(shù)規(guī)程》
評論
0/150
提交評論