




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、物流信息系統(tǒng)第5-6講 決策支持與商業(yè)智能July 22本講的主要內(nèi)容決策與決策支持系統(tǒng)DSS的結(jié)構(gòu)與工作原理多維數(shù)據(jù)模型數(shù)據(jù)倉(cāng)庫(kù)OLAP、EIS與數(shù)據(jù)可視化數(shù)據(jù)挖掘商業(yè)智能決策決策決策就是評(píng)價(jià)和選擇,是一個(gè)提出問(wèn)題,分析問(wèn)題和解決問(wèn)題的過(guò)程管理就是決策西蒙經(jīng)濟(jì)學(xué)、管理學(xué)等學(xué)科所研究的課題,實(shí)際上都是“人的決策過(guò)程和問(wèn)題求解過(guò)程”。要想真正理解組織內(nèi)的決策過(guò)程,就必須深刻了解人的思維過(guò)程。 “從某種意義上來(lái)說(shuō),一切決策都是折中的問(wèn)題。最終選擇的方案,只不過(guò)是在當(dāng)時(shí)的情況下可以選擇的最佳行動(dòng)方案而已,不可能盡善盡美地實(shí)現(xiàn)各種目標(biāo)”決策的過(guò)程決策模型決策模型用以描述決策者如何做決策的工具決策模型的
2、作用是將原始信息經(jīng)定性分析和定量處理,轉(zhuǎn)化成直接與決策有關(guān)的信息,決策者掌握了這些信息之后,就明確了決策問(wèn)題的狀態(tài)和決策目標(biāo),以便采取滿(mǎn)意的決策輔助決策決策問(wèn)題的分類(lèi)(1)三種決策問(wèn)題根據(jù)問(wèn)題的結(jié)構(gòu)程度,分成結(jié)構(gòu)化問(wèn)題、半結(jié)構(gòu)化問(wèn)題和非結(jié)構(gòu)化問(wèn)題結(jié)構(gòu)化程度:對(duì)某一問(wèn)題在不同環(huán)境下的發(fā)展規(guī)律與結(jié)果,能否用明確的語(yǔ)言(數(shù)學(xué)的或邏輯學(xué)的、形式的或非形式的,定量的或推理的)給予清晰的說(shuō)明或描述結(jié)構(gòu)化問(wèn)題是指常規(guī)的、重復(fù)的問(wèn)題,對(duì)于這些問(wèn)題有著標(biāo)準(zhǔn)的解決方法。非結(jié)構(gòu)化的問(wèn)題是指模糊的、復(fù)雜的問(wèn)題,沒(méi)有一刀切的、標(biāo)準(zhǔn)的答案。決策問(wèn)題的分類(lèi)(2)結(jié)構(gòu)化決策采用專(zhuān)門(mén)的方法處理確定的信息,所以總能得到準(zhǔn)確的答案
3、,沒(méi)有必要靠“感覺(jué)”或“直覺(jué)。這是一類(lèi)可編程的決策。也就是說(shuō)如果你輸人確定的信急并用精確的方法處理這些輸人信息,就能得到準(zhǔn)確的結(jié)果。 如,產(chǎn)品成本核算,固定資產(chǎn)折舊,零件訂貨在一個(gè)結(jié)構(gòu)化的問(wèn)題里,情報(bào)、設(shè)計(jì)和選擇都是結(jié)構(gòu)性的,獲得最佳答案的過(guò)程是清楚的。IT/IS可獲得滿(mǎn)意的解決決策問(wèn)題的分類(lèi)(2)非結(jié)構(gòu)化決策可能存在若干正確的解決方案,但沒(méi)有一種精確的方法計(jì)算出最優(yōu)方案,也沒(méi)有一組規(guī)則或標(biāo)準(zhǔn)能保證得到最佳的解決方案。 只能憑直覺(jué)和經(jīng)驗(yàn)作出判斷,IT/IS本身并不能解決,其作用是提供信息給決策者。如雜志封面選取半結(jié)構(gòu)問(wèn)題介于上述二者之間決策問(wèn)題的分類(lèi)(2)半結(jié)構(gòu)決策介于上述二者之間對(duì)于半結(jié)構(gòu)化
4、的問(wèn)題,其部分階段是結(jié)構(gòu)性的需要將標(biāo)準(zhǔn)化解決程序與個(gè)人判斷相結(jié)合。 IT/IS與人相結(jié)合來(lái)解決。各層次決策的比較三類(lèi)決策問(wèn)題的解決手段Decision FrequencyHighLowDecision StructureHighLowRoutine, programmable decisionNon-routine decisionDecision AutomationDecision Support SystemsSpecial studies決策支持系統(tǒng)1970s, Scott Morton “管理決策系統(tǒng)”一種“交互式的計(jì)算機(jī)系統(tǒng),可以幫助決策者使用其數(shù)據(jù)及模型來(lái)解決非結(jié)構(gòu)化的問(wèn)題”。
5、1980s,DSS的主要特征數(shù)據(jù)和模型是 DSS 的主要資源;DSS 是用來(lái)支持用戶(hù)作決策,而不是代替用戶(hù)作決策DSS 主要用來(lái)解決半結(jié)構(gòu)化及非結(jié)構(gòu)化問(wèn)題DSS 的目的在于提高決策的有效性而不是提高決策的效率。 Turban 管理支持系統(tǒng)MIS與DSS的比較本講的主要內(nèi)容決策與決策支持系統(tǒng)DSS的結(jié)構(gòu)與工作原理多維數(shù)據(jù)模型數(shù)據(jù)倉(cāng)庫(kù)OLAP、EIS與數(shù)據(jù)可視化數(shù)據(jù)挖掘商業(yè)智能DSS的結(jié)構(gòu)(1)DSS的結(jié)構(gòu)(2)數(shù)據(jù)庫(kù)子系統(tǒng)DSS中的數(shù)據(jù)通常是預(yù)先從相關(guān)的數(shù)據(jù)庫(kù)中抽取出來(lái)的,而不是MIS中龐大的數(shù)據(jù)。DSS的DB中的數(shù)據(jù)來(lái)源組織內(nèi)部現(xiàn)有的IS,如MIS、TPS來(lái)自組織外部,為分析和決策服務(wù)DSS并
6、不直接存取修改現(xiàn)有的IS的數(shù)據(jù),因?yàn)镸IS、TPS的數(shù)據(jù)不滿(mǎn)足DSS的要求安全性和速度的考慮數(shù)據(jù)庫(kù)子系統(tǒng)的作用為決策模型提供數(shù)據(jù)DSS的結(jié)構(gòu)(3)模型庫(kù)子系統(tǒng)模型從層次的角度來(lái)說(shuō),模型庫(kù)中的模型主要?jiǎng)澐譃樗姆N類(lèi)型:戰(zhàn)略的、戰(zhàn)術(shù)的、操作的和分析的。 有四種模型分析功能在 DSS 中是最常用:因果分析( what -if analysis ) ,目標(biāo)追尋,風(fēng)險(xiǎn)分析和仿真。 模型庫(kù)許多模型、模型構(gòu)建模塊 、編程語(yǔ)言DSS的結(jié)構(gòu)(4)模型庫(kù)管理系統(tǒng)(MBMS)模型庫(kù)管理系統(tǒng)是為生成模型和管理模型提供一個(gè)用戶(hù)友好環(huán)境的計(jì)算機(jī)軟件系統(tǒng)。用戶(hù)可以通過(guò)MBMS靈活地訪問(wèn)、更新、生成和運(yùn)行模型。MBMS使模型的
7、適用范圍拓寬,從而使決策者能方便地使用模型;同時(shí)它還要為決策者提供將現(xiàn)實(shí)問(wèn)題抽象成模型的工具。所以可以說(shuō)模型管理系統(tǒng)是聯(lián)系決策問(wèn)題、數(shù)據(jù)與模型的橋梁。DSS的結(jié)構(gòu)(5)模型庫(kù)管理系統(tǒng)的主要功能模型構(gòu)建幫助用戶(hù)迅速、方便地構(gòu)建模型。構(gòu)建的模型可以是全新的,也可以是在某個(gè)模型基礎(chǔ)上修改加工的模型庫(kù)維護(hù)對(duì)模型的登記、分類(lèi)、刪除、拷貝,對(duì)模型目錄的修改、建立、刪除等模型操作模型與模型的連接生成新模型對(duì)模型執(zhí)行情況進(jìn)行跟蹤 模型與數(shù)據(jù)的連接模型結(jié)果分析DSS的結(jié)構(gòu)(6)會(huì)話(huà)子系統(tǒng)會(huì)話(huà)子系統(tǒng)是 DSS 人機(jī)接口界面提供用戶(hù)表達(dá)和描述決策問(wèn)題的窗口提供用戶(hù)干預(yù)和影響問(wèn)題求解過(guò)程DSS 的決策過(guò)程是人機(jī)交互的
8、啟發(fā)式過(guò)程,問(wèn)題的解決過(guò)程往往要分解成若干階段。一個(gè)階段得到階段結(jié)果及某些啟示,然后進(jìn)入下一階段的人機(jī)會(huì)話(huà),如此反復(fù)。DSS 由不了解系統(tǒng)內(nèi)部的人使用,因此會(huì)話(huà)子系統(tǒng)的好壞標(biāo)志著 DSS 的實(shí)用水平會(huì)話(huà)形式以菜單、窗口、選擇表等圖形方式為主,也可以用自然語(yǔ)言的形式三種結(jié)構(gòu)的DSS 三庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)模型庫(kù)對(duì) 話(huà)子 系 統(tǒng)數(shù) 據(jù) 庫(kù)管理系 統(tǒng)模 型 庫(kù)管理 系 統(tǒng)用戶(hù)數(shù)據(jù)庫(kù)模型庫(kù)對(duì) 話(huà)子 系 統(tǒng)數(shù) 據(jù) 庫(kù)管理系 統(tǒng)模 型 庫(kù)管理 系 統(tǒng)用戶(hù)方法庫(kù)知識(shí)庫(kù)方 法 庫(kù)管理系 統(tǒng)知 識(shí) 庫(kù)管理系 統(tǒng)數(shù)據(jù)庫(kù)模型庫(kù)對(duì)話(huà)子系統(tǒng)方法庫(kù)管理系統(tǒng)模型庫(kù)管理系統(tǒng)用戶(hù)數(shù)據(jù)庫(kù)管理系統(tǒng)方法庫(kù)四庫(kù)結(jié)構(gòu)兩庫(kù)結(jié)構(gòu)DSS案例:Carg
9、oProf收益管理系統(tǒng)(1)1254xxx乘客訂位代理人乘客訂位系統(tǒng)乘客預(yù)測(cè)數(shù)據(jù)航班調(diào)度服務(wù)器可運(yùn)輸貨物容量預(yù)測(cè)貨物訂艙代理人要求要求接受/拒絕貨運(yùn)定艙系統(tǒng)貨物尺寸費(fèi)率數(shù)據(jù)可用容量/最低價(jià)格CargoProf收益管理系統(tǒng)3DSS案例:CargoProf收益管理系統(tǒng)(2)模型與模型庫(kù)管理系統(tǒng)模型1:乘客數(shù)量預(yù)測(cè)模型模型2:乘客行李預(yù)測(cè)模型-可運(yùn)輸貨物容量預(yù)測(cè)主模型模型3:收益管理決策模型背包問(wèn)題:有限容量,收益最大化模型庫(kù)管理系統(tǒng):確定模型的調(diào)用關(guān)系數(shù)據(jù)庫(kù)子系統(tǒng)乘客數(shù)量分布規(guī)律 乘客歷史數(shù)據(jù)乘客行李的分布規(guī)律乘客行李歷史數(shù)據(jù)利潤(rùn)目標(biāo)數(shù)據(jù)會(huì)話(huà)子系統(tǒng)問(wèn)題111422仿真:決策支持的利器假如你是銀行的
10、經(jīng)理各類(lèi)業(yè)務(wù)分別配置多少人力?這一決策考慮哪些因素?服務(wù)水平、成本、可操作性怎么定量地解決?Demo何謂仿真(1)一個(gè)計(jì)算機(jī)化的模型,模仿(再現(xiàn))真實(shí)系統(tǒng)的運(yùn)行過(guò)程仿真是靜態(tài)的還是動(dòng)態(tài)的?仿真時(shí)鐘仿真能得到什么?用什么來(lái)刻畫(huà)運(yùn)行過(guò)程?聚焦于關(guān)心的管理問(wèn)題:服務(wù)水平、成本隊(duì)長(zhǎng)、等待時(shí)間、員工的數(shù)量、忙閑系統(tǒng)的狀態(tài)變量運(yùn)行過(guò)程 = 狀態(tài)變量隨時(shí)間的變化過(guò)程 何謂仿真(2)怎么模仿?模仿的其實(shí)是系統(tǒng)中實(shí)體的行為(動(dòng)作)顧客的到來(lái)、離去;員工的服務(wù)行為對(duì)系統(tǒng)的狀態(tài)有什么影響?行為改變狀態(tài)理解仿真時(shí)間在推進(jìn),實(shí)體在行動(dòng),狀態(tài)在改變行為、狀態(tài)、時(shí)間是仿真的三要素仿真是如何支持決策的模仿了系統(tǒng)的運(yùn)行過(guò)程之后
11、?評(píng)估了解系統(tǒng)的運(yùn)行過(guò)程,評(píng)估系統(tǒng)在目前狀態(tài)下的性能What-if 分析得到不同配置 (if) 下,系統(tǒng)的性能(What)通過(guò)比較,得到優(yōu)選方案實(shí)驗(yàn)的思想!為什么要仿真直接在實(shí)際系統(tǒng)之上做實(shí)驗(yàn),成本太高、太過(guò)危險(xiǎn),或會(huì)造成太大干擾社會(huì)經(jīng)濟(jì)系統(tǒng),經(jīng)濟(jì)政策、股票市場(chǎng)工程,火箭、危險(xiǎn)品系統(tǒng)相當(dāng)復(fù)雜,數(shù)學(xué)模型無(wú)法提供分析或數(shù)值解如果模型足夠簡(jiǎn)單,采用數(shù)學(xué)工具求解理解、分析或預(yù)測(cè)一些復(fù)雜系統(tǒng)的行為股票泡沫、崩跌DSS案例:公交線(xiàn)路車(chē)輛調(diào)度(1)問(wèn)題描述一條公交線(xiàn)路總共配置多少輛車(chē)?不同的時(shí)間段,發(fā)車(chē)間隔多長(zhǎng)時(shí)間?管理目標(biāo)顧客滿(mǎn)意度顧客在站臺(tái)等待時(shí)間不能太長(zhǎng),如多數(shù)不超過(guò)5分鐘車(chē)內(nèi)不能太擁擠,如人數(shù)不能超
12、過(guò)額定人數(shù)的120%成本固定成本(買(mǎi)車(chē),基本工資),可變成本(燃料,獎(jiǎng)金)DSS案例:公交線(xiàn)路車(chē)輛調(diào)度(2)模型庫(kù)與模型管理子系統(tǒng)問(wèn)題抽象:服務(wù)臺(tái)移動(dòng)的單級(jí)多服務(wù)臺(tái)排隊(duì)系統(tǒng)特殊性,服務(wù)臺(tái)移動(dòng)解決這類(lèi)問(wèn)題可以采用的模型的類(lèi)型數(shù)學(xué)模型:運(yùn)籌學(xué)中的排隊(duì)模型仿真模型(離散事件系統(tǒng)仿真),枚舉,仿真設(shè)計(jì)模型庫(kù)(仿真)主模型:公汽運(yùn)行仿真模型子模型1:乘客到來(lái)(到車(chē)站)模擬模型子模型2:乘客上車(chē)模擬模型子模型3:乘客下車(chē)模擬模型模型管理子系統(tǒng)選擇那種類(lèi)型的模型能有效解決問(wèn)題?數(shù)學(xué)、仿真枚舉、仿真設(shè)計(jì)模型調(diào)用關(guān)系仿真:決策支持的利器系統(tǒng)仿真在計(jì)算機(jī)上模擬真實(shí)系統(tǒng)的運(yùn)行過(guò)程,從而對(duì)系統(tǒng)的性能進(jìn)行評(píng)價(jià)(已知結(jié)構(gòu)
13、、評(píng)價(jià)性能)或?qū)ο到y(tǒng)的結(jié)構(gòu)進(jìn)行設(shè)計(jì)(逆向問(wèn)題、設(shè)計(jì)問(wèn)題)仿真方法設(shè)計(jì)系統(tǒng)結(jié)構(gòu)的兩種方案枚舉法,假定配置方案,運(yùn)行模型,進(jìn)行比較。 缺點(diǎn)是組合數(shù)太多,逐一仿真的工作量極大 仿真設(shè)計(jì),一次運(yùn)行模型,得到配置結(jié)果。配置在運(yùn)行過(guò)程中不斷變化,得到滿(mǎn)意解模型停止運(yùn)行??赡苄枰Y(jié)合遺傳算法等優(yōu)化算法DSS案例:公交線(xiàn)路車(chē)輛調(diào)度(3)數(shù)據(jù)抽取子系統(tǒng)與數(shù)據(jù)庫(kù)子系統(tǒng)需要那些數(shù)據(jù)?車(chē)輛運(yùn)行時(shí)間的概率分布、顧客上車(chē)的概率分布、顧客下車(chē)的概率分布、顧客在站臺(tái)等待時(shí)間的概率分布現(xiàn)有那些數(shù)據(jù)?車(chē)輛運(yùn)行數(shù)據(jù):車(chē)載系統(tǒng),車(chē)輛管理MIS可提供車(chē)輛在各個(gè)區(qū)間運(yùn)行時(shí)間的數(shù)據(jù)顧客上車(chē)的數(shù)據(jù):車(chē)上的刷卡投幣系統(tǒng)可以提供不同時(shí)間段乘客的
14、數(shù)據(jù)顧客下車(chē)的數(shù)據(jù):車(chē)輛上有設(shè)備,自動(dòng)獲取顧客下車(chē)數(shù)據(jù)從內(nèi)外部OLTP中抽取DSS需要的數(shù)據(jù)從現(xiàn)有的系統(tǒng)中,統(tǒng)計(jì)分析得到前三項(xiàng)概率分布這些數(shù)據(jù)足夠么?不夠的話(huà)怎么解決?DSS案例:公交線(xiàn)路車(chē)輛調(diào)度(4)數(shù)據(jù)抽取子系統(tǒng)與數(shù)據(jù)庫(kù)子系統(tǒng)(續(xù))這些數(shù)據(jù)足夠么?不夠的話(huà)怎么解決?難以獲得顧客在站臺(tái)等待時(shí)間的概率分布解決方案外部數(shù)據(jù),調(diào)查調(diào)整管理目標(biāo)如何決策(工作原理)數(shù)據(jù)庫(kù)子系統(tǒng)得到模型的初始參數(shù)運(yùn)行模型庫(kù)子系統(tǒng)的模型,得到結(jié)果通過(guò)會(huì)話(huà)子系統(tǒng)與人交流,不斷調(diào)整,得到方案調(diào)整目標(biāo)、調(diào)整參數(shù)(數(shù)據(jù)庫(kù)子系統(tǒng))、調(diào)整模型(運(yùn)行后隨著數(shù)據(jù)更新,不斷修正方案;考慮季節(jié)性因素,推出特殊方案DSS案例:公交線(xiàn)路車(chē)輛調(diào)度
15、(5)問(wèn)題的拓展公交線(xiàn)路規(guī)劃。開(kāi)辟哪些線(xiàn)路?每條線(xiàn)路發(fā)車(chē)計(jì)劃是什么?鐵路、地鐵、航空等類(lèi)似的問(wèn)題超市、銀行等服務(wù)臺(tái)設(shè)置、醫(yī)院病床設(shè)置,標(biāo)準(zhǔn)排隊(duì)系統(tǒng)問(wèn)題,比公交簡(jiǎn)單思考這種模型導(dǎo)向的DSS的核心是什么?能否得到DSS需要的數(shù)據(jù)DSS與一般的管理科學(xué)模型的區(qū)別之一抽象現(xiàn)實(shí)問(wèn)題,選擇合適的模型存在什么弊端專(zhuān)用系統(tǒng)、相對(duì)獨(dú)立模型合理性、可信度?某些現(xiàn)實(shí)問(wèn)題建模困難案例:現(xiàn)實(shí)世界中人是如何做決策的出租司機(jī)給我上的MBA課要用科學(xué)的方法,統(tǒng)計(jì)學(xué)來(lái)做生意 從現(xiàn)實(shí)數(shù)據(jù)中,總結(jié)分析得到客戶(hù)行為的規(guī)律總結(jié)出來(lái)的規(guī)律用于支持決策兩類(lèi)DSSModel-driven DSS ,模型導(dǎo)向決策支持系統(tǒng)Primarily s
16、tand-alone Uses model to perform “what-if” and other kinds of analysisData-driven DSS,數(shù)據(jù)導(dǎo)向決策支持系統(tǒng)Allows users to extract and analyze useful information from large databases數(shù)據(jù)倉(cāng)庫(kù)、OLAP、數(shù)據(jù)挖掘數(shù)據(jù)導(dǎo)向決策支持系統(tǒng)的結(jié)構(gòu)GDSS群決策支持系統(tǒng) 人機(jī)交互的計(jì)算機(jī)系統(tǒng) 解決半結(jié)構(gòu)化問(wèn)題支持群體(團(tuán)隊(duì)/多人)一起工作硬件:通信軟件:由個(gè)人意見(jiàn)形成群體決策結(jié)果: Electronic questionnaires, brains
17、torming tools, voting tools, etc本講的主要內(nèi)容決策與決策支持系統(tǒng)DSS的結(jié)構(gòu)與工作原理多維數(shù)據(jù)模型數(shù)據(jù)倉(cāng)庫(kù)OLAP、EIS與數(shù)據(jù)可視化數(shù)據(jù)挖掘商業(yè)智能問(wèn)題選擇、連接、匯總、計(jì)算銷(xiāo)售單(銷(xiāo)售單號(hào),銷(xiāo)售時(shí)間,門(mén)店號(hào))銷(xiāo)售明細(xì)(銷(xiāo)售單號(hào),產(chǎn)品編號(hào),銷(xiāo)售量)產(chǎn)品(產(chǎn)品編號(hào),產(chǎn)品名稱(chēng),產(chǎn)品類(lèi)別,單價(jià))門(mén)店(門(mén)店號(hào),門(mén)店名,地址)背景OLTP進(jìn)出倉(cāng)登錄與記賬增加一條新的生產(chǎn)線(xiàn),更改產(chǎn)品單價(jià)更改顧客信用銷(xiāo)售訂單錄入產(chǎn)品數(shù)據(jù)庫(kù)存數(shù)據(jù)銷(xiāo)售數(shù)據(jù)數(shù)據(jù)庫(kù):面向業(yè)務(wù)的數(shù)據(jù)組織事務(wù)處理OLAP產(chǎn)品數(shù)據(jù)顧客數(shù)據(jù)供應(yīng)商數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù):面向主題的數(shù)據(jù)組織每種物料保持多少安全庫(kù)存最佳?上個(gè)月有多少產(chǎn)
18、品的銷(xiāo)售額超過(guò)10000元?決策支持多維模型空調(diào)4季度華中地區(qū)銷(xiāo)售收入100萬(wàn)元時(shí)間維產(chǎn)品維門(mén)店維100銷(xiāo)售收入A型1.5匹變頻空調(diào)4季度街道口店銷(xiāo)售收入10萬(wàn)元多維模型的概念(1)多維數(shù)據(jù)模型用多維結(jié)構(gòu)來(lái)組織數(shù)據(jù)和表示數(shù)據(jù)之間的關(guān)系立方里面是銷(xiāo)售數(shù)據(jù),即數(shù)據(jù)測(cè)量值,稱(chēng)之為度量坐標(biāo)軸是維,維提供了測(cè)量值的上下文關(guān)系。其目的就是為了分析(決策)多維圖形表示是邏輯模型,物理上有多種實(shí)現(xiàn)方法此維非彼維RDB中的維:一行數(shù)據(jù)表示一個(gè)實(shí)體(縱軸),一列數(shù)據(jù)表示實(shí)體的一個(gè)屬性(橫軸)多維DB中的維表示看問(wèn)題(數(shù)據(jù))的角度多維模型的一個(gè)切面(二維),其含義也與RDB不同多維模型的概念(2)維度觀察數(shù)據(jù)的特定
19、角度:時(shí)間、地理、產(chǎn)品維的層次 某個(gè)特定角度(維)在細(xì)節(jié)程度上有不同的描述時(shí)間維:日期、月份、季度、年是數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別。維的成員維的一個(gè)取值稱(chēng)為該維的一個(gè)成員。不同維層次上的取值的組合:某年某月某日度量不同維在某一取值下的交叉點(diǎn),有數(shù)據(jù)有單位事實(shí)維和度量的組合,可用多維數(shù)組來(lái)表示。 星型模型(1)Employee_DimEmployeeKeyEmployeeID.EmployeeKeyTime_DimTimeKey年月季度日期TimeKeyProduct_DimProductKeyProductID產(chǎn)品描述產(chǎn)品目錄目錄描述ProductKeyCustomer_DimC
20、ustomerKeyCustomerID.CustomerKeyShipper_DimShipperKeyShipperID.ShipperKeySales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKey單位(元)金額.TimeKeyCustomerKeyShipperKeyProductKeyEmployeeKeyMultipart KeyMeasuresDimensional Keys事實(shí)表維表星型模型(2)GeographicProductTimeUnits$DimensionTablesGeographicProductTim
21、eFact TableMeasuresFactsDimension星型模型實(shí)例星型模型(1) Facts Month_nrStore_nrSKU_nrSales_revenue. Product SKU_nrSKU_descCategoryLine Time Month_nrMonth_descQuarterYear Geography Store_nr Store_nameCityStateRegion本講的主要內(nèi)容決策與決策支持系統(tǒng)DSS的結(jié)構(gòu)與工作原理多維數(shù)據(jù)模型數(shù)據(jù)倉(cāng)庫(kù)OLAP、EIS與數(shù)據(jù)可視化數(shù)據(jù)挖掘商業(yè)智能數(shù)據(jù)倉(cāng)庫(kù)的定義 一個(gè)面向主題的、集成的、非易失的且隨時(shí)間變化的數(shù)據(jù)集合,用
22、來(lái)支持管理人員做出決策。 數(shù)據(jù)倉(cāng)庫(kù)之父WHInmon是什么?數(shù)據(jù)的集合與數(shù)據(jù)庫(kù)有什么區(qū)別?有什么特點(diǎn)?目的是什么?數(shù)據(jù)倉(cāng)庫(kù)的特征(1) 面向主題(Subject Oriented)的數(shù)據(jù)集合數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)如何組織?面向主題的,指的是它將依據(jù)一定的主題, 匯總各個(gè)OLTP系統(tǒng)的數(shù)據(jù)。 主題是什么關(guān)心的管理問(wèn)題,關(guān)心的領(lǐng)域顧客、供應(yīng)商、產(chǎn)品、銷(xiāo)售 主題要從多個(gè)角度去描述主題的確定是管理上的問(wèn)題,而不僅僅是技術(shù)上的問(wèn)題主題的確定最好要知道客戶(hù)需求,否則可能是白忙活怎么組織多維數(shù)據(jù)模型SalesFinancialInventoryOperational SystemsData WarehouseCu
23、stomerGeographyProductOrganized by processesor tasksOrganized by subjectA subject oriented approach to corporate memorySource: 數(shù)據(jù)倉(cāng)庫(kù)的特征(2)集成(Integrated)的數(shù)據(jù)集合 數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)從哪里來(lái)?多個(gè)異種數(shù)據(jù)源構(gòu)成的,可能包括關(guān)系數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)、文本數(shù)據(jù)庫(kù)、Web數(shù)據(jù)庫(kù)、一般文件等有什么問(wèn)題?格式不統(tǒng)一、數(shù)據(jù)不一致要求對(duì)各個(gè)系統(tǒng)數(shù)據(jù)表示進(jìn)行轉(zhuǎn)換, 用統(tǒng)一編碼表示,比如, A系統(tǒng)用001表示退貨, 而B(niǎo)系統(tǒng)用999表示退貨,在數(shù)據(jù)倉(cāng)庫(kù)中必須統(tǒng)一成
24、一個(gè)編碼。數(shù)據(jù)的抽取/轉(zhuǎn)換/加載(ETL)數(shù)據(jù)倉(cāng)庫(kù)的特征(3)非易失的(Nonvolatile)的數(shù)據(jù)集合指的是數(shù)據(jù)被裝載入以后,系統(tǒng)用戶(hù)只讀數(shù)據(jù),不得修改數(shù)據(jù)。時(shí)變(Time Variant)的數(shù)據(jù)集合數(shù)據(jù)倉(cāng)庫(kù)中包含時(shí)間元素,它所提供的信息總是與時(shí)間相關(guān)聯(lián)的。數(shù)掘倉(cāng)庫(kù)中存儲(chǔ)的是一個(gè)時(shí)間段的數(shù)據(jù),而不僅僅是某一個(gè)時(shí)刻的數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)完整地記錄了各個(gè)歷史時(shí)期的數(shù)據(jù),而OLTP系統(tǒng)不會(huì)保留全部的歷史記錄。數(shù)據(jù)比較DB 操作型數(shù)據(jù)(OLTP) DW分析型數(shù)據(jù)( OLAP)原始數(shù)據(jù) 導(dǎo)出數(shù)據(jù)細(xì)節(jié)數(shù)據(jù) 細(xì)節(jié)+綜合性或提煉性數(shù)據(jù)當(dāng)前數(shù)據(jù) 歷史數(shù)據(jù)可更新 不可更新,但周期性刷新一次處理的數(shù)據(jù)量小 一次處理的
25、數(shù)據(jù)量大面向應(yīng)用,事務(wù)驅(qū)動(dòng) 面向分析,分析驅(qū)動(dòng)面向操作人員,支持日常操作 面向決策人員, 支持管理需要 理解數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)的區(qū)別?數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)當(dāng)然都是裝數(shù)據(jù)的地方,關(guān)鍵的區(qū)別是裝的什么樣的數(shù)據(jù)。數(shù)據(jù)庫(kù)裝的原始數(shù)據(jù),沒(méi)經(jīng)過(guò)任何加工;而數(shù)據(jù)倉(cāng)庫(kù)是為了滿(mǎn)足分析需要,對(duì)源數(shù)據(jù)進(jìn)行了轉(zhuǎn)換過(guò)程,具體是怎樣一個(gè)處理過(guò)程,可以從Bill Inmon的倉(cāng)庫(kù)定義四個(gè)特性進(jìn)行理解。數(shù)據(jù)倉(cāng)庫(kù)在物理上也是數(shù)據(jù)庫(kù),只不過(guò)是多維的為什么要建立數(shù)據(jù)倉(cāng)庫(kù)DB vs. DWH數(shù)據(jù)倉(cāng)庫(kù)的組成部分與流程 1 源數(shù)據(jù) 2 數(shù)據(jù)準(zhǔn)備區(qū)(Staging Area) 3 數(shù)據(jù)倉(cāng)庫(kù)(存儲(chǔ)) 4 決策支持Application D
26、atabasesPackaged application/ERP DataDesktop DataExternal DataWeb-based DataAdapted from SunExpert Magazine, October 1998._INCOME ANNUAL REPORT_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 報(bào)表/查詢(xún)EISOLAP數(shù)據(jù)挖掘抽取轉(zhuǎn)換清洗數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)集市元數(shù)據(jù)加 載數(shù)據(jù)準(zhǔn)備部分(1) 源數(shù)據(jù)部分 內(nèi)部數(shù)據(jù)、外部數(shù)據(jù)多來(lái)源,數(shù)據(jù)庫(kù)(面向業(yè)務(wù)、ER)數(shù)據(jù)準(zhǔn)備部分 把不同數(shù)據(jù)源得到的數(shù)據(jù)修改、轉(zhuǎn)換成適合數(shù)據(jù)分析的格式存儲(chǔ)面向主題、多維、一
27、致抽取、轉(zhuǎn)換和裝載,簡(jiǎn)稱(chēng)為ETL流程 數(shù)據(jù)抽取(data extraction)數(shù)據(jù)抽取是數(shù)據(jù)倉(cāng)庫(kù)按分析主題從業(yè)務(wù)數(shù)據(jù)庫(kù)抽取相關(guān)數(shù)據(jù)的過(guò)程。 抽取全部數(shù)據(jù)么?數(shù)據(jù)準(zhǔn)備部分(2) 數(shù)據(jù)清洗(data cleaning)將錯(cuò)誤的、不一致的數(shù)據(jù)予以更正或刪除。得到準(zhǔn)確的數(shù)據(jù)!數(shù)據(jù)轉(zhuǎn)換(data transformation)將不同格式的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)格式不同的數(shù)據(jù)庫(kù)產(chǎn)品,數(shù)據(jù)類(lèi)型可能不同。eg.時(shí)間格式。得到統(tǒng)一格式的數(shù)據(jù)。數(shù)據(jù)加載(data load)指把清洗后的數(shù)據(jù)裝入數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程。數(shù)據(jù)加載策略包括數(shù)據(jù)加載周期和數(shù)據(jù)追加策略。數(shù)據(jù)存儲(chǔ)部分 (1)3部分:數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市、元數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)
28、的數(shù)據(jù)組織結(jié)構(gòu) 粒度:分析過(guò)程由粗到細(xì)OLAP鉆取、時(shí)間數(shù)據(jù)存儲(chǔ)部分 (2)數(shù)據(jù)集市( data mart )面向企業(yè)中的某個(gè)部門(mén)(主題)而在邏輯上或物理上劃分出來(lái)的數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)子集稱(chēng)為數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)面向整個(gè)企業(yè),而數(shù)據(jù)集市則面向企業(yè)中的某個(gè)部門(mén)目的是減少數(shù)據(jù)處理量,提高處理效率兩種數(shù)據(jù)集市:獨(dú)立的、非獨(dú)立的非獨(dú)立的 (復(fù)制的)數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)某部分主題的復(fù)制品。目的:提高效率、易訪問(wèn)數(shù)據(jù)源于數(shù)據(jù)倉(cāng)庫(kù),要首先建立數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)存儲(chǔ)部分 (3)獨(dú)立的數(shù)據(jù)集市出發(fā)點(diǎn):成本、時(shí)間直接從操作型環(huán)境獲取數(shù)據(jù)每個(gè)數(shù)據(jù)集市都負(fù)責(zé)某個(gè)特定領(lǐng)域的信息集合難點(diǎn):各集市的數(shù)據(jù)一致性問(wèn)題,需要集成元數(shù)據(jù)的規(guī)則Q
29、:多個(gè)獨(dú)立的數(shù)據(jù)集市能代替數(shù)據(jù)倉(cāng)庫(kù)么?Ralph Kimball:數(shù)據(jù)倉(cāng)庫(kù)只不過(guò)是一些數(shù)據(jù)集市的集合而已 Inmon:你可以在大海中捕到很多的小魚(yú)并堆積起來(lái),但它們?nèi)匀徊皇泅L 數(shù)據(jù)存儲(chǔ)部分 (4)數(shù)據(jù)集市具有如下一些優(yōu)點(diǎn) 其成本和企業(yè)數(shù)據(jù)倉(cāng)庫(kù)相比較低(通常在10萬(wàn)-100萬(wàn)美元左右)。實(shí)施的時(shí)間短,通常少于90天。數(shù)據(jù)集市可以在局部進(jìn)行控制而不需要在企業(yè)范圍集中控制,用戶(hù)就有了更多的權(quán)力。數(shù)據(jù)集市比數(shù)據(jù)倉(cāng)庫(kù)包含更少的信息,因此比企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)更容易被瀏覽。數(shù)據(jù)集市允許業(yè)務(wù)單元建立自己的決策支持系統(tǒng)而不需要依靠公司的信息系統(tǒng)部門(mén)。獨(dú)立的數(shù)據(jù)集市可以用于驗(yàn)證開(kāi)發(fā)全面的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)所需資源,這能夠快
30、速實(shí)現(xiàn)收益,投資回報(bào)更快。數(shù)據(jù)存儲(chǔ)部分 (5)元數(shù)據(jù)元數(shù)據(jù)部分是數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)本身信息的數(shù)據(jù)。 從哪里來(lái)?操作型元數(shù)據(jù)。建立數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)與操作型數(shù)據(jù)源的原始數(shù)據(jù)間的聯(lián)系。怎么來(lái)?抽取和轉(zhuǎn)換元數(shù)據(jù)。包含了源數(shù)據(jù)系統(tǒng)的數(shù)據(jù)抽取信息,即抽取頻率、抽取方法和數(shù)據(jù)抽取的商業(yè)規(guī)則。 怎么用?最終用戶(hù)元數(shù)據(jù)。是數(shù)據(jù)倉(cāng)庫(kù)的導(dǎo)航圖,它使最終用戶(hù)可以從數(shù)據(jù)倉(cāng)庫(kù)中找到自己需要的信息。 本講的主要內(nèi)容決策與決策支持系統(tǒng)DSS的結(jié)構(gòu)與工作原理多維數(shù)據(jù)模型數(shù)據(jù)倉(cāng)庫(kù)OLAP、EIS與數(shù)據(jù)可視化數(shù)據(jù)挖掘商業(yè)智能OLAPOLAP:聯(lián)機(jī)分析處理由關(guān)系數(shù)據(jù)庫(kù)之父E.F.Codd于1993年提出的。OLAP理事會(huì)的定義:OLAP是
31、一種軟件技術(shù),它使分析人員能夠迅速、一致、交互地從各個(gè)方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的。這些信息是從原始數(shù)據(jù)直接轉(zhuǎn)換過(guò)來(lái)的,它們以用戶(hù)容易理解的方式反映企業(yè)的真實(shí)狀況。理解OL:OLAP vs. OLTP,復(fù)雜查詢(xún)、快理解分析:OLA P的一個(gè)主要特點(diǎn)是多維數(shù)據(jù)分析OLAP的數(shù)據(jù)源從哪里來(lái)?是什么樣的數(shù)據(jù)?OLAP的12條準(zhǔn)則Codd提出OLAP的12條準(zhǔn)則來(lái)描述OLAP系統(tǒng)準(zhǔn)則1 OLAP模型必須提供多維概念視圖準(zhǔn)則2 透明性準(zhǔn)則準(zhǔn)則3 存取能力推測(cè)準(zhǔn)則4 穩(wěn)定的報(bào)表能力準(zhǔn)則5 客戶(hù)/服務(wù)器體系結(jié)構(gòu)準(zhǔn)則6 維的等同性準(zhǔn)則準(zhǔn)則7 動(dòng)態(tài)的稀疏矩陣處理準(zhǔn)則準(zhǔn)則8 多用戶(hù)支持能力準(zhǔn)則準(zhǔn)則9 非
32、受限的跨維操作準(zhǔn)則10 直觀的數(shù)據(jù)操縱準(zhǔn)則11 靈活的報(bào)表生成準(zhǔn)則12 不受限的維與聚集層次Q4時(shí)間Q1Q2Q3ProductGrapesApplesMelonsCherriesPearsLocationAtlantaDenverDetroitSales Introduction to CubesProductGrapesApplesMelonsCherriesPears產(chǎn)品空調(diào)冰箱洗衣機(jī)彩電小家電地區(qū)華北華中華南SalesOLAP的基本多維分析操作(1) 切片(slice)多維數(shù)據(jù)是由多個(gè)維度組成的,如果在某一維度上選定一個(gè)值,則多維數(shù)據(jù)就從n維下降至n -1維,稱(chēng)多維數(shù)據(jù)的子集(維l,維2
33、,維i-1,維i+1,維n,度量變量)是多維數(shù)據(jù)在維i上切片。 切片操作在給定的數(shù)據(jù)多維模型的一個(gè)維度上進(jìn)行選擇,導(dǎo)致一個(gè)子方(Cube)。比如:可以對(duì)時(shí)間維度按時(shí)間=2002年1月進(jìn)行切片,得到一個(gè)含產(chǎn)品和門(mén)店兩個(gè)緯度的片狀圖。OLAP的基本多維分析操作(2) 切塊(dice)選定多維數(shù)組(維1,維2,維n,度量變量)中的若干維度(圖形顯示最多只能做到3維)的取值范圍,從而形成多維數(shù)據(jù)的子集(維1,維2,a1維i b1,a2 維j b2,a3維k Y 的規(guī)則,其中 X 和 Y 分別代表屬性集合(稱(chēng)為項(xiàng)集),并且 X和Y的交集為空。規(guī)則的支持度表示 X 和 Y 同時(shí)出現(xiàn)的概率,用來(lái)描述該規(guī)則是
34、否具有代表性,即:支持度=P(X, Y)。置信度表示在出現(xiàn) X 的前提下出現(xiàn) Y 的概率,描述規(guī)則成立的可信度。即:置信度= P(Y|X) = P(X, Y)/P(X)age(X,“20-29”) income(X, “20K-30K”) = buys(X,”MP3”)support=2%,confidence=60%數(shù)據(jù)挖掘分類(lèi)(4)關(guān)聯(lián)分析(association analysis)t1: (,面包,牛奶,)t2: (,面包,.)t3: (,面包,牛奶,)t4: ()“面包=牛奶”的支持度=P(面包,牛奶)= 1 / 2 置信度= P(面包,牛奶)/ P(面包)=2/3。 數(shù)據(jù)挖掘分類(lèi)(5
35、)序列模式分析(sequence)序列模式分析和關(guān)聯(lián)分析相似,但側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后(因果)序列關(guān)系。它能發(fā)現(xiàn)數(shù)據(jù)庫(kù)中形如“在某一段時(shí)間內(nèi),顧客購(gòu)買(mǎi)商品A,接著購(gòu)買(mǎi)商品B,而后購(gòu)買(mǎi)商品C,即序列ABC出現(xiàn)的頻度較高”之類(lèi)的知識(shí)顧客購(gòu)房之后,2周內(nèi)有65%的可能性購(gòu)買(mǎi)一臺(tái)新冰箱,一個(gè)月內(nèi)有45%的可能購(gòu)買(mǎi)一臺(tái)新烤箱。在所有購(gòu)買(mǎi)了激光打印機(jī)的人中,半年后80%的人再購(gòu)買(mǎi)新硒鼓,20%的人用舊硒鼓裝碳粉;在所有購(gòu)買(mǎi)了彩色電視機(jī)的人中,有60%的人再購(gòu)買(mǎi)DCD產(chǎn)品數(shù)據(jù)挖掘分類(lèi)(6)序列模式分析(sequence)數(shù)據(jù)挖掘分類(lèi)(7)分類(lèi)分析兩階段:首先給定已有的數(shù)據(jù)和類(lèi)別,通過(guò)分類(lèi)算法得到描述和區(qū)
36、分?jǐn)?shù)據(jù)類(lèi)或概念的分類(lèi)模型。然后,將此分類(lèi)模型應(yīng)用到要進(jìn)行測(cè)試的數(shù)據(jù)上,把未來(lái)或者未知的數(shù)據(jù)劃分到若干已經(jīng)類(lèi)別之中。 銀行部門(mén)根據(jù)以前的數(shù)據(jù)將客戶(hù)分成了不同的類(lèi)別,現(xiàn)在就可以根據(jù)這些來(lái)區(qū)分新申請(qǐng)貸款的客戶(hù),以采取相應(yīng)的貸款方案。方法:分類(lèi)規(guī)則(IF-THEN)、決策樹(shù)(decision trees)、數(shù)學(xué)公式(mathematical formula)和神經(jīng)網(wǎng)絡(luò)等。 應(yīng)用:Call Center數(shù)據(jù)挖掘分類(lèi)(8)聚類(lèi)分析(clustering)按照“物以類(lèi)聚”的原則把一個(gè)數(shù)據(jù)集合按照某個(gè)標(biāo)準(zhǔn)分成幾個(gè)簇的過(guò)程。其結(jié)果使得在每個(gè)簇內(nèi)部的數(shù)據(jù)按照該標(biāo)準(zhǔn)具有很高的相似性,而簇與簇之間的數(shù)據(jù)的相似性很低。
37、 應(yīng)用:顧客定位,然后根據(jù)顧客群特點(diǎn)推出相應(yīng)的產(chǎn)品。如,找出可能會(huì)接受某銀行卡的群體,數(shù)據(jù)挖掘分類(lèi)(9)分類(lèi)和聚類(lèi)的區(qū)別分類(lèi)是指將數(shù)據(jù)歸于一系列已知類(lèi)別之中的某個(gè)類(lèi)的分類(lèi)過(guò)程; 分類(lèi)是有指導(dǎo)的類(lèi)別劃分,在若干先驗(yàn)標(biāo)準(zhǔn)的指導(dǎo)下進(jìn)行,效果好壞取決于標(biāo)準(zhǔn)選取的好壞。 聚類(lèi)是無(wú)監(jiān)督學(xué)習(xí),根據(jù)客體屬性對(duì)一系列未分類(lèi)的客體進(jìn)行類(lèi)別的識(shí)別, 把一組個(gè)體按照相似性歸成若干類(lèi)。數(shù)據(jù)挖掘分類(lèi)(10)異常檢測(cè)(anomaly detection,偏差分析)從數(shù)據(jù)分析中發(fā)現(xiàn)異常情況信用卡欺詐檢測(cè)演化分析對(duì)隨時(shí)間變化的數(shù)據(jù)對(duì)象的變化規(guī)律和趨勢(shì)進(jìn)行建模描述。 利用歷史數(shù)據(jù)找出變化規(guī)律,建立模型,并用此模型來(lái)預(yù)測(cè)未來(lái)數(shù)據(jù)的
38、種類(lèi),特征等 典型方法就是回歸分析。數(shù)據(jù)挖掘解決的應(yīng)用數(shù)據(jù)挖掘技術(shù)從一開(kāi)始就是面向應(yīng)用的尤其是在如銀行、電信、保險(xiǎn)、交通、零售(如超級(jí)市場(chǎng))等商業(yè)領(lǐng)域應(yīng)用廣泛。數(shù)據(jù)挖掘所能解決的典型商業(yè)問(wèn)題包括數(shù)據(jù)庫(kù)營(yíng)銷(xiāo)(Database Marketing)客戶(hù)群體劃分(Customer Segmentation & Classification)背景分析(Pro)交叉銷(xiāo)售(Cross-selling)等市場(chǎng)分析行為以及客戶(hù)流失性分析(Churn Analysis)客戶(hù)信用記分(Credit Scoring)欺詐發(fā)現(xiàn)(Fraud Detection)典型案例哪些商品放在一起比較好賣(mài)?庫(kù)存預(yù)測(cè) 預(yù)測(cè)在未來(lái)一周
39、內(nèi)一本書(shū)是否將脫銷(xiāo)股票分析 通過(guò)相關(guān)分析,可以找出一支股票的走勢(shì)與另一只股票走勢(shì)的潛在規(guī)律 “如果微軟的股票下跌4%,那么IBM的股票將在兩周內(nèi)下跌5%”體育競(jìng)技:NBA教練如何布陣以提升獲勝機(jī)會(huì)? 出了一個(gè)新成品,哪些老客戶(hù)最可能購(gòu)買(mǎi)?電子商務(wù)網(wǎng)站公共頁(yè)面該放哪些內(nèi)容最可能產(chǎn)生購(gòu)買(mǎi)行為? 登錄網(wǎng)站的當(dāng)前用戶(hù)現(xiàn)在最可能購(gòu)買(mǎi)什么東西?典型案例(1):哪些商品放在一起比較好賣(mài)?這是沃爾瑪?shù)慕?jīng)典案例:一般看來(lái),啤酒和尿布是顧客群完全不同的商品。但是沃爾瑪一年內(nèi)數(shù)據(jù)挖掘的結(jié)果顯示在居民區(qū)中尿布賣(mài)得好的店面啤酒也賣(mài)得很好原因其實(shí)很簡(jiǎn)單,一般太太讓先生下樓買(mǎi)尿布的時(shí)候,先生們一般都會(huì)犒勞自己兩聽(tīng)啤酒。因此
40、啤酒和尿布一起購(gòu)買(mǎi)的機(jī)會(huì)是最多的。這是一個(gè)現(xiàn)代商場(chǎng)智能化信息分析系統(tǒng)發(fā)現(xiàn)的秘密。這個(gè)故事被公認(rèn)是商業(yè)領(lǐng)域數(shù)據(jù)挖掘的誕生。另外,大家都知道在沃爾瑪牙膏的旁邊通常配備牙刷,在貨價(jià)上這樣放置,牙膏和牙刷才能都賣(mài)的很好。關(guān)聯(lián)分析典型案例(2):庫(kù)存預(yù)測(cè)過(guò)去零售商依靠供應(yīng)鏈軟件、內(nèi)部分析軟件甚至直覺(jué)來(lái)預(yù)測(cè)庫(kù)存需求。隨著競(jìng)爭(zhēng)壓力的一天天增大,很多零售商(從主要財(cái)務(wù)主管到庫(kù)存管理員)都開(kāi)始致力于找到一些更準(zhǔn)確的方法來(lái)預(yù)測(cè)其連鎖商店應(yīng)保有的庫(kù)存。預(yù)測(cè)分析是一種解決方案。它能夠準(zhǔn)確預(yù)測(cè)哪些商店位置應(yīng)該保持哪些產(chǎn)品使用 Microsoft(R) SQL Server(TM) 2005 中的 Analysis Se
41、rvices 以及 SQL Server 數(shù)據(jù)倉(cāng)庫(kù),采用數(shù)據(jù)挖掘技術(shù)可以為產(chǎn)品存儲(chǔ)決策提供準(zhǔn)確及時(shí)的信息。SQL Server 2005 Analysis Services 獲得的數(shù)據(jù)挖掘模型可以預(yù)測(cè)在未來(lái)一周內(nèi)一本書(shū)是否將脫銷(xiāo),準(zhǔn)確性為 98.52%。平均來(lái)說(shuō),預(yù)測(cè)該書(shū)是否將在未來(lái)兩周內(nèi)脫銷(xiāo)的準(zhǔn)確性為 86.45%。詳情見(jiàn) 典型案例(3):股票預(yù)設(shè)預(yù)測(cè)一支股票的走勢(shì)幾乎是不可能,但是通過(guò)相關(guān)分析,可以找出一支股票的走勢(shì)與另一只股票走勢(shì)的潛在規(guī)律,比如數(shù)據(jù)挖掘曾經(jīng)得到過(guò)這個(gè)結(jié)論:“如果微軟的股票下跌4%,那么IBM的股票將在兩周內(nèi)下跌5%”。 典型案例(4):NBA教練如何布陣以提升獲勝機(jī)會(huì)?
42、大約20個(gè)NBA球隊(duì)使用了IBM公司開(kāi)發(fā)的數(shù)據(jù)挖掘應(yīng)用軟件Advanced Scout系統(tǒng)來(lái)優(yōu)化他們的戰(zhàn)術(shù)組合。 教練們可以完全沒(méi)有統(tǒng)計(jì)學(xué)的培訓(xùn),但他們可以利用數(shù)據(jù)挖掘制定策略。例如Scout就因?yàn)檠芯苛四g(shù)隊(duì)隊(duì)員不同的布陣安排,在與邁阿密熱隊(duì)的比賽中找到了獲勝的機(jī)會(huì)。系統(tǒng)分析顯示魔術(shù)隊(duì)先發(fā)陣容中的兩個(gè)后衛(wèi)安佛尼.哈德衛(wèi)和伯蘭.紹在前兩場(chǎng)中被評(píng)為-17分,這意味著他倆在場(chǎng)上,本隊(duì)輸?shù)舻姆謹(jǐn)?shù)比得到的分?jǐn)?shù)多17分。然而,當(dāng)哈德衛(wèi)與替補(bǔ)后衛(wèi)達(dá)利爾.阿姆斯創(chuàng)組合時(shí),魔術(shù)隊(duì)得分為正14分。在下一場(chǎng)中,魔術(shù)隊(duì)增加了阿姆斯創(chuàng)的上場(chǎng)時(shí)間。此著果然見(jiàn)效:阿姆斯創(chuàng)得了21分,哈德衛(wèi)得了42分,魔術(shù)隊(duì)以88比79獲
43、勝。魔術(shù)隊(duì)在第四場(chǎng)讓阿姆斯創(chuàng)進(jìn)入先發(fā)陣容,再一次打敗了熱隊(duì)。在第五場(chǎng)比賽中,這個(gè)靠數(shù)據(jù)挖掘支持的陣容沒(méi)能拖住熱隊(duì),但Advanced Scout畢竟幫助了魔術(shù)隊(duì)贏得了打滿(mǎn)5場(chǎng),直到最后才決出勝負(fù)的機(jī)會(huì)。 典型案例(5):出了一個(gè)新產(chǎn)品,哪些老客戶(hù)最可能購(gòu)買(mǎi)?加拿大蒙特利爾銀行采用 IBM DB2 Intelligent Miner Scoring,基于銀行賬戶(hù)余額、客戶(hù)已擁有的銀行產(chǎn)品以及所處地點(diǎn)和信貸風(fēng)險(xiǎn)等標(biāo)準(zhǔn)來(lái)評(píng)價(jià)記錄檔案。這些評(píng)價(jià)可用于確定客戶(hù)購(gòu)買(mǎi)某一具體產(chǎn)品的可能性。我們對(duì)客戶(hù)的財(cái)務(wù)行為習(xí)慣及其對(duì)銀行收益率的影響有了更深入的了解?,F(xiàn)在,當(dāng)進(jìn)行更具針對(duì)性的營(yíng)銷(xiāo)活動(dòng)時(shí),銀行能夠區(qū)別對(duì)待不同的客戶(hù)群,以提升產(chǎn)品和服務(wù)質(zhì)量,同時(shí)還能制訂適當(dāng)?shù)膬r(jià)格和設(shè)計(jì)各種獎(jiǎng)勵(lì)方案,甚至確定利息費(fèi)用?!懊商乩麪栥y行的數(shù)據(jù)挖掘工具為管理人員提供了大量信息,從而幫助他們對(duì)于從營(yíng)銷(xiāo)到產(chǎn)品設(shè)計(jì)的任何事情進(jìn)行決策。典型案例(7):登錄網(wǎng)站的當(dāng)前用戶(hù)現(xiàn)在最可能購(gòu)買(mǎi)什么東西空調(diào)制造廠商開(kāi)利(Carrier)公司-聲稱(chēng),僅僅通過(guò)利用郵政編碼數(shù)據(jù),其升級(jí)版 B2C 網(wǎng)站的每位訪問(wèn)者所產(chǎn)生的平均收益在一個(gè)月內(nèi)從 1.47 美元提高到了 37.42 美元。當(dāng)客戶(hù)登錄網(wǎng)站時(shí),系統(tǒng)將指示他們提供郵政編碼。這些郵政編碼信息將被發(fā)送到數(shù)據(jù)挖掘WebMiner 服務(wù)器。然后,WebMiner
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 長(zhǎng)春早期教育職業(yè)學(xué)院《教學(xué)理論與實(shí)踐》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025屆廣東省實(shí)驗(yàn)中學(xué)高三2月英語(yǔ)試題模擬試題含解析
- 公園管養(yǎng)設(shè)備分類(lèi)
- 公共交通服務(wù)質(zhì)量投訴調(diào)查處理制度
- 中等職業(yè)學(xué)校美容專(zhuān)業(yè)畢業(yè)學(xué)生問(wèn)卷調(diào)查
- 2025年中考語(yǔ)文名著閱讀考點(diǎn)演練《駱駝祥子》:圈點(diǎn)批注(七年級(jí)下) 答案版
- 杜甫詩(shī)的藝術(shù)風(fēng)格
- 專(zhuān)項(xiàng)施工方案實(shí)施要點(diǎn)
- 物業(yè)水泵檢修方案范本
- 【附答案】熔化焊接與熱切割考試試題
- 2025年合肥公交集團(tuán)有限公司駕駛員招聘180人預(yù)筆試參考題庫(kù)附帶答案詳解
- 2025年蘇州市職業(yè)大學(xué)單招職業(yè)適應(yīng)性測(cè)試題庫(kù)完美版
- (二模)2025年寶雞市高考模擬檢測(cè)試題(二)物理試卷(含答案)
- 營(yíng)銷(xiāo)管理實(shí)踐總結(jié)報(bào)告
- 基地種植合作合同范本
- 露天煤礦安全生產(chǎn)技術(shù)露天煤礦安全管理培訓(xùn)
- 【2025年衛(wèi)生健康宣傳日】世界防治結(jié)核病日
- 新版《醫(yī)療器械經(jīng)營(yíng)質(zhì)量管理規(guī)范》(2024)培訓(xùn)試題及答案
- 2025年人教版數(shù)學(xué)五年級(jí)下冊(cè)教學(xué)計(jì)劃(含進(jìn)度表)
- 2025年初級(jí)社會(huì)工作者綜合能力全國(guó)考試題庫(kù)(含答案)
- 2024年全國(guó)國(guó)家版圖知識(shí)競(jìng)賽題庫(kù)及答案(中小學(xué)組)
評(píng)論
0/150
提交評(píng)論