商務(wù)智能 課件_第1頁(yè)
商務(wù)智能 課件_第2頁(yè)
商務(wù)智能 課件_第3頁(yè)
商務(wù)智能 課件_第4頁(yè)
商務(wù)智能 課件_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

北京科技大學(xué)5.1什么是數(shù)據(jù)挖掘?5.2數(shù)據(jù)挖掘能做什么事?—

數(shù)據(jù)挖掘的任務(wù)!5數(shù)據(jù)分析層面的商務(wù)智能-數(shù)據(jù)挖掘北京科技大學(xué)5.1什么是數(shù)據(jù)挖掘?(1)啤酒與尿布的故事(小案例)某大型超市發(fā)現(xiàn)每到周末,啤酒與尿布的銷(xiāo)量就會(huì)同時(shí)大增,這是什么原因呢?購(gòu)物籃北京科技大學(xué)(1)啤酒與尿布的故事(小案例)-續(xù)這是沃爾瑪利用NCR自動(dòng)數(shù)據(jù)挖掘工具(模式識(shí)別軟件)對(duì)一年多詳細(xì)的原始交易數(shù)據(jù)進(jìn)行分析和挖掘后的一個(gè)意外發(fā)現(xiàn):跟尿布一起購(gòu)買(mǎi)最多的商品竟是啤酒!沃爾瑪因此就在其商店里將它們并排擺放在一起,結(jié)果是尿布與啤酒的銷(xiāo)售量雙雙增長(zhǎng)。經(jīng)過(guò)研究人員分析發(fā)現(xiàn),原來(lái)家里的太太們讓丈夫們?nèi)コ薪o孩子買(mǎi)尿布,而丈夫們?cè)谫I(mǎi)尿布的時(shí)候往往順便買(mǎi)上幾瓶啤酒回去喝。這樣就產(chǎn)生了這個(gè)比較奇怪的現(xiàn)象。數(shù)據(jù)挖掘?qū)?shù)據(jù)挖掘結(jié)果的解釋分析5.1什么是數(shù)據(jù)挖掘?北京科技大學(xué)(2)KDD與數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD)一詞的第一次出現(xiàn)是在1989年8月在美國(guó)底特律召開(kāi)的第11屆國(guó)際人工智能聯(lián)合會(huì)議的專(zhuān)題討論會(huì)上。

數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)是從數(shù)據(jù)集中識(shí)別有效的、新穎的、潛在有用的,以及最終可理解模式的非平凡處理過(guò)程。5.1什么是數(shù)據(jù)挖掘?北京科技大學(xué)KDD是一個(gè)交互式、循環(huán)反復(fù)的整體過(guò)程,除了包括數(shù)據(jù)挖掘外,還包括數(shù)據(jù)的預(yù)處理和對(duì)所發(fā)現(xiàn)的結(jié)果進(jìn)行解釋評(píng)估等諸多環(huán)節(jié)。數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)中專(zhuān)門(mén)負(fù)責(zé)發(fā)現(xiàn)知識(shí)的核心環(huán)節(jié)。數(shù)據(jù)挖掘KDD5.1什么是數(shù)據(jù)挖掘?北京科技大學(xué)KDD的過(guò)程可視化數(shù)據(jù)準(zhǔn)備數(shù)據(jù)挖掘解釋評(píng)估數(shù)據(jù)庫(kù)待挖掘數(shù)據(jù)抽取的信息有用的知識(shí)5.1什么是數(shù)據(jù)挖掘?北京科技大學(xué)(3)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘數(shù)據(jù)倉(cāng)庫(kù)為數(shù)據(jù)挖掘提供了更廣闊的空間。數(shù)據(jù)倉(cāng)庫(kù)完成了數(shù)據(jù)的收集、集成、存儲(chǔ)、管理等工作,數(shù)據(jù)挖掘面對(duì)的是經(jīng)過(guò)初步加工的數(shù)據(jù),使得數(shù)據(jù)挖掘能更專(zhuān)注于知識(shí)的發(fā)現(xiàn)。另一方面,由于數(shù)據(jù)倉(cāng)庫(kù)所具有的新的特點(diǎn),又對(duì)數(shù)據(jù)挖掘技術(shù)提出了更高的要求。數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)結(jié)合起來(lái),能夠更充分地發(fā)揮潛力。

5.1什么是數(shù)據(jù)挖掘?北京科技大學(xué)

數(shù)據(jù)倉(cāng)庫(kù)中集成和存儲(chǔ)著來(lái)自若干異構(gòu)數(shù)據(jù)源的信息,這就要求其數(shù)據(jù)挖掘的算法必須更有效、更快速。數(shù)據(jù)倉(cāng)庫(kù)對(duì)數(shù)據(jù)挖掘技術(shù)提出的更高要求

數(shù)據(jù)倉(cāng)庫(kù)中的長(zhǎng)時(shí)間歷史數(shù)據(jù)在時(shí)間軸上的特征,在一定程度上增加了數(shù)據(jù)挖掘的難度。數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展對(duì)數(shù)據(jù)挖掘提出了更高的要求5.1什么是數(shù)據(jù)挖掘?北京科技大學(xué)5.2數(shù)據(jù)挖掘能做什么事?—

數(shù)據(jù)挖掘的任務(wù)!聚類(lèi)分析分類(lèi)發(fā)現(xiàn)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)序列模式發(fā)現(xiàn)……數(shù)據(jù)挖掘的任務(wù)北京科技大學(xué)(1)聚類(lèi)分析1)聚類(lèi)分析的內(nèi)涵

聚類(lèi)任務(wù)用于發(fā)現(xiàn)在數(shù)據(jù)庫(kù)中未知的對(duì)象類(lèi)。這種對(duì)象類(lèi)劃分的依據(jù)是“物以類(lèi)聚”,即考察個(gè)體或數(shù)據(jù)對(duì)象間的相似性,滿(mǎn)足相似性條件的個(gè)體或數(shù)據(jù)對(duì)象劃分在一組內(nèi),不滿(mǎn)足相似性條件的個(gè)體或數(shù)據(jù)對(duì)象劃分在不同的組。在聚類(lèi)之前,對(duì)象類(lèi)劃分的數(shù)量與類(lèi)型均是未知的,因此在數(shù)據(jù)挖掘后一般需要對(duì)數(shù)據(jù)挖掘結(jié)果進(jìn)行合理的分析與解釋。5.2

數(shù)據(jù)挖掘的任務(wù)——

聚類(lèi)分析北京科技大學(xué)例如:聚類(lèi)分析能幫助市場(chǎng)分析人員從客戶(hù)的基本庫(kù)中發(fā)現(xiàn)不同的客戶(hù)群;可以根據(jù)房子的類(lèi)型、價(jià)值和地理位置對(duì)一個(gè)城市中的房屋進(jìn)行分組;還能對(duì)Web上的文檔進(jìn)行分類(lèi)等等。2)聚類(lèi)分析的一般應(yīng)用模式識(shí)別空間數(shù)據(jù)分析圖像處理經(jīng)濟(jì)科學(xué)網(wǎng)絡(luò)

5.2

數(shù)據(jù)挖掘的任務(wù)——

聚類(lèi)分析北京科技大學(xué)3)數(shù)據(jù)挖掘應(yīng)用對(duì)聚類(lèi)分析算法的要求處理不同類(lèi)型屬性的能力發(fā)現(xiàn)任意形狀的聚類(lèi)

用于決定輸入?yún)?shù)的領(lǐng)域知識(shí)最小化處理噪聲數(shù)據(jù)的能力對(duì)于輸入數(shù)據(jù)的順序不敏感處理高維屬性數(shù)據(jù)的能力結(jié)合用戶(hù)特定的約束結(jié)果可解釋性和可用性5.2

數(shù)據(jù)挖掘的任務(wù)——

聚類(lèi)分析北京科技大學(xué)4)什么是好的聚類(lèi)方法?好的聚類(lèi)方法將產(chǎn)生高質(zhì)量的類(lèi),即在類(lèi)的內(nèi)部具有高的相似度,而類(lèi)間具有低的相似度。聚類(lèi)方法的質(zhì)量依賴(lài)于所選用的相似度計(jì)算方法和該方法的實(shí)現(xiàn)情況質(zhì)量聚類(lèi)方法的質(zhì)量也取決于它發(fā)現(xiàn)隱藏模式的能力5.2

數(shù)據(jù)挖掘的任務(wù)——

聚類(lèi)分析北京科技大學(xué)5)聚類(lèi)分析方法的分類(lèi)分割聚類(lèi)方法

1層次聚類(lèi)方法2基于網(wǎng)格的聚類(lèi)方法4基于密度的聚類(lèi)方法35.2

數(shù)據(jù)挖掘的任務(wù)——

聚類(lèi)分析北京科技大學(xué)算法步驟:首先隨機(jī)地選擇k個(gè)對(duì)象,每個(gè)對(duì)象作為一個(gè)類(lèi)的“中心”,分別代表將分成的k個(gè)類(lèi);根據(jù)距離“中心”最近的原則,尋找與各對(duì)象最為相似的類(lèi),將其他對(duì)象分配到各個(gè)相應(yīng)的類(lèi)中;在完成對(duì)象的分配之后,針對(duì)每個(gè)類(lèi),計(jì)算其所有對(duì)象的平均值,作為該類(lèi)新的“中心”;根據(jù)距離“中心”最近的原則,重新進(jìn)行所有對(duì)象到各個(gè)相應(yīng)類(lèi)的分配;返回步驟3,直到?jīng)]有變化為止。

聚類(lèi)算法例——k-平均算法

k-平均算法屬于分割聚類(lèi)方法。5.2

數(shù)據(jù)挖掘的任務(wù)——

聚類(lèi)分析北京科技大學(xué)有10個(gè)對(duì)象xi,,描述每一個(gè)對(duì)象的屬性為xi1,xi2,取值如下表。設(shè)定聚類(lèi)個(gè)數(shù)為k=2。這里我們采用歐幾里德距離進(jìn)行距離的計(jì)算。x1x2x3x4x5x6x7x8x9x10xi24665843823k-平均聚類(lèi)算法數(shù)值例子北京科技大學(xué)01234567812345678x8x9x10x1x3x5x2x4x6x7xi1xi2k-平均聚類(lèi)算法數(shù)值例子北京科技大學(xué)“數(shù)據(jù)(對(duì)象)對(duì)”聚類(lèi)問(wèn)題的實(shí)際背景

電信客戶(hù)聚類(lèi)分析問(wèn)題聚類(lèi)問(wèn)題的擴(kuò)展—數(shù)據(jù)對(duì)聚類(lèi)問(wèn)題北京科技大學(xué)“數(shù)據(jù)(對(duì)象)對(duì)”聚類(lèi)問(wèn)題的本質(zhì)電信客戶(hù)聚類(lèi)分析問(wèn)題說(shuō)明,在實(shí)際情況中存在這樣一種數(shù)據(jù)情況:實(shí)際業(yè)務(wù)數(shù)據(jù)中,每條記錄標(biāo)明了兩個(gè)的對(duì)象,這兩個(gè)對(duì)象具有關(guān)聯(lián)關(guān)系(以下稱(chēng)為“數(shù)據(jù)對(duì)”),實(shí)際問(wèn)題要求我們?cè)趦蓚€(gè)關(guān)聯(lián)對(duì)象的基礎(chǔ)上,尋找更多具有關(guān)聯(lián)關(guān)系的對(duì)象群體。聚類(lèi)問(wèn)題的擴(kuò)展—數(shù)據(jù)對(duì)聚類(lèi)問(wèn)題北京科技大學(xué)數(shù)據(jù)對(duì)聚類(lèi)與傳統(tǒng)聚類(lèi)問(wèn)題的差異

聚類(lèi)對(duì)象不同—類(lèi)和對(duì)象間的關(guān)系不同-傳統(tǒng)聚類(lèi)問(wèn)題的聚類(lèi)對(duì)象是獨(dú)立對(duì)象!-“數(shù)據(jù)對(duì)”聚類(lèi)問(wèn)題的聚類(lèi)對(duì)象是相互關(guān)聯(lián)的“對(duì)象對(duì)”!-傳統(tǒng)聚類(lèi)得到的“類(lèi)”中:每個(gè)對(duì)象只能屬于一個(gè)類(lèi)!-“數(shù)據(jù)對(duì)”聚類(lèi)得到的“類(lèi)”中:一個(gè)對(duì)象可能屬于多個(gè)類(lèi)(由“對(duì)象對(duì)”構(gòu)成的“類(lèi)”)!聚類(lèi)問(wèn)題的擴(kuò)展—數(shù)據(jù)對(duì)聚類(lèi)問(wèn)題北京科技大學(xué)在社會(huì)網(wǎng)絡(luò)中,聚類(lèi)對(duì)象包含更多基本對(duì)象(如每個(gè)家庭),聚類(lèi)結(jié)果是一個(gè)個(gè)“社團(tuán)”。社會(huì)網(wǎng)絡(luò)分析的研究應(yīng)用,將導(dǎo)致對(duì)傳統(tǒng)系統(tǒng)論的革命性發(fā)展!聚類(lèi)問(wèn)題的擴(kuò)展—社會(huì)網(wǎng)絡(luò)分析北京科技大學(xué)(2)分類(lèi)發(fā)現(xiàn)1)分類(lèi)發(fā)現(xiàn)的目的分類(lèi)發(fā)現(xiàn)的目的是構(gòu)造一個(gè)分類(lèi)函數(shù)或分類(lèi)模型(也稱(chēng)作分類(lèi)器),通過(guò)分類(lèi)函數(shù),把數(shù)據(jù)庫(kù)中的元組映射到給定類(lèi)別中的某一個(gè),即要發(fā)現(xiàn)一些指定的商品或事件是否屬于某一特定數(shù)據(jù)子集的規(guī)則。

5.2

數(shù)據(jù)挖掘的任務(wù)——

分類(lèi)發(fā)現(xiàn)北京科技大學(xué)2)分類(lèi)發(fā)現(xiàn)的處理過(guò)程第一階段第二階段分類(lèi)模型的建立該階段也稱(chēng)監(jiān)督學(xué)習(xí),數(shù)據(jù)類(lèi)別是事先已知的,需要做的工作是通過(guò)分析訓(xùn)練樣本數(shù)據(jù)總結(jié)出一般性的分類(lèi)規(guī)則,建立分類(lèi)模型。分類(lèi)模型的應(yīng)用應(yīng)用分類(lèi)模型前,需要對(duì)建立的模型進(jìn)行評(píng)估,在確保分類(lèi)模型的準(zhǔn)確性及精確度的情況下,才能運(yùn)用該分類(lèi)模型對(duì)未知其類(lèi)別的數(shù)據(jù)樣本進(jìn)行分類(lèi)處理。5.2

數(shù)據(jù)挖掘的任務(wù)——

分類(lèi)發(fā)現(xiàn)北京科技大學(xué)分類(lèi)發(fā)現(xiàn)的處理過(guò)程——第一階段訓(xùn)練集分析分類(lèi)器建立的模型矩形是黃色圓形是紅色三角是綠色2)分類(lèi)發(fā)現(xiàn)的處理過(guò)程北京科技大學(xué)分類(lèi)發(fā)現(xiàn)的處理過(guò)程——第二階段數(shù)據(jù)庫(kù)紅色圖形黃色圖形綠色圖形分類(lèi)器已建立的模型沒(méi)有分辨顏色的圖形2)分類(lèi)發(fā)現(xiàn)的處理過(guò)程北京科技大學(xué)3)分類(lèi)模型的評(píng)估標(biāo)準(zhǔn)預(yù)測(cè)準(zhǔn)確性描述的簡(jiǎn)潔性計(jì)算復(fù)雜性模型強(qiáng)健性處理規(guī)模性

5.2

數(shù)據(jù)挖掘的任務(wù)——

分類(lèi)發(fā)現(xiàn)北京科技大學(xué)4)分類(lèi)發(fā)現(xiàn)的主要方法

基于決策樹(shù)模型的數(shù)據(jù)分類(lèi)——ID3算法1基于統(tǒng)計(jì)模型的數(shù)據(jù)分類(lèi)——貝葉斯分類(lèi)2基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)分類(lèi)35.2

數(shù)據(jù)挖掘的任務(wù)——

分類(lèi)發(fā)現(xiàn)北京科技大學(xué)5)分類(lèi)發(fā)現(xiàn)規(guī)則提取的實(shí)例利用決策樹(shù)模型對(duì)某鋼鐵公司的歷史銷(xiāo)售數(shù)據(jù)進(jìn)行分析。銷(xiāo)售時(shí)間銷(xiāo)售地區(qū)*銷(xiāo)售產(chǎn)品客戶(hù)行業(yè)*銷(xiāo)售渠道*利潤(rùn)行數(shù)2000年華中薄板冶金直銷(xiāo)高2002000年華東管材冶金直銷(xiāo)高5102000年華中圓鋼機(jī)電分銷(xiāo)中3002000年華南線材電力直銷(xiāo)低502000年華東線材電力分銷(xiāo)低600…………………2000年華中薄板電力直銷(xiāo)中802000年華中薄板電力直銷(xiāo)高320注:*代表對(duì)應(yīng)的屬性為決策屬性注:行數(shù)代表滿(mǎn)足各行要求的記錄個(gè)數(shù)5.2

數(shù)據(jù)挖掘的任務(wù)——

分類(lèi)發(fā)現(xiàn)北京科技大學(xué)應(yīng)用ID3算法得到的決策樹(shù)直銷(xiāo)分銷(xiāo)華中華東冶金電力銷(xiāo)售地區(qū)華中低中高高銷(xiāo)售地區(qū)客戶(hù)行業(yè)銷(xiāo)售渠道5.2

數(shù)據(jù)挖掘的任務(wù)——

分類(lèi)發(fā)現(xiàn)北京科技大學(xué)利用決策樹(shù)提取分類(lèi)規(guī)則(用“IF-THEN”的形式表示)直銷(xiāo)分銷(xiāo)華中華東冶金電力銷(xiāo)售地區(qū)華中低中高高銷(xiāo)售地區(qū)客戶(hù)行業(yè)銷(xiāo)售渠道規(guī)則1:IF銷(xiāo)售渠道=“直銷(xiāo)”and客戶(hù)行業(yè)=“冶金”THEN銷(xiāo)售業(yè)務(wù)屬于“高”利潤(rùn)規(guī)則2:IF銷(xiāo)售渠道=“直銷(xiāo)”and客戶(hù)行業(yè)=“電力”and銷(xiāo)售地區(qū)=“華中”THEN銷(xiāo)售業(yè)務(wù)屬于“高”利潤(rùn)規(guī)則3:IF銷(xiāo)售渠道=“分銷(xiāo)”and銷(xiāo)售地區(qū)=“華中”THEN銷(xiāo)售業(yè)務(wù)屬于“中”利潤(rùn)規(guī)則4:IF銷(xiāo)售渠道=“分銷(xiāo)”and銷(xiāo)售地區(qū)=“華東”THEN銷(xiāo)售業(yè)務(wù)屬于“低”利潤(rùn)5.2

數(shù)據(jù)挖掘的任務(wù)——

分類(lèi)發(fā)現(xiàn)北京科技大學(xué)(3)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)1)關(guān)聯(lián)規(guī)則的含義關(guān)聯(lián)規(guī)則是指大量數(shù)據(jù)中項(xiàng)集之間有趣(價(jià)值)的關(guān)聯(lián)或相關(guān)聯(lián)系。前面提到的“啤酒與尿布”的故事就是關(guān)聯(lián)規(guī)則的一個(gè)典型例子。這也成為零售商的貨籃分析,其通過(guò)發(fā)現(xiàn)顧客放入其貨籃中不同商品、即不同項(xiàng)之間的聯(lián)系,分析顧客的購(gòu)買(mǎi)習(xí)慣。通過(guò)了解哪些商品頻繁地被顧客同時(shí)購(gòu)買(mǎi),分析得到商品之間的關(guān)聯(lián),這種關(guān)聯(lián)的發(fā)現(xiàn)可以幫助零售商制定營(yíng)銷(xiāo)策略。

5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)2)描述關(guān)聯(lián)規(guī)則的參數(shù)關(guān)鍵參數(shù)作用度期望可信度支持度可信度5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)描述關(guān)聯(lián)規(guī)則的參數(shù)-支持度商場(chǎng)10個(gè)顧客同時(shí)購(gòu)買(mǎi)錘子和釘子顧客購(gòu)買(mǎi)錘子

顧客購(gòu)買(mǎi)釘子的關(guān)聯(lián)規(guī)則的支持度為10%100個(gè)顧客去商場(chǎng)購(gòu)買(mǎi)東西5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)商場(chǎng)20個(gè)顧客購(gòu)買(mǎi)了錘子顧客購(gòu)買(mǎi)錘子

顧客購(gòu)買(mǎi)釘子的關(guān)聯(lián)規(guī)則的可信度為50%100個(gè)顧客去商場(chǎng)購(gòu)買(mǎi)東西其中10個(gè)顧客又購(gòu)買(mǎi)了釘子描述關(guān)聯(lián)規(guī)則的參數(shù)-可信度5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)商場(chǎng)20個(gè)顧客購(gòu)買(mǎi)了釘子顧客購(gòu)買(mǎi)錘子

顧客購(gòu)買(mǎi)釘子的關(guān)聯(lián)規(guī)則的期望可信度為20%100個(gè)顧客去商場(chǎng)購(gòu)買(mǎi)東西描述關(guān)聯(lián)規(guī)則的參數(shù)-期望可信度5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)作用度是可信度和期望可信度之間的比值。名稱(chēng)描述(利用前面的例子)公式支持度顧客購(gòu)買(mǎi)錘子(X)和購(gòu)買(mǎi)釘子(Y)同時(shí)出現(xiàn)的概率P(X∪Y)可信度顧客在購(gòu)買(mǎi)錘子(X)的前提下,又購(gòu)買(mǎi)釘子(Y)的概率P(Y|X)期望可信度顧客購(gòu)買(mǎi)釘子(Y)的概率P(Y)作用度可信度與期望可信度的比值P(Y|X)/P(Y)描述關(guān)聯(lián)規(guī)則的參數(shù)-作用度5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)支持度是對(duì)關(guān)聯(lián)規(guī)則重要性的衡量可信度是對(duì)關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量作用度描述了一個(gè)事件對(duì)另一事件的影響力大小,有用關(guān)聯(lián)規(guī)則的作用度都應(yīng)該大于1四個(gè)參數(shù)的意義期望可信度描述了在沒(méi)有別的事件作用下,某一事件本身的支持度5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)單層關(guān)聯(lián)規(guī)則:規(guī)則條件中僅涉及同一層次上的屬性。多層關(guān)聯(lián)規(guī)則:規(guī)則條件中涉及不同層次上的屬性。單維關(guān)聯(lián)規(guī)則:處理單個(gè)屬性中的一些關(guān)系。啤酒

尿布(一個(gè)屬性:顧客購(gòu)買(mǎi)的東西)多維關(guān)聯(lián)規(guī)則:處理各個(gè)屬性之間的某些關(guān)系。性別=“女”

且職業(yè)=“秘書(shū)”

漂亮(多個(gè)屬性:性別、職業(yè))3)關(guān)聯(lián)規(guī)則的類(lèi)型5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)4)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的步驟進(jìn)行數(shù)據(jù)清理、集成、轉(zhuǎn)換、聚集等數(shù)據(jù)準(zhǔn)備;根據(jù)實(shí)際情況,確定最小支持度和最小可信度;利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則;可視化顯示、解釋、評(píng)估關(guān)聯(lián)規(guī)則。5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)例:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法“概念樹(shù)算法”挖掘多層關(guān)聯(lián)規(guī)則食品飲料水果肉類(lèi)可樂(lè)蘋(píng)果礦泉水香蕉豬肉可口可樂(lè)百事可樂(lè)紅富士

從下到上的概括或抽象反之則為從上到下的具體化5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)食品飲料水果肉類(lèi)可樂(lè)蘋(píng)果礦泉水香蕉豬肉可口可樂(lè)百事可樂(lè)紅富士

購(gòu)買(mǎi)(可口可樂(lè))

購(gòu)買(mǎi)(蘋(píng)果)涉及不同的抽象層關(guān)聯(lián)規(guī)則稱(chēng)為多層關(guān)聯(lián)規(guī)則。例:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法“概念樹(shù)算法”挖掘多層關(guān)聯(lián)規(guī)則5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)食品飲料水果肉類(lèi)可樂(lè)蘋(píng)果礦泉水香蕉豬肉可口可樂(lè)百事可樂(lè)紅富士

在較低層次上,購(gòu)買(mǎi)(可口可樂(lè))

購(gòu)買(mǎi)(礦泉水)的支持度低在較高層次上,購(gòu)買(mǎi)(可樂(lè))

購(gòu)買(mǎi)(礦泉水)的支持度高在不同層次上可以挖掘更多的強(qiáng)關(guān)聯(lián)規(guī)則例:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法“概念樹(shù)算法”挖掘多層關(guān)聯(lián)規(guī)則5.2

數(shù)據(jù)挖掘的任務(wù)——

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)北京科技大學(xué)6實(shí)施商務(wù)智能常見(jiàn)誤區(qū)(1)信息共享意味著失去控制權(quán)(2)自助式服務(wù)是浪費(fèi)用戶(hù)的時(shí)間(3)IT從業(yè)人員不懂商業(yè)運(yùn)作(4)我們并不總需要所有的數(shù)據(jù)北京科技大學(xué)誤區(qū)一:信息共享意味著失去控制權(quán)

“有了商務(wù)智能系統(tǒng),我的雇員們會(huì)看到很多從前他們看不到的信息,我的權(quán)力何在?其他部門(mén)的人員會(huì)學(xué)到我們多年商業(yè)實(shí)踐所積累下來(lái)的經(jīng)驗(yàn),我的優(yōu)勢(shì)何在?”

“有了商務(wù)智能系統(tǒng),我可以更多地了解企業(yè)內(nèi)外部信息,更積極地參與企業(yè)決策,更便捷地學(xué)習(xí)其他部門(mén)的經(jīng)驗(yàn)教訓(xùn),何樂(lè)而不為?”兩種聲音——閉塞保守開(kāi)放共享北京科技大學(xué)誤區(qū)一:信息共享意味著失去控制權(quán)日趨激烈的商業(yè)競(jìng)爭(zhēng)使得商業(yè)運(yùn)作必須降低成本、提高質(zhì)量、加快速度。因此企業(yè)必須分散機(jī)構(gòu),賦予員工權(quán)力以快速?zèng)Q策。打破階層感,實(shí)現(xiàn)信息共享,已經(jīng)成為一種不可阻擋的趨勢(shì)。北京科技大學(xué)誤區(qū)二:自助式服務(wù)是浪費(fèi)用戶(hù)的時(shí)間自助式服務(wù)意味著:用戶(hù)能得到他們確切所需的數(shù)據(jù)。用戶(hù)能在需要的時(shí),立刻就能得到數(shù)據(jù)。一名管理者正在準(zhǔn)備一次演講,準(zhǔn)備說(shuō)服上級(jí)管理人員投資一個(gè)項(xiàng)目,他認(rèn)為(感覺(jué))某產(chǎn)品在辦理直接郵購(gòu)服務(wù)的地區(qū)銷(xiāo)售情況較好,他需要及時(shí)得到相關(guān)地區(qū)產(chǎn)品銷(xiāo)售的信息,以確認(rèn)他的感覺(jué)。以前他需要到IT部門(mén)查詢(xún)數(shù)據(jù)并等待IT部門(mén)的查詢(xún)報(bào)告,有時(shí)等來(lái)的報(bào)告甚至不是他真正想要的。而現(xiàn)在他可以直接在商務(wù)智能系統(tǒng)上應(yīng)用OLAP工具自主查詢(xún),高效利用時(shí)間,最終做了一次令人信服的演講。北京科技大學(xué)誤區(qū)三:IT從業(yè)人員不懂商業(yè)運(yùn)作商務(wù)智能系統(tǒng)能實(shí)現(xiàn)新技術(shù)平臺(tái)的IT人士理解商業(yè)需求的用戶(hù)商業(yè)用戶(hù)的要求不切實(shí)際,不考慮具體實(shí)施的技術(shù)困難,也不考慮實(shí)行統(tǒng)一標(biāo)準(zhǔn)的必要性!IT部門(mén)認(rèn)為IT部門(mén)不懂商業(yè)運(yùn)作及其要求,他們根本幫不上什么忙??!商業(yè)部門(mén)認(rèn)為北京科技大學(xué)誤區(qū)三:IT從業(yè)人員不懂商業(yè)運(yùn)作(續(xù))但實(shí)際上,他們?cè)忈屩鳬T界與商界目標(biāo)及觀點(diǎn)的融合……在思科—思科公司CIO彼得·索維克(PeterSolvik)不僅負(fù)責(zé)思科公司的因特網(wǎng)顧客服務(wù)工具、局域網(wǎng)與廣域網(wǎng)、商業(yè)應(yīng)用程序、電信業(yè)務(wù),而且領(lǐng)導(dǎo)著思科因特網(wǎng)商業(yè)組織。在他的領(lǐng)導(dǎo)下,CiscoConnectionOnline網(wǎng)站年成交量超過(guò)40億美元。北京科技大學(xué)嘉信理財(cái)公司CIO唐·萊伯(DawnLepore)把股票經(jīng)紀(jì)業(yè)務(wù)轉(zhuǎn)向在線運(yùn)作?,F(xiàn)在嘉信理財(cái)已成為在線經(jīng)紀(jì)業(yè)務(wù)的領(lǐng)袖企業(yè)。在嘉信理財(cái)—誤區(qū)三:IT從業(yè)人員不懂商業(yè)運(yùn)作(續(xù))北京科技大學(xué)誤區(qū)四:我們并不總需要所有的數(shù)據(jù)

“一個(gè)好的商務(wù)智能工具的負(fù)面影響之一是你對(duì)研究這一新工具的興趣超過(guò)了工作需要。這是‘什么是有趣的’和‘什么是有用的’之間的沖突。有一種可能的情況是,你的員工喜歡做一些有趣的報(bào)告,而不是那些對(duì)商業(yè)運(yùn)作有用的報(bào)告。因此,我們有責(zé)任對(duì)分析過(guò)程作出非常清楚的定義,否則,我們會(huì)處于分析癱瘓狀態(tài),所能做的就是每天查看大量的數(shù)據(jù)?!?/p>

——英邁集團(tuán)CIO蓋伊·阿布拉莫北京科技大學(xué)誤區(qū)四:我們并不總需要所有的數(shù)據(jù)(續(xù))部署商務(wù)智能系統(tǒng)的步驟:企業(yè)商務(wù)智能系統(tǒng)的價(jià)值就在于他們能提供“正確的信息”來(lái)回答商業(yè)用戶(hù)的問(wèn)題。理解怎樣用這種工具理解那些可用數(shù)據(jù)的意義第1步第2步北京科技大學(xué)BI產(chǎn)品市場(chǎng)7BI產(chǎn)品市場(chǎng)變化與海波龍的整合獲得了涵蓋數(shù)據(jù)庫(kù),中間件,ERP和BI等大而全的解決方案ORACLESAP與博奧杰的整合為用戶(hù)利用交易數(shù)據(jù)提供了更好的辦法SAP將Cognos與其中間件,數(shù)據(jù)庫(kù)和數(shù)據(jù)集成工具等結(jié)合起來(lái)使用后,用戶(hù)將更容易對(duì)數(shù)據(jù)進(jìn)行分析IBMPerformancePoint和SharePoint是在企業(yè)范圍內(nèi)實(shí)現(xiàn)協(xié)作BI的最佳組合Microsoft北京科技大學(xué)(1)IBM:數(shù)據(jù)為本IOD(Information

On

Demand,信息隨需應(yīng)變)戰(zhàn)略:涉及四方面產(chǎn)品線:數(shù)據(jù)庫(kù)、信息整合、內(nèi)容管理和商業(yè)智能。IBM將Cognos與其中間件、數(shù)據(jù)庫(kù)和數(shù)據(jù)集成工具等結(jié)合起來(lái)使用后,用戶(hù)將更容易對(duì)數(shù)據(jù)進(jìn)行分析。其一貫專(zhuān)注底層系統(tǒng)的戰(zhàn)略讓BI工具缺乏其他類(lèi)似ERP等應(yīng)用軟件的配合。7BI產(chǎn)品市場(chǎng)變化北京科技大學(xué)(2)SAP:交易數(shù)據(jù)是關(guān)鍵SAP與博奧杰的整合讓業(yè)界一流的BI工具和ERP系統(tǒng)獲得緊密結(jié)合,為用戶(hù)利用交易數(shù)據(jù)提供了更好的辦法。缺乏數(shù)據(jù)庫(kù)環(huán)節(jié)的支撐,可能影響企業(yè)整體信息解決方案的實(shí)現(xiàn)。7BI產(chǎn)品市場(chǎng)變化北京科技大學(xué)(3)甲骨文:策略有待完善甲骨文與海波龍的整合獲得了涵蓋數(shù)據(jù)庫(kù)、中間件、ERP和BI等大而全的解決方案。BEA中間件分別與自身中間件、BI產(chǎn)品是各自為政還是完全整合將給用戶(hù)帶來(lái)困惑。7BI產(chǎn)品市場(chǎng)變化北京科技大學(xué)(4)微軟:擴(kuò)展BI用戶(hù)的范圍

微軟的目標(biāo)是利用終端用戶(hù)對(duì)Office軟件的熟悉,將BI帶給不同類(lèi)型的員工。其產(chǎn)品Perfor

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論