數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的運用_第1頁
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的運用_第2頁
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的運用_第3頁
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的運用_第4頁
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的運用_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、本科畢業(yè)論文論文題目: 數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用 學(xué)生姓名: 薛云霞 學(xué)號: 200602410089 專業(yè): 信息治理與信息系統(tǒng) 指導(dǎo)教師: 曲建華 學(xué) 院: 治理與經(jīng)濟學(xué)院 1 2010 年5月6 日畢業(yè)論文(設(shè)計)內(nèi)容介紹論文(設(shè)計)題 目數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用選題時刻2009年12月完成時刻2010年5月論文(設(shè)計)字?jǐn)?shù)12,400關(guān) 鍵 詞數(shù)據(jù)挖掘技術(shù);電子商務(wù);客戶關(guān)系治理論文(設(shè)計)題目的來源、理論和實踐意義:題目來源:導(dǎo)師指導(dǎo)下自選題目理論和實踐意義:隨著網(wǎng)絡(luò)的普及和電子商務(wù)網(wǎng)站的進展,電子商務(wù)差不多作為一種信息時代國際通行的商務(wù)模式,其深入進展引發(fā)了自工業(yè)革命經(jīng)

2、濟領(lǐng)域一場最廣泛、最深刻的變革。電子商務(wù)網(wǎng)站的推廣和普及差不多成為中國企業(yè)提高核心競爭力的必定要求。由于Web提供的信息是繁瑣的,同時有專門多無用的信息,因此這就需要人們必須使用一種技術(shù)來提取有用的信息為商家的決策提供服務(wù)。數(shù)據(jù)挖掘技術(shù)是從大量的數(shù)據(jù)中提取蘊涵的、未知的、有潛在使用價值的信息和知識從而為市場決策提供服務(wù)。因此隨著Internet 技術(shù)和數(shù)據(jù)庫技術(shù)的飛速進展,以網(wǎng)絡(luò)為載體、利用數(shù)字化電子方式開展的商務(wù)活動逐漸成為Web數(shù)據(jù)挖掘的一個重要應(yīng)用方向。因此,本文簡單介紹了電子商務(wù)和數(shù)據(jù)挖掘技術(shù)的差不多概念,分析了電子商務(wù)進展的差不多現(xiàn)狀,并要緊介紹了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用和存在的

3、問題,對我們企業(yè)在電子商務(wù)中應(yīng)用數(shù)據(jù)挖掘技術(shù)具有重要的理論和實踐意義。論文(設(shè)計)的要緊內(nèi)容及創(chuàng)新點:要緊內(nèi)容:隨著Internet和電子商務(wù)網(wǎng)站的飛速進展,Web差不多成為人們獵取信息的一個重要途徑。如何從這些海量的數(shù)據(jù)中找到有用的數(shù)據(jù),如何發(fā)覺用戶的興趣,為客戶提供個性化的服務(wù)成為目前電子商務(wù)網(wǎng)站進展的關(guān)鍵。數(shù)據(jù)挖掘技術(shù)正是在這種背景下和電子商務(wù)結(jié)合在一起。本文簡單介紹了電子商務(wù)和數(shù)據(jù)挖掘技術(shù)的差不多概念,并要緊介紹了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用和存在的問題,并提出了一些對策。創(chuàng)新點:本文要緊介紹了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用,并調(diào)查研究了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用的現(xiàn)狀,發(fā)覺了一些問

4、題,并提出了一些解決方法。附:論文(設(shè)計)本人簽名: 2010 年 5 月 10 日 目 錄 TOC o 1-2 h z u HYPERLINK l _Toc261724058 中文摘要 PAGEREF _Toc261724058 h 1 HYPERLINK l _Toc261724059 英文摘要 PAGEREF _Toc261724059 h 1 HYPERLINK l _Toc261724060 第1章 引言 PAGEREF _Toc261724060 h 2 HYPERLINK l _Toc261724061 第2章 目前電子商務(wù)的現(xiàn)狀 PAGEREF _Toc261724061 h

5、2 HYPERLINK l _Toc261724062 2.1電子商務(wù)的概述 PAGEREF _Toc261724062 h 2 HYPERLINK l _Toc261724063 2.2中國電子商務(wù)的進展?fàn)顩r PAGEREF _Toc261724063 h 3 HYPERLINK l _Toc261724064 第3章 數(shù)據(jù)挖掘技術(shù) PAGEREF _Toc261724064 h 5 HYPERLINK l _Toc261724065 3.1數(shù)據(jù)挖掘的定義 PAGEREF _Toc261724065 h 5 HYPERLINK l _Toc261724066 3.2數(shù)據(jù)挖掘的功能 PAGER

6、EF _Toc261724066 h 5 HYPERLINK l _Toc261724067 3.3數(shù)據(jù)挖掘的方法 PAGEREF _Toc261724067 h 6 HYPERLINK l _Toc261724068 第4章 數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用 PAGEREF _Toc261724068 h 7 HYPERLINK l _Toc261724069 4.1數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用的可行性分析 PAGEREF _Toc261724069 h 7 HYPERLINK l _Toc261724070 4.2電子商務(wù)中的數(shù)據(jù)挖掘過程 PAGEREF _Toc261724070 h 8

7、HYPERLINK l _Toc261724071 4.3數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用 PAGEREF _Toc261724071 h 9 HYPERLINK l _Toc261724072 4.4電子商務(wù)中數(shù)據(jù)挖掘應(yīng)用的現(xiàn)狀和解決方法 PAGEREF _Toc261724072 h 13 HYPERLINK l _Toc261724073 4.5數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用的前景 PAGEREF _Toc261724073 h 14 HYPERLINK l _Toc261724074 第5章 結(jié)語 PAGEREF _Toc261724074 h 14 HYPERLINK l _Toc261

8、724075 參考文獻 PAGEREF _Toc261724075 h 15數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用 薛云霞摘要:隨著Internet和電子商務(wù)的進展,網(wǎng)上購物差不多成為我們生活中不可或缺的一部分。Web積存了海量的數(shù)據(jù),如何把這些海量的數(shù)據(jù)轉(zhuǎn)化為有用的數(shù)據(jù),如何了解顧客的興趣和愛好,為顧客提供個性化的服務(wù)成為目前電子商務(wù)進展的關(guān)鍵問題。數(shù)據(jù)挖掘技術(shù)應(yīng)用于電子商務(wù)中正是在這種背景下產(chǎn)生的。數(shù)據(jù)挖掘技術(shù)是從大量的數(shù)據(jù)中提取蘊涵的、未知的、有潛在使用價值的信息和知識,它為市場分析和決策提供了依據(jù)。本文簡單介紹了電子商務(wù)的差不多概念及其電子商務(wù)的應(yīng)用現(xiàn)狀,然后介紹了數(shù)據(jù)挖掘技術(shù)的差不多概念;接

9、著要緊對數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用進行了研究,指出了實際應(yīng)用中存在的一些問題,并提出了解決方法。關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù),電子商務(wù),客戶關(guān)系治理中圖分類號:TP393The Application of Data Mining in the Electronic Commerce Xue yunxiaAbstract:With the development of Internet and E-commerce ,shopping-online has become a necessary part of our everyday life.With the development of In

10、ternet,Web provides abundant data resources.The key problem to the development of E-commerce is how to make use of E-commerce information and how to find out the interest of customers ,providing pernonalized service for customers .The application of data mining in the E-commerce comes into being in

11、the backgrounds. Data mining is a technique ,which can extract implicit ,undiscovered, potential,useful information and knowledge and which can help the market to analyse and make decisions. This paper simply discusses some basic cocepet about E-commerce and data mining ,and the application actualit

12、y of E-commerce. This paper is mainly focused on application of data mining in Elecotronic Commerce,and finds out some problems and simply puts forward some solutions to these problems.Key words:Data mining technique,E-commerce,Customer Relationship Management 第1章 引言電子商務(wù)的進展差不多成為一種必定趨勢。為客戶提供個性化的服務(wù)是目前

13、電子商務(wù)研究領(lǐng)域的重點和難點。隨著Internet的飛速進展和普及,公司建立自己的電子商務(wù)網(wǎng)站差不多成為一種必定趨勢。新的商業(yè)環(huán)境給企業(yè)帶來專門多商業(yè)機會,同時也帶來了專門多的挑戰(zhàn)。電子商務(wù)網(wǎng)站從“以站點為中心”向“以用戶為中心”成為一種必定。如何對信息進行有效地組織和利用,如何給客戶以個性化的界面,開展有針對性的電子商務(wù)服務(wù)成為電子商務(wù)迫切要解決的問題。數(shù)據(jù)挖掘技術(shù)確實是在這種網(wǎng)絡(luò)時代和商業(yè)背景下產(chǎn)生的。數(shù)據(jù)挖掘技術(shù)確實是將經(jīng)典的統(tǒng)計學(xué)方法、現(xiàn)代的智能化算法同數(shù)據(jù)庫技術(shù)結(jié)合起來,從海量的數(shù)據(jù)中發(fā)覺新的規(guī)律和新的知識的一種技術(shù)1。本文確實是運用數(shù)據(jù)挖掘技術(shù)中的關(guān)鍵技術(shù)關(guān)聯(lián)分析、聚類分析等來解決

14、電子商務(wù)的關(guān)鍵問題。本文遵循著基礎(chǔ)與鋪墊、可行性論證、突出重點如此循序漸進的過程展開論述,旨在介紹數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用。第2章 目前電子商務(wù)的現(xiàn)狀由于傳統(tǒng)商務(wù)活動大部分依靠面對面及書面文檔傳遞為主,使傳統(tǒng)商務(wù)具有信息不完善、耗費時刻長、花費高、庫存和產(chǎn)品的積壓、生產(chǎn)周期長、客戶服務(wù)有限等局限性。同時隨著網(wǎng)絡(luò)的進展,電子商務(wù)表現(xiàn)了它的優(yōu)越性,得到了迅速進展2。但在進展的同時,也面臨著專門多問題。2.1電子商務(wù)的概述2.1.1電子商務(wù)的定義電子商務(wù),英文是Electronic Commerce,簡稱EC。所謂電子商務(wù),確實是在網(wǎng)上開展商務(wù)活動。電子商務(wù)通常是指是在全球各地廣泛的商業(yè)貿(mào)易活

15、動中,在因特網(wǎng)開放的網(wǎng)絡(luò)環(huán)境下,基于掃瞄器/服務(wù)器應(yīng)用方式,買賣雙方不見面地進行各種商貿(mào)活動,實現(xiàn)消費者的網(wǎng)上購物、商戶之間的網(wǎng)上交易和在線電子支付以及各種商務(wù)活動、交易活動、金融活動和相關(guān)的綜合服務(wù)活動的一種新型的商業(yè)運營模式3。2.1.2電子商務(wù)的分類電子商務(wù)按照主體能夠分為三類:B2C、B2B、C2C4。 1、B2C:企業(yè)與個人交易的平臺。應(yīng)該講是企業(yè)做為賣家,個人做為買家的平臺,確實是企業(yè)做好商品推廣的網(wǎng)站。比如當(dāng)當(dāng)書店。2、B2B:企業(yè)與企業(yè)交易的平臺。比如阿里巴巴。3、C2C:個人與個人交易的平臺。比如淘寶,易趣。2.1.3電子商務(wù)的優(yōu)勢電子商務(wù)帶來的不僅是一種技術(shù)變革,它還帶來了

16、一種通過技術(shù)的輔助、引導(dǎo)、支持來實現(xiàn)的商業(yè)活動本身發(fā)生的全然性的革命。它不僅改變交易的方式,還更新了人們的消費觀念和生活方式,改變了人與人之間的關(guān)系。具體有以下幾個優(yōu)點:1、交易能夠跨越時空。交易雙方能夠在世界的任何一個地點,交易能夠在任何時刻進行,打破了傳統(tǒng)電子商務(wù)活動時刻和空間的約束。2、交易的方便性。消費者真正能夠足不出戶,就可貨比三家,同時能夠以一種輕松自由的自我服務(wù)的方式來完成交易。通過互聯(lián)網(wǎng),商家之間能夠直接交流,談判,簽合同,消費者也能夠把自己的反饋建議反映到企業(yè)或商家的網(wǎng)站,而企業(yè)或者商家則要依照消費者的反饋及時調(diào)查產(chǎn)品種類及服務(wù)品質(zhì),做到良性互動。3、交易的成本大大降低。電子

17、商務(wù)使供應(yīng)鏈縮短,各方面治理成本的大幅度降低。4、電子商務(wù)所具有的開放性和全球性的特點,為企業(yè)制造了更多的貿(mào)易機會。 2.2中國電子商務(wù)的進展?fàn)顩r2.2.1中國電子商務(wù)進展的情況隨著中國總體經(jīng)濟的強勢增長和Internet的進展,中國的電子商務(wù)市場進展專門迅速。中國電子商務(wù)市場中,B2B電子商務(wù)是最重要的一部分。依照艾瑞咨詢統(tǒng)計數(shù)據(jù)顯示,09年中國企業(yè)通過電子商務(wù)交易規(guī)模占整體交易規(guī)模(線上和線下交易規(guī)模)的比例達(dá)到11.3%,穩(wěn)中有升5。依照艾瑞咨詢調(diào)查顯示,在全球經(jīng)濟危機下,使用電子商務(wù)的線上中小企業(yè)的存活率要高出傳統(tǒng)線下企業(yè)5倍,因此金融危機讓更多的中小企業(yè)認(rèn)識到電子商務(wù)的優(yōu)勢,電子商務(wù)

18、平臺能夠給中小企業(yè)提供更有效的推廣方式,降低推廣成本5。因此,B2B電子商務(wù)交易規(guī)模所占比例得到提高,提高的部分要緊來自于兩方面,一方面,利用電子商務(wù)平臺獵取信息的中小企業(yè)的數(shù)量在上升;另一方面,部分原有利用電子商務(wù)平臺的中小企業(yè),其線上交易量在增長。2007年-2013年中國B2B電子商務(wù)交易規(guī)模,如圖(1):2007年-2013年中國B2B電子商務(wù)交易規(guī)模 圖(1)當(dāng)前中國電子商務(wù)進展具有網(wǎng)絡(luò)基礎(chǔ)設(shè)施進展迅速,應(yīng)用環(huán)境逐步完善;電子商務(wù)教育和培訓(xùn)進展較快;越來越多的企業(yè)認(rèn)知電子商務(wù),并開始起步應(yīng)用較好,開始發(fā)揮作用。2.2.2中國電子商務(wù)應(yīng)用中面臨的挑戰(zhàn)1、Web站點對客戶來講,差不多上依

19、舊一個“啞終端”。 盡管 Web 站點的軟硬件設(shè)施已得到了廣泛的重視,保證了 Web 站點擁有良好的運行性能,然而客戶卻對Web站點的信息專門不熟悉,對商家來講僅是一條 24 小時不停運轉(zhuǎn)的電子交易輸入通道。2、隨著電子商務(wù)網(wǎng)站規(guī)模日漸擴大,其龐大數(shù)據(jù)量和復(fù)雜的站點結(jié)構(gòu),往往使客戶手足無措,無法順利找到自己需要的商品或信息。商家和賣家在商品屬性上無法達(dá)成共識,使買家無法找到自己想要的商品。盡管商家提供了專門多的方式供買家查詢商品的屬性,然而商品的屬性往往是由商家定義的,買家和商家對商品屬性的認(rèn)識是不相同的,因此買家往往會找不到自己所需要的商品6。總體來講,中國的電子商務(wù)進展專門迅速,進展勢頭良

20、好。然而由于起步晚,基礎(chǔ)差,因此和發(fā)達(dá)國家的差距還專門大。然而企業(yè)建立電子商務(wù)網(wǎng)站差不多成為一種必定趨勢,如何從冗余的、不準(zhǔn)確的數(shù)據(jù)中發(fā)覺有用的信息和知識,了解顧客的愛好和價值取向,為用戶提供個性化的服務(wù)差不多成為各個企業(yè)面臨的關(guān)鍵問題。第3章 數(shù)據(jù)挖掘技術(shù)3.1數(shù)據(jù)挖掘的定義數(shù)據(jù)挖掘,英文是Data Mining,簡稱DM。所謂數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取有效的、未知的、易于理解的、有依據(jù)的信息,并據(jù)此做出商務(wù)決策的過程7。數(shù)據(jù)挖掘從本質(zhì)上講是一種新的商業(yè)信息處理技術(shù)。數(shù)據(jù)挖掘技術(shù)把人們對數(shù)據(jù)的應(yīng)用,從低層次的聯(lián)機查詢操作,提高到?jīng)Q策支持、分析預(yù)測等更高級應(yīng)用上8。3.2數(shù)據(jù)挖掘的功能1、預(yù)測

21、分析。預(yù)測分析是分析現(xiàn)有的數(shù)據(jù)集并以此發(fā)覺數(shù)據(jù)的重要特征,并據(jù)此對以后數(shù)據(jù)進行判定或預(yù)測。預(yù)測分析能夠分為值預(yù)測和分類預(yù)測兩種方法。值預(yù)測是利用一些已知變量的值來預(yù)測其他變量的值(如回歸分析);或者利用某個變量的過去值來預(yù)測其以后值(如時刻序列分析)。分類預(yù)測的目的在于發(fā)覺每一類的屬性特征。例如,假如將信用卡用戶的信用等級作為類標(biāo)簽,銀行治理人員希望分類模型能夠挖掘出每種信用等級的用戶特征,一個可能的結(jié)論是:年齡在30-40歲之間、收入在8000元以上、住在街區(qū)的用戶信用等級為優(yōu)1。依據(jù)這些分類特征,治理人員能夠?qū)ι贽k信用卡的用戶做出信用等級的初始推斷,以輔助決策。決策樹和人工神經(jīng)網(wǎng)絡(luò)是構(gòu)建分

22、類模型的常用技術(shù)。2、關(guān)聯(lián)分析。關(guān)聯(lián)分析用于發(fā)覺數(shù)據(jù)項之間的關(guān)聯(lián)規(guī)則,定義:若X、Y為項目集,且XY=,則:蘊涵式X=Y成為關(guān)聯(lián)規(guī)則9;關(guān)聯(lián)規(guī)則確實是從給定的數(shù)據(jù)集中搜索數(shù)據(jù)項之間所存在的有價值的關(guān)聯(lián)。比如,一家賣電子商品的商店,發(fā)覺買計算機的顧客80%也會買系統(tǒng)軟件。這就講明計算機和系統(tǒng)軟件之間有著某種關(guān)聯(lián)。3、聚類分析。聚類分析的目的確實是把相似的對象歸為類,研究的要緊內(nèi)容是度量相似性以及構(gòu)造聚類的具體方法。聚類模型使用無指導(dǎo)學(xué)習(xí)來發(fā)覺數(shù)據(jù)集中的同構(gòu)成分,產(chǎn)生數(shù)目不定的、含有相似數(shù)據(jù)的數(shù)據(jù)子集。例如,企業(yè)能夠依照客戶交易歷史,進行客戶聚類,發(fā)覺高價值用戶,并據(jù)此加強客戶關(guān)系治理。4、分類分

23、析。分類分析用于找出一個類不的概念描述,那個概念描述代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,一般用規(guī)則或決策樹模式表示。5、偏離檢測。偏離檢測通過應(yīng)用統(tǒng)計方法和可視化技術(shù)來發(fā)覺數(shù)據(jù)集中的孤立點,從而發(fā)覺與期望或規(guī)范相背離的異常事件。3.3數(shù)據(jù)挖掘的方法數(shù)據(jù)挖掘有專門多方法,包括關(guān)聯(lián)規(guī)則方法、聚類分析方法、人工神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、粗糙集方法、決策樹方法、統(tǒng)計方法、可視化技術(shù)等。下面就上述八種方法解釋如下:1、關(guān)聯(lián)規(guī)則方法:關(guān)聯(lián)規(guī)則,是在數(shù)據(jù)挖掘中最先使用的最差不多的技術(shù)。關(guān)聯(lián)規(guī)則是從大量的數(shù)據(jù)中提取或“挖掘”出有用的知識,它能對過去的數(shù)據(jù)進行查詢和遍歷,找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促

24、進信息的顯化10。2、聚類分析方法:聚類分析是一種經(jīng)典的統(tǒng)計學(xué)方法,它同數(shù)據(jù)庫技術(shù)結(jié)合形成了現(xiàn)代數(shù)據(jù)挖掘的常用技術(shù)之一。聚類分析確實是從給定的數(shù)據(jù)集中搜索數(shù)據(jù)對象之間所存在的有價值的聯(lián)系,一個聚類中的所有對象常常被當(dāng)作一個對象來進行處理或分析11。在商業(yè)上,聚類分析能夠關(guān)心市場人員發(fā)覺顧客群中所存在的不同特征的組群,并能夠利用購買模式來描述這些具有不同特征的顧客組群。3、人工神經(jīng)網(wǎng)絡(luò)方法:人工神經(jīng)網(wǎng)絡(luò)和遺傳算法,差不多上仿生研究方法,或仿生算法。它們通過模擬生物學(xué)的某些功能,制造一些優(yōu)化算法,查找世界的規(guī)律。人工神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上仿照生物學(xué)的神經(jīng)網(wǎng)絡(luò),構(gòu)造一個簡化的只有輸入層、輸出層和隱含的中間

25、層的含有非線性特征的網(wǎng)絡(luò)。優(yōu)點是對噪聲數(shù)據(jù)有較好的適應(yīng)能力,同時對未知數(shù)據(jù)也具有較好的預(yù)測分類能力。然而人工神經(jīng)網(wǎng)絡(luò)分類方法獵取的模式隱含在網(wǎng)絡(luò)結(jié)構(gòu)中,而不是顯式的表達(dá)為規(guī)則,不容易被人們理解和解釋。而且還需要多次掃描訓(xùn)練數(shù)據(jù),網(wǎng)格的訓(xùn)練時刻較長。4、遺傳算法方法:簡稱GA,要緊借用了生物進化中“適者生存”規(guī)律。其模擬生物的進化和遺傳,借助選擇、交叉和變異操作,使得要解決的問題從初始解逐步接近最優(yōu)解,解決了許多全局優(yōu)化問題。5、粗糙集算法:能夠用于分類問題,以關(guān)心發(fā)覺不準(zhǔn)確或噪聲數(shù)據(jù)中所存在的結(jié)構(gòu)關(guān)系,是現(xiàn)在數(shù)據(jù)挖掘中最有力的工具。但它只能處理離散量,連續(xù)量必須首先進行離散化后方可使用。利用粗

26、糙集能夠近似或粗略的定義集合(類不)。關(guān)于一個集合的粗糙集定義是通過兩個集合,一個上近似集合和下近似集合來描述。上近似集合包含那些確信不屬于它的數(shù)據(jù)樣本,下近似集合包含那些確信無疑是屬于它的數(shù)據(jù)樣本。6、決策樹方法:決策樹方法是利用信息論中的信息增益查找數(shù)據(jù)庫中具有最大信息量的屬性字段,從而建立決策樹的一個結(jié)點,再依照該屬性字段的不同取值建立樹的分支,最后在每個分支子集中再重復(fù)建立樹的下層結(jié)點和分支的過程。具有速度較快、較易轉(zhuǎn)化成簡單且容易理解的分類規(guī)則、較易轉(zhuǎn)換成數(shù)據(jù)庫查詢語句等優(yōu)點。7、統(tǒng)計學(xué):旨在從抽樣分析中提取未知的數(shù)學(xué)模型,在數(shù)據(jù)挖掘中常常會涉及一定的統(tǒng)計過程,如數(shù)據(jù)抽樣和建模、推斷

27、假設(shè)以及誤差操縱等。8、可視化技術(shù):采納直觀的圖形方式將信息模式、數(shù)據(jù)的關(guān)聯(lián)及趨勢呈現(xiàn)給用戶,以便用戶交互的分析數(shù)據(jù)關(guān)系。第4章 數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用4.1數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用的可行性分析4.1.1數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用的必要性隨著Internet和企業(yè)信息化的進展,企業(yè)建立自己的電子商務(wù)網(wǎng)站差不多成為一種進展趨勢。而Web產(chǎn)生了海量的數(shù)據(jù),這些數(shù)據(jù)中含有專門多冗余的、不準(zhǔn)確的數(shù)據(jù)。如何對這些的數(shù)據(jù)進行有效的組織利用,從而發(fā)覺客戶的興趣和價值取向,加強網(wǎng)站架構(gòu),為客戶提供個性化的服務(wù),是電子商務(wù)網(wǎng)站必須要解決的問題。而數(shù)據(jù)挖掘技術(shù)是從大量的數(shù)據(jù)中找出蘊藏的、有價值的數(shù)據(jù)

28、,運用數(shù)據(jù)挖掘中的關(guān)聯(lián)分析、聚類分析等能夠發(fā)覺潛在用戶、預(yù)測用戶的行為,為企業(yè)做市場分析和決策提供依據(jù)。4.1.2數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用的可行性數(shù)據(jù)挖掘從技術(shù)上看,它直接服務(wù)于數(shù)據(jù)分析工作的;在本質(zhì)上講是一種新的商業(yè)信息處理技術(shù)。它通過對數(shù)據(jù)進行微觀、中觀乃至宏觀的統(tǒng)計、分析預(yù)測、綜合和推理,發(fā)覺數(shù)據(jù)間的關(guān)聯(lián)性、以后趨勢以及一般性的概括知識等,這些知識性的信息能夠用來指導(dǎo)高級商務(wù)活動;從商業(yè)角度看,數(shù)據(jù)挖掘確實是按照企業(yè)的既定業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進行深層次分析以揭示隱藏的、未知的規(guī)律并將其模型化,從而支持商業(yè)決策活動。企業(yè)利用搜索引擎技術(shù),通過 ETL (數(shù)據(jù)抽取轉(zhuǎn)換裝載)工具進行

29、數(shù)據(jù)整合,借助數(shù)據(jù)挖掘技術(shù),對電子商務(wù)交易數(shù)據(jù)進行深入的分析,從而為正確的電子商務(wù)應(yīng)用決策提供強有力的支持和可靠的保證。數(shù)據(jù)挖掘技術(shù)不僅關(guān)心賣家更深入的了解買家的需求、購買力以及購物行為特征,挖掘潛在的買家,而且有助于買家更好的了解商品,為買家提供便利的交易方式和廣泛的選擇。關(guān)于買家和賣家都具有一定的有用價值和現(xiàn)實意義。4.2電子商務(wù)中的數(shù)據(jù)挖掘過程數(shù)據(jù)挖掘分為四個時期:元數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、模式發(fā)覺和模式分析12。1、元數(shù)據(jù)收集:在Web使用挖掘中,數(shù)據(jù)最直接的來源是Web服務(wù)器??蛻粼L問服務(wù)器就會在服務(wù)器上產(chǎn)生相應(yīng)的服務(wù)器數(shù)據(jù),這些數(shù)據(jù)能夠分為日志文件和查詢數(shù)據(jù)。日志文件記錄用戶的訪問信

30、息,查詢數(shù)據(jù)是用戶在查詢自己需要的信息時在服務(wù)器端產(chǎn)生的記錄。2、數(shù)據(jù)的預(yù)處理:服務(wù)器上的數(shù)據(jù)一般差不多上模糊的、冗余的、不完全的,要想得到簡潔、準(zhǔn)確的數(shù)據(jù)必須通過數(shù)據(jù)的預(yù)處理過程。預(yù)處理要緊對用戶訪問日志進行數(shù)據(jù)清洗、用戶的唯一性識不、用戶的會話識不、完善訪問路徑和事務(wù)識不等處理。(1)數(shù)據(jù)清洗:目的是從服務(wù)器日志文件中消除不相干的項,縮小被挖掘數(shù)據(jù)對象的范圍。(2)用戶的唯一性識不:能夠通過分析用戶方的日志文件和采納catch busting技術(shù),并借助其他一些信息來實現(xiàn),例如IP地址。另外能夠參考網(wǎng)絡(luò)站點的拓?fù)浣Y(jié)構(gòu)信息。(3)用戶的會話識不:目的是將每個用戶的訪問信息劃分為若干個獨立的會

31、話進程,最簡單方法是采納超時可能,即當(dāng)頁面之間的請求時刻間隔超過了規(guī)定的時刻范圍,就能夠認(rèn)為用戶差不多開始進行一次新的會話。(4)完善訪問路徑:假如一個頁面請求信息與該用戶上次請求的頁面沒有直接的鏈接關(guān)系,能夠查看參考日志文件來決定那個頁面來自哪個頁面的鏈接。(5)事務(wù)識不:目的是依據(jù)數(shù)據(jù)挖掘任務(wù)的需求將事務(wù)進行分割或合并處理,使其適合于數(shù)據(jù)挖掘需求的分析。3、模式發(fā)覺:模式發(fā)覺時期確實是利用挖掘算法挖掘出有效地、新穎的、潛在的、有用的及最終能夠理解的信息和知識。其中應(yīng)用于Web使用挖掘的技術(shù)有路徑分析、關(guān)聯(lián)規(guī)則的發(fā)覺、序列模式的發(fā)覺、分類聚類技術(shù)。(1)路徑分析:通過對網(wǎng)站結(jié)構(gòu)圖和用戶的訪問

32、信息分析能夠得出路徑圖,通過路徑圖能夠判定一個Web站點中最頻繁訪問的路徑,例如通過路徑分析能夠得出:70%的客戶在掃瞄4個或更少的頁面后離開了。(2)關(guān)聯(lián)規(guī)則的發(fā)覺:找到客戶訪問網(wǎng)站上各種文件之間的相互關(guān)聯(lián)13。例如:50%的用戶訪問Web頁面A公司的B產(chǎn)品時,也訪問了A公司的D產(chǎn)品。(3)序列模式的發(fā)覺:目的是在時刻戳有序的事務(wù)集中,找到那些“一些項跟隨另一個項”內(nèi)部事務(wù)模式。如:在A公司B產(chǎn)品上進行在線訂購的顧客中喲70%的在一個月內(nèi)也在A公司的C產(chǎn)品上下過訂單。(4)分類和聚類技術(shù):分類技術(shù)能夠從個人信息或共同的訪問模式中得出訪問某一服務(wù)器文件的用戶特征。分類技術(shù)能夠通過決策樹方法、貝

33、葉斯分類法來實現(xiàn)。聚類分析能夠從Web訪問信息數(shù)據(jù)中聚類出相似特性的客戶,可實現(xiàn)自動給一個特定的顧客聚類發(fā)送銷售郵件,為一個顧客聚類動態(tài)的改變一個專門的站點。4、模式分析:模式分析要緊是為了從模式發(fā)覺算法找到的模式集合中篩選出有味的模式。模式分析的形式能夠像SQL那樣知識查詢機制,也能夠把Web使用數(shù)據(jù)裝入數(shù)據(jù)倉庫,以便執(zhí)行聯(lián)機分析處理操作。4.3數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用越來越普遍,也越來越受到電子商務(wù)治理者的重視。目前Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用要緊體現(xiàn)在以下四個領(lǐng)域。4.3.1數(shù)據(jù)挖掘在網(wǎng)站設(shè)計、治理中的應(yīng)用數(shù)據(jù)挖掘技術(shù)在網(wǎng)站設(shè)計、治理中的應(yīng)用要

34、緊體現(xiàn)在以下五個方面:1、網(wǎng)站設(shè)計中的數(shù)據(jù)挖掘在網(wǎng)站建設(shè)中,使用數(shù)據(jù)挖掘技術(shù),通過對網(wǎng)站內(nèi)容的挖掘,可有效地組織網(wǎng)站信息。例如采納自動歸類技術(shù)實現(xiàn)網(wǎng)站信息的層次性組織; 分析用戶的Web 訪問行為,可為用戶提供智能化個性化服務(wù)14。比如,可依照客戶的訪問興趣、訪問頻度、訪問時刻,動態(tài)地調(diào)整頁面結(jié)構(gòu), 迎合每個客戶的掃瞄興趣。另外,網(wǎng)站還能夠依照實際用戶的掃瞄情況,挖掘用戶的興趣點,定期為用戶推送相關(guān)信息,以及調(diào)整網(wǎng)站中網(wǎng)頁的鏈接結(jié)構(gòu)和內(nèi)容,為用戶提供個人的定制服務(wù)。2、改進站點設(shè)計對Web站點的鏈接結(jié)構(gòu)的優(yōu)化可從三方面來考慮:(1)對WebLog的挖掘,發(fā)覺用戶訪問頁面的相關(guān)性,從而對緊密聯(lián)系

35、的網(wǎng)頁之間增加鏈接,方便用戶使用。(2)利用路徑分析技術(shù)判定在一個Web站點中最頻繁的訪問路徑,能夠考慮把重要的商品信息放在這些頁面中,改進頁面和網(wǎng)站結(jié)構(gòu)的設(shè)計,增強對客戶的吸引力,提高銷售量。(3)通過對WebLog的挖掘,發(fā)覺用戶的期望位置。假如在期望位置的訪問頻率高于對實際位置的訪問頻率,可考慮在期望位置和實際位置之間建立導(dǎo)航鏈接,從而實現(xiàn)對Web站點結(jié)構(gòu)的優(yōu)化。3、序列模式發(fā)覺發(fā)覺序列模式便于電子商務(wù)的組織者預(yù)測客戶的行為,為客戶提供個性化的服務(wù)。使用序列模式分析挖掘Web日志,能夠發(fā)覺客戶的訪問序列模式,預(yù)測出客戶以后的訪問模式,有的方矢地進行在線推舉或安排廣告等營銷活動。采納關(guān)聯(lián)規(guī)

36、則技術(shù),找出具有一定支持度和置信度的相關(guān)聯(lián)的物品,同時針對客戶的動態(tài)變化來調(diào)整網(wǎng)站的結(jié)構(gòu),能夠使客戶直接訪問關(guān)聯(lián)商品的鏈接信息。3、在電子郵件治理中的應(yīng)用在電子商務(wù)中,現(xiàn)實的和潛在的客戶往往采納電子郵件咨詢電子商務(wù)企業(yè)商品的性能、價格、安裝使用、維護等各種問題?,F(xiàn)在,電子商務(wù)企業(yè)就需要對所接收到的各種電子郵件進行準(zhǔn)確、快速的分類?;跀?shù)據(jù)挖掘的電子郵件過濾、篩選和分類技術(shù)則能夠從大量的郵件清除垃圾郵件,將有用的客戶郵件正確地分發(fā)到相應(yīng)的部門進行及時處理。4、在搜索引擎中的應(yīng)用網(wǎng)絡(luò)用戶經(jīng)常使用搜索引擎在網(wǎng)站中搜索自己所希望的商品,有的用戶希望利用搜索引擎在整個網(wǎng)絡(luò)上搜索自己所關(guān)懷的商品,并希望對

37、這些商品的價格、質(zhì)量、性能、售后服務(wù)進行比較?,F(xiàn)在就需要利用搜索引擎進行Web數(shù)據(jù)挖掘。例如,通過對網(wǎng)頁的聚類、分類,實現(xiàn)網(wǎng)絡(luò)信息的分類掃瞄與檢索,以找到同樣類型的商品;通過用戶所使用的提問式歷史記錄的分析,能夠有效地進行提問擴展,提高用戶的檢索效果;運用網(wǎng)絡(luò)內(nèi)容挖掘技術(shù)改進關(guān)鍵詞加權(quán)算法,能夠提高網(wǎng)絡(luò)信息的標(biāo)引準(zhǔn)確度,改善檢索效果。4.3.2數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系治理中的應(yīng)用客戶關(guān)系治理(Customer Relationship Management,CRM),簡單的講,確實是對客戶關(guān)系進行治理的一種思想和技術(shù),換句話講,客戶關(guān)系治理是一種“以客戶為中心”的經(jīng)營理念,它借助于信息技術(shù)在企業(yè)

38、的市場、銷售、技術(shù)支持、客戶服務(wù)等各個環(huán)節(jié)的應(yīng)用,以改善和增進企業(yè)與客戶的關(guān)系,實現(xiàn)以更優(yōu)質(zhì)、更快捷、更富個性化的服務(wù)保持和吸引更多客戶的目標(biāo),并通過全面優(yōu)化面向客戶的業(yè)務(wù)流程使保留老客戶和獵取新客戶的成本達(dá)到最低化,最終使企業(yè)的市場適應(yīng)能力和競爭實力有一個質(zhì)的提高15。數(shù)據(jù)挖掘能夠應(yīng)用在客戶群體分類分析、客戶效益分類分析和預(yù)測、客戶背景分析、客戶中意度分析、交叉銷售、客戶信用分析、客戶流失分析、客戶的獲得與保持等方面16。要緊應(yīng)用在以下六個方面:1、客戶的群體分類分析通過對電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進行聚類分析,對具有相似掃瞄行為或客戶指標(biāo)的客戶進行分組,找出分組客戶的共同特征,從而確定不同

39、類型客戶的行為模式。如此能夠關(guān)心電子商務(wù)的組織者更好地了解自己的客戶,向客戶提供更適合客戶的服務(wù)。例如:有一些客戶都花了一些時刻掃瞄“森馬服飾”頁面,通過分析這些客戶被聚為一類。商家能夠針對該群體的需求,為他們盡可能的發(fā)送廣告,或者及時的調(diào)整頁面及頁面內(nèi)容,滿足客戶的需求。2、客戶的效益分類分析和預(yù)測客戶的利潤回報分析是客戶效益分類分析和預(yù)測的關(guān)鍵??蛻衾麧櫥貓箢A(yù)測是最令人向往的預(yù)測類型,也是客戶關(guān)系治理應(yīng)用能否替企業(yè)實現(xiàn)長期ROI的一個重要環(huán)節(jié)。通過聚類技術(shù)和分類技術(shù)能夠發(fā)覺那些客戶是中重要的,那些客戶是不重要的,對給企業(yè)帶來利潤的客戶我們要對他好點,比如贈送禮物,多打折扣等。3、客戶中意度

40、分析客戶中意度是對某項產(chǎn)品或服務(wù)的消費經(jīng)驗的總體評價,是客戶通過對一個產(chǎn)品或服務(wù)的可感知的效果與其期望值相比較后,所形成的愉悅或失望的感受狀態(tài),是衡量企業(yè)經(jīng)營質(zhì)量水平的一種方式。它是客戶通過長期沉淀而形成的情感訴求,也是客戶在歷次交易活動中狀態(tài)的積存。分析客戶對企業(yè)產(chǎn)品和服務(wù)的中意度,能夠關(guān)心企業(yè)了解客戶的方法、需求和期望,發(fā)覺企業(yè)在產(chǎn)品、服務(wù)和治理上的不足,為企業(yè)改善經(jīng)營策略、提高客戶忠誠度指明方向。通過自定義的定量的度量標(biāo)準(zhǔn)和公式,并依照時刻和其他參數(shù),利用數(shù)據(jù)挖掘技術(shù)和企業(yè)的數(shù)據(jù)庫中關(guān)于客戶購買、維修、反饋意見、建議、投訴等信息,可對客戶的中意度進行分析,找出客戶不中意的緣故并制定相應(yīng)的

41、策略,提高客戶忠誠度,增加企業(yè)的利潤17。4、交叉銷售交叉銷售是建立在Win-Win原則上的,對客戶來講,要得到更多更好滿足并需求的服務(wù)并從中受益,對企業(yè)來講,也會因銷售額的增長而獲益。數(shù)據(jù)挖掘能夠關(guān)心企業(yè)分析出最優(yōu)的、合理的銷售匹配。5、客戶的獲得與保留通過Web數(shù)據(jù)挖掘能夠?qū)撛诳蛻粜畔⑦M行聚類和分類的分析,再用模式分析預(yù)測那些可能成為新客戶,以關(guān)心市場銷售人員找到正確的營銷對象。Web數(shù)據(jù)挖掘還能夠解釋客戶的行為適應(yīng),發(fā)覺在不同情況下有相似行為的新客戶,關(guān)心商家識不潛在的客戶群,采納積極的營銷策略,不斷挖掘新客戶,提高市場占有率。通過Web數(shù)據(jù)挖掘,可發(fā)覺不同的客戶群在網(wǎng)站上購買不同的商

42、品,那些客戶可能正在流失,那些客戶是網(wǎng)站的忠誠客戶,那些是贏利客戶。針對不同的客戶,進行個性化的營銷,使他們都成為電子商務(wù)企業(yè)的忠誠的老客戶。6、客戶信用分析數(shù)據(jù)挖掘技術(shù)能夠為企業(yè)提供客戶信用分析,如能夠為保險索賠、移動電話呼叫、信用卡購買等易于發(fā)生欺詐的行業(yè)建立模型。4.3.3數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)營銷中的應(yīng)用網(wǎng)絡(luò)營銷是指利用Internet技術(shù),最大限度地滿足客戶需求,以達(dá)到開拓市場、增盈利目標(biāo)的經(jīng)營過程。它從傳統(tǒng)營銷的以產(chǎn)品銷售為中心的“4P”(Product,Price,Place,Promotion)轉(zhuǎn)向以滿足客戶需求為中心的“4C”(Customer,Cost,Convenienee,

43、Communication)。數(shù)據(jù)挖掘在提高營銷的有效性、交叉營銷等方面有著廣泛的應(yīng)用。1、進行有針對性的營銷,提高營銷的有效性數(shù)據(jù)挖掘技術(shù)能夠通過分析客戶點擊流等信息,挖掘出客戶的行為動機,分析出用戶所處的時期,以關(guān)心電子商務(wù)治理者針對用戶所處的時期提供不同的營銷策略,向用戶進行有針對性的信息反饋和廣告發(fā)送;數(shù)據(jù)挖掘技術(shù)還能夠?qū)κ袌?、客戶?shù)據(jù)進行恰當(dāng)?shù)姆诸愅诰?,從而分析出各個層次的細(xì)分市場,為電子商務(wù)企業(yè)定位于自己的目標(biāo)市場提供可靠的依據(jù)。2、交叉營銷交叉營銷確實是指通過與客戶交流,向現(xiàn)有的客戶提供新的產(chǎn)品和服務(wù)的營銷過程。企業(yè)與其客戶之間的商業(yè)關(guān)系是一種持續(xù)的不斷進展的關(guān)系,通過不斷地相互

44、接觸和交流,客戶得到了更好更貼切的服務(wù)質(zhì)量,企業(yè)則因為增加了銷售量而獲利?;诳蛻舨畈欢噘徺I的商品,推舉客戶購買一些相關(guān)的商品,建立忠誠度。客戶往往情愿到那些最能滿足自己需求的網(wǎng)站購物。4.3.4數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)廣告中的應(yīng)用企業(yè)能夠利用數(shù)據(jù)挖掘技術(shù)分析網(wǎng)絡(luò)廣告的有效性、正確的的關(guān)聯(lián)匹配關(guān)系和精準(zhǔn)發(fā)送信息情況等。目的在于提高網(wǎng)絡(luò)廣告的投放率和網(wǎng)絡(luò)廣告的投資回報率(ROI)。1、網(wǎng)絡(luò)廣告的有效性分析網(wǎng)絡(luò)廣告與電視廣告、報紙廣告等傳統(tǒng)媒體廣告具有專門大的不同,電子商務(wù)企業(yè)需要依照網(wǎng)絡(luò)廣告的特點,采納數(shù)據(jù)挖掘技術(shù)對網(wǎng)絡(luò)廣告的布局、投放進行挖掘分析,以獲得更好的廣告效果。利用數(shù)據(jù)挖掘技術(shù)能夠?qū)Ω鞣N廣告

45、進行分類,了解其點擊率、分析廣告在點擊以后的商品銷售情況,以推斷廣告的實際有效性。2、網(wǎng)絡(luò)廣告的關(guān)聯(lián)匹配網(wǎng)絡(luò)廣告的的關(guān)聯(lián)匹配是“數(shù)據(jù)挖掘”和網(wǎng)絡(luò)廣告的結(jié)合體。關(guān)聯(lián)匹配廣告的實現(xiàn)不僅需要了解網(wǎng)絡(luò)訪問者的適應(yīng),而且還需要使用關(guān)聯(lián)規(guī)則對網(wǎng)絡(luò)廣告設(shè)計進行分析,以確定哪些廣告的鏈接效果更好,能夠使訪問者能夠更容易受到網(wǎng)絡(luò)廣告的阻礙去購買企業(yè)的商品。3、網(wǎng)絡(luò)廣告的精準(zhǔn)發(fā)送精準(zhǔn)廣告發(fā)送需要依托網(wǎng)絡(luò)搜索技術(shù)和所積存的龐大的網(wǎng)絡(luò)訪問者行為數(shù)據(jù)倉庫,對網(wǎng)絡(luò)掃瞄者的上網(wǎng)行為進行個性化的數(shù)據(jù)挖掘分析,按電子商務(wù)企業(yè)的廣告需求鎖定目標(biāo)受眾,進行一對一傳播,向細(xì)分人群分類發(fā)送他們各自感興趣的個性化商品信息,實現(xiàn)網(wǎng)絡(luò)廣告的

46、精準(zhǔn)投放。為此,電子商務(wù)企業(yè)需要利用數(shù)據(jù)挖掘系統(tǒng)對網(wǎng)絡(luò)訪問者的IP地址進行分析跟蹤,并利用特征關(guān)鍵詞對用戶進行分類挖掘,同時與廣告產(chǎn)品的特征進行關(guān)聯(lián)、匹配和排序分析,實現(xiàn)有針對性的網(wǎng)絡(luò)訪問者群體的精準(zhǔn)投放。4.4電子商務(wù)中數(shù)據(jù)挖掘應(yīng)用的現(xiàn)狀和解決方法數(shù)據(jù)挖掘技術(shù)應(yīng)用于電子商務(wù)中取得了一定成果,通過對服務(wù)器數(shù)據(jù)運用聚類分類分析、關(guān)聯(lián)規(guī)則的分析等技術(shù)能夠為商家做出個性化的營銷策略提供依據(jù),提高系統(tǒng)的效率,節(jié)約客戶的時刻,為客戶提供個性化的服務(wù)。然而由于我國的網(wǎng)絡(luò)設(shè)施還不健全,在電子商務(wù)中應(yīng)用數(shù)據(jù)挖掘技術(shù)要花費大量的人力物力,因此在我國數(shù)據(jù)挖掘技術(shù)應(yīng)用于電子商務(wù)中的力度和廣度并不是專門理想。即便是應(yīng)

47、用了數(shù)據(jù)挖掘技術(shù),效果也不是專門理想。下面是數(shù)據(jù)挖掘技術(shù)實施中存在的問題和一些解決方法。1、由于數(shù)據(jù)挖掘是有數(shù)據(jù)驅(qū)動的,而且不易治理,因此數(shù)挖掘?qū)iT容易遇到數(shù)據(jù)質(zhì)量的問題。由于數(shù)據(jù)庫差不多上動態(tài)的、有錯誤而且不完整,冗余和稀疏并存,因此也確實是巨大的。因此在使用恰當(dāng)?shù)臄?shù)據(jù)挖掘功能和技術(shù)的同時,必須小心地分析異常情況,不能將異常情況所造成的結(jié)果作為普遍的模式加以應(yīng)用。2、數(shù)據(jù)可視化工具的缺乏。數(shù)據(jù)可視化是一種關(guān)心數(shù)據(jù)挖掘人員了解數(shù)據(jù)、獵取知識的有力工具。然而在數(shù)據(jù)挖掘中遇到的數(shù)據(jù)大多是一些復(fù)雜的海量數(shù)據(jù),要將其可視化,必須要有復(fù)雜的數(shù)據(jù)可視化工具支持。數(shù)據(jù)可視化是一種新興的技術(shù),它能夠提高分析員

48、分析數(shù)據(jù)、獵取知識的能力,尤其是在數(shù)據(jù)維數(shù)較低的時候,其效果更加明顯。3、許多數(shù)據(jù)挖掘技術(shù)由于極大數(shù)據(jù)庫的存儲量過大而出現(xiàn)專門多應(yīng)用問題。例如,過大的查詢數(shù)據(jù)量會對一些特定技術(shù)造成困難15。為此能夠使用數(shù)據(jù)抽取技術(shù)從擊打數(shù)庫中抽取數(shù)據(jù),生成一個數(shù)據(jù)挖掘數(shù)據(jù)庫,數(shù)據(jù)挖掘技術(shù)就能夠在此數(shù)據(jù)挖掘數(shù)據(jù)庫中應(yīng)用,而不是在數(shù)據(jù)倉庫中應(yīng)用。4、成本高,要求治理層必須要有專門高的戰(zhàn)略眼光。為滿足許多數(shù)據(jù)發(fā)覺系統(tǒng)的計算要求,需要在硬件、操作系統(tǒng)軟件上采納并行技術(shù)。這些性能要求將大大增加數(shù)據(jù)挖掘的成本。針對這一情況,企業(yè)領(lǐng)導(dǎo)必須提高認(rèn)識,為電子商務(wù)中應(yīng)用數(shù)據(jù)挖掘技術(shù)提供可靠的物力和財力支撐。5、商業(yè)分析員的技能和

49、素養(yǎng)較差。商業(yè)分析員需要豐富的業(yè)務(wù)知識,并具有極強的調(diào)查能力,同時還有制造力。制造性同意商業(yè)分析員實驗各種數(shù)據(jù)挖掘技術(shù),一邊發(fā)覺大量潛在的模式和關(guān)系。然后分析并了解它,最后生成預(yù)測模型并按永和容易理解的方式公布。因此,企業(yè)必須對商業(yè)分析員進行綜合培訓(xùn),提高分析問題的能力。4.5數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用的前景隨著計算機硬件和軟件的并行進展,數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用會越來越廣泛。在激烈的市場競爭環(huán)境下,能否運用好數(shù)據(jù)挖掘技術(shù),是電子商務(wù)網(wǎng)站能否成功的關(guān)鍵所在。數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的關(guān)鍵性以被越來越多的企業(yè)所認(rèn)同。毫無疑問,數(shù)據(jù)挖掘技術(shù)在電子商務(wù)時代會得到更大的進展。第5章 結(jié)語隨著網(wǎng)

50、絡(luò)的進展和信息化時代的到來,Web產(chǎn)生了海量的數(shù)據(jù),如何有效的組織和利用這些數(shù)據(jù),建設(shè)個性化網(wǎng)站,為用戶提供個性化的服務(wù)是電子商務(wù)網(wǎng)站建設(shè)的重點。數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中表現(xiàn)了它極大的優(yōu)越性。本文只是粗淺的介紹了它在電子商務(wù)中的應(yīng)用。隨著人們認(rèn)識的增加和數(shù)據(jù)挖掘技術(shù)的完善,數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用會更加的廣泛。 參考文獻1 劉魯. 信息系統(tǒng):原理、方法與應(yīng)用M.北京:高等教育出版社,2006.2 邵兵家. 電子商務(wù)概論M. 北京:高等教育出版社,2006. 3 /view/757.htm.4 /question/6098047.html?fr=ala0.5 www.iR.6 夏小云. C

51、2C 電子商務(wù)數(shù)據(jù)挖掘的研究及應(yīng)用C. 江西理工大學(xué) 2007.7 牛紅慧,金顯華. Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用J .濮陽職業(yè)技術(shù)學(xué)院學(xué)報, 2006(3).8 毛國君,段立娟,王實,石云. 數(shù)據(jù)挖掘原理與算法M. 北京:清華大學(xué)出版,2005(1).9 劉菲,李玲. 數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系治理中的應(yīng)用研究J. 產(chǎn)業(yè)與科技論壇,2009(8).10 朱明數(shù)據(jù)挖掘2002:129-13011 王核成,許水龍治理人員的綜合測評方法研究J華東經(jīng)濟治理,2001(2):40-4112 張璐. 數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用J. 電腦知識與科技,2005(12).13 丁燕華. 關(guān)聯(lián)規(guī)則挖掘在電子

52、商務(wù)中的應(yīng)用研究J. 現(xiàn)代商業(yè),2009(10).14 張建宏. 電子商務(wù)網(wǎng)站的數(shù)據(jù)挖掘J . 湖州職業(yè)技術(shù)學(xué)院學(xué)報,2005(1).15 姚國章. 電子商務(wù)與企業(yè)治理M.北京:北京大學(xué)出版社,2002.16 張文宇,賈嶸. 數(shù)據(jù)挖掘與粗糙集方法M . 西安:西安電子科技大學(xué)出版社,2006(1).17 ZJAlexBerson著,贅擴奇等譯,構(gòu)建面向cRM的數(shù)據(jù)挖掘應(yīng)用,北京:人民郵電出版社,2001.96-110. 指導(dǎo)教師意見(包括選題的意義,資料收集或?qū)嶒灧椒ā?shù)據(jù)處理等方面的能力,論證或?qū)嶒炇欠窈侠?,要緊觀點或結(jié)果是否正確,有何獨到的見解或新的方法,基礎(chǔ)理論、專業(yè)知識的掌握程度及寫作

53、水平等,并就該論文是否達(dá)到本科畢業(yè)論文水平做出評價)薛云霞同學(xué)的選題為“數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用”,數(shù)據(jù)挖掘技術(shù)是電子商務(wù)領(lǐng)域熱點問題,選題具有明顯的應(yīng)用價值。該同學(xué)在論文撰寫過程中,運用了文獻調(diào)研、理論分析、事例比較等方法對研究主體進行了概括總結(jié)和歸納分析,同時也采取了引證、例證的方法,分析了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用,并對其進行系統(tǒng)分析,系統(tǒng)全面地闡述論題,對今后我國企業(yè)在電子商務(wù)中運用數(shù)據(jù)挖掘技術(shù)提供一定的參考,更好在電子商務(wù)網(wǎng)站中運用數(shù)據(jù)挖掘技術(shù)。該論文觀點明確,論據(jù)豐富,條理清晰,結(jié)構(gòu)嚴(yán)謹(jǐn),語言通順,專業(yè)知識運用得當(dāng),體現(xiàn)出較高的專業(yè)素養(yǎng)及較好的寫作水平,達(dá)到了本科生畢業(yè)論

54、文的要求。作者的要緊觀點正確,分析比較透徹,結(jié)構(gòu)合理,對策建議有可操作性。論文條理清晰,論述充分,文字通順,層次分明,思路清晰,具有較好的寫作水平。達(dá)到了本科畢業(yè)論文水平。成績: 指導(dǎo)教師(簽名): 2010 年 5 月 6 日注:成績按優(yōu)、良、中、合格、不合格五級分制計。評閱人意見(包括選題的意義,資料收集或?qū)嶒灧椒?、?shù)據(jù)處理等方面的能力,論證或?qū)嶒炇欠窈侠恚o觀點或結(jié)果是否正確,有何獨到的見解或新的方法,基礎(chǔ)理論、專業(yè)知識的掌握程度及寫作水平等,并就該論文是否達(dá)到本科畢業(yè)論文水平做出評價)薛云霞同學(xué)的選題為:數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用。論文的選題合理。國內(nèi)的Web挖掘起步較晚,這些研

55、究重點在局部的挖掘算法的設(shè)計、分析和改進上,較少對數(shù)據(jù)挖掘系統(tǒng)自身的、開發(fā)模式進行系統(tǒng)地論述,要緊研究內(nèi)容有路徑分析、關(guān)聯(lián)規(guī)則、序列模式、聚類和分類分析等。本文分析了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用以及應(yīng)用現(xiàn)狀,發(fā)覺了一些問題并給出了解決方案,對我國企業(yè)在電子商務(wù)環(huán)境下運用數(shù)據(jù)挖掘技術(shù)有著重要的理論和實踐意義。資料翔實,論文論證合理,要緊觀點和結(jié)論正確。對差不多概念的運用準(zhǔn)確,基礎(chǔ)理論、專業(yè)知識掌握準(zhǔn)確無誤。文章思路清晰,語言流暢,沒有語法錯誤和錯不字,論述清晰,建議的策略具有可操作性。 總之,該論文選題正確,結(jié)構(gòu)合理,內(nèi)容豐富,數(shù)據(jù)資料充分,分析透徹,寫作進度安排合理,結(jié)論和建議具有區(qū)域現(xiàn)實意

56、義,符合本科畢業(yè)論文要求。 成績: 評閱人(簽名): 2010 年 5 月10 日注:成績按優(yōu)、良、中、合格、不合格五級分制計。答辯委員會意見(應(yīng)依照論文內(nèi)容和答辯情況,并參考指導(dǎo)教師意見、評閱人意見對論文的綜合水平做出具體評價)薛云霞同學(xué)的選題為:數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用。論文選題合理。論文表明,論文對電子商務(wù)中應(yīng)用數(shù)據(jù)挖掘技術(shù)問題進行了比較深入的研究。作者對相關(guān)領(lǐng)域?qū)I(yè)知識比較熟悉,并能按期完成論文的各項工作,能較好地綜合運用所學(xué)理論和專業(yè)知識,內(nèi)容較豐富,立論正確,分析,結(jié)論合理;有一定的獨立工作能力,科學(xué)作風(fēng)良好;論文有一定的水平。論文條理清晰,論述充分,文字通順,符合技術(shù)用語要

57、求,書寫工整,格式規(guī)范。答辯時,思路清晰,論點正確;能差不多正確回答問題。經(jīng)答辯委員會討論,一致同意該同學(xué)達(dá)到了學(xué)士學(xué)位畢業(yè)水平,通過答辯。成績: 答辯委員會主任(簽名): 2010 年 5 月 18 日學(xué)院學(xué)位分委員會意見綜合指導(dǎo)老師、評閱老師的關(guān)于薛云霞同學(xué)的“數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用”一文的寫作意見以及答辯委員會的答辯意見,經(jīng)學(xué)院分委員會討論一致同意薛云霞同學(xué)通過論文答辯,建議授予學(xué)士學(xué)位。 成績: 學(xué)位分委員會主任(簽名): (公章) 2010 年 5 月 20 日注:成績按優(yōu)、良、中、合格、不合格五級分制計。山東師范大學(xué)本科畢業(yè)論文(設(shè)計)題目審批表學(xué)院:治理與經(jīng)濟學(xué)院(章)

58、系不/教研室: 治理系 時刻:2009 年 12月 15 日課題情況題目名稱數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用課題性質(zhì)A基礎(chǔ)研究 B基礎(chǔ)應(yīng)用研究 C應(yīng)用研究教師姓名曲建華職稱講師學(xué)位碩士課題來源A.科研 B.生產(chǎn) C.教學(xué) D.學(xué)生自擬 E.其它成果類不A.論文 B.設(shè)計要緊研究內(nèi)容與研究目標(biāo)要緊內(nèi)容:本文先從電子商務(wù)的差不多概念和存在的問題從手,進而引出了數(shù)據(jù)挖掘的差不多概念和分析了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用的必要性和可行性。然后詳細(xì)的研究了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用,并介紹了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)應(yīng)用的現(xiàn)狀同時給出了我自己關(guān)于解決這些問題的建議。研究目標(biāo):本文通過闡述電子商務(wù)中現(xiàn)狀,引出了

59、數(shù)據(jù)挖掘技術(shù)。要緊介紹了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)的應(yīng)用,并對出現(xiàn)的問題提出了相應(yīng)的對策,關(guān)于企業(yè)學(xué)習(xí)先進的思想和經(jīng)驗,改進在電子商務(wù)中運用數(shù)據(jù)挖掘技術(shù)實施過程的不足之處,進而成功的運用數(shù)據(jù)挖掘技術(shù)有著重要的指導(dǎo)作用。 指導(dǎo)教師(簽名): 2010年 1 月10 日 選題學(xué)生(簽名): 2010年 1 月10 日系所或教研室審題意見同意負(fù)責(zé)人(簽名): 2010年 1 月 12 日學(xué)院審批意見同意學(xué)院學(xué)位分委員會主任(簽名): 2010 年 1 月 14 日山東師范大學(xué)本科畢業(yè)論文(設(shè)計)開題報告論文題目:數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中 的應(yīng)用 學(xué)院名稱: 治理與經(jīng)濟學(xué)院 專 業(yè): 信息治理與信息系統(tǒng)

60、學(xué)生姓名: 薛云霞 學(xué) 號: 200602410089 指導(dǎo)教師: 曲建華 2010 年 1 月 8日一、選題的性質(zhì) 基礎(chǔ)應(yīng)用研究二、選題的目的和意義目前國內(nèi)的電子商務(wù)網(wǎng)站進展的勢頭專門好。然而隨著網(wǎng)絡(luò)的迅速進展,Web產(chǎn)生了大量的冗余信息。如何從這些冗余的信息中提取有用的信息,發(fā)覺用戶的興趣,為用戶提供針對性的服務(wù)成為電子商務(wù)進展的關(guān)鍵問題。數(shù)據(jù)挖掘技術(shù)應(yīng)用于電子商務(wù)中這是在一背景下產(chǎn)生的。目前我國數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用還不是專門廣泛。針對這一個問題,本文要緊介紹了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用,發(fā)覺了一些問題并給出了解決方法,對我國今后的電子商務(wù)進展具有深遠(yuǎn)的指導(dǎo)意義。三、與本課題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論