![探析電子商務(wù)中數(shù)據(jù)挖掘方法的應(yīng)用_第1頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/15/d431c8f2-622c-4451-8395-e53458226372/d431c8f2-622c-4451-8395-e534582263721.gif)
![探析電子商務(wù)中數(shù)據(jù)挖掘方法的應(yīng)用_第2頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/15/d431c8f2-622c-4451-8395-e53458226372/d431c8f2-622c-4451-8395-e534582263722.gif)
![探析電子商務(wù)中數(shù)據(jù)挖掘方法的應(yīng)用_第3頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/15/d431c8f2-622c-4451-8395-e53458226372/d431c8f2-622c-4451-8395-e534582263723.gif)
![探析電子商務(wù)中數(shù)據(jù)挖掘方法的應(yīng)用_第4頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/15/d431c8f2-622c-4451-8395-e53458226372/d431c8f2-622c-4451-8395-e534582263724.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、探析電子商務(wù)中數(shù)據(jù)挖掘方法的應(yīng)用摘要: 電子商務(wù)是現(xiàn)代商業(yè)的主流趨勢,如何充分利用絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)發(fā)揮優(yōu)勢,成為制勝的法寶。 本文介紹了常用的數(shù)據(jù)挖掘方法, 以及在電子商務(wù)領(lǐng)域的應(yīng)用,分析了利用數(shù)據(jù)挖掘技術(shù)建設(shè)動態(tài)、高效電子商務(wù)的可行性。關(guān)鍵詞:數(shù)據(jù)挖掘 電子商務(wù) 數(shù)據(jù)庫一、引言電子商務(wù)是指以 Internet 絡(luò)為載體、利用數(shù)字化電子方式開展的商務(wù)活動。隨著絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)的飛速發(fā)展, 電子商務(wù)正顯示越來越強(qiáng)大的生命力。 電子商務(wù)的發(fā)展促使公司內(nèi)部收集了大量的數(shù)據(jù), 并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識, 為公司創(chuàng)造更多潛在的利潤。 利用數(shù)據(jù)挖掘技術(shù)可以有效地幫助分析從上獲取的大
2、量數(shù)據(jù), 發(fā)現(xiàn)隱藏在其后的規(guī)律性, 提取出有效信息, 進(jìn)而指導(dǎo)調(diào)整營銷策略,給客戶提供動態(tài)的個性化的高效率服務(wù)。二、數(shù)據(jù)挖掘技術(shù)1. 數(shù)據(jù)挖掘數(shù)據(jù)挖掘 (Data Mining) ,又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn) (Knowledge Discovery in Database, KDD) ,是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、 人們事先不知道的, 但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科, 它匯聚了不同領(lǐng)域尤其是數(shù)據(jù)庫、 人工智能、數(shù)理統(tǒng)計、可視化、并行計算等方面的知識。數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用領(lǐng)域, 它不僅是面向特定數(shù)據(jù)庫的簡單檢索
3、查詢調(diào)用, 而且,要對數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,以指定實(shí)際問題的求解,企圖發(fā)現(xiàn)事件間的相互關(guān)聯(lián), 甚至利用已有的數(shù)據(jù)對未來的活動進(jìn)行預(yù)測。 數(shù)據(jù)挖掘技術(shù)在金融、 保險、電信、大型超市等積累有大量數(shù)據(jù)的電子商務(wù)行業(yè)有著廣泛的應(yīng)用,如信用分析、風(fēng)險分析、欺詐檢驗(yàn)、用戶聚類分析、消費(fèi)者習(xí)慣分析等。2. 數(shù)據(jù)挖掘過程挖掘數(shù)據(jù)過程可以分為3 個步驟:數(shù)據(jù)預(yù)處理、模式發(fā)現(xiàn)、模式分析。(1) 數(shù)據(jù)預(yù)處理。實(shí)際系統(tǒng)中的數(shù)據(jù)一般都具有不完全性、 冗余性和模糊性。因此,數(shù)據(jù)挖掘一般不對原始數(shù)據(jù)進(jìn)行挖掘, 要通過預(yù)處理提供準(zhǔn)確、 簡潔的數(shù)據(jù)。預(yù)處理主要完成以下工作: 包括合并數(shù)據(jù), 將多個
4、文件或多個數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行合并處理;選擇數(shù)據(jù),提取出適合分析的數(shù)據(jù)集合;數(shù)據(jù)清洗、過濾,剔除一些無關(guān)記錄, 將文件、圖形、圖像及多媒體等文件轉(zhuǎn)換成可便于數(shù)據(jù)挖掘的格式等。(2) 模式發(fā)現(xiàn)。模式發(fā)現(xiàn)階段就是利用挖掘算法挖掘出有效的、新穎的、潛在的、有用的以及最終可以理解的信息和知識。 可用于 Web的挖掘技術(shù)有路徑選擇、關(guān)聯(lián)分析、分類規(guī)則、聚類分析、序列分析、依賴性建模等等。(3) 模式分析。模式分析是從模式發(fā)現(xiàn)階段獲得的模式、規(guī)則中過濾掉不感興趣的規(guī)則和模式。 通過技術(shù)手段, 對得到的模式進(jìn)行數(shù)據(jù)分析, 得出有意義的結(jié)論。常用的技術(shù)手段有:關(guān)聯(lián)規(guī)則、分類、聚類、序列模式等。三、電子商務(wù)中幾種
5、常用的數(shù)據(jù)挖掘方法1. 關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘研究的主要模式之一,側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的關(guān)系,找出滿足給定條件下的多個域間的依賴關(guān)系。 關(guān)聯(lián)規(guī)則挖掘?qū)ο笠话闶谴笮蛿?shù)據(jù)庫,該規(guī)則一般表示式為: A1A2 Am=>B1B2 Bm,其中, Ak(k=1,2, , m) , Bj(j=1,2, ,n) 是 數(shù) 據(jù) 庫 中 的 數(shù) 據(jù) 項(xiàng) 。 有 Support(A=>B)=P(A B),Confidence(A=>B)=P(A|B) 。數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián), 即根據(jù)一個事務(wù)中某些數(shù)據(jù)項(xiàng)的出現(xiàn)可以導(dǎo)出另一些數(shù)據(jù)項(xiàng)在同一事務(wù)中的出現(xiàn)。關(guān)聯(lián)分析的目的是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。
6、 關(guān)聯(lián)規(guī)則用于尋找在同一個事件中出現(xiàn)的不同項(xiàng)的相關(guān)性,比如在一次購買活動中所買不同商品的相關(guān)性。關(guān)聯(lián)分析的典型例子是購物籃分析, 描述顧客的購買行為, 可以幫助零售商決定商品的擺放和捆綁銷售策略。 如著名的 ( 面包 +黃油牛奶 ) 例子就屬于關(guān)聯(lián)分析:在超市中, 90%的顧客在購買面包和黃油的同時, 也會購買牛奶。 直觀的意義是:顧客在購買某種商品時有多大的傾向會購買另外一些商品。 找出所有類似的關(guān)聯(lián)規(guī)則,對于確定生產(chǎn)銷售、產(chǎn)品分類設(shè)計、市場分析等多方面是有價值的。2. 聚類分析方法類聚分析就是直接比較樣本中各事物之間的性質(zhì), 將性質(zhì)相近的歸為一類,而將性質(zhì)差別較大的分在不同的類。 對變量聚
7、類計算變量之間的距離, 對樣本聚類則計算樣本之間的距離。 它的目的是使得屬于同一類別的個體之間的距離盡可能小,而不同類別上的個體間的距離盡可能大。聚類分析用于把有相似特性的客戶、 數(shù)據(jù)項(xiàng)集合到一起。 在電子商務(wù)中 , 聚類分析常用于市場細(xì)分。 根據(jù)已有客戶的數(shù)據(jù), 利用聚類技術(shù)將市場按客戶消費(fèi)模式的相似性分為若干細(xì)分市場, 以進(jìn)行有針對性的市場營銷, 提供更適合、 更滿意的服務(wù)。如自動給一個特定的客戶聚類發(fā)送銷售郵件, 為一個客戶聚類動態(tài)地改變一個特殊的站點(diǎn)等。 通過對聚類的客戶特征的提取, 電子商務(wù)站還可以為客戶提供個性化的服務(wù)。3. 分類分析分類系統(tǒng)是基于遺傳算法的機(jī)器學(xué)習(xí)中的一類,它包括
8、一個簡單的基于串規(guī)則的并行生成子系統(tǒng)、 規(guī)則評價子系統(tǒng)和遺傳算法子系統(tǒng)。 分類系統(tǒng)正在被人們越來越多地應(yīng)用于科學(xué)、 工程和經(jīng)濟(jì)領(lǐng)域中, 是目前遺傳算法研究領(lǐng)域中一個非?;钴S的領(lǐng)域。分類分析是數(shù)據(jù)挖掘中應(yīng)用最多的方法。分類要解決的問題是為一個事件或?qū)ο髿w類, 既可以用于分析已有的數(shù)據(jù),也可以用來預(yù)測未來的數(shù)據(jù)。分類通過分析已知分類信息的歷史數(shù)據(jù), 總結(jié)出一個預(yù)測模型, 預(yù)測哪些人可能會對郵寄廣告、產(chǎn)品目錄等有反應(yīng), 可以針對這一類客戶的特點(diǎn)展開商務(wù)活動, 提供個性化的信息服務(wù)。4. 序列模式序列模式挖掘就是要挖掘出交易集之間有時間序列關(guān)系的模式。它挖掘的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后或因果關(guān)系,找到
9、那些“一些項(xiàng)跟隨另一些項(xiàng)”,以預(yù)測未來的訪問模式。 序列模式分析和關(guān)聯(lián)分析類似,其目的也是為了挖掘數(shù)據(jù)之間的,但序列模式分析的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后序列關(guān)系。它能發(fā)現(xiàn)數(shù)據(jù)庫中形如“在某一段時間內(nèi),顧客購買商品A,接著購買商品B,而后購買商品 C,即序列 A-B-C 出現(xiàn)的頻率較高”之類的知識。序列模式分析描述的問題是:在給定交易序列數(shù)據(jù)庫中, 每個序列是按照交易時間排列的一組交易集,挖掘序列函數(shù)作用在這個交易序列數(shù)據(jù)庫上,返回該數(shù)據(jù)庫中出現(xiàn)的高頻序列。在進(jìn)行序列模式分析時,同樣也需要有用戶輸入最小置信度C 和最小支持度 S。序列模式便于進(jìn)行電子商務(wù)的組織,預(yù)測客戶的訪問模式,對客戶開展有針對性的廣告服務(wù)或者主動推薦客戶感興趣的頁面,以滿足訪問者的特定要求。四、結(jié)束語電子商務(wù)是現(xiàn)代信息技術(shù)發(fā)展的必然結(jié)果,也是未來商業(yè)運(yùn)作模式的必然選擇。利用數(shù)據(jù)挖掘技術(shù)來分析大量的數(shù)據(jù),可以挖掘出商品的消費(fèi)規(guī)律與客戶的訪問模式,幫助制定有效的營銷策略,充分發(fā)揮的獨(dú)特優(yōu)勢,促進(jìn)管理創(chuàng)新和技術(shù)創(chuàng)新,提高競爭力。隨著電子商務(wù)發(fā)展的勢頭越來越強(qiáng)勁 , 面向電子商務(wù)的數(shù)據(jù)挖掘?qū)⑹且粋€非常有前景的領(lǐng)域。 它能自動預(yù)測客戶的消費(fèi)趨勢、 市場走向, 指導(dǎo)建設(shè)個性化智能站,帶來巨大的商業(yè)利潤, 可以為創(chuàng)建新的商業(yè)增長點(diǎn)。 但是在面向電子
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山西省2024七年級道德與法治上冊第二單元成長的時空第四課幸福和睦的家庭情境基礎(chǔ)小練新人教版
- 2025年臨時租房協(xié)議考研范文(2篇)
- 2025年倉儲租賃合同例文(三篇)
- 游戲廳裝修工程協(xié)議
- 主題公園商鋪居間合同
- 體育館裝修施工合同協(xié)議書
- 鹽田古典聲學(xué)裝修施工方案
- 機(jī)場候機(jī)廳墻面裝修協(xié)議
- 木材短途運(yùn)輸協(xié)議
- 服裝店內(nèi)部裝修項(xiàng)目協(xié)議
- Unit 2 Last weekend C Story time (教學(xué)設(shè)計)人教PEP版英語六年級下冊
- 2024年上海市普通高中學(xué)業(yè)水平等級性考試化學(xué)試卷(含答案)
- DZ∕T 0153-2014 物化探工程測量規(guī)范(正式版)
- 奧派直播電商仿真實(shí)訓(xùn)軟件操作手冊
- 2024年度-美團(tuán)新騎手入門培訓(xùn)
- 化妝品祛痘功效評價
- 語文新課標(biāo)背景下單元整體教學(xué):六下第4單元大單元設(shè)計
- 高一數(shù)學(xué)寒假講義(新人教A專用)【復(fù)習(xí)】第05講 三角函數(shù)(學(xué)生卷)
- 皮下注射的并發(fā)癥及預(yù)防
- 羅沙司他治療腎性貧血的療效與安全性評價演示稿件
- 農(nóng)村高中思想政治課時政教育研究的中期報告
評論
0/150
提交評論