


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
計算機Web數(shù)據(jù)挖掘技術(shù)在現(xiàn)代商業(yè)中的應(yīng)用論文[關(guān)鍵詞]數(shù)據(jù)挖掘人工智能載體
一、web數(shù)據(jù)挖掘概述
web挖掘是從web資源上抽取信息或?qū)W問的過程,它是將傳統(tǒng)的數(shù)據(jù)挖掘的思想和方法應(yīng)用于web,從web文檔和web活動中抽取感愛好的、潛在的、有用的模式和隱蔽信息。web挖掘可在多方面發(fā)揮作用,如搜尋引擎結(jié)構(gòu)的挖掘,搜尋引擎的開發(fā),改進和提高搜尋引擎的質(zhì)量和效率,確定權(quán)威頁面。web挖掘討論掩蓋了多個討論領(lǐng)域,包括數(shù)據(jù)庫技術(shù)、信息獵取技術(shù)、統(tǒng)計學(xué)、人工智能中的機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等。特殊是電子商務(wù)領(lǐng)域,通過對用戶特征的理解和分析,如對用戶訪問行為、頻度、內(nèi)容等的分析,提取出用戶的特征,從而為用戶定制共性化的界面,有助于開展有針對性的電子商務(wù)活動。
二、web挖掘流程以及特點
1.web挖掘的流程
web數(shù)據(jù)挖掘就是利用數(shù)據(jù)挖掘技術(shù)從網(wǎng)絡(luò)文檔和服務(wù)中發(fā)覺和提取信息。與傳統(tǒng)數(shù)據(jù)和數(shù)據(jù)倉庫相比,web上的信息是非結(jié)構(gòu)化或半結(jié)構(gòu)化的、動態(tài)的、并且是簡單造成混淆的,所以很難直接以web網(wǎng)頁上的數(shù)據(jù)進行數(shù)據(jù)挖掘,而必需經(jīng)過必要的數(shù)據(jù)處理。web挖掘的有以下幾個過程:
(1)資源發(fā)覺。任務(wù)是從目標(biāo)web文檔中得到數(shù)據(jù),值得留意的是有時信息資源不僅限于在線web文檔,還包括電子郵件、電子文檔、新聞組,或者網(wǎng)站的日志數(shù)據(jù)甚至是通過web形成的交易數(shù)據(jù)庫中的數(shù)據(jù)。wwW.133229.COM
(2)信息選擇和預(yù)處理。任務(wù)是從取得的web資源中剔除無用信息和將信息進行必要的例如從web文檔中自動去除廣告連接、去除多余格式標(biāo)記、自動識別段落或者字段并將數(shù)據(jù)組織成規(guī)整的規(guī)律形式甚至是關(guān)系表。
(3)模式發(fā)覺。自動進行模式發(fā)覺??梢栽谕粋€站點內(nèi)部或在多個站點之間進行。
(4)模式分析。驗證、解釋上一步驟產(chǎn)生的模式??梢允菣C器自動完成,也可以是與分析人員進行交互來完成。
2.web挖掘的特點
web挖掘技術(shù)具有很多優(yōu)點,如不需要用戶供應(yīng)主觀的評價信息;可以處理大規(guī)模的數(shù)據(jù)量;用戶訪問模式動態(tài)獵取,不會過時;使用便利等。但是與傳統(tǒng)數(shù)據(jù)庫和數(shù)據(jù)倉庫相比,web是一個巨大、分布廣泛、全球性的信息服務(wù)中心,涉及經(jīng)濟、文化、訓(xùn)練、新聞、廣告、消費、消遣、金融、保險、銷售、電子商務(wù)等信息,內(nèi)容極其豐富,數(shù)據(jù)最大特點就是半結(jié)構(gòu)化;而傳統(tǒng)的數(shù)據(jù)庫中的數(shù)據(jù)結(jié)構(gòu)性很強,即其中的數(shù)據(jù)為完全結(jié)構(gòu)化的數(shù)據(jù)。明顯,面對web的數(shù)據(jù)挖掘比面對單個數(shù)據(jù)倉庫的數(shù)據(jù)挖掘要簡單得多,會面臨許多詳細(xì)問題,主要有:
(1)半結(jié)構(gòu)化數(shù)據(jù)。web頁面以某種格式呈現(xiàn)的半結(jié)構(gòu)化數(shù)據(jù),其數(shù)據(jù)結(jié)構(gòu)不規(guī)章或不完整,簡單程度遠(yuǎn)遠(yuǎn)高于一般的文本文檔,其數(shù)據(jù)結(jié)構(gòu)隱含、模式信息量大、模式變化快。大量的文檔無任何排列次序,無分類索引。
(2)web是一個異質(zhì)、分布、動態(tài)的信息源。web及其數(shù)據(jù)的更新、增長速度極快,也無固定的模式。web上的信息幾乎都是隱蔽的、潛在的、未知的,從web上發(fā)覺這些未知的信息和有用的模式,僅用傳統(tǒng)的基于關(guān)鍵字的檢索方式很難實現(xiàn),現(xiàn)在的搜尋引擎尚不具備這些功能。
(3)面對一個特別廣泛的形形色色的用戶群體。不同的用戶訪問web的愛好、愛好和使用目的千差萬別,面對一個特別廣泛的形形色色的用戶群體,能否使用戶依據(jù)自己的愛好愛好定制網(wǎng)頁,甚至能否依據(jù)發(fā)覺的用戶。自動為用戶定制網(wǎng)頁,從而供應(yīng)共性化的信息檢索和查詢服務(wù)。
3.web挖掘在電子商務(wù)中的應(yīng)用
目前對于,web挖掘的對象和使用的方法層出不窮,但隨著電子商務(wù)網(wǎng)站的興起,電子商務(wù)將是將來web挖掘的主要進展方向之一,因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價值。在當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時,企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù),這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ),同時高性能計算機和高傳輸速率網(wǎng)絡(luò)的使用也給數(shù)據(jù)挖掘技術(shù)供應(yīng)了堅實的'保障。介紹以下幾個方面的應(yīng)用:
(1)分析查找獲得潛在客戶。隨著以客戶為中心的經(jīng)營理念不斷深化人心,分析客戶、了解客戶并引導(dǎo)客戶的需求已成為企業(yè)經(jīng)營的重要課題。通過對電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進行分析,可以按各種客戶指標(biāo)(如自然屬性、收入貢獻(xiàn)交易額、價值度等)對客戶分類,然后確定不同類型客戶的行為模式,以便實行相應(yīng)的營銷措施,促使企業(yè)利潤的最大化。
比如通過數(shù)據(jù)挖掘可以發(fā)覺購買某種商品的消費者是男性還是女性,學(xué)歷、收入如何,有什么愛好,是什么職業(yè)等等。甚至可以發(fā)覺不同的人在購買該種商品的相關(guān)商品后多長時間有可能購買該種商品,以及什么樣的人會購買什么型號的該種商品等等?;蛟S許多因素表面上看起來和購買該種商品不存在任何聯(lián)系,但數(shù)據(jù)挖掘的結(jié)果卻證明他們之間有聯(lián)系。在采納了數(shù)據(jù)挖掘后,針對目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的提高,推銷的成本將大大降低。
在對web的客戶訪問信息的挖掘中,利用分類技術(shù)可以在internet上找到將來的潛在客戶,獲得這些潛在的客戶市場。通常的策略是先對己經(jīng)存在的訪問者進行分類,一般分為三種:“nocustomer”、“visitoronce”“visitorregular”。對于一個新的訪問者,通過在web上的分類發(fā)覺,識別出這個客戶與己經(jīng)分類的老客戶的一些公共的描述,從而對這個新客戶進行正確的分類。然后從它的分類推斷這個新客戶是屬于有利可圖的客戶群,還是屬于無利可圖的客戶群,打算是否要把這個新客戶作為潛在的客戶來對待。客戶的類型確定后,就可以對客戶動態(tài)地展現(xiàn)web頁面,頁面的內(nèi)容取決于客戶與銷售商供應(yīng)的產(chǎn)品和服務(wù)之間的關(guān)聯(lián)。
(2)保留客戶。數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類,在每個類里的客戶擁有相像的屬性,而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶供應(yīng)完全不同的服務(wù)來提高客戶的滿足度。數(shù)據(jù)挖掘還可以發(fā)覺具有哪些特征的客戶有可能流失,這樣挽留客戶的措施將具有針對性,挽留客戶的費用將下降。對客戶來說,傳統(tǒng)客戶與銷售商之間的空間距離在電子商務(wù)中己經(jīng)不存在了。在網(wǎng)上,每一個銷售商對于客戶來說都是一樣的,那么如何使客戶在自己的銷售站點上駐留更長的時間,對銷售商來說將是一個挑戰(zhàn)。為了達(dá)到這一目的,就應(yīng)當(dāng)了解客戶的掃瞄行為,知道客戶的愛好及需求所在,動態(tài)地調(diào)整web頁面,以滿意客戶的需要。通過對客戶訪問信息的挖掘,就能知道客戶的掃瞄行為,從而了解客戶的愛好及需求。在網(wǎng)上的電子商務(wù)中的一個典型的序列,恰好就代表了一個購物者以頁面形式在站點上導(dǎo)航的行為,所以可運用web數(shù)據(jù)挖掘中的序列模式發(fā)覺技術(shù)。
(3)聚類客戶。在電子商務(wù)中客戶聚類是一個重要的方面。通過分組具有相像掃瞄行為的客戶,并分析組中客戶的共同特征,可以關(guān)心電子商務(wù)的組織者更好地了解自己的客戶,向客戶供應(yīng)更適合、更面對客戶的服務(wù)。例如,有一些客戶都花了一段時間掃瞄“babytoys”“babyfurniture”頁面,經(jīng)過分析這些客戶被聚類成為一組。銷售商依據(jù)分析出來的聚類信息,就知道這是一組“expectingparents”客戶,對他們所進行的業(yè)務(wù)活動當(dāng)然也就不行能同于其他被聚類了的客“collegestudents”、“officeladies”。準(zhǔn)時調(diào)整頁面及頁面內(nèi)容,使商務(wù)活動能夠在肯定程度上滿意客戶的要求,對客戶和銷售商來說更有意義。
(4)交叉銷售與共性服務(wù)。交叉銷售的好處在于,對于原有客戶,企業(yè)可以比較簡單地得到關(guān)于這個客戶的比較豐富的信息,大量的數(shù)據(jù)對于數(shù)據(jù)挖掘的精確?????性來說是有很大關(guān)心的。在企業(yè)所把握的客戶信息,尤其是以前購買行為的信息中,可能正包含著這個客戶打算他下一個購買行為的關(guān)鍵,甚至是打算因素。這個時候數(shù)據(jù)挖掘的作用就會體現(xiàn)出來,它可以關(guān)心企業(yè)查找到這些影響他購買行為的因素。
當(dāng)客戶在電子商務(wù)網(wǎng)站注冊時,客戶將會看到帶有客戶姓名的歡迎詞”依據(jù)客戶的訂單紀(jì)錄,系統(tǒng)可以向客戶顯示那些可能引起客戶特別愛好的新商品。當(dāng)客戶留意到一件特別的商品時,系統(tǒng)會建議一些在購買中可以增加的其他商品。一般的產(chǎn)品名目手冊經(jīng)常簡潔的按類型對商品進行分組,以簡化客戶選擇商品的步驟。然而對于在線商店,商品分組可能是完全不同的,它經(jīng)常以針對客戶的商品補充條目為基礎(chǔ),不僅考慮客戶看
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國水洗設(shè)備行業(yè)市場規(guī)模及投資前景預(yù)測分析報告
- 烏魯木齊機制炭項目可行性分析報告
- 2025-2030年中國煙霧煙花行業(yè)深度研究分析報告
- 2025年海運行業(yè)市場趨勢分析報告
- 2025年中國齒輪攻絲機行業(yè)市場前景預(yù)測及投資價值評估分析報告
- 2025年中國骨水泥肘關(guān)節(jié)假體行業(yè)市場前景預(yù)測及投資價值評估分析報告
- 2025年度住房租賃分析報告
- 四川省成都市新都區(qū)2023-2024學(xué)年五年級下學(xué)期語文期末試卷(含答案)
- 2025成都市商品房銷售代理合同
- 2025版的車庫租賃合同范本
- 青銅器科普宣傳
- 《大學(xué)生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)教程》第六章創(chuàng)業(yè)資源與融資
- 山水林田湖草生態(tài)環(huán)境調(diào)查技術(shù)規(guī)范DB41-T 1992-2020
- 大眾旅游服務(wù)質(zhì)量控制手冊
- GB/T 44421-2024矯形器配置服務(wù)規(guī)范
- 大型活動策劃與管理第八章 大型活動風(fēng)險管理
- Q∕GDW 12165-2021 高海拔地區(qū)運維檢修裝備配置規(guī)范
- JGJ107-2016鋼筋機械連接技術(shù)規(guī)程
- 婦科醫(yī)生進修匯報課件
- 動態(tài)分析與設(shè)計實驗報告總結(jié)
- 2024年江蘇省泰州市海陵區(qū)中考一模數(shù)學(xué)試卷
評論
0/150
提交評論