- 相關(guān)推薦
談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
[摘要]電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),按企業(yè)既定業(yè)務(wù)目標(biāo)對這些數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘可以幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素。文章先容了數(shù)據(jù)挖掘技術(shù),以實(shí)例分析了數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用,并先容了在電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)。。坳P(guān)鍵詞]電子商務(wù);數(shù)據(jù)挖掘;路徑分析
隨著Internet 的普及,電子商務(wù)的興起,人們的商務(wù)理念正在改變, 電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),如何更快、更好地利用各種有效的數(shù)據(jù)更好地開展電子商務(wù),這是目前電子商務(wù)急需解決的題目。
一 、數(shù)據(jù)挖掘技術(shù)
20 世紀(jì) 90 年代以來,隨著信息技術(shù)和數(shù)據(jù)庫技術(shù)的迅猛發(fā)展,人們可以非常方便地獲取和存儲(chǔ)大量的數(shù)據(jù)。面對大規(guī)模的海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析工具(如治理信息系統(tǒng))只能進(jìn)行一些表層的處理(如查詢、統(tǒng)計(jì)等),而不能獲得數(shù)據(jù)之間的內(nèi)在關(guān)系和隱含的信息。為了擺脫“數(shù)據(jù)豐富,知識貧乏”的困境,人們迫切需要一種能夠智能地自動(dòng)地把數(shù)據(jù)轉(zhuǎn)換成有用信息和知識的技術(shù)和工具,這種對強(qiáng)有力數(shù)據(jù)分析工具的迫切需求使得數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。人們熟悉到數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱躲著很多重要的信息,假如能把這些信息從數(shù)據(jù)庫中抽取出來,將為公司創(chuàng)造很多潛伏的利潤。這種從海量數(shù)據(jù)庫中挖掘信息的技術(shù),就稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘一般有以下四類主要任務(wù):
(一)數(shù)據(jù)總結(jié)
數(shù)據(jù)挖掘能夠?qū)?shù)據(jù)庫中的有關(guān)數(shù)據(jù)從較低的個(gè)體層次抽象總結(jié)到較高的總體層次上,從而實(shí)現(xiàn)對原始基本數(shù)據(jù)的總體把握。
(二)分類
分析數(shù)據(jù)的各種屬性,并找出數(shù)據(jù)的屬性模型,確定哪些數(shù)據(jù)屬于哪些組。這樣我們就可以利用該模型來分析已有數(shù)據(jù),并猜測新數(shù)據(jù)將屬于哪一個(gè)組。
(三)關(guān)聯(lián)分析
數(shù)據(jù)庫中的數(shù)據(jù)一般都存在著關(guān)聯(lián)關(guān)系,也就是說,兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性。通過挖掘數(shù)據(jù)派生關(guān)聯(lián)規(guī)則,可以了解客戶的行為。
(四)聚類
聚類分析是按照某種相近程度度量方法,將用戶數(shù)據(jù)分成一系列有意義的子集合。每一個(gè)集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。
數(shù)據(jù)挖掘的特點(diǎn)和性質(zhì)對于企業(yè)而言,有助于發(fā)現(xiàn)其企業(yè)業(yè)務(wù)發(fā)展的趨勢, 揭示已知的事實(shí), 猜測未知的結(jié)果, 并幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素, 以達(dá)到增加收進(jìn), 降低本錢, 使企業(yè)處于更有利的競爭位置的目的。
二、數(shù)據(jù)挖掘在電子商務(wù)中的作用
數(shù)據(jù)挖掘技術(shù)源于貿(mào)易的直接需求, 因此它在各種貿(mào)易領(lǐng)域都存在廣泛的使用價(jià)值。電子商務(wù)是貿(mào)易領(lǐng)域的一種新興商務(wù)模式,是指利用電子信息技術(shù)開展一切商務(wù)活動(dòng)。當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時(shí), 企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù), 這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ), 同時(shí)高性能計(jì)算機(jī)和高傳輸速率網(wǎng)絡(luò)的使用也給數(shù)據(jù)挖掘技術(shù)提供了堅(jiān)實(shí)的保障。因此數(shù)據(jù)挖掘技術(shù)在電子商務(wù)活動(dòng)中有了更大的用武之地。下面先容數(shù)據(jù)挖掘在以下電子商務(wù)幾個(gè)方面的作用:
(一)客戶細(xì)分
隨著“以客戶為中心”的經(jīng)營理念的不斷深進(jìn)人心, 分析客戶、了解客戶并引導(dǎo)客戶的需求已成為企業(yè)經(jīng)營的重要課題。通過對電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進(jìn)行分析, 可以按各種客戶指標(biāo)(如自然屬性、收進(jìn)貢獻(xiàn)、交易額、價(jià)值度等) 對客戶分類, 然后確定不同類型客戶的行為模式, 以便采取相應(yīng)的營銷措施, 促使企業(yè)利潤的最大化。
(二)客戶獲得
利用數(shù)據(jù)挖掘可以有效地獲得客戶。比如通過數(shù)據(jù)挖掘可以發(fā)現(xiàn)購買某種商品的消費(fèi)者是男性還是女性, 學(xué)歷、收進(jìn)如何, 有什么愛好, 是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購買該種商品的相關(guān)商品后多長時(shí)間有可能購買該種商品, 以及什么樣的人會(huì)購買什么型號的該種商品等等。也許很多因素表面上看起來和購買該種商品不存在任何聯(lián)系, 但數(shù)據(jù)挖掘的結(jié)果卻證實(shí)它們之間有聯(lián)系。在采用了數(shù)據(jù)挖掘后, 針對目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的進(jìn)步, 傾銷的本錢將大大降低。
(三)客戶保持
數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類, 在每個(gè)類里的客戶擁有相似的屬性, 而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶提供完全不同的服務(wù)來進(jìn)步客戶的滿足度。數(shù)據(jù)挖掘還可以發(fā)現(xiàn)具有哪些特征的客戶有可能流失, 這樣挽留客戶的措施將具有針對性, 挽留客戶的用度將下降。
(四)交叉銷售
交叉銷售可以使企業(yè)比較輕易地得到關(guān)于客戶的豐富的信息,而這些大量的數(shù)據(jù)對于數(shù)據(jù)挖掘的正確性來說是有很大幫助的。在企業(yè)所把握的客戶信息, 尤其是以前購買行為的信息中, 可能正包含著這個(gè)客戶決定他下一個(gè)購買行為的關(guān)鍵, 甚至決定因素。這個(gè)時(shí)候數(shù)據(jù)挖掘的作用就會(huì)體現(xiàn)出來, 它可以幫助企業(yè)尋找到這些影響他購買行為的因素。 (五)個(gè)性服務(wù)
當(dāng)客戶在電子商務(wù)網(wǎng)站注冊時(shí), 客戶將會(huì)看到帶有客戶姓名的歡迎詞。根據(jù)客戶的訂單紀(jì)錄, 系統(tǒng)可以向客戶顯示那些可能引起客戶特殊愛好的新商品。當(dāng)客戶留意到一件特殊的商品時(shí), 系統(tǒng)會(huì)建議一些在購買中可以增加的其他商品。普通的產(chǎn)品目錄手冊經(jīng)常簡單地按類型對商品進(jìn)行分組, 以簡化客戶挑選商品的步驟。然而對于在線商店, 商品分組可能是完全不同的, 它經(jīng)常以針對客戶的商品補(bǔ)充條目為基礎(chǔ)。不僅考慮客戶看到的條目, 而且還考慮客戶購物籃中的商品。使用數(shù)據(jù)挖掘技術(shù)可以使推薦更加個(gè)性化。
(六)資源優(yōu)化
節(jié)約本錢是企業(yè)盈利的關(guān)鍵。通過分析歷史的財(cái)務(wù)數(shù)據(jù)、庫存數(shù)據(jù)和交易數(shù)據(jù), 可以發(fā)現(xiàn)企業(yè)資源消耗的關(guān)鍵點(diǎn)和主要活動(dòng)的投進(jìn)產(chǎn)出比例, 從而為企業(yè)資源優(yōu)化配置提供決策依據(jù), 例如降低庫存、進(jìn)步庫存周轉(zhuǎn)率、進(jìn)步資金使用率等。
(七)異常事件的確定
在很多貿(mào)易領(lǐng)域中, 異常事件具有明顯的貿(mào)易價(jià)值, 如客戶流失、銀行的信用卡欺詐、電信中移動(dòng)話費(fèi)拖欠等。通過數(shù)據(jù)挖掘中的奇異點(diǎn)分析可以迅速正確地甄別這些異常事件。
由此可見數(shù)據(jù)挖掘在電子商務(wù)中有著重要的作用。在生活中采用數(shù)據(jù)挖掘的成功的例子很多。例如總部位于美國阿肯色州的WalMart零售商的“尿布與啤酒”的故事。WalMart擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng),它利用數(shù)據(jù)挖掘工具對數(shù)據(jù)倉庫中的原始交易數(shù)據(jù)進(jìn)行分析,得到了一個(gè)意外發(fā)現(xiàn):跟尿布一起購買最多的商品竟然是啤酒。假如不是借助于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘,商家決不可能發(fā)現(xiàn)這個(gè)隱躲在背后的事實(shí):在美國,一些年輕的父親放工后經(jīng)常要到超市往買嬰兒尿布,而他們中有30%~40%的人同時(shí)也為自己買一些啤酒。有了這個(gè)發(fā)現(xiàn)后,超市調(diào)整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。
三、電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘在電子商務(wù)中有廣泛的應(yīng)用。那么在電子商務(wù)中是如何應(yīng)用數(shù)據(jù)挖掘技術(shù)的?
首先,從挖掘過程說,對在線訪問客戶數(shù)據(jù)的挖掘主要有兩部分:一部分是客戶訪問信息的挖掘,另一部分是客戶登記信息的挖掘。面對大量的訪問日志,首先要做的就是對數(shù)據(jù)進(jìn)行清洗,即預(yù)處理,把無關(guān)的數(shù)據(jù),不重要的數(shù)據(jù)等處理掉;接著對數(shù)據(jù)進(jìn)行事務(wù)識別,通過對事務(wù)進(jìn)行劃分后,就可以根據(jù)具體的分析需求選擇模式發(fā)現(xiàn)的技術(shù),如路徑分析、愛好關(guān)聯(lián)規(guī)則、聚類等。通過模式分析,找到有用的信息,再通過聯(lián)機(jī)分析(OLAP) 的驗(yàn)證,結(jié)合客戶登記信息,找出有價(jià)值的市場信息,或發(fā)現(xiàn)潛伏的市場。
其次,挖掘方法主要有以下幾種:
1.路徑分析
路徑分析是一種找尋頻繁訪問路徑的方法,它通過對Web 服務(wù)器的日志文件中客戶訪問站點(diǎn)的訪問次數(shù)分析,挖掘出頻繁訪問路徑。 例如:一客戶從某一站點(diǎn)訪問到某一感愛好的頁面后就會(huì)經(jīng)常訪問該頁面, 通過路徑分析確定頻繁訪問路徑, 可以了解客戶對哪些頁面感愛好,(下轉(zhuǎn)第78頁)(上接第80頁)從而更好地改進(jìn)設(shè)計(jì),為客戶服務(wù)。
2.愛好關(guān)聯(lián)規(guī)則
當(dāng)客戶訪問某一網(wǎng)頁時(shí),一般會(huì)通過愛好詞條找出相關(guān)的愛好網(wǎng)頁通過鏈接繼續(xù)訪問, 這種關(guān)聯(lián)產(chǎn)生的數(shù)據(jù)假如能夠按照某種策略進(jìn)行挖掘分析, 統(tǒng)計(jì)出客戶訪問某些頁面及愛好關(guān)聯(lián)頁面的比率, 就可以很好地組織站點(diǎn), 實(shí)施有效的市場策略。
3.聚類分析
聚類分析是電子商務(wù)中很重要的一個(gè)方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好地幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。如通過對眾多的瀏覽“camera”網(wǎng)頁的客戶分析,發(fā)現(xiàn)在該網(wǎng)頁上經(jīng)常花一段時(shí)間瀏覽的客戶,再通過對這部分客戶的登記資料分析,知道這些客戶是潛伏要買相機(jī)的客戶群體。就可以調(diào)整“camera”網(wǎng)頁的內(nèi)容和風(fēng)格,以適應(yīng)客戶的需要。
通過以上幾種數(shù)據(jù)分析的方法可以有效地對電子商務(wù)中的信息進(jìn)行分析,從而更有效地開展電子商務(wù)。
目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來越來越激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的貿(mào)易機(jī)會(huì),F(xiàn)在世界上的主要數(shù)據(jù)庫廠商紛紛開始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國在這一領(lǐng)域正處在研究開發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢必會(huì)有更好的貿(mào)易機(jī)會(huì)和更光明的遠(yuǎn)景。
。蹍⒖嘉墨I(xiàn)]
[1]韓家煒.Web 挖掘研究[J].計(jì)算機(jī)研究與發(fā)展,2001 , 38(4).
。2]陳宏. 消費(fèi)者數(shù)據(jù)挖掘系統(tǒng)建立的幾個(gè)題目[J]. www.ctiforum.com,2002-09-03.
【談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用】相關(guān)文章:
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站中的應(yīng)用03-28
數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用03-22
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用.03-21
數(shù)據(jù)挖掘在旅游電子商務(wù)中應(yīng)用論文11-28
數(shù)據(jù)挖掘技術(shù)在企業(yè)知識管理中的應(yīng)用03-19
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究03-07