Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用研究論文
[摘要] 電子商務(wù)是現(xiàn)代商業(yè)模式,數(shù)據(jù)挖掘是先進(jìn)的信息處理技術(shù),因此數(shù)據(jù)挖掘在電子商務(wù)中具有廣闊的應(yīng)用前景。本文主要介紹了web數(shù)據(jù)挖掘的概念和分類,論述了電子商務(wù)中web數(shù)據(jù)挖掘的過程和方法,最后闡述了web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用。
[關(guān)鍵詞] web 數(shù)據(jù)挖掘 電子商務(wù)
一、引言
電子商務(wù)是利用計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和遠(yuǎn)程通信技術(shù),實現(xiàn)整個商務(wù)(買賣)過程中的電子化、數(shù)字化和網(wǎng)絡(luò)化。在全球范圍內(nèi),基于internet的電子商務(wù)迅猛發(fā)展,促使各企業(yè)經(jīng)營者必須及時搜集大量的數(shù)據(jù),并且將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息,為企業(yè)創(chuàng)造更多潛在的利潤。利用web數(shù)據(jù)挖掘技術(shù)可以有效地幫助企業(yè)分析從網(wǎng)上獲取的大量數(shù)據(jù),提取出有效信息,進(jìn)而指導(dǎo)企業(yè)調(diào)整營銷策略,給客戶提供動態(tài)的個性化的高效率服務(wù)。
二、web數(shù)據(jù)挖掘
1.web數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘是指從數(shù)據(jù)庫中的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價值的信息的過程。web數(shù)據(jù)挖掘是數(shù)據(jù)挖掘技術(shù)在web環(huán)境下的應(yīng)用,是從web文檔和web活動中發(fā)現(xiàn)潛在的、有用的模式或信息。它是一項綜合技術(shù),涉及到internet、人工智能、計算機(jī)語言學(xué)、信息學(xué)、統(tǒng)計學(xué)等多個領(lǐng)域。
2.web數(shù)據(jù)挖掘的類型
電子商務(wù)中web信息的多樣性決定了挖掘任務(wù)的多樣性。按照web處理對象的不同,web數(shù)據(jù)挖掘可以分為以下三種類型:
(1)web內(nèi)容挖掘(web content mining):可分為web頁面內(nèi)容挖掘和搜索結(jié)果挖掘。WWW.133229.COM前者指的是對web頁面上的數(shù)據(jù)進(jìn)行挖掘。而后者指的是以某一搜索引擎為基礎(chǔ),對已搜索結(jié)果的挖掘,以得到更精確有用的信息。web內(nèi)容挖掘常用的方法有weboql和ahoy。
(2)web結(jié)構(gòu)挖掘(web structure mining):可分為超鏈接挖掘、內(nèi)容挖掘和url挖掘。整個web空間里,有用的知識不僅包含在web頁面的內(nèi)容之中,而且包含在頁面的結(jié)構(gòu)之中。web結(jié)構(gòu)挖掘是挖掘web潛在的鏈接結(jié)構(gòu)模式,是對web頁面超鏈接關(guān)系、文檔內(nèi)部結(jié)構(gòu)、文檔url中的`目錄途徑結(jié)構(gòu)的挖掘。page2rank方法就是利用文檔間鏈接信息來查找相關(guān)的web頁。
(3)web使用挖掘(web usage mining):可分為一般訪問模式挖掘和個性化服務(wù)模式挖掘。它是從web的訪問記錄中抽取感興趣的模式。/dianzijixie/">電子商務(wù)中,關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)也就是找到客戶對網(wǎng)站上各種文件之間訪問的相互聯(lián)系。聯(lián)系的問題就是得到如下形式的規(guī)則:“”, 其中與均為在數(shù)據(jù)庫中相關(guān)數(shù)據(jù)特征屬性值的集合。例如,用關(guān)聯(lián)規(guī)則技術(shù),我們可以發(fā)現(xiàn):如果客戶在一次訪問行為中,訪問了頁面/page1時,一般也會訪問頁面/page2。進(jìn)行web上的數(shù)據(jù)挖掘,構(gòu)建關(guān)聯(lián)模型,我們可以更好地組織站點,減少用戶過濾信息的負(fù)擔(dān),實施有效的市場策略,增加交叉銷售量。
4.序列模式(sequential pattern)
序列模式分析的目的是為了挖掘出數(shù)據(jù)間的前后或因果關(guān)系,就是在時間戳有序的事務(wù)集中,找到那些“一些項跟隨另一個項”的內(nèi)部事務(wù)模式。例如,在/page1上進(jìn)行過在線訂購的顧客,有60%的人在過去10天內(nèi)也在/page2上下過定單。通過序列模式的發(fā)現(xiàn),能夠便于電子商務(wù)的經(jīng)營者預(yù)測客戶的訪問模式,在服務(wù)器方選取有針對性的頁面,以滿足訪問者的特定要求;網(wǎng)站的管理員可將訪問者按瀏覽模式分類,在頁面上只展示具有該瀏覽模式的訪問者經(jīng)常訪問的鏈接,而用一個“更多內(nèi)容”指向其他未被展示的內(nèi)容。當(dāng)訪問者瀏覽到某頁面時,檢查他的瀏覽所符合的序列模式,并在顯眼的位置提示“訪問該頁面的人通常接著訪問”的若干頁面。
5.分類規(guī)則(classification regulation)
分類要解決的問題是為一個事件或?qū)ο髿w類。設(shè)有一個數(shù)據(jù)庫和一組具有不同特征的類別(標(biāo)記),該數(shù)據(jù)庫中的每一個記錄都賦予一個類別的標(biāo)記,這樣的數(shù)據(jù)庫稱為示例數(shù)據(jù)庫或訓(xùn)練集。分類分析就是通過分析示例數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準(zhǔn)確的描述或建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其它數(shù)據(jù)庫中的記錄進(jìn)行分類。例如,經(jīng)過web挖掘發(fā)現(xiàn),在/page1進(jìn)行過在線訂購的客戶中有60%是20歲~30歲生活在大中城市的年輕人。得到分類后,就可以針對這一類客戶的特點展開商務(wù)活動,提供有針對性的個性化的信息服務(wù)。用于分類分析的方法有統(tǒng)計方法的貝葉斯分類、機(jī)器學(xué)習(xí)的判定樹歸納分類、神經(jīng)網(wǎng)絡(luò)的后向傳播分類、k-最臨近分類、mbr、遺傳法、粗糙集和模糊集等。
6.聚類分析(clustering analysis)
聚類分析不同于分類規(guī)則,其輸入集是一組未標(biāo)定的記錄,也就是說,此時輸入的記錄還沒有進(jìn)行任何分類。其目的是根據(jù)一定的規(guī)則,合理地劃分記錄集合,并用顯式或隱式的方法描述不同的類別。在電子商務(wù)中,通過聚類具有相似瀏覽行為的客戶,可使經(jīng)營者更多地了解客戶,為客戶提供更好的服務(wù)。例如,一些客戶在一個時間段內(nèi)經(jīng)常瀏覽“wedding celebration”,經(jīng)過分析可將這些客戶聚類為一組,并可進(jìn)一步得知這是一組即將結(jié)婚的客戶,對他們的服務(wù)就應(yīng)該有別于其他的聚類客戶,如“經(jīng)理人員階層組”、“學(xué)生階層組”。這樣,web可自動給這個特定的顧客聚類發(fā)送新產(chǎn)品信息郵件,為這個顧客聚類動態(tài)地改變一個特殊的站點。在一定程度上滿足客戶的要求,這對客戶和銷售商來說更有意義。
三、web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
1.挽留老顧客,挖掘潛在客戶
通過web挖掘,電子商務(wù)的經(jīng)營者可以獲知每位訪問者的個人愛好,充分地了解客戶的需要,根據(jù)每一類顧客的獨特需求提供定制化的產(chǎn)品,并根據(jù)需求動態(tài)地向客戶做頁面推薦,調(diào)整web頁面,提高客戶滿意度,延長客戶駐留的時間,最終達(dá)到留住客戶的目的。通過挖掘web日志記錄,可以先對已經(jīng)存在的訪問者進(jìn)行分類,然后從它的分類判斷出某個新客戶是否是潛在的客戶。
2.制定產(chǎn)品營銷策略,優(yōu)化促銷活動
通過對商品訪問情況和銷售情況進(jìn)行挖掘,企業(yè)能夠獲取客戶的訪問規(guī)律,確定顧客消費(fèi)的生命周期,根據(jù)市場的變化,針對不同的產(chǎn)品制定相應(yīng)的營銷策略。
3.降低運(yùn)營成本,提高企業(yè)競爭力
電子商務(wù)的經(jīng)營者通過web數(shù)據(jù)挖掘,可以得到可靠的市場反饋信息,認(rèn)真分析顧客的將來行為,進(jìn)行有針對性的電子商務(wù)營銷活動;可以根據(jù)關(guān)心某產(chǎn)品的訪問者的瀏覽模式來決定廣告的位置,增加廣告針對性,提高廣告的投資回報率,從而降低運(yùn)營成本,提高企業(yè)競爭力。
4.提高站點點擊率,完善電子商務(wù)網(wǎng)站設(shè)計
通過挖掘客戶的行為記錄和反饋情況為站點設(shè)計者提供改進(jìn)的依據(jù),進(jìn)一步優(yōu)化網(wǎng)站組織結(jié)構(gòu)以提高網(wǎng)站的點擊率。比如利用關(guān)聯(lián)規(guī)則的發(fā)現(xiàn),可以針對不同客戶動態(tài)調(diào)整站點結(jié)構(gòu),使客戶訪問的有關(guān)聯(lián)的文件間的鏈接更直接,讓客戶容易地訪問到想要的頁面,就能給客戶留下好的印象,增加下次訪問的機(jī)率。
同時對網(wǎng)站上各種數(shù)據(jù)的統(tǒng)計分析有助于改進(jìn)系統(tǒng)性能,增強(qiáng)系統(tǒng)安全性,并提供決策支持。
四、結(jié)束語
當(dāng)今時代,電子商務(wù)的發(fā)展勢頭越來越強(qiáng)勁,面向電子商務(wù)的數(shù)據(jù)挖掘?qū)⑹且粋非常有前景的領(lǐng)域。但是,不可否認(rèn),在面向電子商務(wù)的數(shù)據(jù)挖掘中還存在很多急需解決的問題, 比如:怎樣將服務(wù)器的日志數(shù)據(jù)轉(zhuǎn)化成適合某種數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)格式;怎樣解決分布性、異構(gòu)性數(shù)據(jù)源的挖掘問題;如何控制整個web上的知識發(fā)現(xiàn)過程等。
參考文獻(xiàn):
[1]jiawei han,micheline kamber著,范明孟小峰譯:數(shù)據(jù)挖掘概念與技術(shù).機(jī)械工業(yè)出版社,2001,8
[2]凌傳繁:web挖掘技術(shù)在電子商務(wù)中的應(yīng)用[j].情報雜志,2006,(1)
[3]柳:web挖掘技術(shù)與電子商務(wù)[j].商場現(xiàn)代化,2007,(03x)
【W(wǎng)eb數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用研究論文】相關(guān)文章:
1.Web數(shù)據(jù)挖掘在電子商務(wù)的應(yīng)用論文
2.數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究論文
3.淺析電子商務(wù)中的WEB數(shù)據(jù)的挖掘論文
4.計算機(jī)Web數(shù)據(jù)挖掘技術(shù)在現(xiàn)代商業(yè)中的應(yīng)用論文