- 相關(guān)推薦
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站中的應(yīng)用
當(dāng)用戶和電子商務(wù)的商家充分享受電子商務(wù)的快捷和方便時(shí),他們同時(shí)面臨著某些新的題目。一方面,用戶面對(duì)網(wǎng)站上提供的琳瑯滿目的眾多商品,他們只對(duì)其中的一部分商品感愛(ài)好。用戶要實(shí)現(xiàn)一次的購(gòu)買(mǎi),就必須瀏覽很多不相關(guān)的網(wǎng)頁(yè),在眾多的商品分類(lèi)中找到自己所需要的商品;另一方面,商家面對(duì)眾多的用戶,不知道他們對(duì)商品的愛(ài)好和要求是什么。因此,電子商務(wù)的商家無(wú)法及時(shí)調(diào)整網(wǎng)站的頁(yè)面結(jié)構(gòu),提供給所有的用戶是千篇一律的界面。缺乏個(gè)性化服務(wù)己經(jīng)成為制約電子商務(wù)發(fā)展的關(guān)鍵題目;赪eb數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)提供了一種有效的解決方法。推薦系統(tǒng)就是根據(jù)用戶個(gè)人的喜好、習(xí)慣來(lái)向其推薦信息、商品的程序。電子商務(wù)推薦系統(tǒng)能夠直接與用戶交互,模擬商店銷(xiāo)售職員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購(gòu)買(mǎi)過(guò)程。從用戶角度來(lái)看,電子商務(wù)推薦系統(tǒng)通過(guò)對(duì)收集到的用戶的訪問(wèn)行為、訪問(wèn)頻度、訪問(wèn)內(nèi)容等瀏覽信息進(jìn)行挖掘,提取用戶的特征,獲取用戶訪問(wèn)Web的模式,動(dòng)態(tài)地調(diào)整頁(yè)面結(jié)構(gòu),為用戶實(shí)現(xiàn)主動(dòng)推薦,提供個(gè)性化服務(wù);從企業(yè)角度來(lái)看,企業(yè)希看能夠獲取用戶的訪問(wèn)規(guī)律,以幫助企業(yè)確定顧客消費(fèi)的生命周期,針對(duì)不同的產(chǎn)品制定相應(yīng)的營(yíng)銷(xiāo)策略,進(jìn)一步優(yōu)化網(wǎng)站的組織結(jié)構(gòu)和服務(wù)方式,以進(jìn)步網(wǎng)站的效率。推薦系統(tǒng)在幫助了客戶的同時(shí)也進(jìn)步了顧客對(duì)商務(wù)活動(dòng)的滿足度,換來(lái)對(duì)商務(wù)網(wǎng)站的進(jìn)一步支持。
一、推薦系統(tǒng)在電子商務(wù)活動(dòng)中的作用
一般說(shuō)來(lái),推薦系統(tǒng)在電子商務(wù)活動(dòng)中的作用可以回納為以下幾點(diǎn):
(一)把瀏覽者轉(zhuǎn)變成購(gòu)買(mǎi)者
己有明確購(gòu)物目標(biāo)的客戶也許可以借助檢索系統(tǒng)找到自己需要的東西,但對(duì)于大多數(shù)只是四處走走看一看的沖浪者,或是對(duì)自己的需要比較模糊的購(gòu)買(mǎi)者,很難有耐心在幾十頁(yè)長(zhǎng)的商品目錄逐項(xiàng)查找是否有自己感愛(ài)好的東西。而推薦系統(tǒng)通過(guò)合適的推薦,可以將一個(gè)瀏覽者變?yōu)橘?gòu)買(mǎi)者。
(二)進(jìn)步電子商務(wù)系統(tǒng)的交叉銷(xiāo)售能力
電子商務(wù)推薦系統(tǒng)在用戶購(gòu)買(mǎi)過(guò)程中向用戶提供其它有價(jià)值的商品推薦,用戶能夠從提供的推薦列表中購(gòu)買(mǎi)自己確實(shí)需要但在購(gòu)買(mǎi)過(guò)程中沒(méi)有想到的商品,從而有效進(jìn)步電子商務(wù)系統(tǒng)的交叉銷(xiāo)售。例如站點(diǎn)可以根據(jù)客戶當(dāng)前購(gòu)物車(chē)中的物品向他們推薦一些和這些己選購(gòu)的物品相關(guān)的物品。假如有一個(gè)比較好的推薦系統(tǒng),則企業(yè)的均勻定購(gòu)量就可能增加。
(三)進(jìn)步客戶對(duì)電子商務(wù)網(wǎng)站忠誠(chéng)度。
與傳統(tǒng)的商務(wù)模式相比,電子商務(wù)系統(tǒng)使得用戶擁有越來(lái)越多的選擇,用戶更換商家及其方便,只需要一兩次鼠標(biāo)的點(diǎn)擊就可以在不同電子商務(wù)系統(tǒng)之間跳轉(zhuǎn)。電子商務(wù)推薦系統(tǒng)分析用戶的購(gòu)買(mǎi)習(xí)慣,根據(jù)用戶需求向用戶提供有價(jià)值的商品推薦。假如電子商務(wù)推薦系統(tǒng)的推薦質(zhì)量很高,用戶可以很輕易找到自己想要的商品,那么用戶會(huì)再次訪問(wèn)這個(gè)網(wǎng)站,并會(huì)推薦給其他人,這對(duì)于網(wǎng)站來(lái)說(shuō)是一個(gè)很大的上風(fēng)。
二、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)推薦系統(tǒng)的具體應(yīng)用
數(shù)據(jù)挖掘是在大型數(shù)據(jù)存儲(chǔ)庫(kù)中,自動(dòng)地發(fā)現(xiàn)有用信息的過(guò)程。數(shù)據(jù)挖掘技術(shù)用來(lái)探查大型
數(shù)據(jù)庫(kù),發(fā)現(xiàn)先前未知的有用模式。電子商務(wù)推薦系統(tǒng)將數(shù)據(jù)挖掘技術(shù)運(yùn)用到電子商務(wù)領(lǐng)域,以數(shù)據(jù)挖掘?yàn)榛A(chǔ)衍生出很多算法。
(一)基于關(guān)聯(lián)規(guī)則的推薦算法
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)的一種,該技術(shù)挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。關(guān)聯(lián)規(guī)則挖掘的一個(gè)典型例子就是購(gòu)物籃分析。該過(guò)程通過(guò)發(fā)現(xiàn)顧客放進(jìn)其購(gòu)物籃中不同商品之間的聯(lián)系,分析顧客的購(gòu)買(mǎi)習(xí)慣。通過(guò)了解哪些商品頻繁地被顧客同時(shí)購(gòu)買(mǎi),這種關(guān)聯(lián)的發(fā)現(xiàn)可以幫助商家制定營(yíng)銷(xiāo)策略。
關(guān)聯(lián)規(guī)則的挖掘是一個(gè)兩步過(guò)程:
首先,找出所有頻繁項(xiàng)集。這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持計(jì)數(shù)一樣。其次,由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。這些規(guī)則必須滿足最小支持度和最小置信度。
關(guān)聯(lián)規(guī)則挖掘算法的瓶頸出現(xiàn)在第一步。由于第一步需要反復(fù)掃描交易數(shù)據(jù)庫(kù),所以增加了系統(tǒng)的開(kāi)銷(xiāo),降低了系統(tǒng)性能。例如:Aprior算法是一種最有影響的挖掘關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法。該算法使用一種稱(chēng)為逐層搜索的迭代方法尋找頻繁項(xiàng)集,它開(kāi)創(chuàng)性地使用基于支持度的剪枝技術(shù),系統(tǒng)地控制候選項(xiàng)集指數(shù)增長(zhǎng)。它缺點(diǎn)就是由于數(shù)據(jù)庫(kù)數(shù)據(jù)的增多,需要多次掃描數(shù)據(jù)庫(kù),這樣便影響了系統(tǒng)的性能。
(二)基于內(nèi)同的推薦算法
基于內(nèi)容的推薦系統(tǒng)的產(chǎn)生根源于信息檢索與信息過(guò)濾。其具體是根據(jù)項(xiàng)之間的相似性來(lái)進(jìn)行推薦的,先用機(jī)器學(xué)習(xí)等技術(shù)分析用戶已經(jīng)評(píng)分的項(xiàng)的內(nèi)容,建立用戶檔案,然后從項(xiàng)集中選擇與用戶檔案相似的項(xiàng),再?gòu)闹懈鶕?jù)評(píng)分選擇一定的項(xiàng)推薦給用戶,最后根據(jù)用戶的反饋信息修正推薦。
基于內(nèi)容得推薦技術(shù)具有一定的局限性。首先,資源內(nèi)容必須以機(jī)器可以理解的格式表示,而很多信息例如圖像、視頻等多媒體信息是很難做到這一點(diǎn)的;其次,資源內(nèi)容的分析范圍比較小,不能提供較多的建議;再次,基于內(nèi)容的推薦不能從質(zhì)量、樣式、審美等角度對(duì)項(xiàng)進(jìn)行過(guò)濾。
(三)協(xié)同過(guò)濾推薦算法
協(xié)同過(guò)濾是在信息過(guò)濾和信息系統(tǒng)中正迅速成為一項(xiàng)很受歡迎的技術(shù)。與傳統(tǒng)的基于內(nèi)容過(guò)濾直接分析內(nèi)容進(jìn)行推薦不同,協(xié)同過(guò)濾分析用戶愛(ài)好,在用戶群中找到指定用戶的相似(愛(ài)好)用戶,綜合這些相似用戶對(duì)某一信息的評(píng)價(jià),形成系統(tǒng)對(duì)該指定用戶對(duì)此信息的喜好程度猜測(cè)。
協(xié)同過(guò)濾推薦算法的缺點(diǎn)是:(1)用戶對(duì)商品的評(píng)價(jià)非常稀疏,這樣基于用戶的評(píng)價(jià)所得到的用戶間的相似性可能不正確(即稀疏性題目)。(2)隨著用戶和商品的增多,系統(tǒng)的性能會(huì)越來(lái)越低(即可擴(kuò)展性題目)。(3)假如從來(lái)沒(méi)有用戶對(duì)某一商品加以評(píng)價(jià),則這個(gè)商品就不可能被推薦(即最初評(píng)價(jià)題目)。
為了彌補(bǔ)各種推薦方法的缺點(diǎn),在實(shí)際中常采用組合推薦。在組合推薦上,國(guó)外的有關(guān)學(xué)者提出了七種組合思路:
(1)加權(quán):加權(quán)多種推薦技術(shù)結(jié)果。
(2)變換:根據(jù)題目背景和實(shí)際情況采用不同的推薦技術(shù)。
(3)混合:同時(shí)采用多種推薦技術(shù)給出多種推薦結(jié)果,為用戶提供參考。
(4)特征組合:組合來(lái)自不同推薦數(shù)據(jù)源的特征被另一種推薦算法所采用。
(5)層疊:先用一種推薦技術(shù)產(chǎn)生一種粗糙的推薦結(jié)果,第二種推薦技術(shù)在此推薦結(jié)果的基礎(chǔ)上進(jìn)一步做出更精確的推薦。
(6)特征擴(kuò)充:一種技術(shù)產(chǎn)生附加的特征信息嵌進(jìn)到另一種推薦技術(shù)的特征輸進(jìn)中。
(7)Metal-Level:一種推薦方法產(chǎn)生的模型作為另一種推薦方法的輸進(jìn)。
盡治理論上有很多種推薦組合方法,但在某一具體題目中并不見(jiàn)得都有效,組合推薦一個(gè)最重要的原則,就是通過(guò)組合后要能避免或彌補(bǔ)各自推薦技術(shù)的弱點(diǎn)。
三、電子商務(wù)推薦算法面臨的挑戰(zhàn)
電子商務(wù)推薦技術(shù)在實(shí)際應(yīng)用中取得了巨大成功,很多電子商務(wù)網(wǎng)站都提供了各種不同的推薦服務(wù)。但隨著站點(diǎn)結(jié)構(gòu)內(nèi)容的復(fù)雜度和用戶人數(shù)的增加,電子商務(wù)推薦算法也面臨很多挑戰(zhàn),主要包括:
(一)實(shí)時(shí)性和擴(kuò)展性題目:對(duì)于上百萬(wàn)之巨的數(shù)據(jù),推薦系統(tǒng)必須快速處理、實(shí)時(shí)搜索,在幾毫秒內(nèi)處理成千上萬(wàn)用戶并提供推薦。通常的推薦算法將遭到嚴(yán)重的實(shí)時(shí)性和擴(kuò)展性題目。
(二)智能化推薦:目前大部分的協(xié)同過(guò)濾推薦系統(tǒng)采用顯示評(píng)分輸進(jìn)的方式提供個(gè)推薦服務(wù),用戶必須顯示輸進(jìn)對(duì)商品的數(shù)值評(píng)分。這種方式一方面使得評(píng)分?jǐn)?shù)據(jù)的獲取比較正確可信,但同時(shí)也使得用戶在使用上不是很方便。如何根據(jù)用戶的行為向用戶提供完全智能化得推薦需要做進(jìn)一步的研究。
(三)實(shí)時(shí)性與推薦質(zhì)量之間的平衡:推薦系統(tǒng)的推薦精度和實(shí)時(shí)性是一對(duì)矛盾。大部分推薦技術(shù)在保證實(shí)時(shí)性要求的同時(shí),是以犧牲推薦系統(tǒng)的推薦質(zhì)量為條件的。在提供實(shí)時(shí)推薦服務(wù)的同時(shí),如何有效進(jìn)步推薦系統(tǒng)的推薦質(zhì)量,需要做進(jìn)一步深進(jìn)的研究。
(四)效率更好的數(shù)據(jù)挖掘算法的研究:更有效的K-最近搜索算法和聚類(lèi)算法能夠進(jìn)步推薦的實(shí)時(shí)性和正確性。目前的推薦系統(tǒng)中,K-最近搜索算法存在實(shí)時(shí)性的不足等缺陷,難以快速處理大規(guī)模的數(shù)據(jù);質(zhì)量高的聚類(lèi)算法能夠有效分割用戶群,適合推薦的聚類(lèi)算法的性能也有待進(jìn)步。
(五)新型電子商務(wù)推薦系統(tǒng)體系結(jié)構(gòu)研究:當(dāng)前大部分的電子商務(wù)推薦系統(tǒng)都只是一個(gè)單一的工具,只能提供一種推薦模型。但由于電子商務(wù)系統(tǒng)本身的復(fù)雜性,不同場(chǎng)合需要不同類(lèi)型的推薦。因此,需要研究新型電子商務(wù)推薦系統(tǒng)體系結(jié)構(gòu),以有效集成多種推薦工具,收集多種類(lèi)型的數(shù)據(jù),提供多種推薦模型,使得不同的推薦工具組合使用,互補(bǔ)是非,滿族不同類(lèi)型的推薦需要。
參考文獻(xiàn):
[1] 曾子明,余小鵬(著):電子商務(wù)推薦系統(tǒng)與智能談判技術(shù)[M]武漢大學(xué)出版社2008.5
[2]Mehmed Kantardzic (著) 閃四清,陳茵,程雁 等(譯):數(shù)據(jù)挖掘
【數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站中的應(yīng)用】相關(guān)文章:
談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用03-21
數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用03-22
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用.03-21
數(shù)據(jù)挖掘在旅游電子商務(wù)中應(yīng)用論文11-28
數(shù)據(jù)挖掘技術(shù)在企業(yè)知識(shí)管理中的應(yīng)用03-19
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究03-07
數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用12-09