- 相關(guān)推薦
組合營銷策略中基于約束的關(guān)聯(lián)規(guī)則挖掘方法
畢業(yè)論文摘 要:網(wǎng)絡(luò)銷售是電子商務(wù)的1種重要的形式,而組合營銷是提升網(wǎng)絡(luò)銷售業(yè)績的1種重要手段。針對目前我國網(wǎng)絡(luò)銷售的基本模式,在已發(fā)現(xiàn)的組合營銷策略特點(diǎn)的基礎(chǔ)上,提出了1種基于約束的關(guān)聯(lián)規(guī)則挖掘新算法。
關(guān)鍵詞:組合營銷策略;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則
1 引言
隨著全球化浪潮的推進(jìn),電子商務(wù)正不斷發(fā)展壯大。網(wǎng)絡(luò)銷售作為電子商務(wù)的1種重要組成形式為企業(yè)尋求更大的市場空間提供了1種新的有益嘗試。我國目前網(wǎng)絡(luò)銷售的主流模式為:“訂單1物流”模式。即用戶下訂單后,企業(yè)通過物流將商品交付給客戶。由于物流費(fèi)用1般由客戶承擔(dān),客戶為減少購物的物流成本,往往會(huì)在購買主目標(biāo)商品的同時(shí),搭配幾件價(jià)格不高的次目標(biāo)商品。這就為企業(yè)實(shí)施商品的組合營銷策略提供了機(jī)遇。
2 問題描述
組合營銷是指企業(yè)通過對不同類別、不同價(jià)格的商品的合理組合,向客戶1次提供多種商品的營銷方式。數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則分析方法,通過挖掘出以往銷售數(shù)據(jù)中哪些商品頻繁的被顧客同時(shí)購買,形成關(guān)于商品間搭配的知識(shí),從而指導(dǎo)今后銷售的商品組合。但經(jīng)典的關(guān)聯(lián)規(guī)則挖掘方法由于缺乏用戶控制,導(dǎo)致產(chǎn)生的規(guī)則過多,且部分規(guī)則對用戶毫無意義。為了解決該問題,人們引入了基于約束的關(guān)聯(lián)規(guī)則挖掘方法。R.T.NG等學(xué)者提出了受約束的關(guān)聯(lián)查詢概念R.Srikant等人研究了項(xiàng)集受約束的關(guān)聯(lián)規(guī)則挖掘,挖掘出了包含某布爾表達(dá)式的頻繁項(xiàng)集Robert J.Ba-yardo Jr等人研究了稠密數(shù)據(jù)庫的特點(diǎn),并提出了改進(jìn)度的概念
本文首先介紹了關(guān)聯(lián)規(guī)則的基本概念,在指出傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘方法缺陷的基礎(chǔ)上,提出了1種受用戶指定數(shù)據(jù)約束的關(guān)聯(lián)規(guī)則挖掘算法(UD-Apriori)。實(shí)驗(yàn)分析表明,該算法能在短時(shí)間內(nèi)找到用戶感興趣的規(guī)則,算法效率有明顯提高。
3 關(guān)聯(lián)規(guī)則的基本概念
3.1關(guān)聯(lián)規(guī)則的描述
設(shè)I={i1i2,im}是項(xiàng)的集合,其中的元素稱為項(xiàng)(item)。記D為交易T的集合,這里交易T是項(xiàng)的集合,并且T I。設(shè)X是I中項(xiàng)的1個(gè)集合,如果X T.那么稱交易T3X。1個(gè)關(guān)聯(lián)規(guī)則是形如“X Y的蘊(yùn)含式,這里X I,Y I,并且X Y= 。
規(guī)則“XjY”在事務(wù)數(shù)據(jù)庫中的支持度(support)是事務(wù)集中包含X和Y的事務(wù)數(shù)與所有事務(wù)數(shù)之比,記為suppog(X Y),即:
suooort(X Y):l{T,X Y T,T D}|/|D|
對項(xiàng)目集I和事務(wù)數(shù)據(jù)庫D,T中所有滿足用戶指定的最小支持度(minsupportl的項(xiàng)目集,稱為頻繁項(xiàng)目集。
規(guī)則X Y在事務(wù)集中的置信度(confidence)是指包含X和Y的事務(wù)數(shù)與包含X的事務(wù)數(shù)之比,記為confidence(X Y),即:
Confidence(X Y)=|{T,X Y T,T D,T D}|/|T:X T,T D}|
3.2經(jīng)典關(guān)聯(lián)規(guī)則挖掘算法及其缺陷
經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法分兩個(gè)階段:首先,產(chǎn)生達(dá)到指定最小支持度的項(xiàng)集(即頻繁項(xiàng)集),然后從每個(gè)頻繁項(xiàng)集中找出能夠達(dá)到指定最小置信度的規(guī)則。其中,第1步生成滿足最小支持度的項(xiàng)集是關(guān)鍵。1994年Agrawal等人在提出了著名的Apfiofi算法此算法使用遞歸方法生成所有的頻繁項(xiàng)集。首先生成頻繁1-項(xiàng)集L1,然后生成頻繁2-項(xiàng)集L2,…,1直到某個(gè)r使得Lr為空,算法結(jié)束。當(dāng)求Lk時(shí),首先通過Lk-1的自連接生成候選項(xiàng)集Ck;檢驗(yàn)Ck中的每個(gè)元素,滿足用戶指定的最小支持度的元素就是Lk中的元素。從以上算法描述可看出由于Lk-1候選集Ck是呈指數(shù)增長的,例如104個(gè)1-頻繁項(xiàng)集就有可能產(chǎn)生接近107個(gè)元素的2-候選項(xiàng)集。如此大的候選項(xiàng)集對時(shí)間和主存空間是1種巨大的挑戰(zhàn)。另外,由于基于“支持度1置信度”的關(guān)聯(lián)規(guī)則挖掘度量框架本身不具有關(guān)聯(lián)規(guī)則生成的先決指導(dǎo)性,導(dǎo)致產(chǎn)生的部分規(guī)則對最終用戶毫無意義,而1些較長的規(guī)則又難于理解。這些都導(dǎo)致算法效率的低下。
4 受用戶指定數(shù)據(jù)約束的關(guān)聯(lián)規(guī)則挖掘算法
4.1算法的提出背景
在企業(yè)實(shí)施商品的組合營銷策略過程中,往往以利潤為先導(dǎo),把關(guān)注焦點(diǎn)集中在那些銷售情況較好而價(jià)格又相對比較高的商品上面。因此,企業(yè)銷售策略可以是:針對具有上述特征的商品,找出和這類商品1起被頻繁購買的其它價(jià)格比較低的商品,以便在今后的銷售中對這些商品進(jìn)行捆綁銷售。
4.2受用戶指定數(shù)據(jù)約束的關(guān)聯(lián)規(guī)則挖掘算法(UD-Apfiofi)的基本思想
基于上述銷售策略,我們提出1種受用戶指定數(shù)據(jù)約束的關(guān)聯(lián)規(guī)則挖掘算法。其中。用戶需要提供兩個(gè)約束信息:暢銷商品A以及與A關(guān)聯(lián)的商品價(jià)格總和的最大值(max_sumprice)。
該算法的基本思想是:首先利用用戶指定商品A為約束條件對事務(wù)數(shù)據(jù)庫D進(jìn)行掃描,包含A的實(shí)例加入到實(shí)例集Dt中,其余被過濾掉。然后在經(jīng)典Apfiofi算法的頻繁項(xiàng)集生成過程中應(yīng)用受max_sumprice參數(shù)約束的剪枝策略,生成符合約束條件的頻繁K-項(xiàng)集,最后由頻繁項(xiàng)集生成受約束的關(guān)聯(lián)規(guī)則。
4.3剪枝策略
定義1
約束Ca是反單調(diào)的是指對于任意給定的不滿足Ca的項(xiàng)目集S,不存在S的超集能夠滿足Ca。
下面給出了與A相關(guān)聯(lián)商品的反單調(diào)性約束表達(dá)式:
sum_price(Bl,B2,…,Bn)≤max_sumprice。
其中,sum_price(B1,B2,…,Bn)為在頻繁項(xiàng)集的項(xiàng)(item)中與A相關(guān)聯(lián)的商品價(jià)格的總和。
證明:反證法。假設(shè)sum_price(B1,B2,…,Bn)>max_sumprice,且有sum_price(B1,B2,…,BnBn+1)≤max_sumprice,其中Bi>0。則有sum_price(B1,B2,…,Bn)>sum_price(B1,B2,…,BnBn+1),即:Bn+1+l<0,與假設(shè)Bi>0矛盾,故sum_price(B1,B2,…,Bn)≤max_sumprice為反單調(diào)性約束條件。由定義1可以確定,如果在Apriofi算法中生成的任何1個(gè)頻繁項(xiàng)集不滿足反單調(diào)約束條件,則它的任何超集都不滿足此約束條件。因此,在經(jīng)典的apriori算法產(chǎn)生K-1-頻繁項(xiàng)集后,我們可以直接將不滿足約束的頻繁項(xiàng)集剔除掉。這樣從客觀上,減少了頻繁項(xiàng)集生成所需要的候選項(xiàng)集的數(shù)目,成功地對候選項(xiàng)集進(jìn)行了剪枝。
4.4 UD-Apriori算法描述
輸入:事務(wù)數(shù)據(jù)庫D,A(用戶指定的商品),min_sup(最小支持度),min_conf(最小置信度),max_sumprice(頻繁項(xiàng)集的項(xiàng)中與A關(guān)聯(lián)的商品之和的最大值)。
輸出:滿足min_sup,min_conf,A,max_sumprice約束的關(guān)聯(lián)規(guī)則。
Begin
If A is unfrequent then
return;
Filter(A);
L1=L1+find_frequent_l-itemsets(D’)//產(chǎn)生頻繁1項(xiàng)集
Delete T where not contain L1;
Gen_rules(1,L1);//產(chǎn)生頻繁1項(xiàng)集規(guī)則
For(k=2;Lk-1≠φ;k++)
{Ck:apriori_gen Lk-1,min_sup,max_sumprice);//產(chǎn)生K-項(xiàng)集
Lk=subset (Ck,D’);//產(chǎn)生頻繁K-項(xiàng)集
Gen_rules(K,Lk)://產(chǎn)生頻繁K-項(xiàng)集的規(guī)則
end;procedure filter(A)//過濾事務(wù)數(shù)據(jù)庫
For all trasactions t D:
Ift contain A then
Write to D′return;
5 試驗(yàn)結(jié)果分析
本試驗(yàn)采用IBM數(shù)據(jù)生成器生成記錄型測試數(shù)據(jù)進(jìn)行算法測試,同時(shí)將每個(gè)項(xiàng)目元素進(jìn)行價(jià)格賦值。實(shí)驗(yàn)環(huán)境基于winxp平臺(tái),計(jì)算機(jī)內(nèi)存256MB,主頻2.8GHZ,測試數(shù)據(jù)各項(xiàng)參數(shù)如表2。
在數(shù)據(jù)庫291個(gè)項(xiàng)目元素中,元素最高價(jià)格為4995。在頻繁1項(xiàng)集中項(xiàng)集最高價(jià)格為4425。因此,將價(jià)格為4425的項(xiàng)i4425定為指定約束元素;诖耸聞(wù)數(shù)據(jù)庫對經(jīng)典的Apriori算法及受用戶指定數(shù)據(jù)約束算法的對比測試結(jié)果如表3。
實(shí)驗(yàn)結(jié)果表明,由于受項(xiàng)i4425的約束,算法的運(yùn)行時(shí)間和生成的規(guī)則數(shù)大為減少。且由于指定了約束條件項(xiàng)i4425,使挖掘過程的指向性得到明顯提高。很好的控制了挖掘的數(shù)據(jù)規(guī)模,從而保證了在生成的關(guān)聯(lián)規(guī)則數(shù)目減少的同時(shí)更加契合用戶的意愿。
6 結(jié)論
本文根據(jù)網(wǎng)絡(luò)電子商務(wù)的特點(diǎn),結(jié)合組合營銷策略實(shí)施中客戶的具體購買模式,提出了1種基于約束的關(guān)聯(lián)規(guī)則挖掘算法。試驗(yàn)結(jié)果表明,這種算法由于引入了更多的用戶控制,相比經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法效率更高。挖掘結(jié)果表明,挖掘生成的關(guān)聯(lián)規(guī)則大為減少,信息指向性也更加明確,為企業(yè)實(shí)施組合營銷策略提供了科學(xué)的依據(jù)。
【組合營銷策略中基于約束的關(guān)聯(lián)規(guī)則挖掘方法】相關(guān)文章:
基于知識(shí)營銷的4Is營銷策略03-23
差異化經(jīng)營策略在營銷組合中的應(yīng)用03-21
論差異化經(jīng)營策略在營銷組合中的應(yīng)用03-02
基于顧客價(jià)值的需求,流動(dòng)網(wǎng)挖掘策略分析01-11
新款手機(jī)上市的營銷組合策略03-23
保險(xiǎn)產(chǎn)品營銷組合與競爭策略研究03-13
汽車營銷中的聯(lián)合營銷策略03-21