- 相關(guān)推薦
淺析改進(jìn)的Apriori關(guān)聯(lián)挖掘算法的實(shí)踐應(yīng)用
摘要:本文介紹了數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用,并運(yùn)用改進(jìn)的Apriori關(guān)聯(lián)挖掘算法對安徽省圖書館自動(dòng)化系統(tǒng)中讀者流通庫進(jìn)行挖掘,并對挖掘出的結(jié)果及其意義進(jìn)行評價(jià),從而為圖書館讀者管理、圖書資源的采購提供決策支持。關(guān)鍵詞:數(shù)據(jù)挖掘 Apriori算法 圖書館管理 讀者管理
數(shù)據(jù)挖掘技術(shù)在商業(yè)領(lǐng)域內(nèi)的應(yīng)用給圖書館帶來了很大的啟發(fā)。圖書館的數(shù)據(jù)庫可以運(yùn)用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析、聚類分析、決策樹、時(shí)間序列分析等數(shù)據(jù)挖掘方法,以找出數(shù)據(jù)庫中蘊(yùn)藏的對于圖書館管理有用的潛在規(guī)則,并且通過描述和預(yù)測,為圖書館的圖書采購、讀者服務(wù)、館藏目錄設(shè)置等管理工作提供決策支持。
關(guān)聯(lián)規(guī)則是與多數(shù)人想象的挖掘過程中最相近的一種數(shù)據(jù)挖掘形式,即尋找在同一事件中出現(xiàn)的不同項(xiàng)的相關(guān)性。關(guān)聯(lián)規(guī)則的研究有助于發(fā)現(xiàn)數(shù)據(jù)庫中不同商品間的聯(lián)系,找出顧客購買行為模式。在圖書館運(yùn)用關(guān)聯(lián)規(guī)則分析可以細(xì)分出讀者群,根據(jù)其借閱情況提供不同的服務(wù),為圖書館的管理決策提供參考。關(guān)聯(lián)規(guī)則的核心算法是Apriori算法。
關(guān)聯(lián)規(guī)則的基本概念及算法
挖掘流通借閱事務(wù)數(shù)據(jù)庫中所有的關(guān)聯(lián)規(guī)則的問題可以被劃分成如下兩個(gè)子問題:
找出所有具有最小支持度的項(xiàng)集(即頻繁項(xiàng)集),可用Apriori算法來找出頻繁項(xiàng)集。由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,對于每一個(gè)頻繁項(xiàng)集I,找出其中所有的非空子集,然后,對于每一個(gè)這樣的子集a,如果support(I)與support(a)的比值大于最小置信度,則存在規(guī)則a=