- 相關(guān)推薦
談數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用
內(nèi)容摘要:數(shù)據(jù)挖掘是商務(wù)智能技術(shù)的重要組成部分,是一個(gè)新的重要的研究領(lǐng)域。本文先容了商務(wù)智能技術(shù)應(yīng)用現(xiàn)狀和組成,闡述了數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用。關(guān)鍵詞:商務(wù)智能 數(shù)據(jù)挖掘 第三方物流 研究
在當(dāng)今競(jìng)爭(zhēng)日益激烈的市場(chǎng)環(huán)境中,第三方物流企業(yè)都希看能夠從浩如煙海的商務(wù)數(shù)據(jù)以及其他相關(guān)的物流業(yè)務(wù)數(shù)據(jù)中發(fā)現(xiàn)帶來(lái)巨額利潤(rùn)的商機(jī)。只有那些利用先進(jìn)的信息技術(shù)成功地收集、分析、理解信息并依據(jù)信息進(jìn)行決策的物流企業(yè)才能獲得競(jìng)爭(zhēng)上風(fēng),才是物流市場(chǎng)的贏家。因此,越來(lái)越多的物流治理者開(kāi)始借助商務(wù)智能技術(shù)來(lái)發(fā)現(xiàn)物流運(yùn)營(yíng)過(guò)程中存在的題目,找到有利的物流解決方案。
商務(wù)智能技術(shù)應(yīng)用現(xiàn)狀
我國(guó)加進(jìn)了WTO,在很多領(lǐng)域,如金融、保險(xiǎn)、物流等領(lǐng)域?qū)⒅鸩綄?duì)外開(kāi)放,這就意味著很多第三方物流企業(yè)將面臨來(lái)自國(guó)際大型跨國(guó)物流公司的巨大競(jìng)爭(zhēng)壓力。國(guó)外發(fā)達(dá)國(guó)家各種企業(yè)采用商務(wù)智能的水平已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了我國(guó)。美國(guó)Palo Alto 治理團(tuán)體公司1999年對(duì)歐洲、北美和日本375家大中型企業(yè)的商務(wù)智能技術(shù)的采用情況進(jìn)行了調(diào)查。結(jié)果顯示,在金融領(lǐng)域,商務(wù)智能技術(shù)的應(yīng)用水平已經(jīng)達(dá)到或接近70%,在營(yíng)銷(xiāo)領(lǐng)域也達(dá)到50%,并且在其他應(yīng)用領(lǐng)域?qū)υ摷夹g(shù)的采納水平都進(jìn)步約50%。現(xiàn)在,很多第三方物流企業(yè)都把數(shù)據(jù)看成寶貴的財(cái)富,紛紛利用商務(wù)智能發(fā)現(xiàn)其中隱躲的信息,借此獲得巨額的回報(bào)。
據(jù)IDC對(duì)歐洲和北美62家采用了商務(wù)智能技術(shù)的企業(yè)的調(diào)查分析發(fā)現(xiàn),這些企業(yè)的3年均勻投資回報(bào)率為401%,其中25%的企業(yè)的投資回報(bào)率超過(guò)600%。調(diào)查結(jié)果還顯示,一個(gè)企業(yè)要想在復(fù)雜的環(huán)境中獲得成功,高層治理者必須能夠控制極其復(fù)雜的貿(mào)易結(jié)構(gòu),若沒(méi)有詳實(shí)的事實(shí)和數(shù)據(jù)支持,是很難辦到的。因此,隨著數(shù)據(jù)挖掘技術(shù)的精益求精和日益成熟,它必將被更多的第三方物流企業(yè)采用,使更多的物流治理者得到更多的商務(wù)智能。
商務(wù)智能技術(shù)的組成
具體地說(shuō),商務(wù)智能技術(shù)有數(shù)據(jù)倉(cāng)庫(kù)(data warehousing)、聯(lián)機(jī)分析處理(on-line analytical processing,簡(jiǎn)稱(chēng)OLAP)、數(shù)據(jù)挖掘(data mining),包括這三者在內(nèi)的用于綜合、探察和分析商務(wù)數(shù)據(jù)的先進(jìn)的信息技術(shù)的統(tǒng)稱(chēng)就是商務(wù)智能技術(shù)。
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、隨時(shí)間變化的主要用于決策支持的數(shù)據(jù)的集合。一般來(lái)說(shuō),大的物流公司或企業(yè)內(nèi)存在著各種各樣的信息系統(tǒng),這些應(yīng)用驅(qū)動(dòng)的操縱型信息系統(tǒng)為企業(yè)不同的物流業(yè)務(wù)系統(tǒng)服務(wù),具有不同接口和不同的數(shù)據(jù)表示方法,互相孤立。利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)可以動(dòng)態(tài)地將各個(gè)物流企業(yè)子系統(tǒng)中的數(shù)據(jù)抽取集成到一起,進(jìn)行清洗、轉(zhuǎn)換等處理之后加載到數(shù)據(jù)倉(cāng)庫(kù)中,通過(guò)周期性的刷新,為物流用戶(hù)提供一個(gè)同一的干凈的數(shù)據(jù)視圖,為數(shù)據(jù)分析提供一個(gè)高質(zhì)量的數(shù)據(jù)源。
對(duì)于數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),可以使用一些增強(qiáng)的查詢(xún)和報(bào)表工具進(jìn)行復(fù)雜的查詢(xún)和即時(shí)的報(bào)表制作,可以利用OLAP技術(shù)從多種角度對(duì)物流業(yè)務(wù)數(shù)據(jù)進(jìn)行多方面的匯總、統(tǒng)計(jì)、計(jì)算,還可以利用數(shù)據(jù)挖掘技術(shù)自動(dòng)發(fā)現(xiàn)其中隱含的有用的物流信息。
數(shù)據(jù)挖掘又稱(chēng)知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,簡(jiǎn)稱(chēng)KDD),是從大量數(shù)據(jù)中抽取有意義的、隱含的、以前未知的并有潛伏使用價(jià)值的知識(shí)的過(guò)程。數(shù)據(jù)挖掘是一個(gè)多學(xué)科交叉性學(xué)科,它涉及統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)、模式識(shí)別、可視化以及高性能計(jì)算等多個(gè)學(xué)科。利用數(shù)據(jù)挖掘技術(shù)可以分析各種類(lèi)型的數(shù)據(jù),例如結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)、靜態(tài)的歷史數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)流數(shù)據(jù)等。
數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用分析
數(shù)據(jù)挖掘是從大量的、不完全的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛伏有用的數(shù)據(jù)中發(fā)現(xiàn)其潛伏規(guī)律的技術(shù),是當(dāng)前計(jì)算機(jī)科學(xué)研究的熱門(mén)之一。隨著信息技術(shù)的高速發(fā)展,積累的有關(guān)物流行業(yè)的數(shù)據(jù)量劇增,如何從大量的物流數(shù)據(jù)中提取有用的知識(shí)成為第三方物流企業(yè)當(dāng)務(wù)之急。數(shù)據(jù)挖掘就是為順應(yīng)需要應(yīng)運(yùn)而生發(fā)展起來(lái)的數(shù)據(jù)處理技術(shù)。
數(shù)據(jù)挖掘的對(duì)象
關(guān)系數(shù)據(jù)庫(kù)(relational database)中通常存儲(chǔ)和治理的是結(jié)構(gòu)化的數(shù)據(jù),它將一個(gè)實(shí)體的各方面信息通過(guò)離散的屬性進(jìn)行描述。而文本數(shù)據(jù)庫(kù)(text database)或文檔數(shù)據(jù)庫(kù)(document database)則通常存儲(chǔ)和治理的是半結(jié)構(gòu)化的數(shù)據(jù),例如新聞稿件、研究論文、電子郵件、書(shū)籍以及WEB頁(yè)面等都屬于半結(jié)構(gòu)化數(shù)據(jù)。空間數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)中存放的是非結(jié)構(gòu)化數(shù)據(jù),例如輿圖、圖片、音頻、視頻等都屬于非結(jié)構(gòu)化數(shù)據(jù)。相對(duì)于半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)來(lái)說(shuō),針對(duì)結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)比較成熟,市場(chǎng)上有很多的商品軟件可以使用,用的較多的包括IBM Intelligent Miner、SAS Enterprise Miner、SGI MineSet、Clementine SPSS以及Microsoft SQL Server 2000等。關(guān)于半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)挖掘軟件尚未幾,相應(yīng)的算法相對(duì)還較少。從另一個(gè)角度來(lái)說(shuō),數(shù)據(jù)挖掘的分析對(duì)象分為兩種類(lèi)型:靜態(tài)數(shù)據(jù)和數(shù)據(jù)流(data stream)數(shù)據(jù),F(xiàn)在的多數(shù)數(shù)據(jù)挖掘算法是用于分析靜態(tài)數(shù)據(jù)的。
數(shù)據(jù)挖掘的分析
無(wú)論要分析的數(shù)據(jù)對(duì)象的類(lèi)型如何,常用的數(shù)據(jù)挖掘分析包括關(guān)聯(lián)分析、序列分析、分類(lèi)、猜測(cè)、聚類(lèi)分析以及時(shí)間序列分析等。
關(guān)聯(lián)分析 關(guān)聯(lián)分析是由Rakesh Apwal等人首先提出的。兩個(gè)或兩個(gè)以上變量的取值之間存在某種規(guī)律性,就稱(chēng)為關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類(lèi)重要的、可被發(fā)現(xiàn)的知識(shí)。關(guān)聯(lián)分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱躲的關(guān)聯(lián)網(wǎng)。一般用支持度和可信度兩個(gè)閥值來(lái)度量關(guān)聯(lián)規(guī)則的相關(guān)性,還不斷引進(jìn)愛(ài)好度、相關(guān)性等參數(shù),使得所挖掘的規(guī)則更符合需求。關(guān)聯(lián)分析主要用于發(fā)現(xiàn)不同事件之間的關(guān)聯(lián)性,即一個(gè)事件發(fā)生的同時(shí),另一個(gè)事件也經(jīng)常發(fā)生。關(guān)聯(lián)分析的重點(diǎn)在于快速發(fā)現(xiàn)那些有實(shí)用價(jià)值的關(guān)聯(lián)發(fā)生的事件。其主要依據(jù)是事件發(fā)生的概率和條件概率應(yīng)該符合一定的統(tǒng)計(jì)意義。 對(duì)于結(jié)構(gòu)化的數(shù)據(jù),以物流客戶(hù)的采購(gòu)習(xí)慣數(shù)據(jù)為例,利用關(guān)聯(lián)分析,可以發(fā)現(xiàn)物流客戶(hù)的關(guān)聯(lián)采購(gòu)需要。例如,對(duì)于第三方物流企業(yè)來(lái)說(shuō),一個(gè)托運(yùn)貨物的貨主很可能同時(shí)有貨物的包裝、流通加工等物流業(yè)務(wù)的需求。利用這種知識(shí)可以采取積極的物流運(yùn)營(yíng)策略,擴(kuò)展物流客戶(hù)采購(gòu)物流服務(wù)的范圍,吸引更多的物流客戶(hù)。通過(guò)調(diào)整服務(wù)的內(nèi)容便于物流顧客采購(gòu)到各種物流服務(wù),或者通過(guò)降低一種物流業(yè)務(wù)的價(jià)格來(lái)促進(jìn)另一種物流業(yè)務(wù)的銷(xiāo)售等。
分類(lèi)分析 分類(lèi)分析是通過(guò)分析具有種別的樣本的特點(diǎn),得到?jīng)Q定樣本屬于各種種別的規(guī)則或方法。利用這些規(guī)則和方法對(duì)未知種別的樣天職類(lèi)時(shí)應(yīng)該具有一定的正確度。分類(lèi)分析可以根據(jù)顧客的消費(fèi)水平和基本特征對(duì)物流顧客進(jìn)行分類(lèi),找出對(duì)第三方物流企業(yè)有較大利益貢獻(xiàn)的重要的物流客戶(hù)的特征,通過(guò)對(duì)其進(jìn)行個(gè)性化物流服務(wù),進(jìn)步他們的忠誠(chéng)度。
聚類(lèi)分析 聚類(lèi)分析是根據(jù)物以類(lèi)聚的原理,將本身沒(méi)有種別的樣本聚集成不同的組,并且對(duì)每一個(gè)這樣的組進(jìn)行描述的過(guò)程。其主要依據(jù)是聚到同一個(gè)組中的樣本應(yīng)該彼此相似,而屬于不同組的樣本應(yīng)該足夠不相似。
以第三方物流企業(yè)的客戶(hù)關(guān)系治理為例,利用聚類(lèi)分析,根據(jù)物流客戶(hù)的個(gè)人特征以及物流業(yè)務(wù)消費(fèi)數(shù)據(jù),可以將客戶(hù)群體進(jìn)行細(xì)分。例如,可以得到這樣的一個(gè)物流業(yè)務(wù)消費(fèi)群體:生產(chǎn)企業(yè)對(duì)物流業(yè)務(wù)中運(yùn)輸需求占41%,對(duì)物流業(yè)務(wù)中倉(cāng)儲(chǔ)業(yè)務(wù)的需求占23%;貿(mào)易企業(yè)對(duì)物流業(yè)務(wù)中運(yùn)輸需求占59%,對(duì)物流業(yè)務(wù)中倉(cāng)儲(chǔ)業(yè)務(wù)需求占77%。針對(duì)不同的客戶(hù)群,可以實(shí)施不同的物流服務(wù)方式,從而進(jìn)步客戶(hù)的滿(mǎn)足度。
數(shù)據(jù)挖掘流程
定義題目:第三方物流企業(yè)首先清楚地定義出各種物流業(yè)務(wù)題目,確定數(shù)據(jù)挖掘的目的。
數(shù)據(jù)預(yù)備:首先第三方物流企業(yè)在大型數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)目標(biāo)中提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集進(jìn)行數(shù)據(jù)選擇;其次進(jìn)行數(shù)據(jù)的預(yù)處理,包括檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性、填補(bǔ)丟失的域,刪除無(wú)效數(shù)據(jù)等。
數(shù)據(jù)挖掘:第三方物流企業(yè)根據(jù)數(shù)據(jù)功能的類(lèi)型和數(shù)據(jù)的特點(diǎn)選擇相應(yīng)的算法,在凈化和轉(zhuǎn)換過(guò)的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。
結(jié)果分析:第三方物流企業(yè)對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋和評(píng)價(jià),轉(zhuǎn)換成為能夠終極被理解的知識(shí)。
知識(shí)的運(yùn)用:第三方物流企業(yè)將分析所得到的知識(shí)集成到物流業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中往。
評(píng)價(jià)數(shù)據(jù)挖掘軟件需要考慮的題目
越來(lái)越多的軟件供給商加進(jìn)了數(shù)據(jù)挖掘這一領(lǐng)域的競(jìng)爭(zhēng)。第三方物流企業(yè)如何正確評(píng)價(jià)一個(gè)貿(mào)易軟件,選擇合適的軟件成為數(shù)據(jù)挖掘成功應(yīng)用的關(guān)鍵。評(píng)價(jià)一個(gè)數(shù)據(jù)挖掘軟件主要應(yīng)從以下四個(gè)主要方面:
計(jì)算性能:如該軟件能否在不同的物流業(yè)務(wù)平臺(tái)運(yùn)行;軟件的架構(gòu);能否連接不同的數(shù)據(jù)源;操縱大數(shù)據(jù)集時(shí),性能變化是線性的還是指數(shù)的;算的效率;是否基于組件結(jié)構(gòu)易于擴(kuò)展;運(yùn)行的穩(wěn)定性等;
功能性:如軟件是否提供足夠多樣的算法;能否避免挖掘過(guò)程黑箱化;軟件提供的算法能否應(yīng)用于多種類(lèi)型的數(shù)據(jù);第三方物流企業(yè)能否調(diào)整算法和算法的參數(shù);軟件能否從數(shù)據(jù)集隨機(jī)抽取數(shù)據(jù)建立預(yù)挖掘模型;能否以不同的形式表現(xiàn)挖掘結(jié)果等。
可用性:如用戶(hù)界面是否友好;軟件是否易學(xué)易用;軟件面對(duì)的用戶(hù)是初學(xué)者、高級(jí)用戶(hù)還是專(zhuān)家;錯(cuò)誤報(bào)告對(duì)用戶(hù)調(diào)試是否有很大幫助。
輔助功能:如是否答應(yīng)第三方物流企業(yè)更改數(shù)據(jù)集中的錯(cuò)誤值或進(jìn)行數(shù)據(jù)清洗;是否答應(yīng)值的全局替換;能否將連續(xù)數(shù)據(jù)離散化;能否根據(jù)用戶(hù)制定的規(guī)則從數(shù)據(jù)集中提取子集;能否將數(shù)據(jù)中的空值用某一適當(dāng)均值或用戶(hù)指定的值代替;能否將一次分析的結(jié)果反饋到另一次分析中等等。
數(shù)據(jù)挖掘技術(shù)是一個(gè)年輕且布滿(mǎn)?吹难芯款I(lǐng)域,利益的強(qiáng)大驅(qū)動(dòng)力將會(huì)不停地促進(jìn)它的發(fā)展。每年都有新的數(shù)據(jù)挖掘方法和模型問(wèn)世,人們對(duì)它的研究正日益廣泛和深進(jìn)。盡管如此,數(shù)據(jù)挖掘技術(shù)仍然面臨著很多題目和挑戰(zhàn):如數(shù)據(jù)挖掘方法的效率亟待進(jìn)步,尤其是超大規(guī)模數(shù)據(jù)集中數(shù)據(jù)挖掘的效率;開(kāi)發(fā)適應(yīng)多數(shù)據(jù)類(lèi)型的挖掘方法,以解決異質(zhì)數(shù)據(jù)集的數(shù)據(jù)挖掘題目;動(dòng)態(tài)數(shù)據(jù)和知識(shí)的數(shù)據(jù)挖掘;網(wǎng)絡(luò)與分布式環(huán)境下的數(shù)據(jù)挖掘等。
【談數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用】相關(guān)文章:
談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用03-21
數(shù)據(jù)挖掘技術(shù)在企業(yè)知識(shí)管理中的應(yīng)用03-19
數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用03-22
淺談現(xiàn)代企業(yè)物流管理中的數(shù)據(jù)挖掘技術(shù)03-07
基于數(shù)據(jù)挖掘技術(shù)的現(xiàn)代物流管理03-25
第三方物流企業(yè)中的商務(wù)智能技術(shù)應(yīng)用03-23
數(shù)據(jù)挖掘技術(shù)在客戶(hù)關(guān)系管理中的應(yīng)用12-09