決策樹算法在煙草公司CRM中的研究與應(yīng)用
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP311.13
【圖文】:
決策樹算法在煙草公司 CRM 中的研究與應(yīng)用6圖2.1 數(shù)據(jù)挖掘技術(shù)分類Figure 2.1 data mining classification分類分析利用訓(xùn)練樣本集建立起分類模型,利用該模型中的分類規(guī)則,對新數(shù)據(jù)實(shí)施分類。聚類分析是把數(shù)據(jù)庫中大量數(shù)據(jù)按照一定的聚類規(guī)則聚成少量的群組。這些群組具有不同的意義,群組內(nèi)的數(shù)據(jù)盡量相似,群組間的數(shù)據(jù)有著較大差別。關(guān)聯(lián)規(guī)則分析是對于數(shù)據(jù)集中前后項(xiàng)之間所隱藏的相互關(guān)聯(lián)關(guān)系進(jìn)行識(shí)別與挖掘,關(guān)聯(lián)規(guī)則分析在零售商業(yè)決策中有著廣泛應(yīng)用[14];貧w分析是根據(jù)數(shù)據(jù)集中的自變量與因變量的關(guān)系確定一個(gè)擬合方程,利用樣本數(shù)據(jù)訓(xùn)練確定擬合方程的參數(shù),常用的回歸分析方法是線性回歸。常用的數(shù)據(jù)挖掘方法包括樸素貝葉斯、BP 神經(jīng)網(wǎng)絡(luò)、遺傳算法和決策樹方法等等。這樣的算法,實(shí)際上亦即其核心的技術(shù)。這篇文章之中,所采用的數(shù)據(jù)源來自于兩個(gè)方面:一是卷煙的銷售信息;二是客戶的資料信息。利用預(yù)測式的數(shù)據(jù)挖掘中的決策樹分類方法,建立分類決策樹
內(nèi)蒙古大學(xué)工程碩士學(xué)位論文7圖2.2 數(shù)據(jù)挖掘算法過程Figure 2.2 data mining process1、數(shù)據(jù)準(zhǔn)備數(shù)據(jù)的準(zhǔn)備階段要做的就是,根據(jù)挖掘的目標(biāo)和將要解決的問題,制定解決問題計(jì)劃,確定數(shù)據(jù)源。2、數(shù)據(jù)選擇由于數(shù)據(jù)來源不同,有些數(shù)據(jù)對于挖掘模式和建立模型意義不大,而且當(dāng)中存在一定數(shù)量的數(shù)據(jù)還可能會(huì)影響數(shù)據(jù)挖掘的效果。因此,要對數(shù)據(jù)源的眾多數(shù)據(jù)進(jìn)行篩選,了解數(shù)據(jù)的類型和數(shù)據(jù)的公式表達(dá)方式,保證數(shù)據(jù)的實(shí)用性和可用性。在保證數(shù)據(jù)完整的基礎(chǔ)上,進(jìn)行數(shù)據(jù)的篩選集成,提高數(shù)據(jù)的處理質(zhì)量。3、數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理是對數(shù)據(jù)進(jìn)行初步的處理,主要包括清洗、轉(zhuǎn)換、填補(bǔ)、合并操作四個(gè)步驟。從而找到能夠用于挖掘的適合的數(shù)據(jù),保證數(shù)據(jù)的可信度和數(shù)據(jù)挖掘的質(zhì)量。4、數(shù)據(jù)挖掘數(shù)據(jù)挖掘是整個(gè)過程中最重要的一個(gè)環(huán)節(jié)
[20]。圖3.3 基于 SSAS 的 CRM-DM 解決方案Figure 3.3 a CRM-DM solution based on SSAS(2)數(shù)據(jù)倉庫數(shù)據(jù)倉庫是數(shù)據(jù)挖掘過程中的要素,只有建立起相應(yīng)的倉庫,才能將多維數(shù)據(jù)集(Cube)與數(shù)據(jù)集(Dataset)提供給數(shù)據(jù)挖掘過程。在進(jìn)行 Cube 的創(chuàng)建工作時(shí),SSAS 具有很大的優(yōu)勢,通過 SSAS 的自動(dòng)創(chuàng)建功能,用戶無需獲取度量數(shù)據(jù)與多維數(shù)據(jù),用戶在設(shè)置量度與維度表之后,只需進(jìn)行簡單的命令與操作即可達(dá)到既定目的。與此同時(shí),我們還可以變更 Cube的相關(guān)設(shè)置,以更好地滿足用戶需求。綜上所述,在創(chuàng)建數(shù)據(jù)倉庫過程中,需要著手的主要任務(wù)有明確量度組與維度表間的關(guān)系。(3)聯(lián)機(jī)分析處理(OLAP)在進(jìn)行數(shù)據(jù)分析時(shí),我們一般使用 OLAP 方式。OLAP 的運(yùn)作前提是多維數(shù)據(jù)模型
【參考文獻(xiàn)】
相關(guān)期刊論文 前9條
1 李紅梅;曹建河;;數(shù)據(jù)挖掘技術(shù)在煙草銷售行業(yè)中應(yīng)用探析[J];現(xiàn)代商貿(mào)工業(yè);2011年14期
2 王永梅;胡學(xué)鋼;;決策樹中ID3算法的研究[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
3 李俊麗;劉戰(zhàn)峰;;數(shù)據(jù)挖掘在Microsoft SQL Server 2005 Analysis Services中的應(yīng)用研究[J];軟件導(dǎo)刊;2010年03期
4 王芳;楊奕;;論數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理(CRM)中的應(yīng)用[J];現(xiàn)代商貿(mào)工業(yè);2009年01期
5 楊玉;;KDD在零售業(yè)客戶關(guān)系管理中的應(yīng)用分析研究[J];商業(yè)研究;2008年12期
6 陳建輝;;一種基于數(shù)據(jù)挖掘的CRM系統(tǒng)框架的實(shí)現(xiàn)[J];華北水利水電學(xué)院學(xué)報(bào);2007年05期
7 王桂芹;黃道;;數(shù)據(jù)挖掘技術(shù)綜述[J];電腦應(yīng)用技術(shù);2007年02期
8 柳林;涂光平;楊峰;;基于決策樹的數(shù)據(jù)挖掘方法在CRM中的應(yīng)用研究[J];計(jì)算技術(shù)與自動(dòng)化;2006年01期
9 鄧光利,劉強(qiáng),陳新度;基于數(shù)據(jù)挖掘提升客戶價(jià)值的實(shí)現(xiàn)框架探索[J];組合機(jī)床與自動(dòng)化加工技術(shù);2005年03期
相關(guān)碩士學(xué)位論文 前10條
1 張志杰;紅塔集團(tuán)面向服務(wù)的數(shù)據(jù)中心平臺(tái)與應(yīng)用架構(gòu)[D];浙江理工大學(xué);2014年
2 姚丹丹;基于數(shù)據(jù)挖掘的紅塔集團(tuán)數(shù)據(jù)庫營銷系統(tǒng)的研究與實(shí)現(xiàn)[D];浙江理工大學(xué);2014年
3 張亮;基于顧客滿意度提升的銷售流程改進(jìn)研究[D];吉林大學(xué);2013年
4 周玉嬋;數(shù)據(jù)挖掘在煙草企業(yè)CRM中的應(yīng)用[D];華南理工大學(xué);2013年
5 鄭得龍;數(shù)據(jù)挖掘在企業(yè)集團(tuán)營銷決策中的應(yīng)用研究[D];浙江理工大學(xué);2013年
6 吳優(yōu)玲;集團(tuán)企業(yè)數(shù)據(jù)中心模型架構(gòu)研究與系統(tǒng)實(shí)現(xiàn)[D];浙江理工大學(xué);2012年
7 鄭陽洋;數(shù)據(jù)挖掘技術(shù)在煙草企業(yè)CRM中的研究與應(yīng)用[D];山東師范大學(xué);2011年
8 潘少東;數(shù)據(jù)挖掘在煙草商業(yè)企業(yè)CRM中的應(yīng)用研究[D];合肥工業(yè)大學(xué);2007年
9 馮亞;數(shù)據(jù)挖掘中決策樹分類算法研究與應(yīng)用[D];西北大學(xué);2007年
10 胡江洪;基于決策樹的分類算法研究[D];武漢理工大學(xué);2006年
本文編號(hào):2768004
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/2768004.html