基于粗糙集特征選擇的電信客戶流失預(yù)測研究
本文關(guān)鍵詞:基于粗糙集特征選擇的電信客戶流失預(yù)測研究,由筆耕文化傳播整理發(fā)布。
【摘要】:客戶流失預(yù)測問題是客戶關(guān)系管理中的一個研究方向,,其研究涉及到多學(xué)科、多因素,多環(huán)節(jié),是一個復(fù)雜的系統(tǒng)。在電信客戶流失預(yù)測研究上,如何構(gòu)建高性能的模型從而提高預(yù)測模型的預(yù)測精度一直是研究的熱點,但是影響模型精度的因素非常多,特別是在數(shù)據(jù)預(yù)處理階段,數(shù)據(jù)預(yù)處理的好壞也會直接影響到模型構(gòu)建之后的分類性能。而在現(xiàn)有的電信客戶流失預(yù)測研究方面關(guān)于預(yù)測模型建立前數(shù)據(jù)預(yù)處理方法的研究還比較缺乏,很多還是基于經(jīng)驗的人工選擇法;同時雖然預(yù)測模型構(gòu)建方法的不斷改進(jìn)能提高分類性能,但模型的可解釋性還是比較差的,也就是在輔助決策方面并不能發(fā)揮太大的效益。在此背景下,探索和研究數(shù)據(jù)的預(yù)處理方法以及決策規(guī)則的獲取是電信客戶流失預(yù)測研究的一個新的方面,將具有重要的理論意義和實踐價值。粗糙集作為一種處理不確定、不精確問題的數(shù)學(xué)工具,其屬性約簡即特征選擇和決策規(guī)則的獲取能力可以用于從數(shù)據(jù)中挖掘出眾多有效信息,因此在知識挖掘領(lǐng)域發(fā)揮著越來越強(qiáng)的作用。本文主要研究基于粗糙集擴(kuò)展模型的特征選擇方法和決策規(guī)則的獲取。 首先采用模糊粗糙集的理論,針對混合型數(shù)據(jù),改進(jìn)屬性重要性的計算,設(shè)計改進(jìn)的CEBARKNC特征選擇算法,以實驗數(shù)據(jù)進(jìn)行特征選擇,對比分析胡清華提出的模糊粗糙集特征選擇算法結(jié)果。 其次研究多粒度粗糙集擴(kuò)展模型,將多粒度粗糙集擴(kuò)展到模糊環(huán)境中,構(gòu)建一種β多粒度模糊粗糙集模型,設(shè)計基于此模型的粒度約簡算法,以實驗數(shù)據(jù)對比分析單粒度特征選擇算法結(jié)果。并提出基于β多粒度模糊粗糙集的決策規(guī)則的獲取方法,以實例展示決策規(guī)則的形式。 然后以電信企業(yè)數(shù)據(jù)作實證,分別以所設(shè)計模糊粗糙集特征算法和β多粒度特征選擇算法選擇屬性后,得出的數(shù)據(jù)以分類器作預(yù)測模型進(jìn)行流失預(yù)測對比分析。同時進(jìn)行決策規(guī)則的獲取,從而提高模型的可解釋性。
【關(guān)鍵詞】:客戶關(guān)系管理 客戶流失預(yù)測 粗糙集 模糊粗糙集 多粒度粗糙集
【學(xué)位授予單位】:江蘇科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:F274;F626;TP18
【目錄】:
- 摘要6-7
- Abstract7-13
- 第1章 緒論13-23
- 1.1 研究背景和意義13-15
- 1.2 國內(nèi)外研究現(xiàn)狀15-20
- 1.2.1 電信客戶流失預(yù)測研究現(xiàn)狀15-18
- 1.2.2 粗糙集研究現(xiàn)狀18-20
- 1.3 本文組織結(jié)構(gòu)20-22
- 1.4 主要研究內(nèi)容22-23
- 第2章 粗糙集相關(guān)概念23-31
- 2.1 粗糙集基本理論23-24
- 2.1.1 粗糙集近似集23-24
- 2.2 知識表示24-25
- 2.3 特征選擇25
- 2.4 決策系統(tǒng)25-26
- 2.5 模糊粗糙集26
- 2.6 多粒度粗糙集26-27
- 2.7 基于粗糙集的特征選擇算法27-30
- 2.7.1 基于信息熵的特征選擇算法27-28
- 2.7.2 正域約簡特征選擇算法28-30
- 2.7.3 基于差別矩陣的特征選擇算法30
- 2.8 本章小結(jié)30-31
- 第3章 基于模糊粗糙集的特征選擇算法31-39
- 3.1 模糊相似關(guān)系31-33
- 3.2 模糊等價關(guān)系33-35
- 3.3 基于模糊粗糙集的條件信息熵35
- 3.4 基于模糊信息熵的特征選擇算法改進(jìn)35-36
- 3.5 算例36-38
- 3.6 本章小結(jié)38-39
- 第4章 β多粒度模糊粗糙集特征選擇算法39-49
- 4.1 β多粒度粗糙集39-40
- 4.2 多粒度模糊粗糙集40-41
- 4.3 β多粒度模糊粗糙集41-43
- 4.4 β多粒度模糊粗糙集粒度選擇43-45
- 4.4.1 基于正域的粒度重要度計算44-45
- 4.4.2 β多粒度模糊粗糙集粒度選擇算法45
- 4.5 算例45-48
- 4.6 本章小結(jié)48-49
- 第5章 基于β多粒度模糊粗糙集的決策規(guī)則獲取49-57
- 5.1 決策規(guī)則的獲取49
- 5.2 決策規(guī)則的度量49-50
- 5.3 β多粒度模糊粗糙集決策規(guī)則的度量50-55
- 5.4 本章小結(jié)55-57
- 第6章 特征選擇在電信客戶流失預(yù)測中的應(yīng)用57-71
- 6.1 建模技術(shù)57-60
- 6.1.1 神經(jīng)網(wǎng)絡(luò)57-58
- 6.1.2 支持向量機(jī)(SVM)58-59
- 6.1.3 邏輯回歸(Logistic)59
- 6.1.4 貝葉斯網(wǎng)絡(luò)59-60
- 6.2 評價指標(biāo)60-61
- 6.2.1 AUC(Area under the receiver operating characteristic curve)60
- 6.2.2 提升系數(shù) (Lift)60
- 6.2.3 準(zhǔn)確率(Accuracy)60-61
- 6.3 實驗 161-64
- 6.3.1 實驗數(shù)據(jù)和特征選擇61
- 6.3.2 實驗結(jié)果及分析61-64
- 6.4 實驗 264-68
- 6.4.1 實驗數(shù)據(jù)和特征選擇64-65
- 6.4.2 實驗結(jié)果及分析65-68
- 6.5 本章小結(jié)68-71
- 第7章 總結(jié)與展望71-73
- 參考文獻(xiàn)73-79
- 攻讀碩士學(xué)位期間撰寫的論文79-81
- 致謝81-82
- 詳細(xì)摘要82-86
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 羅彬;邵培基;羅盡堯;劉獨(dú)玉;夏國恩;;基于粗糙集理論-神經(jīng)網(wǎng)絡(luò)-蜂群算法集成的客戶流失研究[J];管理學(xué)報;2011年02期
2 錢蘇麗;何建敏;王純麟;;基于改進(jìn)支持向量機(jī)的電信客戶流失預(yù)測模型[J];管理科學(xué);2007年01期
3 王國胤;Rough集理論在不完備信息系統(tǒng)中的擴(kuò)充[J];計算機(jī)研究與發(fā)展;2002年10期
4 王國胤,于洪,楊大春;基于條件信息熵的決策表約簡[J];計算機(jī)學(xué)報;2002年07期
5 楊明;;一種基于改進(jìn)差別矩陣的核增量式更新算法[J];計算機(jī)學(xué)報;2006年03期
6 莊恒揚(yáng),沈新平,陸建飛,黃麗芬;模糊聚類計算方法的理論分析[J];江蘇農(nóng)學(xué)院學(xué)報;1998年03期
7 李興國;謝偉;盧光松;;SVM多類別分類方法在客戶流失預(yù)測中的應(yīng)用研究[J];計算機(jī)應(yīng)用與軟件;2010年03期
8 徐遠(yuǎn)純,盛昭瀚,柳炳祥;一種基于決策樹的客戶流失危機(jī)分析方法[J];計算機(jī)與現(xiàn)代化;2004年08期
9 許金權(quán);;模糊粗糙集的表示及應(yīng)用[J];模糊系統(tǒng)與數(shù)學(xué);2011年01期
10 張明;唐振民;徐維艷;楊習(xí)貝;;可變多粒度粗糙集模型[J];模式識別與人工智能;2012年04期
本文關(guān)鍵詞:基于粗糙集特征選擇的電信客戶流失預(yù)測研究,由筆耕文化傳播整理發(fā)布。
本文編號:450782
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/450782.html