基于數(shù)據(jù)挖掘的客戶忠誠度分析
發(fā)布時間:2017-10-05 13:29
本文關鍵詞:基于數(shù)據(jù)挖掘的客戶忠誠度分析
更多相關文章: 知識發(fā)現(xiàn) 數(shù)據(jù)挖掘 分類 預測 回歸 聚類 客戶忠誠度
【摘要】:數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。它是一門交叉學科,它把人們對數(shù)據(jù)的應用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,,提供決策支持。分類和預測是數(shù)據(jù)挖掘中的重要研究方面,可以用于提取描述重要數(shù)據(jù)類的模型或預測未來的數(shù)據(jù)趨勢。經過近20年的發(fā)展,數(shù)據(jù)挖掘技術在理論研究上日趨成熟,正不斷的擴展其應用范圍,當前數(shù)據(jù)挖掘已用于電信、金融、商業(yè)、氣象預報、DNA、股票市場、入侵檢測和客戶分類等許多領域。 本文就分類分析和預測分析算法進行了深入研究,對相關算法作了改進;在此基礎上,對客戶忠誠度變化趨勢進行了預測分析。 首先研究了分類分析和預測分析的相關算法,重點探討了線性回歸分析和CART分類器的原理,對CART分類算法進行了改進;其次,以線性回歸分析和CART分類算法為主并結合其它數(shù)據(jù)挖掘算法,針對企業(yè)中的客戶忠誠度分析問題構建了客戶忠誠度分析系統(tǒng),最后,根據(jù)海爾客戶關系數(shù)據(jù),對海爾集團的客戶忠誠度進行預測,得出了有效的結果。 論文的主要內容如下: 第一,闡述了課題的研究背景及其重要的研究意義;對當前數(shù)據(jù)挖掘的國內與國外的研究動態(tài)進行分析;通過對知識發(fā)現(xiàn)一般過程的介紹,分析了一個典型的數(shù)據(jù)挖掘系統(tǒng)中各模塊的主要功能,并對其中采用的數(shù)據(jù)挖掘的技術作了詳細闡述。 第二,介紹了決策樹,貝葉斯網絡,神經網絡,遺傳算法,線性回歸等分類和預測的方法,分析比較了其算法的優(yōu)劣及其適用范圍,并討論了評價分類準確率的方法。 第三,詳細討論了線性回歸尤其是多元線性回歸算法的基本思路及其參數(shù)估計,利用多元線性回歸思想構造了趨勢預測函數(shù);分析了CART分類器的原理,以及決策樹的構建、修剪和驗證過程的詳細算法描述,并將CART分類算法的建樹過程與修剪過程合并,得到了合并算法,從而提高了決策樹的執(zhí)行效率。 第四,完成了客戶忠誠度分析系統(tǒng)。描述了客戶忠誠度的概念,說明研究客戶忠誠度對企業(yè)的重要意義;介紹了系統(tǒng)的主要功能:數(shù)據(jù)預處理、重點客戶發(fā)現(xiàn)以及客戶忠誠度預測;詳細討論了數(shù)據(jù)預處理模塊所采用的預處理手段和方法;通過客戶忠誠度分析系統(tǒng),就海爾集團所提供的相關數(shù)據(jù)對其客戶忠誠度變化趨勢進行了預測分析。主要操作包括:針對海爾公司的客戶關系數(shù)據(jù),選取和處理客戶忠誠 摘要 度分析數(shù)據(jù):利用原始客戶關系數(shù)據(jù)及趨勢預測函數(shù)構造客戶購買能力變化趨勢影 響因子;結合其它影響因子運用分類分析對客戶忠誠度的趨勢進行預測。該系統(tǒng)通 過在分類分析中導入變化趨勢影響因子,打破了以往的客戶忠誠度分析系統(tǒng)中對客 戶只進行類別上的劃分,而不能預測忠誠度變化趨勢的局限性。分析結果證明了忠 誠度趨勢預測算法(LTPA)的實用性。 最后,對本文的工作進行了總結和對研究前景的展望。
【關鍵詞】:知識發(fā)現(xiàn) 數(shù)據(jù)挖掘 分類 預測 回歸 聚類 客戶忠誠度
【學位授予單位】:青島大學
【學位級別】:碩士
【學位授予年份】:2004
【分類號】:TP311.1
【目錄】:
- 摘要2-4
- Abstract4-8
- 第一章 緒論8-18
- 1.1 選題的背景和意義8-9
- 1.2 國內外研究現(xiàn)狀9-10
- 1.3 數(shù)據(jù)挖掘研究的內容及面臨的挑戰(zhàn)10-16
- 1.3.1 數(shù)據(jù)挖掘定義10-11
- 1.3.2 知識發(fā)現(xiàn)的一般過程11-12
- 1.3.3 數(shù)據(jù)挖掘系統(tǒng)架構12-13
- 1.3.4 數(shù)據(jù)挖掘的分類13-15
- 1.3.5 數(shù)據(jù)挖掘研究和應用的挑戰(zhàn)性15-16
- 1.4 論文的主要內容16-18
- 第二章 分類和預測18-31
- 2.1 什么是分類、預測18-19
- 2.2 決策樹基本算法19-21
- 2.2.1 決策樹生成算法19-20
- 2.2.2 決策樹的修剪20-21
- 2.3 貝葉斯分類21-23
- 2.3.1 貝葉斯定理21-22
- 2.3.2 樸素貝葉斯分類22-23
- 2.4 神經網絡預測算法23-24
- 2.5 其他分類方法24-26
- 2.5.1 k-最臨近分類24-25
- 2.5.2 基于案例的推理25-26
- 2.5.3 遺傳算法26
- 2.6 預測26-29
- 2.6.1 非線性回歸26-27
- 2.6.2 其它回歸模型27
- 2.6.3 各種回歸模型的比較27-29
- 2.7 分類法的準確性29-30
- 2.7.1 評估分類法的準確率29-30
- 2.7.2 提高分類法的準確率30
- 2.8 本章小節(jié)30-31
- 第三章 線性回歸分析及CART分類器31-48
- 3.1 線性回歸分析31-36
- 3.1.1 一元線性回歸:31-32
- 3.1.2 多元線性回歸32-33
- 3.1.3 p元線性回歸模型中的參數(shù)估計33-35
- 3.1.4 趨勢預測函數(shù)35-36
- 3.2 CART分類器36-46
- 3.2.1 決策樹建立36-40
- 3.2.1.1 屬性向量的標準問題集38-39
- 3.2.1.2 CART決策樹構建的過程39
- 3.2.1.3 決策樹建樹算法描述39-40
- 3.2.2 決策樹修剪40-42
- 3.2.2.1 基本定義40
- 3.2.2.2 修剪決策樹的過程40-42
- 3.2.2.3 確定葉節(jié)點的類別42
- 3.2.3 決策樹驗證42-44
- 3.2.3.1 測試樣例驗證42-43
- 3.2.3.2 交叉驗證43-44
- 3.2.4 CART建樹與修剪的合并44-46
- 3.2.4.1 MDL修剪45
- 3.2.4.2 建樹與修剪合并算法45-46
- 3.3 本章小結46-48
- 第四章 基于海爾客戶關系數(shù)據(jù)的客戶忠誠度分析系統(tǒng)48-59
- 4.1 引言48
- 4.2 系統(tǒng)功能簡介48-49
- 4.3 系統(tǒng)整體構架49
- 4.4 系統(tǒng)模塊詳細介紹49-51
- 4.4.1 數(shù)據(jù)預處理模塊49-51
- 4.4.2 重點客戶發(fā)現(xiàn)模塊51
- 4.4.3 客戶忠誠度預測模塊51
- 4.5 基于海爾客戶關系數(shù)據(jù)的忠誠度分析51-58
- 4.5.1 數(shù)據(jù)的選取52-53
- 4.5.2 影響因子的構造53-55
- 4.5.3 訓練集的選取55-56
- 4.5.4 客戶忠誠度預測56-58
- 4.6 本章小結58-59
- 第五章 總結與展望59-60
- 5.1 全文的工作總結59
- 5.2 存在的問題及對未來的展望59-60
- 參考文獻60-63
- 致謝63
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識別與人工智能;2001年01期
本文編號:977065
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/977065.html
最近更新
教材專著