天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于集成學習的數(shù)據(jù)庫營銷研究

發(fā)布時間:2017-10-07 16:47

  本文關鍵詞:基于集成學習的數(shù)據(jù)庫營銷研究


  更多相關文章: 數(shù)據(jù)庫營銷 分類預測 有監(jiān)督聚類 集成學習


【摘要】:數(shù)據(jù)庫營銷指企業(yè)根據(jù)數(shù)據(jù)庫中存儲的消費者信息分析和識別可能對營銷活動或產品感興趣的消費者(目標客戶),并使用電子郵件、短信、電話等方式進行客戶深度挖掘與關系維護,或與客戶建立一對一的互動溝通關系,以便企業(yè)更好地獲取用戶偏好,確立市場定位,調整合適的產品方向和跟蹤市場管理。目前,利用數(shù)據(jù)庫營銷對用戶進行篩選分類進而進行有針對性的營銷活動已經成為很多企業(yè)提高營銷效率,降低營銷成本的重要手段。從數(shù)據(jù)挖掘的角度,我們可以將數(shù)據(jù)庫營銷中準確定位目標客戶視為分類預測問題,即根據(jù)消費者的特征屬性預測其是否購買產品或購買產品的概率,因此,提高數(shù)據(jù)庫營銷模型的預測精度具有非常重要的現(xiàn)實意義和實際價值。類別不均衡是數(shù)據(jù)庫營銷過程中普遍存在的問題,其主要表現(xiàn)為某一類別的數(shù)據(jù)量遠低于其它類別的數(shù)據(jù)量。類別不均衡這一數(shù)據(jù)特性使得傳統(tǒng)的分類預測模型在實際應用過程中面臨數(shù)據(jù)匱乏,數(shù)據(jù)淹沒等現(xiàn)象,從而降低數(shù)據(jù)庫營銷的效果。目前研究主要從數(shù)據(jù),算法和評價標準三個層面對數(shù)據(jù)庫營銷模型進行改進以提高其分類預測的準確度:數(shù)據(jù)層面主要通過改變采樣方式進而改變數(shù)據(jù)集的類別分布來解決這一問題,如過采樣,欠采樣,SMOTE算法等;算法層面則通過改善算法的內部結構或相關參數(shù)來提高算法的適應性進而改善其在非平衡數(shù)據(jù)集上的表現(xiàn),主要包括代價敏感學習,改進的SVM算法,集成學習等等;評價標準主要通過使用F-measure,ROC曲線,命中率和升力曲線等等,這些評價方法和傳統(tǒng)的方法相比,不再單一的關注分類預測模型在數(shù)據(jù)集上整體的表現(xiàn),因此更適合類別不均衡問題的評價。在這些改進的方法中,集成學習在非平衡數(shù)據(jù)集上具有更好的分類預測能力和穩(wěn)定性,并且能夠避免過擬合問題,因此更受到該領域研究者的關注。集成學習的基本思想是使用多個基礎學習器對數(shù)據(jù)集進行學習,并對學習結果進行集成得到最終輸出。相對于單一的學習模型,集成學習具有更強的泛化能力和預測效果;谝陨系目紤],本文針對消費者群體的多樣性和類別不均衡性提出了基于有監(jiān)督聚類和集成學習的數(shù)據(jù)庫營銷模型,并且從單個基礎學習器的個體性能以及各基礎學習器之間差異性的角度進一步提高集成學習在非平衡數(shù)據(jù)集上的分類性能。具體而言,本文首先使用有監(jiān)督聚類對訓練集中多數(shù)類樣本進行聚類,得到多個數(shù)據(jù)簇,再與少數(shù)類樣本組合進而得到多個類別均衡的可供訓練的數(shù)據(jù)子集。在此基礎上使用BP神經網絡進行學習,并對基礎學習器的結果進行動態(tài)集成,實證研究表明,文章所提出的模型在可有效提高數(shù)據(jù)庫營銷的準確率。
【關鍵詞】:數(shù)據(jù)庫營銷 分類預測 有監(jiān)督聚類 集成學習
【學位授予單位】:重慶大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13;F274
【目錄】:
  • 中文摘要3-4
  • 英文摘要4-8
  • 1 緒論8-12
  • 1.1 課題的研究背景和意義8-10
  • 1.2 研究內容和創(chuàng)新點10
  • 1.2.1 研究內容10
  • 1.2.2 主要創(chuàng)新點10
  • 1.3 論文的組織結構10-12
  • 2 國內外研究現(xiàn)狀12-21
  • 2.1 基于數(shù)據(jù)層面的研究現(xiàn)狀13-14
  • 2.2 基于算法層面的研究現(xiàn)狀14-16
  • 2.3 基于評價方法層面的研究現(xiàn)狀16-19
  • 2.3.1 F-measure評價法17-18
  • 2.3.2 ROC曲線18-19
  • 2.4 本章小結19-21
  • 3 數(shù)據(jù)庫營銷優(yōu)勢及存在問題21-27
  • 3.1 數(shù)據(jù)庫營銷概述21-22
  • 3.2 數(shù)據(jù)庫營銷的優(yōu)勢22-23
  • 3.3 數(shù)據(jù)庫營銷存在的問題23-24
  • 3.4 數(shù)據(jù)類別不均衡的分類預測問題24-27
  • 3.4.1 類別不均衡數(shù)據(jù)問題概述24-25
  • 3.4.2 類別不均衡數(shù)據(jù)分類困難原因分析25-27
  • 4 基于集成學習的數(shù)據(jù)庫營銷模型27-40
  • 4.1 模型所使用的基本算法概述27-34
  • 4.1.1 K-means聚類27-29
  • 4.1.2 BP神經網絡算法29-32
  • 4.1.3 集成學習方法32-34
  • 4.2 模型框架34-35
  • 4.3 數(shù)據(jù)預處理35-36
  • 4.4 有監(jiān)督聚類36-38
  • 4.5 集成學習模型38-39
  • 4.6 本章小結39-40
  • 5 實證研究和結果分析40-49
  • 5.1 數(shù)據(jù)簡介40-41
  • 5.2 用于比較的方法41-45
  • 5.2.1 SMOTE算法41-42
  • 5.2.2 FN欠采樣算法42-43
  • 5.2.3 GA / ANN算法43-45
  • 5.3 評價準則45-46
  • 5.3.1 命中率45
  • 5.3.2 升力曲線45-46
  • 5.4 實證結果46-47
  • 5.5 本章小結47-49
  • 6 結論與展望49-51
  • 6.1 研究結論49-50
  • 6.2 工作展望50-51
  • 致謝51-52
  • 參考文獻52-57
  • 附錄 作者在攻讀碩士學位期間發(fā)表論文的目錄57

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前5條

1 趙自翔;王廣亮;李曉東;;基于支持向量機的不平衡數(shù)據(jù)分類的改進欠采樣方法[J];中山大學學報(自然科學版);2012年06期

2 周濤;陸惠玲;;數(shù)據(jù)挖掘中聚類算法研究進展[J];計算機工程與應用;2012年12期

3 鄧曉懿;金淳;j 口良之;韓慶平;;移動商務中面向客戶細分的KSP混合聚類算法[J];管理科學;2011年04期

4 陶新民;劉福榮;童智靖;楊立標;;不均衡數(shù)據(jù)下基于SVM的故障檢測新算法[J];振動與沖擊;2010年12期

5 謝紀剛;裘正定;;非平衡數(shù)據(jù)集Fisher線性判別模型[J];北京交通大學學報;2006年05期

中國碩士學位論文全文數(shù)據(jù)庫 前1條

1 周永進;BP網絡的改進及其應用[D];南京信息工程大學;2007年

,

本文編號:988989

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/xmjj/988989.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶d1ef2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com