分類回歸方法優(yōu)化及在消費行為分析預測中應用
本文選題:決策樹 + 剪枝算法。 參考:《中國石油大學(北京)》2016年碩士論文
【摘要】:隨著計算機在商業(yè)領域廣泛應用,積累了海量的個人消費行為數(shù)據(jù)。研究消費行為數(shù)據(jù),分析并預測消費者的消費需求和消費傾向,對企業(yè)制定生產(chǎn)和營銷計劃具有重要指導作用。為了預測消費者的消費行為,挖掘消費行為數(shù)據(jù)中的隱藏信息,主要進行如下工作:首先,優(yōu)化分類回歸決策樹的生成方法,通過分析數(shù)據(jù)在屬性取值上的分布特性限定屬性的最大分割次數(shù);為屬性選取標準添加缺失數(shù)據(jù)懲罰因子,降低將缺失取值較多的屬性選取為分割節(jié)點;同時,將離散屬性的分裂標準由二分裂改為多分裂,從而獲取具有較高分類預測準確率和較小規(guī)模的決策樹模型。其次,針對現(xiàn)有決策樹剪枝算法的缺點,提出新的動態(tài)結合決策樹的分類誤差和規(guī)模量的剪枝標準,不需要獨立剪枝數(shù)據(jù)集,并綜合考慮決策樹的分類誤差和存儲規(guī)模,解決單一指標剪枝出現(xiàn)偏向,獲得更加平衡的決策樹,提高決策樹模型的泛化能力。最后,將優(yōu)化改進的分類回歸決策樹生成算法和決策樹剪枝算法應用于劃分消費群體和預測消費者購買傾向。
[Abstract]:With the wide application of computer in the field of business, a large amount of personal consumer behavior data has been accumulated. The study of consumer behavior data and the analysis and prediction of consumer demand and propensity play an important role in guiding enterprises to formulate production and marketing plans. In order to predict the consumer's consumption behavior and mine the hidden information in the consumer behavior data, the main work is as follows: first, optimize the method of classification and regression decision tree generation. By analyzing the distribution of data on attribute values, limiting the maximum number of attribute segmentation, adding missing data penalty factor for attribute selection criteria, reducing the missing values of the attributes selected as the split node, at the same time, The split criterion of discrete attributes is changed from two-splitting to multi-splitting to obtain a decision tree model with higher classification accuracy and smaller scale. Secondly, aiming at the shortcomings of the existing decision tree pruning algorithms, a new pruning criterion for dynamic combination of decision tree classification error and scale is proposed, which does not need independent pruning data set, and considers the classification error and storage scale of decision tree synthetically. A more balanced decision tree is obtained by solving the deviation of single index pruning, and the generalization ability of decision tree model is improved. Finally, the improved classification and regression decision tree generation algorithm and the decision tree pruning algorithm are applied to partition consumer groups and predict consumer purchase tendency.
【學位授予單位】:中國石油大學(北京)
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13
【參考文獻】
相關期刊論文 前10條
1 楊貴軍;孟杰;王雙喜;;基于赤池信息準則的分類回歸決策樹剪枝算法[J];計算機應用;2014年S2期
2 梁鳳蘭;;優(yōu)化決策樹改進挖掘算法仿真[J];計算機仿真;2013年11期
3 曾小青;徐秦;張丹;林大瀚;;基于消費數(shù)據(jù)挖掘的多指標客戶細分新方法[J];計算機應用研究;2013年10期
4 孫娟;;智能參數(shù)學習的模糊決策樹算法[J];計算機工程與應用;2012年23期
5 常旭;李義杰;劉萬軍;;CDC與REP結合的決策樹剪枝優(yōu)化算法[J];計算機工程;2012年14期
6 陳毅文;馬繼偉;;電子商務中消費者購買決策及其影響因素[J];心理科學進展;2012年01期
7 姚亞夫;邢留濤;;決策樹C4.5連續(xù)屬性分割閾值算法改進及其應用[J];中南大學學報(自然科學版);2011年12期
8 盧侃;;從Shannon信息論到認知信息論[J];哈爾濱工程大學學報;2011年08期
9 朱參世;張超;李響;;基于模糊分裂的概念自適應增量決策樹分類算法[J];計算機工程與設計;2011年04期
10 李仁良;李義杰;;基于多策略的決策樹剪枝算法及其應用[J];計算機仿真;2010年11期
相關碩士學位論文 前5條
1 陳新明;淘寶網(wǎng)數(shù)據(jù)平臺數(shù)據(jù)倉庫建設[D];大連理工大學;2013年
2 黃雯;數(shù)據(jù)挖掘算法及其應用研究[D];南京郵電大學;2013年
3 許力梅;基于關聯(lián)規(guī)則的決策樹算法改進及應用[D];華南理工大學;2011年
4 周海波;基于決策樹的分類算法研究[D];蘭州大學;2009年
5 王黎明;決策樹學習及其剪枝算法研究[D];武漢理工大學;2007年
,本文編號:2002628
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2002628.html