用戶多維滿意度評價預測系統(tǒng)
本文關(guān)鍵詞:用戶多維滿意度評價預測系統(tǒng),,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著移動互聯(lián)網(wǎng)的發(fā)展,電信運營商逐漸從服務提供商轉(zhuǎn)變?yōu)閮?nèi)容提供商,開始為用戶提供各種移動互聯(lián)網(wǎng)數(shù)據(jù)業(yè)務。由于市場競爭日益激烈,電信運營商迫切需要提升市場競爭力,進一步滿足用戶的需求。數(shù)據(jù)挖掘技術(shù)為電信運營商的市場營銷提供了一種新的思路,如何從海量的業(yè)務數(shù)據(jù)中獲得有價值的知識用來輔助市場決策和精準服務已成為業(yè)內(nèi)比較熱門的課題。本文通過數(shù)據(jù)挖掘技術(shù)預測用戶的滿意度,達到了輔助了運營商進行精準服務的目的。論文主要工作如下:1)使用基于信息增益率的屬性選擇方法,從業(yè)務數(shù)據(jù)中篩選出用戶滿意度相關(guān)屬性,并與調(diào)查問卷數(shù)據(jù)組合成待處理數(shù)據(jù)集。利用各類數(shù)據(jù)預處理技術(shù),對數(shù)據(jù)進行清洗和過濾。然后,構(gòu)建出一個完備數(shù)據(jù)集,用于預測模型的建立。最終,基于不均衡數(shù)據(jù)集處理的思想,提出了類標重新組合的方法,解決了由于數(shù)據(jù)不均衡問題產(chǎn)生的對小類分類精度下降的問題。2)針對用戶滿意度預測的問題,將其轉(zhuǎn)化為用戶在多個問題維度下分類的問題,提出了使用隨機森林算法來構(gòu)建預測模型的解決方案,實現(xiàn)了對用戶每個維度滿意度的評價預測;3)基于對用戶問卷調(diào)查中問題間的關(guān)系,提出了使用基于標記關(guān)系的多標記分類算法優(yōu)化分類模型的解決方案,提升了對用戶的多維滿意度評價的預測的效果。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 多標記學習 集成學習
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13
【目錄】:
- 摘要6-7
- Abstract7-10
- 第一章 緒論10-17
- 1.1 研究背景及意義10
- 1.2 數(shù)據(jù)挖掘相關(guān)背景10-13
- 1.2.1 大數(shù)據(jù)的概念10-11
- 1.2.2 數(shù)據(jù)挖掘的概念11
- 1.2.3 數(shù)據(jù)挖掘的主要應用方向11-13
- 1.3 電信行業(yè)中精準營銷的現(xiàn)狀13-15
- 1.3.1 精準營銷的目的13
- 1.3.2 精準營銷的基本流程13-14
- 1.3.3 精準營銷的應用場景14-15
- 1.4 本文工作及組織結(jié)構(gòu)15-17
- 第二章 機器學習相關(guān)技術(shù)背景17-30
- 2.1 引言17
- 2.2 機器學習17-20
- 2.2.1 機器學習分紹17-18
- 2.2.2 機器學習的過程18
- 2.2.3 機器學習的目標18
- 2.2.4 機器學習的分類和算法18-20
- 2.3 單標記學習20-21
- 2.4 多標記學習21-25
- 2.4.1 問題定義21-22
- 2.4.2 求解策略22-23
- 2.4.3 算法分類23-25
- 2.5 性能度量25-29
- 2.5.1 單標記學習性能度量25-26
- 2.5.2 多標記學習性能度量26-29
- 2.6 本章小結(jié)29-30
- 第三章 屬性選擇與數(shù)據(jù)預處理30-48
- 3.1 引言30
- 3.2 問題描述30
- 3.3 屬性選擇30-33
- 3.3.1 屬性選擇簡介30-31
- 3.3.2 信息增益和信息增益率31-32
- 3.3.3 基于信息增益率的用戶屬性選擇32-33
- 3.4 數(shù)據(jù)集構(gòu)建33-34
- 3.5 數(shù)據(jù)預處理34-35
- 3.5.1 屬性數(shù)據(jù)處理34-35
- 3.5.2 類標數(shù)據(jù)處理35
- 3.6 不均衡數(shù)據(jù)集35-39
- 3.6.1 數(shù)據(jù)不均衡的概念35
- 3.6.2 現(xiàn)有數(shù)據(jù)不均衡處理方法35-37
- 3.6.3 不均衡數(shù)據(jù)集問題的性能度量37-39
- 3.7 類標數(shù)據(jù)的處理39-40
- 3.7.1 現(xiàn)有數(shù)據(jù)集特點39
- 3.7.2 處理不均衡數(shù)據(jù)39-40
- 3.8 基于RANDOM FOREST算法的預測模型構(gòu)建40-46
- 3.8.1 集成學習及算法介紹40-44
- 3.8.2 基于Random Forest算法的預測模型構(gòu)建44-46
- 3.9 實驗46-47
- 3.9.1 實驗設(shè)置46
- 3.9.2 實驗結(jié)果46-47
- 3.9.3 結(jié)果分析47
- 3.10 本章小結(jié)47-48
- 第四章 基于多標記學習的模型構(gòu)建48-59
- 4.1 引言48
- 4.2 常見的基于標記關(guān)系的算法介紹48-53
- 4.2.1 Calibrated Label Ranking算法48-50
- 4.2.2 Random k-Labelsets算法50-51
- 4.2.3 ML-KNN算法51-53
- 4.3 基于CLASSIFIER CHAINS算法的用戶數(shù)據(jù)挖掘53-56
- 4.3.1 Classifier Chains算法介紹53-55
- 4.3.2 基于Classfier Chains算法的預測模型構(gòu)建55-56
- 4.4 實驗56-58
- 4.4.1 實驗設(shè)置56-57
- 4.4.2 實驗結(jié)果57-58
- 4.4.3 結(jié)果分析58
- 4.5 本章小結(jié)58-59
- 第五章 總結(jié)與展望59-61
- 5.1 本文工作總結(jié)59
- 5.2 不足與展望59-61
- 參考文獻61-65
- 致謝65-66
- 附錄66-67
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 香麗蕓;淺談數(shù)據(jù)挖掘及其應用[J];昌吉師專學報;2001年02期
2 鄭雪燕,張杰明,岳洋;數(shù)據(jù)挖掘語言[J];計算機時代;2001年11期
3 劉明晶;數(shù)據(jù)挖掘[J];華南金融電腦;2001年04期
4 張偉;劉勇國;彭軍;廖曉峰;吳中福;;數(shù)據(jù)挖掘發(fā)展研究[J];計算機科學;2001年07期
5 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識別與人工智能;2001年01期
6 朱建平,張潤楚;數(shù)據(jù)挖掘的發(fā)展及其特點[J];統(tǒng)計與決策;2002年07期
7 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場;2002年11期
8 李峻;數(shù)據(jù)挖掘,企業(yè)洞察先機的“慧眼”[J];中國計算機用戶;2002年48期
9 羅可,蔡碧野,卜勝賢,謝中科;數(shù)據(jù)挖掘及其發(fā)展研究[J];計算機工程與應用;2002年14期
10 ;2002數(shù)據(jù)挖掘研討班[J];計算機工程;2002年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 史東輝;蔡慶生;張春陽;;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2000年
2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應用[A];紀念中國農(nóng)業(yè)工程學會成立30周年暨中國農(nóng)業(yè)工程學會2009年學術(shù)年會(CSAE 2009)論文集[C];2009年
3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢[A];信息化、工業(yè)化融合與服務創(chuàng)新——第十三屆計算機模擬與信息技術(shù)學術(shù)會議論文集[C];2011年
4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應用[A];科技、工程與經(jīng)濟社會協(xié)調(diào)發(fā)展——中國科協(xié)第五屆青年學術(shù)年會論文集[C];2004年
5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學技術(shù)情報學會學術(shù)年會論文集[C];2004年
6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務中的應用[A];中南六。▍^(qū))自動化學會第24屆學術(shù)年會會議論文集[C];2006年
7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應用[A];計算機技術(shù)與應用進展·2007——全國第18屆計算機技術(shù)與應用(CACIS)學術(shù)會議論文集[C];2007年
8 肖陽;李啟賢;;數(shù)據(jù)挖掘在中國鋼鐵行業(yè)中的應用[A];中國計量協(xié)會冶金分會2012年會暨能源計量與節(jié)能降耗經(jīng)驗交流會論文集[C];2012年
9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應用[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年
10 謝中;邱玉輝;;面向商務網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2001年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 本報記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日報;2002年
2 周蓉蓉;數(shù)據(jù)挖掘需要點想像力[N];計算機世界;2004年
3 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學計算機科學與技術(shù)學院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險業(yè)的新藍海[N];網(wǎng)絡(luò)世界;2012年
5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年
6 本報記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點[N];中國電子報;2002年
7 本報記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國信息化新浪潮[N];中國電子報;2003年
8 本報記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國旅游報;2002年
9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭的基礎(chǔ)工程[N];解放軍報;2005年
10 本報記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時報;2002年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 于自強;海量流數(shù)據(jù)挖掘相關(guān)問題研究[D];山東大學;2015年
2 張馨;全基因組SNP芯片應用于CNV和L0H分析的軟件比對與數(shù)據(jù)挖掘[D];復旦大學;2011年
3 彭計紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學;2015年
4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復旦大學;2013年
5 鄔文帥;基于多目標決策的數(shù)據(jù)挖掘方法評估與應用[D];電子科技大學;2015年
6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟貿(mào)易大學;2010年
7 李榮;生物信息數(shù)據(jù)挖掘若干關(guān)鍵問題研究與應用[D];復旦大學;2004年
8 李玉華;面向服務的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];華中科技大學;2006年
9 吳少智;時間序列數(shù)據(jù)挖掘在生物醫(yī)學中的應用研究[D];電子科技大學;2010年
10 王珊珊;知識指導下的數(shù)據(jù)挖掘在新聞和金融工具之間因果關(guān)系上的應用[D];中國科學技術(shù)大學;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 林仁紅;基于數(shù)據(jù)挖掘的機遇識別與評價研究[D];首都經(jīng)濟貿(mào)易大學;2007年
2 張彥俊;游戲運營中的數(shù)據(jù)挖掘[D];復旦大學;2011年
3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類中的應用研究[D];昆明理工大學;2015年
4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應用平臺設(shè)計[D];江南大學;2015年
5 劉學建;數(shù)據(jù)挖掘在電子商務推薦系統(tǒng)中的應用研究[D];昆明理工大學;2015年
6 戴陽陽;基于數(shù)據(jù)挖掘的金融時間序列預測研究與應用[D];江南大學;2015年
7 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學院;2015年
8 陳丹;移動互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營銷的設(shè)計與實現(xiàn)應用研究[D];華南理工大學;2015年
9 陳思;基于數(shù)據(jù)挖掘的大學生客戶識別模型的研究[D];昆明理工大學;2015年
10 位長帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學;2015年
本文關(guān)鍵詞:用戶多維滿意度評價預測系統(tǒng),由筆耕文化傳播整理發(fā)布。
本文編號:354669
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/354669.html