基于數(shù)據(jù)挖掘技術(shù)的移動運營商用戶投訴數(shù)據(jù)研究
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘技術(shù)的移動運營商用戶投訴數(shù)據(jù)研究
更多相關(guān)文章: 主題模型 短文本 文本分類 用戶畫像
【摘要】:隨著移動互聯(lián)網(wǎng)時代的到來,移動運營商之間的競爭越來越激烈,如何維系好用戶群體并提升用戶的滿意度成為各方競爭的焦點。用戶投訴是用戶意見的直接反饋,運營商擁有通過多渠道獲得的大量用戶投訴數(shù)據(jù),其中蘊含了很多極有價值的信息,而當(dāng)前運營商處理用戶投訴往往只能依靠人工審閱,缺乏系統(tǒng)化和自動化的投訴分析工具。本文從移動運營商的用戶投訴數(shù)據(jù)入手,首先對用戶投訴進(jìn)行主題建模,挖掘出用戶投訴的焦點問題,其次進(jìn)行了用戶投訴自動分類的研究,最后,將用戶的投訴與用戶本身屬性結(jié)合起來,挖掘用戶的特征并描繪用戶畫像。通過這些研究,最終幫助移動運營商改善服務(wù)、提高競爭力。本文主要工作如下:1)對投訴文本進(jìn)行主題建模發(fā)現(xiàn)投訴熱點話題。針對經(jīng)典的LDA主題模型在短文本上表現(xiàn)不佳的問題,基于短文本特征擴展的思想,提出了一種基于詞共現(xiàn)網(wǎng)絡(luò)進(jìn)行文本特征擴展的方法,以解決短文本的特征稀疏問題。2)對投訴文本進(jìn)行自動分類。針對傳統(tǒng)的向量空間模型存在的特征維度高且無法分辨文本的語義模糊性的問題,使用文本的主題特征來進(jìn)行文本的向量表示。不同分類算法下的實驗表明,該方法能夠在保證分類準(zhǔn)確度的前提下大大提升時間效率。3)對投訴用戶畫像進(jìn)行挖掘。針對傳統(tǒng)的統(tǒng)計方法無法發(fā)現(xiàn)對用戶具有關(guān)鍵影響力特征的問題,提出一種基于C4.5算法的用戶特征挖掘方法,實驗表明該方法能夠挖掘出目標(biāo)用戶群體的典型特征。
【關(guān)鍵詞】:主題模型 短文本 文本分類 用戶畫像
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F626;TP311.13
【目錄】:
- 摘要6-7
- Abstract7-10
- 第一章 緒論10-13
- 1.1 研究背景及意義10-11
- 1.2 研究內(nèi)容及目標(biāo)11-12
- 1.3 論文的組織結(jié)構(gòu)12-13
- 第二章 文本主題挖掘及用戶畫像技術(shù)概述13-25
- 2.1 引言13
- 2.2 文本主題挖掘相關(guān)技術(shù)13-21
- 2.2.1 潛在語義分析13-14
- 2.2.2 概率潛在語義分析14-17
- 2.2.3 潛在狄利克雷分配17-19
- 2.2.4 短文本主題模型19-21
- 2.3 用戶畫像挖掘相關(guān)技術(shù)21-24
- 2.3.1 用戶特征選擇21-24
- 2.3.2 用戶特征挖掘24
- 2.4 本章小結(jié)24-25
- 第三章 用戶投訴文本挖掘25-49
- 3.1 引言25-26
- 3.2 用戶投訴預(yù)處理26-27
- 3.2.1 用戶投訴文本分詞26-27
- 3.2.2 用戶投訴數(shù)據(jù)清洗27
- 3.2.3 相同用戶投訴合并27
- 3.3 基于詞網(wǎng)絡(luò)模塊度的短文本擴展27-34
- 3.3.1 社團發(fā)現(xiàn)與模塊度簡介28-29
- 3.3.2 帶權(quán)詞網(wǎng)絡(luò)的構(gòu)建29-31
- 3.3.3 新詞加入社團前后模塊度增量計算31-32
- 3.3.4 基于模塊度的短文本擴展策略32-34
- 3.4 用戶投訴主題模型34-36
- 3.4.1 LDA吉布斯采樣簡介34-36
- 3.4.2 用戶投訴主題模型算法流程36
- 3.5 用戶投訴分類36-41
- 3.5.1 訓(xùn)練集的構(gòu)造37
- 3.5.2 文本的向量表示37-39
- 3.5.3 文本分類39-41
- 3.6 實驗41-48
- 3.6.1 實驗一:用戶投訴文本主題模型算法效果評估41-45
- 3.6.2 實驗二:用戶投訴文本分類算法效果評估45-48
- 3.7 本章小結(jié)48-49
- 第四章 投訴用戶特征挖掘49-63
- 4.1 引言49
- 4.2 訓(xùn)練集構(gòu)建49-51
- 4.2.1 用戶特征選取和預(yù)處理49-50
- 4.2.2 訓(xùn)練集的構(gòu)建策略50-51
- 4.3 基于聚類的離群點檢測51-54
- 4.4 類別不均衡問題的處理54-56
- 4.4.1 類別不均衡問題的定義54-56
- 4.4.2 基于聚類結(jié)果的欠采樣56
- 4.5 基于C4.5的用戶特征挖掘模型56-60
- 4.5.1 決策樹分類算法簡介56-58
- 4.5.2 基于C4.5的用戶特征挖掘建摸58-60
- 4.6 實驗60-61
- 4.6.1 實驗設(shè)置60
- 4.6.2 實驗結(jié)果60-61
- 4.6.3 實驗總結(jié)61
- 4.7 本章小結(jié)61-63
- 第五章 總結(jié)與展望63-65
- 5.1 本文工作總結(jié)63-64
- 5.2 不足與展望64-65
- 參考文獻(xiàn)65-68
- 致謝68-69
- 附錄69-70
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 趙建坤;從用戶投訴審視郵政的服務(wù)管理[J];中國郵政;2004年11期
2 胥學(xué)躍;淺議電信用戶投訴[J];四川通信技術(shù);2001年06期
3 周海華;;標(biāo)準(zhǔn)+分級+特色:3G用戶投訴“變廢為寶”之策[J];通信世界;2009年41期
4 孫志誠;吳丹;;為用戶投訴“問責(zé)制”叫好[J];信息網(wǎng)絡(luò);2010年07期
5 孫靜;呂廷杰;;用戶投訴在電信行業(yè)同質(zhì)化競爭中的作用[J];通信企業(yè)管理;2010年11期
6 黃志豪;鐘其柱;梅艷;;移動用戶投訴場景回溯系統(tǒng)的研究與應(yīng)用[J];電信快報;2014年07期
7 信;第三季度:電信服務(wù)質(zhì)量居用戶投訴之首[J];通信世界;2001年34期
8 賀聰賢;;移動網(wǎng)用戶投訴分析[J];信息通信;2013年10期
9 胡楊;目標(biāo):摘取服務(wù)的桂冠——記荊州市電信分公司“180”用戶投訴特服臺[J];郵電企業(yè)管理;2000年11期
10 胡勝勇;保持隊伍的凝聚力[J];有線電視技術(shù);2002年14期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 胥學(xué)躍;;淺議電信用戶投訴[A];四川省通信學(xué)會2001年學(xué)術(shù)年會論文集[C];2001年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 王秀玲;接待用戶投訴“四不可”[N];中國郵政報;2007年
2 江東 曾斌 付健水;現(xiàn)場協(xié)調(diào) 廠方代表開溜“醴陵陶機”不理用戶投訴[N];中國質(zhì)量報;2000年
3 記者 司劍非 肖岱;加大服務(wù)力度 減少用戶投訴[N];人民郵電;2001年
4 孫志誠 吳丹;為用戶投訴“問責(zé)制”叫好[N];人民郵電;2010年
5 孫志誠;“曲突徙薪”與用戶投訴[N];人民郵電;2011年
6 記者 武亞亮;山西局預(yù)報用戶投訴熱點[N];中國郵政報;2006年
7 張亞楠;河北聯(lián)通強化用戶投訴處理工作[N];人民郵電;2008年
8 賀曉清;二季度用戶投訴量同比要減五成[N];中國郵政報;2005年
9 張志剛;蘇州電信實現(xiàn)本地網(wǎng)用戶投訴一體化管理[N];通信產(chǎn)業(yè)報;2001年
10 蘇文正;處理用戶投訴四要點[N];中國郵政報;2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 劉小平;成都移動網(wǎng)絡(luò)投訴多維度分析系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2015年
2 戴恒宇;基于數(shù)據(jù)挖掘技術(shù)的移動運營商用戶投訴數(shù)據(jù)研究[D];南京大學(xué);2016年
3 龍雯雯;基于數(shù)據(jù)挖掘的移動用戶投訴行為研究[D];重慶理工大學(xué);2014年
,本文編號:808225
本文鏈接:http://sikaile.net/guanlilunwen/sjfx/808225.html