基于一般化關(guān)聯(lián)規(guī)則的通信運(yùn)營商離網(wǎng)數(shù)據(jù)挖掘
發(fā)布時(shí)間:2023-11-03 18:49
近年來通信運(yùn)營商的業(yè)務(wù)發(fā)展增速明顯放緩,保證用戶數(shù)的關(guān)注點(diǎn)已從增加新用戶轉(zhuǎn)移到如何去保有存量用戶中。其中的一個(gè)策略就是為從海量的存量用戶數(shù)據(jù)中分辨出那些有離網(wǎng)趨勢的用戶,采用的方法是對(duì)那些已處于離網(wǎng)的用戶(即停拆機(jī)狀態(tài)用戶)的相關(guān)數(shù)據(jù)進(jìn)行分析,找出這些用戶離網(wǎng)與其他事務(wù)間的某些關(guān)聯(lián),找到他們離網(wǎng)的原因。這在行業(yè)內(nèi)稱為適用關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘。經(jīng)典關(guān)聯(lián)規(guī)則算法只能挖掘正頻繁項(xiàng)集和正關(guān)聯(lián)規(guī)則,因此無法反映項(xiàng)目A不發(fā)生對(duì)項(xiàng)目B的促進(jìn)關(guān)系,即:-A?B,以及項(xiàng)目A發(fā)生對(duì)項(xiàng)目B發(fā)生的抑制關(guān)系,即:A?-B等。而運(yùn)營商數(shù)據(jù)中包含大量未實(shí)名、未綁定套餐、未參加補(bǔ)貼等負(fù)項(xiàng)目,同時(shí)要研究各項(xiàng)目對(duì)用戶不活躍、不出賬、不計(jì)收等負(fù)項(xiàng)目的影響,因此需要對(duì)經(jīng)典關(guān)聯(lián)規(guī)則算法進(jìn)行優(yōu)化,使之能夠同時(shí)挖掘正負(fù)頻繁項(xiàng)集,生成前后件包含正負(fù)項(xiàng)的更一般化的關(guān)聯(lián)規(guī)則,進(jìn)而應(yīng)用一般化關(guān)聯(lián)規(guī)則對(duì)通信離網(wǎng)用戶數(shù)據(jù)進(jìn)行挖掘。本文首先分析了經(jīng)典關(guān)聯(lián)規(guī)則挖掘算法的關(guān)鍵思路,基于傳統(tǒng)關(guān)聯(lián)規(guī)則算法針對(duì)通信運(yùn)營商離網(wǎng)用戶數(shù)據(jù)的特點(diǎn)引入所謂“一般化關(guān)聯(lián)規(guī)則”,提出了“關(guān)聯(lián)規(guī)則算法的一般化”、“數(shù)值屬性離散化”以及“支持度-置信度框架的完善”三個(gè)優(yōu)化方...
【文章頁數(shù)】:65 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 選題背景及意義
1.1.1 選題背景
1.1.2 選題意義
1.2 研究現(xiàn)狀及熱點(diǎn)
1.2.1 大數(shù)據(jù)研究現(xiàn)狀
1.2.2 運(yùn)營商大數(shù)據(jù)挖掘現(xiàn)狀
1.3 論文主要內(nèi)容及結(jié)構(gòu)安排
1.3.1 論文的主要研究內(nèi)容
1.3.2 論文的結(jié)構(gòu)安排
第二章 經(jīng)典關(guān)聯(lián)規(guī)則算法研究
2.1 關(guān)聯(lián)規(guī)則算法概述
2.2 靜態(tài)關(guān)聯(lián)規(guī)則挖掘算法
2.3 動(dòng)態(tài)關(guān)聯(lián)規(guī)則挖掘算法
2.3.1 數(shù)據(jù)增量更新算法FUP
2.3.2 閾值動(dòng)態(tài)更新算法IUA
2.4 其他類型的關(guān)聯(lián)規(guī)則挖掘算法研究
2.4.1 負(fù)關(guān)聯(lián)規(guī)則挖掘
2.4.2 數(shù)值關(guān)聯(lián)規(guī)則挖掘
2.4.3 多維關(guān)聯(lián)規(guī)則挖掘
2.5 本章總結(jié)
第三章 適合通信運(yùn)營商數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則算法實(shí)現(xiàn)
3.1 通信運(yùn)營商數(shù)據(jù)特點(diǎn)及算法優(yōu)化思路
3.2 關(guān)聯(lián)規(guī)則挖掘算法的一般化
3.2.1 現(xiàn)有正關(guān)聯(lián)規(guī)則挖掘算法一般化方法的缺陷
3.2.2 包含計(jì)數(shù)器結(jié)構(gòu)的一般化關(guān)聯(lián)規(guī)則算法
3.3 數(shù)值屬性離散化算法的優(yōu)化
3.3.1 等寬離散法
3.3.2 等深離散法
3.3.3 最小距離離散法
3.4 “支持度-置信度”框架的優(yōu)化
3.4.1 “支持度-置信度”框架缺陷
3.4.2 興趣度模型
3.5 GAPI算法設(shè)計(jì)及實(shí)現(xiàn)
3.5.1 頻繁項(xiàng)集挖掘中算法設(shè)計(jì)和驗(yàn)證
3.5.2 關(guān)聯(lián)規(guī)則生成中的算法設(shè)計(jì)和驗(yàn)證
3.5.3 GAPI算法實(shí)現(xiàn)
3.6 本章總結(jié)
第四章 基于GAPI算法的運(yùn)營商離網(wǎng)用戶數(shù)據(jù)挖掘?qū)嶒?yàn)
4.1 通信運(yùn)營商數(shù)據(jù)挖掘步驟
4.2 數(shù)據(jù)采集及預(yù)處理
4.2.1 數(shù)據(jù)采集及環(huán)境準(zhǔn)備
4.2.2 數(shù)據(jù)收斂
4.2.3 數(shù)據(jù)預(yù)處理
4.2.4 完成預(yù)處理
4.3 GAPI算法數(shù)據(jù)挖掘?qū)嶒?yàn)
4.3.1 挖掘頻繁項(xiàng)集
4.3.2 生成關(guān)聯(lián)規(guī)則
4.3.3 挖掘有用知識(shí)
4.4 GAPI算法挖掘?qū)嶒?yàn)結(jié)果分析
4.4.1 頻繁項(xiàng)集挖掘結(jié)果分析
4.4.2 關(guān)聯(lián)規(guī)則生成結(jié)果分析
4.5 本章總結(jié)
第五章 基于頻繁模式樹的算法進(jìn)一步優(yōu)化及實(shí)驗(yàn)
5.1 FP-Growth算法的頻繁模式樹架構(gòu)分析
5.2 基于頻繁模式樹的一般化關(guān)聯(lián)規(guī)則算法GFP算法
5.2.1 FP-Growth算法優(yōu)化思路及GFP算法的提出
5.2.2 GFP算法有效性驗(yàn)證
5.2.3 GFP算法的JAVA實(shí)現(xiàn)
5.3 基于GFP算法的通信運(yùn)營商數(shù)據(jù)挖掘?qū)嶒?yàn)
5.4 GFP算法挖掘?qū)嶒?yàn)結(jié)果分析
5.5 本章總結(jié)
第六章 總結(jié)與展望
6.1 論文總結(jié)
6.2 未來展望
參考文獻(xiàn)
附錄
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):3859694
【文章頁數(shù)】:65 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 選題背景及意義
1.1.1 選題背景
1.1.2 選題意義
1.2 研究現(xiàn)狀及熱點(diǎn)
1.2.1 大數(shù)據(jù)研究現(xiàn)狀
1.2.2 運(yùn)營商大數(shù)據(jù)挖掘現(xiàn)狀
1.3 論文主要內(nèi)容及結(jié)構(gòu)安排
1.3.1 論文的主要研究內(nèi)容
1.3.2 論文的結(jié)構(gòu)安排
第二章 經(jīng)典關(guān)聯(lián)規(guī)則算法研究
2.1 關(guān)聯(lián)規(guī)則算法概述
2.2 靜態(tài)關(guān)聯(lián)規(guī)則挖掘算法
2.3 動(dòng)態(tài)關(guān)聯(lián)規(guī)則挖掘算法
2.3.1 數(shù)據(jù)增量更新算法FUP
2.3.2 閾值動(dòng)態(tài)更新算法IUA
2.4 其他類型的關(guān)聯(lián)規(guī)則挖掘算法研究
2.4.1 負(fù)關(guān)聯(lián)規(guī)則挖掘
2.4.2 數(shù)值關(guān)聯(lián)規(guī)則挖掘
2.4.3 多維關(guān)聯(lián)規(guī)則挖掘
2.5 本章總結(jié)
第三章 適合通信運(yùn)營商數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則算法實(shí)現(xiàn)
3.1 通信運(yùn)營商數(shù)據(jù)特點(diǎn)及算法優(yōu)化思路
3.2 關(guān)聯(lián)規(guī)則挖掘算法的一般化
3.2.1 現(xiàn)有正關(guān)聯(lián)規(guī)則挖掘算法一般化方法的缺陷
3.2.2 包含計(jì)數(shù)器結(jié)構(gòu)的一般化關(guān)聯(lián)規(guī)則算法
3.3 數(shù)值屬性離散化算法的優(yōu)化
3.3.1 等寬離散法
3.3.2 等深離散法
3.3.3 最小距離離散法
3.4 “支持度-置信度”框架的優(yōu)化
3.4.1 “支持度-置信度”框架缺陷
3.4.2 興趣度模型
3.5 GAPI算法設(shè)計(jì)及實(shí)現(xiàn)
3.5.1 頻繁項(xiàng)集挖掘中算法設(shè)計(jì)和驗(yàn)證
3.5.2 關(guān)聯(lián)規(guī)則生成中的算法設(shè)計(jì)和驗(yàn)證
3.5.3 GAPI算法實(shí)現(xiàn)
3.6 本章總結(jié)
第四章 基于GAPI算法的運(yùn)營商離網(wǎng)用戶數(shù)據(jù)挖掘?qū)嶒?yàn)
4.1 通信運(yùn)營商數(shù)據(jù)挖掘步驟
4.2 數(shù)據(jù)采集及預(yù)處理
4.2.1 數(shù)據(jù)采集及環(huán)境準(zhǔn)備
4.2.2 數(shù)據(jù)收斂
4.2.3 數(shù)據(jù)預(yù)處理
4.2.4 完成預(yù)處理
4.3 GAPI算法數(shù)據(jù)挖掘?qū)嶒?yàn)
4.3.1 挖掘頻繁項(xiàng)集
4.3.2 生成關(guān)聯(lián)規(guī)則
4.3.3 挖掘有用知識(shí)
4.4 GAPI算法挖掘?qū)嶒?yàn)結(jié)果分析
4.4.1 頻繁項(xiàng)集挖掘結(jié)果分析
4.4.2 關(guān)聯(lián)規(guī)則生成結(jié)果分析
4.5 本章總結(jié)
第五章 基于頻繁模式樹的算法進(jìn)一步優(yōu)化及實(shí)驗(yàn)
5.1 FP-Growth算法的頻繁模式樹架構(gòu)分析
5.2 基于頻繁模式樹的一般化關(guān)聯(lián)規(guī)則算法GFP算法
5.2.1 FP-Growth算法優(yōu)化思路及GFP算法的提出
5.2.2 GFP算法有效性驗(yàn)證
5.2.3 GFP算法的JAVA實(shí)現(xiàn)
5.3 基于GFP算法的通信運(yùn)營商數(shù)據(jù)挖掘?qū)嶒?yàn)
5.4 GFP算法挖掘?qū)嶒?yàn)結(jié)果分析
5.5 本章總結(jié)
第六章 總結(jié)與展望
6.1 論文總結(jié)
6.2 未來展望
參考文獻(xiàn)
附錄
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):3859694
本文鏈接:http://sikaile.net/guanlilunwen/sjfx/3859694.html
最近更新
教材專著