基于Hadoop平臺的電信養(yǎng)卡研究與分析
本文關鍵詞:基于Hadoop平臺的電信養(yǎng)卡研究與分析
更多相關文章: 電信運營商 養(yǎng)卡 K_Means Canopy Hadoop
【摘要】:隨著電信行業(yè)代理商的不斷增多,代理商在市場中出現(xiàn)違規(guī)操作的現(xiàn)象也越來越普遍。其中最主要的違規(guī)行為是建立“貓池”設備進行養(yǎng)卡,通過養(yǎng)卡來套取電信運營商的代理酬金。為了打擊代理商的這種行為,電信運營商借助傳統(tǒng)的數(shù)據(jù)庫技術分析每月新發(fā)展的用戶是否為養(yǎng)卡用戶,然而,這需要花費大量的人力物力,且正確率最高只有85%。為了更加高效的區(qū)分電信運營商的養(yǎng)卡用戶,本文運用了數(shù)據(jù)挖掘技術以及Hadoop平臺。本文以作者在江蘇某運營商實習期間獲得的真實數(shù)據(jù)為背景,對電信運營商區(qū)分養(yǎng)卡用戶進行了研究和分析。本文將數(shù)據(jù)挖掘常用的BP神經網絡算法和K_Means算法應用到養(yǎng)卡分析中,根據(jù)K_Means算法的仿真結果分析原始數(shù)據(jù)中較強的影響因子,找出其對應的數(shù)據(jù)屬性,并通過屬性增強的方法修改原始數(shù)據(jù),該方法可以改善K_Means算法的聚類效果,有效提高養(yǎng)卡分析的正確率。隨后,基于Canopy算法對K_Means算法的養(yǎng)卡聚類分析進行了改進,將Canopy算法得到的兩個距離最大的Canopy作為K_Means算法的初始聚類中心,提高了聚類效率。最后,將基于Hadoop平臺的電信養(yǎng)卡分析集成到Web平臺上,該平臺包括類型轉換、算法調用、任務監(jiān)控、結果查詢等功能,提高了整個養(yǎng)卡分析過程的效率。結果表明,本文提出的基于Hadoop的養(yǎng)卡分析方法有效提高了判決正確率、降低了時間開銷,相比于電信運營商的傳統(tǒng)數(shù)據(jù)庫分析,正確率提高了6.32%;相比于傳統(tǒng)單機運行K_Means算法的養(yǎng)卡聚類分析,四個結點的Hadoop平臺時間開銷降低了64.22%。本文的研究可以為電信運營商的養(yǎng)卡分析提供理論支持,同時也為其他行業(yè)中的欺詐行為分析提供了新思路。
【學位授予單位】:南京郵電大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:F626;TP311.13
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 逄利華;張錦春;;基于Hadoop的分布式數(shù)據(jù)庫系統(tǒng)[J];辦公自動化;2014年05期
2 鄭瑋;;Hadoop釋放大數(shù)據(jù)潛能[J];軟件和信息服務;2012年10期
3 劉爾凱;崔振東;;基于HADOOP技術 實現(xiàn)銀行歷史數(shù)據(jù)線上化研究[J];金融電子化;2014年01期
4 鄒群;;一種基于Hadoop的數(shù)字圖書存儲系統(tǒng)設計方案[J];黑龍江史志;2014年01期
5 諶章義;畢偉;向萬紅;王國安;吳愛國;;基于Hadoop的海量電費數(shù)據(jù)處理模型[J];計算機系統(tǒng)應用;2014年05期
6 ;大數(shù)據(jù)不等于Hadoop[J];辦公自動化;2014年06期
7 ;保障Hadoop數(shù)據(jù)安全的十大措施[J];計算機與網絡;2013年08期
8 王峰;雷葆華;;Hadoop分布式文件系統(tǒng)的模型分析[J];電信科學;2010年12期
9 蘇小會;何婧媛;;Hadoop中任務調度算法的改進[J];電子設計工程;2012年22期
10 林偉偉;;一種改進的Hadoop數(shù)據(jù)放置策略[J];華南理工大學學報(自然科學版);2012年01期
中國重要報紙全文數(shù)據(jù)庫 前8條
1 本報記者 郭濤;機器大數(shù)據(jù)也離不開Hadoop[N];中國計算機報;2013年
2 本報記者 王星;Hadoop引發(fā)大數(shù)據(jù)之戰(zhàn)[N];電腦報;2012年
3 本報記者 鄒大斌;Hadoop一體機降低大數(shù)據(jù)門檻[N];計算機世界;2012年
4 孫定;云計算、大數(shù)據(jù)與Hadoop[N];計算機世界;2011年
5 樂天 編譯;Hadoop:打開大數(shù)據(jù)之門的金鑰匙[N];計算機世界;2012年
6 范范 編譯;Hadoop用戶可以使用多種搜索引擎[N];網絡世界;2013年
7 波波 編譯;Hadoop、Web 2.0為磁帶帶來新商機[N];網絡世界;2013年
8 本報記者 郭濤;讓更多人能夠使用Hadoop[N];中國計算機報;2012年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 宋亞奇;云平臺下電力設備監(jiān)測大數(shù)據(jù)存儲優(yōu)化與并行處理技術研究[D];華北電力大學(北京);2016年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 朱泉明;基于Hadoop平臺的故障診斷專家系統(tǒng)研究[D];河北工業(yè)大學;2015年
2 汲磊舉;大數(shù)據(jù)環(huán)境下動車組故障關聯(lián)關系分析關鍵技術研究與實現(xiàn)[D];北京交通大學;2016年
3 王鄭委;基于大數(shù)據(jù)Hadoop平臺的出租車載客熱點區(qū)域挖掘研究[D];北京交通大學;2016年
4 張博洋;基于Hadoop的動車組故障診斷關鍵技術的研究與實現(xiàn)[D];北京交通大學;2016年
5 施云霄;Hadoop組件管理軟件Data Hub的設計與實現(xiàn)[D];南京大學;2014年
6 宋瑩瑋;Hadoop云平臺下基于本體的圖像檢索系統(tǒng)研究[D];吉林大學;2016年
7 劉聞飛;基于R語言和Hadoop的集成技術及其實現(xiàn)研究[D];華中科技大學;2014年
8 熊定鴻;Hadoop平臺下的分布式SVM算法及其應用研究[D];西南交通大學;2016年
9 李保民;基于Hadoop的路徑分析及能耗預測[D];北京交通大學;2016年
10 陳煉;Hadoop自動化運維管理系統(tǒng)的設計與實現(xiàn)[D];北京交通大學;2016年
,本文編號:1210943
本文鏈接:http://sikaile.net/jingjilunwen/xxjj/1210943.html