天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向運營商IPTV數(shù)據(jù)集的用戶報障行為預(yù)測研究

發(fā)布時間:2020-10-14 07:00
   從交互式網(wǎng)絡(luò)電視(IPTV)長遠(yuǎn)商業(yè)發(fā)展來看,保證良好的用戶體驗質(zhì)量是運營商吸引用戶群體,增加收益的關(guān)鍵所在,也是行業(yè)競爭的關(guān)鍵所在。本論文基于運營商IPTV機頂盒采集到的狀態(tài)數(shù)據(jù)和用戶的報障數(shù)據(jù),對獲得的兩個數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗和匹配,從中選擇合適的關(guān)鍵績效指標(biāo)(KPI)特征。接著,針對獲得的KPI數(shù)據(jù)集在分析、處理上的困難,本文從兩個方面對現(xiàn)有的機器學(xué)習(xí)模型和算法進(jìn)行了改進(jìn),建立了用戶報障行為預(yù)測模型,可以有效提升預(yù)測性能。一方面,為了從原始特征中挑選出最有效的特征子集,達(dá)到去除冗余信息、降低模型復(fù)雜度的目的,本論文提出了一種利用PCA主成分矩陣進(jìn)行特征選擇的算法。具體而言,除了考慮每個原始特征對整個主成分的貢獻(xiàn)度之外,也考慮到對應(yīng)的主成分所占的貢獻(xiàn)率和原始特征自身的信息增益對特征篩選的貢獻(xiàn),提出一種計算特征貢獻(xiàn)度的新算法。實驗結(jié)果表明,所提出的利用PCA主成分矩陣進(jìn)行特征選擇的算法可以進(jìn)一步降低特征之間的相關(guān)性,增加后續(xù)預(yù)測算法的精度。另一方面,針對數(shù)據(jù)集建立模型的困難,本論文首先提出了改進(jìn)的SMOTE算法來對少數(shù)類樣本進(jìn)行過采樣。接著,提出利用基于K-means++算法的欠采樣算法去除多數(shù)類中的冗余信息,并選擇決策樹作為基分類器,從而建立面向運營商IPTV數(shù)據(jù)集的用戶報障預(yù)測模型。實驗結(jié)果表明,改進(jìn)的SMOTE算法與相比于傳統(tǒng)Borderline-SMOTE數(shù)據(jù)生成算法可以有效改善IPTV報障預(yù)測模型的預(yù)測準(zhǔn)確率;此外,基于K-means++算法的欠采樣算法與傳統(tǒng)的隨機欠采樣算法相比,能夠更好地去除冗余信息,提升用戶報障行為預(yù)測性能。
【學(xué)位單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TN949.292
【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景
    1.2 IPTV用戶報障行為預(yù)測的研究現(xiàn)狀
    1.3 論文的主要工作
    1.4 論文的結(jié)構(gòu)安排
第二章 相關(guān)背景知識介紹
    2.1 IPTV系統(tǒng)架構(gòu)
    2.2 非均衡數(shù)據(jù)的處理方法
        2.2.1 研究方法
        2.2.2 性能評估指標(biāo)
    2.3 常用機器學(xué)習(xí)算法
        2.3.1 特征選擇算法
        2.3.2 分類算法
    2.4 本章小結(jié)
第三章 基于PCA主成分矩陣的IPTV用戶報障特征選擇算法
    3.1 數(shù)據(jù)預(yù)處理
        3.1.1 數(shù)據(jù)集
        3.1.2 數(shù)據(jù)清洗
    3.2 基于PCA主成分矩陣的特征選擇算法
        3.2.1 主成分分析
        3.2.2 信息增益
        3.2.3 基于PCA主成分矩陣的特征選擇算法
        3.2.4 實驗結(jié)果與分析
    3.3 本章小結(jié)
第四章 基于改進(jìn)的SMOTE的IPTV用戶報障數(shù)據(jù)生成算法
    4.1 SMOTE算法
    4.2 基于改進(jìn)的SMOTE算法的少數(shù)類數(shù)據(jù)生成
    4.3 基礎(chǔ)分類算法的選取
        4.3.1 決策樹算法
        4.3.2 K近鄰算法
        4.3.3 樸素貝葉斯算法
    4.4 實驗結(jié)果與分析
    4.5 本章小結(jié)
第五章 基于K-means++的IPTV用戶報障行為預(yù)測算法
    5.1 聚類算法K-means
    5.2 基于K-means++的欠采樣算法
        5.2.1 K-means++算法
        5.2.2 基于K-means++的欠采樣算法
    5.3 實驗結(jié)果與分析
    5.4 本章小結(jié)
第六章 總結(jié)與展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
附錄2 攻讀碩士學(xué)位期間參加的科研項目
致謝

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 蘆海波;張劍;;關(guān)于IPTV視頻質(zhì)量監(jiān)控系統(tǒng)研究[J];信息通信;2014年04期

2 曹鵬;李博;栗偉;趙大哲;;基于概率分布估計的混合采樣算法[J];控制與決策;2014年05期

3 丁福利;孫立民;;處理不平衡樣本集的欠采樣算法[J];計算機工程與設(shè)計;2013年12期

4 范雪莉;馮海泓;原猛;;基于互信息的主成分分析特征選擇算法[J];控制與決策;2013年06期

5 陶新民;郝思媛;張冬雪;徐鵬;;不均衡數(shù)據(jù)分類算法的綜述[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2013年01期

6 谷瓊;袁磊;寧彬;吳釗;華麗;李文新;;一種基于混合重取樣策略的非均衡數(shù)據(jù)集分類算法[J];計算機工程與科學(xué);2012年10期

7 鐘瑛;朱順痣;曾志強;洪文興;;一種基于核學(xué)習(xí)的非均衡數(shù)據(jù)分類算法[J];廈門大學(xué)學(xué)報(自然科學(xué)版);2012年02期

8 張永;李卓然;劉小丹;;基于主動學(xué)習(xí)SMOTE的非均衡數(shù)據(jù)分類[J];計算機應(yīng)用與軟件;2012年03期

9 姚旭;王曉丹;張玉璽;權(quán)文;;特征選擇方法綜述[J];控制與決策;2012年02期

10 陶新民;童智靖;劉玉;付丹丹;;基于ODR和BSMOTE結(jié)合的不均衡數(shù)據(jù)SVM分類算法[J];控制與決策;2011年10期



本文編號:2840351

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2840351.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cbbb7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com