天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向運(yùn)營(yíng)商IPTV數(shù)據(jù)集的用戶報(bào)障行為預(yù)測(cè)研究

發(fā)布時(shí)間:2020-10-14 07:00
   從交互式網(wǎng)絡(luò)電視(IPTV)長(zhǎng)遠(yuǎn)商業(yè)發(fā)展來(lái)看,保證良好的用戶體驗(yàn)質(zhì)量是運(yùn)營(yíng)商吸引用戶群體,增加收益的關(guān)鍵所在,也是行業(yè)競(jìng)爭(zhēng)的關(guān)鍵所在。本論文基于運(yùn)營(yíng)商IPTV機(jī)頂盒采集到的狀態(tài)數(shù)據(jù)和用戶的報(bào)障數(shù)據(jù),對(duì)獲得的兩個(gè)數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗和匹配,從中選擇合適的關(guān)鍵績(jī)效指標(biāo)(KPI)特征。接著,針對(duì)獲得的KPI數(shù)據(jù)集在分析、處理上的困難,本文從兩個(gè)方面對(duì)現(xiàn)有的機(jī)器學(xué)習(xí)模型和算法進(jìn)行了改進(jìn),建立了用戶報(bào)障行為預(yù)測(cè)模型,可以有效提升預(yù)測(cè)性能。一方面,為了從原始特征中挑選出最有效的特征子集,達(dá)到去除冗余信息、降低模型復(fù)雜度的目的,本論文提出了一種利用PCA主成分矩陣進(jìn)行特征選擇的算法。具體而言,除了考慮每個(gè)原始特征對(duì)整個(gè)主成分的貢獻(xiàn)度之外,也考慮到對(duì)應(yīng)的主成分所占的貢獻(xiàn)率和原始特征自身的信息增益對(duì)特征篩選的貢獻(xiàn),提出一種計(jì)算特征貢獻(xiàn)度的新算法。實(shí)驗(yàn)結(jié)果表明,所提出的利用PCA主成分矩陣進(jìn)行特征選擇的算法可以進(jìn)一步降低特征之間的相關(guān)性,增加后續(xù)預(yù)測(cè)算法的精度。另一方面,針對(duì)數(shù)據(jù)集建立模型的困難,本論文首先提出了改進(jìn)的SMOTE算法來(lái)對(duì)少數(shù)類樣本進(jìn)行過(guò)采樣。接著,提出利用基于K-means++算法的欠采樣算法去除多數(shù)類中的冗余信息,并選擇決策樹(shù)作為基分類器,從而建立面向運(yùn)營(yíng)商IPTV數(shù)據(jù)集的用戶報(bào)障預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的SMOTE算法與相比于傳統(tǒng)Borderline-SMOTE數(shù)據(jù)生成算法可以有效改善IPTV報(bào)障預(yù)測(cè)模型的預(yù)測(cè)準(zhǔn)確率;此外,基于K-means++算法的欠采樣算法與傳統(tǒng)的隨機(jī)欠采樣算法相比,能夠更好地去除冗余信息,提升用戶報(bào)障行為預(yù)測(cè)性能。
【學(xué)位單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TN949.292
【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景
    1.2 IPTV用戶報(bào)障行為預(yù)測(cè)的研究現(xiàn)狀
    1.3 論文的主要工作
    1.4 論文的結(jié)構(gòu)安排
第二章 相關(guān)背景知識(shí)介紹
    2.1 IPTV系統(tǒng)架構(gòu)
    2.2 非均衡數(shù)據(jù)的處理方法
        2.2.1 研究方法
        2.2.2 性能評(píng)估指標(biāo)
    2.3 常用機(jī)器學(xué)習(xí)算法
        2.3.1 特征選擇算法
        2.3.2 分類算法
    2.4 本章小結(jié)
第三章 基于PCA主成分矩陣的IPTV用戶報(bào)障特征選擇算法
    3.1 數(shù)據(jù)預(yù)處理
        3.1.1 數(shù)據(jù)集
        3.1.2 數(shù)據(jù)清洗
    3.2 基于PCA主成分矩陣的特征選擇算法
        3.2.1 主成分分析
        3.2.2 信息增益
        3.2.3 基于PCA主成分矩陣的特征選擇算法
        3.2.4 實(shí)驗(yàn)結(jié)果與分析
    3.3 本章小結(jié)
第四章 基于改進(jìn)的SMOTE的IPTV用戶報(bào)障數(shù)據(jù)生成算法
    4.1 SMOTE算法
    4.2 基于改進(jìn)的SMOTE算法的少數(shù)類數(shù)據(jù)生成
    4.3 基礎(chǔ)分類算法的選取
        4.3.1 決策樹(shù)算法
        4.3.2 K近鄰算法
        4.3.3 樸素貝葉斯算法
    4.4 實(shí)驗(yàn)結(jié)果與分析
    4.5 本章小結(jié)
第五章 基于K-means++的IPTV用戶報(bào)障行為預(yù)測(cè)算法
    5.1 聚類算法K-means
    5.2 基于K-means++的欠采樣算法
        5.2.1 K-means++算法
        5.2.2 基于K-means++的欠采樣算法
    5.3 實(shí)驗(yàn)結(jié)果與分析
    5.4 本章小結(jié)
第六章 總結(jié)與展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
附錄2 攻讀碩士學(xué)位期間參加的科研項(xiàng)目
致謝

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 蘆海波;張劍;;關(guān)于IPTV視頻質(zhì)量監(jiān)控系統(tǒng)研究[J];信息通信;2014年04期

2 曹鵬;李博;栗偉;趙大哲;;基于概率分布估計(jì)的混合采樣算法[J];控制與決策;2014年05期

3 丁福利;孫立民;;處理不平衡樣本集的欠采樣算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年12期

4 范雪莉;馮海泓;原猛;;基于互信息的主成分分析特征選擇算法[J];控制與決策;2013年06期

5 陶新民;郝思媛;張冬雪;徐鵬;;不均衡數(shù)據(jù)分類算法的綜述[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期

6 谷瓊;袁磊;寧彬;吳釗;華麗;李文新;;一種基于混合重取樣策略的非均衡數(shù)據(jù)集分類算法[J];計(jì)算機(jī)工程與科學(xué);2012年10期

7 鐘瑛;朱順痣;曾志強(qiáng);洪文興;;一種基于核學(xué)習(xí)的非均衡數(shù)據(jù)分類算法[J];廈門大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年02期

8 張永;李卓然;劉小丹;;基于主動(dòng)學(xué)習(xí)SMOTE的非均衡數(shù)據(jù)分類[J];計(jì)算機(jī)應(yīng)用與軟件;2012年03期

9 姚旭;王曉丹;張玉璽;權(quán)文;;特征選擇方法綜述[J];控制與決策;2012年02期

10 陶新民;童智靖;劉玉;付丹丹;;基于ODR和BSMOTE結(jié)合的不均衡數(shù)據(jù)SVM分類算法[J];控制與決策;2011年10期



本文編號(hào):2840351

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2840351.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cbbb7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com