天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于決策樹集成和寬度森林的網(wǎng)絡(luò)流量分析與預(yù)測(cè)研究

發(fā)布時(shí)間:2021-08-24 02:43
  近年來(lái),新一代移動(dòng)通信技術(shù)得到快速發(fā)展,智能手機(jī)、平板電腦等移動(dòng)端智能設(shè)備也迅速普及開來(lái),移動(dòng)通信網(wǎng)絡(luò)逐漸構(gòu)成了當(dāng)今社會(huì)必不可少的基礎(chǔ)設(shè)施之一,不斷影響著人類社會(huì)生活的各個(gè)領(lǐng)域。面對(duì)越來(lái)越復(fù)雜的網(wǎng)絡(luò)環(huán)境和成倍翻升的網(wǎng)絡(luò)流量數(shù)據(jù),網(wǎng)絡(luò)管理和運(yùn)營(yíng)者們需要花費(fèi)更多的時(shí)間和資源監(jiān)控并分析出實(shí)時(shí)的網(wǎng)絡(luò)流量狀況,以應(yīng)對(duì)突發(fā)的網(wǎng)絡(luò)擁擠和堵塞,或者及時(shí)關(guān)閉不需要的基站以節(jié)省能耗,確保網(wǎng)絡(luò)質(zhì)量良好。一個(gè)好的流量預(yù)測(cè)模型能夠使得運(yùn)營(yíng)商提前發(fā)現(xiàn)網(wǎng)絡(luò)異常、網(wǎng)絡(luò)流量爆發(fā)等問(wèn)題,從而保證網(wǎng)絡(luò)的穩(wěn)定性、提高網(wǎng)絡(luò)的服務(wù)質(zhì)量、節(jié)省基站的能耗等。鑒于此,本論文基于基站網(wǎng)絡(luò)流量采集數(shù)據(jù),研究了基于決策樹集成和寬度森林的網(wǎng)絡(luò)流量分析與預(yù)測(cè)算法。本論文的主要研究工作和創(chuàng)新點(diǎn)如下:首先,在數(shù)據(jù)預(yù)處理中,本文針對(duì)采集數(shù)據(jù)中的缺失值采用了填充處理的方式,建立起有效的缺失值填充方案的評(píng)估機(jī)制。通過(guò)對(duì)比多種填充方案,最后選擇了基于高斯分布的擬合方法填充缺失值。隨后完成數(shù)據(jù)的特征工程,一方面,本文分別基于時(shí)空分布和歷史流量數(shù)據(jù)挖掘了流量數(shù)據(jù)特征,提出了可變周期移動(dòng)窗口平均法提取歷史流量數(shù)據(jù)的統(tǒng)計(jì)特性;另一方面,本文提出了基于隨機(jī)森林的重要... 

【文章來(lái)源】:南京郵電大學(xué)江蘇省

【文章頁(yè)數(shù)】:70 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于決策樹集成和寬度森林的網(wǎng)絡(luò)流量分析與預(yù)測(cè)研究


寬度學(xué)習(xí)系統(tǒng)結(jié)構(gòu)圖

移動(dòng)平均,重要性,森林,量值


南京郵電大學(xué)碩士研究生學(xué)位論文第三章數(shù)據(jù)預(yù)處理和特征工程28圖3.3隨機(jī)森林對(duì)輸入特征的重要性度量得分從上圖實(shí)驗(yàn)結(jié)果可以看出,窗口值取1到5的移動(dòng)平均值對(duì)流量值變化的重要度影響要遠(yuǎn)遠(yuǎn)大于窗口值取6到10的移動(dòng)平均值,且隨著窗口值增加,其重要性度量得分呈遞減變化。在時(shí)間特征中,重要性度量得分較大的特征有date_day、date_int、month_day、weekday和day_of_all。由于是針對(duì)某個(gè)基站的流量值分析,其地理位置不變,因此地理位置對(duì)單個(gè)基站流量值的變化沒(méi)有影響。最終,本文從27個(gè)提取的特征中選擇了與流量值變化高度相關(guān)的12個(gè)特征,如表3.7所示,以進(jìn)行進(jìn)一步的預(yù)測(cè)算法設(shè)計(jì)。表3.7特征選擇提取的所有特征{1,2,3,4,5,6,7,8,9,10,5min,5max,10min,10max,date_int,year_month,month_day,date_year,date_month,date_day,weekday,is_weekend,is_holiday,day_of_all,quarter,season,area}選擇的重要特征{1,2,3,4,5,5min,5max,date_day,date_int,month_day,weekday,day_of_all}

對(duì)比圖,決策樹,策略,類別


行分裂,如果不加以區(qū)分地對(duì)待同一層的葉子,就會(huì)導(dǎo)致太多額外的開銷。LightGBM中采用的Leaf-Wise策略則是一種更為高效的決策樹生長(zhǎng)方法,在每次劃分結(jié)點(diǎn)時(shí),從當(dāng)前所有葉子中找到一個(gè)使得分裂增益最大的葉子進(jìn)行分裂,不斷循環(huán),直到生成完整的一棵樹。當(dāng)分裂次數(shù)相同時(shí),Leaf-Wise生成的樹與Level-Wise生成的樹相比,可以減少更多的損失,具有更好的精度。雖然基于Leaf-Wise生成的樹可能會(huì)造成其深度過(guò)大,造成過(guò)擬合,但在這種情況下,可以利用參數(shù)max_depth,即最大深度,來(lái)限制樹的深度,保證高效的同時(shí)也減少了過(guò)擬合。圖4.1給出了兩種決策樹生長(zhǎng)策略對(duì)比圖。(a)Level-Wise策略(b)Leaf-Wise策略圖4.1兩種決策樹生長(zhǎng)策略對(duì)比(3)直接處理類別特征一般來(lái)說(shuō),機(jī)器學(xué)習(xí)算法在處理類別特征時(shí),都需要通過(guò)獨(dú)熱編碼進(jìn)行轉(zhuǎn)換,不僅降低了時(shí)間、空間的效率,在類別特征比較多時(shí),還會(huì)對(duì)樹模型的學(xué)習(xí)過(guò)程造成不利影響,如決策樹可能由于劃分增益過(guò)小而無(wú)法在這個(gè)類別特征上進(jìn)行劃分。為此,LightGBM增加了直接


本文編號(hào):3359117

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3359117.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8c51d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com