基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)投訴預(yù)測分析
【文章頁數(shù)】:6 頁
【部分圖文】:
圖2XGboost算法分類器及深度調(diào)優(yōu)對5026條投訴用戶數(shù)據(jù)和52395條非投訴用戶數(shù)進(jìn)行訓(xùn)練,經(jīng)過數(shù)據(jù)清洗、特征選擇和參數(shù)調(diào)優(yōu)后,訓(xùn)練準(zhǔn)確率達(dá)到93%,精確率達(dá)到56%,召回率達(dá)到42%。隨著投訴用戶數(shù)據(jù)的累積,訓(xùn)練結(jié)果的精確率和召回率也有一定的提升。
全網(wǎng)用戶和實(shí)際投訴用戶的預(yù)測概率分布如圖4所示,可以發(fā)現(xiàn)實(shí)際投訴用戶與預(yù)測結(jié)果匹配度較高,70%以上的實(shí)際投訴用戶預(yù)測概率在0.5以上,而80%的全網(wǎng)用戶投訴概率在0.5以下。圖5潛在投訴用戶挖掘及預(yù)警平臺
圖4全網(wǎng)用戶和實(shí)際投訴用戶的預(yù)測概率分布同時,與省內(nèi)現(xiàn)有的質(zhì)差用戶分析平臺進(jìn)行對比分析,在和實(shí)際投訴用戶匹配度方面,本平臺預(yù)測命中的投訴用戶是現(xiàn)有質(zhì)差用戶分析平臺的3倍以上。
(5)對于字符型的特征值,采用獨(dú)熱編碼進(jìn)行處理。對數(shù)據(jù)進(jìn)行分析后發(fā)現(xiàn),部分用戶無網(wǎng)絡(luò)質(zhì)量指標(biāo),此類用戶級數(shù)據(jù)將被刪除。此外,TCP重傳率和亂序率缺失較高,兩項(xiàng)特征數(shù)據(jù)也將會被刪除。對于中文字符的經(jīng)分?jǐn)?shù)據(jù),如星級級別等信息,將通過獨(dú)熱編碼進(jìn)行處理。
本文編號:3966694
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3966694.html