面向多類不均衡網(wǎng)絡(luò)流量的特征選擇方法
本文選題:網(wǎng)絡(luò)流量 切入點(diǎn):多類不均衡 出處:《計(jì)算機(jī)應(yīng)用研究》2017年02期 論文類型:期刊論文
【摘要】:針對(duì)網(wǎng)絡(luò)流量分類中的多類不均衡問(wèn)題,提出一種基于相對(duì)不確定性和對(duì)稱不確定性的Hybrid型特征選擇方法。首先,利用相對(duì)不確定性為每個(gè)類選擇候選特征集;然后,保留每個(gè)候選特征集中對(duì)稱不確定性較高的特征并去除其他特征;最后,利用基于C4.5決策樹(shù)的wrapper型特征選擇方法確定最優(yōu)特征子集。在真實(shí)網(wǎng)絡(luò)流量數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)方法相比,該方法具有較高的整體準(zhǔn)確率、小類召回率和g-mean值,從而可以減輕多類不均衡問(wèn)題帶來(lái)的不良影響。
[Abstract]:In order to solve the problem of multi-class disequilibrium in network traffic classification, a Hybrid type feature selection method based on relative uncertainty and symmetric uncertainty is proposed. Firstly, the candidate set is selected for each class by using relative uncertainty. The features with high symmetry uncertainty in each candidate feature set are preserved and other features are removed. Finally, the wrapper type feature selection method based on C4.5 decision tree is used to determine the optimal feature subset. The experimental results on the real network traffic data set show that, Compared with the traditional method, this method has higher overall accuracy, subclass recall rate and g-mean value, which can reduce the adverse effects of multi-class imbalance problems.
【作者單位】: 上海大學(xué)通信與信息工程學(xué)院;中國(guó)科學(xué)院上海高等研究院;上海大學(xué)上海市特種光纖與光接入網(wǎng)省部共建重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61501289) 國(guó)家自然科學(xué)青年基金資助項(xiàng)目(61302093) 國(guó)家教育部高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)基金資助項(xiàng)目(20133108120018) 上海市科委重大項(xiàng)目(14511101505) 中科院先導(dǎo)專項(xiàng)“未來(lái)網(wǎng)絡(luò)系統(tǒng)架構(gòu)與關(guān)鍵技術(shù)研究”子課題資助項(xiàng)目(XDA06010301) 上海市科學(xué)技術(shù)委員會(huì)“揚(yáng)帆計(jì)劃”資助項(xiàng)目(14YF1408900)
【分類號(hào)】:TP393.06
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫霞;鄭慶華;;一種面向非平衡數(shù)據(jù)的鄰居詞特征選擇方法[J];小型微型計(jì)算機(jī)系統(tǒng);2008年12期
2 蔣盛益;鄭琪;張倩生;;基于聚類的特征選擇方法[J];電子學(xué)報(bào);2008年S1期
3 王加龍;朱顥東;;結(jié)合類別相關(guān)性和辨識(shí)集的特征選擇方法[J];微型機(jī)與應(yīng)用;2009年23期
4 朱顥東;周姝;鐘勇;;結(jié)合差別對(duì)象對(duì)集的綜合性特征選擇方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年03期
5 姜慧研;柴天佑;;基于可信間隔的特征選擇方法研究[J];控制與決策;2011年08期
6 姚旭;王曉丹;張玉璽;權(quán)文;;特征選擇方法綜述[J];控制與決策;2012年02期
7 王志昊;王中卿;李壽山;李培峰;;不平衡情感分類中的特征選擇方法研究[J];中文信息學(xué)報(bào);2013年04期
8 張玉紅;周全;胡學(xué)鋼;;面向跨領(lǐng)域情感分類的特征選擇方法[J];模式識(shí)別與人工智能;2013年11期
9 李敏;卡米力·木依丁;;特征選擇方法與算法的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年12期
10 申清明;閆利軍;高建民;趙靜;;基于混沌搜索的特征選擇方法[J];兵工學(xué)報(bào);2013年12期
相關(guān)會(huì)議論文 前6條
1 徐燕;王斌;李錦濤;孫春明;;知識(shí)增益:文本分類中一種新的特征選擇方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 肖婷;唐雁;;文本分類中特征選擇方法及應(yīng)用[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年
3 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
4 陳慶軒;鄭德權(quán);鄭博文;趙鐵軍;李生;;中文文本分類中基于文檔頻度分布的特征選擇方法[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年
5 顧成杰;張順頤;劉凱;黃河;;基于粗糙集和禁忌搜索的特征選擇方法[A];江蘇省電子學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
6 王秀娟;郭軍;鄭康鋒;;基于互信息可信度的特征選擇方法[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年
相關(guān)博士學(xué)位論文 前4條
1 劉明霞;屬性學(xué)習(xí)若干重要問(wèn)題的研究及應(yīng)用[D];南京航空航天大學(xué);2015年
2 毛勇;基于支持向量機(jī)的特征選擇方法的研究與應(yīng)用[D];浙江大學(xué);2006年
3 尹留志;關(guān)于非平衡數(shù)據(jù)特征問(wèn)題的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
4 裴志利;數(shù)據(jù)挖掘技術(shù)在文本分類和生物信息學(xué)中的應(yīng)用[D];吉林大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 曹晉;基于SVDD的特征選擇方法研究及其應(yīng)用[D];蘇州大學(xué);2015年
2 張強(qiáng);靜態(tài)圖像上的行人檢測(cè)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年
3 張曉梅;基于融合特征的微博主客觀分類方法研究[D];山西大學(xué);2014年
4 王君;基于SVM-RFE的特征選擇方法研究[D];大連理工大學(xué);2015年
5 于海珠;面向文本聚類的特征選擇方法及應(yīng)用研究[D];大連理工大學(xué);2015年
6 趙世琛;文本分類中特征選擇方法研究[D];山西大學(xué);2014年
7 王丹;特征選擇算法研究及其在異常檢測(cè)中的應(yīng)用[D];電子科技大學(xué);2014年
8 林艷峰;中文文本分類特征選擇方法的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年
9 盧志浩;基于GEP的kNN算法改進(jìn)研究[D];廣西師范學(xué)院;2015年
10 王立鵬;面向圖數(shù)據(jù)的特征選擇方法及其應(yīng)用研究[D];南京航空航天大學(xué);2015年
,本文編號(hào):1646994
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1646994.html