基于互信息選擇聚類集成的網(wǎng)絡(luò)流量分類方法
本文選題:聚類集成 切入點:K均值 出處:《計算機應(yīng)用》2013年01期 論文類型:期刊論文
【摘要】:針對互聯(lián)網(wǎng)流量標注困難以及單個聚類器的泛化能力較弱,提出一種基于互信息(MI)理論的選擇聚類集成方法,以提高流量分類的精度。首先計算不同初始簇個數(shù)K的K均值聚類結(jié)果與訓(xùn)練集中流量協(xié)議的真實分布之間的規(guī)范化互信息(NMI);然后基于NMI的值來選擇用于聚類集成的K均值基聚類器的K值序列;最后采用二次互信息(QMI)的一致函數(shù)生成一致聚類結(jié)果,并使用一種半監(jiān)督方法對聚類簇進行標注。通過實驗比較了聚類集成方法與單個聚類算法在4個不同測試集上總體分類精度。實驗結(jié)果表明,聚類集成方法的流量分類總體精度能達到90%。所提方法將聚類集成模型應(yīng)用到網(wǎng)絡(luò)流量分類中,提高了流量分類的精度和在不同數(shù)據(jù)集上的分類穩(wěn)定性。
[Abstract]:According to Internet traffic marking difficulties and poor generalization ability of single clustering is proposed, based on mutual information (MI) integrated methods clustering theory, in order to improve the traffic classification accuracy. K means clustering results calculated with different initial cluster number K between the true distribution and training flow protocol standardization of each other information (NMI); then based on the NMI values selected for clustering ensemble average K base clustering K sequence; finally using two mutual information (QMI) favorable function to generate consistent clustering results, and the cluster labeling using a semi supervised method. By comparing the clustering ensemble method with a single clustering algorithm in 4 different test sets the overall classification accuracy. The experimental results show that the overall accuracy of traffic classification clustering ensemble method can reach 90%. the proposed method clustering model is applied to network traffic In the classification, the accuracy of the flow classification and the classification stability on different data sets are improved.
【作者單位】: 西北工業(yè)大學計算機學院;咸陽師范學院信息工程學院;
【基金】:國家863計劃項目(2009AA01Z424) 陜西省教育廳專項(12JK0933)
【分類號】:TP181;TP393.06
【參考文獻】
相關(guān)博士學位論文 前1條
1 羅會蘭;聚類集成關(guān)鍵技術(shù)研究[D];浙江大學;2007年
【共引文獻】
相關(guān)博士學位論文 前5條
1 何靈敏;支持向量機集成及在遙感分類中的應(yīng)用[D];浙江大學;2006年
2 楊震;文本分類和聚類中若干問題的研究[D];北京郵電大學;2007年
3 高琰;基于多特征的Web社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中南大學;2007年
4 呂天陽;三維模型檢索中基于聚類與基于語義方法的研究[D];吉林大學;2007年
5 羅會蘭;聚類集成關(guān)鍵技術(shù)研究[D];浙江大學;2007年
相關(guān)碩士學位論文 前4條
1 楊紅;基于選擇性集成的入侵檢測系統(tǒng)的研究與實現(xiàn)[D];江蘇大學;2005年
2 王麗麗;集成學習算法研究[D];廣西大學;2006年
3 劉凈;基于多分類器集成的聚類算法研究[D];河海大學;2007年
4 徐山;神經(jīng)網(wǎng)絡(luò)集成技術(shù)及其在礦產(chǎn)預(yù)測中的應(yīng)用研究[D];吉林大學;2007年
【二級參考文獻】
相關(guān)期刊論文 前2條
1 張學工;關(guān)于統(tǒng)計學習理論與支持向量機[J];自動化學報;2000年01期
2 邸凱昌,李德仁,李德毅;從空間數(shù)據(jù)庫發(fā)現(xiàn)聚類:一種基于數(shù)學形態(tài)學的算法[J];中國圖象圖形學報;1998年03期
【相似文獻】
相關(guān)博士學位論文 前1條
1 高琰;基于多特征的Web社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中南大學;2007年
相關(guān)碩士學位論文 前6條
1 宋凌;基于半監(jiān)督聚類的入侵防御系統(tǒng)研究[D];湘潭大學;2008年
2 項陽;Internet流量與擁塞控制問題研究[D];南京航空航天大學;2003年
3 崔靈珍;Web文本摘要技術(shù)的研究與應(yīng)用[D];武漢理工大學;2007年
4 劉揚;入侵檢測系統(tǒng)中的聚類算法研究[D];大連理工大學;2008年
5 席卓;局域網(wǎng)絡(luò)綜合管理系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學;2012年
6 馬曉春;數(shù)據(jù)挖掘在網(wǎng)絡(luò)入侵檢測系統(tǒng)中的應(yīng)用研究[D];西北工業(yè)大學;2005年
,本文編號:1623334
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1623334.html