基于概念漂移檢測(cè)的自適應(yīng)流量識(shí)別研究
發(fā)布時(shí)間:2021-08-09 13:55
隨著網(wǎng)絡(luò)的高速發(fā)展和硬件水平的提高,互聯(lián)網(wǎng)感知技術(shù)扮演的角色愈發(fā)重要。由于網(wǎng)絡(luò)應(yīng)用程序復(fù)雜化和個(gè)人隱私的重視,流量識(shí)別作為最典型的網(wǎng)絡(luò)感知技術(shù),正在從基于端口和深層數(shù)據(jù)包檢測(cè)等面向數(shù)據(jù)包識(shí)別向面向數(shù)據(jù)流識(shí)別的方向過渡。雖然有機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方面的研究作為基礎(chǔ),但是基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量識(shí)別仍然面臨著很多挑戰(zhàn),概念漂移問題就是首當(dāng)其沖的一個(gè)。對(duì)概念漂移問題的研究,將會(huì)對(duì)網(wǎng)絡(luò)流量識(shí)別技術(shù)的發(fā)展有很大的促進(jìn)作用。首先本文從網(wǎng)絡(luò)流量角度對(duì)概念漂移檢測(cè)的基本原理做出了詳細(xì)的闡述,從概念、目標(biāo)概念和概念漂移及其檢測(cè)的定義到概念漂移檢測(cè)的不同類型,論文都有涉及,為后面的研究奠定了理論基礎(chǔ)。其次,對(duì)目前數(shù)據(jù)流挖掘領(lǐng)域處理概念漂移的基于誤差率的概念漂移檢測(cè)方法進(jìn)行了分析,誤差率方法的局限性限制了它的應(yīng)用范圍。然后,在分析概念漂移檢測(cè)的原理和利用卡方檢驗(yàn)、Fisher檢驗(yàn)的相關(guān)知識(shí)的基礎(chǔ)上,提出了基于統(tǒng)計(jì)學(xué)理論的概念漂移算法,且進(jìn)行了詳細(xì)的理論論證,并通過實(shí)驗(yàn)驗(yàn)證了基于統(tǒng)計(jì)學(xué)的理論方法的有效性。另外,考慮真實(shí)網(wǎng)絡(luò)環(huán)境的類別不平衡現(xiàn)象,比較了貝葉斯核估計(jì)、決策樹和支持向量機(jī)三種機(jī)器學(xué)習(xí)算法的優(yōu)劣,并選擇了...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于權(quán)重的自適應(yīng)流量識(shí)別示意圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文分類采用同一種機(jī)器學(xué)習(xí)算法構(gòu)造基本識(shí)別器不一樣,它利用不算法構(gòu)造基本識(shí)別器,當(dāng)然之后,依舊根據(jù)這些基本識(shí)別器來(lái)決識(shí)別結(jié)果。 4-7 展示了基于平均概率的自適應(yīng)識(shí)別的工作過程,圖中網(wǎng)絡(luò)流數(shù)據(jù)包集合,只在最近的網(wǎng)絡(luò)數(shù)據(jù)集合上訓(xùn)練基本識(shí)別器,只不的機(jī)器學(xué)習(xí)方法,這樣就同樣能夠得到多個(gè)基本識(shí)別器,多個(gè)基集成識(shí)別器,集成識(shí)別器的最終結(jié)果輸出同樣是由所有基本識(shí)別公式(4-2)。11G(x)= (x) miigm
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文合基于權(quán)重和基于平均概率兩者的優(yōu)點(diǎn),我們構(gòu)造我們最終的基于集成的應(yīng)流量識(shí)別器。(1)構(gòu)建過程網(wǎng)絡(luò)流量中 n 個(gè)按時(shí)間順序捕獲的網(wǎng)絡(luò)數(shù)據(jù)包集合,如圖 4-8 所示,基均概率的基本識(shí)別器在最近的一個(gè)網(wǎng)絡(luò)數(shù)據(jù)包集合上構(gòu)建,基于權(quán)重的基別器在之前的 n 個(gè)數(shù)據(jù)包集合上構(gòu)建,最后的整體自適應(yīng)流量識(shí)別器的輸所有的基本識(shí)別器決定,具體的步驟如下(如圖 4-9 所示)。
【參考文獻(xiàn)】:
期刊論文
[1]概念漂移數(shù)據(jù)流分類研究綜述[J]. 文益民,強(qiáng)保華,范志剛. 智能系統(tǒng)學(xué)報(bào). 2013(02)
[2]基于復(fù)合特征的P2P業(yè)務(wù)識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[J]. 陳慶章,邵奔,陳超. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(S1)
[3]數(shù)據(jù)流挖掘分類技術(shù)綜述[J]. 王濤,李舟軍,顏躍進(jìn),陳火旺. 計(jì)算機(jī)研究與發(fā)展. 2007(11)
本文編號(hào):3332191
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于權(quán)重的自適應(yīng)流量識(shí)別示意圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文分類采用同一種機(jī)器學(xué)習(xí)算法構(gòu)造基本識(shí)別器不一樣,它利用不算法構(gòu)造基本識(shí)別器,當(dāng)然之后,依舊根據(jù)這些基本識(shí)別器來(lái)決識(shí)別結(jié)果。 4-7 展示了基于平均概率的自適應(yīng)識(shí)別的工作過程,圖中網(wǎng)絡(luò)流數(shù)據(jù)包集合,只在最近的網(wǎng)絡(luò)數(shù)據(jù)集合上訓(xùn)練基本識(shí)別器,只不的機(jī)器學(xué)習(xí)方法,這樣就同樣能夠得到多個(gè)基本識(shí)別器,多個(gè)基集成識(shí)別器,集成識(shí)別器的最終結(jié)果輸出同樣是由所有基本識(shí)別公式(4-2)。11G(x)= (x) miigm
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文合基于權(quán)重和基于平均概率兩者的優(yōu)點(diǎn),我們構(gòu)造我們最終的基于集成的應(yīng)流量識(shí)別器。(1)構(gòu)建過程網(wǎng)絡(luò)流量中 n 個(gè)按時(shí)間順序捕獲的網(wǎng)絡(luò)數(shù)據(jù)包集合,如圖 4-8 所示,基均概率的基本識(shí)別器在最近的一個(gè)網(wǎng)絡(luò)數(shù)據(jù)包集合上構(gòu)建,基于權(quán)重的基別器在之前的 n 個(gè)數(shù)據(jù)包集合上構(gòu)建,最后的整體自適應(yīng)流量識(shí)別器的輸所有的基本識(shí)別器決定,具體的步驟如下(如圖 4-9 所示)。
【參考文獻(xiàn)】:
期刊論文
[1]概念漂移數(shù)據(jù)流分類研究綜述[J]. 文益民,強(qiáng)保華,范志剛. 智能系統(tǒng)學(xué)報(bào). 2013(02)
[2]基于復(fù)合特征的P2P業(yè)務(wù)識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[J]. 陳慶章,邵奔,陳超. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(S1)
[3]數(shù)據(jù)流挖掘分類技術(shù)綜述[J]. 王濤,李舟軍,顏躍進(jìn),陳火旺. 計(jì)算機(jī)研究與發(fā)展. 2007(11)
本文編號(hào):3332191
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3332191.html
最近更新
教材專著