天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

非平衡過采樣方法及其在視頻流量識別中的應(yīng)用研究

發(fā)布時間:2020-10-08 21:37
   隨著網(wǎng)絡(luò)技術(shù)和應(yīng)用的迅速發(fā)展,視頻流量成為互聯(lián)網(wǎng)中增長最快的流量類型,其占據(jù)了網(wǎng)絡(luò)流量的大部分?焖僭鲩L的視頻流量對互聯(lián)網(wǎng)的管理造成了嚴峻的挑戰(zhàn)。此外網(wǎng)絡(luò)中充斥著大量不健康和非法的視頻,這些視頻嚴重危害人們的身心健康同時也擾亂了社會的穩(wěn)定發(fā)展,因而從網(wǎng)絡(luò)的角度對互聯(lián)網(wǎng)中的視頻流量進行有效的管理是一個迫切需要解決的問題;ヂ(lián)網(wǎng)中的視頻流量是一種典型的非平衡數(shù)據(jù),像色情和暴力的視頻相對于正常的視頻流量是比較少的,因此互聯(lián)網(wǎng)視頻流量的識別是一種非平衡問題。目前有很多不同的方法可以解決非平衡問題,其中數(shù)據(jù)層面的方法由于其獨立于分類器的特性而受到廣泛的關(guān)注,然而這些方法有一定的缺陷,它們只是簡單的考慮局部近鄰信息然后線性的生成數(shù)據(jù),這會導致錯誤樣本的生成。本文針對互聯(lián)網(wǎng)視頻流量的非平衡問題展開研究,建立了一個從基礎(chǔ)數(shù)據(jù)的采集到視頻流量識別方法的解決方案。在本文中首先提出了一種新的有效特征提取方法,即字節(jié)碼分布(BCD),為互聯(lián)網(wǎng)視頻流量類型的識別做前期準備。BCD方法首先從視頻流中計算每個字節(jié)碼值(0到255)出現(xiàn)的次數(shù),然后計算每個字節(jié)碼出現(xiàn)的頻率。這樣256個比率就是提取的視頻流量的特征。比起傳統(tǒng)的包層面的特征,BCD特征包含了更多的視頻類型信息,可以更加正確地識別。針對視頻流量的非平衡問題,本文提出了一種新的數(shù)據(jù)層面的方法,即生成式學習(GL)。在GL中,采用高斯混合模型(GMM)來擬合原始數(shù)據(jù)的分布并基于此分布生成新數(shù)據(jù)。生成的數(shù)據(jù)包括合成的少數(shù)類和多數(shù)類,用于訓練學習模型。相關(guān)實驗結(jié)果表明,GL方法在與其他非平衡過采樣方法對比中具有競爭力,并且Wilcoxon符號秩檢驗結(jié)果證明了所提出方法的顯著優(yōu)勢。該方法以較高的AUC值成功的識別出非平衡互聯(lián)網(wǎng)中的視頻流量。為進一步提升非平衡互聯(lián)網(wǎng)視頻流量的識別效果,本文針對GL方法的不足,提出了另一種新的過采樣方法,即高斯分布引導的過采樣(GDGO)。在GDGO中,首先通過一個計數(shù)因素和一個距離因素加權(quán)少數(shù)類實例,然后通過概率選擇機制選擇錨點少數(shù)類實例,最后以錨點少數(shù)類為中心生成符合高斯分布的數(shù)據(jù)。相關(guān)實驗結(jié)果表明,GDGO的性能高于其他對比的非平衡過采樣方法,假設(shè)檢驗結(jié)果再一次驗證了提出的方法對于解決非平衡問題的有效性。GDGO也進一步提高了非平衡互聯(lián)網(wǎng)視頻流量的識別。
【學位單位】:濟南大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TP391.41;TP393.06
【部分圖文】:

視頻流


互聯(lián)網(wǎng)視頻流量的采集和特征提取方法,這是研究非平內(nèi)容安排如下:2.1 部分介紹了視頻流量的采集和預處的特征提取方法,在 2.3 部分中,實施了一系列特征評及對結(jié)果的分析。2.4 部分對本章做了簡要的總結(jié)。的采集和預處理采集試平臺部署在我們的校園網(wǎng)環(huán)境中,如圖 2.1 所示。我端來采集視頻數(shù)據(jù)。每臺客戶端計算機配備兩個 Intel Ps 7 系統(tǒng)。我們在客戶端計算機上部署 Wireshark 數(shù)據(jù)包據(jù),然后將收集的數(shù)據(jù)發(fā)送到中央服務(wù)器,并在服務(wù)器

案例研究,節(jié)碼,包大小


1,2,,256.2561 11 jkniikniijjccf (2.2,我們得到了一個 256 維的向量 {,,,}12256F ff f,這個就是特征向量。這些特征顯示了視頻流中 256 個字節(jié)碼的分布特點。這種簡單的統(tǒng)計特征具有兩著優(yōu)點。首先,提取這些特征的計算和存儲的代價都很低,其次,這些特征在一度上依賴于原始視頻的內(nèi)容。也就是說,它們可以顯示原始視頻的模式。圖 2.2了這種分布的案例研究。對于浪漫類型,在字節(jié)碼 0 附近出現(xiàn)了顯著的高值。而動作類型,較高的值出現(xiàn)在了字節(jié)碼 250 附近。為了比較,我們還可視化了這兩頻類型的包大小和包到達時間間隔,如圖 2.3 和 2.4 所示?梢钥闯鍪褂眠@兩個包的特征來區(qū)分兩種視頻類型并不容易。大多數(shù)包的包大小值都是 1500(字節(jié))左包到達時間間隔集中在 0 附近。

包大小,案例研究


了這種分布的案例研究。對于浪漫類型,在字節(jié)碼 0 附近出現(xiàn)了顯著的高值。而動作類型,較高的值出現(xiàn)在了字節(jié)碼 250 附近。為了比較,我們還可視化了這兩頻類型的包大小和包到達時間間隔,如圖 2.3 和 2.4 所示?梢钥闯鍪褂眠@兩個包的特征來區(qū)分兩種視頻類型并不容易。大多數(shù)包的包大小值都是 1500(字節(jié))左包到達時間間隔集中在 0 附近。(a) 言情電影 (b) 動作電影圖 2.2 BCD 特征的案例研究

【相似文獻】

相關(guān)期刊論文 前10條

1 黃石平;;基于新型網(wǎng)絡(luò)結(jié)構(gòu)流量識別方法研究[J];電腦編程技巧與維護;2018年04期

2 蘇星曄;徐方南;;對等網(wǎng)絡(luò)流量識別技術(shù)研究[J];中國新通信;2017年05期

3 潘吳斌;程光;郭曉軍;黃順翔;;網(wǎng)絡(luò)加密流量識別研究綜述及展望[J];通信學報;2016年09期

4 滕翠;;網(wǎng)絡(luò)流量識別特征碼自動提取系統(tǒng)分析[J];計算機光盤軟件與應(yīng)用;2014年19期

5 陳乾熙;;網(wǎng)絡(luò)流量識別方法及比較研究[J];今日科苑;2015年08期

6 辛峰;於建華;;互聯(lián)網(wǎng)流量識別技術(shù)的研究及實現(xiàn)[J];廣東通信技術(shù);2008年03期

7 曹詩敏;王娟;;特殊網(wǎng)絡(luò)流量識別綜述[J];電腦知識與技術(shù);2018年17期

8 姜羽;華俊;胡靜;宋鐵成;劉世棟;郭經(jīng)紅;;電力信息通信網(wǎng)絡(luò)流量識別技術(shù)研究[J];信息化研究;2015年01期

9 趙雙;陳曙暉;;基于機器學習的流量識別技術(shù)綜述與展望[J];計算機工程與科學;2018年10期

10 燕f:昊;韓國棟;黃雅靜;王孝龍;;非平衡網(wǎng)絡(luò)流量識別方法[J];計算機應(yīng)用;2018年01期

相關(guān)會議論文 前10條

1 趙興文;何嬌麗;葉佳寧;馬博文;楊旭涵;;網(wǎng)絡(luò)流量識別方案探討和研究展望[A];第十三屆全國信號和智能信息處理與應(yīng)用學術(shù)會議論文集[C];2019年

2 張鑫;馬勇;曹鵬;;基于貝葉斯分類算法的木馬程序流量識別方法[A];第27次全國計算機安全學術(shù)交流會論文集[C];2012年

3 喻東陽;陳宏偉;楊莊;;基于信任抽樣的P2P流量識別[A];武漢機械設(shè)計與傳動學會第21屆學術(shù)年會論文集[C];2013年

4 張娜娜;;P2P流量識別方法研究[A];江蘇省電子學會2010年學術(shù)年會論文集[C];2010年

5 蔣山青;程光;吳樺;;移動端加密視頻廣告流量識別的研究[A];2018中國信息通信大會論文摘要集[C];2018年

6 王波;周曉光;蘇志遠;;基于節(jié)點狀態(tài)的P2P流量識別系統(tǒng)[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國青年通信學術(shù)會議論文集(下)[C];2008年

7 王波;周曉光;蘇志遠;;基于節(jié)點狀態(tài)的P2P流量識別系統(tǒng)[A];中國電子學會第十五屆信息論學術(shù)年會暨第一屆全國網(wǎng)絡(luò)編碼學術(shù)年會論文集(下冊)[C];2008年

8 馬永立;壽國礎(chǔ);胡怡紅;錢宗玨;區(qū)海平;;新型網(wǎng)絡(luò)流量識別分析系統(tǒng)及其性能評估[A];第六屆全國信息獲取與處理學術(shù)會議論文集(2)[C];2008年

9 杜建清;黃少君;楊家海;;網(wǎng)絡(luò)測量協(xié)作柔性支撐平臺[A];2009年全國開放式分布與并行計算機學術(shù)會議論文集(下冊)[C];2009年

10 陳磊;;IP網(wǎng)絡(luò)流量的識別與管理[A];中國通信學會信息通信網(wǎng)絡(luò)技術(shù)委員會2009年年會論文集(上冊)[C];2009年

相關(guān)重要報紙文章 前1條

1 《網(wǎng)絡(luò)世界》記者 邊歆;控制“有害”的應(yīng)用[N];網(wǎng)絡(luò)世界;2011年

相關(guān)博士學位論文 前10條

1 宮婧;基于支持向量機的P2P流量識別關(guān)鍵技術(shù)研究[D];南京郵電大學;2016年

2 卓中流;匿名網(wǎng)絡(luò)追蹤溯源關(guān)鍵技術(shù)研究[D];電子科技大學;2018年

3 林冠洲;網(wǎng)絡(luò)流量識別關(guān)鍵技術(shù)研究[D];北京郵電大學;2011年

4 張劍;寬帶接入網(wǎng)流量識別關(guān)鍵技術(shù)研究[D];北京郵電大學;2011年

5 田旭;互聯(lián)網(wǎng)流量識別技術(shù)研究[D];北京郵電大學;2012年

6 吳敏;P2P網(wǎng)絡(luò)流量控制管理若干關(guān)鍵技術(shù)研究[D];南京郵電大學;2011年

7 侯穎;網(wǎng)絡(luò)流量測量與識別關(guān)鍵技術(shù)研究[D];解放軍信息工程大學;2015年

8 彭立志;基于機器學習的流量識別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學;2015年

9 趙博;網(wǎng)絡(luò)加密流量的協(xié)議不相關(guān)在線識別技術(shù)研究[D];解放軍信息工程大學;2012年

10 韓祺yN;P2P網(wǎng)絡(luò)監(jiān)控與信任安全機制研究[D];電子科技大學;2016年

相關(guān)碩士學位論文 前10條

1 周芷璇;基于機器學習的移動流量識別與異常檢測研究[D];電子科技大學;2019年

2 尹紅珊;I2P匿名通信網(wǎng)絡(luò)流量識別與分類[D];北京交通大學;2019年

3 謝羽茜;非平衡過采樣方法及其在視頻流量識別中的應(yīng)用研究[D];濟南大學;2019年

4 徐軍;基于SDN的應(yīng)用感知多路徑網(wǎng)絡(luò)資源分配系統(tǒng)[D];北京郵電大學;2019年

5 郎瑤;高速環(huán)境下的音視頻數(shù)據(jù)識別技術(shù)研究[D];哈爾濱工程大學;2019年

6 姜易;基于機器學習的大規(guī)模網(wǎng)絡(luò)流量識別方法研究[D];沈陽工業(yè)大學;2019年

7 李旭航;基于XGBoost的SSH流量識別研究[D];哈爾濱理工大學;2019年

8 何杭松;基于Shadowsocks的流量識別研究[D];中國人民公安大學;2019年

9 方鵬;基于TCP流特征提取技術(shù)的網(wǎng)絡(luò)流量識別應(yīng)用研究[D];中國科學技術(shù)大學;2018年

10 李玎;基于深度學習的網(wǎng)絡(luò)流量識別關(guān)鍵技術(shù)研究[D];戰(zhàn)略支援部隊信息工程大學;2018年



本文編號:2832788

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2832788.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶70596***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com