天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 論文百科 > 畢業(yè)論文 >

基于支持向量機(jī)的P2P流量識(shí)別關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2017-01-31 19:20

第一章 緒論

近年來(lái),對(duì)等計(jì)算(Peer-to-Peer,簡(jiǎn)稱 P2P)技術(shù)迅速發(fā)展,日益受到計(jì)算機(jī)界的關(guān)注和青睞,迅速成為業(yè)界關(guān)注的熱門(mén)話題之一。P2P 技術(shù)在文件共享、實(shí)時(shí)流媒體、視頻點(diǎn)播和分布式計(jì)算系統(tǒng)等領(lǐng)域都有重要應(yīng)用。P2P 技術(shù)的使用使得用戶可獲得的資源更廣泛,內(nèi)容更豐富,形式更多樣,但 P2P 技術(shù)的廣泛使用帶來(lái)許多負(fù)面影響,如吞噬網(wǎng)絡(luò)資源、知識(shí)侵權(quán)、網(wǎng)絡(luò)安全等,這些問(wèn)題也導(dǎo)致 P2P 流量識(shí)別研究迫在眉睫。同時(shí) P2P 流量的準(zhǔn)確高效識(shí)別是網(wǎng)絡(luò)運(yùn)營(yíng)商或網(wǎng)絡(luò)管理員開(kāi)展網(wǎng)絡(luò)活動(dòng)的前提。可見(jiàn),P2P 網(wǎng)絡(luò)雖然能提供快速高效的文件共享、低成本高可用的計(jì)算資源和存儲(chǔ)資源共享,并且具有強(qiáng)大的網(wǎng)絡(luò)連通性,以及更直接更靈活的信息傳送能力。然而,P2P 網(wǎng)絡(luò)在提供高效快速資源共享的同時(shí),也帶來(lái)了眾多的問(wèn)題:P2P 對(duì)傳輸速度的需求高,且 P2P 應(yīng)用的數(shù)據(jù)交換具有一對(duì)多、突發(fā)性和分布式特性,P2P 用戶的超大容量下載,消耗了大量帶寬;其用戶搶占了大約 70%以上的網(wǎng)絡(luò)帶寬,造成企業(yè)及網(wǎng)絡(luò)設(shè)備供應(yīng)商的鏈路出現(xiàn)瓶頸效應(yīng);P2P 用戶大批量地下載各種文件,使得網(wǎng)絡(luò)負(fù)荷極大的增加,特別是在高峰時(shí)段,經(jīng)常會(huì)出現(xiàn)網(wǎng)絡(luò)不暢等狀況。隨著 P2P 應(yīng)用的快速發(fā)展,P2P 指數(shù)級(jí)增長(zhǎng)的數(shù)據(jù)傳輸使得網(wǎng)絡(luò)帶寬資源更加緊張。因此,為了確保其他正常網(wǎng)絡(luò)用戶的服務(wù),同時(shí)為了更好地發(fā)揮 P2P 技術(shù)的優(yōu)勢(shì),對(duì) P2P 流量進(jìn)行分類、識(shí)別就成為目前業(yè)內(nèi)研究的一個(gè)熱點(diǎn)。

....


第二章 P2P 流量識(shí)別技術(shù)的研究綜述

2.1端口識(shí)別法

使用基于端口的識(shí)別方法對(duì) P2P 流量的進(jìn)行識(shí)別的方法,同樣也可以用來(lái)識(shí)別普通應(yīng)用分組。首先,在網(wǎng)絡(luò)流量中提取需要檢測(cè)的數(shù)據(jù)信息,然后通過(guò)提取該數(shù)據(jù)包首部信息中的端口信息,接著將提取到的端口號(hào)與已知的固定應(yīng)用的端口號(hào)進(jìn)行匹配,如果匹配成功,則可以斷定該條數(shù)據(jù)流量為 P2P 流量。在 P2P 應(yīng)用研究的初期有許多學(xué)者采用基于端口方法識(shí)別 P2P 流量。Sen 等學(xué)者[6]使用基于端口識(shí)別的方法成功地識(shí)別出當(dāng)時(shí)流行的三種P2P文件共享應(yīng)用(Gnutella、FastTrack、DirectConnect)。Moore[8]等學(xué)者,通過(guò)提取數(shù)據(jù)流量的五元組中的端口信息,用基于端口的方法識(shí)別出 KaZaA 流中的 TCP 端口 1214。Lua等學(xué)者,通過(guò)將數(shù)據(jù)流的長(zhǎng)度和端口相結(jié)合,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)中的一些端口固定的數(shù)據(jù)進(jìn)行識(shí)別。

2.2應(yīng)用層特征識(shí)別法

應(yīng)用層特征識(shí)別法,又稱為深層數(shù)據(jù)包檢測(cè)法(Deep Packet Inspection:DPI),提出該方法的主要原因是因?yàn)榛诙丝谧R(shí)別方法存在的不確定性。因?yàn)榇蟛糠值?P2P 應(yīng)用在其協(xié)議中都有明顯的能夠表明其屬于何種應(yīng)用的特征字信息,因此應(yīng)用層特征識(shí)別法通過(guò)協(xié)議分析與還原技術(shù),提取 P2P 應(yīng)用層數(shù)據(jù)包中的有效載荷,再通過(guò)分析 P2P 載荷中所包含的協(xié)議關(guān)鍵字,,將其與已知的特征字信息進(jìn)行匹配,從而判斷所分析的數(shù)據(jù)流量是否屬于 P2P 應(yīng)用。在深層數(shù)據(jù)包檢測(cè) DPI 技術(shù)中,通過(guò)提取已知的 P2P 應(yīng)用中的有效載荷后,再將這些關(guān)鍵字特征存儲(chǔ)在特征庫(kù)中。對(duì)于網(wǎng)絡(luò)中的實(shí)時(shí)流量,通過(guò)模式匹配算法,如果待測(cè)流量中含有特征庫(kù)中的某種關(guān)鍵字特征,則說(shuō)明該條數(shù)據(jù)的應(yīng)用類型就是何種 P2P 應(yīng)用。對(duì)于早期的 P2P 應(yīng)用來(lái)說(shuō),該方法還是比較有效的[16]。

第三章 基于區(qū)間估計(jì)的懲罰因子優(yōu)化法的 P2P 流量識(shí)別......... 21 

3.1支持向量機(jī)理論概述 .............. 21 
3.2SVM 算法中的核函數(shù)參數(shù)..................................... 28 
3.3一種基于區(qū)間估計(jì)的懲罰因子尋優(yōu)法 PFOMIE.............. 30 
第四章 基于黃金分割的參數(shù)優(yōu)法在 P2P 流量識(shí)別中的應(yīng)用.............. 38 
高斯徑向基函數(shù)中參數(shù)尋優(yōu)法的研究現(xiàn)狀............ 38 
一種基于黃金分割的參數(shù)尋優(yōu)算法(POMGS)............... 41 
第五章 基于多分類的增量學(xué)習(xí)算法的 P2P 流量識(shí)別方法.................... 52 
SVM 增量學(xué)習(xí)算法的基本理論............ 52 
SVM 的增量學(xué)習(xí)算法的相關(guān)研究.................. 53 
一種多分類的 SVM 增量學(xué)習(xí)算法.................. 55 

第六章基于優(yōu)化 SVM 的 P2P 流量識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)


6.1整個(gè)識(shí)別模型的設(shè)計(jì)策略

策略一:使用 SVM 算法進(jìn)行初步訓(xùn)練和分類,前述章節(jié)已經(jīng)就為何選擇 SVM 的分類方法進(jìn)行分類進(jìn)行了深入的討論和實(shí)驗(yàn)。從理論上來(lái)說(shuō),由于 P2P 流量的特征較多,一般的分類算法對(duì)于高維數(shù)據(jù)處理困難,而 SVM 恰是一種能夠解決非線性可分問(wèn)題的算法,該算法具有一定的自學(xué)習(xí)能力,不僅能夠完成高維空間的分類,而且分類效果較好。因此,整個(gè)模型的分類功能,主要由 SVM 的算法為基礎(chǔ)。策略二:為了能夠?qū)?SVM 分類算法很好地應(yīng)用到 P2P 流量識(shí)別中,本文提出了優(yōu)化 SVM算法的策略,即優(yōu)化 SVM 核函數(shù)中的參數(shù)選擇,因?yàn)楹撕瘮?shù)是影響 SVM 算法分類效果的重要因素,而其中核函數(shù)的參數(shù)更是將這種影響充分體現(xiàn)到具體的分類之中。因此,本文為了能夠使 SVM 分類算法更好的進(jìn)行 P2P 流量分類問(wèn)題,提出了優(yōu)化的尋找核函數(shù)參數(shù)的算法,并將其應(yīng)用到 P2P 的分類模型中。

6.2基于優(yōu)化 SVM 的 P2P 流量分類模型

網(wǎng)絡(luò)抓包分析模塊是整個(gè)流量識(shí)別系統(tǒng)實(shí)現(xiàn)的基礎(chǔ)。本模塊主要負(fù)責(zé)捕獲當(dāng)前網(wǎng)絡(luò)中的數(shù)據(jù)包信息。由于本模型為了提高識(shí)別精度需要獲取 P2P 流量的行為統(tǒng)計(jì)特性,所以對(duì)單個(gè)的網(wǎng)絡(luò)數(shù)據(jù)包預(yù)測(cè)能力相當(dāng)有限。由于 P2P 流量的行為統(tǒng)計(jì)特性都是非數(shù)值性的,要將這些特征應(yīng)用到 P2P 流量識(shí)別模型中,需要先將這些流量特征進(jìn)行量化。基于這個(gè)思想,本文為每個(gè) P2P 流量的統(tǒng)計(jì)特性建立時(shí)間的滑動(dòng)窗口的量化模型。滑動(dòng)窗口的具體實(shí)現(xiàn)流程如下:如圖 6.1 所示,本模為了實(shí)現(xiàn) P2P 流量特性的量化,利用滑動(dòng)窗口機(jī)制的原理,將滑動(dòng)窗口機(jī)制中的“以 個(gè)發(fā)送窗口”轉(zhuǎn)變?yōu)樽グ鼤r(shí)連續(xù)抓取 以 秒的網(wǎng)絡(luò)數(shù)據(jù)包。這樣,P2P 流量的每個(gè)特性的量化值就可以借由 以 秒的連續(xù)網(wǎng)絡(luò)流量的平均數(shù)據(jù)量獲得,最后,本模塊會(huì)將這 以 秒的連續(xù)網(wǎng)絡(luò)流量分組保存下來(lái),由流特征提取模塊進(jìn)行流量信息的提取與整理,從而獲得的流量的統(tǒng)計(jì)特征等。

基于支持向量機(jī)的P2P流量識(shí)別關(guān)鍵技術(shù)研究

.....


第七章 總結(jié)與展望


本文主要針對(duì)網(wǎng)絡(luò)中的 P2P 流量的識(shí)別問(wèn)題展開(kāi),主要完成的工作有:(1)通過(guò)對(duì) P2P 識(shí)別的現(xiàn)狀研究分析,指出對(duì)于具有高維特征屬性的 P2P 流量,不適合用傳統(tǒng)的分類方法進(jìn)行分類識(shí)別,而是需要尋求一個(gè)更適合識(shí)別高維度、特征變化多,并適合處理小樣本的分類方法,因此提出使用 SVM 的方法對(duì) P2P 流量進(jìn)行分類和識(shí)別。(2)在現(xiàn)有基于 SVM 算法進(jìn)行分類問(wèn)題研究的基礎(chǔ)上,本文結(jié)合 P2P 流量的特點(diǎn),重點(diǎn)解決 SVM 算法中核函數(shù)的參數(shù)選擇問(wèn)題。本文針對(duì)懲罰參數(shù)選擇的問(wèn)題提出了一種基于區(qū)間估計(jì)的懲罰參數(shù)優(yōu)化法 PFOMIE,并將該方法用在網(wǎng)絡(luò)流量識(shí)別的實(shí)驗(yàn)中,實(shí)驗(yàn)結(jié)果表明,基于 PFOMIE 的 P2P 流量識(shí)別算法能夠提高識(shí)別 P2P 流量時(shí)的效率和準(zhǔn)確率。(3)針對(duì)高斯核函數(shù)中的參數(shù)協(xié)同工作的問(wèn)題,本文通過(guò)分析比較網(wǎng)格搜索法、粒子群算法和遺傳算法等算法在進(jìn)行 SVM 核函數(shù)的參數(shù)選擇時(shí)的各自特點(diǎn),并結(jié)合 SVM 核函數(shù)參數(shù)自身參數(shù)空間分布的特點(diǎn),提出了一種基于黃金分割點(diǎn)的參數(shù)協(xié)同尋優(yōu)法 POMGS。并將該方法在網(wǎng)絡(luò)流量識(shí)別仿真實(shí)驗(yàn)中進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,本文提出的 POMGS 算法在識(shí)別P2P 流量的準(zhǔn)確率、效率等方面都優(yōu)于其他的參數(shù)尋優(yōu)法。

.....

參考文獻(xiàn)(略)




本文編號(hào):239539

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenshubaike/caipu/239539.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶435bc***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com