基于網(wǎng)絡(luò)流量的微信用戶行為識別技術(shù)
發(fā)布時間:2020-06-14 07:57
【摘要】:信息化時代的來臨,智能設(shè)備及其上的應(yīng)用程序逐漸成為人們?nèi)粘I钪胁豢苫蛉钡囊徊糠。網(wǎng)絡(luò)流量作為應(yīng)用程序在網(wǎng)絡(luò)通訊時傳輸數(shù)據(jù)的載體,受到研究者的廣泛關(guān)注。分析應(yīng)用程序產(chǎn)生的網(wǎng)絡(luò)流量可以為網(wǎng)絡(luò)管理、隱私保護(hù)以及用戶行為識別等提供重要信息。微信是在中國以及海外華僑用戶中極其受歡迎的一款擁有發(fā)送文本、圖片、語音、視頻、紅包以及轉(zhuǎn)賬等功能的即時通訊類應(yīng)用程序。然而,微信在給人們的日常生活帶來便利的同時,也引發(fā)了如微信紅包賭局、微信詐騙和微信釣魚攻擊等安全問題。本文針對微信用戶行為識別展開深入研究。第一,為了保護(hù)用戶隱私安全以及提供更好的網(wǎng)絡(luò)服務(wù),本文提出一種基于流量分類的微信用戶行為識別技術(shù)。首先分析用戶行為產(chǎn)生的網(wǎng)絡(luò)流量中的特征信息;其次采用固定的時間段切分網(wǎng)絡(luò)流量至多條表示用戶行為的子序列中;然后從子序列中提取流量特征信息,用于構(gòu)建基于隨機森林算法的流量分類模型。在真實數(shù)據(jù)集上的評估實驗結(jié)果表明,識別用戶行為的平均F1值為88%,其中微信文本與圖片均可以實現(xiàn)96%以上的Fl值(F1-Score),而階段性行為微信紅包與轉(zhuǎn)賬的F1值為83%。第二,為了分析微信賭博、微信詐騙以及微信釣魚攻擊等安全問題,本文提出基于流量分類的微信用戶階段性行為識別技術(shù)。首先分析階段性行為的特殊性以及各個階段產(chǎn)生的網(wǎng)絡(luò)流量中的特征信息;其次以數(shù)據(jù)包時間間隔切分網(wǎng)絡(luò)流量至多條表示不同階段的子序列中;然后根據(jù)不同階段的流量特征信息,從子序列中提取特征信息,用于構(gòu)建基于隨機森林算法流量分類模型。實驗結(jié)果表明,本文提出的可以準(zhǔn)確識別階段性行為,平均F1值達(dá)到96%。綜上所述,本文提出的基于網(wǎng)絡(luò)流量的微信用戶行為識別技術(shù)具有可行性,可以應(yīng)用于網(wǎng)絡(luò)管理、隱私保護(hù)和用戶行為識別等。因此,本研究具有一定理論和使用價值。 【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP393.06
【圖文】:
11APP邋n邋]邋|邐應(yīng)用程序識別邐k)逡逑圖2.1基于端口的應(yīng)用程序識別技術(shù)的一般流程逡逑基于端口的應(yīng)用程序識別技術(shù)的一般流程如圖2.1所示,通過收集應(yīng)用程序逡逑產(chǎn)生的網(wǎng)絡(luò)流量,解析其數(shù)據(jù)報文中的TCP報文頭部,獲取其占用的端口號,逡逑與LANA分配的端口列表匹配,從而識別應(yīng)用程序的種類。Kim等人發(fā)現(xiàn)基逡逑于端口的應(yīng)用程序識R%技術(shù)在識別HTTP、DNS、FTP等類型的流量T是Q囆У,辶x弦蚱洳捎霉潭ǘ絲諍,其精度可以达祫0%译E。葰g,栽燇多数应淤Q(mào)絳蠆捎緬義隙素棺⒁約岸絲諼弊暗燃際踔螅詼絲詰氖禦%技術(shù)的精度在下降。Moore逡逑等人于2005年提出基于端口的應(yīng)用程序識別技術(shù)的正確率不足70%[||1。另外,逡逑Sdmeider等人在使用基于端口技術(shù)識別UDP流量時,,精度僅為24%。因此,基逡逑于端口的技術(shù)己不再滿足目前應(yīng)用程序識別技術(shù)的需求。逡逑2.1.2基于載荷的應(yīng)用程序識別技術(shù)逡逑在基于端口的應(yīng)用程序識別技術(shù)逐漸不再適用以后
邐?邐80:邐HTTP逡逑11APP邋n邋]邋|邐應(yīng)用程序識別邐k)逡逑圖2.1基于端口的應(yīng)用程序識別技術(shù)的一般流程逡逑基于端口的應(yīng)用程序識別技術(shù)的一般流程如圖2.1所示,通過收集應(yīng)用程序逡逑產(chǎn)生的網(wǎng)絡(luò)流量,解析其數(shù)據(jù)報文中的TCP報文頭部,獲取其占用的端口號,逡逑與LANA分配的端口列表匹配,從而識別應(yīng)用程序的種類。Kim等人發(fā)現(xiàn)基逡逑于端口的應(yīng)用程序識R%技術(shù)在識別HTTP、DNS、FTP等類型的流量T是Q囆У,辶x弦蚱洳捎霉潭ǘ絲諍,其精度可以达祫0%译E。葰g,栽燇多数应淤Q(mào)絳蠆捎緬義隙素棺⒁約岸絲諼弊暗燃際踔,基釉溄z詰氖禦%技術(shù)的精度在下降。Moore逡逑等人于2005年提出基于端口的應(yīng)用程序識別技術(shù)的正確率不足70%[||1。另外,逡逑Sdmeider等人在使用基于端口技術(shù)識別UDP流量時
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP393.06
【圖文】:
11APP邋n邋]邋|邐應(yīng)用程序識別邐k)逡逑圖2.1基于端口的應(yīng)用程序識別技術(shù)的一般流程逡逑基于端口的應(yīng)用程序識別技術(shù)的一般流程如圖2.1所示,通過收集應(yīng)用程序逡逑產(chǎn)生的網(wǎng)絡(luò)流量,解析其數(shù)據(jù)報文中的TCP報文頭部,獲取其占用的端口號,逡逑與LANA分配的端口列表匹配,從而識別應(yīng)用程序的種類。Kim等人發(fā)現(xiàn)基逡逑于端口的應(yīng)用程序識R%技術(shù)在識別HTTP、DNS、FTP等類型的流量T是Q囆У,辶x弦蚱洳捎霉潭ǘ絲諍,其精度可以达祫0%译E。葰g,栽燇多数应淤Q(mào)絳蠆捎緬義隙素棺⒁約岸絲諼弊暗燃際踔螅詼絲詰氖禦%技術(shù)的精度在下降。Moore逡逑等人于2005年提出基于端口的應(yīng)用程序識別技術(shù)的正確率不足70%[||1。另外,逡逑Sdmeider等人在使用基于端口技術(shù)識別UDP流量時,,精度僅為24%。因此,基逡逑于端口的技術(shù)己不再滿足目前應(yīng)用程序識別技術(shù)的需求。逡逑2.1.2基于載荷的應(yīng)用程序識別技術(shù)逡逑在基于端口的應(yīng)用程序識別技術(shù)逐漸不再適用以后
邐?邐80:邐HTTP逡逑11APP邋n邋]邋|邐應(yīng)用程序識別邐k)逡逑圖2.1基于端口的應(yīng)用程序識別技術(shù)的一般流程逡逑基于端口的應(yīng)用程序識別技術(shù)的一般流程如圖2.1所示,通過收集應(yīng)用程序逡逑產(chǎn)生的網(wǎng)絡(luò)流量,解析其數(shù)據(jù)報文中的TCP報文頭部,獲取其占用的端口號,逡逑與LANA分配的端口列表匹配,從而識別應(yīng)用程序的種類。Kim等人發(fā)現(xiàn)基逡逑于端口的應(yīng)用程序識R%技術(shù)在識別HTTP、DNS、FTP等類型的流量T是Q囆У,辶x弦蚱洳捎霉潭ǘ絲諍,其精度可以达祫0%译E。葰g,栽燇多数应淤Q(mào)絳蠆捎緬義隙素棺⒁約岸絲諼弊暗燃際踔,基釉溄z詰氖禦%技術(shù)的精度在下降。Moore逡逑等人于2005年提出基于端口的應(yīng)用程序識別技術(shù)的正確率不足70%[||1。另外,逡逑Sdmeider等人在使用基于端口技術(shù)識別UDP流量時
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 劉興彬;楊建華;謝高崗;胡s
本文編號:2712486
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2712486.html
最近更新
教材專著