網(wǎng)絡安全熱點分析系統(tǒng)的研究與開發(fā)
發(fā)布時間:2021-12-29 13:54
當前互聯(lián)網(wǎng)的迅猛發(fā)展,使得互聯(lián)網(wǎng)的應用滲透到了各行各業(yè),為人們的生活提供了極大的便利,因為互聯(lián)網(wǎng)的虛擬性,為網(wǎng)絡犯罪提供了便利,利用互聯(lián)網(wǎng)的漏洞來進行攻擊等等。當前主流的網(wǎng)絡安全熱點分析系統(tǒng)的研究和開發(fā)主要是基于自然語言處理技術,里面分析熱點的關鍵方法是基于主題模型的LDA模型[4]和N-gram模型[7]從海量數(shù)據(jù)中提取重點信息。用自然語言處理技術來進行網(wǎng)絡安全熱點分析,得到的熱點準確性較高,現(xiàn)在流行的無監(jiān)督學習方法更是方便可行,不用人工手動去分類,而是通過一系列的訓練數(shù)據(jù)自動進行識別分類,提高了分類的準確性和效率。本論文的主要描述了網(wǎng)絡安全熱點分析的一種方法——基于主題模型的網(wǎng)絡安全熱點識別方法。首先,需要用網(wǎng)絡爬蟲技術來將海量數(shù)據(jù)按照規(guī)則爬取下來;其次,用基于LDA模型[4]和基于N-gram模型[7]主題模型來提取海量數(shù)據(jù)的主題,主題即是海量數(shù)據(jù)背后隱藏的核心觀點;接著,分析主題部分采用了建造主題鏈和趨勢分析兩種方法對比效果,目的是一樣的要找到熱點,但是兩者的側重點不同,趨勢分析部分需要引入時間的維度進行分析;最后,采用WiGis[3]工程來實現(xiàn)每個主題鏈的可視化。本論文的另外...
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:85 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 網(wǎng)絡安全熱點分析系統(tǒng)的研究背景及意義
1.2 國內外技術開發(fā)現(xiàn)狀
1.2.1 爬取數(shù)據(jù)技術進展
1.2.2 主題建模技術進展
1.2.3 主題鏈和趨勢分析技術進展
1.2.4 可視化技術進展
1.3 論文術語定義
1.4 論文的主要工作
1.5 論文的組織結構
第2章 網(wǎng)絡安全分析系統(tǒng)相關技術與研究
2.1 基于爬蟲爬取數(shù)據(jù)技術與研究
2.2 主題模型技術與研究
2.2.1 基于LSA的主題模型
2.2.2 基于PLSA的主題模型
2.2.3 基于LDA的主題模型與基于N-gram的主題模型
2.2.4 基于Labeled-LDA的主題模型
2.3 建造主題鏈和趨勢分析技術與研究
2.4 可視化方法技術與研究
第3章 系統(tǒng)需求分析
3.1 系統(tǒng)總體業(yè)務描述
3.2 系統(tǒng)實現(xiàn)目標與主要解決問題
3.3 系統(tǒng)需求分析
3.3.1 系統(tǒng)功能性需求
3.4 系統(tǒng)非功能性需求
3.4.1 系統(tǒng)性能要求
3.4.2 可靠性要求
3.4.3 維護性要求
3.4.4 擴展性要求
3.4.5 適應性要求
第4章 系統(tǒng)概要設計
4.1 系統(tǒng)架構設計
4.2 系統(tǒng)功能架構與系統(tǒng)流程
4.2.1 系統(tǒng)管理模塊
4.2.2 數(shù)據(jù)獲取模塊
4.2.3 數(shù)據(jù)處理模塊
4.2.4 主題建模模塊
4.2.5 可視化模塊
第5章 系統(tǒng)詳細設計
5.1 系統(tǒng)靜態(tài)結構設計
5.1.1 系統(tǒng)包圖設計
5.1.2 系統(tǒng)核心類圖設計
5.2 系統(tǒng)模塊詳細設計
5.2.1 系統(tǒng)管理
5.2.2 數(shù)據(jù)獲取
5.2.3 數(shù)據(jù)處理
5.2.4 主題建模
5.2.5 可視化
5.3 系統(tǒng)數(shù)據(jù)庫設計
第6章 系統(tǒng)實現(xiàn)與實驗結果
6.1 系統(tǒng)實現(xiàn)
6.1.1 數(shù)據(jù)獲取
6.1.2 數(shù)據(jù)處理
6.1.3 主題建模
6.1.4 可視化
6.2 實驗結果
6.2.1 實驗運行環(huán)境
6.2.2 實驗參數(shù)設置
6.2.3 主題結果
6.2.4 主題鏈結果
6.2.5 主題趨勢分析結果
第7章 總結與展望
參考文獻
致謝
附件
【參考文獻】:
期刊論文
[1]微博輿情熱點分析系統(tǒng)設計研究[J]. 張洋,何楚杰,段俊文,楊春程. 信息網(wǎng)絡安全. 2012(09)
[2]結合語言模型的自動文本分類的應用研究[J]. 趙敏涯. 計算機與現(xiàn)代化. 2010(03)
[3]主題網(wǎng)絡爬蟲研究綜述[J]. 劉金紅,陸余良. 計算機應用研究. 2007(10)
博士論文
[1]基于粗糙集理論的文本自動分類研究[D]. 張雪英.南京理工大學 2005
本文編號:3556258
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:85 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 網(wǎng)絡安全熱點分析系統(tǒng)的研究背景及意義
1.2 國內外技術開發(fā)現(xiàn)狀
1.2.1 爬取數(shù)據(jù)技術進展
1.2.2 主題建模技術進展
1.2.3 主題鏈和趨勢分析技術進展
1.2.4 可視化技術進展
1.3 論文術語定義
1.4 論文的主要工作
1.5 論文的組織結構
第2章 網(wǎng)絡安全分析系統(tǒng)相關技術與研究
2.1 基于爬蟲爬取數(shù)據(jù)技術與研究
2.2 主題模型技術與研究
2.2.1 基于LSA的主題模型
2.2.2 基于PLSA的主題模型
2.2.3 基于LDA的主題模型與基于N-gram的主題模型
2.2.4 基于Labeled-LDA的主題模型
2.3 建造主題鏈和趨勢分析技術與研究
2.4 可視化方法技術與研究
第3章 系統(tǒng)需求分析
3.1 系統(tǒng)總體業(yè)務描述
3.2 系統(tǒng)實現(xiàn)目標與主要解決問題
3.3 系統(tǒng)需求分析
3.3.1 系統(tǒng)功能性需求
3.4 系統(tǒng)非功能性需求
3.4.1 系統(tǒng)性能要求
3.4.2 可靠性要求
3.4.3 維護性要求
3.4.4 擴展性要求
3.4.5 適應性要求
第4章 系統(tǒng)概要設計
4.1 系統(tǒng)架構設計
4.2 系統(tǒng)功能架構與系統(tǒng)流程
4.2.1 系統(tǒng)管理模塊
4.2.2 數(shù)據(jù)獲取模塊
4.2.3 數(shù)據(jù)處理模塊
4.2.4 主題建模模塊
4.2.5 可視化模塊
第5章 系統(tǒng)詳細設計
5.1 系統(tǒng)靜態(tài)結構設計
5.1.1 系統(tǒng)包圖設計
5.1.2 系統(tǒng)核心類圖設計
5.2 系統(tǒng)模塊詳細設計
5.2.1 系統(tǒng)管理
5.2.2 數(shù)據(jù)獲取
5.2.3 數(shù)據(jù)處理
5.2.4 主題建模
5.2.5 可視化
5.3 系統(tǒng)數(shù)據(jù)庫設計
第6章 系統(tǒng)實現(xiàn)與實驗結果
6.1 系統(tǒng)實現(xiàn)
6.1.1 數(shù)據(jù)獲取
6.1.2 數(shù)據(jù)處理
6.1.3 主題建模
6.1.4 可視化
6.2 實驗結果
6.2.1 實驗運行環(huán)境
6.2.2 實驗參數(shù)設置
6.2.3 主題結果
6.2.4 主題鏈結果
6.2.5 主題趨勢分析結果
第7章 總結與展望
參考文獻
致謝
附件
【參考文獻】:
期刊論文
[1]微博輿情熱點分析系統(tǒng)設計研究[J]. 張洋,何楚杰,段俊文,楊春程. 信息網(wǎng)絡安全. 2012(09)
[2]結合語言模型的自動文本分類的應用研究[J]. 趙敏涯. 計算機與現(xiàn)代化. 2010(03)
[3]主題網(wǎng)絡爬蟲研究綜述[J]. 劉金紅,陸余良. 計算機應用研究. 2007(10)
博士論文
[1]基于粗糙集理論的文本自動分類研究[D]. 張雪英.南京理工大學 2005
本文編號:3556258
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3556258.html
最近更新
教材專著