天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

隱藏服務內(nèi)容分類研究

發(fā)布時間:2021-08-01 22:49
  隨著網(wǎng)絡用戶對隱私保護要求的不斷提高,匿名通信技術(shù)與隱藏服務機制(又名暗網(wǎng))得到快速發(fā)展。然而隱藏服務強匿名性和難以追蹤的特點為非法活動提供了庇護場所,非法服務層出不窮,給網(wǎng)絡空間安全帶來了嚴重威脅。因此,研究隱藏服務非法活動的分類,對防止和打擊違法犯罪行為,具有重要意義。由于隱藏服務域名發(fā)布方式隱蔽,非法網(wǎng)站數(shù)量分布不均衡,且內(nèi)容遷移更新頻繁,大規(guī)模數(shù)據(jù)采集與標記具有一定難度,因此當前隱藏服務非法內(nèi)容分類研究中存在數(shù)據(jù)集規(guī)模小、目標類別少、難以分類新型非法活動等難點。針對這些問題,本文以Tor隱藏服務為研究對象,提出了基于法律規(guī)制的隱藏服務非法活動分類方法,利用相關(guān)法律法規(guī)判定非法隱藏服務,結(jié)合TF-IDF特征權(quán)重計算和機器學習分類算法,實現(xiàn)了對隱藏服務非法網(wǎng)頁的有效分類。本文主要工作與貢獻如下:(1)在數(shù)據(jù)采集階段,通過研究Tor隱藏服務發(fā)布與訪問機制,設計了 Tor隱藏服務發(fā)現(xiàn)與收集系統(tǒng),使用爬蟲框架實現(xiàn)了從Tor隱藏服務目錄類網(wǎng)站和明網(wǎng)搜索引擎關(guān)鍵字檢索兩種渠道發(fā)現(xiàn)和收集Tor隱藏服務域名的功能,構(gòu)造了基于Tor隱藏服務的非法活動網(wǎng)頁數(shù)據(jù)集,為后續(xù)分類研究提供測試數(shù)據(jù)。(2)提... 

【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:77 頁

【學位級別】:碩士

【部分圖文】:

隱藏服務內(nèi)容分類研究


圖2-1?Tor網(wǎng)絡不意圖??Figure?2-1?Tor?network?structure??

運行機制,服務協(xié)議,關(guān)鍵節(jié)點,數(shù)據(jù)流量


服務請求方客戶端和隱藏服務分別與約會節(jié)點RP建立Tor的三跳鏈路,??通信過程的所有數(shù)據(jù)流量都經(jīng)過約會節(jié)點轉(zhuǎn)發(fā)。??圖2-2展示了一個帶有上述關(guān)鍵節(jié)點的Tor網(wǎng)絡結(jié)構(gòu),本文將從Tor隱藏服務??的發(fā)布和用戶訪問兩部分介紹隱藏服務協(xié)議的具體流程。??(1)

流程圖,文本分類,網(wǎng)頁,流程圖


了一些必要的關(guān)鍵技術(shù),對文本分類技術(shù)提出了更高的要求。??現(xiàn)有研究中網(wǎng)頁文本分類的一般過程包括原始網(wǎng)頁去噪、預處理、特征工程、??訓練與分類以及對分類結(jié)果的評價與反饋等步驟,如圖2-3所示:??網(wǎng)頁文本分類過程可以劃分為訓練模塊和分類模塊。在預處理部分,首先根據(jù)??分類需求對原始網(wǎng)頁進行去格式化操作,刪掉與分類無關(guān)的標簽、超鏈接等數(shù)據(jù),??提取文本數(shù)據(jù),然后對得到的文本進行去停用詞、還原詞形等操作,得到原始的特??征詞集合。特征工程部分,通過特征選擇和特征權(quán)重計算完成特征的降維和向量構(gòu)??造。對于訓練與分類部分,一般使用機器學習分類器對訓練集的特征向量進行訓練??后得到該批次數(shù)據(jù)的分類模型,然后輸入測試集的訓練向量,得到分類模型對測試??數(shù)據(jù)的分類結(jié)果。在最后的模型評價與反饋部分,通常使用基于混淆矩陣的評價指??標以及ROC圖等方式對模型進行評估。??下文將介紹網(wǎng)頁文本分類中使用的主要技術(shù)。??—???訓練集一—文本分詞^ ̄?特征選擇??丫丨丄丨r?

【參考文獻】:
期刊論文
[1]匿名通信與暗網(wǎng)研究綜述[J]. 羅軍舟,楊明,凌振,吳文甲,顧曉丹.  計算機研究與發(fā)展. 2019(01)
[2]A Survey about Algorithms Utilized by Focused Web Crawler[J]. Yong-Bin Yu,Shi-Lei Huang,Nyima Tashi,Huan Zhang,Fei Lei,Lin-Yang Wu.  Journal of Electronic Science and Technology. 2018(02)

博士論文
[1]匿名網(wǎng)絡追蹤溯源關(guān)鍵技術(shù)研究[D]. 卓中流.電子科技大學 2018
[2]基于深度學習的文本表示與分類方法研究[D]. 閆琰.北京科技大學 2016

碩士論文
[1]基于節(jié)點注入的暗網(wǎng)掃描系統(tǒng)的設計與實現(xiàn)[D]. 殷帥.北京郵電大學 2018
[2]Tor匿名追蹤技術(shù)研究[D]. 劉源.西安電子科技大學 2017
[3]網(wǎng)頁分類中特征選擇方法的研究[D]. 劉路闊.華中科技大學 2017
[4]基于統(tǒng)計的Web網(wǎng)頁分類算法研究[D]. 孟慶飛.中國地質(zhì)大學(北京) 2016
[5]基于Tor的暗網(wǎng)脆弱性分析研究[D]. 鮑凱.電子科技大學 2016



本文編號:3316384

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3316384.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶59e38***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com