面向暗網(wǎng)的用戶(hù)畫(huà)像構(gòu)建技術(shù)研究與應(yīng)用
發(fā)布時(shí)間:2022-12-07 02:45
近年來(lái),為防止匿名用戶(hù)在網(wǎng)絡(luò)中進(jìn)行散布不實(shí)信息,損害他人名譽(yù)或煽動(dòng)恐慌情緒等網(wǎng)絡(luò)犯罪行為,保護(hù)和引導(dǎo)健康的網(wǎng)絡(luò)環(huán)境,網(wǎng)絡(luò)安全法新增了網(wǎng)絡(luò)用戶(hù)實(shí)名制的規(guī)定。然而暗網(wǎng)目前仍然處于國(guó)家網(wǎng)絡(luò)安全監(jiān)管的盲區(qū),大量不法分子利用暗網(wǎng)穿上“隱身衣”,進(jìn)行各類(lèi)非法行為。因此在“看不見(jiàn)摸不著”的暗網(wǎng)中挖掘用戶(hù)信息,構(gòu)建出暗網(wǎng)用戶(hù)畫(huà)像對(duì)暗網(wǎng)監(jiān)管具有重要意義。目前針對(duì)用戶(hù)畫(huà)像的研究大都只面向表層網(wǎng)絡(luò)的用戶(hù),但在匿名、隱蔽、結(jié)構(gòu)性弱的暗網(wǎng)中,用戶(hù)畫(huà)像的相關(guān)研究極少,構(gòu)建出較為豐富用戶(hù)畫(huà)像更具有一定困難。本文將面向暗網(wǎng),針對(duì)如何獲取用戶(hù)數(shù)據(jù),通過(guò)稀疏的信息構(gòu)建出暗網(wǎng)用戶(hù)畫(huà)像這一問(wèn)題進(jìn)行研究并加以應(yīng)用。本文搭建了基于Tor的暗網(wǎng)采集系統(tǒng),獲取用戶(hù)在暗網(wǎng)中留下的用戶(hù)信息、交易記錄、社交言論等數(shù)據(jù),通過(guò)部分暗網(wǎng)用戶(hù)標(biāo)識(shí)對(duì)用戶(hù)數(shù)據(jù)進(jìn)行關(guān)聯(lián)擴(kuò)充。將數(shù)據(jù)清洗后,在中英兩種語(yǔ)言的暗網(wǎng)用戶(hù)數(shù)據(jù)集上提取用戶(hù)特征。對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行解析,針對(duì)非結(jié)構(gòu)化數(shù)據(jù)建立暗網(wǎng)關(guān)鍵詞詞庫(kù),結(jié)合命名實(shí)體識(shí)別、實(shí)體關(guān)系抽取等自然語(yǔ)言處理算法,得到由基本信息,社交行為,市場(chǎng)交易三個(gè)維度的用戶(hù)基礎(chǔ)屬性構(gòu)成用戶(hù)的基礎(chǔ)畫(huà)像。為進(jìn)一步挖掘用戶(hù)屬性,改善暗網(wǎng)用戶(hù)屬性...
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景與研究意義
1.1.1 課題來(lái)源
1.1.2 課題的研究背景與意義
1.2 國(guó)內(nèi)外相關(guān)研究現(xiàn)狀
1.2.1 暗網(wǎng)威脅數(shù)據(jù)獲取研究現(xiàn)狀
1.2.2 人物信息抽取研究現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)安排
第2章 暗網(wǎng)用戶(hù)數(shù)據(jù)采集與數(shù)據(jù)集構(gòu)建
2.1 暗網(wǎng)數(shù)據(jù)來(lái)源
2.2 暗網(wǎng)數(shù)據(jù)大規(guī)模采集
2.2.1 Tor網(wǎng)絡(luò)層
2.2.2 任務(wù)采集層
2.2.3 數(shù)據(jù)存儲(chǔ)層
2.3 暗網(wǎng)數(shù)據(jù)預(yù)處理
2.4 數(shù)據(jù)匿名化處理
2.5 暗網(wǎng)數(shù)據(jù)統(tǒng)計(jì)分析
2.6 本章小結(jié)
第3章 暗網(wǎng)用戶(hù)多維度基礎(chǔ)畫(huà)像構(gòu)建
3.1 基礎(chǔ)屬性與特征提取
3.2 相關(guān)實(shí)體識(shí)別
3.2.1 中文命名實(shí)體識(shí)別
3.2.2 英文實(shí)體識(shí)別
3.2.3 建立暗網(wǎng)語(yǔ)料庫(kù)
3.2.4 自定義規(guī)則
3.2.5 實(shí)驗(yàn)結(jié)果與分析
3.3 實(shí)體關(guān)系抽取
3.3.1 中文實(shí)體關(guān)系抽取
3.3.2 英文實(shí)體關(guān)系抽取
3.3.3 實(shí)驗(yàn)結(jié)果與分析
3.4 暗網(wǎng)用戶(hù)基礎(chǔ)畫(huà)像
3.5 本章小結(jié)
第4章 基于文本挖掘的暗網(wǎng)用戶(hù)深度畫(huà)像構(gòu)建
4.1 活躍度計(jì)算
4.1.1 活躍度算法
4.1.2 暗網(wǎng)用戶(hù)活躍度分析
4.2 影響力計(jì)算
4.2.1 影響力算法
4.2.2 暗網(wǎng)用戶(hù)影響力分布
4.3 言論情感分析
4.3.1 中文情感分析
4.3.2 英文情感分析
4.3.3 自定義情感值庫(kù)
4.3.4 暗網(wǎng)用戶(hù)情感極性分布
4.4 觀點(diǎn)立場(chǎng)傾向分析
4.4.1 特征提取
4.4.2 分類(lèi)判斷
4.4.3 自定義關(guān)鍵詞庫(kù)
4.5 交易規(guī)模分析與預(yù)測(cè)
4.5.1 交易規(guī)模分析
4.5.2 交易量預(yù)測(cè)
4.6 暗網(wǎng)用戶(hù)深度畫(huà)像
4.7 本章小結(jié)
第5章 基于暗網(wǎng)用戶(hù)畫(huà)像的虛擬群體發(fā)現(xiàn)應(yīng)用
5.1 用戶(hù)畫(huà)像相似度計(jì)算
5.2 用戶(hù)虛擬群體聚類(lèi)
5.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]一種基于暗網(wǎng)的威脅情報(bào)主動(dòng)獲取框架[J]. 黃莉崢,劉嘉勇,鄭榮鋒,李孟銘. 信息安全研究. 2020(02)
[2]基于FTRL和XGBoost組合算法的電商銷(xiāo)量預(yù)測(cè)系統(tǒng)[J]. 鐘小勇. 信息記錄材料. 2020(01)
[3]基于規(guī)則的人物信息抽取算法的研究[J]. 喬磊,李存華,仲兆滿(mǎn),王俊,劉冬冬. 南京師大學(xué)報(bào)(自然科學(xué)版). 2012(04)
[4]競(jìng)爭(zhēng)情報(bào)搜集與利用中的信息資產(chǎn)[J]. 王知津,范淑杰,王麗娜. 圖書(shū)館學(xué)研究. 2011(07)
[5]基于語(yǔ)義上下文分析的因特網(wǎng)人物信息挖掘[J]. 劉金紅,陸余良,施凡,宋舜宏. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版). 2009(04)
[6]基于種子自擴(kuò)展的命名實(shí)體關(guān)系抽取方法[J]. 何婷婷,徐超,李晶,趙君喆. 計(jì)算機(jī)工程. 2006(21)
[7]基于雙層級(jí)聯(lián)文本分類(lèi)的簡(jiǎn)歷信息抽取[J]. 于琨,管剛,周明,王煦法,蔡慶生. 中文信息學(xué)報(bào). 2006(01)
[8]可靠洋蔥路由方案的設(shè)計(jì)與實(shí)現(xiàn)[J]. 趙福祥,王育民,王常杰. 計(jì)算機(jī)學(xué)報(bào). 2001(05)
碩士論文
[1]第二代洋蔥路由匿名系統(tǒng)Tor的性能改進(jìn)研究[D]. 王有文.北京郵電大學(xué) 2017
[2]基于文本的人物畫(huà)像挖掘技術(shù)的研究與應(yīng)用[D]. 李趙潔.電子科技大學(xué) 2016
[3]Tor匿名通信系統(tǒng)路由技術(shù)研究[D]. 韓越.北京郵電大學(xué) 2016
[4]面向突發(fā)事件案例庫(kù)的事件抽取模型構(gòu)建研究[D]. 王文龍.南京大學(xué) 2015
[5]基于規(guī)則的百科人物屬性抽取算法的研究[D]. 李紅亮.西南交通大學(xué) 2013
[6]暗網(wǎng)資源挖掘的關(guān)鍵技術(shù)研究[D]. 張永超.西安電子科技大學(xué) 2013
[7]基于網(wǎng)頁(yè)完整理解的人物信息抽取[D]. 郝冬生.吉林大學(xué) 2012
[8]異構(gòu)信息源的領(lǐng)域人物信息抽取研究[D]. 周婷.哈爾濱工業(yè)大學(xué) 2010
[9]大規(guī)模真實(shí)文本中的人物職銜信息提取研究[D]. 任寧.北京語(yǔ)言大學(xué) 2008
本文編號(hào):3712092
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景與研究意義
1.1.1 課題來(lái)源
1.1.2 課題的研究背景與意義
1.2 國(guó)內(nèi)外相關(guān)研究現(xiàn)狀
1.2.1 暗網(wǎng)威脅數(shù)據(jù)獲取研究現(xiàn)狀
1.2.2 人物信息抽取研究現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)安排
第2章 暗網(wǎng)用戶(hù)數(shù)據(jù)采集與數(shù)據(jù)集構(gòu)建
2.1 暗網(wǎng)數(shù)據(jù)來(lái)源
2.2 暗網(wǎng)數(shù)據(jù)大規(guī)模采集
2.2.1 Tor網(wǎng)絡(luò)層
2.2.2 任務(wù)采集層
2.2.3 數(shù)據(jù)存儲(chǔ)層
2.3 暗網(wǎng)數(shù)據(jù)預(yù)處理
2.4 數(shù)據(jù)匿名化處理
2.5 暗網(wǎng)數(shù)據(jù)統(tǒng)計(jì)分析
2.6 本章小結(jié)
第3章 暗網(wǎng)用戶(hù)多維度基礎(chǔ)畫(huà)像構(gòu)建
3.1 基礎(chǔ)屬性與特征提取
3.2 相關(guān)實(shí)體識(shí)別
3.2.1 中文命名實(shí)體識(shí)別
3.2.2 英文實(shí)體識(shí)別
3.2.3 建立暗網(wǎng)語(yǔ)料庫(kù)
3.2.4 自定義規(guī)則
3.2.5 實(shí)驗(yàn)結(jié)果與分析
3.3 實(shí)體關(guān)系抽取
3.3.1 中文實(shí)體關(guān)系抽取
3.3.2 英文實(shí)體關(guān)系抽取
3.3.3 實(shí)驗(yàn)結(jié)果與分析
3.4 暗網(wǎng)用戶(hù)基礎(chǔ)畫(huà)像
3.5 本章小結(jié)
第4章 基于文本挖掘的暗網(wǎng)用戶(hù)深度畫(huà)像構(gòu)建
4.1 活躍度計(jì)算
4.1.1 活躍度算法
4.1.2 暗網(wǎng)用戶(hù)活躍度分析
4.2 影響力計(jì)算
4.2.1 影響力算法
4.2.2 暗網(wǎng)用戶(hù)影響力分布
4.3 言論情感分析
4.3.1 中文情感分析
4.3.2 英文情感分析
4.3.3 自定義情感值庫(kù)
4.3.4 暗網(wǎng)用戶(hù)情感極性分布
4.4 觀點(diǎn)立場(chǎng)傾向分析
4.4.1 特征提取
4.4.2 分類(lèi)判斷
4.4.3 自定義關(guān)鍵詞庫(kù)
4.5 交易規(guī)模分析與預(yù)測(cè)
4.5.1 交易規(guī)模分析
4.5.2 交易量預(yù)測(cè)
4.6 暗網(wǎng)用戶(hù)深度畫(huà)像
4.7 本章小結(jié)
第5章 基于暗網(wǎng)用戶(hù)畫(huà)像的虛擬群體發(fā)現(xiàn)應(yīng)用
5.1 用戶(hù)畫(huà)像相似度計(jì)算
5.2 用戶(hù)虛擬群體聚類(lèi)
5.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]一種基于暗網(wǎng)的威脅情報(bào)主動(dòng)獲取框架[J]. 黃莉崢,劉嘉勇,鄭榮鋒,李孟銘. 信息安全研究. 2020(02)
[2]基于FTRL和XGBoost組合算法的電商銷(xiāo)量預(yù)測(cè)系統(tǒng)[J]. 鐘小勇. 信息記錄材料. 2020(01)
[3]基于規(guī)則的人物信息抽取算法的研究[J]. 喬磊,李存華,仲兆滿(mǎn),王俊,劉冬冬. 南京師大學(xué)報(bào)(自然科學(xué)版). 2012(04)
[4]競(jìng)爭(zhēng)情報(bào)搜集與利用中的信息資產(chǎn)[J]. 王知津,范淑杰,王麗娜. 圖書(shū)館學(xué)研究. 2011(07)
[5]基于語(yǔ)義上下文分析的因特網(wǎng)人物信息挖掘[J]. 劉金紅,陸余良,施凡,宋舜宏. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版). 2009(04)
[6]基于種子自擴(kuò)展的命名實(shí)體關(guān)系抽取方法[J]. 何婷婷,徐超,李晶,趙君喆. 計(jì)算機(jī)工程. 2006(21)
[7]基于雙層級(jí)聯(lián)文本分類(lèi)的簡(jiǎn)歷信息抽取[J]. 于琨,管剛,周明,王煦法,蔡慶生. 中文信息學(xué)報(bào). 2006(01)
[8]可靠洋蔥路由方案的設(shè)計(jì)與實(shí)現(xiàn)[J]. 趙福祥,王育民,王常杰. 計(jì)算機(jī)學(xué)報(bào). 2001(05)
碩士論文
[1]第二代洋蔥路由匿名系統(tǒng)Tor的性能改進(jìn)研究[D]. 王有文.北京郵電大學(xué) 2017
[2]基于文本的人物畫(huà)像挖掘技術(shù)的研究與應(yīng)用[D]. 李趙潔.電子科技大學(xué) 2016
[3]Tor匿名通信系統(tǒng)路由技術(shù)研究[D]. 韓越.北京郵電大學(xué) 2016
[4]面向突發(fā)事件案例庫(kù)的事件抽取模型構(gòu)建研究[D]. 王文龍.南京大學(xué) 2015
[5]基于規(guī)則的百科人物屬性抽取算法的研究[D]. 李紅亮.西南交通大學(xué) 2013
[6]暗網(wǎng)資源挖掘的關(guān)鍵技術(shù)研究[D]. 張永超.西安電子科技大學(xué) 2013
[7]基于網(wǎng)頁(yè)完整理解的人物信息抽取[D]. 郝冬生.吉林大學(xué) 2012
[8]異構(gòu)信息源的領(lǐng)域人物信息抽取研究[D]. 周婷.哈爾濱工業(yè)大學(xué) 2010
[9]大規(guī)模真實(shí)文本中的人物職銜信息提取研究[D]. 任寧.北京語(yǔ)言大學(xué) 2008
本文編號(hào):3712092
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3712092.html
最近更新
教材專(zhuān)著