基于半監(jiān)督學(xué)習(xí)的網(wǎng)絡(luò)詐騙案例的實(shí)體識(shí)別與實(shí)體關(guān)系抽取研究
發(fā)布時(shí)間:2021-12-28 17:24
目前網(wǎng)絡(luò)詐騙不僅種類繁多、詐騙手段更新迭代升級(jí)速度快,而且詐騙范圍遍及全國各地,造成了巨大的財(cái)產(chǎn)損失。為了快速破案,保護(hù)人民財(cái)產(chǎn),需從數(shù)量龐大的詐騙案例中分析詐騙方式,找出其特點(diǎn)并加以防范。面對(duì)數(shù)量龐大的數(shù)據(jù),僅僅依賴人力手動(dòng)分析是不夠的,需要借助現(xiàn)有的科技與方法來實(shí)現(xiàn)。本文使用半監(jiān)督學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,抽取網(wǎng)絡(luò)詐騙案例中的實(shí)體與實(shí)體關(guān)系并分析。本文從以下幾個(gè)方面入手:第一,因?yàn)槟壳熬W(wǎng)絡(luò)上沒有標(biāo)準(zhǔn)的、有權(quán)威性的、覆蓋范圍廣的網(wǎng)絡(luò)詐騙語料庫可供使用。本項(xiàng)目分別從獵聘網(wǎng)與各大新聞報(bào)道網(wǎng)站爬取數(shù)據(jù),構(gòu)建data1與data2兩個(gè)數(shù)據(jù)集,采用BIO標(biāo)注的方式手工標(biāo)注部分案例,構(gòu)建本文的語料庫。第二,基于Bi-LSTM+CRF實(shí)體識(shí)別的模型基礎(chǔ)之上,為了克服語料庫小的問題,引入半監(jiān)督學(xué)習(xí)的思想構(gòu)建半監(jiān)督識(shí)別模型(Semi-supervised Recognition Model,SRM)。第三,采用聯(lián)合標(biāo)注策略,對(duì)半監(jiān)督識(shí)別模型(Semi-supervised Recognition Model,SRM)進(jìn)行改造。通過將softmax層替代原先的CRF層和添加位置標(biāo)簽構(gòu)建新的關(guān)系抽取模型...
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:65 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
014-2018獵聘網(wǎng)詐騙數(shù)量舉報(bào)圖
014-2018年網(wǎng)絡(luò)詐騙人均損失在對(duì)獵聘網(wǎng)收到的詐騙舉報(bào)案例分析發(fā)現(xiàn):僅2018年一年,其收到的有效
018年網(wǎng)絡(luò)詐騙主要類型以及損失
【參考文獻(xiàn)】:
期刊論文
[1]移動(dòng)互聯(lián)網(wǎng)時(shí)代下網(wǎng)絡(luò)詐騙犯罪態(tài)勢(shì)、特征與防控——基于對(duì)866份刑事裁判文書的實(shí)證研究[J]. 汪嘉佩. 犯罪研究. 2017(06)
[2]網(wǎng)絡(luò)信息安全防范和Web數(shù)據(jù)挖掘技術(shù)的有效整合[J]. 吳雷. 網(wǎng)絡(luò)空間安全. 2016(06)
[3]開放式地理實(shí)體關(guān)系抽取的Bootstrapping方法[J]. 余麗,陸鋒,劉希亮. 測(cè)繪學(xué)報(bào). 2016(05)
[4]大數(shù)據(jù)分析的無限深度神經(jīng)網(wǎng)絡(luò)方法[J]. 張蕾,章毅. 計(jì)算機(jī)研究與發(fā)展. 2016(01)
[5]基于多核融合的中文領(lǐng)域?qū)嶓w關(guān)系抽取[J]. 郭劍毅,陳鵬,余正濤,線巖團(tuán),毛存禮,趙君. 中文信息學(xué)報(bào). 2016(01)
[6]無指導(dǎo)的中文開放式實(shí)體關(guān)系抽取[J]. 秦兵,劉安安,劉挺. 計(jì)算機(jī)研究與發(fā)展. 2015(05)
[7]網(wǎng)絡(luò)詐騙案件的特點(diǎn)及偵查路徑[J]. 李堯. 江西警察學(xué)院學(xué)報(bào). 2015(02)
[8]融合領(lǐng)域知識(shí)短語樹核函數(shù)的中文領(lǐng)域?qū)嶓w關(guān)系抽取[J]. 陳鵬,郭劍毅,余正濤,嚴(yán)馨,張志坤,高盛祥. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2015(01)
[9]基于句法語義特征的中文實(shí)體關(guān)系抽取[J]. 郭喜躍,何婷婷,胡小華,陳前軍. 中文信息學(xué)報(bào). 2014(06)
[10]網(wǎng)絡(luò)詐騙犯罪淺析[J]. 呂巖. 中共樂山市委黨校學(xué)報(bào). 2013(01)
博士論文
[1]面向開放領(lǐng)域文本的實(shí)體關(guān)系抽取[D]. 郭喜躍.華中師范大學(xué) 2016
碩士論文
[1]無監(jiān)督中文實(shí)體關(guān)系抽取研究[D]. 施琦.中國地質(zhì)大學(xué)(北京) 2015
[2]基于多核融合的中文領(lǐng)域?qū)嶓w關(guān)系抽取研究[D]. 陳鵬.昆明理工大學(xué) 2014
[3]基于多代理策略的中文實(shí)體關(guān)系抽取[D]. 王敏.大連理工大學(xué) 2011
[4]Web環(huán)境下基于語義模式匹配的實(shí)體關(guān)系提取方法的研究[D]. 周詩詠.東北大學(xué) 2009
[5]基于圖的半監(jiān)督學(xué)習(xí)模型研究與分類器設(shè)計(jì)[D]. 郝建柏.中國科學(xué)技術(shù)大學(xué) 2009
本文編號(hào):3554440
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:65 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
014-2018獵聘網(wǎng)詐騙數(shù)量舉報(bào)圖
014-2018年網(wǎng)絡(luò)詐騙人均損失在對(duì)獵聘網(wǎng)收到的詐騙舉報(bào)案例分析發(fā)現(xiàn):僅2018年一年,其收到的有效
018年網(wǎng)絡(luò)詐騙主要類型以及損失
【參考文獻(xiàn)】:
期刊論文
[1]移動(dòng)互聯(lián)網(wǎng)時(shí)代下網(wǎng)絡(luò)詐騙犯罪態(tài)勢(shì)、特征與防控——基于對(duì)866份刑事裁判文書的實(shí)證研究[J]. 汪嘉佩. 犯罪研究. 2017(06)
[2]網(wǎng)絡(luò)信息安全防范和Web數(shù)據(jù)挖掘技術(shù)的有效整合[J]. 吳雷. 網(wǎng)絡(luò)空間安全. 2016(06)
[3]開放式地理實(shí)體關(guān)系抽取的Bootstrapping方法[J]. 余麗,陸鋒,劉希亮. 測(cè)繪學(xué)報(bào). 2016(05)
[4]大數(shù)據(jù)分析的無限深度神經(jīng)網(wǎng)絡(luò)方法[J]. 張蕾,章毅. 計(jì)算機(jī)研究與發(fā)展. 2016(01)
[5]基于多核融合的中文領(lǐng)域?qū)嶓w關(guān)系抽取[J]. 郭劍毅,陳鵬,余正濤,線巖團(tuán),毛存禮,趙君. 中文信息學(xué)報(bào). 2016(01)
[6]無指導(dǎo)的中文開放式實(shí)體關(guān)系抽取[J]. 秦兵,劉安安,劉挺. 計(jì)算機(jī)研究與發(fā)展. 2015(05)
[7]網(wǎng)絡(luò)詐騙案件的特點(diǎn)及偵查路徑[J]. 李堯. 江西警察學(xué)院學(xué)報(bào). 2015(02)
[8]融合領(lǐng)域知識(shí)短語樹核函數(shù)的中文領(lǐng)域?qū)嶓w關(guān)系抽取[J]. 陳鵬,郭劍毅,余正濤,嚴(yán)馨,張志坤,高盛祥. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2015(01)
[9]基于句法語義特征的中文實(shí)體關(guān)系抽取[J]. 郭喜躍,何婷婷,胡小華,陳前軍. 中文信息學(xué)報(bào). 2014(06)
[10]網(wǎng)絡(luò)詐騙犯罪淺析[J]. 呂巖. 中共樂山市委黨校學(xué)報(bào). 2013(01)
博士論文
[1]面向開放領(lǐng)域文本的實(shí)體關(guān)系抽取[D]. 郭喜躍.華中師范大學(xué) 2016
碩士論文
[1]無監(jiān)督中文實(shí)體關(guān)系抽取研究[D]. 施琦.中國地質(zhì)大學(xué)(北京) 2015
[2]基于多核融合的中文領(lǐng)域?qū)嶓w關(guān)系抽取研究[D]. 陳鵬.昆明理工大學(xué) 2014
[3]基于多代理策略的中文實(shí)體關(guān)系抽取[D]. 王敏.大連理工大學(xué) 2011
[4]Web環(huán)境下基于語義模式匹配的實(shí)體關(guān)系提取方法的研究[D]. 周詩詠.東北大學(xué) 2009
[5]基于圖的半監(jiān)督學(xué)習(xí)模型研究與分類器設(shè)計(jì)[D]. 郝建柏.中國科學(xué)技術(shù)大學(xué) 2009
本文編號(hào):3554440
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3554440.html
最近更新
教材專著