互聯(lián)網(wǎng)大數(shù)據(jù)環(huán)境下的犯罪度理論的研究
本文關(guān)鍵詞:互聯(lián)網(wǎng)大數(shù)據(jù)環(huán)境下的犯罪度理論的研究
更多相關(guān)文章: 犯罪度 犯罪預(yù)警 樸素貝葉斯 文本分類
【摘要】:隨著智能化安防系統(tǒng)的快速發(fā)展,犯罪案件偵破效率得到很大提高。所謂的智能化安防系統(tǒng)指的是報(bào)警系統(tǒng)、門禁系統(tǒng)以及城市監(jiān)控系統(tǒng)。特別是監(jiān)控系統(tǒng)已經(jīng)在犯罪預(yù)防與偵破中起到了不可或缺的作用,但是傳統(tǒng)的安防技術(shù)仍然存在明顯的不足,即無法在犯罪事件發(fā)生之前給出預(yù)警,如果我們的犯罪分析系統(tǒng)能對(duì)犯罪做出預(yù)測以達(dá)到阻止犯罪事件發(fā)生的目的,那么該系統(tǒng)將具有重要的價(jià)值。因此,對(duì)犯罪預(yù)警理論的研究具有極其重要的價(jià)值。本研究提出犯罪度的概念,從中抽取網(wǎng)絡(luò)言論犯罪度理論進(jìn)行研究,網(wǎng)絡(luò)言論犯罪度指某網(wǎng)絡(luò)ID通過其網(wǎng)絡(luò)言論表現(xiàn)出的犯罪可能性大小。對(duì)犯罪心理與言論特征之間關(guān)系的研究,提出了一種基于犯罪心理學(xué)與自然語言處理技術(shù)的網(wǎng)絡(luò)言論犯罪度理論。該理論運(yùn)用機(jī)器學(xué)習(xí)、詞典等文本分析方法,并結(jié)合犯罪心理學(xué),基于矩陣運(yùn)算建立起網(wǎng)絡(luò)言論犯罪度理論框架與數(shù)學(xué)模型,從海量數(shù)據(jù)角度構(gòu)建了可行性系統(tǒng),從大數(shù)據(jù)運(yùn)算角度對(duì)系統(tǒng)進(jìn)行了巧妙設(shè)計(jì)與優(yōu)化。在模型構(gòu)建方面,本文一則結(jié)合了犯罪心理學(xué)將犯罪過程剝離,以下稱之為犯罪度三因素:(1)需求因素:言論文本有需求得不到滿足的語義;(2)情緒因素:言論文本表達(dá)的情緒極性為消極,且消極情緒有累積傾向;(3)準(zhǔn)備因素:言論文本有犯罪人為犯罪做準(zhǔn)備的語義;通過三因素的定義使犯罪可能性可以用數(shù)學(xué)方式表達(dá)。二則充分考慮了大數(shù)據(jù)計(jì)算的實(shí)際需求,構(gòu)建犯罪度向量,通過矩陣的方式構(gòu)建犯罪度數(shù)學(xué)模型,充分利用分布式系統(tǒng)特點(diǎn)提高計(jì)算效率。在文本分類方面,本文結(jié)合了機(jī)器學(xué)習(xí)和詞典的方法進(jìn)行了文本分類,本文將文本情感分類方法運(yùn)用到犯罪度三因素判斷上,得到了很好的效果。本文在需求因素與情緒因素的判別上分別運(yùn)用了樸素貝葉斯,情感詞典的方法。在準(zhǔn)備因素判別上本文構(gòu)建了犯罪敏感詞詞典,并結(jié)合了機(jī)器學(xué)習(xí)與詞典的方法進(jìn)行雙重判別,大大提高了判別準(zhǔn)確度。
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:D917;TP311.13
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 陳敏,湯曉安;在Microsoft Access中引入文本文件[J];微型電腦應(yīng)用;1995年02期
2 李盛瑜;何文;;一種對(duì)聊天文本進(jìn)行特征選取的方法研究[J];計(jì)算機(jī)科學(xué);2007年05期
3 蔣志方;祝翠玲;吳強(qiáng);;一個(gè)對(duì)不帶類別標(biāo)記文本進(jìn)行分類的方法[J];計(jì)算機(jī)工程;2007年12期
4 趙鋼;;從復(fù)雜文本中導(dǎo)入數(shù)據(jù)的方法[J];中國審計(jì);2007年18期
5 易樹鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計(jì)算機(jī)科學(xué);2002年08期
6 李建中,楊艷,張艷秋;并行文本管理原型系統(tǒng)PDoc的功能與總體框架[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2004年09期
7 覃曉;元昌安;彭昱忠;丁超;;基于基因表達(dá)式編程的Web文本分類研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2009年03期
8 諶志群;;文本趨勢挖掘綜述[J];情報(bào)科學(xué);2010年02期
9 王亞民;劉洋;;含附件文本的分類算法研究[J];情報(bào)雜志;2012年08期
10 江偉;潘昊;;基于優(yōu)化的多核學(xué)習(xí)方法的Web文本分類的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年10期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 許君;王朝坤;劉立超;王建民;劉璋;;云環(huán)境中的近似復(fù)制文本檢測[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
2 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1997年
3 胡蓉;唐常杰;陳敏敏;欒江;;關(guān)聯(lián)規(guī)則制導(dǎo)的遺傳算法在文本分類中的應(yīng)用[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
4 李文波;孫樂;黃瑞紅;馮元勇;張大鯤;;基于Labeled-LDA模型的文本分類新算法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
5 黃云平;孫樂;李文波;;基于上下文圖模型文本表示的文本分類研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
6 蔣勇;陳曉靜;;一種多方向手寫文本行提取方法[A];第二十七屆中國控制會(huì)議論文集[C];2008年
7 李瑞;王朝坤;鄭偉;王建民;王偉平;;基于MapReduce框架的近似復(fù)制文本檢測[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
8 胡俊;黃厚寬;;一種基于SVM的可視化文本分類的方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
9 勞錦明;韋崗;;文本壓縮技術(shù)研究的新進(jìn)展[A];開創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國青年通信學(xué)術(shù)會(huì)議論文集[C];2001年
10 江荻;;藏語文本信息處理的歷程與進(jìn)展[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
中國重要報(bào)紙全文數(shù)據(jù)庫 前1條
1 戴洪玲;向Excel中快速輸入相同文本[N];中國電腦教育報(bào);2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 宋歌;基于聚類森林的文本流分類方法研究[D];哈爾濱工業(yè)大學(xué);2014年
2 韓開旭;基于支持向量機(jī)的文本情感分析研究[D];東北石油大學(xué);2014年
3 鄭立洲;短文本信息抽取若干技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2016年
4 韓磊;漢語句義結(jié)構(gòu)模型分析及其文本表示方法研究[D];北京理工大學(xué);2016年
5 劉林;面向論壇文本的大學(xué)生情緒識(shí)別研究[D];華中師范大學(xué);2016年
6 張博宇;基于局部特征的場景文本分析方法研究[D];哈爾濱工業(yè)大學(xué);2015年
7 胡明涵;面向領(lǐng)域的文本分類與挖掘關(guān)鍵技術(shù)研究[D];東北大學(xué) ;2009年
8 孫曉華;基于聚類的文本機(jī)會(huì)發(fā)現(xiàn)關(guān)鍵問題研究[D];哈爾濱工程大學(xué);2010年
9 尚文倩;文本分類及其相關(guān)技術(shù)研究[D];北京交通大學(xué);2007年
10 霍躍紅;典籍英譯譯者文體分析與文本的譯者識(shí)別[D];大連理工大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王軼霞;基于半監(jiān)督遞歸自編碼的情感分類研究[D];內(nèi)蒙古大學(xué);2015年
2 金傳鑫;氣象文本分類特征選擇方法及其在MapReduce上的實(shí)現(xiàn)[D];南京信息工程大學(xué);2015年
3 李少卿;不良文本及其變體信息的檢測過濾技術(shù)研究[D];復(fù)旦大學(xué);2014年
4 董秦濤;基于文本的個(gè)人情感狀態(tài)分析研究[D];蘭州大學(xué);2015年
5 鐘文波;搜索引擎中關(guān)鍵詞分類方法評(píng)估及推薦應(yīng)用[D];華南理工大學(xué);2015年
6 黃晨;基于新詞識(shí)別和時(shí)間跨度的微博熱點(diǎn)研究[D];上海交通大學(xué);2015年
7 陳紅陽;中文微博話題發(fā)現(xiàn)技術(shù)研究[D];重慶理工大學(xué);2015年
8 王s,
本文編號(hào):1300567
本文鏈接:http://sikaile.net/shoufeilunwen/shuoshibiyelunwen/1300567.html