法院裁判文書當中的數(shù)據(jù)自動抽取及其可視化分析推演
發(fā)布時間:2021-12-29 12:11
科技部聯(lián)合公安部設(shè)立《公共安全風(fēng)險防控與應(yīng)急技術(shù)裝備》重大專項,旨在通過計算機相關(guān)技術(shù)輔助辦案人員提高辦案效率,實現(xiàn)對于職務(wù)犯罪態(tài)勢的研判,以加大對于重點高發(fā)領(lǐng)域的防治,降低職務(wù)犯罪的發(fā)生率。本研究內(nèi)容即屬于該科技部“公共安全”重大專項《多模態(tài)反腐案例特征發(fā)現(xiàn)與腐敗案件發(fā)展態(tài)勢預(yù)判》課題。主要研究內(nèi)容為如何自動收集互聯(lián)網(wǎng)公開的判決文書,并利用自然語言處理技術(shù)對于判決文書27類關(guān)鍵信息實現(xiàn)抽取,最后設(shè)計完成對職務(wù)犯罪案件的態(tài)勢分析研判和對個案的模擬推演的WEB系統(tǒng)。截止2019年3月,通過互聯(lián)網(wǎng)公開的判決文書有超過7 000萬份,其中關(guān)于職務(wù)犯罪類別的判決文書有七萬多份。所以首先我們采用了爬蟲技術(shù)獲取公開的判決文書以作為最初的文書數(shù)據(jù)。之后通過人工構(gòu)建基于規(guī)則信息抽取算法、命名實體識別等多種自然語言處理算法實現(xiàn)對于多種類別的信息實現(xiàn)準確抽取,并存入數(shù)據(jù)庫。在此基礎(chǔ)上設(shè)計開發(fā)WEB端的判決文書數(shù)據(jù)分析及其態(tài)勢研判推演可視化系統(tǒng)。并結(jié)合相關(guān)系統(tǒng)測試技術(shù)實現(xiàn)對于系統(tǒng)的設(shè)計優(yōu)化,以驗證達到課題的任務(wù)需求。
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
被告人判決時年齡分布圖
職務(wù)犯罪案由分析
貪污罪逐年變化趨勢
【參考文獻】:
期刊論文
[1]全面從嚴治黨的理念初探[J]. 何悅,楊露莎. 改革與開放. 2019(01)
[2]新時代反腐敗斗爭語境下的利益集團問題研究[J]. 王塵子. 北京行政學(xué)院學(xué)報. 2018(06)
[3]貪賄犯罪量刑公正難題之破解——基于100例貪污受賄案件刑事判決文書的實證分析[J]. 張兆松,余水星. 浙江工業(yè)大學(xué)學(xué)報(社會科學(xué)版). 2018(03)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的中文人物關(guān)系抽取方法[J]. 司文豪,賈雷萍,戚銀城. 計算機與現(xiàn)代化. 2018(09)
[5]中文實體關(guān)系抽取研究綜述[J]. 武文雅,陳鈺楓,徐金安,張玉潔. 計算機與現(xiàn)代化. 2018(08)
[6]人工智能偵查的實踐應(yīng)用與制度構(gòu)建[J]. 任惠華,金浩波. 河北法學(xué). 2018(06)
[7]基于注意力長短時記憶網(wǎng)絡(luò)的中文詞性標注模型[J]. 司念文,王衡軍,李偉,單義棟,謝鵬程. 計算機科學(xué). 2018(04)
[8]兩種黑盒測試方法的比較分析[J]. 張新,焦豪. 電子技術(shù)與軟件工程. 2018(07)
[9]命名實體識別研究綜述[J]. 劉瀏,王東波. 情報學(xué)報. 2018(03)
[10]法院判決書關(guān)鍵信息抽取系統(tǒng)設(shè)計與實現(xiàn)[J]. 劉穩(wěn),王錦,李銳,游景揚,陳建峽. 湖北工業(yè)大學(xué)學(xué)報. 2018(01)
博士論文
[1]自由文本的信息抽取模式獲取的研究[D]. 姜吉發(fā).中國科學(xué)院研究生院(計算技術(shù)研究所) 2004
碩士論文
[1]行政判決書上網(wǎng)公開制度研究[D]. 對先別克·乎旦.電子科技大學(xué) 2016
[2]基于GATE的司法案件信息抽取方法研究[D]. 宋傳寶.天津大學(xué) 2016
本文編號:3556102
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
被告人判決時年齡分布圖
職務(wù)犯罪案由分析
貪污罪逐年變化趨勢
【參考文獻】:
期刊論文
[1]全面從嚴治黨的理念初探[J]. 何悅,楊露莎. 改革與開放. 2019(01)
[2]新時代反腐敗斗爭語境下的利益集團問題研究[J]. 王塵子. 北京行政學(xué)院學(xué)報. 2018(06)
[3]貪賄犯罪量刑公正難題之破解——基于100例貪污受賄案件刑事判決文書的實證分析[J]. 張兆松,余水星. 浙江工業(yè)大學(xué)學(xué)報(社會科學(xué)版). 2018(03)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的中文人物關(guān)系抽取方法[J]. 司文豪,賈雷萍,戚銀城. 計算機與現(xiàn)代化. 2018(09)
[5]中文實體關(guān)系抽取研究綜述[J]. 武文雅,陳鈺楓,徐金安,張玉潔. 計算機與現(xiàn)代化. 2018(08)
[6]人工智能偵查的實踐應(yīng)用與制度構(gòu)建[J]. 任惠華,金浩波. 河北法學(xué). 2018(06)
[7]基于注意力長短時記憶網(wǎng)絡(luò)的中文詞性標注模型[J]. 司念文,王衡軍,李偉,單義棟,謝鵬程. 計算機科學(xué). 2018(04)
[8]兩種黑盒測試方法的比較分析[J]. 張新,焦豪. 電子技術(shù)與軟件工程. 2018(07)
[9]命名實體識別研究綜述[J]. 劉瀏,王東波. 情報學(xué)報. 2018(03)
[10]法院判決書關(guān)鍵信息抽取系統(tǒng)設(shè)計與實現(xiàn)[J]. 劉穩(wěn),王錦,李銳,游景揚,陳建峽. 湖北工業(yè)大學(xué)學(xué)報. 2018(01)
博士論文
[1]自由文本的信息抽取模式獲取的研究[D]. 姜吉發(fā).中國科學(xué)院研究生院(計算技術(shù)研究所) 2004
碩士論文
[1]行政判決書上網(wǎng)公開制度研究[D]. 對先別克·乎旦.電子科技大學(xué) 2016
[2]基于GATE的司法案件信息抽取方法研究[D]. 宋傳寶.天津大學(xué) 2016
本文編號:3556102
本文鏈接:http://sikaile.net/falvlunwen/gongjianfalunwen/3556102.html