天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于GATE的司法案件信息抽取方法研究

發(fā)布時間:2019-05-03 18:00
【摘要】:隨著我國司法數(shù)據(jù)公開的推進(jìn),越來越多的司法案件判決信息以網(wǎng)頁的形式發(fā)布出來供公眾查詢使用。截止2015年3月,全國各級法院公開的案件判決信息已達(dá)700萬份以上。如果在商業(yè)應(yīng)用上利用這些公開的案件裁判文書信息,就需要對案件的各個核心字段進(jìn)行結(jié)構(gòu)化處理,這通常由人工操作來完成。面對如此龐大的案件信息數(shù)量,人工處理方式顯然在效率上顯得非常低下。如何運(yùn)用信息技術(shù)簡化這一過程便成為當(dāng)下急待解決的問題。針對這一研究背景,本文提出了基于GATE的司法案件信息抽取方法研究,即采用基于JAPE規(guī)則的信息抽取技術(shù),以GATE系統(tǒng)作為論文研究的技術(shù)基礎(chǔ)和開發(fā)平臺。論文首先針對與研究命題相關(guān)的國內(nèi)外研究現(xiàn)狀進(jìn)行研究;接著對相關(guān)基礎(chǔ)理論進(jìn)行概述,包括GATE系統(tǒng)介紹、JAPE規(guī)則基本語法、執(zhí)行原理和應(yīng)用情況的介紹。然后,基于GATE系統(tǒng)提供的平臺組件設(shè)計(jì),重點(diǎn)研究了基于GATE的司法案件信息抽取方法,包括信息的預(yù)處理過程結(jié)束,各案件信息字段的JAPE規(guī)則抽取方法介紹,結(jié)果的組織輸出等。最后,將論文所研究的信息抽取方法應(yīng)用于實(shí)際批量的裁判文書數(shù)據(jù),語料評測結(jié)果顯示,該方法的抽取準(zhǔn)確率可以達(dá)到94%以上,召回率可以達(dá)到86%以上,整體性能F值可以達(dá)到92%以上,證明該方法的科學(xué)性和有效性。
[Abstract]:With the promotion of judicial data disclosure in China, more and more judicial case decision information is published in the form of web pages for public inquiry. As of March 2015, the national courts at all levels of the case judgment information has reached more than 7 million. If we make use of the information of the public case adjudication documents in commercial applications, we need to deal with the core fields of the case structurally, which is usually accomplished by manual operation. In the face of such a large amount of case information, manual processing is obviously very inefficient. How to use information technology to simplify this process has become an urgent problem to be solved. In view of this research background, this paper proposes a method of judicial case information extraction based on GATE, that is, adopting information extraction technology based on JAPE rules and taking GATE system as the technical basis and development platform of this paper. Firstly, this paper studies the domestic and foreign research situation related to the research proposition, and then summarizes the related basic theories, including the introduction of GATE system, the basic grammar of JAPE rules, the principle of execution and the application. Then, based on the platform component design provided by GATE system, this paper focuses on the method of judicial case information extraction based on GATE, including the end of the pre-processing process of information, and the introduction of JAPE rule extraction method of each case information field. Organizational output of the result, etc. Finally, the information extraction method studied in this paper is applied to the actual batch of adjudication document data. The results of corpus evaluation show that the extraction accuracy and recall rate of this method can reach over 94% and 86% respectively, and the result of corpus evaluation shows that the extraction accuracy and recall rate of this method can reach 94% and 86% respectively. The overall performance F value can be more than 92%, which proves that the method is scientific and effective.
【學(xué)位授予單位】:天津大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 鄧箴;包宏;;改進(jìn)的關(guān)鍵詞抽取方法研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年20期

2 石楨;姚天f ;;一種基于統(tǒng)計(jì)和規(guī)則的核心地名抽取方法[J];微型電腦應(yīng)用;2013年02期

3 張世輝;一種新的基于距離的漢字筆畫抽取方法[J];計(jì)算機(jī)工程;2003年14期

4 王大亮;涂序彥;鄭雪峰;佟子健;;多策略融合的搭配抽取方法[J];清華大學(xué)學(xué)報(自然科學(xué)版);2008年04期

5 楊建明;;關(guān)系抽取方法研究[J];電子技術(shù);2009年04期

6 孫繼鵬;賈民;劉增寶;;一種面向文本的概念抽取方法的研究[J];計(jì)算機(jī)應(yīng)用與軟件;2009年09期

7 鄭偉;呂建新;張建偉;;文本分類中特征預(yù)抽取方法研究[J];情報科學(xué);2011年01期

8 肖明軍,張巍,鄒翔,蔡慶生;一種多策略聯(lián)合信息抽取方法[J];小型微型計(jì)算機(jī)系統(tǒng);2005年04期

9 郝博一;夏云慶;鄔曉鈞;鄭方;劉軼;;基于泛化和繁殖的自舉式意見目標(biāo)抽取方法[J];清華大學(xué)學(xué)報(自然科學(xué)版);2009年S1期

10 栗春亮;朱艷輝;徐葉強(qiáng);;中文產(chǎn)品評論中屬性詞抽取方法研究[J];計(jì)算機(jī)工程;2011年12期

相關(guān)會議論文 前10條

1 宋濤;李素建;;基于流形排序的領(lǐng)域詞抽取方法[A];第五屆全國青年計(jì)算語言學(xué)研討會論文集[C];2010年

2 卞真旭;;一種關(guān)鍵詞抽取方法研究[A];2011年安徽省智能電網(wǎng)技術(shù)論壇論文集[C];2011年

3 羅斐;毛宇光;;基于領(lǐng)域分類的查詢接口模式抽取方法[A];2009年研究生學(xué)術(shù)交流會通信與信息技術(shù)論文集[C];2009年

4 栗春亮;朱艷輝;徐葉強(qiáng);;中文產(chǎn)品評論中屬性詞抽取方法研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年

5 劉昊;王健;林鴻飛;;一種模板與圖核融合的蛋白質(zhì)關(guān)系抽取方法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年

6 翁偉;王厚峰;;基于LDA的關(guān)鍵詞抽取方法[A];第五屆全國青年計(jì)算語言學(xué)研討會論文集[C];2010年

7 何莉;林鴻飛;;一種面向WEB的生物醫(yī)學(xué)領(lǐng)域英漢術(shù)語翻譯對抽取方法[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

8 左云存;宗成慶;;基于HMM的短語翻譯對抽取方法[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

9 王裴巖;張桂平;白宇;;一種基于核函數(shù)的技術(shù)關(guān)鍵詞連接關(guān)系抽取方法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年

10 蒲宇達(dá);關(guān)毅;王強(qiáng);;基于數(shù)據(jù)挖掘思想的網(wǎng)頁正文抽取方法的研究[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年

相關(guān)重要報紙文章 前10條

1 張洞若;正確把握司法案件報道的度[N];甘肅日報;2001年

2 方工;科學(xué)施策,,讓每一個司法案件都實(shí)現(xiàn)公正[N];檢察日報;2013年

3 最高人民法院 周穎佳;在每一個司法案件中彰顯公平正義[N];人民法院報;2013年

4 本報記者 林曄晗 本報通訊員 馬遠(yuǎn)斌 雷江輝 熊春生;在每個司法案件中追求公正[N];人民法院報;2013年

5 法治報記者 胡蝶飛;讓每一起司法案件都感受到公平正義[N];上海法治報;2013年

6 河南省開封市中級人民法院院長 詹玉鋒;努力實(shí)現(xiàn)司法案件之公平正義[N];人民法院報;2013年

7 ;讓群眾在每個司法案件中感受公平正義[N];貴州日報;2014年

8 記者 陳菲 羅沙;讓每個司法案件都體現(xiàn)公平正義[N];新華每日電訊;2014年

9 市第一中級人民法院黨組書記 院長 劉金波;努力讓人民群眾在每一個司法案件中都能感受到公平正義[N];天津政法報;2013年

10 通訊員 李光華;廣東先行探討酒類刑事司法案件移送工作[N];華夏酒報;2011年

相關(guān)博士學(xué)位論文 前2條

1 劉勝宇;生物醫(yī)學(xué)文本中藥物信息抽取方法研究[D];哈爾濱工業(yè)大學(xué);2016年

2 李傳席;基于本體的自適應(yīng)Web信息抽取方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 宋傳寶;基于GATE的司法案件信息抽取方法研究[D];天津大學(xué);2016年

2 陳倩;基于特征模型的跨領(lǐng)域信息抽取方法研究[D];上海大學(xué);2015年

3 劉驍;基于產(chǎn)品評論的意見抽取方法研究[D];黑龍江大學(xué);2015年

4 洪軍建;面向社會網(wǎng)絡(luò)應(yīng)用的人物關(guān)系抽取方法研究[D];西藏大學(xué);2016年

5 梅莉莉;基于領(lǐng)域特殊性和統(tǒng)計(jì)語言知識的新詞抽取方法[D];北京理工大學(xué);2016年

6 陳亞東;面向數(shù)據(jù)稀疏問題的英文事件抽取研究[D];蘇州大學(xué);2016年

7 朱珠;基于雙語的事件抽取方法研究[D];蘇州大學(xué);2016年

8 余偉;基于領(lǐng)域知識的Web信息抽取方法研究[D];安徽工程大學(xué);2016年

9 陳茂榕;領(lǐng)域依賴的Web信息抽取系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];東南大學(xué);2016年

10 劉征;作者資訊中的有用文本信息抽取方法研究[D];東北師范大學(xué);2016年



本文編號:2469126

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2469126.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f6dec***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com