天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向司法判決書(shū)案情的主題事件抽取研究

發(fā)布時(shí)間:2021-09-19 01:08
  在司法公開(kāi)的背景下,互聯(lián)網(wǎng)上發(fā)布了海量真實(shí)有效的司法判決書(shū)。司法判決書(shū)案情是對(duì)案件細(xì)節(jié)的描述,富含豐富的行業(yè)知識(shí)和專業(yè)智慧。然而,司法判決書(shū)的數(shù)量龐大,內(nèi)容冗長(zhǎng)、多樣且非結(jié)構(gòu)等特征,導(dǎo)致其數(shù)據(jù)價(jià)值密度低下,難以有效支持決策。司法判決書(shū)的結(jié)構(gòu)化處理是后續(xù)分析的重要基礎(chǔ),面向司法判決書(shū)案情的主題事件抽取任務(wù)開(kāi)展研究具有重要的理論價(jià)值和較好的應(yīng)用前景。本文主要研究工作如下:(1)提出一種觸發(fā)詞與屬性值對(duì)的聯(lián)合抽取方法。該方法首先利用基于熵的特征排序構(gòu)建觸發(fā)詞表。然后基于條件隨機(jī)場(chǎng),訓(xùn)練觸發(fā)詞識(shí)別模型,用于確定二元語(yǔ)義屬性的取值;訓(xùn)練觸發(fā)詞、屬性和屬性值的聯(lián)合標(biāo)記模型,用于識(shí)別字符串屬性及其取值。實(shí)驗(yàn)結(jié)果顯示,與傳統(tǒng)方法相比,所提出的方法能夠抽取二元語(yǔ)義屬性值對(duì),并且對(duì)字符串屬性值對(duì)的抽取準(zhǔn)確率、召回率和F值均有提高,同時(shí)抽取所用平均時(shí)間明顯降低。(2)由于訓(xùn)練條件隨機(jī)場(chǎng)模型需要大量的標(biāo)記語(yǔ)料,司法判決書(shū)的標(biāo)記語(yǔ)料少且依賴人工標(biāo)注。為了減少人工標(biāo)注的工作,通過(guò)利用未標(biāo)記語(yǔ)料,我們提出一種基于tri-training和CRF的元事件抽取方法。實(shí)驗(yàn)結(jié)果顯示:該方法能夠降低訓(xùn)練模型所需標(biāo)記語(yǔ)料的數(shù)量... 

【文章來(lái)源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:63 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向司法判決書(shū)案情的主題事件抽取研究


司法判決書(shū)案情信息結(jié)構(gòu)化處理系統(tǒng)框架圖

界面圖,系統(tǒng)運(yùn)行,界面,司法判決


系統(tǒng)的主要操作流程如下:a. 當(dāng)用戶要對(duì)一篇司法判決書(shū)的案情主題進(jìn)行內(nèi)容抽取時(shí),首先點(diǎn)擊圖中的“選擇文件”按鈕,選中并上傳所需要處理的司法判決書(shū)(txt 格式),最多可上傳10 個(gè);b. 待文件上傳后,點(diǎn)擊“開(kāi)始處理”按鈕,對(duì)司法判決書(shū)案情部分的抽取結(jié)果就會(huì)顯現(xiàn)在右邊文本框中。表 5. 1 開(kāi)發(fā)工具表Tab 5.1 Devlopment tools軟件/工具包 版本 說(shuō)明JDK 1.8 JDK 是 Java 的核心,包括 java 的基礎(chǔ)類庫(kù)和 java 工具Eclipse 4.6.3 一個(gè)集成開(kāi)發(fā)環(huán)境mySql 5.6 一個(gè)關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)ltp4j 3.3.2 ltp 工具的 java 實(shí)現(xiàn)包,可以用于文本的預(yù)處理

【參考文獻(xiàn)】:
期刊論文
[1]基于分歧的半監(jiān)督學(xué)習(xí)[J]. 周志華.  自動(dòng)化學(xué)報(bào). 2013(11)
[2]審判案例自動(dòng)抽取與標(biāo)注模型研究[J]. 佘貴清,張永安.  現(xiàn)代圖書(shū)情報(bào)技術(shù). 2013(06)
[3]事件抽取技術(shù)研究綜述[J]. 高強(qiáng),游宏梁.  情報(bào)理論與實(shí)踐. 2013(04)
[4]基于依存分析的事件識(shí)別[J]. 付劍鋒,劉宗田,付雪峰,周文,仲兆滿.  計(jì)算機(jī)科學(xué). 2009(11)
[5]中文事件抽取技術(shù)研究[J]. 趙妍妍,秦兵,車萬(wàn)翔,劉挺.  中文信息學(xué)報(bào). 2008(01)

碩士論文
[1]基于主題的中文事件抽取技術(shù)研究及應(yīng)用[D]. 吳剛.蘇州大學(xué) 2009



本文編號(hào):3400699

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3400699.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a5484***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com