天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于法律要素的相似案例推薦關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2022-01-23 12:21
  隨著數(shù)字化存儲(chǔ)的法律案件文本數(shù)量的激增,法務(wù)工作者和普通大眾可以更輕松的對(duì)這些資料進(jìn)行查閱,但從這些文本中檢索到有用的信息也會(huì)耗費(fèi)大量時(shí)間,因此設(shè)計(jì)算法準(zhǔn)確地查找信息非常有意義,相似案例推薦就是其中很重要的一環(huán)。本文提出了一個(gè)基于圖嵌入的無(wú)監(jiān)督法律文本表示算法,該算法結(jié)合了案件文本中包含的法律要素信息和文本的語(yǔ)義信息。首先抽取出每個(gè)案例所包含的法律要素,然后,在每一個(gè)法律要素維度生成一張子圖,節(jié)點(diǎn)為每一個(gè)案件,邊代表兩個(gè)案件包含該要素。進(jìn)一步地,利用圖嵌入算法為每個(gè)案例生成每一個(gè)法律要素維度的向量表示,最后將不同維度的向量表示進(jìn)行匯集,形成一個(gè)單獨(dú)的向量來(lái)表示文本,利用該向量來(lái)計(jì)算任意兩個(gè)案件的相似度。考慮到不同法律要素的重要性程度不同,但法律法規(guī)中沒(méi)有明確的規(guī)定不同要素的重要性,因此,在匯集多個(gè)維度法律要素向量表示的時(shí)候,本文利用判決結(jié)果作為標(biāo)簽訓(xùn)練模型,使得模型能夠?qū)W習(xí)到不同要素之間的權(quán)重信息,利用這些權(quán)重信息得到一個(gè)文本的最終向量表示,進(jìn)而計(jì)算案件的相似度。由于相似案例的認(rèn)定在法律領(lǐng)域沒(méi)有嚴(yán)格的規(guī)定,即沒(méi)有一個(gè)充要條件來(lái)定義兩個(gè)案例的相似性,并且在刑事類案件領(lǐng)域缺乏權(quán)威的相似案例... 

【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:66 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于法律要素的相似案例推薦關(guān)鍵技術(shù)研究


word2vec兩種常用模型

注意力,機(jī)制,計(jì)算公式


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文18下面本文以鍵值對(duì)的查詢?yōu)槔o出注意力機(jī)制的具體定義,其具體過(guò)程如圖2-8所示。給定一個(gè)查詢問(wèn)題Query,以及與之相關(guān)聯(lián)的鍵值對(duì)映射(Key-Value),其中Query,Key和Value都是向量。那么attention值的計(jì)算可以分為三個(gè)步驟。首先計(jì)算每一個(gè)Query與Key的相似程度,此處有三種不同的計(jì)算方式,第一種是點(diǎn)積法,其計(jì)算公式如式2-20所示:(,)=(2-20)其中,(,)表示查詢和第個(gè)關(guān)鍵字的相似程度。第二種是通用法,其計(jì)算公式如式2-21所示:(,)=(2-21)其中,是一個(gè)可以訓(xùn)練的權(quán)重矩陣。還有一種是感知機(jī)法,其計(jì)算公式如式2-22所示:(,)=tanh(+)(2-22)+1212(,)1212*+*+*…………圖2-8注意力機(jī)制歸一化處理

文書,式樣,案例,法律


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文23況。上述兩個(gè)部分的合并是作為尋找相似案例的輸入。值得一提的是,有些判決文書中,由于法院審理查明的案件事實(shí)和公訴機(jī)關(guān)指控的事實(shí)相同,為了書寫簡(jiǎn)單,便不會(huì)再寫明經(jīng)審理查明一段,而是在判決文書中明確表示公訴機(jī)關(guān)的起訴內(nèi)容真實(shí)可靠,予以采納。由于這種情況比較常見(jiàn),在這里本文特意指明,這種情況下,文本在采用數(shù)據(jù)的時(shí)候就會(huì)采集公訴機(jī)關(guān)指控部分的數(shù)據(jù),作為案情描述的部分。3.2法律案件要素分析在考慮兩個(gè)案件是否相似時(shí),實(shí)際上是在考慮兩個(gè)案件中所包含的法律要素是否相似,這些法律要素往往體現(xiàn)在被告人的行為上,是用于判定被告人是否觸犯某些法律法規(guī),以及應(yīng)該判處何種罪名,刑期時(shí)間長(zhǎng)短的關(guān)鍵要素,對(duì)于不同類型的案件,往往有著不同的法律要素需要考慮,即每一種罪名對(duì)應(yīng)著不同的法律要素?紤]到法律領(lǐng)域數(shù)據(jù)集的因素,本文使用的數(shù)據(jù)集全都是我國(guó)的刑事類案件,因此本文主要針對(duì)我國(guó)刑事類案件進(jìn)行建模。在大量閱讀刑事類案件判決文書并請(qǐng)教相應(yīng)領(lǐng)域?qū)<抑,本文分析得出我圖3-2案例判決文書式樣

【參考文獻(xiàn)】:
期刊論文
[1]司法類案的判斷標(biāo)準(zhǔn)及其運(yùn)用[J]. 高尚.  法律科學(xué)(西北政法大學(xué)學(xué)報(bào)). 2020(01)
[2]基于主題模型的法院文本典型案例推薦[J]. 呂賓,侯偉亮.  微電子學(xué)與計(jì)算機(jī). 2018(02)
[3]基于SimHash算法的案件輔助判決系統(tǒng)研究[J]. 李銳,游景揚(yáng),劉穩(wěn),王錦,陳建峽.  湖北工業(yè)大學(xué)學(xué)報(bào). 2017(05)
[4]論類似案件的判斷[J]. 張騏.  中外法學(xué). 2014(02)
[5]一種改進(jìn)的基于向量空間文本相似度算法的研究與實(shí)現(xiàn)[J]. 李連,朱愛(ài)紅,蘇濤.  計(jì)算機(jī)應(yīng)用與軟件. 2012(02)
[6]基于VSM的文本相似度計(jì)算的研究[J]. 郭慶琳,李艷梅,唐琦.  計(jì)算機(jī)應(yīng)用研究. 2008(11)

碩士論文
[1]句子級(jí)和段落級(jí)的語(yǔ)義相似度算法的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王明陽(yáng).北京郵電大學(xué) 2019
[2]面向法律案例檢索的文檔相似度計(jì)算研究[D]. 李蘭君.南京師范大學(xué) 2018
[3]基于深度學(xué)習(xí)的司法智能研究[D]. 鄧文超.哈爾濱工業(yè)大學(xué) 2017
[4]基于自然語(yǔ)義處理的裁判文書推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 向李興.南京大學(xué) 2015



本文編號(hào):3604337

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3604337.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1dd1b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com