基于法理知識的刑事案件輔助量刑技術(shù)研究
發(fā)布時間:2021-01-02 22:23
隨著我國司法量刑領(lǐng)域“案多人少”等復(fù)雜問題的不斷加劇,司法機(jī)關(guān)工作者的工作壓力和負(fù)擔(dān)不斷地增大,為平衡我國日益增長的司法量刑案件規(guī)模與不平衡不充分的司法機(jī)關(guān)人力和司法判決公正之間關(guān)系,文本著重研究司法決策中的輔助量刑問題,結(jié)合人工智能和領(lǐng)域知識對案件進(jìn)行剖析,充分發(fā)揮計算機(jī)科學(xué)與其他學(xué)科相結(jié)合的優(yōu)勢,努力打造透明、公正的司法量刑,對于維護(hù)司法公正,構(gòu)建法治社會具有重要意義。本文從司法量刑領(lǐng)域的數(shù)據(jù)處理入手,分別對裁判文書數(shù)據(jù)集和中國法研杯CAIL2018數(shù)據(jù)集分別進(jìn)行處理,主要包括數(shù)據(jù)集獲取、數(shù)據(jù)清洗、有效信息提取以及文本段落分詞。之后為方便文本數(shù)據(jù)在計算機(jī)系統(tǒng)中的表達(dá),本文采用多個詞向量模型對單詞進(jìn)行分布式向量編碼,并針對本文任務(wù)選取最為合適的詞向量模型及其參數(shù)。鑒于司法判決中案件的刑期判決與法律法規(guī)之間密不可分的關(guān)系,本文提出基于多通道注意力機(jī)制的刑事案件輔助量刑技術(shù)。其采用被告人基本信息、案件事實(shí)描述以及法律法規(guī)三個通道,通過多頭自注意力機(jī)制對其文本進(jìn)行向量化表示,之后通過文檔聚合器將多方信息進(jìn)行融合表示,以被告人基本信息和案件事實(shí)描述查詢該案件所涉及法律法規(guī),從而實(shí)現(xiàn)依據(jù)法律法...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
近年來刑事案件立案數(shù)及一審刑事案件數(shù)趨勢圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文29此兩種數(shù)據(jù)集各有優(yōu)劣?傮w上來講,被告人基本信息參與的司法判定要更加合理、準(zhǔn)確。圖3-4判決文書示例3.2數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理整體過程如圖3-5所示,主要包含有數(shù)據(jù)清洗、信息提取和數(shù)據(jù)分詞。本課題中兩種數(shù)據(jù)集由于其結(jié)構(gòu)不同,因此在預(yù)處理中略有差異。CAIL2018數(shù)據(jù)集中由于其各部分?jǐn)?shù)據(jù)已經(jīng)提取完成,因此只需進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)分詞。而裁判文書數(shù)據(jù)由于其較為雜亂,因此還需要進(jìn)行信息提齲數(shù)據(jù)清洗原始數(shù)據(jù)信息提取數(shù)據(jù)分詞已處理數(shù)據(jù)圖3-5數(shù)據(jù)處理流程
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文63加友好,可信度更高,對于消除司法專業(yè)領(lǐng)域和普通人民群眾之間的專業(yè)知識壁壘效果更好。圖5-4不同模型訓(xùn)練時長對比圖圖5-5FPNN輸出結(jié)果示例5.4本章小結(jié)本章闡述一個基于規(guī)則強(qiáng)化的刑事案件輔助量刑模型,該模型引入層次注意力機(jī)制,采用反饋多任務(wù)聯(lián)合學(xué)習(xí)模式進(jìn)行量刑規(guī)則預(yù)測和刑期預(yù)測兩個任務(wù)的訓(xùn)練學(xué)習(xí)。在得到量刑規(guī)則預(yù)測結(jié)果后,將其反饋至刑期預(yù)測任務(wù)的學(xué)習(xí)中,從而進(jìn)行刑期預(yù)測。通過實(shí)驗(yàn)對比可知,該模型在量刑規(guī)則預(yù)測和刑期預(yù)測任務(wù)上均取得較好的成績,量刑規(guī)則預(yù)測Macro-F1-Score指標(biāo)達(dá)到75.92%,刑期預(yù)測MAE指標(biāo)達(dá)到4.21,同時該模型擁有較短的訓(xùn)練時長和更加有依據(jù)的輸出結(jié)果,在實(shí)際工程系統(tǒng)中具有更大的優(yōu)勢。0500010000150002000025000Fact_Law_Info_NNFPNNLSTMBiLSTM訓(xùn)練時長(秒)模型不同模型訓(xùn)練時長對比
本文編號:2953753
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
近年來刑事案件立案數(shù)及一審刑事案件數(shù)趨勢圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文29此兩種數(shù)據(jù)集各有優(yōu)劣?傮w上來講,被告人基本信息參與的司法判定要更加合理、準(zhǔn)確。圖3-4判決文書示例3.2數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理整體過程如圖3-5所示,主要包含有數(shù)據(jù)清洗、信息提取和數(shù)據(jù)分詞。本課題中兩種數(shù)據(jù)集由于其結(jié)構(gòu)不同,因此在預(yù)處理中略有差異。CAIL2018數(shù)據(jù)集中由于其各部分?jǐn)?shù)據(jù)已經(jīng)提取完成,因此只需進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)分詞。而裁判文書數(shù)據(jù)由于其較為雜亂,因此還需要進(jìn)行信息提齲數(shù)據(jù)清洗原始數(shù)據(jù)信息提取數(shù)據(jù)分詞已處理數(shù)據(jù)圖3-5數(shù)據(jù)處理流程
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文63加友好,可信度更高,對于消除司法專業(yè)領(lǐng)域和普通人民群眾之間的專業(yè)知識壁壘效果更好。圖5-4不同模型訓(xùn)練時長對比圖圖5-5FPNN輸出結(jié)果示例5.4本章小結(jié)本章闡述一個基于規(guī)則強(qiáng)化的刑事案件輔助量刑模型,該模型引入層次注意力機(jī)制,采用反饋多任務(wù)聯(lián)合學(xué)習(xí)模式進(jìn)行量刑規(guī)則預(yù)測和刑期預(yù)測兩個任務(wù)的訓(xùn)練學(xué)習(xí)。在得到量刑規(guī)則預(yù)測結(jié)果后,將其反饋至刑期預(yù)測任務(wù)的學(xué)習(xí)中,從而進(jìn)行刑期預(yù)測。通過實(shí)驗(yàn)對比可知,該模型在量刑規(guī)則預(yù)測和刑期預(yù)測任務(wù)上均取得較好的成績,量刑規(guī)則預(yù)測Macro-F1-Score指標(biāo)達(dá)到75.92%,刑期預(yù)測MAE指標(biāo)達(dá)到4.21,同時該模型擁有較短的訓(xùn)練時長和更加有依據(jù)的輸出結(jié)果,在實(shí)際工程系統(tǒng)中具有更大的優(yōu)勢。0500010000150002000025000Fact_Law_Info_NNFPNNLSTMBiLSTM訓(xùn)練時長(秒)模型不同模型訓(xùn)練時長對比
本文編號:2953753
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2953753.html
最近更新
教材專著