Siamese-CNN算法研究及其在法院裁判預(yù)測(cè)中的應(yīng)用
發(fā)布時(shí)間:2020-06-21 00:20
【摘要】:法律領(lǐng)域中,當(dāng)事人想及時(shí)的了解有關(guān)案件的結(jié)果或者賠償金額,需要大量學(xué)習(xí)法律的相關(guān)知識(shí)。同時(shí),對(duì)于律師來講,日益增加的法律文書給律師學(xué)習(xí)和總結(jié)歷史案件帶來困難。因此對(duì)裁判文書進(jìn)行分析,可以更好的深入到法律領(lǐng)域,幫助律師和當(dāng)事人更好的進(jìn)行決策,有著重要的意義和價(jià)值。目前對(duì)于裁判文書的研究主要是基于數(shù)學(xué)統(tǒng)計(jì)的方法,但是數(shù)以萬計(jì)的裁判文書導(dǎo)致統(tǒng)計(jì)分析的效率較為低下。在本文中,使用多核的CNN模型以故意殺人案由和繼承案由為切入點(diǎn),對(duì)案件的判決結(jié)果區(qū)間進(jìn)行預(yù)測(cè),從而達(dá)到為律師或者當(dāng)事人提供借鑒的目的。實(shí)驗(yàn)結(jié)果表示,針對(duì)故意殺人案由,多核CNN的實(shí)驗(yàn)結(jié)果相較于傳統(tǒng)的機(jī)器學(xué)習(xí)模型有較好的實(shí)驗(yàn)結(jié)果,準(zhǔn)確率達(dá)到87.3%,但是在繼承案由上實(shí)驗(yàn)結(jié)果僅達(dá)到52.1%。在此基礎(chǔ)上,本文分析了故意殺人案由與繼承案由樣在樣本集中的差異,發(fā)現(xiàn)繼承案由的樣本分布十分不均勻同時(shí)樣本數(shù)量過小,根據(jù)這一特征,本文提出一種基于Siamese網(wǎng)絡(luò)和多核CNN模型相結(jié)合的案件判決區(qū)間預(yù)測(cè)模型Siamese-CNN,并從樣本組織,模型搭建,損失函數(shù)定義,性能驗(yàn)證等方面對(duì)該模型進(jìn)行設(shè)計(jì)研究。本文最后通過實(shí)際實(shí)驗(yàn)對(duì)Siamese-CNN模型進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果證明,SiameseCNN模型在故意殺人案由中的準(zhǔn)確率達(dá)到88.6%,在繼承案由上的準(zhǔn)確率達(dá)到79.8%。說明該算法不僅有較高的分類正確率,而且Siamese網(wǎng)絡(luò)和多核卷積的方法提升了模型的泛化能力和預(yù)測(cè)性能。同時(shí),本文使用標(biāo)準(zhǔn)文本分類數(shù)據(jù)集分別在Siamese-CNN模型下進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明該算法可以在樣本數(shù)量較少且樣本分布不均的情況下取得很好的分類效果。
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:D926.2
本文編號(hào):2723189
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:D926.2
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 徐徽;馬占軍;;廣東省1999~2014年醫(yī)療糾紛訴訟裁判文書分析[J];中國(guó)醫(yī)藥導(dǎo)報(bào);2015年35期
2 黃啟輝;;行政訴訟一審審判狀況研究——基于對(duì)40家法院2767份裁判文書的統(tǒng)計(jì)分析[J];清華法學(xué);2013年04期
3 崔建明;劉建明;廖周宇;;基于SVM算法的文本分類技術(shù)研究[J];計(jì)算機(jī)仿真;2013年02期
4 陳英;馬仲兵;黃敏;;優(yōu)化的C4.5決策樹算法[J];軟件;2013年02期
5 滿桂云;林家駿;;ID3決策樹算法的改進(jìn)研究[J];中國(guó)科技信息;2007年13期
相關(guān)碩士學(xué)位論文 前1條
1 蔡慧蘋;基于卷積神經(jīng)網(wǎng)絡(luò)的短文本分類方法研究[D];西南大學(xué);2016年
本文編號(hào):2723189
本文鏈接:http://sikaile.net/falvlunwen/gongjianfalunwen/2723189.html
最近更新
教材專著