面向法律案例模擬系統(tǒng)評(píng)價(jià)的句子匹配實(shí)現(xiàn)方法研究
發(fā)布時(shí)間:2022-01-09 10:14
人工智能技術(shù)的進(jìn)步、司法數(shù)據(jù)的公開給法律行業(yè)帶來的影響至寬至遠(yuǎn)。借助自然語言處理技術(shù),建立專業(yè)領(lǐng)域知識(shí)庫(kù),輔助教師針對(duì)學(xué)生的自動(dòng)評(píng)測(cè)是智能教學(xué)的趨勢(shì)之一。法律案例模擬系統(tǒng)包含大量法律案例,充分依托互聯(lián)網(wǎng)技術(shù),模擬真實(shí)的訴訟流程,實(shí)現(xiàn)智能化教學(xué),為探索法學(xué)教育的出路提供了一定啟示。通過對(duì)法律案例模擬系統(tǒng)進(jìn)行需求分析,將模擬系統(tǒng)的訴訟請(qǐng)求評(píng)價(jià)任務(wù)轉(zhuǎn)換為訴訟請(qǐng)求和判決事項(xiàng)匹配問題。目前這方面的研究工作還較少有相關(guān)的文獻(xiàn)報(bào)告,因此,本文對(duì)面向法律案例模擬系統(tǒng)評(píng)價(jià)的句子匹配實(shí)現(xiàn)方法進(jìn)行了試驗(yàn)性的研究。主要工作有以下幾點(diǎn):(1)針對(duì)法律案例模擬系統(tǒng)的評(píng)價(jià)問題,開發(fā)一個(gè)法律案例訴訟請(qǐng)求和判決事項(xiàng)句子匹配數(shù)據(jù)集。該部分的工作內(nèi)容主要包括:分析判決書的特點(diǎn)、判決書數(shù)據(jù)的爬取、訴訟請(qǐng)求和判決事項(xiàng)的抽取、設(shè)計(jì)合適的標(biāo)注規(guī)范等。(2)研究無監(jiān)督的訴訟請(qǐng)求和判決事項(xiàng)匹配方法。用基于簡(jiǎn)單加權(quán)詞向量平均的匹配方法作為無監(jiān)督匹配方法的基線系統(tǒng),實(shí)現(xiàn)基于逆語料詞頻(smooth inverse frequency,SIF)加權(quán)詞向量平均的匹配方法,該方法使用預(yù)訓(xùn)練詞向量,融合大規(guī)模語料詞頻信息,對(duì)句中所有詞對(duì)應(yīng)的詞向量...
【文章來源】:南京師范大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1功能模塊圖??
知網(wǎng)中義原之間有8中關(guān)系,例如:“上下位”關(guān)系、“同義”關(guān)系、“反??義”關(guān)系等。所有的義原之間組成了一個(gè)復(fù)雜的網(wǎng)狀結(jié)構(gòu)。在這8種關(guān)系中,最??重要的是“上下位”關(guān)系。該關(guān)系可以用如圖2.2所示的樹狀層次結(jié)構(gòu)來表示。????.**■*???(實(shí)體3??萬物??—?、、??(物質(zhì)??(生物??動(dòng)物)?,植物')??廣^?、一..??乂? ̄^??(’獸?'?)?(、水果)??y?'、—"?\??,.一乂'?,入、??I.走獸,)?(鳥)??圖2.2義原“上下位”關(guān)系樹狀圖??從關(guān)系樹狀圖中,可以得出如下結(jié)論:??如果一對(duì)節(jié)點(diǎn)的重合度相同,則所處的語義樹層越高,其語義距離越大。例??11??
卷積層是卷積核在上一級(jí)輸入層上通過指定步長(zhǎng)的滑動(dòng)窗口計(jì)算得到,卷積??方式根據(jù)卷積核處理輸入邊緣信息的方式不同分為兩種,分別是窄卷積(Narrow??Convolution)和寬卷積(Wide?Convolution),如圖2.4,NLP中的句子長(zhǎng)度是不??同的,所以CNN的輸入矩陣大小無法確定,這取決于m的大小,卷積層本質(zhì)上??是個(gè)特征抽取層,可以設(shè)定超參數(shù)尸來指定特征抽取器(Filter)的數(shù)量,對(duì)于??某個(gè):Filter來說,可以認(rèn)為有一個(gè)A?大小的移動(dòng)窗口從輸入矩陣的第一個(gè)字開??始不斷往后移動(dòng),其中A:是Filter指定的窗口大小,d是詞向量(Word?Embedding)??長(zhǎng)度。對(duì)于某個(gè)時(shí)刻的窗口,通過神經(jīng)網(wǎng)絡(luò)的非線性變換,將窗口內(nèi)的輸入值轉(zhuǎn)??15??
【參考文獻(xiàn)】:
期刊論文
[1]基于向量空間模型結(jié)合語義的文本相似度算法[J]. 馮高磊,高嵩峰. 現(xiàn)代電子技術(shù). 2018(11)
[2]基于多特征融合的句子相似度計(jì)算方法[J]. 黃姝婧,張仰森. 北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(05)
[3]基于加權(quán)二部圖匹配的中文段落相似度計(jì)算[J]. 張紹陽,曹家波,王子凡,曲衛(wèi)東. 計(jì)算機(jī)工程與應(yīng)用. 2017(18)
[4]一種基于知網(wǎng)的句子相似度計(jì)算方法[J]. 程傳鵬,吳志剛. 計(jì)算機(jī)工程與科學(xué). 2012(02)
[5]自動(dòng)文摘中的冗余句消除方法[J]. 程傳鵬,楊要科. 計(jì)算機(jī)應(yīng)用. 2011(12)
[6]基于句子相似度的論文抄襲檢測(cè)模型研究[J]. 冷強(qiáng)奎,秦玉平,王春立. 計(jì)算機(jī)工程與應(yīng)用. 2011(24)
[7]一種新的詞語相似度計(jì)算方法[J]. 趙軍,胡栓柱,樊興華. 重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2009(04)
[8]基于改進(jìn)VSM的句子相似度研究[J]. 蘇小虎. 計(jì)算機(jī)技術(shù)與發(fā)展. 2009(08)
[9]基于語義理解的文本相似度算法[J]. 金博,史彥軍,滕弘飛. 大連理工大學(xué)學(xué)報(bào). 2005(02)
[10]基于語義依存的漢語句子相似度計(jì)算[J]. 李彬,劉挺,秦兵,李生. 計(jì)算機(jī)應(yīng)用研究. 2003(12)
碩士論文
[1]基于HNC的漢語句子相似度算法的研究[D]. 史燕.江蘇大學(xué) 2009
本文編號(hào):3578514
【文章來源】:南京師范大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1功能模塊圖??
知網(wǎng)中義原之間有8中關(guān)系,例如:“上下位”關(guān)系、“同義”關(guān)系、“反??義”關(guān)系等。所有的義原之間組成了一個(gè)復(fù)雜的網(wǎng)狀結(jié)構(gòu)。在這8種關(guān)系中,最??重要的是“上下位”關(guān)系。該關(guān)系可以用如圖2.2所示的樹狀層次結(jié)構(gòu)來表示。????.**■*???(實(shí)體3??萬物??—?、、??(物質(zhì)??(生物??動(dòng)物)?,植物')??廣^?、一..??乂? ̄^??(’獸?'?)?(、水果)??y?'、—"?\??,.一乂'?,入、??I.走獸,)?(鳥)??圖2.2義原“上下位”關(guān)系樹狀圖??從關(guān)系樹狀圖中,可以得出如下結(jié)論:??如果一對(duì)節(jié)點(diǎn)的重合度相同,則所處的語義樹層越高,其語義距離越大。例??11??
卷積層是卷積核在上一級(jí)輸入層上通過指定步長(zhǎng)的滑動(dòng)窗口計(jì)算得到,卷積??方式根據(jù)卷積核處理輸入邊緣信息的方式不同分為兩種,分別是窄卷積(Narrow??Convolution)和寬卷積(Wide?Convolution),如圖2.4,NLP中的句子長(zhǎng)度是不??同的,所以CNN的輸入矩陣大小無法確定,這取決于m的大小,卷積層本質(zhì)上??是個(gè)特征抽取層,可以設(shè)定超參數(shù)尸來指定特征抽取器(Filter)的數(shù)量,對(duì)于??某個(gè):Filter來說,可以認(rèn)為有一個(gè)A?大小的移動(dòng)窗口從輸入矩陣的第一個(gè)字開??始不斷往后移動(dòng),其中A:是Filter指定的窗口大小,d是詞向量(Word?Embedding)??長(zhǎng)度。對(duì)于某個(gè)時(shí)刻的窗口,通過神經(jīng)網(wǎng)絡(luò)的非線性變換,將窗口內(nèi)的輸入值轉(zhuǎn)??15??
【參考文獻(xiàn)】:
期刊論文
[1]基于向量空間模型結(jié)合語義的文本相似度算法[J]. 馮高磊,高嵩峰. 現(xiàn)代電子技術(shù). 2018(11)
[2]基于多特征融合的句子相似度計(jì)算方法[J]. 黃姝婧,張仰森. 北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(05)
[3]基于加權(quán)二部圖匹配的中文段落相似度計(jì)算[J]. 張紹陽,曹家波,王子凡,曲衛(wèi)東. 計(jì)算機(jī)工程與應(yīng)用. 2017(18)
[4]一種基于知網(wǎng)的句子相似度計(jì)算方法[J]. 程傳鵬,吳志剛. 計(jì)算機(jī)工程與科學(xué). 2012(02)
[5]自動(dòng)文摘中的冗余句消除方法[J]. 程傳鵬,楊要科. 計(jì)算機(jī)應(yīng)用. 2011(12)
[6]基于句子相似度的論文抄襲檢測(cè)模型研究[J]. 冷強(qiáng)奎,秦玉平,王春立. 計(jì)算機(jī)工程與應(yīng)用. 2011(24)
[7]一種新的詞語相似度計(jì)算方法[J]. 趙軍,胡栓柱,樊興華. 重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2009(04)
[8]基于改進(jìn)VSM的句子相似度研究[J]. 蘇小虎. 計(jì)算機(jī)技術(shù)與發(fā)展. 2009(08)
[9]基于語義理解的文本相似度算法[J]. 金博,史彥軍,滕弘飛. 大連理工大學(xué)學(xué)報(bào). 2005(02)
[10]基于語義依存的漢語句子相似度計(jì)算[J]. 李彬,劉挺,秦兵,李生. 計(jì)算機(jī)應(yīng)用研究. 2003(12)
碩士論文
[1]基于HNC的漢語句子相似度算法的研究[D]. 史燕.江蘇大學(xué) 2009
本文編號(hào):3578514
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3578514.html
最近更新
教材專著