面向法律文書的中文文本校對方法研究
發(fā)布時間:2023-08-05 18:53
在研究法律文書書寫錯誤的語言表述特征后,將法律文書中的文本錯誤分為敘事陳述時的直接錯誤和行文書寫時的隱含錯誤,并構(gòu)建一組正則匹配規(guī)則和字詞識別規(guī)則來進行錯字錯詞識別。通過對法律文書語言學(xué)特征的研究,提出一種規(guī)則與概率統(tǒng)計相結(jié)合的方法實現(xiàn)對法律文書的文本校對。實驗結(jié)果顯示,該方法的召回率和準(zhǔn)確率均達(dá)到80%,具有較好的使用前景。
【文章頁數(shù)】:5 頁
【文章目錄】:
1引言
2法律文書文本錯誤類型分析
2.1敘事陳述錯誤
2.2行文書寫錯誤
3文書錯字自動識別校對設(shè)計及實現(xiàn)
3.1單字詞散串合并
3.2詞向量距離計算
3.3錯誤字詞識別
3.4面向法律文書的文本校對實現(xiàn)
4 實驗結(jié)果和分析
4.1測試集的構(gòu)建
4.2評價標(biāo)準(zhǔn)
4.3結(jié)果分析
5結(jié)束語
本文編號:3839158
【文章頁數(shù)】:5 頁
【文章目錄】:
1引言
2法律文書文本錯誤類型分析
2.1敘事陳述錯誤
2.2行文書寫錯誤
3文書錯字自動識別校對設(shè)計及實現(xiàn)
3.1單字詞散串合并
3.2詞向量距離計算
3.3錯誤字詞識別
3.4面向法律文書的文本校對實現(xiàn)
4 實驗結(jié)果和分析
4.1測試集的構(gòu)建
4.2評價標(biāo)準(zhǔn)
4.3結(jié)果分析
5結(jié)束語
本文編號:3839158
本文鏈接:http://sikaile.net/falvlunwen/gongjianfalunwen/3839158.html