天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 漢語言論文 >

基于數(shù)據(jù)增廣和復(fù)制的中文語法錯誤糾正方法

發(fā)布時間:2021-10-26 18:03
  中文作為一種使用很廣泛的文字,因其同印歐語系文字的天然差別,使得漢語初學(xué)者往往會出現(xiàn)各種各樣的語法錯誤。本文針對初學(xué)者在漢語書寫中可能出現(xiàn)的錯別字、語序錯誤等,提出一種自動化的語法糾正方法。首先,本文在自注意力模型中引入復(fù)制機制,構(gòu)建新的C-Transformer模型。構(gòu)建從錯誤文本序列到正確文本序列的文本語法錯誤糾正模型,其次,在公開數(shù)據(jù)集的基礎(chǔ)上,本文利用序列到序列學(xué)習(xí)的方式從正確文本學(xué)習(xí)對應(yīng)的不同形式的錯誤文本,并設(shè)計基于通順度、語義和句法度量的錯誤文本篩選方法;最后,還結(jié)合中文象形文字的特點,構(gòu)造同形、同音詞表,按詞表映射的方式人工構(gòu)造錯誤樣本擴充訓(xùn)練數(shù)據(jù)。實驗結(jié)果表明,本文的方法能夠很好地糾正錯別字、語序不當(dāng)、缺失、冗余等錯誤,并在中文文本語法錯誤糾正標準測試集上取得了目前最好的結(jié)果。 

【文章來源】:智能系統(tǒng)學(xué)報. 2020,15(01)北大核心CSCD

【文章頁數(shù)】:8 頁


本文編號:3459957

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/3459957.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶52ef3***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com