天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

Bi-LSTM-CRF模型在中文語(yǔ)法錯(cuò)誤診斷中的應(yīng)用研究

發(fā)布時(shí)間:2020-03-28 02:57
【摘要】:隨著中國(guó)國(guó)際地位的日益提高,漢語(yǔ)學(xué)習(xí)對(duì)于國(guó)際學(xué)習(xí)者的發(fā)展變得越來(lái)越重要。本文探討的中文語(yǔ)法錯(cuò)誤診斷(CGED)任務(wù)的目標(biāo)是開發(fā)一款計(jì)算機(jī)自動(dòng)輔助工具并通過(guò)該工具協(xié)助第二語(yǔ)言為漢語(yǔ)的外國(guó)學(xué)習(xí)者更好地學(xué)習(xí)中文,同時(shí)減輕漢語(yǔ)教師的輔導(dǎo)壓力。中文語(yǔ)法錯(cuò)誤診斷研究旨在建立一個(gè)模型自動(dòng)檢測(cè)學(xué)習(xí)者在漢語(yǔ)寫作過(guò)程中所犯的錯(cuò)誤及錯(cuò)誤所在位置。本研究中錯(cuò)誤可分成四類,分別是:用詞冗余、詞語(yǔ)缺失、詞語(yǔ)選擇錯(cuò)誤、詞語(yǔ)排序錯(cuò)誤。中文語(yǔ)法錯(cuò)誤診斷研究的難點(diǎn)在于:該任務(wù)涉及到自然語(yǔ)言處理的不同層面信息,將涉及漢語(yǔ)的詞法分析和句法分析等,因此需要多方面統(tǒng)籌考慮以輔助研判。此外,中文中包含了豐富的語(yǔ)言知識(shí),語(yǔ)法表示形式多樣化,當(dāng)判斷一句話中是否包含錯(cuò)誤以及何種類型的錯(cuò)誤時(shí),往往還需要引入外部知識(shí)。鑒于此,本文提出采用pyltp進(jìn)行數(shù)據(jù)預(yù)處理,pyltp的個(gè)性化分詞特點(diǎn)更適合該任務(wù),這是因?yàn)橹形恼Z(yǔ)法錯(cuò)誤診斷的數(shù)據(jù)集大多來(lái)自不同外國(guó)學(xué)生寫的中國(guó)作文,其中涉及眾多不同主題。個(gè)性化分詞則可在一定程度上緩解主題依賴性,當(dāng)面對(duì)新主題時(shí),用戶只需標(biāo)注少量數(shù)據(jù)即可,個(gè)性化分詞會(huì)在原有數(shù)據(jù)基礎(chǔ)上進(jìn)行增量訓(xùn)練,從而達(dá)到既利用原來(lái)主題的數(shù)據(jù)信息,又兼顧目標(biāo)主題的特殊性。此外,本文提出利用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(Bi-LSTM)來(lái)建模,能更好地利用雙向的上下文信息判斷句子是否有誤。在此基礎(chǔ)上,我們將中文語(yǔ)法錯(cuò)誤診斷視為一種特殊的序列標(biāo)注任務(wù)來(lái)求解。針對(duì)序列標(biāo)注問(wèn)題,條件隨機(jī)場(chǎng)(CRF)模型比傳統(tǒng)的隱馬爾科夫模型(HMM)和最大熵馬爾科夫模型(MEMM)有更好的表現(xiàn),且Bi-LSTM模型還可緩解CRF模型中人工特征選擇及難以捕獲長(zhǎng)距離上下文信息依賴的不足。于是,本文進(jìn)一步提出將Bi-LSTM和CRF模型結(jié)合起來(lái)。其中,Bi-LSTM用于獲取兩個(gè)方向上的長(zhǎng)距離信息,然后將信息提供給CRF模型進(jìn)行序列標(biāo)注。在該任務(wù)開放標(biāo)準(zhǔn)評(píng)測(cè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明本文提出的Bi-LSTM-CRF模型在中文語(yǔ)法錯(cuò)誤診斷任務(wù)中的實(shí)際效果比單獨(dú)使用Bi-LSTM模型或CRF模型均有顯著提高。
【圖文】:

結(jié)構(gòu)圖,嵌入層,結(jié)構(gòu)圖,神經(jīng)網(wǎng)絡(luò)模型


3.3.1邋Bi-LSTM神經(jīng)網(wǎng)絡(luò)模型介紹逡逑如下圖所示,單一錯(cuò)誤類型中文語(yǔ)法錯(cuò)誤診斷(CGED)的Bi-LSTM神經(jīng)網(wǎng)絡(luò)逡逑模型的體系結(jié)構(gòu)可以通過(guò)以下三個(gè)專門的層來(lái)表征,如圖3.3所示:(丨)嵌入層逡逑(2)編碼層(3)解碼層逡逑㈧丨p丨,-丨/,,如’逡逑,邐—邐 ̄N逡逑Lookup邋Table邐/邐t邐'逡逑IH+ffl邋Ibgffl逡逑、邐邐y逡逑邐'邐>邋concatenate逡逑Bi-LSTM逡逑邐>|邋LSTM(f)邋| ̄ ̄邐?逡逑邐邐\——LSTM(b]|—逡逑v邐^逡逑六,…,…m_.m邋!邋11逡逑、邋^邋^邋'、逡逑Lin,r—邋[M邋II邋II邋N逡逑圖3.3單錯(cuò)誤型CGED的Bi-LSTM神經(jīng)網(wǎng)絡(luò)模型體系結(jié)構(gòu)逡逑20逡逑

體系結(jié)構(gòu)圖,神經(jīng)網(wǎng)絡(luò)模型,體系結(jié)構(gòu),嵌入層


i逡逑W邋Vi邋V^Va邋……Vn邋^1逡逑圖3.2嵌入層結(jié)構(gòu)圖逡逑3.3邋Bi-LSTM邋層逡逑3.3.1邋Bi-LSTM神經(jīng)網(wǎng)絡(luò)模型介紹逡逑如下圖所示,單一錯(cuò)誤類型中文語(yǔ)法錯(cuò)誤診斷(CGED)的Bi-LSTM神經(jīng)網(wǎng)絡(luò)逡逑模型的體系結(jié)構(gòu)可以通過(guò)以下三個(gè)專門的層來(lái)表征,如圖3.3所示:(丨)嵌入層逡逑(2)編碼層(3)解碼層逡逑㈧丨p丨,-丨/,如’逡逑,邐—邐 ̄N逡逑Lookup邋Table邐/邐t邐'逡逑IH+ffl邋Ibgffl逡逑、邐邐y逡逑邐'邐>邋concatenate逡逑Bi-LSTM逡逑邐>|邋LSTM(f)邋| ̄ ̄邐?逡逑邐邐\——LSTM(b]|—逡逑v邐^逡逑六,…,…m_.m邋!邋11逡逑、邋^邋^邋'、逡逑Lin,r—邋[M邋I
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:H195;TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前7條

1 胡元江;;基于語(yǔ)料庫(kù)的英語(yǔ)專業(yè)高年級(jí)學(xué)生口語(yǔ)詞塊結(jié)構(gòu)特征研究[J];外語(yǔ)研究;2015年05期

2 麥合甫熱提;艾山·吾買爾;麥熱哈巴·艾力;吐爾根·伊布拉音;張健;;基于詞典和統(tǒng)計(jì)相結(jié)合的維吾爾語(yǔ)拼寫檢查方法[J];中文信息學(xué)報(bào);2014年02期

3 蔡昌群;;在英語(yǔ)學(xué)習(xí)中樹立學(xué)生的自信心[J];學(xué)園;2014年01期

4 沈榮;;人工神經(jīng)網(wǎng)絡(luò)的基本模型[J];中國(guó)科技信息;2012年08期

5 張仰森,丁冰青;基于二元接續(xù)關(guān)系檢查的字詞級(jí)自動(dòng)查錯(cuò)方法[J];中文信息學(xué)報(bào);2001年03期

6 周明,黃昌寧;面向語(yǔ)料庫(kù)標(biāo)注的漢語(yǔ)依存體系的探討[J];中文信息學(xué)報(bào);1994年03期

7 李寄;漢語(yǔ)是世界上最古老的語(yǔ)言之一[J];語(yǔ)言教學(xué)與研究;1979年02期

相關(guān)博士學(xué)位論文 前3條

1 莊航;基于深度學(xué)習(xí)的中文詞表示學(xué)習(xí)技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年

2 侯鋒;中文報(bào)業(yè)出版的文字質(zhì)量智能輔助控制技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

3 常甜甜;支持向量機(jī)學(xué)習(xí)算法若干問(wèn)題的研究[D];西安電子科技大學(xué);2010年

相關(guān)碩士學(xué)位論文 前4條

1 張真真;基于卷積神經(jīng)網(wǎng)絡(luò)和條件隨機(jī)場(chǎng)的眼底圖像血管分割研究[D];湘潭大學(xué);2018年

2 李育光;漢語(yǔ)優(yōu)選語(yǔ)義類的自動(dòng)獲取研究[D];鄭州大學(xué);2018年

3 吳昊;垂直搜索引擎關(guān)鍵技術(shù)研究及分布式實(shí)現(xiàn)[D];東南大學(xué);2016年

4 鞠菲;專業(yè)領(lǐng)域未登錄詞識(shí)別研究[D];華東師范大學(xué);2013年



本文編號(hào):2603817

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2603817.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶29661***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美日韩亚洲综合国产人 | 亚洲免费黄色高清在线观看| 国产熟女高清一区二区| 精品推荐国产麻豆剧传媒| 日韩亚洲精品国产第二页| 日本三区不卡高清更新二区| 国产主播精品福利午夜二区| 激情少妇一区二区三区| 色综合久久六月婷婷中文字幕| 国产精品第一香蕉视频| 亚洲一区二区三区熟女少妇| 草草视频福利在线观看| 色婷婷中文字幕在线视频| 国产欧美高清精品一区| 国产传媒精品视频一区| 91久久精品国产成人| 好吊日在线观看免费视频| 人妻熟女欲求不满一区二区| 91人妻人人做人碰人人九色| 国产韩国日本精品视频| 久久经典一区二区三区| 狠狠干狠狠操亚洲综合| 日韩欧美在线看一卡一卡| 国产盗摄精品一区二区视频| 亚洲精品欧美精品日韩精品| 亚洲国产精品久久琪琪| 人妻露脸一区二区三区| 欧美六区视频在线观看| 欧美日韩精品一区二区三区不卡| 国产一区二区熟女精品免费| 伊人久久五月天综合网| 东京干男人都知道的天堂| 日本不卡一本二本三区| 国产精品午夜一区二区三区| 香蕉网尹人综合在线观看| 五月婷婷六月丁香亚洲| 成年人黄片大全在线观看| 精品国产亚洲免费91| 91香蕉视频精品在线看| 精品视频一区二区三区不卡| 91插插插外国一区二区|