一種用于英語語法錯(cuò)誤糾正的層次語言模型的研究與設(shè)計(jì)
發(fā)布時(shí)間:2018-05-31 14:48
本文選題:語法錯(cuò)誤 + 糾正; 參考:《中國科學(xué)技術(shù)大學(xué)》2017年碩士論文
【摘要】:近些年,英語語法錯(cuò)誤糾正領(lǐng)域快速發(fā)展,產(chǎn)生了很多優(yōu)秀的成果,但是在語言模型的設(shè)計(jì)上卻沒有大的突破。傳統(tǒng)的n-gram模型對(duì)于語言糾錯(cuò)沒有很強(qiáng)的針對(duì)性,新提出的句法n-gram模型糾錯(cuò)和一些新出現(xiàn)的樹狀語言模型糾錯(cuò)效果不太理想,基于神經(jīng)網(wǎng)絡(luò)的語言模型太過復(fù)雜。因而,本文的目標(biāo)是綜合現(xiàn)有常見語言模型的優(yōu)點(diǎn),在資源比較有限的條件下,研究和設(shè)計(jì)一種可以應(yīng)用于英語語法錯(cuò)誤糾正系統(tǒng)的層次語言模型。為了取得比傳統(tǒng)語言模型更理想的語法錯(cuò)誤糾正效果,首先,本文分析了目前常見的幾種語言模型的特點(diǎn),提出了一種既可以克服遠(yuǎn)距離單詞間依賴問題又能兼顧保存語義信息的層次語言模型。該語言模型利用句中單詞之間的依存關(guān)系,將句子分解成不同層次的子句,子句內(nèi)部高度相關(guān),上下層子句之間相互修飾和補(bǔ)充。其次,訓(xùn)練該層次語言模型,設(shè)計(jì)糾正解碼算法,利用近似單詞作為備選詞,使用模型的概率信息進(jìn)行糾正解碼,并依此實(shí)現(xiàn)了一個(gè)覆蓋多種英語語法錯(cuò)誤的通用語法錯(cuò)誤糾正模塊;然后,采用該層次語言模型提取句子的上下文信息作為分類器的特征,利用近似動(dòng)名詞搭配作為備選搭配集,對(duì)搭配集進(jìn)行篩選,并使用該語言模型對(duì)糾錯(cuò)結(jié)果進(jìn)行最終排序,并依此設(shè)計(jì)了一個(gè)針對(duì)英語動(dòng)名詞搭配錯(cuò)誤的糾正模塊。最后,對(duì)這兩個(gè)模塊的糾錯(cuò)效果進(jìn)行了測(cè)評(píng)。經(jīng)過實(shí)驗(yàn)驗(yàn)證,本文提出的層次語言模型具有穩(wěn)定性和簡(jiǎn)潔性等優(yōu)點(diǎn),對(duì)句子的描述也更加精確。將層次語言模型直接用于構(gòu)建解碼器對(duì)多種英語語法錯(cuò)誤進(jìn)行檢錯(cuò)糾錯(cuò),或者用于抽取上下文特征作為英語語法檢錯(cuò)糾錯(cuò)中機(jī)器學(xué)習(xí)的特征,或者運(yùn)用于對(duì)糾錯(cuò)結(jié)果進(jìn)行評(píng)分和排序,均能取得比傳統(tǒng)線性語言模型更好的效果。
[Abstract]:In recent years , the fast development in the field of English grammar error correction has produced many excellent results , but there is no big breakthrough in the design of the language model .
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 杜一民;吳桂興;吳敏;;一種解決英語動(dòng)名詞搭配錯(cuò)誤的模型[J];計(jì)算機(jī)科學(xué);2016年07期
2 鑒萍;宗成慶;;基于序列標(biāo)注模型的分層式依存句法分析方法[J];中文信息學(xué)報(bào);2010年06期
3 張鈸;;自然語言處理的計(jì)算模型[J];中文信息學(xué)報(bào);2007年03期
相關(guān)碩士學(xué)位論文 前3條
1 陳朝才;英語搭配錯(cuò)誤檢測(cè)與糾正系統(tǒng)的研究與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2015年
2 葛昊;基于N-gram語法檢查系統(tǒng)的改進(jìn)和實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2014年
3 曹莉;基于語料庫的中國大學(xué)生英語四、六級(jí)考試作文中動(dòng)名搭配錯(cuò)誤分析[D];華中科技大學(xué);2007年
,本文編號(hào):1960172
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1960172.html
最近更新
教材專著