基于N-gram語法檢查系統(tǒng)的改進(jìn)和實(shí)現(xiàn)
發(fā)布時(shí)間:2017-04-20 12:02
本文關(guān)鍵詞:基于N-gram語法檢查系統(tǒng)的改進(jìn)和實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:英語作文體現(xiàn)了英語的書寫能力,是英語能力中的重要一部分,在作文的學(xué)習(xí)過程中,需要進(jìn)行大量的寫作練習(xí),而產(chǎn)生的大量練習(xí)作文同英語老師數(shù)量相對(duì)較少形成了矛盾,很多練習(xí)作文由于無法得到及時(shí)的批閱而使得英語學(xué)習(xí)效果減弱。為此利用計(jì)算機(jī)輔助進(jìn)行作文批閱顯得非常必要。語法檢查是作文批閱中的重要部分,在此之前,王全斌就基于N元語法的語法檢查系統(tǒng)做了如下工作:對(duì)N元語法模型的調(diào)研,對(duì)系統(tǒng)的實(shí)現(xiàn)流程和基礎(chǔ)算法的設(shè)計(jì)、對(duì)語料庫的訓(xùn)練和對(duì)系統(tǒng)的實(shí)現(xiàn)以及對(duì)語法檢查效果的驗(yàn)證,該系統(tǒng)只是實(shí)現(xiàn)了單詞的二元語法檢查,而且檢查算法較為簡單。本文的目標(biāo)是在已有的基礎(chǔ)上對(duì)基于N元語法的語法檢查系統(tǒng)進(jìn)行改進(jìn)。 為了能夠進(jìn)一步提高N元語法檢查系統(tǒng)的檢查效果,本文對(duì)N元語法模型和語法檢查的算法做了進(jìn)一步的研究,并在原系統(tǒng)的基礎(chǔ)上從以下三個(gè)方面對(duì)原系統(tǒng)進(jìn)行了改進(jìn):1.在訓(xùn)練階段添加了對(duì)詞性標(biāo)注的N元語法訓(xùn)練;2.對(duì)訓(xùn)練后的數(shù)據(jù)進(jìn)行了平滑處理;3.優(yōu)化了語法檢查算法,添加了對(duì)單詞的三元語法以及詞性標(biāo)注的二元至五元語法的檢查,并優(yōu)化了判錯(cuò)機(jī)制。本文的工作主要是對(duì)訓(xùn)練系統(tǒng)和檢查系統(tǒng)兩大模塊進(jìn)行改進(jìn)和實(shí)現(xiàn)。其中訓(xùn)練系統(tǒng)的改進(jìn)和實(shí)現(xiàn)包括了語料庫的選擇、訓(xùn)練算法的改進(jìn)和實(shí)現(xiàn)、數(shù)據(jù)庫的表和字段的重新設(shè)計(jì)、核心類的改進(jìn)和實(shí)現(xiàn)。檢查系統(tǒng)的改進(jìn)和實(shí)現(xiàn)包括了核心算法的改進(jìn)和實(shí)現(xiàn)、核心類的改進(jìn)和實(shí)現(xiàn)。 在系統(tǒng)實(shí)現(xiàn)之后,本文以CLEC語料庫為基礎(chǔ)對(duì)系統(tǒng)的準(zhǔn)確率和召回率進(jìn)行了驗(yàn)證,實(shí)驗(yàn)的結(jié)果表明系統(tǒng)的準(zhǔn)確度提高了2%,而系統(tǒng)的召回率提高了10%。較之前的系統(tǒng)整體效果提升明顯。
【關(guān)鍵詞】:英語 語法檢查 N元語法
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:H319;G434
【目錄】:
- 摘要5-6
- Abstract6-9
- 第一章 緒論9-15
- 1.1 問題提出9-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-12
- 1.3 本文主要工作和章節(jié)結(jié)構(gòu)12-15
- 1.3.1 本文研究問題及主要工作12-13
- 1.3.2 本文章節(jié)結(jié)構(gòu)13-15
- 第二章 相關(guān)理論和技術(shù)分析15-33
- 2.1 語料處理理論技術(shù)15-24
- 2.1.1 英文分詞15-16
- 2.1.2 詞性標(biāo)注技術(shù)16-18
- 2.1.3 語料庫18-19
- 2.1.4 平滑算法19-22
- 2.1.5 句法分析22-24
- 2.2 語法檢查基本理論技術(shù)24-30
- 2.2.1 馬爾科夫模型24-25
- 2.2.2 N元語法模型25-27
- 2.2.3 語法檢查基本算法27-30
- 2.3 本章小結(jié)30-33
- 第三章 系統(tǒng)改進(jìn)的設(shè)計(jì)與實(shí)現(xiàn)33-57
- 3.1 語法檢查系統(tǒng)概述33-34
- 3.2 訓(xùn)練模塊改進(jìn)與實(shí)現(xiàn)34-48
- 3.2.1 訓(xùn)練模塊流程34-35
- 3.2.2 數(shù)據(jù)庫的設(shè)計(jì)35-39
- 3.2.3 核心類的改進(jìn)與實(shí)現(xiàn)39-42
- 3.2.4 訓(xùn)練模塊中的核心算法改進(jìn)42-45
- 3.2.5 改進(jìn)后的訓(xùn)練過程的實(shí)現(xiàn)45-48
- 3.2.6 訓(xùn)練結(jié)果48
- 3.3 語法檢查模塊的改進(jìn)與實(shí)現(xiàn)48-54
- 3.3.1 改進(jìn)的語法檢查模塊的基本流程48-49
- 3.3.2 核心類的改進(jìn)與實(shí)現(xiàn)49-50
- 3.3.3 檢查模塊中的核心算法設(shè)計(jì)50-53
- 3.3.4 改進(jìn)的語法檢查過程的實(shí)現(xiàn)53-54
- 3.4 本章小結(jié)54-57
- 第四章 系統(tǒng)的效果和驗(yàn)證57-61
- 4.1 語法檢查效果的評(píng)測標(biāo)準(zhǔn)57-58
- 4.2 系統(tǒng)檢查效果驗(yàn)證58-59
- 4.3 實(shí)驗(yàn)結(jié)果分析59-60
- 4.4 本章小結(jié)60-61
- 第五章 總結(jié)和展望61-65
- 5.1 結(jié)論和總結(jié)61-62
- 5.2 后續(xù)的工作展望62-63
- 5.3 本章小結(jié)63-65
- 參考文獻(xiàn)65-67
- 致謝67-69
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果69
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 謝坤武;;基于實(shí)例的語法檢查研究[J];湖北民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年01期
2 呂威;林文昶;姚正安;李磊;;基于String Kernel和KPCA的負(fù)實(shí)例語法特征提取算法[J];計(jì)算機(jī)工程與應(yīng)用;2009年20期
3 吳應(yīng)中;朱華勇;李杰;;基于n元語法模型的領(lǐng)域語音指令識(shí)別[J];微計(jì)算機(jī)信息;2009年14期
4 吳夙慧;成穎;鄭彥寧;潘云濤;;基于N元語法的英文學(xué)術(shù)文獻(xiàn)聚類標(biāo)簽抽取算法[J];現(xiàn)代圖書情報(bào)技術(shù);2011年Z1期
本文關(guān)鍵詞:基于N-gram語法檢查系統(tǒng)的改進(jìn)和實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):318607
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyujiaoxuefangfalunwen/318607.html
最近更新
教材專著