漢語中介語文本詞語級錯誤的自動查錯研究及其實現(xiàn)—AECIT
發(fā)布時間:2023-06-01 20:49
隨著現(xiàn)代出版事業(yè)的不斷擴大,人工校對的工作量日益增大,產(chǎn)生了機器自動校對的需求。自動校對是自然語言處理的一個重要的研究領(lǐng)域,它的目的主要是在出版行業(yè)中減輕校對人員的工作量。中文文本自動校對較英文文本自動校對而言有許多先天性的困難,如分詞、詞性標(biāo)記等。 中介語文本由于它的特殊性,無論是從錯誤產(chǎn)生原因還是錯誤表現(xiàn)形式都呈現(xiàn)出較普通文本未有的復(fù)雜,F(xiàn)有的自動校對系統(tǒng)是面向普通的中文文本,它處理的是母語為漢語的人士所寫成的中文文本,它們所使用的訓(xùn)練語料和測試語料是同質(zhì)的。本文研究的對象是母語為非漢語的人士寫成的中文中介語文本。二者相比較而言,后者較前者在研究、處理上多了很多困難,如:訓(xùn)練語料和測試語料不同質(zhì),錯誤種類繁多,難以進(jìn)行分類等。本文使用了新疆大學(xué)預(yù)科部少數(shù)民族中介語語料庫,隨機抽取了2063個存在錯誤的句子,以查找句子中的錯誤點為目標(biāo),構(gòu)造了漢語中介語自動查錯系統(tǒng)AECIT(Automatic Error Checker for Interlanguage Texts),采用窗口移動的方式,一次讀取一個三元詞串,以二元詞的互信息為基本統(tǒng)計手段,結(jié)合詞性和確定合理搭配閾值進(jìn)行隔斷的方式...
【文章頁數(shù)】:38 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
英文摘要
第一章 中介語文本自動查錯研究綜述
1.1 選題來源
1.2 本研究的研究目標(biāo)和內(nèi)容
1.3 研究意義
1.4 文本自動校對
1.5 自動校對技術(shù)國外研究現(xiàn)狀
1.6 自動校對技術(shù)國內(nèi)研究現(xiàn)狀
1.7 目前已有的中文文本校對系統(tǒng):黑馬校對系統(tǒng)
1.8 作文自動評分
1.9 研究現(xiàn)狀總結(jié)
1.10 本文使用的語料
第二章 中介語文本的錯誤分類和訓(xùn)練語料分析
2.1 中文普通文本自動校對中的錯誤分類
2.2 中介語文本中的錯誤
2.3 中介語文本中錯誤的定義
2.4 語料分析
第三章 中介語文本字詞級查錯系統(tǒng)——AECIT
3.1 訓(xùn)練模塊
3.2 目前中文文本自動校對中的查錯技術(shù)及分析
3.3 查錯模塊
3.4 系統(tǒng)評測模塊
第四章 查錯系統(tǒng)的測試和分析
4.1 查錯結(jié)果
4.2 查錯系統(tǒng)實例及其分析
4.3 結(jié)合對外漢語教學(xué)的需要
4.4 未來工作展望
參考文獻(xiàn)
致謝
本文編號:3827028
【文章頁數(shù)】:38 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
英文摘要
第一章 中介語文本自動查錯研究綜述
1.1 選題來源
1.2 本研究的研究目標(biāo)和內(nèi)容
1.3 研究意義
1.4 文本自動校對
1.5 自動校對技術(shù)國外研究現(xiàn)狀
1.6 自動校對技術(shù)國內(nèi)研究現(xiàn)狀
1.7 目前已有的中文文本校對系統(tǒng):黑馬校對系統(tǒng)
1.8 作文自動評分
1.9 研究現(xiàn)狀總結(jié)
1.10 本文使用的語料
第二章 中介語文本的錯誤分類和訓(xùn)練語料分析
2.1 中文普通文本自動校對中的錯誤分類
2.2 中介語文本中的錯誤
2.3 中介語文本中錯誤的定義
2.4 語料分析
第三章 中介語文本字詞級查錯系統(tǒng)——AECIT
3.1 訓(xùn)練模塊
3.2 目前中文文本自動校對中的查錯技術(shù)及分析
3.3 查錯模塊
3.4 系統(tǒng)評測模塊
第四章 查錯系統(tǒng)的測試和分析
4.1 查錯結(jié)果
4.2 查錯系統(tǒng)實例及其分析
4.3 結(jié)合對外漢語教學(xué)的需要
4.4 未來工作展望
參考文獻(xiàn)
致謝
本文編號:3827028
本文鏈接:http://sikaile.net/tushudanganlunwen/3827028.html
最近更新
教材專著