“不X是”字串分詞歧解及消歧策略
發(fā)布時(shí)間:2024-06-15 05:42
本文主要探討“不X是”字串在中文自動(dòng)分詞中應(yīng)如何切分的問題,并嘗試進(jìn)行算法設(shè)計(jì)與編程測(cè)試。 第一章主要介紹語料的處理與加工方法。確定“不X是”的選取標(biāo)準(zhǔn),提取所有符合標(biāo)準(zhǔn)的“不X是”字串的語料,然后進(jìn)行歸類統(tǒng)計(jì),依據(jù)切分環(huán)境將所提取的“不X是”分為三類:“不X/是/”、“不/X/是/”、“不/X是/”。同時(shí)說明切分條件及處理原因。 第二、三章為單切分“不X/是/”、“不/X/是/”的字串分析,主要對(duì)語料中只有“不X/是/”和“不/X/是/”切分形式的“不X是”字串逐個(gè)進(jìn)行描寫與解釋,分析其句法環(huán)境及制約因素,并總結(jié)規(guī)則為下文算法設(shè)計(jì)服務(wù)。 第四章是可能存在多種切分的“不X是”字串分析。主要對(duì)可能存在兩種以上切分的“不X是”進(jìn)行描寫與解釋,分析其不同切分形式時(shí)的句法環(huán)境及制約因素。本章涉及“不X/是/”、“不/X/是/”、“不/X是/”三種切分形式。 第五章是總結(jié)、設(shè)計(jì)與測(cè)試。主要對(duì)第二、三、四章的描寫分析進(jìn)行總結(jié),并依據(jù)第二、三、四章分析的結(jié)果和總結(jié)的規(guī)律進(jìn)行算法設(shè)計(jì),并進(jìn)行編程測(cè)試。 在文章的最后主要對(duì)前一章的測(cè)試結(jié)果進(jìn)行報(bào)告,并對(duì)其中出現(xiàn)的問題進(jìn)行分析,提出程序改進(jìn)方向。同時(shí)對(duì)本文...
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
零 緒論
0.1 選題的目的和意義
0.2 前人的研究現(xiàn)狀
0.2.1 關(guān)于“不”和“不X”的研究
0.2.2 關(guān)于“X”和“X 是”的研究
0.2.3 關(guān)于自動(dòng)分詞的研究
0.3 現(xiàn)有研究中存在的問題
0.4 本文采用的理論、方法和語料
0.5 本文的組織
第一章 語料的處理與加工
1.1 語料的提取和統(tǒng)計(jì)分析
1.1.1 提取“不X 是”語料的標(biāo)準(zhǔn)
1.1.2 “不X 是”字串具體形式及統(tǒng)計(jì)分析
1.2 根據(jù)語境切分歸類
1.2.1 切分的標(biāo)準(zhǔn)
1.2.2 “不X 是”的切分歸類
1.3 小結(jié)
第二章 單切分“不X/是/”類字串分析
2.1 “不X/是/”類字串分析
2.1.1 “不X/是/”類字串?dāng)?shù)量分布
2.1.2 “不X”字串分析
2.2 以詞作為切分單位的“不X”
2.2.1 有兩種詞性的“不X”
2.2.2 只作為連詞的“不X”
2.2.3 只作為副詞的“不X”
2.2.4 只作為動(dòng)詞的“不X”
2.3 其他作為分詞單位的“不X”
2.4 小結(jié)
第三章 單切分“不/X/是/”類字串分析
3.1 “不/X/是/”類字串分析
3.1.1 “不/X/是/”類字串?dāng)?shù)量分布
3.1.2 “X”的情況分析
3.2 “不/X/是/”類字串切分分析
3.2.1 語料中“X”只為動(dòng)詞性的“不/X/是/”
3.2.2 語料中“X”只為副詞性的“不/X/是/”
3.2.3 語料中“X”為形容詞性的“不/X/是/”
3.3 小結(jié)
第四章 可能存在多種切分的“不X 是”字串分析
4.1 “不總是”的切分分析
4.2 “不只是”的切分分析
4.2.1 “不只”與“只是”的分析
4.2.2 “不只是”切分分析
4.3 “不單是”、“不光是”、“不就是”的切分分析
4.3.1 “不單是”切分分析
4.3.2 “不光是”切分分析
4.3.3 “不就是”切分分析
4.4 小結(jié)
第五章 總結(jié)、設(shè)計(jì)與測(cè)試
5.1 總結(jié)
5.1.1 單切分形式字串的句法環(huán)境總結(jié)
5.1.2 多切分形式字串的句法環(huán)境總結(jié)
5.2 算法設(shè)計(jì)
5.2.1 總體思路
5.2.2 具體識(shí)別步驟及流程
5.3 編程測(cè)試
5.4 小結(jié)
第六章 結(jié)語
6.1 報(bào)告測(cè)試結(jié)果
6.2 分析改進(jìn)的方向及展望
參考文獻(xiàn)
致謝詞
攻讀學(xué)位期間研究成果
本文編號(hào):3995014
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
零 緒論
0.1 選題的目的和意義
0.2 前人的研究現(xiàn)狀
0.2.1 關(guān)于“不”和“不X”的研究
0.2.2 關(guān)于“X”和“X 是”的研究
0.2.3 關(guān)于自動(dòng)分詞的研究
0.3 現(xiàn)有研究中存在的問題
0.4 本文采用的理論、方法和語料
0.5 本文的組織
第一章 語料的處理與加工
1.1 語料的提取和統(tǒng)計(jì)分析
1.1.1 提取“不X 是”語料的標(biāo)準(zhǔn)
1.1.2 “不X 是”字串具體形式及統(tǒng)計(jì)分析
1.2 根據(jù)語境切分歸類
1.2.1 切分的標(biāo)準(zhǔn)
1.2.2 “不X 是”的切分歸類
1.3 小結(jié)
第二章 單切分“不X/是/”類字串分析
2.1 “不X/是/”類字串分析
2.1.1 “不X/是/”類字串?dāng)?shù)量分布
2.1.2 “不X”字串分析
2.2 以詞作為切分單位的“不X”
2.2.1 有兩種詞性的“不X”
2.2.2 只作為連詞的“不X”
2.2.3 只作為副詞的“不X”
2.2.4 只作為動(dòng)詞的“不X”
2.3 其他作為分詞單位的“不X”
2.4 小結(jié)
第三章 單切分“不/X/是/”類字串分析
3.1 “不/X/是/”類字串分析
3.1.1 “不/X/是/”類字串?dāng)?shù)量分布
3.1.2 “X”的情況分析
3.2 “不/X/是/”類字串切分分析
3.2.1 語料中“X”只為動(dòng)詞性的“不/X/是/”
3.2.2 語料中“X”只為副詞性的“不/X/是/”
3.2.3 語料中“X”為形容詞性的“不/X/是/”
3.3 小結(jié)
第四章 可能存在多種切分的“不X 是”字串分析
4.1 “不總是”的切分分析
4.2 “不只是”的切分分析
4.2.1 “不只”與“只是”的分析
4.2.2 “不只是”切分分析
4.3 “不單是”、“不光是”、“不就是”的切分分析
4.3.1 “不單是”切分分析
4.3.2 “不光是”切分分析
4.3.3 “不就是”切分分析
4.4 小結(jié)
第五章 總結(jié)、設(shè)計(jì)與測(cè)試
5.1 總結(jié)
5.1.1 單切分形式字串的句法環(huán)境總結(jié)
5.1.2 多切分形式字串的句法環(huán)境總結(jié)
5.2 算法設(shè)計(jì)
5.2.1 總體思路
5.2.2 具體識(shí)別步驟及流程
5.3 編程測(cè)試
5.4 小結(jié)
第六章 結(jié)語
6.1 報(bào)告測(cè)試結(jié)果
6.2 分析改進(jìn)的方向及展望
參考文獻(xiàn)
致謝詞
攻讀學(xué)位期間研究成果
本文編號(hào):3995014
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/3995014.html
最近更新
教材專著