現(xiàn)代漢語高頻后綴派生詞的識別研究
發(fā)布時間:2023-03-19 07:24
在中文信息處理領(lǐng)域,自動分詞是一項基礎(chǔ)工作,未登錄詞的切分是影響分詞正確率的重要因素之一。派生詞占據(jù)了未登錄詞中新詞的大部分,解決好派生詞的識別問題,對提高分詞精度和進(jìn)一步的漢語句法自動分析都有著重要的意義。本文在考察大規(guī)模語料的基礎(chǔ)上,以信息處理為目標(biāo),選取后綴“子”、“頭”和“者”作為研究對象。首先探討其派生詞的內(nèi)部構(gòu)詞規(guī)律和左右邊界特征,然后結(jié)合搭配信息和共現(xiàn)頻率等進(jìn)行識別算法設(shè)計。本文共分為六章: 緒論,介紹選題意義,界定研究對象,對研究現(xiàn)狀進(jìn)行評述,提出本文的研究方法。然后介紹語料的來源及其處理方法。 第一章,介紹分詞和分詞歧義的相關(guān)概念,對詞法分析的總體模式和規(guī)則的形式化表述進(jìn)行說明。 第二章,主要從派生詞的內(nèi)部結(jié)構(gòu)探討后綴“子”構(gòu)詞的音節(jié)限制條件和詞類限制條件,以及含后綴“子”派生詞的左右邊界特征。 第三章,主要從派生詞的內(nèi)部結(jié)構(gòu)探討后綴“頭”構(gòu)詞的音節(jié)限制條件和詞類限制條件,以及含后綴“頭”派生詞的左右邊界特征。 第四章,主要從派生詞的內(nèi)部結(jié)構(gòu)探討后綴“者”構(gòu)詞的音節(jié)限制條件和詞類限制條件,以及“者”的相關(guān)因素分析。 第五章,在總結(jié)前幾章研究結(jié)果的基礎(chǔ)上,建立詞語表和規(guī)...
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
零 緒論
0.1 選題意義
0.2 國內(nèi)外研究狀況
0.2.1 漢語詞綴研究
0.2.2 自動識別研究
0.3 本文采用的理論、方法和語料
0.3.1 本文采用的主要理論和方法
0.3.2 本文所采用的語料
0.4 可能的創(chuàng)新點(diǎn)
0.5 存在的困難和解決這些困難的打算
0.6 主要內(nèi)容(思路、章節(jié)內(nèi)容簡介)
第一章 總體設(shè)計
1.1 分詞的相關(guān)概念
1.2 歧義的類型及處理方法
1.2.1 歧義的類型
1.2.2 歧義的處理方法
1.3 規(guī)則的形式化表述
1.3.1 變量表示法
1.3.2 條件表達(dá)式
1.3.3 復(fù)雜特征表示法
第二章 后綴“子”及相關(guān)因素分析
2.1 后綴“子”構(gòu)詞的音節(jié)限制條件
2.1.1 含后綴“子”的雙音節(jié)詞
2.1.2 含后綴“子”的三音節(jié)和多音節(jié)詞
2.1.3 小結(jié)
2.2 后綴“子”構(gòu)詞的詞類限制條件
2.2.1 名詞性的“X”
2.2.2 形容詞性的“X”
2.2.3 動詞性的“X”
2.2.4 量詞性的“X”
2.2.5 小結(jié)
2.3 含后綴“子”派生詞的邊界特征
2.3.1 含后綴“子”派生詞的左邊界特征
2.3.2 “子”的右邊成分分析
2.4 小結(jié)
第三章 后綴“頭”及相關(guān)因素分析
3.1 后綴“頭”構(gòu)詞的音節(jié)限制條件
3.1.1 含后綴“頭”的雙音節(jié)詞
3.1.2 含后綴“頭”的三音節(jié)詞
3.2 后綴“頭”構(gòu)詞的詞類限制條件
3.2.1 名詞性詞根+頭
3.2.2 動詞性詞根+頭
3.2.3 形容詞性詞根+頭
3.2.4 方位詞詞根+頭
3.3 “頭”綴派生詞的邊界特征
3.4 小結(jié)
第四章 后綴“者”及相關(guān)因素分析
4.1 后綴“者”構(gòu)詞的音節(jié)限制條件
4.1.1 含后綴“者”的雙音節(jié)詞
4.1.2 含后綴“者”的三音節(jié)和多音節(jié)詞
4.2 “X + 者”中“X”的語法性質(zhì)
4.2.1 名詞性的“X”
4.2.2 動詞性的“X”
4.2.3 形容詞性的“X”
4.3 “者”的相關(guān)因素分析
第五章 后綴派生詞自動識別的算法設(shè)計
5.1 識別的總體思路
5.1.1 詞語表的建立
5.1.2 規(guī)則庫的建立
5.1.3 對歧義的處理
5.2 派生詞識別的算法設(shè)計和識別步驟
5.2.1 算法設(shè)計和識別步驟
5.2.2 后綴派生詞自動識別的流程圖
5.3 疑難問題分析
第六章 結(jié)語
6.1 本文的結(jié)論
6.2 尚需解決的問題和對未來研究的展望
參考文獻(xiàn)
附錄
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號:3764831
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
零 緒論
0.1 選題意義
0.2 國內(nèi)外研究狀況
0.2.1 漢語詞綴研究
0.2.2 自動識別研究
0.3 本文采用的理論、方法和語料
0.3.1 本文采用的主要理論和方法
0.3.2 本文所采用的語料
0.4 可能的創(chuàng)新點(diǎn)
0.5 存在的困難和解決這些困難的打算
0.6 主要內(nèi)容(思路、章節(jié)內(nèi)容簡介)
第一章 總體設(shè)計
1.1 分詞的相關(guān)概念
1.2 歧義的類型及處理方法
1.2.1 歧義的類型
1.2.2 歧義的處理方法
1.3 規(guī)則的形式化表述
1.3.1 變量表示法
1.3.2 條件表達(dá)式
1.3.3 復(fù)雜特征表示法
第二章 后綴“子”及相關(guān)因素分析
2.1 后綴“子”構(gòu)詞的音節(jié)限制條件
2.1.1 含后綴“子”的雙音節(jié)詞
2.1.2 含后綴“子”的三音節(jié)和多音節(jié)詞
2.1.3 小結(jié)
2.2 后綴“子”構(gòu)詞的詞類限制條件
2.2.1 名詞性的“X”
2.2.2 形容詞性的“X”
2.2.3 動詞性的“X”
2.2.4 量詞性的“X”
2.2.5 小結(jié)
2.3 含后綴“子”派生詞的邊界特征
2.3.1 含后綴“子”派生詞的左邊界特征
2.3.2 “子”的右邊成分分析
2.4 小結(jié)
第三章 后綴“頭”及相關(guān)因素分析
3.1 后綴“頭”構(gòu)詞的音節(jié)限制條件
3.1.1 含后綴“頭”的雙音節(jié)詞
3.1.2 含后綴“頭”的三音節(jié)詞
3.2 后綴“頭”構(gòu)詞的詞類限制條件
3.2.1 名詞性詞根+頭
3.2.2 動詞性詞根+頭
3.2.3 形容詞性詞根+頭
3.2.4 方位詞詞根+頭
3.3 “頭”綴派生詞的邊界特征
3.4 小結(jié)
第四章 后綴“者”及相關(guān)因素分析
4.1 后綴“者”構(gòu)詞的音節(jié)限制條件
4.1.1 含后綴“者”的雙音節(jié)詞
4.1.2 含后綴“者”的三音節(jié)和多音節(jié)詞
4.2 “X + 者”中“X”的語法性質(zhì)
4.2.1 名詞性的“X”
4.2.2 動詞性的“X”
4.2.3 形容詞性的“X”
4.3 “者”的相關(guān)因素分析
第五章 后綴派生詞自動識別的算法設(shè)計
5.1 識別的總體思路
5.1.1 詞語表的建立
5.1.2 規(guī)則庫的建立
5.1.3 對歧義的處理
5.2 派生詞識別的算法設(shè)計和識別步驟
5.2.1 算法設(shè)計和識別步驟
5.2.2 后綴派生詞自動識別的流程圖
5.3 疑難問題分析
第六章 結(jié)語
6.1 本文的結(jié)論
6.2 尚需解決的問題和對未來研究的展望
參考文獻(xiàn)
附錄
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號:3764831
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/3764831.html
最近更新
教材專著