基于規(guī)則和統(tǒng)計的組合類新詞識別技術(shù)研究及其在機(jī)械產(chǎn)品設(shè)計中的應(yīng)用
本文關(guān)鍵詞:基于規(guī)則和統(tǒng)計的組合類新詞識別技術(shù)研究及其在機(jī)械產(chǎn)品設(shè)計中的應(yīng)用
更多相關(guān)文章: 自然語言理解 概念從屬理論 中文新詞識別 產(chǎn)品設(shè)計
【摘要】:本文研究自然語言理解中的組合類中文新詞識別,通過識別新詞,,使分詞結(jié)果更加合理準(zhǔn)確,結(jié)合自然語言理解系統(tǒng)的后續(xù)處理,最終通過對以自然語言形式表達(dá)的用戶需求進(jìn)行理解和分析,將分析結(jié)果轉(zhuǎn)化成概念設(shè)計要求或設(shè)計參數(shù),為后續(xù)設(shè)計提供支持。 本文首先分析了自然語言理解中幾種常用的知識表示方法,闡述了概念從屬理論在知識內(nèi)涵和外延描述中的作用,以及自然語言理解研究中的統(tǒng)計模型,以此作為分析組合類中文新詞識別的理論基礎(chǔ)。其次,以語言學(xué)知識為理論依據(jù),分析組合類中文新詞的構(gòu)詞模式,明確了分類標(biāo)準(zhǔn),將組合類中文新詞分為三類:“單字串類型”、“后綴串類型”和“其他類型”;并通過字詞禁用表、詞性搭配禁用表、詞綴表對候選詞串進(jìn)行篩選;同時,借助概念從屬樹模型,分析新詞構(gòu)成元素間的概念關(guān)聯(lián)關(guān)系;然后收集候選詞串的上下文信息,通過統(tǒng)計語言模型,分析組合元素的內(nèi)部緊密程度和上下文依賴程度,采用內(nèi)部詞概率、互信息和左右信息熵作為統(tǒng)計方法識別新詞的標(biāo)準(zhǔn);總體上采用規(guī)則和統(tǒng)計相結(jié)合的方法進(jìn)行組合類中文新詞的識別。最后設(shè)計了組合類中文新詞識別的整體流程,并通過機(jī)械設(shè)計實例,將組合類中文新詞識別的分析模型應(yīng)用在產(chǎn)品設(shè)計領(lǐng)域自然語言理解中。
【關(guān)鍵詞】:自然語言理解 概念從屬理論 中文新詞識別 產(chǎn)品設(shè)計
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:H136;TH122
【目錄】:
- 摘要3-4
- Abstract4-5
- 目錄5-7
- 第一章 緒論7-17
- 1.1 引言7-8
- 1.2 自然語言理解概述8-12
- 1.2.1 自然語言理解簡介8-9
- 1.2.2 自然語言理解的發(fā)展現(xiàn)狀9-11
- 1.2.3 自然語言理解研究的主要方法11-12
- 1.3 中文新詞識別概述12-14
- 1.4 本文的主要工作14-17
- 第二章 知識表示及統(tǒng)計語言模型17-27
- 2.1 常用的知識表示法17-20
- 2.1.1 格語法17
- 2.1.2 謂詞邏輯17-18
- 2.1.3 框架表示法18-19
- 2.1.4 語義網(wǎng)絡(luò)19
- 2.1.5 概念層次網(wǎng)絡(luò)理論19-20
- 2.2 概念從屬理論20-22
- 2.2.1 概念的內(nèi)涵和外延20-21
- 2.2.2 概念從屬樹21-22
- 2.3 自然語言理解中的統(tǒng)計語言模型22-25
- 2.4 本章小結(jié)25-27
- 第三章 組合類中文新詞識別的分析研究27-45
- 3.1 新詞的分類27-28
- 3.2 組合類中文新詞特征分析28-33
- 3.2.1 組合類中文新詞的構(gòu)成模式28-31
- 3.2.2 組合類中文新詞識別與中文分詞的關(guān)系31-33
- 3.3 組合類中文新詞識別的規(guī)則方法33-38
- 3.3.1 分詞碎片33
- 3.3.2 禁用詞表和詞性搭配規(guī)則33-35
- 3.3.3 組合類中文新詞的抽象概念關(guān)系35-38
- 3.4 組合類中文新詞識別的統(tǒng)計方法38-43
- 3.4.1 候選詞串上下文信息收集38-39
- 3.4.2 內(nèi)部詞概率39-40
- 3.4.3 后綴串詞綴信息40-41
- 3.4.4 互信息41
- 3.4.5 左右信息熵41-43
- 3.5 規(guī)則方法和統(tǒng)計方法的結(jié)合43-44
- 3.6 本章小結(jié)44-45
- 第四章 組合類中文新詞識別的實現(xiàn)45-61
- 4.1 自然語言理解的整體框架45-47
- 4.2 組合類中文新詞識別模板設(shè)計47-51
- 4.3 組合類中文新詞識別的實現(xiàn)流程51-58
- 4.4 統(tǒng)計數(shù)據(jù)分析58-59
- 4.5 組合類新詞識別實例59-60
- 4.6 本章小結(jié)60-61
- 第五章 組合類中文新詞識別在凸輪機(jī)構(gòu)設(shè)計中的應(yīng)用61-67
- 5.1 機(jī)械設(shè)計領(lǐng)域自然語言理解的系統(tǒng)組成61-62
- 5.2 凸輪機(jī)構(gòu)系統(tǒng)62
- 5.3 基于自然語言理解的凸輪機(jī)構(gòu)需求分析62-63
- 5.4 凸輪機(jī)構(gòu)需求分析原型系統(tǒng)知識庫的建立63-64
- 5.5 凸輪機(jī)構(gòu)需求分析中的組合類中文新詞識別64-66
- 5.6 本章小結(jié)66-67
- 總結(jié)和展望67-69
- 致謝69-71
- 參考文獻(xiàn)71-74
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李鈍;曹元大;萬月亮;;Internet中的新詞識別[J];北京郵電大學(xué)學(xué)報;2008年01期
2 傅國宏;Chinese Word Boundary Ambiguity and Unknown Word Resolution Using Unsupervised Methods[J];High Technology Letters;2000年02期
3 郭艷華,周昌樂;自然語言理解研究綜述[J];杭州電子工業(yè)學(xué)院學(xué)報;2000年01期
4 馮敏萱;方芳;陳小荷;;帶后綴三字詞的自動識別[J];計算機(jī)工程與應(yīng)用;2006年19期
5 賀敏;龔才春;張華平;程學(xué)旗;;一種基于大規(guī)模語料的新詞識別方法[J];計算機(jī)工程與應(yīng)用;2007年21期
6 李曉光;王大玲;于戈;;基于統(tǒng)計語言模型的信息檢索[J];計算機(jī)科學(xué);2005年08期
7 張海軍;史樹敏;朱朝勇;黃河燕;;中文新詞識別技術(shù)綜述[J];計算機(jī)科學(xué);2010年03期
8 賈自艷,史忠植;基于概率統(tǒng)計技術(shù)和規(guī)則方法的新詞發(fā)現(xiàn)[J];計算機(jī)工程;2004年20期
9 秦浩偉,步豐林;一個中文新詞識別特征的研究[J];計算機(jī)工程;2004年S1期
10 吳中興,趙克,胡鋼偉,許威;概念從屬樹——一種新的樹模型設(shè)計[J];計算機(jī)應(yīng)用;2004年S1期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 程培濤;機(jī)械產(chǎn)品設(shè)計領(lǐng)域自然語言理解中的概念從屬樹研究與實現(xiàn)[D];西安電子科技大學(xué);2005年
2 鄒綱;中文新詞語自動檢測研究[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2004年
3 徐亮;中文新詞識別研究[D];大連理工大學(xué);2009年
本文編號:781674
本文鏈接:http://sikaile.net/kejilunwen/jixiegongcheng/781674.html