基于規(guī)則和統(tǒng)計的組合類新詞識別技術(shù)研究及其在機(jī)械產(chǎn)品設(shè)計中的應(yīng)用

發(fā)布時間：2017-09-03 00:07

本文關(guān)鍵詞：基于規(guī)則和統(tǒng)計的組合類新詞識別技術(shù)研究及其在機(jī)械產(chǎn)品設(shè)計中的應(yīng)用

【摘要】：本文研究自然語言理解中的組合類中文新詞識別，通過識別新詞，，使分詞結(jié)果更加合理準(zhǔn)確，結(jié)合自然語言理解系統(tǒng)的后續(xù)處理，最終通過對以自然語言形式表達(dá)的用戶需求進(jìn)行理解和分析，將分析結(jié)果轉(zhuǎn)化成概念設(shè)計要求或設(shè)計參數(shù)，為后續(xù)設(shè)計提供支持。本文首先分析了自然語言理解中幾種常用的知識表示方法，闡述了概念從屬理論在知識內(nèi)涵和外延描述中的作用，以及自然語言理解研究中的統(tǒng)計模型，以此作為分析組合類中文新詞識別的理論基礎(chǔ)。其次，以語言學(xué)知識為理論依據(jù)，分析組合類中文新詞的構(gòu)詞模式，明確了分類標(biāo)準(zhǔn)，將組合類中文新詞分為三類：“單字串類型”、“后綴串類型”和“其他類型”；并通過字詞禁用表、詞性搭配禁用表、詞綴表對候選詞串進(jìn)行篩選；同時，借助概念從屬樹模型，分析新詞構(gòu)成元素間的概念關(guān)聯(lián)關(guān)系；然后收集候選詞串的上下文信息，通過統(tǒng)計語言模型，分析組合元素的內(nèi)部緊密程度和上下文依賴程度，采用內(nèi)部詞概率、互信息和左右信息熵作為統(tǒng)計方法識別新詞的標(biāo)準(zhǔn)；總體上采用規(guī)則和統(tǒng)計相結(jié)合的方法進(jìn)行組合類中文新詞的識別。最后設(shè)計了組合類中文新詞識別的整體流程，并通過機(jī)械設(shè)計實例，將組合類中文新詞識別的分析模型應(yīng)用在產(chǎn)品設(shè)計領(lǐng)域自然語言理解中。
【關(guān)鍵詞】：自然語言理解 概念從屬理論 中文新詞識別 產(chǎn)品設(shè)計
【學(xué)位授予單位】：西安電子科技大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2013
【分類號】：H136;TH122
【目錄】：

摘要3-4
Abstract4-5
目錄5-7
第一章緒論7-17
1.1 引言7-8
1.2 自然語言理解概述8-12
1.2.1 自然語言理解簡介8-9
1.2.2 自然語言理解的發(fā)展現(xiàn)狀9-11
1.2.3 自然語言理解研究的主要方法11-12
1.3 中文新詞識別概述12-14
1.4 本文的主要工作14-17
第二章知識表示及統(tǒng)計語言模型17-27
2.1 常用的知識表示法17-20
2.1.1 格語法17
2.1.2 謂詞邏輯17-18
2.1.3 框架表示法18-19
2.1.4 語義網(wǎng)絡(luò)19
2.1.5 概念層次網(wǎng)絡(luò)理論19-20
2.2 概念從屬理論20-22
2.2.1 概念的內(nèi)涵和外延20-21
2.2.2 概念從屬樹21-22
2.3 自然語言理解中的統(tǒng)計語言模型22-25
2.4 本章小結(jié)25-27
第三章組合類中文新詞識別的分析研究27-45
3.1 新詞的分類27-28
3.2 組合類中文新詞特征分析28-33
3.2.1 組合類中文新詞的構(gòu)成模式28-31
3.2.2 組合類中文新詞識別與中文分詞的關(guān)系31-33
3.3 組合類中文新詞識別的規(guī)則方法33-38
3.3.1 分詞碎片33
3.3.2 禁用詞表和詞性搭配規(guī)則33-35
3.3.3 組合類中文新詞的抽象概念關(guān)系35-38
3.4 組合類中文新詞識別的統(tǒng)計方法38-43
3.4.1 候選詞串上下文信息收集38-39
3.4.2 內(nèi)部詞概率39-40
3.4.3 后綴串詞綴信息40-41
3.4.4 互信息41
3.4.5 左右信息熵41-43
3.5 規(guī)則方法和統(tǒng)計方法的結(jié)合43-44
3.6 本章小結(jié)44-45
第四章組合類中文新詞識別的實現(xiàn)45-61
4.1 自然語言理解的整體框架45-47
4.2 組合類中文新詞識別模板設(shè)計47-51
4.3 組合類中文新詞識別的實現(xiàn)流程51-58
4.4 統(tǒng)計數(shù)據(jù)分析58-59
4.5 組合類新詞識別實例59-60
4.6 本章小結(jié)60-61
第五章組合類中文新詞識別在凸輪機(jī)構(gòu)設(shè)計中的應(yīng)用61-67
5.1 機(jī)械設(shè)計領(lǐng)域自然語言理解的系統(tǒng)組成61-62
5.2 凸輪機(jī)構(gòu)系統(tǒng)62
5.3 基于自然語言理解的凸輪機(jī)構(gòu)需求分析62-63
5.4 凸輪機(jī)構(gòu)需求分析原型系統(tǒng)知識庫的建立63-64
5.5 凸輪機(jī)構(gòu)需求分析中的組合類中文新詞識別64-66
5.6 本章小結(jié)66-67
總結(jié)和展望67-69
致謝69-71
參考文獻(xiàn)71-74

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫前10條

1 李鈍;曹元大;萬月亮;;Internet中的新詞識別[J];北京郵電大學(xué)學(xué)報;2008年01期

2 傅國宏;Chinese Word Boundary Ambiguity and Unknown Word Resolution Using Unsupervised Methods[J];High Technology Letters;2000年02期

3 郭艷華,周昌樂;自然語言理解研究綜述[J];杭州電子工業(yè)學(xué)院學(xué)報;2000年01期

4 馮敏萱;方芳;陳小荷;;帶后綴三字詞的自動識別[J];計算機(jī)工程與應(yīng)用;2006年19期

5 賀敏;龔才春;張華平;程學(xué)旗;;一種基于大規(guī)模語料的新詞識別方法[J];計算機(jī)工程與應(yīng)用;2007年21期

6 李曉光;王大玲;于戈;;基于統(tǒng)計語言模型的信息檢索[J];計算機(jī)科學(xué);2005年08期

7 張海軍;史樹敏;朱朝勇;黃河燕;;中文新詞識別技術(shù)綜述[J];計算機(jī)科學(xué);2010年03期

8 賈自艷,史忠植;基于概率統(tǒng)計技術(shù)和規(guī)則方法的新詞發(fā)現(xiàn)[J];計算機(jī)工程;2004年20期

9 秦浩偉,步豐林;一個中文新詞識別特征的研究[J];計算機(jī)工程;2004年S1期

10 吳中興,趙克,胡鋼偉,許威;概念從屬樹——一種新的樹模型設(shè)計[J];計算機(jī)應(yīng)用;2004年S1期

中國碩士學(xué)位論文全文數(shù)據(jù)庫前3條

1 程培濤;機(jī)械產(chǎn)品設(shè)計領(lǐng)域自然語言理解中的概念從屬樹研究與實現(xiàn)[D];西安電子科技大學(xué);2005年

2 鄒綱;中文新詞語自動檢測研究[D];中國科學(xué)院研究生院（計算技術(shù)研究所）;2004年

3 徐亮;中文新詞識別研究[D];大連理工大學(xué);2009年

本文編號：781674

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jixiegongcheng/781674.html

上一篇：最優(yōu)小波包變換在齒輪箱振動信號去噪中的應(yīng)用研究
下一篇：高職機(jī)電一體化專業(yè)微課的多元化教學(xué)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于規(guī)則和統(tǒng)計的組合類新詞識別技術(shù)研究及其在機(jī)械產(chǎn)品設(shè)計中的應(yīng)用