中文問句理解技術(shù)研究及在IT領(lǐng)域問答系統(tǒng)中的應(yīng)用
發(fā)布時間:2017-03-28 21:11
本文關(guān)鍵詞:中文問句理解技術(shù)研究及在IT領(lǐng)域問答系統(tǒng)中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:問答系統(tǒng)(Question Answering System,QA)是新一代智能搜索引擎,它允許用戶以自然語言提問,并能夠向用戶返回準確的答案。與傳統(tǒng)的關(guān)鍵詞檢索相比,問答系統(tǒng)能夠更好滿足用戶對快速、準確地獲取信息的需求。問句理解是問答系統(tǒng)的一個非常重要的組成部分,它的準確性直接影響到系統(tǒng)的準確率。本文以知網(wǎng)為基礎(chǔ),初步建立起基于疑問意向問句分類機制;然后,根據(jù)分類的語義塊特征提取得到語義理解模型;其次,以問句句型和疑問焦點識別為基礎(chǔ),針對中文句子的提問目的,提出多特征多層次結(jié)合的句子相似度計算方法;最后,根據(jù)上述提到的理論方法,建立一個實際應(yīng)用模型。具體來說,本文主要的實際性工作和取得的主要成果如下:1.對中文問句的特點進行分析,提出基于疑問意向的問句分類方法,通過提取問句的疑問焦點、句法和句子成分的語義角色三方面內(nèi)容,將問句的各個組成成分歸類到事件語義塊,問點塊,其他語義塊等三大語義塊,并對各個語義塊進行提取,建立問句的語義理解模型;2.問句提取意圖的方法隨著問句類型的不同而有一定的差異,即意圖提取的研究對象是疑問句。本文的研究背景是自然語言問答系統(tǒng),通過大量分析語料,再依據(jù)不同疑問句出現(xiàn)的頻率多少,將疑問句類型分為特指問句,正反問句,句末語助詞問句這三類,最后依據(jù)疑問句類型提出有針對性的問句意圖提取方法;3.通過分析和研究現(xiàn)有問句相似度計算方法的局限,提出利用多層次多特征的融合的漢語句子相似度計算方法。主要思想如下:第一步,針對用戶所提出的疑問句,采用自然語言處理中的技術(shù)來分析問題,可以將用戶的問句分為問句意圖和關(guān)鍵詞集這兩個部分。第二步,考慮目標層、結(jié)構(gòu)層和語義層,包括意圖、關(guān)鍵詞、句子長度等多種特征。第三步,確定句子相似度的值,即運用一種簡單有效的融合手段來獲取綜合特征,再根據(jù)綜合特征確定句子相似度的值;4.最后,將本文所研究的問句理解技術(shù)和利用有別于現(xiàn)有句子相似度的計算新方法應(yīng)用于IT領(lǐng)域自然語言問答系統(tǒng)中。面向IT領(lǐng)域的自動問答系統(tǒng)的測評結(jié)果表明該方法具有一定的可行性和較高的實用價值。
【關(guān)鍵詞】:中文問答系統(tǒng) 問句理解 查詢意圖 語義塊 問句相似度
【學位授予單位】:華南理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- Abstract6-11
- 第一章 緒論11-16
- 1.1 選題背景及意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-14
- 1.2.1 國外研究現(xiàn)狀12-13
- 1.2.2 國內(nèi)研究現(xiàn)狀13-14
- 1.3 主要研究內(nèi)容14
- 1.4 論文結(jié)構(gòu)安排14-16
- 第二章 中文問答系統(tǒng)概述及相關(guān)技術(shù)16-23
- 2.1 問答系統(tǒng)的處理流程16-17
- 2.2 中文自動分詞技術(shù)17-18
- 2.3 依存文法18-19
- 2.4 知網(wǎng)語義知識資源19-21
- 2.4.1 知網(wǎng)的義原19-20
- 2.4.2 知網(wǎng)的概念20-21
- 2.5 同義詞詞林21-22
- 2.6 本章小結(jié)22-23
- 第三章 中文問句理解技術(shù)研究23-43
- 3.1 問句理解流程體系23
- 3.2 基于疑問意向的問句分類23-28
- 3.3 問句分類的語義塊特征提取28-32
- 3.3.1 問句語義塊的定義28-29
- 3.3.2 問點塊的提取29-30
- 3.3.3 事件語義塊提取30-31
- 3.3.4 其他語義塊提取31-32
- 3.4 問句語義理解模型的分析過程32-35
- 3.5 問句的句型分析和疑問焦點識別35-38
- 3.5.1 中文問句句式類型35-36
- 3.5.2 特指問句類型和疑問焦點36-38
- 3.6 問句意圖的提取38-42
- 3.6.1 問句意圖的含義38
- 3.6.2 問句意圖的表示方法38-39
- 3.6.3 問句意圖的提取39-42
- 3.7 本章小結(jié)42-43
- 第四章 問答系統(tǒng)的問句相似度43-51
- 4.1 句子相似度研究43-45
- 4.1.1 句子相似度的定義43
- 4.1.2 句子相似度常用計算方法43-45
- 4.2 多層次多特征融合的問句相似度計算45-50
- 4.2.1 設(shè)計思想45-46
- 4.2.2 查詢意圖的相似度計算46
- 4.2.3 關(guān)鍵字集的相似度計算46-48
- 4.2.4 其他相似度特征因素的計算48-49
- 4.2.5 多層次多特征融合的問句相似度計算49-50
- 4.3 本章小結(jié)50-51
- 第五章 問句理解技術(shù)在IT領(lǐng)域問答系統(tǒng)中的應(yīng)用51-61
- 5.1 系統(tǒng)總體設(shè)計方法51-52
- 5.2 系統(tǒng)的框架和各模塊體系52-55
- 5.2.1 問句理解模塊52-54
- 5.2.2 答案抽取模塊54-55
- 5.3 實驗過程及結(jié)果評價55-60
- 5.3.1 問句分類測評分析56-59
- 5.3.2 問句相似度算法測評59-60
- 5.4 本章小結(jié)60-61
- 總結(jié)與展望61-63
- 參考文獻63-68
- 致謝68-69
- 附件69
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 呂學強,任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學學報;2003年06期
2 周流溪;近五十年來語言學的發(fā)展(中)[J];外語教學與研究;1997年04期
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 周舫;漢語句子相似度計算方法及其應(yīng)用的研究[D];河南大學;2005年
2 張玉娟;基于《知網(wǎng)》的句子相似度計算的研究[D];中國地質(zhì)大學(北京);2006年
本文關(guān)鍵詞:中文問句理解技術(shù)研究及在IT領(lǐng)域問答系統(tǒng)中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
,本文編號:273035
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/273035.html
最近更新
教材專著