智能問答系統(tǒng)的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:智能問答系統(tǒng)的研究與實(shí)現(xiàn)
更多相關(guān)文章: 大數(shù)據(jù) 下一代搜索引擎 自然語言理解 智能問答 知識(shí)獲取
【摘要】:智能問答改變了傳統(tǒng)搜索引擎返回超鏈接的方式,能把海量的互聯(lián)網(wǎng)信息轉(zhuǎn)化為知識(shí),并能夠理解用戶的自然語言問題和意圖,快速、準(zhǔn)確地直接給予答案,大大減少了用戶查找信息的時(shí)間,是下一代智能搜索服務(wù)的發(fā)展方向。本文主要完成了智能問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),該系統(tǒng)能夠理解中文自然語言問題,從本地知識(shí)庫以及Web數(shù)據(jù)中快速地找到所需的信息。該系統(tǒng)主要包括問句理解和答案檢索兩大模塊。問句理解包括詞法分析、問句分類、主體識(shí)別、謂詞識(shí)別與消歧以及問句元轉(zhuǎn)換。答案檢索包括基于RDF知識(shí)庫的答案檢索和基于Web的答案檢索。中文分詞與詞性標(biāo)注是中文文本語義理解的基礎(chǔ),也是本文所實(shí)現(xiàn)的智能問答系統(tǒng)的關(guān)鍵步驟。本文針對(duì)現(xiàn)有中文分詞中詞性標(biāo)注存在忽略上下文信息的問題,基于最大熵和分詞詞典相結(jié)合的方法,改進(jìn)了兼類詞的詞性標(biāo)注過程。本文將自然語言問句分為:人物類、電影類、音樂類、圖書類、游戲類、應(yīng)用類等六個(gè)類別。采用CRF(Conditional Random Field,條件隨機(jī)場)自定義組合特征和自定義標(biāo)注集獲取問句的類別和問句的主體。采用詞典匹配和句法分析獲得問句中的謂詞,并使用詞語相似度計(jì)算方法對(duì)謂詞進(jìn)行消歧,該處理使問句中的謂詞和RDF知識(shí)庫中的屬性名稱相一致。給出問句元的定義并將問句轉(zhuǎn)換為問句元。問句元是由“[主體,謂詞]”組成的自然語言問句結(jié)構(gòu)化表示形式。問句元的轉(zhuǎn)換準(zhǔn)確率決定對(duì)問句的理解是否準(zhǔn)確。答案檢索采用兩種方法:基于RDF知識(shí)庫和基于Web。RDF知識(shí)庫中存放有大量知識(shí)三元組,知識(shí)三元組涉及人物、電影、音樂、圖書、游戲、應(yīng)用六個(gè)類別。本文在問句理解基礎(chǔ)上,依次對(duì)問句進(jìn)行分類、主體識(shí)別、謂詞識(shí)別與消歧以及問句元轉(zhuǎn)換,并根據(jù)問句元將問句轉(zhuǎn)化為SPARQL結(jié)構(gòu)化查詢語言,從RDF知識(shí)庫中抽取答案。如果在RDF知識(shí)庫中沒有檢索到答案,則采用基于Web的方法進(jìn)行答案的檢索。該方法將問句作為搜索引擎的查詢請(qǐng)求,從返回的查詢結(jié)果中抽取答案。
【關(guān)鍵詞】:大數(shù)據(jù) 下一代搜索引擎 自然語言理解 智能問答 知識(shí)獲取
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
- 摘要6-7
- abstract7-11
- 第1章 緒論11-22
- 1.1 智能問答研究背景和意義11-13
- 1.2 智能問答研究現(xiàn)狀13-16
- 1.3 論文研究目標(biāo)16
- 1.4 論文擬解決的關(guān)鍵問題16-17
- 1.5 智能問答系統(tǒng)處理流程及模塊組成17-20
- 1.5.1 智能問答系統(tǒng)處理流程17-18
- 1.5.2 問句理解18-19
- 1.5.3 答案檢索19-20
- 1.6 論文的章節(jié)安排20
- 1.7 本章小結(jié)20-22
- 第2章 相關(guān)技術(shù)介紹22-31
- 2.1 句法分析22-23
- 2.2 機(jī)器學(xué)習(xí)算法23-30
- 2.2.1 條件隨機(jī)場算法(CRF)23-27
- 2.2.2 最大熵詞性標(biāo)注算法27-30
- 2.3 本章小結(jié)30-31
- 第3章 問句理解31-55
- 3.1 語料收集31
- 3.2 問句介紹31-33
- 3.3 詞法分析33-41
- 3.3.1 中文分詞33
- 3.3.2 詞性標(biāo)注33-41
- 3.4 問句分類41-43
- 3.4.1 問句分類流程及原理41-43
- 3.4.2 問句分類實(shí)驗(yàn)結(jié)果與分析43
- 3.5 主體識(shí)別43-46
- 3.5.1 人物類問句的主體識(shí)別43-44
- 3.5.2 非人物類問句的主體識(shí)別44-45
- 3.5.3 主體識(shí)別實(shí)驗(yàn)結(jié)果與分析45-46
- 3.6 謂詞識(shí)別46-50
- 3.6.1 謂詞詞典構(gòu)建46-47
- 3.6.2 基于屬性詞典和句法分析結(jié)合的謂詞識(shí)別47-49
- 3.6.3 謂詞識(shí)別實(shí)驗(yàn)結(jié)果與分析49-50
- 3.7 謂詞消歧50-52
- 3.8 問句元轉(zhuǎn)換52-54
- 3.8.1 問句元轉(zhuǎn)換規(guī)則52-54
- 3.8.2 問句元轉(zhuǎn)化實(shí)驗(yàn)結(jié)果與分析54
- 3.9 本章小結(jié)54-55
- 第4章 答案檢索55-71
- 4.1 知識(shí)獲取55-56
- 4.2 基于RDF知識(shí)庫的答案檢索56-68
- 4.2.1 SPARQL簡介57-60
- 4.2.2 SPARQL結(jié)構(gòu)化查詢語句60-62
- 4.2.3 SPARQL結(jié)構(gòu)化查詢模板62-65
- 4.2.4 答案提取65-68
- 4.3 基于Web的答案檢索68-69
- 4.4 本章小結(jié)69-71
- 第5章 智能問答系統(tǒng)部署與演示71-79
- 5.1 系統(tǒng)部署71
- 5.2 系統(tǒng)演示71-77
- 5.2.1 基于RDF知識(shí)庫的答案檢索演示72-77
- 5.2.2 基于Web的答案檢索演示77
- 5.3 本章小結(jié)77-79
- 結(jié)論79-80
- 致謝80-81
- 參考文獻(xiàn)81-87
- 攻讀碩士學(xué)位期間發(fā)表的論文及科研成果87
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 毛先領(lǐng);李曉明;;問答系統(tǒng)研究綜述[J];計(jì)算機(jī)科學(xué)與探索;2012年03期
2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結(jié)構(gòu)模式推理[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年01期
3 盧志堅(jiān),張冬茉;中文問答系統(tǒng)中的問句理解[J];計(jì)算機(jī)工程;2004年18期
4 王樹西;問答系統(tǒng):核心技術(shù)、發(fā)展趨勢[J];計(jì)算機(jī)工程與應(yīng)用;2005年18期
5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年07期
6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)化問答系統(tǒng)[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2008年12期
7 賈君枝;毛海飛;;漢語框架網(wǎng)絡(luò)問答系統(tǒng)問句處理研究[J];圖書情報(bào)工作;2008年10期
8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級(jí)局部文本分析[J];圖書情報(bào)知識(shí);2009年01期
9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計(jì)算機(jī)科學(xué);2010年11期
10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2010年11期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 何靖;陳,
本文編號(hào):586229
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/586229.html