智能健康知識問答系統(tǒng)的研究與實現(xiàn)
本文關鍵詞:智能健康知識問答系統(tǒng)的研究與實現(xiàn)
更多相關文章: 問答系統(tǒng) 中文分詞 相似度 語義推理 AIML
【摘要】:隨著信息技術的發(fā)展,人們已習慣于從互聯(lián)網上獲取各類信息,這得益于搜索引擎技術的發(fā)展。然而,搜索引擎仍然有一些問題沒有解決。首先是用戶檢索時,相關信息返回太多且不精確,其次是檢索只能按關鍵字進行匹配,實際上并不能精確表達人們的檢索需求。由于上述問題的存在,發(fā)展在信息檢索技術之上的問答系統(tǒng)應運而生。與國外問答系統(tǒng)相比,中文問答系統(tǒng)起步較晚,目前的中文問答系統(tǒng)仍然存在一些問題,例如:反應速度慢、正確率低、推理能力差等。針對問答系統(tǒng)的這些問題,本文對健康領域的問答系統(tǒng)的若干關鍵技術問題進行了研究,引用了一種多策略混合的問答系統(tǒng)模型。研究主要內容如下:首先構建健康領域的專業(yè)詞庫,AIML(人工智能標記語言)知識庫、本體知識庫、問題庫等;其次在現(xiàn)有中文分詞的基礎上,進行詞類標注、同義詞替換、剪枝處理等;然后引入適用于健康領域的基于詞語權重的句子相似度計算算法和推薦度算法;最后改進ALICE系統(tǒng)使其支持漢語,并且在其自身匹配推理的基礎上,擴展語義推理接口。通過實驗與基于語句相似度的現(xiàn)有問答系統(tǒng)進行對比,驗證本文問答系統(tǒng)的答疑性能。通過實驗結果可知,本文的問答系統(tǒng)在一定程度上提高了問答系統(tǒng)的推理能力、查全率和查準率,從而推動了信息檢索和智能問答系統(tǒng)的研究和發(fā)展。
【關鍵詞】:問答系統(tǒng) 中文分詞 相似度 語義推理 AIML
【學位授予單位】:東北大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第1章 緒論11-15
- 1.1 背景和研究意義11-12
- 1.2 國內外研究現(xiàn)狀12-13
- 1.3 本論文研究內容13-14
- 1.4 論文組織結構14-15
- 第2章 相關技術概述15-23
- 2.1 《知網》簡介15-17
- 2.1.1 《知網》的關系結構15-16
- 2.1.2 《知網》的義原概念16-17
- 2.2 詞語相似度計算17-19
- 2.3 本體論19-21
- 2.3.1 本體的概念和描述語言19-20
- 2.3.2 健康領域本體的特點20-21
- 2.4 ALICE系統(tǒng)介紹21-22
- 2.5 本章小結22-23
- 第3章 中文分詞與問句處理23-35
- 3.1 常見的中文分詞23-24
- 3.1.1 基于字典匹配的分詞方法23
- 3.1.2 基于語義理解的分詞23-24
- 3.1.3 基于詞頻統(tǒng)計的分詞24
- 3.2 分詞對比實驗24-28
- 3.2.1 分詞注意難點24-26
- 3.2.2 分詞器對比26-27
- 3.2.3 健康領域分詞實驗27-28
- 3.3 健康領域詞典的構建28-32
- 3.3.1 健康領域字典的數(shù)據(jù)來源28-29
- 3.3.2 領域詞典的構建29-32
- 3.3.3 構建詞典后分詞實驗32
- 3.4 詞類標注32-34
- 3.4.1 健康領域的詞類標注33
- 3.4.2 詞類標注過程33-34
- 3.5 本章小結34-35
- 第4章 問句相似度和推薦度的算法研究35-47
- 4.1 問句相似度概述35-36
- 4.1.1 問句相似度計算特點35
- 4.1.2 漢語句子相似度計算的難點35-36
- 4.1.3 問句相似計算的意義36
- 4.2 改進的問句相似度算法36-39
- 4.2.1 影響問題相似度的因素36-37
- 4.2.2 基于概念詞的問句相似度算法37-38
- 4.2.3 基于問句長度的相似度算法38
- 4.2.4 改進的問句相似度計算算法38-39
- 4.3 健康領域的問題相關推薦度的算法39-41
- 4.3.1 影響問題推薦度的因素39
- 4.3.2 問題推薦度計算39-41
- 4.4 實驗設計與結果分析41-46
- 4.4.1 問題相似度算法實驗41-42
- 4.4.2 問題相似度對比實驗42-44
- 4.4.3 問題推薦度算法實驗44-45
- 4.4.4 問題推薦度對比實驗45-46
- 4.5 本章小結46-47
- 第5章 ALICE擴展47-61
- 5.1 人工智能語言AIML47-50
- 5.1.1 AIML知識庫47-48
- 5.1.2 ALICE的內部推理機制48-49
- 5.1.3 AIML的優(yōu)缺點49-50
- 5.2 AIML漢語擴展50-54
- 5.2.1 分詞處理51-52
- 5.2.2 同義詞處理52-53
- 5.2.3 句式變換53
- 5.2.4 AIML知識庫構建53-54
- 5.3 AIML語義接口擴展54-55
- 5.3.1 AIML擴展模板54-55
- 5.3.2 AIML擴展實例55
- 5.4 ALICE語義推理擴展55-60
- 5.4.1 Jena及其結構55-56
- 5.4.2 Jena推理機56-59
- 5.4.3 語義推理實驗59-60
- 5.5 本章小結60-61
- 第6章 智能問答系統(tǒng)的實現(xiàn)61-75
- 6.1 系統(tǒng)的總體結構61-66
- 6.1.1 多策略混合模型61-63
- 6.1.2 系統(tǒng)的總體架構63-64
- 6.1.3 系統(tǒng)流程圖64-66
- 6.2 系統(tǒng)的實現(xiàn)66-72
- 6.2.1 系統(tǒng)庫的構建66-67
- 6.2.2 問題列表的建立67-68
- 6.2.3 用戶應用層的功能68-69
- 6.2.4 系統(tǒng)界面展示69-72
- 6.3 實驗結果與分析72-74
- 6.3.1 系統(tǒng)性能測試72-74
- 6.3.2 系統(tǒng)問題抽取能力測試74
- 6.4 本章小結74-75
- 第7章 總結與展望75-77
- 7.1 論文總結75
- 7.2 下一步研究方向75-76
- 7.3 本章小結76-77
- 參考文獻77-81
- 攻讀學位期間發(fā)表的論著81-83
- 致謝83
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 毛先領;李曉明;;問答系統(tǒng)研究綜述[J];計算機科學與探索;2012年03期
2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結構模式推理[J];廣西師范大學學報(自然科學版);2004年01期
3 盧志堅,張冬茉;中文問答系統(tǒng)中的問句理解[J];計算機工程;2004年18期
4 王樹西;問答系統(tǒng):核心技術、發(fā)展趨勢[J];計算機工程與應用;2005年18期
5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識與技術(學術交流);2007年07期
6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網絡數(shù)據(jù)的社會化問答系統(tǒng)[J];哈爾濱工業(yè)大學學報;2008年12期
7 賈君枝;毛海飛;;漢語框架網絡問答系統(tǒng)問句處理研究[J];圖書情報工作;2008年10期
8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級局部文本分析[J];圖書情報知識;2009年01期
9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計算機科學;2010年11期
10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農業(yè)網絡信息;2010年11期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 何靖;陳,
本文編號:1123723
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1123723.html