天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于圖書的問答系統(tǒng)的設計實現(xiàn)和關鍵技術

發(fā)布時間:2017-04-20 10:03

  本文關鍵詞:基于圖書的問答系統(tǒng)的設計實現(xiàn)和關鍵技術,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)的迅速發(fā)展,人們獲取信息和知識的途徑越來越多樣化,基于常問問題集(FAQ)的問答系統(tǒng)便是其中一個有效的方式。與傳統(tǒng)的搜索引擎相比,FAQ問答系統(tǒng)能夠直接返回用戶所提出問題的答案,提高了用戶知識獲取的效率。同時FAQ問答系統(tǒng)是自然語言處理領域中一個相當活躍的分支。FAQ的構(gòu)建與更新、問題的分析與相似度計算等都是FAQ問答系統(tǒng)中的研究熱點和核心內(nèi)容。數(shù)字圖書館中有大量專業(yè)的圖書資源,其中,問答類型的圖書通常是針對一個或者多個領域進行專業(yè)性的知識問答,因此會形成大量問答對,而這些問答對就是常問問題集不可或缺的部分。并且,相對于其他常問問題集,它們更能夠提供專業(yè)性強且準確度高的答案。本論文針對問答類型的圖書資源,首先對問答系統(tǒng)的研究現(xiàn)狀做了詳細分析,介紹了問答系統(tǒng)的基本架構(gòu)和相關理論基礎,介紹了基本的分詞方法、主題模型、問題相似度計算方法。然后設計并實現(xiàn)了一個基于圖書的問答系統(tǒng)。論文的主要工作如下:(1)分析基于圖書的問答系統(tǒng)的需求,并針對需求進行系統(tǒng)分析和設計。提出了系統(tǒng)的架構(gòu)設計和模塊設計,實現(xiàn)了基于圖書的問答系統(tǒng)并上線運行。(2)針對系統(tǒng)的數(shù)據(jù)需求,通過正則匹配等技術從大量的圖書資源中篩選出問答類型的圖書,然后抽取問答圖書的目錄信息,通過字符串匹配等方法過濾掉其中的噪音信息,最終獲取問答類圖書中的問題對數(shù)據(jù),以此構(gòu)建FAQ庫。(3)重點研究了問題分析和問題相似度計算的相關技術,并結(jié)合問題數(shù)據(jù)的結(jié)構(gòu)、主題和短文本等特征提出了針對圖書問題檢索的核心算法,包括:基于BTM的問題主題分析,基于Topic和Focus的問題相似度計算。設計相關實驗并與傳統(tǒng)算法比較,實驗結(jié)果表明論文所提出算法明顯提高了問題回答的準確度。
【關鍵詞】:常問問題集 圖書問答系統(tǒng) 問題相似度 短文本 問題分析
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1
【目錄】:
  • 摘要5-6
  • Abstract6-12
  • 第1章 緒論12-17
  • 1.1 課題背景和意義12-13
  • 1.2 本文的主要工作13-14
  • 1.3 本文使用的圖書數(shù)據(jù)介紹14-15
  • 1.4 本文的組織結(jié)構(gòu)15-16
  • 1.5 本章小結(jié)16-17
  • 第2章 相關研究和工作綜述17-34
  • 2.1 問答系統(tǒng)17-20
  • 2.1.1 FAQ問答系統(tǒng)17-19
  • 2.1.2 FAQ問答系統(tǒng)核心問題19-20
  • 2.2 問題分析算法研究現(xiàn)狀20-29
  • 2.2.1 問題分類算法21-22
  • 2.2.2 問題主題識別算法22-29
  • 2.3 問題相似度算法研究現(xiàn)狀29-31
  • 2.3.1 基于向量空間模型的TF-IDF方法29
  • 2.3.2 基于語義詞典的語句相似度計算方法29-30
  • 2.3.3 基于大規(guī)模文檔集的語句相似度計算方法30-31
  • 2.3.4 基于編輯距離的計算方法31
  • 2.4 常用分詞工具31-32
  • 2.5 本章小結(jié)32-34
  • 第3章 基于圖書的問答系統(tǒng)設計34-54
  • 3.1 基于圖書的問答系統(tǒng)的研發(fā)目標34
  • 3.2 基于圖書的問答系統(tǒng)的需求分析34-35
  • 3.2.1 數(shù)據(jù)需求34-35
  • 3.2.2 功能需求35
  • 3.3 基于圖書的問答系統(tǒng)的架構(gòu)設計35-43
  • 3.3.1 系統(tǒng)體系架構(gòu)36-38
  • 3.3.2 系統(tǒng)運行架構(gòu)38-43
  • 3.4 基于圖書的問答系統(tǒng)的模塊設計和實現(xiàn)43-53
  • 3.4.1 FAQ模塊43-45
  • 3.4.2 問題分析模塊45-48
  • 3.4.3 問題檢索模塊48-49
  • 3.4.4 排序和候選集生成模塊49-50
  • 3.4.5 前端交互模塊50-53
  • 3.5 本章小結(jié)53-54
  • 第4章 基于圖書的問答系統(tǒng)關鍵技術54-64
  • 4.1 問題主題分析55-58
  • 4.2 問題相似度計算58-63
  • 4.3 本章小結(jié)63-64
  • 第5章 實驗及結(jié)果分析64-75
  • 5.1 實驗數(shù)據(jù)集64
  • 5.2 問題主題分析實驗64-69
  • 5.3 問題相似度計算實驗69-74
  • 5.3.1 評價標準69-70
  • 5.3.2 實驗過程及結(jié)果分析70-74
  • 5.4 本章小結(jié)74-75
  • 第6章 總結(jié)與展望75-77
  • 6.1 工作總結(jié)75
  • 6.2 展望75-77
  • 參考文獻77-80
  • 攻讀碩士學位期間主要的研究成果80-81
  • 致謝81

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 毛先領;李曉明;;問答系統(tǒng)研究綜述[J];計算機科學與探索;2012年03期

2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結(jié)構(gòu)模式推理[J];廣西師范大學學報(自然科學版);2004年01期

3 盧志堅,張冬茉;中文問答系統(tǒng)中的問句理解[J];計算機工程;2004年18期

4 王樹西;問答系統(tǒng):核心技術、發(fā)展趨勢[J];計算機工程與應用;2005年18期

5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識與技術(學術交流);2007年07期

6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡數(shù)據(jù)的社會化問答系統(tǒng)[J];哈爾濱工業(yè)大學學報;2008年12期

7 賈君枝;毛海飛;;漢語框架網(wǎng)絡問答系統(tǒng)問句處理研究[J];圖書情報工作;2008年10期

8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級局部文本分析[J];圖書情報知識;2009年01期

9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計算機科學;2010年11期

10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡信息;2010年11期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 何靖;陳,

本文編號:318411


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/318411.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶93e77***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com