基于圖書的問答系統(tǒng)的設(shè)計實現(xiàn)和關(guān)鍵技術(shù)
本文關(guān)鍵詞:基于圖書的問答系統(tǒng)的設(shè)計實現(xiàn)和關(guān)鍵技術(shù),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的迅速發(fā)展,人們獲取信息和知識的途徑越來越多樣化,基于常問問題集(FAQ)的問答系統(tǒng)便是其中一個有效的方式。與傳統(tǒng)的搜索引擎相比,FAQ問答系統(tǒng)能夠直接返回用戶所提出問題的答案,提高了用戶知識獲取的效率。同時FAQ問答系統(tǒng)是自然語言處理領(lǐng)域中一個相當(dāng)活躍的分支。FAQ的構(gòu)建與更新、問題的分析與相似度計算等都是FAQ問答系統(tǒng)中的研究熱點(diǎn)和核心內(nèi)容。數(shù)字圖書館中有大量專業(yè)的圖書資源,其中,問答類型的圖書通常是針對一個或者多個領(lǐng)域進(jìn)行專業(yè)性的知識問答,因此會形成大量問答對,而這些問答對就是常問問題集不可或缺的部分。并且,相對于其他常問問題集,它們更能夠提供專業(yè)性強(qiáng)且準(zhǔn)確度高的答案。本論文針對問答類型的圖書資源,首先對問答系統(tǒng)的研究現(xiàn)狀做了詳細(xì)分析,介紹了問答系統(tǒng)的基本架構(gòu)和相關(guān)理論基礎(chǔ),介紹了基本的分詞方法、主題模型、問題相似度計算方法。然后設(shè)計并實現(xiàn)了一個基于圖書的問答系統(tǒng)。論文的主要工作如下:(1)分析基于圖書的問答系統(tǒng)的需求,并針對需求進(jìn)行系統(tǒng)分析和設(shè)計。提出了系統(tǒng)的架構(gòu)設(shè)計和模塊設(shè)計,實現(xiàn)了基于圖書的問答系統(tǒng)并上線運(yùn)行。(2)針對系統(tǒng)的數(shù)據(jù)需求,通過正則匹配等技術(shù)從大量的圖書資源中篩選出問答類型的圖書,然后抽取問答圖書的目錄信息,通過字符串匹配等方法過濾掉其中的噪音信息,最終獲取問答類圖書中的問題對數(shù)據(jù),以此構(gòu)建FAQ庫。(3)重點(diǎn)研究了問題分析和問題相似度計算的相關(guān)技術(shù),并結(jié)合問題數(shù)據(jù)的結(jié)構(gòu)、主題和短文本等特征提出了針對圖書問題檢索的核心算法,包括:基于BTM的問題主題分析,基于Topic和Focus的問題相似度計算。設(shè)計相關(guān)實驗并與傳統(tǒng)算法比較,實驗結(jié)果表明論文所提出算法明顯提高了問題回答的準(zhǔn)確度。
【關(guān)鍵詞】:常問問題集 圖書問答系統(tǒng) 問題相似度 短文本 問題分析
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- Abstract6-12
- 第1章 緒論12-17
- 1.1 課題背景和意義12-13
- 1.2 本文的主要工作13-14
- 1.3 本文使用的圖書數(shù)據(jù)介紹14-15
- 1.4 本文的組織結(jié)構(gòu)15-16
- 1.5 本章小結(jié)16-17
- 第2章 相關(guān)研究和工作綜述17-34
- 2.1 問答系統(tǒng)17-20
- 2.1.1 FAQ問答系統(tǒng)17-19
- 2.1.2 FAQ問答系統(tǒng)核心問題19-20
- 2.2 問題分析算法研究現(xiàn)狀20-29
- 2.2.1 問題分類算法21-22
- 2.2.2 問題主題識別算法22-29
- 2.3 問題相似度算法研究現(xiàn)狀29-31
- 2.3.1 基于向量空間模型的TF-IDF方法29
- 2.3.2 基于語義詞典的語句相似度計算方法29-30
- 2.3.3 基于大規(guī)模文檔集的語句相似度計算方法30-31
- 2.3.4 基于編輯距離的計算方法31
- 2.4 常用分詞工具31-32
- 2.5 本章小結(jié)32-34
- 第3章 基于圖書的問答系統(tǒng)設(shè)計34-54
- 3.1 基于圖書的問答系統(tǒng)的研發(fā)目標(biāo)34
- 3.2 基于圖書的問答系統(tǒng)的需求分析34-35
- 3.2.1 數(shù)據(jù)需求34-35
- 3.2.2 功能需求35
- 3.3 基于圖書的問答系統(tǒng)的架構(gòu)設(shè)計35-43
- 3.3.1 系統(tǒng)體系架構(gòu)36-38
- 3.3.2 系統(tǒng)運(yùn)行架構(gòu)38-43
- 3.4 基于圖書的問答系統(tǒng)的模塊設(shè)計和實現(xiàn)43-53
- 3.4.1 FAQ模塊43-45
- 3.4.2 問題分析模塊45-48
- 3.4.3 問題檢索模塊48-49
- 3.4.4 排序和候選集生成模塊49-50
- 3.4.5 前端交互模塊50-53
- 3.5 本章小結(jié)53-54
- 第4章 基于圖書的問答系統(tǒng)關(guān)鍵技術(shù)54-64
- 4.1 問題主題分析55-58
- 4.2 問題相似度計算58-63
- 4.3 本章小結(jié)63-64
- 第5章 實驗及結(jié)果分析64-75
- 5.1 實驗數(shù)據(jù)集64
- 5.2 問題主題分析實驗64-69
- 5.3 問題相似度計算實驗69-74
- 5.3.1 評價標(biāo)準(zhǔn)69-70
- 5.3.2 實驗過程及結(jié)果分析70-74
- 5.4 本章小結(jié)74-75
- 第6章 總結(jié)與展望75-77
- 6.1 工作總結(jié)75
- 6.2 展望75-77
- 參考文獻(xiàn)77-80
- 攻讀碩士學(xué)位期間主要的研究成果80-81
- 致謝81
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 毛先領(lǐng);李曉明;;問答系統(tǒng)研究綜述[J];計算機(jī)科學(xué)與探索;2012年03期
2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結(jié)構(gòu)模式推理[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2004年01期
3 盧志堅,張冬茉;中文問答系統(tǒng)中的問句理解[J];計算機(jī)工程;2004年18期
4 王樹西;問答系統(tǒng):核心技術(shù)、發(fā)展趨勢[J];計算機(jī)工程與應(yīng)用;2005年18期
5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年07期
6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的社會化問答系統(tǒng)[J];哈爾濱工業(yè)大學(xué)學(xué)報;2008年12期
7 賈君枝;毛海飛;;漢語框架網(wǎng)絡(luò)問答系統(tǒng)問句處理研究[J];圖書情報工作;2008年10期
8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級局部文本分析[J];圖書情報知識;2009年01期
9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計算機(jī)科學(xué);2010年11期
10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2010年11期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 何靖;陳,
本文編號:318411
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/318411.html