IT領(lǐng)域問答系統(tǒng)的研究與實現(xiàn)
本文關(guān)鍵詞:IT領(lǐng)域問答系統(tǒng)的研究與實現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展和應(yīng)用,網(wǎng)上的信息迅速增長。人們希望能從海量的網(wǎng)絡(luò)內(nèi)容獲取自己所需要的信息。搜索引擎的出現(xiàn)從很大程度上解決了這個問題。人們只需輸入一些關(guān)鍵字,搜索引擎就會返回相關(guān)的網(wǎng)頁。但是面對繁多的網(wǎng)頁信息,用戶很難迅速找到自己所需的內(nèi)容。因此,為了滿足人們能夠更快速、準確地獲取信息的愿望,自動問答系統(tǒng)(automatic Question Answering System,QA)逐漸發(fā)展起來。自動問答系統(tǒng)允許用戶使用自然語言進行提問,并針對問題返回一個簡潔準確的答案。它綜合運用多種自然語言處理技術(shù),是計算機應(yīng)用領(lǐng)域研究的熱點之一。目前,英文問答系統(tǒng)的研究已比較成熟,由于中文自然語言的復(fù)雜性,因此中文問答系統(tǒng)的研究還處于初步階段。本文研究的是基于IT領(lǐng)域中文自動問答系統(tǒng)。本文根據(jù)IT領(lǐng)域數(shù)據(jù)的特點,開發(fā)出一個在中華字庫項目下基于常用問題庫(FAQ)的中文問答系統(tǒng)。本系統(tǒng)主要完成對IT領(lǐng)域數(shù)據(jù)的構(gòu)建,計算句子相似度算法等方面的內(nèi)容。在構(gòu)建IT領(lǐng)域數(shù)據(jù)部分,研究設(shè)計了IT領(lǐng)域數(shù)據(jù)結(jié)構(gòu)、FAQ存儲方式、對FAQ進行預(yù)處理;句子相似度計算部分,采用了基于語義的相似度計算方法,并建立了相應(yīng)的問題測試集進行試驗,文章最后介紹了整個自動問答系統(tǒng)的實驗結(jié)果及其評價。本文的主要工作包括:(1)分析了IT領(lǐng)域數(shù)據(jù)組成。本文涉及的IT領(lǐng)域數(shù)據(jù)包括QA數(shù)據(jù)、IT領(lǐng)域詞典、專家問答庫。(2)使用ICTCLAS分詞技術(shù),實現(xiàn)對問題的分詞處理。使用基于語義的句子相似度計算方法,對用戶問題與數(shù)據(jù)庫中問題進行相似度的計算,從數(shù)據(jù)庫中尋找匹配的問句及答案返回給用戶。(3)開發(fā)出一個FAQ自動問答系統(tǒng),為中華字庫項目使用人員提供了關(guān)于項目的常見問題的解答。
【關(guān)鍵詞】:FAQ問答系統(tǒng) 問句相似度 知網(wǎng)
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- Abstract6-12
- 第一章 緒論12-17
- 1.1 前言12
- 1.2 國內(nèi)外研究現(xiàn)狀12-14
- 1.2.1 國外研究現(xiàn)狀12-13
- 1.2.2 國內(nèi)研究現(xiàn)狀13-14
- 1.3 立題意義14-15
- 1.4 本文的工作內(nèi)容15
- 1.5 論文的組織結(jié)構(gòu)15-16
- 1.6 本章小結(jié)16-17
- 第二章 相關(guān)技術(shù)研究17-33
- 2.1 問答系統(tǒng)核心研究模塊17-19
- 2.2 中文自動分詞技術(shù)19-21
- 2.2.1 中文自動分詞的意義19-20
- 2.2.2 中文自動分詞的方法20-21
- 2.3 語義詞典資源21-25
- 2.3.1《知網(wǎng)》詞典介紹21-22
- 2.3.2《知網(wǎng)》的結(jié)構(gòu)22
- 2.3.3《同義詞詞林》介紹22-25
- 2.4 詞語的相似度計算25-28
- 2.4.1 基于《同義詞詞林》的計算25-27
- 2.4.2 基于《知網(wǎng)》的計算27-28
- 2.4.3 詞語相似度計算評價28
- 2.5 句子的相似度計算[44]28-32
- 2.5.1 句子相似度的概念28-29
- 2.5.2 基于向量空間模型的TF-IDF方法29-30
- 2.5.3 基于語義依存的計算30
- 2.5.4 基于語義距離的計算30-31
- 2.5.5 編輯距離計算方法31
- 2.5.6 語句相似度計算的評價31-32
- 2.6 本章小結(jié)32-33
- 第三章 IT領(lǐng)域數(shù)據(jù)組成和構(gòu)建33-39
- 3.1 概述33
- 3.2 QA數(shù)據(jù)庫33-35
- 3.2.1 QA數(shù)據(jù)結(jié)構(gòu)34
- 3.2.2 數(shù)據(jù)存儲結(jié)構(gòu)34-35
- 3.3 IT領(lǐng)域詞典35-37
- 3.3.1 IT領(lǐng)域詞典概念35
- 3.3.2 IT領(lǐng)域詞典建立35-37
- 3.4 專家問答庫37-38
- 3.4.1 索引表的建立37-38
- 3.5 本章小結(jié)38-39
- 第四章 問答系統(tǒng)的總體設(shè)計39-46
- 4.1 問答系統(tǒng)設(shè)計框架39
- 4.2 問句理解部分39-42
- 4.2.1 分詞系統(tǒng)40
- 4.2.2 問句分類40-41
- 4.2.3 關(guān)鍵詞提取41-42
- 4.2.4 關(guān)鍵詞擴展42
- 4.3 信息檢索部分42-44
- 4.3.1 確定FAQ候選集43
- 4.3.2 詞語相似度計算43
- 4.3.3 句子相似度計算43-44
- 4.4 答案抽取部分44
- 4.4.1 相似度排序44
- 4.5 本章小結(jié)44-46
- 第五章 需求分析與概要設(shè)計46-64
- 5.1 需求分析概述46
- 5.1.1 功能簡介46
- 5.2 功能需求46-55
- 5.2.1 模塊劃分46-47
- 5.2.2 基本設(shè)計用例47-55
- 5.3 概要設(shè)計55-56
- 5.3.1 系統(tǒng)功能結(jié)構(gòu)55-56
- 5.4 模塊設(shè)計56-60
- 5.4.1 模塊名稱及功能56-59
- 5.4.2 限制條件59-60
- 5.5 運行設(shè)計60
- 5.5.1 運行模塊組合60
- 5.5.2 運行控制60
- 5.6 數(shù)據(jù)結(jié)構(gòu)設(shè)計60-63
- 5.6.1 數(shù)據(jù)庫概念設(shè)計60-63
- 5.6.2 數(shù)據(jù)結(jié)構(gòu)與程序的關(guān)系63
- 5.7 系統(tǒng)出錯處理63
- 5.7.1 出錯信息63
- 5.7.2 補救措施63
- 5.8 本章小結(jié)63-64
- 第六章 問答系統(tǒng)的實現(xiàn)64-71
- 6.1 系統(tǒng)總體支撐框架64-65
- 6.2 系統(tǒng)總體架構(gòu)65
- 6.3 模塊設(shè)計65-70
- 6.3.1 QA知識管理模塊65-67
- 6.3.2 QA知識問答模塊67-68
- 6.3.3 用戶管理模塊68-69
- 6.3.4 權(quán)限管理模塊69
- 6.3.5 公告管理模塊69-70
- 6.4 本章小結(jié)70-71
- 第七章 實驗結(jié)果與分析71-79
- 7.1 實驗環(huán)境與性能指標71-72
- 7.1.1 實驗環(huán)境71
- 7.1.2 實驗性能指標71-72
- 7.2 功能測試72-74
- 7.3 界面展示74-76
- 7.4 實驗結(jié)果與分析76-78
- 7.5 本章小結(jié)78-79
- 第八章 總結(jié)與展望79-81
- 8.1 總結(jié)79
- 8.2 展望79-81
- 參考文獻81-83
- 攻讀碩士學(xué)位期間取得的研究成果83-84
- 致謝84-85
- 附件85
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 毛先領(lǐng);李曉明;;問答系統(tǒng)研究綜述[J];計算機科學(xué)與探索;2012年03期
2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結(jié)構(gòu)模式推理[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2004年01期
3 盧志堅,張冬茉;中文問答系統(tǒng)中的問句理解[J];計算機工程;2004年18期
4 王樹西;問答系統(tǒng):核心技術(shù)、發(fā)展趨勢[J];計算機工程與應(yīng)用;2005年18期
5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年07期
6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的社會化問答系統(tǒng)[J];哈爾濱工業(yè)大學(xué)學(xué)報;2008年12期
7 賈君枝;毛海飛;;漢語框架網(wǎng)絡(luò)問答系統(tǒng)問句處理研究[J];圖書情報工作;2008年10期
8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級局部文本分析[J];圖書情報知識;2009年01期
9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計算機科學(xué);2010年11期
10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2010年11期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 何靖;陳
本文編號:383137
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/383137.html