IT領(lǐng)域問答系統(tǒng)的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:IT領(lǐng)域問答系統(tǒng)的研究與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展和應(yīng)用,網(wǎng)上的信息迅速增長(zhǎng)。人們希望能從海量的網(wǎng)絡(luò)內(nèi)容獲取自己所需要的信息。搜索引擎的出現(xiàn)從很大程度上解決了這個(gè)問題。人們只需輸入一些關(guān)鍵字,搜索引擎就會(huì)返回相關(guān)的網(wǎng)頁(yè)。但是面對(duì)繁多的網(wǎng)頁(yè)信息,用戶很難迅速找到自己所需的內(nèi)容。因此,為了滿足人們能夠更快速、準(zhǔn)確地獲取信息的愿望,自動(dòng)問答系統(tǒng)(automatic Question Answering System,QA)逐漸發(fā)展起來(lái)。自動(dòng)問答系統(tǒng)允許用戶使用自然語(yǔ)言進(jìn)行提問,并針對(duì)問題返回一個(gè)簡(jiǎn)潔準(zhǔn)確的答案。它綜合運(yùn)用多種自然語(yǔ)言處理技術(shù),是計(jì)算機(jī)應(yīng)用領(lǐng)域研究的熱點(diǎn)之一。目前,英文問答系統(tǒng)的研究已比較成熟,由于中文自然語(yǔ)言的復(fù)雜性,因此中文問答系統(tǒng)的研究還處于初步階段。本文研究的是基于IT領(lǐng)域中文自動(dòng)問答系統(tǒng)。本文根據(jù)IT領(lǐng)域數(shù)據(jù)的特點(diǎn),開發(fā)出一個(gè)在中華字庫(kù)項(xiàng)目下基于常用問題庫(kù)(FAQ)的中文問答系統(tǒng)。本系統(tǒng)主要完成對(duì)IT領(lǐng)域數(shù)據(jù)的構(gòu)建,計(jì)算句子相似度算法等方面的內(nèi)容。在構(gòu)建IT領(lǐng)域數(shù)據(jù)部分,研究設(shè)計(jì)了IT領(lǐng)域數(shù)據(jù)結(jié)構(gòu)、FAQ存儲(chǔ)方式、對(duì)FAQ進(jìn)行預(yù)處理;句子相似度計(jì)算部分,采用了基于語(yǔ)義的相似度計(jì)算方法,并建立了相應(yīng)的問題測(cè)試集進(jìn)行試驗(yàn),文章最后介紹了整個(gè)自動(dòng)問答系統(tǒng)的實(shí)驗(yàn)結(jié)果及其評(píng)價(jià)。本文的主要工作包括:(1)分析了IT領(lǐng)域數(shù)據(jù)組成。本文涉及的IT領(lǐng)域數(shù)據(jù)包括QA數(shù)據(jù)、IT領(lǐng)域詞典、專家問答庫(kù)。(2)使用ICTCLAS分詞技術(shù),實(shí)現(xiàn)對(duì)問題的分詞處理。使用基于語(yǔ)義的句子相似度計(jì)算方法,對(duì)用戶問題與數(shù)據(jù)庫(kù)中問題進(jìn)行相似度的計(jì)算,從數(shù)據(jù)庫(kù)中尋找匹配的問句及答案返回給用戶。(3)開發(fā)出一個(gè)FAQ自動(dòng)問答系統(tǒng),為中華字庫(kù)項(xiàng)目使用人員提供了關(guān)于項(xiàng)目的常見問題的解答。
【關(guān)鍵詞】:FAQ問答系統(tǒng) 問句相似度 知網(wǎng)
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
- 摘要5-6
- Abstract6-12
- 第一章 緒論12-17
- 1.1 前言12
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-14
- 1.2.1 國(guó)外研究現(xiàn)狀12-13
- 1.2.2 國(guó)內(nèi)研究現(xiàn)狀13-14
- 1.3 立題意義14-15
- 1.4 本文的工作內(nèi)容15
- 1.5 論文的組織結(jié)構(gòu)15-16
- 1.6 本章小結(jié)16-17
- 第二章 相關(guān)技術(shù)研究17-33
- 2.1 問答系統(tǒng)核心研究模塊17-19
- 2.2 中文自動(dòng)分詞技術(shù)19-21
- 2.2.1 中文自動(dòng)分詞的意義19-20
- 2.2.2 中文自動(dòng)分詞的方法20-21
- 2.3 語(yǔ)義詞典資源21-25
- 2.3.1《知網(wǎng)》詞典介紹21-22
- 2.3.2《知網(wǎng)》的結(jié)構(gòu)22
- 2.3.3《同義詞詞林》介紹22-25
- 2.4 詞語(yǔ)的相似度計(jì)算25-28
- 2.4.1 基于《同義詞詞林》的計(jì)算25-27
- 2.4.2 基于《知網(wǎng)》的計(jì)算27-28
- 2.4.3 詞語(yǔ)相似度計(jì)算評(píng)價(jià)28
- 2.5 句子的相似度計(jì)算[44]28-32
- 2.5.1 句子相似度的概念28-29
- 2.5.2 基于向量空間模型的TF-IDF方法29-30
- 2.5.3 基于語(yǔ)義依存的計(jì)算30
- 2.5.4 基于語(yǔ)義距離的計(jì)算30-31
- 2.5.5 編輯距離計(jì)算方法31
- 2.5.6 語(yǔ)句相似度計(jì)算的評(píng)價(jià)31-32
- 2.6 本章小結(jié)32-33
- 第三章 IT領(lǐng)域數(shù)據(jù)組成和構(gòu)建33-39
- 3.1 概述33
- 3.2 QA數(shù)據(jù)庫(kù)33-35
- 3.2.1 QA數(shù)據(jù)結(jié)構(gòu)34
- 3.2.2 數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)34-35
- 3.3 IT領(lǐng)域詞典35-37
- 3.3.1 IT領(lǐng)域詞典概念35
- 3.3.2 IT領(lǐng)域詞典建立35-37
- 3.4 專家問答庫(kù)37-38
- 3.4.1 索引表的建立37-38
- 3.5 本章小結(jié)38-39
- 第四章 問答系統(tǒng)的總體設(shè)計(jì)39-46
- 4.1 問答系統(tǒng)設(shè)計(jì)框架39
- 4.2 問句理解部分39-42
- 4.2.1 分詞系統(tǒng)40
- 4.2.2 問句分類40-41
- 4.2.3 關(guān)鍵詞提取41-42
- 4.2.4 關(guān)鍵詞擴(kuò)展42
- 4.3 信息檢索部分42-44
- 4.3.1 確定FAQ候選集43
- 4.3.2 詞語(yǔ)相似度計(jì)算43
- 4.3.3 句子相似度計(jì)算43-44
- 4.4 答案抽取部分44
- 4.4.1 相似度排序44
- 4.5 本章小結(jié)44-46
- 第五章 需求分析與概要設(shè)計(jì)46-64
- 5.1 需求分析概述46
- 5.1.1 功能簡(jiǎn)介46
- 5.2 功能需求46-55
- 5.2.1 模塊劃分46-47
- 5.2.2 基本設(shè)計(jì)用例47-55
- 5.3 概要設(shè)計(jì)55-56
- 5.3.1 系統(tǒng)功能結(jié)構(gòu)55-56
- 5.4 模塊設(shè)計(jì)56-60
- 5.4.1 模塊名稱及功能56-59
- 5.4.2 限制條件59-60
- 5.5 運(yùn)行設(shè)計(jì)60
- 5.5.1 運(yùn)行模塊組合60
- 5.5.2 運(yùn)行控制60
- 5.6 數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)60-63
- 5.6.1 數(shù)據(jù)庫(kù)概念設(shè)計(jì)60-63
- 5.6.2 數(shù)據(jù)結(jié)構(gòu)與程序的關(guān)系63
- 5.7 系統(tǒng)出錯(cuò)處理63
- 5.7.1 出錯(cuò)信息63
- 5.7.2 補(bǔ)救措施63
- 5.8 本章小結(jié)63-64
- 第六章 問答系統(tǒng)的實(shí)現(xiàn)64-71
- 6.1 系統(tǒng)總體支撐框架64-65
- 6.2 系統(tǒng)總體架構(gòu)65
- 6.3 模塊設(shè)計(jì)65-70
- 6.3.1 QA知識(shí)管理模塊65-67
- 6.3.2 QA知識(shí)問答模塊67-68
- 6.3.3 用戶管理模塊68-69
- 6.3.4 權(quán)限管理模塊69
- 6.3.5 公告管理模塊69-70
- 6.4 本章小結(jié)70-71
- 第七章 實(shí)驗(yàn)結(jié)果與分析71-79
- 7.1 實(shí)驗(yàn)環(huán)境與性能指標(biāo)71-72
- 7.1.1 實(shí)驗(yàn)環(huán)境71
- 7.1.2 實(shí)驗(yàn)性能指標(biāo)71-72
- 7.2 功能測(cè)試72-74
- 7.3 界面展示74-76
- 7.4 實(shí)驗(yàn)結(jié)果與分析76-78
- 7.5 本章小結(jié)78-79
- 第八章 總結(jié)與展望79-81
- 8.1 總結(jié)79
- 8.2 展望79-81
- 參考文獻(xiàn)81-83
- 攻讀碩士學(xué)位期間取得的研究成果83-84
- 致謝84-85
- 附件85
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 毛先領(lǐng);李曉明;;問答系統(tǒng)研究綜述[J];計(jì)算機(jī)科學(xué)與探索;2012年03期
2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結(jié)構(gòu)模式推理[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年01期
3 盧志堅(jiān),張冬茉;中文問答系統(tǒng)中的問句理解[J];計(jì)算機(jī)工程;2004年18期
4 王樹西;問答系統(tǒng):核心技術(shù)、發(fā)展趨勢(shì)[J];計(jì)算機(jī)工程與應(yīng)用;2005年18期
5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年07期
6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)化問答系統(tǒng)[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2008年12期
7 賈君枝;毛海飛;;漢語(yǔ)框架網(wǎng)絡(luò)問答系統(tǒng)問句處理研究[J];圖書情報(bào)工作;2008年10期
8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級(jí)局部文本分析[J];圖書情報(bào)知識(shí);2009年01期
9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計(jì)算機(jī)科學(xué);2010年11期
10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2010年11期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 何靖;陳
本文編號(hào):383137
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/383137.html