天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

自動問答系統(tǒng)中基于WordNet的句子相似度計算研究與實(shí)現(xiàn)

發(fā)布時間:2017-05-12 16:22

  本文關(guān)鍵詞:自動問答系統(tǒng)中基于WordNet的句子相似度計算研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:隨著信息技術(shù)的快速發(fā)展,網(wǎng)絡(luò)上的信息和數(shù)據(jù)越來越多,人們對信息檢索的需求越來越大。如何從大量的信息中搜索到需要的信息,,是一個困難和挑戰(zhàn)。人們進(jìn)行信息檢索主要是利用搜索引擎。傳統(tǒng)的利用關(guān)鍵詞進(jìn)行搜索的搜索引擎存在搜索過程復(fù)雜、返回信息量大等問題。因此,學(xué)者們提出了自動問答系統(tǒng)的概念。 自動問答系統(tǒng),對用戶使用自然語言提出的問題,經(jīng)過一系列處理,用自然語言以簡潔的方式返回答案給用戶。其中最常見一種是基于常問問題集(FAQ)知識庫的自動問答系統(tǒng)。而句子相似度計算是基于FAQ自動問答系統(tǒng)的核心。目前主要的句子相似度算法有基于向量空間模型TF-IDF算法、基于語義的句子相似度算法等。本文采用的是基于WordNet語義詞典的基于語義相似度算法,并與編輯距離計算方法相結(jié)合。WordNet是現(xiàn)今世界上最通用的一部英語語義詞典,它利用同義詞集合和同義詞集合間的語義關(guān)系組織起來。WordNet為自然語言處理、信息檢索等領(lǐng)域提供了很大的幫助。 本文首先對自動問答系統(tǒng)的相關(guān)技術(shù)進(jìn)行了介紹,然后重點(diǎn)介紹了本文使用的基于WordNet進(jìn)行句子相似度計算的方法。其中通過對幾種常用的句子相似度計算方法進(jìn)行分析,針對現(xiàn)有的句子相似度計算方法,本文提出了一種既考慮了句子語義信息又考慮了句子中詞語位置信息的一種新的句子相似度計算方法。其中句子語義信息是利用WordNet語義詞典求句子中詞語的最大匹配方法進(jìn)行計算,詞語位置信息是利用基于編輯距離進(jìn)行相似度計算。然后把這種基于WordNet句子相似度計算方法運(yùn)用到自動問答系統(tǒng)中,利用這種新方法設(shè)計和實(shí)現(xiàn)了一個基于FAQ的自動問答系統(tǒng)。在自動問答系統(tǒng)的基礎(chǔ)上,對新的句子相似度計算方法進(jìn)行測試并確定方法權(quán)值,同時對比不同的句子相似度計算方法,對實(shí)驗(yàn)結(jié)果進(jìn)行分析,驗(yàn)證新方法的有效性。最后,對本文所做的研究工作進(jìn)行總結(jié),并指出工作中還需要一步解決的問題,同時指出了可深入研究的方向和發(fā)展前景。
【關(guān)鍵詞】:自動問答系統(tǒng) 相似度計算 編輯距離 WordNet
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1
【目錄】:
  • 摘要5-6
  • Abstract6-9
  • 第一章 緒論9-14
  • 1.1 研究背景及意義9-10
  • 1.2 國內(nèi)外研究現(xiàn)狀10-12
  • 1.3 主要研究內(nèi)容12-13
  • 1.4 論文的組織結(jié)構(gòu)13-14
  • 第二章 自動問答系統(tǒng)相關(guān)技術(shù)研究14-24
  • 2.1 自動問答系統(tǒng)的基本框架和關(guān)鍵技術(shù)14-15
  • 2.2 自動問答系統(tǒng)的分類15-16
  • 2.3 WordNet 語義詞典16-23
  • 2.3.1 WordNet 概述16-17
  • 2.3.2 WordNet 的詞匯組織結(jié)構(gòu)17-18
  • 2.3.3 WordNet 中語義關(guān)系18-19
  • 2.3.4 關(guān)于 WordNet 3.019-21
  • 2.3.5 WordNet 3.0 的文件結(jié)構(gòu)21-23
  • 2.4 本章小結(jié)23-24
  • 第三章 基于 WordNet 的句子相似度計算24-43
  • 3.1 基于 WordNet 的句子預(yù)處理流程25-27
  • 3.1.1 斷詞25
  • 3.1.2 去除停用詞25
  • 3.1.3 詞干化25-26
  • 3.1.4 詞性標(biāo)注26
  • 3.1.5 消除歧義26-27
  • 3.2 基于 WordNet 的詞匯相似度計算27-30
  • 3.2.1 基于信息量的語義相似度計算28-29
  • 3.2.2 基于路徑的語義相似度計算29-30
  • 3.3 常用的句子相似度算法30-35
  • 3.3.1 基于向量空間模型的 TF-IDF 計算方法30-33
  • 3.3.2 基于語義的句子相似度計算方法33
  • 3.3.3 基于編輯距離的句子相似度算法33-35
  • 3.4 改進(jìn)的句子相似度計算方法35-42
  • 3.4.1 改進(jìn)的基于語義的句子相似度計算方法36-40
  • 3.4.2 改進(jìn)的基于 WordNet 語義和編輯距離的句子相似度計算方法40-42
  • 3.5 本章小結(jié)42-43
  • 第四章 基于 WordNet 的句子相似度算法的自動問答系統(tǒng)設(shè)計與實(shí)現(xiàn)43-55
  • 4.1 FAQ 自動問答系統(tǒng)的基本流程43-44
  • 4.2 系統(tǒng)設(shè)計與實(shí)現(xiàn)44-53
  • 4.2.1 建立 FAQ 常問問題集46-47
  • 4.2.2 句子預(yù)處理47-48
  • 4.2.3 相似度計算48-49
  • 4.2.4 系統(tǒng)演示效果49-53
  • 4.3 本章小結(jié)53-55
  • 第五章 實(shí)驗(yàn)與結(jié)果分析55-65
  • 5.1 測試集合建立55-56
  • 5.2 評價方法56-57
  • 5.3 基于 WordNet 并結(jié)合編輯距離的句子相似度計算方法權(quán)值確定測試57-58
  • 5.4 句子相似度計算方法對比實(shí)驗(yàn)58-60
  • 5.5 結(jié)果對比分析60-63
  • 5.6 本章小結(jié)63-65
  • 第六章 總結(jié)65-68
  • 6.1 主要工作總結(jié)65-66
  • 6.2 存在問題66-67
  • 6.3 前景展望67-68
  • 參考文獻(xiàn)68-71
  • 致謝71-72
  • 附件72

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 紀(jì)曉東;謝信乾;;基于二分圖最大賦權(quán)匹配的網(wǎng)絡(luò)編碼中繼選擇[J];北京郵電大學(xué)學(xué)報;2011年05期

2 楊倩倩;徐棟;;TFIDF方法在英語句子相似度計算中的應(yīng)用初探[J];電腦知識與技術(shù);2012年17期

3 秦兵,劉挺,王洋,鄭實(shí)福,李生;基于常問問題集的中文問答系統(tǒng)研究[J];哈爾濱工業(yè)大學(xué)學(xué)報;2003年10期

4 史斌;閆健卓;王普;方麗英;;基于本體的概念語義相似度度量[J];計算機(jī)工程;2009年19期

5 王艷娜;周子力;何艷;;WordNet中基于IC的概念語義相似度算法[J];計算機(jī)工程;2011年22期

6 厙向陽;羅曉霞;;點(diǎn)和邊有容量約束的網(wǎng)絡(luò)最大流新算法[J];計算機(jī)應(yīng)用;2008年01期

7 劉寶艷;林鴻飛;趙晶;;基于改進(jìn)編輯距離和依存文法的漢語句子相似度計算[J];計算機(jī)應(yīng)用與軟件;2008年07期

8 丁凡;王斌;白碩;劉宜軒;李亞楠;;文檔檢索中句法信息的有效利用研究[J];中文信息學(xué)報;2008年04期

9 劉宇鵬;李生;趙鐵軍;;基于WordNet詞義消歧的系統(tǒng)融合[J];自動化學(xué)報;2010年11期

10 邊振興;;WordNet中概念語義相似度IC參數(shù)模型研究[J];計算機(jī)工程與應(yīng)用;2011年19期


  本文關(guān)鍵詞:自動問答系統(tǒng)中基于WordNet的句子相似度計算研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。



本文編號:360277

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/360277.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b3334***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com