【摘要】:隨著科技與互聯(lián)網(wǎng)的迅猛發(fā)展,人類已經(jīng)被海量的數(shù)字化信息包圍。如何快捷地在海量數(shù)據(jù)中找到所需信息是需要迫切解決的問題。因此自動問答(QA)系統(tǒng)應(yīng)運而生。QA系統(tǒng)可以直接接收用戶提出的自然語言形式的問句,然后返回給用戶簡潔準確的答案。目前的QA系統(tǒng)存在以下兩個問題:(1)基于關(guān)鍵詞匹配的方法只考慮句中關(guān)鍵詞頻率,不考慮關(guān)鍵詞的語義及關(guān)鍵詞間的語義關(guān)系,返回的答案經(jīng)常與用戶問題無關(guān);(2)不能根據(jù)用戶對于答案的概念抽象層次的不同的需求提供不同的答案。本文設(shè)計并實現(xiàn)了一個基于Wikipedia的單文本自動問答系統(tǒng)(Automatic Question Answering Based on Single Document,簡稱SingleDoc系統(tǒng))。Single Doc系統(tǒng)可以接受用戶提出問題類型包括:“What is A”類型和“Who/When等疑問詞+事件/事實”類型,A代表特定領(lǐng)域概念或術(shù)語。同時,Single Doc系統(tǒng)支持用戶在輸入問題的同時指定單篇論文及領(lǐng)域,然后從指定的論文中提取出滿足問題所指的答案。該系統(tǒng)首先分析問題的類型,基于指定的單文本和領(lǐng)域關(guān)鍵詞,通過DCSE(Domain Category Space Extraction)算法抽取Wikipedia中category及category間關(guān)系來構(gòu)建領(lǐng)域分類空間(DCS),DCS描述了問題涉及的背景分類知識,然后在DCS中運用句子語義距離算法獲取文本內(nèi)容中的句子,將其作為系統(tǒng)答案輸出。另一方面,該系統(tǒng)可以根據(jù)用戶對于概念抽象層次的不同需求重新整理輸出答案句子,提供個性化答案。本文主要工作有以下幾點:(1)提出DCSE算法。該算法能夠針對輸入的領(lǐng)域關(guān)鍵詞從Wikipedia中抽取相關(guān)category以及category之間語義關(guān)系構(gòu)建相關(guān)領(lǐng)域分類空間。(2)基于抽取的領(lǐng)域分類空間,設(shè)計了SingleDoc系統(tǒng)的答案提取算法。通過實驗表明,SingleDoc系統(tǒng)比關(guān)鍵詞匹配的QA系統(tǒng)答案準確率高,并且在回答“What is A”類型問題準確率可以達到58%,在回答“When/Who/Where+事件/事實”類型準確率可以達到80%。(3)提出描述用戶對于答案概念抽象層次的需求模型,從用戶角度提供滿足用戶概念抽象層次需求的個性化答案。(4)設(shè)計并實現(xiàn)了基于Web的自動問答系統(tǒng)。該系統(tǒng)主要包含數(shù)據(jù)層、接口層、應(yīng)用層和視圖層,完成了領(lǐng)域分類空間構(gòu)建和句子距離的計算,主要功能支持用戶按照問題類型模板以自然語言句子輸入問題、單篇文本和領(lǐng)域關(guān)鍵詞,根據(jù)用戶需求輸出普通類型和不同概念抽象層次類型兩種答案。
[Abstract]:......
【學位授予單位】:南京郵電大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1
【參考文獻】
相關(guān)期刊論文 前10條
1 楊建萍;年梅;;基于維基百科網(wǎng)絡(luò)技術(shù)的概念語義網(wǎng)絡(luò)構(gòu)建[J];計算機與現(xiàn)代化;2016年01期
2 閆紅;李付學;周云;;基于HowNet句子相似度的計算[J];計算機技術(shù)與發(fā)展;2015年11期
3 鎮(zhèn)麗華;王小林;楊思春;;自動問答系統(tǒng)中問句分類研究綜述[J];安徽工業(yè)大學學報(自然科學版);2015年01期
4 王正華;韓永國;;自動問答系統(tǒng)設(shè)計與實現(xiàn)[J];軟件導刊;2014年09期
5 楊倩倩;徐棟;;TFIDF方法在英語句子相似度計算中的應(yīng)用初探[J];電腦知識與技術(shù);2012年17期
6 涂新輝;張紅春;周琨峰;何婷婷;;中文維基百科的結(jié)構(gòu)化信息抽取及詞語相關(guān)度計算方法[J];中文信息學報;2012年03期
7 周永梅;陶紅;陳姣姣;張再躍;;自動問答系統(tǒng)中的句子相似度算法的研究[J];計算機技術(shù)與發(fā)展;2012年05期
8 田衛(wèi)東;祖永亮;;基于答案模式和語義特征融合的答案抽取方法[J];計算機工程與應(yīng)用;2011年13期
9 劉漢興;林旭東;田緒紅;;基于本體的自動答疑系統(tǒng)的研究與實現(xiàn)[J];計算機應(yīng)用;2010年02期
10 熊回香;夏立新;;自然語言處理技術(shù)在中文全文檢索中的應(yīng)用[J];情報理論與實踐;2008年03期
相關(guān)碩士學位論文 前8條
1 陳麗莎;自動問答系統(tǒng)中基于WordNet的句子相似度計算研究與實現(xiàn)[D];華南理工大學;2014年
2 汪祥;基于中文維基百科的語義相關(guān)度計算的研究與實現(xiàn)[D];國防科學技術(shù)大學;2011年
3 王振佶;面向銷售服務(wù)的自動問答系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學;2011年
4 馬莉;基于動態(tài)本體知識庫的問答系統(tǒng)的研究與實現(xiàn)[D];廣西師范大學;2009年
5 鄧昱;中文問答系統(tǒng)中的答案抽取算法研究[D];北京郵電大學;2009年
6 黃際洲;聊天機器人知識庫自動抽取算法的研究與實現(xiàn)[D];重慶大學;2006年
7 王慧慧;基于自然語言處理的問答系統(tǒng)研究[D];電子科技大學;2006年
8 曹志娟;自動問答系統(tǒng)中的問題理解與信息檢索研究[D];重慶大學;2005年
,
本文編號:
2473573
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2473573.html