問答系統(tǒng)的答案優(yōu)化方法研究

發(fā)布時間：2018-01-02 15:22

本文關鍵詞：問答系統(tǒng)的答案優(yōu)化方法研究　出處：《哈爾濱工業(yè)大學》2017年博士論文　論文類型：學位論文

【摘要】：隨著大數(shù)據(jù)時代的到來和計算機硬件體系的不斷更新,人工智能在學術界和產(chǎn)業(yè)界都取得了長足的發(fā)展,如人機博弈、自動控制等。自動問答是人工智能的一個重要分支,它建立在自然語言理解的基礎上,能夠針對真實環(huán)境下用戶的提問給出精簡準確的反饋以滿足其信息需求。問答系統(tǒng)的性能往往依賴于內容準確、表達合理的高質量知識庫,其來源主要為互聯(lián)網(wǎng)上大規(guī)模的異構信息;然而,由于互聯(lián)網(wǎng)用戶群體的復雜性和知識抽取方法的不完備性,問答系統(tǒng)知識庫中存儲的候選答案常會出現(xiàn)表述不合理的情形,例如答案語句的語法表達不當、語義關系表述失準或給出的回復對上下文信息考慮不足等,另外,問答系統(tǒng)在線運行時的復雜環(huán)境也使得不可靠答案的出現(xiàn)難以避免�；谝陨戏治�,本文提出問答系統(tǒng)的答案優(yōu)化方法,旨在對答案中潛在的不合理表述進行校驗,從而優(yōu)化答案質量,提高問答系統(tǒng)的回復能力。主要研究內容包括:1、基于深度卷積神經(jīng)網(wǎng)絡的答案語法錯誤修正�；ヂ�(lián)網(wǎng)用戶群體的復雜性使得不符合語法表達規(guī)范語句的存在難以避免,而互聯(lián)網(wǎng)作為自動問答系統(tǒng)知識庫的主要來源,其語言表達的不規(guī)范性將直接影響到系統(tǒng)生成答案的質量,進而影響用戶的體驗。本文從語法層次出發(fā),主要探索如何自動發(fā)現(xiàn)語句中的語法表達錯誤問題并加以修正,以保證系統(tǒng)返回答案中語法表達的合理性。為此,本文提出基于深度卷積神經(jīng)網(wǎng)絡的語法錯誤檢測模型,模型使用詞向量和詞性向量作為輸入,通過卷積神經(jīng)網(wǎng)絡對候選樣本的上下文進行特征學習。模型學習的目標函數(shù)為最大化預測值和觀察值之間的邊緣間隔。實驗證明,與傳統(tǒng)統(tǒng)計學習方法相比,本文提出的深度模型對語法錯誤產(chǎn)生時的上下文特征具備更強的學習能力,并能取得比傳統(tǒng)方法更優(yōu)的結果。2、基于弱監(jiān)督學習的答案語義關系抽取。大規(guī)模語義知識庫可以為問答系統(tǒng)回答事實類問題提供支持,但由于知識抽取等方法仍存在一定局限性,語義知識庫中難免會存在不準確、不合理或過時的語義信息,從而導致答案中對于語義的表述出現(xiàn)異常。本文從語義層次考慮,主要研究如何根據(jù)已有的小規(guī)模語義知識庫和較新的大規(guī)模自由文本學習新的語義關系,從而更新和補充問答系統(tǒng)的語義知識庫。弱監(jiān)督學習是實體語義關系抽取的主要路線之一,也是對知識庫進行更新和補充的重要途徑,本文在弱監(jiān)督學習的基礎上提出基于高質量樣本的實體語義關系抽取模型。在參數(shù)學習過程中,模型通過應用多種評價策略來選擇高質量訓練樣本,以降低不可靠樣本對分類的影響、優(yōu)化語義關系分類器。實驗證明,基于高質量樣本的實體語義關系抽取模型可以有效降低訓練樣本集合中的噪聲,與基準方法相比,模型能夠取得更優(yōu)的F_1值和P-R曲線。3、基于上下文的社區(qū)問答答案選擇。社區(qū)問答網(wǎng)站為問答系統(tǒng)知識庫的構建提供了大量資源,而如何利用上下文信息進行答案選擇是針對社區(qū)問答所開展研究中的一個難點。本文從語境層次考慮,主要研究如何高效、全面地學習和利用上下文信息來進行答案選擇(即問答對抽取)。通過分析發(fā)現(xiàn),社區(qū)問答的答案質量與內容關聯(lián)和標簽依賴兩種上下文關系密切相關,為此,本文提出基于上下文的答案選擇深度模型,該模型通過深度卷積神經(jīng)網(wǎng)絡對問題和答案進行編碼,利用融合注意力機制的長短時記憶網(wǎng)絡對內容關聯(lián)進行學習,并使用條件隨機場對標簽依賴進行學習。實驗證明,兩種上下文關系在答案選擇過程中不可或缺,提出的模型相較于對比方法能夠獲得更優(yōu)的F1值。4、基于用戶反饋的不可靠答案識別。用戶反饋是自動問答系統(tǒng)成長和進化的良藥,除了顯式的用戶評分,人機交互過程中的用戶行為也在一定程度上反映了答案的優(yōu)劣。本文從語境層次考慮,主要研究如何有效地捕捉真實人機交互過程中用戶所反饋出的不可靠答案,從而為答案的進一步優(yōu)化或知識庫的更新提供依據(jù)。通過分析發(fā)現(xiàn),對話系統(tǒng)中的用戶反饋包括用戶意圖和用戶情感兩個方面,系統(tǒng)回復的不可靠答案通常由用戶進一步的動作或表現(xiàn)出的情緒反映出來。為了研究人機對話中不可靠答案與用戶反饋之間的關系,本文首先構建了一個真實環(huán)境下的對話數(shù)據(jù)集并對其中的不可靠答案進行標注和分析,然后通過定義一系列語法和語義等特征來描述兩種用戶反饋因素,并利用有監(jiān)督學習方法對不可靠答案進行識別。實驗證明考慮用戶意圖和情感兩方面因素能夠更好的識別出不可靠答案,從而為系統(tǒng)優(yōu)化提供更有價值的線索。
[Abstract]:In this paper , based on deep convolution neural network , this paper puts forward an answer optimization method based on deep convolution neural network , which can be used as the main source of the knowledge base of automatic question and answer system . This paper studies how to efficiently and comprehensively learn and use context information to study the answers . In order to study the relationship between user ' s intention and user ' s feedback , this paper mainly studies how to efficiently and comprehensively study and use context information to identify the answers .

【學位授予單位】：哈爾濱工業(yè)大學
【學位級別】：博士
【學位授予年份】：2017
【分類號】：TP391.1;TP18

【參考文獻】

相關期刊論文前2條

1 趙妍妍;秦兵;劉挺;;文本情感分析[J];軟件學報;2010年08期

2 范士喜;王曉龍;王軒;張耀允;;面向真實環(huán)境的問句分析方法[J];電子學報;2010年05期

，

本文編號：1369791

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/shoufeilunwen/xxkjbs/1369791.html

上一篇：自適應光學系統(tǒng)傾斜校正技術研究
下一篇：基于深亞微米CMOS工藝的多標準全波段數(shù)字廣播接收機RF芯片研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

問答系統(tǒng)的答案優(yōu)化方法研究