基于大規(guī)模知識圖譜的自動(dòng)問答技術(shù)研究
發(fā)布時(shí)間:2021-02-12 04:52
隨著大規(guī)模知識圖譜的構(gòu)建,基于知識圖譜的自動(dòng)問答成為自然語言處理領(lǐng)域的研究熱點(diǎn)。該任務(wù)旨在用知識圖譜中的三元組回答用戶問題,使用戶能夠高效、準(zhǔn)確地獲取知識。然而,知識圖譜問答由于知識圖譜規(guī)模龐大、問題和答案數(shù)據(jù)異構(gòu)而存在挑戰(zhàn)。目前大量工作關(guān)注于分段式建模問題與三元組的局部匹配,從而進(jìn)行答案選擇。然而這樣忽略了不同匹配子任務(wù)之間的關(guān)聯(lián),容易帶來誤差傳播問題。此外,由于缺乏大規(guī)模無偏標(biāo)注數(shù)據(jù),模型遇到低頻或者未登錄關(guān)系時(shí)效果容易變差。因此,本文利用深度學(xué)習(xí)方法進(jìn)行模型改進(jìn),利用外部數(shù)據(jù)和逆任務(wù)進(jìn)行模型提升。本文主要工作包括如下幾個(gè)方面:·基于序列標(biāo)注模型的子圖檢索 利用整個(gè)知識圖譜作為候選答案是不切實(shí)際的,因此需要檢索出與問題相關(guān)的子圖,減小模型的搜索空間。本文首先構(gòu)建了基于Bi-LSTM的序列標(biāo)注模型識別問題的主題實(shí)體,接著設(shè)計(jì)了啟發(fā)式算法進(jìn)行主題實(shí)體和知識圖譜中候選實(shí)體的匹配,該算法結(jié)合了融入先驗(yàn)知識的擴(kuò)展匹配和基于Jaccard的模糊匹配,旨在修改該階段的誤差,從而擴(kuò)大實(shí)體召回,產(chǎn)生高質(zhì)量的候選答案集合!せ诙嗳蝿(wù)學(xué)習(xí)的候選重排模型 在候選答案重排階段,本文針對現(xiàn)有的問題答案匹配框...
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:97 頁
【學(xué)位級別】:碩士
【部分圖文】:
Elasticsearch可視化界面Kibana
本文編號:3030289
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:97 頁
【學(xué)位級別】:碩士
【部分圖文】:
Elasticsearch可視化界面Kibana
本文編號:3030289
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3030289.html
最近更新
教材專著