天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于自動(dòng)生成模板的知識庫問答方法研究

發(fā)布時(shí)間:2021-08-04 13:18
  知識庫問答是自然語言處理領(lǐng)域中的一項(xiàng)重要任務(wù),其目的是對自然語言描述的問題,從知識庫中查找或推斷出問題答案,關(guān)于知識庫問答的研究具有重要的價(jià)值和意義。使用手工模板實(shí)現(xiàn)知識庫問答是一種經(jīng)典的方法,但是面對復(fù)雜的自然語言,以及與日俱增的用戶問題數(shù)量,傳統(tǒng)的手工模板暴露出模板構(gòu)建難度高、構(gòu)建出的模板數(shù)量少的問題。本文提出了一種基于自動(dòng)生成模板的知識庫問答方法。使用現(xiàn)有的訓(xùn)練問題答案對,在關(guān)系詞典基礎(chǔ)上,自動(dòng)地生成模板,并使用生成出的模板回答測試問題。其次,對于沒有模板匹配或者模板返回答案集合為空的測試問題,本文提出了一種計(jì)算問題之間相似度,使用相似問題協(xié)助進(jìn)行問答的方法,補(bǔ)充完善模板問答方法。本文的主要研究內(nèi)容如下:(1)提出了自動(dòng)的模板生成方法。本文通過遠(yuǎn)監(jiān)督的方法構(gòu)建了關(guān)系詞典,搭建自然語言與知識庫之間的映射。使用訓(xùn)練問題與答案的組合,借助關(guān)系詞典,抽取問題的詞性和依存句法組成的樹結(jié)構(gòu)問題模板,從問題查詢圖中抽取查詢圖結(jié)構(gòu)組成的圖結(jié)構(gòu)查詢模板,問題模板和查詢模板的組合構(gòu)成本文模板。(2)使用自動(dòng)生成的模板回答問題。對于測試問題,將模板庫與問題進(jìn)行匹配,匹配成功的模板會(huì)生成候選查詢。本文使... 

【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:61 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于自動(dòng)生成模板的知識庫問答方法研究


sigmoid函數(shù)

激活函數(shù),向量,語義


東南大學(xué)碩士學(xué)位論文36通道輸出一個(gè)長度為kernel_num的向量,將這4個(gè)向量將輸入在下一層中,通過向量操作計(jì)算得出問題的語義相似度。4.3.5輸出層在上一層通過卷積操作,得到了4個(gè)長度為kernel_num的向量1、2、3、4。在本層中,首先將四個(gè)向量進(jìn)行橫向拼接,得到維度為一個(gè)4*kernel_num的向量,使用這個(gè)向量作為問題的低維語義向量v=[1,2,3,4]。兩個(gè)問題q1和q2的語義相似度,就可以通過如下公式進(jìn)行計(jì)算:sim(1,2)=cos(1,2)(43)選擇cos函數(shù)作為計(jì)算兩個(gè)向量之間的距離,可以控制結(jié)果在(0,1)之間。本文參考經(jīng)典的HingeLoss,將模型的損失函數(shù)設(shè)置為:(,+,)=(((+,)(,)))(44)損失函數(shù)的目的是最大化正樣本和負(fù)樣本之間的距離,即最大化語義相似問題與語義不相似問題之間的距離。(+,)(,)是正樣本與負(fù)樣本之間的距離,若正負(fù)樣本距離大于margin,則在激活函數(shù)relu的作用下?lián)p失為0;若正負(fù)樣本距離小于margin,正負(fù)樣本間距離太小,則產(chǎn)生損失,反向傳播損失值,迭代更新模型網(wǎng)絡(luò)參數(shù)。圖4-4激活函數(shù)relu問題“wherearethe<e>headquarterslocated”在這一層就被嵌入式表達(dá)成為向量,候選問題“whereisthe<e>headquarters”使用同一個(gè)網(wǎng)絡(luò),得到候選問題的嵌入表達(dá),計(jì)算與之間的余弦值,這個(gè)值就是兩個(gè)問題之間的語義相似度。4.4模型訓(xùn)練在4.3小節(jié)中,本文介紹了問題語義相似度計(jì)算的模型,在這一節(jié)中,本文將介紹模型訓(xùn)練集構(gòu)造和模型參數(shù)的選擇。

【參考文獻(xiàn)】:
期刊論文
[1]基于注意力機(jī)制的句子排序方法[J]. 欒克鑫,杜新凱,孫承杰,劉秉權(quán),王曉龍.  中文信息學(xué)報(bào). 2018(01)
[2]基于主題敏感的重啟隨機(jī)游走實(shí)體鏈接方法[J]. 李茂林.  北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(01)
[3]面向微博搜索的時(shí)間敏感的排序?qū)W習(xí)方法[J]. 王書鑫,衛(wèi)冰潔,魯驍,王斌.  中文信息學(xué)報(bào). 2015(04)
[4]改進(jìn)的基于句模匹配算法的問句理解方法[J]. 馬莉,唐素勤,陳立娜,蔣運(yùn)承.  計(jì)算機(jī)工程. 2009(20)
[5]問答系統(tǒng)中復(fù)雜類問題的分析方法研究[J]. 劉磊,郭麗,白宇,蔡東風(fēng).  沈陽航空工業(yè)學(xué)院學(xué)報(bào). 2009(03)
[6]基于本體的受限領(lǐng)域問答系統(tǒng)研究[J]. 劉杰,樊孝忠,王濤.  廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2009(01)



本文編號:3321769

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3321769.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶651b3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com