天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向金融知識(shí)圖譜的實(shí)體和關(guān)系聯(lián)合抽取算法

發(fā)布時(shí)間:2021-06-20 08:37
  在知識(shí)圖譜的構(gòu)建過(guò)程中,傳統(tǒng)方法先進(jìn)行命名實(shí)體識(shí)別,再進(jìn)行關(guān)系抽取,導(dǎo)致任務(wù)間關(guān)聯(lián)信息的丟失,而且忽略了實(shí)體間的重疊關(guān)系。為此,基于能識(shí)別重疊關(guān)系的Bi-LSTM+CRF模型,通過(guò)參數(shù)共享實(shí)現(xiàn)兩個(gè)任務(wù)聯(lián)合學(xué)習(xí),充分利用任務(wù)間聯(lián)系來(lái)優(yōu)化結(jié)果。公開數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:所提出模型在實(shí)體識(shí)別上取得了78. 4%的f1值,在非重疊關(guān)系和重疊關(guān)系的抽取上取得了50. 5%和45. 0%的f1值。為驗(yàn)證該方法可后續(xù)用于金融知識(shí)圖譜構(gòu)建,提取了小型金融數(shù)據(jù)集來(lái)驗(yàn)證其在金融數(shù)據(jù)上的泛化能力。 

【文章來(lái)源】:重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)). 2020,34(05)北大核心

【文章頁(yè)數(shù)】:11 頁(yè)

【部分圖文】:

面向金融知識(shí)圖譜的實(shí)體和關(guān)系聯(lián)合抽取算法


LSTM結(jié)構(gòu)

序列,模型結(jié)構(gòu),實(shí)體,句子


在實(shí)體和關(guān)系聯(lián)合抽取的任務(wù)中,我們將句子映射到詞向量空間后輸入模型,使用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)捕捉句子中的語(yǔ)義信息,然后結(jié)合條件隨機(jī)場(chǎng),對(duì)每個(gè)輸入句子得到預(yù)測(cè)的實(shí)體標(biāo)注序列,作為實(shí)體部分的輸出。我們將實(shí)體類型標(biāo)注結(jié)果變換后和長(zhǎng)短期記憶網(wǎng)絡(luò)的輸入拼合在一起,作為關(guān)系分類器的輸入,分類器輸出的多維向量代表對(duì)每個(gè)標(biāo)注的實(shí)體對(duì)間可能存在的多種關(guān)系的預(yù)測(cè),也就是關(guān)系部分的輸出。模型整體框架見圖1。2.1.2 實(shí)體識(shí)別模型

示意圖,隨機(jī)場(chǎng),序列,標(biāo)簽


之后這一輸出被送入CRF層[19],其結(jié)構(gòu)示意如圖3所示。對(duì)于每一個(gè)輸入序列X=(x1,…,xn),當(dāng)前預(yù)測(cè)序列標(biāo)簽為y=(y1,…,yn),CRF對(duì)這個(gè)預(yù)測(cè)打分為


本文編號(hào):3238859

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/3238859.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶eb38c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com