基于序列模型的作戰(zhàn)文書知識(shí)抽取技術(shù)研究
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
圖1重疊實(shí)體關(guān)系示例2本文模型描述
司?鋁煊虻墓叵搗擲嚳椒ā?以上關(guān)于軍事知識(shí)抽取的模型均屬于流水線模型。然而流水線模型有一些共同的問(wèn)題:由于關(guān)系抽取是建立在實(shí)體識(shí)別的結(jié)果上的,所以實(shí)體識(shí)別的誤差會(huì)傳遞到關(guān)系抽取中,對(duì)關(guān)系抽取造成較大的影響。另外,現(xiàn)有的關(guān)系抽取模型大多側(cè)重于在一個(gè)句子中處理單個(gè)關(guān)系的場(chǎng)景,但在一個(gè)....
圖3輸入語(yǔ)句的全局位置與相對(duì)位置
的啟發(fā)對(duì)位置向量進(jìn)行處理。由于作戰(zhàn)文書中比較固定的句式,部隊(duì)名稱這種命名實(shí)體一般會(huì)出現(xiàn)在句子的開頭,軍事任務(wù)這種命名實(shí)體一般會(huì)出現(xiàn)在句子的末尾,因此詞語(yǔ)在句子中的全局位置就帶有一定規(guī)律,通過(guò)加入詞語(yǔ)的全局位置向量可以增強(qiáng)模型中注意力機(jī)制的效果。另一方面,對(duì)于關(guān)系抽取來(lái)說(shuō),句子中詞....
圖4抽取重疊實(shí)體關(guān)系測(cè)試從圖4中可以發(fā)現(xiàn)隨著一個(gè)句子中包含關(guān)系
總第310期4以及大于等于5的重疊實(shí)體關(guān)系數(shù)。最終測(cè)試結(jié)果如圖4所示。圖4抽取重疊實(shí)體關(guān)系測(cè)試從圖4中可以發(fā)現(xiàn)隨著一個(gè)句子中包含關(guān)系的數(shù)量的增加,關(guān)系抽取的性能也就逐漸下降。但是當(dāng)句子有重復(fù)的一到三個(gè)關(guān)系三元組時(shí),本文模型仍能保持一定的準(zhǔn)確率,當(dāng)重復(fù)關(guān)系數(shù)大于4時(shí),關(guān)系抽取的能力....
圖5總體指標(biāo)對(duì)比由于本文并未將實(shí)體識(shí)別的誤差引入到關(guān)系
是朱等[8]使用的BiLSTM-ATT模型,該模型通過(guò)BiLSTM層提取句子特征,經(jīng)過(guò)語(yǔ)義注意力機(jī)制層后輸入到分類器中實(shí)現(xiàn)了軍事文本關(guān)系抽齲由于這兩種模型都是關(guān)系分類模型,沒有識(shí)別重疊實(shí)體關(guān)系的能力,因此本文將作戰(zhàn)文書數(shù)據(jù)集中的非重疊實(shí)體關(guān)系句作為訓(xùn)練和測(cè)試集。在非重疊實(shí)體關(guān)系句....
本文編號(hào):3947858
本文鏈接:http://sikaile.net/kejilunwen/jingguansheji/3947858.html