基于復(fù)述與多信息融合的關(guān)系抽取方法研究
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖3-1方法整體流程圖??3.2.1基于遠(yuǎn)程監(jiān)督?
基于復(fù)述與多信息融合的關(guān)系抽取方法研究?第三章基于復(fù)述約束的遠(yuǎn)程監(jiān)督關(guān)系抽取??3.2算法簡介??本文以遠(yuǎn)程監(jiān)督的語料生成方法為基礎(chǔ),通過復(fù)述識別模型度量擴(kuò)充語料和關(guān)系??類型定義的語義相似度,從而對遠(yuǎn)程監(jiān)督的結(jié)果進(jìn)行優(yōu)化。本文方法框架如圖3-1所??示,首先通過遠(yuǎn)程監(jiān)督方法鏈接....
圖3-2維基百科頁面的丨nfo?
第三章基于復(fù)述約束的遠(yuǎn)程監(jiān)替關(guān)系抽取?基于復(fù)述與多信總?cè)诤系年P(guān)系抽取方法研究??作為知識庫,將維基百科頁面下的文本描述內(nèi)容以及紐約時(shí)報(bào)的新聞?wù)Z料作為外部語??料庫,用于生成樣本。下面將具體介紹兩種資源以及遠(yuǎn)程監(jiān)督方法的具體實(shí)現(xiàn)。??圖3-2顯示了維基百科中關(guān)于實(shí)體“Mfcmsq/....
圖3-4樣本過濾算法流程??但是,通過上述方法組織訓(xùn)練樣本會使得正負(fù)例樣本嚴(yán)重失衡,因?yàn)槌藰颖咀??
。??本文提出的基于復(fù)述約束的樣本過濾模型,將生成樣本是否滿足關(guān)系類型定義作??為分類目標(biāo)。因此,本文將遠(yuǎn)程監(jiān)督的生成樣本和關(guān)系類型定義進(jìn)行組合,作為基于??復(fù)述約束的樣本過濾模型的分類對象。在訓(xùn)練過程中,通過組合人T:標(biāo)注樣本和關(guān)系??類型定義生成訓(xùn)練樣本。具體地,本文隨機(jī)采樣....
圖4-1?CRNN模型框架??4.2.1框架概述??本章的模型框架主要由四部分構(gòu)成,分別是輸入序列表示、卷積層、聚合層和循??
基于復(fù)述與多信總?cè)诤系年P(guān)系抽取方法研宄?第四章融合多粒度信息的關(guān)系表征模型???探宄了多種聚合策略對信息融合的效果。??本章的組織如下:第二節(jié)介紹模型的框架和內(nèi)部各模塊策略,第三節(jié)給出實(shí)驗(yàn)設(shè)??置、實(shí)驗(yàn)結(jié)果和分析。??4.2算法簡介??本章的關(guān)系抽取模型主要包括如下三部分:卷積層....
本文編號:4042173
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4042173.html