基于神經(jīng)網(wǎng)絡(luò)的命名實體識別與實體關(guān)系聯(lián)合抽取
發(fā)布時間:2022-08-11 21:42
隨著網(wǎng)絡(luò)信息化的逐步發(fā)展,非結(jié)構(gòu)化的文本信息不斷增長,如何對大量產(chǎn)生的非結(jié)構(gòu)化文本信息進(jìn)行有效的處理成為研究的熱點。信息抽取技術(shù)因其能夠從非結(jié)構(gòu)化的文本信息中進(jìn)行結(jié)構(gòu)化抽取,受到學(xué)者們的廣泛關(guān)注。其中,命名實體識別與實體關(guān)系抽取作為信息抽取領(lǐng)域的重要課題,目前解決這個問題的方法主要分為兩類:串聯(lián)抽取和聯(lián)合抽取。串聯(lián)抽取方法是通過首先進(jìn)行命名實體識別,再進(jìn)行實體關(guān)系抽取。這種抽取方式將命名實體識別與實體關(guān)系抽取定義為兩個相互獨立的子任務(wù),它的優(yōu)點是各個模塊之間相互獨立、靈活度較高且易于實現(xiàn)。但是,它忽略了兩個任務(wù)之間的內(nèi)在聯(lián)系,而且通過串聯(lián)抽取方法進(jìn)行命名實體識別的結(jié)果會直接影響到后續(xù)進(jìn)行的實體關(guān)系抽取,極易產(chǎn)生誤差累積。聯(lián)合抽取方法旨在構(gòu)建聯(lián)合抽取模型,當(dāng)命名實體識別與實體關(guān)系抽取之間存在較強(qiáng)內(nèi)在聯(lián)系或依賴關(guān)系時,聯(lián)合抽取模型能夠更好的整合兩者之間的信息,降低各個中間步驟產(chǎn)生的錯誤,進(jìn)而提升抽取模型的性能。本文通過充分分析命名實體識別與實體關(guān)系聯(lián)合抽取方法的研究現(xiàn)狀,對目前在命名實體識別與實體關(guān)系聯(lián)合抽取領(lǐng)域效果顯著的幾種方法進(jìn)行分析與實驗,依據(jù)傳統(tǒng)聯(lián)合抽取模型存在的不足,本文提出以下...
【文章頁數(shù)】:42 頁
【學(xué)位級別】:碩士
【部分圖文】:
LSTM模型
長短時記憶模塊
BiLSTM模型
本文編號:3675443
【文章頁數(shù)】:42 頁
【學(xué)位級別】:碩士
【部分圖文】:
LSTM模型
長短時記憶模塊
BiLSTM模型
本文編號:3675443
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3675443.html
最近更新
教材專著