基于深度學(xué)習(xí)的聯(lián)合實體識別和關(guān)系抽取模型研究
發(fā)布時間:2021-10-17 18:21
實體識別和關(guān)系抽取是自然語言處理領(lǐng)域中兩個十分經(jīng)典的問題。能夠快速準(zhǔn)確的識別出實體對及其之間的語義關(guān)系,對于信息抽取有著必不可少的作用,同時在進(jìn)行知識圖譜的創(chuàng)建過程以及信息搜索等領(lǐng)域都有著至關(guān)重要的意義。隨著互聯(lián)網(wǎng)的快速發(fā)展,數(shù)據(jù)量暴增,對知識服務(wù)的要求越來越高。因此實體關(guān)系抽取技術(shù)也成為了近年來學(xué)術(shù)界和工業(yè)界的研究熱點之一,并在信息檢索、問答系統(tǒng)、知識庫創(chuàng)建、知識圖譜等眾多領(lǐng)域發(fā)揮著極大的作用。隨著深度學(xué)習(xí)的發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的實體識別和關(guān)系抽取技術(shù)的優(yōu)勢得到充分的顯現(xiàn),逐漸成為了當(dāng)前使用主流的方法之一。本文研究了基于深度學(xué)習(xí)的聯(lián)合實體識別和關(guān)系抽取模型,文章所做的主要工作內(nèi)容和創(chuàng)新點包含如下的幾個方面:1.總結(jié)了實體識別和關(guān)系抽取作為自然語言處理領(lǐng)域的兩大熱點任務(wù)的研究背景和研究意義,介紹了實體識別和關(guān)系抽取任務(wù)的原理、質(zhì)量評價指標(biāo)并回顧了實體識別和關(guān)系抽取的發(fā)展歷史和國內(nèi)外研究現(xiàn)狀。概括介紹了深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)相關(guān)的基礎(chǔ)理論如基于神經(jīng)網(wǎng)絡(luò)的詞向量技術(shù)、卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、循環(huán)神經(jīng)網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)和優(yōu)化算法等。2.提出了一種基于雙向長短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)實體關(guān)系抽取聯(lián)合模型。該...
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
實體識別樣例
關(guān)系抽取樣例
合肥工業(yè)大學(xué)碩士學(xué)位論文10夠獲得詞序信息,F(xiàn)astText方法在輸入層中增加了n-gram特征,其輸入為n-gram特征和句子中的每個詞,輸出為文本的標(biāo)簽。圖2.3Skip-gram模型和CBOW模型邏輯框圖Fig2.3LogicblockdiagramofSkip-grammodelandCBOWmodel2.3.2卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)最早在上個世紀(jì)八十年代誕生了卷積神經(jīng)網(wǎng)絡(luò)的雛形,卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種典型的人工神經(jīng)網(wǎng)絡(luò)算法,之后神經(jīng)延遲網(wǎng)絡(luò)和LeNet-5隨之被人們開發(fā)出來,近些年由于深度學(xué)習(xí)中持續(xù)的理論研究,卷積神經(jīng)網(wǎng)絡(luò)也迅速發(fā)展,被應(yīng)用于眾多領(lǐng)域[52-53]。1989年,LeCun在自己的論文中第一次提到了卷積神經(jīng)網(wǎng)絡(luò)這個概念,這種比較簡單的全連接網(wǎng)絡(luò)有著訓(xùn)練容易、泛化能力強(qiáng)等好處。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)種類繁多,可以包括很多層,當(dāng)前層以上一層學(xué)習(xí)獲得特征為樣本,進(jìn)行新的特征獲取工作,最后完成各自的學(xué)習(xí),卷積神經(jīng)網(wǎng)絡(luò)通過隨著網(wǎng)絡(luò)層數(shù)的增加,提出的圖像特征將更為抽象,并且輸入的全局特征也可以被網(wǎng)絡(luò)學(xué)習(xí)到。卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點在于網(wǎng)絡(luò)本身設(shè)計時所存在的兩個特點,權(quán)值共享和局部連接。卷積神經(jīng)網(wǎng)絡(luò)依靠局部連接將復(fù)雜度顯著降低。權(quán)值共享可以使輸入共用一樣的參數(shù)矩陣來特征提取,這樣使神經(jīng)網(wǎng)絡(luò)能夠無需學(xué)習(xí)輸入的所有卷積核參數(shù),只用一組的卷積核參數(shù)就能完成整個網(wǎng)絡(luò)的特征提取,顯著降低了網(wǎng)絡(luò)中計算的參數(shù)量,就可以通過共享同一組卷積核的參數(shù)再來生成一副完整的特征圖。卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)一般會采用卷積層、池化層和激活函數(shù)層相互交替堆疊,以下部分對卷積層、激活函數(shù)分別進(jìn)行介紹,并對批歸一化以進(jìn)行簡單的概述。1)卷積層卷積的運(yùn)算能夠簡化成使用了一個滑窗濾波器,在完整的一幅輸入圖像上按
【參考文獻(xiàn)】:
期刊論文
[1]基于COAE2016數(shù)據(jù)集的中文實體關(guān)系抽取算法研究[J]. 孫建東,顧秀森,李彥,徐蔚然. 山東大學(xué)學(xué)報(理學(xué)版). 2017(09)
[2]基于維基百科和模式聚類的實體關(guān)系抽取方法[J]. 張葦如,孫樂,韓先培. 中文信息學(xué)報. 2012(02)
[3]命名實體識別研究[J]. 張曉艷,王挺,陳火旺. 計算機(jī)科學(xué). 2005(04)
碩士論文
[1]基于深度學(xué)習(xí)的中文命名實體識別研究[D]. 王國昱.北京工業(yè)大學(xué) 2015
[2]音樂領(lǐng)域中文實體關(guān)系抽取研究[D]. 周藍(lán)珺.哈爾濱工業(yè)大學(xué) 2009
本文編號:3442211
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
實體識別樣例
關(guān)系抽取樣例
合肥工業(yè)大學(xué)碩士學(xué)位論文10夠獲得詞序信息,F(xiàn)astText方法在輸入層中增加了n-gram特征,其輸入為n-gram特征和句子中的每個詞,輸出為文本的標(biāo)簽。圖2.3Skip-gram模型和CBOW模型邏輯框圖Fig2.3LogicblockdiagramofSkip-grammodelandCBOWmodel2.3.2卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)最早在上個世紀(jì)八十年代誕生了卷積神經(jīng)網(wǎng)絡(luò)的雛形,卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種典型的人工神經(jīng)網(wǎng)絡(luò)算法,之后神經(jīng)延遲網(wǎng)絡(luò)和LeNet-5隨之被人們開發(fā)出來,近些年由于深度學(xué)習(xí)中持續(xù)的理論研究,卷積神經(jīng)網(wǎng)絡(luò)也迅速發(fā)展,被應(yīng)用于眾多領(lǐng)域[52-53]。1989年,LeCun在自己的論文中第一次提到了卷積神經(jīng)網(wǎng)絡(luò)這個概念,這種比較簡單的全連接網(wǎng)絡(luò)有著訓(xùn)練容易、泛化能力強(qiáng)等好處。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)種類繁多,可以包括很多層,當(dāng)前層以上一層學(xué)習(xí)獲得特征為樣本,進(jìn)行新的特征獲取工作,最后完成各自的學(xué)習(xí),卷積神經(jīng)網(wǎng)絡(luò)通過隨著網(wǎng)絡(luò)層數(shù)的增加,提出的圖像特征將更為抽象,并且輸入的全局特征也可以被網(wǎng)絡(luò)學(xué)習(xí)到。卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點在于網(wǎng)絡(luò)本身設(shè)計時所存在的兩個特點,權(quán)值共享和局部連接。卷積神經(jīng)網(wǎng)絡(luò)依靠局部連接將復(fù)雜度顯著降低。權(quán)值共享可以使輸入共用一樣的參數(shù)矩陣來特征提取,這樣使神經(jīng)網(wǎng)絡(luò)能夠無需學(xué)習(xí)輸入的所有卷積核參數(shù),只用一組的卷積核參數(shù)就能完成整個網(wǎng)絡(luò)的特征提取,顯著降低了網(wǎng)絡(luò)中計算的參數(shù)量,就可以通過共享同一組卷積核的參數(shù)再來生成一副完整的特征圖。卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)一般會采用卷積層、池化層和激活函數(shù)層相互交替堆疊,以下部分對卷積層、激活函數(shù)分別進(jìn)行介紹,并對批歸一化以進(jìn)行簡單的概述。1)卷積層卷積的運(yùn)算能夠簡化成使用了一個滑窗濾波器,在完整的一幅輸入圖像上按
【參考文獻(xiàn)】:
期刊論文
[1]基于COAE2016數(shù)據(jù)集的中文實體關(guān)系抽取算法研究[J]. 孫建東,顧秀森,李彥,徐蔚然. 山東大學(xué)學(xué)報(理學(xué)版). 2017(09)
[2]基于維基百科和模式聚類的實體關(guān)系抽取方法[J]. 張葦如,孫樂,韓先培. 中文信息學(xué)報. 2012(02)
[3]命名實體識別研究[J]. 張曉艷,王挺,陳火旺. 計算機(jī)科學(xué). 2005(04)
碩士論文
[1]基于深度學(xué)習(xí)的中文命名實體識別研究[D]. 王國昱.北京工業(yè)大學(xué) 2015
[2]音樂領(lǐng)域中文實體關(guān)系抽取研究[D]. 周藍(lán)珺.哈爾濱工業(yè)大學(xué) 2009
本文編號:3442211
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3442211.html
最近更新
教材專著