基于GRU-CRF的中文命名實(shí)體識別方法研究
發(fā)布時間:2021-03-07 05:22
中文命名實(shí)體識別作為中文自然語言處理領(lǐng)域中的基本任務(wù)之一,是中文自然語言處理綜合應(yīng)用中機(jī)器翻譯、信息抽取等任務(wù)的基礎(chǔ)環(huán)節(jié),直接影響自然語言處理后續(xù)工作的性能。隨著網(wǎng)絡(luò)文本資源的增長,從網(wǎng)絡(luò)中高效地發(fā)現(xiàn)和獲取新知識,通過文本更方便地進(jìn)行知識挖掘和分析,中文命名實(shí)體識別發(fā)揮著重大作用。研究實(shí)現(xiàn)基于深度學(xué)習(xí)的中文命名實(shí)體特征提取算法來更好地識別中文命名實(shí)體的實(shí)體特征,提高系統(tǒng)對中文命名實(shí)體特征的識別能力,是基于深度學(xué)習(xí)的命名實(shí)體識別問題研究的重要內(nèi)容。論文以基于深度學(xué)習(xí)的命名實(shí)體識別為主要研究內(nèi)容。首先,對國內(nèi)外命名實(shí)體識別的解決方法進(jìn)行了研究,而后,針對近幾年基于深度學(xué)習(xí)的相關(guān)神經(jīng)網(wǎng)絡(luò)解決命名實(shí)體識別的方法進(jìn)行分析,深入研究了基于循環(huán)神經(jīng)網(wǎng)絡(luò)、長短時記憶神經(jīng)網(wǎng)絡(luò)、門控循環(huán)單元網(wǎng)絡(luò)等模型的中文命名實(shí)體特征提取算法。最終提出了解決中文命名實(shí)體識別問題的新方案。針對中文命名實(shí)體識別提出一種門控循環(huán)單元網(wǎng)絡(luò)(GRU)和條件隨機(jī)場(CRF)相結(jié)合的神經(jīng)網(wǎng)絡(luò)模型。對該模型在中文命名實(shí)體識別任務(wù)的應(yīng)用進(jìn)行深入研究,優(yōu)化了模型訓(xùn)練過程對于中文命名實(shí)體特征提取的效果,解決了實(shí)驗(yàn)中中文標(biāo)注語料匱乏的問題,使其...
【文章來源】:哈爾濱理工大學(xué)黑龍江省
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文研究的主要內(nèi)容
第2章 神經(jīng)網(wǎng)絡(luò)與條件隨機(jī)場
2.1 神經(jīng)網(wǎng)絡(luò)理論
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 基本循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3 長短時記憶神經(jīng)網(wǎng)絡(luò)
2.3.1 LSTM網(wǎng)絡(luò)
2.3.2 雙向長短時記憶神經(jīng)網(wǎng)絡(luò)
2.4 門控循環(huán)單元
2.4.1 GRU結(jié)構(gòu)分析
2.4.2 雙向GRU結(jié)構(gòu)分析
2.5 條件隨機(jī)場
2.6 其他神經(jīng)網(wǎng)絡(luò)整體模型
2.6.1 RNN-CRF網(wǎng)絡(luò)模型
2.6.2 LSTM-CRF網(wǎng)絡(luò)模型
2.7 本章小結(jié)
第3章 中文命名實(shí)體識別模型設(shè)計(jì)
3.1 GRU-CRF整體網(wǎng)絡(luò)模型
3.2 網(wǎng)絡(luò)模型原理
3.3 模型結(jié)構(gòu)流程
3.3.1 整體網(wǎng)絡(luò)模型的訓(xùn)練過程
3.3.2 整體網(wǎng)絡(luò)模型的識別
3.4 本章小結(jié)
第4章 實(shí)驗(yàn)與分析
4.1 環(huán)境配置和語料預(yù)處理
4.1.1 Tensorflow深度學(xué)習(xí)框架
4.1.2 中文語料預(yù)處理
4.2 語料標(biāo)注集和評估指標(biāo)
4.2.1 語料標(biāo)注集
4.2.2 評估指標(biāo)
4.3 實(shí)驗(yàn)結(jié)果分析
4.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文及獲得成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于語義理解注意力神經(jīng)網(wǎng)絡(luò)的多元特征融合中文文本分類[J]. 謝金寶,侯永進(jìn),康守強(qiáng),李佰蔚,張霄. 電子與信息學(xué)報(bào). 2018(05)
[2]基于深度神經(jīng)網(wǎng)絡(luò)的中文命名實(shí)體識別[J]. 張海楠,伍大勇,劉悅,程學(xué)旗. 中文信息學(xué)報(bào). 2017(04)
[3]基于BLSTM的命名實(shí)體識別方法[J]. 馮艷紅,于紅,孫庚,孫娟娟. 計(jì)算機(jī)科學(xué). 2018(02)
[4]大數(shù)據(jù)背景下數(shù)據(jù)新聞的文本挖掘算法的研究[J]. 程鈴鈁,黃澤文. 科技廣場. 2017(04)
[5]基于深度學(xué)習(xí)的算法知識實(shí)體識別與發(fā)現(xiàn)[J]. 朱國進(jìn),沈盼宇. 智能計(jì)算機(jī)與應(yīng)用. 2017(01)
[6]基于遞歸神經(jīng)網(wǎng)絡(luò)的文本分類研究[J]. 黃磊,杜昌順. 北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[7]深度學(xué)習(xí)研究與進(jìn)展[J]. 孫志遠(yuǎn),魯成祥,史忠植,馬剛. 計(jì)算機(jī)科學(xué). 2016(02)
[8]中英命名實(shí)體識別及對齊中的中文分詞優(yōu)化[J]. 尹存燕,黃書劍,戴新宇,陳家駿. 電子學(xué)報(bào). 2015(08)
[9]面向軍事文本的命名實(shí)體識別[J]. 馮蘊(yùn)天,張宏軍,郝文寧. 計(jì)算機(jī)科學(xué). 2015(07)
[10]基于CRF和規(guī)則相結(jié)合的地理命名實(shí)體識別方法[J]. 何炎祥,羅楚威,胡彬堯. 計(jì)算機(jī)應(yīng)用與軟件. 2015(01)
本文編號:3068473
【文章來源】:哈爾濱理工大學(xué)黑龍江省
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文研究的主要內(nèi)容
第2章 神經(jīng)網(wǎng)絡(luò)與條件隨機(jī)場
2.1 神經(jīng)網(wǎng)絡(luò)理論
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 基本循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3 長短時記憶神經(jīng)網(wǎng)絡(luò)
2.3.1 LSTM網(wǎng)絡(luò)
2.3.2 雙向長短時記憶神經(jīng)網(wǎng)絡(luò)
2.4 門控循環(huán)單元
2.4.1 GRU結(jié)構(gòu)分析
2.4.2 雙向GRU結(jié)構(gòu)分析
2.5 條件隨機(jī)場
2.6 其他神經(jīng)網(wǎng)絡(luò)整體模型
2.6.1 RNN-CRF網(wǎng)絡(luò)模型
2.6.2 LSTM-CRF網(wǎng)絡(luò)模型
2.7 本章小結(jié)
第3章 中文命名實(shí)體識別模型設(shè)計(jì)
3.1 GRU-CRF整體網(wǎng)絡(luò)模型
3.2 網(wǎng)絡(luò)模型原理
3.3 模型結(jié)構(gòu)流程
3.3.1 整體網(wǎng)絡(luò)模型的訓(xùn)練過程
3.3.2 整體網(wǎng)絡(luò)模型的識別
3.4 本章小結(jié)
第4章 實(shí)驗(yàn)與分析
4.1 環(huán)境配置和語料預(yù)處理
4.1.1 Tensorflow深度學(xué)習(xí)框架
4.1.2 中文語料預(yù)處理
4.2 語料標(biāo)注集和評估指標(biāo)
4.2.1 語料標(biāo)注集
4.2.2 評估指標(biāo)
4.3 實(shí)驗(yàn)結(jié)果分析
4.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文及獲得成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于語義理解注意力神經(jīng)網(wǎng)絡(luò)的多元特征融合中文文本分類[J]. 謝金寶,侯永進(jìn),康守強(qiáng),李佰蔚,張霄. 電子與信息學(xué)報(bào). 2018(05)
[2]基于深度神經(jīng)網(wǎng)絡(luò)的中文命名實(shí)體識別[J]. 張海楠,伍大勇,劉悅,程學(xué)旗. 中文信息學(xué)報(bào). 2017(04)
[3]基于BLSTM的命名實(shí)體識別方法[J]. 馮艷紅,于紅,孫庚,孫娟娟. 計(jì)算機(jī)科學(xué). 2018(02)
[4]大數(shù)據(jù)背景下數(shù)據(jù)新聞的文本挖掘算法的研究[J]. 程鈴鈁,黃澤文. 科技廣場. 2017(04)
[5]基于深度學(xué)習(xí)的算法知識實(shí)體識別與發(fā)現(xiàn)[J]. 朱國進(jìn),沈盼宇. 智能計(jì)算機(jī)與應(yīng)用. 2017(01)
[6]基于遞歸神經(jīng)網(wǎng)絡(luò)的文本分類研究[J]. 黃磊,杜昌順. 北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[7]深度學(xué)習(xí)研究與進(jìn)展[J]. 孫志遠(yuǎn),魯成祥,史忠植,馬剛. 計(jì)算機(jī)科學(xué). 2016(02)
[8]中英命名實(shí)體識別及對齊中的中文分詞優(yōu)化[J]. 尹存燕,黃書劍,戴新宇,陳家駿. 電子學(xué)報(bào). 2015(08)
[9]面向軍事文本的命名實(shí)體識別[J]. 馮蘊(yùn)天,張宏軍,郝文寧. 計(jì)算機(jī)科學(xué). 2015(07)
[10]基于CRF和規(guī)則相結(jié)合的地理命名實(shí)體識別方法[J]. 何炎祥,羅楚威,胡彬堯. 計(jì)算機(jī)應(yīng)用與軟件. 2015(01)
本文編號:3068473
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3068473.html
最近更新
教材專著