基于級聯(lián)神經(jīng)網(wǎng)絡(luò)的命名實體識別深度訓(xùn)練技術(shù)
發(fā)布時間:2021-03-14 23:43
命名實體識別是自然語言處理的基礎(chǔ)性任務(wù)之一,廣泛應(yīng)用于文本挖掘、語義分析、機器翻譯等領(lǐng)域中。在數(shù)據(jù)日趨海量化和異構(gòu)化的當(dāng)今社會,對命名實體識別的研究已經(jīng)成為了現(xiàn)階段自然語言處理中的重點項目之一。中文命名實體識別的現(xiàn)有方法大多依賴于先驗領(lǐng)域知識,對研究人員的語言學(xué)知識具有較高的要求,且識別效果不佳,難以滿足大規(guī)模工程化應(yīng)用的需求。隨著近年來深度學(xué)習(xí)技術(shù)的日漸成熟,基于人工神經(jīng)網(wǎng)絡(luò)的中文命名實體識別技術(shù)的研究已經(jīng)逐漸成為當(dāng)前中文命名實體識別的主要研究方向。本文首先對傳統(tǒng)的命名實體識別方法進行了分析和總結(jié),并介紹了國外命名實體識別的基于人工神經(jīng)網(wǎng)絡(luò)的研究成果。隨后本文在傳統(tǒng)命名實體識別方法的基礎(chǔ)上,融入詞向量和前饋神經(jīng)網(wǎng)絡(luò),建立了一種較為靈活的命名實體識別架構(gòu)。通過對大規(guī)模未標(biāo)記語料的內(nèi)部表示的學(xué)習(xí),使得系統(tǒng)減少甚至忽略工程化特征的影響,采用無監(jiān)督的方法進行中文命名實體識別。并在無監(jiān)督前饋神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,利用PCA降維的方法,從包含中文命名實體特征的多個目標(biāo)詞中提取出一系列的特征向量,再使用這些少量的先驗知識來實現(xiàn)半監(jiān)督的命名實體識別,從而進一步提升了模型的識別效果。實驗表明,使用前饋...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
神經(jīng)元結(jié)構(gòu)示意圖
sigmoid函數(shù)圖像
tanh函數(shù)圖像
本文編號:3083169
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
神經(jīng)元結(jié)構(gòu)示意圖
sigmoid函數(shù)圖像
tanh函數(shù)圖像
本文編號:3083169
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3083169.html
最近更新
教材專著