融合語(yǔ)言模型和注意力機(jī)制的蒙古文命名實(shí)體識(shí)別研究
發(fā)布時(shí)間:2021-02-12 01:00
蒙古文命名實(shí)體識(shí)別是蒙古文自然語(yǔ)言處理的一項(xiàng)基礎(chǔ)任務(wù),其識(shí)別性能會(huì)直接影響后續(xù)處理任務(wù)或相關(guān)應(yīng)用的性能。目前,基于深度學(xué)習(xí)的蒙古文命名實(shí)體識(shí)別研究工作相對(duì)較少,而采用傳統(tǒng)機(jī)器學(xué)習(xí)方法在識(shí)別效果上仍不夠理想。鑒于深度學(xué)習(xí)在其他語(yǔ)言命名實(shí)體識(shí)別中的優(yōu)良表現(xiàn)和廣泛應(yīng)用,本文以雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)-條件隨機(jī)場(chǎng)模型(Bidirectional Long Short-term Memory-Conditional Random Fields,BLSTM-CRF)作為基線(xiàn)模型,同時(shí)結(jié)合蒙古文的構(gòu)詞特性,提出了融合語(yǔ)言模型和注意力機(jī)制的蒙古文命名實(shí)體識(shí)別方法。論文的主要工作如下:首先,本文提出了融合語(yǔ)言模型的蒙古文命名實(shí)體識(shí)別模型(Mongolian Named Entity Recognition-Language Model,MNER-LM)。針對(duì)蒙古文命名實(shí)體識(shí)別中標(biāo)注語(yǔ)料稀缺的情況,本文通過(guò)訓(xùn)練語(yǔ)言模型捕獲蒙古文文本中蘊(yùn)含的語(yǔ)法和句法等語(yǔ)言學(xué)特征信息,并將這些特征信息引入BLSTM-CRF模型中來(lái)完成對(duì)模型僅從有限標(biāo)注語(yǔ)料中學(xué)習(xí)到的信息進(jìn)一步擴(kuò)充。實(shí)驗(yàn)結(jié)果表明,MNER-LM模型的平均F值相比基...
【文章來(lái)源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
模型對(duì)訓(xùn)練語(yǔ)料規(guī)模的敏感性Figure3.6Sensitivityofthemodeltothenumberoftrainingcorpus
不同網(wǎng)絡(luò)結(jié)構(gòu)的模型性能比較
【參考文獻(xiàn)】:
期刊論文
[1]基于主題標(biāo)簽和CRF的中文微博命名實(shí)體識(shí)別[J]. 朱顥東,楊立志,丁溫雪,馮嘉美. 華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[2]基于CRF算法的航天命名實(shí)體識(shí)別[J]. 徐建忠,朱俊,趙瑞,張亮,李嬌嬌. 電子設(shè)計(jì)工程. 2017(20)
[3]基于詞典匹配的蒙古文命名實(shí)體識(shí)別研究[J]. 包敏娜,斯·勞格勞. 中央民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2017(03)
[4]CRF和詞典相結(jié)合的蒙古文地名識(shí)別研究[J]. 吳金星,麗麗,楊振新. 計(jì)算機(jī)工程與科學(xué). 2016(05)
[5]基于HMM的京劇機(jī)構(gòu)命名實(shí)體識(shí)別算法[J]. 樂(lè)娟,趙璽. 計(jì)算機(jī)工程. 2013(06)
[6]簡(jiǎn)約語(yǔ)法規(guī)則和最大熵模型相結(jié)合的混合實(shí)體識(shí)別[J]. 陸銘,康雨潔,俞能海. 小型微型計(jì)算機(jī)系統(tǒng). 2012(03)
[7]基于層疊條件隨機(jī)場(chǎng)的旅游領(lǐng)域命名實(shí)體識(shí)別[J]. 郭劍毅,薛征山,余正濤,張志坤,張宜浩,姚賢明. 中文信息學(xué)報(bào). 2009(05)
博士論文
[1]蒙古文命名實(shí)體識(shí)別研究[D]. 王煒華.內(nèi)蒙古大學(xué) 2018
[2]基于蒙古文語(yǔ)料庫(kù)的人名自動(dòng)識(shí)別[D]. 通拉嘎.中央民族大學(xué) 2013
碩士論文
[1]基于SVM和HMM算法的中文機(jī)構(gòu)名稱(chēng)識(shí)別[D]. 祝繼鋒.吉林大學(xué) 2017
[2]基于CRF的蒙古文人名自動(dòng)識(shí)別[D]. 才晶晶.內(nèi)蒙古大學(xué) 2016
[3]基于規(guī)則和統(tǒng)計(jì)的西里爾與傳統(tǒng)蒙古文相互轉(zhuǎn)換方法研究[D]. 王洪偉.內(nèi)蒙古大學(xué) 2015
[4]基于多模板HMM的中文命名實(shí)體識(shí)別[D]. 藍(lán)雁玲.華南理工大學(xué) 2011
本文編號(hào):3029994
【文章來(lái)源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
模型對(duì)訓(xùn)練語(yǔ)料規(guī)模的敏感性Figure3.6Sensitivityofthemodeltothenumberoftrainingcorpus
不同網(wǎng)絡(luò)結(jié)構(gòu)的模型性能比較
【參考文獻(xiàn)】:
期刊論文
[1]基于主題標(biāo)簽和CRF的中文微博命名實(shí)體識(shí)別[J]. 朱顥東,楊立志,丁溫雪,馮嘉美. 華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[2]基于CRF算法的航天命名實(shí)體識(shí)別[J]. 徐建忠,朱俊,趙瑞,張亮,李嬌嬌. 電子設(shè)計(jì)工程. 2017(20)
[3]基于詞典匹配的蒙古文命名實(shí)體識(shí)別研究[J]. 包敏娜,斯·勞格勞. 中央民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2017(03)
[4]CRF和詞典相結(jié)合的蒙古文地名識(shí)別研究[J]. 吳金星,麗麗,楊振新. 計(jì)算機(jī)工程與科學(xué). 2016(05)
[5]基于HMM的京劇機(jī)構(gòu)命名實(shí)體識(shí)別算法[J]. 樂(lè)娟,趙璽. 計(jì)算機(jī)工程. 2013(06)
[6]簡(jiǎn)約語(yǔ)法規(guī)則和最大熵模型相結(jié)合的混合實(shí)體識(shí)別[J]. 陸銘,康雨潔,俞能海. 小型微型計(jì)算機(jī)系統(tǒng). 2012(03)
[7]基于層疊條件隨機(jī)場(chǎng)的旅游領(lǐng)域命名實(shí)體識(shí)別[J]. 郭劍毅,薛征山,余正濤,張志坤,張宜浩,姚賢明. 中文信息學(xué)報(bào). 2009(05)
博士論文
[1]蒙古文命名實(shí)體識(shí)別研究[D]. 王煒華.內(nèi)蒙古大學(xué) 2018
[2]基于蒙古文語(yǔ)料庫(kù)的人名自動(dòng)識(shí)別[D]. 通拉嘎.中央民族大學(xué) 2013
碩士論文
[1]基于SVM和HMM算法的中文機(jī)構(gòu)名稱(chēng)識(shí)別[D]. 祝繼鋒.吉林大學(xué) 2017
[2]基于CRF的蒙古文人名自動(dòng)識(shí)別[D]. 才晶晶.內(nèi)蒙古大學(xué) 2016
[3]基于規(guī)則和統(tǒng)計(jì)的西里爾與傳統(tǒng)蒙古文相互轉(zhuǎn)換方法研究[D]. 王洪偉.內(nèi)蒙古大學(xué) 2015
[4]基于多模板HMM的中文命名實(shí)體識(shí)別[D]. 藍(lán)雁玲.華南理工大學(xué) 2011
本文編號(hào):3029994
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3029994.html
最近更新
教材專(zhuān)著