預(yù)訓(xùn)練語言模型在中文電子病歷命名實(shí)體識別上的應(yīng)用
發(fā)布時間:2021-03-04 13:28
中文預(yù)訓(xùn)練語言模型能夠表達(dá)句子豐富的特征信息,并且可解決針對中文出現(xiàn)的"一詞多義"問題,是當(dāng)前自然語言處理任務(wù)中普遍使用的模型。研究預(yù)訓(xùn)練模型在中文電子病歷命名實(shí)體識別任務(wù)上的應(yīng)用,為基于深度學(xué)習(xí)的中文電子病歷信息抽取探索一種信的信息優(yōu)化方法。該文首先介紹了四種語言預(yù)訓(xùn)練模型BERT,ERNIE,ALBERT,NEZHA,并搭建預(yù)訓(xùn)練模型、BiLSTM、CRF的融合結(jié)構(gòu),在CCKS2018中文電子病歷數(shù)據(jù)集上進(jìn)行醫(yī)學(xué)命名實(shí)體識別任務(wù)。實(shí)驗(yàn)結(jié)果表明NEZHA取得了當(dāng)前預(yù)訓(xùn)練模型最優(yōu)的識別結(jié)果。
【文章來源】:電子質(zhì)量. 2020,(09)
【文章頁數(shù)】:5 頁
【部分圖文】:
基于預(yù)訓(xùn)練的中文電子病歷命名實(shí)體識別模型
【參考文獻(xiàn)】:
期刊論文
[1]基于BERT-IDCNN-CRF的中文命名實(shí)體識別方法[J]. 李妮,關(guān)煥梅,楊飄,董文永. 山東大學(xué)學(xué)報(理學(xué)版). 2020(01)
本文編號:3063296
【文章來源】:電子質(zhì)量. 2020,(09)
【文章頁數(shù)】:5 頁
【部分圖文】:
基于預(yù)訓(xùn)練的中文電子病歷命名實(shí)體識別模型
【參考文獻(xiàn)】:
期刊論文
[1]基于BERT-IDCNN-CRF的中文命名實(shí)體識別方法[J]. 李妮,關(guān)煥梅,楊飄,董文永. 山東大學(xué)學(xué)報(理學(xué)版). 2020(01)
本文編號:3063296
本文鏈接:http://sikaile.net/yixuelunwen/swyx/3063296.html
最近更新
教材專著