基于集成模型的生物醫(yī)學命名實體識別研究
發(fā)布時間:2021-10-27 13:34
命名實體識別任務是生物醫(yī)學文本挖掘中基礎且重要的任務之一,其對于實體識別的準確率會影響后續(xù)利用相關醫(yī)學領域信息的效率,如關系抽取和事件抽取等相關任務的效率會受到影響。在現在的命名實體識別任務中,大多數使用的方法是神經網絡與條件隨機場結合的方法,神經網絡比傳統機器學習方法的好處在于不需要大量人工參與避免了特征構造的資源浪費。但是,目前大多數模型存在幾個問題:一、時序特征獲取不充分,深層隱含信息獲取不全面。忽略了文本的局部特征,生物醫(yī)學文獻普遍句式較長,存在大量冗余虛詞,重要的詞匯混在大量虛詞中,使得識別變得更加困難。二、空間局部特征使用不完全,以卷積神經網絡(CNN)為代表的空間局部特征提取模型為例,模型速度快,但信息獲取不全,容易丟失重要信息,識別效果不佳。故本文從改進模型結構入手,我們提出了一個基于雙向長短期記憶神經網絡(BiLSTM)和卷積神經網絡的集成模型,并使用了注意力機制(Attention)和擴張卷積核對這兩個模型分別進行了改進,以增加關鍵信息的權重并獲得更廣泛的信息。集成模型BiLSTM-ATT-HDC中的兩個模型,一個是BiLSTM-ATT-CRF模型,是基于BiLST...
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數】:63 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內外研究現狀
1.2.1 基于詞典和規(guī)則的方法
1.2.2 基于傳統機器學習的方法
1.2.3 基于深度學習的方法
1.3 本文研究內容
1.4 本文組織結構
2 相關理論概述
2.1 詞表示
2.1.1 one-hot向量表示
2.1.2 分布式詞向量表示
2.2 條件隨機場
2.2.1 條件隨機場算法原理
2.2.2 條件隨機場算法的優(yōu)缺點
2.3 神經網絡
2.3.1 前饋神經網絡
2.3.2 循環(huán)神經網絡
2.3.3 卷積神經網絡
2.3.4 Dropout和優(yōu)化方法
2.4 本章小結
3 基于循環(huán)神經網絡與注意力機制結合的命名實體識別
3.1 引言
3.2 特殊的循環(huán)神經網絡
3.2.1 長短時記憶神經網絡
3.2.2 雙向長短時記憶神經網絡
3.3 基于BiLSTM-ATT-CRF的生物醫(yī)學命名實體識別
3.3.1 BiLSTM-CRF框架
3.3.2 Attention思想
3.3.3 Attention機制公式
3.4 結果分析
3.4.1 實驗數據與評價指標
3.4.2 實驗設計
3.4.3 BiLSTM-ATT-CRF模型結果分析
3.5 本章小結
4 基于集成模型的命名實體識別
4.1 引言
4.2 BiLSTM-ATT-HDC集成模型
4.2.1 總體模型架構
4.2.2 HDCNN-CRF模型
4.3 結果分析
4.3.1 HDCNN-CRF模型結果分析
4.3.2 BiLSTM-ATT-HDC集成模型結果分析
4.4 本章小結
結論
參考文獻
致謝
作者簡歷及攻讀碩士學位期間的科研成果
【參考文獻】:
期刊論文
[1]生物醫(yī)學命名實體識別的研究與進展[J]. 鄭強,劉齊軍,王正華,朱云平. 計算機應用研究. 2010(03)
本文編號:3461707
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數】:63 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內外研究現狀
1.2.1 基于詞典和規(guī)則的方法
1.2.2 基于傳統機器學習的方法
1.2.3 基于深度學習的方法
1.3 本文研究內容
1.4 本文組織結構
2 相關理論概述
2.1 詞表示
2.1.1 one-hot向量表示
2.1.2 分布式詞向量表示
2.2 條件隨機場
2.2.1 條件隨機場算法原理
2.2.2 條件隨機場算法的優(yōu)缺點
2.3 神經網絡
2.3.1 前饋神經網絡
2.3.2 循環(huán)神經網絡
2.3.3 卷積神經網絡
2.3.4 Dropout和優(yōu)化方法
2.4 本章小結
3 基于循環(huán)神經網絡與注意力機制結合的命名實體識別
3.1 引言
3.2 特殊的循環(huán)神經網絡
3.2.1 長短時記憶神經網絡
3.2.2 雙向長短時記憶神經網絡
3.3 基于BiLSTM-ATT-CRF的生物醫(yī)學命名實體識別
3.3.1 BiLSTM-CRF框架
3.3.2 Attention思想
3.3.3 Attention機制公式
3.4 結果分析
3.4.1 實驗數據與評價指標
3.4.2 實驗設計
3.4.3 BiLSTM-ATT-CRF模型結果分析
3.5 本章小結
4 基于集成模型的命名實體識別
4.1 引言
4.2 BiLSTM-ATT-HDC集成模型
4.2.1 總體模型架構
4.2.2 HDCNN-CRF模型
4.3 結果分析
4.3.1 HDCNN-CRF模型結果分析
4.3.2 BiLSTM-ATT-HDC集成模型結果分析
4.4 本章小結
結論
參考文獻
致謝
作者簡歷及攻讀碩士學位期間的科研成果
【參考文獻】:
期刊論文
[1]生物醫(yī)學命名實體識別的研究與進展[J]. 鄭強,劉齊軍,王正華,朱云平. 計算機應用研究. 2010(03)
本文編號:3461707
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3461707.html