基于神經(jīng)網(wǎng)絡(luò)與領(lǐng)域知識的生物醫(yī)學(xué)關(guān)系抽取
發(fā)布時間:2023-04-01 09:03
信息抽取技術(shù)為處理互聯(lián)網(wǎng)中存在的海量數(shù)據(jù)提供了手段。生物醫(yī)學(xué)文獻(xiàn)是互聯(lián)網(wǎng)文本數(shù)據(jù)的重要組成部分,隱藏在文獻(xiàn)背后的知識可以服務(wù)于信息檢索、推薦系統(tǒng)和問答系統(tǒng)等實(shí)際應(yīng)用領(lǐng)域。關(guān)系抽取是用于挖掘文獻(xiàn)中蘊(yùn)含的知識的一種必不可少的技術(shù)。本文重點(diǎn)研究生物醫(yī)學(xué)領(lǐng)域的篇章級關(guān)系抽取,區(qū)別于傳統(tǒng)關(guān)系抽取局限于抽取單個句子內(nèi)的實(shí)體關(guān)系,篇章級關(guān)系抽取則是從文獻(xiàn)摘要中抽取實(shí)體關(guān)系,而摘要文本通常由多個句子組成,長度更長,語義更加復(fù)雜。本文提出一種基于圖卷積神經(jīng)網(wǎng)絡(luò)和多頭注意力機(jī)制的端到端關(guān)系抽取方法。為了更好地從長文本中提取特征,構(gòu)建了文檔級別依存圖并使用圖卷積神經(jīng)網(wǎng)絡(luò)對其進(jìn)行建模,獲得了文本的句法結(jié)構(gòu)特征,另一方面使用多頭注意力機(jī)制從不同的語義子空間中獲取與關(guān)系抽取任務(wù)最相關(guān)的文本序列上下文特征,將得到的上下文特征和句法特征融合后用于關(guān)系分類。此外,傳統(tǒng)的詞向量是靜態(tài)詞向量,不能根據(jù)上下文確定詞的語義表示,而本文使用了深度上下文相關(guān)詞向量替換傳統(tǒng)詞向量,解決傳統(tǒng)詞向量存在的一詞多義問題,從而豐富了文本輸入特征的表達(dá)。除了文本信息以外,現(xiàn)有的生物領(lǐng)域知識也可以為關(guān)系抽取提供更多信息。本文提出了基于領(lǐng)域知識的...
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于規(guī)則模板的研究方法
1.2.2 基于機(jī)器學(xué)習(xí)的研究方法
1.2.3 基于深度學(xué)習(xí)的研究方法
1.3 本文的研究內(nèi)容
1.4 本文的結(jié)構(gòu)安排
2 相關(guān)技術(shù)知識與資源簡介
2.1 詞向量模型
2.1.1 Word2Vec簡介
2.1.2 ELMo簡介
2.2 深度學(xué)習(xí)方法
2.2.1 長短時記憶網(wǎng)絡(luò)
2.2.2 圖卷積神經(jīng)網(wǎng)絡(luò)
2.2.3 注意力機(jī)制
2.3 篇章級關(guān)系抽取介紹
2.4 相關(guān)資源與評價指標(biāo)
2.4.1 CDR數(shù)據(jù)集
2.4.2 CTD知識庫
2.4.3 評價指標(biāo)
3 基于神經(jīng)網(wǎng)絡(luò)的關(guān)系抽取方法
3.1 引言
3.2 關(guān)系實(shí)例的構(gòu)建
3.3 文檔級別依存圖的構(gòu)建
3.4 基于神經(jīng)網(wǎng)絡(luò)的關(guān)系抽取模型
3.4.1 模型框架
3.4.2 模型輸入層
3.4.3 BiLSTM層
3.4.4 多頭注意力機(jī)制層
3.4.5 GCN層
3.4.6 關(guān)系分類層
3.5 關(guān)系合并
3.6 實(shí)驗(yàn)設(shè)置與結(jié)果分析
3.6.1 實(shí)驗(yàn)參數(shù)設(shè)置
3.6.2 實(shí)驗(yàn)結(jié)果與分析
3.6.3 Multi-head attention可視化分析
3.7 本章小結(jié)
4 基于領(lǐng)域知識的關(guān)系抽取方法
4.1 引言
4.2 領(lǐng)域知識表示學(xué)習(xí)
4.3 基于領(lǐng)域知識的關(guān)系抽取模型
4.3.1 模型框架
4.3.2 模型輸入層
4.3.3 特征抽取層
4.3.4 領(lǐng)域知識注意力機(jī)制層
4.3.5 關(guān)系分類層
4.4 關(guān)系合并
4.5 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.5.1 實(shí)驗(yàn)參數(shù)設(shè)置
4.5.2 實(shí)驗(yàn)結(jié)果與分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間所獲獎項(xiàng)情況
攻讀碩士學(xué)位期間參加科研項(xiàng)目情況
致謝
本文編號:3776854
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于規(guī)則模板的研究方法
1.2.2 基于機(jī)器學(xué)習(xí)的研究方法
1.2.3 基于深度學(xué)習(xí)的研究方法
1.3 本文的研究內(nèi)容
1.4 本文的結(jié)構(gòu)安排
2 相關(guān)技術(shù)知識與資源簡介
2.1 詞向量模型
2.1.1 Word2Vec簡介
2.1.2 ELMo簡介
2.2 深度學(xué)習(xí)方法
2.2.1 長短時記憶網(wǎng)絡(luò)
2.2.2 圖卷積神經(jīng)網(wǎng)絡(luò)
2.2.3 注意力機(jī)制
2.3 篇章級關(guān)系抽取介紹
2.4 相關(guān)資源與評價指標(biāo)
2.4.1 CDR數(shù)據(jù)集
2.4.2 CTD知識庫
2.4.3 評價指標(biāo)
3 基于神經(jīng)網(wǎng)絡(luò)的關(guān)系抽取方法
3.1 引言
3.2 關(guān)系實(shí)例的構(gòu)建
3.3 文檔級別依存圖的構(gòu)建
3.4 基于神經(jīng)網(wǎng)絡(luò)的關(guān)系抽取模型
3.4.1 模型框架
3.4.2 模型輸入層
3.4.3 BiLSTM層
3.4.4 多頭注意力機(jī)制層
3.4.5 GCN層
3.4.6 關(guān)系分類層
3.5 關(guān)系合并
3.6 實(shí)驗(yàn)設(shè)置與結(jié)果分析
3.6.1 實(shí)驗(yàn)參數(shù)設(shè)置
3.6.2 實(shí)驗(yàn)結(jié)果與分析
3.6.3 Multi-head attention可視化分析
3.7 本章小結(jié)
4 基于領(lǐng)域知識的關(guān)系抽取方法
4.1 引言
4.2 領(lǐng)域知識表示學(xué)習(xí)
4.3 基于領(lǐng)域知識的關(guān)系抽取模型
4.3.1 模型框架
4.3.2 模型輸入層
4.3.3 特征抽取層
4.3.4 領(lǐng)域知識注意力機(jī)制層
4.3.5 關(guān)系分類層
4.4 關(guān)系合并
4.5 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.5.1 實(shí)驗(yàn)參數(shù)設(shè)置
4.5.2 實(shí)驗(yàn)結(jié)果與分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間所獲獎項(xiàng)情況
攻讀碩士學(xué)位期間參加科研項(xiàng)目情況
致謝
本文編號:3776854
本文鏈接:http://sikaile.net/projectlw/swxlw/3776854.html
最近更新
教材專著