融合知識庫和文本信息的實(shí)體關(guān)系抽取研究
發(fā)布時(shí)間:2022-02-16 13:02
隨著互聯(lián)網(wǎng)的發(fā)展和大數(shù)據(jù)時(shí)代的到來,生物醫(yī)學(xué)文獻(xiàn)的數(shù)量快速增長,如何從這些非結(jié)構(gòu)化的文本中挖掘和整理實(shí)體關(guān)系成為人們目前迫切的需求。在生物醫(yī)學(xué)領(lǐng)域,蛋白質(zhì)實(shí)體交互關(guān)系抽取任務(wù)要求從非結(jié)構(gòu)化的文本中抽取出存在交互關(guān)系的蛋白質(zhì)實(shí)體對。該任務(wù)對于精準(zhǔn)醫(yī)療、疾病發(fā)生機(jī)理、細(xì)胞穩(wěn)態(tài)控制等都具有重大的意義。此外,生物醫(yī)學(xué)知識庫中包含了大量實(shí)體關(guān)系三元組的結(jié)構(gòu)化信息。這些先驗(yàn)知識可以幫助我們識別復(fù)雜語義環(huán)境中蛋白質(zhì)實(shí)體對的交互關(guān)系。本文探索融合知識庫和文本信息方法,重點(diǎn)研究蛋白質(zhì)交互關(guān)系抽取任務(wù),主要研究內(nèi)容如下:研究基于實(shí)體表示的蛋白質(zhì)交互關(guān)系抽取。采用知識表示學(xué)習(xí)模型對知識庫中的大量實(shí)體關(guān)系三元組進(jìn)行學(xué)習(xí),獲得實(shí)體表示和關(guān)系表示。再利用深度學(xué)習(xí)模型將實(shí)體表示和文本信息進(jìn)行融合,構(gòu)建融合實(shí)體表示和文本信息的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)。實(shí)驗(yàn)表明,實(shí)體表示可以有效提升模型捕獲與實(shí)體相關(guān)的上下文信息的能力,提升了關(guān)系抽取的精確率。研究基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取;谥R庫中一對蛋白質(zhì)實(shí)體對應(yīng)的關(guān)系表示,利用注意力機(jī)制抽取與實(shí)體關(guān)系相關(guān)的上下文特征,構(gòu)建融合關(guān)系表示和文本信息的蛋白質(zhì)交互關(guān)系抽取模型。實(shí)...
【文章來源】:大連理工大學(xué)遼寧省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究內(nèi)容及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 蛋白質(zhì)交互關(guān)系語料庫
1.4 知識庫
1.5 評測指標(biāo)
1.6 本文主要工作
1.7 本文組織結(jié)構(gòu)
2 關(guān)鍵技術(shù)概述
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2 長短時(shí)記憶網(wǎng)絡(luò)
2.3 注意力機(jī)制
2.4 記憶網(wǎng)絡(luò)
2.5 知識表示學(xué)習(xí)
2.6 本章小結(jié)
3 基于實(shí)體表示的蛋白質(zhì)交互關(guān)系抽取
3.1 基于實(shí)體表示蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
3.1.1 系統(tǒng)概況
3.1.2 語料預(yù)處理
3.1.3 構(gòu)建候選樣例和詞向量序列
3.1.4 知識表示學(xué)習(xí)
3.1.5 基于CNN的蛋白質(zhì)交互關(guān)系抽取
3.1.6 基于LSTM的蛋白質(zhì)交互關(guān)系抽取
3.2 基于實(shí)體表示的蛋白質(zhì)交互關(guān)系抽取實(shí)驗(yàn)
3.2.1 基于實(shí)體表示的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)性能
3.2.2 知識庫中的蛋白質(zhì)實(shí)體統(tǒng)計(jì)數(shù)據(jù)
3.3 本章小結(jié)
4 基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取
4.1 基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
4.1.1 系統(tǒng)概況
4.1.2 基于門機(jī)制的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
4.1.3 基于關(guān)系表示特征的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
4.1.4 基于注意力機(jī)制的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
4.2 基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取實(shí)驗(yàn)
4.2.1 基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取性能
4.2.2 知識庫中的關(guān)系三元組統(tǒng)計(jì)數(shù)據(jù)
4.3 本章小結(jié)
5 基于記憶網(wǎng)絡(luò)的蛋白質(zhì)交互關(guān)系抽取
5.1 基于記憶網(wǎng)絡(luò)的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
5.1.1 系統(tǒng)概況
5.1.2 基于文本信息的蛋白質(zhì)交互關(guān)系抽取
5.1.3 基于實(shí)體表示和關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取
5.1.4 后處理規(guī)則
5.2 基于記憶網(wǎng)絡(luò)蛋白質(zhì)交互關(guān)系抽取實(shí)驗(yàn)
5.2.1 基于記憶網(wǎng)絡(luò)蛋白質(zhì)交互關(guān)系抽取性能
5.2.2 錯(cuò)誤分析
5.2.3 與相關(guān)研究的對比
5.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[2]知識表示學(xué)習(xí)研究進(jìn)展[J]. 劉知遠(yuǎn),孫茂松,林衍凱,謝若冰. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
本文編號:3628014
【文章來源】:大連理工大學(xué)遼寧省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究內(nèi)容及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 蛋白質(zhì)交互關(guān)系語料庫
1.4 知識庫
1.5 評測指標(biāo)
1.6 本文主要工作
1.7 本文組織結(jié)構(gòu)
2 關(guān)鍵技術(shù)概述
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2 長短時(shí)記憶網(wǎng)絡(luò)
2.3 注意力機(jī)制
2.4 記憶網(wǎng)絡(luò)
2.5 知識表示學(xué)習(xí)
2.6 本章小結(jié)
3 基于實(shí)體表示的蛋白質(zhì)交互關(guān)系抽取
3.1 基于實(shí)體表示蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
3.1.1 系統(tǒng)概況
3.1.2 語料預(yù)處理
3.1.3 構(gòu)建候選樣例和詞向量序列
3.1.4 知識表示學(xué)習(xí)
3.1.5 基于CNN的蛋白質(zhì)交互關(guān)系抽取
3.1.6 基于LSTM的蛋白質(zhì)交互關(guān)系抽取
3.2 基于實(shí)體表示的蛋白質(zhì)交互關(guān)系抽取實(shí)驗(yàn)
3.2.1 基于實(shí)體表示的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)性能
3.2.2 知識庫中的蛋白質(zhì)實(shí)體統(tǒng)計(jì)數(shù)據(jù)
3.3 本章小結(jié)
4 基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取
4.1 基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
4.1.1 系統(tǒng)概況
4.1.2 基于門機(jī)制的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
4.1.3 基于關(guān)系表示特征的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
4.1.4 基于注意力機(jī)制的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
4.2 基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取實(shí)驗(yàn)
4.2.1 基于關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取性能
4.2.2 知識庫中的關(guān)系三元組統(tǒng)計(jì)數(shù)據(jù)
4.3 本章小結(jié)
5 基于記憶網(wǎng)絡(luò)的蛋白質(zhì)交互關(guān)系抽取
5.1 基于記憶網(wǎng)絡(luò)的蛋白質(zhì)交互關(guān)系抽取系統(tǒng)
5.1.1 系統(tǒng)概況
5.1.2 基于文本信息的蛋白質(zhì)交互關(guān)系抽取
5.1.3 基于實(shí)體表示和關(guān)系表示的蛋白質(zhì)交互關(guān)系抽取
5.1.4 后處理規(guī)則
5.2 基于記憶網(wǎng)絡(luò)蛋白質(zhì)交互關(guān)系抽取實(shí)驗(yàn)
5.2.1 基于記憶網(wǎng)絡(luò)蛋白質(zhì)交互關(guān)系抽取性能
5.2.2 錯(cuò)誤分析
5.2.3 與相關(guān)研究的對比
5.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[2]知識表示學(xué)習(xí)研究進(jìn)展[J]. 劉知遠(yuǎn),孫茂松,林衍凱,謝若冰. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
本文編號:3628014
本文鏈接:http://sikaile.net/yixuelunwen/swyx/3628014.html
最近更新
教材專著