生物醫(yī)學(xué)實(shí)體關(guān)系抽取算法與應(yīng)用研究
發(fā)布時(shí)間:2024-01-25 12:44
生物醫(yī)學(xué)領(lǐng)域的研究因與人類的健康狀況密切相關(guān)而受到廣泛關(guān)注。近年來(lái),生物醫(yī)學(xué)文獻(xiàn)的數(shù)量呈高速增長(zhǎng)的態(tài)勢(shì)。海量的生物醫(yī)學(xué)資源一方面成為生物醫(yī)學(xué)專家的寶貴資源,另一方面,由于人工抽取有用的信息耗時(shí)耗力,也一定程度上制約了生物醫(yī)學(xué)研究的效率;诖,生物醫(yī)學(xué)文本挖掘技術(shù)適時(shí)出現(xiàn)并解決了這一難題。生物醫(yī)學(xué)實(shí)體關(guān)系抽取是文本挖掘中的重要任務(wù)之一。由于目前主流的關(guān)系抽取技術(shù)是基于深度學(xué)習(xí)的單任務(wù)學(xué)習(xí)方法,該方法不能有效利用同一領(lǐng)域的相關(guān)任務(wù)間的共性,使得模型的性能和泛化能力有限;诖,在本文的工作中,我們構(gòu)建了多任務(wù)學(xué)習(xí)模型,分別為全共享多任務(wù)模型、私有共享多任務(wù)模型和基于Attention機(jī)制的主輔多任務(wù)模型。多任務(wù)模型中的私有網(wǎng)絡(luò)抽取各個(gè)任務(wù)的私有特征,共享網(wǎng)絡(luò)可以抽取多個(gè)任務(wù)之間的公共特征,對(duì)私有特征進(jìn)行補(bǔ)充和增強(qiáng)。特別是,我們提出的基于Attention機(jī)制的主輔多任務(wù)模型,根據(jù)輔助任務(wù)對(duì)主任務(wù)的影響程度,利用Attention層為每個(gè)輔助任務(wù)與主任務(wù)的共享特征分配權(quán)重,最大化的利用了輔助任務(wù)的積極影響,同時(shí)避免了輔助任務(wù)的噪聲,提升了模型的分類能力。然后,我們使用基于深度學(xué)習(xí)的關(guān)系抽取...
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 生物醫(yī)學(xué)實(shí)體關(guān)系抽取研究現(xiàn)狀
1.2.2 知識(shí)圖譜研究現(xiàn)狀
1.2.3 蛋白質(zhì)-蛋白質(zhì)交互關(guān)系數(shù)據(jù)庫(kù)研究現(xiàn)狀
1.3 本文工作
1.4 本文結(jié)構(gòu)
2 相關(guān)技術(shù)與知識(shí)
2.1 相關(guān)算法
2.1.1 單詞的向量化表示
2.1.2 神經(jīng)網(wǎng)絡(luò)
2.2 實(shí)驗(yàn)數(shù)據(jù)集
2.3 評(píng)價(jià)指標(biāo)
3 基于多任務(wù)學(xué)習(xí)的生物醫(yī)學(xué)實(shí)體關(guān)系抽取
3.1 引言
3.2 方法
3.2.1 單任務(wù)模型
3.2.2 全共享多任務(wù)模型
3.2.3 私有共享多任務(wù)模型
3.2.4 基于Attention機(jī)制的主輔多任務(wù)模型
3.3 實(shí)驗(yàn)與討論
3.3.1 數(shù)據(jù)集與實(shí)驗(yàn)設(shè)置
3.3.2 兩兩任務(wù)間的多任務(wù)學(xué)習(xí)
3.3.3 所有任務(wù)間的多任務(wù)學(xué)習(xí)
3.3.4 Attention機(jī)制在主輔多任務(wù)模型中的有效性
3.3.5 與其他方法的性能比較
3.4 本章小結(jié)
4 原發(fā)性肝癌的知識(shí)圖譜構(gòu)建及表示學(xué)習(xí)
4.1 引言
4.2 原發(fā)性肝癌的知識(shí)圖譜構(gòu)建
4.2.1 知識(shí)獲取
4.2.2 知識(shí)存儲(chǔ)
4.3 基于原發(fā)性肝癌的知識(shí)圖譜表示學(xué)習(xí)
4.3.1 問題引出
4.3.2 知識(shí)圖譜表示學(xué)習(xí)方法
4.3.3 實(shí)驗(yàn)與討論
4.4 本章小結(jié)
5 人類惡性腫瘤的蛋白質(zhì)交互關(guān)系數(shù)據(jù)庫(kù)構(gòu)建
5.1 引言
5.2 數(shù)據(jù)庫(kù)構(gòu)建方法
5.2.1 生物醫(yī)學(xué)文獻(xiàn)PPIs抽取系統(tǒng)介紹
5.2.2 人類惡性腫瘤相關(guān)PPIs抽取步驟
5.2.3 PPIs結(jié)構(gòu)化數(shù)據(jù)格式
5.3 數(shù)據(jù)庫(kù)介紹
5.3.1 數(shù)據(jù)統(tǒng)計(jì)
5.3.2 數(shù)據(jù)質(zhì)量分析
5.3.3 數(shù)據(jù)庫(kù)網(wǎng)站
5.3.4 數(shù)據(jù)可視化
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間參加學(xué)術(shù)評(píng)測(cè)和獲獎(jiǎng)情況
攻讀碩士學(xué)位期間參加科研項(xiàng)目情況
致謝
本文編號(hào):3884841
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 生物醫(yī)學(xué)實(shí)體關(guān)系抽取研究現(xiàn)狀
1.2.2 知識(shí)圖譜研究現(xiàn)狀
1.2.3 蛋白質(zhì)-蛋白質(zhì)交互關(guān)系數(shù)據(jù)庫(kù)研究現(xiàn)狀
1.3 本文工作
1.4 本文結(jié)構(gòu)
2 相關(guān)技術(shù)與知識(shí)
2.1 相關(guān)算法
2.1.1 單詞的向量化表示
2.1.2 神經(jīng)網(wǎng)絡(luò)
2.2 實(shí)驗(yàn)數(shù)據(jù)集
2.3 評(píng)價(jià)指標(biāo)
3 基于多任務(wù)學(xué)習(xí)的生物醫(yī)學(xué)實(shí)體關(guān)系抽取
3.1 引言
3.2 方法
3.2.1 單任務(wù)模型
3.2.2 全共享多任務(wù)模型
3.2.3 私有共享多任務(wù)模型
3.2.4 基于Attention機(jī)制的主輔多任務(wù)模型
3.3 實(shí)驗(yàn)與討論
3.3.1 數(shù)據(jù)集與實(shí)驗(yàn)設(shè)置
3.3.2 兩兩任務(wù)間的多任務(wù)學(xué)習(xí)
3.3.3 所有任務(wù)間的多任務(wù)學(xué)習(xí)
3.3.4 Attention機(jī)制在主輔多任務(wù)模型中的有效性
3.3.5 與其他方法的性能比較
3.4 本章小結(jié)
4 原發(fā)性肝癌的知識(shí)圖譜構(gòu)建及表示學(xué)習(xí)
4.1 引言
4.2 原發(fā)性肝癌的知識(shí)圖譜構(gòu)建
4.2.1 知識(shí)獲取
4.2.2 知識(shí)存儲(chǔ)
4.3 基于原發(fā)性肝癌的知識(shí)圖譜表示學(xué)習(xí)
4.3.1 問題引出
4.3.2 知識(shí)圖譜表示學(xué)習(xí)方法
4.3.3 實(shí)驗(yàn)與討論
4.4 本章小結(jié)
5 人類惡性腫瘤的蛋白質(zhì)交互關(guān)系數(shù)據(jù)庫(kù)構(gòu)建
5.1 引言
5.2 數(shù)據(jù)庫(kù)構(gòu)建方法
5.2.1 生物醫(yī)學(xué)文獻(xiàn)PPIs抽取系統(tǒng)介紹
5.2.2 人類惡性腫瘤相關(guān)PPIs抽取步驟
5.2.3 PPIs結(jié)構(gòu)化數(shù)據(jù)格式
5.3 數(shù)據(jù)庫(kù)介紹
5.3.1 數(shù)據(jù)統(tǒng)計(jì)
5.3.2 數(shù)據(jù)質(zhì)量分析
5.3.3 數(shù)據(jù)庫(kù)網(wǎng)站
5.3.4 數(shù)據(jù)可視化
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間參加學(xué)術(shù)評(píng)測(cè)和獲獎(jiǎng)情況
攻讀碩士學(xué)位期間參加科研項(xiàng)目情況
致謝
本文編號(hào):3884841
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3884841.html
最近更新
教材專著