基于強(qiáng)化學(xué)習(xí)的生物醫(yī)學(xué)實(shí)體識別研究與應(yīng)用
發(fā)布時間:2022-07-13 21:24
生物醫(yī)學(xué)文獻(xiàn)的數(shù)量浩如煙海,能夠挖掘出有價值的生物醫(yī)學(xué)信息具有重要的意義。生物醫(yī)學(xué)實(shí)體識別工作是從非結(jié)構(gòu)化的文本中識別出相關(guān)的生物醫(yī)學(xué)實(shí)體,是進(jìn)行生物醫(yī)學(xué)關(guān)系抽取和構(gòu)建生物醫(yī)學(xué)知識圖譜的重要前提,F(xiàn)階段的研究方法大多是基于深度學(xué)習(xí)的,這些方法仍存在很多不足之處,例如容易出現(xiàn)過擬合的問題,并且數(shù)據(jù)分布不平衡的問題一直沒有得到很好的解決。本文提出了一種基于強(qiáng)化學(xué)習(xí)的生物醫(yī)學(xué)實(shí)體識別算法,在傳統(tǒng)的基于深度學(xué)習(xí)方法的基礎(chǔ)上,用雙向長短記憶神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)單詞的上下文語義信息,并將其輸出的隱含層狀態(tài)作為強(qiáng)化學(xué)習(xí)的輸入,利用深度Q學(xué)習(xí)算法來產(chǎn)生序列的標(biāo)注,完成標(biāo)簽解碼工作。相較于傳統(tǒng)的利用前饋型神經(jīng)網(wǎng)絡(luò)和條件隨機(jī)場解碼,強(qiáng)化學(xué)習(xí)模型的解碼方法更能學(xué)習(xí)到長距離的特征。并且通過設(shè)置合適的獎勵機(jī)制,可以有效地避免在監(jiān)督學(xué)習(xí)中因為數(shù)據(jù)噪聲或者樣本不平衡所帶來的干擾。最后通過實(shí)驗證明了在生物醫(yī)學(xué)實(shí)體識別工作上,基于強(qiáng)化學(xué)習(xí)的方法在性能方面具有明顯的優(yōu)勢。本文也將理論與實(shí)際相結(jié)合,應(yīng)用生物醫(yī)學(xué)實(shí)體識別算法模型,開發(fā)了疾病知識提取系統(tǒng)。用戶通過系統(tǒng)界面可以查看與神經(jīng)退行性疾病相關(guān)的化合物、致病基因、疾病癥狀、肽、天...
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外的研究現(xiàn)狀
1.2.1 生物醫(yī)學(xué)實(shí)體識別的研究現(xiàn)狀
1.2.2 強(qiáng)化學(xué)習(xí)的研究現(xiàn)狀
1.3 本文的主要研究內(nèi)容
1.4 文章結(jié)構(gòu)
2 理論基礎(chǔ)
2.1 深度學(xué)習(xí)
2.1.1 前饋型神經(jīng)網(wǎng)絡(luò)
2.1.2 長短記憶神經(jīng)網(wǎng)絡(luò)
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)
2.2 條件隨機(jī)場
2.3 強(qiáng)化學(xué)習(xí)
2.3.1 強(qiáng)化學(xué)習(xí)過程
2.3.2 深度Q學(xué)習(xí)
2.3.3 策略梯度
3 基于強(qiáng)化學(xué)習(xí)的生物醫(yī)學(xué)實(shí)體識別研究
3.1 引言
3.2 相關(guān)工作
3.3 研究方法
3.3.1 詞級別表示
3.3.2 字符級別表示
3.3.3 預(yù)訓(xùn)練模型
3.3.4 強(qiáng)化學(xué)習(xí)模型
3.4 算法實(shí)驗與結(jié)果分析
3.4.1 實(shí)驗語料介紹
3.4.2 標(biāo)簽和評價指標(biāo)
3.4.3 實(shí)驗環(huán)境
3.4.4 參數(shù)設(shè)置
3.4.5 實(shí)驗結(jié)果與分析
3.5 本章小結(jié)
4 基于生物醫(yī)學(xué)實(shí)體識別的疾病知識提取系統(tǒng)
4.1 引言
4.2 相關(guān)工作
4.3 系統(tǒng)分析
4.3.1 需求分析
4.3.2 功能性需求
4.3.3 非功能性需求
4.3.4 可行性分析
4.4 系統(tǒng)設(shè)計
4.4.1 系統(tǒng)架構(gòu)設(shè)計
4.4.2 系統(tǒng)框架介紹
4.4.3 系統(tǒng)整體流程結(jié)構(gòu)
4.5 系統(tǒng)實(shí)現(xiàn)與測試
4.5.1 系統(tǒng)實(shí)現(xiàn)
4.5.2 系統(tǒng)測試
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于CNN-BLSTM-CRF模型的生物醫(yī)學(xué)命名實(shí)體識別[J]. 李麗雙,郭元凱. 中文信息學(xué)報. 2018(01)
[2]基于B/S結(jié)構(gòu)的實(shí)驗室管理信息系統(tǒng)開發(fā)方案[J]. 張文增,孫振國,趙冬斌,陳強(qiáng). 計算機(jī)工程與應(yīng)用. 2002(11)
博士論文
[1]生物醫(yī)學(xué)實(shí)體關(guān)系抽取研究[D]. 趙哲煥.大連理工大學(xué) 2017
碩士論文
[1]基于深度學(xué)習(xí)的生物醫(yī)學(xué)命名實(shí)體識別研究[D]. 姜宇新.大連理工大學(xué) 2018
本文編號:3660793
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外的研究現(xiàn)狀
1.2.1 生物醫(yī)學(xué)實(shí)體識別的研究現(xiàn)狀
1.2.2 強(qiáng)化學(xué)習(xí)的研究現(xiàn)狀
1.3 本文的主要研究內(nèi)容
1.4 文章結(jié)構(gòu)
2 理論基礎(chǔ)
2.1 深度學(xué)習(xí)
2.1.1 前饋型神經(jīng)網(wǎng)絡(luò)
2.1.2 長短記憶神經(jīng)網(wǎng)絡(luò)
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)
2.2 條件隨機(jī)場
2.3 強(qiáng)化學(xué)習(xí)
2.3.1 強(qiáng)化學(xué)習(xí)過程
2.3.2 深度Q學(xué)習(xí)
2.3.3 策略梯度
3 基于強(qiáng)化學(xué)習(xí)的生物醫(yī)學(xué)實(shí)體識別研究
3.1 引言
3.2 相關(guān)工作
3.3 研究方法
3.3.1 詞級別表示
3.3.2 字符級別表示
3.3.3 預(yù)訓(xùn)練模型
3.3.4 強(qiáng)化學(xué)習(xí)模型
3.4 算法實(shí)驗與結(jié)果分析
3.4.1 實(shí)驗語料介紹
3.4.2 標(biāo)簽和評價指標(biāo)
3.4.3 實(shí)驗環(huán)境
3.4.4 參數(shù)設(shè)置
3.4.5 實(shí)驗結(jié)果與分析
3.5 本章小結(jié)
4 基于生物醫(yī)學(xué)實(shí)體識別的疾病知識提取系統(tǒng)
4.1 引言
4.2 相關(guān)工作
4.3 系統(tǒng)分析
4.3.1 需求分析
4.3.2 功能性需求
4.3.3 非功能性需求
4.3.4 可行性分析
4.4 系統(tǒng)設(shè)計
4.4.1 系統(tǒng)架構(gòu)設(shè)計
4.4.2 系統(tǒng)框架介紹
4.4.3 系統(tǒng)整體流程結(jié)構(gòu)
4.5 系統(tǒng)實(shí)現(xiàn)與測試
4.5.1 系統(tǒng)實(shí)現(xiàn)
4.5.2 系統(tǒng)測試
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于CNN-BLSTM-CRF模型的生物醫(yī)學(xué)命名實(shí)體識別[J]. 李麗雙,郭元凱. 中文信息學(xué)報. 2018(01)
[2]基于B/S結(jié)構(gòu)的實(shí)驗室管理信息系統(tǒng)開發(fā)方案[J]. 張文增,孫振國,趙冬斌,陳強(qiáng). 計算機(jī)工程與應(yīng)用. 2002(11)
博士論文
[1]生物醫(yī)學(xué)實(shí)體關(guān)系抽取研究[D]. 趙哲煥.大連理工大學(xué) 2017
碩士論文
[1]基于深度學(xué)習(xí)的生物醫(yī)學(xué)命名實(shí)體識別研究[D]. 姜宇新.大連理工大學(xué) 2018
本文編號:3660793
本文鏈接:http://sikaile.net/projectlw/swxlw/3660793.html
最近更新
教材專著