疾病相關實體關聯(lián)抽取方法研究
發(fā)布時間:2022-01-16 12:30
隨著當今經(jīng)濟水平持續(xù)提高,科學技術迅猛發(fā)展,生活水平日益改善,人民健康水平逐步提高,人們對于生命健康提出了更高的標準,對疾病的預防和治療也有著更高的要求。生物醫(yī)藥公開文獻中記錄了大量經(jīng)過實踐得到的知識,蘊含著巨大的寶藏,有助于了解疾病相關影響因素,指導疾病防治。但是近年來生物醫(yī)藥文獻快速增長使快速及時發(fā)現(xiàn)或找出疾病相關影響因素變得更加困難。僅僅生物醫(yī)藥領域的權威數(shù)據(jù)庫Pub Med收錄的文獻已經(jīng)高達2800多萬條,科研人員越來越難以快速發(fā)現(xiàn)高質量、可用性的知識。而當前計算機技術和自然語言處理技術的發(fā)展不斷帶來新的突破,在文本檢索、機器翻譯、命名實體識別、關聯(lián)抽取、摘要提取、智能問答等方面都取得了優(yōu)秀成績。因此,充分利用先進的技術在疾病關聯(lián)因素中發(fā)揮作用,從中抽取出能夠指導疾病預防、治療、禁忌等相關因素有助于快速全面發(fā)現(xiàn)對抗疾病的方法,具有十分重要的意義。本研究主要采用文獻調研、比較分析、機器學習和統(tǒng)計分析等研究方法,對實體關聯(lián)抽取及其前提命名實體識別的起源、發(fā)展、現(xiàn)狀進行全面系統(tǒng)的梳理。系統(tǒng)調研并從各自特征出發(fā),深入比較分析了進行命名實體關聯(lián)抽取的四大類常用方法:基于詞典構建的方法、基...
【文章來源】:軍事科學院北京市
【文章頁數(shù)】:103 頁
【學位級別】:博士
【部分圖文】:
神經(jīng)網(wǎng)絡基礎單元
圖 3 具有單個隱層的神經(jīng)網(wǎng)絡的計算方式如下:1)x1+ W12(1)x2+ W13(1)x3+ b1(1))1)x1+ W22(1)x2+ W23(1)x3+ b2(1))1)x1+ W32(1)x2+ W33(1)x3+ b3(1)))= f (W11(2)a1(2)+ W12(2)a2(2)+ W13(2)a3(2)+b1(2)),神經(jīng)網(wǎng)絡結構可以進一步拓展到有 2,3,4,5,…多訓練由于其多層性,需要利用鏈式求導法則對隱藏為反向傳播(background propagation, BP)[68]。2.5 多種關聯(lián)抽取方法比較分析
由于受到生物學里面的視覺系統(tǒng)結構的啟發(fā)。因此,為了降低參與運算的參數(shù)數(shù),不需要每個神經(jīng)元接受全部像素的數(shù)據(jù),只需要對局部進行感知,隨后在高層網(wǎng)絡結構中將所有的局部信息匯總起來,從而得到全部像素的信息。如下所示:左圖為全連接,右圖為卷積神經(jīng)網(wǎng)絡中用到的局部連接。
【參考文獻】:
期刊論文
[1]基于生物醫(yī)學文獻的化學物質致病關系抽取[J]. 李智恒,桂穎溢,楊志豪,林鴻飛,王健. 計算機研究與發(fā)展. 2018(01)
[2]基于卷積神經(jīng)網(wǎng)絡的圖像識別算法研究[J]. 張榮磊,田愛奎,譚浩,鄭睿. 山東理工大學學報(自然科學版). 2018(01)
[3]融合詞嵌入表示特征的實體關系抽取方法研究[J]. 張琴,郭紅梅,張智雄. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(09)
[4]卷積神經(jīng)網(wǎng)絡研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機學報. 2017(06)
[5]基于多通道卷積神經(jīng)網(wǎng)的實體關系抽取[J]. 肜博輝,付琨,黃宇,王洋. 計算機應用研究. 2017(03)
[6]疾病-病癥和病癥-治療物質的關系抽取研究[J]. 馮欽林,楊志豪,林鴻飛. 計算機工程與應用. 2017(10)
[7]基于核的關系抽取研究綜述[J]. 劉婧,趙嵩正,張小娣. 計算機應用研究. 2016(02)
[8]關系抽取研究綜述[J]. 母克東,萬琪. 現(xiàn)代計算機(專業(yè)版). 2015(03)
[9]電子病歷命名實體識別和實體關系抽取研究綜述[J]. 楊錦鋒,于秋濱,關毅,蔣志鵬. 自動化學報. 2014(08)
[10]關系抽取技術研究綜述[J]. 黃勛,游宏梁,于洋. 現(xiàn)代圖書情報技術. 2013(11)
博士論文
[1]中文文本自動分類中的關鍵問題研究[D]. 薛德軍.清華大學 2004
碩士論文
[1]機器學習算法在蛋白質結構預測中的應用[D]. 薛燕娜.江南大學 2016
[2]基于深度學習的中文電子病歷實體修飾與關系抽取研究及算法平臺開發(fā)[D]. 楊晨浩.哈爾濱工業(yè)大學 2016
[3]面向深度網(wǎng)絡的自編碼器研究[D]. 魯亞平.蘇州大學 2016
[4]基于多核學習的腫瘤—藥物—基因語義關系提取[D]. 王逯姚.北京協(xié)和醫(yī)學院 2015
[5]中樞性神經(jīng)系統(tǒng)感染性疾病數(shù)據(jù)庫建立及應用[D]. 黃守先.蘭州大學 2012
[6]中醫(yī)腎臟疾病臨床數(shù)據(jù)庫的構建及對IgA腎病數(shù)據(jù)資料的探索性研究[D]. 徐冰.北京中醫(yī)藥大學 2008
本文編號:3592662
【文章來源】:軍事科學院北京市
【文章頁數(shù)】:103 頁
【學位級別】:博士
【部分圖文】:
神經(jīng)網(wǎng)絡基礎單元
圖 3 具有單個隱層的神經(jīng)網(wǎng)絡的計算方式如下:1)x1+ W12(1)x2+ W13(1)x3+ b1(1))1)x1+ W22(1)x2+ W23(1)x3+ b2(1))1)x1+ W32(1)x2+ W33(1)x3+ b3(1)))= f (W11(2)a1(2)+ W12(2)a2(2)+ W13(2)a3(2)+b1(2)),神經(jīng)網(wǎng)絡結構可以進一步拓展到有 2,3,4,5,…多訓練由于其多層性,需要利用鏈式求導法則對隱藏為反向傳播(background propagation, BP)[68]。2.5 多種關聯(lián)抽取方法比較分析
由于受到生物學里面的視覺系統(tǒng)結構的啟發(fā)。因此,為了降低參與運算的參數(shù)數(shù),不需要每個神經(jīng)元接受全部像素的數(shù)據(jù),只需要對局部進行感知,隨后在高層網(wǎng)絡結構中將所有的局部信息匯總起來,從而得到全部像素的信息。如下所示:左圖為全連接,右圖為卷積神經(jīng)網(wǎng)絡中用到的局部連接。
【參考文獻】:
期刊論文
[1]基于生物醫(yī)學文獻的化學物質致病關系抽取[J]. 李智恒,桂穎溢,楊志豪,林鴻飛,王健. 計算機研究與發(fā)展. 2018(01)
[2]基于卷積神經(jīng)網(wǎng)絡的圖像識別算法研究[J]. 張榮磊,田愛奎,譚浩,鄭睿. 山東理工大學學報(自然科學版). 2018(01)
[3]融合詞嵌入表示特征的實體關系抽取方法研究[J]. 張琴,郭紅梅,張智雄. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(09)
[4]卷積神經(jīng)網(wǎng)絡研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機學報. 2017(06)
[5]基于多通道卷積神經(jīng)網(wǎng)的實體關系抽取[J]. 肜博輝,付琨,黃宇,王洋. 計算機應用研究. 2017(03)
[6]疾病-病癥和病癥-治療物質的關系抽取研究[J]. 馮欽林,楊志豪,林鴻飛. 計算機工程與應用. 2017(10)
[7]基于核的關系抽取研究綜述[J]. 劉婧,趙嵩正,張小娣. 計算機應用研究. 2016(02)
[8]關系抽取研究綜述[J]. 母克東,萬琪. 現(xiàn)代計算機(專業(yè)版). 2015(03)
[9]電子病歷命名實體識別和實體關系抽取研究綜述[J]. 楊錦鋒,于秋濱,關毅,蔣志鵬. 自動化學報. 2014(08)
[10]關系抽取技術研究綜述[J]. 黃勛,游宏梁,于洋. 現(xiàn)代圖書情報技術. 2013(11)
博士論文
[1]中文文本自動分類中的關鍵問題研究[D]. 薛德軍.清華大學 2004
碩士論文
[1]機器學習算法在蛋白質結構預測中的應用[D]. 薛燕娜.江南大學 2016
[2]基于深度學習的中文電子病歷實體修飾與關系抽取研究及算法平臺開發(fā)[D]. 楊晨浩.哈爾濱工業(yè)大學 2016
[3]面向深度網(wǎng)絡的自編碼器研究[D]. 魯亞平.蘇州大學 2016
[4]基于多核學習的腫瘤—藥物—基因語義關系提取[D]. 王逯姚.北京協(xié)和醫(yī)學院 2015
[5]中樞性神經(jīng)系統(tǒng)感染性疾病數(shù)據(jù)庫建立及應用[D]. 黃守先.蘭州大學 2012
[6]中醫(yī)腎臟疾病臨床數(shù)據(jù)庫的構建及對IgA腎病數(shù)據(jù)資料的探索性研究[D]. 徐冰.北京中醫(yī)藥大學 2008
本文編號:3592662
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3592662.html
最近更新
教材專著