天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學習的生物醫(yī)學實體關系抽取算法研究

發(fā)布時間:2021-08-20 14:53
  近年來,隨著生物醫(yī)學技術的進步,生物醫(yī)學領域產(chǎn)生了大量的研究成果,該領域文獻呈急劇增長趨勢。截止目前,醫(yī)學文獻搜索引擎PubMed引文已經(jīng)超過三千萬,這些文獻中蘊含著豐富的生物醫(yī)學知識。面對如此海量的文獻,科研人員通過人工閱讀的方式獲取有用信息、了解生物醫(yī)學領域最新研究進展越來越困難。通過文本挖掘從海量文獻中自動挖掘出知識是解決這一困境的可行辦法,受到了越來越多研究人員的關注。實體關系抽取技術是文本挖掘領域的關鍵技術。生物醫(yī)學文獻中存在許多命名實體,這些實體包括蛋白質、藥物和疾病等類型。這些命名實體之間存在許多關系例如蛋白質和蛋白質之間的交互關系、藥物和疾病之間的治療關系。通過實體關系抽取技術將這些實體關系從文獻中挖掘出來對生物學家進行系統(tǒng)生物學研究有重要意義。當前該技術主要有三類方法:共現(xiàn)法、模板匹配方法和機器學習方法。相較于共現(xiàn)方法的低精確率和模板匹配方法的低召回率,機器學習方法由于出色的性能受到研究人員的廣泛關注;跈C器學習的關系抽取方法可分為:基于特征工程的方法、基于核函數(shù)的方法和基于深度學習的方法。基于特征工程和基于核函數(shù)的方法比較依賴于特征設計,因此,近期的研究熱點是使用... 

【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:62 頁

【學位級別】:碩士

【部分圖文】:

基于深度學習的生物醫(yī)學實體關系抽取算法研究


986年-2010年PubMed引文數(shù)量變化[2]

句法,示例,句子


司吞岢雋艘恢只?謨錕楹痛市緣惹巢閿镅匝?畔⒌暮撕?齕57]。單獨一個核函數(shù)通常只從一個角度建模句子,可以結合多個核函數(shù)來對句子充分建模。Miwa等人通過多核學習方法(multiplekernellearning)結合了多種關系抽取核函數(shù),在蛋白質-蛋白質交互關系抽取任務上取得了極好的性能[58];诤撕瘮(shù)的方法嚴重依賴于其他自然語言處理工具,這些工具產(chǎn)生的錯誤通常會造成其他模型的錯誤累積。分類器在利用核函數(shù)時,通常會構造一個核矩陣。當訓練數(shù)據(jù)比較大時,相應的核矩陣也比較大,此時基于核方法的模型訓練變得不那么可行。圖1.2依存句法解析結果示例[59]將深度學習算法應用于生物醫(yī)學關系抽取也是近期的研究熱點。由于生物醫(yī)學關系抽取語料規(guī)模普遍比較小,用語跟通用領域語料并不完全一致,因此設計深度神經(jīng)網(wǎng)絡時需要考慮生物醫(yī)學領域的特點。深度神經(jīng)網(wǎng)絡對數(shù)據(jù)的需求量大,將句法結構信息引入神經(jīng)網(wǎng)絡可以提供一定的先驗知識,減少對數(shù)據(jù)的需求。實體對在句子間的最短依存路徑通常被認為最可能表達實體間關系,這個路徑上的詞可以看做一個簡化的句子。例如:句子“Acanthamoebaprofilinaffectsthemechanicalpropertiesofnon-filamentousactin.”的依存句法解析結果如圖1.2所示。在這個句子中profilin和actin分別為兩個蛋白質實體。這兩個詞的最短依存路徑為圖中標紅的連接線?梢钥闯鲎疃桃来媛窂健皃rofilinaffectspropertiesactin”比原始句子短,也更容易理解。因此,最短依存路徑被廣泛用于基于深度學習的生物醫(yī)學關系抽取模型中[59–62]。Yadav等人認為實體間的最短依存路徑上的詞序列比整個句子對抽取醫(yī)學關系更有用,因此提出了一個結合最短依存路徑和基于Attention的LongShortTerm-Memory(LSTM)的關系抽取模型Att-sdpLSTM[60]。這個?

實例圖,實例,句子,實體


第2章相關理論介紹10第2章相關理論介紹2.1生物醫(yī)學實體關系抽取2.1.1任務介紹生物醫(yī)學實體關系抽取的任務目標是將給定句子中描述的生物醫(yī)學實體間關系給抽取出來。在進行該任務前首先需要把句子中出現(xiàn)的生物醫(yī)學實體給找出來。圖2.1所示的實例共標注有三個蛋白質實體,它們是LEC、CCR1和CCR8。圖2.2所示的實例共標注有三個藥物實體,它們分別是Metopirone、acetaminophen和acetaminophen。醫(yī)學關系抽取語料都會對句子中的領域命名實體給標注出來,當前大部分工作都假定實體是預先給定,因此本文也遵循這一做法。圖2.1關系抽取實例1圖2.2關系抽取實例2知道句子中命名實體后,需要通過某種方法判斷實體間是否存在關系,這一步叫做實體關系檢測。如圖2.1所示,該句子描述了LEC蛋白質和CCR1蛋白質之間的關系,但是并沒有描述CCR1和CCR8之間的關系。在確定實體間存在關

【參考文獻】:
期刊論文
[1]實體關系自動抽取[J]. 車萬翔,劉挺,李生.  中文信息學報. 2005(02)



本文編號:3353703

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3353703.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶8a606***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com