面向海量生物醫(yī)學文獻的實體關系提取方法及其應用研究
發(fā)布時間:2021-03-11 23:28
生物醫(yī)學文獻是生物醫(yī)藥大數(shù)據(jù)的一類重要來源,其中包含了大量有價值的信息。但這些信息多以非結構化文本的形式存在,加之文獻數(shù)目以千萬計,因此,需要信息的高效獲取和利用需要先進、高效的計算機方法;谧匀徽Z言處理(NLP)的文本挖掘技術,可以識別海量生物醫(yī)學文獻中的基因、藥物、疾病和變異等關鍵的生物醫(yī)學概念(命名實體識別,NER),并可在此基礎上挖掘的概念實體之間的關系(RE)。已有相關研究表明,生物醫(yī)學文獻具有其獨特的語言特點且很多情況下依賴于復雜的領域背景知識,因此生物醫(yī)學文獻挖掘不能直接照搬通用NLP的方法和工具,需要進行專門的研究。生物醫(yī)學文獻的命名實體識別已有大量相關研究和軟件工具,目前已可涵蓋大部分關鍵的生物醫(yī)學概念;但針對實體間關系的提取,則是近兩年才成為研究的熱點。實體間關系提取需要進行深度的語義和語法分析,流程較為復雜,當前的主流方法準確率不能令人滿意。此外,生物醫(yī)學文獻的數(shù)量龐大,當前最全的生物醫(yī)學文獻庫PubMed包含超過兩千萬篇摘要和百萬篇全文,這樣大的數(shù)據(jù)量,對計算能力提出了嚴峻的挑戰(zhàn)。因此,如何設計與實現(xiàn)識別性能好、計算效率高的關系提取方法是本課題研究的主要科學問...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:84 頁
【學位級別】:碩士
【部分圖文】:
生物醫(yī)藥文獻挖掘流水線
本文組織結構
例句2-1的依存關系分析
本文編號:3077286
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:84 頁
【學位級別】:碩士
【部分圖文】:
生物醫(yī)藥文獻挖掘流水線
本文組織結構
例句2-1的依存關系分析
本文編號:3077286
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3077286.html
最近更新
教材專著