天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

生物醫(yī)學(xué)文獻中的藥物名抽取方法研究

發(fā)布時間:2020-02-26 05:17
【摘要】:隨著信息技術(shù)的快速發(fā)展,越來越多的生物醫(yī)學(xué)研究成果在互聯(lián)網(wǎng)上發(fā)布,如科學(xué)文獻和專利等文本數(shù)據(jù)的規(guī)模正在以指數(shù)級的速度快速增長。這些數(shù)據(jù)以非結(jié)構(gòu)化形式存儲,其中包含了很多與化合物和藥品相關(guān)的知識,例如化合物和藥品的靶向目標(biāo)和結(jié)合關(guān)系、新陳代謝、酶反映以及潛在的副作用和治療用途等等。如何獲取并利用這些蘊含在文本中的知識對相關(guān)研究和應(yīng)用有重大意義,首先需要解決的問題是如何高效地完成海量非結(jié)構(gòu)化文本數(shù)據(jù)中的藥物名(包括化合物和藥品)抽取工作。在此背景下,本課題主要對解決生物醫(yī)學(xué)文獻中藥物名抽取問題的方法做了相關(guān)研究。本課題的研究工作主要包括以下三個方面:第一,針對藥物名實體的特點設(shè)計了一個豐富有效的特征集合,使用條件隨機場和結(jié)構(gòu)化支持向量機,實現(xiàn)了基于領(lǐng)域特征的藥物名抽取方法。在對化合物和藥品實體的特點深入分析的基礎(chǔ)上,我們通過對比實驗選取了一個有效的特征集,不但有基本的領(lǐng)域特征,還包括詞表示特征。最終,在Bio Creative V CEMP評測任務(wù)的數(shù)據(jù)集上,基于條件隨機場的系統(tǒng)和基于結(jié)構(gòu)化支持向量機的系統(tǒng)分別取得了0.8704和0.8761的F1值。第二,研究使用深度學(xué)習(xí)解決藥物名抽取問題的方法。傳統(tǒng)的機器學(xué)習(xí)算法來解決命名實體抽取問題,通常系統(tǒng)的性能與特征的好壞有很大關(guān)系,深度學(xué)習(xí)作為一種能夠自動學(xué)習(xí)特征的機器學(xué)習(xí)方法,對很多問題更具有適用性。本課題利用循環(huán)神經(jīng)網(wǎng)絡(luò)的時序化結(jié)構(gòu)來解決藥物名抽取問題,最終采用循環(huán)神經(jīng)網(wǎng)絡(luò)和條件隨機場結(jié)合的方法,系統(tǒng)F1值達到0.8876,優(yōu)于常用的條件隨機場算法和標(biāo)準(zhǔn)的循環(huán)神經(jīng)網(wǎng)絡(luò)方法。第三,在領(lǐng)域特征方法和深度學(xué)習(xí)方法的基礎(chǔ)上,采用層疊泛化的集成學(xué)習(xí)方法對其進行融合,實現(xiàn)了基于層疊泛化的藥物名抽取方法。本文使用領(lǐng)域特征方法和深度學(xué)習(xí)方法構(gòu)造初級學(xué)習(xí)器,通過對他們抽取結(jié)果的分析,設(shè)計了一套表征他們之間差異性和一致性的特征集,使用線性核支持向量機方法構(gòu)建元學(xué)習(xí)器,實現(xiàn)對初級學(xué)習(xí)器的集成,最終基于層疊泛化方法的F1值達到0.8906。本文研究并實現(xiàn)了解決生物醫(yī)學(xué)文獻中藥物名抽取問題的方法。實驗結(jié)果表明,本論文中的方法能夠有效地從非結(jié)構(gòu)化文本數(shù)據(jù)抽取出藥物名等信息。
【圖文】:

文本數(shù)據(jù),專利


專利文本數(shù)據(jù)樣例

科學(xué)文獻,專利,數(shù)據(jù)庫文獻,制表符


圖 5-2 科學(xué)文獻文本數(shù)據(jù)樣例專利摘要數(shù)據(jù)和科學(xué)文獻摘要數(shù)據(jù)是以 UTF-8 格式編碼的純文本數(shù)據(jù)他們以制表符分隔成三部分:1)文檔編號(PubMed 數(shù)據(jù)庫文獻 ID 或?qū)@?IP編碼);2)文獻或?qū)@臉?biāo)題 3)文獻或?qū)@恼。圖中高亮的部分也就文本中出現(xiàn)的藥物名,以圖 5-1 中的專利文本為例,,標(biāo)注數(shù)據(jù)提供了藥物名
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1

【參考文獻】

相關(guān)期刊論文 前3條

1 陳恩紅;邱思語;許暢;田飛;劉鐵巖;;單詞嵌入——自然語言的連續(xù)空間表示[J];數(shù)據(jù)采集與處理;2014年01期

2 胡文靜;;文本分類技術(shù)進展[J];知識經(jīng)濟;2011年10期

3 鄭強;劉齊軍;王正華;朱云平;;生物醫(yī)學(xué)命名實體識別的研究與進展[J];計算機應(yīng)用研究;2010年03期



本文編號:2582927

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2582927.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a0581***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产二级一级内射视频播放| 国产精品免费无遮挡不卡视频| 久草视频这里只是精品| 国产又粗又猛又大爽又黄| 熟女高潮一区二区三区| 欧美熟妇一区二区在线| 亚洲精品中文字幕一二三| 欧美三级大黄片免费看| 久草国产精品一区二区| 自拍偷女厕所拍偷区亚洲综合| 精品国产日韩一区三区| 国产精品久久精品国产| 久久精品国产亚洲av麻豆尤物| 亚洲男人天堂网在线视频| 男人和女人草逼免费视频| 福利一区二区视频在线| 98精品永久免费视频| 欧美日本精品视频在线观看| 婷婷亚洲综合五月天麻豆| 成人精品一区二区三区在线| 好骚国产99在线中文| 麻豆一区二区三区精品视频| 国产精品欧美日韩中文字幕| 精品熟女少妇av免费久久野外| 亚洲精品福利视频在线观看| 中文字字幕在线中文乱码二区| 国产偷拍盗摄一区二区| 欧美人妻盗摄日韩偷拍| 欧美国产日产综合精品| 日韩午夜福利高清在线观看| 激情视频在线视频在线视频| 91欧美一区二区三区| 日本不卡在线一区二区三区| 老司机精品一区二区三区| 亚洲中文字幕乱码亚洲| 日本高清视频在线播放| 免费午夜福利不卡片在线 视频 | 最近日韩在线免费黄片| 九九热这里只有免费精品| 中文字幕有码视频熟女| 六月丁香六月综合缴情|