基于語義的疾病相關(guān)蛋白質(zhì)知識(shí)抽取
發(fā)布時(shí)間:2017-12-03 06:27
本文關(guān)鍵詞:基于語義的疾病相關(guān)蛋白質(zhì)知識(shí)抽取
更多相關(guān)文章: 語義關(guān)系 信息抽取 SemRep KEGG
【摘要】:隨著人類基因組學(xué)研究和高通量技術(shù)的發(fā)展,涉及蛋白質(zhì)知識(shí)以及相關(guān)疾病、藥物的醫(yī)學(xué)文獻(xiàn)呈指數(shù)增長(zhǎng)。利用文本挖掘技術(shù)從大量的生物醫(yī)學(xué)文本中發(fā)現(xiàn)和抽取有價(jià)值的、新穎的蛋白質(zhì)知識(shí)已經(jīng)成為可能;赟emRep得到的特定疾病的M EDLINE文獻(xiàn)的語義輸出,通過顯著信息提取算法對(duì)該語義輸出進(jìn)行打分排序,抽取得到與特定疾病相關(guān)的蛋白質(zhì)以及蛋白質(zhì)和藥物之間的聯(lián)系。之后與KEGG數(shù)據(jù)庫中列出的該疾病相關(guān)的蛋白質(zhì)、基因進(jìn)行比較。實(shí)驗(yàn)結(jié)果對(duì)理解疾病的病因、蛋白質(zhì)功能預(yù)測(cè)以及藥物輔助設(shè)計(jì)都有重要的研究意義。
【作者單位】: 大連理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61070098,61272373,61340020) 新世紀(jì)優(yōu)秀人才支撐計(jì)劃項(xiàng)目(NCET-13-0084) 中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(DUT13JB09,DUT14YQ213)
【分類號(hào)】:R3411;TP391.1
【正文快照】: 網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/37.1389.N.20160311.1531.010.html0引言現(xiàn)如今,現(xiàn)代科學(xué)技術(shù)迅猛發(fā)展,數(shù)據(jù)庫技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)日益成熟,人們掌握的信息也越來越多。作為提高醫(yī)學(xué)研究水平重要手段之一,電子生物醫(yī)學(xué)文獻(xiàn)的數(shù)量也呈指數(shù)增長(zhǎng)。并且,海量數(shù)據(jù),
本文編號(hào):1247775
本文鏈接:http://sikaile.net/xiyixuelunwen/1247775.html
最近更新
教材專著