基于信息抽取的疾病與基因關(guān)聯(lián)關(guān)系研究
發(fā)布時(shí)間:2021-12-18 05:54
目的:從醫(yī)學(xué)信息學(xué)的視角出發(fā),旨在從生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)中發(fā)現(xiàn)疾病與基因的關(guān)聯(lián)關(guān)系。為從文獻(xiàn)中發(fā)現(xiàn)疾病與基因的關(guān)聯(lián)關(guān)系,建立基于信息抽取的疾病-基因關(guān)聯(lián)關(guān)系發(fā)現(xiàn)模式。研究對關(guān)聯(lián)關(guān)系的強(qiáng)度與深度進(jìn)行定義與分析,從文獻(xiàn)中發(fā)現(xiàn)疾病與基因的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)基于文獻(xiàn)數(shù)據(jù)的知識發(fā)現(xiàn)。應(yīng)用PubMed中糖尿病并發(fā)癥主題的文獻(xiàn)數(shù)據(jù)進(jìn)行實(shí)證研究,發(fā)現(xiàn)糖尿病并發(fā)癥與基因的關(guān)聯(lián)關(guān)系,論證揭示模式的科學(xué)性、在知識發(fā)現(xiàn)領(lǐng)域的合理性和可行性。通過對文獻(xiàn)摘要數(shù)據(jù)進(jìn)行文本挖掘,發(fā)現(xiàn)疾病關(guān)聯(lián)基因及其規(guī)律,實(shí)現(xiàn)知識發(fā)現(xiàn),為疾病的預(yù)防與治療提供依據(jù)。方法:通過文獻(xiàn)調(diào)研法系統(tǒng)詳實(shí)地對醫(yī)學(xué)文本挖掘、信息抽取等領(lǐng)域的國內(nèi)外研究現(xiàn)狀進(jìn)行綜述,并對研究相關(guān)的理論與方法進(jìn)行述評;诋(dāng)前研究現(xiàn)狀與理論方法基礎(chǔ),提出基于信息抽取的疾病-基因關(guān)聯(lián)關(guān)系發(fā)現(xiàn)模式。關(guān)聯(lián)關(guān)系發(fā)現(xiàn)模式可發(fā)現(xiàn)疾病與基因間的關(guān)聯(lián)關(guān)系,并從關(guān)系的關(guān)聯(lián)強(qiáng)度與關(guān)聯(lián)深度進(jìn)行關(guān)系的剖析與揭示。模式整合了本體理論和共詞分析法、命名實(shí)體識別、關(guān)系抽取等技術(shù)的思想,從文獻(xiàn)摘要中識別并抽取疾病與基因的關(guān)聯(lián)關(guān)系。應(yīng)用知識發(fā)現(xiàn)和文獻(xiàn)計(jì)量學(xué)理論,定義并分析了疾病與基因關(guān)聯(lián)關(guān)系的強(qiáng)度與深度:關(guān)聯(lián)關(guān)系...
【文章來源】: 吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 研究目的與意義
1.2.1 研究目的
1.2.2 研究意義
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 生物醫(yī)學(xué)領(lǐng)域文本挖掘研究現(xiàn)狀
1.3.2 信息抽取研究現(xiàn)狀
1.3.3 國內(nèi)外研究現(xiàn)狀述評
1.4 研究內(nèi)容與論文結(jié)構(gòu)
1.4.1 研究內(nèi)容
1.4.2 論文結(jié)構(gòu)
1.5 研究方法與研究思路
1.5.1 研究方法
1.5.2 研究思路
第2章 相關(guān)理論與方法
2.1 相關(guān)理論基礎(chǔ)
2.1.1 知識發(fā)現(xiàn)理論
2.1.2 本體理論
2.1.3 文獻(xiàn)計(jì)量學(xué)
2.2 相關(guān)方法
2.2.1 共詞分析法
2.2.2 信息抽取
2.2.3 聚類分析
2.2.4 基因富集
第3章 疾病-基因關(guān)聯(lián)關(guān)系發(fā)現(xiàn)模式研究
3.1 模式構(gòu)建
3.1.1 模式概念
3.1.2 模式流程
3.2 關(guān)聯(lián)強(qiáng)度發(fā)現(xiàn)
3.2.1 疾病與基因的實(shí)體識別
3.2.2 疾病與基因的關(guān)系抽取
3.2.3 關(guān)聯(lián)強(qiáng)度分析
3.3 關(guān)聯(lián)深度發(fā)現(xiàn)
3.3.1 語義關(guān)聯(lián)揭示
3.3.2 生物關(guān)聯(lián)揭示
3.4 本章小結(jié)
第4章 疾病-基因關(guān)聯(lián)關(guān)系發(fā)現(xiàn)模式實(shí)證研究
4.1 數(shù)據(jù)獲取
4.1.1 疾病選取
4.1.2 數(shù)據(jù)來源
4.1.3 檢索策略
4.1.4 數(shù)據(jù)導(dǎo)出
4.2 詞表構(gòu)建
4.3 疾病-基因關(guān)聯(lián)強(qiáng)度分析
4.3.1 疾病-基因關(guān)聯(lián)關(guān)系發(fā)現(xiàn)
4.3.2 關(guān)聯(lián)強(qiáng)度分析結(jié)果
4.3.3 關(guān)聯(lián)強(qiáng)度發(fā)現(xiàn)
4.4 疾病-基因關(guān)聯(lián)深度分析
4.4.1 不同并發(fā)癥共同關(guān)聯(lián)基因分析
4.4.2 疾病-基因語義關(guān)系發(fā)現(xiàn)
4.4.3 關(guān)聯(lián)深度發(fā)現(xiàn)
4.5 本章小結(jié)
第5章 結(jié)論與展望
5.1 研究結(jié)論
5.2 研究創(chuàng)新點(diǎn)
5.3 研究局限與展望
5.3.1 研究局限
5.3.2 研究展望
參考文獻(xiàn)
作者簡介及科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]胃癌相關(guān)易感基因的生物信息學(xué)分析 [J]. 李玲,蘇韞,劉永琦,駱亞莉,張麗英,王鳳梅,任春貞,盧志偉,柳峰峰. 中華中醫(yī)藥雜志. 2018(06)
[2]基于生物醫(yī)學(xué)文獻(xiàn)挖掘的疾病-基因-藥物關(guān)系抽取研究 [J]. 翟菊葉,葉澤坤,楊樞,劉長青. 新余學(xué)院學(xué)報(bào). 2018(02)
[3]基于數(shù)據(jù)立方體挖掘疾病–基因–藥物新關(guān)聯(lián) [J]. 魏星,胡德華,易敏寒,朱啟貞,朱文婕. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(10)
[4]全基因組關(guān)聯(lián)研究通路分析方法現(xiàn)狀 [J]. 王鈺嫣,王子興,胡耀達(dá),王蕾,李寧,張彪,韓偉,姜晶梅. 遺傳. 2017(08)
[5]共詞分析過程中的若干問題研究 [J]. 李綱,巴志超. 中國圖書館學(xué)報(bào). 2017(04)
[6]利用GEO數(shù)據(jù)庫分析結(jié)腸癌中EZH2及其相關(guān)基因的表達(dá)與意義 [J]. 宋達(dá)為,黃睿,湯慶超,馬天翼,羅玥琛,王貴玉,王錫山. 中華結(jié)直腸疾病電子雜志. 2016(06)
[7]基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架研究 [J]. 夏立新,陳晨,王忠義. 情報(bào)科學(xué). 2016(05)
[8]糖尿病患者需注意心血管并發(fā)癥 [J]. 韓旭. 開卷有益—求醫(yī)問藥. 2016(04)
[9]大數(shù)據(jù)知識發(fā)現(xiàn)的本體論追問 [J]. 段偉文. 哲學(xué)研究. 2015(11)
[10]糖尿病腎病的發(fā)病機(jī)制及治療進(jìn)展 [J]. 余翠,熊錢穎,王李卓,高家林. 醫(yī)學(xué)綜述. 2015(21)
博士論文
[1]Irisin及其基因多態(tài)性與中國人2型糖尿病相關(guān)臨床性狀及微血管并發(fā)癥的關(guān)系[D]. 唐珊珊.上海交通大學(xué). 2015
[2]2型糖尿病大血管并發(fā)癥中血管平滑肌細(xì)胞增殖相關(guān)基因DNA甲基化的作用研究[D]. 徐哲奕.華中科技大學(xué). 2014
[3]面向生物醫(yī)學(xué)文本的疾病關(guān)系挖掘模型及算法研究[D]. 楊黎.華中科技大學(xué). 2013
碩士論文
[1]基于UMLS和通路數(shù)據(jù)的潛在語義分析技術(shù)的研究與實(shí)現(xiàn)[D]. 尚美辰.黑龍江大學(xué). 2015
[2]基于多核學(xué)習(xí)的腫瘤—藥物—基因語義關(guān)系提取[D]. 王逯姚.北京協(xié)和醫(yī)學(xué)院. 2015
[3]面向語義關(guān)系發(fā)現(xiàn)的文本挖掘研究[D]. 劉明巖.南京理工大學(xué). 2010
本文編號:3541768
【文章來源】: 吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 研究目的與意義
1.2.1 研究目的
1.2.2 研究意義
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 生物醫(yī)學(xué)領(lǐng)域文本挖掘研究現(xiàn)狀
1.3.2 信息抽取研究現(xiàn)狀
1.3.3 國內(nèi)外研究現(xiàn)狀述評
1.4 研究內(nèi)容與論文結(jié)構(gòu)
1.4.1 研究內(nèi)容
1.4.2 論文結(jié)構(gòu)
1.5 研究方法與研究思路
1.5.1 研究方法
1.5.2 研究思路
第2章 相關(guān)理論與方法
2.1 相關(guān)理論基礎(chǔ)
2.1.1 知識發(fā)現(xiàn)理論
2.1.2 本體理論
2.1.3 文獻(xiàn)計(jì)量學(xué)
2.2 相關(guān)方法
2.2.1 共詞分析法
2.2.2 信息抽取
2.2.3 聚類分析
2.2.4 基因富集
第3章 疾病-基因關(guān)聯(lián)關(guān)系發(fā)現(xiàn)模式研究
3.1 模式構(gòu)建
3.1.1 模式概念
3.1.2 模式流程
3.2 關(guān)聯(lián)強(qiáng)度發(fā)現(xiàn)
3.2.1 疾病與基因的實(shí)體識別
3.2.2 疾病與基因的關(guān)系抽取
3.2.3 關(guān)聯(lián)強(qiáng)度分析
3.3 關(guān)聯(lián)深度發(fā)現(xiàn)
3.3.1 語義關(guān)聯(lián)揭示
3.3.2 生物關(guān)聯(lián)揭示
3.4 本章小結(jié)
第4章 疾病-基因關(guān)聯(lián)關(guān)系發(fā)現(xiàn)模式實(shí)證研究
4.1 數(shù)據(jù)獲取
4.1.1 疾病選取
4.1.2 數(shù)據(jù)來源
4.1.3 檢索策略
4.1.4 數(shù)據(jù)導(dǎo)出
4.2 詞表構(gòu)建
4.3 疾病-基因關(guān)聯(lián)強(qiáng)度分析
4.3.1 疾病-基因關(guān)聯(lián)關(guān)系發(fā)現(xiàn)
4.3.2 關(guān)聯(lián)強(qiáng)度分析結(jié)果
4.3.3 關(guān)聯(lián)強(qiáng)度發(fā)現(xiàn)
4.4 疾病-基因關(guān)聯(lián)深度分析
4.4.1 不同并發(fā)癥共同關(guān)聯(lián)基因分析
4.4.2 疾病-基因語義關(guān)系發(fā)現(xiàn)
4.4.3 關(guān)聯(lián)深度發(fā)現(xiàn)
4.5 本章小結(jié)
第5章 結(jié)論與展望
5.1 研究結(jié)論
5.2 研究創(chuàng)新點(diǎn)
5.3 研究局限與展望
5.3.1 研究局限
5.3.2 研究展望
參考文獻(xiàn)
作者簡介及科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]胃癌相關(guān)易感基因的生物信息學(xué)分析 [J]. 李玲,蘇韞,劉永琦,駱亞莉,張麗英,王鳳梅,任春貞,盧志偉,柳峰峰. 中華中醫(yī)藥雜志. 2018(06)
[2]基于生物醫(yī)學(xué)文獻(xiàn)挖掘的疾病-基因-藥物關(guān)系抽取研究 [J]. 翟菊葉,葉澤坤,楊樞,劉長青. 新余學(xué)院學(xué)報(bào). 2018(02)
[3]基于數(shù)據(jù)立方體挖掘疾病–基因–藥物新關(guān)聯(lián) [J]. 魏星,胡德華,易敏寒,朱啟貞,朱文婕. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(10)
[4]全基因組關(guān)聯(lián)研究通路分析方法現(xiàn)狀 [J]. 王鈺嫣,王子興,胡耀達(dá),王蕾,李寧,張彪,韓偉,姜晶梅. 遺傳. 2017(08)
[5]共詞分析過程中的若干問題研究 [J]. 李綱,巴志超. 中國圖書館學(xué)報(bào). 2017(04)
[6]利用GEO數(shù)據(jù)庫分析結(jié)腸癌中EZH2及其相關(guān)基因的表達(dá)與意義 [J]. 宋達(dá)為,黃睿,湯慶超,馬天翼,羅玥琛,王貴玉,王錫山. 中華結(jié)直腸疾病電子雜志. 2016(06)
[7]基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架研究 [J]. 夏立新,陳晨,王忠義. 情報(bào)科學(xué). 2016(05)
[8]糖尿病患者需注意心血管并發(fā)癥 [J]. 韓旭. 開卷有益—求醫(yī)問藥. 2016(04)
[9]大數(shù)據(jù)知識發(fā)現(xiàn)的本體論追問 [J]. 段偉文. 哲學(xué)研究. 2015(11)
[10]糖尿病腎病的發(fā)病機(jī)制及治療進(jìn)展 [J]. 余翠,熊錢穎,王李卓,高家林. 醫(yī)學(xué)綜述. 2015(21)
博士論文
[1]Irisin及其基因多態(tài)性與中國人2型糖尿病相關(guān)臨床性狀及微血管并發(fā)癥的關(guān)系[D]. 唐珊珊.上海交通大學(xué). 2015
[2]2型糖尿病大血管并發(fā)癥中血管平滑肌細(xì)胞增殖相關(guān)基因DNA甲基化的作用研究[D]. 徐哲奕.華中科技大學(xué). 2014
[3]面向生物醫(yī)學(xué)文本的疾病關(guān)系挖掘模型及算法研究[D]. 楊黎.華中科技大學(xué). 2013
碩士論文
[1]基于UMLS和通路數(shù)據(jù)的潛在語義分析技術(shù)的研究與實(shí)現(xiàn)[D]. 尚美辰.黑龍江大學(xué). 2015
[2]基于多核學(xué)習(xí)的腫瘤—藥物—基因語義關(guān)系提取[D]. 王逯姚.北京協(xié)和醫(yī)學(xué)院. 2015
[3]面向語義關(guān)系發(fā)現(xiàn)的文本挖掘研究[D]. 劉明巖.南京理工大學(xué). 2010
本文編號:3541768
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3541768.html
最近更新
教材專著