基于科研文獻挖掘的疾病與藥物關聯研究
發(fā)布時間:2018-03-24 01:23
本文選題:科研文獻挖掘 切入點:生物醫(yī)學實體 出處:《山西醫(yī)科大學》2017年碩士論文
【摘要】:目的:生物醫(yī)學實體是包含在醫(yī)學科研文獻中出現的疾病、藥物、基因等名稱、術語或概念,即一種文獻內含知識,了解其相互關聯對于科學研究意義重大。然此類知識被大量淹沒于文獻海洋,亟需一種有效知識管理方式將之快速地展現給科研人員。鑒于此,本研究擬基于科研文獻挖掘開展疾病與藥物實體關聯研究。方法:1.文獻分析法通過搜集、鑒別、整理相關文獻,分析當前國內外相關研究歷史、現狀及存在的問題。在閱讀、整理、歸納、分析這些文獻材料的基礎上,借鑒他人的研究成果,從而形成自己的研究框架。2.編程語言和數據庫技術利用Java和Python等程序設計語言和數據庫技術將上述PubMed ID相關的文獻信息下載,進行批量數據有序化,并在MySQL數據庫中分別建庫。3.生物實體識別方法使用基于詞典的匹配方法識別疾病實體與藥物實體。4.信息計量學方法利用Python自編程序語言,基于信息計量學中的共現關系構建疾病與藥物實體共現網絡,并運用詞頻分析和共詞分析進行疾病與藥物實體關聯分析。5.社會網絡分析方法利用社會網絡分析工具Pajek對共現網絡進行宏觀和微觀層次的指標分析。微觀指標層次進行中心度(點度中心度、接近中心度、中介中心度)等指標的對比分析。最后利用Gephi對共現網絡進行可視化分析。結果與結論:本研究所使用的生物醫(yī)學實體識別及關聯發(fā)現方法能夠幫助科研人員從大規(guī)模的生物醫(yī)學文本中快速探測被隱藏的關聯,具有良好的推廣性,也同樣適用于疾病-基因、基因-藥物等其他生物醫(yī)學實體之間的分析。
[Abstract]:Objective: biomedical entity is to include in the medical research literature of the disease, medication, gene name, term or concept, which is a document containing knowledge, understand the relationship for scientific research is of great significance. However, such knowledge is submerged in the ocean of literature, need an effective knowledge management mode will quickly show for researchers. In view of this, this study intends to carry out the research on related diseases and drug entity mining based on scientific literature. Methods: 1. literature analysis by collecting, collating relevant literature, identification, analysis of the current domestic and foreign related research history, current situation and existing problems. In the reading, sorting, summary, analysis of these documents on the reference of others' research achievements, to form their own research framework of.2. programming language and database technology using Java and Python programming language and database technology of the P UbMed ID related information download, batch data ordering, and in the MySQL database were database.3. biological entity recognition method by using Python programming language matching method to identify disease entity and entity.4. drug information measurement dictionary based on information in metrology co-occurrence relationship building disease and drug entity co-occurrence based on the network, and the use of the word frequency analysis and co word analysis of disease associated with drug entity analysis.5. social network analysis method of co-occurrence analysis tool Pajek network to analyze the macro and micro level indicators. Using social network micro index level center (degree centrality, closeness centrality, betweenness centrality) comparative analysis other indicators. Finally, using Gephi visualization analysis of co-occurrence network. Results and conclusion: biomedical and entity recognition used in this study The joint discovery method can help researchers quickly detect hidden associations from large-scale biomedical texts, and has good generalization. It also applies to the analysis of diseases, genes, genes, drugs and other biomedical entities.
【學位授予單位】:山西醫(yī)科大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1;R-05
【參考文獻】
相關期刊論文 前5條
1 王鵬遠;姬東鴻;;基于多標簽CRF的疾病名稱抽取[J];計算機應用研究;2017年01期
2 李麗雙;何紅磊;劉珊珊;黃德根;;基于詞表示方法的生物醫(yī)學命名實體識別[J];小型微型計算機系統(tǒng);2016年02期
3 龔樂君;韋有兵;謝建明;袁志棟;孫嘯;;一種面向基因與疾病關系的文本挖掘方法[J];東南大學學報(自然科學版);2010年03期
4 鄭強;劉齊軍;王正華;朱云平;;生物醫(yī)學命名實體識別的研究與進展[J];計算機應用研究;2010年03期
5 馮璐;冷伏海;;共詞分析方法理論進展[J];中國圖書館學報;2006年02期
相關會議論文 前1條
1 王浩暢;趙鐵軍;劉延力;于浩;;生物醫(yī)學文本中命名實體識別的智能化方法[A];2006年首屆ICT大會信息、知識、智能及其轉換理論第一次高峰論壇會議論文集[C];2006年
相關碩士學位論文 前1條
1 潘昌霖;臨床醫(yī)學中數據挖掘技術的研究與應用[D];中國人民解放軍醫(yī)學院;2013年
,本文編號:1656087
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1656087.html