基于文本挖掘的潛在藥物不良反應發(fā)現(xiàn)
發(fā)布時間:2017-05-06 16:06
本文關鍵詞:基于文本挖掘的潛在藥物不良反應發(fā)現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:生物醫(yī)學技術的發(fā)展為人類提供了大量的藥品用以治療各種疾病。一方面,藥物對于治療人類疾病,改善人類健康水平,延長人類壽命起到重要作用;另一方面,藥物不良反應又使得藥物在某些情況下對人類身體健康產(chǎn)生嚴重危害,而這些危害甚至可能是致命的。藥物不良反應不僅對個人健康產(chǎn)生危害,而且給整個社會帶來巨大的經(jīng)濟損失。如何及時高效而又全面地發(fā)現(xiàn)藥物所導致的不良反應成為醫(yī)學界和學術界所關注的熱點。藥物流向市場之前必須進行綜合的臨床試驗。但由于其局限性,臨床試驗不能保證揭露藥物所有的不良反應。藥物上市后,藥物不良事件報告系統(tǒng)成為監(jiān)控藥物安全、發(fā)現(xiàn)藥物不良反應的主要依托。隨著Web2.0技術的發(fā)展以及互聯(lián)網(wǎng)廣泛的普及,健康社交網(wǎng)站積累了大量的用藥者評論,這些用藥者評論數(shù)據(jù)蘊含豐富的藥物不良反應信息,為挖掘潛在藥物不良反應、監(jiān)控藥物安全提供了新的數(shù)據(jù)源。針對藥物不良事件報告系統(tǒng)中的數(shù)據(jù),本文利用非序列化Skip-gram模型,訓練生成藥物和不良反應的分布式實體向量,利用向量之間的運算來計算藥物和不良反應之間的關聯(lián)性達到挖掘潛在藥物不良反應的目的。實驗表明,非序列化Skip-gram模型生成的分布式實體向量,有效地捕捉了藥物和不良反應之間的關聯(lián)性,可以用于進行潛在藥物不良反應的發(fā)現(xiàn)。針對社交網(wǎng)絡中的用藥者評論數(shù)據(jù),本文利用信息熵和字典匹配的方法從用戶評論中挖掘藥物不良反應。但是,從用戶評論中挖掘到的藥物不良反應是“潛在”意義的不良反應,尚未得到臨床意義上的驗證,而驗證潛在藥物不良反應的真?zhèn)涡允呛臅r耗力的過程。因此,本文利用非序列化Skip-gram模型,生成生物醫(yī)學實體的分布式向量,對于藥物d和不良反應a,利用所生成的分布式實體向量,盡最大努力發(fā)現(xiàn)藥物d和不良反應a之間的關聯(lián)蛋白質,為生物醫(yī)學專家最終確定其真實性提供蛋白質級別的參考,從而縮短確定潛在不良反應真實性的時間,實現(xiàn)及時發(fā)現(xiàn)藥物潛在風險的目標。
【關鍵詞】:藥物不良反應 非序列化Skip-gram 分布式向量
【學位授予單位】:大連理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:R96;TP311.13
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-15
- 1.1 研究背景9-11
- 1.2 研究現(xiàn)狀11-13
- 1.2.1 基于不良事件報告系統(tǒng)的研究現(xiàn)狀11-12
- 1.2.2 基于社交網(wǎng)絡的研究現(xiàn)狀12-13
- 1.3 本文工作13
- 1.4 本文結構13-15
- 2 相關資源和算法15-23
- 2.1 生物醫(yī)學數(shù)據(jù)資源15-18
- 2.1.1 SIDER15
- 2.1.2 Semantic MEDLINE Database15-16
- 2.1.3 MeSH16-17
- 2.1.4 DrugBank17-18
- 2.2 生物醫(yī)學工具18-19
- 2.3 相關算法19-22
- 2.3.1 非序列化Skip-gram模型19-21
- 2.3.2 信息熵21-22
- 2.4 本章小結22-23
- 3 面向不良事件報告的潛在藥物不良反應發(fā)現(xiàn)23-31
- 3.1 問題引出23
- 3.2 實驗數(shù)據(jù)23-24
- 3.3 研究框架24
- 3.4 方法24-28
- 3.4.1 藥名文本去噪24-25
- 3.4.2 藥名實體識別(MetaMap)25
- 3.4.3 語義類型過濾25-27
- 3.4.4 生成分布式實體向量27-28
- 3.4.5 計算藥物和不良反應之間關聯(lián)度28
- 3.5 實驗分析28-30
- 3.6 本章小結30-31
- 4 面向社交網(wǎng)絡的潛在藥物不良反應發(fā)現(xiàn)31-44
- 4.1 問題引出31
- 4.2 研究框架31-33
- 4.2.1 數(shù)據(jù)獲取模塊32
- 4.2.2 潛在不良反應識別模塊32
- 4.2.3 關聯(lián)蛋白質尋求模塊32-33
- 4.3 識別潛在藥物不良反應33-36
- 4.3.1 生成“疾病和不良反應”詞典33
- 4.3.2 基于信息熵和字典匹配的“疾病和不良反應”實體識別33-34
- 4.3.3 基于DrugBank和Semantic MEDLINE的適應癥標記34-35
- 4.3.4 基于SIDER的已知藥物不良反應標記35
- 4.3.5 潛在藥物不良反應標記35-36
- 4.4 尋求潛在不良反應的證據(jù)36-37
- 4.4.1 關聯(lián)度36-37
- 4.4.2 基于Skip-gram模型的生物實體關聯(lián)度37
- 4.5 實驗結果分析37-43
- 4.5.1 不良反應識別結果38-40
- 4.5.2 分布式實體向量40-41
- 4.5.3 關聯(lián)蛋白質41-43
- 4.6 本章小結43-44
- 結論44-46
- 參考文獻46-49
- 攻讀碩士學位期間發(fā)表學術論文情況49-50
- 致謝50-51
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 魏建香;孫越泓;朱云霞;徐厚明;孫俊;帥友良;;一種基于互信息的藥品不良反應信號檢測方法[J];南京大學學報(自然科學版);2010年06期
本文關鍵詞:基于文本挖掘的潛在藥物不良反應發(fā)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:348699
本文鏈接:http://sikaile.net/yixuelunwen/yxlw/348699.html
最近更新
教材專著