基于Biclustering的跨病種癥狀群分析研究
發(fā)布時間:2020-08-02 12:55
【摘要】:癥狀是疾病診斷與治療的重要表征,癥狀在疾病以及患者表現(xiàn)中具有特定的規(guī)律,以往的相關(guān)研究一般重點關(guān)注癥狀與疾病的關(guān)系,以發(fā)現(xiàn)疾病特異性的癥狀為主要研究目標(biāo)。但十余年來,醫(yī)學(xué)研究人員發(fā)現(xiàn)某些癥狀往往在不同疾病和患者中同時出現(xiàn),形成具有顯著同現(xiàn)規(guī)律的癥狀群(Symptom Cluster)。鑒于癥狀管理的重要性,癥狀群的確認及其分子機理的發(fā)現(xiàn)已經(jīng)成為醫(yī)學(xué)研究的熱點問題。傳統(tǒng)的癥狀群分析方法以主成分和隱類模型等為主,并且目前研究人員主要關(guān)注于某種特定的疾病下癥狀群的規(guī)律。但在跨病種的癥狀群分析中往往還需要確認關(guān)聯(lián)的疾病信息,因此,存在顯著不足。本文采用Biclustering的方法進行跨病種的癥狀群分析,利用一個具有較全疾病譜的疾病癥狀關(guān)系數(shù)據(jù)行研究,確認特定的癥狀群結(jié)構(gòu)及分子機理。本文主要研究工作包括以下兩個方面:為了研究跨病種癥狀群規(guī)律,首先我們利用來自疾病本體論,人類表型本體論,OrphaNet,MalaCards和統(tǒng)一醫(yī)學(xué)語言系統(tǒng)庫中搜集并集成共計16,383種高質(zhì)量疾病-癥狀關(guān)系數(shù)據(jù)。該數(shù)據(jù)包含如糖尿病,艾滋病毒,肺疾病,心臟疾病,黃熱病,失調(diào),慢性肝炎,發(fā)炎等常見疾病.此外,還包含如疼痛,疲勞,惡心,麻木,咳嗽,嘔吐,食欲不振,虛弱,痛苦等癥狀.數(shù)據(jù)集共計包含13,532疾病和2,378癥狀,基于此數(shù)據(jù)集我們采用了三種經(jīng)典的Biclustering算法:BIMAX(Binary inclusion-maximal),QUBIC(Qualitative Biclustering)和Spectral Clustering進行癥狀群的聚類分析,發(fā)現(xiàn)并確認了多種具有臨床意義的癥狀群。這些癥狀群在不同的病種中同時出現(xiàn),反映了不同疾病的共性臨床表型模式和規(guī)律。例如,如下三個癥狀群:疼痛、抑郁和疲勞;惡心和嘔吐;疼痛、疲勞、睡眠障礙、嗜睡、食欲不振,他們在真實臨床中也是常見的伴隨癥狀群,確實與現(xiàn)實臨床經(jīng)驗吻合.基于此結(jié)果,我們結(jié)合371,422種癥狀-基因關(guān)系,共計有2834種癥狀和16728種基因數(shù)據(jù),并利用841,068條相互作用組網(wǎng)絡(luò)數(shù)據(jù)(來自大規(guī)模整合數(shù)據(jù)庫STRING 11)。并采用共享基因、最短路徑和GO分析等分析方法進行分析,與此同時,我們通過隨機取樣與實驗結(jié)果相同的癥狀群樣本作為癥狀群的實驗對照組。實驗分析對比結(jié)果表明,通過Biclustering相關(guān)算法實驗得到的這些癥狀群具有較高的共享基因可能性、較短的蛋白質(zhì)相互作用分子路徑等共享的分子機制(與隨機癥狀組合相比,p值0.05)。進一步的比較分析表明,在以上三種方法中,我們發(fā)現(xiàn)QUBIC方法獲得了具有較好生物學(xué)意義的聚類結(jié)果,而譜聚類則在共享分子機制方面獲得了最好的癥狀聚類結(jié)果。此外,基于Biclustering算法取得的癥狀群在GO、pathway方面每個注釋簇的富集得分具有統(tǒng)計學(xué)意義在后續(xù)研究中,我們將進一步探索不同聚類方法對跨病種癥狀群分析的性能優(yōu)劣。
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R-05;TP301.6
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R-05;TP301.6
【相似文獻】
相關(guān)期刊論文 前10條
1 翟瑩瑩;楊Y
本文編號:2778540
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2778540.html
最近更新
教材專著