基于多階信息的復(fù)雜疾病分子網(wǎng)絡(luò)研究
發(fā)布時(shí)間:2020-08-12 21:40
【摘要】:隨著生物信息的發(fā)展和多層次高通量組學(xué)數(shù)據(jù)的出現(xiàn),生命科學(xué)研究進(jìn)入了大數(shù)據(jù)時(shí)代,同時(shí)也面臨著新的革命。生物分子層面的研究模式從單個(gè)分子擴(kuò)展到多個(gè)分子以及它們之間的相互作用。計(jì)算系統(tǒng)生物學(xué)為挖掘生物大數(shù)據(jù)提供了數(shù)學(xué)理論基礎(chǔ)與方法儲(chǔ)備。尤其,網(wǎng)絡(luò)作為刻畫大數(shù)據(jù)關(guān)系的有力工具,逐漸被應(yīng)用于分析各種高通量生物數(shù)據(jù)。其中,復(fù)雜疾病作為威害人類健康的主要?dú)⑹?其致病機(jī)理、早期診斷和后期治療成為生物醫(yī)學(xué)最關(guān)注的研究領(lǐng)域。如何從分子網(wǎng)絡(luò)角度結(jié)合高通量生物組學(xué)數(shù)據(jù)來研究復(fù)雜疾病的發(fā)病機(jī)制及致病基因是目前亟待解決的問題。本文主要利用復(fù)雜網(wǎng)絡(luò)本身的數(shù)學(xué)特性,結(jié)合生物高通量組學(xué)數(shù)據(jù),建立了針對復(fù)雜疾病的新型分子網(wǎng)絡(luò)模型,并對疾病的致病機(jī)理、早期診斷及富集的生物通路進(jìn)行了深入研究,F(xiàn)有的大多數(shù)疾病分子網(wǎng)絡(luò)模型,無法真實(shí)地反映現(xiàn)實(shí)網(wǎng)絡(luò)的隨機(jī)波動(dòng)和噪音。對此,我們提出利用生物組學(xué)數(shù)據(jù)的多階統(tǒng)計(jì)信息來構(gòu)建分子網(wǎng)絡(luò)模型,并提出具體的分析算法。其次,我們針對臨床樣本數(shù)據(jù)少這一現(xiàn)實(shí),利用多階統(tǒng)計(jì)信息構(gòu)建了單樣本分子網(wǎng)絡(luò):差異網(wǎng)絡(luò)模型,并利用該模型對生物通路富集問題進(jìn)行了深入研究。本文的主要研究成果有:1.利用生物組學(xué)數(shù)據(jù)(主要是基因表達(dá)數(shù)據(jù))的一階、二階統(tǒng)計(jì)信息,建立了新型的多階信息分子網(wǎng)絡(luò)。利用數(shù)據(jù)的多階信息,盡可能地還原生物分子網(wǎng)絡(luò)的真實(shí)發(fā)展過程。通過對多階信息分子網(wǎng)絡(luò)理論與應(yīng)用的研究,我們發(fā)現(xiàn),結(jié)合了二階統(tǒng)計(jì)信息的生物分子網(wǎng)絡(luò)(邊網(wǎng)絡(luò))能更好地縮小對致病基因的搜索范疇,從而能更精確地找到與疾病相關(guān)的致病基因。通過對H3N2流感病毒感染后的時(shí)序基因表達(dá)數(shù)據(jù)的分析,我們發(fā)現(xiàn),通過邊網(wǎng)絡(luò)模型找到的疾病基因不僅能有效預(yù)測病毒感染的發(fā)生與否,還能盡可能早地給出預(yù)測結(jié)果。也就是說這些基因在對H3N2流感感染的早期預(yù)測上具有高效的生物標(biāo)記功能。2.從單樣本數(shù)據(jù)出發(fā),利用多階統(tǒng)計(jì)信息構(gòu)建了單樣本分子網(wǎng)絡(luò)。不同于基礎(chǔ)理論研究,臨床診斷中的實(shí)際樣本數(shù)量是極其有限的,單樣本分子網(wǎng)絡(luò)將為復(fù)雜疾病分子網(wǎng)絡(luò)模型的實(shí)際應(yīng)用創(chuàng)造條件。通過設(shè)計(jì)合理的可加性量化指標(biāo),我們發(fā)現(xiàn),整合了基因表達(dá)值與基因表達(dá)相關(guān)性值而構(gòu)建的差異表達(dá)網(wǎng)絡(luò)能更全面地提取正常與疾病生物分子網(wǎng)絡(luò)之間的差異信息,從而提高疾病預(yù)測的精度及魯棒性。在對前列腺癌及糖尿病的疾病數(shù)據(jù)分析中,我們?nèi)〉昧溯^豐富的工作成果:全面評估了各種差異信息對疾病預(yù)測的貢獻(xiàn);挖掘了具有顯著生物意義的差異模塊;識(shí)別了與疾病異質(zhì)性相關(guān)的生物功能模塊,例如可變剪切;篩選了高精度且具有魯棒性的生物標(biāo)記模塊。3.為了進(jìn)一步比較多階信息分子網(wǎng)絡(luò)與傳統(tǒng)的一階信息網(wǎng)絡(luò),基于差異表達(dá)網(wǎng)絡(luò)開發(fā)了集成生物通路富集分析模型及算法。傳統(tǒng)的生物通路富集分析僅僅考慮了點(diǎn)網(wǎng)絡(luò)中一階信息上的差異,而集成生物通路富集分析將同時(shí)考慮二階信息上的差異。這為解釋復(fù)雜疾病分子網(wǎng)絡(luò)的生物意義提供了新的視角。通過設(shè)計(jì)針對雙重差異的超幾何檢驗(yàn)指標(biāo),我們發(fā)現(xiàn),整合了表達(dá)均值差異與表達(dá)方差差異的集成生物通路富集分析算法,在異質(zhì)性樣本中的富集分析能力顯著提高。在模型評估中,我們在大量疾病數(shù)據(jù)上對現(xiàn)有的多種生物通路富集分析方法進(jìn)行了比較,其結(jié)果體現(xiàn)了集成生物通路富集分析算法的優(yōu)勢和擴(kuò)展性。在對典型的異質(zhì)性疾病-糖尿病的研究中,集成生物通路富集分析有效地識(shí)別出了異常調(diào)控的生物通路及這些通路標(biāo)記下的潛在糖尿病亞型。綜上,我們對復(fù)雜疾病分子網(wǎng)絡(luò)的研究,為理解疾病的致病機(jī)理和疾病的早期預(yù)測做出了一定的貢獻(xiàn)。多階信息分子網(wǎng)絡(luò)(邊網(wǎng)絡(luò))將更全面地包含生物組學(xué)數(shù)據(jù)中的信息,從而可以為疾病研究定位更少更精確的致病候選基因,同時(shí)也為疾病預(yù)測提供了更精細(xì)的分析手段。單樣本分子網(wǎng)絡(luò)(差異網(wǎng)絡(luò)模型)則克服了實(shí)際應(yīng)用中樣本數(shù)據(jù)少的問題,為實(shí)現(xiàn)個(gè)體化醫(yī)療提供了理論與技術(shù)基礎(chǔ)。
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:Q811.4;R3416
【圖文】:
過貝葉斯模型來描述共表達(dá)基因模塊與它們共享的調(diào)控上游因子;另一方面是通過逡逑物理相互作用圖來描述在研究條件下所可能發(fā)生的蛋白相互作用及蛋白-DNA相互逡逑作用。一個(gè)詳細(xì)的實(shí)例如圖1.1所示,調(diào)控因子Mobl及其37個(gè)目標(biāo)基因在2個(gè)細(xì)逡逑胞周期中的表達(dá)模式(圖1.1(a))。一個(gè)物理通路利用Cdc28將Mobl連接到另一逡逑個(gè)轉(zhuǎn)錄調(diào)控因子FKH2,這個(gè)因子可能綁定調(diào)控了邋15個(gè)模塊基因(圖U(b))。物逡逑理模塊網(wǎng)絡(luò)模型的分析過程,其輸入是基因表達(dá)數(shù)據(jù),一組潛在的調(diào)控因子和已知逡逑蛋白-蛋白/蛋白-DNA相互作用;其學(xué)習(xí)過程是通過一個(gè)迭代的優(yōu)化手段來搜索最優(yōu)逡逑的模塊及相應(yīng)的調(diào)控因子和物理通路;其輸出則是最優(yōu)的物理模塊及其上下游網(wǎng)絡(luò)逡逑結(jié)構(gòu)(圖1.1(c))。逡逑(a)邐(b)逡逑Regulator逡逑WB灥瞧*81邋..WWW邋巧扣邋1邐巧eguistio。逡逑?邐起芒夢Path逡逑Tar?qū)剩舆姡筮姡畫Xy卞蝹每邐逡逑Module邐1邐戶巧邐、-一^逡逑%煎危牽卞義稀,:《逦.z吻傷擼插澹未模剩殄義希羈寂私藻澹五五義稀鰣危跡,狂二ιI悱.::逦辶x稀鰣危澹桑翦澹椋哄危掊危掊澹ǎㄥ,,,,,逦辶x希煎巍靄耍璸骸貳⒃鰣;盧‘逡逑dm邋U1;-邐—逡逑!~+礎(chǔ),灥^逡逑化邋i邐"...—邋邋邐邐邐邐*逡逑!邋\邋■邋"1逡逑?邋■Gens邋g,pf株巧W邐邐邋邐邐邐X—*邋!逡逑.;?娭w始}!謝化巧:邐i邋WS邋邐\邐邋S逡逑;?護(hù)筑泌誕皆城於巧邐i邐;邋、:邐主邐茂I逡逑>??今;象;蠶巧?
圖2.1針對疾病生物系巧的點(diǎn)網(wǎng)絡(luò)與邊網(wǎng)絡(luò)逡逑一般來說,上述方法都源于一個(gè)基本的數(shù)學(xué)模型:在隨機(jī)動(dòng)力學(xué)中,一個(gè)生逡逑物系統(tǒng)在分子水平上可W被一個(gè)主方程來建模[68,邋69]。如圖2.1所示,在線性和逡逑高斯分布假設(shè)下,一個(gè)系統(tǒng)可W被兩組方程準(zhǔn)確的描述:一組是關(guān)于分子表達(dá)的逡逑平均值向量(即一階信息),另一組是關(guān)于分子表達(dá)的協(xié)方差矩陣(即二階信息)。逡逑然而,在傳統(tǒng)網(wǎng)絡(luò)(點(diǎn)網(wǎng)絡(luò))的研究中,如對基因網(wǎng)絡(luò)或蛋白質(zhì)相互作用網(wǎng)絡(luò)的逡逑研巧,分子網(wǎng)絡(luò)的構(gòu)建都是基于平均值向量的方程組,而沒用到基于協(xié)方差矩陣逡逑的方程組。顯然,這種情況下構(gòu)建的分子網(wǎng)絡(luò)是無法完整反映原始生物系統(tǒng)的隨逡逑機(jī)動(dòng)力學(xué)特征的
圖2.邋3r>值篩選
本文編號(hào):2791058
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:Q811.4;R3416
【圖文】:
過貝葉斯模型來描述共表達(dá)基因模塊與它們共享的調(diào)控上游因子;另一方面是通過逡逑物理相互作用圖來描述在研究條件下所可能發(fā)生的蛋白相互作用及蛋白-DNA相互逡逑作用。一個(gè)詳細(xì)的實(shí)例如圖1.1所示,調(diào)控因子Mobl及其37個(gè)目標(biāo)基因在2個(gè)細(xì)逡逑胞周期中的表達(dá)模式(圖1.1(a))。一個(gè)物理通路利用Cdc28將Mobl連接到另一逡逑個(gè)轉(zhuǎn)錄調(diào)控因子FKH2,這個(gè)因子可能綁定調(diào)控了邋15個(gè)模塊基因(圖U(b))。物逡逑理模塊網(wǎng)絡(luò)模型的分析過程,其輸入是基因表達(dá)數(shù)據(jù),一組潛在的調(diào)控因子和已知逡逑蛋白-蛋白/蛋白-DNA相互作用;其學(xué)習(xí)過程是通過一個(gè)迭代的優(yōu)化手段來搜索最優(yōu)逡逑的模塊及相應(yīng)的調(diào)控因子和物理通路;其輸出則是最優(yōu)的物理模塊及其上下游網(wǎng)絡(luò)逡逑結(jié)構(gòu)(圖1.1(c))。逡逑(a)邐(b)逡逑Regulator逡逑WB灥瞧*81邋..WWW邋巧扣邋1邐巧eguistio。逡逑?邐起芒夢Path逡逑Tar?qū)剩舆姡筮姡畫Xy卞蝹每邐逡逑Module邐1邐戶巧邐、-一^逡逑%煎危牽卞義稀,:《逦.z吻傷擼插澹未模剩殄義希羈寂私藻澹五五義稀鰣危跡,狂二ιI悱.::逦辶x稀鰣危澹桑翦澹椋哄危掊危掊澹ǎㄥ,,,,,逦辶x希煎巍靄耍璸骸貳⒃鰣;盧‘逡逑dm邋U1;-邐—逡逑!~+礎(chǔ),灥^逡逑化邋i邐"...—邋邋邐邐邐邐*逡逑!邋\邋■邋"1逡逑?邋■Gens邋g,pf株巧W邐邐邋邐邐邐X—*邋!逡逑.;?娭w始}!謝化巧:邐i邋WS邋邐\邐邋S逡逑;?護(hù)筑泌誕皆城於巧邐i邐;邋、:邐主邐茂I逡逑>??今;象;蠶巧?
圖2.1針對疾病生物系巧的點(diǎn)網(wǎng)絡(luò)與邊網(wǎng)絡(luò)逡逑一般來說,上述方法都源于一個(gè)基本的數(shù)學(xué)模型:在隨機(jī)動(dòng)力學(xué)中,一個(gè)生逡逑物系統(tǒng)在分子水平上可W被一個(gè)主方程來建模[68,邋69]。如圖2.1所示,在線性和逡逑高斯分布假設(shè)下,一個(gè)系統(tǒng)可W被兩組方程準(zhǔn)確的描述:一組是關(guān)于分子表達(dá)的逡逑平均值向量(即一階信息),另一組是關(guān)于分子表達(dá)的協(xié)方差矩陣(即二階信息)。逡逑然而,在傳統(tǒng)網(wǎng)絡(luò)(點(diǎn)網(wǎng)絡(luò))的研究中,如對基因網(wǎng)絡(luò)或蛋白質(zhì)相互作用網(wǎng)絡(luò)的逡逑研巧,分子網(wǎng)絡(luò)的構(gòu)建都是基于平均值向量的方程組,而沒用到基于協(xié)方差矩陣逡逑的方程組。顯然,這種情況下構(gòu)建的分子網(wǎng)絡(luò)是無法完整反映原始生物系統(tǒng)的隨逡逑機(jī)動(dòng)力學(xué)特征的
圖2.邋3r>值篩選
【共引文獻(xiàn)】
相關(guān)博士學(xué)位論文 前3條
1 朱俊;基于幾何特征配準(zhǔn)的圖像魯棒拼接算法[D];南京理工大學(xué);2014年
2 葛新;互聯(lián)網(wǎng)宏觀拓?fù)涠认嚓P(guān)及社團(tuán)特征研究[D];東北大學(xué);2011年
3 胡國章;利用生物信息學(xué)方法篩選膠質(zhì)瘤的差異表達(dá)基因及其相關(guān)機(jī)制[D];吉林大學(xué);2015年
本文編號(hào):2791058
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/2791058.html
最近更新
教材專著